您好,欢迎来到筏尚旅游网。
搜索
您的当前位置:首页基于PSO的二级倒立摆LQR最优控制器设计

基于PSO的二级倒立摆LQR最优控制器设计

来源:筏尚旅游网
基于PSO的二级倒立摆LQR最优控制器设计 基于PSO的二级倒立摆LQ R最优控制器设计 PSO based LQR Optimal Controller Design for Double Inverted Pendulum 何俊强 任开春 武明亮’ 甘剑锋 高传平。 (1重庆通信学院控制工程重点实验室,重庆400035;2重庆通信学院电力工程系,重庆400035; 3中国人民78088,重庆400039) 摘 要 根据微粒群算法的随机性、快速性、易于实现性等优点,针对LQR在二级倒立摆最优控制设计过程中对加权矩阵Q、R 选择的盲目性,研究了基于PSO的LQR最优控制器的设计方法,该方法利用PSO算法的启发式全局优化特点对Q、R阵 进行寻优,然后得到状态反馈控制律K。并设计了基于该方法的二级倒立摆的最优控制器,通过和基于遗传算法的LQR最 优控制器比较,仿真结果表明:该方法所设计的最优控制器能使系统的响应时间更快,超调量更小,对二级倒立摆的控制效 果更理想。 关键词:二级倒立摆,LQR,PS0,最优控制器 Abstract According to Particle Swarm Optimization algorithm with advantages of randomness、rapidity and easy realizabilitythe ,LQR optimal controller design method based on PSO is studied which overcomes the choice blindness of weighting matrix of LQR in the design process.This method makes use of PSO algorithm with heuristic global optimization to get Q、R and state feedback control law K.Double inverted pendulum optimal controller application of the method is designedwhich over. ,comes the choice blindness of weighting matrix of LQR in the design process.Compared with the optimal controller based on genetic algorithm,the simulation results shows that the method designed for optimal controller enables the system re. sponse time faster,smaller overshoot and the control results to double inverted pendulum more satisfactory. Keywords:double inverted pendulum,Linear Quad ratic Regulator,Particle Swarm Optimization,optimal controller 倒立摆作为控制系统的被控对象,许多抽象的控制概念都 可以通过它直观的表现出来,因此成为检验各种新型控制理论 和方法有效性的典型装置。近年来,许多学者对倒立摆系统进行 广泛地研究。文献[1—2]提出了基于模糊神经网络的倒立摆控 制系统,该方法由于模糊神经网络系统的自适应能力,有效地克 服了系统存在的非线性和不确定性,但该方法过分依赖人类直 接控制被控对象的经验。文献[3—4]提出了倒立摆拟人控制方 法,系统的稳定范围大,鲁棒性好,但控制率从定性到定量的转 系统设计,将功率放大器、力矩电机、小车、摆、皮带及皮带轮等 的组合体视为控制对象,其输入是功率放大器的输入信号,输出 是小车的位移和摆杆的角度。假设系统中的每一根摆杆都是匀 质刚体,驱动力与放大器的输入成正比且无延迟地直接作用于 小车上,并且可以在忽略实验中的库仑摩擦和动摩擦的前提下, 设定摆杆竖直向上时,下摆杆角位移O,、上摆杆角位移O2均为 零,摆杆顺时针旋转为正。 化较复杂。线性二次型最优设计方法得到的控制系统具有较好 的鲁棒性与动态特性等优点,文献[5—6]基于状态空间设计法 的LQR最优调节器,较好地兼顾了系统的鲁棒稳定性和快速 性,但在控制器的设计中难以选择合适加权矩阵。文献[7—8]利 用了遗传算法对加权矩阵进行优化取得了较好的效果,但遗传 操作中的选择、交叉、变异比较复杂,而且局部寻优能力不强。相 固 ——厂 匾习 _‘ / _ ■ 比之下,粒子群(PSO)算法是基于种群的并行全局搜索策略,概 念简单易于实现,且没有太多参数需要调整,具有更快的收敛速 度。本文采用基于PS0算法的权矩阵设计方法设计二级倒立摆 (_) ■ ●的LQR最优控制器。将设计好的控制器用于二级倒立摆试验仿 真,试验结果和文献[7]相比,最优控制器超调小,响应速度更 快,实现了对倒立摆系统的稳定控制。 1 二级倒立摆的数学模型 本文系统模型是基于直线二级倒立摆,模型系统由机械部 分和电路部分组成。机械部分包括底座、框架、滑轨、直流永磁式 力矩电机、测速电机、电位器、齿型传动皮带、小车、摆杆、触发开 关以及一些连接轴等。主要机械结构部分如图1所示。对于控制 图1 直线二级倒立摆的物理结构图 欧拉一拉格朗日原理较之牛顿力学分析方法可以把系统看 作一个整体并利用如动能、势能之类的纯量来描述函数,只需考 虑系统的动能和广义力两个方面,计算简单、工作量小,大大简 化建模过程,因此本文选择拉格朗日方程建模。取小车质量M。 为0.595kg,下摆的质量M1为O.161kg,上摆的质量M2为 《工业控制计算机}2010年第23卷第6期 .57 —..................。.........lj. ...。.。.。。....。.....L [Vl1’Vl2’…,V.D],X.=[Xl1,X.2,…,X。D],i=1,2…,m。将每个微粒的 0.142kg,下摆转动轴心到上摆转动轴心的距离L为O.151m,下 1●●●●●●● ●● ●●●●●●●●●●J 7 D D 0 D D —...。........................l. l...................L 位置x.代入目标函数中得到适应度值f(i),通过评价微粒的适 摆转动轴心到其重心的距离l 为O.124m,上摆转动轴心到其重 D 7 D D D D x. . D D D D 0 D 心的距离I 为0.227m,小车系统的等效摩擦阻力系数F0为 对其重心的转动惯量J2为0.002433kg/m ,重力加速度g为 D D 7 0 D D 0 D 0 7 D D 应度值f(i),从而确定个体最佳位置Pi=[P_1,P|2’…,p.D]及群体 新公式如下: ( 7)=Ⅵ, (f)十c,r,[ (f)一 (f)]+ [ ( )— (f)] (5) 最优位置Pg=[P g1IPg2,…,pgo]。对每一代微粒,速度和位置的更 1 1 N/ms~,下摆对其重心的转动惯量J1为0.O0284kg/m ,上摆 0 0 0 D 7 D D 0 D D D 7 9.806m/s 。建模并线性化后,并将参数带入得到系统在平衡点 附件的状态方程为: D 0 7 D D D 0 D 7 0 D D 0 D 7 -3.02—0.57—1601 0 0 53 oo一23 40 6621 O 0 —37 08 69 39-46 31 0 0 。。。X 册一一 0, 02 ● X (2) ● e, - Q e2 广●●●●—]●●●Lq D 系统的能控性是控制器设计的前提,故在设计前进行能控 性分析。由能控性矩阵M=[B AB A。B A。B A B A B】,在 %~MATLAB中利用可控性矩阵的Ctrb命令来计算,可以得出 Rank(M)=6,可知系统可控,因此可以对系统进行控制器的设 计,使系统稳定。 2 LQR控制器的设计 2.1 LQR控制器原理 LQR即线性二次型调节器,其对象是现代控制理论中以状 态空问形式给出的线性系统,而目标函数是状态变量(和/或)控 制变量的二次型函数的积分。线性二次型最优控制问题的解最 简单,解出的控制规律是状态变量的线性函数,因而通过状态反 馈便可实现闭环最优控制。 线性定常系统状态方程为: X=AX+BU Y=CX (3) 初始状态为X(t)l =0=×(0),确定一个最优反馈控制律U (t)=一KX(t),使得如下性能指标最小化: t T T J= l[ ( )QX(f)+U‘(f)RU(f)] (4) u 其中:K=R B4p,P为满足Riccati方程PA+A ̄一PBR。。BPT+ Q=0的实对称正定矩阵。Q、R分别是对状态变量和输入向量的 加权矩阵,而Q、R的选取决定K的值,而K的取值与系统的闭 环极点位置以及时域响应的性能指标密切相关,所以Q、R阵的 选择是设计具有线性二次性能指标的最优控制器的关键。传统 的方法都是通过试凑,本文将通过PSO优化算法实现。 2.2 PSO算法基本原理 微粒群优化(Particle Swarm Optimization,PSO)算法最早 是由美国心理学家James Kennedy和电气工程师Russell E— berhart于1995年共同提出的。与其它群集智能算法(例如遗传 算法、蚁群算法等)类似,PS0算法也是一种基于迭代的优化算 法,但与它们相比,PSO算法又具有实现简单、鲁棒性好等优点。 在基本微粒群优化算法中,假设搜索空间为D维,种群由 m个微粒组成。其中,第i个微粒的速度和位置分别表示为V.= (“7) (f)+ (f) (6) 其中,W为惯性权重,C1和C2为正的加速常数,r1和r2为O 到1之间均匀分布的随机数。 2.3基于PSO的LQR最优控制器的设计 最优控制器的目标就是要找到最优反馈控制律U使性能 指标函数J最小化,因此可以将性能指标的倒数作为微粒群算 法的适应度。二级倒立摆系统为6个状态变量、1个输入、3个输 出的多变量系统。Q阵选为6x6维非负定对称矩阵,R选为正实 数,Q阵通常选为对角形式: ・・0 0 ・・0 0 -● ●_● ,R=r(q,,≥0,r>O) q55 0 0 q∞ 根据微粒群算法工作原理,基于PSO的LQR最优控制器  D 的设计步骤如下:D  1)将Q阵中的对角元素和实数r共7个参数编码成实数码 串表示的个体,则每个微粒可由全部待确定参数组成的7维行 向量表示,一个微粒代表一组Q、R阵参数。 2)初始化微粒群,随机生成一定数目的微粒组成种群,根据 优化问题所定义的适应度函数,在初始化微粒群中寻找个体历 史最好位置pbest和全局最好位置gbest。 3)按照微粒群速度、位置进化公式(5)、(6)更新微粒速度、位 置,并对每个微粒适应度进行评价,得到新的个体最好位置 pbest和全局最好位置gbest。 4)若未达到训练精度要求或最大代数,则返回步骤C。 优化结束后得到Q、R阵的最优解,进而计算K值,获得最 优控制器。 3计算机仿真实验 本文的仿真是在Matlab 7.9(R2009b)环境下进行的,微粒 群算法参数设置为:每个微粒维数D为7;种群数量N为20;C 为1.5;c2为1l7;w 为O.9;W 为0.4;逼近精度为10_6;最大 进化代数为200代。优化过程的适应度变化如图2所示。 经PS0优化后的Q=diag[300.32,302.78,276.74, 306.01,154.57,258.79】,R=2,计算得到状态反馈控制律K= [12.26 231.07—363.89 22.58 8.6—0.51】,基于PS0算法和 基于GA算法的二 适应度曲线(参数c1=1 5.c2=1 7.终止代艘=200.种群数量pop=20) 级倒立摆LQR控 制器对系统仿真结 果分别如图3和图 4所示:图中包括 了小车位移、小车 速度、上摆杆角位 移、上摆杆角速度、 下摆杆角位移、下 摆杆角速度共六条 曲线。从两种算法 图2适应度值随代数进化过程图 — 58 基于PSO的二级倒立摆LQR最优控制器设计 4结束语 所设计的最优控制器的仿真结果可以很明显的看出:基于PSO 算法的控制器对系统的调节时间更短,超调量更小,摆杆的角度 变化也更小,系统取得了很好的控制效果。 本文利用微粒群算法的较强全局随机搜索能力对LQR中的 加权矩阵进行寻优,避免了在设计二级倒立摆LQR最优控制器 时对Q、R阵人为选择的盲目性,将二者结合最大限度地发挥了 线性二次型最优控制器的优点。并和基于文献【7】中所设计的最优 。——cart position 控制器进行仿真比较,基于该方法的最优控制器使系统的调节时 间更短,超调量更小,使二级倒立摆的控制效果得到改善。 参考文献 [1]杨振强,等.二级倒立拱的状态合成模糊神经网络控制[J].控制与决 策,2002,17(1):123—125 [2]黄伟忠.单级倒立摆FUZZY—PD控制系统的建模与仿真[J].计算机 pendulum englel pendulum angle2 cart sDeed ’pendulum angl ̄speed 熏 pendulum angle7,.speed 搿斓 应用技术,2009,36(5):40—43 [3]龙雨.基于拟人控制的平丽运动倒立摆研究[D].北京:此京航空航天 大学,2000:20—51 图3 PSO最优控制器总体仿真曲线 [4]张明廉,孙昌龄,杨亚炜.拟人控制二维单倒立摆[J].控制与决策, 2002,17(1):53—56 [5]雷霞,王彬.基于LQR算法的倒立摆系统仿真研究[J].仪器仪表用 / } ——cart position 户,2008,15(2):6—8 , Dendu m angled [6]刘金亨,陈今润,吕郁青,等.基于LQR的一阶直线双倒立摆最优控 口pendulum angle2 : cart s0eed 制系统研究[J].控制理论与应用,2009,28(5):11—13 pendulum angle]speed [7]王昱,李勇.基于GA的二级倒立摆LQR最优控制器的设计[J].沈 pendulum angle2 sDeed  :阳航空工业学院学报,2009,26(4):46—49 [8]李宇成,岳春然,王目树基于遗传算法的倒立摆系统的多级控制研 ’ 究[J]北方工业大学学报,2009,21(3):19—24 [9]宋君烈,肖军,徐心和.倒立摆系统的Lagrange方程建模与模糊控 制[J].东北大学学报,2002,23(4):333—337 『 [10]谢晓峰,张文俊,杨之廉微粒群算法综述[J].控制与决策,2003,18 (2):129—134 图4 GA最优控制器总体仿真曲线 [收稿日期:2010.1.12] (上接第55页) 4模糊推理及解模糊方法 表3绿灯延长时间的模糊规则(TLC) 加权平均法是模糊控制系统中应用最广泛的一种判决方 UL 无 低 中 高 法,它的输出执行量用下面的计算公式决定: n n UH 很低 短 d J 长 很长 u=  ̄x/Z,k 低 短 短 d 长 i=1 l=1 由 很短 短 由 长 上式中 的选择要根据实际情况决定。当kj=l ̄N(xj)时(此 高 很短 报短 短 中 时kj为隶属度函数),就是重心法。  r很高 很短 很短 短 r士| 5结束语 这也符合交警的疏导思想,只有首先放行车流量较大的方向的 由路口检测器收集交通车辆信息,提供给模糊控制器。模糊 车,才能最大化地减少车辆的平均等待时间。 控制器根据这些信息对路口信号进行优化控制,确定各相位的 考虑对于信号灯,一般有左转、直行、右转3种,也就是一个 顺序和持续的时间。本系统在单片机开发模拟装置上进行了仿 路口有3个属性值。表4给出了一个四路口四相位的实例情况。 真,采用AT89C51为CPU,对整个系统进行控制和管理。仿真 可借助普通相位规则表完成这个优化过程,在普通相位规则表中 结果表明其控制效果比定时控制大为改善。 找到当前相位,依次检验其后续相位,当后续相位畅通时,即选用 这个后续相位为当前相位的下一优化相位,否则重新选择相位。 参考文献 表1中“1,’表示该路口状态为畅通,“0”表示该路口状态为阻塞。 [1]陆化普.城市交通现代化管理[M]北京:人民教育出版社,1998 [2】杨汉祥,刘良福,邬喜辉.利用单片机改进交通灯控制系统[J].北京 表4交叉路口普通相位规则表 电子科技学院学报,2005,13(4):68—71 路口、 l(左) 1(中) 1(右) 2(左) 2(中) 2(右j 3(左) 3(中) 3(右) 4(左J 4(中) 4(右) [3]Lee C C Fuzzy Logic in Control Systems:Fuzzy Logic Con— 相位 troller—Part1.IEEE Trans.Syst.,Man,Cybern.,1990.20:404—418 l 0 0 1 1 0 l 1 O l 0 0 l 2 0 0 l 0 l l 0 l 1 O O 1 [4]J arkko N,M at t i P.Signal cont ro l using fuzzy logic[J]. 3 1 0 1 0 0 1 0 O l l O l Fuzzy Seystem,2000,116(1):11—22 4 0 1 l 0 0 l 0 0 l O l l [收稿日期:2009.12.25] 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- efsc.cn 版权所有 赣ICP备2024042792号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务