CN100498601C - 一种利用蚁群算法辨识高精度伺服系统摩擦参数的方法 - Google Patents
一种利用蚁群算法辨识高精度伺服系统摩擦参数的方法 Download PDFInfo
- Publication number
- CN100498601C CN100498601C CNB2007101217769A CN200710121776A CN100498601C CN 100498601 C CN100498601 C CN 100498601C CN B2007101217769 A CNB2007101217769 A CN B2007101217769A CN 200710121776 A CN200710121776 A CN 200710121776A CN 100498601 C CN100498601 C CN 100498601C
- Authority
- CN
- China
- Prior art keywords
- ant
- theta
- tau
- formula
- delta
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Abstract
本发明提供了一种利用蚁群算法辨识高精度伺服系统摩擦参数的方法。首先令闭环伺服系统以一组恒定的转速运动,得到相应的控制力矩序列,从而构造出静态评价函数,辨识出高精度伺服系统摩擦参数的静态参数;将蚂蚁按照随机原则散布在空间网格点上,并记录具有最好评价函数值的精灵蚂蚁;按照规则结合评价函数值进行信息素更新,直至寻到最优静态参数。然后用得到的静态参数的估计值替代实际值,进一步辨识出动态参数。该方法优点是可不依赖被控对象的精确数学模型,并具有较高的在线实时性,能有效地攻克十分困难的在线辨识问题,使处理问题更具灵活性、适应性和鲁棒性。
Description
(一)技术领域
本发明涉及一种利用蚁群算法辨识高精度伺服系统摩擦参数的方法,属于机械制造技术领域。
(二)背景技术
在高精度、超低速伺服系统中,由于非线性摩擦环节的存在,使系统的动态及静态性能受到很大影响,这主要表现为低速时出现爬行现象,稳态时有较大的静差或出现极限环振荡。因此,要提高系统的性能,必须采用适当的控制方法来消除摩擦力矩的影响。在基于摩擦模型的补偿方法中,选择一个合适的摩擦模型是非常重要的。实践表明,采用经典的库仑摩擦+粘性摩擦作为摩擦模型,并不能真实地反映摩擦现象的动态过程。Canudas de Wit C等在1995年提出了LuGre模型(Canudas de Wit C,OlssonH,Astrom K J,et al.A new model for control of systems with friction.IEEETransactions on Automatic Control,1995,40(3):419-425),该模型能够准确地描述摩擦过程复杂的动态、静态特性,如爬行、极限环振荡、滑前变形、摩擦记忆、变静摩擦及静态Stribeck曲线等,目前在高精度伺服系统中得到了广泛应用。
本发明设计了利用蚁群算法辨识高精度伺服系统摩擦参数的方法。本发明在对高精度伺服系统摩擦参数的辨识过程中采用了蚁群智能的如下特点:
(1)在蚂蚁不断散布生物信息激素的加强作用下,新的信息会很快被加入到环境中。而由于生物信息激素的蒸发更新,旧的信息会不断被丢失,体现出一种动态特性;
(2)由于许多蚂蚁在环境中感受散布的生物信息激素同时自身也散发生物信息激素,这使得不同的蚂蚁会有不同的选择策略,具有分布性;
(3)最优路线是通过众多蚂蚁的合作被搜索得到的,并成为大多数蚂蚁所选择的路线,这一过程具有协同性;
(4)蚂蚁个体之间、群体之间以及与环境之间的相互作用、相互影响、相互协作,可以完成的复杂的任务,这种适应性表现为蚁群算法的鲁棒性;
(5)自组织使得蚂蚁群体的行为趋向结构化,其原因在于包含了一个正反馈的过程。这个过程利用了全局信息作为反馈,正反馈使系统演化过程中较优解的自增强作用,使得问题的解向着全局最优化的方向不断变化,最终能有效地获得相对较优解。
蚁群算法寻优过程中所体现出的并行性、协同性、自组织性、动态性、强鲁棒性等特点与高精度伺服系统摩擦参数辨识的许多要求是相符的。用蚁群算法辨识高精度伺服系统摩擦参数可以不依赖被控对象的精确数学模型,并具有较高的在线实时性,能有效地攻克十分困难的在线辨识问题,使处理问题更具灵活性、适应性和鲁棒性。同时,该方法也可用于解决其它类型复杂非线性参数辨识问题。
(三)发明内容
蚁群算法是一种最新发展的仿生智能优化算法,该算法模拟了自然界蚂蚁的群体觅食行为。自然界中,蚂蚁通过相互协调完成相对其本身来说比较艰巨的任务,科学家发现蚂蚁总能在较短的时间寻找到其巢穴与食物源之间最短的路径。蚁群算法最早用来成功地解决了著名的旅行商问题(Traveling Salesman Problem)。目前人们对蚁群算法的研究已经由当初单一的旅行商问题领域渗透到了多个应用领域,由解决一维静态优化问题发展到解决多维动态组合优化问题,由离散域范围内的研究逐渐拓展到了连续域范围内的研究,而且在蚁群算法的硬件实现上也取得了很多突破性进展,从而使这种新兴的仿生优化算法展现出勃勃生机和广阔的发展前景。
蚁群算法的主要特点是:正反馈、并行性及分布式计算。正反馈过程使得该方法能较快地发现问题的较好解;分布式易于并行实现,与启发式算法相结合,使得该方法易于发现更好的解。
经过生物学家研究,发现蚂蚁之间是通过一种称为信息激素的化学物质来互相通信,并互相影响,真实的蚂蚁外出觅食的时候会不断地在经过的路径上分泌信息素,记录自己经过的路线,路径上的信息素浓度将影响后续蚂蚁的行进路线。对于较短的路径,在单位时间内经过的蚂蚁数量较多,路径上的信息素浓度较高,吸引着较多的蚂蚁沿该路径搜索;对于距离较长的路径,由于单位时间内经过的蚂蚁数量较少,路径上的信息素浓度较低;而且信息素会随着时间而挥发,从而较长的路径的信息素浓度弱化就会比较明显,而对于较短路径则由于经过的蚂蚁数量较多,信息素浓度的衰减作用就显得次要,主要体现为信息素浓度被经过的蚂蚁增强,从而形成了一种正反馈。这种正反馈机制为蚁群寻找最优路径提供了可行性。蚂蚁走过的路径越短,信息激素浓度越高,而信息激素浓度越高,吸引的蚂蚁越多,最后所有的蚂蚁都集中到信息激素浓度最高的一条路径上,这条路径就是从巢穴到食物源的最短路径。图1为真实蚂蚁的觅食过程。
蚁群算法实际上是一类智能多主体系统,其自组织机制使得蚁群算法不需要对所求问题的每一方面都有详尽的认识。自组织本质上是蚁群算法机制在没有外界作用下使系统熵增加的动态过程,体现了从无序到有序的动态演化,其逻辑结构如图2所示。
蚁群算法的数学模型为:设bi(t)表示t时刻位于元素i的蚂蚁数目,τij(t)为t时刻路径(i,j)上的信息量,n表示TSP规模,m为蚁群中蚂蚁的总数目,则 是t时刻集合C中元素(城市)两两连接lij上残留信息量的集合。在初始时刻各条路径上信息量相等,并设τij(0)=const,基本蚁群算法的寻优是通过有向图g=(C,L,Γ)实现的。
蚂蚁k(k=1,2,…,m)在运动过程中,根据各条路径上的信息量决定其转移方向。这里用禁忌表tabuk(k=1,2,…,m)来记录蚂蚁k当前所走过的城市,集合随着tabuk进化过程作动态调整。在搜索过程中,蚂蚁根据各条路径上的信息量及路径的启发信息来计算状态转移概率。表示在t时刻蚂蚁k由元素(城市)i转移到元素(城市)j的状态转移概率
式中,allowedk={C-tabuk}表示蚂蚁k下一步允许选择的城市。α为信息启发式因子,表示轨迹的相对重要性,反映了蚂蚁在运动过程中所积累的信息在蚂蚁运动时所起的作用,其值越大,则该蚂蚁越倾向于选择其它蚂蚁经过的路径,蚂蚁之间协作性越强;β为期望启发式因子,表示能见度的相对重要性,反映了蚂蚁在运动过程中启发信息在蚂蚁选择路径中的受重视程度,其值越大,则该状态转移概率越接近于贪心规则。ηij(t)为启发函数,其表达式如下:
为了避免残留信息素过多引起残留信息淹没启发信息,在每只蚂蚁走完一步或者完成对所有n个城市的遍历(也即一个循环结束)后,要对残留信息进行更新处理。这种更新策略模仿了人类大脑记忆的特点,在新信息不断存入大脑的同时,存贮在大脑中的旧信息随着时间的推移逐渐淡化,甚至忘记。由此,t+n时刻在路径(i,j)上的信息量可按如下规则进行调整
τij(t+n)=(1-ρ)·τij(t)+Δτij(t) (3)
式中,ρ表示信息素挥发系数,则1-ρ表示信息素残留因子,为了防止信息的无限积累,ρ的取值范围为: ;Δτij(t)表示本次循环中路径(i,j)上的信息素增量,初始时刻Δτij(0)=0,表示第k只蚂蚁在本次循环中留在路径(i,j)上的信息量。
根据信息素更新策略的不同,目前有三种不同的基本蚁群算法模型,分别称之为Ant-Cycle模型、Ant-Quantity模型及Ant-Density模型,其差别在于求法的不同。由于Ant-Quantity模型及Ant-Density模型均是对信息素的局部更新,而Ant-Cycle模型是整体更信息素,在求解TSP问题时效果良好,所以用Ant-Cycle模型作为基本蚁群算法的信息素更新方式。在Ant-Cycle模型中
式中,Q表示信息素强度,它在一定程度上影响算法的收敛速度;Lk表示第k只蚂蚁在本次循环中所走路径的总长度。
角位移伺服系统一般可用如下微分方程表示
式中,m表示转动惯量,θ表示转角,u表示控制力矩,F表示摩擦力矩。设状态变量z表示接触面鬃毛的平均变形,则F可由如下LuGre模型来描述
公式(10)所确定的转速-摩擦力矩曲线称为Stribeck曲线。
本发明一种利用蚁群算法辨识高精度伺服系统摩擦参数的方法,该方法具体如下:
(1)静态参数辨识
式中, 由此,可定义静态辨识误差为
按下式取目标函数
设蚂蚁总数为m,对于每只蚂蚁l,定义其评价函数值为i点的目标函数JSi和相邻为j点的目标函数JSj的差值,并记
定义蚂蚁l的转移概率为
寻优时,将蚂蚁按照随机原则散布在空间网格点上,并记录具有最好评价函数值的精灵蚂蚁。然后,按照公式(15)所给的空间状态转移概率移动各只蚂蚁。在搜索过程中嵌入了邻近搜索机制,即当ΔJSij>0时,蚂蚁l按概率Pij从其邻域i移动至邻域j;当ΔJSij≤0时,蚂蚁l进行自身的邻域搜索,以寻找更优的解。
一次循环结束时,蚂蚁所移动路径上的信息量按照下式作相应调整
(2)动态参数辨识
基于PID控制和LuGre摩擦补偿的高精度闭环伺服系统结构如图3所示。
公式(6)给出的控制量u可通过PID控制器定义为
设待辨识的参数向量为 同样地,可定义动态辨识误差为
e(xd,t)=θ(t)-θ1(xd,t) (19)
式中,θ(t)表示t时刻闭环伺服系统的转角输出值,θ1(xd,t)表示t时刻辨识参数所组成的模型系统输出值。同样地,取目标函数
式中,c1、c2均为权系数。定义其评价函数值为i点的目标函数JDi和相邻为j点的目标函数JDj的差值,并记
定义蚂蚁l的转移概率为
寻优时,将蚂蚁按照随机原则散布在空间网格点上,并记录具有最好评价函数值的精灵蚂蚁。然后,按照空间状态转移概率移动各只蚂蚁。在搜索过程中嵌入了邻近搜索机制,即当ΔJSij>0时,蚂蚁l按概率Pij从其邻域i移动至邻域j;当ΔJSij≤0时,蚂蚁l进行自身的邻域搜索,以寻找更优的解。
一次循环结束时,蚂蚁所移动路径上的信息量按照下式作相应调整
本发明一种利用蚁群算法辨识高精度伺服系统摩擦参数的方法,其优点及所达成的功效是:用蚁群算法辨识高精度伺服系统摩擦参数可以不依赖被控对象的精确数学模型,并具有较高的在线实时性,能有效地攻克十分困难的在线辨识问题,使处理问题更具灵活性、适应性和鲁棒性。同时,该方法也可用于解决其它类型复杂非线性参数辨识问题。
(四)附图说明
图1(a)、(b)、(c)、(d)现实中蚁群寻找食物的过程
图2基本蚁群算法的逻辑结构
图3基于PID控制和LuGre摩擦补偿的高精度闭环伺服系统结构
图4(a)、(b)正弦波速率信号下LuGre摩擦补偿前后试验结果对比
图中标号及符号说明如下:
σ0——刚度系数 σ1——粘性阻尼系数 α——粘性摩擦系数
(五)具体实施方式
本发明以某型闭环高精度伺服系统为例进行了LuGre摩擦参数辨识,初始化参数为:kp=0.3,ki=0.5,kd=0.8,m=50,F=200,α=1.2,β=2.5,ρ=0.6,Q=300。基于蚁群算法的LuGre摩擦参数辨识方法具体如下:
(1)静态参数辨识
式中, 由此,可定义静态辨识误差为
按下式取目标函数
对于每只蚂蚁l,定义其评价函数值为i点的目标函数JSi和相邻为j点的目标函数JSj的差值,并记
定义蚂蚁l的转移概率为
寻优时,将蚂蚁按照随机原则散布在空间网格点上,并记录具有最好评价函数值的精灵蚂蚁。然后,按照上述公式所给的空间状态转移概率移动各只蚂蚁。一次循环结束时,蚂蚁所移动路径上的信息量按照下式作相应调整
上述过程持续进行,直到满足一定的结束条件为止。
(2)动态参数辨识
基于PID控制和LuGre摩擦补偿的高精度闭环伺服系统结构如图3所示。
公式(6)给出的控制量u可通过PID控制器定义为
设待辨识的参数向量为 同样地,可定义动态辨识误差为
e(xd,t)=θ(t)-θ1(xd,t)
同样地,取目标函数
定义其评价函数值为i点的目标函数JDi和相邻为j点的目标函数JDj的差值,并记
定义蚂蚁l的转移概率为
寻优时,将蚂蚁按照随机原则散布在空间网格点上,并记录具有最好评价函数值的精灵蚂蚁。然后,按照空间状态转移概率移动各只蚂蚁。一次循环结束时,蚂蚁所移动路径上的信息量按照下式作相应调整
上述过程持续进行,直到满足一定的结束条件为止。
下列表1为蚁群算法迭代491次后的LuGre模型静态摩擦参数辨识结果:
表1
同样地,在静态摩擦参数辨识的基础上,可得到迭代387次后LuGre模型的动态摩擦参数辨识结果如下列表2所示:
表2
图4(a)和(b)给出了标准速率信号(正弦波,10deg/s,0.05Hz)下,LuGre摩擦补偿后的试验结果。
由表1、表2和图4可见,基于蚁群算法的高精度伺服系统静态摩擦参数和动态摩擦参数的辨识值都非常接近其实际值,从而验证了用蚁群算法进行非线性参数辨识的可行性和有效性。
Claims (1)
1、一种利用蚁群算法辨识高精度伺服系统摩擦参数的方法,其特征在于:该方法步骤如下:
(1)静态参数辨识:
式中,m表示转动惯量,θ表示转角,u表示控制力矩,F表示摩擦力矩
式中, 由此,可定义静态辨识误差为
按下式取目标函数
设蚂蚁总数为m,对于每只蚂蚁l,定义其评价函数值为i点的目标函数JSi和相邻为j点的目标函数JSj的差值,并记
定义蚂蚁l的转移概率为
寻优时,将蚂蚁按照随机原则散布在空间网格点上,并记录具有最好评价函数值的精灵蚂蚁;然后,按照公式(15)所给的空间状态转移概率移动各只蚂蚁;在搜索过程中嵌入了邻近搜索机制,即当ΔJSij>0时,蚂蚁l按概率Pij从其邻域i移动至邻域j;当ΔJSij≤0时,蚂蚁l进行自身的邻域搜索,以寻找更优的解;
一次循环结束时,蚂蚁所移动路径上的信息量按照下式作相应调整
(2)动态参数辨识:
公式(6)给出的控制量u可通过PID控制器定义为
设待辨识的参数向量为 同样地,可定义动态辨识误差为
e(xd,t)=θ(t)-θ1(xd,t) (19)
式中,θ(t)表示t时刻闭环伺服系统的转角输出值,θ1(xd,t)表示t时刻辨识参数所组成的模型系统输出值;同样地,取目标函数
式中,c1、c2均为权系数;定义其评价函数值为i点的目标函数JDi和相邻为j点的目标函数JDj的差值,并记
定义蚂蚁l的转移概率为
寻优时,将蚂蚁按照随机原则散布在空间网格点上,并记录具有最好评价函数值的精灵蚂蚁;然后,按照空间状态转移概率移动各只蚂蚁;在搜索过程中嵌入了邻近搜索机制,即当ΔJSij>0时,蚂蚁l按概率Pij从其邻域i移动至邻域j;当ΔJSij≤0时,蚂蚁l进行自身的邻域搜索,以寻找更优的解;
一次循环结束时,蚂蚁所移动路径上的信息量按照下式作相应调整
式中,表示第l只蚂蚁在本次循环中的目标函数计算值,上述过程持续进行,直到满足一定的结束条件为止。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2007101217769A CN100498601C (zh) | 2007-09-13 | 2007-09-13 | 一种利用蚁群算法辨识高精度伺服系统摩擦参数的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2007101217769A CN100498601C (zh) | 2007-09-13 | 2007-09-13 | 一种利用蚁群算法辨识高精度伺服系统摩擦参数的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101122779A CN101122779A (zh) | 2008-02-13 |
CN100498601C true CN100498601C (zh) | 2009-06-10 |
Family
ID=39085136
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2007101217769A Expired - Fee Related CN100498601C (zh) | 2007-09-13 | 2007-09-13 | 一种利用蚁群算法辨识高精度伺服系统摩擦参数的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100498601C (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102199843B (zh) * | 2011-05-26 | 2013-08-07 | 浙江恒强科技股份有限公司 | 横机撞针检测方法 |
TW201600846A (zh) * | 2014-06-26 | 2016-01-01 | Hiwin Tech Corp | 線性移動平台之摩擦力參數鑑別方法 |
CN105527965A (zh) * | 2016-01-04 | 2016-04-27 | 江苏理工学院 | 基于遗传蚁群算法的路径规划方法及系统 |
CN115137351B (zh) * | 2022-07-22 | 2023-07-14 | 安徽大学 | 一种基于肌电信号的上肢肘关节角度估计方法及系统 |
-
2007
- 2007-09-13 CN CNB2007101217769A patent/CN100498601C/zh not_active Expired - Fee Related
Non-Patent Citations (1)
Title |
---|
基于改进蚁群算法的电液伺服系统跟踪控制. 熊勇.机床与液压,第2期. 2006 * |
Also Published As
Publication number | Publication date |
---|---|
CN101122779A (zh) | 2008-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mousavi et al. | Traffic light control using deep policy‐gradient and value‐function‐based reinforcement learning | |
Hecht et al. | Activated membrane patches guide chemotactic cell motility | |
CN106781489B (zh) | 一种基于递归神经网络的路网状态预测方法 | |
CN100498601C (zh) | 一种利用蚁群算法辨识高精度伺服系统摩擦参数的方法 | |
Fachantidis et al. | Transferring task models in reinforcement learning agents | |
Meetei | A survey: swarm intelligence vs. genetic algorithm | |
Wu et al. | ES-CTC: A deep neuroevolution model for cooperative intelligent freeway traffic control | |
Feng et al. | Physarum-energy optimization algorithm | |
Yao et al. | Monte carlo tree search based hybrid optimization of variational quantum circuits | |
Hu et al. | Heterogeneous crowd simulation using parametric reinforcement learning | |
Bouzbita et al. | Hidden Markov model classifier for the adaptive ACS-TSP Pheromone parameters | |
Khodayari et al. | Modify car following model by human effects based on locally linear neuro fuzzy | |
Redlarski et al. | Using river formation dynamics algorithm in mobile robot navigation | |
Di Mario et al. | A distributed noise-resistant particle swarm optimization algorithm for high-dimensional multi-robot learning | |
Wan et al. | Adaptive traffic signal control methods based on deep reinforcement learning | |
Williams et al. | Locally weighted regression pseudo-rehearsal for adaptive model predictive control | |
Baronov et al. | Decision making for rapid information acquisition in the reconnaissance of random fields | |
CN113139644B (zh) | 一种基于深度蒙特卡洛树搜索的信源导航方法及装置 | |
Sinkar et al. | Multi-agent path finding using dynamic distributed deep learning model | |
CN101477689B (zh) | 一种基于自适应蚁群智能的空中机器人视觉分层匹配方法 | |
Gregor et al. | Novelty detector for reinforcement learning based on forecasting | |
Banerjee et al. | Mobility prediction in vehicular networks: an approach through hybrid neural networks under uncertainty | |
CN113534251A (zh) | 基于卷积神经网络的地震数据断裂识别方法及装置 | |
Li et al. | Robot navigation in crowds environment base deep reinforcement learning with POMDP | |
Heinen et al. | Dealing with continuous-state reinforcement learning for intelligent control of traffic signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090610 Termination date: 20100913 |