CN115407665B - 一种基于h∞的机器人关节高效故障估计方法及装置 - Google Patents

一种基于h∞的机器人关节高效故障估计方法及装置 Download PDF

Info

Publication number
CN115407665B
CN115407665B CN202211359221.9A CN202211359221A CN115407665B CN 115407665 B CN115407665 B CN 115407665B CN 202211359221 A CN202211359221 A CN 202211359221A CN 115407665 B CN115407665 B CN 115407665B
Authority
CN
China
Prior art keywords
fault
observer
robot joint
weighting function
control system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211359221.9A
Other languages
English (en)
Other versions
CN115407665A (zh
Inventor
潘月斗
江万青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology Beijing USTB
Original Assignee
University of Science and Technology Beijing USTB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology Beijing USTB filed Critical University of Science and Technology Beijing USTB
Priority to CN202211359221.9A priority Critical patent/CN115407665B/zh
Publication of CN115407665A publication Critical patent/CN115407665A/zh
Application granted granted Critical
Publication of CN115407665B publication Critical patent/CN115407665B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于
Figure DEST_PATH_IMAGE001
的机器人关节高效故障估计方法及装置,涉及机器人故障诊断技术领域。包括:设计优化问题可调的复合式加权灵敏度故障观测器;基于深度确定策略梯度算法DDPG算法,对故障观测器的加权函数进行优化;基于优化后的故障观测器,对机器人关节控制系统进行故障观测,得到机器人关节故障估计结果。本发明设计一种优化问题可调的复合式加权灵敏度故障观测器对机器人关节控制系统进行观测,使故障观测器的灵敏度更高,机器人关节控制系统的动静态特性更好,鲁棒性更好。同时使用DDPG算法优化复合式加权灵敏度
Figure 614300DEST_PATH_IMAGE001
故障观测器的加权函数参数,克服了普通
Figure 610069DEST_PATH_IMAGE001
故障观测器设计的保守性,避免了传统的人工试凑,使机器人关节控制系统工作更加高效。

Description

一种基于H∞的机器人关节高效故障估计方法及装置
技术领域
本发明涉及机器人故障诊断技术领域,特别是指一种基于
Figure 392481DEST_PATH_IMAGE001
的机器人关节高效 故障估计方法及装置。
背景技术
工业机器人作为一种新型生产设备,一经问世便为人们的生产生活提供了诸多便 利。随着机器人技术的不断发展,在医疗、汽车、国防军工等生产场合,机器人发挥着越来越 重要的作用。但是由于机器人系统变得越来越复杂,而且实际生产过程中工业机器人长时 间处于高负荷运转状态,这给机器人系统状态监测带来了不小的挑战。若不能及时对系统 发生的故障进行发现、估计和诊断,可能会导致系统控制系统性能不稳定引起不可估计的 严重损失。基于此种情况,人们将
Figure 550536DEST_PATH_IMAGE001
控制思想运用于机器人关节的故障观测器与容错控 制器的设计,从而保证机器人在故障发生前后均有较好的控制效果。
但是在设计
Figure 742614DEST_PATH_IMAGE001
故障观测器对机器人关节进行故障观测时,可能出现故障观测器 对故障不敏感的情况、动静态特性不好等不足。
发明内容
本发明针对现有
Figure 979429DEST_PATH_IMAGE001
故障观测器的灵敏度不高、机器人关节控制系统的动静态特 性较差的问题;以及普通
Figure 79103DEST_PATH_IMAGE001
故障观测器设计的保守性,采用传统的人工试凑效率低的问 题,提出了本发明。
为解决上述技术问题,本发明提供如下技术方案:
一方面,本发明提供了一种基于
Figure 780081DEST_PATH_IMAGE001
的机器人关节高效故障估计方法,该方法由电 子设备实现,该方法包括:
S1、设计优化问题可调的复合式加权灵敏度故障观测器。
S2、基于深度确定策略梯度算法DDPG算法,对复合式加权灵敏度故障观测器的加权函数进行优化。
S3、基于优化后的复合式加权灵敏度故障观测器,对机器人关节控制系统进行故障观测,得到机器人关节故障估计结果。
可选地,S1中的设计优化问题可调的复合式加权灵敏度故障观测器包括:
S11、基于线性时不变LTI系统,构造基于故障观测器的故障估计器。
S12、定义故障观测器的状态估计误差与故障观测误差。
S13、根据故障估计器、状态估计误差与故障观测误差,得到故障观测器方程。
S14、基于故障观测器方程,设计故障观测器的增益矩阵
Figure 392328DEST_PATH_IMAGE002
Figure 414642DEST_PATH_IMAGE003
,使得故障观测器误 差系统稳定,且满足机器人关节控制系统外部扰动
Figure 754225DEST_PATH_IMAGE004
与故障信号
Figure 529283DEST_PATH_IMAGE005
Figure 328743DEST_PATH_IMAGE001
范数性能 指标。
可选地,S13中的故障观测器方程,如下式(1)所示:
Figure 336888DEST_PATH_IMAGE006
其中,
Figure 450469DEST_PATH_IMAGE007
为适当维数已知矩阵;
Figure 814454DEST_PATH_IMAGE008
为状态估计误差。
可选地,S14中的基于故障观测器方程,设计故障观测器的增益矩阵
Figure 283350DEST_PATH_IMAGE002
Figure 14677DEST_PATH_IMAGE003
,使得故 障观测器误差系统稳定,且满足机器人关节控制系统外部扰动
Figure 446795DEST_PATH_IMAGE004
与故障信号
Figure 602970DEST_PATH_IMAGE005
Figure 711609DEST_PATH_IMAGE001
范数性能指标包括:
S141、基于故障观测器方程,利用频率域回路整形方法选取加权函数,进而确定加权函数的状态空间实现。
S142、基于加权函数的状态空间实现,设计故障观测器的增益矩阵
Figure 382762DEST_PATH_IMAGE002
Figure 369304DEST_PATH_IMAGE003
,设计动 态输出反馈控制器
Figure 442302DEST_PATH_IMAGE009
Figure 721842DEST_PATH_IMAGE010
,使得机器人关节控制系统故障信号
Figure 880291DEST_PATH_IMAGE005
到故障观测器误差
Figure 404945DEST_PATH_IMAGE011
的闭环传递函数
Figure 332449DEST_PATH_IMAGE012
Figure 782891DEST_PATH_IMAGE001
范数、以及外部干扰
Figure 694215DEST_PATH_IMAGE004
到故障观测器误差
Figure 960243DEST_PATH_IMAGE011
的 闭环传递函数
Figure 7833DEST_PATH_IMAGE013
Figure 894755DEST_PATH_IMAGE001
范数最小,并且被控对象
Figure 231059DEST_PATH_IMAGE014
的输出能够跟踪给定参考指令信号
Figure 346782DEST_PATH_IMAGE015
可选地,加权函数包括灵敏度加权函数
Figure 265191DEST_PATH_IMAGE016
Figure 808168DEST_PATH_IMAGE017
、控制加权函数
Figure 615456DEST_PATH_IMAGE018
Figure 800449DEST_PATH_IMAGE019
以 及补灵敏度加权函数
Figure 307785DEST_PATH_IMAGE020
Figure 21663DEST_PATH_IMAGE021
可选地,S142中的设计动态输出反馈控制器
Figure 402002DEST_PATH_IMAGE009
Figure 859528DEST_PATH_IMAGE010
包括:
对于闭环传递函数
Figure 673900DEST_PATH_IMAGE012
,基于
Figure 840570DEST_PATH_IMAGE016
Figure 169921DEST_PATH_IMAGE018
以及
Figure 883667DEST_PATH_IMAGE020
的状态空间实现,构建广义 被控对象
Figure 614863DEST_PATH_IMAGE022
的状态空间模型,对
Figure 686855DEST_PATH_IMAGE022
设计动态输出反馈控制器
Figure 706764DEST_PATH_IMAGE009
对于闭环传递函数
Figure 771672DEST_PATH_IMAGE013
,基于
Figure 606642DEST_PATH_IMAGE017
Figure 302065DEST_PATH_IMAGE019
以及
Figure 356740DEST_PATH_IMAGE021
的状态空间实现,构建广义 被控对象
Figure 959760DEST_PATH_IMAGE023
的状态空间模型,对
Figure 914815DEST_PATH_IMAGE023
设计动态输出反馈控制器
Figure 515561DEST_PATH_IMAGE010
可选地,设计动态输出反馈控制器
Figure 306799DEST_PATH_IMAGE009
,以及设计动态输出反馈控制器
Figure 464242DEST_PATH_IMAGE010
,还包括:
基于
Figure 227799DEST_PATH_IMAGE001
控制思想和广义内模控制原理,将积分器加入动态输出反馈控制器
Figure 45451DEST_PATH_IMAGE009
以 及
Figure 589565DEST_PATH_IMAGE010
的控制通道中。
另一方面,本发明提供了一种基于
Figure 737649DEST_PATH_IMAGE001
的机器人关节高效故障估计装置,该装置应 用于实现基于
Figure 168762DEST_PATH_IMAGE001
的机器人关节高效故障估计方法,该装置包括:
设计模块,用于设计优化问题可调的复合式加权灵敏度故障观测器。
优化模块,用于基于深度确定策略梯度算法DDPG算法,对复合式加权灵敏度故障观测器的加权函数进行优化。
输出模块,用于基于优化后的复合式加权灵敏度故障观测器,对机器人关节控制系统进行故障观测,得到机器人关节故障估计结果。
可选地,设计模块,进一步用于:
S11、基于线性时不变LTI系统,构造基于故障观测器的故障估计器。
S12、定义故障观测器的状态估计误差与故障观测误差。
S13、根据故障估计器、状态估计误差与故障观测误差,得到故障观测器方程。
S14、基于故障观测器方程,设计故障观测器的增益矩阵
Figure 452588DEST_PATH_IMAGE002
Figure 218419DEST_PATH_IMAGE003
,使得故障观测器误 差系统稳定,且满足机器人关节控制系统外部扰动
Figure 717664DEST_PATH_IMAGE004
与故障信号
Figure 252551DEST_PATH_IMAGE005
Figure 412006DEST_PATH_IMAGE001
范数性能 指标。
可选地,故障观测器方程,如下式(1)所示:
Figure 399553DEST_PATH_IMAGE006
其中,
Figure 436911DEST_PATH_IMAGE007
为适当维数已知矩阵;
Figure 29566DEST_PATH_IMAGE008
为状态估计误差。
可选地,设计模块,进一步用于:
S141、基于故障观测器方程,利用频率域回路整形方法选取加权函数,进而确定加权函数的状态空间实现。
S142、基于加权函数的状态空间实现,设计故障观测器的增益矩阵
Figure 625501DEST_PATH_IMAGE002
Figure 365924DEST_PATH_IMAGE003
,设计动 态输出反馈控制器
Figure 941393DEST_PATH_IMAGE009
Figure 185293DEST_PATH_IMAGE010
,使得机器人关节控制系统故障信号
Figure 906124DEST_PATH_IMAGE005
到故障观测器误差
Figure 383111DEST_PATH_IMAGE011
的闭环传递函数
Figure 214800DEST_PATH_IMAGE012
Figure 63939DEST_PATH_IMAGE001
范数、以及外部干扰
Figure 17988DEST_PATH_IMAGE004
到故障观测器误差
Figure 670687DEST_PATH_IMAGE011
的 闭环传递函数
Figure 86493DEST_PATH_IMAGE024
Figure 570564DEST_PATH_IMAGE001
范数最小,并且被控对象
Figure 383931DEST_PATH_IMAGE014
的输出能够跟踪给定参考指令信号
Figure 55083DEST_PATH_IMAGE015
可选地,加权函数包括灵敏度加权函数
Figure 805739DEST_PATH_IMAGE016
Figure 82000DEST_PATH_IMAGE017
、控制加权函数
Figure 112273DEST_PATH_IMAGE018
Figure 287033DEST_PATH_IMAGE019
以 及补灵敏度加权函数
Figure 795375DEST_PATH_IMAGE020
Figure 440989DEST_PATH_IMAGE021
可选地,设计模块,进一步用于:
对于闭环传递函数
Figure 907742DEST_PATH_IMAGE012
,基于
Figure 304220DEST_PATH_IMAGE016
Figure 819515DEST_PATH_IMAGE018
以及
Figure 867105DEST_PATH_IMAGE020
的状态空间实现,构建广义 被控对象
Figure 754027DEST_PATH_IMAGE022
的状态空间模型,对
Figure 887069DEST_PATH_IMAGE022
设计动态输出反馈控制器
Figure 956787DEST_PATH_IMAGE009
对于闭环传递函数
Figure 124463DEST_PATH_IMAGE013
,基于
Figure 916707DEST_PATH_IMAGE017
Figure 474728DEST_PATH_IMAGE019
以及
Figure 659721DEST_PATH_IMAGE021
的状态空间实现,构建广义 被控对象
Figure 370320DEST_PATH_IMAGE023
的状态空间模型,对
Figure 84198DEST_PATH_IMAGE023
设计动态输出反馈控制器
Figure 730115DEST_PATH_IMAGE010
可选地,设计模块,进一步用于:
基于
Figure 390904DEST_PATH_IMAGE001
控制思想和广义内模控制原理,将积分器加入动态输出反馈控制器
Figure 267593DEST_PATH_IMAGE009
以 及
Figure 168684DEST_PATH_IMAGE010
的控制通道中。
一方面,提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中 存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现上述基于
Figure 498034DEST_PATH_IMAGE001
的 机器人关节高效故障估计方法。
一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令, 所述至少一条指令由处理器加载并执行以实现上述基于
Figure 946202DEST_PATH_IMAGE001
的机器人关节高效故障估计 方法。
本发明实施例提供的技术方案带来的有益效果至少包括:
上述方案中,设计一种优化问题可调的复合式加权灵敏度故障观测器对机器人关 节控制系统进行观测,使故障观测器的灵敏度更高,机器人关节控制系统的动静态特性更 好,鲁棒性更好。同时使用DDPG算法优化复合式加权灵敏度
Figure 677397DEST_PATH_IMAGE001
故障观测器的加权函数参 数,克服了普通
Figure 14969DEST_PATH_IMAGE001
故障观测器设计的保守性,避免了传统的人工试凑,使机器人关节控制 系统工作更加高效。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于
Figure 769298DEST_PATH_IMAGE001
的机器人关节高效故障估计方法流程示意图;
图2是本发明实施例提供的闭环传递函数
Figure 834206DEST_PATH_IMAGE012
控制示意图;
图3是本发明实施例提供的闭环传递函数
Figure 934755DEST_PATH_IMAGE024
控制示意图;
图4是本发明实施例提供的复合式加权灵敏度
Figure 364600DEST_PATH_IMAGE001
系统结构示意图;
图5是本发明实施例提供的基于DDPG的复合式加权灵敏度
Figure 684854DEST_PATH_IMAGE001
系统结构示意图;
图6是本发明实施例提供的基于
Figure 287873DEST_PATH_IMAGE001
的机器人关节高效故障估计装置框图;
图7是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
如图1所示,本发明实施例提供了一种基于
Figure 931344DEST_PATH_IMAGE001
的机器人关节高效故障估计方法, 该方法可以由电子设备实现。如图1所示的基于
Figure 109254DEST_PATH_IMAGE001
的机器人关节高效故障估计方法流程 图,该方法的处理流程可以包括如下的步骤:
S1、设计优化问题可调的复合式加权灵敏度故障观测器。
可选地,上述步骤S1可以包括以下步骤S11-S14:
S11、基于线性时不变LTI系统,构造基于故障观测器的故障估计器。
一种可行的实施方式中,考虑系统执行器故障与外部扰动情况下,在关节机器人多胞型LPV(Linear Parameter-Varying,线性变参数)系统顶点处,有下列LTI(LinearTime Invariant,线性时不变)系统,如下式(1)所示:
Figure 634913DEST_PATH_IMAGE025
其中,
Figure 792356DEST_PATH_IMAGE026
Figure 555912DEST_PATH_IMAGE027
Figure 373565DEST_PATH_IMAGE028
Figure 917678DEST_PATH_IMAGE029
Figure 65763DEST_PATH_IMAGE030
Figure 231296DEST_PATH_IMAGE031
,分别为系统状态,控制器输出,系统测量输出,
Figure 236161DEST_PATH_IMAGE001
性能目标函数,系统未知输 入(系统外部扰动),与执行器故障信号,并且
Figure 188943DEST_PATH_IMAGE032
Figure 203035DEST_PATH_IMAGE031
Figure 223075DEST_PATH_IMAGE033
范数有界信号。 并且系统矩阵
Figure 602104DEST_PATH_IMAGE034
均为适当维数已知矩 阵。
假设系统
Figure 855230DEST_PATH_IMAGE035
可控,
Figure 391123DEST_PATH_IMAGE036
可检测。构造基于观测器的故障估计 器,如下式(2)所示:
Figure 780516DEST_PATH_IMAGE037
其中,
Figure 81178DEST_PATH_IMAGE038
为观测器状态向量,
Figure 290443DEST_PATH_IMAGE002
Figure 895605DEST_PATH_IMAGE003
为需要求解的观测器参数矩阵。
S12、定义故障观测器的状态估计误差与故障观测误差。
一种可行的实施方式中,由于所设计故障观测器目标是使得观测器实际故障信号有尽可能的准确估计效果,令状态估计误差与故障观测误差为下式(3):
Figure 342767DEST_PATH_IMAGE039
由上式得:
Figure 860336DEST_PATH_IMAGE040
此外,将
Figure 838788DEST_PATH_IMAGE041
代入
Figure 670477DEST_PATH_IMAGE042
,可得:
Figure 18151DEST_PATH_IMAGE043
S13、根据故障估计器、状态估计误差与故障观测误差,得到故障观测器方程。
可选地,S13中的故障观测器方程,如下式(4)所示:
Figure 972201DEST_PATH_IMAGE044
其中,
Figure 359320DEST_PATH_IMAGE007
为适当维数已知矩阵;
Figure 807750DEST_PATH_IMAGE008
为状态估计误差。
S14、基于故障观测器方程,设计故障观测器的增益矩阵
Figure 26241DEST_PATH_IMAGE002
Figure 134880DEST_PATH_IMAGE003
,使得故障观测器误 差系统稳定,且满足机器人关节控制系统外部扰动
Figure 806033DEST_PATH_IMAGE004
与故障信号
Figure 526996DEST_PATH_IMAGE005
Figure 803256DEST_PATH_IMAGE001
范数性能 指标。
可选地,上述步骤S14可以包括下述步骤S141-S142:
S141、基于故障观测器方程,利用频率域回路整形方法选取加权函数,进而确定加权函数的状态空间实现。
可选地,加权函数包括灵敏度加权函数
Figure 82797DEST_PATH_IMAGE016
Figure 506825DEST_PATH_IMAGE017
、控制加权函数
Figure 484008DEST_PATH_IMAGE018
Figure 693404DEST_PATH_IMAGE019
以 及补灵敏度加权函数
Figure 894578DEST_PATH_IMAGE020
Figure 727274DEST_PATH_IMAGE021
一种可行的实施方式中,根据观测器的方程,可以将问题进一步转化为,设计观测 器增益矩阵
Figure 570465DEST_PATH_IMAGE045
使得上述观测器误差系统稳定,且满足系统外部扰动
Figure 821317DEST_PATH_IMAGE004
与故障信号
Figure 944125DEST_PATH_IMAGE005
Figure 77166DEST_PATH_IMAGE001
性能指标。但是使用原来的
Figure 645420DEST_PATH_IMAGE001
性能指标存在灵敏度不高的问题,会导致机器 人关节控制系统的动静态特性较差,因此本文利用频率域回路整形方法,选取
Figure 813096DEST_PATH_IMAGE016
Figure 106805DEST_PATH_IMAGE017
(灵敏度加权函数)、
Figure 930405DEST_PATH_IMAGE018
Figure 584240DEST_PATH_IMAGE019
(控制加权函数)、
Figure 121269DEST_PATH_IMAGE020
Figure 38410DEST_PATH_IMAGE021
(补灵敏度加权函数),设计 观测器增益矩阵
Figure 896776DEST_PATH_IMAGE045
以及动态输出反馈控制器
Figure 354302DEST_PATH_IMAGE009
Figure 434253DEST_PATH_IMAGE010
,使得系统故障信号
Figure 833879DEST_PATH_IMAGE005
到观测器 误差
Figure 366492DEST_PATH_IMAGE011
的闭环传递函数
Figure 378441DEST_PATH_IMAGE012
Figure 109637DEST_PATH_IMAGE001
范数以及系统干扰
Figure 414585DEST_PATH_IMAGE004
到观测器误差
Figure 496811DEST_PATH_IMAGE011
的闭 环传递函数
Figure 764981DEST_PATH_IMAGE013
Figure 101416DEST_PATH_IMAGE001
范数最小,并且对象
Figure 593577DEST_PATH_IMAGE014
输出
Figure 373487DEST_PATH_IMAGE011
能够跟踪给定参考指令信号
Figure 976506DEST_PATH_IMAGE015
, 利用此方法来解决上述问题。
其中,
Figure 433026DEST_PATH_IMAGE016
Figure 299351DEST_PATH_IMAGE017
(灵敏度加权函数)的选择由系统性能要求决定, 一般具有积分 特性或高增益低通特性, 积分可以有效抑制系统超调量, 而适当提高增益可以增加频宽, 提高系统动态响应, 具有在低频段稳态跟踪输入信号和抑制外界低频扰动能力。
Figure 90590DEST_PATH_IMAGE018
Figure 746568DEST_PATH_IMAGE019
(控制加权函数)的选择由系统不确定性的摄动范围来决定,一般主 要用来约束鲁棒控制器的输出,
Figure 244545DEST_PATH_IMAGE001
加权灵敏度设计中可以通过对加权阵的选取实现对控 制器信号幅值的限制。为了降低控制器的阶次,通常取控制加权函数为一常数, 从而保证 了系统的频宽要求。
Figure 829242DEST_PATH_IMAGE020
Figure 638935DEST_PATH_IMAGE021
(补灵敏度加权函数)的选择通常根据系统模型不确定性(未建模动 态) 来选取,一般具有高通特性,且灵敏度加权函数和补灵敏度加权函数的频率尽可能不 要重叠, 同时补灵敏度加权函数的选取阶次应不宜过大, 以免影响系统迭代速度及控制 器阶数, 增加系统复杂度。
S142、基于加权函数的状态空间实现,设计故障观测器的增益矩阵
Figure 833025DEST_PATH_IMAGE002
Figure 451088DEST_PATH_IMAGE003
,设计动 态输出反馈控制器
Figure 206685DEST_PATH_IMAGE009
Figure 972516DEST_PATH_IMAGE010
,使得机器人关节控制系统故障信号
Figure 970297DEST_PATH_IMAGE005
到故障观测器误差
Figure 442866DEST_PATH_IMAGE011
的闭环传递函数
Figure 618633DEST_PATH_IMAGE012
Figure 356913DEST_PATH_IMAGE001
范数、以及外部干扰
Figure 909117DEST_PATH_IMAGE004
到故障观测器误差
Figure 751040DEST_PATH_IMAGE011
的 闭环传递函数
Figure 832128DEST_PATH_IMAGE013
Figure 323283DEST_PATH_IMAGE001
范数最小,并且被控对象
Figure 413599DEST_PATH_IMAGE014
的输出能够跟踪给定参考指令信号
Figure 860761DEST_PATH_IMAGE015
可选地,S142中的设计动态输出反馈控制器
Figure 893177DEST_PATH_IMAGE009
Figure 589737DEST_PATH_IMAGE010
包括:
对于闭环传递函数
Figure 172160DEST_PATH_IMAGE012
,基于
Figure 801724DEST_PATH_IMAGE016
Figure 693457DEST_PATH_IMAGE018
以及
Figure 657739DEST_PATH_IMAGE020
的状态空间实现,构建广义 被控对象
Figure 637328DEST_PATH_IMAGE022
的状态空间模型,对
Figure 855820DEST_PATH_IMAGE022
设计动态输出反馈控制器
Figure 167721DEST_PATH_IMAGE009
一种可行的实施方式中,对于闭环传递函数
Figure 104453DEST_PATH_IMAGE012
有下式(5):
Figure 825416DEST_PATH_IMAGE046
进一步地,基于
Figure 101676DEST_PATH_IMAGE001
控制思想和广义内模控制原理,将积分器加入控制通道中,对
Figure 397528DEST_PATH_IMAGE047
设计加权灵敏度动态输出反馈
Figure 805245DEST_PATH_IMAGE001
控制器
Figure 782428DEST_PATH_IMAGE048
,使被控对象
Figure 726244DEST_PATH_IMAGE049
输出能够跟踪 参考输入信号。对于
Figure 130681DEST_PATH_IMAGE049
Figure 42005DEST_PATH_IMAGE050
是满足要求的控制器。
Figure 72147DEST_PATH_IMAGE016
Figure 854158DEST_PATH_IMAGE018
Figure 242545DEST_PATH_IMAGE020
状态空间实现分别为:
Figure 578849DEST_PATH_IMAGE051
Figure 960151DEST_PATH_IMAGE052
Figure 111516DEST_PATH_IMAGE053
,即:
Figure 654493DEST_PATH_IMAGE054
另外,
Figure 228825DEST_PATH_IMAGE055
,令:
Figure 522141DEST_PATH_IMAGE056
Figure 29476DEST_PATH_IMAGE057
Figure 212196DEST_PATH_IMAGE058
Figure 54250DEST_PATH_IMAGE059
Figure 26623DEST_PATH_IMAGE060
按照标准
Figure 903312DEST_PATH_IMAGE001
控制问题结构,可得广义被控对象
Figure 742086DEST_PATH_IMAGE022
状态空间模型如下式(6)所示:
Figure 71436DEST_PATH_IMAGE061
其中,
Figure 847500DEST_PATH_IMAGE062
控制目标变为对
Figure 109854DEST_PATH_IMAGE022
设计动态输出反馈控制器
Figure 119530DEST_PATH_IMAGE009
,使得(1)闭环系统稳定;
(2)系统故障输入
Figure 201755DEST_PATH_IMAGE063
到评价信号
Figure 250352DEST_PATH_IMAGE064
的闭环传递函数
Figure 39316DEST_PATH_IMAGE065
Figure 797057DEST_PATH_IMAGE001
范数最 小;
(3)对象
Figure 851731DEST_PATH_IMAGE014
输出
Figure 392434DEST_PATH_IMAGE011
能够跟踪给定参考指导信号
Figure 613069DEST_PATH_IMAGE066
。其控制示意图如图2所示。
对于闭环传递函数
Figure 10552DEST_PATH_IMAGE067
,基于
Figure 5053DEST_PATH_IMAGE017
Figure 896917DEST_PATH_IMAGE019
以及
Figure 722790DEST_PATH_IMAGE021
的状态空间实现,构建广义 被控对象
Figure 829459DEST_PATH_IMAGE023
的状态空间模型,对
Figure 45677DEST_PATH_IMAGE023
设计动态输出反馈控制器
Figure 6811DEST_PATH_IMAGE010
一种可行的实施方式中,闭环传递函数
Figure 421611DEST_PATH_IMAGE067
控制示意图如图3所示。
Figure 629739DEST_PATH_IMAGE017
Figure 644837DEST_PATH_IMAGE019
Figure 331033DEST_PATH_IMAGE021
状态空间实现分别为:
Figure 616652DEST_PATH_IMAGE068
Figure 57998DEST_PATH_IMAGE069
Figure 248808DEST_PATH_IMAGE070
,即:
Figure 784700DEST_PATH_IMAGE071
令:
Figure 908514DEST_PATH_IMAGE072
Figure 271494DEST_PATH_IMAGE073
Figure 746337DEST_PATH_IMAGE074
Figure 289183DEST_PATH_IMAGE075
Figure 798662DEST_PATH_IMAGE076
按照标准
Figure 801384DEST_PATH_IMAGE001
控制问题结构,可得广义被控对象
Figure 966786DEST_PATH_IMAGE023
状态空间模型如下式(7)所示:
Figure 860793DEST_PATH_IMAGE077
其中,
Figure 677308DEST_PATH_IMAGE078
控制目标变为对
Figure 100199DEST_PATH_IMAGE023
设计动态输出反馈控制器
Figure 565946DEST_PATH_IMAGE010
,使得(1)闭环系统稳定;
(2)系统扰动输入
Figure 201327DEST_PATH_IMAGE079
到评价信号
Figure 419819DEST_PATH_IMAGE080
的闭环传递函数
Figure 528458DEST_PATH_IMAGE081
Figure 402873DEST_PATH_IMAGE001
范数最 小;
(3)对象
Figure 654994DEST_PATH_IMAGE082
输出
Figure 931255DEST_PATH_IMAGE011
能够跟踪给定参考指导信号
Figure 227107DEST_PATH_IMAGE083
引理:假设
Figure 634823DEST_PATH_IMAGE084
能稳能检测,则系统
Figure 612006DEST_PATH_IMAGE085
存在一个输出反馈
Figure 290244DEST_PATH_IMAGE086
次优
Figure 756997DEST_PATH_IMAGE001
控 制器当且仅当存在正定矩阵
Figure 606004DEST_PATH_IMAGE087
Figure 432884DEST_PATH_IMAGE088
,使得:
Figure 480474DEST_PATH_IMAGE089
其中:
Figure 806544DEST_PATH_IMAGE090
Figure 205165DEST_PATH_IMAGE091
分别是以子空间
Figure 570156DEST_PATH_IMAGE092
Figure 675515DEST_PATH_IMAGE093
中 任意一组向量作为列向量所构成的矩阵,即满足:
Figure 218492DEST_PATH_IMAGE094
Figure 589562DEST_PATH_IMAGE095
Figure 712238DEST_PATH_IMAGE096
的矩阵
Figure 983689DEST_PATH_IMAGE090
Figure 900829DEST_PATH_IMAGE091
进一步地,基于以上理论,设计一种优化问题可调的复合式加权灵敏度
Figure 8462DEST_PATH_IMAGE001
动态输 出反馈控制器,其控制如图4所示,且其求解算法如下所示:
(1)建立被控对象
Figure 482300DEST_PATH_IMAGE014
的状态空间模型;
(2)根据期望性能,利用回路整形方法,在频率域内确定
Figure 296672DEST_PATH_IMAGE097
进而确定其状态空间实现。同时整形函数的 阶数不能太复杂以保证控制器的阶数不至于太高。
(3)构造广义被控对象
Figure 961878DEST_PATH_IMAGE014
的状态空间模型,求解优化问题:
Figure 291228DEST_PATH_IMAGE098
满 足:
Figure 755707DEST_PATH_IMAGE099
其中:
Figure 237635DEST_PATH_IMAGE100
Figure 558895DEST_PATH_IMAGE101
分别是以子空间
Figure 828071DEST_PATH_IMAGE102
Figure 627400DEST_PATH_IMAGE103
中任意一组向量作为列向量所构成的矩阵,即满足:
Figure 229414DEST_PATH_IMAGE104
Figure 924837DEST_PATH_IMAGE105
的矩阵
Figure 228780DEST_PATH_IMAGE100
Figure 81067DEST_PATH_IMAGE101
Figure 990117DEST_PATH_IMAGE106
Figure 403912DEST_PATH_IMAGE107
分别是以子空间
Figure 195151DEST_PATH_IMAGE108
Figure 539544DEST_PATH_IMAGE109
中任意一组向量作为列向量所构成的矩 阵,即满足:
Figure 614685DEST_PATH_IMAGE110
Figure 386332DEST_PATH_IMAGE111
的矩阵
Figure 415599DEST_PATH_IMAGE106
Figure 626001DEST_PATH_IMAGE107
Figure 244064DEST_PATH_IMAGE112
为正定矩阵;
Figure 498197DEST_PATH_IMAGE113
Figure 264027DEST_PATH_IMAGE114
能稳能检 测;
Figure 700956DEST_PATH_IMAGE115
Figure 501422DEST_PATH_IMAGE115
为权值系数且都为正常数,可根据系统的实际需求调整其大小。
基于复合式加权灵敏度
Figure 660877DEST_PATH_IMAGE001
控制思想对
Figure 851687DEST_PATH_IMAGE014
设计观测器增益矩阵
Figure 403891DEST_PATH_IMAGE045
以及最优
Figure 747278DEST_PATH_IMAGE001
动态输出反馈控制器
Figure 359525DEST_PATH_IMAGE009
Figure 37631DEST_PATH_IMAGE010
。则对于该系统,
Figure 135073DEST_PATH_IMAGE045
为所求的增益矩阵且
Figure 644552DEST_PATH_IMAGE009
Figure 116115DEST_PATH_IMAGE010
为所求的控 制器。
S2、基于深度确定策略梯度算法DDPG算法,对复合式加权灵敏度故障观测器的加权函数进行优化。
一种可行的实施方式中,DDPG(Deep Deterministic Policy Gradient,深度确定 策略梯度算法)是一种强化学习算法,在本机器人关节控制系统中,运用DDPG算法来优化
Figure 78255DEST_PATH_IMAGE016
Figure 221529DEST_PATH_IMAGE017
(灵敏度加权函数)、
Figure 523198DEST_PATH_IMAGE018
Figure 211668DEST_PATH_IMAGE019
(控制加权函数)、
Figure 677416DEST_PATH_IMAGE020
Figure 47217DEST_PATH_IMAGE021
(补灵敏度加权 函数)参数,克服了普通加权灵敏度
Figure 780556DEST_PATH_IMAGE001
故障观测器设计的保守性,避免了传统的人工试 凑。
其算法具体流程如下:
输入:初始化Critic网络
Figure 639927DEST_PATH_IMAGE116
,Actor网络
Figure 514342DEST_PATH_IMAGE117
的网络参数
Figure 766463DEST_PATH_IMAGE118
Figure 42724DEST_PATH_IMAGE119
将Critic、Actor的参数拷贝给对应的目标网络函数(target)
Figure 587844DEST_PATH_IMAGE120
Figure 746292DEST_PATH_IMAGE121
的参数:
Figure 457896DEST_PATH_IMAGE122
Figure 401713DEST_PATH_IMAGE123
初始化记忆库R容量。
对于每一条参数探索轨迹,for episode = 1,…,
Figure 868466DEST_PATH_IMAGE124
初始化一个随机过程
Figure 763479DEST_PATH_IMAGE125
,用来给行为添加噪声;
获得初始化状态
Figure 278774DEST_PATH_IMAGE126
对于轨迹上的每一步,for t = 1,……,
Figure 342676DEST_PATH_IMAGE127
根据当前策略的探索噪声,获得行为
Figure 714751DEST_PATH_IMAGE128
执行行为
Figure 51055DEST_PATH_IMAGE129
,获得回报
Figure 681625DEST_PATH_IMAGE130
和下一个状态
Figure 786984DEST_PATH_IMAGE131
将状态转换序列
Figure 346273DEST_PATH_IMAGE132
存储于记忆库R中;
从R中随机采样
Figure 904293DEST_PATH_IMAGE133
个转换序列,作为online策略网络
Figure 823708DEST_PATH_IMAGE134
网络 (Critic)的一小批训练数据。
Figure 95158DEST_PATH_IMAGE135
表示单个转换序列。
令:
Figure 12298DEST_PATH_IMAGE136
通过最小化损失函数
Figure 136243DEST_PATH_IMAGE137
,更新online Critic网络函数
Figure 593769DEST_PATH_IMAGE138
Figure 408142DEST_PATH_IMAGE139
通过计算样本策略梯度
Figure 73347DEST_PATH_IMAGE140
,更新online Actor网络参数
Figure 402697DEST_PATH_IMAGE141
Figure 352330DEST_PATH_IMAGE142
通过滑动平均值更新目标网络参数
Figure 349105DEST_PATH_IMAGE143
Figure 873627DEST_PATH_IMAGE144
Figure 673961DEST_PATH_IMAGE145
单条轨迹结束,循环结束。
Figure 4449DEST_PATH_IMAGE124
条轨迹结束,循环结束。
输出:最优网络参数
Figure 544146DEST_PATH_IMAGE146
Figure 36307DEST_PATH_IMAGE147
以及最优策略。
综合上文对基于
Figure 589517DEST_PATH_IMAGE001
理论故障观测器设计的分析和DDPG强化学习算法,结合机器 关节多胞型LPV系统,本申请所设计的基于DDPG的优化问题可调的复合式加权灵敏度
Figure 395799DEST_PATH_IMAGE001
故障观测器控制结构图如图5所示。
由图5所示的控制系统求出最优的增益矩阵
Figure 101587DEST_PATH_IMAGE045
,既满足观测器误差系统稳定,又 满足系统外部扰动
Figure 515381DEST_PATH_IMAGE004
和故障信号
Figure 244303DEST_PATH_IMAGE005
的复合式加权灵敏度
Figure 165860DEST_PATH_IMAGE001
性能指标。
S3、基于优化后的复合式加权灵敏度故障观测器,对机器人关节控制系统进行故障观测,得到机器人关节故障估计结果。
本发明实施例中,设计了一种优化问题可调的复合式加权灵敏度故障观测器对机 器人关节控制系统进行观测,使故障观测器的灵敏度更高,机器人关节控制系统的动静态 特性更好,鲁棒性更好。同时使用DDPG算法优化复合式加权灵敏度
Figure 929417DEST_PATH_IMAGE001
故障观测器的加权 函数参数,克服了普通
Figure 763381DEST_PATH_IMAGE001
故障观测器设计的保守性,避免了传统的人工试凑,使机器人关 节控制系统工作更加高效。
如图6所示,本发明实施例提供了一种基于
Figure 995910DEST_PATH_IMAGE148
的机器人关节高效故障估计装置 600,该装置600应用于实现基于
Figure 940732DEST_PATH_IMAGE001
的机器人关节高效故障估计方法,该装置600包括:
设计模块610,用于设计优化问题可调的复合式加权灵敏度故障观测器。
优化模块620,用于基于深度确定策略梯度算法DDPG算法,对复合式加权灵敏度故障观测器的加权函数进行优化。
输出模块630,用于基于优化后的复合式加权灵敏度故障观测器,对机器人关节控制系统进行故障观测,得到机器人关节故障估计结果。
可选地,设计模块610,进一步用于:
S11、基于线性时不变LTI系统,构造基于故障观测器的故障估计器。
S12、定义故障观测器的状态估计误差与故障观测误差。
S13、根据故障估计器、状态估计误差与故障观测误差,得到故障观测器方程。
S14、基于故障观测器方程,设计故障观测器的增益矩阵
Figure 870380DEST_PATH_IMAGE002
Figure 812928DEST_PATH_IMAGE003
,使得故障观测器误 差系统稳定,且满足机器人关节控制系统外部扰动
Figure 578759DEST_PATH_IMAGE004
与故障信号
Figure 281267DEST_PATH_IMAGE005
Figure 550574DEST_PATH_IMAGE001
范数性能 指标。
可选地,故障观测器方程,如下式(1)所示:
Figure 975608DEST_PATH_IMAGE006
其中,
Figure 228735DEST_PATH_IMAGE007
为适当维数已知矩阵;
Figure 718622DEST_PATH_IMAGE008
为状态估计误差。
可选地,设计模块610,进一步用于:
S141、基于故障观测器方程,利用频率域回路整形方法选取加权函数,进而确定加权函数的状态空间实现。
S142、基于加权函数的状态空间实现,设计故障观测器的增益矩阵
Figure 858748DEST_PATH_IMAGE002
Figure 470995DEST_PATH_IMAGE003
,设计动 态输出反馈控制器
Figure 132789DEST_PATH_IMAGE009
Figure 488684DEST_PATH_IMAGE010
,使得机器人关节控制系统故障信号
Figure 483316DEST_PATH_IMAGE005
到故障观测器误差
Figure 885DEST_PATH_IMAGE011
的闭环传递函数
Figure 166287DEST_PATH_IMAGE012
Figure 43982DEST_PATH_IMAGE001
范数、以及外部干扰
Figure 407967DEST_PATH_IMAGE004
到故障观测器误差
Figure 50432DEST_PATH_IMAGE011
的 闭环传递函数
Figure 499868DEST_PATH_IMAGE024
Figure 181254DEST_PATH_IMAGE001
范数最小,并且被控对象
Figure 603008DEST_PATH_IMAGE014
的输出能够跟踪给定参考指令信号
Figure 462380DEST_PATH_IMAGE015
可选地,加权函数包括灵敏度加权函数
Figure 149844DEST_PATH_IMAGE016
Figure 120074DEST_PATH_IMAGE017
、控制加权函数
Figure 481540DEST_PATH_IMAGE018
Figure 777392DEST_PATH_IMAGE019
以 及补灵敏度加权函数
Figure 139103DEST_PATH_IMAGE020
Figure 929336DEST_PATH_IMAGE021
可选地,设计模块610,进一步用于:
对于闭环传递函数
Figure 122420DEST_PATH_IMAGE012
,基于
Figure 776124DEST_PATH_IMAGE016
Figure 421869DEST_PATH_IMAGE018
以及
Figure 750213DEST_PATH_IMAGE020
的状态空间实现,构建广义 被控对象
Figure 1066DEST_PATH_IMAGE022
的状态空间模型,对
Figure 638721DEST_PATH_IMAGE022
设计动态输出反馈控制器
Figure 958712DEST_PATH_IMAGE009
对于闭环传递函数
Figure 74436DEST_PATH_IMAGE024
,基于
Figure 727265DEST_PATH_IMAGE017
Figure 535821DEST_PATH_IMAGE019
以及
Figure 359421DEST_PATH_IMAGE021
的状态空间实现,构建广义 被控对象
Figure 262524DEST_PATH_IMAGE023
的状态空间模型,对
Figure 550286DEST_PATH_IMAGE023
设计动态输出反馈控制器
Figure 218158DEST_PATH_IMAGE010
可选地,设计模块610,进一步用于:
基于
Figure 325792DEST_PATH_IMAGE001
控制思想和广义内模控制原理,将积分器加入动态输出反馈控制器
Figure 986580DEST_PATH_IMAGE009
以 及
Figure 112537DEST_PATH_IMAGE010
的控制通道中。
本发明实施例中,设计了一种优化问题可调的复合式加权灵敏度故障观测器对机 器人关节控制系统进行观测,使故障观测器的灵敏度更高,机器人关节控制系统的动静态 特性更好,鲁棒性更好。同时使用DDPG算法优化复合式加权灵敏度
Figure 997316DEST_PATH_IMAGE001
故障观测器的加权 函数参数,克服了普通
Figure 342978DEST_PATH_IMAGE001
故障观测器设计的保守性,避免了传统的人工试凑,使机器人关 节控制系统工作更加高效。
图7是本发明实施例提供的一种电子设备700的结构示意图,
该电子设备700可因配置或性能不同而产生比较大的差异,可以包括一个或一个 以上处理器(central processing units,CPU)701和一个或一个以上的存储器702,其中, 存储器702中存储有至少一条指令,至少一条指令由处理器701加载并执行以实现下述基于
Figure 604195DEST_PATH_IMAGE001
的机器人关节高效故障估计方法:
S1、设计优化问题可调的复合式加权灵敏度故障观测器。
S2、基于深度确定策略梯度算法DDPG算法,对复合式加权灵敏度故障观测器的加权函数进行优化。
S3、基于优化后的复合式加权灵敏度故障观测器,对机器人关节控制系统进行故障观测,得到机器人关节故障估计结果。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器, 上述指令可由终端中的处理器执行以完成上述基于
Figure 787921DEST_PATH_IMAGE001
的机器人关节高效故障估计方法。 例如,计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据 存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于
Figure 574898DEST_PATH_IMAGE001
的机器人关节高效故障估计方法,其特征在于,所述方法包括:
S1、设计优化问题可调的复合式加权灵敏度故障观测器;
S2、基于深度确定策略梯度算法DDPG算法,对所述复合式加权灵敏度故障观测器的加权函数进行优化;
S3、基于优化后的复合式加权灵敏度故障观测器,对机器人关节控制系统进行故障观测,得到机器人关节故障估计结果;
述S1中的设计优化问题可调的复合式加权灵敏度故障观测器包括:
S11、基于线性时不变LTI系统,构造基于故障观测器的故障估计器;
S12、定义故障观测器的状态估计误差与故障观测误差;
S13、根据所述故障估计器、状态估计误差与故障观测误差,得到故障观测器方程;
S14、基于所述故障观测器方程,设计故障观测器的增益矩阵
Figure 577489DEST_PATH_IMAGE002
Figure 632032DEST_PATH_IMAGE003
,使得故障观测器误 差系统稳定,且满足机器人关节控制系统外部扰动
Figure 593035DEST_PATH_IMAGE004
与故障信号
Figure 834661DEST_PATH_IMAGE005
Figure 657254DEST_PATH_IMAGE001
范数性能 指标;
所述S14中的基于所述故障观测器方程,设计故障观测器的增益矩阵
Figure 566304DEST_PATH_IMAGE002
Figure 432629DEST_PATH_IMAGE003
,使得故障 观测器误差系统稳定,且满足机器人关节控制系统外部扰动
Figure 427130DEST_PATH_IMAGE004
与故障信号
Figure 37103DEST_PATH_IMAGE005
Figure 831620DEST_PATH_IMAGE001
范数性能指标包括:
S141、基于所述故障观测器方程,利用频率域回路整形方法选取加权函数,进而确定加权函数的状态空间实现;
其中,所述加权函数包括灵敏度加权函数
Figure 603267DEST_PATH_IMAGE006
Figure 350643DEST_PATH_IMAGE007
、控制加权函数
Figure 498727DEST_PATH_IMAGE008
Figure 382370DEST_PATH_IMAGE009
以及 补灵敏度加权函数
Figure 590497DEST_PATH_IMAGE010
Figure 44743DEST_PATH_IMAGE011
所述灵敏度加权函数
Figure 996519DEST_PATH_IMAGE006
Figure 734668DEST_PATH_IMAGE007
的选择由机器人关节控制系统性能要求决定;
所述控制加权函数
Figure 113696DEST_PATH_IMAGE006
Figure 304506DEST_PATH_IMAGE007
的选择由机器人关节控制系统不确定性的摄动范围决 定;
所述补灵敏度加权函数
Figure 794394DEST_PATH_IMAGE010
Figure 403361DEST_PATH_IMAGE011
的选择由机器人关节控制系统不确定性决定;
S142、基于所述加权函数的状态空间实现,设计故障观测器的增益矩阵
Figure 953291DEST_PATH_IMAGE002
Figure 631397DEST_PATH_IMAGE003
,设计动 态输出反馈控制器
Figure 924975DEST_PATH_IMAGE012
Figure 372137DEST_PATH_IMAGE013
,使得机器人关节控制系统故障信号
Figure 109280DEST_PATH_IMAGE005
到故障观测器误差
Figure 274682DEST_PATH_IMAGE014
的闭环传递函数
Figure 371951DEST_PATH_IMAGE015
Figure 673619DEST_PATH_IMAGE001
范数、以及外部干扰
Figure 565352DEST_PATH_IMAGE004
到故障观测器误差
Figure 483629DEST_PATH_IMAGE014
的 闭环传递函数
Figure 601233DEST_PATH_IMAGE016
Figure 288567DEST_PATH_IMAGE001
范数最小,并且被控对象
Figure 351200DEST_PATH_IMAGE017
的输出能够跟踪给定参考指令信号
Figure 225616DEST_PATH_IMAGE018
2.根据权利要求1所述的方法,其特征在于,所述S13中的故障观测器方程,如下式(1)所示:
Figure 930266DEST_PATH_IMAGE019
其中,
Figure 206527DEST_PATH_IMAGE020
为适当维数已知矩阵;
Figure 456374DEST_PATH_IMAGE021
为状态估计误差。
3.根据权利要求1所述的方法,其特征在于,所述S142中的设计动态输出反馈控制器
Figure 818085DEST_PATH_IMAGE012
Figure 795268DEST_PATH_IMAGE013
包括:
对于所述闭环传递函数
Figure 191615DEST_PATH_IMAGE015
,基于
Figure 596051DEST_PATH_IMAGE006
Figure 461370DEST_PATH_IMAGE008
以及
Figure 976665DEST_PATH_IMAGE010
的状态空间实现,构建广义 被控对象
Figure 227518DEST_PATH_IMAGE022
的状态空间模型,对所述
Figure 68435DEST_PATH_IMAGE022
设计动态输出反馈控制器
Figure 670317DEST_PATH_IMAGE012
对于所述闭环传递函数
Figure 989303DEST_PATH_IMAGE023
,基于
Figure 845395DEST_PATH_IMAGE007
Figure 857213DEST_PATH_IMAGE009
以及
Figure 415234DEST_PATH_IMAGE011
的状态空间实现,构建广义 被控对象
Figure 803490DEST_PATH_IMAGE024
的状态空间模型,对所述
Figure 763355DEST_PATH_IMAGE024
设计动态输出反馈控制器
Figure 699737DEST_PATH_IMAGE013
4.根据权利要求1所述的方法,其特征在于,所述设计动态输出反馈控制器
Figure 10633DEST_PATH_IMAGE012
,以及设 计动态输出反馈控制器
Figure 937001DEST_PATH_IMAGE013
,还包括:
基于
Figure 751373DEST_PATH_IMAGE001
控制思想和广义内模控制原理,将积分器加入动态输出反馈控制器
Figure 104994DEST_PATH_IMAGE012
以及
Figure 903185DEST_PATH_IMAGE013
的控制通道中。
5.一种基于
Figure 118397DEST_PATH_IMAGE001
的机器人关节高效故障估计装置,其特征在于,所述装置包括:
设计模块,用于设计优化问题可调的复合式加权灵敏度故障观测器;
优化模块,用于基于深度确定策略梯度算法DDPG算法,对所述复合式加权灵敏度故障观测器的加权函数进行优化;
输出模块,用于基于优化后的复合式加权灵敏度故障观测器,对机器人关节控制系统进行故障观测,得到机器人关节故障估计结果;
所述设计优化问题可调的复合式加权灵敏度故障观测器包括:
S11、基于线性时不变LTI系统,构造基于故障观测器的故障估计器;
S12、定义故障观测器的状态估计误差与故障观测误差;
S13、根据所述故障估计器、状态估计误差与故障观测误差,得到故障观测器方程;
S14、基于所述故障观测器方程,设计故障观测器的增益矩阵
Figure 52855DEST_PATH_IMAGE002
Figure 842957DEST_PATH_IMAGE003
,使得故障观测器误 差系统稳定,且满足机器人关节控制系统外部扰动
Figure 597286DEST_PATH_IMAGE004
与故障信号
Figure 131036DEST_PATH_IMAGE005
Figure 670732DEST_PATH_IMAGE001
范数性能 指标;
所述S14中的基于所述故障观测器方程,设计故障观测器的增益矩阵
Figure 100577DEST_PATH_IMAGE002
Figure 873361DEST_PATH_IMAGE003
,使得故障 观测器误差系统稳定,且满足机器人关节控制系统外部扰动
Figure 679643DEST_PATH_IMAGE004
与故障信号
Figure 588693DEST_PATH_IMAGE005
Figure 455018DEST_PATH_IMAGE001
范数性能指标包括:
S141、基于所述故障观测器方程,利用频率域回路整形方法选取加权函数,进而确定加权函数的状态空间实现;
其中,所述加权函数包括灵敏度加权函数
Figure 200251DEST_PATH_IMAGE006
Figure 810224DEST_PATH_IMAGE007
、控制加权函数
Figure 573780DEST_PATH_IMAGE008
Figure 611007DEST_PATH_IMAGE009
以及 补灵敏度加权函数
Figure 92804DEST_PATH_IMAGE010
Figure 240888DEST_PATH_IMAGE011
所述灵敏度加权函数
Figure 872333DEST_PATH_IMAGE006
Figure 814881DEST_PATH_IMAGE007
的选择由机器人关节控制系统性能要求决定;
所述控制加权函数
Figure 783974DEST_PATH_IMAGE006
Figure 735750DEST_PATH_IMAGE007
的选择由机器人关节控制系统不确定性的摄动范围决 定;
所述补灵敏度加权函数
Figure 208320DEST_PATH_IMAGE010
Figure 603660DEST_PATH_IMAGE011
的选择由机器人关节控制系统不确定性决定;
S142、基于所述加权函数的状态空间实现,设计故障观测器的增益矩阵
Figure 794470DEST_PATH_IMAGE002
Figure 549936DEST_PATH_IMAGE003
,设计动 态输出反馈控制器
Figure 142592DEST_PATH_IMAGE012
Figure 958101DEST_PATH_IMAGE013
,使得机器人关节控制系统故障信号
Figure 370628DEST_PATH_IMAGE005
到故障观测器误差
Figure 414938DEST_PATH_IMAGE014
的闭环传递函数
Figure 127679DEST_PATH_IMAGE015
Figure 848511DEST_PATH_IMAGE001
范数、以及外部干扰
Figure 13913DEST_PATH_IMAGE004
到故障观测器误差
Figure 111182DEST_PATH_IMAGE014
的 闭环传递函数
Figure 412850DEST_PATH_IMAGE016
Figure 320894DEST_PATH_IMAGE001
范数最小,并且被控对象
Figure 708013DEST_PATH_IMAGE017
的输出能够跟踪给定参考指令信号
Figure 343394DEST_PATH_IMAGE018
CN202211359221.9A 2022-11-02 2022-11-02 一种基于h∞的机器人关节高效故障估计方法及装置 Active CN115407665B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211359221.9A CN115407665B (zh) 2022-11-02 2022-11-02 一种基于h∞的机器人关节高效故障估计方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211359221.9A CN115407665B (zh) 2022-11-02 2022-11-02 一种基于h∞的机器人关节高效故障估计方法及装置

Publications (2)

Publication Number Publication Date
CN115407665A CN115407665A (zh) 2022-11-29
CN115407665B true CN115407665B (zh) 2023-02-28

Family

ID=84169261

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211359221.9A Active CN115407665B (zh) 2022-11-02 2022-11-02 一种基于h∞的机器人关节高效故障估计方法及装置

Country Status (1)

Country Link
CN (1) CN115407665B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116021516B (zh) * 2022-12-22 2024-06-21 西南科技大学 一种多自由度机械臂容错控制方法
CN117913902B (zh) * 2024-03-19 2024-06-14 山东大学 基于预设时间观测器的孤岛微网状态估计方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2931624A1 (en) * 2013-12-23 2015-07-02 Exxonmobil Research And Engineering Company Systems and methods for event detection and diagnosis
CN110955231A (zh) * 2019-12-18 2020-04-03 中国科学院长春光学精密机械与物理研究所 基于鲁棒观测器的卫星姿控系统微小故障检测方法
CN111740669A (zh) * 2020-07-31 2020-10-02 北京科技大学 一种机器人关节伺服电机控制方法
CN112067925A (zh) * 2020-09-07 2020-12-11 淮阴工学院 一种针对升压变换器电路的实时加权故障检测方法
CN112207834A (zh) * 2020-12-10 2021-01-12 北京科技大学 一种基于干扰观测器的机器人关节系统控制方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2931624A1 (en) * 2013-12-23 2015-07-02 Exxonmobil Research And Engineering Company Systems and methods for event detection and diagnosis
CN110955231A (zh) * 2019-12-18 2020-04-03 中国科学院长春光学精密机械与物理研究所 基于鲁棒观测器的卫星姿控系统微小故障检测方法
CN111740669A (zh) * 2020-07-31 2020-10-02 北京科技大学 一种机器人关节伺服电机控制方法
CN112067925A (zh) * 2020-09-07 2020-12-11 淮阴工学院 一种针对升压变换器电路的实时加权故障检测方法
CN112207834A (zh) * 2020-12-10 2021-01-12 北京科技大学 一种基于干扰观测器的机器人关节系统控制方法及系统

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
Robust Fault Detection for Switched Fuzzy Systems With Unknown Input;Jian Han 等;《IEEE Transactions on Cybernetics 》;20171003;全文 *
以观测器为基础的量化网络化系统故障检测;王朝辉;《电子设计工程》;20130705(第13期);全文 *
基于H_-/H_∞优化的风力发电机组传感器故障检测;李东亮等;《上海电机学院学报》;20160425(第02期);全文 *
基于LMI的H_/H_∞故障检测观测器设计;吴丽娜等;《系统工程与电子技术》;20120815(第08期);全文 *
基于状态观测器的鲁棒故障诊断滤波器设计LMI方法;Steven X.Ding;《自动化学报》;20021122(第06期);全文 *
基于观测器的网络控制系统的故障检测;陈雨等;《控制工程》;20070720;全文 *
网络控制系统故障诊断滤波器设计的LMI方法;刘云霞等;《山东大学学报(工学版)》;20050630(第03期);全文 *

Also Published As

Publication number Publication date
CN115407665A (zh) 2022-11-29

Similar Documents

Publication Publication Date Title
CN115407665B (zh) 一种基于h∞的机器人关节高效故障估计方法及装置
Yang et al. Decentralized event-triggered control for a class of nonlinear-interconnected systems using reinforcement learning
Wang et al. Fully distributed consensus control for a class of disturbed second-order multi-agent systems with directed networks
Yang et al. H∞ bumpless transfer reliable control of Markovian switching LPV systems subject to actuator failures
Janczak Identification of nonlinear systems using neural networks and polynomial models: a block-oriented approach
CN110162739B (zh) 基于变遗忘因子的rffklms算法权值更新优化方法
Pin et al. Robust deadbeat continuous-time observer design based on modulation integrals
CN105739310A (zh) 一种基于多模型的伺服系统自适应控制系统
Toscano et al. A new heuristic approach for non-convex optimization problems
Habib et al. Data-driven modeling: concept, techniques, challenges and a case study
CN115390459B (zh) 模型预测控制方法及装置
Si et al. Adaptive neural control for stochastic pure‐feedback non‐linear time‐delay systems with output constraint and asymmetric input saturation
CN113721458A (zh) 一种具有扰动的非线性系统故障估计观测方法和装置
CN111044926A (zh) 质子交换膜燃料电池寿命预测方法
Tan et al. ZKF-based optimal robust fault estimation of descriptor LPV systems with measurement error-affected scheduling variables
CN113820954B (zh) 一种广义噪声下复杂非线性系统的容错控制方法
Cheng et al. A novel adaptive gain strategy for stochastic learning control
CN105068529B (zh) 一种基于加权残差分量比较的故障分离方法及系统
Alipouri et al. Distributed data‐driven observer for linear time invariant systems
CN113721469A (zh) 污水处理系统的传感器加性故障的自愈控制方法及系统
Xiao et al. A novel H∞ memory observer design for uncertain switched nonlinear systems using past output measurements
Li et al. Zonotopic fault interval estimation for discrete-time Markovin jump systems with generally bounded transition probabilities
Alamdari et al. Neural network model-based predictive control for multivariable nonlinear systems
CN112379601A (zh) 基于工业过程的mfa控制系统设计方法
Patan et al. Robustness of neural-network-based nonlinear iterative learning control

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant