CN110308650A - 一种基于数据驱动的压电陶瓷驱动器控制方法 - Google Patents

一种基于数据驱动的压电陶瓷驱动器控制方法 Download PDF

Info

Publication number
CN110308650A
CN110308650A CN201910569941.XA CN201910569941A CN110308650A CN 110308650 A CN110308650 A CN 110308650A CN 201910569941 A CN201910569941 A CN 201910569941A CN 110308650 A CN110308650 A CN 110308650A
Authority
CN
China
Prior art keywords
piezoelectric ceramic
function
ceramic actuator
follows
line data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910569941.XA
Other languages
English (en)
Other versions
CN110308650B (zh
Inventor
陈学松
李星科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201910569941.XA priority Critical patent/CN110308650B/zh
Publication of CN110308650A publication Critical patent/CN110308650A/zh
Application granted granted Critical
Publication of CN110308650B publication Critical patent/CN110308650B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0205Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system
    • G05B13/021Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system in which a variable is automatically adjusted to optimise the performance
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)
  • Manipulator (AREA)

Abstract

本发明公开了一种基于数据驱动的压电陶瓷驱动器控制方法,包括以下步骤:1)对压电陶瓷驱动器的性能指标函数进行离散;2)引入Q函数并设计执行‑评价网络;3)采集离线数据集SM与在线数据si,更新并计算评价网络系数4)基于离线数据集SM与在线数据si,更新并计算执行网络系数5)给定允许误差ε,若满足误差要求,则输出否则返回3),继续更新系数,直至满足误差要求为止。本发明基于数据驱动,采用神经动态规划方法对压电陶瓷驱动器进行控制,避免了复杂的数学建模和参数辨识,并能有效消除压电陶瓷驱动器的非线性迟滞特性,达到提高控制精度、减少系统误差的目的。

Description

一种基于数据驱动的压电陶瓷驱动器控制方法
技术领域
本发明涉及压电陶瓷驱动器控制的技术领域,尤其涉及到一种基于数据驱动的压电陶瓷驱动器控制方法。
背景技术
压电陶瓷驱动器是一种利用智能材料的逆压电效应原理设计的超精密微位移元件,具有响应快、体积小、位移分辨率高等优点,被广泛应用于精密定位与精密制造之中。但是,由于其本身的物理性质具有迟滞和蠕变等非线性特性,导致定位精度不高。为了减少压电陶瓷驱动器的定位误差,目前国内外很多研究者基于Preisach模型、Maxwell模型、Prandtle-Ishlinskii模型等来设计控制方法。这些方法的主要不足之处是模型复杂,参数多且不易确定,计算量大等,这使得实际应用操作不便,难于推广使用。因此研究对压电陶瓷驱动器设计简易有效的控制方法,来提高压电陶瓷驱动器定位精度是很有必要的。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于数据驱动的压电陶瓷驱动器控制方法,该方法避免了复杂的建模过程,能够有效消除非线性迟滞特性,进一步提高压电陶瓷驱动器的定位精度。
为实现上述目的,本发明所提供的技术方案为:
一种基于数据驱动的压电陶瓷驱动器控制方法,包括以下步骤:
1)对压电陶瓷驱动器的性能指标函数进行离散;
2)引入Q函数并设计执行-评价网络;
3)采集离线数据集SM与在线数据si,更新并计算评价网络系数
4)基于离线数据集SM与在线数据si,更新并计算执行网络系数
5)给定允许误差ε,若满足误差要求,则输出否则返回3),继续更新系数,直至满足误差要求为止。
进一步地,所述步骤1)对压电陶瓷驱动器的性能指标函数进行离散具体如下:
压电陶瓷驱动器的性能指标函数为:
其中,x为实际输出位移,y为期望位移,u为控制策略,A和B为权矩阵;
离散后的性能指标函数为:
其中,T为时间间隔:T=tk+1-tk,tk(k=0,1,2,...)为时间节点;xl=x(tl),ul=u(xl),且P(xl,ul)=(xl-y)A(xl-y)+ulBul
进一步地,所述步骤2)引入Q函数并设计执行-评价网络的具体过程如下:
2-1)定义Q函数:
其中a为当前位移的输入电压,且Qu(xk,u)=J(xk);
2-2)估计Q函数:
Q(i)(xk,a)=P(xk,a)+Q(i)(xk+1,u(i));
其中i为更新次数;
2-3)更新控制策略u:
2-4)设计执行-评价神经网络,用执行网络逼近控制策略u(i)(x);用评价网络逼近Q函数Q(i)(x,a);取两组线性无关的基函数: 其中fj(x)=xj,ψj(x,a)=(x+a)j
该神经网络的输出为:
其中分别为执行网络和评价网络的权重系数的近似估计;分别为执行网络和评价网络的激活函数向量。
进一步地,所述步骤3)的具体过程如下:
为离线数据,其中为当前位移x在通过压电陶瓷驱动器输入电压a后得到的新的位移;离线数据集l=1,2,…,M,M为离线数据的数量;
定义Q函数的残差为:
利用Q函数的残差与ΨL(x,a)做内积为零,即:其中D为由数组(xl,al),l=1,2,…,M构成的集合,且内积定义为:
<w1(x,u),w2(x,u)>D=∫Dw1(x,u)w2(x,u)d(x,u),其中w1(x,u)与w2(x,u)为关于x和u的任意二元函数;
则可得:
,其中根据蒙特卡洛积分方法,令:ID=∫Dd(x,a);
基于离线数据集SM计算
其中
接着收集在线数据si=(xi-1,ui-1,xi),然后将在线数据si加入到离线数据集SM作为新的离线数据集SM+si,并用于计算
其中
ξi=ξ0L(xi-1,ui-1)P(xi-1,ui-1)。
进一步地,所述步骤4)的具体过程如下:
定义控制策略u的残差为:
利用控制策略u的残差与ΦL(x)做内积为零,即:
其中X为xl,l=1,2,…,M和xi构成的集合,且内积定义为:
<n1(x),n2(x)>x=∫xn1(x)n2(x)dx,n1(x)与n2(x)为关于x的任意一元函数;
则可得:
其中根据蒙特卡洛积分方法,令:Ix=∫xdx;
基于离线数据集SM与在线数据si,计算
其中
与现有技术相比,本方案原理和优点如下:
本方案基于数据驱动,采用神经动态规划方法对压电陶瓷驱动器进行控制,避免了复杂的数学建模和参数辨识,并能有效消除压电陶瓷驱动器的非线性迟滞特性,达到提高控制精度、减少系统误差的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的服务作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种基于数据驱动的压电陶瓷驱动器控制方法的原理流程图;
图2为采集离线数据集的原理示意图;
图3为收集在线数据的原理示意图图;
图4为执行-评价网络系数更新的原理示意图。
具体实施方式
下面结合具体实施例对本发明作进一步说明:
如图1所示,本实施例所述的一种基于数据驱动的压电陶瓷驱动器控制方法,包括以下五个步骤:
1)离散压电陶瓷驱动器的性能指标函数:
压电陶瓷驱动器的性能指标函数为:
其中,x为实际输出位移,y为期望位移,u为控制策略,A和B为权矩阵;
离散后的性能指标函数为:
其中,T为时间间隔:
T=tk+1-tk,tk(k=0,1,2,...)为时间节点;xl=x(tl),ul=u(xl),且P(xl,ul)=(xl-y)A(xl-y)+ulBul
2)引入Q函数并设计执行-评价网络:
首先定义Q函数:
其中a为当前位移的输入电压,且Qu(xk,u)=J(xk);
其次估计Q函数:
Q(i)(xk,a)=P(xk,a)+Q(i)(xk+1,u(i));
其中i为更新次数;
然后更新控制策略u:
最后设计执行-评价神经网络,用执行网络逼近控制策略u(i)(x);用评价网络逼近Q函数Q(i)(x,a);取两组线性无关的基函数: 其中fj(x)=xj,ψj(x,a)=(x+a)j;则控制策略u(i)(x)与Q函数Q(i)(x,a)可以被线性表出:
对基函数截取有限L1项来构造执行网络:
再对基函数截取有限L2项来构造评价网络:其中分别为执行网络和评价网络的权重系数向量;
分别为执行网络和评价网络的激活函数向量;
该神经网络的输出为:
其中分别为执行网络和评价网络的权重系数的近似估计。
3)采集离线数据集SM与在线数据si,更新并计算评价网络系数
为一个离线数据,其中为当前位移x在通过压电陶瓷驱动器输入电压a后得到的新的位移;离线数据集l=1,2,…,M,M为离线数据的数量;其中离线数据集SM可以通过压电陶瓷驱动器随机采样获得,其原理如图2所示;
定义Q函数的残差为:
利用Q函数的残差与ΨL(x,a)做内积为零,即:其中D为由数组(xl,al),l=1,2,…,M构成的集合,且内积定义为:
<w1(x,u),w2(x,u)>D=∫Dw1(x,u)w2(x,u)d(x,u),其中w1(x,u)与w2(x,u)为关于x和u的任意二元函数;
则可得:
,其中根据蒙特卡洛积分方法,令:ID=∫Dd(x,a);
则基于离线数据集SM计算的公式如下:
其中同理可得
其中
整理上面的计算则得:
接着收集在线数据si=(xi-1,ui-1,xi),其中xi-1与xi为i-1与i时刻的在线状态,ui-1为i-1时刻的控制策略,其获得的方式如图3;
然后将在线数据si加入到离线数据集SM作为新的离线数据集SM+si,并用于计算具体如下:
则可得:
其中
ξi=ξ0L(xi-1,ui-1)P(xi-1,ui-1)。
4)基于离线数据集SM与在线数据si,更新并计算执行网络系数
定义控制策略u的残差为:
利用控制策略u的残差与ФL(x)做内积为零,即
其中X为xl,l=1,2,…,M和xi构成的集合,且内积定义为:
<n1(x),n2(x)〉x=∫xn1(x)n2(x)dx,其中n1(x)与n2(x)为关于x的任意一元函数。
则可得:
其中根据蒙特卡洛积分方法,令Ix=∫xdx,则基于离线数据集SM与在线数据si得:
其中
则可得:
5)如图4,首先给定初始执行网络权重系数采集离线数据集SM,通过3)计算出评价网络权重系数然后通过4)更新并计算收集在线数据s1,并将其加入到离线数据集SM作为新的离线数据集SM+s1,通过3)计算然后通过4)更新并计算以此循环。
给定允许误差ε,若则输出否则返回3),继续更新系数,直至满足误差要求为止。
本实施例基于数据驱动,采用神经动态规划方法对压电陶瓷驱动器进行控制,避免了复杂的数学建模和参数辨识,并能有效消除压电陶瓷驱动器的非线性迟滞特性,达到提高控制精度、减少系统误差的目的。
以上所述之实施例子只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。

Claims (5)

1.一种基于数据驱动的压电陶瓷驱动器控制方法,其特征在于,包括以下步骤:
1)对压电陶瓷驱动器的性能指标函数进行离散;
2)引入Q函数并设计执行-评价网络;
3)采集离线数据集SM与在线数据si,更新并计算评价网络系数
4)基于离线数据集SM与在线数据si,更新并计算执行网络系数
5)给定允许误差ε,若满足误差要求,则输出否则返回3),继续更新系数,直至满足误差要求为止。
2.根据权利要求1所述的一种基于数据驱动的压电陶瓷驱动器控制方法,其特征在于,所述步骤1)对压电陶瓷驱动器的性能指标函数进行离散具体如下:
压电陶瓷驱动器的性能指标函数为:
其中,x为实际输出位移,y为期望位移,u为控制策略,A和B为权矩阵;
离散后的性能指标函数为:
其中,T为时间间隔:T=tk+1-tk,tk(k=0,1,2,...)为时间节点;xl=x(tl),ul=u(xl),且P(xl,ul)=(xl-y)A(xl-y)+ulBul
3.根据权利要求1所述的一种基于数据驱动的压电陶瓷驱动器控制方法,其特征在于,所述步骤2)引入Q函数并设计执行-评价网络的具体过程如下:
2-1)定义Q函数:
其中a为当前位移的输入电压,且Qu(xk,u)=J(xk);
2-2)估计Q函数:
Q(i)(xk,a)=P(xk,a)+Q(i)(xk+1,u(i));
其中i为更新次数;
2-3)更新控制策略u:
2-4)设计执行-评价神经网络,用执行网络逼近控制策略u(i)(x);用评价网络逼近Q函数Q(i)(x,a);取两组线性无关的基函数: 其中fj(x)=xj,ψj(x,a)=(x+a)j
该神经网络的输出为:
其中分别为执行网络和评价网络的权重系数的近似估计;分别为执行网络和评价网络的激活函数向量。
4.根据权利要求1所述的一种基于数据驱动的压电陶瓷驱动器控制方法,其特征在于,所述步骤3)的具体过程如下:
为离线数据,其中为当前位移x在通过压电陶瓷驱动器输入电压a后得到的新的位移;离线数据集M为离线数据的数量;
定义Q函数的残差为:
利用Q函数的残差与ΨL(x,a)做内积为零,即:其中D为由数组(xl,al),l=1,2,…,M构成的集合,且内积定义为:
<w1(x,u),w2(x,u)>D=∫Dw1(x,u)w2(x,u)d(x,u),其中w1(x,u)与w2(x,u)为关于x和u的任意二元函数;
则可得:
其中根据蒙特卡洛积分方法,令:ID=∫Dd(x,a);
基于离线数据集SM计算
其中
接着收集在线数据si=(xi-1,ui-1,xi),其中xi-1与xi为i-1与i时刻的在线状态,ui-1为i-1时刻的控制策略;
然后将在线数据si加入到离线数据集SM作为新的离线数据集SM+si,并用于计算
其中
ξi=ξ0L(xi-1,ui-1)P(xi-1,ui-1)。
5.根据权利要求1所述的一种基于数据驱动的压电陶瓷驱动器控制方法,其特征在于,所述步骤4)的具体过程如下:
定义控制策略u的残差为:
利用控制策略u的残差与ΦL(x)做内积为零,即:
其中X为xl,l=1,2,…,M和xi构成的集合,且内积定义为:<n1(x),n2(x)>x=∫xn1(x)n2(x)dx,n1(x)与n2(x)为关于x的任意一元函数;
则可得:
其中根据蒙特卡洛积分方法,令:Ix=∫xdx;
基于离线数据集SM与在线数据si,计算
其中
CN201910569941.XA 2019-06-27 2019-06-27 一种基于数据驱动的压电陶瓷驱动器控制方法 Active CN110308650B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910569941.XA CN110308650B (zh) 2019-06-27 2019-06-27 一种基于数据驱动的压电陶瓷驱动器控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910569941.XA CN110308650B (zh) 2019-06-27 2019-06-27 一种基于数据驱动的压电陶瓷驱动器控制方法

Publications (2)

Publication Number Publication Date
CN110308650A true CN110308650A (zh) 2019-10-08
CN110308650B CN110308650B (zh) 2023-01-20

Family

ID=68076909

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910569941.XA Active CN110308650B (zh) 2019-06-27 2019-06-27 一种基于数据驱动的压电陶瓷驱动器控制方法

Country Status (1)

Country Link
CN (1) CN110308650B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111368400A (zh) * 2020-02-17 2020-07-03 华南理工大学 基于pso算法的压电微驱动变频定位平台建模辨识方法
CN113759724A (zh) * 2021-09-17 2021-12-07 中国人民解放军国防科技大学 基于数据驱动的机器人控制方法、装置和计算机设备
CN114839863A (zh) * 2022-06-14 2022-08-02 广东工业大学 一种数据驱动的压电微驱动器无模型预测控制方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103217899A (zh) * 2013-01-30 2013-07-24 中国科学院自动化研究所 基于数据的q函数自适应动态规划方法
CN108696176A (zh) * 2018-05-08 2018-10-23 广东工业大学 一种基于粒子群算法的压电陶瓷驱动器控制方法
CN109739085A (zh) * 2018-12-21 2019-05-10 广东工业大学 一种基于改进高斯伪谱法的压电陶瓷驱动器最优位移控制方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103217899A (zh) * 2013-01-30 2013-07-24 中国科学院自动化研究所 基于数据的q函数自适应动态规划方法
CN108696176A (zh) * 2018-05-08 2018-10-23 广东工业大学 一种基于粒子群算法的压电陶瓷驱动器控制方法
CN109739085A (zh) * 2018-12-21 2019-05-10 广东工业大学 一种基于改进高斯伪谱法的压电陶瓷驱动器最优位移控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李星科等: "《一种新的基于数据驱动的神经动态规划方法》", 《 人工智能与机器人研究》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111368400A (zh) * 2020-02-17 2020-07-03 华南理工大学 基于pso算法的压电微驱动变频定位平台建模辨识方法
CN111368400B (zh) * 2020-02-17 2021-09-21 华南理工大学 基于pso算法的压电微驱动变频定位平台建模辨识方法
CN113759724A (zh) * 2021-09-17 2021-12-07 中国人民解放军国防科技大学 基于数据驱动的机器人控制方法、装置和计算机设备
CN113759724B (zh) * 2021-09-17 2023-08-15 中国人民解放军国防科技大学 基于数据驱动的机器人控制方法、装置和计算机设备
CN114839863A (zh) * 2022-06-14 2022-08-02 广东工业大学 一种数据驱动的压电微驱动器无模型预测控制方法

Also Published As

Publication number Publication date
CN110308650B (zh) 2023-01-20

Similar Documents

Publication Publication Date Title
CN110308650A (zh) 一种基于数据驱动的压电陶瓷驱动器控制方法
Nakajima Physical reservoir computing—an introductory perspective
Hu et al. Deep learning with a long short-term memory networks approach for rainfall-runoff simulation
Bai et al. A neuron-based kalman filter with nonlinear autoregressive model
CN106030622B (zh) 原位神经网络协同处理
CN108710301B (zh) 压电陶瓷作动器迟滞非线性在线辨识和补偿的方法及系统
Hassan et al. Neuro-fuzzy wavelet based adaptive MPPT algorithm for photovoltaic systems
Lu et al. Regularized online sequential extreme learning machine with adaptive regulation factor for time-varying nonlinear system
Radac et al. Hierarchical cognitive control for unknown dynamic systems tracking
Serna-Garcés et al. Reconfiguration of urban photovoltaic arrays using commercial devices
Yuan et al. State of charge dual estimation of a Li-ion battery based on variable forgetting factor recursive least square and multi-innovation unscented kalman filter algorithm
Wu et al. A nonvolatile fractional order memristor model and its complex dynamics
Li et al. Research on short-term load forecasting based on optimized gru neural network
Wang et al. An Optimization on the Neuronal Networks Based on the ADEX Biological Model in Terms of LUT-State Behaviors: Digital Design and Realization on FPGA Platforms
Yao et al. Research on solving nonlinear problem of ball and beam system by introducing detail-reward function
CN110110359A (zh) 一种基于几何样条的线弹模型建模求解方法
Ekbatani et al. Control of an IPMC soft actuator using adaptive full-order recursive terminal sliding mode
Wu et al. Algorithm and implementation of distributed ESN using Spark framework and parallel PSO
Xiong et al. Modeling of hysteresis in piezoelectric actuator based on segment similarity
CN108520141B (zh) 一种压电陶瓷作动器的迟滞非线性模拟方法
Artetxe et al. Maximum Power Point Tracker Controller for Solar Photovoltaic Based on Reinforcement Learning Agent with a Digital Twin
CN109739085A (zh) 一种基于改进高斯伪谱法的压电陶瓷驱动器最优位移控制方法
Pichardo et al. A Compact and High-Performance Acoustic Echo Canceller Neural Processor Using Grey Wolf Optimizer along with Least Mean Square Algorithms
Rashid et al. Are neural networks the right tool for process modeling and control of batch and batch-like processes?
CN108846191B (zh) 压电陶瓷作动器的分布参数饱和电容模型建模方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant