CN115917444A - 控制辅助装置、控制装置及控制辅助方法 - Google Patents
控制辅助装置、控制装置及控制辅助方法 Download PDFInfo
- Publication number
- CN115917444A CN115917444A CN202180040453.5A CN202180040453A CN115917444A CN 115917444 A CN115917444 A CN 115917444A CN 202180040453 A CN202180040453 A CN 202180040453A CN 115917444 A CN115917444 A CN 115917444A
- Authority
- CN
- China
- Prior art keywords
- gain
- input
- control device
- filter
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B11/00—Automatic controllers
- G05B11/01—Automatic controllers electric
- G05B11/36—Automatic controllers electric with provision for obtaining particular characteristics, e.g. proportional, integral, differential
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0205—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system
- G05B13/024—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/18—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
- G05B19/19—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by positioning or contouring control systems, e.g. to control position from one programmed point to another or to control movement along a programmed continuous path
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Manufacturing & Machinery (AREA)
- Feedback Control In General (AREA)
- Control Of Electric Motors In General (AREA)
Abstract
缩短测定输入输出增益和相位延迟的频率特性的时间。控制辅助装置使用由调整前后的、控制马达的伺服控制装置的至少1个滤波器的系数和反馈增益中的至少一方构成的第二信息以及第一信息,计算滤波器的系数和反馈增益中至少一方在调整前后的、滤波器和反馈增益的输入输出增益和相位延迟的频率特性中的至少一方的频率特性,根据在调整前后的至少一方的频率特性、以及系数和反馈增益中至少一方的调整前的、对伺服控制装置的输入输出增益以及输入输出的相位延迟进行测定而得的频率特性,求出滤波器的系数和反馈增益中至少一方的调整后的伺服控制装置的输入输出增益和相位延迟的频率特性推定值。
Description
技术领域
本发明涉及对控制马达的伺服控制部的至少1个滤波器的系数和反馈增益(FG)中的至少一方进行调整的控制辅助装置、包含控制辅助装置和伺服控制装置的控制装置、以及控制辅助方法。
背景技术
例如,在专利文献1中记载了在短时间内实现适当的伺服控制条件设定的控制系统以及控制辅助装置。
在专利文献1中记载了一种由伺服系统和控制辅助装置构成的控制系统,伺服系统对驱动负载装置的马达进行控制,控制辅助装置与伺服系统连接,并自动调整为了将马达控制为规定的目标动作而设定的调整参数的最佳值,控制辅助装置中的调整参数调整部根据模拟结果,自动设定应调整的参数及其调整范围,并在调整范围内根据马达实际动作的结果自动调整调整参数的最佳值。
另外,例如在专利文献2中记载了一种车辆的行驶控制设定装置,能够在短时间内容易地设定驱动马达的反馈控制用的控制参数。
在专利文献2中记载了一种车辆的行驶控制设定装置,在进行沿着规定行驶路径进行无人驾驶的运输车辆的行驶控制时,对行驶驱动用的马达进行反馈控制使其成为规定的旋转速度,根据运输车辆在试验行驶时得到的马达的动作状态,将其动作特性推定为表示其传递函数的模型式,根据推定出的模型式来确定反馈控制用的控制增益。
并且,例如在专利文献3中记载了一种增益自动调整辅助装置,对伺服马达控制装置中控制环的控制增益的自动调整进行辅助。
在专利文献3中记载了一种增益自动调整辅助装置,具有:频率特性测定部,其测定伺服马达控制装置的控制环的频率特性;显示部,其以伯德图显示控制环的频率特性;条件设定部,其设定规定频率下的增益目标值;增益自动调整部,其自动调整控制环的控制增益使得与条件设定部设定的规定频率下的增益目标值一致;参数设定部,其对伺服马达控制装置设定控制增益。
现有技术文献
专利文献
专利文献1:日本特开2009-122779号公报
专利文献2:日本特开平11-194821号公报
专利文献3:日本特开2016-092935号公报
发明内容
发明要解决的课题
在调整伺服控制装置的至少1个滤波器的系数和反馈增益中的至少一方使得控制马达的伺服控制装置的输入输出增益(振幅比)和相位延迟的频率特性成为设为目标频率特性时,需要每次调整至少1个滤波器的系数和反馈增益中的至少一方时使伺服控制装置动作,来求出输入输出增益和相位延迟的频率特性。
但是,每次调整至少1个滤波器的系数和反馈增益中的至少一方时,使伺服控制装置动作来测定输入输出增益和相位延迟的频率特性需要一定的时间。期望尽可能缩短该时间。
用于解决课题的手段
(1)本公开的第一方式是一种控制辅助装置,其进行用于对控制马达的伺服控制装置的至少1个滤波器的系数和反馈增益中的至少一方进行调整的辅助,其中,
所述控制辅助装置具有:
伺服状态信息取得部,其取得由调整后的、所述至少1个滤波器的系数和所述反馈增益中的至少一方构成的第一信息;
频率特性计算部,其使用由调整前的、所述至少1个滤波器的系数和所述反馈增益中的至少一方构成的第二信息以及所述第一信息,计算以下频率特性中至少一方的频率特性:所述滤波器的系数和所述反馈增益中至少一方在调整前后的、所述滤波器的输入输出增益和相位延迟的频率特性,以及所述反馈增益的输入输出增益和相位延迟的频率特性;以及
状态推定部,其根据在调整前后的所述至少一方的频率特性、以及所述滤波器的系数和所述反馈增益中至少一方的调整前的、对所述伺服控制装置的输入输出增益和输入输出的相位延迟进行测定而得的频率特性,求出所述滤波器的系数和所述反馈增益中至少一方的调整后的所述伺服控制装置的输入输出增益和相位延迟的频率特性推定值。
(2)本公开的第二方式是一种控制装置,具有:
伺服控制装置,其控制马达;以及
上述(1)所述的控制辅助装置,其求出所述伺服控制装置的至少1个滤波器的系数和反馈增益中至少一方的调整后的所述伺服控制装置的输入输出增益和相位延迟的频率特性推定值。
(3)本公开的第三方式是一种控制辅助装置的控制辅助方法,该控制辅助装置进行用于对控制马达的伺服控制装置的至少1个滤波器的系数和反馈增益中的至少一方进行调整的辅助,其中,
取得由调整后的、所述至少1个滤波器的系数和所述反馈增益中的至少一方构成的第一信息,以及由调整前的、所述至少1个滤波器的系数和所述反馈增益中的至少一方构成的第二信息;
使用所述第二信息和所述第一信息,计算以下频率特性中至少一方的频率特性:所述滤波器的系数和所述反馈增益中至少一方在调整前后的、所述滤波器的输入输出增益和相位延迟的频率特性,以及所述反馈增益的输入输出增益和相位延迟的频率特性;
根据在调整前后的所述至少一方的频率特性、以及所述系数和所述反馈增益中至少一方的调整前的、对所述伺服控制装置的输入输出增益和输入输出的相位延迟进行测定而得的频率特性,求出所述滤波器的系数和所述反馈增益中至少一方的调整后的所述伺服控制装置的输入输出增益和相位延迟的频率特性推定值。
发明效果
根据本公开的各方式,在对伺服控制装置的至少1个滤波器的系数和反馈增益中的至少一方进行调整时,无需在每次对至少1个滤波器的系数和反馈增益中的至少一方进行调整时使伺服控制装置动作来求出输入输出增益和相位延迟的频率特性,就能推定输入输出增益和相位延迟的频率特性。因此,能够缩短测定输入输出增益和相位延迟的频率特性的时间。
附图说明
图1是表示本公开的第一实施方式的控制装置的框图。
图2是表示图1的控制辅助装置的动作的流程图。
图3是表示本公开的第二实施方式的控制装置的框图。
图4是表示本公开的第三实施方式的控制装置的框图。
图5是表示本发明的一实施方式的机器学习部的框图。
图6是成为用于计算输入输出增益的规范模型的模型的框图。
图7是表示规范模型的伺服控制部的输入输出增益的频率特性和学习前及学习后的伺服控制部100的输入输出增益的推定值的频率特性的特性图。
图8是表示输入输出增益和相位延迟的推定值的频率特性的图。
图9是表示直接连接多个滤波器来构成滤波器的例子的框图。
图10是表示控制装置的其他构成例的框图。
具体实施方式
以下,使用附图对本公开的实施方式进行详细说明。
(第一实施方式)
图1是表示本公开的第一实施方式的控制装置的框图。
控制装置10具有:伺服控制部100、频率生成部200、频率特性测定部300以及控制辅助部400。伺服控制部100对应于控制马达的伺服控制装置,频率特性测定部300对应于频率特性计算装置,控制辅助部400对应于控制辅助装置。
此外,频率生成部200、频率特性测定部300及控制辅助部400中的一个或多个可以设置在伺服控制部100内。频率特性测定部300也可以设置在控制辅助部400内。
伺服控制部100具有:减法器110、速度控制部120、滤波器130、电流控制部140以及马达150。减法器110、速度控制部120、滤波器130、电流控制部140以及马达150构成作为闭环的速度反馈环的伺服系统。马达150可以使用进行直线运动的线性马达、具有旋转轴的马达等。由马达150驱动的对象例如是机床、机器人、工业机械的机构部。马达150可以设置为机床、机器人、工业机械等的一部分。控制装置10也可以设置为机床、机器人、工业机械等的一部分。
减法器110求出输入的速度指令与速度反馈的检测速度之差,并将该差作为速度偏差输出到速度控制部120。
速度控制部120进行PI控制(Proportional-Integral Control:比例积分控制),将对速度偏差乘以积分增益K1v并进行积分而得的值与对速度偏差乘以比例增益K2v而得的值相加,作为转矩指令输出到滤波器130。速度控制部120包含反馈增益(FG)。此外,速度控制部120并不特别限定于PI控制,也可以使用其他控制,例如PID控制(Proportional-Integral-Differential Control:比例积分微分控制)。
数学公式1(以下表示为数学式1)表示速度控制部120的传递函数GV(s)。
[数学式1]
滤波器130是使特定的频率成分衰减的滤波器,例如使用陷波滤波器、低通滤波器或者带阻滤波器。在具有由马达150驱动的机构部的机床等机械中存在谐振点,有时在伺服控制部100中谐振增大。通过使用陷波滤波器等滤波器,能够降低谐振。滤波器130的输出作为转矩指令输出到电流控制部140。
数学公式2(以下表示为数学式2)表示作为滤波器130的陷波滤波器的传递函数GF(s)。
这里,数学公式2的系数δ是衰减系数,系数ωc是中心角频率,系数τ是分数带宽。若将中心频率设为fc,将带宽设为fw,则系数ωc由ωc=2πfc表示,系数τ由τ=fw/fc表示。
[数学式2]
电流控制部140根据转矩指令生成用于驱动马达150的电压指令,将该电压指令输出到马达150。
在马达150为线性马达的情况下,可动部的位置由设置于马达150的线性标尺(未图示)检测,通过对位置检测值进行微分来求出速度检测值,求出的速度检测值作为速度反馈输入到减法器110。
在马达150是具有旋转轴的马达的情况下,旋转角度位置由设置于马达150的旋转编码器(未图示)检测,速度检测值作为速度反馈输入到减法器110。
如以上那样构成伺服控制部100,但为了求出积分增益K1v和比例增益K2v中的一个或双方、和/或滤波器130的传递函数的各系数ωc、τ、δ的调整后的伺服控制部100的输入输出增益和相位延迟的频率特性推定值,控制装置10还具有:频率生成部200、频率特性测定部300以及控制辅助部400。
频率生成部200一边使频率变化一边将正弦波信号作为速度指令输出到伺服控制部100的减法器110和频率特性测定部300。
频率特性测定部300使用由频率生成部200生成的、作为输入信号的速度指令(正弦波)和作为从旋转编码器(未图示)输出的输出信号的检测速度(正弦波),按由速度指令规定的各频率,测定输入信号与输出信号的振幅比(输入输出增益)以及相位延迟。或者,频率特性测定部300使用由频率生成部200生成的作为输入信号的速度指令(正弦波)和作为从线性标尺输出的输出信号的检测位置的微分(正弦波),按由速度指令规定的各频率,测定输入信号与输出信号的振幅比以及相位延迟。
伺服控制部100以调整积分增益K1v和比例增益K2v中的一个或双方、和/或滤波器130的传递函数的各系数ωc、τ、δ之前的、速度控制部120的积分增益K1v和比例增益K2v、以及滤波器130的传递函数的各系数ωc、τ、δ(以下,称为“伺服参数”)来进行动作,向频率特性测定部300输入上述的检测速度或者检测位置的微分。频率特性测定部300测定作为输入信号的速度指令与输出信号的振幅比(输入输出增益)以及相位延迟的频率特性P,输出到控制辅助部400。
以下,调整前的伺服参数为“调整前的伺服参数”,相对于调整前的伺服参数,将调整了积分增益K1v和比例增益K2v中的一个或双方、和/或滤波器130的传递函数的各系数ωc、τ、δ的伺服参数称为“调整后的伺服参数”。
控制辅助部400保存伺服控制部100以调整前的伺服参数进行动作并从频率特性测定部300输出的输入输出增益(振幅比)以及相位延迟的频率特性P。
控制辅助部400使用调整前的伺服参数中的、速度控制部120的积分增益K1v和比例增益K2v中的任一方或双方的增益和/或滤波器130的传递函数的各系数ωc、τ、δ(作为第二信息),计算速度控制部120和/或滤波器130的输入输出增益以及相位延迟的频率特性C2。
另外,控制辅助部400使用调整后的伺服参数中的、速度控制部120的积分增益K1v和比例增益K2v中的任一方或双方的增益和/或滤波器130的传递函数的各系数ωc、τ、δ(作为第一信息),计算速度控制部120和/或滤波器130的输入输出增益以及相位延迟的频率特性C1。
并且,控制辅助部400根据频率特性C1、频率特性C2以及频率特性P,求出伺服控制部100的输入输出增益和相位延迟的频率特性推定值E。
具体而言,使用以下的数学公式3(以下表示为数学式3),求出伺服控制部100的输入输出增益和相位延迟的频率特性推定值E。
[数学式3]
E=C1-C2+P
此外,伺服控制部100的输入输出增益和相位延迟的频率特性推定值E可以使用上述数学公式3,即E=C1-C2+P来计算,但控制辅助部400进行的计算可以是E=(C1-C2)+P、E=(P-C2)+C1、E=(P+C1)-C2中的任一个。
以下,对控制辅助部400的结构以及动作的详细内容进一步进行说明。
<控制辅助部400>
如图1所示,控制辅助部400具有:伺服状态信息取得部401、调整前状态保存部402、频率特性计算部403以及状态推定部404。
伺服状态信息取得部401取得调整后的伺服参数中的、速度控制部120的积分增益K1v和比例增益K2v中的任一方或双方的增益和/或滤波器130的传递函数的各系数ωc、τ、δ(以下,称为第一信息)并输出到频率特性计算部403。
此外,调整前的伺服参数预先由用户生成。在操作者预先调整了伺服参数的情况下,也可以将调整完毕的值作为“调整前的伺服参数”。
在调整前状态保存部402中,如上所述,保存从频率特性测定部300输出的、输入输出增益和相位延迟的频率特性P。另外,从速度控制部120和/或滤波器130向调整前状态保存部402输出调整前的伺服参数中的、速度控制部120的积分增益K1v和比例增益K2v中的任一方或双方的增益和/或滤波器130的传递函数的各系数ωc、τ、δ(以下,称为第二信息),并进行保存。
频率特性计算部403从伺服状态信息取得部401取得第一信息,从调整前状态保存部402读出第二信息。
并且,频率特性计算部403使用第一信息所包含的、速度控制部120的传递函数GV(jω)和/或滤波器130的传递函数GF(jω),计算速度控制部120和/或滤波器130的输入输出增益与相位延迟的频率特性C1。另外,频率特性计算部403使用第二信息所包含的、速度控制部120的传递函数GV(jω)和/或滤波器130的传递函数GF(jω),计算速度控制部120和/或滤波器130的输入输出增益与相位延迟的频率特性C2。
例如,若将初始状态的频率特性设为GV(jω),则将速度控制部120的传递函数GV(jω)的积分增益K1v和比例增益K2v设为调整前的值的n倍(n为整数)时的频率特性为n×GV(jω)。在伯德图上,增益和相位分别由数学公式4(以下表示为数学式4)和数学公式5(以下表示为数学式5)表示。
[数学式4]
20log10|n×GV(jω)|=20log10(n)+20log10|GV(jω)|
[数学式5]
tan-1(n×GV(jω))=tan-1(GV(jω))
并且,频率特性计算部403将计算出的频率特性C1和频率特性C2输出到状态推定部404。
状态推定部404使用上述的数学式3,根据频率特性C1、频率特性C2以及频率特性P,求出伺服控制部100的输入输出增益和相位延迟的频率特性推定值E。
以下,对通过公式E=(C1-C2)+P求出频率特性推定值E的情况进行说明。
例如,如上所述,若将初始状态的频率特性C2设为GV(jω),则将速度控制部120的传递函数GV(jω)的积分增益K1v和比例增益K2v设为调整前的值的n倍(n为整数)时的频率特性C1为n×GV(jω)。
如数学公式4所示,伯德图所示的、设为初始状态的n倍时的增益的频率特性为对成为初始状态的增益的20log10|GV(jω)|加上20log10(n)而得的频率特性。伯德图所示的、设为初始状态的n倍时的相位的频率特性为tan-1(n)=0,因此,如数学公式4所示,初始状态的相位频率特性没有变化。
因此,设为初始状态的n倍时的频率特性仅在伯德图的增益线图中变化,数学公式3所示的20log10(n)为设为初始状态的n倍时的频率特性与初始状态的频率特性这2个频率特性的差分(C1-C2)。
状态推定部404从调整前状态保存部402读出根据调整前的伺服参数,使用频率生成部200输出的速度指令(正弦波)驱动伺服控制部100而得的、输入输出增益和相位延迟的频率特性P,对该频率特性P加上差分(C1-C2)。相加而得的频率特性为基于调整后的伺服参数的、伺服控制部100的输入输出增益和相位延迟的频率特性推定值E=(C1-C2)+P。
在以上说明的实施方式中,调整后的伺服参数中的伺服控制部100的输入输出增益和相位延迟的推定值,可以由控制辅助部400计算,因此,与以调整后的伺服参数使伺服控制部100动作而实际检测速度指令和检测速度并由频率特性测定部300测定的情况相比,能够在短时间内求出。
以上,对控制装置10所包含的功能块进行了说明。
为了实现这些功能块,控制装置10具有CPU(Central Processing Unit)等运算处理装置。另外,控制装置10还具有储存了应用软件以及OS(Operating System:操作系统)等各种控制用程序的HDD(Hard Disk Drive:硬盘驱动器)等辅助存储装置、以及用于储存运算处理装置执行程序时暂时所需的数据的RAM(Random Access Memory:随机存取存储器)这样的主存储装置。
并且,在控制装置10中,运算处理装置从辅助存储装置读入应用软件或OS,一边使读入的应用软件或OS在主存储装置中展开,一边进行基于这些应用软件或OS的运算处理。另外,根据该运算结果,控制各装置具有的各种硬件。由此,实现本实施方式的功能块。即,本实施方式能够通过硬件和软件协作来实现。
关于控制辅助部400,在运算量多的情况下,例如,利用在个人计算机搭载GPU(Graphics Processing Units:图形处理器),称为GPGPU(General-Purpose computing onGraphics Processing Units:通用图形处理器)的技术,在将GPU用于运算处理时能够进行高速处理。并且,为了进行更高速的处理,可以使用多台搭载了这样的GPU的计算机来构筑计算机集群,通过该计算机集群所包含的多个计算机来进行并行处理。
接着,使用流程图对控制辅助部400的动作进行说明。图2是表示控制辅助装置的动作的流程图。
在步骤S11中,从速度控制部120和/或滤波器130向调整前状态保存部402输出调整前的伺服参数中的、速度控制部120的积分增益K1v和比例增益K2v中的任一方或双方的增益和/或滤波器130的传递函数的各系数ωc、τ、δ(第二信息),并进行保存。在此,调整前的伺服参数预先由用户生成。
另外,在步骤S11中,从频率特性测定部300取得根据调整前的伺服参数使用频率生成部200输出的速度指令(正弦波)来驱动伺服控制部100而得的、输入输出增益(振幅比)和相位延迟的频率特性(图2中的频率特性P),保存在调整前状态保存部402中。
在步骤S12中,伺服状态信息取得部401取得调整后的伺服参数中的、速度控制部120的积分增益K1v和比例增益K2v中的任一方或双方的增益和/或滤波器130的传递函数的各系数ωc、τ、δ(第一信息),输出到频率特性计算部403。
在步骤S13中,频率特性计算部403使用速度控制部120的传递函数GV(jω)和/或滤波器130的传递函数GF(jω)求出设定为调整前的伺服参数的、速度控制部120和/或滤波器130的输入输出增益与相位延迟的频率特性C2、以及设定为调整后的伺服参数的、速度控制部120和/或滤波器130的输入输出增益与相位延迟的频率特性C1这2个频率特性,输出到状态推定部404。
在步骤S14中,状态推定部404从调整前状态保存部402读出根据调整前的伺服参数,使用频率生成部200输出的速度指令(正弦波)驱动伺服控制部100而得的、输入输出增益和相位延迟的频率特性P,使用频率特性C1、频率特性C2以及频率特性P,通过数学公式3(E=C1-C2+P),求出伺服控制部100的输入输出增益和相位延迟的频率特性推定值E。
在步骤S15中,判断是否继续进行求出频率特性推定值E的处理,在继续进行的情况下,返回到步骤S12,在不继续进行的情况下,结束控制辅助装置的动作。
(第二实施方式)
在第一实施方式中,频率特性测定部300在测定伺服控制部100的输入输出增益(振幅比)和相位延迟的频率特性的情况下,根据频率变化的正弦波信号即速度指令和速度反馈来计算频率特性。在本实施方式中,频率生成部200在滤波器130之后,一边使频率变化一边输入正弦波信号。并且,频率特性测定部300在测定伺服控制部100的输入输出增益和相位延迟的频率特性的情况下,根据在滤波器130之后输入的正弦波信号和滤波器130的输出来计算频率特性。
图3是表示本公开的第二实施方式的控制装置的框图。在图3中,对与图1所示的控制装置10的构成部件相同的构成部件标注相同的符号并省略说明。
如图3所示,控制装置10A在滤波器130的后级设置有加法器160,向该加法器160输入从频率生成部200输出的、频率变化的正弦波信号。加法器160与减法器170连接,电流控制部140与放大器180连接。放大器180具有电流检测器,由电流检测器检测出的电流输入到减法器170。减法器170、电流控制部140以及放大器180构成电流反馈环,电流反馈环包含在速度反馈环中。正弦波信号对应于频率变化的第一信号,滤波器130的输出对应于在速度反馈环中输入到电流反馈环的第二信号。
马达150的电感因磁饱和等影响而根据在马达150中流过的电流非线形地变化。当从调整前的伺服参数变为调整后的伺服参数时,向电流控制部140输入的转矩指令发生变化,在电流控制部140的电流增益一定的情况下,在马达150中流过的电流也发生变化。当在马达150中流过的电流发生变化而电感非线形地变化时,电流反馈环的特性也非线形地变化。
在本实施方式中,将输入到减法器110的输入信号的电平设为零,频率生成部200在滤波器130之后一边使频率变化一边输入正弦波信号,频率特性测定部300根据该正弦波信号和滤波器130的输出来测定伺服控制部100的输入输出增益和相位延迟的频率特性。由此,向电流反馈环的输入一定,因此,能够一边维持电流反馈环特性的线性,一边通过控制辅助部400推定伺服控制部100的输入输出增益和相位延迟的频率特性。
(第三实施方式)
在第一及第二实施方式中,求出调整后的伺服参数下的伺服控制部100的输入输出增益(振幅比)和相位延迟的频率特性推定值。在本实施方式中,对如下控制装置进行说明:求出伺服控制部100的输入输出增益和相位延迟的频率特性推定值,使用该推定值通过机器学习求出伺服控制部100的伺服参数的最佳值。在以下的说明中,对在图1所示的控制装置10中加入了机器学习部的例子进行说明,也可以在图3所示的控制装置10A中加入机器学习部。
图4是表示本公开的第三实施方式的控制装置的框图。在图4中,对与图1所示的构成部件相同的构成部件标注相同的符号并省略说明。
如图4所示,控制装置10B构成为在图1所示的控制装置10中加入了作为机器学习装置的机器学习部500。
机器学习部500取得从控制辅助部400输出的、伺服控制部100的输入输出增益和相位延迟的推定值,将伺服参数的值的调整信息输送到控制辅助部400。并且,机器学习部500对伺服控制部100的伺服参数的最佳值进行机器学习(以下,将“机器学习”称为“学习”),以使伺服控制部100的输入输出增益和相位延迟的频率特性推定值与作为目标的频率特性相同或在一定范围内。并且,机器学习部500将伺服控制部100的伺服参数,即积分增益K1v和比例增益K2v、以及滤波器130的传递函数的各系数ωc、τ、δ设定为最佳值。
机器学习部500的学习在出厂前进行,也可以在出厂后进行再学习。
机器学习部500进行的学习可以使用强化学习,但并不特别限定于强化学习,例如,也可以进行监督学习。
此外,机器学习部500在学习伺服控制部100的伺服参数的情况下,调整伺服控制部100的伺服参数,在每次进行该调整时使伺服控制装置动作,使用从频率特性测定部300输出的输入输出增益和相位延迟的频率特性,学习伺服控制部100的伺服参数的最佳值时,需要在每次进行伺服控制部100的伺服参数的调整时使伺服控制装置动作,由频率特性测定部300测定输入输出增益和相位延迟的频率特性,因此,处理需要时间。
在本实施方式中,机器学习部500使用由控制辅助部400求出的、输入输出增益和相位延迟的频率特性推定值来学习伺服控制部100的伺服参数的最佳值。因此,伺服参数的调整得以简化,能够在短时间内进行。
以下,对作为机器学习装置的机器学习部500中的机器学习进行补充说明。
<机器学习部500>
在以下的说明中,对机器学习部500进行强化学习的情况进行说明。
机器学习部500进行将从控制辅助部400输出的输入输出增益和相位延迟的推定值设为状态S、将该状态S的控制辅助部400中的伺服参数的值的调整设为行为A的Q学习(Q-learning)。如本领域技术人员所知那样,Q学习的目的在于,在某个状态S时,从可取的行为A中选择价值Q(S,A)最高的行为A作为最佳行为。
具体而言,智能体(机器学习装置)在某个状态S下选择各种行为A,针对此时的行为A,根据赋予的回报来选择更好的行为,由此,学习正确的价值Q(S,A)。
另外,想要使将来得到的回报的合计最大化,因此,以最终成为Q(S,A)=E[Σ(γt)rt]为目标。在此,E[]表示期望值,t是时刻,γ是后述的称为折扣率的参数,rt是时刻t的回报,Σ是基于时刻t的合计。该公式中的期望值是按照最佳行为进行了状态变化时的期望值。这样的价值Q(S,A)的更新式例如可以通过以下的数学公式6(以下表示为数学式6)来表示。
[数学式6]
在上述的数学公式6中,St表示时刻t的环境状态,At表示时刻t的行为。通过行为At,状态变化为St+1。rt+1表示通过该状态的变化而得到的回报。另外,带有max的项是在状态St+1下选择了此时已知的Q值最高的行为A时的Q值乘以γ而得到的。在此,γ是0<γ≤1的参数,称为折扣率。另外,α是学习系数,设为0<α≤1的范围。
上述的数学公式6表示如下方法:根据尝试At的结果而反馈回来的回报rt+1,更新状态St下的行为At的价值Q(St、At)。
机器学习部500观测包含控制辅助部400推定出的各频率的输入输出增益和相位延迟的频率特性推定值的状态信息S,决定行为A。机器学习部500每当进行行为A时返回回报。关于回报将在后面描述。
在Q学习中,机器学习部500例如试错性地搜索将来的回报合计为最大的最佳行为A。由此,机器学习部500能够针对状态S选择最佳行为A(即,最佳的伺服参数值)。
图5是表示本发明的一实施方式的机器学习部500的框图。
为了进行上述的强化学习,如图5所示,机器学习部500具有:状态信息取得部501、学习部502、行为信息输出部503、价值函数存储部504以及优化行为信息输出部505。
状态信息取得部501从控制辅助部400取得使用调整后的伺服参数计算出的伺服控制部100的输入输出增益和相位延迟的频率特性推定值,输出到学习部502。状态信息取得部501在最初开始Q学习的时间点,从频率特性测定部300取得调整前的伺服参数下的伺服控制部100的输入输出增益和相位延迟的频率特性,输出到学习部502。从控制辅助部400取得的频率特性推定值为状态信息S。状态信息S相当于Q学习中的环境状态S。
此外,在最初开始Q学习的时间点,状态信息取得部501从速度控制部120以及滤波器130取得调整前的初始值的伺服参数,输出到学习部502。
如已经说明的那样,预先由用户生成调整前的初始值的伺服参数。关于初始值的伺服参数,在由操作者预先调整机床时,可以将调整完毕的值作为初始值。
学习部502是学习在某个环境状态S下选择某个行为A时的价值Q(S,A)的部分。学习部502具有:回报输出部5021、价值函数更新部5022以及行为信息生成部5023。
回报输出部5021是计算在某个状态S下选择了行为A时的回报的部分。
回报输出部5021在调整了初始值的伺服参数的情况下,将各频率的输入输出增益的推定值gs与预先设定的规范模型的各频率的输入输出增益的值gb进行比较。回报输出部5021在输入输出增益的推定值gs比规范模型的输入输出增益的值gb大时,赋予负回报。另一方面,回报输出部5021在输入输出增益的推定值gs为规范模型的输入输出增益的值gb以下时,在从状态S成为状态S’的情况下,在相位延迟的推定值变小时赋予正回报,在相位延迟的推定值变大时赋予负回报,在相位延迟的推定值不变时赋予零回报。
首先,使用图6以及图7对回报输出部5021在输入输出增益的推定值gs比规范模型的输入输出增益的值gb大时赋予负回报的动作进行说明。
回报输出部5021保存输入输出增益的规范模型。规范模型是具有无谐振的理想特性的伺服控制部的模型。规范模型例如可以根据图6所示的模型的惯量Ja、转矩常数Kt、比例增益Kp、积分增益KI、微分增益KD通过计算来求出。惯量Ja是马达惯量和机械惯量的加法值。
图7是表示规范模型的伺服控制部的输入输出增益的频率特性和学习前及学习后的伺服控制部100的输入输出增益的推定值的频率特性的特性图。如图7的特性图所示,规范模型具有成为一定的输入输出增益以上,例如-20dB以上的理想输入输出增益的频域即区域A、以及成为小于一定的输入输出增益的频域即区域B。在图7的区域A中,用曲线MC1(粗线)表示规范模型的理想输入输出增益。在图7的区域B中,用曲线MC11(虚线的粗线)表示规范模型的理想虚拟输入输出增益,将规范模型的输入输出增益作为一定值用直线MC12(粗线)表示。在图7的区域A和B中,分别用曲线RC1、RC2表示与学习前及学习后的伺服控制部的输入输出增益的推定值的曲线。
回报输出部5021在区域A中,在输入输出增益的推定值的学习前的曲线RC1超过规范模型的理想输入输出增益的曲线MC1时,赋予第一负回报。
在超过输入输出增益变得足够小的频率的区域B中,即使学习前的输入输出增益的推定值的曲线RC1超过规范模型的理想虚拟输入输出增益的曲线MC11,对稳定性的影响也小。因此,在区域B中,如上所述,规范模型的输入输出增益并非理想的增益特性的曲线MC11,而是使用一定值的输入输出增益(例如,-20dB)的直线MC12。但是,在学习前的输入输出增益的推定值的曲线RC1超过一定值的输入输出增益的直线MC12时,存在变得不稳定的可能性,因此,作为回报赋予第一负值。
接着,对在输入输出增益的推定值gs为规范模型的输入输出增益的值gb以下时,回报输出部5021根据相位延迟的推定值来决定回报的动作进行说明。
在以下的说明中,用D(S)表示作为状态信息S的状态变量的相位延迟的推定值,用D(S’)表示作为根据行为信息A(伺服参数的值的调整)从状态S起发生了变化的状态S’的状态变量的相位延迟的推定值。此外,在最初开始Q学习的时间点,没有求出相位延迟的推定值,因此,以从频率特性测定部300取得的初始值的伺服参数使伺服控制部100动作来得到伺服控制部100的相位延迟,将该相位延迟设为D(S)来决定以下的回报。
回报输出部5021根据相位延迟推定值来决定回报的方法例如有以下的方法。
在从状态S变为状态S’时,可以根据相位延迟推定值为180度的频率是变大、变小、还是相同来决定回报。在此,举出了相位延迟推定值为180度的情况,但并不特别限定于180度,也可以是其他值。
例如,在相位延迟推定值由图8所示的相位线图表示时,在从状态S成为状态S’时,若曲线变化成相位延迟的推定值为180度的频率变小(向图8的X2方向),则相位延迟推定值变大。另一方面,在从状态S成为状态S’时,若曲线变化成相位延迟推定值为180度的频率变大(向图8的X1方向),则相位延迟推定值变小。
因此,在从状态S成为状态S’的情况下,在相位延迟推定值为180度的频率变小时,定义为相位延迟推定值D(S)<相位延迟推定值D(S’),回报输出部5021将回报值设为第二负值。此外,第二负值的绝对值比第一负值小。
另一方面,在从状态S成为状态S’的情况下,在相位延迟推定值为180度的频率变大时,定义为相位延迟推定值D(S)>相位延迟的推定值D(S’),回报输出部5021将回报值设为正值。
另外,在从状态S成为状态S’的情况下,在相位延迟推定值为180度的频率不变时,定义为相位延迟推定值D(S)=相位延迟的推定值D(S’),回报输出部5021将回报值设为零值。
根据相位延迟推定值来决定回报的方法并不限定于上述方法,也可以使用如下方法:在从状态S成为状态S’的情况下,在相位余量小时赋予第二负值的回报,在相位余量大时赋予正值的回报,在相位余量相同时赋予零回报。
以上,对回报输出部5021进行了说明。
价值函数更新部5022根据状态S、行为A、将行为A应用于状态S的情况下的状态S’、以及如上所述求出的回报来进行Q学习,由此,更新价值函数存储部504存储的价值函数Q。
价值函数Q的更新,可以通过在线学习来进行,也可以通过批量学习来进行,还可以通过小批量学习来进行。
在线学习是如下学习方法:通过将某个行为A应用于当前的状态S,每当状态S向新的状态S’转移时,立即进行价值函数Q的更新。另外,批量学习是如下学习方法:通过反复将某个行为A应用于当前的状态S,状态S向新的状态S’转移,由此收集学习用数据,使用收集到的所有学习用数据,来进行价值函数Q的更新。并且,小批量学习是在线学习与批量学习中间的学习方法,是每当积攒了某种程度的学习用数据时进行价值函数Q的更新的学习方法。
行为信息生成部5023针对当前的状态S,选择Q学习的过程中的行为A。行为信息生成部5023在Q学习的过程中,为了进行调整伺服参数值的动作(相当于Q学习中的行为A),生成行为信息A,将生成的行为信息A输出到行为信息输出部503。
更具体而言,行为信息生成部5023例如可以针对状态S所包含的调整后的伺服参数,将行为A所包含的伺服参数中的速度控制部120的积分增益K1v和比例增益K2v、以及滤波器130的传递函数的各系数ωc、τ、δ与增量相加或相减。
此外,作为伺服参数的速度控制部120的积分增益K1v和比例增益K2v、以及滤波器130的各系数ωc、τ、δ可以全部修正,也可以修正一部分系数。在调整滤波器130的各系数ωc、τ、δ时,例如容易发现产生谐振的中心频率fc,容易确定中心频率fc。因此,行为信息生成部5023为了进行暂时固定中心频率fc来修正带宽fw和衰减系数δ,即固定系数ωc(=2πfc)来修正系数τ(=fw/fc)和衰减系数δ的动作,可以生成行为信息A,将生成的行为信息A输出到行为信息输出部503。
另外,行为信息生成部5023也可以采取如下策略:通过在当前推定的行为A的价值中选择价值Q(S,A)最高的行为A’的贪婪算法,或者用某个较小的概率ε随机选择行为A’,除此之外选择价值Q(S,A)最高的行为A’的ε贪婪算法这样的众所周知的方法,来选择行为A’。
行为信息输出部503是对控制辅助部400发送从学习部502输出的行为信息A的部分。如上所述,根据该行为信息,在当前的状态S,即当前设定的控制辅助部400中,通过调整伺服参数中的速度控制部120的积分增益K1v和比例增益K2v、和/或各系数ωc、τ、δ,转变为接下来的状态S’(即调整后的速度控制部120的积分增益K1v和比例增益K2v、和/或滤波器130的各系数)。
价值函数存储部504是存储价值函数Q的存储装置。价值函数Q例如可以按状态S、行为A来储存为表(以下,称为行为价值表)。存储在价值函数存储部504中的价值函数Q由价值函数更新部5022更新。另外,存储在价值函数存储部504中的价值函数Q可以在其他机器学习部500之间共享。如果在多个机器学习部500中共享价值函数Q,则可以在各机器学习部500中分散地进行强化学习,因此,能够提高强化学习的效率。
优化行为信息输出部505根据通过价值函数更新部5022进行Q学习而更新的价值函数Q,生成用于使速度控制部120以及滤波器130进行价值Q(S,A)为最大的动作的行为信息A(以下,称为“优化行为信息”)。
更具体而言,优化行为信息输出部505取得价值函数存储部504存储的价值函数Q。该价值函数Q如上所述通过价值函数更新部5022进行Q学习而更新。并且,优化行为信息输出部505根据价值函数Q生成行为信息,将生成的行为信息输出到伺服控制部100的速度控制部120和/或滤波器130。该优化行为信息中包含修正伺服控制部100的速度控制部120的积分增益K1v和比例增益K2v、和/或滤波器130的传递函数的各系数ωc、τ、δ的信息。
在速度控制部120中,根据该行为信息修正积分增益K1v和比例增益K2v,在滤波器130中,根据该行为信息修正传递函数的各系数ωc、τ、δ。
机器学习部500通过以上的动作,进行伺服参数的优化,能够以抑制机械端的振动的方式进行动作。另外,能够简化伺服参数的调整。
在上述的各实施方式中,对设置了1个滤波器的情况进行了说明,但滤波器130也可以通过将分别与不同频带对应的多个滤波器串联连接来构成。图9是表示将多个滤波器直接连接来构成滤波器的例子的框图。在图9中,在存在m个(m为2以上的自然数)谐振点时,滤波器130通过将m个滤波器130-1~130-m串联连接而构成。
另外,控制装置的结构除了图1、图3以及图4的结构以外,还有以下的结构。
<控制辅助部经由网络与伺服控制部连接的变形例>
图10是表示控制装置的其他结构例的框图。图10所示的控制装置10C与图1或图3所示的控制装置10不同的点在于,n(n为2以上的自然数)个伺服控制部100-1~100-n经由网络600与n个控制辅助部400-1~400-n连接,并且分别具有频率生成部200和频率特性测定部300。控制辅助部400-1~400-n具有与图1所示的控制辅助部400相同的结构。伺服控制部100-1~100-n分别对应于伺服控制装置,另外,控制辅助部400-1~400-n分别对应于控制辅助装置。此外,当然也可以将频率生成部200和频率特性测定部300中的一方或双方设置在伺服控制部100-1~100-n之外。图10所示的结构也可以应用于图4的控制装置10B,该情况下,伺服控制部100-1~100-n分别具有机器学习部500。此外,当然也可以将机器学习部500设置在伺服控制部100-1~100-n之外。
在此,伺服控制部100-1和控制辅助部400-1为1对1的组,能够通信地连接。伺服控制部100-2~100-n和控制辅助部400-2~400-n也与伺服控制部100-1和控制辅助部400-1一样地连接。在图10中,伺服控制部100-1~100-n和控制辅助部400-1~400-n的n个组经由网络600连接,但伺服控制部100-1~100-n和控制辅助部400-1~400-n的n个组也可以是各组的伺服控制部和控制辅助部经由连接接口直接连接。这些伺服控制部100-1~100-n和控制辅助部400-1~400-n的n个组例如可以在相同的工厂中设置多组,也可以分别设置在不同的工厂中。
此外,网络600例如是在工厂内构建的LAN(Local Area Network:局域网)、因特网、公共电话网、或者它们的组合。关于网络600中的具体的通信方式、是有线连接还是无线连接等,没有特别限定。
<系统结构的自由度>
在上述的实施方式中,伺服控制部100-1~100-n和控制辅助部400-1~400-n分别设为1对1的组并能够通信地连接,但例如也可以是1台控制辅助部经由网络600能够通信地与多个伺服控制部连接,实施各伺服控制部的控制辅助。
此时,可以是将1台控制辅助部的各功能适当地分散到多个服务器的分散处理系统。另外,也可以在云上利用虚拟服务器功能等来实现1台控制辅助部的各功能。
另外,也可以构成为,当存在与n台相同类型名称、相同规格、或者相同系列的伺服控制部100-1~100-n分别对应的n个控制辅助部400-1~400-n时,共享各控制辅助部400-1~400-n中的推定结果。由此,能够构筑更最佳的模型。
以上,对第一、第二及第三实施方式进行了说明。各实施方式的控制装置所包含的各构成部可以通过硬件、软件或者它们的组合来实现。另外,通过上述的控制装置所包含的各构成部各自的协作来进行的伺服控制方法也可以通过硬件、软件或者它们的组合来实现。在此,通过软件实现是指通过计算机读入程序并执行来实现。
可以使用各种类型的非暂时性的计算机可读介质(non-transitory computerreadable medium)来储存程序,将其提供给计算机。非暂时性的计算机可读介质包含各种类型的有实体的记录介质(tangible storage medium)。非暂时性的计算机可读介质的例子包含磁记录介质(例如,硬盘驱动器)、磁光记录介质(例如,磁光盘)、CD-ROM(Read OnlyMemory:只读存储器)、CD-R、CD-R/W、半导体存储器(例如,掩模ROM、PROM(ProgrammableROM)、EPROM(Erasable PROM)、闪存ROM和RAM(random access memory))。另外,程序也可以通过各种类型的暂时性的计算机可读介质(transitory computer readable medium)提供给计算机。
上述各实施方式是本发明的优选实施方式,但本发明的范围并不仅限定于上述实施方式,在不脱离本发明主旨的范围内能够以实施了各种变更的方式来实施。
本公开的控制辅助装置、控制装置以及控制辅助方法包含上述实施方式,可以采取具有如下结构的各种实施方式。
(1)一种控制辅助装置(例如,控制辅助部400),其进行用于对控制马达(例如,马达150)的伺服控制装置(例如,伺服控制部100)的至少1个滤波器(例如,滤波器130)的系数和反馈增益中的至少一方进行调整的辅助,
所述控制辅助装置具有:
伺服状态信息取得部(例如,伺服状态信息取得部401),其取得由调整后的、所述至少1个滤波器的系数和所述反馈增益中的至少一方构成的第一信息;
频率特性计算部(例如,频率特性计算部403),其使用由调整前的、所述至少1个滤波器的系数和所述反馈增益中的至少一方构成的第二信息以及所述第一信息,计算以下频率特性中至少一方的频率特性:所述滤波器的系数和所述反馈增益中至少一方在调整前后的、所述滤波器的输入输出增益和相位延迟的频率特性,以及所述反馈增益(例如,速度控制部120)的输入输出增益和相位延迟的频率特性;以及
状态推定部(例如,状态推定部404),其根据在调整前后的所述至少一方的频率特性、以及所述滤波器的系数和所述反馈增益中至少一方的调整前的、对所述伺服控制装置的输入输出增益和输入输出的相位延迟进行测定而得的频率特性,求出所述滤波器的系数和所述反馈增益中至少一方的调整后的所述伺服控制装置的输入输出增益和相位延迟的频率特性推定值。
根据该控制辅助装置,在对伺服控制装置的至少1个滤波器的系数和反馈增益中的至少一方进行调整的情况下,无需在每次对至少1个滤波器的系数和反馈增益中的至少一方进行调整时使伺服控制装置动作来求出输入输出增益和相位延迟的频率特性,就能够求出输入输出增益和相位延迟的频率特性。因此,能够缩短测定输入输出增益和相位延迟的频率特性的时间。
(2)根据上述(1)所述的控制辅助装置,所述控制辅助装置具有:调整前状态信息保存部(例如,调整前状态保存部402),其保存对所述伺服控制装置的输入输出增益和输入输出的相位延迟进行测定而得的频率特性以及所述第二信息。
(3)一种控制装置,具有:
伺服控制装置,其控制马达;以及
上述(1)或(2)所述的控制辅助装置,其求出所述伺服控制装置的至少1个滤波器的系数和反馈增益中至少一方的调整后的所述伺服控制装置的输入输出增益和相位延迟的频率特性推定值。
根据该控制装置,在对伺服控制装置的至少1个滤波器的系数和反馈增益中的至少一方进行调整的情况下,无需在每次对至少1个滤波器的系数和反馈增益中的至少一方进行调整时使伺服控制装置动作来求出输入输出增益和相位延迟的频率特性,就能够求出输入输出增益和相位延迟的频率特性。因此,能够缩短测定输入输出增益及相位延迟的频率特性的时间。
(4)根据上述(3)所述的控制装置,所述控制装置具有:机器学习装置(例如,机器学习部500),其根据由上述(1)或(2)所述的控制辅助装置求出的、所述伺服控制装置的输入输出增益和相位延迟的频率特性推定值,对所述伺服控制装置的至少1个滤波器的系数和反馈增益中的至少一方进行优化。
根据该控制装置,速度控制部和/或滤波器的参数调整得以简化,可以在短时间内进行。
(5)根据上述(3)或(4)所述的控制装置,所述控制装置具有:
频率生成装置,其生成频率变化的信号,并将所述信号输入到所述伺服控制装置;以及
频率特性测定部,其根据所述信号和所述伺服控制装置的输出信号来测定所述伺服控制装置的输入输出增益和相位延迟的频率特性。
(6)根据上述(3)或(4)所述的控制装置,
所述伺服控制装置具有:
电流反馈环,其控制在所述马达中流过的电流;以及
反馈环,其包含该电流反馈环,并具有所述滤波器和所述反馈增益,
所述控制装置具有:
频率生成装置,其生成频率变化的第一信号,并将所述第一信号输入到所述电流反馈环;以及
频率特性测定部,其根据所述第一信号和在所述反馈环中输入到所述电流反馈环的第二信号,测定所述伺服控制装置的输入输出增益和相位延迟的频率特性。
(7)一种控制辅助装置(例如,控制辅助部400)的控制辅助方法,该控制辅助装置进行用于对控制马达(例如,马达150)的伺服控制装置(例如,伺服控制部100)的至少1个滤波器(例如,滤波器130)的系数和反馈增益中的至少一方进行调整的辅助,
取得由调整后的、所述至少1个滤波器的系数和所述反馈增益中的至少一方构成的第一信息,以及由调整前的、所述至少1个滤波器的系数和所述反馈增益中的至少一方构成的第二信息;
使用所述第二信息和所述第一信息,计算以下频率特性中至少一方的频率特性:所述滤波器的系数和所述反馈增益中至少一方在调整前后的、所述滤波器的输入输出增益和相位延迟的频率特性,以及所述反馈增益(例如,速度控制部120)的输入输出增益和相位延迟的频率特性;
根据在调整前后的所述至少一方的频率特性、以及所述滤波器的系数和所述反馈增益中至少一方的调整前的、对所述伺服控制装置的输入输出增益和输入输出的相位延迟进行测定而得的频率特性,求出所述滤波器的系数和所述反馈增益中至少一方的调整后的所述伺服控制装置的输入输出增益和相位延迟的频率特性推定值。
根据该控制辅助方法,在对伺服控制装置的至少1个滤波器的系数和反馈增益中的至少一方进行调整的情况下,无需在每次对至少1个滤波器的系数和反馈增益中的至少一方进行调整时使伺服控制装置动作来求出输入输出增益和相位延迟的频率特性,就能够求出输入输出增益和相位延迟的频率特性。因此,能够缩短测定输入输出增益和相位延迟的频率特性的时间。
符号说明
10、10A 控制装置
100、100-1~100-n 伺服控制部
110 减法器
120 速度控制部
130 滤波器
140 电流控制部
150 马达
200 频率生成部
300 频率特性测定部
400、400-1~400-n 控制辅助部
401 伺服状态信息取得部
402 调整前状态保存部
403 频率特性测定部
404 状态推定部
500 机器学习部
501 状态信息取得部
502 学习部
503 行为信息输出部
504 价值函数存储部
505 优化行为信息输出部
600 网络。
Claims (7)
1.一种控制辅助装置,其进行用于对控制马达的伺服控制装置的至少1个滤波器的系数和反馈增益中的至少一方进行调整的辅助,其特征在于,
所述控制辅助装置具有:
伺服状态信息取得部,其取得由调整后的、所述至少1个滤波器的系数和所述反馈增益中的至少一方构成的第一信息;
频率特性计算部,其使用由调整前的、所述至少1个滤波器的系数和所述反馈增益中的至少一方构成的第二信息以及所述第一信息,计算以下频率特性中至少一方的频率特性:所述滤波器的系数和所述反馈增益中至少一方在调整前后的、所述滤波器的输入输出增益和相位延迟的频率特性,以及所述反馈增益的输入输出增益和相位延迟的频率特性;以及
状态推定部,其根据在调整前后的所述至少一方的频率特性、以及所述滤波器的系数和所述反馈增益中至少一方的调整前的、对所述伺服控制装置的输入输出增益和输入输出的相位延迟进行测定而得的频率特性,求出所述滤波器的系数和所述反馈增益中至少一方的调整后的所述伺服控制装置的输入输出增益和相位延迟的频率特性推定值。
2.根据权利要求1所述的控制辅助装置,其特征在于,
所述控制辅助装置具有:调整前状态信息保存部,其保存对所述伺服控制装置的输入输出增益和输入输出的相位延迟进行测定而得的频率特性以及所述第二信息。
3.一种控制装置,其特征在于,具有:
伺服控制装置,其控制马达;以及
权利要求1或2所述的控制辅助装置,其求出所述伺服控制装置的至少1个滤波器的系数和反馈增益中至少一方的调整后的所述伺服控制装置的输入输出增益和相位延迟的频率特性推定值。
4.根据权利要求3所述的控制装置,其特征在于,
所述控制装置具有:机器学习装置,其根据由权利要求1或2所述的控制辅助装置求出的、所述伺服控制装置的输入输出增益和相位延迟的频率特性推定值,对所述伺服控制装置的至少1个滤波器的系数和反馈增益中的至少一方进行优化。
5.根据权利要求3或4所述的控制装置,其特征在于,
所述控制装置具有:
频率生成装置,其生成频率变化的信号,并将所述信号输入到所述伺服控制装置;以及
频率特性测定部,其根据所述信号和所述伺服控制装置的输出信号来测定所述伺服控制装置的输入输出增益和相位延迟的频率特性。
6.根据权利要求3或4所述的控制装置,其特征在于,
所述伺服控制装置具有:
电流反馈环,其控制在所述马达中流过的电流;以及
反馈环,其包含该电流反馈环,并具有所述滤波器和所述反馈增益,
所述控制装置具有:
频率生成装置,其生成频率变化的第一信号,并将所述第一信号输入到所述电流反馈环;以及
频率特性测定部,其根据所述第一信号和在所述反馈环中输入到所述电流反馈环的第二信号,测定所述伺服控制装置的输入输出增益和相位延迟的频率特性。
7.一种控制辅助装置的控制辅助方法,该控制辅助装置进行用于对控制马达的伺服控制装置的至少1个滤波器的系数和反馈增益中的至少一方进行调整的辅助,其特征在于,
取得由调整后的、所述至少1个滤波器的系数和所述反馈增益中的至少一方构成的第一信息,以及由调整前的、所述至少1个滤波器的系数和所述反馈增益中的至少一方构成的第二信息;
使用所述第二信息和所述第一信息,计算以下频率特性中至少一方的频率特性:所述滤波器的系数和所述反馈增益中至少一方在调整前后的、所述滤波器的输入输出增益和相位延迟的频率特性,以及所述反馈增益的输入输出增益和相位延迟的频率特性;
根据在调整前后的所述至少一方的频率特性、以及所述系数和所述反馈增益中至少一方的调整前的、对所述伺服控制装置的输入输出增益和输入输出的相位延迟进行测定而得的频率特性,求出所述滤波器的系数和所述反馈增益中至少一方的调整后的所述伺服控制装置的输入输出增益和相位延迟的频率特性推定值。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020-099963 | 2020-06-09 | ||
JP2020099963 | 2020-06-09 | ||
PCT/JP2021/020938 WO2021251226A1 (ja) | 2020-06-09 | 2021-06-02 | 制御支援装置、制御装置及び制御支援方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115917444A true CN115917444A (zh) | 2023-04-04 |
Family
ID=78846050
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180040453.5A Pending CN115917444A (zh) | 2020-06-09 | 2021-06-02 | 控制辅助装置、控制装置及控制辅助方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230176532A1 (zh) |
JP (1) | JP7381751B2 (zh) |
CN (1) | CN115917444A (zh) |
DE (1) | DE112021003188T5 (zh) |
WO (1) | WO2021251226A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7414704B2 (ja) * | 2020-12-14 | 2024-01-16 | 株式会社東芝 | 異常検出装置、異常検出方法、およびプログラム |
WO2023181418A1 (ja) | 2022-03-25 | 2023-09-28 | ファナック株式会社 | 制御パラメータを調整する調整装置、制御システム及び制御パラメータ調整方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6488706A (en) * | 1987-09-30 | 1989-04-03 | Toshiba Corp | Adaptive controller |
JPH11194821A (ja) | 1997-12-26 | 1999-07-21 | Mazda Motor Corp | 車両の走行制御設定装置、制御パラメータ設定方法および設定プログラムを記憶した記憶媒体 |
JP4698656B2 (ja) | 2007-11-12 | 2011-06-08 | 三菱電機株式会社 | 制御システムおよび制御支援装置 |
JP5731933B2 (ja) * | 2011-08-30 | 2015-06-10 | 川崎重工業株式会社 | 適応制御装置および適応制御方法ならびに射出成形機の制御装置および制御方法 |
US9270369B2 (en) | 2014-01-13 | 2016-02-23 | Fujitsu Limited | Correction table for interferometric optical signal-to-noise ratio monitor |
JP2016092935A (ja) | 2014-10-31 | 2016-05-23 | ファナック株式会社 | ゲイン自動調整支援装置 |
JP6325504B2 (ja) * | 2015-10-28 | 2018-05-16 | ファナック株式会社 | 学習制御器の自動調整を行う機能を有するサーボ制御装置 |
-
2021
- 2021-06-02 CN CN202180040453.5A patent/CN115917444A/zh active Pending
- 2021-06-02 DE DE112021003188.0T patent/DE112021003188T5/de active Pending
- 2021-06-02 JP JP2022530497A patent/JP7381751B2/ja active Active
- 2021-06-02 US US17/926,373 patent/US20230176532A1/en active Pending
- 2021-06-02 WO PCT/JP2021/020938 patent/WO2021251226A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
DE112021003188T5 (de) | 2023-04-20 |
JPWO2021251226A1 (zh) | 2021-12-16 |
US20230176532A1 (en) | 2023-06-08 |
WO2021251226A1 (ja) | 2021-12-16 |
JP7381751B2 (ja) | 2023-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111103849B (zh) | 输出装置、控制装置、以及学习参数的输出方法 | |
CN109274314B (zh) | 机器学习装置、伺服电动机控制装置、伺服电动机控制系统以及机器学习方法 | |
WO2018151215A1 (ja) | 制御装置及び制御方法 | |
US20200104743A1 (en) | Machine learning device, control device, and machine learning method | |
US11009837B2 (en) | Machine learning device that adjusts controller gain in a servo control apparatus | |
US11226599B2 (en) | Machine learning system, control device, and machine learning method for optimizing filter coefficients | |
JP6748135B2 (ja) | 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法 | |
CN111830904B (zh) | 机器学习装置、控制装置以及机器学习方法 | |
CN115917444A (zh) | 控制辅助装置、控制装置及控制辅助方法 | |
US11126149B2 (en) | Control parameter adjusting device and adjusting method using machine learning | |
US11029650B2 (en) | Machine learning device, control system, and machine learning method | |
CN111552237B (zh) | 机器学习装置、控制装置、以及机器学习的搜索范围的设定方法 | |
CN110941242A (zh) | 电动机控制装置 | |
CN117678155A (zh) | 频率特性预测装置及频率特性预测方法 | |
JP7469476B2 (ja) | 制御支援装置、制御システム及び制御支援方法 | |
US11243501B2 (en) | Machine learning device, control system, and machine learning | |
CN110138296B (zh) | 机器学习装置和方法、伺服电动机控制装置和系统 | |
CN110727242B (zh) | 机器学习装置、控制装置、以及机器学习方法 | |
WO2022065190A1 (ja) | 制御支援装置、制御システム及びフィルタ調整方法 | |
Mallick et al. | Comparative performance study of lyapunov based MRAC technique and MRAC augmented with PID controller for speed control of a DC motor | |
CN115398353A (zh) | 机器学习装置、控制装置以及机器学习方法 | |
CN107623473B (zh) | 一种永磁同步伺服系统位置预测控制方法 | |
WO2023067787A1 (ja) | 安定余裕の設定支援装置、制御システム及び設定支援方法 | |
JP4036520B2 (ja) | 単純適応制御装置 | |
JPH0695703A (ja) | 機械定数の推定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |