CN108693833B - 机器学习装置、伺服控制装置和系统以及机器学习方法 - Google Patents

机器学习装置、伺服控制装置和系统以及机器学习方法 Download PDF

Info

Publication number
CN108693833B
CN108693833B CN201810264707.1A CN201810264707A CN108693833B CN 108693833 B CN108693833 B CN 108693833B CN 201810264707 A CN201810264707 A CN 201810264707A CN 108693833 B CN108693833 B CN 108693833B
Authority
CN
China
Prior art keywords
mentioned
control object
current
machine learning
speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810264707.1A
Other languages
English (en)
Other versions
CN108693833A (zh
Inventor
园田直人
猪饲聪史
恒木亮太郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fanuc Corp
Original Assignee
Fanuc Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fanuc Corp filed Critical Fanuc Corp
Publication of CN108693833A publication Critical patent/CN108693833A/zh
Application granted granted Critical
Publication of CN108693833B publication Critical patent/CN108693833B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/414Structure of the control system, e.g. common controller or multiprocessor systems, interface to servo, programmable interface controller
    • G05B19/4142Structure of the control system, e.g. common controller or multiprocessor systems, interface to servo, programmable interface controller characterised by the use of a microprocessor
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/34Director, elements to supervisory
    • G05B2219/34013Servocontroller

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Manufacturing & Machinery (AREA)
  • Human Computer Interaction (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Computer Hardware Design (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明提供一种机器学习装置、伺服控制装置和系统以及机器学习方法,避免繁杂的调整并简便地抑制干扰。该机器学习装置具备:标签取得部(220),其取得在抑制了干扰的状态下驱动伺服控制装置的控制对象的电流指令作为标签;输入数据取得部(210),其取得在抑制了干扰的状态下根据电流指令进行驱动的控制对象的速度作为输入数据;以及学习部(230),其将标签与输入数据的组作为训练数据进行有监督学习,从而构建根据控制对象的速度推定驱动上述控制对象的电流的学习模型。

Description

机器学习装置、伺服控制装置和系统以及机器学习方法
技术领域
本发明涉及用于抑制干扰的机器学习装置、伺服控制装置、伺服控制系统及机器学习方法。
背景技术
作为机床以及工业机械的伺服控制装置,专利文献1公开了一种能够进行可以与控制对象的非线性、干扰或环境经时变化对应的高精度定位的结构。具体地说,专利文献1公开了一种伺服控制装置,其作为具有使控制对象的控制输出与目标值一致地反馈控制目标值与控制输出之间的控制偏差的控制器的伺服控制装置,包括:神经网络模型,其将控制器的输出设为输入信号;线性模型,其将控制器的输出设为输入信号;以及学习单元,其将神经网络的输出设为控制对象的输入信号,并以使控制对象的输出与线性模型的输出变得相等的方式使神经网络的各层间的权重发生变化。
上述专利文献1公开的结构,将线性模型设为参考模型,以与该线性模型的特性一致的方式进行模型参考自适应控制,所以用户需要逐一准备线性模型。
但是,用户逐一准备线性模型对用户来说比较繁杂,希望一种更简便地抑制干扰等的伺服控制装置。
专利文献1:日本特开平07-210207号公报
发明内容
本发明的目的为提供能够避免繁杂的调整并简便地抑制干扰的机器学习装置、伺服控制装置、伺服控制系统及机器学习方法。
(1)本发明的机器学习装置(例如后述的机器学习装置200、200-1~200-n、201、202)具备:
标签取得部(例如后述的标签取得部220),其取得在抑制了干扰的状态下驱动伺服控制装置的控制对象(例如后述的控制对象400)的电流指令作为标签;
输入数据取得部(例如后述的输入数据取得部210),其取得在抑制了上述干扰的状态下根据上述电流指令进行驱动的控制对象的速度作为输入数据;以及
学习部(例如后述的学习部230),其将上述标签与上述输入数据的组作为训练数据来进行有监督学习,由此构建用于根据上述控制对象的速度推定驱动上述控制对象的电流的学习模型。
(2)在上述(1)的机器学习装置中,上述控制对象具备电动机(例如后述的伺服电动机401)和通过该电动机进行移动的负载(例如后述的负载402),通过上述输入数据取得部取得的上述速度可以是上述电动机的转速和上述负载的速度。
(3)在上述(1)或(2)的机器学习装置中,还具备:函数输出部(例如后述的推定电流生成函数输出部250),其根据通过上述学习部所构建的上述学习模型,生成用于根据上述控制对象的速度推定驱动上述控制对象的电流的函数,并输出给上述伺服控制装置。
(4)在上述(1)~(3)中的任意一个机器学习装置中,上述伺服控制装置具备构成电流反馈环的电流控制部(例如后述的电流控制部180)和放大器(例如后述的放大器190),驱动上述控制对象的电流指令经由上述电流控制部和上述放大器被施加给上述控制对象,
输入到上述标签取得部的上述电流指令可以是上述放大器的输出。
(5)本发明的伺服控制系统具备上述(3)的机器学习装置(例如后述的机器学习装置200、200-1~200-n、201、202)、对该机器学习装置输出上述电流指令以及上述控制对象的速度的上述伺服控制装置(例如后述的伺服控制装置100、100-1~100-n、101、102),
上述伺服控制装置具备:推定电流生成部(例如后述的推定电流生成部150),其基于从上述函数输出部输出的上述函数,根据上述控制对象的速度推定驱动上述控制对象的电流;减法部(例如后述的减法器140),其求出上述电流指令与通过上述推定电流生成部推定出的推定电流之间的差;以及干扰补偿部(例如后述的干扰补偿器160),其根据上述差来生成用于补偿干扰的修正电流。
(6)在上述(5)的伺服控制系统中,上述伺服控制装置具备构成电流反馈环的电流控制部(例如后述的电流控制部180)和放大器(例如后述的放大器190),驱动上述控制对象的电流指令经由上述电流控制部和上述放大器被施加给上述控制对象,
输入到上述标签取得部的上述电流指令可以是上述放大器的输出。
(7)本发明的伺服控制装置具备:
上述(3)的机器学习装置(例如后述的机器学习装置200、200-1~200-n、201、202);
推定电流生成部(例如后述的推定电流生成部150),其基于从上述函数输出部输出的上述函数,根据上述控制对象的速度推定驱动上述控制对象的电流;
减法部(例如后述的减法器140),其求出上述电流指令与通过上述推定电流生成部推定出的推定电流之间的差;以及
干扰补偿部(例如后述的干扰补偿器160),其根据上述差来生成用于补偿干扰的修正电流。
(8)在上述(7)的伺服控制装置中,具备构成电流反馈环的电流控制部(例如后述的电流控制部180)和放大器(例如后述的放大器190),驱动上述控制对象的电流指令经由上述电流控制部和上述放大器被施加给上述控制对象,
输入到上述标签取得部的上述电流指令是上述放大器的输出。
(9)本发明的机器学习装置的机器学习方法,
取得在抑制了干扰的状态下驱动伺服控制装置的控制对象的电流指令作为标签;
取得在抑制了上述干扰的状态下根据上述电流指令进行驱动的控制对象的速度作为输入数据;以及
将上述标签与上述输入数据的组作为训练数据进行有监督学习,由此构建用于根据上述控制对象的速度推定驱动上述控制对象的电流的学习模型。
根据本发明,能够避免繁杂的调整并简便地抑制干扰。
附图说明
图1是表示本发明第一实施方式的伺服控制系统的框图。
图2是表示本发明第一实施方式的伺服控制系统的伺服控制装置的结构的框图。
图3是表示本发明第一实施方式的伺服控制系统的加工时的伺服控制装置的结构的框图。
图4是表示本发明第一实施方式的伺服控制系统的机器学习装置的结构的框图。
图5是表示本实施方式的机器学习装置200的动作的流程图。
图6是表示本发明第二实施方式的伺服控制系统中的伺服控制装置与机器学习装置的一个结构例的框图。
图7是表示本发明第二实施方式的伺服控制系统的加工时的伺服控制装置的结构的框图。
图8是表示本发明第二实施方式的伺服控制系统的机器学习装置的结构的框图。
图9是表示本发明第三实施方式的伺服控制系统中的伺服控制装置与机器学习装置的一个结构例的框图。
图10是表示本发明第三实施方式的伺服控制系统的加工时的伺服控制装置的结构的框图。
图11是表示本发明第三实施方式的伺服控制系统的机器学习装置的结构的框图。
附图标记的说明
10:伺服控制系统;100、100-1~100~n:伺服控制装置;110:减法器;120:速度控制部;130:加法器;140:减法器;150:推定电流生成部;160:干扰补偿器;170:低通滤波器;200、200-1~200~n:机器学习装置;210:输入数据取得部;220:标签取得部;230:学习部;240:学习模型存储部;250:推定电流生成函数输出部;300:网络;400:控制对象。
具体实施方式
以下,使用附图详细说明本发明的实施方式。另外,以下说明了三个实施方式,但是成为其前提的整体结构在各个实施方式中是相同的,所以首先说明在该各个实施方式中相同的整体结构。
<在各个实施方式中相同的整体结构>
图1是表示本发明第一实施方式的伺服控制系统的框图。如图1所示,伺服控制系统10具备n台伺服控制装置100-1~100-n、n台机器学习装置200-1~200-n以及网络300。另外,n是任意的自然数。
这里,伺服控制装置100-1与机器学习装置200-1为1对1的组,以可通信的方式连接。关于伺服控制装置100-2~100-n和机器学习装置200-2~200-n也与伺服控制装置100-1和机器学习装置200-1同样地连接。图1中,伺服控制装置100-1~100-n与机器学习装置200-1~200-n的n个组经由网络300连接,但是伺服控制装置100-1~100-n与机器学习装置200-1~200-n的n个组也可以经由连接接口将每个组的伺服控制装置和机器学习装置直接连接。伺服控制装置100-1~100-n与机器学习装置200-1~200-n的n个组例如可以在相同的工厂中设置多组,也可以分别设置在不同的工厂。
网络300例如是构建在工厂内的LAN(Local Area Network局域网)、因特网、公共电话网或者这些的组合。对于网络300中的具体通信方式以及是有线连接与无线连接的哪一个等没有特别限定。
<第一实施方式>
图2是表示本发明第一实施方式的伺服控制系统中的一组伺服控制装置与机械控制装置的一个结构例的框图。图2所示的伺服控制装置100与机器学习装置200例如与图1所示的伺服控制装置100-1和机器学习装置200-1对应。图2中,在各个装置间存在的网络300省略其图示。
如图2所示,伺服控制装置100具备减法器110、速度控制部120、加法器130、减法器140、推定电流生成部150、干扰补偿器160以及低通滤波器170。机器学习装置200从加法器130接受电流指令值,从控制对象400接受速度检测值。机器学习装置200将电流指令值作为标签,根据将速度检测值作为输入数据的训练数据进行作为机器学习的有监督学习,并将推定电流生成函数输出给推定电流生成部150。
通过伺服控制装置100进行伺服控制的控制对象400例如是伺服电动机、或者包括伺服电动机的机床、机器人或工业机械等。伺服控制装置100可以作为机床、机器人或工业机械等的一部分而设置。在以下的说明中,说明控制对象400是包括伺服电动机的机床的情况。
在本实施方式中,伺服控制装置100在机器学习时,在不产生干扰的状态,具体地说是不加工工件的状态下,驱动控制对象400,不进行补偿干扰的控制。因此,在机器学习时,从加法器130经由减法器140、推定电流生成部150、干扰补偿器160以及低通滤波器170返回加法器130的路径不发挥功能。在路径不发挥功能的意义下,在图2中通过虚线表示该路径。伺服控制装置100为了使该路径不发挥功能,例如以不从干扰补偿器160输出输出信号的方式进行控制即可。
伺服控制系统10在机器学习时,能够使用通过机床实际加工的工件的加工程序来驱动控制对象400,进行机器学习。但是,一般基于加工程序的处理时间长,所以伺服控制系统10最好使用与实际的加工程序不同的用于机器学习的评价用程序。评价用程序通过机器学习时的加工形状指定轴方向的移动距离、进给速度等。机器学习时的加工形状例如是圆、方形以及带角R的方形(a square with quarter arc有四分之一圆弧的方形)等。通过这样的加工形状,能够使伺服电动机的旋转方向反转,或者从旋转状态停止。
接着,参照图2说明本实施方式的机器学习时的信号流。首先,用于控制控制对象400的驱动的速度指令从省略了图示的上位装置输入到伺服控制装置100。减法器110求出被输入到伺服控制装置100的速度指令与从控制对象400进行速度反馈的速度检测值之间的差即速度偏差,并输出给速度控制部120。
速度控制部120将积分增益K1v与速度偏差相乘并进行积分后得到的值与将比例增益K2v与速度偏差相乘后得到的值相加,将其相加值作为电流指令值,经由加法器130输出给控制对象400以及机器学习装置200。加法器130在实际的加工时,求出电流指令值与低通滤波器170的输出之间的差,并将该差输出给控制对象400。另一方面,加法器130在机器学习时将电流指令值直接输出给控制对象400以及机器学习装置200。
控制对象400中包括的伺服电动机根据电流指令值而被驱动。通过与伺服电动机关联的成为位置检测部的旋转编码器检测控制对象400的伺服电动机的旋转角度位置,检测出的信号被用作进行了速度反馈的速度检测值。另外,速度检测值被输入给机器学习装置200。
机器学习装置200进行作为机器学习的有监督学习,该机器学习将从旋转编码器输出的速度检测值用作训练数据,将电流指令值用作标签。机器学习装置200通过进行有监督学习来构建学习模型,并将控制对象400的传递函数1/Js的反函数Js作为推定电流生成函数输出给推定电流生成部150。后面详细描述机器学习装置200的有监督学习。
机器学习装置200如果在推定电流生成部150中设定反函数Js,则如图3所示,伺服控制装置100即使在通过学习后的实际加工程序进行工件的加工时产生干扰,也能够生成修正电流使得通过接下来的动作修正由于干扰产生的速度变化。图3是表示本发明第一实施方式的伺服控制系统的加工时的伺服控制装置的结构的框图。在实际的加工时,不进行机器学习,因此与机器学习装置200的连接在图3中没有被图示。
如图3所示,基于学习后的实际加工程序的速度指令值被输入给减法器110。减法器110求出被输入的速度指令与从控制对象400进行速度反馈的速度检测值之间的差即速度偏差,并输出给速度控制部120。
速度控制部120将积分增益K1v与速度偏差相乘并进行积分后得到的值与将比例增益K2v与速度偏差相乘后得到的值相加,将其加法运算值作为电流指令值输出给加法器130。加法器130求出电流指令值与低通滤波器170的输出之间的差,并将该差输出给控制对象400以及减法器140。
在由于工件的加工产生干扰,且成为控制对象的伺服电动机的速度发生变化时,包括干扰造成的速度变动成分的速度检测值被输入给推定电流生成部150。推定电流生成部150的传递函数被设定为控制对象400的反函数,所以如果输入包括干扰造成的速度变动成分的速度检测值,则将包括由于干扰的影响而被施加的电流成分的推定电流值输出给减法器140。
减法器140取得电流指令值与包括干扰造成的电流成分的推定电流值之间的差,仅将干扰造成的电流成分输入干扰补偿器160。干扰补偿器160生成修正电流值,并将修正电流值经由低通滤波器170输入加法器130。加法器130将干扰造成的修正电流值与电流指令值相加并输出。这样,为了抑制干扰造成的控制对象400的伺服电动机的速度变化而修正电流指令值,根据修正后的电流指令来驱动伺服电动机。为了除去比从施加干扰到通过修正电流值抑制干扰造成的影响为止的时间短的频率成分而设置低通滤波器170。
接着,使用图4说明机器学习装置200的结构以及动作。图4是表示本发明第一实施方式的伺服控制系统的机器学习装置的结构的框图。
如图4所示,机器学习装置200具备输入数据取得部210、标签取得部220、学习部230、学习模型存储部240以及推定电流生成函数输出部250。
输入数据取得部210取得根据速度指令驱动的伺服电动机的速度检测值作为输入数据(也称为特征量),并将取得的输入数据输出给学习部230。
标签取得部220取得从加法器130输出的电流指令值作为标签,并将取得的标签输出给学习部230。
这样,作为输入数据的速度检测值与作为标签的电流指令的组被输入学习部230。该输入数据与标签的组相当于机器学习中的训练数据。
学习部230根据这样被输入的训练数据进行被称为有监督学习的机器学习,从而构建学习模型。这里,有监督学习自身对本领域技术人员来说非常熟悉,所以省略详细的说明,说明其概略。
例如,通过组合感知器而构成的神经网络进行有监督学习。具体地说,训练数据中包括的输入数据与标签的组被赋予神经网络,为了使神经网络的输出与标签相同,一边变更针对各个感知器的权重一边重复学习。
例如在进行了正向传播(Forward-propagation)之后,重复反向传播(back-propagation,也称为误差反向传播法)的处理,从而调整权重值,以便缩小各个感知器的输出误差。
这样,学习部230学习训练数据的特征,并归纳地获得用于根据输入推定结果的学习模型。
这里,有监督学习如上述那样,一边使权重的值不同,一边消除标签与输出数据之间的误差。而且,本实施方式的标签是针对控制对象400的电流指令,输入是成为控制对象400的输出的检测速度值。因此,通过学习部230重复学习而构建的学习模型,理想地相当于用于将针对控制对象400的电流指令与针对成为输入数据的速度检测值的输出数据设为相等值的反函数。
另外,学习部230用于学习的神经网络可以是三层,但是也可以是四层以上。学习部230可以通过所谓的深度学习(也称为深层学习)进行学习。
学习部230所构建的学习模型被输出给学习模型存储部240。
学习模型存储部240是存储由学习部230构建并对学习模型存储部240输出的学习模型的存储部。
推定电流生成函数输出部250在实际加工前,从学习模型存储部240取得学习模型。然后,推定电流生成函数输出部250将根据所取得的学习模型计算出的函数即推定电流生成函数输出给推定电流生成部150。该推定电流生成函数用于在通过实际的加工程序产生了干扰时,在推定电流生成部150中生成包括干扰造成的电流成分的推定电流值。
以上,说明了机器学习装置200的功能块。为了实现这些功能块,机器学习装置200具备CPU(Central Processing Unit中央处理单元)等运算处理装置。另外,机器学习装置200具备存储了各种控制用程序的HDD(Hard Disk Drive硬盘驱动器)等辅助存储装置以及用于存储在运算处理装置执行程序时暂时所需要的数据的RAM(Random Access Memory随机存取存储器)等主存储装置。
而且,在机器学习装置200中,由运算处理装置从辅助存储装置读入应用程序和OS,使读入的应用程序或OS展开到主存储装置,并进行基于这些应用程序或OS的运算处理。另外,运算处理装置根据该运算结果来控制各装置所具备的各种软件。由此,实现本实施方式中的机器学习装置200的功能块。即,本实施方式能够通过硬件与软件的协作来实现。
作为具体例,机器学习装置200通过个人计算机、服务器装置或者数值控制装置(CNC:Computerized Numerical Control计算机数值控制)的一部分等来实现。
但是,机器学习装置200随着机器学习的运算量较多,因此例如优选在个人计算机中搭载GPU(Graphics Processing Units图形处理单元)。机器学习装置200通过被称为GPGPU(General-Purpose computing on Graphics Processing Units图形处理单元的通用计算)的技术,如果将GPU用于随着机器学习的运算处理,则能够高速处理。进一步,机器学习装置200为了进行更高速的处理,使用多台搭载了这种CPU的计算机来构建计算机集群,通过该计算机集群中包括的多个计算机进行并行处理。
另外,后述的第二实施方式中的机器学习装置201以及第三实施方式中的机器学习装置202,也能够和本实施方式的机器学习装置200同样地实现。
接着,参照图5的流程图说明本实施方式中的机器学习装置200的机器学习的动作。
在步骤S11中,机器学习装置200判断机器学习是否结束。
这里,当机器学习结束时,在步骤S11中判定为“是”,处理进入到步骤S16。当机器学习没有结束时,在步骤S11中判定为“否”,处理进入到步骤S12。
在步骤S12以及步骤S13中,机器学习装置200的输入数据取得部210以及标签取得部220取得输入数据和标签。这些数据的具体内容为以上。
在步骤S14中,机器学习装置200的学习部230使用所输入的训练数据执行机器学习。使用了该训练数据的机器学习的具体内容为以上那样。
在步骤S15中,学习部230将所构建的学习模型输出给学习模型存储部240,从而更新学习模型。之后,处理再次进入步骤S11。
这样重复从步骤S11到步骤S15的处理,从而继续学习。然后,当机器学习结束时,进入步骤S16。另外,机器学习的结束,例如可以通过来自用户的指示来执行,也可以在学习模型的输出与标签的误差值在预定值以下的情况下进行,也可以在将机器学习重复预定的次数的情况下进行。
在步骤S16中,推定电流生成函数输出部250取得由学习模型存储部240存储的学习模型。
在步骤S17中,推定电流生成函数输出部250将根据所取得的学习模型计算出的函数即推定电流生成函数输出给推定电流生成部150。
这样,伺服控制装置100中的干扰补偿功能为有效。
<第二实施方式>
接着,参照图6、图7以及图8说明第二实施方式的结构。另外,关于第二实施方式的功能以及结构中与上述第一实施方式相同的功能以及结构,省略说明。另外,在图6~图8中,标注相同标记并省略重复的说明,详细说明第一实施方式与第二实施方式中的不同点。
图6是表示本发明第二实施方式的伺服控制系统中的伺服控制装置与机器学习装置的一个结构例的框图。图7是表示本发明第二实施方式的伺服控制系统的加工时的伺服控制装置的结构的框图。图8是表示本发明第二实施方式的伺服控制系统的机器学习装置的结构的框图。
如图6以及图7所示,本实施方式的伺服控制系统与图2以及图3所示的第一实施方式的伺服控制系统之间的不同点为,由伺服电动机401和负载402构成控制对象,从伺服电动机401的旋转编码器输出的速度检测值与从检测负载402的速度的线位移传感器输出的负载侧的速度检测值被输入到推定电流生成部150以及机器学习装置201。
机器学习装置201与机器学习装置200的不同点为,如图8所示,负载侧的速度检测值与伺服电动机401侧的速度检测值的双方作为输入数据输入到输入数据取得部210中,学习部230根据将这两个速度检测值作为输入数据并将电流指令值作为标签的训练数据来进行被称为有监督学习的机器学习,从而构建学习模型。
与伺服电动机401连接的负载402,在机床的情况下例如相当于装载要加工的工件的工作台。伺服电动机401与工作台通过连结机构连接,如图6以及图7所示,连结机构作为机械的等价电路,通过阻尼器和弹簧表示。连结机构具备与伺服电动机401连结的联轴器、固定在联轴器上的滚珠丝杠、与滚珠丝杆螺纹结合并与工作台连接的螺母。伺服电动机401的旋转运动通过这样的连结功能而转换为工作台的直线运动。通过在滚珠丝杆3033的端部安装线位移传感器能够测量负载402的速度。
在第二实施方式中也和第一实施方式同样,在机器学习时不进行补偿干扰的控制。因此,图6中经由减法器140、推定电流生成部150、干扰补偿器160以及低通滤波器170到达加法器130的路径不发挥功能。在路径不发挥功能的意义下,在图6中通过虚线表示该路径。伺服控制装置101为了使该路径不发挥功能,例如控制成不从干扰补偿器160输出输出信号即可。另一方面,在实际加工时不进行机器学习,因此与机器学习装置201的连接在图7中未被图示。
第二实施方式的伺服控制系统不限于由于工件的加工产生干扰,且伺服电动机401的转速发生了变化的情况,即使在负载402的速度由于干扰发生变化的情况下也能够修正电流指令值以便抑制该速度变化。
<第三实施方式>
接着,参照图9、图10以及图11说明第三实施方式的结构。另外,关于第三实施方式的功能以及结构中与上述第一实施方式相同的功能以及结构将省略说明。另外,在图9~图11中,标注相同标记,省略重复的说明,详细说明第一实施方式与第三实施方式中的不同点。
图9是表示本发明第三实施方式的伺服控制系统中的伺服控制装置与机器学习装置的一个结构例的框图。图10是表示本发明第三实施方式的伺服控制系统的加工时的伺服控制装置的结构的框图。图11是表示本发明第三实施方式的伺服控制系统的机器学习装置的结构的框图。
如图9以及图10所示,本实施方式的伺服控制系统与图2以及图3所示的第一实施方式的伺服控制系统之间的不同点为,在加法器130的输出侧增加了电流控制部180和放大器190,形成了电流反馈环。从电流控制部180向放大器190发送电压指令,通过放大器190控制的电流被赋予控制对象400。另外,被赋予控制对象400的电流被反馈给电流控制部180,并且被赋予减法器140以及机器学习装置202。电流控制部180将电流指令与电流反馈之差输出给放大器190。
机器学习装置202与机器学习装置200的不同点为,如图11所示,放大器190的输出被输入给标签取得部220,学习部230将放大器190的输出作为标签进行被称为有监督学习的机器学习,从而构建学习模型。
以上,说明了本发明的3个实施方式。上述各个实施方式是本发明的优选实施方式,但是不将本发明的范围仅限于上述各个实施方式,能够通过在不脱离本发明主旨的范围内实施了各种变更的方式来实施。例如,能够通过实施了以下记载的变更的方式来实施。
<伺服控制装置具备机器学习装置的变形例>
在上述的实施方式中,通过与伺服控制装置100~102分离的装置构成了机器学习装置200~202,但是也可以通过伺服控制装置100~102来实现机器学习装置200~202的功能的一部分或全部。
<系统结构的自由度>
在上述的实施方式中,伺服控制装置100~102与机器学习装置200~202作为1对1的组可通信地连接,但是各个实施方式的结构不限于上述结构。例如,如果以伺服控制装置100和机器学习装置200为例进行说明,则1台机器学习装置200和多个伺服控制装置100直接或经由网络可通信地连接,实施各个伺服控制装置100的机器学习。
此时,机器学习装置200的各个功能可以作为适当分散到多个服务器的分散处理系统。另外,机器学习装置200的各个功能也可以在云端利用虚拟服务器功能来实现。
另外,在具有与多个相同的型号名、相同标准或者相同系列的多个伺服控制装置100分别对应的多个控制对象400时,伺服控制系统可以构成为共享各个伺服控制装置100中的学习结果。通过这样,伺服控制系统能够构建更加适当的模型。
<在线学习、批量学习以及小批量学习>
上述学习部230中的有监督学习可以通过在线学习进行,可以通过批量学习进行,也可以通过小批量学习进行。
在线学习是指在每次由控制对象400驱动并生成训练数据时,立刻进行有监督学习的学习方法。另外,批量学习是指在重复由控制对象400驱动并生成训练数据期间,收集与重复对应的多个训练数据并使用收集到的所有训练数据进行有监督学习的学习方法。进一步,小批量学习是指在线学习与批量学习中间的每当训练数据滞留一定程度时进行有监督学习的学习方法。
另外,上述所说明的各个实施方式能够通过硬件、软件或它们的组合来实现。这里,通过软件实现是指通过计算机读入程序并执行来实现。在通过硬件构成时,例如能够通过LSI(Large Scale Integrated circuit大规模集成电路)、ASIC(Application SpecificIntegrated circuit专用集成电路)、门阵列、FPGA(Field Programmable Gate Array现场可编程门阵列)等集成电路(IC)来构成各个实施方式的一部分或全部。
另外,通过软件和硬件的组合构成各个实施方式的一部分或全部时,计算机的CPU将运算所需要的信息存储在DRAM中,使记述了通过流程图表示的伺服控制装置的动作的全部或一部分的程序进行运行。通过存储了该程序的硬盘、ROM等存储部、存储运算所需的数据的DRAM、CPU以及连接各部的总线来构成计算机。
能够使用各种类型的计算机可读取记录介质(computer readable medium)来存储程序并提供给计算机。计算机可读取记录介质包括各种类型的有实体的记录介质(tangible storage medium)。计算机可读取记录介质包括磁记录介质(例如软盘、磁带、硬盘驱动器)、光磁记录介质(例如光磁盘)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、半导体存储器(例如掩模ROM、PROM(programmable ROM)、EPROM(Erasable PROM)、闪存ROM、RAM(random access memory))。

Claims (7)

1.一种伺服控制系统,其特征在于,
该伺服控制系统具备机器学习装置以及伺服控制装置,
上述机器学习装置具备:标签取得部,其取得在抑制了干扰的状态下驱动伺服控制装置的控制对象的电流指令作为标签;输入数据取得部,其取得在抑制了上述干扰的状态下根据上述电流指令进行驱动的控制对象的速度作为输入数据;学习部,其将上述标签与上述输入数据的组作为训练数据来进行有监督学习,由此构建用于根据上述控制对象的速度推定驱动上述控制对象的电流的学习模型;以及函数输出部,其根据通过上述学习部构建的上述学习模型,生成用于根据上述控制对象的速度推定驱动上述控制对象的电流的函数,并输出给上述伺服控制装置,
上述伺服控制装置对该机器学习装置输出上述电流指令以及上述控制对象的速度,
上述伺服控制装置具备:推定电流生成部,其基于从上述函数输出部输出的上述函数,根据上述控制对象的速度推定驱动上述控制对象的电流;减法部,其求出上述电流指令与通过上述推定电流生成部推定出的推定电流之间的差;以及干扰补偿部,其根据上述差来生成用于补偿干扰的修正电流。
2.根据权利要求1所述的伺服控制系统,其特征在于,
上述伺服控制装置具备构成电流反馈环的电流控制部和放大器,驱动上述控制对象的电流指令经由上述电流控制部和上述放大器被施加给上述控制对象,
输入到上述标签取得部的上述电流指令是上述放大器的输出。
3.根据权利要求1或2所述的伺服控制系统,其特征在于,
上述控制对象具备电动机和通过该电动机进行移动的负载,通过上述输入数据取得部取得的上述速度是上述电动机的转速和上述负载的速度。
4.一种伺服控制装置,其特征在于,具备:
机器学习装置,其具备:标签取得部,其取得在抑制了干扰的状态下驱动伺服控制装置的控制对象的电流指令作为标签;输入数据取得部,其取得在抑制了上述干扰的状态下根据上述电流指令进行驱动的控制对象的速度作为输入数据;学习部,其将上述标签与上述输入数据的组作为训练数据来进行有监督学习,由此构建用于根据上述控制对象的速度推定驱动上述控制对象的电流的学习模型;以及函数输出部,其根据通过上述学习部构建的上述学习模型,生成用于根据上述控制对象的速度推定驱动上述控制对象的电流的函数并输出;
推定电流生成部,其基于从上述函数输出部输出的上述函数,根据上述控制对象的速度来推定驱动上述控制对象的电流;
减法部,其求出上述电流指令与通过上述推定电流生成部推定出的推定电流之间的差;以及
干扰补偿部,其根据上述差来生成用于补偿干扰的修正电流。
5.根据权利要求4所述的伺服控制装置,其特征在于,
该伺服控制装置具备构成电流反馈环的电流控制部和放大器,驱动上述控制对象的电流指令经由上述电流控制部和上述放大器被施加给上述控制对象,
输入到上述标签取得部的上述电流指令是上述放大器的输出。
6.根据权利要求4或5所述的伺服控制装置,其特征在于,
上述控制对象具备电动机和通过该电动机进行移动的负载,通过上述输入数据取得部取得的上述速度是上述电动机的转速和上述负载的速度。
7.一种伺服控制方法,其特征在于,
机器学习装置取得在抑制了干扰的状态下驱动伺服控制装置的控制对象的电流指令作为标签,
取得在抑制了上述干扰的状态下根据上述电流指令进行驱动的控制对象的速度作为输入数据,
将上述标签与上述输入数据的组作为训练数据来进行有监督学习,由此构建用于根据上述控制对象的速度推定驱动上述控制对象的电流的学习模型,
根据所构建的上述学习模型,生成用于根据上述控制对象的速度推定驱动上述控制对象的电流的函数;
上述伺服控制装置基于所生成的上述函数,根据上述控制对象的速度来推定驱动上述控制对象的电流,
求出上述电流指令与推定出的上述电流之间的差,
根据上述差来生成用于补偿干扰的修正电流。
CN201810264707.1A 2017-03-31 2018-03-28 机器学习装置、伺服控制装置和系统以及机器学习方法 Active CN108693833B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017-071017 2017-03-31
JP2017071017A JP6490131B2 (ja) 2017-03-31 2017-03-31 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法

Publications (2)

Publication Number Publication Date
CN108693833A CN108693833A (zh) 2018-10-23
CN108693833B true CN108693833B (zh) 2019-11-01

Family

ID=63524700

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810264707.1A Active CN108693833B (zh) 2017-03-31 2018-03-28 机器学习装置、伺服控制装置和系统以及机器学习方法

Country Status (4)

Country Link
US (1) US10481566B2 (zh)
JP (1) JP6490131B2 (zh)
CN (1) CN108693833B (zh)
DE (1) DE102018203956B4 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6646025B2 (ja) * 2017-09-15 2020-02-14 ファナック株式会社 制御装置及び機械学習装置
CN109376664B (zh) * 2018-10-29 2021-03-09 百度在线网络技术(北京)有限公司 机器学习训练方法、装置、服务器和介质
TWI681274B (zh) * 2018-11-14 2020-01-01 財團法人工業技術研究院 工具機頻率響應參數的調整方法及應用其之調整系統
WO2020203876A1 (ja) * 2019-03-29 2020-10-08 株式会社小松製作所 産業機械、制御装置、制御補正装置、および制御方法
JP7021147B2 (ja) * 2019-04-03 2022-02-16 ファナック株式会社 モータ制御装置及びモータ制御用コンピュータプログラム
WO2020217282A1 (ja) * 2019-04-22 2020-10-29 三菱電機株式会社 サーボ制御装置
FI20195894A1 (en) * 2019-10-16 2021-04-17 Kemira Oyj Method and system for monitoring the process
JP7412742B2 (ja) * 2020-01-16 2024-01-15 Kkテクノロジーズ株式会社 制御装置、制御方法、およびプログラム
JP7299184B2 (ja) * 2020-03-11 2023-06-27 日立Geニュークリア・エナジー株式会社 液圧駆動装置、液圧駆動装置の制御方法
DE112020006573B4 (de) * 2020-03-17 2024-06-06 Mitsubishi Electric Corporation Steuerungssystem, Motorsteuerungsvorrichtung und Vorrichtung für Maschinelles Lernen
JP7484382B2 (ja) * 2020-04-24 2024-05-16 横河電機株式会社 制御装置、制御方法および制御プログラム
JP7557314B2 (ja) * 2020-09-03 2024-09-27 国立大学法人群馬大学 モータ制御装置
JP7563250B2 (ja) 2021-03-11 2024-10-08 オムロン株式会社 制御システム、予測モデル生成装置、及びコンピュータプログラム
CN117378139A (zh) * 2021-12-13 2024-01-09 三菱电机株式会社 控制器、控制系统、学习装置及推断装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07210207A (ja) * 1994-01-17 1995-08-11 Hitachi Ltd 適応制御装置
CN1674429A (zh) * 2004-03-26 2005-09-28 伯斯有限公司 电磁致动器和控制
CN101261509A (zh) * 2007-03-08 2008-09-10 发那科株式会社 伺服控制装置
CN103532459A (zh) * 2013-10-15 2014-01-22 东南大学 一种数控机床驱动用直线伺服电机控制方法
CN104038128A (zh) * 2014-05-28 2014-09-10 浙江理工大学 基于nurbs的直线电机推力波动控制方法
CN104270046A (zh) * 2014-09-26 2015-01-07 嘉善博工数控科技有限公司 一种基于转速-电流二维模糊模型自学习的电机控制方法
CN104977895A (zh) * 2014-04-08 2015-10-14 发那科株式会社 伺服控制装置
CN106054816A (zh) * 2015-04-02 2016-10-26 发那科株式会社 切换基准轴来进行学习控制的伺服控制装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2923000B2 (ja) * 1990-07-27 1999-07-26 株式会社日立製作所 サーボ制御装置
US5852817A (en) * 1991-08-14 1998-12-22 Kabushiki Kaisha Toshiba Intelligent control apparatus
JP2831880B2 (ja) * 1992-07-23 1998-12-02 東洋電機製造株式会社 自動制御装置
US6000827A (en) * 1993-09-10 1999-12-14 Fujitsu Limited System identifying device and adaptive learning control device
JP3995835B2 (ja) * 1999-07-12 2007-10-24 トヨタ自動車株式会社 電動機を備える車両における動力制御装置
JP2004199289A (ja) * 2002-12-17 2004-07-15 Mitsubishi Electric Corp 周期的な目標値に追従する出力の制御装置
JP2008217259A (ja) * 2007-03-01 2008-09-18 Sumitomo Heavy Ind Ltd シミュレータ及び記憶媒体及びプログラム及び制御装置及びシミュレータの制御方法
US9360849B2 (en) * 2010-10-27 2016-06-07 Makino Milling Machine Co., Ltd. Numerical control method
JP6386492B2 (ja) * 2016-04-28 2018-09-05 ファナック株式会社 高速計算される比例項にフィルタを付加したサーボ制御装置、サーボ制御方法及びサーボ制御プログラム
JP6457569B2 (ja) * 2017-02-24 2019-01-23 ファナック株式会社 サーボモータ制御装置、サーボモータ制御方法、及びサーボモータ制御用プログラム
JP6514257B2 (ja) * 2017-03-29 2019-05-15 ファナック株式会社 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07210207A (ja) * 1994-01-17 1995-08-11 Hitachi Ltd 適応制御装置
CN1674429A (zh) * 2004-03-26 2005-09-28 伯斯有限公司 电磁致动器和控制
CN101261509A (zh) * 2007-03-08 2008-09-10 发那科株式会社 伺服控制装置
CN103532459A (zh) * 2013-10-15 2014-01-22 东南大学 一种数控机床驱动用直线伺服电机控制方法
CN104977895A (zh) * 2014-04-08 2015-10-14 发那科株式会社 伺服控制装置
CN104038128A (zh) * 2014-05-28 2014-09-10 浙江理工大学 基于nurbs的直线电机推力波动控制方法
CN104270046A (zh) * 2014-09-26 2015-01-07 嘉善博工数控科技有限公司 一种基于转速-电流二维模糊模型自学习的电机控制方法
CN106054816A (zh) * 2015-04-02 2016-10-26 发那科株式会社 切换基准轴来进行学习控制的伺服控制装置

Also Published As

Publication number Publication date
DE102018203956A1 (de) 2018-10-04
JP2018173777A (ja) 2018-11-08
CN108693833A (zh) 2018-10-23
JP6490131B2 (ja) 2019-03-27
DE102018203956B4 (de) 2021-09-30
US10481566B2 (en) 2019-11-19
US20180284702A1 (en) 2018-10-04

Similar Documents

Publication Publication Date Title
CN108693833B (zh) 机器学习装置、伺服控制装置和系统以及机器学习方法
He et al. Vibration control of a flexible robotic manipulator in the presence of input deadzone
JP6348137B2 (ja) 工作物の良否を判定する加工機械システム
CN100562823C (zh) 一种复杂轨迹的轮廓控制方法
CN108693834B (zh) 调整装置以及调整方法
CN108693832A (zh) 机器学习装置及方法、伺服控制装置、伺服控制系统
CN109116811B (zh) 机器学习装置和方法、伺服控制装置、伺服控制系统
JP2018152012A (ja) 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法
Kim et al. Indirect cutting force measurement in multi-axis simultaneous NC milling processes
JP2017103882A (ja) 制御装置、制御プログラムおよび記録媒体
CN108803499A (zh) 控制装置以及机器学习装置
CN111965976B (zh) 基于神经网络观测器的机器人关节滑模控制方法及系统
CN115034147B (zh) 一种基于数字孪生的智能制造系统
Gierlak Hybrid position/force control of the SCORBOT-ER 4pc manipulator with neural compensation of nonlinearities
CN115366107A (zh) 机器人机械臂关节摩擦力补偿方法及系统
Kang et al. Robust tracking control of a direct drive robot
Wu et al. Apply Adaptive Neural Network PID Controllers for a 6DOF Robotic Arm
Wang et al. Friction compensation of an xy robot using a recursive model free controller
Ghder Soliman et al. Traditional versus fuzzy optimal coupling in multi‐axis distributed motion control: a pre‐IoT‐integration procedure
Yang et al. Adaptive prescribed performance control for nonlinear networked teleoperation system under time delay
Xu et al. A Neural Network Error Compensation Technology for Precision Grinding Based on Genetic Algorithm
Shiryaev et al. Control Algorithm for Robot Manipulator Under Conditions of Incomplete Information
Wen et al. A Method of Temperature Prediction and Velocity Control Based on BP Artificial Neural Network
US11820007B2 (en) Abnormality detection device and abnormality detection method
Kussainov A Load Adaptive Control System of Manipulator Robot’s Drive

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant