CN106411210B - 电动机控制装置、机械学习装置及其方法 - Google Patents

电动机控制装置、机械学习装置及其方法 Download PDF

Info

Publication number
CN106411210B
CN106411210B CN201610605039.5A CN201610605039A CN106411210B CN 106411210 B CN106411210 B CN 106411210B CN 201610605039 A CN201610605039 A CN 201610605039A CN 106411210 B CN106411210 B CN 106411210B
Authority
CN
China
Prior art keywords
mentioned
motor
acceleration
magnetic flux
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610605039.5A
Other languages
English (en)
Other versions
CN106411210A (zh
Inventor
森田有纪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fanuc Corp
Original Assignee
Fanuc Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fanuc Corp filed Critical Fanuc Corp
Publication of CN106411210A publication Critical patent/CN106411210A/zh
Application granted granted Critical
Publication of CN106411210B publication Critical patent/CN106411210B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02PCONTROL OR REGULATION OF ELECTRIC MOTORS, ELECTRIC GENERATORS OR DYNAMO-ELECTRIC CONVERTERS; CONTROLLING TRANSFORMERS, REACTORS OR CHOKE COILS
    • H02P21/00Arrangements or methods for the control of electric machines by vector control, e.g. by control of field orientation
    • H02P21/14Estimation or adaptation of machine parameters, e.g. flux, current or voltage
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B11/00Automatic controllers
    • G05B11/01Automatic controllers electric
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/045Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02PCONTROL OR REGULATION OF ELECTRIC MOTORS, ELECTRIC GENERATORS OR DYNAMO-ELECTRIC CONVERTERS; CONTROLLING TRANSFORMERS, REACTORS OR CHOKE COILS
    • H02P21/00Arrangements or methods for the control of electric machines by vector control, e.g. by control of field orientation
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02PCONTROL OR REGULATION OF ELECTRIC MOTORS, ELECTRIC GENERATORS OR DYNAMO-ELECTRIC CONVERTERS; CONTROLLING TRANSFORMERS, REACTORS OR CHOKE COILS
    • H02P21/00Arrangements or methods for the control of electric machines by vector control, e.g. by control of field orientation
    • H02P21/13Observer control, e.g. using Luenberger observers or Kalman filters
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02PCONTROL OR REGULATION OF ELECTRIC MOTORS, ELECTRIC GENERATORS OR DYNAMO-ELECTRIC CONVERTERS; CONTROLLING TRANSFORMERS, REACTORS OR CHOKE COILS
    • H02P21/00Arrangements or methods for the control of electric machines by vector control, e.g. by control of field orientation
    • H02P21/14Estimation or adaptation of machine parameters, e.g. flux, current or voltage
    • H02P21/141Flux estimation
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02PCONTROL OR REGULATION OF ELECTRIC MOTORS, ELECTRIC GENERATORS OR DYNAMO-ELECTRIC CONVERTERS; CONTROLLING TRANSFORMERS, REACTORS OR CHOKE COILS
    • H02P21/00Arrangements or methods for the control of electric machines by vector control, e.g. by control of field orientation
    • H02P21/34Arrangements for starting
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/33Director till display
    • G05B2219/33322Failure driven learning
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/42Servomotor, servo controller kind till VSS
    • G05B2219/42129Teach, learn position table, model, for each reference a motor control output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02PCONTROL OR REGULATION OF ELECTRIC MOTORS, ELECTRIC GENERATORS OR DYNAMO-ELECTRIC CONVERTERS; CONTROLLING TRANSFORMERS, REACTORS OR CHOKE COILS
    • H02P21/00Arrangements or methods for the control of electric machines by vector control, e.g. by control of field orientation
    • H02P21/06Rotor flux based control involving the use of rotor position or rotor speed sensors

Landscapes

  • Engineering & Computer Science (AREA)
  • Power Engineering (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Automation & Control Theory (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Control Of Ac Motors In General (AREA)
  • Control Of Electric Motors In General (AREA)

Abstract

本发明提供一种电动机控制装置、机械学习装置及其方法。学习与电动机控制装置(1000)中的磁通控制器(51)的增益以及磁通推定器(52)的时间常数相关联的条件的机械学习装置(1)具备:状态观测部(11),其观测由与电动机(104)的加速度相关的数据、与电动机(104)的加加速度相关的数据、与电动机(104)的加速时间相关的数据中的至少一个构成的状态变量;以及学习部(12),其按照由状态变量构成的训练数据集,学习与磁通控制器(51)的增益以及磁通推定器(52)的时间常数相关联的条件。

Description

电动机控制装置、机械学习装置及其方法
技术领域
本发明涉及一种具有磁通控制器的电动机控制装置、机械学习装置及其方法。
背景技术
作为用作驱动控制电动机的电动机控制装置,例如如日本特开2013-66342号公报所记载的那样,有如下的装置:根据所输入的速度指令,通过磁通推定器推动感应电动机的磁通状态,通过磁通控制器控制磁通。
感应电动机(以下,简单地称为“电动机”)中的磁通的大小,在稳定状态下,成为与用于生成磁通的电流即励磁电流成比例的值,但在电动机的加减速时等磁通大小变化的情况下,相对于励磁电流的变化,延迟由电动机的电路常数决定的时间常数的量而变化。若不考虑该延迟量地进行电流控制,则在电动机的加减速时磁通变化时,转矩不连续地变化,从而有时在速度波形中发生产生波动的过渡现象。
以解决上述问题为目的,将磁通控制器组入到电动机控制装置中,其中,该磁通控制器控制追随励磁电流指令,以便根据励磁电流或励磁电流指令、上述时间常数来推定磁通量,使该推定值尽快追随磁通指令值。在此,与励磁电流对应的磁通变化延迟的时间常数为通过电动机电路常数决定的值,但在实际的电动机中,有时不成为所设计的时间常数,因此有时需要与实机对应地调整磁通推定器的时间常数。此外,能够通过提高磁通控制器的增益,来提高与磁通指令对应的实际磁通的追随性,但若增益过度提高,则电流控制变得不稳定。因此,希望将磁通推定器的时间常数以及磁通控制器的增益调整为恰当值。
作业者亲自观测向电动机控制装置输入预定速度指令(例如,阶梯输入)时的加减速时的电动机的速度波形,并基于速度波形的好坏,来决定磁通控制器的增益以及磁通推定器的时间常数的各参数,因此决定最佳的参数需要时间和人力。
发明内容
本发明是鉴于上述问题而提出的,其目的是提供一种能够自动地进行磁通控制器的增益以及磁通推定器的时间常数的最佳化的电动机控制装置、用于该电动机控制装置的机械学习装置及其方法。
为了实现上述目的,学习与电动机控制装置中的磁通控制器的增益以及磁通推定器的时间常数相关联的条件的机械学习装置具备:状态观测部,其观测由与电动机的加速度相关的数据、与电动机的加加速度相关的数据、与电动机的加速时间相关的数据中的至少一个构成的状态变量;以及学习部,其按照由状态变量构成的训练数据集,学习与磁通控制器的增益以及磁通推定器的时间常数相关联的条件。
在此,学习部也可以具备:回报计算部,其根据状态变量计算回报;以及函数更新部,其根据回报,更新用于变更磁通控制器的增益以及磁通推定器的时间常数的函数。
此外,在电动机的加速期间或减速期间通过状态观测部观测到的电动机的加速度的极性发生变化时,回报计算部也可以减少回报。
此外,在电动机的加速期间或减速期间通过状态观测部观测到的电动机的加加速度的极性发生变化的次数为预定值以上时,回报计算部也可以减少回报。
此外,在电动机的加速期间或减速期间通过状态观测部观测到的电动机的加速时间比在当前的加速期间或减速期间之前的加速期间或减速期间通过状态观测部观测到的电动机的加速时间短时,回报计算部也可以增加回报。
学习部也可以构成为,按照针对多个电动机控制装置取得的训练数据集,学习上述条件。
此外,具备上述机械学习装置的电动机控制装置还具备:电动机控制部,其具有磁通控制器和磁通推定器;速度检测部,其检测电动机的速度;加速度计算部,其根据由速度检测部检测出的电动机的速度计算加速度;加加速度计算部,其根据由加速度计算部计算出的电动机的加速度计算加加速度;加速时间测定部,其测定电动机的加速时间;以及意图决定部,其根据学习部按照训练数据集学习后的结果,响应当前的状态变量的输入,决定磁通控制器的增益以及磁通推定器的时间常数。
在此,学习部构成为,按照由当前的状态变量构成的追加的训练数据集,重新学习并更新条件。
此外,学习与电动机控制装置中的磁通控制器的增益以及磁通推定器的时间常数相关联的条件的机械学习方法,具备如下的步骤:状态观测步骤,观测由与电动机的加速度相关的数据、与电动机的加加速度相关的数据、与电动机的加速时间相关的数据中的至少一个构成的状态变量;以及学习步骤,按照由状态变量构成的训练数据集,学习与磁通控制器的增益以及磁通推定器的时间常数相关联的条件。
附图说明
通过参照以下的附图,更明确地理解本发明。
图1是实施例的机械学习装置的原理框图。
图2是表示实施例的机械学习方法的动作原理的流程图。
图3是实施例的使用强化学习的机械学习装置的原理框图。
图4是表示实施例的使用强化学习的机械学习方法的原理的流程图。
图5是表示具备实施例的机械学习装置的电动机控制装置的原理框图。
图6是表示图5的电动机控制装置内的电动机控制部的原理框图。
图7A是表示图6的电动机控制部内的磁通控制部的原理框图,表示磁通控制部。
图7B是表示图6的电动机控制部内的磁通控制部的原理框图,表示磁通控制部内的磁通推定器。
图8A是说明回报计算部进行的回报计算处理的图,示例了提供阶梯状的速度指令时的理想速度波形。
图8B是说明回报计算部进行的回报计算处理的图,示例了在最佳化前的磁通控制器的增益下提供了阶梯状的速度指令时观测的速度波形。
图9A是说明回报计算部进行的回报计算处理的图,示例了提供阶梯状的速度指令时的理想速度波形。
图9B是说明回报计算部进行的回报计算处理的图,示例了在最佳化前的磁通推定器的时间常数下提供了阶梯状的速度指令时观测的速度波形。
图10是表示实施例的使用强化学习的机械学习装置的动作流程的流程图。
具体实施方式
以下,参照附图对具有磁通控制器的电动机控制装置、机械学习装置及其方法进行说明。然而,应当理解本发明并不限定于附图或以下说明的实施方式。
图1是实施例的机械学习装置的原理框图。以下,在不同的附图中赋予了相同参照符号的部件表示是具有相同功能的构成要素。
实施例的机械学习装置1学习与电动机控制装置中的磁通控制器的增益以及磁通推定器的时间常数相关联的条件。
机械学习装置1具备状态观测部11和学习部12。
作为训练数据集,状态观测部11观测由与电动机的加速度相关的数据、与电动机的加加速度相关的数据、与电动机的加速时间相关的数据中的至少1个构成的状态变量。
学习部12按照根据状态变量构成的训练数据集,学习磁通控制器的增益以及磁通推定器的时间常数。另外,只要从多个电动机控制装置取得训练数据集即可,在该情况下,学习部12按照针对多个电动机控制装置取得的训练数据集,学习磁通控制器的增益以及磁通推定器的时间常数。
图2是表示实施例的机械学习方法的动作原理的流程图。学习与电动机控制装置中的磁通控制器的增益以及磁通推定器的时间常数相关联的条件的机械学习方法具备状态观察步骤S101和机械学习步骤S102。
状态观察步骤S101由状态观测部11执行,即观测由与电动机的加速度相关的数据、与电动机的加加速度相关的数据、与电动机的加速时间相关的数据中的至少1个构成的状态变量。
机械学习步骤S102由学习部12执行,按照由状态变量构成的训练数据集,学习与磁通控制器的增益以及磁通推定器的时间常数相关的条件。
学习部12使用的学习算法可以是任意的。作为一例,对应用强化学习(Reinforcement Learning)的情况进行说明。强化学习是某环境内的智能体(行动主体)观测当前状态,决定应采取的行动的学习。智能体选择行动,由此根据环境获得回报,通过一连串的行动学习能够获得最多回报的对策。作为强化学习的代表性方法,已知Q学习(Q-learning)、TD学习(TD-learning)。例如,在Q学习的情况下,用式1表示行动价值函数Q(s,a)的一般的更新式(行动价值表)。
在式1中,st表示时刻t的环境,at表示时刻t的行动。通过行动at,环境变为st+1。rt+1表示根据环境的变化得到的回报(reward),γ表示折扣率,α表示学习系数。在应用Q学习的情况下,磁通控制器的增益以及磁通推定器的时间常数成为行动at
图3是实施例的使用强化学习的机械学习装置的原理框图。学习部12具备回报计算部21和函数更新部22。回报计算部21根据状态变量计算回报。函数更新部22根据回报更新用于变更磁通控制器的增益以及磁通推定器的时间常数的函数。例如为Q学习的情况下,将由式1表示的行动价值函数Q(s,a)用作行动at即用于变更磁通控制器的增益以及磁通推定器的时间常数的函数。另外,对于除此以外的电路结构要素与图1所示的电路结构要素相同,因此对相同的电路构成要素赋予相同符号,并省略对该电路构成要素的详细的说明。
图4是表示实施例的使用强化学习的机械学习方法的原理的流程图。
首先,在状态观察步骤S101中,状态观测部11观测由与电动机的加速度相关的数据、与电动机的加加速度相关的数据、与电动机的加速时间相关的数据中的至少一个构成的状态变量。
接着,在回报计算步骤S102-1中,回报计算部21根据在步骤S101中观测到的状态变量来计算回报。
接着,在函数更新步骤S102-2中,函数更新部22根据回报更新用于变更磁通控制器的增益以及磁通推定器的时间常数的函数。
接着,对具备上述机械学习装置的电动机控制装置进行说明。在此,作为一例说明作为学习部的学习算法而使用强化学习的情况。
图5是表示具备实施例的机械学习装置的电动机控制装置的原理框图。图6是表示图5的电动机控制装置内的电动机控制部的原理框图。此外,图7A是表示图6的电动机控制部内的磁通控制部的原理框图,表示磁通控制部。图7B是表示图6的电动机控制部内的磁通控制部的原理框图,表示磁通控制部内的磁通推定器。在此,说明对1个电动机104进行驱动控制的电动机控制装置1000。
作为电动机控制装置1000的主要电路结构具备整流器101、逆变器102以及DC链路电容器105。电动机控制装置1000的三相交流输入侧与交流电源103连接,电动机控制装置1000的交流电动机侧与三相电动机104连接。
整流器101将从交流电源103侧提供的交流电力变换为直流电力并输出到DC链路。在本发明中,并不对所使用的整流器101的实施方式进行特别限定,例如是二极管整流器或PWM控制方式的整流电路等。
逆变器102是与DC链路连接,将DC链路中的直流电力变换为交流电力并提供给电动机104的装置,但一般是可进行直交双方向变换的电力变换器。即,逆变器102能够在DC链路的直流电力与电动机104的驱动电力或作为再生电力的交流电力之间进行双方向的电力变换,按照从电动机控制部14接收到的电动机驱动指令,进行将直流电力变换为交流电力的再生动作(逆变换动作)以及将交流电力变换为直流电力的动力运行动作(整流动作)中的某一个。具体地,逆变器102根据从电动机控制部14接收到的电动机驱动指令,使内部开关元件进行开关动作,将从DC链路侧提供的直流电力变换为用于驱动电动机104的所希望的电压以及所希望的频率的三相交流电力。由此,电动机104根据所供给的电压可变以及频率可变的三相交流电力进行动作。此外,在电动机104减速时产生再生电力,但在该情况下,根据从电动机控制部14接收到的电动机驱动指令,将在电动机104产生的交流再生电力变换为直流电力后返回给DC链路。逆变器102例如由PWM逆变器等由开关元件和与之逆并联连接的二极管的电桥电路构成。
此外,作为电动机控制装置1000的控制系统以及测定系统具备参照图3和图4说明的使用强化学习的机械学习装置1、意图决定部13、电动机控制部14、速度指令输入部15、速度检测部31、加速度计算部32、加加速度计算部33以及加速时间测定部34。
速度检测部31检测电动机104的速度。
加速度计算部32根据速度检测部31检测出的速度计算电动机104的加速度。
加加速度计算部33根据加速度计算部32计算出的电动机的加速度计算加加速度。
加速时间测定部34测定电动机104的加速时间。
电动机控制部14具备速度控制部35和电流控制部36。电流控制部36内的磁通控制部42具备在加减速的过渡状态下,与电动机104的电路特性对应地进行适当的电流控制,用于产生与转矩指令对应的转矩的磁通控制器51和磁通推定器52。在后面叙述电动机控制部14的详细结构。
学习部12内的回报计算部21根据状态观测部11观测到的状态变量计算回报。
状态观测部11观测由与电动机104的加速度相关的数据、与电动机104的加加速度相关的数据、与电动机104的加速时间相关的数据中的至少一个构成的状态变量。将观测到的状态变量作为训练数据集用于学习部12的学习。通过加速度计算部32计算电动机104的加速度,通过加加速度计算部33计算电动机104的加加速度,通过加速时间测定部34测定电动机104的加速时间。
学习部12内的回报计算部21根据状态观测部11观测到的状态变量计算回报。
将与电动机的加速度相关的数据设为状态变量的情况下,在电动机104的加速期间或减速期间通过状态观测部11观测到的电动机104的加速度的极性发生变化时,回报计算部21减少回报。参照图8A和图8B,以提供阶梯状的速度指令的情况为例,说明在加速期间或减速期间电动机104的加速度的极性发生变化时减少回报的原因。图8A是说明回报计算部进行的回报计算处理的图,示例了提供阶梯状的速度指令时的理想速度波形。图8B是说明回报计算部进行的回报计算处理的图,示例了在最佳化前的磁通控制器51的增益下提供了阶梯状的速度指令时观测的速度波形。理想的是,对于图8A的点虚线所示那样的阶梯状的速度指令,向电动机控制部14提供时观测的速度波形为实线所示,然而,在磁通控制器51的增益没有最佳化的情况下,如图8B所示,在速度波形(图中用实线表示)中发生临时的减少。将这样的临时的速度的减少置换为加速度波形时,对应极性变化。这样,在电动机104的加速期间或减速期间加速度的极性变化时,表示磁通控制器51的增益没有被最佳化,因此在本实施例中减少回报。
将与电动机的加加速度相关的数据设为状态变量的情况下,在电动机104的加速期间或减速期间通过状态观测部11观测到的电动机104的加加速度的极性发生变化的次数为预定值以上时,回报计算部21减少回报。参照图9A和图9B,以提供阶梯状的速度指令的情况为例,说明在加速期间或减速期间电动机104的加加速度的极性发生变化的次数为预定值以上时减少回报的原因。图9A是说明回报计算部进行的回报计算处理的图,示例了提供阶梯状的速度指令时的理想速度波形。图9B是说明回报计算部进行的回报计算处理的图,示例了在最佳化前的磁通推定器52的时间常数下提供了阶梯状的速度指令时观测的速度波形。理想的是,对于图9A的点虚线所示那样的阶梯状的速度指令,用实线表示通过状态观测部11观测的速度波形,然而,磁通推定器52的时间常数没有最佳化的情况下,如图9B所示,发生速度波形(图中用实线表示)加速的程度(即,加加速度)变弱的所谓的“波动”(在图示的例子中为2次波动)。将这样的波动的发生置换为加加速度时,对应极性变化。因此,在本实施例中,在电动机104的加速期间或减速期间加加速度的极性变化的次数为预定值以上时减少回报。作业者可以任意地设定上述“预定值”,例如可以在发生了1次波动的情况下减少回报,或发生多次波动的情况下减少回报。
将与电动机的加速时间相关的数据设为状态变量的情况下,在电动机104的加速期间或减速期间通过状态观测部11观测到的电动机104的加速时间比在当前的加速期间或减速期间之前的加速期间或减速期间通过状态观测部11观测到的电动机的加速时间短时(即,加速时间变得更短时),回报计算部21增加回报。在这样的情况下增加回报是因为追随速度指令所需要的时间越短,使用的磁通控制器51的增益以及磁通推定器52的时间常数越接近最佳值。
学习部12内的函数更新部22根据通过回报计算部21计算出的回报,更新用于变更磁通控制器51的增益以及磁通推定器52的时间常数的函数。例如为Q学习的情况下,将用式1表示的行动价值函数Q(s,a)用作用于变更磁通控制器51的增益以及磁通推定器52的时间常数的函数。
意图决定部13根据学习部12按照训练数据集学习后的结果,响应当前的状态变量的输入,决定磁通控制器51的增益以及磁通推定器52的时间常数。在本实施例中,作为一例,作为学习算法而使用强化学习,因此根据通过学习部12内的回报计算部21计算出的回报,学习部12内的函数更新部22更新用于变更磁通控制器51的增益以及磁通推定器52的时间常数的函数,意图决定部13根据变更后的函数,选择得到最多回报的磁通控制器51的增益以及磁通推定器52的时间常数。
电动机控制部14根据意图决定部13决定的磁通控制器51的增益以及磁通推定器52的时间常数,使用从速度指令输入部15输入的速度指令、电动机104的动作程序、逆变器102的交流电动机侧的交流电流或交流电压和/或电动机104的转速等,作为用于控制电动机104的速度、转矩,或转子的位置的驱动指令,而对逆变器102指令将交流电力变换为直流电力的动力运行动作(整流动作)以及将直流电力变换为交流电力的再生动作(逆变换动作)中的某一个,电动机控制部14具备速度控制部35和电流控制部36。
电动机控制部14内的速度控制部35具备速度控制器41。速度控制器41根据从速度指令输入部15输入的速度指令和从速度检测部31反馈的电动机104的速度,生成转矩指令。速度控制器41例如使用PI控制来生成转矩指令。
电动机控制部14内的电流控制部36具备磁通控制部42、励磁电流控制器43、两相三相变换器44、转矩电流指令发生器45、转矩电流控制器46。
如图7A所示,磁通控制部42具有用于产生基于转矩指令的转矩的磁通控制器51、磁通推定器52、磁通指令发生部53,根据转矩指令生成励磁电流指令。
磁通控制部42内的磁通指令发生部53根据从速度控制器41输入的转矩指令生成磁通指令。
磁通控制部42内的磁通控制器51根据通过磁通指令发生部53生成的磁通指令和通过磁通推定器52的推定处理生成的磁通推定值来生成励磁电流指令。磁通控制器51例如由PI控制器构成,通过意图决定部13决定其增益。
磁通控制部42内的磁通推定器52根据由磁通控制器51生成的励磁电流指令计算出磁通推定值。通过意图决定部13决定磁通推定器52的时间常数。如图7B所示,磁通推定器52具备滤波器增益61和延迟电路62。通过磁通推定器52的时间常数和控制周期来决定滤波器增益61的值。
励磁电流控制器43根据通过磁通控制部42生成的励磁电流指令和经由电流传感器(未图示)检测出的电动机104的励磁电流,来生成励磁控制用电压指令。励磁电流控制器43例如使用PI控制来生成励磁控制用电压指令。
转矩电流指令发生器45根据转矩指令生成转矩电流指令。
转矩电流控制器46根据通过转矩电流指令发生器45生成的转矩电流指令和经由电流传感器(未图示)检测出的电动机104的转矩电流,来生成转矩控制用电压指令。转矩电流控制器46例如使用PI控制来生成转矩控制用电压指令。
两相三相变换器44将通过励磁电流控制器43生成励磁控制用电压指令和通过转矩电流控制器46生成的转矩控制用电压指令变换为三相的电压指令。将这样得到的三相的电压指令用作用于控制逆变器102内的开关元件的指令。此外,两相三相变换器44将向电动机104流过的三相电流变换为两相电流(即,d轴电流和q轴电流)。这样得到的励磁电流和转矩电流分别流入到励磁电流控制器43和转矩电流控制器46。
图10是表示实施例的使用强化学习的机械学习装置的动作流程的流程图。
一般,在强化学习中随机选择行动的初始值。在本实施例中,在步骤S201中,随机选择作为行动的磁通控制器51的增益以及磁通推定器52的时间常数。
在步骤S202中,电动机控制部14根据所设定的磁通控制器51的增益以及磁通推定器52的时间常数,使用从速度指令输入部15输入的速度指令、电动机104的动作程序、逆变器102的交流电动机侧的交流电流或交流电压和/或电动机104的转速等,作为用于控制电动机104的速度、转矩,或转子的位置的驱动指令,而对逆变器102指令将交流电力变换为直流电力的动力运行动作(整流动作)以及将直流电力变换为交流电力的再生动作(逆变换动作)中的某一个。由此,电动机104进行驱动。在该期间,速度检测部31检测出电动机104的速度,加速度计算部32根据速度检测部31检测出的速度计算电动机104的加速度,加加速度计算部33根据加速度计算部32计算出的电动机的加速度计算加加速度,加速时间测定部34测定电动机104的加速时间。
在步骤S203中,状态观测部11观测由与电动机104的加速度相关的数据、与电动机104的加加速度相关的数据、与电动机104的加速时间相关的数据中的至少一个构成的状态变量。另外,在本实施例中,作为一例以这3个数据为状态变量,但只要将这3个数据中的至少一个设为状态变量即可。
在步骤S204中,状态观测部11根据与电动机的加速度相关的数据,判别在电动机104的加速期间或减速期间通过状态观测部11观测到的电动机104的加速度的极性是否发生变化。在通过状态观测部11观测到电动机104的加速度的极性发生变化时,在步骤S207回报计算部21减少回报。另一方面,在通过状态观测部11未观测到电动机104的加速度的极性发生变化时,向步骤S205前进。
在步骤S205中,状态观测部11根据与电动机的加加速度相关的数据,判别在电动机104的加速期间或减速期间通过状态观测部11观测到的电动机104的加加速度的极性发生变化的次数是否为预定值以上。在通过状态观测部11观测到电动机104的加加速度的极性发生变化的次数为预定值以时,在步骤S207中回报计算部21减少回报。另一方面,在电动机104的加加速度的极性发生变化的次数不到预定值时,向步骤S206前进。
在步骤S206中,状态观测部11根据与电动机的加速时间相关的数据,判别在电动机104的加速期间或减速期间通过状态观测部11观测到的电动机104的加速时间是否比在当前的加速期间或减速期间之前的加速期间或减速期间通过状态观测部11观测到的电动机的加速时间短(即,加速时间更短)。在通过状态观测部11判定为加速时间变得更短时,在步骤S208中回报计算部21增加回报。另一方面,在没有判定为加速时间变得更短时,向步骤S209前进。
另外,也可以变换顺序地执行S204~S206的处理。
在步骤S209中,函数更新部22根据通过回报计算部21计算出的回报,更新用于变更磁通控制器51的增益以及磁通推定器52的时间常数的函数。
接着,在步骤S210中,意图决定部13根据在步骤S209中更新后的函数,选择得到的回报最多的磁通控制器51的增益以及磁通推定器52的时间常数。之后,返回到步骤S202,以后,重复执行步骤S202~S210的处理。由此,机械学习装置1学习能够最佳的磁通控制器51的增益以及磁通推定器52的时间常数。另外,可以从多个整流器101取得训练数据集,在该情况下,学习部12按照针对多个整流器101取得的训练数据集,重复执行步骤S201~S210的处理,学习磁通控制器51的增益以及磁通推定器52的时间常数。若针对多个整流器101取得训练数据集,则机械学习装置1的学习精度提高。
另外,上述的状态观测部11、学习部12以及意图决定部13例如可以以软件程序形式构筑,或通过各种电子电路和软件程序的组合来构筑。例如,通过软件程序形式构筑上述各部的情况下,使电动机控制装置1000内的运算处理装置按照该软件程序动作,由此实现上述各部的功能。此外,或者也可以将具备状态观测部11和学习部12的机械学习装置1作为写入了用于实现各部的功能的软件程序的半导体集成电路来实现。此外,或者也可以以包含具备状态观测部11和学习部12的机械学习装置1以及意图决定部13的形式,实现写入了用于实现各部的功能的软件程序的半导体集成电路。
此外,电动机控制装置1000使用通过为了电动机的驱动控制而本来具备的速度检测部32测定的与电动机的转速相关的数据来执行机械学习处理,因此不需要如现有技术那样设置新的硬件装置,从而也能够采用以后安装的方式应用于已有的电动机控制装置中。在该情况下,将写入了实现机械学习装置1、意图决定部13的各部的功能的软件程序的半导体集成电路组入到该已有电动机控制装置中,或将实现机械学习装置1、意图决定部13的各部的功能的软件程序其本身追加安装到该已有电动机控制装置内的运算处理装置中即可。此外,关于某电动机控制装置,将学习了磁通控制器51的增益以及磁通推定器52的时间常数的机械学习装置1安装在与之不同的其他电动机控制装置,关于该其他电动机控制装置,重新学习并更新磁通控制器51的增益以及磁通推定器52的时间常数即可。
通过本发明,能够实现自动地进行磁通控制器的增益以及磁通推定器的时间常数的最佳化的电动机控制装置、用于该电动机控制装置的机械学习装置及其方法。
通过本发明,在电动机控制装置动作的状态下,机械学习装置不需要自学并调整磁通控制器的增益以及磁通推定器的时间常数成为最佳化的、作业者进行的参数调整作业,因此能够削减用于参数调整的时间。

Claims (8)

1.一种机械学习装置,学习电动机控制装置中的磁通控制器的增益以及磁通推定器的时间常数,该机械学习装置的特征在于,具备:
状态观测部,其观测由与电动机的加速度相关的数据、与电动机的加加速度相关的数据、与电动机的加速时间相关的数据中的至少一个构成的状态变量;以及
学习部,其按照由上述状态变量构成的训练数据集,学习上述磁通控制器的增益以及上述磁通推定器的时间常数;
其中,上述学习部具备:
回报计算部,其根据上述状态变量计算回报;以及
函数更新部,其根据上述回报,更新用于变更上述磁通控制器的增益以及上述磁通推定器的时间常数的函数。
2.根据权利要求1所述的机械学习装置,其特征在于,
在电动机的加速期间或减速期间通过上述状态观测部观测到的电动机的加速度的极性发生变化时,上述回报计算部减少回报。
3.根据权利要求1所述的机械学习装置,其特征在于,
在电动机的加速期间或减速期间通过上述状态观测部观测到的电动机的加加速度的极性发生变化的次数为预定值以上时,上述回报计算部减少回报。
4.根据权利要求1所述的机械学习装置,其特征在于,
在电动机的加速期间或减速期间通过上述状态观测部观测到的电动机的加速时间比在当前的上述加速期间或上述减速期间之前的加速期间或减速期间通过上述状态观测部观测到的电动机的加速时间短时,上述回报计算部增加回报。
5.根据权利要求1至4中任一项所述的机械学习装置,其特征在于,
上述学习部构成为,按照针对多个电动机控制装置取得的上述训练数据集,学习上述磁通控制器的增益以及上述磁通推定器的时间常数。
6.一种电动机控制装置,具备权利要求1至5中任一项所述的机械学习装置,该电动机控制装置的特征在于,还具备:
电动机控制部,其具有上述磁通控制器和上述磁通推定器;
速度检测部,其检测电动机的速度;
加速度计算部,其根据由上述速度检测部检测出的电动机的速度计算加速度;
加加速度计算部,其根据由上述加速度计算部计算出的电动机的加速度计算加加速度;
加速时间测定部,其测定电动机的加速时间;以及
意图决定部,其根据上述学习部按照上述训练数据集学习后的结果,响应当前的上述状态变量的输入,决定上述磁通控制器的增益以及上述磁通推定器的时间常数。
7.根据权利要求6所述的电动机控制装置,其特征在于,
上述学习部构成为,按照由当前的上述状态变量构成的追加的训练数据集,重新学习并更新上述磁通控制器的增益以及上述磁通推定器的时间常数。
8.一种机械学习方法,学习电动机控制装置中的磁通控制器的增益以及磁通推定器的时间常数,该机械学习方法的特征在于,具备如下的步骤:
状态观测步骤,观测由与电动机的加速度相关的数据、与电动机的加加速度相关的数据、与电动机的加速时间相关的数据中的至少一个构成的状态变量;以及
学习步骤,按照由上述状态变量构成的训练数据集,学习上述磁通控制器的增益以及上述磁通推定器的时间常数;
其中,上述学习步骤包括:
回报计算步骤,根据上述状态变量计算回报;以及
函数更新步骤,根据上述回报,更新用于变更上述磁通控制器的增益以及上述磁通推定器的时间常数的函数。
CN201610605039.5A 2015-07-31 2016-07-27 电动机控制装置、机械学习装置及其方法 Active CN106411210B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015152469A JP6140225B2 (ja) 2015-07-31 2015-07-31 磁束制御器を有するモータ制御装置、ならびに機械学習装置およびその方法
JP2015-152469 2015-07-31

Publications (2)

Publication Number Publication Date
CN106411210A CN106411210A (zh) 2017-02-15
CN106411210B true CN106411210B (zh) 2018-09-11

Family

ID=57795725

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610605039.5A Active CN106411210B (zh) 2015-07-31 2016-07-27 电动机控制装置、机械学习装置及其方法

Country Status (4)

Country Link
US (1) US9977411B2 (zh)
JP (1) JP6140225B2 (zh)
CN (1) CN106411210B (zh)
DE (1) DE102016009031A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018126796A (ja) * 2017-02-06 2018-08-16 セイコーエプソン株式会社 制御装置、ロボットおよびロボットシステム
JP6546213B2 (ja) * 2017-04-13 2019-07-17 ファナック株式会社 回路構成最適化装置及び機械学習装置
JP6572265B2 (ja) * 2017-06-30 2019-09-04 ファナック株式会社 制御装置及び機械学習装置
KR20190038070A (ko) * 2017-09-29 2019-04-08 삼성전자주식회사 반도체 장치의 제조 시스템 및 반도체 장치의 제조 방법
JP6740263B2 (ja) * 2018-02-08 2020-08-12 ファナック株式会社 機械学習装置、サーボモータ制御装置、サーボモータ制御システム、及び機械学習方法
CN112335169B (zh) * 2018-06-21 2022-04-12 三菱电机株式会社 同步旋转机的控制装置及机器学习装置
JP2020116869A (ja) 2019-01-25 2020-08-06 セイコーエプソン株式会社 印刷装置、学習装置、学習方法および学習プログラム
WO2020194685A1 (ja) * 2019-03-28 2020-10-01 三菱電機株式会社 数値制御装置および機械学習装置
WO2020261764A1 (ja) * 2019-06-28 2020-12-30 パナソニックIpマネジメント株式会社 インパクト工具

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1431769A (zh) * 2003-02-20 2003-07-23 东南大学 感应电机的神经网络逆控制变频器及构造方法
JP2007164406A (ja) * 2005-12-13 2007-06-28 Oita Univ 学習機構付意思決定システム
CN102299681A (zh) * 2010-06-25 2011-12-28 株式会社日立制作所 电动机系统、电力变换装置及电力变换装置的控制方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6646412B2 (en) * 2002-02-11 2003-11-11 Ford Global Technologies, Llc Method and system for controlling torque in a powertrain that includes an induction motor
KR100809170B1 (ko) 2004-05-14 2008-03-03 미쓰비시덴키 가부시키가이샤 동기기 제어 장치
US8203304B2 (en) * 2007-08-31 2012-06-19 Rockwell Automation Technologies, Inc. Control method and system with feedback indicative of load flux
ES2655303T3 (es) * 2009-03-26 2018-02-19 Mitsubishi Electric Corporation Controlador para máquina rotatoria de CA
JP5713850B2 (ja) 2011-09-20 2015-05-07 三菱電機株式会社 モータ制御装置
JP5084973B1 (ja) * 2011-10-17 2012-11-28 三菱電機株式会社 モータ制御装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1431769A (zh) * 2003-02-20 2003-07-23 东南大学 感应电机的神经网络逆控制变频器及构造方法
JP2007164406A (ja) * 2005-12-13 2007-06-28 Oita Univ 学習機構付意思決定システム
CN102299681A (zh) * 2010-06-25 2011-12-28 株式会社日立制作所 电动机系统、电力变换装置及电力变换装置的控制方法

Also Published As

Publication number Publication date
US9977411B2 (en) 2018-05-22
US20170031331A1 (en) 2017-02-02
JP6140225B2 (ja) 2017-05-31
DE102016009031A1 (de) 2017-02-02
JP2017034845A (ja) 2017-02-09
CN106411210A (zh) 2017-02-15

Similar Documents

Publication Publication Date Title
CN106411210B (zh) 电动机控制装置、机械学习装置及其方法
US9768716B2 (en) Motor control apparatus provided with magnetic flux control unit, and machine learning apparatus and method thereof
CN106411225B (zh) 电动机控制装置、机械学习装置及其方法
US10090791B2 (en) Machine learning apparatus and method for learning correction value in motor current control, correction value computation apparatus including machine learning apparatus and motor driving apparatus
US20210328537A1 (en) AC Electric Motor Control Device
CN102957366B (zh) 永磁同步电机控制方法和装置以及空调设备
US10135255B2 (en) Motor control apparatus in which power regeneration are adjusted, controller for converter, machine learning apparatus and method thereof
US10353014B2 (en) Watchdog scheme for monitoring a power electronic inverter and determining a manner of operating a load
CN103812412B (zh) 用于估算感应电动机中参数的装置
DE112014006685T5 (de) Elektromotorsteuervorrichtung
US9581649B2 (en) Method and apparatus for load fault detection
CN108880367B (zh) 用于识别电动机的转子的电阻的方法
US10216151B2 (en) Power consumption-amount estimation apparatus
JP5674844B2 (ja) Pwm信号のデューティ比検出回路及び方法
Bazzi et al. A survey of real-time power-loss minimizers for induction motors
CN103580572B (zh) 恒功率控制方法、装置及恒功率牵引驱动系统
CN105322863A (zh) 电动机驱动装置
CN105281633A (zh) 变频器自动辨识异步电机转子时间常数的方法
Jabłoński et al. Industrial implementations of control algorithms for voltage inverters supplying induction motors
CN107528517B (zh) 旋转电机的控制方法
Karlovský et al. Improvement of induction motor drive performance using predictive control method instead of DTC method
Kroics et al. Practical method for experimental detection of DC motor inertia to design a speed regulator
JP2020010433A (ja) モータ制御装置
RU2524507C1 (ru) Устройство векторного управления скоростью асинхронного двигателя
JP5871981B2 (ja) パワーアンプ

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant