JP7118249B2 - motor controller - Google Patents
motor controller Download PDFInfo
- Publication number
- JP7118249B2 JP7118249B2 JP2021514690A JP2021514690A JP7118249B2 JP 7118249 B2 JP7118249 B2 JP 7118249B2 JP 2021514690 A JP2021514690 A JP 2021514690A JP 2021514690 A JP2021514690 A JP 2021514690A JP 7118249 B2 JP7118249 B2 JP 7118249B2
- Authority
- JP
- Japan
- Prior art keywords
- torque
- machine learning
- motor
- control device
- motor control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02P—CONTROL OR REGULATION OF ELECTRIC MOTORS, ELECTRIC GENERATORS OR DYNAMO-ELECTRIC CONVERTERS; CONTROLLING TRANSFORMERS, REACTORS OR CHOKE COILS
- H02P23/00—Arrangements or methods for the control of AC motors characterised by a control method other than vector control
- H02P23/0004—Control strategies in general, e.g. linear type, e.g. P, PI, PID, using robust control
- H02P23/0018—Control strategies in general, e.g. linear type, e.g. P, PI, PID, using robust control using neural networks
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02P—CONTROL OR REGULATION OF ELECTRIC MOTORS, ELECTRIC GENERATORS OR DYNAMO-ELECTRIC CONVERTERS; CONTROLLING TRANSFORMERS, REACTORS OR CHOKE COILS
- H02P2205/00—Indexing scheme relating to controlling arrangements characterised by the control loops
- H02P2205/05—Torque loop, i.e. comparison of the motor torque with a torque reference
Description
本発明は、制御対象を模したモデルを生成するモータ制御装置に関する。 The present invention relates to a motor control device that generates a model imitating a controlled object.
ロボット、工作機械などをはじめとした制御対象の機械を制御するモータ制御装置に対して、高速かつ高精度な制御手法および故障検知手法が求められている。これらの性能向上には、制御対象を正確に模したモデルが必要不可欠である。しかしながら、実際のモータ制御装置の動作においては、制御対象における配線、エンドエフェクタなどの取り付けによる質量、重心位置、慣性テンソルといった物理モデルパラメータの誤差が無視できず、また、振動、摩擦などモータ速度に対して非線形な成分も多く含まれる。そのため、予めこれらを高精度に再現可能なモデルを与えることは困難であった。 High-speed and high-precision control methods and failure detection methods are required for motor control devices that control machines to be controlled, such as robots and machine tools. For these performance improvements, a model that accurately simulates the controlled object is essential. However, in the actual operation of a motor control device, errors in physical model parameters such as mass, center of gravity position, and inertia tensor due to wiring in the controlled object, attachment of end effectors, etc. cannot be ignored. On the other hand, many nonlinear components are also included. Therefore, it has been difficult to provide a model capable of reproducing these with high accuracy in advance.
近年、このようなモデルにおける力およびトルクの推定誤差を抑制するための制御方式が提案されている。例えば、特許文献1には、電動機の制御装置が、M系列または正弦波状の指令を取得し、トルク推定誤差が最小となるように、慣性テンソル、摩擦係数、およびばね定数をサンプリング周期毎に修正することにより、物理モデルパラメータの初期値に含まれる誤差を動作中に修正する技術が開示されている。
In recent years, control methods have been proposed for suppressing force and torque estimation errors in such models. For example, in
しかしながら、特許文献1に記載の技術では、電動機の制御装置の運動が、慣性テンソル、摩擦、およびばねからのトルクでモデル化できると仮定されており、モデルとして考慮されていない外乱が表現できない、という問題があった。また、摩擦のモデルについても簡略化されているため、ストライベック効果、ヒステリシスなどといった非線形性の強い複雑な現象に対する表現能力を持たない、という問題があった。
However, in the technique described in
本発明は、上記に鑑みてなされたものであって、トルク推定精度および汎化性能を向上したモデルを学習し、異常を検知する速度および精度を向上可能なモータ制御装置を得ることを目的とする。 SUMMARY OF THE INVENTION It is an object of the present invention to provide a motor control device capable of learning a model with improved torque estimation accuracy and generalization performance and improving the speed and accuracy of abnormality detection. do.
上述した課題を解決し、目的を達成するために、本発明は、対象機械を駆動するモータを制御するモータ制御装置である。モータ制御装置は、モータの状態を観測し観測結果をモータ状態信号として出力するモータ状態観測部と、モータ状態信号および対象機械の物理モデルパラメータに基づき、運動方程式を用いてモータのトルクの推定値である第一の推定トルクと第一の推定トルクの成分である物理状態変数とを出力する第一のトルク推定部と、モータ状態信号に含まれる実トルクと第一の推定トルクとの差分を低減するよう物理モデルパラメータを学習し記憶する物理モデル記憶部と、第一の推定トルク、物理状態変数、およびモータ状態信号のうち少なくとも一つから特徴量を生成し出力する特徴量生成部と、を備える。また、モータ制御装置は、入出力関係に自己回帰項を含む機械学習を用いて特徴量および機械学習モデルパラメータから機械学習補正量を算出し、算出した機械学習補正量を第一の推定トルクに加算して第二の推定トルクを出力する第二のトルク推定部と、機械学習補正量が実トルクと第一の推定トルクとの差分に近づくように機械学習モデルパラメータを教師あり学習により学習し、学習した機械学習モデルパラメータを記憶する機械学習モデル記憶部と、を備えることを特徴とする。 In order to solve the above-described problems and achieve the object, the present invention is a motor control device for controlling a motor that drives a target machine. The motor control device includes a motor state observation unit that observes the state of the motor and outputs the observation result as a motor state signal, and an estimated value of the torque of the motor using the equation of motion based on the motor state signal and the physical model parameters of the target machine. A first torque estimator that outputs a first estimated torque and a physical state variable that is a component of the first estimated torque, and a difference between the actual torque and the first estimated torque included in the motor state signal a physical model storage unit that learns and stores physical model parameters to be reduced; a feature amount generation unit that generates and outputs a feature amount from at least one of the first estimated torque, the physical state variable, and the motor state signal; Prepare. Further, the motor control device calculates a machine learning correction amount from the feature amount and the machine learning model parameters using machine learning including an autoregressive term in the input/output relationship, and applies the calculated machine learning correction amount to the first estimated torque. A second torque estimator that outputs a second estimated torque by addition, and a machine learning model parameter learned by supervised learning so that the machine learning correction amount approaches the difference between the actual torque and the first estimated torque. and a machine learning model storage unit that stores learned machine learning model parameters.
本発明によれば、モータ制御装置は、トルク推定精度および汎化性能を向上したモデルを学習し、異常を検知する速度および精度を向上できる、という効果を奏する。 Advantageous Effects of Invention According to the present invention, a motor control device can learn a model with improved torque estimation accuracy and generalization performance, and can improve the speed and accuracy of abnormality detection.
以下に、本発明の実施の形態に係るモータ制御装置を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。 A motor control device according to an embodiment of the present invention will be described in detail below with reference to the drawings. In addition, this invention is not limited by this embodiment.
実施の形態.
図1は、本発明の実施の形態に係るモータ制御装置100の構成例を示すブロック図である。モータ制御装置100は、対象機械10を駆動するモータを制御する。モータ制御装置100は、モータ状態観測部1と、物理モデル計算部2と、特徴量生成部3と、機械学習モデル計算部4と、を備える。物理モデル計算部2は、第一のトルク推定部21と、物理モデル記憶部22と、を備える。機械学習モデル計算部4は、第二のトルク推定部41と、機械学習モデル記憶部42と、を備える。Embodiment.
FIG. 1 is a block diagram showing a configuration example of a
モータ制御装置100が制御対象とする対象機械10について説明する。図2は、本実施の形態に係るモータ制御装置100が制御対象とする対象機械10を示す模式図である。ここでは、対象機械10として、水平多関節ロボットを例にして説明する。対象機械10である水平多関節ロボットは、第1軸11jと、第2軸12jと、第3軸13jと、第4軸14jと、第1リンク11lと、第2リンク12lと、第3リンク13lと、第4リンク14lと、手先部15eと、から構成されている。モータ制御装置100は、第1軸11jに搭載されたアクチュエータによって第2リンク12lを駆動し、第2軸12jに搭載されたアクチュエータによって第3リンク13lを駆動し、第3軸13jおよび第4軸14jに搭載されたアクチュエータによって第4リンク14lを駆動することで、水平多関節ロボットの手先部15eの位置および向きを制御することができる。ここで、第3軸13jは第4リンク14lの手先部15e方向に対する軸回りの回転運動に対応し、第4軸14jは第4リンク14lの手先部15e方向に対する並進運動に対応している。
A
本実施の形態では、対象機械10として水平多関節ロボットを例示したがこれに限定されず、モータ制御装置100は、モータによって駆動される対象機械10について広く適用することができる。対象機械10の例としては、さらに、垂直多関節ロボット、NC(Numerical Control)工作機械、実装機などを挙げることができる。
In the present embodiment, a horizontal articulated robot is exemplified as the
モータ状態観測部1は、対象機械10を駆動するモータの状態を観測し、観測結果をモータ状態信号として出力する。具体的には、モータ状態観測部1は、第1軸11jと、第2軸12jと、第3軸13jと、第4軸14jと、に対応する各アクチュエータの位置、速度、加速度の少なくともいずれか一つと、前述のモータのトルクである実トルクとをモータ状態信号として出力する。ここで、実トルクについては、直接センサから計測した値であってもよいし、アクチュエータから取得された入力電流値の換算値を用いてもよい。また、モータ状態信号は、各アクチュエータの位置、速度、加速度、および実トルクの信号のみに限定されない。モータ状態信号は、ロボットの各軸または規定された個所に設けられた内界センサもしくは外界センサのセンシングデータ、例えば、各軸のアクチュエータの温度データ、手先の力覚センサの取得データ、赤外線センサ、超音波センサなどのセンサから得られた距離データ、ビジョンセンサから得られた動画像データ、およびそれらを画像処理して得られた特徴量データ、などの値を含んでもよい。
The motor
第一のトルク推定部21は、モータ状態信号と、物理モデル記憶部22の出力である後述する物理モデルパラメータとを入力として、前述のモータのトルクである実トルクの推定値である第一の推定トルクを運動方程式により算出する。すなわち、第一のトルク推定部21は、モータ状態信号および対象機械10の物理モデルパラメータに基づき、運動方程式を用いてモータのトルクの推定値である第一の推定トルクを推定する。第一のトルク推定部21は、第一の推定トルクと、第一の推定トルクの成分である物理状態変数とを出力する。物理状態変数には、慣性項、遠心力の項、コリオリ力の項、重力項だけでなく、クーロン摩擦の項、粘性摩擦の項、アームの振動の項、弾性たわみの項に加えて、後述する非線形摩擦モデルのような、第一の推定トルクを算出する上で何らかの物理現象を模擬して導入された関数の項が含まれてもよい。物理状態変数に摩擦推定値を含むことにより、モータ制御装置100は、摩擦モデルの不確かさおよび実トルクの摩擦成分に対する摩擦推定値の誤差を、後述する機械学習モデル計算部4で補正することを可能にする。
The first torque estimating unit 21 receives the motor state signal and the physical model parameters described later, which are the outputs of the physical model storage unit 22, and calculates the first torque, which is the estimated value of the actual torque, which is the torque of the motor. Estimated torque is calculated by the equation of motion. That is, the first torque estimator 21 estimates the first estimated torque, which is the estimated torque of the motor, using the equation of motion based on the motor state signal and the physical model parameters of the
運動方程式において用いられるモータ状態信号および物理モデルパラメータは、それぞれ、各アクチュエータの位置、速度、加速度と、各リンクの質量、重心位置、慣性テンソルとに対応している。すなわち、物理モデルパラメータには、対象機械10のリンク機構における質量、対象機械10のリンク機構における重心位置、および対象機械10のリンク機構における慣性テンソルが含まれる。これにより、モータ制御装置100は、対象機械10の既知の機構に関する情報を利用する逆動力学において、係数の質量、重心位置、慣性テンソルを物理モデルパラメータとして学習し実トルクに対する第一の推定トルクの推定精度を向上させることができる。また、モータ制御装置100は、後述する機械学習モデル計算部4における補正値が相対的に小さくなり、第二の推定トルクの汎化性能を向上させることができる。ここで、運動方程式としては、例えば、ニュートンオイラー法、ラグランジュの運動方程式などを用いることができる。
The motor state signals and physical model parameters used in the equations of motion correspond to the position, velocity and acceleration of each actuator and the mass, center of gravity position and inertia tensor of each link, respectively. That is, the physical model parameters include the mass of the link mechanism of the
第一のトルク推定部21は、モータ状態信号により求まるモータの速度を入力として、トルクの摩擦成分の推定値を出力する連続かつ滑らかな摩擦モデルを含む運動方程式を用いる。後述するように機械学習モデル計算部4がニューラルネットワークを用いるが、ニューラルネットワークが計算できるのは入力に対して連続な関数であるため、特徴量および特徴量生成部3への入力は連続であることが望ましい。そのため、モータ制御装置100は、速度ゼロ近傍も含めて連続となる摩擦モデルを定義することで、物理モデル記憶部22内で学習しきれない摩擦成分についてもニューラルネットワークを用いて学習および補正することが可能となる。
The first torque estimator 21 uses an equation of motion including a continuous and smooth friction model that outputs an estimated value of the frictional component of the torque with the speed of the motor obtained from the motor state signal as input. As will be described later, the machine learning
物理モデル記憶部22は、対象機械10を一定期間動作させた際のモータ状態信号を教師データとし、モータ状態信号に含まれる実トルクと第一の推定トルクとの差分を低減するよう物理モデルパラメータを学習する。物理モデル記憶部22は、学習した物理モデルパラメータを記憶する。モータ制御装置100は、物理モデルパラメータを学習することで、センサ、配線類の取り付け、加工誤差、組み立て誤差などによる物性の変化を補正し、実トルクの推定精度を向上させることができる。また、一般的に、物理モデルパラメータは、諸元表、CAD(Computer Aided Design)データなどからおおよその値が算出可能であるため、これらの値を学習時の初期値として与えることにより学習の速度、収束性などを向上させることが可能である。ただし、これらの値が未知もしくは算出が困難な場合は、任意の定数で初期化してもよい。
The physical model storage unit 22 uses the motor state signal obtained when the
物理モデル記憶部22での物理モデルパラメータの学習には、上述の運動方程式を変形し、物理モデルパラメータのみを分離した優決定系の線形方程式を用いる。ニュートンの運動方程式、オイラーの運動方程式、およびラグランジュの運動方程式は、いずれも位置、速度、加速度に対して非線形な項を考慮しない場合、質量、重心位置、慣性テンソルからなる定数係数と、位置、速度、加速度からなる変数との積の線形結合で表現できる。すなわち、実トルクに対する動力学計算の誤差をΔfとおくと、各軸の運動方程式は、質量、重心位置、慣性テンソルからなる物理モデルパラメータw、および速度vと加速度aからなる係数行列A(v,a)を用いて式(1)のように変数分離した形で記述できる。 For the learning of the physical model parameters in the physical model storage unit 22, linear equations of an overdetermined system obtained by transforming the above equation of motion and separating only the physical model parameters are used. Newton's equations of motion, Euler's equations of motion, and Lagrangian's equations of motion, when none of the nonlinear terms for position, velocity, and acceleration are considered, have constant coefficients consisting of mass, center of gravity position, and inertia tensor, position, It can be expressed as a linear combination of products with variables consisting of velocity and acceleration. That is, if the error in the dynamics calculation with respect to the actual torque is Δf, the equation of motion for each axis consists of the physical model parameter w consisting of the mass, the position of the center of gravity, and the inertia tensor, and the coefficient matrix A (v , a) can be used to describe in a variable-separated form as shown in Equation (1).
Δf=A(v,a)w …(1) Δf=A(v,a)w (1)
よって、物理モデル記憶部22は、式(1)を最小二乗法により軸毎にwについて解くことで、各軸の物理モデルパラメータを算出できる。また、物理モデル記憶部22は、駆動軸が直列に接続されている産業用ロボットのような軸間干渉の生じうる駆動機械に対しては、各軸のwに関する式(1)を1つの線形方程式にまとめて同時に解くことにより、物理モデル計算部2全体としてより尤もらしい解を得ることができる。物理モデル記憶部22は、物理モデルパラメータwの同定手法に関して、最小二乗法以外にも正則化最小二乗法、カルマンフィルタに加えて、ベイズ推定、遺伝的アルゴリズム、ニューラルネットワークなどを用いてもよい。
Therefore, the physical model storage unit 22 can calculate the physical model parameter of each axis by solving the equation (1) for w for each axis by the least squares method. In addition, the physical model storage unit 22 converts the equation (1) regarding w of each axis into one linear By summarizing the equations and solving them simultaneously, a more plausible solution can be obtained for the physical
なお、物理モデル記憶部22は、運動方程式において摩擦の影響を考慮する際、次に示すクーロン摩擦および粘性摩擦からなる摩擦モデルである線形摩擦モデルなど、速度の関数と摩擦係数との線形結合で表現される摩擦係数が分離可能な式で摩擦を表現することで、摩擦係数についても式(1)と同様に物理モデルパラメータとして同時に推定が可能となる。物理モデル記憶部22で推定される摩擦係数を式(2)で示す。なお、イメージで取り込まれる式(2)および後述の式(3)ではqiの上部にドットが付与されているが、これを説明部分で表現できない。そのため、説明部分では、qiの上部にドットが付与されているものを単にqiと表記する。In addition, when considering the effect of friction in the equation of motion, the physical model storage unit 22 stores a linear combination of a function of velocity and a friction coefficient, such as a linear friction model that is a friction model consisting of Coulomb friction and viscous friction shown below. By expressing the friction with a separable equation, the friction coefficient can be simultaneously estimated as a physical model parameter in the same manner as the equation (1). The coefficient of friction estimated by the physical model storage unit 22 is expressed by Equation (2). In equation (2), which is captured as an image, and equation (3), which will be described later, a dot is added above q i , but this cannot be expressed in the description. Therefore, in the explanation part, q i with a dot above it is simply written as q i .
ここで、速度qiで動作する軸iの摩擦モデルFiに対して、rFC,iはクーロン摩擦係数、rFV,iは粘性摩擦係数である。ただし、産業用ロボットをはじめとする多軸機構の動作においては、粘性摩擦が速度に対して完全に線形な関係とならず、特にアクチュエータの高速動作時においては、線形と仮定した場合の値と比べて小さくなることがしばしば確認される。そのような場合は、速度に対する非線形性を考慮したより自由度の高い摩擦モデルを用いて摩擦を推定し、実トルクと第一の推定トルクの差分における摩擦成分を除去した上で、その他の物理モデルパラメータを推定することが望ましい。このような摩擦モデルである非線形摩擦モデルとして、式(3)で示される以下に示すような関数が一例として挙げられる。where r FC,i is the Coulomb friction coefficient and r FV,i is the viscous friction coefficient for a friction model F i of axis i operating at velocity q i . However, in the operation of multi-axis mechanisms such as industrial robots, the viscous friction does not have a completely linear relationship with the speed. It is often confirmed that it is smaller than the In such a case, the friction is estimated using a friction model with a higher degree of freedom that considers the nonlinearity with respect to speed, and after removing the friction component in the difference between the actual torque and the first estimated torque, other physical It is desirable to estimate the model parameters. An example of such a non-linear friction model is the following function represented by Equation (3).
ここで、ωlsは低速動作の境界速度であり、ωhsは高速動作の境界速度であり、rST,iは摩擦の飽和係数である。非線形摩擦モデルのグラフを図3に示す。図3は、本実施の形態に係る物理モデル記憶部22で推定される物理モデルパラメータである非線形摩擦モデルの例を示す図である。図3において、横軸はモータ速度を示し、縦軸は摩擦を示す。非線形摩擦モデルは、クーロン摩擦係数rFC,iおよび粘性摩擦係数rFV,iに加えて計4つのパラメータを持ち、速度qiに対して非線形な関数であるため、これらは実トルクと第一の推定トルクとの差分から非線形最小二乗法であるLevenberg-Marquardt法を用いて求める。Levenberg-Marquardt法は、初期値依存性を持つため、一度摩擦に線形性を仮定してクーロン摩擦係数rFC,iおよび粘性摩擦係数rFV,iを物理モデルパラメータwに加え、上述の式(1)により各摩擦係数を算出した後、それらを初期値とすることで初期値依存性による推定の失敗を防ぐことができる。すなわち、物理モデル記憶部22は、物理モデルパラメータの学習において、最小二乗法、正則化最小二乗法、非線形最小二乗法、またはカルマンフィルタなどを用いることができる。モータ制御装置100は、最小二乗法、非線形最小二乗法、非線形最小二乗法、またはカルマンフィルタを用いることで、対象機械10の運動方程式および状態方程式における未知の係数を動作データから推定することが可能となる。動作データは、例えば、モータ状態信号に含まれるデータである。where ω ls is the boundary speed for low speed motion, ω hs is the boundary speed for high speed motion, and r ST,i is the saturation coefficient of friction. A graph of the nonlinear friction model is shown in FIG. FIG. 3 is a diagram showing an example of a nonlinear friction model, which is a physical model parameter estimated by the physical model storage unit 22 according to this embodiment. In FIG. 3, the horizontal axis indicates motor speed and the vertical axis indicates friction. The nonlinear friction model has a total of four parameters in addition to the Coulomb friction coefficient rFC ,i and the viscous friction coefficient rFV,i . is obtained using the Levenberg-Marquardt method, which is a nonlinear least-squares method, from the difference from the estimated torque. Since the Levenberg-Marquardt method has initial value dependence, once linearity is assumed for friction, the Coulomb friction coefficient r FC,i and the viscous friction coefficient r FV,i are added to the physical model parameter w, and the above equation ( After calculating each friction coefficient by 1), by using them as initial values, estimation failure due to initial value dependence can be prevented. That is, the physical model storage unit 22 can use the least-squares method, the regularized least-squares method, the nonlinear least-squares method, the Kalman filter, or the like in learning the physical model parameters. The
物理モデル記憶部22は、ここで得られた非線形摩擦モデルの係数を物理モデルパラメータとして記憶し、各時刻の非線形摩擦モデルの出力を物理状態変数に追加する。モータ制御装置100は、摩擦モデルの係数を物理モデルパラメータとして物理モデル記憶部22で記憶しておくことにより、経年劣化、異常などによる粘性摩擦、またクーロン摩擦の変化を検知することができる。物理モデル記憶部22は、例えば、物理モデルパラメータの学習において、非線形摩擦モデルの係数および他の物理モデルパラメータを交互に推定する。モータ制御装置100は、摩擦モデルの係数およびその他の物理モデルパラメータを交互に推定することで、摩擦モデルをより複雑かつ詳細に設計することができる。また、モータ制御装置100は、その他の物理モデルパラメータの推定についても摩擦の影響をほとんど除去した状態で行えるため、物理モデルパラメータをより高精度に学習することが可能となる。
The physical model storage unit 22 stores the coefficients of the nonlinear friction model obtained here as physical model parameters, and adds the output of the nonlinear friction model at each time to the physical state variables. By storing coefficients of the friction model as physical model parameters in the physical model storage unit 22, the
ただし、非線形摩擦モデルについては、速度の関数に限らず、位置、加速度、モータ温度などにも依存する多変数関数であってもよく、非線形摩擦モデルの各係数はGauss-Newton法、最急降下法、拡張カルマンフィルタ、無香カルマンフィルタなどによって同定してもよい。また、非線形摩擦モデルとして、サポートベクター回帰モデル、回帰木、ランダムフォレスト、多変量適応型回帰スプラインモデル、ニューラルネットワークなど機械学習アルゴリズムに基づいたモデル生成手法を用いてもよいが、後述の機械学習モデル計算部4において、ニューラルネットワークをはじめとする機械学習部411により第一の推定トルクの補正を行うため、非線形摩擦モデルは摩擦の静的な特性に着目したマクロな影響のみを除去できればよく、陽に与えられる速度のみの関数として考慮すれば十分である。
However, the nonlinear friction model is not limited to a function of velocity, and may be a multivariable function that depends on position, acceleration, motor temperature, etc. Each coefficient of the nonlinear friction model is Gauss-Newton method, steepest descent method , an extended Kalman filter, an unscented Kalman filter, or the like. As the nonlinear friction model, a support vector regression model, regression tree, random forest, multivariate adaptive regression spline model, neural network, or other model generation method based on machine learning algorithms may be used. In the
特徴量生成部3は、第一の推定トルクと、物理状態変数と、モータ状態信号とを入力とし、機械学習部411の入力である特徴量を出力する。これらの特徴量生成部3の入力および推定対象である実トルクは、時系列的に変化する値である。機械学習モデル記憶部42は、それぞれ時間軸方向の相関についても考慮する必要があるため、特徴量も過去の一定期間の値も同時に含むベクトルとして与える。また、本実施の形態で対象とする水平多関節ロボットのような多軸機構においては、軸間の相互干渉の影響が小さくないため、それぞれの軸に対応する入力の値についても同時に含むベクトルとすることが望ましい。ただし、特徴量におけるトルク成分に関しては、実トルクと第一の推定トルクとの差分として与え、推定対象とする実トルクに対して過去の値のみを用いるものとする。
The feature
図4は、本実施の形態に係る特徴量生成部3および機械学習モデル計算部4の構成例を示すブロック図である。図4において、zは単位遅延演算子であり、Ndは遅延の単位時刻数を示す0以上の整数である。図4に示す単位遅延演算子は、特徴量生成部3に備えられた記憶装置ともいえる。すなわち、特徴量生成部3は、第一の推定トルク、物理状態変数、およびモータ状態信号を格納可能な記憶装置を備え、記憶装置に格納されている第一の推定トルク、物理状態変数、およびモータ状態信号から抽出したものを特徴量として出力してもよい。モータ制御装置100は、物理状態変数およびモータ状態信号に関する時系列変化の情報を入力として特徴量に含むことで、機械学習モデル計算部4が対象機械10の動作をより詳細に予測できるため、実トルクに対する第二の推定トルクの推定精度を向上させることができる。FIG. 4 is a block diagram showing a configuration example of the feature
特徴量生成部3は、第一の推定トルク、物理状態変数、およびモータ状態信号の全てを使用せず、一部のみを使用して特徴量を生成し、出力してもよい。すなわち、特徴量生成部3は、第一の推定トルク、物理状態変数、およびモータ状態信号のうち少なくとも一つから特徴量を生成し出力してもよい。
The feature
第二のトルク推定部41は、機械学習部411を備える。第二のトルク推定部41は、特徴量生成部3で生成された特徴量と、第一のトルク推定部21の出力である第一の推定トルクと、機械学習モデル記憶部42の出力である機械学習モデルパラメータとを入力とし、特徴量および機械学習モデルパラメータを用いた機械学習部411の機械学習に基づいて機械学習補正量を算出する。第二のトルク推定部41は、第一の推定トルクに機械学習補正量を加算したものを第二の推定トルクとして出力する。
The second torque estimating section 41 includes a
機械学習部411は、特徴量生成部3で生成された特徴量と機械学習モデル記憶部42の出力である機械学習モデルパラメータとを入力とし、実トルクに対する第二の推定トルクの誤差が最小となるよう、機械学習補正量を出力するニューラルネットワークから構成される。すなわち、出力の機械学習補正量の理想的な値は実トルクと第一の推定トルクとの差分と一致し、入力である特徴量に遅延した過去の実トルクと第一の推定トルクとの差分を含むため、機械学習部411は、図5に示すような入出力関係に自己回帰項を持つ。
The
図5は、本実施の形態に係る特徴量生成部3および機械学習モデル計算部4の構成において自己回帰項を示す図である。図5は、図4から自己回帰項に関連する部分を抽出したものである。ここで、機械学習モデルパラメータは、ニューラルネットワークにおける重み行列およびバイアスベクトルを指す。また、ニューラルネットワークの種類として、中間層の入出力関係に再帰的な構造を持つ、リカレントニューラルネットワーク、LSTM(Long Short Term Memory)、GRU(Gated Recurrent Unit)といったリカレント型と呼ばれるニューラルネットワークを用いることも、このような時系列データに対する予測精度を向上する上で有効な手段である。また、学習負荷および計算量を削減するため、ニューラルネットワークの代わりに多項式モデル、重回帰モデル、サポートベクター回帰モデル、回帰木、ランダムフォレスト、多変量適応型回帰スプラインモデルなどを用いてもよいし、軸間の相互干渉を無視してよい場合などは、軸毎に独立に機械学習部411を適用してもよい。
FIG. 5 is a diagram showing autoregression terms in the configurations of the feature
ただし、ニューラルネットワークをはじめとする機械学習部411で用いた汎用的な関数近似モデルは、一般的に不連続関数の近似に適していない。そのため、第一の推定トルクにおいて式(2)の線形摩擦モデルによって摩擦分のトルクの近似および補正を行うと、実トルクと第一の推定トルクとの差分が不連続なジャンプを起こし、これらの値を入出力に含み自己回帰項を形成する機械学習部411の機械学習モデルパラメータの学習結果および機械学習補正量の算出結果が著しく悪化する可能性がある。さらに、駆動機械の実機においては、粘着と滑りとが交互に起こって発生するスティックスリップ現象、ストライベック曲線で表わされるような潤滑に関する摩擦などが影響し、速度0付近および低速動作時の摩擦は非線形性が強いため、これらのモデルを陽に与えることは非常に困難である。そこで、式(3)で示した非線形摩擦モデルように、速度0近傍を連続かつ滑らかに接続した摩擦モデルを用いることで、第一の推定トルクおよび特徴量の各値がそれぞれ連続となり、上述のような第一の推定トルクおよび非線形摩擦モデルで再現が困難な摩擦成分についても、機械学習補正量を加えることによって高精度に推定が可能となる。さらに、特徴量は、過去の一定期間の速度、非線形摩擦モデルの出力などを同時に含むベクトルである。そのため、機械学習部411は、摩擦のヒステリシス特性など直前の状態に依存して変化する推定誤差要因についても学習し、機械学習補正量として補正することが可能となる。
However, general-purpose function approximation models such as neural networks used in the
このように、第二のトルク推定部41は、入出力関係に自己回帰項を含む機械学習を用いて特徴量および機械学習モデルパラメータから機械学習補正量を算出する。第二のトルク推定部41は、算出した機械学習補正量を第一の推定トルクに加算して第二の推定トルクを出力する。また、第二のトルク推定部41は、入出力関係に自己回帰項を含む機械学習としてニューラルネットワークを用いた機械学習を用いてもよい。モータ制御装置100は、機械学習の手法としてニューラルネットワークを利用することで、運動方程式上で表現が困難なトルク成分を非線形多自由度モデルとして学習し保存することが可能となる。また、第二のトルク推定部41は、機械学習補正量を算出するのに用いる入出力関係に自己回帰項を含む機械学習において、自己回帰項として実トルクと第一の推定トルクとの差分を用いてもよい。実トルクと第一の推定トルクとの差分が第一の推定トルクに対する補正量の目標値である。補正量の目標値は対象機械10のモータの動作に伴い時系列的に変化するため、モータ制御装置100は、次の時刻の最適な補正量を推定する際、過去の補正量の目標値を入力に含む自己回帰項を備えることで、より高精度に推定することが可能となる。
In this way, the second torque estimator 41 uses machine learning including an autoregressive term in the input/output relationship to calculate the machine learning correction amount from the feature amount and the machine learning model parameters. The second torque estimator 41 adds the calculated machine learning correction amount to the first estimated torque and outputs the second estimated torque. Further, the second torque estimator 41 may use machine learning using a neural network as machine learning including an autoregressive term in the input/output relationship. By using a neural network as a machine learning method, the
機械学習モデル記憶部42は、物理モデル記憶部22における物理モデルパラメータの学習後に、対象機械10を一定期間動作させた際の特徴量、および実トルクと第一の推定トルクとの差分をそれぞれ入出力の教師データとして、実トルクと第一の推定トルクとの差分に対する機械学習補正量の誤差が低減するよう機械学習モデルパラメータを学習する。すなわち、機械学習モデル記憶部42は、機械学習補正量が実トルクと第一の推定トルクとの差分に近づくように機械学習モデルパラメータを教師あり学習により学習する。機械学習モデル記憶部42は、学習した機械学習モデルパラメータを記憶する。学習開始時の機械学習モデルパラメータは任意の定数で初期化してよいが、特にニューラルネットワークで表現される機械学習部411は、機械学習モデルパラメータである重み行列、バイアスなどに対して初期値依存性を持つ。そのため、機械学習部411では、重み行列について、一様分布、通常の正規分布に加えて、切断正規分布、Heの正規分布、Glorotの正規分布など、正規分布に由来した確率分布で初期化することが一般的である。
The machine learning model storage unit 42 inputs the feature amount and the difference between the actual torque and the first estimated torque when the
また、機械学習モデル記憶部42は、学習手法としてミニバッチ勾配降下法および誤差逆伝搬法を利用し、重み行列およびバイアスベクトルで表わされる機械学習モデルパラメータをバッチ毎に更新する。すなわち、機械学習モデル記憶部42は、機械学習モデルパラメータの学習時に用いる教師あり学習手法として誤差逆伝搬法を用いてもよい。ただし、教師データが十分な量だけ用意できない場合などは、機械学習モデル記憶部42は、ミニバッチ勾配降下法の代わりに通常の勾配降下法、確率的勾配降下法などを用いてもよい。また、機械学習モデル記憶部42は、機械学習部411におけるニューラルネットワークの汎化性能を向上させるため、学習の際にニューロンをランダムに除外するdropout、エポック毎に誤差を監視して学習を早く打ち切るearly stoppingといった手法を用いるのも有効である。機械学習モデル記憶部42は、学習時にdropoutを適用した際は、機械学習補正量の推論時にdropout確率を重み行列に適用する必要があるので、このようなハイパーパラメータについても機械学習モデルパラメータとして追加し保存する。
The machine learning model storage unit 42 also uses the mini-batch gradient descent method and the error backpropagation method as learning methods, and updates the machine learning model parameters represented by the weight matrix and the bias vector for each batch. That is, the machine learning model storage unit 42 may use the error backpropagation method as a supervised learning method used when learning the machine learning model parameters. However, if a sufficient amount of teacher data cannot be prepared, the machine learning model storage unit 42 may use a normal gradient descent method, a stochastic gradient descent method, or the like instead of the mini-batch gradient descent method. In addition, in order to improve the generalization performance of the neural network in the
ここまでの物理モデルパラメータおよび機械学習モデルパラメータの学習の流れを、フローチャートを用いて説明する。図6は、本実施の形態に係るモータ制御装置100における物理モデルパラメータおよび機械学習モデルパラメータの学習の流れを示すフローチャートである。物理モデル記憶部22は、諸元表の値から各リンクの物理モデルパラメータである質量、重心位置、および慣性テンソルの初期値を設定する(ステップS1)。モータ状態観測部1は、対象機械10のモータ状態信号である実トルク、位置、速度、および加速度の時系列データを教師データとして出力する(ステップS2)。
The flow of learning the physical model parameters and the machine learning model parameters up to this point will be described using flowcharts. FIG. 6 is a flow chart showing the flow of learning of physical model parameters and machine learning model parameters in
第一のトルク推定部21は、位置、速度、および加速度に対して、動力学計算により第一の推定トルクを算出する(ステップS3)。第一のトルク推定部21は、動力学方程式に線形摩擦モデルの項を追加する(ステップS4)。物理モデル記憶部22は、物理モデルパラメータにクーロン摩擦係数および粘性摩擦係数を追加する(ステップS5)。物理モデル記憶部22は、実トルクと第一の推定トルクとの差分から、線形方程式に変形した動力学方程式および最小二乗法を用いて、物理モデルパラメータを同定する(ステップS6)。物理モデル記憶部22は、同定した物理モデルパラメータにおけるクーロン摩擦係数および粘性摩擦係数を初期値とし、Levenberg-Marquardt法で非線形摩擦モデルを同定し、得られた各係数を物理モデルパラメータに追加する(ステップS7)。物理モデル記憶部22は、実トルクから第一の推定トルクおよび非線形摩擦モデルの値を引いた結果に対し、摩擦モデルの項を除去し線形方程式に変形した動力学方程式および最小二乗法を用いて、摩擦係数以外の物理モデルパラメータを再び同定する(ステップS8)。第一のトルク推定部21は、動力学方程式に非線形摩擦モデルの項を追加し、学習した物理モデルパラメータを用いて、第一の推定トルクを再び算出する(ステップS9)。 The first torque estimator 21 calculates a first estimated torque by dynamic calculation with respect to the position, velocity, and acceleration (step S3). The first torque estimator 21 adds a linear friction model term to the dynamics equation (step S4). The physical model storage unit 22 adds the Coulomb friction coefficient and the viscous friction coefficient to the physical model parameters (step S5). The physical model storage unit 22 identifies physical model parameters from the difference between the actual torque and the first estimated torque, using the dynamic equation transformed into a linear equation and the least-squares method (step S6). The physical model storage unit 22 uses the Coulomb friction coefficient and the viscous friction coefficient in the identified physical model parameters as initial values, identifies the nonlinear friction model by the Levenberg-Marquardt method, and adds each obtained coefficient to the physical model parameters ( step S7). The physical model storage unit 22 subtracts the first estimated torque and the value of the nonlinear friction model from the actual torque, and uses the dynamics equation transformed into a linear equation by removing the terms of the friction model and the least squares method. , the physical model parameters other than the friction coefficient are identified again (step S8). The first torque estimator 21 adds a nonlinear friction model term to the dynamics equation, and uses the learned physical model parameters to calculate the first estimated torque again (step S9).
特徴量生成部3は、第一の推定トルク、物理状態変数、およびモータ状態信号を入力として、それらを過去の一定期間の値も同時に含むベクトルにまとめ、特徴量として出力する(ステップS10)。機械学習モデル記憶部42は、機械学習モデルパラメータである重み行列、およびバイアスに対し、重み行列を正規分布で、バイアスを定数で初期化する(ステップS11)。機械学習モデル記憶部42は、学習時の条件として、early stopping、dropoutなどのハイパーパラメータを設定し、それらの値を機械学習モデルパラメータへ追加する(ステップS12)。第二のトルク推定部41は、入力を特徴量、出力を実トルクと第一の推定トルクとの差分である機械学習補正量の理想値とし、機械学習モデルパラメータにおける学習時の条件に従って、誤差逆伝搬法により機械学習モデルパラメータの重み行列およびバイアスを学習する(ステップS13)。
The
ここで、第二の推定トルクの汎化性能の向上については、上述の通り、事前に物理モデル記憶部22において物理モデルパラメータの学習を行い、第一の推定トルクに対する機械学習補正量を自己回帰項として、機械学習モデル記憶部42において機械学習モデルパラメータの学習を行うことによる寄与が大きい。なぜなら、モータ制御装置100は、物理モデルパラメータと機械学習モデルパラメータとを区別することで、それぞれ運動方程式においてモデル化が容易な既知の物理現象に起因したトルク推定誤差成分と、運動方程式においてモデル化が困難なトルク推定誤差成分とを分けて学習することができ、機械学習部411の出力である機械学習補正量の絶対値が小さくなるためである。言い換えれば、陽に与えられるトルク推定誤差成分が機械学習補正量に含まれないため、モータ制御装置100は、機械学習モデルパラメータに含まれるパラメータ数も少なくすることができ、結果として機械学習モデル記憶部42における学習の過学習の防止と高速化、さらに学習に用いる教師データの削減も可能となる。
Here, for improving the generalization performance of the second estimated torque, as described above, the physical model parameters are learned in advance in the physical model storage unit 22, and the machine learning correction amount for the first estimated torque is autoregressed. As a term, learning of the machine learning model parameters in the machine learning model storage unit 42 greatly contributes. This is because the
機械学習補正量に関する自己回帰項についても同様に、実トルクと物理モデルパラメータに初期値を用いた運動方程式による算出結果の差分を機械学習モデル計算部4で学習し機械学習補正量とする構成、または、物理モデルパラメータに初期値を用いた運動方程式による算出結果を特徴量に含み第二の推定トルクを直接機械学習部411の出力として機械学習モデルパラメータを学習する構成に比べ、機械学習補正量の絶対値が小さくなりニューラルネットワークなどによるトルク推定誤差範囲を抑えることができる。さらに、自己回帰項を用いるメリットとして、モータ特性に依存するコギングトルク、トルクリップル、ギア間のトルク伝達におけるバックラッシュの影響など、運動方程式の式中に与えることが困難な時間軸方向に周期的に変化する推定誤差要因を学習しやすい点などが挙げられる。実際に、物理モデルパラメータを学習した後の第一の推定トルク、さらに実トルクと第一の推定トルクとの差分から機械学習モデルパラメータを学習した第二の推定トルクを図7に示す。図7は、本実施の形態に係るモータ制御装置100の制御対象の対象機械10の動作を表すモータ速度、モータ制御装置100で推定される第一の推定トルク、およびモータ制御装置100で推定される第二の推定トルクを示す図である。各項目において、横軸は時間を示している。図7に示すように、第二の推定トルクの方が、第一の推定トルクよりも実トルクに近似している。
Similarly, for the autoregression term related to the machine learning correction amount, the difference between the actual torque and the calculation result by the equation of motion using the initial values for the physical model parameters is learned by the machine learning
また、機械学習部411にニューラルネットワークを用いた場合、特徴量に含まれるどのパラメータが機械学習補正量にどの程度影響したかが明らかでなく、機械学習モデルパラメータの変化から対象機械10の物性の変化を推測することは非常に困難である。しかしながら、物理モデルパラメータの学習ではそれら物性の各値を直接確認できる本実施の形態では、モータ制御装置100は、物理モデルパラメータと機械学習モデルパラメータとを区別して学習するため、異常検知に適した構成といえる。
In addition, when a neural network is used for the
学習を行った物理モデル計算部2および機械学習モデル計算部4を用いた異常検知の例として、主に実トルクと第二の推定トルクとの差分を監視する手法が考えられる。モータ制御装置100は、実トルクと第二の推定トルクとの差分を監視することで、観測値がほぼ0周りに集中し、絶対値をそのまま実トルクの異常度と捉えられるためである。具体的な異常検知手法としては、実トルクと第二の推定トルクとの差分の絶対値があらかじめ設定された閾値を超えるかによって検知する単純なものでもよいし、その他に、特徴量および実トルクと第二の推定トルクとの差分を入力とした正常、異常の2クラス分類問題として、ラベル付けを行った教師データを用意し、ロジスティック回帰、サポートベクターマシン、決定木、ニューラルネットワークなどを用いて判別してもよい。
As an example of abnormality detection using the physical
モータ制御装置100は、教師データである異常時の動作データが集めにくい場合、SMOTE(Synthetic Minority Over-sampling TEchnique)、ADASYN(ADAptive SYNthetic)などを用いて取得された異常時の動作データに対するオーバーサンプリングを行ってもよいし、K-means法、自己組織化マップなど教師なし学習により正常、異常で分かれる2クラスタに分類してもよい。また、モータ制御装置100において、クラス数およびクラスタ数は正常、異常の2つに限定されず、異常度の度合いに合わせてより細かく段階的に設定してもよいし、実トルクと第二の推定トルクとの差分の絶対値以外の異常度を任意に設定してもよい。
図1の破線で示した、物理モデル記憶部22における物理モデルパラメータ、および機械学習モデル記憶部42における機械学習モデルパラメータの学習のタイミングについて、故障検知を目的とした用途を想定すると、出荷段階の試験運転時などモータ制御装置100が劣化度合いの比較対象として理想的な状態となる環境で実行することが望ましい。ただし、水平多関節ロボットをはじめとする産業用ロボットは、手先に力覚センサ、エンドエフェクタなどを取り付けることが多々あり、その場合も各リンクの質量、重心位置、慣性テンソルといった物性が変化するため、各状態で物理モデルパラメータおよび機械学習モデルパラメータをどちらも学習し直す必要がある。
Regarding the learning timing of the physical model parameters in the physical model storage unit 22 and the machine learning model parameters in the machine learning model storage unit 42, which are indicated by the dashed lines in FIG. It is desirable that the
ただし、一般的にセンサ、エンドエフェクタなどを取り付けた際、これらの物理モデルパラメータへの影響をロボットコントローラなどによって設定する手間が発生していたのに対し、本実施の形態では、物理モデル記憶部22において、対象機械10を一定期間動作させた際のモータ状態信号からそれらを学習することで、この設定の過程についても自動化することが可能となっている。また、物理モデルパラメータの値が正しく設定されていることで、サイクルタイム、軌跡ずれ、衝突時の押しつけ力などが減少するといった利点もあり、位置制御、速度制御などに加えて、力制御、インピーダンス制御の高速化、高精度化にも応用可能な技術であり、上述の手法の用途は異常検知に限定されるものではない。
However, in general, when a sensor, an end effector, etc. are attached, it takes time and effort to set the influence on these physical model parameters by a robot controller, etc., but in this embodiment, the physical model storage unit In 22, by learning them from the motor state signals when the
つづいて、モータ制御装置100のハードウェア構成について説明する。モータ制御装置100において、モータ状態観測部1、物理モデル計算部2、特徴量生成部3、および機械学習モデル計算部4は処理回路により実現される。処理回路は、メモリに格納されるプログラムを実行するプロセッサおよびメモリであってもよいし、専用のハードウェアであってもよい。
Next, the hardware configuration of the
図8は、本実施の形態に係るモータ制御装置100が備える処理回路をプロセッサおよびメモリで構成する場合の例を示す図である。処理回路がプロセッサ91およびメモリ92で構成される場合、モータ制御装置100の処理回路の各機能は、ソフトウェア、ファームウェア、またはソフトウェアとファームウェアとの組み合わせにより実現される。ソフトウェアまたはファームウェアはプログラムとして記述され、メモリ92に格納される。処理回路では、メモリ92に記憶されたプログラムをプロセッサ91が読み出して実行することにより、各機能を実現する。すなわち、処理回路は、モータ制御装置100の処理が結果的に実行されることになるプログラムを格納するためのメモリ92を備える。また、これらのプログラムは、モータ制御装置100の手順および方法をコンピュータに実行させるものであるともいえる。
FIG. 8 is a diagram showing an example in which a processing circuit included in
ここで、プロセッサ91は、CPU(Central Processing Unit)、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、またはDSP(Digital Signal Processor)などであってもよい。また、メモリ92には、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、EPROM(Erasable Programmable ROM)、EEPROM(登録商標)(Electrically EPROM)などの、不揮発性または揮発性の半導体メモリ、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、またはDVD(Digital Versatile Disc)などが該当する。
Here, the processor 91 may be a CPU (Central Processing Unit), a processing device, an arithmetic device, a microprocessor, a microcomputer, or a DSP (Digital Signal Processor). The
図9は、本実施の形態に係るモータ制御装置100が備える処理回路を専用のハードウェアで構成する場合の例を示す図である。処理回路が専用のハードウェアで構成される場合、図9に示す処理回路93は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、またはこれらを組み合わせたものが該当する。モータ制御装置100の各機能を機能別に処理回路93で実現してもよいし、各機能をまとめて処理回路93で実現してもよい。
FIG. 9 is a diagram showing an example in which a processing circuit included in
なお、モータ制御装置100の各機能について、一部を専用のハードウェアで実現し、一部をソフトウェアまたはファームウェアで実現するようにしてもよい。このように、処理回路は、専用のハードウェア、ソフトウェア、ファームウェア、またはこれらの組み合わせによって、上述の各機能を実現することができる。
It should be noted that each function of the
以上説明したように、本実施の形態では、モータ制御装置100のモデルを、対象機械10の力学的物性と運動方程式上で陽に与えられる物理現象の情報を利用してトルクの推定を行う物理モデル計算部2と、物理モデル計算部2の推定トルクに対する補正量を自己回帰項として含み、運動方程式上で表現が困難な非線形性の強いトルク成分の推定を行う機械学習モデル計算部4の組み合わせで表現する。モータ制御装置100は、これらを順に学習することで、実トルクに対するトルク推定精度および汎化性能が高い対象機械10のモデルを、少量の動作データから高速に学習することができる。また、モータ制御装置100は、実トルクとトルク推定値とを比較する、すなわち実機と学習したモデルとを比較することで、軽微な異常についても検知が可能となる。
As described above, in the present embodiment, the model of the
すなわち、モータ制御装置100は、物理モデルパラメータと機械学習モデルパラメータとを順に学習することで、それぞれ対象機械10の力学的物性、運動方程式上で陽に与えられる物理現象によるトルク成分と、運動方程式上で表現が困難な非線形性の強いトルク成分とを区別して学習し、推定することができる。これにより、モータ制御装置100は、学習全体にかかる時間を短縮し、機械学習補正量の絶対値が物理モデルパラメータの学習により小さくなるので、実トルクに対する第二の推定トルクの汎化性能を向上させることができる。また、モータ制御装置100は、第二のトルク推定部41において、入出力関係の自己回帰項により時間軸方向の特徴量間の相関を効率的に学習させることで、第二の推定トルクの推定精度を向上させることができる。
That is, the
なお、本実施の形態では、水平多関節ロボットを制御対象としていたが、モータ制御装置100は、機械の軸数、関節の直動、回転の機構によらずに適用することができるため、垂直多関節ロボット、NC工作機械、実装機などにも適用することが可能である。
In the present embodiment, a horizontal multi-joint robot is controlled. However, the
以上の実施の形態に示した構成は、本発明の内容の一例を示すものであり、別の公知の技術と組み合わせることも可能であるし、本発明の要旨を逸脱しない範囲で、構成の一部を省略、変更することも可能である。 The configuration shown in the above embodiment shows an example of the contents of the present invention, and it is possible to combine it with another known technology, and one configuration can be used without departing from the scope of the present invention. It is also possible to omit or change the part.
1 モータ状態観測部、2 物理モデル計算部、3 特徴量生成部、4 機械学習モデル計算部、10 対象機械、11l 第1リンク、11j 第1軸、12l 第2リンク、12j 第2軸、13l 第3リンク、13j 第3軸、14l 第4リンク、14j 第4軸、15e 手先部、21 第一のトルク推定部、22 物理モデル記憶部、41 第二のトルク推定部、42 機械学習モデル記憶部、100 モータ制御装置、411 機械学習部。
1 motor
Claims (10)
前記モータの状態を観測し観測結果をモータ状態信号として出力するモータ状態観測部と、
前記モータ状態信号および前記対象機械の物理モデルパラメータに基づき、運動方程式を用いて前記モータのトルクの推定値である第一の推定トルクと前記第一の推定トルクの成分である物理状態変数とを出力する第一のトルク推定部と、
前記モータ状態信号に含まれる実トルクと前記第一の推定トルクとの差分を低減するよう前記物理モデルパラメータを学習し記憶する物理モデル記憶部と、
前記第一の推定トルク、前記物理状態変数、および前記モータ状態信号のうち少なくとも一つから特徴量を生成し出力する特徴量生成部と、
入出力関係に自己回帰項を含む機械学習を用いて前記特徴量および機械学習モデルパラメータから機械学習補正量を算出し、算出した前記機械学習補正量を前記第一の推定トルクに加算して第二の推定トルクを出力する第二のトルク推定部と、
前記機械学習補正量が前記実トルクと前記第一の推定トルクとの差分に近づくように前記機械学習モデルパラメータを教師あり学習により学習し、学習した前記機械学習モデルパラメータを記憶する機械学習モデル記憶部と、
を備えることを特徴とするモータ制御装置。A motor control device for controlling a motor that drives a target machine,
a motor state observation unit that observes the state of the motor and outputs an observation result as a motor state signal;
Based on the motor state signal and the physical model parameters of the target machine, a first estimated torque, which is an estimated value of the torque of the motor, and a physical state variable, which is a component of the first estimated torque, are calculated using an equation of motion. a first torque estimator that outputs;
a physical model storage unit that learns and stores the physical model parameters so as to reduce the difference between the actual torque included in the motor state signal and the first estimated torque;
a feature quantity generator that generates and outputs a feature quantity from at least one of the first estimated torque, the physical state variable, and the motor state signal;
A machine learning correction amount is calculated from the feature amount and the machine learning model parameters using machine learning including an autoregressive term in the input/output relationship, and the calculated machine learning correction amount is added to the first estimated torque to obtain a second a second torque estimator that outputs two estimated torques;
Machine learning model storage for learning the machine learning model parameters by supervised learning so that the machine learning correction amount approaches the difference between the actual torque and the first estimated torque, and storing the learned machine learning model parameters. Department and
A motor control device comprising:
前記機械学習モデル記憶部は、前記機械学習モデルパラメータの学習時に用いる教師あり学習手法として誤差逆伝搬法を用いる、
ことを特徴とする請求項1に記載のモータ制御装置。The second torque estimating unit uses machine learning using a neural network as machine learning including an autoregressive term in the input/output relationship,
The machine learning model storage unit uses an error backpropagation method as a supervised learning method used when learning the machine learning model parameters,
2. The motor control device according to claim 1, wherein:
ことを特徴とする請求項2に記載のモータ制御装置。In machine learning including an autoregressive term in the input/output relationship used to calculate the machine learning correction amount, the second torque estimator uses the difference between the actual torque and the first estimated torque as an autoregressive term. using
3. The motor control device according to claim 2, wherein:
ことを特徴とする請求項1から3のいずれか一つに記載のモータ制御装置。The feature amount generating unit includes a storage device capable of storing the first estimated torque, the physical state variable, and the motor state signal, and the first estimated torque stored in the storage device and the physical outputting state variables and features extracted from the motor state signal as features;
4. The motor control device according to any one of claims 1 to 3, characterized in that:
ことを特徴とする請求項1から4のいずれか一つに記載のモータ制御装置。The physical model parameters include a mass in a linkage of the target machine, a center of gravity position in the linkage of the target machine, and an inertia tensor in the linkage of the target machine.
5. The motor control device according to any one of claims 1 to 4, characterized in that:
ことを特徴とする請求項1から5のいずれか一つに記載のモータ制御装置。The first torque estimating unit uses a motion equation including a continuous and smooth friction model that outputs an estimated value of the frictional component of the torque with the speed of the motor determined by the motor state signal as an input,
6. The motor control device according to any one of claims 1 to 5, characterized in that:
ことを特徴とする請求項6に記載のモータ制御装置。the physical model storage unit learns and stores coefficients of the friction model as the physical model parameters;
7. The motor control device according to claim 6, wherein:
ことを特徴とする請求項7に記載のモータ制御装置。wherein the physical state variables include the friction model;
8. The motor control device according to claim 7, characterized in that:
ことを特徴とする請求項8に記載のモータ制御装置。The physical model storage unit alternately estimates coefficients of the friction model and other physical model parameters in learning the physical model parameters.
9. The motor control device according to claim 8, wherein:
ことを特徴とする請求項9に記載のモータ制御装置。The physical model storage unit uses a least-squares method, a regularized least-squares method, a nonlinear least-squares method, or a Kalman filter in learning the physical model parameters.
10. The motor control device according to claim 9, characterized in that:
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/016356 WO2020213062A1 (en) | 2019-04-16 | 2019-04-16 | Motor control device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020213062A1 JPWO2020213062A1 (en) | 2021-10-21 |
JP7118249B2 true JP7118249B2 (en) | 2022-08-15 |
Family
ID=72837073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021514690A Active JP7118249B2 (en) | 2019-04-16 | 2019-04-16 | motor controller |
Country Status (4)
Country | Link |
---|---|
JP (1) | JP7118249B2 (en) |
CN (1) | CN113748597A (en) |
DE (1) | DE112019007222T5 (en) |
WO (1) | WO2020213062A1 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6949284B1 (en) * | 2021-01-26 | 2021-10-13 | 三菱電機株式会社 | Numerical control device |
DE102021134294B4 (en) | 2021-12-22 | 2023-07-06 | Festo Se & Co. Kg | Hybrid approach for estimating and monitoring friction and mass parameters in an electric drive system |
EP4346086A1 (en) * | 2022-09-30 | 2024-04-03 | Siemens Aktiengesellschaft | Method for monitoring an electric machine |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001204190A (en) | 2000-01-17 | 2001-07-27 | Yaskawa Electric Corp | Device for estimating initial magnetic pole position and its error adjustment method |
JP2010183784A (en) | 2009-02-06 | 2010-08-19 | Hitachi Ltd | Controller for permanent magnet motor |
WO2012133799A1 (en) | 2011-03-30 | 2012-10-04 | 株式会社明電舎 | Motor-ripple inhibiting apparatus and motor-ripple inhibiting method |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5209810B1 (en) | 2011-07-27 | 2013-06-12 | ファナック株式会社 | Motor control device with function to estimate inertia, friction coefficient and spring constant at the same time |
JP2017177255A (en) * | 2016-03-29 | 2017-10-05 | ソニー株式会社 | Control device and control method |
JP6140331B1 (en) * | 2016-04-08 | 2017-05-31 | ファナック株式会社 | Machine learning device and machine learning method for learning failure prediction of main shaft or motor driving main shaft, and failure prediction device and failure prediction system provided with machine learning device |
JP6161854B1 (en) * | 2016-07-28 | 2017-07-12 | 三菱電機株式会社 | Motor control system |
JP6572265B2 (en) * | 2017-06-30 | 2019-09-04 | ファナック株式会社 | Control device and machine learning device |
-
2019
- 2019-04-16 CN CN201980095382.1A patent/CN113748597A/en active Pending
- 2019-04-16 WO PCT/JP2019/016356 patent/WO2020213062A1/en active Application Filing
- 2019-04-16 DE DE112019007222.6T patent/DE112019007222T5/en active Pending
- 2019-04-16 JP JP2021514690A patent/JP7118249B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001204190A (en) | 2000-01-17 | 2001-07-27 | Yaskawa Electric Corp | Device for estimating initial magnetic pole position and its error adjustment method |
JP2010183784A (en) | 2009-02-06 | 2010-08-19 | Hitachi Ltd | Controller for permanent magnet motor |
WO2012133799A1 (en) | 2011-03-30 | 2012-10-04 | 株式会社明電舎 | Motor-ripple inhibiting apparatus and motor-ripple inhibiting method |
Also Published As
Publication number | Publication date |
---|---|
DE112019007222T5 (en) | 2022-01-05 |
WO2020213062A1 (en) | 2020-10-22 |
CN113748597A (en) | 2021-12-03 |
JPWO2020213062A1 (en) | 2021-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Haddadin et al. | Robot collisions: A survey on detection, isolation, and identification | |
JP7118249B2 (en) | motor controller | |
JP6411380B2 (en) | Method for improving detection of collision between robot and its environment, system and computer program product for implementing the method | |
US8442685B2 (en) | Robot control apparatus | |
CN110076773B (en) | Robot apparatus, method of manufacturing article, and motor driving apparatus | |
CN110832422B (en) | Machine learning device, correction parameter adjustment device, and machine learning method | |
JP6324641B1 (en) | Abnormality diagnosis apparatus and abnormality diagnosis method | |
CN108388123B (en) | Self-adaptive control method of multiple humanoid robots under condition of non-measurable speed | |
CN111347421A (en) | Method and apparatus for torque estimation | |
Marton et al. | Control of robotic systems with unknown friction and payload | |
CN108472809B (en) | Robot and method for operating a robot | |
Dong et al. | Friction modeling and compensation for haptic master manipulator based on deep Gaussian process | |
WO2022162740A1 (en) | Numerical control device | |
WO2021060104A1 (en) | Information processing device, information processing system, and information processing method | |
CN115336167B (en) | Friction compensation device, collision detection device, torque feedforward calculation device, robot control device, and friction compensation method | |
Trumić et al. | Force/torque-sensorless joint stiffness estimation in articulated soft robots | |
Farooq et al. | Hybrid force/position control scheme for flexible joint robot with friction between and the end-effector and the environment | |
Hur et al. | Joint torque servo of a high friction robot manipulator based on time-delay control with feed-forward friction compensation | |
Wang et al. | An adaptive controller for robotic manipulators with unknown kinematics and dynamics | |
JP4223911B2 (en) | Collision detection method and collision detection apparatus | |
Jandaghi et al. | Motion Dynamics Modeling and Fault Detection of a Soft Trunk Robot | |
Bazzi et al. | Identification of robot forward dynamics via neural network | |
Huard et al. | LPV modeling and experimental identification of a new self-sensing finger joint | |
US20240066692A1 (en) | Method for determining a torque for an operation of a robot using a model and method for teaching the model | |
Farooq et al. | Adaptive sliding-mode hybrid force/position controller for flexible joint robot |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210531 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220705 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220802 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7118249 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |