JP6457563B2 - 数値制御装置及び機械学習装置 - Google Patents

数値制御装置及び機械学習装置 Download PDF

Info

Publication number
JP6457563B2
JP6457563B2 JP2017010598A JP2017010598A JP6457563B2 JP 6457563 B2 JP6457563 B2 JP 6457563B2 JP 2017010598 A JP2017010598 A JP 2017010598A JP 2017010598 A JP2017010598 A JP 2017010598A JP 6457563 B2 JP6457563 B2 JP 6457563B2
Authority
JP
Japan
Prior art keywords
learning
machine
adjustment
reward
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017010598A
Other languages
English (en)
Other versions
JP2018120357A (ja
Inventor
健二 清水
健二 清水
和生 佐藤
和生 佐藤
英朗 前田
英朗 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FANUC Corp
Original Assignee
FANUC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FANUC Corp filed Critical FANUC Corp
Priority to JP2017010598A priority Critical patent/JP6457563B2/ja
Priority to US15/869,852 priority patent/US10466658B2/en
Priority to DE102018000342.7A priority patent/DE102018000342A1/de
Priority to CN201810064681.6A priority patent/CN108345273B/zh
Publication of JP2018120357A publication Critical patent/JP2018120357A/ja
Application granted granted Critical
Publication of JP6457563B2 publication Critical patent/JP6457563B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/414Structure of the control system, e.g. common controller or multiprocessor systems, interface to servo, programmable interface controller
    • G05B19/4148Structure of the control system, e.g. common controller or multiprocessor systems, interface to servo, programmable interface controller characterised by using several processors for different functions, distributed (real-time) systems
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/414Structure of the control system, e.g. common controller or multiprocessor systems, interface to servo, programmable interface controller
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/33Director till display
    • G05B2219/33034Online learning, training
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/33Director till display
    • G05B2219/33038Real time online learning, training, dynamic network
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/33Director till display
    • G05B2219/33044Supervised learning with second artificial neural network

Description

本発明は、数値制御装置及び機械学習装置に関し、特に機械学習により最適なオーバライド制御用設定値を学習する数値制御装置及び機械学習装置に関する。
工作機械による加工をする際の従来技術として、主軸負荷を入力値としたPID制御により、送り速度オーバライドを制御する機能がある(例えば、特許文献1)。この機能を用いることにより、負荷が低い部分では、オーバライドを増加させ、サイクルタイムの短縮を図り、負荷が高い部分では、オーバライドを減少させ、工具破損、オーバヒートを防止する。送り速度の制御方法は、一般的に対象の値を一定値に保つための制御としてPID制御が広く使われている。PID制御による出力は一般に数1式で算出することができる。なお、数1式ではPID制御開始時の時刻をt0としている。
Figure 0006457563
図8は、従来技術によるPID制御を用いたフィードバック制御のブロック線図の例を示している。主軸の負荷が一定になるように送り速度を制御する場合は、出力値O(t)を送り速度(オーバライド)とし、eL(t)を目標主軸負荷と時刻tでの主軸負荷との差分とし、定数に適切な値を設定することで主軸負荷を目標へ近づけることができる。切削していない状態、つまり主軸の空転時には送り速度を上げても主軸負荷は変動しないため、切削中、つまり主軸負荷が一定値以上に達しているときのみ制御を行うのが望ましい。
PID制御では、制御対象の状態(工作機械においては、例えば、機械構成や工具の種類、ワーク材質、切り込み量など)に応じて各ゲイン(数1式、図8におけるKp、Ki、Kd)を調整することにより、該状態に合わせた適切なフィードバック制御を行うことができるようになる。PID制御は一般的なフィードバック制御であるため、例えば限界感度法などのような、経験的なゲインの設定方法が多数考案されている。また、特許文献2,3には、PID制御の動作を補償するためにニューラルネットを用いる技術が開示されている。
特開2012−032869号公報 特許平07−036506号公報 国際公開第2007/049412号
しかしながら、従来技術によるPID制御方法では、ゲインを加工における制御対象の状態(機械構成や工具の種類、ワーク材質、切り込み量など)に設定する必要があり、かつ安定した制御とするには、何度も試行する必要が有るという課題があった。
そこで本発明の目的は、機械学習により最適なオーバライド制御用設定値を学習する数値制御装置及び機械学習装置を提供することである。
本願の請求項1に係る発明は、少なくとも1つの軸を備えた機械を制御する数値制御装置において、前記軸を駆動するモータのオーバライド制御に用いられる設定値の調整を機械学習する機械学習装置を備え、前記機械学習装置は、前記モータのオーバライド制御に用いられる設定値の現在値を含む前記数値制御装置及び前記機械の状態を示す状態データを取得する状態観測部と、報酬条件を設定する報酬条件設定部と、前記状態観測部が取得した前記状態データと前記報酬条件に基づいて報酬を計算する報酬計算部と、前記オーバライド制御に用いられる設定値の調整を機械学習するオーバライド制御用設定値調整学習部と、前記オーバライド制御用設定値調整学習部による前記オーバライド制御に用いられる設定値の調整の機械学習結果と、前記状態データとに基づいて、前記オーバライド制御に用いられる設定値の調整を決定して出力するオーバライド制御用設定値調整量決定部と、を有し、前記オーバライド制御用設定値調整学習部は、調整された前記設定値と、前記設定値の調整後に取得された前記状態データと、前記報酬計算部が計算した前記報酬と、に基づいて前記オーバライド制御に用いられる設定値の調整を機械学習する、数値制御装置である。
本願の請求項2に係る発明は、前記報酬計算部は、前記機械の動作のサイクルタイム、前記機械の主軸負荷、前記機械に取り付けられた工具の破損、前記機械により加工されたワークの加工精度の少なくともいずれかに基づいて報酬を計算する、請求項1に記載の数値制御装置である。
本願の請求項3に係る発明は、少なくとも1つの他の数値制御装置と接続されており、前記他の数値制御装置との間で機械学習の結果を相互に交換または共有する、請求項1または2に記載の数値制御装置である。
本願の請求項4に係る発明は、数値制御装置により制御される機械が備える少なくとも1つの軸を駆動するモータのオーバライド制御に用いられる設定値の調整を機械学習した機械学習装置であって、前記オーバライド制御に用いられる設定値の調整の機械学習結果を記憶する学習結果記憶部と、前記モータのオーバライド制御に用いられる設定値の現在値を含む前記数値制御装置及び前記機械の状態を示す状態データを取得する状態観測部と、報酬条件を設定する報酬条件設定部と、前記状態観測部が取得した前記状態データと前記報酬条件に基づいて報酬を計算する報酬計算部と、前記オーバライド制御に用いられる設定値の調整を機械学習するオーバライド制御用設定値調整学習部と、前記オーバライド制御用設定値調整学習部による前記オーバライド制御に用いられる設定値の調整の機械学習結果と、前記状態データとに基づいて、前記オーバライド制御に用いられる設定値の調整を決定して出力するオーバライド制御用設定値調整量決定部と、を有し、前記オーバライド制御用設定値調整学習部は、調整された前記設定値と、前記設定値の調整後に取得された前記状態データと、前記報酬計算部が計算した前記報酬と、に基づいて前記オーバライド制御に用いられる設定値の調整を機械学習する、機械学習装置である。
本発明により、制御対象の機械の状態(機械構成、工具の種類、ワーク材質、切り込み量、指令送り速度など)に基づいて、最適なオーバライド制御用の設定値を自動的に設定することができるようになる。これにより、機械の状態(機械構成、工具の種類、ワーク材質、切り込み量、指令送り速度など)に応じて作業者がゲインを調整する必要がなくなるため、ゲイン調整にかかる手間と時間を削減できる。
強化学習アルゴリズムの基本的な概念を説明する図である。 ニューロンのモデルを示す模式図である。 3層の重みを有するニューラルネットワークを示す模式図である。 自己符号化器を学習モデルとして用いた場合の例を示す図である。 本発明の実施形態による数値制御装置の機械学習に関するイメージ図である。 本発明の実施形態による数値制御装置の概略的な機能ブロック図である。 本発明の実施形態における機械学習の流れを示すフローチャートである。 従来技術によるPID制御を用いたフィードバック制御のブロック線図の例である。
以下、本発明の実施形態を図面と共に説明する。
本発明では、機械を数値制御装置に対して人工知能となる機械学習装置を導入し、機械の状態(機械構成、工具の種類、ワーク材質、切り込み量、指令送り速度など)に応じたオーバライド制御用設定値(PID制御の各ゲイン)の調整を機械学習することで、機械の状態に対して適切なPID制御を行えるようにする。
以下では、本発明で導入する機械学習について簡単に説明する。
<1.機械学習>
ここで、機械学習について簡単に説明する。機械学習は、機械学習を行う装置(以下、機械学習装置)に入力されるデータの集合から、その中にある有用な規則や知識表現、判断基準などを解析により抽出し、その判断結果を出力すると共に、知識の学習を行うことで実現される。機械学習の手法は様々であるが、大別すれば「教師あり学習」、「教師なし学習」、「強化学習」に分けられる。さらに、これらの手法を実現する上で、特徴量そのものの抽出を学習する「深層学習」と呼ばれる手法がある。
「教師あり学習」とは、ある入力と結果(ラベル)のデータの組を大量に機械学習装置に与えることで、それらのデータセットにある特徴を学習し、入力から結果を推定するモデル、即ち、その関係性を帰納的に獲得することができる。これは後述のニューラルネットワークなどのアルゴリズムを用いて実現することができる。
「教師なし学習」とは、入力データのみを大量に学習装置に与えることで、入力データがどのような分布をしているか学習し、対応する教師出力データを与えなくても、入力データに対して圧縮、分類、整形などを行う装置を学習する手法である。それらのデータセットにある特徴を似た者どうしにクラスタリングすることなどができる。この結果を使って、何らかの基準を設けてそれを最適にするような出力の割り当てを行うことで、出力の予測を実現することができる。また「教師なし学習」と「教師あり学習」との中間的な問題設定として、「半教師あり学習」と呼ばれるものもあり、これは一部のみ入力と出力のデータの組が存在し、それ以外は入力のみのデータである場合がこれに当たる。本実施形態においては、実際に加工機を動作させなくても取得することが出来るデータを教師なし学習で利用し、学習を効率的に行うことが出来る。
「強化学習」とは、判定や分類だけではなく、行動を学習することにより、環境に行動が与える相互作用を踏まえて適切な行動を学習、即ち、将来的に得られる報酬を最大にするための学習する方法である。強化学習においては、機械学習装置は行動が引き起こす結果を全く知らない状態から、または不完全にしか知らない状態から学習はスタートすることができる。また、人間の動作を真似るように事前学習(前述の教師あり学習や、逆強化学習といった手法)した状態を初期状態として、良いスタート地点から学習をスタートさせることもできる。
なお、工作機械を制御する数値制御装置に対して機械学習を適用する場合、工作機械が実際に動作して初めて、その結果をデータとして得ることが出来ること、即ち、試行錯誤しながら最適な行動を探索する必要があることを考慮する必要がある。本発明では、機械学習装置の主たる学習アルゴリズムとして報酬を与えることで機械学習装置が目標到達のための行動を自動的に学習する強化学習のアルゴリズムを採用している。
図1は、強化学習アルゴリズムの基本的な概念を説明する図である。強化学習においては、学習する主体となるエージェント(機械学習装置)と、制御対象となる環境(制御対象システム)とのやりとりにより、エージェントの学習と行動が進められる。より具体的には、(1)エージェントはある時点における環境の状態stを観測し、(2)観測結果と過去の学習に基づいて自分が取れる行動atを選択して行動atを実行し、(3)何らかの規則および行動atの実行に基づいて環境の状態stが次の状態st+1へと変化し、(4)行動atの結果としての状態の変化に基づいてエージェントが報酬rt+1を受け取り、(5)エージェントが状態st、行動at、報酬rt+1および過去の学習の結果に基づいて学習を進める、といったやりとりがエージェントと環境の間で行われる。
強化学習の初期の段階では、エージェントは(2)の行動選択において環境の状態stに対する最適な行動atを選択するための価値判断の基準が全く分かっていない。そこで、エージェントは或る状態stの元で様々な行動atを選択し、その時の行動atに対して与えられた報酬rt+1に基づいて、より良い行動の選択、すなわち正しい価値判断の基準を学習していく。
上記した(5)における学習においては、エ−ジェントは将来取得できる報酬の量を判断するための基準となる情報として、観測された状態st,行動at,報酬rt+1のマッピングを獲得する。例えば、各時刻において取り得る状態の個数がm、取り得る行動の個数がnとすると、行動を繰り返すことによって状態stと行動atの組に対する報酬rt+1を記憶するm×nの2次元配列が得られる。
そして、上記得られたマッピングに基づいて選択した状態や行動がどのくらい良いのかを示す関数である価値関数(評価関数)を用い、行動を繰り返す中で価値関数(評価関数)を更新していくことにより状態に対する最適な行動を学習していく。
状態価値関数は、ある状態stがどのくらい良い状態であるのかを示す価値関数である。状態価値関数は、状態を引数とする関数として表現され、行動を繰り返す中での学習において、ある状態における行動に対して得られた報酬や、該行動により移行する未来の状態の価値などに基づいて更新される。状態価値関数の更新式は強化学習のアルゴリズムに応じて定義されており、例えば、強化学習アルゴリズムの1つであるTD学習においては、状態価値関数は以下の数2式で更新される。なお、数2式においてαは学習係数、γは割引率と呼ばれ、0<α≦1、0<γ≦1の範囲で定義される。
Figure 0006457563
また、行動価値関数は、ある状態stにおいて行動atがどのくらい良い行動であるのかを示す価値関数である。行動価値関数は、状態と行動を引数とする関数として表現され、行動を繰り返す中での学習において、ある状態における行動に対して得られた報酬や、該行動により移行する未来の状態における行動の価値などに基づいて更新される。行動価値関数の更新式は強化学習のアルゴリズムに応じて定義されており、例えば、代表的な強化学習アルゴリズムの1つであるQ学習においては、行動価値関数は以下の数3式で更新される。なお、数3式においてαは学習係数、γは割引率と呼ばれ、0<α≦1、0<γ≦1の範囲で定義される。
Figure 0006457563
数3式は、行動atの結果帰ってきた報酬rt+1を元に、状態stにおける行動atの評価値Q(st,at)を更新する方法を表している。状態stにおける行動atの評価値Q(st,at)よりも、報酬rt+1+行動atによる次の状態における最良の行動max(a)の評価値Q(st+1,max(a))の方が大きければ、Q(st,at)を大きくするし、反対に小さければ、Q(st,at)も小さくする事を示している。つまり、ある状態におけるある行動の価値を、結果として即時帰ってくる報酬と、その行動による次の状態における最良の行動の価値に近付けるようにしている。
Q学習においては、このような更新を繰り返すことで、最終的にQ(st,at)が期待値E[Σγtt]となるようにすることを目指す(期待値は最適な行動に従って状態変化した時についてとる。もちろん、それは分かっていないので、探索しながら学習しなければならない)。
そして、上記した(2)における行動の選択においては、過去の学習によって作成された価値関数(評価関数)を用いて現在の状態stにおいて将来にわたっての報酬(rt+1+rt+2+…)が最大となる行動at(状態価値関数を用いている場合には、もっとも価値の高い状態へ移るための行動、行動価値関数を用いている場合には該状態において最も価値の高い行動)を選択する。なお、エージェントの学習中には学習の進展を目的として(2)における行動の選択において一定の確率でランダムな行動を選択することもある(εグリーディ法)。
なお、学習結果としての価値関数(評価関数)を記憶する方法としては、すべての状態行動ペア(s,a)に対して、その値をテーブル(行動価値テーブル)として保持しておく方法や、上記価値関数を近似するような関数を用意する方法がある。後者の方法では、前述の更新式は、確率勾配降下法などの手法で近似関数のパラメータを調整していくことで実現することが出来る。近似関数としては、ニューラルネットワークなどの教師あり学習器を用いることが出来る。
ニューラルネットワークは、たとえば図2に示すようなニューロンのモデルを模したニューラルネットワークを実現する演算装置及びメモリ等で構成される。図2は、ニューロンのモデルを示す模式図である。
図2に示すように、ニューロンは、複数の入力x(ここでは一例として、入力x1〜入力x3)に対する出力yを出力するものである。各入力x1〜x3には、この入力xに対応する重みw(w1〜w3)が掛けられる。これにより、ニューロンは、次の数4式により表現される出力yを出力する。なお、数4式において、入力x、出力y及び重みwは、すべてベクトルである。また、θはバイアスであり、fkは活性化関数である。
Figure 0006457563
次に、上述したニューロンを組み合わせた3層の重みを有するニューラルネットワークについて、図3を参照して説明する。図3は、D1〜D3の3層の重みを有するニューラルネットワークを示す模式図である。図3に示すように、ニューラルネットワークの左側から複数の入力x(ここでは一例として、入力x1〜入力x3)が入力され、右側から結果y(ここでは一例として、結果y1〜結果y3)が出力される。
具体的には、入力x1〜入力x3は、3つのニューロンN11〜N13の各々に対して対応する重みが掛けられて入力される。これらの入力に掛けられる重みはまとめてw1と標記されている。ニューロンN11〜N13は、それぞれ、z11〜z13を出力する。これらのz11〜z13はまとめて特徴ベクトルz1と標記され、入力ベクトルの特徴量を抽出したベクトルとみなすことができる。この特徴ベクトルz1は、重みw1と重みw2との間の特徴ベクトルである。
z11〜z13は、2つのニューロンN21、N22の各々に対して対応する重みが掛けられて入力される。これらの特徴ベクトルに掛けられる重みは、まとめてw2と標記されている。ニューロンN21、N22は、それぞれ、z21、z22を出力する。これらは、まとめて特徴ベクトルz2と標記されている。この特徴ベクトルz2は、重みw2と重みw3との間の特徴ベクトルである。
特徴ベクトルz21、z22は、3つのニューロンN31〜N33の各々に対して対応する重みが掛けられて入力される。これらの特徴ベクトルに掛けられる重みは、まとめてw3と標記されている。
最後に、ニューロンN31〜N33は、それぞれ、結果y1〜結果y3を出力する。
ニューラルネットワークの動作には、学習モードと予測モードとがあり、学習モードにおいて学習データセットを用いて重みwを学習し、そのパラメータを用いて予測モードにおいて加工機の行動判断を行う(便宜上、予測と書いたが、検出、分類、推論など多様なタスクが可能である)。
予測モードで実際に制御装置により機械を制御して得られたデータを即時学習し、次の行動に反映させる(オンライン学習)ことも、あらかじめ収集しておいたデータ群を用いてまとめた学習を行い、以降はずっとそのパラメータで検知モードを行う(バッチ学習)こともできる。その中間的な、ある程度データが溜まるたびに学習モードを挟むということも可能である。
重みw1〜w3は、誤差逆伝搬法(バックプロパゲーション)により学習可能なものである。誤差の情報は、右側から入り左側に流れる。誤差逆伝搬法は、各ニューロンについて、入力xが入力されたときの出力yと真の出力y(教師)との差分を小さくするように、それぞれの重みを調整(学習)する手法である。
ニューラルネットワークは、3層以上にさらに層を増やすことも可能である(深層学習と称される)。入力の特徴抽出を段階的に行い、結果を回帰する演算装置を、教師データのみから自動的に獲得することが可能である。また、多層のニューラルネットを用いる場合には、図4に示すような公知のオートエンコーダを構成して、特徴量そのものを抽出して自律的に学習するようにしても良い。
このようなニューラルネットワークを近似関数として用いることで、上記した強化学習の過程における(1)〜(5)を繰り返しつつ上記した価値関数(評価関数)をニューラルネットワークとして記憶して学習を進めることができる。
一般的に機械学習装置は、ある環境において学習が終了した後に、新たな環境におかれた場合でも追加の学習を行うことでその環境に適応するように学習を進めることができる。したがって、本発明のように機械の状態に応じたオーバライド制御用設定値(PID制御の各ゲイン)の調整に適用することで、新しい機械制御の前提条件に適用したりする場合であっても、過去のオーバライド制御用設定値の調整の学習を基にして、新たな加工の前提条件における追加の学習をすることで、オーバライド制御用設定値の調整の学習を短時間で行うことが可能となる。
また、強化学習においては、複数のエージェントをネットワークなどを介して接続したシステムとし、エージェント間で状態s、行動a、報酬rなどの情報を共有してそれぞれの学習に利用することで、それぞれのエージェントが他のエージェントの環境も考慮して学習をする分散強化学習を行うことで効率的な学習を行うことができる。本発明においても、複数の環境(機械を制御する数値制御装置)に組み込まれた複数のエージェント(機械学習装置)がネットワークなどを介して接続された状態で分散機械学習を行うことで、機械を制御する数値制御装置におけるオーバライド制御用設定値の調整の学習を効率的に行わせることができるようになる。
なお、強化学習のアルゴリズムとしては、Q学習、SARSA法、TD学習、AC法など様々な手法が周知となっているが、本発明に適用する方法としていずれの強化学習アルゴリズムを採用してもよい。上記したそれぞれの強化学習アルゴリズムは周知なので、本明細書における各アルゴリズムの詳細な説明は省略する。
以下では、機械学習装置を導入した本発明の数値制御装置について、具体的な実施形態に基づいて説明する。
<2.実施形態>
図5は、本発明の一実施形態による機械学習装置を導入した数値制御装置におけるオーバライド制御用設定値の調整の機械学習に関するイメージを示す図である。なお、図5には本実施形態における数値制御装置の機械学習の説明に必要な構成のみを示している。
本実施形態において、機械学習装置20が環境(<1.機械学習>で説明した状態st)を特定するための情報として、機械2から取得された機械構成や工具種類、ワーク材質、切込量、及びプログラムによる指令送り速度、オーバライド制御用設定値(PID制御の各ゲインなど)の現在値などの情報を状態情報として機械学習装置20に対して入力している。
本実施形態では、機械学習装置20が環境に対して出力するもの(<1.機械学習>で説明した行動at)として、機械2のPID制御に用いられるオーバライド制御用設定値の調整量を出力する。
本実施形態による数値制御装置1では、上記した状態情報を、機械2から取得された機械構成や工具種類、ワーク材質、切込量、及びプログラムによる指令送り速度、オーバライド制御用設定値(PID制御の各ゲインなど)などにより状態を定義する。そして、上記した調整行動は機械学習装置20が出力する機械2のPID制御に用いられるオーバライド制御用設定値の調整量により定義できる。
また本実施形態では、機械学習装置20に対して与えられる報酬(<1.機械学習>で説明した報酬rt)として、サイクルタイムの増減(プラス・マイナス報酬)、主軸負荷軽減(プラス・マイナス報酬)、工具破損(マイナス報酬)、加工精度(プラス・マイナス報酬)などを採用する。なお、いずれのデータに基づいて報酬を決定するのかについては、作業者が適宜設定するようにしてもよい。
更に、本実施形態では、機械学習装置20は上記した状態情報(入力データ)、調整行動(出力データ)、報酬に基づいて機械学習を行う。機械学習においては、ある時刻tにおいて、入力データの組み合わせにより状態stが定義され、定義された状態stに対して行われるゲインの調整が行動atとなり、そして、行動atによりオーバライド制御用設定値の調整が行われた結果として新たに得られた機械の稼動結果のデータに基づいて評価計算された値が報酬rt+1となり、これを<1.機械学習>で説明したように、機械学習のアルゴリズムに応じた価値関数(評価関数)の更新式に当てはめることにより学習を進める。
以下では、制御システムの機能ブロック図に基づいて説明する。
図6は、本実施形態による数値制御装置の機能ブロック図である。本実施形態の数値制御装置1は、制御対象となる機械2が備える軸を駆動するサーボモータ(図示せず)を制御するサーボ制御部(図示せず)などの数値制御装置が標準的に備える構成と、該サーボ制御部や周辺機器などを制御する制御部10、および機械学習を行う人工知能となる機械学習装置20を備える。図6に示した構成を、図1に示した強化学習における要素と対比すると、機械学習装置20がエージェントに対応し、機械学習装置20を除く機械2などの構成が環境に対応する。なお、数値制御装置1は、上記した以外にも一般的な数値制御装置の構成を備えているものとし、本発明における機械学習の動作の説明に特段必要な構成以外は本明細書での詳細な説明を省略する。
制御部10は、図示しないメモリから読み出された、または図示しない入力機器などを介して入力されたプログラムを解析し、解析結果として得られた制御データに基づいて機械2の各部を制御する。制御部10は、通常はプログラムの解析結果に基づいた制御を行なうが、本実施形態においては、機械2の各軸の制御においては、機械学習装置20からの出力により調整されたオーバライド制御用設定値に従って行われる。
機械学習を行う機械学習装置20は、状態観測部21、状態データ記憶部22、報酬条件設定部23、報酬計算部24、オーバライド制御用設定値調整学習部25、学習結果記憶部26、オーバライド制御用設定値調整量決定部27を備える。機械学習装置20は、図に示すように数値制御装置1内に備えてもよいし、数値制御装置1外のパソコン等に備えるようにしてもよい。
状態観測部21は、制御部10を介して数値制御装置1及び機械2に関する状態を観測して状態データとして機械学習装置20内に取得する機能手段である。状態データとしては機械2から取得された機械構成や工具種類、ワーク材質、切込量、及びプログラムによる指令送り速度、オーバライド制御用設定値(PID制御の各ゲインなど)の現在値、更に各物理量を演算処理して算出した算出値などがある。状態観測部21は、数値制御装置1及び機械2に関する状態を状態データとして取得する際に、あらかじめ定められたルールに従って文字や記号などの数値以外のデータの数値化を行うようにしても良い。
状態データ記憶部22は状態データを入力して記憶し、記憶した該状態データを報酬計算部24やオーバライド制御用設定値調整学習部25に対して出力する機能手段である。入力される状態データは、最新の加工運転で取得したデータでも、過去の加工運転で取得したデータでも構わない。また、他の数値制御装置1や集中管理システム30に記憶された状態データを入力して記憶したり、出力したりすることも可能である。
報酬条件設定部23は、操作者などにより設定された機械学習において報酬を与える条件を設定するための機能手段である。報酬にはプラスの報酬とマイナスの報酬があり、適宜設定が可能である。報酬条件設定部23への入力は集中管理システムで使用しているパソコンやタブレット端末等からでも構わないが、数値制御装置1が備える図示しないMDI機器を介して入力できるようにすることで、より簡便に設定することが可能となる。
報酬計算部24は、報酬条件設定部23で設定された条件に基づいて状態観測部21または状態データ記憶部22から入力された状態データを分析し、計算された報酬をオーバライド制御用設定値調整学習部25に出力する。
以下に、本実施形態における報酬条件設定部23で設定する報酬条件の例を示す。なお、以下に示す報酬条件は一例であり、それぞれ設計的に変更してもよく、また、他の様々な報酬条件を設定できるようにしても良い。
●[報酬1:サイクルタイムの増減(プラス報酬,マイナス報酬)]
機械2の一連の動作(加工動作)におけるサイクルタイムがあらかじめ定めた所定の基準値よりも短い場合、その短い度合いに応じてプラスの報酬を与える。
一方で、機械2の一連の動作(加工動作)におけるサイクルタイムがあらかじめ定めた所定の基準値よりも長い場合、その短い度合いに応じてマイナスの報酬を与える。
●[報酬2:主軸負荷軽減(プラス・マイナス報酬)]
機械2の動作(加工動作)における主軸にかかった負荷があらかじめ定めた所定の基準値よりも小さい場合、その小さい度合いに応じてプラスの報酬を与える。
一方で、機械2の動作(加工動作)における主軸にかかった負荷があらかじめ定めた所定の基準値よりも大きい場合、その大きい度合いに応じてマイナスの報酬を与える。
●[報酬3:工具破損(マイナス報酬)]
機械2に取り付けられた工具が破損した場合、大きなマイナス報酬を与える。
●[報酬4:加工精度(プラス・マイナス報酬)]
機械2の動作(加工動作)により加工されたワークの加工精度があらかじめ定めた所定の基準値よりも高い場合(例えば、CADなどで設計されているワーク図面と加工されたワークとの寸法誤差があらかじめ定めた所定の基準値よりも小さい場合)、その高さの度合いに応じてプラスの報酬を与える。
一方で、機械2の動作(加工動作)により加工されたワークの加工精度があらかじめ定めた所定の基準値よりも低い場合(例えば、CADなどで設計されているワーク図面と加工されたワークとの寸法誤差があらかじめ定めた所定の基準値よりも大きい場合)、その低さの度合いに応じてマイナスの報酬を与える。
オーバライド制御用設定値調整学習部25は、状態観測部21が観測した状態にかかるデータと、自身が行ったオーバライド制御用設定値の調整(調整量の出力)、および報酬計算部24で計算された報酬とに基づいて機械学習(強化学習)を行う。オーバライド制御用設定値調整学習部25が行う機械学習においては、ある時刻tにおける状態データの組み合わせにより状態stが定義され、定義された状態stに応じて後述するオーバライド制御用設定値調整量決定部27がオーバライド制御用設定値の調整動作を決定して数値制御装置1に対して出力し、実際にオーバライド制御用設定値を調整することが行動atとなり、オーバライド制御用設定値が調整され、機械2の動作の制御が行われ、その結果として状態観測部21が取得した状態データに基づいて報酬計算部24で計算された値が報酬rt+1となる。学習に用いられる価値関数については、適用する学習アルゴリズムに応じて決定する。例えば、Q学習を用いる場合には、上記した数3式に従って行動価値関数Q(st,at)を更新することにより学習を進めるようにすれば良い。
学習結果記憶部26は、オーバライド制御用設定値調整学習部25が学習した結果を記憶する。また、オーバライド制御用設定値調整学習部25が学習結果を再使用する際には、学習結果記憶部26は記憶している学習結果をオーバライド制御用設定値調整学習部25に出力する。学習結果の記憶には、上述したように、利用する機械学習アルゴリズムに応じた価値関数を、近似関数や、配列、又は多値出力のSVMやニューラルネットワーク等の教師あり学習器などにより記憶するようにすれば良い。
なお、学習結果記憶部26に、他の数値制御装置1や集中管理システム30が記憶している学習結果を入力して記憶させたり、学習結果記憶部26が記憶している学習結果を他の数値制御装置1や集中管理システム30に対して出力したりすることも可能である。
オーバライド制御用設定値調整量決定部27は、オーバライド制御用設定値調整学習部25が学習した(そして、学習結果記憶部26に記憶されている)学習結果と状態観測部21が観測した状態に係るデータとに基づいてオーバライド制御用設定値の調整行動を決定し、制御部10に対して出力する。ここでいうオーバライド制御用設定値の調整行動の決定が、機械学習に用いられる行動aに相当する。オーバライド制御用設定値の調整行動は、調整対象となるゲイン(Kp、KI、Kd)の選択と、選択されたゲインに対してどの程度に調整するかを組にして、それぞれの組を選択可能な行動(例えば、行動1=KpをXXに設定、行動2=KIを+YY、…)としてあらかじめ設定して用意しておき、過去の学習結果に基づいて将来に得られる報酬が最も大きくなるように行動を選択するようにしてもよい。選択可能な行動は、複数のゲインを同時に調整する行動としてもよい。また、上記したεグリーディ法を採用し、所定の確率でランダムな行動を選択することで後のオーバライド制御用設定値調整学習部25による学習の進展を図るようにしてもよい。
そして、制御部10は、オーバライド制御用設定値調整量決定部27から受けたオーバライド制御用設定値の調整量に基づいてオーバライド制御用設定値を調整する。
図7のフローチャートを用いて、オーバライド制御用設定値調整学習部25が行う機械学習の流れを説明する。
●[ステップSA01]機械学習が開始されると、状態観測部21が制御部10を介して数値制御装置1と機械2の状態を状態データとして観測する。
●[ステップSA02]オーバライド制御用設定値調整学習部25は、状態観測部21が観測した状態に係るデータに基づいて現在の状態stを特定する。
●[ステップSA03]オーバライド制御用設定値調整量決定部27は、過去の学習結果とステップSA02で特定した状態stに基づいて行動at(オーバライド制御用設定値の調整行動)を選択する。
●[ステップSA04]制御部10は、ステップSA03で選択されたオーバライド制御用設定値の調整行動atを実行する。
●[ステップSA05]状態観測部21が、数値制御装置1と機械2の状態を状態データとして取得する。この段階においては、数値制御装置1及び機械2の状態は時刻tから時刻t+1への時間的推移と共にステップSA04で実行された行動atによって変化している。
●[ステップSA06]ステップSA05で取得された状態データに基づいて、報酬計算部24が報酬rt+1を算出する。
●[ステップSA07]ステップSA02で特定された状態st、ステップSA03で選択された行動at、ステップSA06で算出された報酬rt+1に基づいて、オーバライド制御用設定値調整学習部25が機械学習を進め、ステップSA02へ戻る。
上記したように、オーバライド制御用設定値調整量決定部27の決定に基づいてオーバライド制御用設定値が調整され、調整されたオーバライド制御用設定値により機械2が制御されて機械2が動作(ワークを加工)し、状態観測部21による状態データの観測が行われ、機械学習を繰り返すことにより、より優れた学習結果を得ることができる。
上記した機械学習が十分に行われた学習データを用いて実際にオーバライド制御用設定値を調整する際には、機械学習装置20が新たな学習を行なわないようにしておいて、機械学習が十分に行われた学習データをそのまま使用して運転をするようにしてもよい。
また、機械学習が完了した機械学習装置20(または、他の機械学習装置20の機械学習が完了した学習データを複写した機械学習装置20)を他の数値制御装置1に取付けて、機械学習が十分に行われた時の学習データをそのまま使用して運転をするようにしてもよい。
数値制御装置1の機械学習装置20は単独で機械学習をするようにしてもよいが、複数の数値制御装置1がそれぞれ外部との通信手段を更に備えると、それぞれの学習結果記憶部26に記憶された価値関数を互いに送受信して共有することが可能となり、より効率良く機械学習を行うことができる。例えば、複数の数値制御装置1において異なる調整対象と異なる調整量を所定の範囲内でそれぞれ変動させながら、それぞれの数値制御装置1の間で状態に係るデータや学習結果としての価値関数をやり取りすることにより並列して学習を進めるようにすることで効率的に学習させることができる。
このように複数の数値制御装置1の間でやり取りする際には、通信は図示しない管理装置等を経由しても良いし、直接数値制御装置1同士が通信しても構わないし、クラウドを使用しても構わないが、大量のデータを取り扱う場合があるため、なるべく通信速度が速い通信手段が好ましい。
以上、本発明の実施の形態について説明したが、本発明は上述した実施の形態の例のみに限定されることなく、適宜の変更を加えることにより様々な態様で実施することができる。
例えば、上記実施形態で示した数値制御装置1が備える各機能手段の関係は図6の機能ブロック図に示したものに限定されるものではなく、各機能手段の機能に相当する構成を備えているのであれば、どのような機能単位に分割しても、また、機能間にどのような上下関係を持たせても良い。
1 数値制御装置
2 機械
10 制御部
20 機械学習装置
21 状態観測部
22 状態データ記憶部
23 報酬条件設定部
24 報酬計算部
25 オーバライド制御用設定値調整学習部
26 学習結果記憶部
27 オーバライド制御用設定値調整量決定部
30 集中管理システム

Claims (4)

  1. 少なくとも1つの軸を備えた機械を制御する数値制御装置において、
    前記軸を駆動するモータのオーバライド制御に用いられる設定値の調整を機械学習する機械学習装置を備え、
    前記機械学習装置は、
    前記モータのオーバライド制御に用いられる設定値の現在値を含む前記数値制御装置及び前記機械の状態を示す状態データを取得する状態観測部と、
    報酬条件を設定する報酬条件設定部と、
    前記状態観測部が取得した前記状態データと前記報酬条件に基づいて報酬を計算する報酬計算部と、
    前記オーバライド制御に用いられる設定値の調整を機械学習するオーバライド制御用設定値調整学習部と、
    前記オーバライド制御用設定値調整学習部による前記オーバライド制御に用いられる設定値の調整の機械学習結果と、前記状態データとに基づいて、前記オーバライド制御に用いられる設定値の調整を決定して出力するオーバライド制御用設定値調整量決定部と、
    を有し、
    前記オーバライド制御用設定値調整学習部は、調整された前記設定値と、前記設定値の調整後に取得された前記状態データと、前記報酬計算部が計算した前記報酬と、に基づいて前記オーバライド制御に用いられる設定値の調整を機械学習する、
    数値制御装置。
  2. 前記報酬計算部は、前記機械の動作のサイクルタイム、前記機械の主軸負荷、前記機械に取り付けられた工具の破損、前記機械により加工されたワークの加工精度の少なくともいずれかに基づいて報酬を計算する、
    請求項1に記載の数値制御装置。
  3. 少なくとも1つの他の数値制御装置と接続されており、
    前記他の数値制御装置との間で機械学習の結果を相互に交換または共有する、
    請求項1または2に記載の数値制御装置。
  4. 数値制御装置により制御される機械が備える少なくとも1つの軸を駆動するモータのオーバライド制御に用いられる設定値の調整を機械学習した機械学習装置であって、
    前記オーバライド制御に用いられる設定値の調整の機械学習結果を記憶する学習結果記憶部と、
    前記モータのオーバライド制御に用いられる設定値の現在値を含む前記数値制御装置及び前記機械の状態を示す状態データを取得する状態観測部と、
    報酬条件を設定する報酬条件設定部と、
    前記状態観測部が取得した前記状態データと前記報酬条件に基づいて報酬を計算する報酬計算部と、
    前記オーバライド制御に用いられる設定値の調整を機械学習するオーバライド制御用設定値調整学習部と、
    前記オーバライド制御用設定値調整学習部による前記オーバライド制御に用いられる設定値の調整の機械学習結果と、前記状態データとに基づいて、前記オーバライド制御に用いられる設定値の調整を決定して出力するオーバライド制御用設定値調整量決定部と、
    を有し、
    前記オーバライド制御用設定値調整学習部は、調整された前記設定値と、前記設定値の調整後に取得された前記状態データと、前記報酬計算部が計算した前記報酬と、に基づいて前記オーバライド制御に用いられる設定値の調整を機械学習する、
    機械学習装置。
JP2017010598A 2017-01-24 2017-01-24 数値制御装置及び機械学習装置 Active JP6457563B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2017010598A JP6457563B2 (ja) 2017-01-24 2017-01-24 数値制御装置及び機械学習装置
US15/869,852 US10466658B2 (en) 2017-01-24 2018-01-12 Numerical controller and machine learning device
DE102018000342.7A DE102018000342A1 (de) 2017-01-24 2018-01-17 Numerische steuerung und maschinelle lernvorrichtung
CN201810064681.6A CN108345273B (zh) 2017-01-24 2018-01-23 数值控制装置及机器学习装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017010598A JP6457563B2 (ja) 2017-01-24 2017-01-24 数値制御装置及び機械学習装置

Publications (2)

Publication Number Publication Date
JP2018120357A JP2018120357A (ja) 2018-08-02
JP6457563B2 true JP6457563B2 (ja) 2019-01-23

Family

ID=62812990

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017010598A Active JP6457563B2 (ja) 2017-01-24 2017-01-24 数値制御装置及び機械学習装置

Country Status (4)

Country Link
US (1) US10466658B2 (ja)
JP (1) JP6457563B2 (ja)
CN (1) CN108345273B (ja)
DE (1) DE102018000342A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6325504B2 (ja) * 2015-10-28 2018-05-16 ファナック株式会社 学習制御器の自動調整を行う機能を有するサーボ制御装置
JP6474449B2 (ja) * 2017-04-07 2019-02-27 ファナック株式会社 調整装置及び調整方法
JP7090243B2 (ja) * 2018-05-08 2022-06-24 千代田化工建設株式会社 プラント運転条件設定支援システム、学習装置、及び運転条件設定支援装置
EP3611578B1 (en) * 2018-08-14 2022-04-06 OMRON Corporation Industrial pc device and method for operating an industrial pc device
KR101990326B1 (ko) * 2018-11-28 2019-06-18 한국인터넷진흥원 감가율 자동 조정 방식의 강화 학습 방법
JP6940474B2 (ja) * 2018-12-05 2021-09-29 ファナック株式会社 工作機械
JP7053518B2 (ja) * 2019-02-18 2022-04-12 ファナック株式会社 切削液量調整装置及び切削液量調整システム
JP7074718B2 (ja) * 2019-04-26 2022-05-24 ファナック株式会社 加工支援装置、数値制御装置、及び加工支援システム
KR102120049B1 (ko) * 2019-06-12 2020-06-08 한국인터넷진흥원 감가율 자동 조정 방식의 강화 학습 방법
CN110362034A (zh) * 2019-08-08 2019-10-22 合肥学院 具有加工时间测量和在机测量功能的加工装置
JP7331660B2 (ja) * 2019-11-26 2023-08-23 横河電機株式会社 装置、方法およびプログラム
US11960267B2 (en) 2020-04-24 2024-04-16 Yokogawa Electric Corporation Control apparatus, control method, and storage medium
US11796977B2 (en) * 2020-04-29 2023-10-24 Honeywell International Inc. PID controller autotuner using machine learning approaches
WO2022186140A1 (ja) * 2021-03-02 2022-09-09 ファナック株式会社 数値制御装置、およびコンピュータ読み取り可能な記憶媒体
CN116243658B (zh) * 2023-03-15 2023-10-03 上海铼钠克数控科技有限公司 数控系统控制方法及应用

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0731529B2 (ja) * 1988-07-29 1995-04-10 オ−クマ株式会社 数値制御工作機械における学習制御方式
JP3125791B2 (ja) * 1990-03-09 2001-01-22 株式会社日立製作所 受注生産システム
JP2851901B2 (ja) * 1990-03-09 1999-01-27 株式会社日立製作所 学習制御装置
JP3135738B2 (ja) * 1993-03-18 2001-02-19 三菱電機株式会社 数値制御装置
JP3062606B2 (ja) 1993-07-16 2000-07-12 株式会社日立製作所 ニューラルネットワークを用いた適応制御装置
US20030125828A1 (en) * 2002-01-03 2003-07-03 Corey Gary John SmartPath: an intelligent tool path optimizer that automatically adusts feedrates, accel rates and decel rates based on a set of rules and spindle torque defined by the user
JP3898686B2 (ja) * 2003-10-20 2007-03-28 ファナック株式会社 数値制御装置
JP2006105943A (ja) * 2004-10-08 2006-04-20 Omron Corp 知識作成装置及びパラメータ探索方法並びにプログラム製品
JP4299805B2 (ja) * 2005-04-25 2009-07-22 ファナック株式会社 テーブル形式データを用い工具補正を行う数値制御装置
JP4361071B2 (ja) * 2005-07-08 2009-11-11 ファナック株式会社 サーボ制御装置
JP4918682B2 (ja) 2005-10-27 2012-04-18 国立大学法人山口大学 超音波モータの制御方法、超音波モータ制御装置及び超音波モータを制御するためのプログラム
CN101025620B (zh) * 2006-02-24 2010-10-13 同济大学 一种可用于数控铣削加工过程的分级模糊递阶控制方法
JP5014391B2 (ja) * 2009-09-11 2012-08-29 ファナック株式会社 複数のセンサの信号に基づいて機械の異常判定を行う機能を備えた数値制御装置
WO2011153520A1 (en) * 2010-06-04 2011-12-08 The Gleason Works Adaptive control of a machining process
JP2012032869A (ja) 2010-07-28 2012-02-16 Okouchi Kinzoku Co Ltd 円盤刃物送り制御方法,装置およびそれを用いた切断装置
CN104010910A (zh) * 2011-12-22 2014-08-27 斯堪尼亚商用车有限公司 用于确定车辆控制系统的参考值的方法和模块
CN103576615A (zh) * 2012-07-30 2014-02-12 台中精机厂股份有限公司 工具机智能化适应性定负载切削控制方法与系统
CN104635621A (zh) * 2013-11-08 2015-05-20 沈阳高精数控技术有限公司 基于现场总线的xy工作台过象限凸起补偿方法
JP6243260B2 (ja) * 2013-12-16 2017-12-06 国立大学法人 東京大学 主軸モータの制御装置
JP5987081B1 (ja) * 2015-04-02 2016-09-06 ファナック株式会社 基準軸を切り替えて学習制御を行うサーボ制御装置
JP5997330B1 (ja) * 2015-07-31 2016-09-28 ファナック株式会社 主軸交換の要否を判定できる機械学習装置、主軸交換判定装置、制御装置、工作機械及び生産システム、並びに機械学習方法
JP6063016B1 (ja) * 2015-09-29 2017-01-18 ファナック株式会社 電動機に対する動作指令を学習する機械学習方法および機械学習装置並びに該機械学習装置を備えた工作機械
JP5969676B1 (ja) * 2015-09-30 2016-08-17 ファナック株式会社 工作機械の工具補正の頻度を最適化する機械学習装置及び機械学習方法、並びに該機械学習装置を備えた工作機械
JP6174649B2 (ja) * 2015-09-30 2017-08-02 ファナック株式会社 ファンモータの予防保全機能を備えたモータ駆動装置
JP6031202B1 (ja) * 2016-01-29 2016-11-24 ファナック株式会社 製造機械の異常の原因を発見するセル制御装置
CN106338970B (zh) * 2016-11-17 2018-09-07 沈阳工业大学 一种五轴联动数控机床伺服系统控制方法
JP6457472B2 (ja) 2016-12-14 2019-01-23 ファナック株式会社 制御システム及び機械学習装置

Also Published As

Publication number Publication date
JP2018120357A (ja) 2018-08-02
CN108345273B (zh) 2020-03-17
US10466658B2 (en) 2019-11-05
US20180210406A1 (en) 2018-07-26
CN108345273A (zh) 2018-07-31
DE102018000342A1 (de) 2018-07-26

Similar Documents

Publication Publication Date Title
JP6457563B2 (ja) 数値制御装置及び機械学習装置
JP6457472B2 (ja) 制御システム及び機械学習装置
JP6470251B2 (ja) 数値制御装置及び機械学習装置
KR102168264B1 (ko) 이동축 이상 부하 경고 기능을 갖는 와이어 방전 가공기
JP6063013B1 (ja) びびり或いは工具摩耗/破損の発生を抑制する加工条件調整機能を有する数値制御装置
JP5969676B1 (ja) 工作機械の工具補正の頻度を最適化する機械学習装置及び機械学習方法、並びに該機械学習装置を備えた工作機械
JP6063016B1 (ja) 電動機に対する動作指令を学習する機械学習方法および機械学習装置並びに該機械学習装置を備えた工作機械
US10289075B2 (en) Machine learning apparatus for optimizing cycle processing time of processing machine, motor control apparatus, processing machine, and machine learning method
JP6680756B2 (ja) 制御装置及び機械学習装置
JP6348098B2 (ja) 機械学習を使った中子の溶着位置決定機能を備えたワイヤ放電加工機のシミュレーション装置
JP6219897B2 (ja) 最適な加減速を生成する工作機械
JP6169655B2 (ja) 工作機械、シミュレーション装置、及び機械学習器
JP6077617B1 (ja) 最適な速度分布を生成する工作機械
JP6412086B2 (ja) 数値制御装置
CN108427378B (zh) 数值控制装置

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20180621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A132

Effective date: 20180626

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181220

R150 Certificate of patent or registration of utility model

Ref document number: 6457563

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150