JP2018130798A - 数値制御装置 - Google Patents

数値制御装置 Download PDF

Info

Publication number
JP2018130798A
JP2018130798A JP2017026152A JP2017026152A JP2018130798A JP 2018130798 A JP2018130798 A JP 2018130798A JP 2017026152 A JP2017026152 A JP 2017026152A JP 2017026152 A JP2017026152 A JP 2017026152A JP 2018130798 A JP2018130798 A JP 2018130798A
Authority
JP
Japan
Prior art keywords
workpiece
pressing force
learning
numerical control
tailstock
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017026152A
Other languages
English (en)
Other versions
JP6502976B2 (ja
Inventor
俊大 渡邉
Toshihiro Watanabe
俊大 渡邉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fanuc Corp
Original Assignee
Fanuc Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fanuc Corp filed Critical Fanuc Corp
Priority to JP2017026152A priority Critical patent/JP6502976B2/ja
Priority to US15/890,661 priority patent/US10698380B2/en
Priority to DE102018001028.8A priority patent/DE102018001028B4/de
Priority to CN201810151905.7A priority patent/CN108427378B/zh
Publication of JP2018130798A publication Critical patent/JP2018130798A/ja
Application granted granted Critical
Publication of JP6502976B2 publication Critical patent/JP6502976B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/404Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by control arrangements for compensation, e.g. for backlash, overshoot, tool offset, tool wear, temperature, machine construction errors, load, inertia
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/4097Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by using design data to control NC machines, e.g. CAD/CAM
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/32Operator till task planning
    • G05B2219/32334Use of reinforcement learning, agent acts, receives reward
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/32Operator till task planning
    • G05B2219/32346Using acd, activity cycle diagram
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/33Director till display
    • G05B2219/33034Online learning, training
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/36Nc in input of data, input key till input tape
    • G05B2219/36204Lathe, turning
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/37Measurements
    • G05B2219/37232Wear, breakage detection derived from tailstock, headstock or rest
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/49Nc machine tool, till multiple
    • G05B2219/49356Tool with constant force against workpiece during machining

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Human Computer Interaction (AREA)
  • Manufacturing & Machinery (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Numerical Control (AREA)
  • Automatic Control Of Machine Tools (AREA)
  • Machine Tool Sensing Apparatuses (AREA)
  • Turning (AREA)

Abstract

【課題】最適なテールストック押付け力を自動計算することが可能な数値制御装置を提供する。
【解決手段】数値制御装置1は、旋盤加工時のワークの挙動を安定させるためのテールストック押付け力を機械学習により算出するテールストック押付け力算出部を有する。数値制御装置1は、現在のワークの形状を含む前提条件を取得し、現在のテールストック押付け力を状態情報として取得し、現在の前記ワークの振動、又は変位、あるいはテールストック軸の消費電力のうち少なくともいずれか1つを判定データとして取得し、判定データに基づいて価値関数を更新し、価値関数に基づいて状態情報の調整値を出力することを特徴とする。
【選択図】図8

Description

本発明は数値制御装置に関し、特に最適なテールストック押付け力を自動計算することが可能な数値制御装置に関する。
ワーク(特に長尺材)の旋盤加工を行う際、加工精度を向上させるための方法としてテールストックがある。図1は、主軸とともに回転するワークを旋盤加工する場合における、テールストックの有無による挙動の差を示す模式図である。図1左図のようにテールストック無しでワークの旋盤加工を行う場合に比べ、図1右図のようにワークに対し回転軸方向の押付け力を作用させるテールストックを施した場合の方が、ワークの振幅が小さくなることが知られている。近年のNC旋盤(数値制御装置が制御する旋盤)には、加工プログラムによってテールストック押付け力を指令できるものもある。この場合は、数値制御装置が、加工プログラムに従ってテールストック押付け力の指令値をテールストック軸サーボに転送し、テールストック軸サーボがトルクを一定に保つ制御を行うことにより、一定のテールストック押付け力がワークに加えられることになる。
一般に、テールストック押付け力が大きいほど加工精度は向上し、テールストック押付け力が不十分であると精度向上という目的を十分に達成できない。但し、テールストック押付け力が大きすぎると、図2左図に示すようにワークを変形させる可能性がある。また、図2右図に示すように、ワークの形状によってはワークを折損させる可能性もある。ワークの材質が硬ければワークの変形や折損は抑制されるかもしれないが、その代わりに工作機械にダメージを与える懸念がある。加えて、大きすぎるテールストック押付け力は消費電力の浪費を招く。したがって、テールストック押付け力は最適な大きさに調整される必要がある。
従来、テールストック押付け力は人手で調整されていた。すなわち、ユーザは、ワークの状態を観察しつつ、加工プログラム中のテールストック押付け力のプログラム指令を編集する必要があった。また、加工に伴うワークの形状変化に応じてテールストック押付け力もリアルタイムに変化させたいという場合には、ユーザはテールストック押付け力を変化させるためのプログラム指令を都度挿入する必要があった。例えば、図2右図に示すようにワークが加工により徐々に細くなっていく場合には、折損を防ぐためテールストック押付け力を段階的に弱めることが考えられるが、これを実現するには、ユーザがテールストック押付け力を変更するためのプログラム指令を加工プログラムに挿入する手数が必要であった。
関連する従来技術として特許文献1がある。特許文献1には、ワークの仕様に基づいてテールストック押付け力を決定する機能を備えたNC旋盤が開示されている。
特開平10−080802号公報
しかしながら、特許文献1は、加工中のワークの形状変化に対し、適応的にテールストック押付け力を調整する技術を開示していない。また、特許文献1は、テールストック力を発生に伴う消費電力を抑制する、換言すればテールストック押付け力の無駄遣いを抑制するという観点に基づくテールストック押付け力の調整方法を開示していない。
本発明はこのような問題点を解決するためになされたものであり、最適なテールストック押付け力を自動計算することが可能な数値制御装置を提供することを目的とする。
本発明の一実施の形態にかかる数値制御装置は、旋盤加工時のワークの挙動を安定させるためのテールストック押付け力を機械学習により算出するテールストック押付け力算出部を有する数値制御装置であって、前記数値制御装置は、現在の前記ワークの形状を含む前提条件を取得し、現在のテールストック押付け力を状態情報として取得し、現在の前記ワークの振動、又は変位、あるいはテールストック軸の消費電力のうち少なくともいずれか1つを判定データとして取得し、前記判定データに基づいて価値関数を更新し、前記価値関数に基づいて前記状態情報の調整値を出力することを特徴とする。
他の実施の形態にかかる数値制御装置では、現在の前記ワークの形状は、前記ワークの直径を用いて表現されることを特徴とする。
他の実施の形態にかかる数値制御装置では、現在の前記ワークの形状は、前記ワークの画像より取得される特徴量により表現されることを特徴とする。
他の実施の形態にかかる数値制御装置では、前記判定データは、工具に設けられたセンサ、並びに、主軸、工具制御軸又はテールストック軸のモータのうち、少なくともいずれか1つから取得されることを特徴とする。
本発明によれば、最適なテールストック押付け力を自動計算することが可能な数値制御装置を提供することができる。
テールストックの有無による加工精度への影響を説明する図である。 テールストック押付け力の最適化の必要性を説明する図である。 本実施の形態の数値制御装置1の動作を示す図である。 本実施の形態の数値制御装置1の動作を示す図である。 本実施の形態の数値制御装置1の動作を示す図である。 本実施の形態の数値制御装置1の動作を示す図である。 本実施の形態の数値制御装置1の動作を示す図である。 本実施の形態の数値制御装置1の動作と構成を示す図である。
以下、本発明の実施の形態を図面を用いて説明する。
本発明では、NC旋盤を制御する数値制御装置に対して人工知能となる機械学習器を導入する。機械学習器には、加工対象となるワークの形状、ワークの材質、主軸回転数、切込み量などの各値を加工の前提条件として与え、テールストック押付け力を加えた場合におけるワーク旋盤加工のシミュレーションを行う。この際、テールストック押付け力の大きさを加工の状態に係るデータとし、該加工状態に係るデータに対するテールストック押付け力の大きさの調整に関する機械学習を行うことで、加工の前提条件に応じた最適なテールストック押付け力の大きさを導出できるようにする。
以下では、本発明で導入する機械学習について簡単に説明する。
<1.機械学習>
ここで、機械学習について簡単に説明する。機械学習は、機械学習を行う装置(以下、機械学習器)に入力されるデータの集合から、その中にある有用な規則や知識表現、判断基準などを解析により抽出し、その判断結果を出力すると共に、知識の学習を行うことで実現される。機械学習の手法は様々であるが、大別すれば「教師あり学習」、「教師なし学習」、「強化学習」に分けられる。さらに、これらの手法を実現する上で、特徴量そのものの抽出を学習する、「深層学習」と呼ばれる手法がある。
「教師あり学習」とは、ある入力と結果(ラベル)のデータの組を大量に機械学習器に与えることで、それらのデータセットにある特徴を学習し、入力から結果を推定するモデル、即ち、その関係性を帰納的に獲得することができる。これは後述のニューラルネットワークなどのアルゴリズムを用いて実現することができる。
「教師なし学習」とは、入力データのみを大量に学習装置に与えることで、入力データがどのような分布をしているか学習し、対応する教師出力データを与えなくても、入力データに対して圧縮、分類、整形などを行う装置を学習する手法である。それらのデータセットにある特徴を似た者どうしにクラスタリングすることなどができる。この結果を使って、何らかの基準を設けてそれを最適にするような出力の割り当てを行うことで、出力の予測を実現することができる。また「教師なし学習」と「教師あり学習」との中間的な問題設定として、「半教師あり学習」と呼ばれるものもあり、これは一部のみ入力と出力のデータの組が存在し、それ以外は入力のみのデータである場合がこれに当たる。本実施形態においては、実際に加工機を動作させなくても取得することが出来るデータを教師なし学習で利用し、学習を効率的に行うことが出来る。
「強化学習」とは、判定や分類だけではなく、行動を学習することにより、環境に行動が与える相互作用を踏まえて適切な行動を学習、即ち、将来的に得られる報酬を最大にするための学習する方法である。強化学習においては、機械学習器は行動が引き起こす結果を全く知らない状態から、または不完全にしか知らない状態から学習はスタートすることができる。また、人間の動作を真似るように事前学習(前述の教師あり学習や、逆強化学習といった手法)した状態を初期状態として、良いスタート地点から学習をスタートさせることもできる。
なお、NC旋盤のような加工機に対して機械学習を適用する場合、加工機が実際に動作して初めて、その結果をデータとして得ることが出来ること、即ち、試行錯誤しながら最適な行動を探索する必要があることを考慮する必要がある。そこで、本発明では、機械学習器の主たる学習アルゴリズムとして報酬を与えることで機械学習器が目標到達のための行動を自動的に学習する強化学習のアルゴリズムを採用している。
図5は、強化学習アルゴリズムの基本的な概念を説明する図である。強化学習においては、学習する主体となるエージェント(機械学習器)と、制御対象となる環境(制御対象システム)とのやりとりにより、エージェントの学習と行動が進められる。より具体的には、(1)エージェントはある時点における環境の状態stを観測し、(2)観測結果と過去の学習に基づいて自分が取れる行動atを選択して行動atを実行し、(3)何らかの規則および行動atの実行に基づいて環境の状態stが次の状態st+1へと変化し、(4)行動atの結果としての状態の変化に基づいてエージェントが報酬rt+1を受け取り、(5)エージェントが状態st、行動at、報酬rt+1および過去の学習の結果に基づいて学習を進める、といったやりとりがエージェントと環境の間で行われる。
強化学習の初期の段階では、エージェントは(2)の行動選択において環境の状態stに対する最適な行動atを選択するための価値判断の基準が全く分かっていない。そこで、エージェントは或る状態stの元で様々な行動atを選択し、その時の行動atに対して与えられた報酬rt+1に基づいて、より良い行動の選択、すなわち正しい価値判断の基準を学習していく。
上記した(5)における学習においては、エ−ジェントは将来取得できる報酬の量を判断するための基準となる情報として、観測された状態st,行動at,報酬rt+1のマッピングを獲得する。例えば、各時刻において取り得る状態の個数がm、取り得る行動の個数がnとすると、行動を繰り返すことによって状態stと行動atの組に対する報酬rt+1を記憶するm×nの2次元配列が得られる。
そして、上記得られたマッピングに基づいて選択した状態や行動がどのくらい良いのかを示す関数である価値関数(評価関数)を用い、行動を繰り返す中で価値関数(評価関数)を更新していくことにより状態に対する最適な行動を学習していく。
状態価値関数は、ある状態stがどのくらい良い状態であるのかを示す価値関数である。状態価値関数は、状態を引数とする関数として表現され、行動を繰り返す中での学習において、ある状態における行動に対して得られた報酬や、該行動により移行する未来の状態の価値などに基づいて更新される。状態価値関数の更新式は強化学習のアルゴリズムに応じて定義されており、例えば、強化学習アルゴリズムの1つであるTD学習においては、状態価値関数は以下の数1式で更新される。なお、数1式においてαは学習係数、γは割引率と呼ばれ、0<α≦1、0<γ≦1の範囲で定義される。
また、行動価値関数は、ある状態stにおいて行動atがどのくらい良い行動であるのかを示す価値関数である。行動価値関数は、状態と行動を引数とする関数として表現され、行動を繰り返す中での学習において、ある状態における行動に対して得られた報酬や、該行動により移行する未来の状態における行動の価値などに基づいて更新される。行動価値関数の更新式は強化学習のアルゴリズムに応じて定義されており、例えば、代表的な強化学習アルゴリズムの1つであるQ学習においては、行動価値関数は以下の数2式で更新される。なお、数2式においてαは学習係数、γは割引率と呼ばれ、0<α≦1、0<γ≦1の範囲で定義される。
この式は、行動atの結果帰ってきた報酬rt+1を元に、状態stにおける行動atの評価値Q(st,at)を更新する方法を表している。状態stにおける行動atの評価値Q(st,at)よりも、報酬rt+1+行動atによる次の状態における最良の行動max(a)の評価値Q(st+1,max(a))の方が大きければ、Q(st,at)を大きくするし、反対に小さければ、Q(st,at)も小さくする事を示している。つまり、ある状態におけるある行動の価値を、結果として即時帰ってくる報酬と、その行動による次の状態における最良の行動の価値に近付けるようにしている。
Q学習においては、このような更新を繰り返すことで、最終的にQ(st,at)が期待値E[Σγtt]となるようにすることを目指す(期待値は最適な行動に従って状態変化した時についてとる。もちろん、それは分かっていないので、探索しながら学習しなければならない)。
そして、上記した(2)における行動の選択においては、過去の学習によって作成された価値関数(評価関数)を用いて現在の状態stにおいて将来にわたっての報酬(rt+1+rt+2+…)が最大となる行動at(状態価値関数を用いている場合には、もっとも価値の高い状態へ移るための行動、行動価値関数を用いている場合には該状態において最も価値の高い行動)を選択する。なお、エージェントの学習中には学習の進展を目的として(2)における行動の選択において一定の確率でランダムな行動を選択することもある(εグリーディ法)。
なお、学習結果としての価値関数(評価関数)を記憶する方法としては、すべての状態行動ペア(s,a)に対して、その値をテーブル(行動価値テーブル)として保持しておく方法や、上記価値関数を近似するような関数を用意する方法がある。後者の方法では、前述の更新式は、確率勾配降下法などの手法で近似関数のパラメータを調整していくことで実現することが出来る。近似関数としては、ニューラルネットワークなどの教師あり学習器を用いることが出来る。
ニューラルネットワークは、たとえば図6に示すようなニューロンのモデルを模したニューラルネットワークを実現する演算装置及びメモリ等で構成される。図6は、ニューロンのモデルを示す模式図である。
図6に示すように、ニューロンは、複数の入力x(ここでは一例として、入力x1〜入力x3)に対する出力yを出力するものである。各入力x1〜x3には、この入力xに対応する重みw(w1〜w3)が掛けられる。これにより、ニューロンは、次の数3式により表現される出力yを出力する。なお、数3式において、入力x、出力y及び重みwは、すべてベクトルである。また、θはバイアスであり、fkは活性化関数である。
次に、上述したニューロンを組み合わせた3層の重みを有するニューラルネットワークについて、図7を参照して説明する。図7は、D1〜D3の3層の重みを有するニューラルネットワークを示す模式図である。図7に示すように、ニューラルネットワークの左側から複数の入力x(ここでは一例として、入力x1〜入力x3)が入力され、右側から結果y(ここでは一例として、結果y1〜結果y3)が出力される。
具体的には、入力x1〜入力x3は、3つのニューロンN11〜N13の各々に対して対応する重みが掛けられて入力される。これらの入力に掛けられる重みはまとめてw1と標記されている。ニューロンN11〜N13は、それぞれ、z11〜z13を出力する。これらのz11〜z13はまとめて特徴ベクトルz1と標記され、入力ベクトルの特徴量を抽出したベクトルとみなすことができる。この特徴ベクトルz1は、重みw1と重みw2との間の特徴ベクトルである。
z11〜z13は、2つのニューロンN21、N22の各々に対して対応する重みが掛けられて入力される。これらの特徴ベクトルに掛けられる重みは、まとめてw2と標記されている。ニューロンN21、N22は、それぞれ、z21、z22を出力する。これらは、まとめて特徴ベクトルz2と標記されている。この特徴ベクトルz2は、重みw2と重みw3との間の特徴ベクトルである。
特徴ベクトルz21、z22は、3つのニューロンN31〜N33の各々に対して対応する重みが掛けられて入力される。これらの特徴ベクトルに掛けられる重みは、まとめてw3と標記されている。
最後に、ニューロンN31〜N33は、それぞれ、結果y1〜結果y3を出力する。
ニューラルネットワークの動作には、学習モードと価値予測モードとがあり、学習モードにおいて学習データセットを用いて重みwを学習し、そのパラメータを用いて予測モードにおいて加工機の行動判断を行う(便宜上、予測と書いたが、検出、分類、推論など多様なタスクが可能である)。
予測モードで実際に加工機を動かして得られたデータを即時学習し、次の行動に反映させる(オンライン学習)ことも、あらかじめ収集しておいたデータ群を用いてまとめた学習を行い、以降はずっとそのパラメータで検知モードを行う(バッチ学習)こともできる。その中間的な、ある程度データが溜まるたびに学習モードを挟むということも可能である。
重みw1〜w3は、誤差逆伝搬法(バックプロパゲーション)により学習可能なものである。誤差の情報は、右側から入り左側に流れる。誤差逆伝搬法は、各ニューロンについて、入力xが入力されたときの出力yと真の出力y(教師)との差分を小さくするように、それぞれの重みを調整(学習)する手法である。
ニューラルネットワークは、3層以上にさらに層を増やすことも可能である(深層学習と称される)。入力の特徴抽出を段階的に行い、結果を回帰する演算装置を、教師データのみから自動的に獲得することが可能である。
このようなニューラルネットワークを近似関数として用いることで、上記した強化学習の過程における(1)〜(5)を繰り返しつつ上記した価値関数(評価関数)をニューラルネットワークとして記憶して学習を進めることができる。
ある環境において学習が終了した後に、新たな環境におかれた場合でも追加の学習を行うことでその環境に適応するように学習を進めることができる。したがって、本発明のようにテールストック押付け力の大きさの調整に適用することで、新しい加工の前提条件(加工対象となるワークの形状、ワークの材質、主軸回転数、切込み量など)に適用したりする場合であっても、過去のテールストック押付け力の大きさの調整の学習に、新たな加工の前提条件における追加の学習をすることで、テールストック押付け力の大きさの調整の学習を短時間で行うことが可能となる。
また、強化学習においては、複数のエージェントをネットワークなどを介して接続したシステムとし、エージェント間で状態s、行動a、報酬rなどの情報を共有してそれぞれの学習に利用することで、それぞれのエージェントが他のエージェントの環境も考慮して学習をする分散強化学習を行うことで効率的な学習を行うことができる。本発明においても、複数の環境(数値制御装置)に組み込まれた複数のエージェント(機械学習器)がネットワークなどを介して接続された状態で分散機械学習を行うことで、数値制御装置におけるテールストック押付け力の大きさの調整の学習を効率的に行わせることができるようになる。
なお、強化学習のアルゴリズムとしては、Q学習、SARSA法、TD学習、AC法など様々な手法が周知となっているが、本発明に適用する方法としていずれの強化学習アルゴリズムを採用してもよい。上記したそれぞれの強化学習アルゴリズムは周知なので、本明細書における各アルゴリズムの詳細な説明は省略する。
以下、機械学習器を導入した本発明の数値制御装置について、具体的な実施形態に基づいて説明する。
<2.実施形態>
図8は、本発明の一実施形態における数値制御装置1におけるテールストック押付け力の大きさの調整の機械学習プロセスを示す図である。なお、図8には本実施形態における数値制御装置1での機械学習プロセスの説明に必要な構成のみを示している。
数値制御装置1は、テールストック押付け力算出部10、動作評価部11、機械学習器20を有する。機械学習器20は、環境(<1.機械学習>で説明した状態st)を特定するための情報として、加工の前提条件を入力する。テールストック押付け力の大きさを、状態情報として入力する。また、機械学習器20は、テールストック押付け力の大きさの調整行動を環境に対して出力する(<1.機械学習>で説明した行動at)。
数値制御装置1に前提条件として入力されるデータについて説明する。数値制御装置1は、主軸モータが備えるセンサを用いて主軸回転数を取得する。また、数値制御装置1は、テールストック軸モータが備えるセンサよりトルクを取得し、これをテールストック押付け力とみなす。また、数値制御装置1は、ワークの材質を加工情報から特定する。また、数値制御装置1は、CAD/CAMデータ及びプログラムの進行度から、現在のワークの形状及び切込み量を特定する。これらの情報が、前提条件として機械学習器20に入力される。
現在のワークの形状及び切込み量の特定処理について更に詳しく説明する。数値制御装置1は、ワークの完成形を定義したCAD/CAMデータ、加工プログラムの実行中ブロック、及び実行中ブロックの残り移動量をそれぞれ公知の手法により取得する。現在の切込み量は、CAD/CAMデータ及び加工プログラムの実行中ブロックから特定できる。現在のワークの形状を機械学習器20に入力可能なデータとして表現する方法は種々考えられる。以下に幾つかの例を示す。
方法1:数値制御装置1は、CAD/CAMデータ、加工プログラムの実行中ブロック、及び実行中ブロックの残り移動量に基づいて、現在のワークの形状を想定する。図3上図において、破線の矩形は加工前のワークの形状を示している。矢印の実線部は加工プログラムの既に実行されたブロック、矢印の破線部は加工プログラムの実行中ブロックの残り移動量を示す。図3下図に、これらから想定される現在のワーク形状及び切込み量を示す。次に、数値制御装置1は、現在のワーク形状のZ軸方向の一方の端面から他方の端面までの間に、一定間隔で(N−1)個の計測点を設定し、各計測点及びワーク両端におけるワークの直径をそれぞれ算出する。そして、これらN個の直径の値を要素として含むN次元ベクトルを作成し、このベクトルを現在のワーク形状を示すデータとする。なお、ワークの大きさにかかわらず計測点の数を固定化しておけば、どのような大きさのワークも同じN次元ベクトルの形で表すことが可能である。
方法2:数値制御装置1は、CAD/CAMデータ、加工プログラムの実行中ブロック、及び実行中ブロックの残り移動量から、現在まで実行した各ブロックの始点又は終点におけるワークの径とテールストック位置からのZ方向の移動量との組み合わせを抽出する。そして、これらの組合せの履歴を要素として含む多次元ベクトルを生成して、当該ベクトルを現在のワーク形状を示すデータとする。例えば、図3上図において、N1ブロックの始点又は終点におけるワークの径がp、移動量がP、N3ブロックの始点又は終点におけるワークの径がq、移動量がQ、N5ブロックの始点又は終点におけるワークの径がr、移動量がR、N7ブロックの始点又は終点におけるワークの径がs、現在までの移動量がSであるとする。このとき、数値制御装置1は、多次元ベクトルM(p,P,q,Q,r,R,s,S)を作成し、このベクトルMにより現在のワーク形状を表現する。
方法3:数値制御装置1は、CAD/CAMデータ、加工プログラムの実行中ブロック、及び実行中ブロックの残り移動量に基づいて、現在のワーク形状の3次元モデル、又は当該3次元モデルを投影した2次元画像を作成する。次に、数値制御装置1は、当該モデル又は画像から公知の手法により特徴点を抽出し、当該特徴点を現在のワーク形状を表現するデータとする。なお、数値制御装置1は、図示しない撮影装置により加工中のワークを実際に撮影し、撮影画像から抽出される特徴点をもって現在のワーク形状を表現することとしても良い。
また、機械学習器20は、テールストック押付け力を状態情報として入力する。ここで、初回のテールストック押付け力は、例えば特許文献1などの従来技術の手法を用いて決定するようにしてもよく、作業者に適宜入力させるようにしてもよい。
動作評価部11は、状態情報としてテールストック押付け力が入力されると、それに対して与えられる報酬(<1.機械学習>で説明した報酬rt)を計算する。以下に、報酬条件の例を示す。
報酬1:ワークの振動や変位の大小(プラス・マイナス報酬)
数値制御装置1は、ワークの振動やたわみを検出し、これらが大きい場合には、その度合いに応じてマイナスの報酬を与える。一方、これらが0に近いほどプラスの報酬を与える。典型的には、ワークの振動やたわみの大小は、工具に設けられた振動センサや変位センサ、主軸負荷、工具の各制御軸方向の負荷、及びテールストック軸の負荷等に基づいて求めることが可能である。
報酬2:テールストック軸の消費電力の大小(プラス・マイナス報酬)
数値制御装置1は、テールストック軸の消費電力を推定し、これらが大きい場合には、その度合いに応じてマイナスの報酬を与える。一方、これらが0に近いほどプラスの報酬を与える。典型的には、テールストック軸の消費電力の大小は、テールストック軸のモータ電流値や抵抗値に基づいて求めることが可能である。
なお、いずれのデータに基づいて報酬を決定するのかについては、作業者が適宜設定するようにしてもよい。
機械学習器20は、動作評価部11の評価結果に従って、価値関数を更新する。例えばQ学習はActor−Critic等の公知の手法により、できるだけ大きな報酬が得られるテールストック押付け力の調整を出力するよう、価値関数を更新してゆく。
このように、数値制御装置1は上述の入力データ、出力データ、報酬に基づいて機械学習を行う。機械学習においては、ある時刻tにおいて、入力データの組み合わせにより状態stが定義され、定義された状態stに対して行われるテールストック押付け力の調整が行動atとなり、そして、行動atによりテールストック押付け力の調整が行われた結果として新たに得られた入力データに基づいて評価計算された値が報酬rt+1となり、これを<1.機械学習>で説明したように、機械学習のアルゴリズムに応じた価値関数(評価関数)の更新式に当てはめることにより学習を進める。すなわち、機械学習器20は、入力された前提条件及び状態データと、自身が行ったテールストック押付け力の調整結果、および報酬計算部24で計算された報酬とに基づいて機械学習(強化学習)を行う。
図4のフローチャートを用いて、数値制御装置1が行う機械学習の流れを説明する。
ステップS101:
機械学習器20は、ワークの材質、現在のワーク形状、現在の切込み量、主軸回転数などの前提条件と、状態情報であるテールストック押付け力とを入力する。なお、初回はテールストック押付け力として何らかの初期値が与えられる。
ステップS102:
テールストック押付け力算出部10は、現時点で最適なテールストック押付け力を算出する。すなわち、テールストック押付け力の調整が既に出力されていれば、ステップS101で入力されたテールストック押付け力に、テールストック押付け力の調整を加える。
ステップS103:
動作評価部11は、ステップS102で調整されたテールストック押付け力に対する報酬を計算するため、判定データを取得する。例えば、ワークの振動や変位、テールストック軸の消費電力等を計算する。
ステップS104乃至S106:
動作評価部11は、ステップS103で取得した判定データと、予め定められた判定条件とに基づいて、報酬を計算する。例えば、ワークの振動や変位、あるいはテールストックの消費電力が大きければ報酬を大きくし、ワークの振動や変位、あるいはテールストックの消費電力が0に近ければ報酬を小さくする。
ステップS107:
機械学習器20は、動作評価部11の計算した報酬に従って価値観数を更新し、テールストック押付け力の調整を計算して出力する。
ステップS108:
数値制御装置1は、加工が終了するまでの間、上述の一連の処理を繰り返し実行する。このように機械学習を繰り返すことにより、より優れた学習結果を得ることができるようになる。
なお、上記学習が完了した学習データを用いてNC旋盤を運転する際には、機械学習器20は新たな学習を行なわないようにしてNC旋盤に取り付け、学習完了時の学習データをそのまま使用して運転をするようにしてもよい。
また、学習が完了した機械学習器20(または、他の機械学習器20の完了した学習データを学習結果記憶部26に複写した機械学習器20)を他のNC旋盤に取付けて、学習完了時の学習データをそのまま使用して運転をするようにしてもよい。
機械学習器20は単独で機械学習をするようにしてもよいが、複数の数値制御装置1がそれぞれ外部との通信手段を更に備えると、それぞれの学習結果を送受信して共有することが可能となり、より効率良く機械学習を行うことができる。
このように複数の数値制御装置1の間でやり取りする際には、通信は図示しない管理装置等を経由しても良いし、直接数値制御装置1同士が通信しても構わないし、クラウドを使用しても構わないが、大量のデータを取り扱う場合があるため、なるべく通信速度が速い通信手段が好ましい。
本実施の形態によれば、数値制御装置は、ワークの振動や変位、あるいはテールストック軸の消費電力がなるべく低くなるようにテールストック押付け力を自動的に調整する。これにより、ユーザはテールストック押付け力を手作業で調整する必要がない。また、従来は最適化する手法が提案されていなかったテールストック軸の消費電力についても、なるべくこれを抑制するよう、テールストック押付け力が自動的に調整される。
以上、本発明の実施の形態について説明したが、本発明は上述した実施の形態の例のみに限定されることなく、適宜の変更を加えることにより様々な態様で実施することができる。
1 数値制御装置
10 テールストック押付け力算出部
11 動作評価部
20 機械学習器

Claims (4)

  1. 旋盤加工時のワークの挙動を安定させるためのテールストック押付け力を機械学習により算出するテールストック押付け力算出部を有する数値制御装置であって、
    前記数値制御装置は、
    現在の前記ワークの形状を含む前提条件を取得し、
    現在のテールストック押付け力を状態情報として取得し、
    現在の前記ワークの振動、又は変位、あるいはテールストック軸の消費電力のうち少なくともいずれか1つを判定データとして取得し、
    前記判定データに基づいて価値関数を更新し、前記価値関数に基づいて前記状態情報の調整値を出力することを特徴とする
    数値制御装置。
  2. 現在の前記ワークの形状は、前記ワークの直径を用いて表現されることを特徴とする
    請求項1記載の数値制御装置。
  3. 現在の前記ワークの形状は、前記ワークの画像より取得される特徴量により表現されることを特徴とする
    請求項1記載の数値制御装置。
  4. 前記判定データは、工具に設けられたセンサ、並びに、主軸、工具制御軸又はテールストック軸のモータのうち、少なくともいずれか1つから取得されることを特徴とする
    請求項1記載の数値制御装置。
JP2017026152A 2017-02-15 2017-02-15 数値制御装置 Active JP6502976B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2017026152A JP6502976B2 (ja) 2017-02-15 2017-02-15 数値制御装置
US15/890,661 US10698380B2 (en) 2017-02-15 2018-02-07 Numerical controller
DE102018001028.8A DE102018001028B4 (de) 2017-02-15 2018-02-08 Numerische Steuerung
CN201810151905.7A CN108427378B (zh) 2017-02-15 2018-02-14 数值控制装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017026152A JP6502976B2 (ja) 2017-02-15 2017-02-15 数値制御装置

Publications (2)

Publication Number Publication Date
JP2018130798A true JP2018130798A (ja) 2018-08-23
JP6502976B2 JP6502976B2 (ja) 2019-04-17

Family

ID=62982771

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017026152A Active JP6502976B2 (ja) 2017-02-15 2017-02-15 数値制御装置

Country Status (4)

Country Link
US (1) US10698380B2 (ja)
JP (1) JP6502976B2 (ja)
CN (1) CN108427378B (ja)
DE (1) DE102018001028B4 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024095430A1 (ja) * 2022-11-03 2024-05-10 株式会社ジェイテクト 工作機械および加圧力設定方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6484265B2 (ja) * 2017-02-15 2019-03-13 ファナック株式会社 学習制御機能を備えたロボットシステム及び学習制御方法
JP6940474B2 (ja) * 2018-12-05 2021-09-29 ファナック株式会社 工作機械
IT202100018137A1 (it) * 2021-07-09 2023-01-09 Luca Toncelli Macchina utensile e metodo per la lavorazione di manufatti

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0655310A (ja) * 1992-08-11 1994-03-01 Nakamura Tome Precision Ind Co Ltd Ncテールストック及びその制御方法
JPH1080802A (ja) * 1996-09-05 1998-03-31 Daikin Ind Ltd テールストックの押付力制御装置
JP2005199404A (ja) * 2004-01-16 2005-07-28 Ricoh Co Ltd 回転センタ、押圧力制御装置、旋盤、旋削方法、及び旋削加工品の製造方法
JP2010120133A (ja) * 2008-11-20 2010-06-03 Okuma Corp 心押制御装置
JP6063016B1 (ja) * 2015-09-29 2017-01-18 ファナック株式会社 電動機に対する動作指令を学習する機械学習方法および機械学習装置並びに該機械学習装置を備えた工作機械

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR920002268A (ko) * 1990-07-17 1992-02-28 유끼노리 가까즈 인텔리젠트가공장치
DE4208701C2 (de) 1992-03-18 1995-07-13 Weiler Werkzeugmaschinen Gmbh Verfahren zum Einspannen eines Werkstücks in einer CNC-Drehmaschine
JP3259371B2 (ja) * 1992-11-17 2002-02-25 三菱電機株式会社 工作機械のワーク保持方法及びその装置
JP2861715B2 (ja) * 1993-02-18 1999-02-24 信越半導体株式会社 インゴット円筒研削機における空回転防止装置
US7341410B2 (en) * 2003-03-10 2008-03-11 Foster-Miller, Inc. Dynamical instrument for machining
WO2011010528A1 (ja) * 2009-07-22 2011-01-27 株式会社ジェイテクト 工作物のスリップ防止方法および装置
JP5331068B2 (ja) 2010-07-29 2013-10-30 新日本工機株式会社 数値制御装置
CN105033288B (zh) 2015-08-12 2017-07-28 北京兴华机械厂 一种高精度顶持力可测的柔性顶尖
JP6063013B1 (ja) 2015-08-27 2017-01-18 ファナック株式会社 びびり或いは工具摩耗/破損の発生を抑制する加工条件調整機能を有する数値制御装置
JP6709111B2 (ja) * 2016-06-01 2020-06-10 オークマ株式会社 工作機械
CN106112027B (zh) 2016-08-19 2018-04-03 浙江振兴阿祥集团有限公司 弹性复合顶紧机构及其中工件有无和受力状况的判断方法
CN106885736B (zh) 2017-03-23 2019-08-13 西安交通大学 一种主轴转子动刚度性能测试系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0655310A (ja) * 1992-08-11 1994-03-01 Nakamura Tome Precision Ind Co Ltd Ncテールストック及びその制御方法
JPH1080802A (ja) * 1996-09-05 1998-03-31 Daikin Ind Ltd テールストックの押付力制御装置
JP2005199404A (ja) * 2004-01-16 2005-07-28 Ricoh Co Ltd 回転センタ、押圧力制御装置、旋盤、旋削方法、及び旋削加工品の製造方法
JP2010120133A (ja) * 2008-11-20 2010-06-03 Okuma Corp 心押制御装置
JP6063016B1 (ja) * 2015-09-29 2017-01-18 ファナック株式会社 電動機に対する動作指令を学習する機械学習方法および機械学習装置並びに該機械学習装置を備えた工作機械

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024095430A1 (ja) * 2022-11-03 2024-05-10 株式会社ジェイテクト 工作機械および加圧力設定方法

Also Published As

Publication number Publication date
CN108427378B (zh) 2020-06-23
US20180231953A1 (en) 2018-08-16
JP6502976B2 (ja) 2019-04-17
CN108427378A (zh) 2018-08-21
US10698380B2 (en) 2020-06-30
DE102018001028A1 (de) 2018-08-16
DE102018001028B4 (de) 2024-03-21

Similar Documents

Publication Publication Date Title
JP6470251B2 (ja) 数値制御装置及び機械学習装置
JP6457472B2 (ja) 制御システム及び機械学習装置
JP6457563B2 (ja) 数値制御装置及び機械学習装置
JP6063016B1 (ja) 電動機に対する動作指令を学習する機械学習方法および機械学習装置並びに該機械学習装置を備えた工作機械
JP5969676B1 (ja) 工作機械の工具補正の頻度を最適化する機械学習装置及び機械学習方法、並びに該機械学習装置を備えた工作機械
JP6680756B2 (ja) 制御装置及び機械学習装置
JP6348098B2 (ja) 機械学習を使った中子の溶着位置決定機能を備えたワイヤ放電加工機のシミュレーション装置
JP6219897B2 (ja) 最適な加減速を生成する工作機械
KR102168264B1 (ko) 이동축 이상 부하 경고 기능을 갖는 와이어 방전 가공기
JP6063013B1 (ja) びびり或いは工具摩耗/破損の発生を抑制する加工条件調整機能を有する数値制御装置
JP6235543B2 (ja) 加工機のサイクル加工時間を最適化する機械学習装置、モータ制御装置、加工機、および機械学習方法
US10331104B2 (en) Machine tool, simulation apparatus, and machine learning device
JP6502976B2 (ja) 数値制御装置
JP6077617B1 (ja) 最適な速度分布を生成する工作機械
JP2017030067A (ja) 加工時間測定機能とオンマシン測定機能を有する制御装置付き加工装置
JP6490124B2 (ja) レーザ加工装置および機械学習装置
JP6412086B2 (ja) 数値制御装置
JP6659652B2 (ja) 加工条件調整装置及び機械学習装置
US11897066B2 (en) Simulation apparatus
JP2019185125A (ja) 制御装置及び機械学習装置

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20180618

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180920

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180925

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190322

R150 Certificate of patent or registration of utility model

Ref document number: 6502976

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150