JP6457421B2 - シミュレーション結果を利用して学習を行う機械学習装置,機械システム,製造システムおよび機械学習方法 - Google Patents

シミュレーション結果を利用して学習を行う機械学習装置,機械システム,製造システムおよび機械学習方法 Download PDF

Info

Publication number
JP6457421B2
JP6457421B2 JP2016075476A JP2016075476A JP6457421B2 JP 6457421 B2 JP6457421 B2 JP 6457421B2 JP 2016075476 A JP2016075476 A JP 2016075476A JP 2016075476 A JP2016075476 A JP 2016075476A JP 6457421 B2 JP6457421 B2 JP 6457421B2
Authority
JP
Japan
Prior art keywords
machine
control command
machine learning
learning
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016075476A
Other languages
English (en)
Other versions
JP2017185577A (ja
Inventor
中川 浩
中川  浩
貴史 梶山
貴史 梶山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FANUC Corp
Original Assignee
FANUC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FANUC Corp filed Critical FANUC Corp
Priority to JP2016075476A priority Critical patent/JP6457421B2/ja
Priority to DE102017002996.2A priority patent/DE102017002996B4/de
Priority to US15/472,395 priority patent/US10317854B2/en
Priority to CN201710213188.1A priority patent/CN107263464B/zh
Publication of JP2017185577A publication Critical patent/JP2017185577A/ja
Application granted granted Critical
Publication of JP6457421B2 publication Critical patent/JP6457421B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/163Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1664Programme controls characterised by programming, planning systems for manipulators characterised by motion, path, trajectory planning
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1671Programme controls characterised by programming, planning systems for manipulators characterised by simulation, either to verify existing program or to create and verify new program, CAD/CAM oriented, graphic oriented programming systems
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1694Programme controls characterised by use of sensors other than normal servo-feedback from position, speed or acceleration sensors, perception control, multi-sensor controlled systems, sensor fusion
    • B25J9/1697Vision controlled systems
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/406Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by monitoring or safety
    • G05B19/4063Monitoring general control system
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/39Robotics, robotics to robotics hand
    • G05B2219/39298Trajectory learning
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/40Robotics, robotics mapping to robotics vision
    • G05B2219/40515Integration of simulation and planning

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Automation & Control Theory (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Manufacturing & Machinery (AREA)
  • Manipulator (AREA)
  • Numerical Control (AREA)
  • Feedback Control In General (AREA)

Description

本発明は、シミュレーション結果を利用して学習を行う機械学習装置,機械システム,製造システムおよび機械学習方法に関する。
近年、例えば、ロボットなどの機械に対して機械学習を適用することが注目され、実用化のための研究・開発が行われている。例えば、機械の制御指令を学習するシステムにおいて、その機械を制御する制御指令が問題を有するものでないことを保証する必要がある。
ところで、従来、位置誤差をニューラルネットワークにより推定し、動作プログラムのデータを補正して動作する組立ロボットが開示されている(例えば、特許文献1参照)。
また、従来、仮想的なシステムモデルに対して、作業指令候補を繰り返し入力して学習することで、干渉しない最適な作業動作を獲得する装置も開示されている(例えば、特許文献2参照)。
特開平09−319420号公報 特許第5137537号公報
上述したように、機械に対して機械学習を適用したものとしては、様々な提案がなされているが、例えば、特許文献1において、得られた学習結果によっては、機械の制御指令が機械や周囲環境に対して干渉などを引き起こす虞がある。すなわち、機械学習では、学習結果の安全性は保証されないため、例えば、干渉などを防ぐことは困難であり、生産ラインに対して機械学習を導入する場合の障害になっている。
また、例えば、特許文献2では、システムモデルの評価結果を用いて学習を行うため、システムモデルが正確である必要があり、このシステムモデルの精度を改善するためのモデル再構成部を設けることで、最適化を可能にしている。しかしながら、この手法では、最適化結果の精度がシステムモデルの精度に依存するため、システムモデルの改善に長時間を要することになり、現実的ではない。
本発明の目的は、上述した従来技術の課題に鑑み、機械学習の安全性を保証することができる機械学習装置,機械システム,製造システムおよび機械学習方法の提供にある。
本発明に係る第1実施形態によれば、機械学習により機械に対する制御指令を学習する機械学習装置であって、前記機械学習を行って前記制御指令を出力する機械学習器と、前記制御指令に基づいて、前記機械の作業動作のシミュレーションを実行するシミュレータと、
前記シミュレータによる前記シミュレーションの実行結果に基づいて、前記制御指令を判定する第1判定器と、を備え、前記第1判定器は、前記シミュレーションの実行結果に問題がなければ、前記制御指令を良好と判定し、前記機械に対して良好と判定された前記制御指令の入力を実行し、前記シミュレーションの実行結果に問題があれば、前記制御指令を不良と判定し、前記機械に対して不良と判定された前記制御指令の入力を停止すると共に、前記第1判定器により得られた第1結果ラベルを、訓練データとして前記機械学習器に対して与えることで学習を行う機械学習装置が提供される。
また、本発明に係る第1実施形態によれば、機械学習により機械に対する制御指令を学習する機械学習装置であって、前記機械学習を行って前記制御指令を出力する機械学習器と、前記制御指令に基づいて、前記機械の作業動作のシミュレーションを実行するシミュレータと、前記シミュレータによる前記シミュレーションの実行結果に基づいて、前記制御指令を判定する第1判定器と、を備え、前記第1判定器は、前記シミュレーションの実行結果に問題がなければ、前記制御指令を良好と判定し、前記機械に対して良好と判定された前記制御指令の入力を実行し、前記シミュレーションの実行結果に問題があれば、前記制御指令を不良と判定し、前記機械に対して不良と判定された前記制御指令の入力を停止し、前記機械学習器の状態を、定期的または予め指定した条件成立時に第1状態として保存し、前記第1判定器による判定結果が良好になる頻度が低下した場合、前記機械学習器の状態を、前記第1状態に戻す機械学習装置も提供される。
記第1判定器による判定結果が不良の場合、前記第1結果ラベルと共に、前記シミュレータから得られる計算結果データの一部または全てを含む第1状態量を、前記機械学習器に対して与えることで学習を行うこともできる。
前記機械学習装置は、さらに、前記制御指令による前記機械の作業結果を判定する第2判定器を備え、前記第1判定器による判定結果が良好の場合、前記機械に対して前記第1判定器により良好と判定された前記制御指令の入力を実行すると共に、前記第2判定器により得られる第2結果ラベルを、訓練データとして前記機械学習器に与えることで学習を行うことができる。前記第1判定器による判定結果が良好の場合、前記第2結果ラベルと共に、前記機械または周囲環境の状態を検出するセンサの出力データ,前記機械を制御する制御ソフトウェアの内部データ,および,前記センサの出力データまたは前記制御ソフトウェアの内部データに基づいて得られる計算データの少なくとも1つを含む第2状態量を、前記機械学習器に対して与えることで学習を行うこともできる。
記第1判定器による判定結果が良好および不良を含む3つ以上の状態を取るとき、前記状態に基づいて前記制御指令に含まれる前記機械の指令速度を変化させることもできる。前記機械学習器は、前記機械の作業状態に基づいて報酬を計算する報酬計算部と、前記制御指令の価値を定める価値関数を有し、前記報酬に基づいて前記価値関数を更新する価値関数更新部と、を含むのが好ましい。前記機械学習装置は、ニューラルネットワークを備えてもよい。
本発明に係る第2実施形態によれば、上述した第1実施形態の機械学習装置、および、前記機械を備える機械システムであって、前記機械を制御する制御装置と、前記機械学習器,前記シミュレータおよび前記第1判定器を含む前記機械学習装置を有するコンピュータ装置と、を備え、前記コンピュータ装置と、1台または複数台の前記機械がネットワークを介して接続される機械システムが提供される。前記機械学習器の学習を、前記機械による実際の生産作業中にも継続して行い、あるいは、事前に実施して、前記機械による実際の生産作業中には行わないように構成してもよい。
本発明に係る第3実施形態によれば、上述した第2実施形態の機械システムを複数備える製造システムであって、前記機械学習装置は、それぞれの前記機械システムに設けられ、複数の前記機械システムに設けられた複数の前記機械学習装置は、通信媒体を介して相互にデータを共有または交換するようになっている製造システムが提供される。前記機械学習装置は、クラウドサーバ上に存在してもよい。
本発明に係る第4実施形態によれば、機械学習により機械に対する制御指令を学習する機械学習方法であって、前記機械学習を行って前記制御指令を出力し、前記制御指令に基づいて、前記機械の作業動作のシミュレーションを実行し、前記シミュレーションの実行結果に基づいて、前記制御指令を判定し、前記シミュレーションの実行結果に問題がなければ、前記制御指令を良好と判定し、前記機械に対して良好と判定された前記制御指令の入力を実行し、前記シミュレーションの実行結果に問題があれば、前記制御指令を不良と判定し、前記機械に対して不良と判定された前記制御指令の入力を停止すると共に、前記制御指令を不良と判定したことに基づく第1結果ラベルを、訓練データとして前記機械学習器に対して与えることで学習を行う機械学習方法機械学習方法が提供される。
また、本発明に係る第4実施形態によれば、機械学習により機械に対する制御指令を学習する機械学習方法であって、前記機械学習を行って前記制御指令を出力し、前記制御指令に基づいて、前記機械の作業動作のシミュレーションを実行し、前記シミュレーションの実行結果に基づいて、前記制御指令を判定し、前記シミュレーションの実行結果に問題がなければ、前記制御指令を良好と判定し、前記機械に対して良好と判定された前記制御指令の入力を実行し、前記シミュレーションの実行結果に問題があれば、前記制御指令を不良と判定し、前記機械に対して不良と判定された前記制御指令の入力を停止し、前記機械学習を行って出力する前記制御指令の状態を、定期的または予め指定した条件成立時に第1状態として保存し、前記シミュレーションの実行結果に基づく前記制御指令の判定結果が良好になる頻度が低下した場合、前記機械学習を行って出力する前記制御指令の状態を、前記第1状態に戻す機械学習方法も提供される。
本発明に係る機械学習装置,機械システム,製造システムおよび機械学習方法によれば、機械学習の安全性を保証することができるという効果を奏する。
図1は、本発明が適用される機械システムの一例を模式的に示す図である。 図2は、本発明に係る機械学習装置の第1実施例を示すブロック図である。 図3は、図2に示す機械学習装置における処理の一例を説明するための図である。 図4は、図3に示す全体画像から部分画像を切り出す処理の一例を説明するための図である。 図5は、図2に示す機械学習装置に適用したニューラルネットワークの入出力の構成例を説明するための図である。 図6は、本発明に係る機械学習装置の第2実施例を示すブロック図である。 図7は、一実施形態の機械学習装置における機械学習器の一例を説明するための図である。
まず、本発明に係るシミュレーション結果を利用して学習を行う機械学習装置,機械システム,製造システムおよび機械学習方法の実施形態を詳述する前に、本発明が適用される機械システムの一例、および、その問題点を、図1を参照して説明する。
図1は、本発明が適用される機械システムの一例を模式的に示す図であり、エンドエフェクタ13を取り付けたロボット14が、ワーク12を籠11から取り出す作業を行う様子を示すものである。図1に示されるように、機械システムの一例において、籠11の上方には、三次元計測器15が設けられ、この三次元計測器15によりワーク12の深度画像を撮影する。さらに、三次元計測器15により撮影した深度画像(画像30)に基づいて、ロボット14がワーク12を取り出す動作を学習する。ここで、ロボット14は、例えば、6軸多関節型ロボットであり、ロボット14およびエンドエフェクタ13のそれぞれの駆動軸は、制御装置(機械学習装置)からの制御指令(指令)により制御される。
ところで、機械学習によりロボット14に対する指令を学習する場合、機械学習装置(20)により獲得された指令によっては、干渉が発生する虞がある。例えば、ロボット14に対する指令が不適切(不良)な場合、具体的に、図1において、エンドエフェクタ13が指令Aにより軌跡16のように移動(作業)する場合、エンドエフェクタ13(ロボット14)と籠11が干渉することになる。
すなわち、ロボット14に対する指令は、適切(良好)であることが求められ、具体的に、図1において、ロボット14は、指令Bによるエンドエフェクタ13の軌跡17のように、エンドエフェクタ13と籠11が干渉することなく作業を行うことが要求されるが、例えば、上述した指令Aがロボット14に入力されると干渉が発生し、籠11,エンドエフェクタ13,ロボット14およびエンドエフェクタ13、あるいは、周辺装置などの破損を招く虞がある。特に、実際の生産ラインにおいては、生産停止につながるため、大きな問題になる。さらに、籠11内のワーク12の状態によっては、他のワーク12との相互作用などに起因して、ロボット14がワーク12をうまく取り出せないことも生じ得る。この場合にも、作業のタクトタイムが遅れるという問題が発生する。
以下、本発明に係るシミュレーション結果を利用して学習を行う機械学習装置,機械システム,製造システムおよび機械学習方法の実施形態を、添付図面を参照して詳述する。なお、本明細書において、機械として、制御装置により制御される産業用ロボットを例として説明するが、本発明の適用は、例えば、制御装置により制御される工作機械,鍛圧機械,射出成形機,あるいは,サービス用ロボットなどであってもよいのはもちろんである。
図2は、本発明に係る機械学習装置の第1実施例を示すブロック図であり、例えば、図1を参照して説明した機械システム(ロボットシステム)に適用される機械学習装置を示すものである。機械学習装置20は、三次元計測器15からの画像情報(画像)30を受け取って機械学習を行い、ロボット(機械)14に制御指令(指令)を出力して作業動作(作業)を制御する。
図2に示されるように、機械学習装置20は、機械学習を行って制御指令を出力する機械学習器21と、制御指令に基づいてロボット14の作業のシミュレーションを実行するシミュレータ22と、シミュレータ22によるシミュレーションの実行結果に基づいて制御指令を判定する第1判定器23と、制御指令によるロボット14の作業結果を判定する第2判定器24を備える。
第1判定器23は、シミュレータ22によるシミュレーションの実行結果に問題がなければ、機械学習器21から出力される制御指令を良好と判定してロボット14に入力する。そして、ロボット14は、第1判定器23による判定結果が良好とされた制御指令に基づいて作業を行う。また、第1判定器23は、シミュレータ22によるシミュレーションの実行結果に問題があれば、制御指令を不良と判定してロボット14に対する制御指令の入力を停止する。すなわち、第1判定器23による判定結果が不良とされた制御指令はロボット14に入力されず、ロボット14は、シミュレータ22によるシミュレーションの実行結果で問題があるとされた制御指令に基づいて作業を行うことから回避される。
ここで、第1判定器23による判定結果が不良の場合、ロボット14に対する制御指令の入力を停止するだけでなく、例えば、第1判定器23により得られた第1結果ラベル41を、訓練データとして機械学習器21に対して与えることでさらなる学習を行うようにすることができる。
このように、第1実施例の機械学習装置20によれば、実際にロボット14を動作させる前に、シミュレータ22により制御指令を実行し、例えば、周辺装置とロボット14の距離や、ワーク12の動きを事前にシミュレーションし、干渉の発生やワーク12の取り出し失敗の可能性を第1判定器23によって判定する。そして、シミュレータ22によるシミュレーションの実行結果に基づいて、問題ないと評価(判定)された場合にのみ実機(ロボット14)を動作させることで、実機の破損や作業の失敗などを防止することができる。すなわち、第1実施例によれば、機械学習の安全性を保証する、すなわち、機械の破損や作業の失敗あるいは周辺装置の破損などといった問題の発生を防止すことが可能になる。
さらに、第1実施例の機械学習装置20において、第2判定器24は、制御指令によるロボット14の作業結果を判定する。そして、第1判定器23による判定結果が良好の場合、ロボット14に対する制御指令の入力を実行すると共に、第2判定器24により得られる第2結果ラベル44を、訓練データとして機械学習器21に与えることで学習を行うようになっている。
すなわち、制御指令は、シミュレータ22によって評価され、シミュレータの評価結果が第1判定器23によって判定され、判定結果が良好であればロボット14に対する制御指令の入力を実行して、ロボット14に実際の動作を行わせる。そして、ロボット14の動作結果(作業結果)は、第2判定器24により評価(判定)され、第2判定器24は、第2結果ラベル44を出力する。そして、機械学習器21は、この第2結果ラベル44,上述した第1判定器23からの第1結果ラベル41および画像30による訓練データに基づいて、制御指令の学習(機械学習)を行う。
なお、第1判定器23による判定結果が不良の場合、ロボット14に対する制御指令の入力は行われず、第1判定器23から機械学習器21に対して、第1結果ラベル41が出力される。そして、機械学習器21は、この第1結果ラベル41および画像30による訓練データに基づいて、制御指令の学習を行う。
図3は、図2に示す機械学習装置における処理の一例を説明するための図であり、図4は、図3に示す全体画像から部分画像を切り出す処理の一例を説明するための図である。次に、図3および図4を参照して、例えば、図1に示す三次元計測器15によって取得された全体画像31から、画像の一部を切り出して部分画像32を作成する処理の一例を説明する。
図4に示されるように、部分画像32は、全体画像31の中から任意の部分を切り出すことで作成することができるが、通常は一定間隔ごとにオフセットしながら、全領域をカバーするまで切り出し処理を繰り返して行う。具体的に、例えば、横320ピクセル,縦240ピクセルの全体画像31に対して、横80ピクセル,縦が80ピクセルの部分画像(32)を、縦横ともに40ピクセルごとオフセットしながら部分画像を作成すると、{(320−80)/40+1}×{(240−80)/40+1}=7×5=35枚の部分画像が得られることになる。
このようにして作成した部分画像32を、例えば、ニューラルネットワークを用いた機械学習器25に入力し、機械学習器25の出力として、取り出し成功確率26を得る。これを全ての部分画像に対して繰り返し行い、その結果の中から、最高取り出し成功確率を持つ部分画像(32)を選択し、その部分画像32を切り出した位置情報(最高取り出し成功確率位置の情報)27を取得する。
なお、ニューラルネットワーク(25)は、ニューロンのモデルを模した演算装置およびメモリなどで構成され、汎用の計算機やプロセッサを用いることもできるが、例えば、GPGPU(General-Purpose computing on Graphics Processing Units)や大規模PCクラスターなどを適用すると、より高速処理が可能になる。
そして、最高取り出し成功確率位置27の位置情報をシミュレータ22に入力し、ロボット14の動作の評価(作業動作のシミュレーション)を行う。例えば、ワーク12の取り出し位置から、籠11の直上の位置を経由して、搬出位置へワーク12を搬送するような動作を、予めシミュレータ22に設定しておくことで、取り出し動作の軌跡を生成することができる。
ここで、簡略化されたシミュレータ22としては、例えば、取り出し位置からの取り出し動作を生成し、ロボット先端位置(エンドエフェクタ13)の時系列データを出力するものであってもよい。この時系列データは、第1判定器23に入力され、ロボット先端位置が事前にユーザーが指定した範囲を逸脱しないかどうかをチェックすることにより、干渉の有無をチェックすることができ、動作結果の良否の判定、すなわち、制御指令が良好か不良かの判定を行うことができる。
また、より高度なシミュレータ22としては、さらに、ロボット14,ハンド(エンドエフェクタ13),籠11,ワーク12および周辺環境などの形状モデルや、重量などの物性値まで含めてモデリングし、例えば、重力の影響やワーク相互の干渉、ロボットに使用しているモータの負荷なども計算対象とする、いわゆる物理シミュレーションを行うシミュレータとすることもできる。
この場合、ロボット先端位置の範囲をチェックするだけではなく、ワークとワークが相互に干渉することによる取り出しの失敗、あるいは、ロボットが過負荷になってエラー停止するなどについても、シミュレート(評価)することが可能になる。また、シミュレータ22から得られる評価結果は、干渉によるロボット14やワーク12へのダメージ量、あるいは、干渉からの余裕度など多岐にわたるため、第1判定器23による良否判定の基準も、それらの中から必要なものを取捨選択して組み合わせたものとすることで、より一層高度な判定を行うことが可能になる。
なお、前述したように、第1判定器23により不良と判定された場合、実際のロボット14(実機)には制御指令を入力せず、第1判定器23からの第1結果ラベル41および使用した部分画像43による訓練データを、機械学習器(ニューラルネットワーク)25に入力することで、制御指令の学習を行う。これにより、例えば、不良な(問題のある)制御指令を実機に入力することを避けることができ、また、機械学習器25が不良な制御指令を出力しないように学習させることができる。
図5は、図2に示す機械学習装置に適用したニューラルネットワークの入出力の構成例を説明するための図である。図5に示されるように、ニューラルネットワーク25は、入力として部分画像32を受け取り、取り出し成功確率26を出力する。ここで、学習する場合には、例えば、使用した部分画像43と第1結果ラベル41のセットを訓練データとし、教師あり学習によって制御指令を学習する。
すなわち、使用した部分画像43から得られた取り出し成功確率26と、シミュレータ22から得られた第1結果ラベル41との間の誤差を、誤差計算部28により計算し、この誤差を逆伝播させることで、ニューラルネットワーク25の学習を行うことができる。具体的に、取り出し成功確率26が、失敗を表す『0』から成功を表す『1』までの範囲の数値を取るようにした場合、第1結果ラベル41は、例えば、取り出し成功/失敗の結果を受けて『0』または『1』の値を取るようにすれば、誤差は、両者の差を取ることで計算することが可能である。
第1判定器23により良好(良)と判定された場合、ロボット14(実機)に制御信号を入力しても問題なく動作(作業)すると保証されたことを意味する。これにより、実機(ロボット14)に制御指令を入力し、実際に動作を行わせる。そして、その結果をカメラなどのセンサにより観測し、実際に結果が良になったかどうかを、第2判定器24によって判定する。
第2判定器24からは、結果の良否(良好/不良)が第2結果ラベル44として、ニューラルネットワーク25に出力される。すなわち、ニューラルネットワーク25は、第2結果ラベル44および使用した部分画像43で構成された訓練データを受け取って学習を行う。この学習の方法は、前述したシミュレータ22から得られた第1結果ラベル41を用いた場合の学習と同様である。
また、第1判定器23および第2判定器24は良否判定を行っているが、それぞれの判定器が出力する結果は、必ずしも二値(『0』または『1』)である必要はない。例えば、閾値を2段階設け、『良』,『可』,『不可』の3つに分類する判定を行うこともできる。これは、例えば、ロボット14が籠11などの障害物の付近を通過する場合、シミュレータ22の精度によっては、干渉の可能性が疑われる状況が生じるためである。
例えば、干渉の可能性が疑われる場合、第1判定器23の判定を『良(良好)』および『不可(不良)』の二値の判定ではなく、さらに、『可(中間)』を含めた三値、あるいは、それ以上の多値とし、制御指令をより細かく制御することができる。すなわち、第1判定器23による判定結果が、良好および不良を含む3つ以上の状態(多値)を取るとき、その状態に基づいて、例えば、制御指令に含まれるロボット14の指令速度を変化させる、具体的に、干渉の可能性が高い場合には、指令速度を下げてロボット14を動作させるといった制御を行うことができる。
これにより、例えば、ロボット14による干渉が万一生じた場合でも、ロボット14や周辺装置の損傷などを小さく抑えることが可能になる。さらに、閾値を3段階,4段階と増やし、指令速度を段階ごとに変化させて干渉のリスクに対して、より細かく対応することもできる。
ここで、図2を参照して説明した機械学習装置20は、ロボット14の制御装置内に設けることもできるが、例えば、ロボット14を、機械学習を行わない作業にも使用することを考えると、コストの面から過剰な装備になってしまう。そこで、機械学習を行うコンピュータ装置(機械学習装置20)を、ロボット14の制御装置とは別に設けてもよい。このようなハードウェア構成にすることで、ロボット14の制御装置側には、制御指令を受けるためのインターフェイスを準備するだけでよくなり、ロボット14の制御装置のコストを抑えることができる。また、機械学習装置20が設けられたコンピュータ装置のみを入れ替えることで、機械学習器21やシミュレータ22の能力を容易に向上させることもできるといった利点もある。
さらに、機械学習装置20が設けられたコンピュータ装置とロボット14の制御装置を、ネットワークを介して接続するため、コンピュータ装置を複数台のロボット14(制御装置)と接続することが可能になり、学習を行うロボット14を適宜切り替えて接続することにより、1台のコンピュータ装置で多数(全て)のロボット14の学習を行うことも可能になる。すなわち、例えば、機械学習装置20およびロボット14を備えるロボットシステム(機械システム)が、ロボット14を制御する制御装置と、機械学習器21,シミュレータ22および第1判定器23を含む機械学習装置20を有するコンピュータ装置と、を備え、そのコンピュータ装置と、1台または複数台のロボット14を、ネットワークを介して接続することができる。
また、実際に生産を行う機械システムにおいては、生産を継続しながら学習によって動作を改善したい場合がある。特に、機械学習は、学習に多くの訓練データを必要とするため、学習を行う数(データ数)を増やして学習効果を上げるには、実際に生産を行うデータも使いながら学習するのが好ましい。
この場合、問題になるのは、学習によって動作が常に改善することは保証されず、逆に動作の成功率が低下する場合があることである。この問題も、干渉の問題と並んで、実際の生産ラインに学習機能を適用することの障害の一つになる虞がある。そこで、動作の成功率が低下するような場合には、実際に生産を行う機械システムへの適用時には、学習を行わないようにすることもできる。すなわち、機械学習器21による学習を、例えば、ロボット14による実際の生産作業中にも継続して行い、あるいは、事前に実施して、ロボット14による実際の生産作業中には行わないようにすることができる。
また、機械学習器21の状態を、実際の生産ライン投入段階など予め指定したタイミングで保存し、または、定期的に保存し、第1判定器23による判定結果が不良になる確率が上がった場合には、機械学習器21を以前の状態に戻して機械学習器21の性能を回復し、実際の生産効率を保証しながら、学習による更なる効率改善を可能にすることができる。すなわち、機械学習器21の状態を、定期的または予め指定した条件成立時に第1状態として保存し、第1判定器23による判定結果が良好になる頻度が低下した場合、機械学習器21の状態を、第1状態に戻すように構成することもできる。なお、上述した第1実施例では、「教師あり学習」を適用した例を示したが、「強化学習」などの他の学習方法を適用することもできる。
図6は、本発明に係る機械学習装置の第2実施例を示すブロック図であり、強化学習を適用した機械学習装置の例を示すものである。なお、図6は、取り出し位置が既に決定しているものとして、ロボット14の取り出し動作の軌跡を学習する例を示している。図6に示す第2実施例では、機械学習器55によりロボット14の動作軌跡が生成され、シミュレータ52に入力される。シミュレータ52では、ロボット14の動作が評価され、第1判定器53によってその動作の良否(良好/不良)が判定される。
第1判定器53による判定結果が良好の場合、制御指令がロボット14に対する制御指令の入力を実行し、ロボット14が動作する。ロボット14の動作結果は、第2判定器54で判定され、その判定結果は、第2結果ラベル64として機械学習器55に送られると共に、ロボット14または周囲環境の状態を表すデータ、ロボット14を制御する制御ソフトウェアの内部データ、および、それらの両者の一方または両方に基づいて得られる計算データの少なくとも1つを含む第2状態量65が機械学習器55に送られる。すなわち、第1判定器53による判定結果が良好の場合、第2結果ラベル64と共に、ロボット14または周囲環境の状態を検出するセンサの出力データ,ロボット14を制御する制御ソフトウェアの内部データ,および,センサの出力データまたは制御ソフトウェアの内部データに基づいて得られる計算データの少なくとも1つを含む第2状態量65を、機械学習器55に対して与えることで学習を行うようになっている。
また、第1判定器53による判定結果が不良の場合、制御指令はロボット14に入力されず、第1判定器53による判定によって得られた第1結果ラベル61と、シミュレータ52の内部データで構成される第1状態量62が機械学習器55に送られる。すなわち、第1判定器53による判定結果が不良の場合、第1結果ラベル61と共に、シミュレータ52から得られる計算結果データの一部または全てを含む第1状態量62を、機械学習器55に対して与えることで学習を行うようになっている。
このとき、機械学習器55で生成される動作軌跡は、例えば、一定時間分、または、一定距離分の短いステップで生成され、その都度シミュレーションと判定が行われ、それを繰り返すことで、最終的に全体の動作軌跡が生成される。
ここで、第1結果ラベル61および第1状態量62、または、第2結果ラベル64および第2状態量65を受け取った機械学習器55は、例えば、「強化学習」を行う。具体的に、「Q学習」を適用して学習を行う場合について説明する。
Q学習は、ある環境状態sの下で、行動aを選択する価値Q(s,a)を学習する方法である。つまり、ある状態sのとき、価値Q(s,a)の最も高い行動aを最適な行動として選択すればよい。しかし、最初は、状態sと行動aとの組合せについて、価値Q(s,a)の正しい値は全く分かっていない。そこで、エージェント(行動主体)は、ある状態sの下で様々な行動aを選択し、その時の行動aに対して、報酬が与えられる。それにより、エージェントは、より良い行動の選択、すなわち、正しい価値Q(s,a)を学習していく。
ここで、第2実施例の機械学習装置において、Q学習を適用して学習を行う場合、状態量sは、第1判定器53から出力された第1結果ラベル61およびシミュレータ52から出力された第1状態量62、または、第2判定器54から出力された第2結果ラベル64およびロボット14や周辺機器などから出力された第2状態量65で構成される。
第1結果ラベル61および第2結果ラベル64には、例えば、干渉の有無,タクトタイム,最終位置までの距離、ワーク12の把持の成功/失敗などの結果が含まれる。また、行動aは、ロボット14に対する制御指令であり、例えば、ロボット14の先端位置(エンドエフェクタ13)の移動方向および移動速度などとすることができる。
図7は、一実施形態の機械学習装置における機械学習器の一例を説明するための図であり、「強化学習(Q学習)」を適用した場合の一例を示すものである。図7に示されるように、機械学習器55は、報酬計算部71および価値関数更新部72を備える。報酬計算部71は、例えば、第1結果ラベル61および第1状態量62、または、第2結果ラベル64および第2状態量65に基づいて、報酬、例えば、スコアを計算する。
ここで、報酬は、例えば、動作の成功に対しては高くなるように設定され、動作の失敗に対しては低くなるように設定される。また、報酬は、例えば、動作のタクトタイムに基づいて計算してもよい。さらに、報酬に関して、例えば、ハンド部(エンドエフェクタ13)による把持の成功や、ハンド部による運搬の成功などといった各段階に応じて報酬の計算を行うようにしてもよい。また、例えば、干渉が発生したと判断した場合、報酬が低くなるように設定すると共に、その時点で動作を中断して初期位置からやり直すといった処理を行うことで、例えば、問題のある状態を発生または継続させずに、学習を進めることができる。
次に、価値関数更新部72は、例えば、動作の価値を定める価値関数Q(s,a)を有し、上述した報酬計算部71による報酬に応じて価値関数を更新する。そして、制御指令(動作軌跡)は、更新された価値関数に基づいて生成され、シミュレータ52に出力されて上述した処理を行い、ロボット14(機械)を制御するために使用される。これにより、機械学習の安全性を保証(機械の破損や作業の失敗、あるいは、周辺装置の破損などといった問題の発生を防止)した制御指令により機械を制御することができる。
なお、本発明に係る機械学習装置に対しては、上述した「教師あり学習」や「強化学習(Q学習)」だけでなく、例えば、知られている様々な機械学習の手法(例えば、様々な「教師あり学習」,「教師なし学習」および「強化学習」)、あるいは、これらの手法を実現するうえで、特徴量そのものの抽出を学習する「深層学習(ディープラーニング:Deep Learning)」などの様々な技術を幅広く適用することができる。さらに、本発明に係る機械学習装置の適用は、上述した産業用ロボットなどに限定されるものではなく、例えば、制御装置により制御される工作機械,鍛圧機械,射出成形機,あるいは,サービス用ロボットなどであってもよいのはいうまでもない。
以上において、機械学習装置および機械(ロボット)を備える機械システムを複数備える製造システムを考えた場合、例えば、機械学習装置をそれぞれの機械システムに設け、複数の機械システムに設けられた複数の機械学習装置を、通信媒体を介して相互にデータを共有または交換するように構成してもよい。また、機械学習装置は、例えば、インターネットなどの通信媒体を介して、クラウドサーバ上に存在するように構成することも可能である。
以上、実施形態を説明したが、ここに記載した全ての例や条件は、発明および技術に適用する発明の概念の理解を助ける目的で記載されたものであり、特に記載された例や条件は発明の範囲を制限することを意図するものではない。また、明細書のそのような記載は、発明の利点および欠点を示すものでもない。発明の実施形態を詳細に記載したが、各種の変更、置き換え、変形が発明の精神および範囲を逸脱することなく行えることが理解されるべきである。
11 籠
12 ワーク
13 エンドエフェクタ
14 ロボット(機械)
15 三次元計測器
20 機械学習装置
21,25,55 機械学習器(ニューラルネットワーク)
22,52 シミュレータ
23,53 第1判定器
24,54 第2判定器
71 報酬計算部
72 価値関数更新部

Claims (15)

  1. 機械学習により機械に対する制御指令を学習する機械学習装置であって、
    前記機械学習を行って前記制御指令を出力する機械学習器と、
    前記制御指令に基づいて、前記機械の作業動作のシミュレーションを実行するシミュレータと、
    前記シミュレータによる前記シミュレーションの実行結果に基づいて、前記制御指令を判定する第1判定器と、を備え、
    前記第1判定器は、
    前記シミュレーションの実行結果に問題がなければ、前記制御指令を良好と判定し、前記機械に対して良好と判定された前記制御指令の入力を実行し、
    前記シミュレーションの実行結果に問題があれば、前記制御指令を不良と判定し、前記機械に対して不良と判定された前記制御指令の入力を停止すると共に、前記第1判定器により得られた第1結果ラベルを、訓練データとして前記機械学習器に対して与えることで学習を行う、
    ことを特徴とする機械学習装置。
  2. 機械学習により機械に対する制御指令を学習する機械学習装置であって、
    前記機械学習を行って前記制御指令を出力する機械学習器と、
    前記制御指令に基づいて、前記機械の作業動作のシミュレーションを実行するシミュレータと、
    前記シミュレータによる前記シミュレーションの実行結果に基づいて、前記制御指令を判定する第1判定器と、を備え、
    前記第1判定器は、
    前記シミュレーションの実行結果に問題がなければ、前記制御指令を良好と判定し、前記機械に対して良好と判定された前記制御指令の入力を実行し、
    前記シミュレーションの実行結果に問題があれば、前記制御指令を不良と判定し、前記機械に対して不良と判定された前記制御指令の入力を停止し、
    前記機械学習器の状態を、定期的または予め指定した条件成立時に第1状態として保存し、
    前記第1判定器による判定結果が良好になる頻度が低下した場合、前記機械学習器の状態を、前記第1状態に戻す、
    ことを特徴とする機械学習装置。
  3. 前記第1判定器による判定結果が不良の場合、
    前記第1結果ラベルと共に、前記シミュレータから得られる計算結果データの一部または全てを含む第1状態量を、前記機械学習器に対して与えることで学習を行う、
    ことを特徴とする請求項1に記載の機械学習装置。
  4. さらに、
    前記制御指令による前記機械の作業結果を判定する第2判定器を備え、
    前記第1判定器による判定結果が良好の場合、
    前記機械に対して前記第1判定器により良好と判定された前記制御指令の入力を実行すると共に、
    前記第2判定器により得られる第2結果ラベルを、訓練データとして前記機械学習器に与えることで学習を行う、
    ことを特徴とする請求項1乃至請求項のいずれか1項に記載の機械学習装置。
  5. 前記第1判定器による判定結果が良好の場合、
    前記第2結果ラベルと共に、前記機械または周囲環境の状態を検出するセンサの出力データ,前記機械を制御する制御ソフトウェアの内部データ,および,前記センサの出力データまたは前記制御ソフトウェアの内部データに基づいて得られる計算データの少なくとも1つを含む第2状態量を、前記機械学習器に対して与えることで学習を行う、
    ことを特徴とする請求項に記載の機械学習装置。
  6. 前記第1判定器による判定結果が良好および不良を含む3つ以上の状態を取るとき、前記状態に基づいて前記制御指令に含まれる前記機械の指令速度を変化させる、
    ことを特徴とする請求項1乃至請求項のいずれか1項に記載の機械学習装置。
  7. 前記機械学習器は、
    前記機械の作業状態に基づいて報酬を計算する報酬計算部と、
    前記制御指令の価値を定める価値関数を有し、前記報酬に基づいて前記価値関数を更新する価値関数更新部と、を含む、
    ことを特徴とする請求項1乃至請求項のいずれか1項に記載の機械学習装置。
  8. 前記機械学習装置は、ニューラルネットワークを備える、
    ことを特徴とする請求項1乃至請求項のいずれか1項に記載の機械学習装置。
  9. 請求項1乃至請求項のいずれか1項に記載の機械学習装置、および、前記機械を備える機械システムであって、
    前記機械を制御する制御装置と、
    前記機械学習器,前記シミュレータおよび前記第1判定器を含む前記機械学習装置を有するコンピュータ装置と、を備え、
    前記コンピュータ装置と、1台または複数台の前記機械がネットワークを介して接続される、
    ことを特徴とする機械システム。
  10. 前記機械学習器の学習を、
    前記機械による実際の生産作業中にも継続して行う、
    ことを特徴とする請求項に記載の機械システム。
  11. 前記機械学習器の学習を、
    事前に実施して、前記機械による実際の生産作業中には行わない、
    ことを特徴とする請求項に記載の機械システム。
  12. 請求項乃至請求項11のいずれか1項に記載の機械システムを複数備える製造システムであって、
    前記機械学習装置は、それぞれの前記機械システムに設けられ、
    複数の前記機械システムに設けられた複数の前記機械学習装置は、通信媒体を介して相互にデータを共有または交換するようになっている、
    ことを特徴とする製造システム。
  13. 前記機械学習装置は、クラウドサーバ上に存在する、
    ことを特徴とする請求項12に記載の製造システム。
  14. 機械学習により機械に対する制御指令を学習する機械学習方法であって、
    前記機械学習を行って前記制御指令を出力し、
    前記制御指令に基づいて、前記機械の作業動作のシミュレーションを実行し、
    前記シミュレーションの実行結果に基づいて、前記制御指令を判定し、
    前記シミュレーションの実行結果に問題がなければ、前記制御指令を良好と判定し、前記機械に対して良好と判定された前記制御指令の入力を実行し、
    前記シミュレーションの実行結果に問題があれば、前記制御指令を不良と判定し、前記機械に対して不良と判定された前記制御指令の入力を停止すると共に、前記制御指令を不良と判定したことに基づく第1結果ラベルを、訓練データとして前記機械学習器に対して与えることで学習を行う、
    ことを特徴とする機械学習方法。
  15. 機械学習により機械に対する制御指令を学習する機械学習方法であって、
    前記機械学習を行って前記制御指令を出力し、
    前記制御指令に基づいて、前記機械の作業動作のシミュレーションを実行し、
    前記シミュレーションの実行結果に基づいて、前記制御指令を判定し、
    前記シミュレーションの実行結果に問題がなければ、前記制御指令を良好と判定し、前記機械に対して良好と判定された前記制御指令の入力を実行し、
    前記シミュレーションの実行結果に問題があれば、前記制御指令を不良と判定し、前記機械に対して不良と判定された前記制御指令の入力を停止し、
    前記機械学習を行って出力する前記制御指令の状態を、定期的または予め指定した条件成立時に第1状態として保存し、
    前記シミュレーションの実行結果に基づく前記制御指令の判定結果が良好になる頻度が低下した場合、前記機械学習を行って出力する前記制御指令の状態を、前記第1状態に戻す、
    ことを特徴とする機械学習方法。
JP2016075476A 2016-04-04 2016-04-04 シミュレーション結果を利用して学習を行う機械学習装置,機械システム,製造システムおよび機械学習方法 Active JP6457421B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2016075476A JP6457421B2 (ja) 2016-04-04 2016-04-04 シミュレーション結果を利用して学習を行う機械学習装置,機械システム,製造システムおよび機械学習方法
DE102017002996.2A DE102017002996B4 (de) 2016-04-04 2017-03-28 Maschinenlernvorrichtung, die ein lernen unter verwendung eines simulationsergebnisses durchführt, maschinensystem, herstellungssystem und maschinenlernverfahren
US15/472,395 US10317854B2 (en) 2016-04-04 2017-03-29 Machine learning device that performs learning using simulation result, machine system, manufacturing system, and machine learning method
CN201710213188.1A CN107263464B (zh) 2016-04-04 2017-04-01 机器学习装置、机械系统、制造系统以及机器学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016075476A JP6457421B2 (ja) 2016-04-04 2016-04-04 シミュレーション結果を利用して学習を行う機械学習装置,機械システム,製造システムおよび機械学習方法

Publications (2)

Publication Number Publication Date
JP2017185577A JP2017185577A (ja) 2017-10-12
JP6457421B2 true JP6457421B2 (ja) 2019-01-23

Family

ID=59886008

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016075476A Active JP6457421B2 (ja) 2016-04-04 2016-04-04 シミュレーション結果を利用して学習を行う機械学習装置,機械システム,製造システムおよび機械学習方法

Country Status (4)

Country Link
US (1) US10317854B2 (ja)
JP (1) JP6457421B2 (ja)
CN (1) CN107263464B (ja)
DE (1) DE102017002996B4 (ja)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9069725B2 (en) 2011-08-19 2015-06-30 Hartford Steam Boiler Inspection & Insurance Company Dynamic outlier bias reduction system and method
CA3116974A1 (en) 2014-04-11 2015-10-15 Hartford Steam Boiler Inspection And Insurance Company Improving future reliability prediction based on system operational and performance data modelling
US10580735B2 (en) 2016-10-07 2020-03-03 Xcelsis Corporation Stacked IC structure with system level wiring on multiple sides of the IC die
US10672745B2 (en) 2016-10-07 2020-06-02 Xcelsis Corporation 3D processor
US10672663B2 (en) 2016-10-07 2020-06-02 Xcelsis Corporation 3D chip sharing power circuit
US10600691B2 (en) 2016-10-07 2020-03-24 Xcelsis Corporation 3D chip sharing power interconnect layer
US10580757B2 (en) 2016-10-07 2020-03-03 Xcelsis Corporation Face-to-face mounted IC dies with orthogonal top interconnect layers
KR102512017B1 (ko) 2016-10-07 2023-03-17 엑셀시스 코포레이션 직접-접합된 네이티브 상호접속부 및 능동 베이스 다이
US10607136B2 (en) 2017-08-03 2020-03-31 Xcelsis Corporation Time borrowing between layers of a three dimensional chip stack
JP2019086928A (ja) * 2017-11-06 2019-06-06 ファナック株式会社 制御装置及び機械学習装置
CN107918283B (zh) * 2017-12-12 2021-03-26 海南师范大学 一种批次注塑过程抗干扰的混杂稳定控制器设计方法
JP6933167B2 (ja) * 2018-03-14 2021-09-08 オムロン株式会社 ロボットの制御装置
JP6911798B2 (ja) 2018-03-15 2021-07-28 オムロン株式会社 ロボットの動作制御装置
CN108510081A (zh) * 2018-03-23 2018-09-07 北京京东尚科信息技术有限公司 机器学习方法和平台
JP6810087B2 (ja) * 2018-03-29 2021-01-06 ファナック株式会社 機械学習装置、機械学習装置を用いたロボット制御装置及びロボットビジョンシステム、並びに機械学習方法
US10875176B2 (en) 2018-04-04 2020-12-29 Kuka Systems North America Llc Process control using deep learning training model
CN110390845A (zh) * 2018-04-18 2019-10-29 北京京东尚科信息技术有限公司 虚拟环境下机器人训练方法及装置、存储介质及计算机系统
JP7091820B2 (ja) * 2018-05-14 2022-06-28 オムロン株式会社 制御システム、学習データ作成装置、学習装置および判定装置
EP3804918A4 (en) * 2018-05-25 2022-03-30 Kawasaki Jukogyo Kabushiki Kaisha ROBOT SYSTEM AND ADDITIONAL LEARNING METHOD
JP7039389B2 (ja) * 2018-05-25 2022-03-22 川崎重工業株式会社 ロボットシステム及びロボット制御方法
CN112135719B (zh) * 2018-06-14 2023-08-22 雅马哈发动机株式会社 机器学习装置以及具备该机器学习装置的机器人系统
US11133110B2 (en) * 2018-06-21 2021-09-28 Healthhelp, Llc Systems and methods for assessing whether medical procedures should be approved
JP7398373B2 (ja) 2018-07-04 2023-12-14 株式会社Preferred Networks 制御装置、システム、制御方法、及びプログラム
JP7191569B2 (ja) * 2018-07-26 2022-12-19 Ntn株式会社 把持装置
EP3611578B1 (en) * 2018-08-14 2022-04-06 OMRON Corporation Industrial pc device and method for operating an industrial pc device
JP7175682B2 (ja) * 2018-09-06 2022-11-21 キヤノンメディカルシステムズ株式会社 診断支援装置、診断支援システム、診断支援方法、及び診断支援プログラム
WO2020050405A1 (ja) * 2018-09-07 2020-03-12 Ntn株式会社 作業装置
JP7125745B2 (ja) * 2018-09-14 2022-08-25 学校法人早稲田大学 自律型作業支援ロボットの環境適応性強化システム、動作シミュレーション装置及びそのプログラム
US11636292B2 (en) 2018-09-28 2023-04-25 Hartford Steam Boiler Inspection And Insurance Company Dynamic outlier bias reduction system and method
JP7110884B2 (ja) * 2018-10-01 2022-08-02 オムロン株式会社 学習装置、制御装置、学習方法、及び学習プログラム
DE102019006725B4 (de) * 2018-10-02 2023-06-01 Fanuc Corporation Steuereinrichtung und Steuersystem
CN113039494A (zh) * 2018-11-13 2021-06-25 Abb瑞士股份有限公司 用于将机器学习应用于应用的方法和系统
EP3880411A1 (en) * 2018-11-13 2021-09-22 ABB Schweiz AG A method and a system for applying machine learning to an application
JP6915605B2 (ja) * 2018-11-29 2021-08-04 オムロン株式会社 画像生成装置、ロボット訓練システム、画像生成方法、及び画像生成プログラム
US11584020B2 (en) * 2018-12-04 2023-02-21 Cloudminds Robotics Co., Ltd. Human augmented cloud-based robotics intelligence framework and associated methods
CA3121735A1 (en) * 2018-12-04 2020-06-11 Cavendish Nuclear Limited Improvements in and relating to control apparatus
JP6997068B2 (ja) * 2018-12-19 2022-01-17 ファナック株式会社 ロボット制御装置、ロボット制御システム、及びロボット制御方法
TWI709922B (zh) * 2018-12-21 2020-11-11 財團法人工業技術研究院 基於模型之機器學習系統
JP7252787B2 (ja) 2019-02-28 2023-04-05 川崎重工業株式会社 機械学習モデル運用管理システム及び機械学習モデル運用管理方法
US11763191B2 (en) * 2019-08-20 2023-09-19 The Calany Holding S. À R.L. Virtual intelligence and optimization through multi-source, real-time, and context-aware real-world data
US11615348B2 (en) 2019-09-18 2023-03-28 Hartford Steam Boiler Inspection And Insurance Company Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models
JP7399269B2 (ja) 2019-09-18 2023-12-15 ハートフォード スチーム ボイラー インスペクション アンド インシュアランス カンパニー 機械学習モデルにおいて動的外れ値偏り低減を実装するように構成されるコンピュータベースシステム、コンピュータコンポーネント及びコンピュータオブジェクト
US11328177B2 (en) 2019-09-18 2022-05-10 Hartford Steam Boiler Inspection And Insurance Company Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models
US11645498B2 (en) 2019-09-25 2023-05-09 International Business Machines Corporation Semi-supervised reinforcement learning
WO2021084587A1 (ja) * 2019-10-28 2021-05-06 株式会社安川電機 機械学習データ生成装置、機械学習装置、作業システム、コンピュータプログラム、機械学習データ生成方法及び作業機械の製造方法
US11599299B2 (en) 2019-11-19 2023-03-07 Invensas Llc 3D memory circuit
US11525596B2 (en) 2019-12-23 2022-12-13 Johnson Controls Tyco IP Holdings LLP Methods and systems for training HVAC control using simulated and real experience data
EP3907171B1 (en) * 2020-05-06 2022-07-06 Hiab AB A crane, a vehicle, and a method for the crane
EP4214584A4 (en) * 2020-08-20 2024-05-15 Hitachi Vantara Llc SYSTEMS AND METHODS FOR AN AUTOMATED DATA SCIENCE PROCESS
TWI757999B (zh) * 2020-12-04 2022-03-11 國立陽明交通大學 即時避障系統、即時避障方法及具有即時避障功能的無人載具
JP7359176B2 (ja) * 2021-03-03 2023-10-11 横河電機株式会社 判定装置、判定方法、および、判定プログラム
JP7363839B2 (ja) * 2021-03-09 2023-10-18 横河電機株式会社 制御装置、制御方法、および、制御プログラム
JP2022143969A (ja) * 2021-03-18 2022-10-03 株式会社東芝 データ生成装置、データ生成方法、制御装置、制御方法及びプログラム
CN117999153A (zh) * 2021-09-15 2024-05-07 雅马哈发动机株式会社 图像处理装置、元件把持系统、图像处理方法和元件把持方法
DE102022212198A1 (de) 2022-11-16 2024-05-16 Kuka Deutschland Gmbh Anpassung einer Greifsimulation durch Parameteridentifikation in der realen Welt

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5137537A (ja) 1974-09-26 1976-03-29 Matsushita Electric Ind Co Ltd
US5673367A (en) * 1992-10-01 1997-09-30 Buckley; Theresa M. Method for neural network control of motion using real-time environmental feedback
JPH09319420A (ja) 1996-05-31 1997-12-12 Ricoh Co Ltd 組立ロボット
JP3363846B2 (ja) * 1999-08-27 2003-01-08 富士通株式会社 実世界情報データベース構築方法及び装置と自律移動走行体学習方法
JP3782679B2 (ja) * 2001-05-09 2006-06-07 ファナック株式会社 干渉回避装置
JP2004116351A (ja) * 2002-09-25 2004-04-15 Fuji Heavy Ind Ltd 制御パラメータの最適化システム
JP2007280054A (ja) * 2006-04-06 2007-10-25 Sony Corp 学習装置および学習方法、並びにプログラム
JP5137537B2 (ja) 2007-11-28 2013-02-06 三菱電機株式会社 ロボットの作業動作最適化装置
CN101623865A (zh) * 2009-07-08 2010-01-13 北京工业大学 独轮机器人系统及其控制方法
JP5454221B2 (ja) * 2010-02-24 2014-03-26 株式会社Ihi 多関節ロボットの駆動制御方法及び多関節ロボットの配線配管保護装置
CN101973031B (zh) * 2010-08-24 2013-07-24 中国科学院深圳先进技术研究院 云机器人系统及实现方法
JP5623358B2 (ja) * 2011-09-06 2014-11-12 三菱電機株式会社 ワーク取り出し装置
JP5931685B2 (ja) * 2012-10-12 2016-06-08 日本電信電話株式会社 ロボット協調搬送計画装置、方法、プログラム
JP5765355B2 (ja) * 2013-03-18 2015-08-19 株式会社安川電機 ロボットピッキングシステム及び被加工物の製造方法
US9008840B1 (en) * 2013-04-19 2015-04-14 Brain Corporation Apparatus and methods for reinforcement-guided supervised learning
JP6429450B2 (ja) * 2013-10-31 2018-11-28 キヤノン株式会社 情報処理装置、情報処理方法
US9524418B2 (en) * 2014-06-05 2016-12-20 Promethean Limited Systems and methods for detecting, identifying and tracking objects and events over time

Also Published As

Publication number Publication date
DE102017002996B4 (de) 2020-08-27
CN107263464B (zh) 2020-02-28
CN107263464A (zh) 2017-10-20
JP2017185577A (ja) 2017-10-12
US10317854B2 (en) 2019-06-11
US20170285584A1 (en) 2017-10-05
DE102017002996A1 (de) 2017-10-05

Similar Documents

Publication Publication Date Title
JP6457421B2 (ja) シミュレーション結果を利用して学習を行う機械学習装置,機械システム,製造システムおよび機械学習方法
US11511420B2 (en) Machine learning device, robot system, and machine learning method for learning operation program of robot
JP6031202B1 (ja) 製造機械の異常の原因を発見するセル制御装置
US11429854B2 (en) Method and device for a computerized mechanical device
JP6542839B2 (ja) 制御装置及び機械学習装置
JP6148316B2 (ja) 故障条件を学習する機械学習方法及び機械学習装置、並びに該機械学習装置を備えた故障予知装置及び故障予知システム
JP6438450B2 (ja) レーザ加工ロボットの加工順序を学習する機械学習装置、ロボットシステムおよび機械学習方法
JP6616170B2 (ja) コアシートの積層動作を学習する機械学習器、積層コア製造装置、積層コア製造システムおよび機械学習方法
US20210073096A1 (en) Three-dimensional space monitoring device and three-dimensional space monitoring method
US20210114209A1 (en) Robot control device, and method and non-transitory computer-readable storage medium for controlling the same
JP2019185125A (ja) 制御装置及び機械学習装置
US20210107144A1 (en) Learning method, learning apparatus, and learning system
CN112847336B (zh) 动作学习方法、装置、存储介质及电子设备
CN114599488A (zh) 机器学习数据生成装置、机器学习装置、作业系统、计算机程序、机器学习数据生成方法及作业机的制造方法
US11203116B2 (en) System and method for predicting robotic tasks with deep learning
US20220143836A1 (en) Computer-readable recording medium storing operation control program, operation control method, and operation control apparatus
JP6731603B1 (ja) 検査システム
CN117348577B (zh) 一种生产工艺仿真检测方法、装置、设备以及介质
US20220297298A1 (en) Data generation device, data generation method, control device, control method, and computer program product
US20240005060A1 (en) Simulation device, storage medium having simulation program and method
CN114080304B (zh) 控制装置、控制方法及控制程序
WO2023157235A1 (ja) 計算装置
JP7060546B2 (ja) 歯当たり位置調整量推定装置、機械学習装置、ロボットシステム及び歯当たり位置調整量推定システム
US20210326754A1 (en) Storage medium, learning method, and information processing apparatus
US20240054393A1 (en) Learning Device, Learning Method, Recording Medium Storing Learning Program, Control Program, Control Device, Control Method, and Recording Medium Storing Control Program

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180328

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180417

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180614

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180918

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181019

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20181029

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181220

R150 Certificate of patent or registration of utility model

Ref document number: 6457421

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150