JP6114421B1 - 複数の産業機械の作業分担を学習する機械学習装置,産業機械セル,製造システムおよび機械学習方法 - Google Patents

複数の産業機械の作業分担を学習する機械学習装置,産業機械セル,製造システムおよび機械学習方法 Download PDF

Info

Publication number
JP6114421B1
JP6114421B1 JP2016029605A JP2016029605A JP6114421B1 JP 6114421 B1 JP6114421 B1 JP 6114421B1 JP 2016029605 A JP2016029605 A JP 2016029605A JP 2016029605 A JP2016029605 A JP 2016029605A JP 6114421 B1 JP6114421 B1 JP 6114421B1
Authority
JP
Japan
Prior art keywords
industrial
work
machine learning
industrial machines
machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016029605A
Other languages
English (en)
Other versions
JP2017146879A (ja
Inventor
雅文 大場
雅文 大場
丈嗣 津田
丈嗣 津田
智樹 大家
智樹 大家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FANUC Corp
Original Assignee
FANUC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FANUC Corp filed Critical FANUC Corp
Priority to JP2016029605A priority Critical patent/JP6114421B1/ja
Priority to CN201710007511.XA priority patent/CN107102619A/zh
Priority to US15/429,064 priority patent/US11036191B2/en
Priority to DE102017001290.3A priority patent/DE102017001290A1/de
Application granted granted Critical
Publication of JP6114421B1 publication Critical patent/JP6114421B1/ja
Publication of JP2017146879A publication Critical patent/JP2017146879A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/408Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by data handling or data format, e.g. reading, buffering or conversion of data
    • G05B19/4083Adapting programme, configuration
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/4185Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by the network communication
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/41865Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by job scheduling, process planning, material flow
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/31From computer integrated manufacturing till monitoring
    • G05B2219/31264Control, autonomous self learn knowledge, rearrange task, reallocate resources
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/33Director till display
    • G05B2219/33038Real time online learning, training, dynamic network
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/39Robotics, robotics to robotics hand
    • G05B2219/39166Coordinate activity by sending pheromone messages between robots, no central control
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/45Nc applications
    • G05B2219/45104Lasrobot, welding robot
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Automation & Control Theory (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Manufacturing & Machinery (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • General Factory Administration (AREA)
  • Manipulator (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Feedback Control In General (AREA)

Abstract

【課題】複数の産業機械の作業分担を最適化することのできる機械学習装置,産業機械セル,製造システムおよび機械学習方法の提供を図る。【解決手段】複数の産業機械11〜1nにより作業を行い、前記複数の産業機械に対する作業分担を学習する機械学習装置2であって、前記複数の産業機械の状態量を観測する状態量観測部21と、前記状態量観測部により観測された前記状態量に基づいて、前記複数の産業機械に対する作業分担を学習する学習部22と、を備える。【選択図】図1

Description

本発明は、複数の産業機械の作業分担を学習する機械学習装置,産業機械セル,製造システムおよび機械学習方法に関する。
従来、例えば、ロボット等の産業機械を複数備え、それら複数の産業機械により作業を行う産業機械セルが実用化されている。このとき、処理されていないワークの合計数を計算し、処理したワークの合計数の多いマシンから、上記合計数の少ないマシンへ1つ以上のワークを再割り当てすることで、各マシンの負荷を均一化するものが提案されている(例えば、特許文献1参照)。
また、従来、ロボットの動作経路や物品の搬送間隔が変化する場合であっても、効率よく物品をハンドリング可能とするものとして、各制御装置が制御するロボットがハンドリングするワークおよびハンドリングしないワークの個数を予め規定しておき、その規定された個数に基づいてワークのハンドリングを行うか否かを判断するものも提案されている(例えば、特許文献2参照)。
さらに、従来、予めワークや部品の情報およびロボットの情報を設定した上で、決められた作業に対して、複数のロボットにタスクを分配し、動作させる順序を決め、衝突回避を行って、作業の最適化を図るものも提案されている(例えば、特許文献3参照)。
また、従来、溶接ロボットの故障等によってスポット溶接ガンが動作不能に陥った場合でも、予め各スポット溶接ガンが動作不能になった場合を想定して、生産ラインの作業配分シミュレーションを行うことも提案されている(例えば、特許文献4参照)。
なお、ロボットの適用としては、製造作業を行うものだけでなく、例えば、搬送コンベヤ(コンベヤ)上の物品を受け渡す物流トラッキング装置(例えば、特許文献5参照)といった様々なものであってもよい。
特許第4827731号公報 特開2008−296330号公報 特開2004−243461号公報 特開2000−141147号公報 特開2007−030087号公報
上述したように、従来、様々な提案がなされているが、例えば、特許文献1のように、或る作業を複数台のロボットで分担して行う際、各ロボットに対して作業量が均一になるように作業分担を決める場合、あるいは、特許文献2のように、作業個数を予め決めて作業を行うか否かを判断する場合、各ロボット固有の状態(例えば、作業領域や作業内容の違い等)により、いずれかのロボットで能力を超える作業が生じ得る。そして、いずれかのロボットにおいて、そのロボットの能力(許容値)を超える作業が生じると、結果として、ワークの見逃しや不完全な作業が行われることにもなる。
また、このような課題を防ぐために、各ロボット固有の状態を考慮して作業割合(それぞれのロボットが分担する作業の量)を予め決めておき、あるいは、その作業割合を動的に制御するといったことが考えられる。しかしながら、複数のロボットの作業内容等の条件の組み合わせは膨大になるため、例えば、作業割合を予め決めておくことや、予め作業割合を変更するプログラムを作って作業割合を動的に制御することは、現実的には困難である。
上述した課題は、例えば、生産中にいずれかのロボットが何らかの理由で停止し、残った他のロボットで作業を分担して生産を継続するといった場合に顕著なものになる。この場合、例えば、特許文献1のように、残った他のロボットで作業を均一に分担することが考えられるが、上述したように、いずれかのロボットで能力を超える作業が生じると、多くのワークの見逃しや不完全な作業が行われる虞が生じる。
また、例えば、複数のロボットでスポット溶接を行うシステムにおいて、何らかの原因でシステム内の任意のロボットが停止した場合、その停止したロボットの作業を他のロボットで分担する必要がある。しかしながら。例えば、特許文献3では、タスク(作業)が入力される以前にロボットの情報を入力しておく必要があるため、任意のロボットが停止した場合、ロボット情報を更新した上でタスクの再分配を行い、作業の最適化を再構築することになるため、システム全体の停止時間の増大を招く虞がある。
さらに、例えば、特許文献4では、予め各ロボットが停止した際に、他のロボットで作業を分担できるようにシミュレーションを行っているが、事前のシミュレーションを行うための工数が必要なだけでなく、シミュレーション結果に基づいた挙動しかとれないといった課題がある。
本発明の目的は、上述した従来技術の課題に鑑み、複数の産業機械の作業分担を最適化することのできる機械学習装置,産業機械セル,製造システムおよび機械学習方法の提供にある。
本発明に係る第1実施形態の第一構成例によれば、複数の産業機械により作業を行い、前記複数の産業機械におけるいずれかの産業機械が停止した場合に、停止した前記産業機械の作業を、停止した前記産業機械を除く残りの産業機械で分担するように、作業分担を学習する機械学習装置であって、前記複数の産業機械の状態量を観測する状態量観測部と、前記状態量観測部により観測された前記状態量に基づいて、前記複数の産業機械に対する作業分担を学習する学習部と、を備え、前記状態量観測部は、前記複数の産業機械により繰り返し行われる一連の作業の開始から終了までの作業時間、および、前記作業の開始から終了までの,前記複数の産業機械のそれぞれにおける作業負荷を観測し、前記学習部は、前記状態量観測部の出力に基づいて、前記作業負荷が、前記産業機械が許容する負荷を超えるときはマイナス報酬を設定し、前記作業時間を短縮できたときはプラス報酬を設定し、前記作業時間を短縮できなかったときは報酬なしを設定する報酬計算部と、前記状態量観測部の出力および前記報酬計算部の出力に基づいて、前記複数の産業機械に対する作業分担の価値を定める行動価値テーブルを、前記報酬に応じて更新する価値関数更新部と、を備える機械学習装置が提供される。
前記機械学習装置は、さらに、前記学習部が学習した前記作業分担を参照して、前記複数の産業機械に対して作業の分担内容を決定して指令する意思決定部を備えるのが好ましい。前記機械学習装置は、ネットワークを介して前記複数の産業機械のそれぞれに接続され、前記状態量観測部は、前記ネットワークを介して前記複数の産業機械の状態量を取得し、前記意思決定部は、前記ネットワークを介して前記複数の産業機械に対して前記作業の分担内容を送信することができる。
前記状態量観測部は、前記複数の産業機械により繰り返し行われる一連の作業の開始から終了までの作業時間、および、前記作業の開始から終了までの,前記複数の産業機械のそれぞれにおける作業負荷の少なくとも一方を観測し、あるいは、前記複数の産業機械が行う作業の達成度、および、前記複数の産業機械のそれぞれにおける作業量の差の少なくとも一方を観測するのが好ましい。前記状態量観測部は、さらに、上流の工程における生産量の変化、および、定期的に行われるメンテナンスによる前記産業機械の停止に伴う生産量の変化の少なくとも一方を取得してもよい。
前記学習部は、前記複数の産業機械による生産量の維持、前記複数の産業機械のそれぞれにおける負荷の平均化、ならびに、前記複数の産業機械による作業量の最大化を行うための作業分担を学習するのが好ましい。前記複数の産業機械のそれぞれは、ロボットであり、前記複数のロボットは、学習した前記作業分担に基づいて作業を行うことができる。
前記学習部は、前記状態量観測部の出力に基づいて報酬を計算する報酬計算部と、前記状態量観測部の出力および前記報酬計算部の出力に基づいて、前記複数の産業機械に対する作業分担の価値を定める価値関数を、前記報酬に応じて更新する価値関数更新部と、を備えることができる。また、前記学習部は、前記状態量観測部の出力および入力された教師データに基づいて誤差を計算する誤差計算部と、前記状態量観測部の出力および前記誤差計算部の出力に基づいて、前記複数の産業機械に対する作業分担の誤差を定める学習モデルを更新する学習モデル更新部と、を備えることもできる。前記機械学習装置は、ニューラルネットワークを備えてもよい。
本発明に係る第2実施形態によれば、前記複数の産業機械と、上述した第1実施形態による機械学習装置と、を備える、産業機械セルが提供される。
本発明に係る第3実施形態によれば、上述した第2実施形態による産業機械セルを複数備える製造システムであって、前記機械学習装置は、前記産業機械セルに対応して設けられ、前記産業機械セルに対応して設けられた前記機械学習装置は、通信媒体を介して相互にデータを共有または交換するようになっている製造システムが提供される。前記機械学習装置は、クラウドサーバ上に存在してもよい。
本発明に係る第4実施形態によれば、複数の産業機械により作業を行い、前記複数の産業機械に対する作業分担を学習する機械学習方法であって、前記複数の産業機械の状態量を観測し、観測された前記状態量に基づいて、前記複数の産業機械に対する作業分担を学習する機械学習方法が提供される。前記状態量を観測するのは、前記複数の産業機械により繰り返し行われる一連の作業の開始から終了までの作業時間、および、前記作業の開始から終了までの,前記複数の産業機械のそれぞれにおける作業負荷の少なくとも一方を観測し、あるいは、前記複数の産業機械が行う作業の達成度、および、前記複数の産業機械のそれぞれにおける作業量の差の少なくとも一方を観測するのが好ましい。
本発明に係る機械学習装置,産業機械セル,製造システムおよび機械学習方法によれば、複数の産業機械の作業分担を最適化することができるという効果を奏する。
図1は、本発明に係る産業機械セルの一実施形態を示すブロック図である。 図2は、図1に示す産業機械セルによる作業の一例を説明するための図である。 図3は、ニューロンのモデルを模式的に示す図である。 図4は、図3に示すニューロンを組み合わせて構成した三層のニューラルネットワークを模式的に示す図である。 図5は、本発明に係る機械学習装置の一実施例を示すブロック図である。 図6は、図5に示す機械学習装置の動作の一例を説明するためのフローチャートである。 図7は、本発明に係る機械学習装置の他の実施例を示すブロック図である。 図8は、複数の産業機械セルを備える製造システムの一例を示すブロック図である。 図9は、産業機械セルにおいて、1つの産業機械が停止した場合の処理の一例を説明するための図である。
まず、本発明に係る機械学習装置,産業機械セル,製造システムおよび機械学習方法の実施形態を詳述する前に、例えば、1つの産業機械が停止した場合における産業機械セルの処理の一例を、図9を参照して説明する。図9は、産業機械セルにおいて、1つの産業機械が停止した場合の処理の一例を説明するための図である。図9において、参照符号11〜14は産業機械(ロボット)、50はコンベヤ(搬送コンベヤ)、51〜54はワーク載置部、60はワーク、そして、200は産業機械セルを示す。
図9に示されるように、産業機械セル200は、複数のロボット11〜14を備え、それぞれのロボットは、コンベヤ50により連続的に搬送されるワーク60を順次取り出して、対応するワーク載置部51〜54の上面に載置するようになっている。ここで、図9は、例えば、メンテナンスのため1台のロボット12が停止し、残り3台のロボット11,13,14により、4台のロボット11〜14と同じ作業を行う場合を示している。
例えば、各ロボット11〜14の作業の能力(処理能力)、ならびに、各ロボット11〜14による作業の内容(処理内容)は同一で、しかも、産業機械セル200による作業も同一作業の繰り返しであると仮定し、4台のロボット11〜14により産業機械セル200全体の作業を100%とすると、各ロボット11〜14が行う作業は、それぞれ25%になる。そして、1台のロボット12が停止し、残り3台のロボット11,13,14により作業を行う場合、各ロボット11,13,14が行う作業は、それぞれ25%から約33%に増加することになる。
しかしながら、実際の産業機械セル200におけるロボット11〜14は、例えば、全て同一の作業を行うことは少なく、また、各ロボットの作業領域も異なっていることが多い。そのため、4台のロボット11〜14における1台のロボット12が停止したとき、ロボット12の作業を残りの3台のロボット11,13,14に対して均等に割り振っても、それが最適な作業分担になるのは極めて稀である。さらに、例えば、所定のロボットにおいて、そのロボットの能力を超える作業が生じると、ワークの見逃しや不完全な作業が生じる虞もある。
また、ロボットの能力を超えないように余裕を持たせることも考えられるが、ロボットに余裕を持たせることは、本来の生産能力を発揮させないことでもあるため、産業機械セルにおける生産性の損失を招くことになる。
さらに、各ロボット固有の状態を考慮して作業割合を予め決めておき、あるいは、その作業割合を動的に制御することも考えられるが、複数のロボットの作業内容等の条件の組み合わせは膨大であり、各ロボットに最適な作業分担で作業を行わせて産業機械セル200全体の生産量を最大化するのは、困難なものになっている。
以下、本発明に係る複数の産業機械の作業分担を学習する機械学習装置,産業機械セル,製造システムおよび機械学習方法の実施形態を、添付図面を参照して詳述する。図1は、本発明に係る産業機械セルの一実施形態を示すブロック図である。
図1に示されるように、産業機械セル100は、作業を行う複数の産業機械11〜13、および、複数の産業機械11〜13に対する作業分担(作業割合(ロードバランス))を学習する機械学習装置2を含む。なお、図1では、説明を簡略化するために、3つの産業機械11〜13のみが描かれているが、産業機械の数は、3つに限定されるものではなく、様々な場合があり得るのはいうまでもない。ここで、産業機械としては、産業用およびサービス用のロボットに限定されず、例えば、旋盤,ボール盤,中ぐり盤,フライス盤,研削盤,歯切り盤・歯車仕上げ機械,マシニングセンタ,放電加工機,パンチプレス,レーザ加工機,搬送機およびプラスチック射出成形機といった工作機械等であってもよい。
図1に示されるように、機械学習装置2は、状態量観測部21,学習部22および意思決定部23を備える。状態量観測部21は、複数の産業機械11〜13の状態量(状態変数)を観測し、学習部22は、状態量観測部21により観測された状態量に基づいて、複数の産業機械11〜13に対する作業分担を学習する。意思決定部23は、学習部22が学習した作業分担を参照して、複数の産業機械11〜13に対して作業の分担内容を決定して指令する。
ここで、機械学習装置2は、例えば、ネットワーク3を介して複数の産業機械11〜13のそれぞれに接続されている。状態量観測部21は、ネットワークを介して複数の産業機械11〜13の状態量を取得し、意思決定部23は、ネットワークを介して、複数の産業機械11〜13に対する作業の分担内容を送信するようになっている。なお、学習部22は、例えば、複数の産業機械11〜13による生産量の維持、複数の産業機械11〜13のそれぞれにおける負荷の平均化、ならびに、複数の産業機械11〜13による作業量の最大化等を行うための作業分担を学習する。
図2は、図1に示す産業機械セルによる作業の一例を説明するための図であり、ワーク6に対して、複数のロボットR1〜R8によりスポット溶接を行う産業機械セルを説明するためのものである。図2において、参照符号A1〜A8は、通常時(ロボットR3も動作しているとき)に、例えば、自動車等のワーク6に対して、各ロボットR1〜R8がスポット溶接を行う領域を示す。そのため、例えば、ロボットR3がメンテナンス等により停止している場合、ロボットR3が行っていた領域A3の打点(スポット溶接個所)は、ロボットR3の周辺に位置するロボットR2,R4,R7(R6,R8)等により分担され、さらに、ロボットR2が通常時に行っていた領域A2の打点も、ロボットR2の周辺に位置するロボットR1,R6(R5,R7)等により分担される。
本実施形態の機械学習装置2(4)は、例えば、8台のロボットR1〜R8を含む産業機械セルにおいて、1台のロボットR3が停止した場合に、残りの7台のロボットR1,R2およびR4〜R8により分担する作業を学習して、ロボットR1,R2およびR4〜R8の作業分担を最適化しようとするものである。なお、本実施形態の産業機械セル(100)としては、例えば、図2に示すような、自動車等のワーク6に対して複数のロボットR1〜R8によりスポット溶接を行うものであってもよいが、図9を参照して説明したような複数のロボット11〜14で、コンベヤ50により連続的に搬送されるワーク60に対して順次作業を行うものであってもよい。
すなわち、本実施形態の機械学習装置2(4)は、様々な構成の産業機械セルに対して幅広く適用することが可能である。また、産業機械としては、様々な産業用ロボットや工作機械を用いることができ、さらに、産業機械セルとしては、これら産業用ロボットや工作機械等を必要に応じて混在させることができるのはいうまでもない。また、機械学習装置としては、図5および図6を参照して説明する「強化学習(Q学習)」を適用した機械学習装置2、並びに、図7を参照して説明する「教師有り学習」を適用した機械学習装置4を始めとして、様々な機械学習を適用したものであってもよい。
すなわち、機械学習装置は、装置に入力されるデータの集合から、その中にある有用な規則や知識表現、判断基準等を解析により抽出し、その判断結果を出力するとともに、知識の学習(機械学習)を行う機能を有する。機械学習の手法は様々であるが、大別すれば、例えば、「教師あり学習」、「教師なし学習」および「強化学習」に分けられる。さらに、これらの手法を実現するうえで、特徴量そのものの抽出を学習する、「深層学習(ディープラーニング:Deep Learning)」と呼ばれる手法がある。
上述したように、図5に示す機械学習装置2は、「強化学習(Q学習)」を適用した例を示し、また、図7に示す機械学習装置4は、「教師あり学習」を適用した例を示す。これらの機械学習装置2,4(機械学習)は、汎用の計算機若しくはプロセッサを用いることもできるが、例えば、GPGPU(General-Purpose computing on Graphics Processing Units)や大規模PCクラスター等を適用すると、より高速処理が可能になる。
まず、教師あり学習とは、教師データ、すなわち、ある入力と結果(ラベル)のデータの組を大量に機械学習装置に与えることで、それらのデータセットにある特徴を学習し、入力から結果を推定するモデル(誤差モデル)、すなわち、その関係性を帰納的に獲得するものである。例えば、後述のニューラルネットワーク等のアルゴリズムを用いて実現することが可能である。
また、教師なし学習とは、入力データのみを大量に機械学習装置に与えることで、入力データがどのような分布をしているか学習し、対応する教師出力データを与えなくても、入力データに対して圧縮・分類・整形等を行う装置で学習する手法である。例えば、それらのデータセットにある特徴を、似た者どうしにクラスタリングすること等ができる。この結果を使って、何らかの基準を設けてそれを最適化するような出力の割り当てを行うことにより、出力の予測を実現することできる。
なお、教師なし学習と教師あり学習との中間的な問題設定として、半教師あり学習と呼ばれるものもあり、これは、例えば、一部のみ入力と出力のデータの組が存在し、それ以外は入力のみのデータである場合が対応する。本実施形態においては、実際に産業機械セル(複数の産業機械)を動かさなくても取得することができるデータ(画像データやシミュレーションのデータ等)を教師なし学習で利用することにより、学習を効率的に行うことが可能になる。
次に、強化学習について、説明する。まず、強化学習の問題設定として、次のように考える。
・産業機械セル(すなわち、複数の産業機械(例えば、複数のロボットや複数の工作機械等))は、環境の状態を観測し、行動を決定する。
・環境は、何らかの規則に従って変化し、さらに、自分の行動が、環境に変化を与えることもある。
・行動するたびに、報酬信号が帰ってくる。
・最大化したいのは、将来にわたっての(割引)報酬の合計である。
・行動が引き起こす結果を全く知らない、または、不完全にしか知らない状態から学習はスタートする。すなわち、数値制御装置は、実際に行動して初めて、その結果をデータとして得ることができる。つまり、試行錯誤しながら最適な行動を探索する必要がある。
・人間の動作を真似るように、事前学習(前述の教師あり学習や、逆強化学習といった手法)した状態を初期状態として、良いスタート地点から学習をスタートさせることもできる。
ここで、強化学習とは、判定や分類だけではなく、行動を学習することにより、環境に行動が与える相互作用を踏まえて適切な行動を学習、すなわち、将来的に得られる報酬を最大にするための学習する方法を学ぶものである。以下に、例として、Q学習の場合で説明を続けるが、Q学習に限定されるものではない。
Q学習は、或る環境状態sの下で、行動aを選択する価値Q(s,a)を学習する方法である。つまり、或る状態sのとき、価値Q(s,a)の最も高い行動aを最適な行動として選択すればよい。しかし、最初は、状態sと行動aとの組合せについて、価値Q(s,a)の正しい値は全く分かっていない。そこで、エージェント(行動主体)は、或る状態sの下で様々な行動aを選択し、その時の行動aに対して、報酬が与えられる。それにより、エージェントは、より良い行動の選択、すなわち、正しい価値Q(s,a)を学習していく。
さらに、行動の結果、将来にわたって得られる報酬の合計を最大化したいので、最終的にQ(s,a)=E[Σ(γt)rt]となるようにすることを目指す。ここで、期待値は、最適な行動に従って状態変化したときについてとるものとし、それは、分かっていないので、探索しながら学習することになる。このような価値Q(s,a)の更新式は、例えば、次の式(1)により表すことができる。
Figure 0006114421
上記の式(1)において、stは、時刻tにおける環境の状態を表し、atは、時刻tにおける行動を表す。行動atにより、状態はst+1に変化する。rt+1は、その状態の変化により得られる報酬を表している。また、maxの付いた項は、状態st+1の下で、その時に分かっている最もQ値の高い行動aを選択した場合のQ値にγを乗じたものになる。ここで、γは、0<γ≦1のパラメータで、割引率と呼ばれる。また、αは、学習係数で、0<α≦1の範囲とする。
上述した式(1)は、試行atの結果、帰ってきた報酬rt+1を元に、状態stにおける行動atの評価値Q(st,at)を更新する方法を表している。すなわち、状態sにおける行動aの評価値Q(st,at)よりも、報酬rt+1 + 行動aによる次の状態における最良の行動max aの評価値Q(st+1,max at+1)の方が大きければ、Q(st,at)を大きくし、反対に小さければ、Q(st,at)を小さくすることを示している。つまり、或る状態における或る行動の価値を、結果として即時帰ってくる報酬と、その行動による次の状態における最良の行動の価値に近付けるようにしている。
ここで、Q(s,a)の計算機上での表現方法は、すべての状態行動ペア(s,a)に対して、その値をテーブルとして保持しておく方法と、Q(s,a)を近似するような関数を用意する方法がある。後者の方法では、前述の式(1)は、確率勾配降下法等の手法で近似関数のパラメータを調整していくことにより、実現することができる。なお、近似関数としては、後述のニューラルネットワークを用いることができる。
また、強化学習での価値関数の近似アルゴリズムとして、ニューラルネットワークを用いることができる。図3は、ニューロンのモデルを模式的に示す図であり、図4は、図3に示すニューロンを組み合わせて構成した三層のニューラルネットワークを模式的に示す図である。すなわち、ニューラルネットワークは、例えば、図3に示すようなニューロンのモデルを模した演算装置およびメモリ等で構成される。
図3に示されるように、ニューロンは、複数の入力x(図3では、一例として入力x1〜x3)に対する出力(結果)yを出力するものである。各入力x(x1,x2,x3)には、この入力xに対応する重みW(W1,W2,W3)が乗算される。これにより、ニューロンは、次の式(2)により表現される結果yを出力する。なお、入力x、結果yおよび重みwは、すべてベクトルである。また、下記の式(2)において、θは、バイアスであり、fkは、活性化関数である。
Figure 0006114421
図4を参照して、図3に示すニューロンを組み合わせて構成した三層のニューラルネットワークを説明する。図4に示されるように、ニューラルネットワークの左側から複数の入力x(ここでは、一例として、入力x1〜入力x3)が入力され、右側から結果y(ここでは、一例として、結果y1〜入力y3)が出力される。具体的に、入力x1,x2, x3は、3つのニューロンN11〜N13の各々に対して、対応する重みが掛けられて入力される。これらの入力に掛けられる重みは、まとめてW1と標記されている。
ニューロンN11〜N13は、それぞれ、z11〜z13を出力する。図4において、これらz11〜z13は、まとめて特徴ベクトルZ1と標記され、入力ベクトルの特徴量を抽出したベクトルとみなすことができる。この特徴ベクトルZ1は、重みW1と重みW2との間の特徴ベクトルである。z11〜z13は、2つのニューロンN21およびN22の各々に対して、対応する重みが掛けられて入力される。これらの特徴ベクトルに掛けられる重みは、まとめてW2と標記されている。
ニューロンN21,N22は、それぞれz21,z22を出力する。図4において、これらz21,z22は、まとめて特徴ベクトルZ2と標記されている。この特徴ベクトルZ2は、重みW2と重みW3との間の特徴ベクトルである。z21,z22は、3つのニューロンN31〜N33の各々に対して、対応する重みが掛けられて入力される。これらの特徴ベクトルに掛けられる重みは、まとめてW3と標記されている。
最後に、ニューロンN31〜N33は、それぞれ、結果y1〜結果y3を出力する。ニューラルネットワークの動作には、学習モードと価値予測モードとがある。例えば、学習モードにおいて、学習データセットを用いて重みWを学習し、そのパラメータを用いて予測モードにおいて、数値制御装置の行動判断を行う。なお、便宜上、予測と書いたが、検出・分類・推論等多様なタスクが可能なのはいうまでもない。
ここで、予測モードで実際に数値制御装置を動かして得られたデータを即時学習し、次の行動に反映させる(オンライン学習)ことも、予め収集しておいたデータ群を用いてまとめた学習を行い、以降はずっとそのパラメータで検知モードを行う(バッチ学習)こともできる。あるいは、その中間的な、ある程度データが溜まるたびに学習モードを挟むということも可能である。
また、重みW1〜W3は、誤差逆伝搬法(誤差逆転伝播法:バックプロパゲーション:Backpropagation)により学習可能なものである。なお、誤差の情報は、右側から入り左側に流れる。誤差逆伝搬法は、各ニューロンについて、入力xが入力されたときの出力yと真の出力y(教師)との差分を小さくするように、それぞれの重みを調整(学習)する手法である。このようなニューラルネットワークは、三層以上に、さらに層を増やすことも可能である(深層学習と称される)。また、入力の特徴抽出を段階的に行い、結果を回帰する演算装置を、教師データのみから自動的に獲得することも可能である。
図5は、本発明に係る機械学習装置の一実施例を示すブロック図であり、「強化学習(Q学習)」を適用した機械学習装置の例を示すものである。本実施例の機械学習装置2は、例えば、Q学習を実施するために、状態量観測部21、学習部22、および、意思決定部23を備えている。ただし、本発明に適用される機械学習方法は、Q学習に限定されない。また、機械学習(機械学習装置2)は、例えば、GPGPUや大規模PCクラスター等を適用することで実現可能なのは、前述した通りである。
図5に示されるように、機械学習装置2は、状態量観測部21、学習部22、ならびに、意思決定部23を備え、学習部22は、報酬計算部221および価値関数更新部222を含む。状態量観測部21は、複数の産業機械(例えば、ロボットR1〜R8)の状態量を観測するが、具体的に、例えば、複数の産業機械により繰り返し行われる一連の作業の開始から終了までの作業時間(全体の作業時間)、および、作業の開始から終了までの間における複数の産業機械のそれぞれの作業負荷(例えば、各ロボットの消費電力等の負荷)を観測する。
あるいは、状態量観測部21は、複数の産業機械が行う作業の達成度、および、複数の産業機械のそれぞれにおける作業量の差を観測することもできる。ここで、複数の産業機械が行う作業の達成度としては、例えば、ワークの見逃し数等であり、また、複数の産業機械のそれぞれにおける作業量の差としては、例えば、各産業機械が処理するワークの個数や打点数の差等である。
なお、状態量観測部21は、全体の作業時間および各ロボットの作業負荷の一方、あるいは、複数の産業機械が行う作業の達成度および複数の産業機械のそれぞれにおける作業量の差の一方を観測してもよい。また、状態量観測部21は、全体の作業時間および各ロボットの作業負荷、ならびに、複数の産業機械が行う作業の達成度および複数の産業機械のそれぞれにおける作業量の差を観測することもできる。さらに、状態量観測部21は、例えば、その産業機械セル(100)が行う作業の上流の工程における生産量の変化、および、定期的に行われるメンテナンスによる産業機械の停止に伴う生産量の変化の少なくとも一方を取得(観測)することもできる。
報酬計算部221は、状態量観測部21の出力に基づいて報酬を計算し、価値関数更新部222は、状態量観測部21の出力および報酬計算部221の出力に基づいて、複数の産業機械に対する作業分担の価値を定める価値関数を報酬に応じて更新する。
図6は、図5に示す機械学習装置の動作の一例を説明するためのフローチャートであり、状態量観測部21が、上述した全体の作業時間および各ロボットの作業負荷を取得する例を示すものである。図6に示されるように、機械学習が開始(学習スタート)すると、行動価値テーブルに基づいた分担内容で作業を行う(ステップST1)。すなわち、産業機械セル100に含まれる複数の産業機械(例えば、図1における産業機械11〜1n、あるいは、図2におけるロボットR1〜R8)は、機械学習装置2(意思決定部23)から出力される作業の分担内容に基づいた作業を行って、ステップST2に進む。
ステップST2では、複数の産業機械(例えば、ロボットR1〜R8)により繰り返し行われる一連の作業の開始から終了までの作業時間(すなわち、産業機械セル100全体の作業時間)、および、この作業の開始から終了までの,複数の産業機械のそれぞれにおける作業負荷(すなわち、各ロボットR1〜R8の作業負荷)を取得して、ステップST3に進む。ここで、例えば、ロボットR3が停止している場合には、ステップST2において、例えば、その停止しているロボットR3の作業負荷が零であることが取得される。なお、各ロボットの作業負荷の取得としては、ネットワークを介してそれぞれのロボットから取得するのに限定されず、例えば、メンテナンスを行うために停止するロボットを指定する上位の制御装置、あるいは、故障して停止したロボットから出力されるアラームの通知といった様々なものがあり得る。
ステップST3では、作業負荷がロボットの許容範囲内かどうかを判定し、作業負荷が許容範囲内である(ST3:YES)と判定すれば、ステップST4に進んで、作業時間を短縮できたかどうかを判定し、作業負荷が許容範囲内ではない(ST3:NO)と判定すれば、ステップST7に進んでマイナス報酬を設定する。すなわち、作業負荷が、そのロボットが許容する負荷を超えるのは好ましくないので、マイナス報酬を設定する。
ステップST4において、作業時間(産業機械セル100全体の作業時間)を短縮できた(ST4:YES)と判定すると、ステップST5に進んでプラス報酬を設定し、作業時間を短縮できなかった(ST4:NO)と判定すると、ステップST6に進んで報酬なし(零報酬)を設定する。そして、ステップST8に進んで、ステップST5,ST6およびST7による「プラス報酬」,「報酬なし」および「マイナス報酬」による報酬計算を行い、ステップST9に進んで、行動価値テーブルを更新する。そして、ステップST1に戻り、同様の処理を繰り返す。これにより、複数のロボット(産業機械)の作業分担を最適化することが可能になる。
以上において、産業機械セル100(200)は、図2に示すような自動車等のワーク6にスポット溶接を行うもの、あるいは、図9に示すようなコンベヤ50により連続的に搬送されるワーク60を順次取り出すものに限定されず、例えば、コンベヤ上の物品を受け渡す物流トラッキング装置といった様々な構成のものに対して幅広く適用することができる。また、上述したステップST5,ST6およびST7における「プラス報酬」,「報酬なし」および「マイナス報酬」の値(大きさ)は、様々な条件に応じて適切なものが選ばれるのはいうまでもない。
図7は、本発明に係る機械学習装置の他の実施例を示すブロック図であり、教師あり学習を適用したものを示す。図7と、前述した図5の比較から明らかなように、図7に示す教師あり学習を適用した機械学習装置4は、図5に示すQ学習(強化学習)を適用した機械学習装置2において、教師データ(結果(ラベル)付きデータ)が提供されるようになっている。
図7に示されるように、教師あり学習を適用した機械学習装置4は、状態量観測部41、学習部42、および、意思決定部43を備える。学習部42は、誤差計算部421、および、学習モデル更新部(誤差モデル更新部)422を備える。ここで、誤差計算部421および学習モデル更新部422は、それぞれ、図5に示すQ学習を適用した機械学習装置2における報酬計算部221および価値関数更新部222に相当する。ただし、本実施形態における誤差計算部421には、外部から教師データが入力され、その教師データと学習モデル(誤差モデル)の差が小さくなるように、学習モデル更新部422により学習モデルが更新される構成等において、図5を参照して説明したものとは異なる。
すなわち、誤差計算部421は、状態量観測部41の出力および教師データを受け取って、結果(ラベル)付きデータと学習部42に実装されている学習モデルとの誤差を計算する。ここで、教師データとしては、例えば、同一の産業機械セルにより同じ作業を行わせる場合、実際に作業を行わせる所定日の前日までに得られたラベル付きデータを保持し、その所定日に、教師データとして誤差計算部421に提供することができる。
あるいは、産業機械セル(複数のロボットや工作機械等)の外部で行われたシミュレーション等により得られたデータ、または、他の産業機械セルのラベル付きデータを、メモリカードや通信回線により、その産業機械セルの誤差計算部421に教師データとして提供することも可能である。さらに、教師データ(ラベル付きデータ)を、例えば、学習部42に内蔵したフラッシュメモリ(Flash Memory)等の不揮発性メモリに保持し、その不揮発性メモリに保持されたラベル付きデータを、そのまま学習部42で使用することもできる。
図8は、複数の産業機械セルを備える製造システムの一例を示すブロック図である。図8に示されるように、製造システムは、複数の産業機械セル101〜10mを備え、これら複数の産業機械セル101〜10mは、例えば、インターネット130で利用される通信回線等の通信媒体120を介して接続されている。
機械学習装置2,4は、産業機械セル101〜10mに対応して設けられ、産業機械セル101〜10mに対応して設けられた機械学習装置2,4は、通信媒体120を介して相互にデータを共有または交換するようになっている。なお、図8では、産業機械セル101〜10mに対応して設けられた機械学習装置2,4は、クラウドサーバ110上に存在するようになっている。従って、産業機械セル101〜10mは、地理的に異なる場所に設けられていてもよい。
あるいは、複数の産業機械セル101〜10mを地理的に近接した場所に設け、それぞれの産業機械セル101〜10mに対して設けた複数の機械学習装置2,4により学習されたデータを、例えば、LAN(Local Area Network)等の通信媒体(120)を介して相互に共有または交換することもできる。
以上、詳述したように、本発明の各実施形態によれば、機械学習の手法を使って産業機械セルにおける複数の産業機械(複数のロボットや複数の工作機械等)の作業分担を最適化することが可能になる。また、本発明の各実施形態によれば、例えば、機械学習装置は、産業機械セル内の生産量は維持しつつ、各産業機械の負荷を均一にする作業分担(作業割合)を学習して出力することができ、また、産業機械セル内の生産量を最大化するための作業分担を学習して出力することもできる。
なお、本発明に係る機械学習装置としては、「強化学習」や「教師あり学習」だけでなく、「教師なし学習」や「半教師あり学習」等の様々な機械学習の手法を適用することが可能である。
以上、実施形態を説明したが、ここに記載したすべての例や条件は、発明および技術に適用する発明の概念の理解を助ける目的で記載されたものであり、特に記載された例や条件は発明の範囲を制限することを意図するものではない。また、明細書のそのような記載は、発明の利点および欠点を示すものでもない。発明の実施形態を詳細に記載したが、各種の変更、置き換え、変形が発明の精神および範囲を逸脱することなく行えることが理解されるべきである。
2,4 機械学習装置
3 ネットワーク
6,60 ワーク
11〜1n,R1〜R8 産業機械(ロボット)
21,41 状態量観測部
22,42 学習部
23,43 意思決定部
50 コンベヤ
51〜54 ワーク載置部
100,101〜10m,200 産業機械セル
110 クラウドサーバ
120 通信媒体
130 インターネット
221 報酬計算部
222 価値関数更新部
421 誤差計算部
422 学習モデル更新部

Claims (15)

  1. 複数の産業機械により作業を行い、前記複数の産業機械におけるいずれかの産業機械が停止した場合に、停止した前記産業機械の作業を、停止した前記産業機械を除く残りの産業機械で分担するように、作業分担を学習する機械学習装置であって、
    前記複数の産業機械の状態量を観測する状態量観測部と、
    前記状態量観測部により観測された前記状態量に基づいて、前記複数の産業機械に対する作業分担を学習する学習部と、を備え、
    前記状態量観測部は、
    前記複数の産業機械により繰り返し行われる一連の作業の開始から終了までの作業時間、および、前記作業の開始から終了までの,前記複数の産業機械のそれぞれにおける作業負荷を観測し、
    前記学習部は、
    前記状態量観測部の出力に基づいて、前記作業負荷が、前記産業機械が許容する負荷を超えるときはマイナス報酬を設定し、前記作業時間を短縮できたときはプラス報酬を設定し、前記作業時間を短縮できなかったときは報酬なしを設定する報酬計算部と、
    前記状態量観測部の出力および前記報酬計算部の出力に基づいて、前記複数の産業機械に対する作業分担の価値を定める行動価値テーブルを、前記報酬に応じて更新する価値関数更新部と、を備える、
    ことを特徴とする機械学習装置。
  2. 前記作業負荷は、前記産業機械の消費電力である、
    ことを特徴とする請求項1に記載の機械学習装置。
  3. さらに、
    前記学習部が学習した前記作業分担を参照して、前記複数の産業機械に対して作業の分担内容を決定して指令する意思決定部を備える、
    ことを特徴とする請求項1または請求項2に記載の機械学習装置。
  4. 前記機械学習装置は、ネットワークを介して前記複数の産業機械のそれぞれに接続され、
    前記状態量観測部は、前記ネットワークを介して前記複数の産業機械の状態量を取得し、
    前記意思決定部は、前記ネットワークを介して前記複数の産業機械に対して前記作業の分担内容を送信する、
    ことを特徴とする請求項3に記載の機械学習装置。
  5. 前記状態量観測部は、
    記複数の産業機械が行う作業の達成度、および、前記複数の産業機械のそれぞれにおける作業量の差の少なくとも一方を観測する、
    ことを特徴とする請求項1乃至請求項4のいずれか1項に記載の機械学習装置。
  6. 前記状態量観測部は、さらに、
    上流の工程における生産量の変化、および、定期的に行われるメンテナンスによる前記産業機械の停止に伴う生産量の変化の少なくとも一方を取得する、
    ことを特徴とする請求項5に記載の機械学習装置。
  7. 前記学習部は、
    前記複数の産業機械による生産量の維持、前記複数の産業機械のそれぞれにおける負荷の平均化、ならびに、前記複数の産業機械による作業量の最大化を行うための作業分担を学習する、
    ことを特徴とする請求項1乃至請求項6のいずれか1項に記載の機械学習装置。
  8. 前記複数の産業機械のそれぞれは、ロボットであり、
    前記複数のロボットは、学習した前記作業分担に基づいて作業を行う、
    ことを特徴とする請求項1乃至請求項7のいずれか1項に記載の機械学習装置。
  9. 前記機械学習装置は、ニューラルネットワークを備える、
    ことを特徴とする請求項1乃至請求項8のいずれか1項に記載の機械学習装置。
  10. 前記複数の産業機械と、請求項1乃至請求項9のいずれか1項に記載の機械学習装置と、を備える、
    ことを特徴とする産業機械セル。
  11. 請求項10に記載の産業機械セルを複数備える製造システムであって、
    前記機械学習装置は、前記産業機械セルに対応して設けられ、
    前記産業機械セルに対応して設けられた前記機械学習装置は、通信媒体を介して相互にデータを共有または交換するようになっている、
    ことを特徴とする製造システム。
  12. 前記機械学習装置は、クラウドサーバ上に存在する、
    ことを特徴とする請求項11に記載の製造システム。
  13. 複数の産業機械により作業を行い、前記複数の産業機械におけるいずれかの産業機械が停止した場合に、停止した前記産業機械の作業を、停止した前記産業機械を除く残りの産業機械で分担するように、作業分担を学習する機械学習方法であって、
    前記複数の産業機械の状態量を観測し、
    観測された前記状態量に基づいて、前記複数の産業機械に対する作業分担を学習し、
    前記状態量の観測は、
    前記複数の産業機械により繰り返し行われる一連の作業の開始から終了までの作業時間、および、前記作業の開始から終了までの,前記複数の産業機械のそれぞれにおける作業負荷を観測し、
    前記複数の産業機械に対する作業分担の学習は、
    観測された前記複数の産業機械の前記状態量に基づいて、前記作業負荷が、前記産業機械が許容する負荷を超えるときはマイナス報酬を設定し、前記作業時間を短縮できたときはプラス報酬を設定し、前記作業時間を短縮できなかったときは報酬なしを設定して報酬を計算し、
    観測された前記複数の産業機械の前記状態量および計算された前記報酬に基づいて、前記複数の産業機械に対する作業分担の価値を定める行動価値テーブルを、前記報酬に応じて更新する、
    ことを特徴とする機械学習方法。
  14. 前記作業負荷は、前記産業機械の消費電力である、
    ことを特徴とする請求項13に記載の機械学習方法。
  15. 前記状態量の観測は、
    記複数の産業機械が行う作業の達成度、および、前記複数の産業機械のそれぞれにおける作業量の差の少なくとも一方を観測する、
    ことを特徴とする請求項13または請求項14に記載の機械学習方法。
JP2016029605A 2016-02-19 2016-02-19 複数の産業機械の作業分担を学習する機械学習装置,産業機械セル,製造システムおよび機械学習方法 Active JP6114421B1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2016029605A JP6114421B1 (ja) 2016-02-19 2016-02-19 複数の産業機械の作業分担を学習する機械学習装置,産業機械セル,製造システムおよび機械学習方法
CN201710007511.XA CN107102619A (zh) 2016-02-19 2017-01-05 机器学习装置、工业机械单元、制造系统及机器学习方法
US15/429,064 US11036191B2 (en) 2016-02-19 2017-02-09 Machine learning device, industrial machine cell, manufacturing system, and machine learning method for learning task sharing among plurality of industrial machines
DE102017001290.3A DE102017001290A1 (de) 2016-02-19 2017-02-10 Maschinenlernvorrichtung, Industriemaschinenzelle, Herstellungssystem und Maschinenlernverfahren zum Erlernen einer Aufgabenteilung unter einer Vielzahl von Industriemaschinen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016029605A JP6114421B1 (ja) 2016-02-19 2016-02-19 複数の産業機械の作業分担を学習する機械学習装置,産業機械セル,製造システムおよび機械学習方法

Publications (2)

Publication Number Publication Date
JP6114421B1 true JP6114421B1 (ja) 2017-04-12
JP2017146879A JP2017146879A (ja) 2017-08-24

Family

ID=58666706

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016029605A Active JP6114421B1 (ja) 2016-02-19 2016-02-19 複数の産業機械の作業分担を学習する機械学習装置,産業機械セル,製造システムおよび機械学習方法

Country Status (4)

Country Link
US (1) US11036191B2 (ja)
JP (1) JP6114421B1 (ja)
CN (1) CN107102619A (ja)
DE (1) DE102017001290A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109032078A (zh) * 2017-06-12 2018-12-18 发那科株式会社 机器学习装置、控制装置以及计算机可读介质
JP2020109377A (ja) * 2019-01-07 2020-07-16 ユニパルス株式会社 計量用機械学習装置、計量用機械学習システム及び計量システム

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6457473B2 (ja) * 2016-12-16 2019-01-23 ファナック株式会社 ロボットおよびレーザスキャナの動作を学習する機械学習装置,ロボットシステムおよび機械学習方法
JP6577542B2 (ja) 2017-09-05 2019-09-18 ファナック株式会社 制御装置
WO2019090264A1 (en) * 2017-11-03 2019-05-09 Drishti Technologies, Inc. Real time anomaly detection systems and methods
CN108227636B (zh) * 2018-01-17 2020-01-17 厦门理工学院 基于云端负载均衡控制的激光雕刻机工作系统及方法
TWI650714B (zh) 2018-01-19 2019-02-11 財團法人工業技術研究院 動態智能排程方法及裝置
JP6703020B2 (ja) * 2018-02-09 2020-06-03 ファナック株式会社 制御装置及び機械学習装置
DE112018007159B4 (de) * 2018-02-26 2022-10-06 Mitsubishi Electric Corporation Korrekturfunktion-erzeugungseinrichtung, robotersteuersystem und robotersystem
EP3540661A1 (en) 2018-03-15 2019-09-18 Siemens Industry Software Ltd. Method for balancing a production line
US11106211B2 (en) * 2018-04-02 2021-08-31 Sony Group Corporation Vision-based sample-efficient reinforcement learning framework for autonomous driving
CN112313043B (zh) * 2018-06-15 2024-04-02 谷歌有限责任公司 自我监督的机器人对象交互
US11966218B2 (en) 2018-06-15 2024-04-23 Mitsubishi Electric Corporation Diagnosis device, diagnosis method and program
DE102018211044A1 (de) * 2018-07-04 2020-01-09 Kuka Deutschland Gmbh Verfahren und System zum Analysieren und/oder Konfigurieren einer industriellen Anlage
US11292133B2 (en) * 2018-09-28 2022-04-05 Intel Corporation Methods and apparatus to train interdependent autonomous machines
CN113661035A (zh) * 2018-09-28 2021-11-16 艾利文Ai有限公司 用于机器人代理管理的系统和方法
JP7237551B2 (ja) * 2018-11-30 2023-03-13 住友重機械工業株式会社 射出成形機システム
US11693392B2 (en) 2019-01-30 2023-07-04 Hitachi, Ltd. System for manufacturing dispatching using deep reinforcement and transfer learning
JP7302226B2 (ja) * 2019-03-27 2023-07-04 株式会社ジェイテクト 研削盤の支援装置及び支援方法
WO2020225883A1 (ja) * 2019-05-08 2020-11-12 三菱電機株式会社 工程管理装置、工程管理方法および工程管理プログラム
DE102019207746A1 (de) * 2019-05-27 2020-12-03 Robert Bosch Gmbh Verfahren zum Ermitteln einer Zustandsinformation betreffend eine Bandschleifmaschine mittels eines maschinellen Lernsystems
JP6661065B1 (ja) * 2019-07-05 2020-03-11 三菱電機株式会社 機械学習装置、ワイヤ放電加工システム、および機械学習方法
US11413747B2 (en) * 2019-08-12 2022-08-16 Workshops for Warriors Machine learning driven computer numerical control of a robotic machine tool
KR20190104008A (ko) * 2019-08-14 2019-09-05 엘지전자 주식회사 인공 지능을 이용하여, 청소하는 로봇 청소기 및 그 동작 방법
JP2021094677A (ja) * 2019-12-19 2021-06-24 本田技研工業株式会社 ロボット制御装置、ロボット制御方法、プログラム及び学習モデル
DE102020204351A1 (de) * 2020-04-03 2021-10-07 Robert Bosch Gesellschaft mit beschränkter Haftung Vorrichtung und verfahren zum planen einer mehrzahl von aufträgen für eine vielzahl von maschinen
EP4214584A4 (en) * 2020-08-20 2024-05-15 Hitachi Vantara Llc SYSTEMS AND METHODS FOR AN AUTOMATED DATA SCIENCE PROCESS
CN112434464B (zh) * 2020-11-09 2021-09-10 中国船舶重工集团公司第七一六研究所 基于maddpg算法的船舶多机械臂弧焊协同焊接方法
CN112427843B (zh) * 2020-11-09 2021-09-03 中国船舶重工集团公司第七一六研究所 基于qmix强化学习算法的船舶多机械臂焊点协同焊接方法
US11755003B2 (en) * 2021-09-30 2023-09-12 Hitachi, Ltd. Autonomous task management industrial robot

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4827731B1 (ja) 1965-07-12 1973-08-25
JPH05120300A (ja) * 1991-10-24 1993-05-18 Toshiba Corp 割当て装置
JP2000141147A (ja) 1998-11-04 2000-05-23 Honda Motor Co Ltd 生産ラインの作業配分シミュレーション方法
JP2001166803A (ja) * 1999-12-06 2001-06-22 Nippon Telegr & Teleph Corp <Ntt> ロボット行動ルール生成装置、ロボット制御装置、及びロボット教示装置、並びにセンサ付きロボット
JP2002006934A (ja) * 2000-06-27 2002-01-11 Matsushita Electric Works Ltd 製造ラインにおける作業者の配分調整方法とそのシステム
JP4788066B2 (ja) * 2001-06-18 2011-10-05 大日本印刷株式会社 材料発注システム
JP2004243461A (ja) 2003-02-13 2004-09-02 Yaskawa Electric Corp ロボットの教示システム
SE0301910L (sv) 2003-06-26 2004-12-27 Abb Ab Datorstyrd arbetsplats med robotar
CN1244801C (zh) * 2003-08-01 2006-03-08 重庆大学 旋转机械故障智能诊断方法与装置
JP2007030087A (ja) 2005-07-26 2007-02-08 Fanuc Ltd 物流トラッキング装置
JP2008296330A (ja) 2007-05-31 2008-12-11 Fanuc Ltd ロボットシミュレーション装置
JP5245852B2 (ja) * 2009-01-17 2013-07-24 日本電気株式会社 サーバ処理分散装置、サーバ処理分散方法及びサーバ処理分散プログラム
JP5436460B2 (ja) * 2009-02-12 2014-03-05 三菱電機株式会社 産業用ロボットシステム
CN101973031B (zh) * 2010-08-24 2013-07-24 中国科学院深圳先进技术研究院 云机器人系统及实现方法
JP5931685B2 (ja) * 2012-10-12 2016-06-08 日本電信電話株式会社 ロボット協調搬送計画装置、方法、プログラム
US9417625B2 (en) 2012-11-29 2016-08-16 Fanuc America Corporation Robot system calibration method
JP6136408B2 (ja) * 2013-03-15 2017-05-31 株式会社リコー 製品開発システム、情報処理装置、プログラム、記憶媒体
JP5741616B2 (ja) * 2013-03-18 2015-07-01 株式会社安川電機 生産システム及び製品の生産方法
JP5747931B2 (ja) * 2013-03-18 2015-07-15 株式会社安川電機 ワークの組立装置及び組立方法
JP6383537B2 (ja) * 2013-12-10 2018-08-29 川崎重工業株式会社 ロボットハンド、ロボット、およびロボットセル
US9958860B2 (en) * 2014-05-01 2018-05-01 Rockwell Automation Technologies, Inc. Systems and methods for broadcasting data and data tags associated with an industrial automation system

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109032078A (zh) * 2017-06-12 2018-12-18 发那科株式会社 机器学习装置、控制装置以及计算机可读介质
JP2019003271A (ja) * 2017-06-12 2019-01-10 ファナック株式会社 機械学習装置、制御装置及び機械学習プログラム
CN109032078B (zh) * 2017-06-12 2020-04-14 发那科株式会社 机器学习装置、控制装置以及计算机可读介质
US10705506B2 (en) 2017-06-12 2020-07-07 Fanuc Corporation Reinforcement learning to allocate processes to a machine tool controller
JP2020109377A (ja) * 2019-01-07 2020-07-16 ユニパルス株式会社 計量用機械学習装置、計量用機械学習システム及び計量システム
JP7178659B2 (ja) 2019-01-07 2022-11-28 ユニパルス株式会社 計量用機械学習装置、計量用機械学習システム及び計量システム

Also Published As

Publication number Publication date
JP2017146879A (ja) 2017-08-24
US20170243135A1 (en) 2017-08-24
CN107102619A (zh) 2017-08-29
DE102017001290A1 (de) 2017-08-24
US11036191B2 (en) 2021-06-15

Similar Documents

Publication Publication Date Title
JP6114421B1 (ja) 複数の産業機械の作業分担を学習する機械学習装置,産業機械セル,製造システムおよび機械学習方法
Zhou et al. Multi-agent reinforcement learning for online scheduling in smart factories
Wang et al. A proactive material handling method for CPS enabled shop-floor
JP6059375B1 (ja) 生産制御システムおよび統合生産制御システム
JP6438450B2 (ja) レーザ加工ロボットの加工順序を学習する機械学習装置、ロボットシステムおよび機械学習方法
JP6453805B2 (ja) 製品の異常に関連する変数の判定値を設定する生産システム
JP6174669B2 (ja) 複数の製造機械を有する製造セルを制御するセルコントロールシステム、生産システム、制御方法及び制御プログラム
Asokan et al. Application of adaptive genetic algorithm and particle swarm optimisation in scheduling of jobs and AS/RS in FMS
CN108227482A (zh) 控制系统以及机器学习装置
JP2017138881A (ja) 操作メニューの表示を学習する機械学習器,数値制御装置,工作機械システム,製造システムおよび機械学習方法
CN111260181B (zh) 一种基于分布式智能制造单元的车间自适应生产调度装置
Xu et al. Optimization approaches for solving production scheduling problem: A brief overview and a case study for hybrid flow shop using genetic algorithms
JP6659652B2 (ja) 加工条件調整装置及び機械学習装置
Saric et al. Estimation of machining time for CNC manufacturing using neural computing
Zhang et al. Stochastic models for performance analysis of multistate flexible manufacturing cells
Zhang et al. Scenarios in multi-objective optimisation of process parameters for sustainable machining
CN110531705A (zh) 可编程控制器以及机器学习装置
CN108427378B (zh) 数值控制装置
Zhang et al. Real-time batching in job shops based on simulation and reinforcement learning
Burduk et al. Simulation modeling in production effectiveness improvement–case study
JP6898479B2 (ja) 操作メニューの表示を学習する機械学習器,数値制御装置,工作機械システム,製造システムおよび機械学習方法
Zhang et al. Mission reliability analysis of flexible manufacturing cells considering component reliability, task demand, and product quality
Niekurzak et al. Production line modelling in accordance with the industry 4.0 concept as an element of process management in the iron and steel industry
Atia et al. An ANN parametric approach for the estimation of total production operation time
AU2021105079A4 (en) The controlling machine tools system by using machine learning techniques.

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170221

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170316

R150 Certificate of patent or registration of utility model

Ref document number: 6114421

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150