JP7198967B2 - 切断プロセスにおけるレーザ切断ヘッド移動の制御 - Google Patents

切断プロセスにおけるレーザ切断ヘッド移動の制御 Download PDF

Info

Publication number
JP7198967B2
JP7198967B2 JP2022513179A JP2022513179A JP7198967B2 JP 7198967 B2 JP7198967 B2 JP 7198967B2 JP 2022513179 A JP2022513179 A JP 2022513179A JP 2022513179 A JP2022513179 A JP 2022513179A JP 7198967 B2 JP7198967 B2 JP 7198967B2
Authority
JP
Japan
Prior art keywords
state
workpiece
cutting
machine
reward
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022513179A
Other languages
English (en)
Other versions
JP2022540510A (ja
Inventor
アレクサンドル パラズィネツ
Original Assignee
バイストロニック レーザー アクチェンゲゼルシャフト
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイストロニック レーザー アクチェンゲゼルシャフト filed Critical バイストロニック レーザー アクチェンゲゼルシャフト
Publication of JP2022540510A publication Critical patent/JP2022540510A/ja
Application granted granted Critical
Publication of JP7198967B2 publication Critical patent/JP7198967B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/4093Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by part programming, e.g. entry of geometrical information as taken from a technical drawing, combining this with machining and material information to obtain control information, named part programme, for the NC machine
    • G05B19/40937Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by part programming, e.g. entry of geometrical information as taken from a technical drawing, combining this with machining and material information to obtain control information, named part programme, for the NC machine concerning programming of machining or material parameters, pocket machining
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/408Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by data handling or data format, e.g. reading, buffering or conversion of data
    • G05B19/4083Adapting programme, configuration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/35Nc in input of data, input till input file format
    • G05B2219/35162Determine workpiece placement, nesting in blank, optimize, minimize loss material
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/36Nc in input of data, input key till input tape
    • G05B2219/36056Modify program, machining order in real time, during operation, dynamically
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/45Nc applications
    • G05B2219/45041Laser cutting

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Manufacturing & Machinery (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Geometry (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Laser Beam Processing (AREA)
  • Numerical Control (AREA)

Description

本発明は、レーザ切断機の切断ヘッドを制御する制御命令を算出する方法、機械学習装置、及び機械学習装置の意思決定エージェントに関し、更にこれらの各コンピュータプログラムに関する。
現在のレーザ切断機は、メタルシート産業において幅広く利用されている。このようなレーザ切断機の典型的な動作は、ワークピースから被加工部品を分離するために、一般には閉じている独立した輪郭を1つずつ切断することである。この動作は、ワークピース内に熱エネルギを投入(局部加熱)すること、切断ガス噴射を行うこと、及び切断ヘッドを機械的に移動することを伴う。これらの動作を有するため、切断シーケンスの概念は、切断プロセスにおいて極めて重要である。主なパフォーマンス基準は、切断シーケンス、すなわち全サイクル時間(切断ジョブの処理時間)、機械的に移動する切断ヘッドと既に分離されて傾斜している可能性のある部品との衝突のリスク、ワークピースの特定の区画の過熱、機械部品の機械的寿命などから直接、影響を受ける。最短の加工経路及び衝突回避は解決された課題であるように見えたとしても、材料内の熱分布を考慮した(特に経路の最適化及び衝突回避と組み合わせて熱分布を考慮した)最適な加工シーケンスは、高い自由度のせいで遥かに複雑な問題である。熱分布の推定(通常はオフラインの有限要素(FE)シミュレーション)は高価な演算処理を必要とする。このため、「次に最も近くで利用できる近隣部」よりも優れた切断戦略を妥当な時間で見つけることは、一般的な機械制御装置では不可能である。切断経路の最適化そのものが、組合せ最適化のNP困難な問題である。
図1に示すように、一般的な機械加工計画1は、被加工部品2を含む。機械制御装置が適用する標準の機械加工シーケンス3は、「次に最も近くで利用できる近隣部」タイプであり、直線状に並ぶシーケンスである。このシーケンスには、前述したワークピースの過熱の問題はいずれも考慮されておらず、切断部品のオーバードライブも考慮されていない。いくつかの発見的規則を適用して標準の機械加工シーケンスを改良できるが、発見的規則は、異なる機械加工計画の策定には適用できない場合がある。機械加工シーケンスの問題は、複雑性n!の組合せ最適化の問題であるため、発見的規則を利用することで、機械加工プロセスの最終段において標準の機械加工シーケンスより劣悪な状況となる可能性が非常に高い。機械学習を用いた巡回セールスマン問題(Travelling Salesman Problem;TSP)の解決は、科学文献(ベロー(Bello)他の「Neural Combinatorial Optimization with Reinforcement Learning(強化学習による神経組合せ最適化)」、2017年)において広く知られている。本願の課題と対比すると、巡回セールスマンの問題は、純粋にアルゴリズムの問題であり、移動負荷(グラフのエッジ)をステートレス(履歴から独立)にした加重グラフ内で最短のハミルトンパスを発見することから成る。換言すると、巡回セールスマン問題は、処理の過程において静的に維持されるが、本発明が解決しようとする課題は、動的であり、各ピースが切断された後、残りの他のピースにとって存続する状況が変化する。経時変化するTSPの事例グラフは、文献において時間グラフとして知られている(O.ミカイル(Michail)著、「An Introduction to Temporal Graphs:An Algorithmic Perspective(時間グラフ概説:アルゴリズム的観点)」)。時間グラフにおいてTSPを解決することにより、静的事例よりも複雑性が高度になり、多項式時間の近似解となる可能性が減少することが判る。
米国特許出願公開第2017/0270434号明細書には、レーザ加工システムの状態データを計算するために使用される機械学習装置が開示されている。
米国特許出願公開第2011/0284512号明細書には、指紋で表されるセンサからの特性値を使用してレーザ加工動作を監視する方法が開示されている。 データ処理には人工ニューラルネットワークを使用することができる。
論文「ダブルQ学習による深層強化学習」(H.van Hasselt et al.,2015年12月8日、1~13ページ、XP055317414)には、Q学習アルゴリズム、特にダブルQ学習アルゴリズムについての説明がある。それは、Atari2600ドメインのゲームのコンテキストでの過大評価の問題に関連する。
したがって、レーザ加工機には、解決されるべき動的課題が存在し、この課題において、次の部品への移動についての可能性が、加工機から得られるリアルタイムの状態観察結果に応じて時間と共に変化する。
米国特許公開第2018/169856号明細書には、全加工時間、加工領域に費やされる時間、ロボット駆動電流などの基準を考慮して溶接ロボットの軌跡を最適化することを目的とした機械学習方法及び機械学習装置が記載されている。前記米国特許出願公開第2018/169856号で解決された課題とは異なり、レーザ切断において解決されるべき問題は、全加工時間又は軸駆動部の使用電流の最適化だけではない。レーザ切断プロセスは、下記の点で溶接と異なる。
-切断プロセスの実行中に被加工部品がワークピースから物理的に切り離される。薄いメタルシート材料では、切り離された部品が立ち上がり(傾斜して)衝突リスクを生じる(レーザ加工機の切断ヘッドが傾斜した部品と衝突する)可能性が極めて高い。この問題は、本発明によって解決される。
-切断プロセスの実行中に熱が蓄積され、厚みのある材料において品質が低下する。この問題は、考慮する必要のある問題であり、本明細書に記載した手法で解決される。
米国特許公開第2018/0169856号明細書
したがって、本発明の目的は、前述した問題の解決策を提供することである。特に、レーザ加工機ヘッドの動作シーケンスを算出する際には、傾斜した部品の衝突リスクを回避しなければならず、また、熱の蓄積を考慮する必要がある。
この目的は、付属の独立請求項に係る、制御命令の算出方法、機械学習装置、意思決定エージェント、及びコンピュータプログラムによって達成される。有利な態様、特徴、及び実施例は、従属請求項に記載されると共に、下記の説明において利点と合わせて記載される。
第1の態様によれば、本発明は、レーザ加工機の機械加工ヘッド(すなわち、切断ヘッド)を制御する制御命令の算出方法に関する。本方法は、コンピュータで実施され、下記のステップを含む。
-符号化された加工計画、特に、切断計画を読み取る又は受け取るステップ。切断計画は、ワークピースがどのように何に加工されるのか、すなわち、どこでどのように切断を実行すべきであるのか、及び利用すべき切断形式を定義するデータを有するデータ構造である。通常、ワークピースは、可能な限り効率的に加工され、ひいては可能な限り多くの切断が行われるように構成されて、元のワークピースからできるだけ多くの切断された被加工部品を得るようにしなければならない。ただし、加工計画には、切断の順序ひいては切断経路を表す、例えば、どの切断を最初に実行し、どれを2番目に実行するのかなどを規定する機械加工シーケンスは定義されていない。
-例えば、赤外線カメラによって取り込まれた光センサ信号など、一連のセンサ信号を利用して、ワークピースの加工に関わる状態を継続的に特定するステップ。
-加工ヘッドが次に取るべき行動を算出する、コンピュータで実施される意思決定エージェントを提供し、符号化された切断計画と特定された状態とを有するトレーニング済みモデルにアクセスすることによって、算出された行動に基づいて加工計画を実行する制御命令を提供するステップ。
好ましい実施形態において、モデル又はニューラルネットワークは、状態(特に、多層画像、好ましくは多層画像マトリクスの形式の状態)と符号化された切断計画とを入力として受け取り、機械学習装置に送られて次に実行される行動を出力として提供する。したがって、モデル又はニューラルモデルは、デジタル入力、特に、光入力、より具体的には、図形入力を処理する。例えば、切断計画は、図形入力として提供されてもよい。
他の好ましい実施形態によれば、報酬関数及び個別モジュールが提供され、この実施形態は、各行動の実行後に、各行動が、受信したセンサ信号に基づいて報酬を受け取るように適合されたもので、意思決定エージェントは、全ての行動の総合報酬を最大化する最適化関数を実行する。
他の好ましい実施形態によれば、状態は、レーザ加工機の状態、既に加工された被加工部品の状態、及びこれから加工する必要のある被加工部品の状態である、又はこれらの状態を含むと共に、ワークピースの状態も表すことができる。したがって、状態は時間と共に動的に変化し、特に、ワークピースに対してレーザ加工機の動作が実行された後、より具体的には被加工部品の各切断後に変化する。このことは、経時的に変化しない静的状態と比べて、遥かに多くの演算を必要とするため、前述した問題の解決をより複雑なものにする。
状態を特定する状態観察ユニットは、例えば、実際の機械加工状況(切断状況)の光センサ信号を利用して実施されてよい。好ましい実施形態において、観察内容は、赤外線(IR)カメラによる観察値(機械加工中にリアルタイムで記録されるヒートマップ)、材料の変形、観察された衝突リスク(傾いた部品)、累積加工時間、駆動部温度などから得られる。ここに列挙した項目は、この特定のセンサ信号には限定されず、拡張されてよい。他の好ましい実施形態において、画像のみでなく、ファイルからのデジタルデータも処理用の入力として提供されてよい。例えば、切断計画は、ベクトル図形の形式で、又は画像ファイル内のピクセルデータとして提供されてよい。したがって、光信号及び/又は画像が状態決定のために処理されてよい。好ましくは、複数の異なる光入力、特に、2つの異なる入力が処理される。好ましい実施形態において、第1入力として機能する第1画像が提供され、この第1画像には、実際の切断状況及び切断の成否と共に、既に切断された部品と、これから切断されるべき部品とが示される。画像は、各切断部品の完成後に変化する。また、第2入力して機能する第2画像が提供され、第2画像には、ワークピース内の熱分布及び/又は切断部品内の熱分布が示される。第2画像は、切断プロセスの品質を評価するための重要な情報である。第1入力及び第2入力の両方が処理されて状態が決定される。
更に他の好ましい実施形態によれば、レーザ加工機による動作の実行後及び/又は実行中に、経験データが蓄積される。経験データは、一連センサから記録されたレーザ加工機に関する観察内容(決定された状態を含む)を表すデジタルデータである。経験データは、蓄積されると共に、モデル又はネットワークを継続的に改良する(特に、モデルの学習機能を改良する)ためにモデル又はネットワークに送り返される(フィードバックされる)。記録された観察内容をフィードバックすることにより、加工機は、否定的なフィードバックであった場合に、生成された解決策の構成要素にペナルティーを与え、検索空間の更なる探索を実行することができ、逆に、肯定的なフィードバックであった場合には、既存の解決策を最適解として安定させることができる。各種異なる実際の加工機が自身の機械加工プロセスを自己適合(経験から「学習」する)できるものであることは特に重要であるが、これは、実際の加工機はそれぞれコンディションに若干のばらつき、例えば、空気の流れや組み立て時のばらつきなどを有する可能性があるためである。
他の好ましい実施形態において、状態は、光学的状態(光センサによって記録された状態)を表す、又は光学的状態含み、多層画像の形式で、若しくは図形として示されても、又は多層画像の形式で図形として示されてもよい。多層画像又は多層画像マトリクスは、下記に示す2つの異なるパラメータを含む。
1.加工されているワークピースの第1層画像。第1層画像では、既に加工された部品を、まだ加工されていない部品から区別することができる(特に、切断計画のうちの既に実行された切断処理を、自動物体認識ツール、例えば、アルゴリズムによって、これから実行されるべき切断処理から区別することができる)。
2.ワークピースの第2層画像。第2層画像には、切断計画に従って加工されているワークのヒートマックが示される。好ましい実施形態において、第2層画像は、赤外線カメラを用いて取得することができ、切断中又は切断直後の空間的熱分布及び/又は局部熱分布を表すことができる。
この特徴は、次の行動、特に、最適切断シーケンスを決定する際に、両方の側面(すなわち、切断処理及び傾斜した部品によって生じる問題、及び過熱による品質問題)、ひいては全ての関連情報を考慮できるという重要な技術的利点を有する。
「行動」の用語は、レーザ切断ヘッドを制御する一連のプロセス制御命令として解釈される用語である。したがって、行動は、切断ステップのシーケンス(当初の切断計画には変更が必要であると考える)、切断速度(又は頸動、加速)を規定するモータ駆動部の送り量、焦点シフト、又は切断パラメータの他の設定を意味し得る。
好ましい実施形態において、コンピュータビジョンアルゴリズムが、既に加工された部品とこれから加工される部品とを区別するために実行される。その際に、物体切り出しアルゴリズム及び/又は物体検出アルゴリズムが実行されてよい。
他の好ましい実施形態において、多層画像マトリクスの2つの異なる入力層は、単一の2部構成の合成物に集約されてよい。2部構成の合成物は、熱分布情報及び加工状態情報(加工済み部品とこれから加工されるべき部品とを示す情報)の両方を表すデジタルデータセットである。多層画像マトリクスの2つの異なる入力層は、前述した両方のタイプの情報を含むオーバーレイ画像として提供されても、又は、他の方式で結合されてもよい。
「状態」の用語は、レーザ加工、特に切断の状態を表すデジタルデータセットとして理解される用語である。したがって、状態は、レーザ切断処理が進むにつれて動的に発展して経時的に変化するため、状態は時間示度を有する。状態は、前述したような2つの個別の要素を有すると好ましい。第1に、状態は、切断計画の中のどの部分が既に実行されてどの部分が実行されていない(これから切断する必要がある)のかを検出するために、切断計画に関連付けられてよい。第2に、状態は、切断区画内の局部的熱分布に関連付けられてよい。
他の好ましい実施形態によれば、報酬関数が、下記のグループから選択される。
-切断時間報酬関数
-熱最適化報酬関数
-温度の積分測定値報酬関数
-衝突回避報酬関数
切断時間報酬関数は、切断時間が最適化され得る行動に報酬を与える。熱最適化報酬関数は、過熱問題が回避される、又は少なくとも可能な限り抑制される点において切断プロセスの品質が最適化される行動に報酬を与える。温度の積分測定値報酬関数は、経時的に切断プロセスの品質を向上させるものである。衝突回避報酬関数は衝突問題を回避する、特に、レーザ加工機の切断ヘッド又はその他の部品と、既に切断された部品(傾いている、又はワークピースの残りのグリッド状の構造から脱落している可能性のある部品)との衝突の問題を回避するものである。
この特徴には、異なる報酬関数を適用でき、1回の単独の処理の実行中であっても異なる最適化基準を選択できるという技術的利点がある。特に、各種異なる切断指令(複数の区画)、例えば、ワークピースの第1部位とワークピースの第2部位とで異なる切断指令を有する大きいワークピースを処理する際に、それぞれ異なる最適化基準を選択でき、例えば、第1部位に第1の報酬関数、第2部位に第2の報酬関数というように選択できるため、この特徴は、大量の内部輪郭(穴)を有し独立した内部最適化基準内にある部品に対して特に有用である。報酬関数は、前述したように異なる最適化基準に対応できる。ただし、最適化の目標は包括的なものであり、通常は、部品毎に異なる報酬関数を適用することは無駄であるため、好ましい実施形態では、包括的報酬関数が適用される。報酬関数は、個別の各部品に作用するものではないが、部品が多数の内部輪郭(穴)を有する場合は例外である。この場合は、前述したように、異なる報酬関数及び/又は独立した内部最適化基準を適用することが有用になり得る。
1セットの報酬関数は、異なる最適化目標を実現するものであり、具体的には、前述した切断経路の最適化、切断ジョブの処理時間、切断部品の品質などの異なる最適化目標を実現する。
他の好ましい実施形態において、特定の報酬関数が、特定の処理ジョブに対して、特定のワークピースに対して、又は加工されるワークピース内の特定の部品(領域)に対して決定される。これは、1つのジョブに切断される複数のシートが存在できるので有用である。また、領域固有の最適化も、例えば、複雑な構造である場合に有用である。
他の好ましい実施形態において、報酬関数は、前述した全ての報酬関数の一次(又は多項)の組み合わせであってよく、この組合せには、実際の加工環境に応じてそれぞれ異なる報酬関数を優先できるように、異なる報酬関数に適用される重みとしてユーザ定義による優先順位が利用される。
自己学習エージェントは、Q関数を用いて生成できる、いわゆるQテーブルを利用したモデル化及び/又はQテーブルに基づいた行動を行うことができる。Qテーブルは、機械加工(特に、切断)プロセスの各ステップに次の行動を算出する状態-行動の組合せの品質を定形化したものである。詳細な情報については、C.J.C.H.ワトキンス(Watkins)の「Learning from Delayed Rewards(遅延報酬から学ぶ)」(1989年)を参照されたい。機械加工シーケンスの場合は、状態-行動空間がかなり膨大であるため、Qテーブルは適用できないことが多い。
更に他の好ましい実施形態において、Q関数は、ディープニューラルネットワーク、特に、深層畳み込みネットワークで表されてよい。
更に他の好ましい実施形態において、ニューラルネットワークは、経験再生技術を、特にトレーニング工程において活用できる。経験再生技術の詳細については、シャウル(Schaul)他による「Prioritized Experience Replay(優先順位付き経験再生)」2015年を参照されたい。経験再生技術(「HER(後知恵経験再生:Hindsight Experience Replay)技術」としても知られる)は、データ全体を無作為化して、観察シーケンスにおける対応関係を除去し、データ分布内の変化を平滑化するために用いられることが知られている。経験再生を行うことによって、データセット内の各タイムステップにおけるエージェントの経験(データ、状態)がメモリに格納されるが、これは、それまでの学習工程にフィードバックを提供するためである。入力空間に目標を追加することにより、観察するエージェントに複数の目標が存在することが宣言される。新しいQ関数は、現在の状態において行う各行動が、現在の目標を達成することに関してどのように良いのかを示す。より詳細な内容については、ニー(Mnih)らによる「Playing Atari with Deep Reinforcement Learning(深層強化学習を用いたAtariゲームのプレー)」2013年を参照されたい。
これまで、請求項に記載した方法を参照しながら本発明について説明してきた。本明細書に記載された特徴、利点、又は代替実施形態は、請求項に記載された他の対象(例えば、コンピュータプログラム、又は意思決定エージェントを備えた機械学習装置)に対応付けることができ、また、その逆もあり得る。すなわち、装置に関して請求又は記載された内容は、方法の文脈で記載又は請求された特徴を用いて改良でき、また、その逆もあり得る。この場合、方法の機能的特徴は、装置の構成ユニットによって実施され、また、その逆もあり得る。一般に、コンピュータ科学では、ソフトウェア実装と、対応するハードウェア実装とは等価である。したがって、例えば、方法におけるデータの「格納」ステップは、記憶装置及びデータを記憶部に書き込む各命令によって実行されてよい。方法について説明した代替実施形態に装置も利用できるが、冗長化を防ぐために、装置については、そのような実施形態を繰り返して明示的に説明しない。
他の態様によれば、本発明は、前述の方法を実行するように適合された、レーザ加工機、特に、レーザ切断機用の機械学習装置に関する。特に、本機械学習装置は、下記を含むことができる。
-符号化された切断計画を受け取る入力インターフェース。
-切断及び機械の実行過程の途中及び又は終了後に継続的に状態を特定するために、一連のセンサからセンサ信号を受け取る別の入力インターフェース。
-意思決定エージェント。意思決定エージェントは、トレーニング済みモデルを含む、又はトレーニング済みモデルにアクセスすることができる。
-レーザ加工機の切断ヘッドを制御する制御命令を提供する出力インターフェース。
機械学習装置は、更に、メモリを含む、又はメモリにアクセスすることができる。メモリは、エージェントのデータを格納及び/又はトレーニング済みモデルを格納するように適合できる。
好ましい実施形態において、機械学習装置は、方法に関して既に説明した好ましい実施形態に従って動作するように適合されてよい。
他の態様において、本発明は、前述した機械学習装置内の意思決定エージェントに関する。
更に他の態様において、本発明は、プログラム要素を含むコンピュータプログラムに関し、プログラム要素はコンピュータを含み、コンピュータは、プログラム要素がコンピュータのメモリに読み込まれたときに、前述した態様に係るレーザ加工機の切断ヘッドを制御する制御命令を算出する方法の各ステップを実行する。コンピュータプログラムは、外部サーバからローカルに設けられたものにダウンロードされるものとして提供されてよい。コンピュータプログラムは、コンピュータ可読媒体に格納されてよい。
更に他の態様において、本発明は、コンピュータが読み込んで実行できるプログラム要素が格納されたコンピュータ可読媒体に関し、プログラム要素は、コンピュータによって実行されたときに、レーザ加工機の切断ヘッドを制御する制御命令を算出する方法のステップを実行するように構成される。
コンピュータプログラム製品及び/又はコンピュータ可読媒体によって本発明を実施することには、本発明によって提案される作業を行うように、既存のコンピュータエンティティ(レーザ加工機内に存在する又はレーザ加工機に関連付けられたマイクロコンピュータ又はプロセッサ)をソフトウェアアップデートによって容易に適合できるという利点がある。
下記に、本願で用いられる用語の定義を示す。
本方法を実行し、且つ制御命令を提供する機械学習装置は、コンピュータネットワーク内のパーソナルコンピュータ又はワークステーションであってよく、前記機械学習装置は、処理装置と、システムメモリと、システムメモリを始めとする各種のシステムコンポーネントを処理装置に連結するシステムバスとを含むことができる。システムバスは、各種のバスアーキテクチャを利用した、メモリバス又はメモリ制御装置、ペリフェラルバス、及びローカルバスなど、複数のタイプのバス構造のうちのいずれかであってよい。システムメモリは、リードオンリメモリ(ROM)及び/又はランダムアクセスメモリ(RAM)を含んでよい。起動時などにパーソナルコンピュータ内の要素間の情報転送を支援するベーシックルーチンを含む基本入出力システム(BIOS)は、ROMに格納されてよい。また、コンピュータは、ハードディスクへの読み書きを行うハードディスクドライブ、磁気ディスク(例えば、リムーバブル磁気ディスク)への読み書きを行う磁気ディスクドライブ、及びコンパクトディスク又は他の光(磁気)媒体などのリムーバブル光(磁気)ディスクへの読み書きを行う光ディスクドライブも含んでよい。ハードディスクドライブ、磁気ディスクドライブ、及び光(磁気)ディスクドライブは、それぞれハードディスクドライブインターフェース、磁気ディスクドライブインターフェース、及び光(磁気)ドライブインターフェースによってシステムバスに接続されてよい。これらの各種ドライブと各種ドライブにそれぞれ対応する記憶媒体は、機械可読命令、データ構造、プログラムモジュール、及びコンピュータの他のデータの不揮発性記憶装置を提供する。本明細書に記載した例示的環境では、ハードディスク、リムーバブル磁気ディスク、及びリムーバブル光(磁気)ディスクが採用されるが、当業者であれば、前述した記憶装置に代えて、又は追加して他のタイプの記憶媒体、例えば、磁気カセット、フラッシュメモリカード、デジタルビデオディスク、Bernoulliカートリッジ、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)なども利用できることは理解されるであろう。多数のプログラムモジュールがハードディスク、磁気ディスク、光(磁気)ディスク、ROM、又はRAMに格納されてよく、例えば、オペレーティングシステム、制御命令を算出する方法及び/又は他のプログラムモジュールのような1つ以上のアプリケーションプログラム、及び/又はプログラムデータなどが格納される。ユーザは、入力装置、例えば、キーボードやポインティングデバイスなどからコンピュータにコマンド及び情報を入力できる。マイクロフォン、ジョイスティック、ゲームパッド、サテライトディッシュ、スキャナなどの他の入力装置が含まれてもよい。前述した入力装置及び他の入力装置は、多くの場合、システムバスに接続されたシリアルポートインターフェースを介して処理装置に接続される。ただし、入力装置は、パラレルポート、ゲームポート、又はユニバーサルシリアルバス(USB)などの他のインターフェースによって接続されてもよい。モニタ(例えば、GUI)又は他のタイプの表示装置も、例えば、ビデオアダプタなどのインターフェースを介してシステムバスに接続されてよい。モニタの他に、コンピュータは、例えば、スピーカやプリンタなど、他の周辺出力装置を含むことができる。
コンピュータは、1つ以上のリモートコンピュータとの論理接続を規定するネットワーク環境において操作されてよい。リモートコンピュータは、他のパーソナルコンピュータ、サーバ、ルータ、ネットワークPC、ピアデバイス、又は他の共通ネットワークノードであってよく、パーソナルコンピュータに関して前述した要素のうちの多数又は全ての要素を含むことができる。論理接続は、ローカルエリアネットワーク(LAN)や広域ネットワーク(WAN)、イントラネット、及びインターネットを含む。
好ましい実施形態において、レーザ加工機はレーザ切断機である。ただし、本明細書に示した解決策は、他の種類のレーザ加工機に適用されてもよい。
意思決定エージェントは、好ましくは、ソフトウェア及び/又はハードウェアに実装され、好ましくは、大量の演算処理のための十分なリソースを提供する専用の図形処理装置で実行される。
報酬モジュールは、好ましくは、意思決定エージェントとレーザ加工機環境の両方への論理リンクを有するソフトウェアモジュールである。
加工計画又は切断計画は、内部のデータの自動パーズ及び解析を行えるように構造化された方式の電子ファイルとして提供されてよい。このようなフォーマットの例としては、限定ではないが、Gコード(又はGコードと同様の)命令リスト(テキストファイル)が挙げられる。
観察解釈モジュールは、少なくとも2つの下位状態を有する状態を生成するために、レーザ加工機から受け取ったセンサ信号を解釈及び処理する役割を担う。好ましくは、観察解釈モジュールは、ソフトウェアモジュールとして実施される。また、観察解釈モジュールは、報酬モジュールを含んでよく、この報酬モジュールもソフトウェアで実施されると好ましい。
前述した本発明の特性、特徴、及び利点に加え、これらが実現される方式は、図面を参照しながらより詳細に記述される下記の説明及び実施形態に照らし合わせることでより明白且つ詳細に理解できるようになる。下記の説明は、記載された実施形態に本発明を限定するものではない。同一の要素又は部品には、異なる図において同一の符号が付与され得る。図面は、概して縮尺が対応していない。
理解されるであろうが本発明の好ましい実施形態は、従属請求項又は各独立請求項に係る前記実施形態の組み合わせであってもよい。
本発明の前述した態様及び他の態様は、後述する実施形態から明白であり、これらの実施形態を参照して明瞭に説明される。
従来の既知の機械制御装置に係る切断シーケンスを模式的に示す図である。 本発明の好ましい実施形態に係る機械学習装置によって制御されるレーザ加工機環境の構造部品及びアーキテクチャの概要を示す図である。 本発明の好ましい実施形態に係る意思決定エージェントを模式的に示す図である。 本発明の好ましい実施形態に係る、加工されている状態の構造図である。 機械加工ヘッドのための、最も高い報酬を有する制御命令を生成する学習方法のフローチャートである。 意思決定エージェントのモデルをトレーニングする学習工程のフローチャートである。 本発明の好ましい実施形態に係る制御命令の算出方法のフローチャートである。
本発明において、機械学習装置MLD(Machine Learning Device)及び機械学習方法を使用して、機械加工シーケンスを複数の基準で最適化する際の複雑さの問題を解決することを提案する。
図2に示すように、機械学習装置MLDは、レーザ加工機Lとその環境、すなわち、機械加工ヘッドHを移動するガントリのような他の装置や外部センサなどと相互作用し、且つ協働する。機械学習装置MLDは、レーザ加工機Lの環境内で取得されたセンサ信号sensを受け取り、複雑な演算処理の結果として、制御命令CIをレーザ加工機Lに提供する。レーザ加工機Lは機械制御装置MCを含み、機械制御装置MCは、軸駆動部ADの制御信号、切断ヘッドHの制御信号、及び/又は、例えば、ガントリ若しくは切断ヘッドHの可動部などの他のアクター(行動器)の制御信号を用いて、レーザ加工機Lの切断プロセスを制御する。レーザ加工機Lには複数のセンサSが設けられており、複数のセンサSは、レーザ加工機Lの各種異なる位置に配置されてよい。これらのセンサSは、加工環境、すなわち切断環境の多層画像又は多層画像マトリクスを継続的に提供する赤外線カメラを含むことができる。
機械学習装置MLDは、機械加工環境Lから受け取った観察データを有するセンサ信号sensの数学的前処理とモデリングを実行する役割を担う観察解釈モジュールOIMを含む。観察解釈モジュールOIMは、ユーザ設定可能な報酬関数モジュールRFを含み、報酬関数モジュールRFは、少なくとも1つの最適化基準OC又は複数の異なる最適化基準OCの組み合わせを含む。最適化基準OCは、例えば、安全性、機械加工時間、品質であり得る。最適化基準OCとして、人間の経験からのフィードバック、例えば、熟練した機械オペレータからの学習として利用することができ、熟練した機械オペレータの経験は、定形化されてメモリMEMに格納される。意思決定エージェントDAは機械学習の数学モデルである。意思決定エージェントDAは、ニューラルネットワーク、ディープニューラルネットワーック、畳み込みニューラルネットワーク、及び/又はリカレントニューラルネットワークを含むことができ、将来の報酬を予測して、将来の機械加工ステップにとっての最適行動aを選択するようにトレーニングされる。
Q学習の観点において、システムの状態sは、次の2つで構成されるか、又は次の2つを表す。
1.既に加工された部分がこれから加工されるべき部分から区別された、機械加工計画Pの現在のレイアウトのデジタル形式
2.例えば、IRカメラを用いて観察される熱分布マップ
より一般的に述べると、システムの状態sは、通常、可変構造化データ(又は、少なくともニューラルネットワークへの入力に適さない構造化データ)として表される。切断機によって加工される切断計画Pは、部品内部の穴を含めて部品を表す一連の幾何形状輪郭である。切断計画毎の部品数は固定された個数でも、限定(材料シートの物理寸法によって限定)された個数でもない。切断計画Pは、機械学習装置MLDの入力インターフェースJNにおいて受け取ることができる。
状態sの前処理の最初のステップは、切断計画Pとその現在の機械加工の進捗を、ニューラルネットワークへの入力に適した固定サイズのマトリクスに符号化することである。好ましい実施形態において、多層画像又は多層画像マトリクスの第1層として、1つの色で示された加工されるべき部品と、別の色で示された既に加工された部品とを有する固定サイズのN×Mピクセルの多層画像を作成することが考えられる。熱の伝搬と材料の過熱が重要である用途では、部品の切断後に経過した時間に応じて切断部品の色を更新する(特定の制限時間に達した後で固定値に飽和させる)アルゴリズムが提供される。多層画像又は多層画像マトリクスの第2層には、切断計画のヒートマップ(測定温度又はシミュレーション温度に対応するピクセル値)が示される。ニューラルネットワークの入力として大きい可変サイズの画像を有すると、ネットワークのトレーニングに実用上の問題が生じる。この問題を克服するために、意思決定ニューラルネットワークの前に変分オートエンコーダ(VARIATIONAL AUTOENCODER;VAE)を挿入することができる。オートエンコーダの役割は、プロセスの状態情報を潜在的に保持しながら入力データ空間をサイズの小さい固定幅ベクトルに圧縮することである。
多層画像又は多層画像マトリクスとして状態sをモデリングする処理に利用できる他の手法として、構造データの埋め込み又はグラフニューラルネットワークを適用できる(例えば、スカーセリ(Scarselli)らによる「The Graph Neural Network Model(グラフニューラルネットワークモデル)」2009年を参照)。
本発明に係る機械制御装置MCは、知的機械制御装置であり、この知的機械制御装置は、機械加工ヘッドH(例えば、レーザ加工機の切断ヘッド)の機械加工プロセスを制御して、レーザ加工機Lの駆動部ADの軸を連係動作させることに利用される。機械制御装置MCは、機械学習装置MLDとペアで動作でき、機械学習装置MLDは、大量の数理演算に対応した中央処理装置CPU及び画像処理装置GPUと、メモリと、トレーニング済みモードを含む記憶装置とで構成されてよい。好ましい実施形態において、前述した機械学習装置MLDの機械学習方法として、強化学習又は深層Q学習を利用することが提案される。Q学習の詳細については、米国特許出願第2015/0100530号明細書を参照されたい。この米国出願の開示内容を本願の一部として援用する。標準的なQ学習は、Qテーブルを作成することを含み、Qテーブルは、状態-行動[s,a](プロセスの現在の状態である状態及び現在の状態に関して生じ得る次のステップである行動)の組み合わせの品質を示したものである。意思決定エージェントDAは、Qテーブルに従って動作して各ステップを動的に決定する。決定したステップ毎に、意思決定エージェントDAは、レーザ加工機Lの環境から報酬を受け取る。意思決定エージェントDAの目標は、全てのステップの報酬全体を最大化することである。この目的のために、Qテーブルは、観察されたレーザ加工機Lのセンサ信号と、割り当てられた又は関連付けられた報酬と(更に、次のステップに対して予想される最大報酬と)を用いて継続的に更新される。深層Q学習の場合は、ディープ(畳み込み)ニューラルネットワークCNNによって関数Qが提示される。関連付けられた観察内容及びニューラルネットワークの非線形性に起因する解の不安定性を克服するために、経験再生技術が利用されると好ましい。
行動aの空間は、加工の方向(輪郭を切断する場合)及び開始点(複数の開始点があり得る場合)を含む、次に加工する部品の選択肢から形成される。行動空間が広大であるか又は連続している場合には、アクタークリティック法がより適している。Q学習とアクタークリティックの主な違いは、1つの人工ニューラルネットワーク(略号:ANN)を用いてQ関数(品質値への状態軸と行動軸のマッピング)をモデル化する代わりに、アルゴリズムが、2つのANN、すなわちアクター(状態の関数としての行動)とクリティック(状態の関数としての値)を用いてプロセスをモデル化する点である。各ステップにおいて、アクターは、取るべき行動を予測し、クリティックは、その行動がどのように良いのかを予測する。アクターとクリティックは並行してトレーニングされる。アクターはクリティックに依存する。
切断シーケンスの場合、クリティックエージェントは、現在の状況(現在の状態)における理論上最高の将来の結果、及び連続空間内に符号化された行動(切断計画上の次の部品の座標)を評価できる。その際、最適化プロセスは、より良い結果に繋がり得る、実行すべき次の行動についてアクターに問い合わせる必要がある。
センサ信号sensによって与えられる経験データ(ニューラルネットワーク係数及び他の構成データ)は、記憶装置MEMに格納されると共に、ネットワーク、共有ドライブ、若しくはクラウドサービスを介して、又は機械技術者によって手動で分配されて、2つ以上の機械加工環境の間で共有されてよい。
図3に、内部へのメッセージ及び外部へのメッセージと共に意思決定エージェントDAの構造図を示す。受信したセンサ信号に基づいてレーザ切断機Lの環境の状態sが算出される。算出された状態には、既に切断された輪郭が第1部として、現在の切断状態における切断計画のヒートマップが第2部として示される。切断計画Pも、意思決定エージェントDAに提供されてよい。報酬関数モジュールRFは、観察データ(センサ信号sens)に適用される報酬関数を提供する。この入力データに基づき、意思決定エージェントDAは、(機械制御装置MCによって命令される)レーザ加工機Lが次に取るべき行動aを提供する。
図4に、意思決定エージェントDAによって処理される状態sを模式的に示す。状態は、2つの下位状態S1及びS2を含む。第1の下位状態S1は、既に加工された部品及びこれから加工される部品を含めた、切断ジョブの進捗を表す。第2の下位状態S2は、切断位置におけるワークピースへの熱エネルギの局部投入を表すワークピースのヒートマップを示すもので、これによりワークピース及び/又は切断部品内の区画に生じ得る過熱が明らかになるため、第2の下位状態S2は品質の測定値として機能する。
図5から判るように、学習プロセスは、制御命令CIに示される機械加工ヘッドの機械加工シーケンスを生成することから成り、この生成は、報酬予測意思決定エージェントDAを用いてその現在の経験に基づいて行われ、機械加工は、観察内容(すなわち、全機械加工時間、材料又はワークピースのヒートマップ、及び/又は衝突の可能性などに関するセンサ信号sens)を記録しながら実行される。次に、観察内容がステップ14において解釈されて、最適化で考慮しなければならない各現象に対応するコスト関数又は報酬関数が生成される。
本発明者らは、複数の異なる最適化目標に対応する複数の異なる報酬関数のセットから選択することを提案する。切断時間最適化の報酬関数には、合計移動距離に負の符号を付けたものが使用される。熱最適化の報酬関数には、到達した局部最高温度に負の符号を付けたものが使用される。これに代えて、全切断輪郭に沿った温度の積分測定値(又は、温度のべき関数)に負の符号を付けたものを利用することもできる。衝突最適化の報酬関数については、衝突しない場合の0値、及び生じ得る衝突の回数を負の定数に掛けた値が存在する。
ステップ15において、包括的報酬関数が、(限定ではないが)ユーザ設定による優先順位の重みを用いて一次式の組み合わせとして算出される。優先順位は、現在の必要事項(安全対速度、速度対安全、安全+品質など)に従って機械のオペレータによって設定される。一次式の組み合わせの係数は経験によって特定される。例えば、
平均的な最適化の場合:距離_報酬*1.0+熱_報酬+衝突_報酬*1.0
速度の最適化の場合:距離_報酬*10.0+熱_報酬*1.0+衝突_報酬1.0
などのように設定される。
局部的報酬関数及び包括的報酬関数を評価した後、ステップ16において、意思決定エージェントの経験データ(すなわち、使用されたニューラルネットワークの重み)が更新される。ここで、重要なのは、学習工程の実行及び観察段階は、実機(たとえば、限定ではないが、熱画像生成用の赤外線光センサ、潜在的な衝突の検出用の3D背景再構築センサ、駆動電流センサ、加速度センサなど、該当するセンサを備えたレーザ切断機)において行われると共に、機械学習シミュレーションソフトウェアなどの仮想環境においても行われることである。
仮想環境の場合、観察データは、対応するシミュレーション技術(熱分布マップに対応するFE法、傾斜部品の検出に対応する機械的シミュレーションなど)を用いて演算される。仮想シミュレーション学習は、好ましい方法であるが、これは、非常に多数の異なる機械加工計画(仮想的に生成された機械加工計画及びシミュレーションされた加工計画)、通常は、数十万の加工計画について学習を行うことが好ましいためである。この点は、最良の機械加工シーケンス予想の全体的パフォーマンスを大きく左右する。
図6に、モデル又は畳み込みニューラルネットワークCNNをトレーニングするトレーニング工程を示す。学習及びトレーニングの開始後、ネストが生成される。「ネスト」の用語は、本明細書の文脈において定義されたい。
ネストは、標準的なネスティングパラメータと、部品のリストとを用いて生成でき、リスト内の部品は、例えば、異なる部品の平均個数、平均寸法分布、材料のタイプなどを含む製造サンプリング統計を利用して製造部品データベースからランダムにサンプリングされる。次に、本工程は、図5のステップ13から16に係る学習セッションを1回実行するステップに進んでよい。このステップの後、本工程は、取得したトレーニングの経験データ(例えば、ニューラルネットワーク係数)を、機械学習装置MLDと協働する全ての機械制御装置MCに配布するステップに進んでよい。
図7に、機械制御装置MCによるレーザ切断ヘッドHの制御に使用される制御命令CIを生成する処理の別のフローチャートを示す。本方法の開始後、ステップS71において、切断計画Pが読み込まれる。この読み込みは、入力インターフェースJNを介して実行されてよい。切断計画Pは、構造化されたフォーマットのファイルとして受け取られてよい。ステップS72において、センサ信号がレーザ加工機Lの環境から受信される。ステップS73において、受信したセンサ信号sensを全て考慮して、状態が決定又は算出される。ステップS74において、次に行うべき行動aが、意思決定エージェントDAによって算出される。算出された行動aに基づき、ステップS75において、制御命令CLが提供されてよい。好ましい実施形態において、行動aは、伝達関数を用いて、制御命令CIに変換される。単純な実施形態では、伝達関数が識別情報であり、行動a自体が、機械制御装置MCに送られる制御命令CIと同じものとなる。他の実施形態において、より複雑な別の伝達関数が適用されてよく、このような伝達関数としては、例えば、再フォーマット、各レーザ加工機の諸元及び/又はレーザ加工機にインストールされたソフトウェアのバージョンへの適合、安全関数の適用などが挙げられる。算出された制御命令CIを機械制御装置MCに提供した後、ステップS76において、更なる手動入力又は検証を行わないで、受け取った命令を直ちに実行するように、機械制御装置MCに命令することができる。レーザ加工機の動作中、センサ信号sensが継続的に観察されて意思決定エージェントDAに送られる(図7ではステップS72にループされる)。
開示した実施形態の他の変形例は、図面、明細書、及び付属の請求項を精査することで、請求項に記載された発明を実施する際に当業者が理解及び実践できるものである。請求項において、「含む」の用語は、他の要素又はステップが存在することを排除しない表現であり、不定冠詞による「1つ」という表現は、複数個の存在を排除するものではない。
単一のユニット又は装置、すなわち、意思決定エージェントDA又は機械学習装置MLDは、請求項に記載された複数の項目の機能を実施してよい。特定の測定値が複数の異なる従属請求項に記載されているという単なる事実は、これらの測定値を組み合わせて活用できないことを示さない。
前述した方法に従って制御命令CIを生成する機械学習装置MLDは、コンピュータプログラムのプログラムコード手段及び/又は専用ハードウェアとして実施できる。
コンピュータプログラムは、他のハードウェアと共に提供される、又は他のハードウェアの一部として提供される光記憶媒体又は固体型媒体などの適切な媒体に格納/配布されてよいが、インターネット又は他の有線/無線通信システムなど、他の形式で配布されてもよい。
請求項内の参照符号は、範囲を限定するものとして解釈されるべきではない。
明示的に記載されていない限り、図面に関連付けて説明した各実施形態、又はその各側面及び各特徴は、互いに組み合わせること又は入れ替えることに意味があり、本発明の趣旨に沿うものであれば、記載された発明の範囲を限定又は広げることなく、組み合わせること又は入れ替えることができる。本発明の特定の実施形態又は特定の図に関して記述された利点は、適用可能である場合には、本発明の他の実施形態の利点でもある。

Claims (13)

  1. ワークピース内の一連の輪郭を切断して前記ワークピースから被加工部品(2)を切り出すように、レーザ加工機(L)の切断ヘッド(H)を制御する制御命令(CI)を算出する、コンピュータで実施される方法であって、
    -被加工部品(2)内の穴を含めて前記被加工部品(2)を表す一連の幾何形状である符号化された切断計画(P)を読み込むステップ(S71)と、
    -一連のセンサ信号(sens)を用いて状態(s)を継続的に特定するステップ(S73)であって、前記状態(s)が、前記レーザ加工機(L)の状態、切断された前記被加工部品(2)の状態、及び切断対象である前記ワークピースの状態を含む、ステップ(S73)と、
    -前記機械加工ヘッド(H)が次に取るべき行動(a)を動的に算出する、コンピュータで実施される意思決定エージェント(DA)を提供し、前記符号化された切断計画(P)と特定された前記状態(s)とを有するトレーニング済みモデルにアクセスすることによって、算出された前記行動(a)に基づいて前記切断計画(P)を実行するための制御命令(CI)を提供するステップと、を含み、
    前記モデルは、入力として、多層画像の形式、好ましくは多層画像マトリクスの形式で、前記状態(s)及び前記符号化された切断計画(P)を受け取り、出力として、次回の実行のために前記レーザ加工機(L)の機械制御装置(MC)に送られる前記行動(a)を提供する、方法。
  2. 請求項1に記載の方法であって、
    前記行動(a)の実行後に、前記各行動(a)が、受信したセンサ信号(sens)に基づいて報酬を受け取ること、及び
    前記意思決定エージェント(DA)が、全ての行動(a)の総合報酬を最大化する最適化関数を実行する報酬モジュール(RF)を含むこと、
    を特徴とする方法。
  3. 請求項1または2に記載の方法であって、
    算出された前記行動(a)に基づいた前記レーザ加工機(L)による前記制御命令(CI)の実行後及び/又は実行中に、前記一連のセンサ信号から経験データが収集され、収集された前記経験データは、前記モデルを継続して改善するために、前記モデルにフィードバックされること、
    を特徴とする方法。
  4. 請求項1から3のいずれか1項に記載の方法であって、
    前記状態(s)は、多層画像の形式、好ましくは多層画像マトリクスの形式で示されると共に、前記状態(s)は、第1の下位状態(s1)であって、既に切断された被加工部品とまだ切断されていない被加工部品とを区別できる、切断中の前記ワークピースのレイヤ画像の形式の第1の下位状態(s1)と、第2の下位状態(s2)であって、前記切断計画(P)に従って切断されているワークピースのヒートマップが示された、前記ワークピースのレイヤ画像の形式の第2の下位状態(s2)と、を少なくとも含むこと、
    を特徴とする方法。
  5. 請求項2から4のいずれか1項に記載の方法であって、
    切断時間報酬関数、熱最適化報酬関数、温度の積分測定値報酬関数、及び衝突回避報酬関数から成る群から報酬関数(RF)が選択されること、
    を特徴とする方法。
  6. 請求項に記載の方法であって、
    前記報酬関数(RF)は、ユーザ定義の優先順位を重みとして利用する、前記報酬関数全ての一次結合式であること、
    を特徴とする方法。
  7. 請求項1から6のいずれか1項に記載の方法であって、
    最適化目標ごとに個別の報酬関数(RF)が決定されること、
    を特徴とする方法。
  8. 請求項1から7のいずれか1項に記載の方法であって、
    自己学習エージェントとして動作する前記意思決定エージェント(DA)は、Q関数を用いて生成できるQテーブルを利用してモデル化でき、及び/又は、Qテーブルに従って動作でき、前記Qテーブルに、前記レーザ加工機(L)のステップ毎に次の行動を動的に評価及び算出するための状態-動作の組合せの品質が定形化されること、
    を特徴とする方法。
  9. 請求項1から8のいずれか1項に記載の方法であって、
    前記意思決定エージェント(DA)は、Q関数を実装し、ディープニューラルネットワーック、特に、深層畳み込みニューラルネットワーク(CNN)によって提示され得ること、
    を特徴とする方法。
  10. 請求項1から9のいずれか1項に記載の方法であって、
    前記意思決定エージェント(DA)は、少なくとも1つのニューラルネットワークとして実施され、トレーニングに経験再生技術を利用すること、
    を特徴とする方法。
  11. 請求項1から10のいずれか1項に記載の方法を実行するように適合された機械学習装置(MLD)であって、
    -前記被加工部品(2)内の穴を含めて前記被加工部品(2)を表す一連の幾何形状である前記符号化された切断計画(P)を読み込む(S71)ように構成された入力インターフェース(JN)と、
    -前記レーザ加工機(L)による前記ワークピースの切断に関する状態を、一連のセンサ(S)を用いて継続的に特定する(S73)ように構成された観察解釈モジュール(OIM)と、
    -コンピュータで実施される意思決定エージェント(DA)であって、前記機械加工ヘッド(H)が次に取るべき行動(a)を動的に算出し、前記符号化された切断計画(P)と特定された前記状態(s)とを有するトレーニング済みモデルにアクセスすることによって、算出された前記行動(a)に基づいて前記切断計画(P)を実行するための制御命令(CI)を提供するように構成された意思決定エージェント(DA)と、を含み
    前記モデルは、入力として、多層画像の形式、好ましくは多層画像マトリクスの形式で、前記状態(s)及び前記符号化された切断計画(P)を受け取り、出力として、次回の実行のために前記レーザ加工機(L)の機械制御装置(MC)に送られる行動(a)を提供する、機械学習装置(MLD)。
  12. 請求項11に記載の機械学習装置(MLD)内で用いられるコンピュータで実施される意思決定エージェント(DA)。
  13. プログラム要素を含むコンピュータプログラムであって、
    前記プログラム要素は、コンピュータのメモリに読み込まれたときに、請求項1から10のいずれか1項に記載された方法に従ってレーザ加工機(L)の機械加工ヘッド(H)を制御する制御命令(CI)を算出するために、前記コンピュータに前記方法の各ステップを実行させ、前記コンピュータは、一連のセンサ信号(sens)によって前記レーザー加工機(L)の状態を連続的に決定するように構成された一連のセンサを含む、ことを特徴とするコンピュータプログラム。
JP2022513179A 2019-08-28 2020-08-19 切断プロセスにおけるレーザ切断ヘッド移動の制御 Active JP7198967B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19194078.2 2019-08-28
EP19194078.2A EP3786736A1 (en) 2019-08-28 2019-08-28 Control for a laser cutting head movement in a cutting process
PCT/EP2020/073247 WO2021037641A1 (en) 2019-08-28 2020-08-19 Control for laser cutting head movement in a cutting process

Publications (2)

Publication Number Publication Date
JP2022540510A JP2022540510A (ja) 2022-09-15
JP7198967B2 true JP7198967B2 (ja) 2023-01-04

Family

ID=67777194

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022513179A Active JP7198967B2 (ja) 2019-08-28 2020-08-19 切断プロセスにおけるレーザ切断ヘッド移動の制御

Country Status (4)

Country Link
US (1) US11467559B2 (ja)
EP (2) EP3786736A1 (ja)
JP (1) JP7198967B2 (ja)
WO (1) WO2021037641A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4080301A1 (en) * 2021-04-19 2022-10-26 Bystronic Laser AG 3d tilt estimation and collision avoidance for laser cutting
CN113408148B (zh) * 2021-07-15 2023-04-11 广东宏石激光技术股份有限公司 一种基于SolidWorks二次开发的管材切割仿真方法
CN114296400B (zh) * 2021-11-16 2024-03-12 中南大学 一种用于激光切割高速插补的自适应前瞻处理方法
CN114690707B (zh) * 2021-12-01 2023-08-18 南京工业大学 一种基于改进bp神经网络的数控成形磨齿机直线轴几何综合误差辨识方法
WO2024037825A1 (en) * 2022-08-15 2024-02-22 TRUMPF Werkzeugmaschinen SE + Co. KG Method for selecting parts to be placed on sheets
DE102022123795A1 (de) 2022-09-16 2024-03-21 TRUMPF Werkzeugmaschinen SE + Co. KG Verfahren und System zum Anpassen eines Steuerungsplans zum Steuern eines Laserschneidvorgangs einer Laserschneidanlage
DE102022128678A1 (de) 2022-10-28 2024-05-08 TRUMPF Werkzeugmaschinen SE + Co. KG Verfahren und System zum Anpassen eines laufenden Laserschneidvorgangs einer Laserschneidmaschine
CN116329774B (zh) * 2023-02-24 2023-10-20 百超(深圳)激光科技有限公司 一种高速光纤激光切割机智能切割控制系统及方法
CN117170314B (zh) * 2023-11-02 2024-01-26 天津诺瑞信精密电子有限公司 一种切割钻孔数控机床控制方法及系统
CN117610889A (zh) * 2024-01-19 2024-02-27 北京金橙子科技股份有限公司 自适应填充及其填充线排序加工方法、装置和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018140471A (ja) 2017-02-28 2018-09-13 ファナック株式会社 制御装置及び機械学習装置
JP2018144078A (ja) 2017-03-07 2018-09-20 ファナック株式会社 レーザ加工装置および機械学習装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002080081A1 (en) * 2001-03-29 2002-10-10 Lasx Industries, Inc. Controller for a laser using predictive models of materials processing
CN102292187B (zh) 2008-11-21 2015-12-09 普雷茨特两合公司 用于监控要在工件上实施的激光加工过程的方法和装置以及具有这种装置的激光加工头
US9679258B2 (en) 2013-10-08 2017-06-13 Google Inc. Methods and apparatus for reinforcement learning
JP6625914B2 (ja) 2016-03-17 2019-12-25 ファナック株式会社 機械学習装置、レーザ加工システムおよび機械学習方法
JP6457473B2 (ja) 2016-12-16 2019-01-23 ファナック株式会社 ロボットおよびレーザスキャナの動作を学習する機械学習装置,ロボットシステムおよび機械学習方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018140471A (ja) 2017-02-28 2018-09-13 ファナック株式会社 制御装置及び機械学習装置
JP2018144078A (ja) 2017-03-07 2018-09-20 ファナック株式会社 レーザ加工装置および機械学習装置

Also Published As

Publication number Publication date
EP3786736A1 (en) 2021-03-03
JP2022540510A (ja) 2022-09-15
EP3999923A1 (en) 2022-05-25
EP3999923B1 (en) 2023-04-26
US20220244705A1 (en) 2022-08-04
WO2021037641A1 (en) 2021-03-04
US11467559B2 (en) 2022-10-11

Similar Documents

Publication Publication Date Title
JP7198967B2 (ja) 切断プロセスにおけるレーザ切断ヘッド移動の制御
JP7391023B2 (ja) 人間による実演に基づく、ロボットによる産業タスクの学習のためのシステム及び方法
JP6744208B2 (ja) 制御装置及び制御方法
JP6886869B2 (ja) 動作予測システム及び動作予測方法
JP6652549B2 (ja) 切粉除去装置及び情報処理装置
JP2019162712A (ja) 制御装置、機械学習装置及びシステム
TWI802820B (zh) 機器人控制裝置、方法和儲存媒體
JP6703020B2 (ja) 制御装置及び機械学習装置
Passalis et al. Deep reinforcement learning for controlling frontal person close-up shooting
JP2006268813A (ja) 学習制御装置、学習制御方法、およびプログラム
Wang et al. Robot navigation by waypoints
Allen et al. Health-informed policy gradients for multi-agent reinforcement learning
JP7450517B2 (ja) 加工面判定装置、加工面判定プログラム、加工面判定方法、及び、加工システム
CN114341754B (zh) 对切割处理中的激光切割头运动的控制方法及设备和介质
Akay et al. An end-to-end stochastic action and visual estimation system towards autonomous teleoperation
JP6829271B2 (ja) 測定動作パラメータ調整装置、機械学習装置及びシステム
JP6940425B2 (ja) 制御装置及び機械学習装置
JP2022113345A (ja) 加工面判定装置、加工面判定プログラム、加工面判定方法、加工システム、推論装置、及び、機械学習装置
JP2021086219A (ja) 協調作業システム、解析収集装置および解析プログラム
Pan et al. Smart scheduling of hanging workshop via digital twin and deep reinforcement learning
JP4687992B2 (ja) プラント運転支援装置
Langer et al. Human guidance and supervision of a manufacturing system for semi-automated production
Crandall et al. Predictive model for human-unmanned vehicle systems
JP7286023B1 (ja) 加工不良分析装置、加工システム、加工不良分析方法、および、加工方法
Sujatha et al. Hybrid deep learning neuro-fuzzy networks for industrial parameters estimation

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220421

A529 Written submission of copy of amendment under article 34 pct

Free format text: JAPANESE INTERMEDIATE CODE: A529

Effective date: 20220421

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220421

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220823

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221219

R150 Certificate of patent or registration of utility model

Ref document number: 7198967

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150