以下、図を参照しつつ、レーザ制御装置及びそのようなレーザ制御装置により制御されるレーザ装置について説明する。なお、各図において、同じ構成要素には同じ参照符号を付している。また、これらの図を見易くするために、縮尺を適宜変更している。
本願の発明者は、レーザ光の伝搬に光ファイバを利用するレーザ装置において何らかの異常が検知された場合において、その異常が検知された前後の所定期間における、レーザ装置の動作状況を表すデータ、特に、その異常が検知された前後の所定期間においてレーザ装置から出力されたレーザ光(以下、単にレーザ出力光と呼ぶことがある)の光量の時系列データ及び光ファイバをレーザ光の伝搬方向とは逆向きに伝搬する戻り光(以下、単に戻り光と呼ぶことがある)の時系列データが、レーザ発振器または光ファイバを含むレーザ光学系の損傷の有無と密接に関連していることを見出した。そこでこのレーザ制御装置は、レーザ装置において何らかの異常が検知された前後の所定期間における、レーザ装置の動作状況を表すデータ、特に、その所定期間における出力光及び戻り光の少なくとも一方の時系列データを、レーザ光の再出力が可能か否かを判定するように予め学習された判定器に入力することで、レーザ装置がレーザ光を再出力することの可否を判定する。
まず、第1の実施形態によるレーザ制御装置ついて説明する。
図1は、本発明の第1実施形態のレーザ制御装置及びそのレーザ制御装置によって制御されるレーザ装置の概略構成図である。なお、図1において、白抜きの矢印は、空気中または光ファイバ中を伝播しているレーザ光を模擬的に示し、実線の矢印は、信号線等とその信号の方向を模擬的に示している。なお、この点については、図1以降の概念的な構成を示す各図においても同様である。
本実施形態によるレーザ制御装置1は、レーザ装置2を制御する。レーザ装置2は、少なくとも、レーザ発振器21と、レーザ光学系22と、出力光検出器23と、戻り光検出器24と、制御回路25と、入力装置26と、表示装置27とを有する。そしてレーザ装置2から出力されたレーザ光は、光ファイバ3を伝搬して加工ヘッド4からワーク(加工対象物)5へ照射され、ワーク5の加工に利用される。
レーザ発振器21は、制御回路25からの制御に従ってレーザ発振することでレーザ光を出力する。本実施形態によるレーザ発振器21には、特に制限はないが、レーザ発振器21は、例えば、ファイバレーザ、YAGレーザといった固体レーザ方式のレーザ発振器、または、ダイレクトダイオードレーザといったレーザ発振器とすることができる。
レーザ光学系22は、レーザ発振器21と光ファイバ3との間に設けられ、レーザ発振器21から出力されたレーザ光が光ファイバ3へ入射するように、そのレーザ光を光ファイバ3の一端面に集光する。そのために、レーザ光学系22は、レーザ発振器21と光ファイバ3との一端面とを結ぶ光軸に沿って配置される1以上のレンズを有する。なお、レーザ発振器21と光ファイバ3とが直接接続される場合には、レーザ光学系22は省略されてもよい。また、光ファイバ3自体もレーザ光学系の一部と考えられるので、以下では、レーザ光学系22と光ファイバ3とを併せてレーザ光学系と呼ぶことがある。
出力光検出器23は、レーザ出力光の光量を検出する。そのために、出力光検出器23は、例えば、フォトダイオードといったレーザ出力光に対して感度を有する1以上の受光素子を有する。そして出力光検出器23は、例えば、光ファイバ3の融着部(図示せず)あるいはその近傍の光ファイバ3の保護被膜を除去した部分から漏出するレーザ出力光を受光するように配置される。あるいは、出力光検出器23は、レーザ光学系22のレーザ発振器21側の近傍に、レーザ光学系22が有するレンズ面にてレーザ出力光の一部が反射することで生じた迷光を受光するように配置されてもよい。あるいはまた、出力光検出器23は、レーザ発振器21とレーザ光学系22の間に配置されるビームスプリッタ(図示せず)により分割されたレーザ出力光の一部を受光するように配置されてもよい。あるいはまた、出力光検出器23は、光ファイバ3の加工ヘッド4の近傍において、レーザ出力光の一部またはレーザ出力光により生じた迷光を受光するように配置されてもよい。そして出力光検出器23は、レーザ出力光の光量の測定値を制御回路25へ出力する。
戻り光検出器24は、光ファイバ3内をレーザ出力光の伝搬方向とは逆向きに伝搬し、光ファイバ3の一端面からレーザ発振器21側へ向けて出射する戻り光の光量を検出する。そのために、戻り光検出器24は、例えば、フォトダイオードといった戻り光に対して感度を有する1以上の受光素子を有する。そして戻り光検出器24は、例えば、出力光検出器23と同様に、光ファイバ3の融着部あるいはその近傍の光ファイバの3保護被膜を除去した部分から漏出する戻り光を受光するように配置される。あるいは、戻り光検出器24は、レーザ発振器21を構成する高反射鏡(図示せず:ファイバレーザの場合は、HRFBG:High-reflecting fiber Bragg grating)を透過してくる戻り光を受光するように配置されてもよい。あるいはまた、戻り光検出器24は、レーザ光学系22の光ファイバ3側の近傍に、レーザ光学系22が有するレンズ面にて戻り光の一部が反射することで生じた迷光を受光するように配置されてもよい。あるいはまた、戻り光検出器24は、レーザ光学系22と光ファイバ3との間に配置されるビームスプリッタ(図示せず)により分割された戻り光の一部を受光するように配置されてもよい。そして戻り光検出器24は、戻り光の光量の測定値を制御回路25へ出力する。
制御回路25は、レーザ制御装置1からの制御信号、レーザ出力光の光量の測定値、戻り光の光量の測定値、あるいは、入力装置26からの操作信号に従って、レーザ発振器21にレーザ光を出力させる光出力指令あるいはレーザ光の出力を停止させる出力停止指令を出力する。なお、制御回路25がレーザ発振器21に対して光出力指令を出力するという表現は、レーザ発振器21に駆動電力を供給するように構成された電源(図示せず)に電力出力指令を出力するという意味を略して表現したものである。以降の各実施形態または変形例についても同様である。
制御回路25は、例えば、Central Processing Unit(CPU)といった演算回路、メモリ回路、レーザ発振器21に対して駆動電力を供給する電源(図示せず)を駆動する駆動回路及びレーザ装置2の各部及びレーザ制御装置1と通信するための通信回路などを有する。なお、制御回路25は、Field Programmable Gate Arrayにより構成されてもよい。制御回路25は、例えば、入力装置26から、レーザ装置2を起動する操作信号を受信すると、レーザ発振器21へ光出力指令を出力する。また、制御回路25は、入力装置26から、レーザ装置2を停止させる操作信号を受信すると、レーザ発振器21へ出力停止指令を出力する。さらに、制御回路25は、レーザ出力光の光量の測定値または戻り光の光量の測定値が所定の許容範囲から外れると、レーザ装置2または光ファイバ3に何らかの異常が発生したと判定する。例えば、制御回路25は、レーザ出力光の光量の測定値が所定の下限閾値より小さい場合、あるいは、戻り光の光量の測定値が所定の上限閾値より大きい場合、レーザ装置2または光ファイバ3に何らかの異常が発生したと判定する。なお、所定の下限閾値は、光出力指令の関数として設定されてもよい。また、異常が発生したという表現は、レーザ装置に不可逆的な損傷が発生したと意味ではなく、レーザ装置が異常な状態になったという意味で使用される。制御回路25は、異常の発生を検知すると、レーザ発振器21へ出力停止指令を出力するとともに、レーザ制御装置1へ、異常の発生を検知したことを通知する。さらにまた、制御回路25は、学習モデルの学習が行われている間、異常発生を検知した後に、レーザ発振器21へ光出力指令を再度出力してもよい。そして制御回路25は、光出力指令を再出力してから一定期間を経過しても異常の発生が検知されない場合、その旨を表す光出力可ラベルをレーザ制御装置1へ出力する。一方、制御回路25は、光出力指令を再出力してから一定期間内に異常の発生を再度検知すると、その旨を表す光出力不可ラベルをレーザ制御装置1へ出力する。
さらにまた、制御回路25は、レーザ装置2の各部の状態を表すデータ(以下、状態データと呼ぶ)を継続的にレーザ制御装置1へ出力する。なお、状態データには、例えば、レーザ出力光の光量の測定値、戻り光の光量の測定値、レーザ発振器21に供給する駆動電流量を指定する値といった制御回路25の制御データ、及び、レーザ装置2内に設置される他のセンサ(例えば、電流計、電圧計あるいは温度計)による測定値が含まれる。
また制御回路25は、学習モデルの学習が終了すると、異常の発生を検知してレーザ発振器21にレーザ光出力を一旦停止させた後に、レーザ光出力の再開の可否などを問い合わせる信号をレーザ制御装置1へ出力する。そして制御回路25は、レーザ制御装置1から、レーザ光出力の再開の許可を表す制御信号を受信すると、レーザ発振器21へ光出力指令を出力する。一方、制御回路25は、レーザ制御装置1から、レーザ光出力の再開を許可しない制御信号を受信すると、レーザ発振器21によるレーザ光出力を停止させたまま維持する。
入力装置26は、例えば、複数の操作ボタンを有する。そして入力装置26は、複数の操作ボタンのうち、ユーザにより操作された操作ボタンに応じた操作信号(例えば、レーザ装置2を起動する操作信号、レーザ装置2によるレーザ光の出力を停止する操作信号、レーザ光の出力強度を設定する操作信号など)を生成して制御回路25へ出力する。
表示装置27は、例えば、液晶ディスプレイであり、制御回路25から受け取った各種の表示用のデータ、例えば、レーザ装置2の状態を表すデータを表示する。なお、入力装置26と表示装置27とは、タッチパネルディスプレイのように一体的に構成されてもよい。また、入力装置26と表示装置27とは、レーザ制御装置1に設けられてもよい。
レーザ制御装置1は、通信インターフェース11と、メモリ12と、プロセッサ13とを有する。
通信インターフェース11は、通信部の一例であり、レーザ装置2等と通信するための通信回路を有する。そして通信インターフェース11は、レーザ装置2から受信した各種のデータまたは信号をプロセッサ13へわたす。また通信インターフェース11は、プロセッサ13から受け取った、レーザ装置2に対する制御信号をレーザ装置2へ出力する。さらに、通信インターフェース11は、レーザ装置2及び光ファイバ3の周囲の環境の状態を表すデータ(以下、環境データと呼ぶ)を測定する1以上のセンサ(例えば、加工ヘッド4またはワーク5の近傍に設置される温度計または湿度計)と通信可能に接続され、そのセンサから受信した環境データをプロセッサ13へわたしてもよい。なお、通信インターフェース11は、レーザ装置2の制御回路25を介して環境データを受信してもよい。環境データには、例えば、加工ヘッド4またはワーク5の近傍の温度または湿度、加工ヘッド4とワーク5の相対位置関係を制御する駆動装置(図示せず)の内部データが含まれる。
メモリ12は、記憶部の一例であり、レーザ制御装置1がレーザ装置2を制御するために使用する各種のデータ及びプロセッサ13上で動作するプログラムを記憶する。例えば、メモリ12は、レーザ装置2において異常が検出され、一旦レーザ光出力が停止された後にレーザ光出力の再開の可否を判定するために用いられる学習モデルを表すパラメータ群、及び、そのような学習モデルの学習に利用される、レーザ装置2の状態データ及び環境データを記憶する。そのために、メモリ12は、例えば、不揮発性の読み出し専用の半導体メモリと、揮発性の読み書き可能な半導体メモリとを有する。さらに、メモリ12は、リングバッファを有してもよい。さらにまた、メモリ12は、磁気記録媒体または光記録媒体及びそのアクセス装置といったストレージ装置を有していてもよい。
プロセッサ13は、制御部の一例であり、例えば、Central Processing Unit(CPU)及びその周辺回路を有する。さらにプロセッサ13は、論理演算用のプロセッサ及び数値演算用のプロセッサを有していてもよい。さらに、プロセッサ13は、Field Programmable Gate Arrayにより構成された演算回路を有してもよい。そしてプロセッサ13は、レーザ装置2の制御に関する処理を実行する。そのために、プロセッサ13は、状態観測部131と、ラベル取得部132と、判定部133と、学習部134と、学習制御部135とを有する。プロセッサ13が有するこれらの各部は、例えば、プロセッサ13上で実行されるコンピュータプログラムにより実現される機能モジュールである。あるいは、これらの各部は、プロセッサ13の一部に実装される専用の演算回路として実装されてもよい。また、プロセッサ13は、一つのプロセッサで構成される必要はなく、特に計算負荷の大きい学習部134等の処理を実行するための別の専用プロセッサが設けられてもよい。
状態観測部131は、状態データ及び環境データを観測する。本実施形態では、状態観測部131は、通信インターフェース11を介して状態データ及び環境データを継続的に取得して、メモリ12に記憶する。その際、状態観測部131は、メモリ12に含まれるリングバッファに状態データ及び環境データを書き込んでもよい。この場合、リングバッファに、直近の一定期間の状態データ及び環境データが記憶される。
ラベル取得部132は、レーザ装置2の制御回路25が異常発生を検知して、制御回路25から出力停止指令が出力された後に制御回路25が再度光出力指令を出力することの可否を、光出力可ラベルあるいは光出力不可ラベルから成るラベルとして取得する。例えば、ラベル取得部132は、通信インターフェース11を介して、制御回路25から、異常発生の検知後に光出力指令を再度出力しても再度異常発生が検知されなかったという光出力可ラベル、及び、異常発生の検知後に光出力指令を出力すると異常発生が再度検知されて直ちに光出力を再度停止したという光出力不可ラベルを取得することができる。これらのラベルの取得には人間が介在しないことが好ましいが、レーザ装置2を分解して調査した結果、異常発生の検知後に光出力指令を再度出力することが不可である損傷が見つかった場合等は、人間が入力装置26を操作して、制御回路25に、光出力不可ラベルを出力させてもよい。
判定部133は、異常発生の検知によって、レーザ装置2の制御回路25がレーザ発振器21へ出力停止指令を出力したときに、制御回路25が出力停止指令を出力した出力停止時点(すなわち、レーザ光出力が停止された時点)を含む所定期間内の状態データ及び環境データの少なくとも一部である入力データを、レーザ光出力の再開の可否を判定する学習モデルに入力する。これにより、判定部133は、レーザ光出力の再開の可否を判定する。また判定部133は、その判定結果に応じて、レーザ光出力の再開の可否に関してレーザ装置2の制御回路25を制御する。なお、学習モデルは、判定器の一例である。
所定期間は、出力停止時点から第1所定時間遡った時点から、その出力停止時点後の第2所定時間が経過した時点までの期間とすることができる。第1所定時間は、時間を長く設定すると、データ量が大きくなり過ぎる、あるいは、有効なデータが無効なデータに埋もれてしまうという問題が発生するので、ゼロよりも大きく、かつ、典型的に10msオーダー程度に設定することが好ましい。また、第2所定時間も同様の問題があり、有効なデータは出力停止時点より前に多く存在するので、第2所定時間は、第1所定時間と同じか、第1所定時間より短く設定することが好ましい。また、第2所定時間はゼロに設定されてもよい。すなわち、出力停止時点が所定期間の終端に設定されてもよい。
本実施形態では、学習モデルは、例えば、多層パーセプトロン型のニューラルネットワークあるいはサポートベクトルマシンとすることができる。なお、学習モデルに入力される入力データには、特に、所定期間におけるレーザ出力光の光量の測定値の時系列データ及び戻り光の光量の測定値の時系列データの少なくとも一方が含まれることが好ましく、所定期間におけるレーザ出力光の光量の測定値の時系列データ及び戻り光の光量の測定値の時系列データの両方が含まれることがより好ましい。所定期間におけるレーザ出力光の光量の測定値の時系列データ及び戻り光の光量の測定値の時系列データは、レーザ発振器21及び光ファイバ3の何れかにて生じた異常との関連性が高く、そのため、これらの時系列データを学習モデルの入力データとすることで、学習モデルは、レーザ光出力の再開の可否を精度よく判定できる。その結果として、レーザ発振器21及び光ファイバ3の何れかに、レーザ光出力を再開すると損傷が拡大するような異常があるときに、レーザ光出力が再開されることが抑制される。
なお、入力データの一つとして、状態データのうち、レーザ発振器21に供給される駆動電流の目標値といった、制御回路25による制御データが利用されてもよい。そのような制御データについては、短時間で変化しないので、所定期間中の何れかの時点での値が入力データとして用いられてもよい。また、入力データの他の一つとして、状態データまたは環境データのうち、電流計、電圧計あるいは光検出器といったセンサにより測定されるデータが利用されてもよい。そのような測定データは、異常発生の前後で変化する可能性があるので、所定期間中の時系列の測定データが入力データとして用いられることが好ましい。
学習部134は、学習モデルを学習する。本実施形態では、学習部134は、レーザ装置2の制御回路25が異常の発生を検知したときの所定期間の状態データ及び環境データのうちの入力データと、その入力データに対応するラベルのペアとなる教師データを複数利用して、誤差逆伝搬法といった所定の教師有り学習手法に従って学習モデルを学習する。
学習制御部135は、学習部134による学習モデルの学習過程を制御する。そのために、学習制御部135は、状態観測部131により得られた状態データ等とラベル取得部132により得られたラベルとの対応付けによる教師データの作成及び教師データのメモリ12への書き込み、メモリ12からの教師データの読み込み及び学習部134への教師データの受け渡しなどの処理を実行する。例えば、学習制御部135は、制御回路25から異常の発生を検知したことが通知されると、メモリ12から、上記の所定期間の状態データ等を読み出して、ラベル取得部132により得られたラベルと対応付けて、教師データとしてメモリ12に別途記憶する。さらに、学習制御部135は、学習部134による学習モデルの学習が終了したか否かを判定し、学習モデルの学習が終了した場合に、レーザ装置2の制御回路25へ、その学習が終了したことを、通信インターフェース11を介して通知する。
図2は、第1実施形態による学習モデルの学習過程及び学習済みの学習モデルを用いたレーザ光再出力可否判定の一例を示すフローチャートである。
レーザ制御装置1が動作を開始すると、まず未だ学習モデルの学習の到達レベルが設定したレベルに達していないことを明確にするために、学習制御部135の内部変数である学習レベルに0を設定する(ステップS101)。続いて、学習制御部135が、レーザ装置2の制御回路25が光出力指令の出力を要求されているか否かを判定する(ステップS102)。光出力指令の出力を要求されていれば(ステップS102−Yes)、学習制御部135は、制御回路25に対して、通信インターフェース11を介して光出力指令に従ってレーザ光を出力することを許可する制御信号を出力する。そして制御回路25がレーザ発振器21に対して光出力指令を出力することで、レーザ発振器21からレーザ光が出力される(ステップS103)。
状態観測部131は、レーザ出力光の光量の測定値及び戻り光の光量の測定値を含む、レーザ装置2の状態データ及び環境データを制御回路25から常時取得するとともに、制御回路25による、異常発生の検知及び出力停止指令が出力されたか否かも常時観測し、異常発生が検知されたときには、異常発生の検知を表す信号を制御回路25から通信インターフェース11を介して取得する(ステップS104)。
学習制御部135が、状態観測部131を経由して、制御回路25が異常発生を検知したか否か、すなわち、出力停止指令が出力されたか否かを判定する(ステップS105)。出力停止指令が出力された場合(ステップS105−Yes)、学習制御部135は、メモリ12(例えば、リングバッファ)から、上記の所定期間内の状態データ及び環境データの少なくとも何れかを入力データとして読み込む(ステップS106)。次に、学習制御部135は、学習レベルを確認するため、学習制御部135の内部変数である学習レベルが0か否かを判定する(ステップS107)。学習レベルが0であれば(ステップS107−Yes)、学習途上ということであり、学習制御部135は、設定されている学習モードが自動再出力モードか否か判定する(ステップS108)。
ここで、自動再出力モードとは、制御回路25が異常発生を検知して、光出力停止指令を出力し、レーザ光出力が停止した場合に、例えば、ワーク5からの反射光が発生しない位置に加工ヘッド4を退避させて後、制御回路25に光出力指令を再度出力するように、学習制御部135が自動的に指令する学習モードである。人間が介在しないで学習を進められるメリットがあるが、光ファイバ3またはレーザ光学系22の損傷が拡大して、場合によっては、レーザ発振器21にまで損傷が拡大して、レーザ装置2の修理が必要となるという事態も起こり得る。しかし、制御回路25が異常発生を検知して、光出力停止指令を出力した場合でも、ワーク5からの反射光が一時的に基準を超えただけであることも多い。このような場合、光出力停止指令によって瞬時にレーザ光出力が停止するため、光ファイバ3等が何ら損傷を受けていない。そのため、時には上記のように損傷が拡大して修理が必要となっても、制御回路25からの出力停止指令によって、レーザ装置2がレーザ光出力を停止した時に、制御回路25が光出力指令を再度出力する可否を自動的に判別するので、使い易くて信頼性の高いレーザ装置を開発するめには必要なコストと考えられる場合に採用されればよい。
ステップS108で自動再出力モードに設定されていると判定されると(ステップS108−Yes)、学習制御部135は、通信インターフェース11を介して制御回路25に光出力指令をレーザ発振器21へ再度出力するように指令して、レーザ光が再び出力される(ステップS109)。レーザ光の再出力の結果として、学習制御部135が、状態観測部131を経由して、制御回路25から出力停止指令が再度出力されたか否かを判定する(ステップS110)。制御回路25から出力停止指令が再度出力されたと判定された場合(ステップS110−Yes)、レーザ装置2または光ファイバ3に損傷部分があり、修理が必要な状態であることが考えられるので、学習制御部135は、制御回路25に対して、通信インターフェース11を介して、表示装置27等に要修理状態であることを表示するように指令する(ステップS112)。この場合、人間が損傷部を修理するが(ステップS113)、レーザ光出力を再度行ってはいけなかったということになるので、ラベル取得部132は、制御回路25から出力停止指令が再出力されたことを光出力不可ラベルとして取得する(ステップS114)。そして学習制御部135は、ステップS106で取得した入力データと光出力不可ラベルとを対応付けることで、教師データの一つとなる入力データと光出力不可ラベルのペアが形成される(ステップS115)。
また、ステップS110で、制御回路25から一定時間経過しても出力停止指令が再度出力されていないと判定された場合(ステップS110−No)、レーザ装置2または光ファイバ3は、問題となるような損傷を受けていないと推定される。そのため、レーザ光を再度出力することが可能であったことになるので、ラベル取得部132は、制御回路25から出力停止指令が再度出力されなかったことを光出力可ラベルとして取得する(ステップS111)。そしてステップS115にて、学習制御部135は、ステップS106で取得した入力データと光出力可ラベルとを対応付けることで、教師データの一つとなる入力データと光出力可ラベルのペアが形成される。
ステップS115の後、学習制御部135は、前回の学習モデルの更新以降に蓄積された教師データの数が所定数(例えば、1000)に達したか否か判定する(ステップS116)。教師データの数が所定数に達していなければ(ステップS116−No)、学習制御部135は、レーザ制御装置1に対して動作終了指令が出ているか否かを判定する(ステップS131)。動作終了指令が出ていれば(ステップS131−Yes)、レーザ制御装置1は動作を終了する。一方、動作終了指令が出ていなければ(ステップS131−No)、学習制御部135は、ステップS102以降の処理を繰り返す。
一方、教師データの数が所定数に達していれば(ステップS116−Yes)、学習制御部135は、前回の学習モデルの更新以降に蓄積された教師データのそれぞれについて、その教師データに含まれる入力データを学習モデルに入力して得られる判定結果とその教師データに含まれるラベルとを照合することで学習モデルによる判定結果が正解か否か判定する。そして学習制御部135は、各教師データについての判定結果から、学習モデルによる判定結果の誤り率をもとめる(ステップS117)。なお、上記のようにバッチ学習ではなく、学習制御部135は、オンライン学習で、リアルタイムの入力データに対して、学習しながら判定を行ってもよい。
学習制御部135は、誤り率が所定の設定値以下か否か判定する(ステップS118)、誤り率が所定の設定値よりも大きければ(ステップS118−No)、学習モデルの学習は十分でなく、そのため、レーザ光再出力の可否の判定精度は不十分である。そこで、学習制御部135は、メモリ12に記憶されている全ての教師データを用いて、学習部134に学習モデルを学習させることで、学習モデルを更新する(ステップS119)。その後、学習制御部135は、ステップS131で動作終了指令が出ていなければ、ステップS102以降の処理を繰り返す。
一方、誤り率が所定の設定値以下であれば(ステップS118−Yes)、学習モデルの学習は十分であり、その結果として、レーザ光再出力の可否について十分な判定精度が得られる。そこで、学習制御部135は、学習レベルに、学習が終了したことを表す1を設定する(ステップS120)。さらに、学習制御部135は、通信インターフェース11を介して制御回路25へ学習モデルの学習が完了したことを通知するとともに、表示装置27に学習モデルの学習が完了したことを表示させる(ステップS121)。
ステップS121の後、ステップS102にて光出力指令の出力が要求されていない場合(ステップS102−No)、あるいは、ステップS105にて制御回路25から出力停止指令が出力されていないと判定された場合(ステップS105−No)についても、学習制御部135は、レーザ制御装置1に対して動作終了指令が出ているか否かを判定する(ステップS131)。動作終了指令が出ていれば(ステップS131−Yes)、レーザ制御装置1は動作を終了する。一方、動作終了指令が出ていなければ(ステップS131−No)、学習制御部135は、ステップS102以降の処理を繰り返す。なお、ステップS102で、レーザ装置2に光出力指令が出ておらず、かつ、ステップS131にて、動作終了指令がでていない場合は、学習制御部135は、光出力指令か動作終了指令の何れかが出るまで待機することになる。
なお、ステップS104、ステップS105、ステップS131、ステップS102、ステップS103の順に処理が実行され、再度、ステップS104の処理が実行されるまでの時間サイクルは、10μsオーダーか、それ以下であることが好ましい。
また、ステップS108にて、学習モードが自動再出力モードに設定されていないと判定されると(ステップS108−No)、制御回路25から出力停止指令が出力されたため、表示装置27にレーザ装置2が停止状態であることが表示される(ステップS122)。なお、人間(担当者)が、レーザ装置2が停止状態であることに早く気付くように、制御回路25は、ブザー(図示せず)等を同時に鳴らしてもよい。この場合、レーザ装置2が停止状態となってから、人間(担当者)が、レーザ装置2または光ファイバ3の損傷が疑われる部分から分解調査して損傷部の有無またはレーザ装置2または光ファイバ3の状態を確認する。そして、その調査結果が入力装置26を介して入力される(ステップS123)。学習制御部135は、入力された調査結果を制御回路25から受け取り、その調査結果を参照して、レーザ光の再出力が可であるか不可であるかを判定する(ステップS124)、レーザ光の再出力が可であると判定された場合(ステップS124−Yes)、学習制御部135は、前述のステップS109以降の処理を実行する。
一方、ステップS124にて、学習制御部135は、レーザ光の再出力が不可であると判定した場合(ステップS124−No)、損傷部の修理が必要である。そこで、人間がレーザ装置2または光ファイバ3の損傷部の修理を行って(ステップS125)、学習制御部135は、前述のステップS114以降の処理を実行すればよい。
前述のステップS120で学習レベルに1が代入されると、学習モデルの学習が完了する。そのため、判定部133は、学習結果である学習モデルを用いて、新たに異常の発生が検知されたときにその検知時の入力データに対してレーザ光の再出力の可否、すなわち、制御回路25からレーザ発振器21に対して、光出力指令を再度出力するか否かを適切に判断することが可能となる。すなわち、ステップS107にて、学習レベルが1であると判定されると(ステップS107−No)、判定部133は、ステップS106で取得した入力データを学習モデルに入力する(ステップS126)。そして判定部133は、学習モデルから、レーザ光の再出力が可能か否かの判定結果を得る(ステップS127)、判定部133は、その判定結果がレーザ光の再出力が可能であることを示しているか否か判定する(ステップS128)、レーザ光の再出力が可能であれば(ステップS128−Yes)、判定部133は、制御回路25からレーザ光の再出力可否の問い合わせに対して再出力の許可を与える制御信号を、通信インターフェース11を介して制御回路25へ出力する(ステップS129)。
一方、レーザ光の再出力が不可能であれば(ステップS128−No)、判定部133は、制御回路25からレーザ光の再出力可否の問い合わせに対して再出力を不許可とする制御信号を、通信インターフェース11を介して制御回路25へ出力するとともに、表示装置27に故障が検知されたことを表示させる。そしてレーザ装置2または光ファイバ3の損傷部の修理が行われる(ステップS130)。
ステップS129またはステップS130の後、判定部133は、ステップS131の処理を実行すればよい。
以上に説明してきたように、レーザ装置または光ファイバの異常の発生が検知された時に、その異常の原因が、雑音による一時的な誤検出である場合、あるいは、ワーク表面で反射したレーザ出力光による戻り光が所定レベルを超えたことに対する正常な損傷回避動作である場合のように、光出力指令が再度出力されてもよい場合がある。一方、その異常の原因が、何らかの理由でレーザ発振器または光ファイバ等に損傷が発生したり、発生し掛けていることであり、光出力指令が再度出力されると、損傷部分が広がるので、光出力指令が出力されてはいけない場合がある。しかし、本実施形態のレーザ制御装置は、異常の発生が検知されてレーザ光出力が停止された後に、光ファイバなどに再度光を入射させなくても、異常の発生が検知されてレーザ光出力が停止されたときを含む所定期間の状態データ及び環境データのうちから選択される入力データを学習モデルに入力することで、光出力指令を再度出力してもよいか否かを、直ちに、かつ、適切に判断することができる。そのため、このレーザ制御装置は、無駄な工数を削減できるとともに、光出力指令の再出力可否の判断を誤って、レーザ発振器または光ファイバ等に生じた損傷が拡大することを防止できる。
次に、第2実施形態について説明する。第2の実施形態によるレーザ制御装置は、レーザ制御装置が有する光ファイバ破断装置により光ファイバを損傷させたとき、すなわち、再度の光出力指令が拒否される場合の教師データを容易に取得できるようにする。
図3は、本発明の第2実施形態のレーザ制御装置及びそのレーザ制御装置によって制御されるレーザ装置の概略構成図である。第2の実施形態と図1に示される第1実施形態との相違点は、レーザ制御装置1が光ファイバ破断装置28をさらに有している点である。
本実施形態では、光ファイバ破断装置28は、レーザ制御装置1の構成の一部であるが、レーザ装置2内に設置されており、学習制御部135からの指令で光ファイバ3を破断する。なお、光ファイバ破断装置28は、光ファイバ3のレーザ装置2の外側に位置する部分を破断するように設置されてもよい。光ファイバ破断装置28は、レーザ装置2がレーザ光を出力中に、光ファイバ3の少なくとも一箇所以上の原則的には特定区間において光ファイバ3を破断させることが可能なように構成されている。特定区間は、例えば、破断した光ファイバ3を再融着することによってレーザ装置2を機能的に修復可能な区間であることが好ましい。光ファイバ破断装置28は、学習制御部135からの指令で光ファイバ3が破断した時に、破断発生信号を通信インターフェース11を介してプロセッサ13のラベル取得部132に出力し、ラベル取得部132は、少なくとも破断発生信号を光出力不可ラベルとして取得するようにしてもよい。
図4は、光ファイバ破断装置28の構成の一例を示す図である。この例では、光ファイバ破断装置28は、図4に示されるように、光ファイバ3を徐々に屈曲させて、屈曲部3aの曲率が限界を超えたところで光ファイバ3が文字通り破断させる構成を有する。光ファイバ破断装置28は、光ファイバ3の保護被膜を除去した部分(屈曲部)3aの曲率が次第に大きくなるように、光ファイバ3の保護被膜を除去した部分3aの一端側を、光ファイバ3を固定的に保持する光ファイバ固定ホルダー281aでホールドし、その部分3aの他端側を光ファイバ移動ホルダー281bでホールドする。そして光ファイバ破断装置28は、光ファイバ移動ホルダー281bを、例えば、モータ及びモータにより駆動される車輪を有する円弧駆動装置281cによって円弧駆動用ガイドレール281dに沿って図に示した駆動方向に移動させる。破断が起こる場所を一義的に決めるために、あるいは破断し易くするために、屈曲部3aの外側のクラッド外面に予め僅かに傷を付けておいてもよい。光ファイバ破断装置28の各部は、遮光筐体281e内に収容される。これにより、光ファイバ3が破断した時に外部にレーザ光が漏洩することが防止される。また、遮光筐体281e内に、フォトダイオードといった散乱光検出器281fが配置されてもよい。そして光ファイバ破断装置28は、光ファイバ3が破断した時に発生する遮光筐体281e内の散乱光を散乱光検出器281fで検出することにより破断発生信号として利用してもよい。そのために、円弧駆動装置281cと散乱光検出器281fの信号線は、レーザ制御装置1の通信インターフェース11に接続されればよい。
図5は、光ファイバ破断装置28の構成の他の一例を示す図である。この例では、光ファイバ破断装置28は、図5に示されるように、リニア駆動用ガイドレール282aに沿って、リニア駆動装置282bを図中に示した駆動方向に沿って移動させることによって、エッジ282cを光ファイバ3に押し当ててエッジ受け台282dとの間で、光ファイバ3の保護被膜を除去した部分3aを加圧して、その部分3aを急角度に曲げる。そして光ファイバ破断装置28は、曲がり損失の急激な増大により、その部分3aに生じる損失部を起点にファイバフューズを発生させて実効的に光ファイバ3を破断する構成としてもよい。ファイバフューズの発生により、レーザ発振器21へ向かう方向と反対方向に伝播してくる出力光を検出する、フォトダイオードといった出力光検出器282eが配置されてもよい。そして光ファイバ破断装置28は、出力光検出器282eにより検出される、レーザ発振器21へ向かう方向と反対方向に伝播してくる出力光の光量が激減すること(例えば、直近の一定期間におけるその光量の減少量が所定の閾値以上となること)を破断発生信号として利用してもよい。図5の場合、光ファイバ3の保護被膜を除去した部分3aの一部を緩く曲げて曲がり損失によってコアから漏れ出した出力光が出力光検出器282eにより検出される。リニア駆動装置282bと出力光検出器282eの信号線は、レーザ制御装置1の通信インターフェース11に接続されればよい。なお、この例でも、光ファイバ破断装置28の各部は、遮光筐体282f内に収容される。
図6は、光ファイバ破断装置28の構成のさらに他の一例を示す図である。この例では、光ファイバ破断装置28は、図6に示されるように、出力光検出器23及び戻り光検出器24の検出結果に直接影響を与えないように、レーザ装置2のレーザ発振器21の出力レーザ光の波長及び出力光検出器23及び戻り光検出器24が検出可能な波長とは異なる波長を持つレーザ光を出射するレーザ発振器283aを有する。そして光ファイバ破断装置28は、レーザ発振器283aから出射されたレーザ光を、集光光学系283bで集光して、光ファイバ3の保護被膜を除去した部分3aに照射して局部的に光ファイバ3を高温に加熱する。これにより、この光ファイバ破断装置28は、その部分3aにファイバフューズを発生させて実効的に光ファイバ3を破断させる。この場合、図5に示される例と同様に、ファイバフューズの発生により、レーザ発振器21へ向かう方向と反対方向に伝播してくる出力光を検出する、フォトダイオードといった出力光検出器283cが配置されてもよい。そして光ファイバ破断装置28は、出力光検出器283cにより検出される、レーザ発振器21へ向かう方向と反対方向に伝播してくる出力光の光量が激減すること(例えば、直近の一定期間におけるその光量の減少量が所定の閾値以上となること)を破断発生信号として利用してもよい。図5に示される例と同様に、光ファイバ3の保護被膜を除去した部分3aの一部を緩く曲げて曲がり損失によってコアから漏れ出した出力光が出力光検出器283cにより検出される。レーザ発振器283aと出力光検出器283cの信号線は、レーザ制御装置1の通信インターフェース11に接続されればよい。なお、この例でも、光ファイバ破断装置28の各部は、遮光筐体283d内に収容される。
上記のように、図4〜6に示した光ファイバ破断装置28では、散乱光検出器または出力光検出器により検出される光量の変化が破断発生信号として利用される。しかし、学習制御部135から光ファイバ破断装置28に出力された光ファイバ破断指令が破断発生信号として利用されてもよい。この場合には、光ファイバ破断装置28において、散乱光検出器及び出力光検出器は省略されてもよい。
図7は、本実施形態のレーザ制御装置1の学習過程の一例を示すフローチャートであり、本発明におけるレーザ制御方法における学習過程の一例でもある。
本実施形態による学習過程では、図2に示されるフローチャートにおける、ステップS102の光出力指令の有無の判定において、光出力指令が有った場合に、ステップS201の意図的破断モードが有効に設定されているか否かを判定する処理と、意図的破断モードが有効と判定された場合に適用されるステップS202〜ステップS212の処理が追加される。そこで図7に示されるフローチャートでは、ステップS201〜S212の処理が図示される。その他のステップの処理の詳細については、図2のフローチャート及び関連する説明を参照されたい。
レーザ制御装置1が学習モデルの学習を開始して、学習制御部135が、レーザ装置2の制御回路25が光出力指令の出力を要求されているか否かを判定する。そして光出力指令の出力を要求されていれば(ステップS102−Yes)、すなわち、光出力指令が新たに出ている場合、あるいは、先に出された光出力指令の実行が終了せずに残っている場合、学習制御部135は、意図的破断モードが有効に設定されているか否かを判定する(ステップS201)。意図的破断モードとは、光ファイバ破断装置28を使用して光ファイバ3を意図的に破断するモードである。意図的破断モードが無効に設定されていれば(ステップS201−No)、学習制御部135は、図2に示されるフローチャートにおけるステップ103以降の処理を実行する。
一方、意図的破断モードが有効に設定されていれば(ステップS201−Yes)、学習制御部135は、制御回路25に対して、通信インターフェース11を介して光出力指令に従ってレーザ光を出力することを許可する制御信号を出力する。そして制御回路25がレーザ発振器21に対して光出力指令を出力することで、レーザ発振器21からレーザ光が出力される(ステップS202)。さらに、学習制御部135は、光ファイバ3の意図的破断が実行されるまでの時間計測を開始する(ステップS203)。状態観測部131は、レーザ出力光の光量の測定値及び戻り光の光量の測定値を含む、レーザ装置2の状態データ及び環境データを制御回路25から常時取得するとともに、制御回路25による、異常発生の検知及び出力停止指令が出力されたか否かも常時観測し、異常発生が検知されたときには、異常発生の検知を表す信号を制御回路25から通信インターフェース11を介して取得する(ステップS204)。
学習制御部135が、状態観測部131を経由して、制御回路25が異常発生を検知したか否か、すなわち、出力停止指令が出力されたか否かを判定する(ステップS205)。出力停止指令が出力された場合(ステップS205−Yes)、後述のように、学習制御部135からの指令により光ファイバ破断装置28が光ファイバ3の意図的破断を実行するまでの設定時間が経過する前に、出力停止指令が出力されたことになる。すなわち、光ファイバ3の意図的破断は実行されていない。そのため、学習制御部135は、図2のフローチャートにおけるステップS106以降の処理を実行する。
一方、制御回路25から出力停止指令が出力されていないと判定されると(ステップS205−No)、学習制御部135は、ステップS204で計測を開始してからの経過時間が、意図的破断を実行するまでの時間として設定した時間に達したか否かを判定する(ステップS206)、経過時間が設定時間に達していないと判定されると(ステップS206−No)、学習制御部135は、図2のフローチャートにおけるステップS131以降の処理を実行する。
一方、経過時間が設定時間に達したと判定されると(ステップS206−Yes)、学習制御部135は、計測していた経過時間をリセットする(ステップS207)。そして学習制御部135は、光ファイバ破断装置28に対して光ファイバ破断指令を出力する(ステップS208)。そして光ファイバ3の破断が実行される。光ファイバ3が破断したことによって、制御回路25は、出力光検出器23によるレーザ出力光の光量の検出結果または戻り光検出器24による戻り光の光量の検出結果等から異常発生を検知して、出力停止指令を出力する。また、光ファイバ破断装置28あるいは学習制御部135が破断発生信号を出力する(ステップS209)。その後、学習制御部135は、メモリ12から、制御回路25が出力停止指令を出力した停止指令時点よりも第1所定時間遡った時点から停止指令時点の第2所定時間経過後の時点間の所定期間内の状態データ及び環境データの少なくとも何れかを入力データとして読み込む(ステップS210)。また、光ファイバ3の損傷部分、すなわち光ファイバ3の破断部は、光ファイバ3からその破断部近傍を除去した後に再融着することで修理される(ステップS211)。光ファイバ3が破断したことによって、レーザ装置2は、制御回路25が光出力指令を再出力してはいけない状態になっていることは明らかなので、ラベル取得部132は、破断発生信号を光出力不可ラベルとして取得する(ステップS212)。その後、学習制御部135は、図2のフローチャートにおけるステップS115以降の処理を実行する。
以上に説明してきたように、図7のフローチャートで示した学習過程は、レーザ発振器と、レーザ発振器から出射されたレーザ出力光が伝播する光ファイバを含むレーザ光学系とを有するレーザ装置において、異常の発生が検知され、レーザ光出力が停止されたときを含む所定期間の状態データ及び環境データの少なくとも何れかを入力として、光出力指令を再度出力してもよいか否かを判定する判定器の一例である学習モデルの学習方法の一例を示している。
光出力指令の再出力の判定精度が良好となるように学習モデルを適切に学習するためには、光出力不可ラベルと対応する入力データとのペアとなる教師データも多数必要となるが、光出力不可ラベルの取得には、光ファイバ等が損傷を受けた状態を実現させる必要がある。しかし、レーザ装置は一般に高価であり、容易に修復できない箇所が損傷を受けると、高額な修理費がかかるので、光出力不可ラベルと対応する入力データとのペアとなる教師データの入手コストが非常に高くなるという問題がある。また、多数の教師データを入手するには非常に時間も要する。そこで、本実施形態のように、光ファイバの再融着でレーザ装置を機能的に修復可能な位置(あるいは区間)で、光ファイバを意図的に破断することによって、学習モデルの適切な学習に不可欠な光出力不可ラベルと対応する入力データとのペアとなる教師データを比較的低コストで取得することが可能になる。また本実施形態によれば、意図的に光ファイバを破断するので、多くの教師データを比較的短時間で取得できるため、学習の進捗速度を上げることも可能になる。
また、本実施形態の変形例によれば、光出力不可ラベルには、レーザ装置の制御回路からの光出力指令の再出力を不可とする理由である損傷部位と損傷状態に関する情報(以下、損傷情報と呼ぶことがある)も含まれてもよい。この場合、学習部134は、入力データに対して、光出力指令の再出力の可否だけでなく、光出力指令の再出力を不可とする判定結果を出力する際に、推定される損傷部位と推定される損傷状態を表す情報(以下、推定損傷情報と呼ぶことがある)も出力するように、学習モデルを学習してもよい。この場合も、学習部134は、損傷情報を含む光出力不可ラベルと対応する入力データとのペアとなる教師データを用いて、誤差逆伝搬法といった所定の学習手法を学習モデルの学習に適用することで、推定損傷情報を出力するように学習モデルを学習できる。なお、この場合には、損傷部位を変更できるように、光ファイバ破断装置28が破断する光ファイバ3の位置を変更可能なように光ファイバ破断装置28が設置されることが好ましい。
具体的には、図7のフローチャートにおいて、ステップS212で取得される光出力不可ラベルには、光出力不可という情報とともに損傷情報、すなわち、意図的に破断した光ファイバ3の位置(すなわち、損傷部位)の情報及びステップS211の損傷部修理時に明らかになった損傷状態も含まれるようにすればよい。同様に、図2のフローチャートにおけるステップS114で取得される光出力不可ラベルにも、光出力不可という情報とともに損傷情報、すなわち、ステップS113またはステップS125の損傷部修理時に明らかになった損傷部位及び損傷状態も含まれるようにすればよい。損傷情報は、例えば、入力装置26を介して入力されればよい。その際、損傷部位は、例えば、光ファイバ3全体が複数の区間に区分され、区間ごとにラベルが割り当てられ、損傷部位が含まれる区間のラベルにより表される。また、損傷状態は、例えば、損傷の程度に応じた複数のランクの何れかとして表されればよい。これにより、学習モデルの学習が進むと、制御回路25が出力停止指令を出力し、新たな入力データが取得された時に、学習モデルは、光出力指令の再出力の可否だけでなく、制御回路25が光出力指令を再出力することを不可とする判定結果を出力する場合には、その判定理由である推定損傷情報も出力できるようになる。
学習モデルが、制御回路25が光出力指令を再出力することを不可とする判定結果を出力した場合は、損傷箇所を特定して、レーザ装置2または光ファイバ3の修復を試みる必要がある。そのため、この変形例のように、学習モデルが推定損傷情報を出力することでレーザ装置2または光ファイバ3の修復に要する時間が低減できる。入力データと光出力不可ラベルのペアとなる教師データのうち、光ファイバ3を再融着することによってレーザ装置2を機能的に修復可能な光ファイバ3の区間で意図的に光ファイバ3を破断することによって発現させたペアの教師データについては、光出力指令の再出力を不可とする理由である損傷情報を光出力不可ラベルに含めることは特に容易である。
なお、第1実施形態においても、ステップS114で取得する光出力不可ラベルには、ステップS113またはステップS125の損傷部修理時に明らかになった損傷部位及び損傷状態も含まれるようにしてもよい。これにより、学習モデルの学習が進むと、学習モデルは、制御回路25が出力停止指令を出力し、新たな入力データが取得された時に、光出力指令の再出力の可否だけでなく、制御回路25が光出力指令を再出力することを不可とする判定結果を出力する場合には、その判定結果の理由となる損傷部位と損傷状態を表す推定損傷情報も出力することができるようになり、本実施形態の場合と同様に、修復までに要する時間が低減できるという効果がある。なお、推定損傷情報には、損傷部位と損傷状態のうちの何れか一方のみが含まれていてもよい。
次に、第3実施形態によるレーザ制御装置について説明する。第3実施形態によるレーザ制御装置は、レーザ装置の制御回路が何らかの異常を検知してレーザ光出力を停止する度に、そのときのレーザ装置の状態データ及び環境データを用いて判定器を所定の強化学習手法に従って逐次更新することで、制御回路からの光出力指令の再出力の可否の判定精度をより向上する。
なお、第3実施形態によるレーザ制御装置は、第1実施形態によるレーザ制御装置と比較して、プロセッサにより実行される処理、特に、判定器の学習に関する処理において相異する。そこで以下では、レーザ制御装置のプロセッサにより実行される処理について説明する。レーザ制御装置による制御対象となるレーザ装置、及び、レーザ制御装置のプロセッサ以外の各構成要素の詳細については、第1の実施形態における対応する構成要素の説明を参照されたい。
図8は、本発明の第3実施形態のレーザ制御装置のプロセッサの機能ブロック図である。本実施形態のレーザ制御装置1のプロセッサ13は、状態観測部231と、意志決定部232と、判定データ取得部233と、学習部234と、学習制御部237とを有する。さらに、学習部234は、報酬計算部235と、価値関数更新部236とを有する。プロセッサ13が有するこれらの各部は、例えば、プロセッサ13上で実行されるコンピュータプログラムにより実現される機能モジュールである。あるいは、これらの各部は、プロセッサ13の一部に実装される専用の演算回路として実装されてもよい。また、第1実施形態と同様に、プロセッサ13は、一つのプロセッサで構成される必要はなく、特に計算負荷の大きい学習部234等の処理を実行するための別の専用プロセッサが設けられてもよい。
状態観測部231は、第1実施形態における状態観測部131と同様に、判定器への入力データとして用いられる、レーザ装置2の状態データ及び環境データを観測する。状態観測部231は、通信インターフェース11を介して状態データ及び環境データを継続的に取得して、メモリ12に記憶する。なお、状態データ及び環境データも、上記の実施形態における状態データ及び環境データと同様のデータとすることができる。また、状態データ及び環境データに含まれる各データのうち、光出力指令の再出力の可否の判定に利用される1以上の入力データも、上記の実施形態における入力データと同様のデータとすることができる。
意志決定部232は、判定部の他の一例であり、1以上の入力データに対する重み付けを行う価値関数に基づいて行動データを決定して、決定した行動データをレーザ装置2の制御回路25へ通信インターフェース11を介して出力する。価値関数は、判定器の他の一例である。行動データは、出力光検出器23によるレーザ出力光の光量の測定結果及び戻り光検出器24による戻り光の光量の測定結果に基づいて制御回路25が異常発生を検知して、制御回路25がレーザ発振器21へ出力停止指令を出力したときに、制御回路25が光出力指令を再出力することを可とするか不可とするかの何れかを表す。本実施形態では、意志決定部232は、制御回路25が出力停止指令を出力した出力停止時点から第1所定時間遡った時点とその出力停止時点から第2所定時間経過後の時点間の所定期間内の状態データ及び環境データの少なくとも何れか(すなわち、入力データ)に対して、価値関数をもとに、制御回路25が光出力指令を再出力することを可とするか不可とするかの何れかの行動データを決定して、決定した行動データを制御回路25へ出力する。なお、第1所定時間及び第2所定時間は、第1実施形態における第1所定時間及び第2所定時間と同じとすることができる。
判定データ取得部233は、意志決定部232から出力された行動データに従って制御回路25が光出力指令の再出力に関する行動を行ったときに、その行動データが正解であったか不正解であったかを判定するための判定データを取得する。
学習部234は、Q学習といった所定の強化学習手法に従って価値関数を学習する。そのために、学習部234は、報酬計算部235と、価値関数更新部236とを有する。
報酬計算部235は、所定の強化学習手法に従って判定データから報酬値(例えば、Q値)を計算する。そのために、報酬計算部235は、判定データに基づいて、行動データが正解であったか否かを判定し、行動データが正解であった場合に、報酬値がプラスとなるように報酬値を計算する。一方、報酬計算部235は、行動データが不正解であった場合に、報酬値がマイナスとなるように報酬値を計算する。例えば、報酬計算部235は、少なくとも、意志決定部232が、光出力指令の再出力を可とする行動データを出力し、意志決定部232からの出力に従って、レーザ装置2の制御回路25が光出力指令をレーザ発振器21へ再出力した結果、レーザ装置2における損傷が拡大しなかった場合は、行動データは正解であるので、報酬値がプラスとなるように報酬値を計算する。一方、光出力指令の再出力を可とする行動データに対して、レーザ装置2における損傷、すなわち、レーザ発振器21、レーザ光学系22または光ファイバ3における損傷が拡大した場合は、行動データは不正解であるので、報酬計算部235は、報酬値がマイナスとなるように報酬値を計算する。
価値関数更新部236は、報酬計算部235により求められた報酬値に応じて、所定の強化学習手法に従って価値関数を逐次更新することによって、判定データをもとに、入力データに対する最適な行動データが得られるように価値関数を試行錯誤的に学習する。なお、価値関数の初期値として、第1実施形態または第2実施形態における学習モデルといった、教師あり学習の学習結果が利用されてもよい。
意志決定部232から出力された、制御回路25からの光出力指令の再出力の可否を表す行動データが正解であったか不正解であったかを判定するために用いられる判定データの取得には人間が介在しないことが好ましい。しかし、人間がレーザ装置2を分解して調査した結果、光出力指令を再出力することが不可である損傷が見つかった場合等は、人間が入力装置26を介して判定データを入力してもよい。そして判定データ取得部233は、入力装置26から入力された判定データを、例えば、制御回路25及び通信インターフェース11を介して取得すればよい。
学習制御部237は、上記の各実施形態と同様に、学習過程を制御する。そのために、学習制御部237は、状態観測部231による状態データ等の取得及び判定データ取得部233による判定データの取得等のために、通信インターフェース11を介したレーザ装置2の制御回路25との通信を制御する。また学習制御部237は、プロセッサ13内の各部間の各種データの受け渡し、及び、メモリ12からの各種データの読み込み、及び、メモリ12への各種データの書き込みを制御する。例えば、学習制御部237は、制御回路25から異常の発生を検知したことが通知されると、メモリ12(例えば、リングバッファ)から、上記の所定期間の状態データ等を読み出して、意志決定部232へわたす。
図9は、本実施形態のレーザ制御装置1による、価値関数の学習過程の一例を示すフローチャートである。
レーザ制御装置1が動作を開始すると、ます最初に、学習制御部135は、本実施形態による価値関数の学習過程においては必須な処理ではないが、実行モードを自動実行モードあるいは非自動実行モードの何れかに設定する(ステップS301)。自動実行モードは、レーザ装置2の制御回路25が異常発生を検知して出力停止指令を出力し、レーザ光出力が停止した時に、レーザ制御装置1が、学習結果である価値関数に従って制御回路25が光出力指令を再出力することを可とする行動データを出力した場合は、自動的に制御回路25が光出力指令を再出力することを許可する実行モードである。一方、非自動実行モードは、レーザ制御装置1が上記のように制御回路25が光出力指令を再出力することを可とする行動データを出力した場合にも、自動的に制御回路25が光出力指令を再出力することを許可しない実行モードである。このステップを設ける意味は、価値関数の学習レベルが目標レベルに達するほど高度化するまでは、レーザ制御装置1が価値関数に従って制御回路25が光出力指令を再出力することを可とする行動データを出力した場合も、念のため、人間が光出力指令を再出力してもよいと判断できる状態か否かを確認する処理の挿入を可能とするためである。これにより、価値関数の学習レベルが未だ高くなく、自動実行モードが設定されると、光ファイバ3、レーザ光学系22またはレーザ発振器21が重大な損傷を受ける確率が高い場合に、光ファイバ3、レーザ光学系22またはレーザ発振器21にそのような損傷が生じることが抑制される。
次に、学習制御部237が、制御回路25が光出力指令の出力を要求されているか否かを判定する(ステップS302)。光出力指令の出力を要求されていれば(ステップS302−Yes)、学習制御部237は、制御回路25に対して、通信インターフェース11を介して光出力指令に従ってレーザ光を出力することを許可する制御信号を出力する。そして制御回路25がレーザ発振器21に対して光出力指令を出力することで、レーザ発振器21からレーザ光が出力される(ステップS303)。
状態観測部231は、レーザ出力光の光量の測定値及び戻り光の光量の測定値を含む、レーザ装置2の状態データ及び環境データを制御回路25から常時取得する。また状態観測部231は、制御回路25による、異常発生の検知及び出力停止指令が出力されたか否かも常時観測し、異常発生が検知されたときには、異常発生の検知を表す信号を制御回路25から通信インターフェース11を介して取得する(ステップS304)。
学習制御部237が、状態観測部231を経由して、制御回路25が異常発生を検知したか否か、すなわち、出力停止指令が出力されたか否かを判定する(ステップS305)。出力停止指令が出力された場合(ステップS305−Yes)、学習制御部237は、メモリ12(例えば、リングバッファ)から、制御回路25が出力停止指令を出力した停止指令時点を含む上記の所定期間内の状態データ及び環境データの少なくとも何れかを入力データとして読み込む(ステップS306)。
意志決定部232は、読み込んだ入力データを価値関数に入力することで、行動データを決定する(ステップS307)。上記のように、この学習過程における行動データは、制御回路25からレーザ発振器21へ出力停止指令が出力され、レーザ光出力が停止している状態において、制御回路25が光出力指令を再出力することを可とする行動を表すデータ(再光出力可データ)、あるいは不可とする行動を表すデータ(再光出力不可データ)である。
次に、学習制御部237は、意志決定部232から出力された行動データが、再光出力可データであるか、あるいは、再光出力不可データであるかを判定する(ステップS308)。行動データが再光出力可データであると判定された場合(ステップS308−Yes)、学習制御部237は、実行モードが自動実行モードと非自動実行モードの何れに設定されているかを判定する(ステップS309)。実行モードが自動実行モードに設定されていると(ステップS309−Yes)、学習制御部237は、通信インターフェース11を介して制御回路25に光出力指令をレーザ発振器21へ再度出力するように指令して、レーザ光が再び出力される(ステップS310)。
一方、価値関数の学習レベルが不充分である場合のように、実行モードが非自動実行モードに設定されていると(ステップS309−No)、制御回路25から出力停止指令が出力されたため、表示装置27にレーザ装置2が停止状態であることが表示される(ステップS311)。なお、人間(担当者)が、レーザ装置2が停止状態であることに早く気付くように、制御回路25は、ブザー(図示せず)等を同時に鳴らしてもよい。この場合、レーザ装置2が停止状態となってから、人間(担当者)が、レーザ装置2または光ファイバ3の損傷が疑われる部分から分解調査して損傷部の有無またはレーザ装置2または光ファイバ3の状態を確認する。そして、その調査結果が入力装置26を介して入力される(ステップS312)。調査結果には、レーザ光の再出力が可であるか不可であるかという結論も含まれる。そこで学習制御部237は、入力された調査結果において、レーザ光の再出力が可であるか否かを判定する(ステップS313)、レーザ光の再出力が可である場合(ステップS313−Yes)、学習制御部237は、ステップS310以降の処理を実行する。これにより、レーザ光が再出力される。
ステップS310におけるレーザ光の再光出力の結果として、学習制御部237が、状態観測部231を経由して、制御回路25から出力停止指令が再度出力されたか否かを判定する(ステップS314)。制御回路25から出力停止指令が再度出力されたと判定された場合(ステップS314−Yes)、レーザ装置2または光ファイバ3に損傷部分があり、修理が必要な状態であることが考えられるので、学習制御部237は、制御回路25に対して、通信インターフェース11を介して、表示装置27等に要修理状態であることを表示するように指令する(ステップS315)。そして例えば、レーザ装置2または光ファイバ3の損傷部の修理が人間により行われる(ステップS316)。そして入力装置26を介して修理結果が入力される(ステップS317)。
なお、ステップS313にて、レーザ光の再出力が不可である場合(ステップS313−No)、ステップS316以降の処理が実行されればよい。
また、ステップS308にて、意志決定部232から出力された行動データが再光出力不可データであると判定された場合も(ステップS308−No)、学習制御部237は、ステップS311以降の処理を実行すればよい。
ステップS317にて修理結果が入力された後、判定データ取得部233は、意志決定部232から出力された行動データと、入力装置26から入力された修理結果を判定データとして取得する(ステップS318)。そして報酬計算部235は、意志決定部232から出力された行動データが、再光出力可データであったか、あるいは、再光出力不可データであったかを判定する(ステップS319)。ステップS307において意志決定部232から出力された行動データが再光出力可データであったと判定された場合(ステップS319−Yes)、行動データが再光出力可データでありながら、実際は、レーザ装置2または光ファイバ3が再光出力不可の状態で修理する必要があったので、意志決定部232から出力された行動データは不正解ということになる。そのため、報酬計算部235は、報酬値がマイナスとなるように報酬値を計算する(ステップS320)。一方、ステップS307において意志決定部232から出力された行動データが再光出力不可データであったと判定された場合(ステップS319−No)、行動データが再光出力不可データであり、実際にレーザ装置2または光ファイバ3が再光出力不可の状態で修理する必要があったので、意志決定部232から出力された行動データは正解ということになる。そのため、報酬計算部235は、報酬値がプラスとなるように報酬値を計算する(ステップS321)。
また、ステップS314で、制御回路25から一定時間経過しても出力停止指令が再度出力されていないと判定された場合(ステップS314−No)、レーザ装置2または光ファイバ3は、問題となるような損傷を受けていないと推定される。そのため、レーザ光を再度出力することが可能であったことになる。そこで、判定データ取得部233は、意志決定部232から出力された行動データと、制御回路25が光出力指令をレーザ発振器21へ再出力しても問題が発生せず、レーザ光の再出力が可であったという事実とを判定データとして取得する(ステップS322)。そして報酬計算部235は、意志決定部232から出力された行動データが、再光出力可データであったか、あるいは、再光出力不可データであったかを判定する(ステップS323)。ステップS307において意志決定部232から出力された行動データが再光出力可データであったと判定された場合(ステップS323−Yes)、行動データが再光出力可データであり、事実、レーザ光の再出力が可であったので、意志決定部232から出力された行動データは正解ということになる。そのため、報酬計算部235は、報酬値がプラスとなるように報酬値を計算する(ステップS324)。
一方、意志決定部232から出力された行動データが再光出力不可データであったと判定された場合(ステップS323−No)、行動データが再光出力不可データでありながら、実際には、レーザ光の再出力が可であったので、意志決定部232から出力された行動データは不正解ということになる。そのため、報酬計算部235は、報酬値がマイナスとなるように報酬値を計算する(ステップS325)。
ステップS321、S322、S324またはS325の後、価値関数更新部236は、算出された報酬値に基づいて価値関数を更新する(ステップS326)。その際、価値関数更新部236は、上記のように、Q学習といった所定の強化学習手法に従って価値関数を更新すればよい。
その後、学習制御部237は、報酬値の移動平均が目標値より大きくなったか否か判定する(ステップS327)。報酬値の移動平均は、例えば、最近の1,000回の報酬値の移動平均値等である。報酬値の移動平均値が目標値より大きくなれば(ステップS327−Yes)、価値関数の学習レベルが目標レベルに達したと考えられる。そこで、学習制御部237は、前述の実行モードが自動実行モードに設定されていない場合は、実行モードを自動実行モードに設定する(ステップS328)。また、学習制御部237は、通信インターフェース11を介して、表示装置27に学習レベルが目標レベルに達したことを表示させるようにしてもよい。また、学習レベルが目標レベルに達したので、学習制御部237が、内部データとして、動作終了指令を出力してもよい。動作終了指令は、入力装置26から入力され、制御回路25及び通信インターフェース11介して取得されてもよい。
その後、学習制御部237は、レーザ装置2に対して動作終了指令が出ているか否かを判定する(ステップS329)。動作終了指令が出ている場合(ステップS329−Yes)、レーザ制御装置1は動作を終了する。
一方、動作終了指令が出ていない場合(ステップS329−No)、学習制御部237は、ステップS302以降の処理を繰り返す。
また、ステップS327にて、報酬値の移動平均が目標値より小さいと判定された場合(ステップS327−No)、ステップS302にて光出力指令の出力が要求されていない場合(ステップS302−No)、あるいは、ステップS305にて、制御回路25から出力停止指令が出力されていないと判定された場合(ステップS305−No)も、学習制御部237は、ステップS329の処理を実行すればよい。なお、ステップS302で、レーザ装置2に光出力指令が出ておらず、かつ、ステップS329にて、動作終了指令がでていない場合は、学習制御部237は、光出力指令か動作終了指令の何れかが出るまで待機することになる。
以上に説明してきたように、本実施形態では、レーザ制御装置は、動作終了指令が発令されるまで、ステップS302からステップS329の処理を繰り返し実行することによって、価値関数の更新を続けて、価値関数の強化学習を進めることができる。また、このレーザ制御装置は、第1実施形態または第2実施形態のレーザ制御装置における教師あり学習の学習結果として得られる学習モデルを価値関数の初期値として設定して、価値関数の強化学習を継続することによって、入力データに対して、制御回路が光出力指令を再出力することの可否に関して、より確実に正しい判定結果(行動データ)を出力できるようになる。
なお、価値関数の学習レベルが目標レベルに達すると、学習制御部237は、それ以上に価値関数の学習を続ける必要がない。この場合は、レーザ装置2の制御回路25から出力停止指令が出力されると、意志決定部232が、出力停止指令の出力時点を含む所定期間において状態観測部231により観測された状態データ及び環境データ中の入力データを価値関数に入力することで得られる行動データを出力するだけでよい。そのため、判定データ取得部233及び学習部234の処理は省略されてよい。また、判定データも不要になる。
変形例によれば、光出力指令の再出力を不可とする行動データには、その理由となる、推定される損傷部位と損傷状態を表す推定損傷情報が含まれてもよい。この場合、光出力指令の再出力を不可とする行動データに対する判定データには、その行動データに含まれる推定損傷情報で表される損傷部位と損傷状態とが正解か否かの判定結果を表す情報も含まれてもよい。そして報酬計算部235は、光出力指令の再出力を不可とする行動データが出力された場合には、判定データに基づいて、推定損傷情報で表される損傷部位と損傷状態が正解であった場合、追加の報酬値がプラスとなるように追加の報酬値を計算し、一方、推定損傷情報で表される損傷部位と損傷状態が不正解であった場合、追加の報酬値がマイナスとなるように追加の報酬値を計算してもよい。そして報酬計算部235は、推定損傷情報で表される損傷部位と損傷状態の正否に対する追加の報酬値と、光出力指令の再出力の可否の正否に対する報酬値とを合算して出力してもよい。価値関数更新部236は、合算した報酬値に応じて、価値関数を更新してもよい。
この場合、図9のフローチャートにおいて、ステップS307で、意志決定部232が、制御回路25からの光出力指令の再出力を不可する行動データを出力する場合は、推定損傷情報も行動データに含まれるようにする。また、ステップS317での修理結果入力では、修理の結果判明した損傷部位と損傷状態を表す損傷情報が入力される。なお、損傷部位は、第2実施形態のように、例えば、レーザ発振器21、レーザ光学系22及び光ファイバ3が複数の区間に区分され、区間ごとにラベルが割り当てられ、その複数の区分のうち、損傷部位が含まれる区間により表されればよい。また、損傷状態は、損傷の程度に応じた複数のランクの何れかとして表されればよい。
また、ステップS318では、意志決定部232が出力した行動データに含まれる推定損傷情報により表される損傷部位及び損傷状態と、修理結果として入力された損傷部位及び損傷状態との相違度合いも判定データとして取得される。そしてステップS321にて、報酬計算部235は、推定損傷情報で表される損傷部位と損傷状態の正否に対する追加の報酬値と、光出力指令の再出力の可否の正否に対する報酬値との合算値をプラスとしつつ、相違度合いが大きいほど、追加の報酬値が小さくなるように追加の報酬値を算出し、一方、相違度合いが小さいほど、追加の報酬値が大きくなるように追加の報酬値を算出すればよい。なお、この変形例においても、推定損傷情報には、損傷部位及び損傷状態の何れか一方のみが含まれてもよい。この場合、報酬計算部235は、損傷部位及び損傷状態のうちの推定損傷情報に含まれる方に基づいて、上記のように追加の報酬値を計算すればよい。
この変形例によれば、意志決定部232が、制御回路25が光出力指令を再出力することを不可とする行動データを出力した場合に、損傷部位と損傷状態の推定結果も出力されるので、レーザ制御装置は、レーザ装置2を修復するまでに要する時間を低減できる。
また他の変形例によれば、意志決定部232は、状態観測部231により観測された状態データ及び環境データのうちの直近の所定期間の入力データを価値関数に入力することで光出力指令の再出力を不可とする行動データが得られる場合、レーザ装置2の制御回路25に対して、通信インターフェース11を介して、光出力停止指令を直ちに出力させることを指示する、緊急停止機能をさらに有してもよい。この緊急停止機能は、有効または無効の切り替えが可能であってもよい。なお、この所定期間の長さは、停止指令時点よりも第1所定時間遡った時点から停止指令時点の第2所定時間経過後の時点までの長さと同じとすることができる。
図10は、緊急停止機能が含まれる場合における、価値関数の学習過程の他の一例を示すフローチャートである。この変形例による学習過程では、図9に示されるフローチャートにおける、ステップS303の処理の後に、緊急停止機能の有効・無効の判定に関する処理、及び、緊急停止機能が有効な場合における、緊急停止処理が追加される。そこで、これらの処理以外の各ステップの処理については、図9のフローチャートを参照されたい。
ステップS303にて、レーザ発振器21からレーザ光が出力されると、学習制御部237は、緊急停止機能が有効となっているか否か判定する(ステップS330)。緊急停止機能が無効となっている場合(ステップS330−No)、学習制御部237は、ステップS304以降の処理を実行する。すなわち、図9に示されるフローチャートに従って価値関数の学習が進められる。一方、緊急停止機能が有効となっている場合(ステップS330−Yes)、状態観測部231は、レーザ出力光の光量の測定値及び戻り光の光量の測定値を含む、レーザ装置2の状態データ及び環境データを制御回路25から常時取得する(ステップS331)。そして意志決定部232は、状態観測部231により観測された状態データ及び環境データのうちの直近の所定期間の入力データを価値関数に入力することで、光出力指令の再出力を不可とする行動データが得られるか否か、すなわち、異常発生の前兆が有るか否か判定する(ステップS332)。光出力指令の再出力を不可とする行動データが得られない場合(ステップS332−No)、すなわち、異常発生の前兆が無い場合、学習制御部237は、ステップS305以降の処理を実行すればよい。一方、光出力指令の再出力を不可とする行動データが得られた場合(ステップS332−Yes)、すなわち、異常発生の前兆が有る場合、意志決定部232は、制御回路25に対して、通信インターフェース11を介して、光出力停止指令を直ちに出力することを指示する信号、すなわち、光出力緊急停止指令を出力する(ステップS333)。そして制御回路25がレーザ発振器21に対して光出力停止指令を出力して、レーザ光出力が停止される。その後、学習制御部237は、ステップS306以降の処理を実行すればよい。
価値関数の学習が進むと、価値関数を利用することで、制御回路25が異常の発生を検知して、光出力停止指令を出力するよりも前に、状態観測部231により観測される状態データ及び環境データに基づいて、このままレーザ光出力を続けると、光ファイバ3等に、光出力指令の再出力が不可なるような損傷が発生する可能性が高いことが認知される場合があり得る。そこで、上記の機能の追加によって、実際に異常の発生が検知される前に、レーザ制御装置1が、制御回路25に光出力停止指令を出力させて、レーザ光出力を停止することによって、光出力指令の再出力が不可なるような損傷の発生を防止できる可能性が向上する。
なお、上記の緊急停止機能は、第1及び第2実施形態またはその変形例によるレーザ制御装置にも適用可能である。この場合には、判定部が学習モデルに直近の所定期間の入力データを入力することで、光出力指令の再出力を不可とする判定結果が得られる場合に、制御回路25に対して、通信インターフェース11を介して、光出力緊急停止指令を出力すればよい。
緊急停止機能の有効と無効を切り換えられるようにしている理由は、価値関数の学習レベルが未だ余り高くない段階では、緊急停止機能を無効とすることで、学習の進行の妨げにならないようにするためである。例えば、緊急停止機能を第2実施形態の機械学習装置に適用した場合、緊急停止機能を無効とすることで、光ファイバ3を所定の位置で意図的に破断させて入力データと光出力不可ラベルのペアサンプルを作成しようとしている時に、このようなペアサンプルの作成が妨げられるといった、学習の妨げを防止できる。
次に、第4実施形態について説明する。第4実施形態によるレーザ制御装置は、ローカルエリアネットワークを介して複数のレーザ装置と接続され、その複数のレーザ装置のそれぞれから得られる状態データ及び環境データに基づいて判定器を学習する。さらに、このレーザ制御装置は、広域ネットワークを介して接続される他のレーザ制御装置との間で、学習された判定器を共有可能とする。
図11は、本発明の第4実施形態によるレーザ制御装置を含む、レーザ制御システムの概略構成図である。本実施形態によるレーザ制御システム100は、複数のレーザ加工セル101を有する。複数のレーザ加工セル101は、広域ネットワーク102を介して互いに通信可能に接続される。
複数のレーザ加工セル101のそれぞれは、レーザ制御装置1と、複数のレーザ装置2とを含む。なお、各レーザ加工セル101において、レーザ制御装置1は、第1実施形態または第2実施形態によるレーザ制御装置、または、第3実施形態によるレーザ制御装置の何れであってもよい。そして各レーザ加工セル101において、レーザ制御装置1と、複数のレーザ装置2とは、ローカルネットワーク103を介して互いに通信可能に接続される。例えば、レーザ制御装置1の通信インターフェース11(図1などを参照)は、ローカルネットワーク103と接続するための通信回路を有していればよい。ここで、ローカルネットワーク103は、例えば、ルータあるいはスイッチングハブといった、ネットワークを介して受信した信号の伝送先に応じてその信号の出力先を決定する機能を有する一つの中継装置の下に接続されるネットワークとすることができる。一方、広域ネットワーク102は、例えば、個々のローカルネットワーク103同士を接続するネットワークとすることができる。
各レーザ加工セル101において、レーザ制御装置1は、ローカルネットワーク103を介して複数のレーザ装置2の何れかから取得した、そのレーザ装置2の状態データ、環境データ及び異常発生の検知を表す信号などに基づいて判定器(第1、第2実施形態における学習モデル、第3実施形態における価値関数など)を学習する。さらに、レーザ制御装置1は、ローカルネットワーク103を介して、複数のレーザ装置2のそれぞれに対して、光出力指令の再出力の可否を表す信号などを出力することで、複数のレーザ装置2のそれぞれを制御する。
また、各レーザ加工セル101のレーザ制御装置1は、広域ネットワーク102を介して、学習された判定器あるいは学習中の判定器を共有してもよい。学習中の判定器が共有される場合には、学習に用いられた教師データの数、判定器の更新回数、あるいは、直近の報酬値の移動平均値も、広域ネットワーク102を介して共有されてもよい。この場合、複数のレーザ加工セル101のうちの何れかのレーザ制御装置1は、自装置が有する判定器の学習の進捗状況と、複数のレーザ加工セル101のうちの他のレーザ加工セルの判定器の学習の進捗状況とを比較して、学習が進んでいる方の判定器を、それ以降の学習対象の判定器としてもよい。この場合には、レーザ制御装置1のプロセッサ13の学習制御部は、学習に用いられた教師データの数が多いほど、判定器の更新回数が多いほど、あるいは、直近の報酬値の移動平均値が大きいほど、判定器の学習が進捗していると判定すればよい。
レーザ制御装置1の状態観測部は、レーザ装置2の制御回路25が出力停止指令を出力した停止指令時点から第1所定時間遡った時点と、停止指令時点から第2所定時間経過後の時点との間の10msオーダーの所定期間の状態データ及び環境データを観測する必要があり、その結果として、状態データ及び環境データの伝送にはリアルタイム性が要求される。そこで、本実施形態では、各レーザ加工セルにおいて、レーザ制御装置とそのレーザ制御装置の制御対象となる複数(例えば、数台〜100台)のレーザ装置とを、上記のようなローカルネットワークで接続することで要求されるリアルタイム性を満たすことができる。一方、リアルタイム性が要求されない、判定器の共有については、広域ネットワークを介して、複数のレーザ制御装置間で判定器及び学習の進捗状況を表す情報を共有することで、このレーザ制御システムは、各レーザ制御装置における、判定器の学習の進行を加速することができる。さらに、このレーザ制御システムは、何れかのレーザ加工セルのレーザ制御装置にて学習が終了した判定器を、広域ネットワークを介して、他のレーザ加工セルのレーザ制御装置も利用可能とすることができる。
次に、第5実施形態について説明する。第5実施形態では、レーザ装置の制御回路は、一旦異常発生を検知して、レーザ光出力を停止すると、レーザ光出力を再開させる指示を受信しても光出力指令をレーザ発振器へ出力しない停止状態となる。そして停止状態を解除するための停止状態解除入力部が入力装置とは別個に設けられる。
図12は、本実施形態によるレーザ装置の概略構成図である。図12に示されるレーザ装置20は、図1に示されるレーザ装置2と比較して、停止状態解除入力部29を有する点、及び制御回路25の動作の一部で相違する。そこで以下では、制御回路25、停止状態解除入力部29及びその関連部分について説明する。レーザ装置20のその他の構成要素及びレーザ制御装置1については、上記の各実施形態における対応する構成要素の説明を参照されたい。また、本実施形態によるレーザ制御装置1は、第1実施形態〜第3実施形態または変形例によるレーザ制御装置の何れであってもよい。
制御回路25は、上記の各実施形態と同様に、出力光検出器23によるレーザ出力光の光量の測定値及び戻り光検出器24による戻り光の光量の測定値に基づいて、レーザ発振器21、レーザ光学系22または光ファイバ3において発生した異常を検知すると、レーザ発振器21に対して出力停止指令を出力して、レーザ光の出力を停止する。さらに、制御回路25は、例えば、内部パラメータとして保持する停止状態フラグをオンにして、停止状態に移行する。停止状態では、制御回路25は、入力装置26からレーザ光出力を再開させる指示を受信し、あるいは、レーザ制御装置1から光出力指令の再出力の許可または光出力指令の再出力を可とする行動データを受信しても、光出力指令をレーザ発振器21へ出力しない。そして制御回路25は、停止状態解除入力部29から、停止状態の解除を指令する信号を受信すると、停止状態フラグをオフにして、停止状態を解除する。停止状態が解除されると、制御回路25は、入力装置26からレーザ光出力を再開させる指示を受信し、あるいは、レーザ制御装置1から光出力指令の再出力の許可または光出力指令の再出力を可とする行動データを受信すると、光出力指令をレーザ発振器21へ出力する。
停止状態解除入力部29は、例えば、ボタンスイッチであり、入力装置26とは別個に、例えば、入力装置26と異なる位置に設けられる。そして停止状態解除入力部29は、人間による操作に応じて、停止状態の解除を指令する信号を生成し、その信号を制御回路25へ出力する。これにより、レーザ装置20の停止状態が解除される。なお、入力部26及び停止状態解除入力部29は、レーザ制御装置1に設けられてもよい。
停止状態を設定することによって、レーザ光が出力されるべきでない場合、例えば、光ファイバ3等の損傷の拡大が見込まれる場合に、入力装置26を介して誤ってレーザ光の出力が指示されても、レーザ光出力による損傷の拡大を防止できる。また、通常の指令を入力するための入力装置26とは別個に停止状態解除入力部29を設けることで、誤って停止状態解除入力部29が操作されることが防止され、その結果として、停止状態を解除すべきでない場合に停止状態が解除されることが防止される。
なお、停止状態解除入力部29から停止状態の解除を指令する信号が入力されると、制御回路25は、表示装置27に、停止状態を解除する前に必要な確認を行ったか等、最終確認を促す内容を表すメッセージを表示させてもよい。また、制御回路25は、レーザ制御装置1から光出力指令を再出力することを不可とする判定結果あるいは行動データを、推定損傷情報とともに受信した場合には、表示装置27に、推定損傷情報で表される損傷部位と損傷状態を表示させてもよい。レーザ制御装置1が、光出力指令を再出力することを不可とする判定結果または行動データを出力した場合は、レーザ装置20を修理することが必要であると想定される。しかし、推定される損傷部位と損傷状態とが表示装置27に表示されると、損傷箇所の特定が容易となり、レーザ装置の修復までに要する時間を短縮できる。
変形例によれば、制御回路25が異常発生を検知したことによってレーザ装置20からのレーザ光出力が停止してから、レーザ制御装置1が、光出力指令の再出力を可とする判定結果あるいは行動データを出力した場合にも、制御回路25は、レーザ装置20の定格出力、あるいは最大出力を指定する光出力指令をレーザ発振器21に対して出力する前に、定格出力または最大出力よりも低い出力を指定する光出力指令をレーザ発振器21に対して出力してもよい。そして制御回路25は、その後に、レーザ光出力を定格出力あるいは最大出力まで徐々に上げるようにレーザ発振器21を制御してもよい。レーザ制御装置1が、光出力指令の再出力を可とする判定結果または行動データを出力した場合でも、光ファイバ3等に軽微な損傷が発生している可能性がある。しかし、この変形例によれば、光ファイバ3等に軽微な損傷が発生していても、制御回路25は、レーザ光出力の強度を徐々に上げることによって、レーザ光出力の再開によって、レーザ発振器21、レーザ光学系22または光ファイバ3等の損傷が一気に拡大することを防止できる。そのため、レーザ発振器21、レーザ光学系22または光ファイバ3等の損傷の拡大が最小限に抑制される。
図13は、本発明の第5実施形態によるレーザ装置が制御される場合の価値関数の学習過程の一例を示すフローチャートである。なお、図13のフローチャートでは、第3実施形態によるレーザ制御装置1がレーザ装置20を制御するものとしている。
レーザ装置20が動作を開始すると、学習制御部237が、制御回路25が光出力指令の出力を要求されているか否かを判定する(ステップS401)。光出力指令の出力を要求されていれば(ステップS401−Yes)、学習制御部237は、制御回路25に対して、通信インターフェース11を介して光出力指令に従ってレーザ光を出力することを許可する制御信号を出力する。そして制御回路25がレーザ発振器21に対して光出力指令を出力することで、レーザ発振器21からレーザ光が出力される(ステップS402)。
状態観測部231は、レーザ出力光の光量の測定値及び戻り光の光量の測定値を含む、レーザ装置2の状態データ及び環境データを制御回路25から常時取得するとともに、制御回路25による、異常発生の検知及び出力停止指令が出力されたか否かも常時観測し、異常発生が検知されたときには、異常発生の検知を表す信号を制御回路25から通信インターフェース11を介して取得する(ステップS403)。
学習制御部237が、状態観測部231を経由して、制御回路25が異常発生を検知したか否か、すなわち、出力停止指令が出力されたか否かを判定する(ステップS404)。出力停止指令が出力された場合(ステップS404−Yes)、学習制御部237は、メモリ12(例えば、リングバッファ)から、制御回路25が出力停止指令を出力した停止指令時点よりも第1所定時間遡った時点から停止指令時点の第2所定時間経過後の時点までの所定期間内の状態データ及び環境データの少なくとも何れかを入力データとして読み込む(ステップS405)。
意志決定部232は、読み込んだ入力データを価値関数に入力することで、行動データを決定する(ステップS406)。そして意志決定部232は、その行動データを、通信インターフェース11を介して制御回路25へ出力する。制御回路25は、受信した行動データが、再光出力可データであるか、あるいは、再光出力不可データであるかを判定する(ステップS407)。
行動データが再光出力可データであると判定された場合(ステップS407−Yes)、制御回路25は、光出力指令に含まれる出力設定値Pに、例えば、最大出力Pmaxの100分の1のような微小出力値ΔPを設定する(ステップS408)。そして制御回路25は、光出力指令をレーザ発振器21へ出力することでレーザ光が出力される(ステップS409)。レーザ制御装置1の状態観測部231は、ステップS403と同様に、レーザ装置2の状態データ及び環境データを制御回路25から常時取得するとともに、制御回路25による、異常発生の検知及び出力停止指令が出力されたか否かも常時観測し、異常発生が検知されたときには、異常発生の検知を表す信号を制御回路25から通信インターフェース11を介して取得する(ステップS410)。そして学習制御部237は、ステップS404と同様に、出力停止指令が出力されたか否かを判定する(ステップS411)。出力停止指令が出力された場合(ステップS411−Yes)、ステップS405と同様に、学習制御部237は、メモリ12から、停止指令時点を含む所定期間内の状態データ及び環境データの少なくとも何れかを入力データとして読み込む(ステップS412)。そして意志決定部232は、ステップS406と同様に、読み込んだ入力データを価値関数に入力することで、行動データを決定する(ステップS413)。そして意志決定部232は、その行動データを、通信インターフェース11を介して制御回路25へ出力する。制御回路25は、ステップS407と同様に、受信した行動データが、再光出力可データであるか、あるいは、再光出力不可データであるかを判定する(ステップS414)。受信した行動データが再光出力可データであると判定された場合(ステップS414−Yes)、制御回路25は、光出力指令に含まれる出力設定値Pが最大出力Pmaxより大きいか否か判定する(ステップS415)。出力設定値Pが最大出力Pmaxより小さいと判定された場合(ステップS415−No)、出力設定値Pに微小出力値ΔPを加えた値を新たな出力設定値Pとする(ステップS416)。そして制御回路25は、新たな出力設定値Pに従ってステップS409以降の処理を繰り返す。
なお、ステップS411にて、出力停止指令が出力されたと判定された場合、ステップS412及びステップS413の処理が行われ、ステップS414で、受信した行動データが再光出力可データであった場合、制御回路25は、念のため、ステップS415の処理の代わりに、ステップS408の処理を実行して、出力設定値を微小出力値ΔPに戻してもよい。
上記のように、制御回路25から出力停止指令が出力されても、意志決定部232から、制御回路25が光出力指令を再出力することを可とする行動データ(再光出力可データ)が出力され、ステップS409からステップS416までの処理が繰り返されることによって、出力設定値Pが次第に高い値となる。そしてステップS415にて、出力設定値Pが最大出力Pmaxに達したと判定されると(ステップS415−Yes)、判定データ取得部233は、実際に、最大出力Pmaxレベルのレーザ光を再出力できたという判定データを取得する(ステップS417)。
報酬計算部235は、意志決定部232から出力された行動データが、再光出力可データであったか、あるいは、再光出力不可データであったかを判定する(ステップS418)。上記の制御の流れにおいては、行動データは再光出力可データであり(ステップS418−Yes)、ステップS417で得られた判定データにより、行動データは正解であることが分かる。そこで、報酬計算部235は、報酬値がプラスとなるように報酬値を計算する(ステップS419)。そして価値関数更新部236は、算出された報酬値に基づいて価値関数を更新する(ステップS421)。
なお、ステップS411において、学習制御部237が、制御回路25から出力停止指令が出力されていないと判定した場合(ステップS411−No)、ステップS412〜S414の処理が行われずに、ステップS415以降の処理が実行される。
一方、ステップS407またはステップS414にて、受信した行動データが再光出力不可データであると判定された場合(ステップS407−NoまたはステップS414−No)、制御回路25は停止状態に移行する(ステップS422)。なお、制御回路25は、レーザ制御装置1へ、停止状態に移行したことを通知してもよい。そして制御回路25は、レーザ装置20が停止状態であり、調査が必要であることを表すメッセージを表示装置27に表示させる(ステップS423)。レーザ装置20が停止状態であることを受けて、人間(担当者)が、レーザ装置20の損傷が疑われる部分から分解調査して損傷部の有無及び損傷状態を調査し、その調査結果が入力装置26を介して入力される(ステップS424)。調査結果には、レーザ光の再出力が可であるか不可であるかという結論も含まれる。そこで学習制御部237は、入力された調査結果において、レーザ光の再出力が可であるか否かを判定する(ステップS425)、レーザ光の再出力が可である場合(ステップS425−Yes)、学習制御部237は、その旨を制御回路25へ通知する。制御回路25は、停止状態フラグを参照して、停止状態が解除されているか否かを判定する(ステップS426)、停止状態が解除されていれば(ステップS426−Yes)、制御回路25及びレーザ制御装置1は、ステップS408以降の処理を実行する。
一方、停止状態が解除されていない場合(ステップS426−No)、制御回路25は、レーザ装置20が停止状態にあり、レーザ光出力を再開するには停止状態を解除する必要があることを表すメッセージを表示装置27に表示させる(ステップS427)。そして停止状態解除入力部29から停止状態を解除する指令が入力されると、制御回路25は、停止状態を解除する(ステップS428)。
その後、ステップS426にて停止状態が解除されていると判定され、ステップS408以降の処理が実行される。この制御の流れにおいても、ステップS417において、最大出力Pmaxのレーザ光を再出力できたという判定データが取得される。しかし、ステップS418において、意志決定部232からから出力された行動データが再光出力不可データであると判定される(ステップS418−No)。そのため、この行動データは、判定データから不正解であることが分かる。そこで、報酬計算部235は、報酬値がマイナスとなるように報酬値を計算する(ステップS420)。そして価値関数更新部236は、算出された報酬値に従って価値関数を更新する(ステップS421)。
また、ステップS425にて、調査の結果、レーザ光の再出力が不可であると判定された場合(ステップS425−No)、担当者によって、レーザ装置20または光ファイバ3の損傷部の修理が行われる(ステップS429)。そして入力装置26を介して修理結果が入力される(ステップS430)。さらに、修理が完了したので、停止状態解除入力部29を介して停止状態を解除する指令が入力される(ステップS431)。続いて、判定データ取得部233は、意志決定部232から出力された行動データと、入力装置26から入力された修理結果を判定データとして取得する(ステップS432)。そして報酬計算部235は、意志決定部232から出力された行動データが、再光出力可データであったか、あるいは、再光出力不可データであったかを判定する(ステップS433)。
ステップS407において意志決定部232から出力された行動データが再光出力可データであったと判定された場合(ステップS433−Yes)、行動データが再光出力可データでありながら、実際は、レーザ装置20または光ファイバ3が再光出力不可の状態で修理する必要があったので、意志決定部232から出力された行動データは不正解ということになる。そのため、報酬計算部235は、報酬値がマイナスとなるように報酬値を計算する(ステップS434)。
一方、ステップS407において意志決定部232から出力された行動データが再光出力不可データであったと判定された場合(ステップS433−No)、行動データが再光出力不可データであり、実際にレーザ装置20または光ファイバ3が再光出力不可の状態で修理する必要があったので、意志決定部232から出力された行動データは正解ということになる。そのため、報酬計算部235は、報酬値がプラスとなるように報酬値を計算する(ステップS435)。ステップS434またはS435の後、価値関数更新部236は、算出された報酬値に従って価値関数を更新する(ステップS421)。
ステップS421に続いて、学習制御部237は、報酬値の移動平均が目標値より大きくなったか否か判定する(ステップS436)。報酬の移動平均値が目標値より大きくなれば(ステップS436−Yes)、価値関数の学習レベルが目標レベルに達したと考えられる。そして学習制御部237は、通信インターフェース11を介して、表示装置27に学習レベルが目標レベルに達したことを表示させる(ステップS437)。それ以降は、判定データの取得及び報酬計算のステップは省略されてもよい。
その後、学習制御部237は、レーザ装置20に対して動作終了指令が出ているか否かを判定する(ステップS438)。また、ステップS401にて、光出力指令の出力が要求されていない場合も(ステップS401−No)、学習制御部237は、ステップS438の処理を実行すればよい。動作終了指令が出ている場合(ステップS438−Yes)、レーザ制御装置1は動作を終了する。
一方、動作終了指令が出ていない場合(ステップS438−No)、レーザ制御装置1及び制御回路25は、ステップS401以降の処理を繰り返す。なお、ステップS401で、レーザ装置20に光出力指令が出ておらず、かつ、ステップS438にて、動作終了指令がでていない場合は、レーザ制御装置1及び制御回路25は、光出力指令か動作終了指令の何れかが出るまで待機することになる。
本実施形態によるレーザ装置の制御回路は、上記のように、異常発生を検知して、レーザ発振器からのレーザ光出力を一旦停止させた後に、レーザ制御装置から光出力指令の再出力を可とする判定結果または行動データが得られると、レーザ光出力を微小な出力から定格出力または最大出力まで徐々に上昇させるよう、レーザ発振器を制御する。そのため、光ファイバ等に軽微な損傷が発生している場合に、レーザ制御装置が光出力指令の再出力を可とする判定結果または行動データを出力しても、レーザ光出力を徐々に上げて行くことで、レーザ光出力の再開により、光ファイバ等の損傷が一気に拡大することが防止される。その結果として、光ファイバ等の損傷の拡大が最小限に抑制される。
また、通常の指令を入力する入力装置とは別個に停止状態解除入力部を設けることによって、誤って停止状態解除入力部29が操作されることが防止され、その結果として、停止状態を解除すべきでない場合に停止状態が解除されることが防止される。
次に、第6実施形態について説明する。第6実施形態によるレーザ装置は、直近の一定期間の状態データ及び環境データを記憶する状態データ記録部をさらに有する。そしてこのレーザ装置は、異常発生が検知されてレーザ光出力が停止されたときに、状態データ記録部に記憶されている、そのレーザ光出力の停止時点を含む所定期間の状態データ及び環境データをレーザ制御装置へ送信する。
図14は、本発明の第6実施形態によるレーザ装置を含むレーザ制御システムの概略構成図である。本実施形態によるレーザ制御システム200は、少なくとも一つのレーザ装置201と、レーザ制御装置1とを有する。各レーザ装置201は、ローカルネットワーク202、203及び広域ネットワーク204を介してレーザ制御装置1と通信可能に接続される。レーザ制御装置1は、上記の各実施形態によるレーザ制御装置の何れかとすることができる。また、ローカルネットワーク202、203は、図11に示されるローカルネットワーク103と同様のものとすることができる。同様に、広域ネットワーク204は、図11に示される広域ネットワーク102と同様のものとすることができる。なお、図14において、破線の接続信号線は、接続が常時確立されておらず、必要な時に接続が確立されることを表している。
本実施形態によるレーザ装置201は、図1に示されるレーザ装置2と比較して、状態データ記録部30を有する点で相違する。そこで以下では、状態データ記録部30及びその関連部分について説明する。レーザ装置201のその他の構成要素及びレーザ制御装置の各構成要素については、上記の各実施形態における対応する構成要素の説明を参照されたい。
状態データ記録部30は、例えば、リングバッファを有する。そして制御回路25は、状態データ及び環境データを取得する度に、状態データ記録部30に、その状態データ及び環境データを書き込む。すなわち、状態データ記録部30には、リアルタイムで最新の状態データ及び環境データが書き込まれる。そして状態データ記録部30に記録されている状態データ及び環境データの容量が、状態データ記録部30のメモリ容量を超えると、古い方の状態データ及び環境データから順に上書きされる。これにより、状態データ記録部30には、直近の一定期間の状態データ及び環境データが記録される。なお、一定期間は、制御回路25が異常発生を検知して出力停止指令を出力した停止指令時点から第1所定時間遡った時点と停止指令時点から第2所定時間経過後の時点との間の所定期間以上に設定される。
制御回路25は、上記の各実施形態のように異常発生を検知して、レーザ発振器21に対して出力停止指令を出力してから第2所定時間が経過すると、状態データ及び環境データの状態データ記録部30への書き込みを停止する。これにより、状態データ記録部30には、上記の所定期間の状態データ及び環境データが記録されていることになる。
また、レーザ装置201がレーザ光出力を停止して、上記の所定期間の状態データ及び環境データが状態データ記録部30に記録されたときに、レーザ装置201とレーザ制御装置1との接続が確立されていない場合、制御回路25は、レーザ装置201とレーザ制御装置1間の接続を確立するための処理を実行して、レーザ装置201とレーザ制御装置1間の接続を確立する。なお、物理的にレーザ装置201とローカルネットワーク202間を接続する信号線が外されている場合には、その信号線が接続されてから、制御回路25は、上記の接続を確立する処理を実行すればよい。そして接続が確立されると、制御回路25は、状態データ記録部30から読み出した所定期間の状態データ及び環境データをレーザ制御装置1へ送信する。なお、上記の所定期間の状態データ及び環境データが状態データ記録部30に記録されたときに、レーザ装置201とレーザ制御装置1との接続が確立されている場合には、制御回路25は、状態データ記録部30から読み出した所定期間の状態データ及び環境データをレーザ制御装置1へ直ちに送信すればよい。そしてレーザ制御装置1は、受信した所定期間の状態データ及び環境データを利用して、判定器を学習し、あるいは、光出力指令の再出力の可否を判定する。
本実施形態によれば、レーザ装置とレーザ制御装置間の通信が確立されておらず、レーザ装置がリアルタイムに状態データ及び環境データをレーザ制御装置へ送信できない場合でも、レーザ装置は、レーザ装置において異常発生が検知され、レーザ光出力が停止される前後の状態データ及び環境データをレーザ制御装置へ送信できる。
なお、状態データ記録部30には、所定期間の状態データ及び環境データのうち、判定器への入力に利用される入力データのみが記録されてもよい。この場合、制御回路25は、レーザ装置201とレーザ制御装置1との接続が確立されると、状態データ記録部30から読み出した所定期間の入力データをレーザ制御装置1へ送信すればよい。
次に、第7実施形態について説明する。第7実施形態によるレーザ装置は、上記の何れかの実施形態によるレーザ制御装置により学習された判定器を表すデータを記憶する。そしてレーザ装置の制御回路自体が、そのデータを利用して、判定部または意志決定部の処理を実行することで、異常発生が検知されてレーザ光出力が一旦停止した後に、光出力指令の再出力の可否を判定する。
図15は、本発明の第7実施形態によるレーザ装置の概略構成図である。本実施形態によるレーザ装置210は、レーザ発振器21と、レーザ光学系22と、出力光検出器23と、戻り光検出器24と、制御回路25と、入力装置26と、表示装置27と、学習結果記録部31とを有する。そしてレーザ発振器21から出力されたレーザ光は、レーザ光学系22及び光ファイバ3を伝搬して加工ヘッド4からワーク(加工対象物)5へ照射される。なお、レーザ装置210は、入力装置26とは別個に、第5実施形態に示された停止状態解除入力部をさらに有してもよい。本実施形態によるレーザ装置210は、図1に示されるレーザ装置2と比較して、学習結果記録部31を有する点、及び、制御回路25による処理の一部について相違する。そこで以下では、学習結果記録部31及び制御回路25の処理について説明する。レーザ装置210のその他の構成要素については、上記の各実施形態における対応する構成要素の説明を参照されたい。
学習結果記録部31は、例えば、不揮発性の半導体メモリ回路、または、磁気記録媒体及びそのアクセス装置を有する。そして学習結果記録部31は、上記の何れかの実施形態によるレーザ制御装置により学習された判定器を表すデータを記憶する。例えば、学習結果記録部31は、第1または第2実施形態によるレーザ制御装置において学習された学習モデルを表すデータ、または、第3実施形態によるレーザ制御装置において学習された価値関数を表すデータを記憶する。なお、判定器を表すデータには、その判定器の構成を表すデータ(例えば、ニューラルネットワークの各層のニューロンにより実行される演算を規定するためのデータ、または、サポートベクトルマシンのサポートベクトルを表すデータ等)だけでなく、その判定器に関する処理を実行するためのアプリケーションプログラムが含まれる。
制御回路25は、異常発生を検知してレーザ発振器21へ光出力停止指令を出力してレーザ光出力が停止された後に、学習結果記録部31に記憶されている判定器を表すデータと、上記の所定期間の状態データ及び環境データ中の入力データとを用いて光出力指令の再出力の可否を判定する。すなわち、学習結果記録部31に、学習モデルを表すデータが記憶されている場合、制御回路25は、そのデータを利用して、第1実施形態または第2実施形態におけるレーザ制御装置のプロセッサの状態観測部及び判定部の処理を実行する。また、学習結果記録部31に、価値関数を表すデータが記憶されている場合、制御回路25は、そのデータを利用して、第3実施形態におけるレーザ制御装置のプロセッサの状態観測部及び意志決定部の処理を実行すればよい。また、レーザ装置210が停止状態解除入力部を有する場合には、第5実施形態と同様に、制御回路25は、異常発生を検知すると、例えば、内部パラメータとして保持する停止状態フラグをオンにして、レーザ装置210を停止状態に移行させてもよい。そして制御回路25は、停止状態解除入力部を介して停止状態を解除する操作が行われると、停止状態フラグをオフにして、レーザ装置210の停止状態を解除すればよい。
このように、学習された判定器のデータをレーザ装置自身が利用可能に保持することで、レーザ装置自身が光出力指令の再出力の可否を適切に判定できる。したがって、上記の各実施形態のようなレーザ制御装置が無い、あるいは、ネットワーク環境が不備であり、レーザ制御装置と通信不能な場所にレーザ装置が設置されても、レーザ装置は、光ファイバ等の損傷が拡大することを抑制できる。
さらに、第1〜第6実施形態におけるレーザ制御装置のメモリ12にも、学習された判定器を表すデータが予め記憶されてもよい。この場合には、例えば、他のレーザ制御装置により、判定器が予め学習されればよい。そしてこの場合、レーザ制御装置のプロセッサ13において、判定器の学習に関連する処理は省略されてもよい。すなわち、第1実施形態または第2実施形態のように、判定器として学習モデルが用いられる場合、プロセッサ13は、状態観測部及び判定部の処理を実行すればよい。また、第3実施形態のように、判定器として価値関数が用いられる場合、プロセッサ13は、状態観測部及び意志決定部の処理を実行すればよい。
なお、上記の各実施形態または変形例において、判定器は、入力データに対して、レーザ光の再出力により、レーザ発振器または光ファイバを含むレーザ光学系の損傷が拡大するか否かの予測結果を出力してもよい。レーザ発振器または光ファイバを含むレーザ光学系の損傷が拡大するとの予測結果を出力することは、レーザ光の再出力を不可とする判定結果を出力することと実質的に同義である。また、レーザ発振器及び光ファイバを含むレーザ光学系の損傷が拡大しないとの予測結果を出力することは、レーザ光の再出力を可とする判定結果を出力することと実質的に同義である。
ここに挙げられた全ての例及び特定の用語は、読者が、本発明及び当該技術の促進に対する本発明者により寄与された概念を理解することを助ける、教示的な目的において意図されたものであり、本発明の優位性及び劣等性を示すことに関する、本明細書の如何なる例の構成、そのような特定の挙げられた例及び条件に限定しないように解釈されるべきものである。本発明の実施形態は詳細に説明されているが、本発明の精神及び範囲から外れることなく、様々な変更、置換及び修正をこれに加えることが可能であることを理解されたい。