JP6975187B2

JP6975187B2 - レーザ制御装置、レーザ制御システム及びレーザ装置ならびにレーザ制御方法

Info

Publication number: JP6975187B2
Application number: JP2019016101A
Authority: JP
Inventors: 龍介宮田; 宏瀧川
Original assignee: Fanuc Corp
Current assignee: Fanuc Corp
Priority date: 2019-01-31
Filing date: 2019-01-31
Publication date: 2021-12-01
Anticipated expiration: 2039-01-31
Also published as: CN111496374B; CN111496374A; US11293835B2; US20200249120A1; JP2020123704A; DE102020101669A1

Description

本発明は、例えば、レーザ制御装置、レーザ制御システム及びレーザ装置ならびにレーザ制御方法に関する。

近年のレーザ加工用高出力レーザ装置においては、被加工物（ワーク）により反射されたレーザ光（以下、単に反射光と呼ぶことがある）等によって、レーザ光学系またはレーザ発振器が損傷を受けるのを防ぐことが研究されている。例えば、レーザ加工用高出力レーザ装置は、レーザ発振器から出射されたレーザ出力光またはワークからの反射光を含むレーザ出力光の伝搬方向とは反対方向にレーザ光学系を伝播する戻り光等の光量を短期間で検出可能な光検出器で検出し、検出された光量を非常に短い時間間隔で監視する。そして検出された光量が所定範囲から外れると、レーザ加工用高出力レーザ装置は、直ちにレーザ光出力を停止するように制御される。例えば、戻り光の光量が所定範囲から外れる等の異常が発生してから、レーザ光出力停止までの時間は、数十μs以下であることも少なくない。このように、異常発生からレーザ光出力停止までの時間が非常に短く設定されているため、レーザ加工用高出力レーザ装置が異常発生を検知してレーザ光出力を停止した場合でも、レーザ発振器及びレーザ光学系は損傷を受けておらず、再度、レーザ光を出力しても問題がないことが多い。

しかし、レーザ発振器またはレーザ光学系が僅かに損傷を受けている場合がある。例えば、レーザ加工用高出力レーザ装置のレーザ光学系には、レーザ出力光を加工ヘッドまで導光するために光ファイバが使用されている。この光ファイバが僅かにでも損傷を受けている場合、レーザ加工用高出力レーザ装置がレーザ光を再度出力すると、損傷部分において、レーザ光の損失による発熱で、光ファイバのコアの温度が上昇することがある。このような場合、いわゆるファイバフューズが発生して、レーザ発振器へ向かう方向に、急速に損傷部分が拡大する。特に、レーザ装置が、レーザ加工用高出力レーザ装置に多く使用されているファイバレーザ装置の場合、レーザ発振器も光ファイバで構成されているので、ファイバフューズがレーザ発振器にまで進んで、高価なファイバレーザ発振器まで損傷を受けるという事態が起こり得る。したがって、光検出器による光量の検出結果等に基づいて異常発生を検知してレーザ装置がレーザ光出力を停止した場合、レーザ装置がレーザ光を再度出力してもよいのか、損傷が拡大するのでレーザ光を再度出力してはいけないのかを見極めるということは非常に重要な意味を持つ。

前述のように、レーザ装置が異常発生を検知してレーザ光出力を停止した場合でも、光出力を再度行ってもよい場合が多いので、レーザ装置を毎回分解して調査することは非常に工数が掛かり非現実的である。また、レーザ装置を分解して調査しても、僅かな損傷の場合、損傷場所を見つけるのは容易ではないという問題もある。

光ファイバの損傷を検出するために、光ファイバに光を通して検査する技術が提案されている（例えば、特許文献１〜５を参照）。例えば、特許文献１には、高エネルギの光を伝送する光ファイバの入射端に光源からの光を光ファイバへ集光するレンズ系を設けると共に出射端には伝送先へ光を照射・集光するレンズ系を設け、これら入射端レンズ系及び出射端レンズ系のそれぞれ近傍にレンズ系内の迷光を受光する受光器を設け、これら受光器の出力を比較して光ファイバの破断を検出する検出部を設けたことを特徴とする光ファイバ破断検出装置が開示されている。

また、特許文献２には、光ファイバ健全性検査装置が開示されている。この光ファイバ健全性検査装置は、加工用レーザ光を発生する加工用レーザ発振器と加工用レーザ光を搬送する光ファイバと該光ファイバから放射される加工用レーザ光を収束して対象物に照射するレーザ加工ヘッドを備えたレーザ加工装置に適用される。そしてこの光ファイバ健全性検査装置は、加工用レーザ光と波長が異なる検査用レーザ光を発生する検査用レーザ発振器と検査用レーザ光を検出する光検出器を備え、検査用レーザ光を光ファイバに導入してレーザ加工ヘッドから戻ってくる検査用レーザ光を光ファイバのレーザ光放出端に隣接した位置で光検出器により測定して、光ファイバの異常を検出する。

また、特許文献３に開示されたＹＡＧレーザ用ファイバの断線検出方法は、ＹＡＧレーザ用ファイバに入射するレーザ出力信号の有無と、ファイバから出射するレーザ検出信号の有無とを照合することでファイバの断線を検出する。この方法は、出射側の戻り光を入射側付近まで導いてその終端で検出し、検出された信号を一定時間保持する。そしてこの方法は、保持された戻り光検出信号を、レーザ出力用制御部の出力指令信号と照合して、出力指令信号が存在するのに戻り光検出信号が存在しないときファイバが断線したと判定する。

さらに、特許文献４に開示された光ファイバモニタ装置は、特定の周波数のレーザ光を出射するレーザ発振器と、レーザ光が入射された光ファイバからの反射光を集光する集光光学系と、集光光学系から反射光が入射されて反射光の光量を測定する光検出器とを備えている。

さらにまた、特許文献５には、レーザ光が伝搬する光ファイバにおけるファイバフューズを検知するファイバフューズ検知装置が開示されている。このファイバフューズ検知装置は、光ファイバのレーザ光入射側に配置され、光ファイバに入射した光に対して逆方向に伝播する逆方向伝搬光の少なくとも一部を入力する光入力手段と、光入力手段で入力された光を光電変換する受光手段と、受光手段の出力信号から、ファイバフューズによる周期信号を含む所定周波数帯域成分を抽出する電気フィルタ手段と、電気フィルタ手段の出力レベルの所定値以上の変化を検知する検知手段と、検知手段の検知出力に応じて、警告信号を発する警告手段とを備える。

特開平１０−３８７５１号公報特開２０００−２２１１０８号公報特開２０００−３１４６７３号公報特開２００６−２９２４２４号公報国際公開第２０１０／０４１５６４号

上記の光ファイバの損傷を検出する技術の何れも、光ファイバにレーザ光を通して光ファイバの損傷を検出する。しかし、異常発生が検知された後に光ファイバにレーザ光を通すと、損傷が拡大しないように、異常発生を高速で検知してレーザ光出力を停止したにもかかわらず、光ファイバの損傷が拡大し、場合によっては、レーザ発振器まで損傷させてしまうおそれがある。損傷が拡大しないように、光ファイバに微弱な光を通して損傷を検出することも考えられる。しかしこの場合、微弱な光では検出器により測定された光量の絶対値に対する測定誤差の割合が大きくなる。そのため、光ファイバの軽微な損傷を精度良く検出できなくなる。その結果として、光ファイバに実際には損傷があるにもかかわらず、損傷がないと誤判定されることがある。このような場合、レーザ装置がレーザ光出力を再開した時に、光ファイバの損傷が一気に拡大するおそれがある。

一つの側面では、光ファイバをレーザ光の伝搬に利用するレーザ装置が異常発生を検知してレーザ光出力を停止したときに、光ファイバに光を通さずに、レーザ光を再出力してもよいか否かを判定可能なレーザ制御装置を提供することを目的とする。

一つの実施形態によれば、レーザ光を出力するレーザ発振器と、レーザ発振器から出力されるレーザ光の光量を検出する出力光検出器と、レーザ光を伝搬させる光ファイバを含むレーザ光学系を、レーザ光の伝搬方向とは逆向きに伝搬する戻り光の光量を検出する戻り光検出器と、レーザ発振器を制御する制御回路とを有するレーザ装置を制御するレーザ制御装置が提供される。このレーザ制御装置は、レーザ装置の制御回路がレーザ発振器またはレーザ光学系における異常の発生を検知してレーザ発振器からのレーザ出力を停止させると、レーザ出力の停止時点を含む所定期間のレーザ装置の状態を表す状態データ及びレーザ装置及び光ファイバが設置された環境の状態を表す環境データの少なくとも一部である入力データに基づいてレーザ発振器からのレーザ光の再出力の可否を判定する判定器にその入力データを入力することで、レーザ発振器からのレーザ光の再出力の可否を判定し、その判定結果に従って制御回路を制御する判定部を有する。そして所定期間の状態データ及び入力データは、その所定期間におけるレーザ光の光量の時系列データ及び戻り光の光量の時系列データのうちの少なくとも一方を含む。

他の実施形態によれば、レーザ装置と、レーザ装置と通信ネットワークを介して通信可能なレーザ制御装置とを有するレーザ制御システムが提供される。このレーザ制御システムにおいて、レーザ装置は、レーザ光を出力するレーザ発振器と、レーザ発振器から出力されるレーザ光の光量を検出する出力光検出器と、レーザ光を伝搬させる光ファイバを含むレーザ光学系を、レーザ光の伝搬方向とは逆向きに伝搬する戻り光の光量を検出する戻り光検出器と、レーザ発振器を制御する制御回路と、制御回路がレーザ発振器またはレーザ光学系における異常の発生を検知してレーザ発振器からのレーザ出力を停止させると、そのレーザ出力の停止時点を含む所定期間のレーザ装置の状態を表す状態データ及びレーザ装置及び光ファイバが設置された環境の状態を表す環境データの少なくとも一部である入力データを記憶する状態データ記録部とを有し、制御回路は、通信ネットワークを介してレーザ装置とレーザ制御装置間の通信が確立されると、状態データ記録部に記憶されている入力データをレーザ制御装置へ送信する。また、レーザ制御装置は、レーザ発振器からのレーザ光の再出力の可否を判定する判定器に入力データを入力することで、レーザ発振器からのレーザ光の再出力の可否を判定し、その判定結果に従って制御回路を制御する判定部を有する。そして所定期間の状態データ及び入力データは、その所定期間におけるレーザ光の光量の時系列データ及び戻り光の光量の時系列データのうちの少なくとも一方を含む。

また他の実施形態によれば、レーザ装置が提供される。このレーザ装置は、レーザ光を出力するレーザ発振器と、レーザ発振器から出力されるレーザ光の光量を検出する出力光検出器と、レーザ光を伝搬させる光ファイバを含むレーザ光学系を、レーザ光の伝搬方向とは逆向きに伝搬する戻り光の光量を検出する戻り光検出器と、レーザ発振器またはレーザ光学系における異常の発生を検知するとレーザ発振器からのレーザ出力を停止させ、レーザ出力の停止時点を含む所定期間のレーザ装置の状態を表す状態データ及びレーザ装置及び光ファイバが設置された環境の状態を表す環境データの少なくとも一部である入力データに基づいてレーザ発振器からのレーザ光の再出力の可否を判定する判定器にその入力データを入力することで、レーザ発振器からのレーザ光の再出力の可否を判定し、その判定結果に従ってレーザ発振器にレーザ光を再出力させるか否かを制御する制御回路とを有する。そして所定期間の状態データ及び入力データは、その所定期間におけるレーザ光の光量の時系列データ及び戻り光の光量の時系列データのうちの少なくとも一方を含む。

さらに他の実施形態によれば、レーザ光を出力するレーザ発振器と、レーザ発振器から出力されるレーザ光の光量を検出する出力光検出器と、レーザ光を伝搬させる光ファイバを含むレーザ光学系を、レーザ光の伝搬方向とは逆向きに伝搬する戻り光の光量を検出する戻り光検出器と、レーザ発振器を制御する制御回路とを有するレーザ装置を制御するレーザ制御方法が提供される。このレーザ制御方法は、レーザ装置の制御回路がレーザ発振器またはレーザ光学系における異常の発生を検知してレーザ発振器からのレーザ出力を停止させると、そのレーザ出力の停止時点を含む所定期間のレーザ装置の状態を表す状態データ及びレーザ装置及び光ファイバが設置された環境の状態を表す環境データの少なくとも一部である入力データに基づいてレーザ発振器からのレーザ光の再出力の可否を判定する判定器に入力データを入力することで、レーザ発振器からのレーザ光の再出力の可否を判定し、判定結果に従ってレーザ装置の制御回路を制御する、ことを含む。そして所定期間の状態データ及び入力データは、その所定期間におけるレーザ光の光量の時系列データ及び戻り光の光量の時系列データのうちの少なくとも一方を含む。

一つの側面によれば、光ファイバをレーザ光の伝搬に利用するレーザ装置が異常発生を検知してレーザ光出力を停止したときに、光ファイバに光を通さずに、レーザ光を再出力してもよいか否かを判定することができる。

本発明の第１実施形態のレーザ制御装置及びそのレーザ制御装置によって制御されるレーザ装置の概略構成図である。本発明の第１実施形態による学習モデルの学習過程及び学習済みの学習モデルを用いたレーザ光再出力可否判定の一例を示すフローチャートである。本発明の第２実施形態のレーザ制御装置及びそのレーザ制御装置によって制御されるレーザ装置の概略構成図である。光ファイバ破断装置の構成の一例を示す図である。光ファイバ破断装置の構成の他の一例を示す図である。光ファイバ破断装置の構成のさらに他の一例を示す図である。本発明の第２実施形態のレーザ制御装置の学習過程の一例を示すフローチャートである。本発明の第３実施形態によるレーザ制御装置のプロセッサの機能ブロック図である。本発明の第３実施形態によるレーザ制御装置による、価値関数の学習過程の一例を示すフローチャートである。本発明の第３実施形態によるレーザ制御装置による、価値関数の学習過程の他の一例を示すフローチャートである。本発明の第４実施形態によるレーザ制御装置を含む、レーザ制御システムの概略構成図である。本発明の第５実施形態によるレーザ装置の概略構成図である。本発明の第５実施形態によるレーザ装置が制御される場合の価値関数の学習過程の一例を示すフローチャートである。本発明の第６実施形態によるレーザ装置を含むレーザ制御システムの概略構成図である。本発明の第７実施形態によるレーザ装置の概略構成図である。

以下、図を参照しつつ、レーザ制御装置及びそのようなレーザ制御装置により制御されるレーザ装置について説明する。なお、各図において、同じ構成要素には同じ参照符号を付している。また、これらの図を見易くするために、縮尺を適宜変更している。

本願の発明者は、レーザ光の伝搬に光ファイバを利用するレーザ装置において何らかの異常が検知された場合において、その異常が検知された前後の所定期間における、レーザ装置の動作状況を表すデータ、特に、その異常が検知された前後の所定期間においてレーザ装置から出力されたレーザ光（以下、単にレーザ出力光と呼ぶことがある）の光量の時系列データ及び光ファイバをレーザ光の伝搬方向とは逆向きに伝搬する戻り光（以下、単に戻り光と呼ぶことがある）の時系列データが、レーザ発振器または光ファイバを含むレーザ光学系の損傷の有無と密接に関連していることを見出した。そこでこのレーザ制御装置は、レーザ装置において何らかの異常が検知された前後の所定期間における、レーザ装置の動作状況を表すデータ、特に、その所定期間における出力光及び戻り光の少なくとも一方の時系列データを、レーザ光の再出力が可能か否かを判定するように予め学習された判定器に入力することで、レーザ装置がレーザ光を再出力することの可否を判定する。

まず、第１の実施形態によるレーザ制御装置ついて説明する。
図１は、本発明の第１実施形態のレーザ制御装置及びそのレーザ制御装置によって制御されるレーザ装置の概略構成図である。なお、図１において、白抜きの矢印は、空気中または光ファイバ中を伝播しているレーザ光を模擬的に示し、実線の矢印は、信号線等とその信号の方向を模擬的に示している。なお、この点については、図１以降の概念的な構成を示す各図においても同様である。

本実施形態によるレーザ制御装置１は、レーザ装置２を制御する。レーザ装置２は、少なくとも、レーザ発振器２１と、レーザ光学系２２と、出力光検出器２３と、戻り光検出器２４と、制御回路２５と、入力装置２６と、表示装置２７とを有する。そしてレーザ装置２から出力されたレーザ光は、光ファイバ３を伝搬して加工ヘッド４からワーク（加工対象物）５へ照射され、ワーク５の加工に利用される。

レーザ発振器２１は、制御回路２５からの制御に従ってレーザ発振することでレーザ光を出力する。本実施形態によるレーザ発振器２１には、特に制限はないが、レーザ発振器２１は、例えば、ファイバレーザ、ＹＡＧレーザといった固体レーザ方式のレーザ発振器、または、ダイレクトダイオードレーザといったレーザ発振器とすることができる。

レーザ光学系２２は、レーザ発振器２１と光ファイバ３との間に設けられ、レーザ発振器２１から出力されたレーザ光が光ファイバ３へ入射するように、そのレーザ光を光ファイバ３の一端面に集光する。そのために、レーザ光学系２２は、レーザ発振器２１と光ファイバ３との一端面とを結ぶ光軸に沿って配置される１以上のレンズを有する。なお、レーザ発振器２１と光ファイバ３とが直接接続される場合には、レーザ光学系２２は省略されてもよい。また、光ファイバ３自体もレーザ光学系の一部と考えられるので、以下では、レーザ光学系２２と光ファイバ３とを併せてレーザ光学系と呼ぶことがある。

出力光検出器２３は、レーザ出力光の光量を検出する。そのために、出力光検出器２３は、例えば、フォトダイオードといったレーザ出力光に対して感度を有する１以上の受光素子を有する。そして出力光検出器２３は、例えば、光ファイバ３の融着部（図示せず）あるいはその近傍の光ファイバ３の保護被膜を除去した部分から漏出するレーザ出力光を受光するように配置される。あるいは、出力光検出器２３は、レーザ光学系２２のレーザ発振器２１側の近傍に、レーザ光学系２２が有するレンズ面にてレーザ出力光の一部が反射することで生じた迷光を受光するように配置されてもよい。あるいはまた、出力光検出器２３は、レーザ発振器２１とレーザ光学系２２の間に配置されるビームスプリッタ（図示せず）により分割されたレーザ出力光の一部を受光するように配置されてもよい。あるいはまた、出力光検出器２３は、光ファイバ３の加工ヘッド４の近傍において、レーザ出力光の一部またはレーザ出力光により生じた迷光を受光するように配置されてもよい。そして出力光検出器２３は、レーザ出力光の光量の測定値を制御回路２５へ出力する。

戻り光検出器２４は、光ファイバ３内をレーザ出力光の伝搬方向とは逆向きに伝搬し、光ファイバ３の一端面からレーザ発振器２１側へ向けて出射する戻り光の光量を検出する。そのために、戻り光検出器２４は、例えば、フォトダイオードといった戻り光に対して感度を有する１以上の受光素子を有する。そして戻り光検出器２４は、例えば、出力光検出器２３と同様に、光ファイバ３の融着部あるいはその近傍の光ファイバの３保護被膜を除去した部分から漏出する戻り光を受光するように配置される。あるいは、戻り光検出器２４は、レーザ発振器２１を構成する高反射鏡（図示せず：ファイバレーザの場合は、HRFBG：High-reflecting fiber Bragg grating）を透過してくる戻り光を受光するように配置されてもよい。あるいはまた、戻り光検出器２４は、レーザ光学系２２の光ファイバ３側の近傍に、レーザ光学系２２が有するレンズ面にて戻り光の一部が反射することで生じた迷光を受光するように配置されてもよい。あるいはまた、戻り光検出器２４は、レーザ光学系２２と光ファイバ３との間に配置されるビームスプリッタ（図示せず）により分割された戻り光の一部を受光するように配置されてもよい。そして戻り光検出器２４は、戻り光の光量の測定値を制御回路２５へ出力する。

制御回路２５は、レーザ制御装置１からの制御信号、レーザ出力光の光量の測定値、戻り光の光量の測定値、あるいは、入力装置２６からの操作信号に従って、レーザ発振器２１にレーザ光を出力させる光出力指令あるいはレーザ光の出力を停止させる出力停止指令を出力する。なお、制御回路２５がレーザ発振器２１に対して光出力指令を出力するという表現は、レーザ発振器２１に駆動電力を供給するように構成された電源（図示せず）に電力出力指令を出力するという意味を略して表現したものである。以降の各実施形態または変形例についても同様である。

制御回路２５は、例えば、Central Processing Unit(CPU)といった演算回路、メモリ回路、レーザ発振器２１に対して駆動電力を供給する電源（図示せず）を駆動する駆動回路及びレーザ装置２の各部及びレーザ制御装置１と通信するための通信回路などを有する。なお、制御回路２５は、Field Programmable Gate Arrayにより構成されてもよい。制御回路２５は、例えば、入力装置２６から、レーザ装置２を起動する操作信号を受信すると、レーザ発振器２１へ光出力指令を出力する。また、制御回路２５は、入力装置２６から、レーザ装置２を停止させる操作信号を受信すると、レーザ発振器２１へ出力停止指令を出力する。さらに、制御回路２５は、レーザ出力光の光量の測定値または戻り光の光量の測定値が所定の許容範囲から外れると、レーザ装置２または光ファイバ３に何らかの異常が発生したと判定する。例えば、制御回路２５は、レーザ出力光の光量の測定値が所定の下限閾値より小さい場合、あるいは、戻り光の光量の測定値が所定の上限閾値より大きい場合、レーザ装置２または光ファイバ３に何らかの異常が発生したと判定する。なお、所定の下限閾値は、光出力指令の関数として設定されてもよい。また、異常が発生したという表現は、レーザ装置に不可逆的な損傷が発生したと意味ではなく、レーザ装置が異常な状態になったという意味で使用される。制御回路２５は、異常の発生を検知すると、レーザ発振器２１へ出力停止指令を出力するとともに、レーザ制御装置１へ、異常の発生を検知したことを通知する。さらにまた、制御回路２５は、学習モデルの学習が行われている間、異常発生を検知した後に、レーザ発振器２１へ光出力指令を再度出力してもよい。そして制御回路２５は、光出力指令を再出力してから一定期間を経過しても異常の発生が検知されない場合、その旨を表す光出力可ラベルをレーザ制御装置１へ出力する。一方、制御回路２５は、光出力指令を再出力してから一定期間内に異常の発生を再度検知すると、その旨を表す光出力不可ラベルをレーザ制御装置１へ出力する。

さらにまた、制御回路２５は、レーザ装置２の各部の状態を表すデータ（以下、状態データと呼ぶ）を継続的にレーザ制御装置１へ出力する。なお、状態データには、例えば、レーザ出力光の光量の測定値、戻り光の光量の測定値、レーザ発振器２１に供給する駆動電流量を指定する値といった制御回路２５の制御データ、及び、レーザ装置２内に設置される他のセンサ（例えば、電流計、電圧計あるいは温度計）による測定値が含まれる。

また制御回路２５は、学習モデルの学習が終了すると、異常の発生を検知してレーザ発振器２１にレーザ光出力を一旦停止させた後に、レーザ光出力の再開の可否などを問い合わせる信号をレーザ制御装置１へ出力する。そして制御回路２５は、レーザ制御装置１から、レーザ光出力の再開の許可を表す制御信号を受信すると、レーザ発振器２１へ光出力指令を出力する。一方、制御回路２５は、レーザ制御装置１から、レーザ光出力の再開を許可しない制御信号を受信すると、レーザ発振器２１によるレーザ光出力を停止させたまま維持する。

入力装置２６は、例えば、複数の操作ボタンを有する。そして入力装置２６は、複数の操作ボタンのうち、ユーザにより操作された操作ボタンに応じた操作信号（例えば、レーザ装置２を起動する操作信号、レーザ装置２によるレーザ光の出力を停止する操作信号、レーザ光の出力強度を設定する操作信号など）を生成して制御回路２５へ出力する。

表示装置２７は、例えば、液晶ディスプレイであり、制御回路２５から受け取った各種の表示用のデータ、例えば、レーザ装置２の状態を表すデータを表示する。なお、入力装置２６と表示装置２７とは、タッチパネルディスプレイのように一体的に構成されてもよい。また、入力装置２６と表示装置２７とは、レーザ制御装置１に設けられてもよい。

レーザ制御装置１は、通信インターフェース１１と、メモリ１２と、プロセッサ１３とを有する。

通信インターフェース１１は、通信部の一例であり、レーザ装置２等と通信するための通信回路を有する。そして通信インターフェース１１は、レーザ装置２から受信した各種のデータまたは信号をプロセッサ１３へわたす。また通信インターフェース１１は、プロセッサ１３から受け取った、レーザ装置２に対する制御信号をレーザ装置２へ出力する。さらに、通信インターフェース１１は、レーザ装置２及び光ファイバ３の周囲の環境の状態を表すデータ（以下、環境データと呼ぶ）を測定する１以上のセンサ（例えば、加工ヘッド４またはワーク５の近傍に設置される温度計または湿度計）と通信可能に接続され、そのセンサから受信した環境データをプロセッサ１３へわたしてもよい。なお、通信インターフェース１１は、レーザ装置２の制御回路２５を介して環境データを受信してもよい。環境データには、例えば、加工ヘッド４またはワーク５の近傍の温度または湿度、加工ヘッド４とワーク５の相対位置関係を制御する駆動装置（図示せず）の内部データが含まれる。

メモリ１２は、記憶部の一例であり、レーザ制御装置１がレーザ装置２を制御するために使用する各種のデータ及びプロセッサ１３上で動作するプログラムを記憶する。例えば、メモリ１２は、レーザ装置２において異常が検出され、一旦レーザ光出力が停止された後にレーザ光出力の再開の可否を判定するために用いられる学習モデルを表すパラメータ群、及び、そのような学習モデルの学習に利用される、レーザ装置２の状態データ及び環境データを記憶する。そのために、メモリ１２は、例えば、不揮発性の読み出し専用の半導体メモリと、揮発性の読み書き可能な半導体メモリとを有する。さらに、メモリ１２は、リングバッファを有してもよい。さらにまた、メモリ１２は、磁気記録媒体または光記録媒体及びそのアクセス装置といったストレージ装置を有していてもよい。

プロセッサ１３は、制御部の一例であり、例えば、Central Processing Unit(CPU)及びその周辺回路を有する。さらにプロセッサ１３は、論理演算用のプロセッサ及び数値演算用のプロセッサを有していてもよい。さらに、プロセッサ１３は、Field Programmable Gate Arrayにより構成された演算回路を有してもよい。そしてプロセッサ１３は、レーザ装置２の制御に関する処理を実行する。そのために、プロセッサ１３は、状態観測部１３１と、ラベル取得部１３２と、判定部１３３と、学習部１３４と、学習制御部１３５とを有する。プロセッサ１３が有するこれらの各部は、例えば、プロセッサ１３上で実行されるコンピュータプログラムにより実現される機能モジュールである。あるいは、これらの各部は、プロセッサ１３の一部に実装される専用の演算回路として実装されてもよい。また、プロセッサ１３は、一つのプロセッサで構成される必要はなく、特に計算負荷の大きい学習部１３４等の処理を実行するための別の専用プロセッサが設けられてもよい。

状態観測部１３１は、状態データ及び環境データを観測する。本実施形態では、状態観測部１３１は、通信インターフェース１１を介して状態データ及び環境データを継続的に取得して、メモリ１２に記憶する。その際、状態観測部１３１は、メモリ１２に含まれるリングバッファに状態データ及び環境データを書き込んでもよい。この場合、リングバッファに、直近の一定期間の状態データ及び環境データが記憶される。

ラベル取得部１３２は、レーザ装置２の制御回路２５が異常発生を検知して、制御回路２５から出力停止指令が出力された後に制御回路２５が再度光出力指令を出力することの可否を、光出力可ラベルあるいは光出力不可ラベルから成るラベルとして取得する。例えば、ラベル取得部１３２は、通信インターフェース１１を介して、制御回路２５から、異常発生の検知後に光出力指令を再度出力しても再度異常発生が検知されなかったという光出力可ラベル、及び、異常発生の検知後に光出力指令を出力すると異常発生が再度検知されて直ちに光出力を再度停止したという光出力不可ラベルを取得することができる。これらのラベルの取得には人間が介在しないことが好ましいが、レーザ装置２を分解して調査した結果、異常発生の検知後に光出力指令を再度出力することが不可である損傷が見つかった場合等は、人間が入力装置２６を操作して、制御回路２５に、光出力不可ラベルを出力させてもよい。

判定部１３３は、異常発生の検知によって、レーザ装置２の制御回路２５がレーザ発振器２１へ出力停止指令を出力したときに、制御回路２５が出力停止指令を出力した出力停止時点（すなわち、レーザ光出力が停止された時点）を含む所定期間内の状態データ及び環境データの少なくとも一部である入力データを、レーザ光出力の再開の可否を判定する学習モデルに入力する。これにより、判定部１３３は、レーザ光出力の再開の可否を判定する。また判定部１３３は、その判定結果に応じて、レーザ光出力の再開の可否に関してレーザ装置２の制御回路２５を制御する。なお、学習モデルは、判定器の一例である。

所定期間は、出力停止時点から第１所定時間遡った時点から、その出力停止時点後の第２所定時間が経過した時点までの期間とすることができる。第１所定時間は、時間を長く設定すると、データ量が大きくなり過ぎる、あるいは、有効なデータが無効なデータに埋もれてしまうという問題が発生するので、ゼロよりも大きく、かつ、典型的に１０ｍｓオーダー程度に設定することが好ましい。また、第２所定時間も同様の問題があり、有効なデータは出力停止時点より前に多く存在するので、第２所定時間は、第１所定時間と同じか、第１所定時間より短く設定することが好ましい。また、第２所定時間はゼロに設定されてもよい。すなわち、出力停止時点が所定期間の終端に設定されてもよい。

本実施形態では、学習モデルは、例えば、多層パーセプトロン型のニューラルネットワークあるいはサポートベクトルマシンとすることができる。なお、学習モデルに入力される入力データには、特に、所定期間におけるレーザ出力光の光量の測定値の時系列データ及び戻り光の光量の測定値の時系列データの少なくとも一方が含まれることが好ましく、所定期間におけるレーザ出力光の光量の測定値の時系列データ及び戻り光の光量の測定値の時系列データの両方が含まれることがより好ましい。所定期間におけるレーザ出力光の光量の測定値の時系列データ及び戻り光の光量の測定値の時系列データは、レーザ発振器２１及び光ファイバ３の何れかにて生じた異常との関連性が高く、そのため、これらの時系列データを学習モデルの入力データとすることで、学習モデルは、レーザ光出力の再開の可否を精度よく判定できる。その結果として、レーザ発振器２１及び光ファイバ３の何れかに、レーザ光出力を再開すると損傷が拡大するような異常があるときに、レーザ光出力が再開されることが抑制される。

なお、入力データの一つとして、状態データのうち、レーザ発振器２１に供給される駆動電流の目標値といった、制御回路２５による制御データが利用されてもよい。そのような制御データについては、短時間で変化しないので、所定期間中の何れかの時点での値が入力データとして用いられてもよい。また、入力データの他の一つとして、状態データまたは環境データのうち、電流計、電圧計あるいは光検出器といったセンサにより測定されるデータが利用されてもよい。そのような測定データは、異常発生の前後で変化する可能性があるので、所定期間中の時系列の測定データが入力データとして用いられることが好ましい。

学習部１３４は、学習モデルを学習する。本実施形態では、学習部１３４は、レーザ装置２の制御回路２５が異常の発生を検知したときの所定期間の状態データ及び環境データのうちの入力データと、その入力データに対応するラベルのペアとなる教師データを複数利用して、誤差逆伝搬法といった所定の教師有り学習手法に従って学習モデルを学習する。

学習制御部１３５は、学習部１３４による学習モデルの学習過程を制御する。そのために、学習制御部１３５は、状態観測部１３１により得られた状態データ等とラベル取得部１３２により得られたラベルとの対応付けによる教師データの作成及び教師データのメモリ１２への書き込み、メモリ１２からの教師データの読み込み及び学習部１３４への教師データの受け渡しなどの処理を実行する。例えば、学習制御部１３５は、制御回路２５から異常の発生を検知したことが通知されると、メモリ１２から、上記の所定期間の状態データ等を読み出して、ラベル取得部１３２により得られたラベルと対応付けて、教師データとしてメモリ１２に別途記憶する。さらに、学習制御部１３５は、学習部１３４による学習モデルの学習が終了したか否かを判定し、学習モデルの学習が終了した場合に、レーザ装置２の制御回路２５へ、その学習が終了したことを、通信インターフェース１１を介して通知する。

図２は、第１実施形態による学習モデルの学習過程及び学習済みの学習モデルを用いたレーザ光再出力可否判定の一例を示すフローチャートである。

レーザ制御装置１が動作を開始すると、まず未だ学習モデルの学習の到達レベルが設定したレベルに達していないことを明確にするために、学習制御部１３５の内部変数である学習レベルに０を設定する（ステップＳ１０１）。続いて、学習制御部１３５が、レーザ装置２の制御回路２５が光出力指令の出力を要求されているか否かを判定する（ステップＳ１０２）。光出力指令の出力を要求されていれば（ステップＳ１０２−Ｙｅｓ）、学習制御部１３５は、制御回路２５に対して、通信インターフェース１１を介して光出力指令に従ってレーザ光を出力することを許可する制御信号を出力する。そして制御回路２５がレーザ発振器２１に対して光出力指令を出力することで、レーザ発振器２１からレーザ光が出力される（ステップＳ１０３）。

状態観測部１３１は、レーザ出力光の光量の測定値及び戻り光の光量の測定値を含む、レーザ装置２の状態データ及び環境データを制御回路２５から常時取得するとともに、制御回路２５による、異常発生の検知及び出力停止指令が出力されたか否かも常時観測し、異常発生が検知されたときには、異常発生の検知を表す信号を制御回路２５から通信インターフェース１１を介して取得する（ステップＳ１０４）。

学習制御部１３５が、状態観測部１３１を経由して、制御回路２５が異常発生を検知したか否か、すなわち、出力停止指令が出力されたか否かを判定する（ステップＳ１０５）。出力停止指令が出力された場合（ステップＳ１０５−Ｙｅｓ）、学習制御部１３５は、メモリ１２（例えば、リングバッファ）から、上記の所定期間内の状態データ及び環境データの少なくとも何れかを入力データとして読み込む（ステップＳ１０６）。次に、学習制御部１３５は、学習レベルを確認するため、学習制御部１３５の内部変数である学習レベルが０か否かを判定する（ステップＳ１０７）。学習レベルが０であれば（ステップＳ１０７−Ｙｅｓ）、学習途上ということであり、学習制御部１３５は、設定されている学習モードが自動再出力モードか否か判定する（ステップＳ１０８）。

ここで、自動再出力モードとは、制御回路２５が異常発生を検知して、光出力停止指令を出力し、レーザ光出力が停止した場合に、例えば、ワーク５からの反射光が発生しない位置に加工ヘッド４を退避させて後、制御回路２５に光出力指令を再度出力するように、学習制御部１３５が自動的に指令する学習モードである。人間が介在しないで学習を進められるメリットがあるが、光ファイバ３またはレーザ光学系２２の損傷が拡大して、場合によっては、レーザ発振器２１にまで損傷が拡大して、レーザ装置２の修理が必要となるという事態も起こり得る。しかし、制御回路２５が異常発生を検知して、光出力停止指令を出力した場合でも、ワーク５からの反射光が一時的に基準を超えただけであることも多い。このような場合、光出力停止指令によって瞬時にレーザ光出力が停止するため、光ファイバ３等が何ら損傷を受けていない。そのため、時には上記のように損傷が拡大して修理が必要となっても、制御回路２５からの出力停止指令によって、レーザ装置２がレーザ光出力を停止した時に、制御回路２５が光出力指令を再度出力する可否を自動的に判別するので、使い易くて信頼性の高いレーザ装置を開発するめには必要なコストと考えられる場合に採用されればよい。

ステップＳ１０８で自動再出力モードに設定されていると判定されると（ステップＳ１０８−Ｙｅｓ）、学習制御部１３５は、通信インターフェース１１を介して制御回路２５に光出力指令をレーザ発振器２１へ再度出力するように指令して、レーザ光が再び出力される（ステップＳ１０９）。レーザ光の再出力の結果として、学習制御部１３５が、状態観測部１３１を経由して、制御回路２５から出力停止指令が再度出力されたか否かを判定する（ステップＳ１１０）。制御回路２５から出力停止指令が再度出力されたと判定された場合（ステップＳ１１０−Ｙｅｓ）、レーザ装置２または光ファイバ３に損傷部分があり、修理が必要な状態であることが考えられるので、学習制御部１３５は、制御回路２５に対して、通信インターフェース１１を介して、表示装置２７等に要修理状態であることを表示するように指令する（ステップＳ１１２）。この場合、人間が損傷部を修理するが（ステップＳ１１３）、レーザ光出力を再度行ってはいけなかったということになるので、ラベル取得部１３２は、制御回路２５から出力停止指令が再出力されたことを光出力不可ラベルとして取得する（ステップＳ１１４）。そして学習制御部１３５は、ステップＳ１０６で取得した入力データと光出力不可ラベルとを対応付けることで、教師データの一つとなる入力データと光出力不可ラベルのペアが形成される（ステップＳ１１５）。

また、ステップＳ１１０で、制御回路２５から一定時間経過しても出力停止指令が再度出力されていないと判定された場合（ステップＳ１１０−Ｎｏ）、レーザ装置２または光ファイバ３は、問題となるような損傷を受けていないと推定される。そのため、レーザ光を再度出力することが可能であったことになるので、ラベル取得部１３２は、制御回路２５から出力停止指令が再度出力されなかったことを光出力可ラベルとして取得する（ステップＳ１１１）。そしてステップＳ１１５にて、学習制御部１３５は、ステップＳ１０６で取得した入力データと光出力可ラベルとを対応付けることで、教師データの一つとなる入力データと光出力可ラベルのペアが形成される。

ステップＳ１１５の後、学習制御部１３５は、前回の学習モデルの更新以降に蓄積された教師データの数が所定数（例えば、1000）に達したか否か判定する（ステップＳ１１６）。教師データの数が所定数に達していなければ（ステップＳ１１６−Ｎｏ）、学習制御部１３５は、レーザ制御装置１に対して動作終了指令が出ているか否かを判定する（ステップＳ１３１）。動作終了指令が出ていれば（ステップＳ１３１−Ｙｅｓ）、レーザ制御装置１は動作を終了する。一方、動作終了指令が出ていなければ（ステップＳ１３１−Ｎｏ）、学習制御部１３５は、ステップＳ１０２以降の処理を繰り返す。

一方、教師データの数が所定数に達していれば（ステップＳ１１６−Ｙｅｓ）、学習制御部１３５は、前回の学習モデルの更新以降に蓄積された教師データのそれぞれについて、その教師データに含まれる入力データを学習モデルに入力して得られる判定結果とその教師データに含まれるラベルとを照合することで学習モデルによる判定結果が正解か否か判定する。そして学習制御部１３５は、各教師データについての判定結果から、学習モデルによる判定結果の誤り率をもとめる（ステップＳ１１７）。なお、上記のようにバッチ学習ではなく、学習制御部１３５は、オンライン学習で、リアルタイムの入力データに対して、学習しながら判定を行ってもよい。

学習制御部１３５は、誤り率が所定の設定値以下か否か判定する（ステップＳ１１８）、誤り率が所定の設定値よりも大きければ（ステップＳ１１８−Ｎｏ）、学習モデルの学習は十分でなく、そのため、レーザ光再出力の可否の判定精度は不十分である。そこで、学習制御部１３５は、メモリ１２に記憶されている全ての教師データを用いて、学習部１３４に学習モデルを学習させることで、学習モデルを更新する（ステップＳ１１９）。その後、学習制御部１３５は、ステップＳ１３１で動作終了指令が出ていなければ、ステップＳ１０２以降の処理を繰り返す。

一方、誤り率が所定の設定値以下であれば（ステップＳ１１８−Ｙｅｓ）、学習モデルの学習は十分であり、その結果として、レーザ光再出力の可否について十分な判定精度が得られる。そこで、学習制御部１３５は、学習レベルに、学習が終了したことを表す１を設定する（ステップＳ１２０）。さらに、学習制御部１３５は、通信インターフェース１１を介して制御回路２５へ学習モデルの学習が完了したことを通知するとともに、表示装置２７に学習モデルの学習が完了したことを表示させる（ステップＳ１２１）。

ステップＳ１２１の後、ステップＳ１０２にて光出力指令の出力が要求されていない場合（ステップＳ１０２−Ｎｏ）、あるいは、ステップＳ１０５にて制御回路２５から出力停止指令が出力されていないと判定された場合（ステップＳ１０５−Ｎｏ）についても、学習制御部１３５は、レーザ制御装置１に対して動作終了指令が出ているか否かを判定する（ステップＳ１３１）。動作終了指令が出ていれば（ステップＳ１３１−Ｙｅｓ）、レーザ制御装置１は動作を終了する。一方、動作終了指令が出ていなければ（ステップＳ１３１−Ｎｏ）、学習制御部１３５は、ステップＳ１０２以降の処理を繰り返す。なお、ステップＳ１０２で、レーザ装置２に光出力指令が出ておらず、かつ、ステップＳ１３１にて、動作終了指令がでていない場合は、学習制御部１３５は、光出力指令か動作終了指令の何れかが出るまで待機することになる。

なお、ステップＳ１０４、ステップＳ１０５、ステップＳ１３１、ステップＳ１０２、ステップＳ１０３の順に処理が実行され、再度、ステップＳ１０４の処理が実行されるまでの時間サイクルは、１０μｓオーダーか、それ以下であることが好ましい。

また、ステップＳ１０８にて、学習モードが自動再出力モードに設定されていないと判定されると（ステップＳ１０８−Ｎｏ）、制御回路２５から出力停止指令が出力されたため、表示装置２７にレーザ装置２が停止状態であることが表示される（ステップＳ１２２）。なお、人間（担当者）が、レーザ装置２が停止状態であることに早く気付くように、制御回路２５は、ブザー（図示せず）等を同時に鳴らしてもよい。この場合、レーザ装置２が停止状態となってから、人間（担当者）が、レーザ装置２または光ファイバ３の損傷が疑われる部分から分解調査して損傷部の有無またはレーザ装置２または光ファイバ３の状態を確認する。そして、その調査結果が入力装置２６を介して入力される（ステップＳ１２３）。学習制御部１３５は、入力された調査結果を制御回路２５から受け取り、その調査結果を参照して、レーザ光の再出力が可であるか不可であるかを判定する（ステップＳ１２４）、レーザ光の再出力が可であると判定された場合（ステップＳ１２４−Ｙｅｓ）、学習制御部１３５は、前述のステップＳ１０９以降の処理を実行する。

一方、ステップＳ１２４にて、学習制御部１３５は、レーザ光の再出力が不可であると判定した場合（ステップＳ１２４−Ｎｏ）、損傷部の修理が必要である。そこで、人間がレーザ装置２または光ファイバ３の損傷部の修理を行って（ステップＳ１２５）、学習制御部１３５は、前述のステップＳ１１４以降の処理を実行すればよい。

前述のステップＳ１２０で学習レベルに１が代入されると、学習モデルの学習が完了する。そのため、判定部１３３は、学習結果である学習モデルを用いて、新たに異常の発生が検知されたときにその検知時の入力データに対してレーザ光の再出力の可否、すなわち、制御回路２５からレーザ発振器２１に対して、光出力指令を再度出力するか否かを適切に判断することが可能となる。すなわち、ステップＳ１０７にて、学習レベルが１であると判定されると（ステップＳ１０７−Ｎｏ）、判定部１３３は、ステップＳ１０６で取得した入力データを学習モデルに入力する（ステップＳ１２６）。そして判定部１３３は、学習モデルから、レーザ光の再出力が可能か否かの判定結果を得る（ステップＳ１２７）、判定部１３３は、その判定結果がレーザ光の再出力が可能であることを示しているか否か判定する（ステップＳ１２８）、レーザ光の再出力が可能であれば（ステップＳ１２８−Ｙｅｓ）、判定部１３３は、制御回路２５からレーザ光の再出力可否の問い合わせに対して再出力の許可を与える制御信号を、通信インターフェース１１を介して制御回路２５へ出力する（ステップＳ１２９）。

一方、レーザ光の再出力が不可能であれば（ステップＳ１２８−Ｎｏ）、判定部１３３は、制御回路２５からレーザ光の再出力可否の問い合わせに対して再出力を不許可とする制御信号を、通信インターフェース１１を介して制御回路２５へ出力するとともに、表示装置２７に故障が検知されたことを表示させる。そしてレーザ装置２または光ファイバ３の損傷部の修理が行われる（ステップＳ１３０）。
ステップＳ１２９またはステップＳ１３０の後、判定部１３３は、ステップＳ１３１の処理を実行すればよい。

以上に説明してきたように、レーザ装置または光ファイバの異常の発生が検知された時に、その異常の原因が、雑音による一時的な誤検出である場合、あるいは、ワーク表面で反射したレーザ出力光による戻り光が所定レベルを超えたことに対する正常な損傷回避動作である場合のように、光出力指令が再度出力されてもよい場合がある。一方、その異常の原因が、何らかの理由でレーザ発振器または光ファイバ等に損傷が発生したり、発生し掛けていることであり、光出力指令が再度出力されると、損傷部分が広がるので、光出力指令が出力されてはいけない場合がある。しかし、本実施形態のレーザ制御装置は、異常の発生が検知されてレーザ光出力が停止された後に、光ファイバなどに再度光を入射させなくても、異常の発生が検知されてレーザ光出力が停止されたときを含む所定期間の状態データ及び環境データのうちから選択される入力データを学習モデルに入力することで、光出力指令を再度出力してもよいか否かを、直ちに、かつ、適切に判断することができる。そのため、このレーザ制御装置は、無駄な工数を削減できるとともに、光出力指令の再出力可否の判断を誤って、レーザ発振器または光ファイバ等に生じた損傷が拡大することを防止できる。

次に、第２実施形態について説明する。第２の実施形態によるレーザ制御装置は、レーザ制御装置が有する光ファイバ破断装置により光ファイバを損傷させたとき、すなわち、再度の光出力指令が拒否される場合の教師データを容易に取得できるようにする。

図３は、本発明の第２実施形態のレーザ制御装置及びそのレーザ制御装置によって制御されるレーザ装置の概略構成図である。第２の実施形態と図１に示される第１実施形態との相違点は、レーザ制御装置１が光ファイバ破断装置２８をさらに有している点である。

本実施形態では、光ファイバ破断装置２８は、レーザ制御装置１の構成の一部であるが、レーザ装置２内に設置されており、学習制御部１３５からの指令で光ファイバ３を破断する。なお、光ファイバ破断装置２８は、光ファイバ３のレーザ装置２の外側に位置する部分を破断するように設置されてもよい。光ファイバ破断装置２８は、レーザ装置２がレーザ光を出力中に、光ファイバ３の少なくとも一箇所以上の原則的には特定区間において光ファイバ３を破断させることが可能なように構成されている。特定区間は、例えば、破断した光ファイバ３を再融着することによってレーザ装置２を機能的に修復可能な区間であることが好ましい。光ファイバ破断装置２８は、学習制御部１３５からの指令で光ファイバ３が破断した時に、破断発生信号を通信インターフェース１１を介してプロセッサ１３のラベル取得部１３２に出力し、ラベル取得部１３２は、少なくとも破断発生信号を光出力不可ラベルとして取得するようにしてもよい。

図４は、光ファイバ破断装置２８の構成の一例を示す図である。この例では、光ファイバ破断装置２８は、図４に示されるように、光ファイバ３を徐々に屈曲させて、屈曲部３ａの曲率が限界を超えたところで光ファイバ３が文字通り破断させる構成を有する。光ファイバ破断装置２８は、光ファイバ３の保護被膜を除去した部分（屈曲部）３ａの曲率が次第に大きくなるように、光ファイバ３の保護被膜を除去した部分３ａの一端側を、光ファイバ３を固定的に保持する光ファイバ固定ホルダー２８１ａでホールドし、その部分３ａの他端側を光ファイバ移動ホルダー２８１ｂでホールドする。そして光ファイバ破断装置２８は、光ファイバ移動ホルダー２８１ｂを、例えば、モータ及びモータにより駆動される車輪を有する円弧駆動装置２８１ｃによって円弧駆動用ガイドレール２８１ｄに沿って図に示した駆動方向に移動させる。破断が起こる場所を一義的に決めるために、あるいは破断し易くするために、屈曲部３ａの外側のクラッド外面に予め僅かに傷を付けておいてもよい。光ファイバ破断装置２８の各部は、遮光筐体２８１ｅ内に収容される。これにより、光ファイバ３が破断した時に外部にレーザ光が漏洩することが防止される。また、遮光筐体２８１ｅ内に、フォトダイオードといった散乱光検出器２８１ｆが配置されてもよい。そして光ファイバ破断装置２８は、光ファイバ３が破断した時に発生する遮光筐体２８１ｅ内の散乱光を散乱光検出器２８１ｆで検出することにより破断発生信号として利用してもよい。そのために、円弧駆動装置２８１ｃと散乱光検出器２８１ｆの信号線は、レーザ制御装置１の通信インターフェース１１に接続されればよい。

図５は、光ファイバ破断装置２８の構成の他の一例を示す図である。この例では、光ファイバ破断装置２８は、図５に示されるように、リニア駆動用ガイドレール２８２ａに沿って、リニア駆動装置２８２ｂを図中に示した駆動方向に沿って移動させることによって、エッジ２８２ｃを光ファイバ３に押し当ててエッジ受け台２８２ｄとの間で、光ファイバ３の保護被膜を除去した部分３ａを加圧して、その部分３ａを急角度に曲げる。そして光ファイバ破断装置２８は、曲がり損失の急激な増大により、その部分３ａに生じる損失部を起点にファイバフューズを発生させて実効的に光ファイバ３を破断する構成としてもよい。ファイバフューズの発生により、レーザ発振器２１へ向かう方向と反対方向に伝播してくる出力光を検出する、フォトダイオードといった出力光検出器２８２ｅが配置されてもよい。そして光ファイバ破断装置２８は、出力光検出器２８２ｅにより検出される、レーザ発振器２１へ向かう方向と反対方向に伝播してくる出力光の光量が激減すること（例えば、直近の一定期間におけるその光量の減少量が所定の閾値以上となること）を破断発生信号として利用してもよい。図５の場合、光ファイバ３の保護被膜を除去した部分３ａの一部を緩く曲げて曲がり損失によってコアから漏れ出した出力光が出力光検出器２８２ｅにより検出される。リニア駆動装置２８２ｂと出力光検出器２８２ｅの信号線は、レーザ制御装置１の通信インターフェース１１に接続されればよい。なお、この例でも、光ファイバ破断装置２８の各部は、遮光筐体２８２ｆ内に収容される。

図６は、光ファイバ破断装置２８の構成のさらに他の一例を示す図である。この例では、光ファイバ破断装置２８は、図６に示されるように、出力光検出器２３及び戻り光検出器２４の検出結果に直接影響を与えないように、レーザ装置２のレーザ発振器２１の出力レーザ光の波長及び出力光検出器２３及び戻り光検出器２４が検出可能な波長とは異なる波長を持つレーザ光を出射するレーザ発振器２８３ａを有する。そして光ファイバ破断装置２８は、レーザ発振器２８３ａから出射されたレーザ光を、集光光学系２８３ｂで集光して、光ファイバ３の保護被膜を除去した部分３ａに照射して局部的に光ファイバ３を高温に加熱する。これにより、この光ファイバ破断装置２８は、その部分３ａにファイバフューズを発生させて実効的に光ファイバ３を破断させる。この場合、図５に示される例と同様に、ファイバフューズの発生により、レーザ発振器２１へ向かう方向と反対方向に伝播してくる出力光を検出する、フォトダイオードといった出力光検出器２８３ｃが配置されてもよい。そして光ファイバ破断装置２８は、出力光検出器２８３ｃにより検出される、レーザ発振器２１へ向かう方向と反対方向に伝播してくる出力光の光量が激減すること（例えば、直近の一定期間におけるその光量の減少量が所定の閾値以上となること）を破断発生信号として利用してもよい。図５に示される例と同様に、光ファイバ３の保護被膜を除去した部分３ａの一部を緩く曲げて曲がり損失によってコアから漏れ出した出力光が出力光検出器２８３ｃにより検出される。レーザ発振器２８３ａと出力光検出器２８３ｃの信号線は、レーザ制御装置１の通信インターフェース１１に接続されればよい。なお、この例でも、光ファイバ破断装置２８の各部は、遮光筐体２８３ｄ内に収容される。

上記のように、図４〜６に示した光ファイバ破断装置２８では、散乱光検出器または出力光検出器により検出される光量の変化が破断発生信号として利用される。しかし、学習制御部１３５から光ファイバ破断装置２８に出力された光ファイバ破断指令が破断発生信号として利用されてもよい。この場合には、光ファイバ破断装置２８において、散乱光検出器及び出力光検出器は省略されてもよい。

図７は、本実施形態のレーザ制御装置１の学習過程の一例を示すフローチャートであり、本発明におけるレーザ制御方法における学習過程の一例でもある。

本実施形態による学習過程では、図２に示されるフローチャートにおける、ステップＳ１０２の光出力指令の有無の判定において、光出力指令が有った場合に、ステップＳ２０１の意図的破断モードが有効に設定されているか否かを判定する処理と、意図的破断モードが有効と判定された場合に適用されるステップＳ２０２〜ステップＳ２１２の処理が追加される。そこで図７に示されるフローチャートでは、ステップＳ２０１〜Ｓ２１２の処理が図示される。その他のステップの処理の詳細については、図２のフローチャート及び関連する説明を参照されたい。

レーザ制御装置１が学習モデルの学習を開始して、学習制御部１３５が、レーザ装置２の制御回路２５が光出力指令の出力を要求されているか否かを判定する。そして光出力指令の出力を要求されていれば（ステップＳ１０２−Ｙｅｓ）、すなわち、光出力指令が新たに出ている場合、あるいは、先に出された光出力指令の実行が終了せずに残っている場合、学習制御部１３５は、意図的破断モードが有効に設定されているか否かを判定する（ステップＳ２０１）。意図的破断モードとは、光ファイバ破断装置２８を使用して光ファイバ３を意図的に破断するモードである。意図的破断モードが無効に設定されていれば（ステップＳ２０１−Ｎｏ）、学習制御部１３５は、図２に示されるフローチャートにおけるステップ１０３以降の処理を実行する。

一方、意図的破断モードが有効に設定されていれば（ステップＳ２０１−Ｙｅｓ）、学習制御部１３５は、制御回路２５に対して、通信インターフェース１１を介して光出力指令に従ってレーザ光を出力することを許可する制御信号を出力する。そして制御回路２５がレーザ発振器２１に対して光出力指令を出力することで、レーザ発振器２１からレーザ光が出力される（ステップＳ２０２）。さらに、学習制御部１３５は、光ファイバ３の意図的破断が実行されるまでの時間計測を開始する（ステップＳ２０３）。状態観測部１３１は、レーザ出力光の光量の測定値及び戻り光の光量の測定値を含む、レーザ装置２の状態データ及び環境データを制御回路２５から常時取得するとともに、制御回路２５による、異常発生の検知及び出力停止指令が出力されたか否かも常時観測し、異常発生が検知されたときには、異常発生の検知を表す信号を制御回路２５から通信インターフェース１１を介して取得する（ステップＳ２０４）。

学習制御部１３５が、状態観測部１３１を経由して、制御回路２５が異常発生を検知したか否か、すなわち、出力停止指令が出力されたか否かを判定する（ステップＳ２０５）。出力停止指令が出力された場合（ステップＳ２０５−Ｙｅｓ）、後述のように、学習制御部１３５からの指令により光ファイバ破断装置２８が光ファイバ３の意図的破断を実行するまでの設定時間が経過する前に、出力停止指令が出力されたことになる。すなわち、光ファイバ３の意図的破断は実行されていない。そのため、学習制御部１３５は、図２のフローチャートにおけるステップＳ１０６以降の処理を実行する。

一方、制御回路２５から出力停止指令が出力されていないと判定されると（ステップＳ２０５−Ｎｏ）、学習制御部１３５は、ステップＳ２０４で計測を開始してからの経過時間が、意図的破断を実行するまでの時間として設定した時間に達したか否かを判定する（ステップＳ２０６）、経過時間が設定時間に達していないと判定されると（ステップＳ２０６−Ｎｏ）、学習制御部１３５は、図２のフローチャートにおけるステップＳ１３１以降の処理を実行する。

一方、経過時間が設定時間に達したと判定されると（ステップＳ２０６−Ｙｅｓ）、学習制御部１３５は、計測していた経過時間をリセットする（ステップＳ２０７）。そして学習制御部１３５は、光ファイバ破断装置２８に対して光ファイバ破断指令を出力する（ステップＳ２０８）。そして光ファイバ３の破断が実行される。光ファイバ３が破断したことによって、制御回路２５は、出力光検出器２３によるレーザ出力光の光量の検出結果または戻り光検出器２４による戻り光の光量の検出結果等から異常発生を検知して、出力停止指令を出力する。また、光ファイバ破断装置２８あるいは学習制御部１３５が破断発生信号を出力する（ステップＳ２０９）。その後、学習制御部１３５は、メモリ１２から、制御回路２５が出力停止指令を出力した停止指令時点よりも第１所定時間遡った時点から停止指令時点の第２所定時間経過後の時点間の所定期間内の状態データ及び環境データの少なくとも何れかを入力データとして読み込む（ステップＳ２１０）。また、光ファイバ３の損傷部分、すなわち光ファイバ３の破断部は、光ファイバ３からその破断部近傍を除去した後に再融着することで修理される（ステップＳ２１１）。光ファイバ３が破断したことによって、レーザ装置２は、制御回路２５が光出力指令を再出力してはいけない状態になっていることは明らかなので、ラベル取得部１３２は、破断発生信号を光出力不可ラベルとして取得する（ステップＳ２１２）。その後、学習制御部１３５は、図２のフローチャートにおけるステップＳ１１５以降の処理を実行する。

以上に説明してきたように、図７のフローチャートで示した学習過程は、レーザ発振器と、レーザ発振器から出射されたレーザ出力光が伝播する光ファイバを含むレーザ光学系とを有するレーザ装置において、異常の発生が検知され、レーザ光出力が停止されたときを含む所定期間の状態データ及び環境データの少なくとも何れかを入力として、光出力指令を再度出力してもよいか否かを判定する判定器の一例である学習モデルの学習方法の一例を示している。

光出力指令の再出力の判定精度が良好となるように学習モデルを適切に学習するためには、光出力不可ラベルと対応する入力データとのペアとなる教師データも多数必要となるが、光出力不可ラベルの取得には、光ファイバ等が損傷を受けた状態を実現させる必要がある。しかし、レーザ装置は一般に高価であり、容易に修復できない箇所が損傷を受けると、高額な修理費がかかるので、光出力不可ラベルと対応する入力データとのペアとなる教師データの入手コストが非常に高くなるという問題がある。また、多数の教師データを入手するには非常に時間も要する。そこで、本実施形態のように、光ファイバの再融着でレーザ装置を機能的に修復可能な位置（あるいは区間）で、光ファイバを意図的に破断することによって、学習モデルの適切な学習に不可欠な光出力不可ラベルと対応する入力データとのペアとなる教師データを比較的低コストで取得することが可能になる。また本実施形態によれば、意図的に光ファイバを破断するので、多くの教師データを比較的短時間で取得できるため、学習の進捗速度を上げることも可能になる。

また、本実施形態の変形例によれば、光出力不可ラベルには、レーザ装置の制御回路からの光出力指令の再出力を不可とする理由である損傷部位と損傷状態に関する情報（以下、損傷情報と呼ぶことがある）も含まれてもよい。この場合、学習部１３４は、入力データに対して、光出力指令の再出力の可否だけでなく、光出力指令の再出力を不可とする判定結果を出力する際に、推定される損傷部位と推定される損傷状態を表す情報（以下、推定損傷情報と呼ぶことがある）も出力するように、学習モデルを学習してもよい。この場合も、学習部１３４は、損傷情報を含む光出力不可ラベルと対応する入力データとのペアとなる教師データを用いて、誤差逆伝搬法といった所定の学習手法を学習モデルの学習に適用することで、推定損傷情報を出力するように学習モデルを学習できる。なお、この場合には、損傷部位を変更できるように、光ファイバ破断装置２８が破断する光ファイバ３の位置を変更可能なように光ファイバ破断装置２８が設置されることが好ましい。

具体的には、図７のフローチャートにおいて、ステップＳ２１２で取得される光出力不可ラベルには、光出力不可という情報とともに損傷情報、すなわち、意図的に破断した光ファイバ３の位置（すなわち、損傷部位）の情報及びステップＳ２１１の損傷部修理時に明らかになった損傷状態も含まれるようにすればよい。同様に、図２のフローチャートにおけるステップＳ１１４で取得される光出力不可ラベルにも、光出力不可という情報とともに損傷情報、すなわち、ステップＳ１１３またはステップＳ１２５の損傷部修理時に明らかになった損傷部位及び損傷状態も含まれるようにすればよい。損傷情報は、例えば、入力装置２６を介して入力されればよい。その際、損傷部位は、例えば、光ファイバ３全体が複数の区間に区分され、区間ごとにラベルが割り当てられ、損傷部位が含まれる区間のラベルにより表される。また、損傷状態は、例えば、損傷の程度に応じた複数のランクの何れかとして表されればよい。これにより、学習モデルの学習が進むと、制御回路２５が出力停止指令を出力し、新たな入力データが取得された時に、学習モデルは、光出力指令の再出力の可否だけでなく、制御回路２５が光出力指令を再出力することを不可とする判定結果を出力する場合には、その判定理由である推定損傷情報も出力できるようになる。

学習モデルが、制御回路２５が光出力指令を再出力することを不可とする判定結果を出力した場合は、損傷箇所を特定して、レーザ装置２または光ファイバ３の修復を試みる必要がある。そのため、この変形例のように、学習モデルが推定損傷情報を出力することでレーザ装置２または光ファイバ３の修復に要する時間が低減できる。入力データと光出力不可ラベルのペアとなる教師データのうち、光ファイバ３を再融着することによってレーザ装置２を機能的に修復可能な光ファイバ３の区間で意図的に光ファイバ３を破断することによって発現させたペアの教師データについては、光出力指令の再出力を不可とする理由である損傷情報を光出力不可ラベルに含めることは特に容易である。

なお、第１実施形態においても、ステップＳ１１４で取得する光出力不可ラベルには、ステップＳ１１３またはステップＳ１２５の損傷部修理時に明らかになった損傷部位及び損傷状態も含まれるようにしてもよい。これにより、学習モデルの学習が進むと、学習モデルは、制御回路２５が出力停止指令を出力し、新たな入力データが取得された時に、光出力指令の再出力の可否だけでなく、制御回路２５が光出力指令を再出力することを不可とする判定結果を出力する場合には、その判定結果の理由となる損傷部位と損傷状態を表す推定損傷情報も出力することができるようになり、本実施形態の場合と同様に、修復までに要する時間が低減できるという効果がある。なお、推定損傷情報には、損傷部位と損傷状態のうちの何れか一方のみが含まれていてもよい。

次に、第３実施形態によるレーザ制御装置について説明する。第３実施形態によるレーザ制御装置は、レーザ装置の制御回路が何らかの異常を検知してレーザ光出力を停止する度に、そのときのレーザ装置の状態データ及び環境データを用いて判定器を所定の強化学習手法に従って逐次更新することで、制御回路からの光出力指令の再出力の可否の判定精度をより向上する。

なお、第３実施形態によるレーザ制御装置は、第１実施形態によるレーザ制御装置と比較して、プロセッサにより実行される処理、特に、判定器の学習に関する処理において相異する。そこで以下では、レーザ制御装置のプロセッサにより実行される処理について説明する。レーザ制御装置による制御対象となるレーザ装置、及び、レーザ制御装置のプロセッサ以外の各構成要素の詳細については、第１の実施形態における対応する構成要素の説明を参照されたい。

図８は、本発明の第３実施形態のレーザ制御装置のプロセッサの機能ブロック図である。本実施形態のレーザ制御装置１のプロセッサ１３は、状態観測部２３１と、意志決定部２３２と、判定データ取得部２３３と、学習部２３４と、学習制御部２３７とを有する。さらに、学習部２３４は、報酬計算部２３５と、価値関数更新部２３６とを有する。プロセッサ１３が有するこれらの各部は、例えば、プロセッサ１３上で実行されるコンピュータプログラムにより実現される機能モジュールである。あるいは、これらの各部は、プロセッサ１３の一部に実装される専用の演算回路として実装されてもよい。また、第１実施形態と同様に、プロセッサ１３は、一つのプロセッサで構成される必要はなく、特に計算負荷の大きい学習部２３４等の処理を実行するための別の専用プロセッサが設けられてもよい。

状態観測部２３１は、第１実施形態における状態観測部１３１と同様に、判定器への入力データとして用いられる、レーザ装置２の状態データ及び環境データを観測する。状態観測部２３１は、通信インターフェース１１を介して状態データ及び環境データを継続的に取得して、メモリ１２に記憶する。なお、状態データ及び環境データも、上記の実施形態における状態データ及び環境データと同様のデータとすることができる。また、状態データ及び環境データに含まれる各データのうち、光出力指令の再出力の可否の判定に利用される１以上の入力データも、上記の実施形態における入力データと同様のデータとすることができる。

意志決定部２３２は、判定部の他の一例であり、１以上の入力データに対する重み付けを行う価値関数に基づいて行動データを決定して、決定した行動データをレーザ装置２の制御回路２５へ通信インターフェース１１を介して出力する。価値関数は、判定器の他の一例である。行動データは、出力光検出器２３によるレーザ出力光の光量の測定結果及び戻り光検出器２４による戻り光の光量の測定結果に基づいて制御回路２５が異常発生を検知して、制御回路２５がレーザ発振器２１へ出力停止指令を出力したときに、制御回路２５が光出力指令を再出力することを可とするか不可とするかの何れかを表す。本実施形態では、意志決定部２３２は、制御回路２５が出力停止指令を出力した出力停止時点から第１所定時間遡った時点とその出力停止時点から第２所定時間経過後の時点間の所定期間内の状態データ及び環境データの少なくとも何れか（すなわち、入力データ）に対して、価値関数をもとに、制御回路２５が光出力指令を再出力することを可とするか不可とするかの何れかの行動データを決定して、決定した行動データを制御回路２５へ出力する。なお、第１所定時間及び第２所定時間は、第１実施形態における第１所定時間及び第２所定時間と同じとすることができる。

判定データ取得部２３３は、意志決定部２３２から出力された行動データに従って制御回路２５が光出力指令の再出力に関する行動を行ったときに、その行動データが正解であったか不正解であったかを判定するための判定データを取得する。

学習部２３４は、Q学習といった所定の強化学習手法に従って価値関数を学習する。そのために、学習部２３４は、報酬計算部２３５と、価値関数更新部２３６とを有する。

報酬計算部２３５は、所定の強化学習手法に従って判定データから報酬値（例えば、Q値）を計算する。そのために、報酬計算部２３５は、判定データに基づいて、行動データが正解であったか否かを判定し、行動データが正解であった場合に、報酬値がプラスとなるように報酬値を計算する。一方、報酬計算部２３５は、行動データが不正解であった場合に、報酬値がマイナスとなるように報酬値を計算する。例えば、報酬計算部２３５は、少なくとも、意志決定部２３２が、光出力指令の再出力を可とする行動データを出力し、意志決定部２３２からの出力に従って、レーザ装置２の制御回路２５が光出力指令をレーザ発振器２１へ再出力した結果、レーザ装置２における損傷が拡大しなかった場合は、行動データは正解であるので、報酬値がプラスとなるように報酬値を計算する。一方、光出力指令の再出力を可とする行動データに対して、レーザ装置２における損傷、すなわち、レーザ発振器２１、レーザ光学系２２または光ファイバ３における損傷が拡大した場合は、行動データは不正解であるので、報酬計算部２３５は、報酬値がマイナスとなるように報酬値を計算する。

価値関数更新部２３６は、報酬計算部２３５により求められた報酬値に応じて、所定の強化学習手法に従って価値関数を逐次更新することによって、判定データをもとに、入力データに対する最適な行動データが得られるように価値関数を試行錯誤的に学習する。なお、価値関数の初期値として、第１実施形態または第２実施形態における学習モデルといった、教師あり学習の学習結果が利用されてもよい。

意志決定部２３２から出力された、制御回路２５からの光出力指令の再出力の可否を表す行動データが正解であったか不正解であったかを判定するために用いられる判定データの取得には人間が介在しないことが好ましい。しかし、人間がレーザ装置２を分解して調査した結果、光出力指令を再出力することが不可である損傷が見つかった場合等は、人間が入力装置２６を介して判定データを入力してもよい。そして判定データ取得部２３３は、入力装置２６から入力された判定データを、例えば、制御回路２５及び通信インターフェース１１を介して取得すればよい。

学習制御部２３７は、上記の各実施形態と同様に、学習過程を制御する。そのために、学習制御部２３７は、状態観測部２３１による状態データ等の取得及び判定データ取得部２３３による判定データの取得等のために、通信インターフェース１１を介したレーザ装置２の制御回路２５との通信を制御する。また学習制御部２３７は、プロセッサ１３内の各部間の各種データの受け渡し、及び、メモリ１２からの各種データの読み込み、及び、メモリ１２への各種データの書き込みを制御する。例えば、学習制御部２３７は、制御回路２５から異常の発生を検知したことが通知されると、メモリ１２（例えば、リングバッファ）から、上記の所定期間の状態データ等を読み出して、意志決定部２３２へわたす。

図９は、本実施形態のレーザ制御装置１による、価値関数の学習過程の一例を示すフローチャートである。
レーザ制御装置１が動作を開始すると、ます最初に、学習制御部１３５は、本実施形態による価値関数の学習過程においては必須な処理ではないが、実行モードを自動実行モードあるいは非自動実行モードの何れかに設定する（ステップＳ３０１）。自動実行モードは、レーザ装置２の制御回路２５が異常発生を検知して出力停止指令を出力し、レーザ光出力が停止した時に、レーザ制御装置１が、学習結果である価値関数に従って制御回路２５が光出力指令を再出力することを可とする行動データを出力した場合は、自動的に制御回路２５が光出力指令を再出力することを許可する実行モードである。一方、非自動実行モードは、レーザ制御装置１が上記のように制御回路２５が光出力指令を再出力することを可とする行動データを出力した場合にも、自動的に制御回路２５が光出力指令を再出力することを許可しない実行モードである。このステップを設ける意味は、価値関数の学習レベルが目標レベルに達するほど高度化するまでは、レーザ制御装置１が価値関数に従って制御回路２５が光出力指令を再出力することを可とする行動データを出力した場合も、念のため、人間が光出力指令を再出力してもよいと判断できる状態か否かを確認する処理の挿入を可能とするためである。これにより、価値関数の学習レベルが未だ高くなく、自動実行モードが設定されると、光ファイバ３、レーザ光学系２２またはレーザ発振器２１が重大な損傷を受ける確率が高い場合に、光ファイバ３、レーザ光学系２２またはレーザ発振器２１にそのような損傷が生じることが抑制される。

次に、学習制御部２３７が、制御回路２５が光出力指令の出力を要求されているか否かを判定する（ステップＳ３０２）。光出力指令の出力を要求されていれば（ステップＳ３０２−Ｙｅｓ）、学習制御部２３７は、制御回路２５に対して、通信インターフェース１１を介して光出力指令に従ってレーザ光を出力することを許可する制御信号を出力する。そして制御回路２５がレーザ発振器２１に対して光出力指令を出力することで、レーザ発振器２１からレーザ光が出力される（ステップＳ３０３）。

状態観測部２３１は、レーザ出力光の光量の測定値及び戻り光の光量の測定値を含む、レーザ装置２の状態データ及び環境データを制御回路２５から常時取得する。また状態観測部２３１は、制御回路２５による、異常発生の検知及び出力停止指令が出力されたか否かも常時観測し、異常発生が検知されたときには、異常発生の検知を表す信号を制御回路２５から通信インターフェース１１を介して取得する（ステップＳ３０４）。

学習制御部２３７が、状態観測部２３１を経由して、制御回路２５が異常発生を検知したか否か、すなわち、出力停止指令が出力されたか否かを判定する（ステップＳ３０５）。出力停止指令が出力された場合（ステップＳ３０５−Ｙｅｓ）、学習制御部２３７は、メモリ１２（例えば、リングバッファ）から、制御回路２５が出力停止指令を出力した停止指令時点を含む上記の所定期間内の状態データ及び環境データの少なくとも何れかを入力データとして読み込む（ステップＳ３０６）。

意志決定部２３２は、読み込んだ入力データを価値関数に入力することで、行動データを決定する（ステップＳ３０７）。上記のように、この学習過程における行動データは、制御回路２５からレーザ発振器２１へ出力停止指令が出力され、レーザ光出力が停止している状態において、制御回路２５が光出力指令を再出力することを可とする行動を表すデータ（再光出力可データ）、あるいは不可とする行動を表すデータ（再光出力不可データ）である。

次に、学習制御部２３７は、意志決定部２３２から出力された行動データが、再光出力可データであるか、あるいは、再光出力不可データであるかを判定する（ステップＳ３０８）。行動データが再光出力可データであると判定された場合（ステップＳ３０８−Ｙｅｓ）、学習制御部２３７は、実行モードが自動実行モードと非自動実行モードの何れに設定されているかを判定する（ステップＳ３０９）。実行モードが自動実行モードに設定されていると（ステップＳ３０９−Ｙｅｓ）、学習制御部２３７は、通信インターフェース１１を介して制御回路２５に光出力指令をレーザ発振器２１へ再度出力するように指令して、レーザ光が再び出力される（ステップＳ３１０）。

一方、価値関数の学習レベルが不充分である場合のように、実行モードが非自動実行モードに設定されていると（ステップＳ３０９−Ｎｏ）、制御回路２５から出力停止指令が出力されたため、表示装置２７にレーザ装置２が停止状態であることが表示される（ステップＳ３１１）。なお、人間（担当者）が、レーザ装置２が停止状態であることに早く気付くように、制御回路２５は、ブザー（図示せず）等を同時に鳴らしてもよい。この場合、レーザ装置２が停止状態となってから、人間（担当者）が、レーザ装置２または光ファイバ３の損傷が疑われる部分から分解調査して損傷部の有無またはレーザ装置２または光ファイバ３の状態を確認する。そして、その調査結果が入力装置２６を介して入力される（ステップＳ３１２）。調査結果には、レーザ光の再出力が可であるか不可であるかという結論も含まれる。そこで学習制御部２３７は、入力された調査結果において、レーザ光の再出力が可であるか否かを判定する（ステップＳ３１３）、レーザ光の再出力が可である場合（ステップＳ３１３−Ｙｅｓ）、学習制御部２３７は、ステップＳ３１０以降の処理を実行する。これにより、レーザ光が再出力される。

ステップＳ３１０におけるレーザ光の再光出力の結果として、学習制御部２３７が、状態観測部２３１を経由して、制御回路２５から出力停止指令が再度出力されたか否かを判定する（ステップＳ３１４）。制御回路２５から出力停止指令が再度出力されたと判定された場合（ステップＳ３１４−Ｙｅｓ）、レーザ装置２または光ファイバ３に損傷部分があり、修理が必要な状態であることが考えられるので、学習制御部２３７は、制御回路２５に対して、通信インターフェース１１を介して、表示装置２７等に要修理状態であることを表示するように指令する（ステップＳ３１５）。そして例えば、レーザ装置２または光ファイバ３の損傷部の修理が人間により行われる（ステップＳ３１６）。そして入力装置２６を介して修理結果が入力される（ステップＳ３１７）。

なお、ステップＳ３１３にて、レーザ光の再出力が不可である場合（ステップＳ３１３−Ｎｏ）、ステップＳ３１６以降の処理が実行されればよい。

また、ステップＳ３０８にて、意志決定部２３２から出力された行動データが再光出力不可データであると判定された場合も（ステップＳ３０８−Ｎｏ）、学習制御部２３７は、ステップＳ３１１以降の処理を実行すればよい。

ステップＳ３１７にて修理結果が入力された後、判定データ取得部２３３は、意志決定部２３２から出力された行動データと、入力装置２６から入力された修理結果を判定データとして取得する（ステップＳ３１８）。そして報酬計算部２３５は、意志決定部２３２から出力された行動データが、再光出力可データであったか、あるいは、再光出力不可データであったかを判定する（ステップＳ３１９）。ステップＳ３０７において意志決定部２３２から出力された行動データが再光出力可データであったと判定された場合（ステップＳ３１９−Ｙｅｓ）、行動データが再光出力可データでありながら、実際は、レーザ装置２または光ファイバ３が再光出力不可の状態で修理する必要があったので、意志決定部２３２から出力された行動データは不正解ということになる。そのため、報酬計算部２３５は、報酬値がマイナスとなるように報酬値を計算する（ステップＳ３２０）。一方、ステップＳ３０７において意志決定部２３２から出力された行動データが再光出力不可データであったと判定された場合（ステップＳ３１９−Ｎｏ）、行動データが再光出力不可データであり、実際にレーザ装置２または光ファイバ３が再光出力不可の状態で修理する必要があったので、意志決定部２３２から出力された行動データは正解ということになる。そのため、報酬計算部２３５は、報酬値がプラスとなるように報酬値を計算する（ステップＳ３２１）。

また、ステップＳ３１４で、制御回路２５から一定時間経過しても出力停止指令が再度出力されていないと判定された場合（ステップＳ３１４−Ｎｏ）、レーザ装置２または光ファイバ３は、問題となるような損傷を受けていないと推定される。そのため、レーザ光を再度出力することが可能であったことになる。そこで、判定データ取得部２３３は、意志決定部２３２から出力された行動データと、制御回路２５が光出力指令をレーザ発振器２１へ再出力しても問題が発生せず、レーザ光の再出力が可であったという事実とを判定データとして取得する（ステップＳ３２２）。そして報酬計算部２３５は、意志決定部２３２から出力された行動データが、再光出力可データであったか、あるいは、再光出力不可データであったかを判定する（ステップＳ３２３）。ステップＳ３０７において意志決定部２３２から出力された行動データが再光出力可データであったと判定された場合（ステップＳ３２３−Ｙｅｓ）、行動データが再光出力可データであり、事実、レーザ光の再出力が可であったので、意志決定部２３２から出力された行動データは正解ということになる。そのため、報酬計算部２３５は、報酬値がプラスとなるように報酬値を計算する（ステップＳ３２４）。

一方、意志決定部２３２から出力された行動データが再光出力不可データであったと判定された場合（ステップＳ３２３−Ｎｏ）、行動データが再光出力不可データでありながら、実際には、レーザ光の再出力が可であったので、意志決定部２３２から出力された行動データは不正解ということになる。そのため、報酬計算部２３５は、報酬値がマイナスとなるように報酬値を計算する（ステップＳ３２５）。

ステップＳ３２１、Ｓ３２２、Ｓ３２４またはＳ３２５の後、価値関数更新部２３６は、算出された報酬値に基づいて価値関数を更新する（ステップＳ３２６）。その際、価値関数更新部２３６は、上記のように、Q学習といった所定の強化学習手法に従って価値関数を更新すればよい。

その後、学習制御部２３７は、報酬値の移動平均が目標値より大きくなったか否か判定する（ステップＳ３２７）。報酬値の移動平均は、例えば、最近の１，０００回の報酬値の移動平均値等である。報酬値の移動平均値が目標値より大きくなれば（ステップＳ３２７−Ｙｅｓ）、価値関数の学習レベルが目標レベルに達したと考えられる。そこで、学習制御部２３７は、前述の実行モードが自動実行モードに設定されていない場合は、実行モードを自動実行モードに設定する（ステップＳ３２８）。また、学習制御部２３７は、通信インターフェース１１を介して、表示装置２７に学習レベルが目標レベルに達したことを表示させるようにしてもよい。また、学習レベルが目標レベルに達したので、学習制御部２３７が、内部データとして、動作終了指令を出力してもよい。動作終了指令は、入力装置２６から入力され、制御回路２５及び通信インターフェース１１介して取得されてもよい。

その後、学習制御部２３７は、レーザ装置２に対して動作終了指令が出ているか否かを判定する（ステップＳ３２９）。動作終了指令が出ている場合（ステップＳ３２９−Ｙｅｓ）、レーザ制御装置１は動作を終了する。

一方、動作終了指令が出ていない場合（ステップＳ３２９−Ｎｏ）、学習制御部２３７は、ステップＳ３０２以降の処理を繰り返す。

また、ステップＳ３２７にて、報酬値の移動平均が目標値より小さいと判定された場合（ステップＳ３２７−Ｎｏ）、ステップＳ３０２にて光出力指令の出力が要求されていない場合（ステップＳ３０２−Ｎｏ）、あるいは、ステップＳ３０５にて、制御回路２５から出力停止指令が出力されていないと判定された場合（ステップＳ３０５−Ｎｏ）も、学習制御部２３７は、ステップＳ３２９の処理を実行すればよい。なお、ステップＳ３０２で、レーザ装置２に光出力指令が出ておらず、かつ、ステップＳ３２９にて、動作終了指令がでていない場合は、学習制御部２３７は、光出力指令か動作終了指令の何れかが出るまで待機することになる。

以上に説明してきたように、本実施形態では、レーザ制御装置は、動作終了指令が発令されるまで、ステップＳ３０２からステップＳ３２９の処理を繰り返し実行することによって、価値関数の更新を続けて、価値関数の強化学習を進めることができる。また、このレーザ制御装置は、第１実施形態または第２実施形態のレーザ制御装置における教師あり学習の学習結果として得られる学習モデルを価値関数の初期値として設定して、価値関数の強化学習を継続することによって、入力データに対して、制御回路が光出力指令を再出力することの可否に関して、より確実に正しい判定結果(行動データ)を出力できるようになる。

なお、価値関数の学習レベルが目標レベルに達すると、学習制御部２３７は、それ以上に価値関数の学習を続ける必要がない。この場合は、レーザ装置２の制御回路２５から出力停止指令が出力されると、意志決定部２３２が、出力停止指令の出力時点を含む所定期間において状態観測部２３１により観測された状態データ及び環境データ中の入力データを価値関数に入力することで得られる行動データを出力するだけでよい。そのため、判定データ取得部２３３及び学習部２３４の処理は省略されてよい。また、判定データも不要になる。

変形例によれば、光出力指令の再出力を不可とする行動データには、その理由となる、推定される損傷部位と損傷状態を表す推定損傷情報が含まれてもよい。この場合、光出力指令の再出力を不可とする行動データに対する判定データには、その行動データに含まれる推定損傷情報で表される損傷部位と損傷状態とが正解か否かの判定結果を表す情報も含まれてもよい。そして報酬計算部２３５は、光出力指令の再出力を不可とする行動データが出力された場合には、判定データに基づいて、推定損傷情報で表される損傷部位と損傷状態が正解であった場合、追加の報酬値がプラスとなるように追加の報酬値を計算し、一方、推定損傷情報で表される損傷部位と損傷状態が不正解であった場合、追加の報酬値がマイナスとなるように追加の報酬値を計算してもよい。そして報酬計算部２３５は、推定損傷情報で表される損傷部位と損傷状態の正否に対する追加の報酬値と、光出力指令の再出力の可否の正否に対する報酬値とを合算して出力してもよい。価値関数更新部２３６は、合算した報酬値に応じて、価値関数を更新してもよい。

この場合、図９のフローチャートにおいて、ステップＳ３０７で、意志決定部２３２が、制御回路２５からの光出力指令の再出力を不可する行動データを出力する場合は、推定損傷情報も行動データに含まれるようにする。また、ステップＳ３１７での修理結果入力では、修理の結果判明した損傷部位と損傷状態を表す損傷情報が入力される。なお、損傷部位は、第２実施形態のように、例えば、レーザ発振器２１、レーザ光学系２２及び光ファイバ３が複数の区間に区分され、区間ごとにラベルが割り当てられ、その複数の区分のうち、損傷部位が含まれる区間により表されればよい。また、損傷状態は、損傷の程度に応じた複数のランクの何れかとして表されればよい。

また、ステップＳ３１８では、意志決定部２３２が出力した行動データに含まれる推定損傷情報により表される損傷部位及び損傷状態と、修理結果として入力された損傷部位及び損傷状態との相違度合いも判定データとして取得される。そしてステップＳ３２１にて、報酬計算部２３５は、推定損傷情報で表される損傷部位と損傷状態の正否に対する追加の報酬値と、光出力指令の再出力の可否の正否に対する報酬値との合算値をプラスとしつつ、相違度合いが大きいほど、追加の報酬値が小さくなるように追加の報酬値を算出し、一方、相違度合いが小さいほど、追加の報酬値が大きくなるように追加の報酬値を算出すればよい。なお、この変形例においても、推定損傷情報には、損傷部位及び損傷状態の何れか一方のみが含まれてもよい。この場合、報酬計算部２３５は、損傷部位及び損傷状態のうちの推定損傷情報に含まれる方に基づいて、上記のように追加の報酬値を計算すればよい。

この変形例によれば、意志決定部２３２が、制御回路２５が光出力指令を再出力することを不可とする行動データを出力した場合に、損傷部位と損傷状態の推定結果も出力されるので、レーザ制御装置は、レーザ装置２を修復するまでに要する時間を低減できる。

また他の変形例によれば、意志決定部２３２は、状態観測部２３１により観測された状態データ及び環境データのうちの直近の所定期間の入力データを価値関数に入力することで光出力指令の再出力を不可とする行動データが得られる場合、レーザ装置２の制御回路２５に対して、通信インターフェース１１を介して、光出力停止指令を直ちに出力させることを指示する、緊急停止機能をさらに有してもよい。この緊急停止機能は、有効または無効の切り替えが可能であってもよい。なお、この所定期間の長さは、停止指令時点よりも第１所定時間遡った時点から停止指令時点の第２所定時間経過後の時点までの長さと同じとすることができる。

図１０は、緊急停止機能が含まれる場合における、価値関数の学習過程の他の一例を示すフローチャートである。この変形例による学習過程では、図９に示されるフローチャートにおける、ステップＳ３０３の処理の後に、緊急停止機能の有効・無効の判定に関する処理、及び、緊急停止機能が有効な場合における、緊急停止処理が追加される。そこで、これらの処理以外の各ステップの処理については、図９のフローチャートを参照されたい。

ステップＳ３０３にて、レーザ発振器２１からレーザ光が出力されると、学習制御部２３７は、緊急停止機能が有効となっているか否か判定する（ステップＳ３３０）。緊急停止機能が無効となっている場合（ステップＳ３３０−Ｎｏ）、学習制御部２３７は、ステップＳ３０４以降の処理を実行する。すなわち、図９に示されるフローチャートに従って価値関数の学習が進められる。一方、緊急停止機能が有効となっている場合（ステップＳ３３０−Ｙｅｓ）、状態観測部２３１は、レーザ出力光の光量の測定値及び戻り光の光量の測定値を含む、レーザ装置２の状態データ及び環境データを制御回路２５から常時取得する（ステップＳ３３１）。そして意志決定部２３２は、状態観測部２３１により観測された状態データ及び環境データのうちの直近の所定期間の入力データを価値関数に入力することで、光出力指令の再出力を不可とする行動データが得られるか否か、すなわち、異常発生の前兆が有るか否か判定する（ステップＳ３３２）。光出力指令の再出力を不可とする行動データが得られない場合（ステップＳ３３２−Ｎｏ）、すなわち、異常発生の前兆が無い場合、学習制御部２３７は、ステップＳ３０５以降の処理を実行すればよい。一方、光出力指令の再出力を不可とする行動データが得られた場合（ステップＳ３３２−Ｙｅｓ）、すなわち、異常発生の前兆が有る場合、意志決定部２３２は、制御回路２５に対して、通信インターフェース１１を介して、光出力停止指令を直ちに出力することを指示する信号、すなわち、光出力緊急停止指令を出力する（ステップＳ３３３）。そして制御回路２５がレーザ発振器２１に対して光出力停止指令を出力して、レーザ光出力が停止される。その後、学習制御部２３７は、ステップＳ３０６以降の処理を実行すればよい。

価値関数の学習が進むと、価値関数を利用することで、制御回路２５が異常の発生を検知して、光出力停止指令を出力するよりも前に、状態観測部２３１により観測される状態データ及び環境データに基づいて、このままレーザ光出力を続けると、光ファイバ３等に、光出力指令の再出力が不可なるような損傷が発生する可能性が高いことが認知される場合があり得る。そこで、上記の機能の追加によって、実際に異常の発生が検知される前に、レーザ制御装置１が、制御回路２５に光出力停止指令を出力させて、レーザ光出力を停止することによって、光出力指令の再出力が不可なるような損傷の発生を防止できる可能性が向上する。

なお、上記の緊急停止機能は、第１及び第２実施形態またはその変形例によるレーザ制御装置にも適用可能である。この場合には、判定部が学習モデルに直近の所定期間の入力データを入力することで、光出力指令の再出力を不可とする判定結果が得られる場合に、制御回路２５に対して、通信インターフェース１１を介して、光出力緊急停止指令を出力すればよい。

緊急停止機能の有効と無効を切り換えられるようにしている理由は、価値関数の学習レベルが未だ余り高くない段階では、緊急停止機能を無効とすることで、学習の進行の妨げにならないようにするためである。例えば、緊急停止機能を第２実施形態の機械学習装置に適用した場合、緊急停止機能を無効とすることで、光ファイバ３を所定の位置で意図的に破断させて入力データと光出力不可ラベルのペアサンプルを作成しようとしている時に、このようなペアサンプルの作成が妨げられるといった、学習の妨げを防止できる。

次に、第４実施形態について説明する。第４実施形態によるレーザ制御装置は、ローカルエリアネットワークを介して複数のレーザ装置と接続され、その複数のレーザ装置のそれぞれから得られる状態データ及び環境データに基づいて判定器を学習する。さらに、このレーザ制御装置は、広域ネットワークを介して接続される他のレーザ制御装置との間で、学習された判定器を共有可能とする。

図１１は、本発明の第４実施形態によるレーザ制御装置を含む、レーザ制御システムの概略構成図である。本実施形態によるレーザ制御システム１００は、複数のレーザ加工セル１０１を有する。複数のレーザ加工セル１０１は、広域ネットワーク１０２を介して互いに通信可能に接続される。

複数のレーザ加工セル１０１のそれぞれは、レーザ制御装置１と、複数のレーザ装置２とを含む。なお、各レーザ加工セル１０１において、レーザ制御装置１は、第１実施形態または第２実施形態によるレーザ制御装置、または、第３実施形態によるレーザ制御装置の何れであってもよい。そして各レーザ加工セル１０１において、レーザ制御装置１と、複数のレーザ装置２とは、ローカルネットワーク１０３を介して互いに通信可能に接続される。例えば、レーザ制御装置１の通信インターフェース１１（図１などを参照）は、ローカルネットワーク１０３と接続するための通信回路を有していればよい。ここで、ローカルネットワーク１０３は、例えば、ルータあるいはスイッチングハブといった、ネットワークを介して受信した信号の伝送先に応じてその信号の出力先を決定する機能を有する一つの中継装置の下に接続されるネットワークとすることができる。一方、広域ネットワーク１０２は、例えば、個々のローカルネットワーク１０３同士を接続するネットワークとすることができる。

各レーザ加工セル１０１において、レーザ制御装置１は、ローカルネットワーク１０３を介して複数のレーザ装置２の何れかから取得した、そのレーザ装置２の状態データ、環境データ及び異常発生の検知を表す信号などに基づいて判定器（第１、第２実施形態における学習モデル、第３実施形態における価値関数など）を学習する。さらに、レーザ制御装置１は、ローカルネットワーク１０３を介して、複数のレーザ装置２のそれぞれに対して、光出力指令の再出力の可否を表す信号などを出力することで、複数のレーザ装置２のそれぞれを制御する。

また、各レーザ加工セル１０１のレーザ制御装置１は、広域ネットワーク１０２を介して、学習された判定器あるいは学習中の判定器を共有してもよい。学習中の判定器が共有される場合には、学習に用いられた教師データの数、判定器の更新回数、あるいは、直近の報酬値の移動平均値も、広域ネットワーク１０２を介して共有されてもよい。この場合、複数のレーザ加工セル１０１のうちの何れかのレーザ制御装置１は、自装置が有する判定器の学習の進捗状況と、複数のレーザ加工セル１０１のうちの他のレーザ加工セルの判定器の学習の進捗状況とを比較して、学習が進んでいる方の判定器を、それ以降の学習対象の判定器としてもよい。この場合には、レーザ制御装置１のプロセッサ１３の学習制御部は、学習に用いられた教師データの数が多いほど、判定器の更新回数が多いほど、あるいは、直近の報酬値の移動平均値が大きいほど、判定器の学習が進捗していると判定すればよい。

レーザ制御装置１の状態観測部は、レーザ装置２の制御回路２５が出力停止指令を出力した停止指令時点から第１所定時間遡った時点と、停止指令時点から第２所定時間経過後の時点との間の１０ｍｓオーダーの所定期間の状態データ及び環境データを観測する必要があり、その結果として、状態データ及び環境データの伝送にはリアルタイム性が要求される。そこで、本実施形態では、各レーザ加工セルにおいて、レーザ制御装置とそのレーザ制御装置の制御対象となる複数（例えば、数台〜１００台）のレーザ装置とを、上記のようなローカルネットワークで接続することで要求されるリアルタイム性を満たすことができる。一方、リアルタイム性が要求されない、判定器の共有については、広域ネットワークを介して、複数のレーザ制御装置間で判定器及び学習の進捗状況を表す情報を共有することで、このレーザ制御システムは、各レーザ制御装置における、判定器の学習の進行を加速することができる。さらに、このレーザ制御システムは、何れかのレーザ加工セルのレーザ制御装置にて学習が終了した判定器を、広域ネットワークを介して、他のレーザ加工セルのレーザ制御装置も利用可能とすることができる。

次に、第５実施形態について説明する。第５実施形態では、レーザ装置の制御回路は、一旦異常発生を検知して、レーザ光出力を停止すると、レーザ光出力を再開させる指示を受信しても光出力指令をレーザ発振器へ出力しない停止状態となる。そして停止状態を解除するための停止状態解除入力部が入力装置とは別個に設けられる。

図１２は、本実施形態によるレーザ装置の概略構成図である。図１２に示されるレーザ装置２０は、図１に示されるレーザ装置２と比較して、停止状態解除入力部２９を有する点、及び制御回路２５の動作の一部で相違する。そこで以下では、制御回路２５、停止状態解除入力部２９及びその関連部分について説明する。レーザ装置２０のその他の構成要素及びレーザ制御装置１については、上記の各実施形態における対応する構成要素の説明を参照されたい。また、本実施形態によるレーザ制御装置１は、第１実施形態〜第３実施形態または変形例によるレーザ制御装置の何れであってもよい。

制御回路２５は、上記の各実施形態と同様に、出力光検出器２３によるレーザ出力光の光量の測定値及び戻り光検出器２４による戻り光の光量の測定値に基づいて、レーザ発振器２１、レーザ光学系２２または光ファイバ３において発生した異常を検知すると、レーザ発振器２１に対して出力停止指令を出力して、レーザ光の出力を停止する。さらに、制御回路２５は、例えば、内部パラメータとして保持する停止状態フラグをオンにして、停止状態に移行する。停止状態では、制御回路２５は、入力装置２６からレーザ光出力を再開させる指示を受信し、あるいは、レーザ制御装置１から光出力指令の再出力の許可または光出力指令の再出力を可とする行動データを受信しても、光出力指令をレーザ発振器２１へ出力しない。そして制御回路２５は、停止状態解除入力部２９から、停止状態の解除を指令する信号を受信すると、停止状態フラグをオフにして、停止状態を解除する。停止状態が解除されると、制御回路２５は、入力装置２６からレーザ光出力を再開させる指示を受信し、あるいは、レーザ制御装置１から光出力指令の再出力の許可または光出力指令の再出力を可とする行動データを受信すると、光出力指令をレーザ発振器２１へ出力する。

停止状態解除入力部２９は、例えば、ボタンスイッチであり、入力装置２６とは別個に、例えば、入力装置２６と異なる位置に設けられる。そして停止状態解除入力部２９は、人間による操作に応じて、停止状態の解除を指令する信号を生成し、その信号を制御回路２５へ出力する。これにより、レーザ装置２０の停止状態が解除される。なお、入力部２６及び停止状態解除入力部２９は、レーザ制御装置１に設けられてもよい。

停止状態を設定することによって、レーザ光が出力されるべきでない場合、例えば、光ファイバ３等の損傷の拡大が見込まれる場合に、入力装置２６を介して誤ってレーザ光の出力が指示されても、レーザ光出力による損傷の拡大を防止できる。また、通常の指令を入力するための入力装置２６とは別個に停止状態解除入力部２９を設けることで、誤って停止状態解除入力部２９が操作されることが防止され、その結果として、停止状態を解除すべきでない場合に停止状態が解除されることが防止される。

なお、停止状態解除入力部２９から停止状態の解除を指令する信号が入力されると、制御回路２５は、表示装置２７に、停止状態を解除する前に必要な確認を行ったか等、最終確認を促す内容を表すメッセージを表示させてもよい。また、制御回路２５は、レーザ制御装置１から光出力指令を再出力することを不可とする判定結果あるいは行動データを、推定損傷情報とともに受信した場合には、表示装置２７に、推定損傷情報で表される損傷部位と損傷状態を表示させてもよい。レーザ制御装置１が、光出力指令を再出力することを不可とする判定結果または行動データを出力した場合は、レーザ装置２０を修理することが必要であると想定される。しかし、推定される損傷部位と損傷状態とが表示装置２７に表示されると、損傷箇所の特定が容易となり、レーザ装置の修復までに要する時間を短縮できる。

変形例によれば、制御回路２５が異常発生を検知したことによってレーザ装置２０からのレーザ光出力が停止してから、レーザ制御装置１が、光出力指令の再出力を可とする判定結果あるいは行動データを出力した場合にも、制御回路２５は、レーザ装置２０の定格出力、あるいは最大出力を指定する光出力指令をレーザ発振器２１に対して出力する前に、定格出力または最大出力よりも低い出力を指定する光出力指令をレーザ発振器２１に対して出力してもよい。そして制御回路２５は、その後に、レーザ光出力を定格出力あるいは最大出力まで徐々に上げるようにレーザ発振器２１を制御してもよい。レーザ制御装置１が、光出力指令の再出力を可とする判定結果または行動データを出力した場合でも、光ファイバ３等に軽微な損傷が発生している可能性がある。しかし、この変形例によれば、光ファイバ３等に軽微な損傷が発生していても、制御回路２５は、レーザ光出力の強度を徐々に上げることによって、レーザ光出力の再開によって、レーザ発振器２１、レーザ光学系２２または光ファイバ３等の損傷が一気に拡大することを防止できる。そのため、レーザ発振器２１、レーザ光学系２２または光ファイバ３等の損傷の拡大が最小限に抑制される。

図１３は、本発明の第５実施形態によるレーザ装置が制御される場合の価値関数の学習過程の一例を示すフローチャートである。なお、図１３のフローチャートでは、第３実施形態によるレーザ制御装置１がレーザ装置２０を制御するものとしている。

レーザ装置２０が動作を開始すると、学習制御部２３７が、制御回路２５が光出力指令の出力を要求されているか否かを判定する（ステップＳ４０１）。光出力指令の出力を要求されていれば（ステップＳ４０１−Ｙｅｓ）、学習制御部２３７は、制御回路２５に対して、通信インターフェース１１を介して光出力指令に従ってレーザ光を出力することを許可する制御信号を出力する。そして制御回路２５がレーザ発振器２１に対して光出力指令を出力することで、レーザ発振器２１からレーザ光が出力される（ステップＳ４０２）。

状態観測部２３１は、レーザ出力光の光量の測定値及び戻り光の光量の測定値を含む、レーザ装置２の状態データ及び環境データを制御回路２５から常時取得するとともに、制御回路２５による、異常発生の検知及び出力停止指令が出力されたか否かも常時観測し、異常発生が検知されたときには、異常発生の検知を表す信号を制御回路２５から通信インターフェース１１を介して取得する（ステップＳ４０３）。

学習制御部２３７が、状態観測部２３１を経由して、制御回路２５が異常発生を検知したか否か、すなわち、出力停止指令が出力されたか否かを判定する（ステップＳ４０４）。出力停止指令が出力された場合（ステップＳ４０４−Ｙｅｓ）、学習制御部２３７は、メモリ１２（例えば、リングバッファ）から、制御回路２５が出力停止指令を出力した停止指令時点よりも第１所定時間遡った時点から停止指令時点の第２所定時間経過後の時点までの所定期間内の状態データ及び環境データの少なくとも何れかを入力データとして読み込む（ステップＳ４０５）。

意志決定部２３２は、読み込んだ入力データを価値関数に入力することで、行動データを決定する（ステップＳ４０６）。そして意志決定部２３２は、その行動データを、通信インターフェース１１を介して制御回路２５へ出力する。制御回路２５は、受信した行動データが、再光出力可データであるか、あるいは、再光出力不可データであるかを判定する（ステップＳ４０７）。

行動データが再光出力可データであると判定された場合（ステップＳ４０７−Ｙｅｓ）、制御回路２５は、光出力指令に含まれる出力設定値Ｐに、例えば、最大出力Ｐｍａｘの１００分の１のような微小出力値ΔＰを設定する（ステップＳ４０８）。そして制御回路２５は、光出力指令をレーザ発振器２１へ出力することでレーザ光が出力される（ステップＳ４０９）。レーザ制御装置１の状態観測部２３１は、ステップＳ４０３と同様に、レーザ装置２の状態データ及び環境データを制御回路２５から常時取得するとともに、制御回路２５による、異常発生の検知及び出力停止指令が出力されたか否かも常時観測し、異常発生が検知されたときには、異常発生の検知を表す信号を制御回路２５から通信インターフェース１１を介して取得する（ステップＳ４１０）。そして学習制御部２３７は、ステップＳ４０４と同様に、出力停止指令が出力されたか否かを判定する（ステップＳ４１１）。出力停止指令が出力された場合（ステップＳ４１１−Ｙｅｓ）、ステップＳ４０５と同様に、学習制御部２３７は、メモリ１２から、停止指令時点を含む所定期間内の状態データ及び環境データの少なくとも何れかを入力データとして読み込む（ステップＳ４１２）。そして意志決定部２３２は、ステップＳ４０６と同様に、読み込んだ入力データを価値関数に入力することで、行動データを決定する（ステップＳ４１３）。そして意志決定部２３２は、その行動データを、通信インターフェース１１を介して制御回路２５へ出力する。制御回路２５は、ステップＳ４０７と同様に、受信した行動データが、再光出力可データであるか、あるいは、再光出力不可データであるかを判定する（ステップＳ４１４）。受信した行動データが再光出力可データであると判定された場合（ステップＳ４１４−Ｙｅｓ）、制御回路２５は、光出力指令に含まれる出力設定値Ｐが最大出力Ｐｍａｘより大きいか否か判定する（ステップＳ４１５）。出力設定値Ｐが最大出力Ｐｍａｘより小さいと判定された場合（ステップＳ４１５−Ｎｏ）、出力設定値Ｐに微小出力値ΔＰを加えた値を新たな出力設定値Ｐとする（ステップＳ４１６）。そして制御回路２５は、新たな出力設定値Ｐに従ってステップＳ４０９以降の処理を繰り返す。

なお、ステップＳ４１１にて、出力停止指令が出力されたと判定された場合、ステップＳ４１２及びステップＳ４１３の処理が行われ、ステップＳ４１４で、受信した行動データが再光出力可データであった場合、制御回路２５は、念のため、ステップＳ４１５の処理の代わりに、ステップＳ４０８の処理を実行して、出力設定値を微小出力値ΔＰに戻してもよい。

上記のように、制御回路２５から出力停止指令が出力されても、意志決定部２３２から、制御回路２５が光出力指令を再出力することを可とする行動データ（再光出力可データ）が出力され、ステップＳ４０９からステップＳ４１６までの処理が繰り返されることによって、出力設定値Ｐが次第に高い値となる。そしてステップＳ４１５にて、出力設定値Ｐが最大出力Ｐｍａｘに達したと判定されると（ステップＳ４１５−Ｙｅｓ）、判定データ取得部２３３は、実際に、最大出力Ｐｍａｘレベルのレーザ光を再出力できたという判定データを取得する（ステップＳ４１７）。

報酬計算部２３５は、意志決定部２３２から出力された行動データが、再光出力可データであったか、あるいは、再光出力不可データであったかを判定する（ステップＳ４１８）。上記の制御の流れにおいては、行動データは再光出力可データであり（ステップＳ４１８−Ｙｅｓ）、ステップＳ４１７で得られた判定データにより、行動データは正解であることが分かる。そこで、報酬計算部２３５は、報酬値がプラスとなるように報酬値を計算する（ステップＳ４１９）。そして価値関数更新部２３６は、算出された報酬値に基づいて価値関数を更新する（ステップＳ４２１）。

なお、ステップＳ４１１において、学習制御部２３７が、制御回路２５から出力停止指令が出力されていないと判定した場合（ステップＳ４１１−Ｎｏ）、ステップＳ４１２〜Ｓ４１４の処理が行われずに、ステップＳ４１５以降の処理が実行される。

一方、ステップＳ４０７またはステップＳ４１４にて、受信した行動データが再光出力不可データであると判定された場合（ステップＳ４０７−ＮｏまたはステップＳ４１４−Ｎｏ）、制御回路２５は停止状態に移行する（ステップＳ４２２）。なお、制御回路２５は、レーザ制御装置１へ、停止状態に移行したことを通知してもよい。そして制御回路２５は、レーザ装置２０が停止状態であり、調査が必要であることを表すメッセージを表示装置２７に表示させる（ステップＳ４２３）。レーザ装置２０が停止状態であることを受けて、人間（担当者）が、レーザ装置２０の損傷が疑われる部分から分解調査して損傷部の有無及び損傷状態を調査し、その調査結果が入力装置２６を介して入力される（ステップＳ４２４）。調査結果には、レーザ光の再出力が可であるか不可であるかという結論も含まれる。そこで学習制御部２３７は、入力された調査結果において、レーザ光の再出力が可であるか否かを判定する（ステップＳ４２５）、レーザ光の再出力が可である場合（ステップＳ４２５−Ｙｅｓ）、学習制御部２３７は、その旨を制御回路２５へ通知する。制御回路２５は、停止状態フラグを参照して、停止状態が解除されているか否かを判定する（ステップＳ４２６）、停止状態が解除されていれば（ステップＳ４２６−Ｙｅｓ）、制御回路２５及びレーザ制御装置１は、ステップＳ４０８以降の処理を実行する。

一方、停止状態が解除されていない場合（ステップＳ４２６−Ｎｏ）、制御回路２５は、レーザ装置２０が停止状態にあり、レーザ光出力を再開するには停止状態を解除する必要があることを表すメッセージを表示装置２７に表示させる（ステップＳ４２７）。そして停止状態解除入力部２９から停止状態を解除する指令が入力されると、制御回路２５は、停止状態を解除する（ステップＳ４２８）。

その後、ステップＳ４２６にて停止状態が解除されていると判定され、ステップＳ４０８以降の処理が実行される。この制御の流れにおいても、ステップＳ４１７において、最大出力Ｐｍａｘのレーザ光を再出力できたという判定データが取得される。しかし、ステップＳ４１８において、意志決定部２３２からから出力された行動データが再光出力不可データであると判定される（ステップＳ４１８−Ｎｏ）。そのため、この行動データは、判定データから不正解であることが分かる。そこで、報酬計算部２３５は、報酬値がマイナスとなるように報酬値を計算する（ステップＳ４２０）。そして価値関数更新部２３６は、算出された報酬値に従って価値関数を更新する（ステップＳ４２１）。

また、ステップＳ４２５にて、調査の結果、レーザ光の再出力が不可であると判定された場合（ステップＳ４２５−Ｎｏ）、担当者によって、レーザ装置２０または光ファイバ３の損傷部の修理が行われる（ステップＳ４２９）。そして入力装置２６を介して修理結果が入力される（ステップＳ４３０）。さらに、修理が完了したので、停止状態解除入力部２９を介して停止状態を解除する指令が入力される（ステップＳ４３１）。続いて、判定データ取得部２３３は、意志決定部２３２から出力された行動データと、入力装置２６から入力された修理結果を判定データとして取得する（ステップＳ４３２）。そして報酬計算部２３５は、意志決定部２３２から出力された行動データが、再光出力可データであったか、あるいは、再光出力不可データであったかを判定する（ステップＳ４３３）。

ステップＳ４０７において意志決定部２３２から出力された行動データが再光出力可データであったと判定された場合（ステップＳ４３３−Ｙｅｓ）、行動データが再光出力可データでありながら、実際は、レーザ装置２０または光ファイバ３が再光出力不可の状態で修理する必要があったので、意志決定部２３２から出力された行動データは不正解ということになる。そのため、報酬計算部２３５は、報酬値がマイナスとなるように報酬値を計算する（ステップＳ４３４）。

一方、ステップＳ４０７において意志決定部２３２から出力された行動データが再光出力不可データであったと判定された場合（ステップＳ４３３−Ｎｏ）、行動データが再光出力不可データであり、実際にレーザ装置２０または光ファイバ３が再光出力不可の状態で修理する必要があったので、意志決定部２３２から出力された行動データは正解ということになる。そのため、報酬計算部２３５は、報酬値がプラスとなるように報酬値を計算する（ステップＳ４３５）。ステップＳ４３４またはＳ４３５の後、価値関数更新部２３６は、算出された報酬値に従って価値関数を更新する（ステップＳ４２１）。

ステップＳ４２１に続いて、学習制御部２３７は、報酬値の移動平均が目標値より大きくなったか否か判定する（ステップＳ４３６）。報酬の移動平均値が目標値より大きくなれば（ステップＳ４３６−Ｙｅｓ）、価値関数の学習レベルが目標レベルに達したと考えられる。そして学習制御部２３７は、通信インターフェース１１を介して、表示装置２７に学習レベルが目標レベルに達したことを表示させる（ステップＳ４３７）。それ以降は、判定データの取得及び報酬計算のステップは省略されてもよい。

その後、学習制御部２３７は、レーザ装置２０に対して動作終了指令が出ているか否かを判定する（ステップＳ４３８）。また、ステップＳ４０１にて、光出力指令の出力が要求されていない場合も（ステップＳ４０１−Ｎｏ）、学習制御部２３７は、ステップＳ４３８の処理を実行すればよい。動作終了指令が出ている場合（ステップＳ４３８−Ｙｅｓ）、レーザ制御装置１は動作を終了する。

一方、動作終了指令が出ていない場合（ステップＳ４３８−Ｎｏ）、レーザ制御装置１及び制御回路２５は、ステップＳ４０１以降の処理を繰り返す。なお、ステップＳ４０１で、レーザ装置２０に光出力指令が出ておらず、かつ、ステップＳ４３８にて、動作終了指令がでていない場合は、レーザ制御装置１及び制御回路２５は、光出力指令か動作終了指令の何れかが出るまで待機することになる。

本実施形態によるレーザ装置の制御回路は、上記のように、異常発生を検知して、レーザ発振器からのレーザ光出力を一旦停止させた後に、レーザ制御装置から光出力指令の再出力を可とする判定結果または行動データが得られると、レーザ光出力を微小な出力から定格出力または最大出力まで徐々に上昇させるよう、レーザ発振器を制御する。そのため、光ファイバ等に軽微な損傷が発生している場合に、レーザ制御装置が光出力指令の再出力を可とする判定結果または行動データを出力しても、レーザ光出力を徐々に上げて行くことで、レーザ光出力の再開により、光ファイバ等の損傷が一気に拡大することが防止される。その結果として、光ファイバ等の損傷の拡大が最小限に抑制される。

また、通常の指令を入力する入力装置とは別個に停止状態解除入力部を設けることによって、誤って停止状態解除入力部２９が操作されることが防止され、その結果として、停止状態を解除すべきでない場合に停止状態が解除されることが防止される。

次に、第６実施形態について説明する。第６実施形態によるレーザ装置は、直近の一定期間の状態データ及び環境データを記憶する状態データ記録部をさらに有する。そしてこのレーザ装置は、異常発生が検知されてレーザ光出力が停止されたときに、状態データ記録部に記憶されている、そのレーザ光出力の停止時点を含む所定期間の状態データ及び環境データをレーザ制御装置へ送信する。

図１４は、本発明の第６実施形態によるレーザ装置を含むレーザ制御システムの概略構成図である。本実施形態によるレーザ制御システム２００は、少なくとも一つのレーザ装置２０１と、レーザ制御装置１とを有する。各レーザ装置２０１は、ローカルネットワーク２０２、２０３及び広域ネットワーク２０４を介してレーザ制御装置１と通信可能に接続される。レーザ制御装置１は、上記の各実施形態によるレーザ制御装置の何れかとすることができる。また、ローカルネットワーク２０２、２０３は、図１１に示されるローカルネットワーク１０３と同様のものとすることができる。同様に、広域ネットワーク２０４は、図１１に示される広域ネットワーク１０２と同様のものとすることができる。なお、図１４において、破線の接続信号線は、接続が常時確立されておらず、必要な時に接続が確立されることを表している。

本実施形態によるレーザ装置２０１は、図１に示されるレーザ装置２と比較して、状態データ記録部３０を有する点で相違する。そこで以下では、状態データ記録部３０及びその関連部分について説明する。レーザ装置２０１のその他の構成要素及びレーザ制御装置の各構成要素については、上記の各実施形態における対応する構成要素の説明を参照されたい。

状態データ記録部３０は、例えば、リングバッファを有する。そして制御回路２５は、状態データ及び環境データを取得する度に、状態データ記録部３０に、その状態データ及び環境データを書き込む。すなわち、状態データ記録部３０には、リアルタイムで最新の状態データ及び環境データが書き込まれる。そして状態データ記録部３０に記録されている状態データ及び環境データの容量が、状態データ記録部３０のメモリ容量を超えると、古い方の状態データ及び環境データから順に上書きされる。これにより、状態データ記録部３０には、直近の一定期間の状態データ及び環境データが記録される。なお、一定期間は、制御回路２５が異常発生を検知して出力停止指令を出力した停止指令時点から第１所定時間遡った時点と停止指令時点から第２所定時間経過後の時点との間の所定期間以上に設定される。

制御回路２５は、上記の各実施形態のように異常発生を検知して、レーザ発振器２１に対して出力停止指令を出力してから第２所定時間が経過すると、状態データ及び環境データの状態データ記録部３０への書き込みを停止する。これにより、状態データ記録部３０には、上記の所定期間の状態データ及び環境データが記録されていることになる。

また、レーザ装置２０１がレーザ光出力を停止して、上記の所定期間の状態データ及び環境データが状態データ記録部３０に記録されたときに、レーザ装置２０１とレーザ制御装置１との接続が確立されていない場合、制御回路２５は、レーザ装置２０１とレーザ制御装置１間の接続を確立するための処理を実行して、レーザ装置２０１とレーザ制御装置１間の接続を確立する。なお、物理的にレーザ装置２０１とローカルネットワーク２０２間を接続する信号線が外されている場合には、その信号線が接続されてから、制御回路２５は、上記の接続を確立する処理を実行すればよい。そして接続が確立されると、制御回路２５は、状態データ記録部３０から読み出した所定期間の状態データ及び環境データをレーザ制御装置１へ送信する。なお、上記の所定期間の状態データ及び環境データが状態データ記録部３０に記録されたときに、レーザ装置２０１とレーザ制御装置１との接続が確立されている場合には、制御回路２５は、状態データ記録部３０から読み出した所定期間の状態データ及び環境データをレーザ制御装置１へ直ちに送信すればよい。そしてレーザ制御装置１は、受信した所定期間の状態データ及び環境データを利用して、判定器を学習し、あるいは、光出力指令の再出力の可否を判定する。

本実施形態によれば、レーザ装置とレーザ制御装置間の通信が確立されておらず、レーザ装置がリアルタイムに状態データ及び環境データをレーザ制御装置へ送信できない場合でも、レーザ装置は、レーザ装置において異常発生が検知され、レーザ光出力が停止される前後の状態データ及び環境データをレーザ制御装置へ送信できる。
なお、状態データ記録部３０には、所定期間の状態データ及び環境データのうち、判定器への入力に利用される入力データのみが記録されてもよい。この場合、制御回路２５は、レーザ装置２０１とレーザ制御装置１との接続が確立されると、状態データ記録部３０から読み出した所定期間の入力データをレーザ制御装置１へ送信すればよい。

次に、第７実施形態について説明する。第７実施形態によるレーザ装置は、上記の何れかの実施形態によるレーザ制御装置により学習された判定器を表すデータを記憶する。そしてレーザ装置の制御回路自体が、そのデータを利用して、判定部または意志決定部の処理を実行することで、異常発生が検知されてレーザ光出力が一旦停止した後に、光出力指令の再出力の可否を判定する。

図１５は、本発明の第７実施形態によるレーザ装置の概略構成図である。本実施形態によるレーザ装置２１０は、レーザ発振器２１と、レーザ光学系２２と、出力光検出器２３と、戻り光検出器２４と、制御回路２５と、入力装置２６と、表示装置２７と、学習結果記録部３１とを有する。そしてレーザ発振器２１から出力されたレーザ光は、レーザ光学系２２及び光ファイバ３を伝搬して加工ヘッド４からワーク（加工対象物）５へ照射される。なお、レーザ装置２１０は、入力装置２６とは別個に、第５実施形態に示された停止状態解除入力部をさらに有してもよい。本実施形態によるレーザ装置２１０は、図１に示されるレーザ装置２と比較して、学習結果記録部３１を有する点、及び、制御回路２５による処理の一部について相違する。そこで以下では、学習結果記録部３１及び制御回路２５の処理について説明する。レーザ装置２１０のその他の構成要素については、上記の各実施形態における対応する構成要素の説明を参照されたい。

学習結果記録部３１は、例えば、不揮発性の半導体メモリ回路、または、磁気記録媒体及びそのアクセス装置を有する。そして学習結果記録部３１は、上記の何れかの実施形態によるレーザ制御装置により学習された判定器を表すデータを記憶する。例えば、学習結果記録部３１は、第１または第２実施形態によるレーザ制御装置において学習された学習モデルを表すデータ、または、第３実施形態によるレーザ制御装置において学習された価値関数を表すデータを記憶する。なお、判定器を表すデータには、その判定器の構成を表すデータ（例えば、ニューラルネットワークの各層のニューロンにより実行される演算を規定するためのデータ、または、サポートベクトルマシンのサポートベクトルを表すデータ等）だけでなく、その判定器に関する処理を実行するためのアプリケーションプログラムが含まれる。

制御回路２５は、異常発生を検知してレーザ発振器２１へ光出力停止指令を出力してレーザ光出力が停止された後に、学習結果記録部３１に記憶されている判定器を表すデータと、上記の所定期間の状態データ及び環境データ中の入力データとを用いて光出力指令の再出力の可否を判定する。すなわち、学習結果記録部３１に、学習モデルを表すデータが記憶されている場合、制御回路２５は、そのデータを利用して、第１実施形態または第２実施形態におけるレーザ制御装置のプロセッサの状態観測部及び判定部の処理を実行する。また、学習結果記録部３１に、価値関数を表すデータが記憶されている場合、制御回路２５は、そのデータを利用して、第３実施形態におけるレーザ制御装置のプロセッサの状態観測部及び意志決定部の処理を実行すればよい。また、レーザ装置２１０が停止状態解除入力部を有する場合には、第５実施形態と同様に、制御回路２５は、異常発生を検知すると、例えば、内部パラメータとして保持する停止状態フラグをオンにして、レーザ装置２１０を停止状態に移行させてもよい。そして制御回路２５は、停止状態解除入力部を介して停止状態を解除する操作が行われると、停止状態フラグをオフにして、レーザ装置２１０の停止状態を解除すればよい。

このように、学習された判定器のデータをレーザ装置自身が利用可能に保持することで、レーザ装置自身が光出力指令の再出力の可否を適切に判定できる。したがって、上記の各実施形態のようなレーザ制御装置が無い、あるいは、ネットワーク環境が不備であり、レーザ制御装置と通信不能な場所にレーザ装置が設置されても、レーザ装置は、光ファイバ等の損傷が拡大することを抑制できる。

さらに、第１〜第６実施形態におけるレーザ制御装置のメモリ１２にも、学習された判定器を表すデータが予め記憶されてもよい。この場合には、例えば、他のレーザ制御装置により、判定器が予め学習されればよい。そしてこの場合、レーザ制御装置のプロセッサ１３において、判定器の学習に関連する処理は省略されてもよい。すなわち、第１実施形態または第２実施形態のように、判定器として学習モデルが用いられる場合、プロセッサ１３は、状態観測部及び判定部の処理を実行すればよい。また、第３実施形態のように、判定器として価値関数が用いられる場合、プロセッサ１３は、状態観測部及び意志決定部の処理を実行すればよい。

なお、上記の各実施形態または変形例において、判定器は、入力データに対して、レーザ光の再出力により、レーザ発振器または光ファイバを含むレーザ光学系の損傷が拡大するか否かの予測結果を出力してもよい。レーザ発振器または光ファイバを含むレーザ光学系の損傷が拡大するとの予測結果を出力することは、レーザ光の再出力を不可とする判定結果を出力することと実質的に同義である。また、レーザ発振器及び光ファイバを含むレーザ光学系の損傷が拡大しないとの予測結果を出力することは、レーザ光の再出力を可とする判定結果を出力することと実質的に同義である。

ここに挙げられた全ての例及び特定の用語は、読者が、本発明及び当該技術の促進に対する本発明者により寄与された概念を理解することを助ける、教示的な目的において意図されたものであり、本発明の優位性及び劣等性を示すことに関する、本明細書の如何なる例の構成、そのような特定の挙げられた例及び条件に限定しないように解釈されるべきものである。本発明の実施形態は詳細に説明されているが、本発明の精神及び範囲から外れることなく、様々な変更、置換及び修正をこれに加えることが可能であることを理解されたい。

１レーザ制御装置
１１通信インターフェース
１２メモリ
１３プロセッサ
１３１状態観測部
１３２ラベル取得部
１３３判定部
１３４学習部
１３５学習制御部
２３１状態観測部
２３２意志決定部
２３３判定データ取得部
２３４学習部
２３５報酬計算部
２３６価値関数更新部
２３７学習制御部
２、２０、２０１、２１０レーザ装置
２１レーザ発振器
２２レーザ光学系
２３出力光検出器
２４戻り光検出器
２５制御回路
２６入力装置
２７表示装置
２８光ファイバ破断装置
２９停止状態解除入力部
３０状態データ記録部
３１学習結果記録部
１００、２００レーザ制御システム
１０１レーザ加工セル
１０２、２０４広域ネットワーク
１０３、２０２、２０３ローカルネットワーク
３光ファイバ
４加工ヘッド
５ワーク
２８１ａ光ファイバ固定ホルダー
２８１ｂ光ファイバ移動ホルダー
２８１ｃ円弧駆動装置
２８１ｄ円弧駆動用ガイドレール
２８１ｅ遮光筐体
２８１ｆ散乱光検出器
２８２ａリニア駆動用ガイドレール
２８２ｂリニア駆動装置
２８２ｃエッジ
２８２ｄエッジ受け台
２８２ｅ出力光検出器
２８２ｆ遮光筐体
２８３ａレーザ発振器
２８３ｂ集光光学系
２８３ｃ出力光検出器
２８３ｄ遮光筐体

Claims

レーザ光を出力するレーザ発振器と、前記レーザ発振器から出力されるレーザ光の光量を検出する出力光検出器と、前記レーザ光を伝搬させる光ファイバを含むレーザ光学系を、前記レーザ光の伝搬方向とは逆向きに伝搬する戻り光の光量を検出する戻り光検出器と、前記レーザ発振器を制御する制御回路とを有するレーザ装置を制御するレーザ制御装置であって、
前記制御回路が前記レーザ発振器または前記レーザ光学系における異常の発生を検知して前記レーザ発振器からのレーザ出力を停止させると、当該レーザ出力の停止時点を含む所定期間の前記レーザ装置の状態を表す状態データ及び前記レーザ装置及び前記光ファイバが設置された環境の状態を表す環境データの少なくとも一部である入力データに基づいて前記レーザ発振器からのレーザ光の再出力の可否を判定する判定器に前記入力データを入力することで、前記レーザ発振器からのレーザ光の再出力の可否を判定し、当該判定結果に従って前記制御回路を制御する判定部を有し、
前記所定期間の前記状態データ及び前記入力データは、前記所定期間における前記レーザ光の光量の時系列データ及び前記戻り光の光量の時系列データのうちの少なくとも一方を含む、レーザ制御装置。
複数の前記停止時点のそれぞれにおける前記入力データに基づいて前記判定器を学習する学習部をさらに有する、請求項１に記載のレーザ制御装置。
複数の前記停止時点のそれぞれについて、当該停止時点以降に前記レーザ発振器がレーザ光を再出力することで前記レーザ発振器または前記レーザ光学系において損傷が拡大する場合にレーザ光の再出力を不可とすることを表し、一方、当該停止時点以降に前記レーザ発振器がレーザ光を再出力しても前記レーザ発振器及び前記レーザ光学系において損傷が拡大しない場合にレーザ光の再出力を可とすることを表すラベルデータを取得するラベル取得部をさらに有し、
前記学習部は、複数の前記停止時点のそれぞれにおける前記入力データと前記ラベルデータとの組み合わせに基づく教師有り学習手法に従って前記判定器を学習する、請求項２に記載のレーザ制御装置。
前記光ファイバの所定の区間で前記光ファイバを破断可能な破断装置をさらに有し、
前記ラベル取得部は、前記複数の停止時点のうち、前記破断装置により前記光ファイバが破断されることで前記異常の発生が検知された停止時点における前記ラベルデータを、レーザ光の再出力を不可とすることを表すデータとして取得する、請求項３に記載のレーザ制御装置。
複数の前記停止時点のそれぞれについて、当該停止時点を含む前記所定期間の前記入力データを入力することで前記判定器が出力したレーザ光の再出力の可否の判定結果に従って前記制御回路が前記レーザ発振器を制御したことが正解か否かを表す判定データを取得する判定データ取得部をさらに有し、
前記学習部は、複数の前記停止時点のそれぞれについて、当該停止時点における前記判定データに応じた強化学習手法に従って前記判定器を学習し、
前記判定結果がレーザ光の再出力を可と判定するものであり、かつ、前記レーザ発振器からレーザ光が再出力されても前記レーザ発振器及び前記レーザ光学系の損傷が拡大しない場合、または、前記判定結果がレーザ光の再出力を不可と判定するものであり、かつ、前記レーザ発振器からレーザ光が再出力されると前記レーザ発振器または前記レーザ光学系の損傷が拡大する場合、前記判定データは正解であることを表す、請求項２に記載のレーザ制御装置。
第１の通信ネットワークを介して接続される複数の前記レーザ装置、及び、前記第１の通信ネットワークと他のレーザ制御装置が接続される他の通信ネットワークとを接続する第２の通信ネットワークを介して接続される前記他のレーザ制御装置と通信可能に構成される通信部をさらに有し、
前記学習部は、前記第１の通信ネットワークを介して接続される複数の前記レーザ装置の何れか一つ以上から前記通信部を介して取得した前記入力データに基づいて前記判定器を学習し、
前記判定部は、前記第１の通信ネットワークを介して接続される複数の前記レーザ装置のそれぞれについて、当該レーザ装置から得られた前記入力データを前記判定器に入力することで、当該レーザ装置の前記レーザ発振器からのレーザ光の再出力の可否を判定し、
前記判定器は前記他のレーザ制御装置と共有される、請求項２〜５の何れか一項に記載のレーザ制御装置。
前記判定器は、レーザ光の再出力を不可とする判定結果を出力する場合に、前記レーザ発振器または前記レーザ光学系において推定される損傷部位及び損傷状態の少なくとも一方をさらに出力し、
前記判定部は、前記推定される損傷部位及び損傷状態の少なくとも一方を表示装置に表示させる、請求項１に記載のレーザ制御装置。
複数の前記停止時点のそれぞれにおける前記入力データと損傷部位及び損傷状態の前記少なくとも一方に基づいて前記判定器を学習する学習部をさらに有する、請求項７に記載のレーザ制御装置。
前記判定部は、前記所定期間と同じ長さの直近の一定期間における前記入力データを前記判定器に入力することで前記判定器がレーザ光の再出力を不可とする判定結果を出力する場合、前記レーザ光の出力が停止されるように前記制御回路を制御する、請求項１〜８の何れか一項に記載のレーザ制御装置。
前記レーザ装置は、前記制御回路が前記レーザ発振器からのレーザ出力を停止させるとレーザ出力を再開しない停止状態へ移行し、
前記レーザ装置を操作するための入力部と、
前記入力部と別個に設けられ、かつ、前記制御回路が前記レーザ発振器からのレーザ出力を停止させた後に、前記停止状態を解除するための操作を受け付ける停止状態解除入力部とをさらに有する、請求項１〜９の何れか一項に記載のレーザ制御装置。
レーザ装置と、前記レーザ装置と通信ネットワークを介して通信可能なレーザ制御装置とを有するレーザ制御システムであって、
前記レーザ装置は、
レーザ光を出力するレーザ発振器と、
前記レーザ発振器から出力されるレーザ光の光量を検出する出力光検出器と、
前記レーザ光を伝搬させる光ファイバを含むレーザ光学系を、前記レーザ光の伝搬方向とは逆向きに伝搬する戻り光の光量を検出する戻り光検出器と、
前記レーザ発振器を制御する制御回路と、
前記制御回路が前記レーザ発振器または前記レーザ光学系における異常の発生を検知して前記レーザ発振器からのレーザ出力を停止させると、当該レーザ出力の停止時点を含む所定期間の前記レーザ装置の状態を表す状態データ及び前記レーザ装置及び前記光ファイバが設置された環境の状態を表す環境データの少なくとも一部である入力データを記憶する状態データ記録部と、
を有し、前記制御回路は、前記通信ネットワークを介して前記レーザ装置と前記レーザ制御装置間の通信が確立されると、前記状態データ記録部に記憶されている前記入力データを前記レーザ制御装置へ送信し、
前記レーザ制御装置は、
前記レーザ発振器からのレーザ光の再出力の可否を判定する判定器に前記入力データを入力することで、前記レーザ発振器からのレーザ光の再出力の可否を判定し、当該判定結果に従って前記制御回路を制御する判定部を有し、
前記所定期間の前記状態データ及び前記入力データは、前記所定期間における前記レーザ光の光量の時系列データ及び前記戻り光の光量の時系列データのうちの少なくとも一方を含む、レーザ制御システム。
レーザ光を出力するレーザ発振器と、
前記レーザ発振器から出力されるレーザ光の光量を検出する出力光検出器と、
前記レーザ光を伝搬させる光ファイバを含むレーザ光学系を、前記レーザ光の伝搬方向とは逆向きに伝搬する戻り光の光量を検出する戻り光検出器と、
前記レーザ発振器または前記レーザ光学系における異常の発生を検知すると前記レーザ発振器からのレーザ出力を停止させ、当該レーザ出力の停止時点を含む所定期間の前記レーザ装置の状態を表す状態データ及び前記レーザ装置及び前記光ファイバが設置された環境の状態を表す環境データの少なくとも一部である入力データに基づいて前記レーザ発振器からのレーザ光の再出力の可否を判定する判定器に前記入力データを入力することで、前記レーザ発振器からのレーザ光の再出力の可否を判定し、当該判定結果に従って前記レーザ発振器にレーザ光を再出力させるか否かを制御する制御回路と、
を有し、
前記所定期間の前記状態データ及び前記入力データは、前記所定期間における前記レーザ光の光量の時系列データ及び前記戻り光の光量の時系列データのうちの少なくとも一方を含む、レーザ装置。
前記レーザ装置は、前記制御回路が前記レーザ発振器からのレーザ出力を停止させるとレーザ出力を再開しない停止状態へ移行し、
前記レーザ装置を操作するための入力部と、
前記入力部と別個に設けられ、かつ、前記制御回路が前記レーザ発振器からのレーザ出力を停止させた後に、前記停止状態を解除するための操作を受け付ける停止状態解除入力部とをさらに有する、請求項１２に記載のレーザ装置。
レーザ光を出力するレーザ発振器と、前記レーザ発振器から出力されるレーザ光の光量を検出する出力光検出器と、前記レーザ光を伝搬させる光ファイバを含むレーザ光学系を、前記レーザ光の伝搬方向とは逆向きに伝搬する戻り光の光量を検出する戻り光検出器と、前記レーザ発振器を制御する制御回路とを有するレーザ装置を制御するレーザ制御方法であって、
前記制御回路が前記レーザ発振器または前記レーザ光学系における異常の発生を検知して前記レーザ発振器からのレーザ出力を停止させると、当該レーザ出力の停止時点を含む所定期間の前記レーザ装置の状態を表す状態データ及び前記レーザ装置及び前記光ファイバが設置された環境の状態を表す環境データのうちの少なくとも一部である入力データに基づいて前記レーザ発振器からのレーザ光の再出力の可否を判定する判定器に前記入力データを入力することで、前記レーザ発振器からのレーザ光の再出力の可否を判定し、
前記判定結果に従って前記制御回路を制御する、ことを含み、
前記所定期間の前記状態データ及び前記入力データは、前記所定期間における前記レーザ光の光量の時系列データ及び前記戻り光の光量の時系列データのうちの少なくとも一方を含む、レーザ制御方法。
複数の前記停止時点のそれぞれにおける前記入力データに基づいて前記判定器を学習することをさらに含む、請求項１４に記載のレーザ制御方法。