JP2021026507A - 対話式診断装置 - Google Patents

対話式診断装置 Download PDF

Info

Publication number
JP2021026507A
JP2021026507A JP2019144002A JP2019144002A JP2021026507A JP 2021026507 A JP2021026507 A JP 2021026507A JP 2019144002 A JP2019144002 A JP 2019144002A JP 2019144002 A JP2019144002 A JP 2019144002A JP 2021026507 A JP2021026507 A JP 2021026507A
Authority
JP
Japan
Prior art keywords
question
defect
unit
evaluation index
answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019144002A
Other languages
English (en)
Inventor
哲朗 姉川
Tetsuro ANEKAWA
哲朗 姉川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fanuc Corp
Original Assignee
Fanuc Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fanuc Corp filed Critical Fanuc Corp
Priority to JP2019144002A priority Critical patent/JP2021026507A/ja
Publication of JP2021026507A publication Critical patent/JP2021026507A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】知見が足りないユーザにとっても、判断しやすい質問を優先して選び、簡潔な対話で不具合が診断可能なエキスパートシステムを提供する。【解決手段】対話式診断装置1は、ユニットで発生するエラー毎に当該エラーの原因となる全ての不具合候補の集合と、実際の不具合を推定するための質問の集合と、推定される不具合が各不具合候補であった場合に、質問に対して肯定を示す回答が得られる確率とを格納する不具合・質問対応データベース20を備える。質問毎の確率と、質問に対する回答が肯定か否定かを示す指数との内積である可能性指数を算出し、各不具合候補に対応する複数の質問における、可能性指数の合計値に重み係数を乗じた質問評価指数を算出し、不具合候補毎に、優先順位に従った質問順となっている複数の質問のうち最新の質問において、不具合候補間で同一の質問については質問評価指数を合算し、質問評価指数が最も大きな質問を提示する。【選択図】図1

Description

本発明は、対話式診断装置に関する。
工作機械に不具合が発生した際、ユーザが不具合の原因を判断することは困難であるため、工作機械の製造者に問い合わせをするケースが多い。しかし、製造者側で全ての問い合わせに対応することは、製造者の工数を過剰に消費してしまうために、迅速な回答が難しい場合がある。そこで、製造者に頼らずに問い合わせに対応するための調査方法の模索が必要と考えられる。
製造者側の専門家による調査方法を人工知能に任せる仕組みはエキスパートシステムと呼ばれる。従来のエキスパートシステムは、ユーザに質問することで、どれだけ正しい診断結果を導けるかという所に重点が置かれていた。
この点、種々の故障に対する原因の究明についての専門知識が蓄えられた知識ベース部と、知識ベース部に蓄えられた専門知識を基に故障の原因を導き出す推論機構部と、専門知識を知識ベース部に入力しあるいは削除、変更し、かつ故障診断に際して推論機構部と対話する対話手段を設けると共に、NC装置と工作機械との間で授受する各種情報及びNC装置の内部情報を取り出すことが可能な知識を知識ベース部に蓄え、上記の知識により自動的に取り出した情報を基にNC装置及び工作機械の故障を診断する技術が知られている(例えば、特許文献1参照)。
特開昭64−81010号公報
しかし、このようなエキスパートシステムを用いるユーザは、そもそも知見が足りていないため、エキスパートシステムから提示される質問に対して、誤った回答をしたり、正しい回答が分からないために答えられない場合が考えられ、このような場合に、正しい回答を導くのは困難であった。
従って、エキスパートシステムを用いる場合、診断結果があり得そうか否か、判断しやすい質問を優先して選び、簡潔な対話で不具合の診断を済ませることが、ユーザから求められる条件であると考えられる。
すなわち、知見が足りないユーザにとっても、判断しやすい質問を優先して選び、簡潔な対話で不具合が診断可能である点で、ユーザフレンドリなエキスパートシステムを提供することが望まれている。
本開示の一態様は、数値制御装置を構成するユニットで発生するエラー毎に当該エラーの原因となる全ての不具合候補の集合と、前記エラーの実際の原因である不具合を推定するための質問の集合と、推定される不具合が各不具合候補であった場合に、前記質問に対して肯定を示す回答が得られる確率とを格納する不具合・質問対応データベースと、前記不具合候補毎に、前記不具合を推定するための1つ以上の前記質問の優先順位を格納する優先順位データベースと、前記質問毎の各不具合候補に対応する確率、及び前記質問に対する回答が肯定か否定かを示す指数に基づいて、前記不具合候補毎に、前記確率と前記指数との内積である不具合可能性指数を算出する不具合可能性指数算出部と、各不具合候補に対応する複数の前記質問のうち同一の質問に対応する、前記不具合候補の可能性指数の合計値である質問評価指数を算出する質問評価指数算出部と、前記質問評価指数に重み係数を乗ずることにより、前記質問評価指数を補正する質問評価指数補正部と、不具合候補毎に、前記優先順位に従った質問順となっている複数の質問のうち最新の質問について、不具合候補間で同一の質問に関しては補正後の前記質問評価指数を合算し、合算された前記質問評価指数が最も大きな前記質問を選択し、前記ユーザに提示する質問選択部と、前記質問に対する回答を前記ユーザから取得する度に、算出され、補正される前記質問評価指数の値が、閾値を超えたものの中で最も大きな前記不具合候補を表示装置に表示する表示制御部と、前記表示された不具合候補が、前記ユーザにより正解として選択された場合に、これまでに前記ユーザに提示された質問と、各質問に対する前記ユーザによる回答と、各質問の出題順と、前記正解として選択された前記不具合候補と、不正解として選択された前記不具合候補とを、前記エラーに係る情報及び前記ユニットに係る情報に対応付けて記憶部に記録する不具合調査結果記録部と、前記不具合調査結果記録部により、前記記憶部に記憶された記憶内容に基づいて、前記重み係数を補正する重み係数補正部と、を備える対話式診断装置である。
一態様によれば、知見が足りないユーザにとっても、判断しやすい質問を優先して選び、簡潔な対話で不具合が診断可能である点で、ユーザフレンドリなエキスパートシステムを提供することが可能となる。
一実施形態に係る対話式診断装置1の基本概念を示す図である。 一実施形態に係る対話式診断装置1の基本概念を示す図である。 一実施形態に係る対話式診断装置1の基本概念を示す図である。 一実施形態に係る対話式診断装置1の基本概念を示す図である。 一実施形態に係る対話式診断装置1の機能ブロック図である。 一実施形態に係る対話式診断装置1の表示画面の例を示す図である。 一実施形態に係る対話式診断装置1の記憶部40に記録されるデータの内容の例を示す図である。 一実施形態に係る対話式診断装置1の優先順位データベース30に記録されるデータの内容の例を示す図である。 一実施形態に係る対話式診断装置1の強化学習時の動作を示すフローチャートである。
〔1 第1実施形態〕
以下、本発明の第1実施形態を図1〜図9に基づいて説明する。
〔1.1 発明の構成〕
図1は、本実施形態に係る対話式診断装置1の構成を示す機能ブロック図である。対話式診断装置1は、制御部10と、不具合・質問対応データベース20と、優先順位データベース30と、記憶部40とを備える。
対話式診断装置1は、数値制御装置のユニット構成、及び実際に発生した不具合の現象から、実際に発生している不具合の候補をピックアップし、実際の不具合がどの不具合の候補に該当するのか判断するため、オペレータに対し効果的な質問を出題することにより、不具合の診断を自動化するエキスパートシステムである。
制御部10は、CPU、ROM、RAM、CMOSメモリ等を有し、これらはバスを介して相互に通信可能に構成される、当業者にとって公知のものである。
CPUは対話式診断装置1を全体的に制御するプロセッサである。該CPUは、ROMに格納されたシステムプログラム及びアプリケーションプログラムを、バスを介して読み出し、該システムプログラム及びアプリケーションプログラムに従って対話式診断装置1全体を制御することで、図1に示すように、制御部10を、不具合可能性指数算出部101、質問評価指数算出部102、質問評価指数補正部103、質問選択部104、表示制御部105、不具合調査結果記録部106、重み係数補正部107、データベース更新部108の機能を実現するように構成される。RAMには一時的な計算データや表示データ等の各種データが格納される。CMOSメモリは図示しないバッテリでバックアップされ、対話式診断装置1の電源がオフされても記憶状態が保持される不揮発性メモリとして構成される。
不具合可能性指数算出部101は、推定される不具合が各不具合候補であった場合に、質問に対して肯定を示す回答が得られる確率であって、質問毎の各不具合候補に対応する確率、及び質問に対する回答が肯定か否定かを示す指数に基づいて、不具合候補毎に、確率と指数との内積である不具合可能性指数を算出する。なお、この確率は、後述の不具合・質問対応データベース20に記憶されている。また、この確率は、不具合調査結果記録部106に格納される履歴情報に基づいて、適宜修正される。
図2は、工作機械に不具合が発生した際に、エキスパートシステムから提示される質問に対して「はい」の回答をする確率の例を、各質問・不具合候補毎に場合分けした表の例である。
図2においては、例えばAの不具合が発生している場合に、質問Iに対して「はい」と回答する確率が75.9%であり、質問IIに対して「はい」と回答する確率が52.1%であり、質問IIIに対して「はい」と回答する確率が92.4%である。
同様に、Bの不具合が発生している場合に、質問Iに対して「はい」と回答する確率が4.6%であり、質問IIに対して「はい」と回答する確率が92.4%であり、質問IIIに対して「はい」と回答する確率が50.8%である。
同様に、Cの不具合が発生している場合に、質問Iに対して「はい」と回答する確率が85.8%であり、質問IIに対して「はい」と回答する確率が45.5%であり、質問IIIに対して「はい」と回答する確率が46.0%である。
ここで、ユーザの回答が、質問Iに対して「はい」であり、質問IIに対して「いいえ」であり、質問IIIに対して「はい」だったとする。この場合、「はい」に対して点数「1」を、「いいえ」に対して点数「−1」を割り振り、不具合候補毎に、確率に対して、回答に対応する点数を乗算する(以降では、この内積を「不具合可能性指数」と呼称する)。
図2の例において、不具合候補Aについて、質問Iに対応する不具合可能性指数は、75.9×1=75.9となり、質問IIに対応する不具合可能性指数は、52.1×(−1)=−52.1となり、質問IIIに対応する不具合可能性指数は、92.4×1=92.4となる。
また、不具合候補Bについて、質問Iに対応する不具合可能性指数は、4.6×1=4.6となり、質問IIに対応する不具合可能性指数は、92.4×(−1)=−92.4となり、質問IIIに対応する不具合可能性指数は、50.8×1=50.8となる。
また、不具合候補Cについて、質問Iに対応する不具合可能性指数は、85.8×1=85.8となり、質問IIに対応する不具合可能性指数は、45.5×(−1)=−45.5となり、質問IIIに対応する不具合可能性指数は、46.0×1=46.0となる。
質問評価指数算出部102は、各不具合候補に対応する複数の質問について、不具合候補の可能性指数の合計値である質問評価指数を算出する。
図2において、質問評価指数算出部102は、不具合候補毎に各質問に対応するすべての内積を合算する。
具体的には、不具合候補Aに対応する質問評価指数は、75.9+(−52.1)+92.4=116.2となる。不具合候補Bに対応する質問評価指数は、4.6+(−92.4)+50.8=−37となる。不具合候補Cに対応する質問評価指数は、85.8+(−45.5)+46.0=86.3となる。
すなわち、不具合候補Aに対応する質問評価指数は116.2、不具合候補Bに対応する質問評価指数は−37、不具合候補Cに対応する質問評価指数は86.3となり、不具合候補Aに対応する質問評価指数が最も高くなる。
図3は、図2に示す表と、この図2に示す表内の数値を用いて、各不具合候補に対応する質問毎の確率の分布を表したグラフと、各質問に対する回答の点数を表したグラフである。
図3に示すように、質問評価指数が最も高い不具合候補Aについての質問毎の確率の分布、すなわち質問Iの確率が75.9%、質問IIの確率が52.1%、質問IIIの確率が92.4%となる分布と、各質問に対する回答の点数である、1、−1、1という分布との類似性は、他の不具合候補についての質問毎の確率の分布と、各質問に対する回答の点数の分布との類似性と比較して、最も高くなる。
すなわち、各不具合候補についての質問毎の確率の分布を示すグラフと、各質問に対する回答の点数の分布を示すグラフとの類似性は、双方のグラフの形状を見れば分かるが、本発明においては、内積を用いて定量的に評価する。その上で、後述のように、本発明に係る対話式診断装置1は、各質問に対する回答の点数の分布に最も類似する確率分布となる不具合候補を、オペレータに提示する。
質問評価指数補正部103は、質問評価指数に重み係数を乗ずることにより、質問評価指数を補正する。
質問選択部104は、不具合候補毎に、優先順位に従った質問順となっている複数の質問のうち最新の質問について、不具合候補間で同一の質問に関しては補正後の質問評価指数を合算し、合算された質問評価指数が最も大きな質問を選択し、ユーザに提示する。なお、この優先順位は、後述の優先順位データベース30に記憶されている。また、この優先順位は、不具合候補に対する質問の確率の高い順としてもよい。この場合、確率の見直しに応じて、優先順位も見直される。
図4〜図5は、重み係数と質問順の変更について説明する図である。
質問の順序には、不具合候補毎に最適なものが存在するが、運用上は、どの不具合候補が実際の不具合に当てはまるか不明な段階で質問順を決定しなくてはならない。
そこで、図4に示すように、不具合候補毎に、優先順位に従った質問順となっている複数の質問のうち最新の質問について、不具合候補間で同一の質問に関しては質問評価指数を合算し、最も質問評価指数の高い質問を出題する。
図4に示す例においては、不具合候補Aに紐づけられる質問が質問IIであり、質問評価指数が40であるとする。また、不具合候補Bに紐づけられる質問も質問IIであり、質問評価指数が20であるとする。また、不具合候補Cに紐づけられる質問は質問IIIであり、質問評価指数が50であるとする。
この場合、不具合候補Aに紐づけられる質問と不具合候補Bに紐づけられる質問とが、共に質問IIであるため、不具合候補Aの質問評価指数40と、不具合候補Bの質問評価指数20とを合算した結果、質問IIに対応する質問評価指数は60となる。一方で、不具合候補Cに紐づけられる質問IIIの質問評価指数は50である。質問IIに対応する質問評価指数60は、質問IIIに対応する質問評価指数50よりも大きいため、質問選択部104は、質問IIを出題する。
質問IIを出題した後、不具合候補Aに紐づけられる質問が質問Iであり、質問評価指数は10であるとする。また、不具合候補Bに紐づけられる質問が質問Iであり、質問評価指数は5であるとする。また、不具合候補Cに紐づけられる質問が質問IIIであり、質問評価指数は30であるとする。
なお、質問IIはすでに出題したので、不具合候補A〜Cのいずれにも紐づけられない。
ここで、質問Iに対応する質問評価指数の合計値は15となり、質問IIIに対応する質問評価指数は30であるため、図4には示さないが、更に出題する質問は、質問IIIとなる。
図4に示す例においては、各不具合候補が同じ重みで評価されている。しかし、実際に不具合が発生する頻度は、不具合毎に異なるはずである。このため、頻発する度合いの高い不具合候補からオペレータに確認していく手法が、不具合の原因を推定する近道となる。
図5は、不具合が発生する頻度を踏まえた、質問順の変更の仕組みを説明する図である。図5に示すように、不具合が発生する頻度を考慮するため、各質問評価係数に重み係数を乗算することにより、不具合候補毎に質問評価指数に重みをつけた上で、質問毎に質問評価指数を合算する。
図5に示す例においては、質問IIの質問評価指数の合算値が40×a+20×bであり、質問IIIの質問評価指数が50×cであり、40×a+20×bが50×cよりも大きいため、次に出題する質問は、質問IIとなる。
なお、後述のように、本実施形態において、図5に示す例における重み係数は強化学習により変動させる。
図1において、表示制御部105は、質問に対する回答をユーザから取得する度に、算出され、補正される質問評価指数の値が、閾値を超えたものの中で最も大きな不具合候補を表示装置(不図示)に表示する。
図6は、質問選択部104による質問の提示例、及び表示制御部105による不具合候補の表示例を示す。
図6の例においては、最初に表示される画面(a)において、第1の質問として、問題が発生したユニットのLEDが点灯しているかどうかを質問する。これに対し、ユーザは、「はい」と回答したとする。
その結果表示される画面(b)において、第2の質問として、問題が発生したユニットとその前段のユニットに対し、I/O Linkケーブルが正しいコネクタに接続されているかどうかを質問する。これに対し、ユーザは「はい」と回答したとする。
その結果表示される画面(c)において、第3の質問として、問題が発生したユニットの信号線に対し、高電圧線がショートする可能性があるか否かを質問する。これに対し、ユーザは「はい」と回答したとする。
その結果、これまでのユーザによる回答に基づき、画面下方に不具合候補として、「ドライバ故障」を示すボタンが表示される。ユーザは、この「ドライバ故障」を示すボタンをクリックする。
すると、画面(d)において、「ドライバ故障」の具体的な内容を示すウインドウが表示される。ユーザは、この具体的な内容が実際のエラーの原因であると判断する場合には、「保存」のボタンをクリックする。一方、この具体的な内容が実際のエラーではないと判断する場合には、「NG」のボタンをクリックする。ユーザが「NG」のボタンをクリックした場合には、継続して質問が表示される。
図1において、不具合調査結果記録部106は、表示された不具合候補が、ユーザにより正解として選択された場合に、これまでにユーザに提示された質問と、各質問に対するユーザによる回答と、各質問の出題順と、正解として選択された不具合候補と、不正解として選択された不具合候補とを、エラーに係る情報及びユニットに係る情報に対応付けて記憶部40に記録する。
図7は、不具合調査結果記録部106により記憶部40に記録されるデータの内容の例を示す。
1つ目のデータは、質問VIII、質問I、質問IX、質問III、質問VIの順に質問が提示され、その結果、不具合候補として表示されたAをユーザが正解として保存したデータを示す。
2つ目のデータは、質問III、質問IV、質問VIII、質問Vの順に質問が提示され、その結果、不具合候補として表示されたAをユーザが正解として保存したデータを示す。
3つ目のデータは、質問IX、質問II、質問X、質問VIIの順に質問が提示され、その結果表示された不具合候補が、ユーザによって不正解としてNGとされた後、質問VIII、質問IIの順に質問が提示され、その結果、不具合候補として表示されたAをユーザが正解として保存したデータを示す。
不具合調査結果記録部106は、これらの質問、各質問の出題順、各質問に対するユーザの回答、正解として選択された不具合候補と、不正解として選択された不具合候補を、エラーに対応付けて記憶部40に記録する。
図1において、重み係数補正部107は、不具合調査結果記録部106により、記憶部40に記憶された記憶内容に基づいて、重み係数を補正する。なお、本実施形態においては、強化学習により重み係数を補正するが、強化学習の具体的な内容については後述する。
データベース更新部108は、実際の不具合が発生しないように、制御対象の工作機械の構成自体が改良された際に、後述の不具合・質問対応データベース20を更新する。例えば、データベース更新部108は、実際に発生しないように対策された不具合に対応する不具合候補を含むデータを削除することが可能である。
不具合・質問対応データベース20は、数値制御装置を構成するユニットで発生するエラー毎に当該エラーの原因となる全ての不具合候補の集合と、エラーの実際の原因である不具合を推定するための質問の集合と、質問に対して肯定を示す回答をした場合に、推定される不具合が各不具合候補に対応する確率とを格納する。具体的には、不具合・質問対応データベース20は、例えば図1に示した、テーブル形式の質問と不具合の対応表を格納することが可能である。
優先順位データベース30は、不具合候補毎に、前記不具合を推定するための1つ以上の前記質問の優先順位を格納する。
図8は、優先順位データベース30に格納されるデータの例を示す。図8の例においては、不具合候補毎に優先順位に従って最適な質問順が設定される。不具合候補間で、同一の順番に同一の質問が設定されてもよく、異なる質問が設定されてもよい。
〔1.2 強化学習〕
上記のように本実施形態では、強化学習により重み係数を調整するが、まず強化学習の基本的な仕組みについて説明する。エージェント(本実施形態における重み係数補正部107に相当)は、環境の状態を観測し、ある行動を選択し、当該行動に基づいて環境が変化する。環境の変化に伴って、何らかの報酬が与えられ、エージェントはより良い行動の選択(意思決定)を学習する。
教師あり学習が、完全な正解を示すのに対して、強化学習における報酬は、環境の一部の変化に基づく断片的な値であることが多い。このため、エージェントは、将来にわたっての報酬の合計を最大にするように行動を選択するように学習する。
このように、強化学習では、行動を学習することにより、環境に行動が与える相互作用を踏まえて適切な行動を学習、すなわち将来的に得られる報酬を最大にするための学習する方法を学ぶ。これは、本実施形態において、例えば、加工精度を維持しつつ、サイクルタイムを短縮するための行動情報を選択するという、未来に影響をおよぼすような行動を獲得できることを表している。
ここで、強化学習としては、任意の学習方法を用いることができるが、以下の説明では、或る環境の状態sの下で、行動aを選択する価値関数Q(s,a)を学習する方法であるQ学習(Q-learning)を用いる場合を例にとって説明をする。
Q学習では、或る状態sのとき、取り得る行動aのなかから、価値関数Q(s,a)の最も高い行動aを最適な行動として選択することを目的とする。
しかしながら、Q学習を最初に開始する時点では、状態sと行動aとの組合せについて、価値関数Q(s,a)の正しい値は全く分かっていない。そこで、エージェントは、或る状態sの下で様々な行動aを選択し、その時の行動aに対して、与えられる報酬に基づいて、より良い行動の選択をすることにより、正しい価値関数Q(s,a)を学習していく。
また、将来にわたって得られる報酬の合計を最大化したいので、最終的にQ(s,a)=E[Σ(γ)r]となるようにすることを目指す。ここでE[]は期待値を表し、tは時刻、γは後述する割引率と呼ばれるパラメータ、rは時刻tにおける報酬、Σは時刻tによる合計である。この式における期待値は、最適な行動に従って状態変化した場合の期待値である。しかしQ学習の過程において最適な行動が何であるのかは不明であるので、様々な行動を行うことにより、探索しながら強化学習をする。このような価値関数Q(s,a)の更新式は、例えば、次の数式1(以下に数1として示す)により表すことができる。
Figure 2021026507
上記の数式1において、sは、時刻tにおける環境の状態を表し、aは、時刻tにおける行動を表す。行動aにより、状態はst+1に変化する。rt+1は、その状態の変化により得られる報酬を表している。また、maxの付いた項は、状態st+1の下で、その時に分かっている最もQ値の高い行動aを選択した場合のQ値にγを乗じたものになる。ここで、γは、0<γ≦1のパラメータで、割引率と呼ばれる。また、αは、学習係数で、0<α≦1の範囲とする。
上述した数式1は、試行aの結果、返ってきた報酬rt+1を元に、状態sにおける行動aの価値関数Q(s,a)を更新する方法を表している。
この更新式は、状態sにおける行動aの価値関数Q(s,a)よりも、行動aによる次の状態st+1における最良の行動の価値max Q(st+1,a)の方が大きければ、Q(s,a)を大きくし、逆に小さければ、Q(s,a)を小さくすることを示している。つまり、或る状態における或る行動の価値を、それによる次の状態における最良の行動の価値に近づける。ただし、その差は、割引率γと報酬rt+1のあり方により変わってくるが、基本的には、ある状態における最良の行動の価値が、それに至る1つ前の状態における行動の価値に伝播していく仕組みになっている。
ここで、Q学習では、すべての状態行動ペア(s,a)についてのQ(s,a)のテーブルを作成して、学習を行う方法がある。しかし、すべての状態行動ペアのQ(s,a)の値を求めるには状態数が多すぎて、Q学習が収束するのに多くの時間を要してしまう場合がある。
そこで、公知のDQN(Deep Q-Network)と呼ばれる技術を利用するようにしてもよい。具体的には、価値関数Qを適当なニューラルネットワークを用いて構成し、ニューラルネットワークのパラメータを調整することにより、価値関数Qを適当なニューラルネットワークで近似することにより価値関数Q(s,a)の値を算出するようにしてもよい。DQNを利用することにより、Q学習が収束するのに要する時間を短くすることが可能となる。なお、DQNについては、例えば、以下の非特許文献に詳細な記載がある。
<非特許文献>
「Human-level control through deep reinforcement learning」、Volodymyr Mnih1著[online]、[平成29年1月17日検索]、インターネット〈URL:http://files.davidqiu.com/research/nature14236.pdf〉
本実施形態においては、以上説明をしたQ学習を重み係数補正部107が行う。具体的には、重み係数補正部107は、エラーに係る情報、不具合の発生するユニットに係る情報、質問と回答の組み合わせとを状態sとし、当該状態sに係る重み係数の変更を行動aとして、選択する価値関数Qを学習する。
なお、上記の報酬rは、一例として、次の数式2(以下に数2として示す)により表すことができるが、これには限られない。
Figure 2021026507
上記の数式2において、Bは、不具合例の選択で決まる係数であり、「保存」なら1、「NG」なら−1である。bは、回答の回数により報酬の強弱を決めるための0以上1未満の係数であり、本発明に係る対話式診断装置の設計者によって決められる。nは回答数であり、例えば3回の質問に対して3回回答していたら3、5回の質問に対して5回回答していたら5となる。例えば、「質問IX→質問II→質問X→質問VII」の後に表示された不具合候補Bに対し、「NG」をクリックし、それに続けて、「質問I→質問VI→質問VIII」の後に表示された不具合候補Cに対し、再度「NG」がクリックされた場合、最初の「NG」に紐づく回答数は4となり、次の「NG」に紐づく回答数は7となる。naveは、過去において、同様のエラー及びユニット構成だった場合に、「保存」のボタンがクリックされたときの平均回答数を示す。なお、この平均回答数は記憶部40に記憶される。また、図7に例示する学習用データが記憶部40に記憶される都度、この平均回答数はリアルタイムで更新されてもよく、記憶部40に学習用データがある程度蓄積される毎に、平均回答数が更新されてもよい。
重み係数補正部107は、エラーに係る情報、不具合の発生するユニットに係る情報、質問と回答の組み合わせとを含む状態情報sを観測して、行動aを決定する。重み係数補正部107は、行動aをするたびに報酬が返ってくる。重み係数補正部107は、例えば、将来にわたっての報酬の合計が最大になるように最適な行動aを試行錯誤的に探索する。そうすることで、重み係数補正部107は、エラーに係る情報、不具合の発生するユニットに係る情報、質問と回答の組み合わせとを含む状態sに対して、最適な行動aを選択することが可能となる。
すなわち、重み係数補正部107により学習された価値関数Qに基づいて、或る状態sに係る、エラーに係る情報、不具合の発生するユニットに係る情報、質問と回答の組み合わせに対して適用される行動aのうち、価値関数Qの値が最大となるような行動aを選択することで、不具合候補毎に最適な質問順序となるような行動aを選択することが可能となる。
図9は、強化学習時の対話式診断装置1の動作を示すフローチャートである。
ステップS11において、重み係数補正部107は、第1状態情報として、エラーに係る情報と不具合の発生するユニットに係る情報を取得する。
ステップS12において、重み係数補正部107は、行動出力として、不具合候補に紐づいた質問評価指数に乗算する重み係数を決定又は変更する。
ステップS13において、質問選択部104は、不具合候補毎に、優先順位に従った質問順となっている複数の質問のうち最新の質問について、不具合候補間で同一の質問に関しては補正後の前記質問評価指数を合算し、合算された質問評価指数の合算値が最も大きな質問を選択し、表示装置(不図示)に表示する。
ステップS14において、オペレータは、表示装置に表示された質問に対し回答する。重み係数補正部107は、この質問と回答の組み合わせを第2状態情報とする。
ステップS15において、表示制御部105は、各不具合候補に紐づく、補正後の質問評価指数を評価する。
ステップS16において、各不具合候補の中で補正後の質問評価指数が閾値を超えたものがある場合(S16:YES)には、処理はステップS17に移行する。ない場合(S16:NO)には、処理はステップS13に移行する。
ステップS17において、表示制御部105は、補正後の質問評価指数が閾値を超えたものの中で最も大きな不具合候補を表示する。
ステップS18において、オペレータが、表示された不具合候補に対して「保存」又は「NG」を選択する。重み係数補正部107は、この選択結果、及び質問数を判断情報とする。
ステップS19において、不具合調査結果記録部106は、第1状態情報、第2状態情報、及び判断情報を、学習用データとして記憶部40に記録する。
ステップS20において、重み係数補正部107は、数式2に基づいて報酬を計算する。
ステップS21において、ステップS18で不具合候補に対して「保存」を選択した場合(S21:保存)には、処理はステップS22に移行する。ステップS18で不具合候補に対して「NG」を選択した場合(S21:NG)には、処理はステップS13に移行する。
ステップS22において、重み係数補正部107は、価値関数を更新する。なお、価値関数の更新の際には、これまでのフローにおいて、ステップS20で計算された報酬が合算され、合算された報酬が用いられる。
ステップS23において、更なる調査を継続する場合(S23:YES)には、処理はステップS11に移行する。調査を終了する場合(S23:NO)には、処理を終了する。
〔1.3 第1実施形態が奏する効果〕
本実施形態に係る対話式診断装置1により、知見が足りないユーザにとっても、判断しやすい質問を優先して選び、簡潔な対話で不具合が診断可能である点で、ユーザフレンドリなエキスパートシステムを実現することが可能となる。
とりわけ、各不具合候補に紐づく質問評価指数に重み係数を乗算するとともに、強化学習により当該重み係数を決定することにより、実際に不具合が発生する頻度を考慮した上で、質問順を決定することが可能となる。
〔2 変形例〕
〔2.1 変形例1〕
上記の第1実施形態においては、強化学習により重み係数を決定するとしたが、これには限定されない。
例えば、重み係数補正部107は、不具合候補が保存(正解)として選択された回数と、NG(不正解)として選択された回数から、不具合候補の頻度を算出し、当該頻度に基づいて、重み係数を補正してもよい。
〔2.2 変形例2〕
本発明に係る対話式診断装置1は、知見が足りないユーザやオペレータとの対話を前提としているが、一方で、工作機械の製造者側の専門家による対話式診断装置1への回答は、知見が足りないユーザやオペレータによる回答に比較して、より信用できると考えられる。
そこで、上記の強化学習のための学習モデルを構築する際に、工作機械の製造者側の専門家による回答に係るデータのみを用いてもよい。これにより、例えば、上記の重み係数の算出の際、より早く収束することが可能となる。
〔2.3 変形例3〕
図6に示す、質問選択部104による質問の提示例においては、回答の選択肢として、「はい」及び「いいえ」の2択の選択肢、又は、「はい」、「いいえ」、及び「不明」の3択の選択肢が示されているが、これには限定されない。例えば、「はい」、「いいえ」、及び「不明」に加え、「おそらくはい」及び「おそらくいいえ」を加えることにより、4択又は5択の選択肢としてもよい。
更に、例えば、「はい」に対して「1」の属性値、「いいえ」に対して「−1」の属性値、及び「不明」に対して「0」の属性値を対応付けて場合、「おそらくはい」に対して「0.5」の属性値、「おそらくいいえ」に対して「−0.5」の属性値を割り当ててもよい。
上述した実施形態は、本発明の好適な実施形態ではあるが、上記実施形態に本発明の範囲を限定するものではなく、本発明の要旨を逸脱しない範囲において、種々の変更を施した形態での実施が可能である。
なお、上記の対話式診断装置1に含まれる各装置は、ハードウェア、ソフトウェア又はこれらの組み合わせによりそれぞれ実現することができる。また、上記の対話式診断装置1に含まれる各装置により行なわれる支援方法も、ハードウェア、ソフトウェア又はこれらの組み合わせにより実現することができる。ここで、ソフトウェアによって実現されるとは、コンピュータがプログラムを読み込んで実行することにより実現されることを意味する。
プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えば、フレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば、光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
1 対話式診断装置
10 制御部
20 不具合・質問対応データベース
30 優先順位データベース
40 記憶部
101 不具合可能性指数算出部
102 質問評価指数算出部
103 質問評価指数補正部
104 質問選択部
105 表示制御部
106 不具合調査結果記録部
107 重み係数補正部
108 データベース更新部

Claims (4)

  1. 数値制御装置を構成するユニットで発生するエラー毎に当該エラーの原因となる全ての不具合候補の集合と、前記エラーの実際の原因である不具合を推定するための質問の集合と、推定される不具合が各不具合候補であった場合に、前記質問に対して肯定を示す回答が得られる確率とを格納する不具合・質問対応データベースと、
    前記不具合候補毎に、前記不具合を推定するための1つ以上の前記質問の優先順位を格納する優先順位データベースと、
    前記質問毎の各不具合候補に対応する確率、及び前記質問に対する回答が肯定か否定かを示す指数に基づいて、前記不具合候補毎に、前記確率と前記指数との内積である不具合可能性指数を算出する不具合可能性指数算出部と、
    各不具合候補に対応する複数の前記質問における、前記不具合候補の可能性指数の合計値である質問評価指数を算出する質問評価指数算出部と、
    前記質問評価指数に重み係数を乗ずることにより、前記質問評価指数を補正する質問評価指数補正部と、
    不具合候補毎に、前記優先順位に従った質問順となっている複数の質問のうち最新の質問について、不具合候補間で同一の質問に関しては補正後の前記質問評価指数を合算し、合算された前記質問評価指数が最も大きな前記質問を選択し、ユーザに提示する質問選択部と、
    前記質問に対する回答を前記ユーザから取得する度に、算出され、補正される前記質問評価指数の値が、閾値を超えたものの中で最も大きな前記不具合候補を表示装置に表示する表示制御部と、
    前記表示された不具合候補が、前記ユーザにより正解として選択された場合に、これまでに前記ユーザに提示された質問と、各質問に対する前記ユーザによる回答と、各質問の出題順と、前記正解として選択された前記不具合候補と、不正解として選択された前記不具合候補とを、前記エラーに係る情報及び前記ユニットに係る情報に対応付けて記憶部に記録する不具合調査結果記録部と、
    前記不具合調査結果記録部により、前記記憶部に記憶された記憶内容に基づいて、前記重み係数を補正する重み係数補正部と、
    を備える対話式診断装置。
  2. 前記重み係数補正部は、
    前記エラーに係る情報、前記不具合の発生するユニットに係る情報、及び前記質問と前記回答の組み合わせを含む状態情報を取得する状態情報取得手段と、
    前記重み係数の変更情報を含む行動情報を出力する行動情報出力手段と、
    前記状態情報に含まれる、前記質問と前記回答の組み合わせに基づく、強化学習における報酬の値を出力する報酬計算手段と、
    前記報酬の値と、前記状態情報と、前記行動情報とに基づいて前記強化学習を行うことにより価値関数を更新する価値関数更新手段とを備え、
    前記強化学習の結果を用いて、前記重み係数を補正する、請求項1に記載の対話式診断装置。
  3. 前記重み係数補正部は、前記不具合候補の各々が、正解として選択された回数と、不正解として選択された回数とから算出される頻度に基づいて、前記重み係数を補正する、請求項1に記載の対話式診断装置。
  4. 前記不具合が解消された際に、前記不具合・質問対応データベースを更新する、データベース更新部を更に備える、請求項1から請求項3のいずれか1項に記載の対話式診断装置。
JP2019144002A 2019-08-05 2019-08-05 対話式診断装置 Pending JP2021026507A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019144002A JP2021026507A (ja) 2019-08-05 2019-08-05 対話式診断装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019144002A JP2021026507A (ja) 2019-08-05 2019-08-05 対話式診断装置

Publications (1)

Publication Number Publication Date
JP2021026507A true JP2021026507A (ja) 2021-02-22

Family

ID=74663918

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019144002A Pending JP2021026507A (ja) 2019-08-05 2019-08-05 対話式診断装置

Country Status (1)

Country Link
JP (1) JP2021026507A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117273392A (zh) * 2023-11-16 2023-12-22 四川省致链数字科技有限公司 家具生产决策方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117273392A (zh) * 2023-11-16 2023-12-22 四川省致链数字科技有限公司 家具生产决策方法、装置、电子设备及存储介质
CN117273392B (zh) * 2023-11-16 2024-02-09 四川省致链数字科技有限公司 家具生产决策方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
EP1859392B1 (en) Fault diagnostics
US8200526B2 (en) Method and system for collecting stakeholder relationship data
Chougule et al. A fuzzy logic based approach for modeling quality and reliability related customer satisfaction in the automotive domain
US11682029B2 (en) Systems and methods for scoring user reactions to a software program
JPH0769828B2 (ja) 診断エキスパート・システムにおける応答入力処理方法
JP2017068621A (ja) 機械学習器及び組み立て・試験器を備えた生産設備
US20090192836A1 (en) Automated test system project management
CN112966806A (zh) 处理装置、处理方法及记录介质
US20020128943A1 (en) Investment analysis tool and service for making investment decisions
JP2021026507A (ja) 対話式診断装置
Kendall et al. On the complexity of forming mental models
WO2020206172A1 (en) Confidence evaluation to measure trust in behavioral health survey results
Mujtaba et al. Artificial intelligence in computerized adaptive testing
US11176502B2 (en) Analytical model training method for customer experience estimation
CN116167749B (zh) 一种基于深度学习的永磁同步电机故障诊断方法
CN117574201A (zh) 基于多工业模型的模型训练方法、装置、设备和存储介质
CN115713389A (zh) 理财产品推荐方法及装置
US20210256447A1 (en) Detection for ai-based recommendation
JP2022059547A (ja) メンタル改善支援装置
CN112015861A (zh) 基于用户历史行为分析的智能试卷算法
US8682817B1 (en) Product testing process using diploid evolutionary method
US20220414126A1 (en) Virtual assistant feedback adjustment
JP2022063820A (ja) 精神状態推定装置
US20230419230A1 (en) Sales activity support apparatus and sales activity support method
WO2022244625A1 (ja) 修理内容予測方法、修理内容予測装置、プログラム、及び、修理内容予測モデルの作成方法