JP7158633B2 - 説明提示装置、説明提示方法、及び説明提示プログラム - Google Patents

説明提示装置、説明提示方法、及び説明提示プログラム Download PDF

Info

Publication number
JP7158633B2
JP7158633B2 JP2022542564A JP2022542564A JP7158633B2 JP 7158633 B2 JP7158633 B2 JP 7158633B2 JP 2022542564 A JP2022542564 A JP 2022542564A JP 2022542564 A JP2022542564 A JP 2022542564A JP 7158633 B2 JP7158633 B2 JP 7158633B2
Authority
JP
Japan
Prior art keywords
feature
unit
explanation
explicit knowledge
sensor data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022542564A
Other languages
English (en)
Other versions
JPWO2022034685A1 (ja
JPWO2022034685A5 (ja
Inventor
雄一 佐々木
翔貴 宮川
勝 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JPWO2022034685A1 publication Critical patent/JPWO2022034685A1/ja
Application granted granted Critical
Publication of JP7158633B2 publication Critical patent/JP7158633B2/ja
Publication of JPWO2022034685A5 publication Critical patent/JPWO2022034685A5/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Manufacturing & Machinery (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Automation & Control Theory (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Educational Technology (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Image Analysis (AREA)

Description

本開示は、説明提示装置、説明提示方法、及び説明提示プログラムに関する。
機械学習によって取得された学習済モデルを用いるAI(Artificial Intelligence)の挙動として、「もし…していれば、……を達成していた。」というような反実仮想的な説明(Counterfactual Explanation)の提示がある。反実仮想的な説明では、実際にはデータとして観測されていないが仮説としてある状況が発生した場合に、どのようなことが実現されるか、が説明される。
例えば、AIを活用した住宅ローン審査では、AIは、ローンの申請者に対し、実際には実現されていない状況が発生した場合に、どのようなことが実現されるかの説明(すなわち、反実仮想的な説明)を申請者に提示することがある。例えば、AIは、「もし年収が…万円高ければ、申請されたローンの借入が可能です。」又は「もし他のローンの借入残額が…万円少なければ、申請されたローンの借入が可能です。」、などのような反実仮想的な説明を提示する。
また、特許文献1は、対象者に作業を習得させるための作業支援装置を提案している。この装置は、対象者(例えば、作業者)に対し指導内容のテンプレートを提示することで、対象者の動作が模範者(例えば、熟練者)の動作に近付くようにするための装置である。上記住宅ローン審査の場合と同様に、特許文献1に記載の装置にAIを適用し、対象者と模範者との間の特徴量の差異(例えば、技能レベルの差異)に基づいて、対象者に対し、「もし…していれば、……を達成していた。」というような反実仮想的な説明を提示することが可能である。
特開2020-034849号公報(例えば、要約書、段落0043、0054)
しかしながら、例えば、機械学習で用いられる特徴量が、経験的に使っている知識であるが簡単に言葉で説明できない知識である暗黙知(tacit knowledge)である場合に、対象者は、提示された反実仮想的な説明の意味(すなわち、AIの挙動の意味)を理解できない可能性がある。ここで、暗黙知は、個人の過去の経験から成り立つ主観的な知識、例えば、経験又は勘などに基づく知識のことである。
本開示は、上記課題を解決するためになされたものであり、機械学習の結果に基づいて提示される反実仮想的な説明を理解しやすくすることを目的とする。
本開示に係る説明提示装置は、作業者の行動を検出して得られたセンサデータと取得した人間が解釈できる知識である形式知とを記憶するデータベースから、前記行動の特徴量を取得する特徴取得部と、前記特徴量から前記作業者の技能レベルを判定し、前記データベースに前記技能レベルを登録する技能判定部と、前記データベースにおいて、前記特徴量に形式知を紐付ける形式知紐付け部と、前記特徴量と前記特徴量に紐付けられた前記形式知とを含む提示情報を抽出する説明抽出部とを有し、前記特徴取得部、前記技能判定部、及び前記形式知紐付け部は、前記特徴量と前記技能レベルとを含む第2の学習用データを用いて、前記特徴量に紐づけられる形式知を出力するための第2の学習済モデルを生成する
本開示に係る説明提示方法は、説明提示装置によって実行される方法であって、作業者の行動を検出して得られたセンサデータと取得した人間が解釈できる知識である形式知とを記憶するデータベースから、前記行動の特徴量を取得するステップと、前記特徴量から前記作業者の技能レベルを判定し、前記データベースに前記技能レベルを登録するステップと、前記データベースにおいて、前記特徴量に形式知を紐付けるステップと、前記特徴量と前記特徴量に紐付けられた前記形式知とを含む提示情報を抽出するステップと、前記特徴量と前記技能レベルとを含む学習用データを用いて、前記特徴量に紐づけられる前記形式知を出力するための学習済モデルを生成するステップと、を有する。
本開示によれば、機械学習の結果に基づいて提示される反実仮想的な説明を理解しやすくすることができる。
説明提示装置のハードウェア構成の例を示す図である。 (A)及び(B)は、機械学習を行って学習済モデルを生成する学習装置及び学習済モデルを用いた推論を行って推論結果を出力する推論装置の構成の例を示す図である。 実施の形態1に係る説明提示装置の構成を示す機能ブロック図である。 実施の形態1に係る説明提示装置における学習済モデルの生成動作を示すフローチャートである。 全結合のニューラルネットワークを用いたモデルの例を示す図である。 実施の形態1に係る説明提示装置において、暗黙的特徴量に形式知を紐付ける学習済モデルの生成動作を示すフローチャートである。 実施の形態1に係る説明提示装置の動作の例を示すフローチャートである。 実施の形態1に係る説明提示装置によって生成されるデータの例を表形式(表1)で示す図である。 実施の形態1に係る説明提示装置によって生成されるデータの例を表形式(表2)で示す図である。 暗黙的特徴量空間における探索の例を示す図である。 可視化された説明の例を示す図である。 実施の形態2に係る説明提示装置の構成を示す機能ブロック図である。 実施の形態2に係る説明提示装置の動作の例を示すフローチャートである。 実施の形態2に係る説明提示装置によって生成されるデータの例を表形式(表3)で示す図である。 得られた相関係数の例を表形式(表4)で示す図である。 行動に紐付けられた形式知を相関係数で重み付けた値の和によって得られる熟練技能を得るために推奨される行動を表形式(表5)で示す図である。 実施の形態3に係る説明提示装置の構成を示す機能ブロック図である。 マルチタスクラーニングを実行するネットワークの構成例を示す図である。 実施の形態3に係る説明提示装置の動作の例を示すフローチャートである。 実施の形態3に係る説明提示装置によって生成されるデータの例を表形式(表6)で示す図である。 図20に示されるセンサデータを可視化し、特に異なる部分を変化#1、変化#2として表示した図である。 Attention Branch Networkの例を示す図である。 実施の形態4に係る説明提示装置の構成を示す機能ブロック図である。 実施の形態5に係る説明提示装置の構成を示す機能ブロック図である。 実施の形態5に係る説明提示装置における時分割センサデータの例を示す図である。 実施の形態5に係る説明提示装置において可視化された提示情報の例を示す図である。
以下に、実施の形態に係る説明提示装置、説明提示方法、及び説明提示プログラムを、図面を参照しながら説明する。実施の形態に係る説明提示装置、説明提示方法、及び説明提示プログラムによれば、機械学習の結果を用いて説明を提示する場合に、形式知(explicit knowledge)を伴う説明を提示することで、例えば、反実仮想的な説明が暗黙知であっても、反実仮想的な説明を理解しやすくすることができる。ここで、形式知は、人間が理解できる知識である。形式知は、例えば、文章、図表、数式などによって説明、表現できる知識である。なお、以下の実施の形態は、例にすぎず、実施の形態を適宜組み合わせること及び各実施の形態を適宜変更することが可能である。
《実施の形態1》
図1は、実施の形態1に係る説明提示装置1のハードウェア(H/W)構成の例を示す図である。図1に示されるように、説明提示装置1は、情報処理部としてのプロセッサ11と、情報を記憶するメモリ12と、ハードディスクドライブ(HDD)、ソリッドステートドライブ(SSD)などの記憶装置13と、ユーザ操作を受け付けるユーザインタフェースとしての操作装置14とを有する。説明提示装置1は、例えば、コンピュータである。説明提示装置1は、人間に情報を表示する画像表示部である表示器15を有してもよい。表示器15は、音声出力の機能を備えた装置であってもよい。また、説明提示装置1は、人間(例えば、作業者)の行動(例えば、動き)を検出する検出部であるセンサ16を有してもよい。センサ16は、映像を撮影する撮像装置であるカメラであってもよい。センサ16は、センサデータを出力する。センサ16がカメラである場合、センサデータは、映像データを含む。
プロセッサ11は、例えば、機械学習による学習済モデルの生成と、機械学習の結果である学習済モデルを用いる推論とを実行する。図1では、機械学習を行うプロセッサと推論を行うプロセッサとは、共通の1つのプロセッサであるが、異なるプロセッサであってもよい。プロセッサ11は、例えば、メモリ12に記憶されているソフトウェアであるプログラムを実行する。メモリ12に記憶されているプログラムは、実施の形態1に係る説明提示装置1に説明提示方法を実施させるための説明提示プログラムを含むことができる。説明提示プログラムは、例えば、コンピュータにより読み取り可能な記録媒体に記録されたプログラムとして説明提示装置1に提供される。或いは、説明提示プログラムは、ネットワークを介するダウンロードによって説明提示装置1に提供される。なお、後述される実施の形態2~5に係る説明提示装置2~5も、図1に示されるハードウェア構成と同様の構成を有する。
図2(A)及び(B)は、機械学習を行って学習済モデルを生成する学習装置20及び学習済モデルを用いた推論を行って推論結果を出力する推論装置30の構成の例を示す図である。図2(A)に示されるように、学習装置20は、データ取得部21と、モデル生成部22とを有する。学習装置20は、学習済モデル記憶部23を備えてもよい。データ取得部21とモデル生成部22とは、例えば、図1に示されるメモリ12及びプロセッサ11によって実現可能である。学習済モデル記憶部23は、例えば、図1に示される記憶装置13によって実現可能である。
データ取得部21は、学習用データを取得する。学習用データは、例えば、センサデータ(すなわち、入力信号)と正解データ(すなわち、教師信号)とを含む。モデル生成部22は、データ取得部21から出力される学習用データに基づいて、最適な出力を推論するために用いられる学習済モデルを生成する。
モデル生成部22が用いる学習アルゴリズムとしては、教師あり学習、教師なし学習、強化学習、などの公知のアルゴリズムを用いることができる。モデル生成部22は、例えば、ニューラルネットワークのモデルに従って、教師あり学習により学習する。教師あり学習とは、入力と結果(ラベル)とのデータの組を学習データとして学習装置に与えることで、学習用データに存在する特徴を学習し、入力から結果を推論可能にする方法である。モデル生成部22は、以上のような学習を実行することで学習済モデルを生成し、出力する。学習済モデル記憶部23は、モデル生成部22から出力された学習済モデルを記憶する。
図2(B)に示されるように、推論装置30は、データ取得部31と、推論部32とを備える。推論装置30は、学習済モデル記憶部33を備えてもよい。データ取得部31と推論部32とは、例えば、図1に示されるメモリ12とプロセッサ11によって実現可能である。学習済モデル記憶部33は、例えば、図1に示される記憶装置13によって実現可能である。学習済モデル記憶部33と、図2(A)に示される学習済モデル記憶部23とは、異なる記憶装置に備えられているが、同じ記憶装置に備えられてもよい。
データ取得部31は、技能を習得したい対象者である作業者のセンサデータを取得する。作業者のセンサデータは、例えば、作業者を撮影した映像データである。推論部32は、学習装置20で生成された学習済モデルを利用して得られる推論結果を出力する。すなわち、推論部32は、学習済モデル記憶部33に記憶されている学習済モデルにデータ取得部31で取得したセンサデータを入力することで、推論結果を出力することができる。
図3は、実施の形態1に係る説明提示装置1の構成を示す機能ブロック図である。図3に示されるように、説明提示装置1は、データ記憶部101と、特徴取得部としての特徴抽出部102と、技能判定部103と、形式知紐付け部104と、反実仮想的説明抽出部である説明抽出部105と、形式知選択部106とを有する。
データ記憶部101は、例えば、図1に示される記憶装置13の一部である。データ記憶部101は、データベースを記憶する。データ記憶部101は、説明提示装置1と通信可能な外部の記憶装置(例えば、ネットワーク上のサーバの記憶装置)であってもよい。特徴抽出部102、技能判定部103、形式知紐付け部104、説明抽出部105、及び形式知選択部106は、例えば、説明提示プログラムを実行するプロセッサ11によって実現される。特徴抽出部102、技能判定部103、及び形式知紐付け部104は、例えば、図2(A)に示される学習装置20を構成することができる。また、説明抽出部105及び形式知選択部106は、例えば、図2(B)に示される推論装置30を構成することができる。
機械学習時には、データ記憶部101は、様々な分野の熟練者(すなわち、高度な技能を既に体得している熟練作業者)から取得した形式知と、熟練者の行動と同じ行動(同様の行動を含む。)をとることによって得られた結果とを、教師信号として記憶する。ここで、形式知は、取得した人間が解釈できる知識である。形式知は、例えば、熟練者を撮影することによって得られたセンサデータ(例えば、映像データなど)、熟練者からヒアリングなどによって聞き出した情報、などを含むことができる。熟練者の行動と同じ行動をとることによって得られた結果は、技能レベル(例えば、熟練度、加工精度、など)を含む。熟練度は、作業者の技能レベルを示す値である。技能レベルは、作業を遂行する能力の程度である。熟練度は、主観的で定性的である場合がある。熟練度は、例えば、ヒアリング(アンケートを含む。)などにより作業者から聞き出した、技能を数値として評価した値である。また、熟練度は、作業者から聞き出した値を定量データ等と照らし合わせた結果に基づいて修正されてもよい。アンケートでは、同じ熟練度であるにも関わらず、自分自身の熟練度を高く評価する人(例えば、「俺はすごく高い技能レベルを持っている。」と回答する人)もいれば、自分自身の熟練度を謙虚に評価する人(例えば、「私の技能レベルは十分ではない。」と回答する人)もいる。このため、熟練度を、例えば、集められたアンケート全体のスコアの平均で偏差を取り除いた値とすることも可能である。このように、熟練度は、作業者又はその管理者などのヒアリングを通して得られた作業者のスキルを、数値化したものである。また、学習時には、ヒアリングなどを通してえられた上記のような定性データに加え、加工精度のような定量データを、教師として合わせて学習するとも可能である。加工精度は、作業者が加工した対象物の寸法、形状の正確さを評価する指標であり、技能レベルに対応する値であるから、技能レベルに含まれる。また、技能レベルは、作業者が行う作業の正確性、速度、安定性、などを含むことも可能である。正確性は、複数回の作業を行う場合に、各作業が正しい手順で実行されているか否かの度合いを示す指標である。安定性は、複数回の作業を行う場合に、各作業が一定の手順で実行されているか否かの度合いを示す指標である。速度は、複数回の作業を行う場合に、各作業に費やす時間の長さを示す指標である。
図4は、実施の形態1に係る説明提示装置1の機械学習時における動作を示すフローチャートである。ステップS101において、特徴抽出部102と技能判定部103とは、データ記憶部101に記憶されている学習用データを取得する。学習用データは、センサデータd(i=1、2、…)と、教師信号とを含む。
ステップS102において、例えば、ニューラルネットワークのモデル(例えば、後述の図5に示される。)に従って、データ記憶部101に記憶されたセンサデータ、教師信号のデータの組み合わせを学習用データとして学習装置(例えば、図2(A)における学習装置20)に与え、それらの学習用データにある特徴を機械学習し、入力から結果を推論することにより得られた出力(例えば、熟練度、加工精度、など)を機械学習する。ニューラルネットワークの機械学習では、教師信号とニューラルネットワークの出力との間の誤差が小さくなるように、誤差逆伝播法などを用いて、技能判定部103及び特徴抽出部102が使用する学習済モデルのパラメータを自動調整する。
図5は、全結合のニューラルネットワークを用いたモデルの例を示す図である。図5において、X1~X3は入力層、Y1及びY2は中間層、Z1及びZ2は出力層、w11~w16及びw21~w24は重み係数である。ただし、センサデータが時系列のデータである場合は、LSTM(Long short-term memory)を用いることが好適である。また、センサデータが画像系のデータである場合は、CNN(Convolutional Neural Network)を用いることが好適である。なお、学習済モデルの生成には、公知の様々なニューラルネットワークを用いることが可能である。
図4のステップS103において、データ記憶部101は、特徴抽出部102と技能判定部103によって生成された第1の学習済モデルである学習済モデルM1を記憶する。
特徴抽出部102は、センサデータを入力とし、技能判定部103が熟練度、加工精度などの技能レベルを判定できるようにするための特徴量である暗黙的特徴量を抽出する。暗黙的特徴量は、暗黙知の一例である。暗黙的特徴量は、ニューラルネットワークの最終出力層(例えば、図5のZ1、Z2)の手前の層から抽出される。技能判定部103は、特徴抽出部102から暗黙的特徴量を得て、暗黙的特徴量に基づいて熟練度、加工精度、などの技能レベルを判定する。
次に、人が暗黙的特徴量の挙動を容易に理解できるようにするために行う、形式知の紐付け動作について説明する。図6は、暗黙的特徴量に形式知を紐付ける学習済モデルの生成動作を示すフローチャートである。ステップS201において、特徴抽出部102は、データ記憶部101に記憶されたセンサデータを取得する。
ステップS202において、特徴抽出部102は、センサデータを学習済モデルM1に入力する。ステップS203において、特徴抽出部102は、暗黙的特徴量を抽出して出力する。ここで、特徴抽出部102は、例えば、ニューラルネットワークの最終出力層(例えば、図5のZ1、Z2)の手前の層の出力値を、暗黙的特徴量として抽出する。
ステップS204において、形式知紐付け部104は、データ記憶部101に記憶された形式知を取得する。形式知は、例えば、熟練者を撮影することによって得られた映像データ、又は熟練者からヒアリングなどによって聞き出した情報、などを含む。
ステップS205において、例えば、図5に示されるようなニューラルネットワークのモデルに従って、暗黙的特徴量と形式知とのデータの組み合わせを学習装置(例えば、図2(A)における学習装置20)に与え、それらの学習用データにある特徴を機械学習し、入力から結果を推論することにより出力を機械学習する。ニューラルネットワークの機械学習では、教師信号とニューラルネットワークの出力との間の誤差が小さくなるように、誤差逆伝播法などを用いて技能判定部103及び特徴抽出部102のモデルパラメータを自動調整する。ステップS206において、データ記憶部101は、形式知紐付け部104が生成した第2の学習済モデルである学習済モデルM2を記憶する。
暗黙的特徴量を入力とし、形式知を出力する学習済モデルは、ニューラルネットワークに限定されるものではなく、SVR(Support vector regression)、ナイーブベイズ(Naive Bayes)による形式知部分の欠損値推定などの方法を用いてもよい。
最終的に、技能を体得したい作業者P(すなわち、ユーザ)が、形式知紐付け部104が紐付けし、技能判定部103が技能レベル(例えば、熟練度及び加工精度など)を判定するモデルに対して、反実仮想的な説明の提示を要求する動作について詳細に説明する。
図7は、実施の形態1に係る説明提示装置1の動作の例を示すフローチャートである。ステップS301において、作業者Pは、ある改善したい技能行動に関するセンサデータを、データ記憶部101に登録する。すなわち、作業者Pは、自身が技能レベルの向上を希望する技能に関するセンサデータが何であるかを、例えば、操作装置(図1における操作装置14)で登録する。
ステップS302において、特徴抽出部102は、データ記憶部101に登録された作業者Pが技能レベルの向上を希望する技能に関するセンサデータを取得する。ステップS303において、特徴抽出部102は、取得したセンサデータを、データ記憶部101に記憶した学習済モデルM1に入力する。
ステップS304において、特徴抽出部102は、学習済モデルM1から暗黙的特徴量を取得する。ここで、特徴抽出部102は、例えば、ニューラルネットワークの最終出力層の手前の層の出力値を暗黙的特徴量として抽出する。
図8は、実施の形態1に係る説明提示装置1によって生成されるデータの例を表形式(表1)で示す図である。なお、Lは、正の整数であり、iは、1以上L以下の整数である。
図8に表1として記述されるように、形式知Sは、技s,s,s,…,s(mは、正の整数)とラベル付けされている。図8に示されるように、データ記憶部101には、作業者の行動A(i=1,…,L)と対応付けされて、技s,技s,技s,…,技sと、センサデータdと、暗黙的特徴量xと、技能レベルである熟練度yとが、記憶されている。そして、作業者Pが、技能を体得したいと考えている行動Aがデータ記憶部101に入力される。ここで、作業者Pが、どのような形式知に該当する行動を行っているかは未知と仮定する。
図9は、実施の形態1に係る説明提示装置1によって生成されるデータの例を表形式(表2)で示す図である。ステップS305~S310を繰り返すことで、説明抽出部105は、特徴抽出部102が取得した暗黙的特徴量xを基に得られた特徴ベクトルの各要素の値を変更して、技能判定部103を通じて技能レベルがどのように変わるかの探索を行い、図9の表2に示されるような反実仮想的な説明に用いられるデータを得る。
ステップS305において、説明抽出部105は、特徴抽出部102が取得した暗黙的特徴量xを基に、得られた特徴ベクトルの各要素の値を変更し暗黙的特徴量xを得る。ステップS306において、技能判定部103は、説明抽出部105から取得した暗黙的特徴量xを学習済モデルM1に入力する。ステップS307において、技能判定部103は、入力された暗黙的特徴量xに対応する技能レベルとして熟練度yを出力する。
ステップS308において、形式知紐付け部104は、学習済モデルM2に暗黙的特徴量xを入力する。ステップS309において、形式知紐付け部104は、入力された暗黙的特徴量xに対応する形式知を出力する。ステップS310において、データ記憶部101は、それぞれのステップで得られた暗黙的特徴量と、熟練度、形式知をデータベースに記憶する。
ステップS305において、説明抽出部105の値の変更方法としては、xからΔxずつ各要素の値に変更を加えた場合に、x+Δxのうち熟練度が最も大きくなる要素を記憶して、大きい熟練度を与えるxであるほど優先的に探索を行うアルゴリズムを用いてもよい(例えば、図10を参照)。
図10は、暗黙的特徴量空間における探索の例を示す図である。xを開始点として、Δxを各要素に足して技能判定部103が判定した熟練度を探索キューに予め記憶する。なお、探索キューには、熟練度が高いものほど前になるように並べ替える。そして、探索キューの先頭の要素を選ぶ。図10には、1番目の要素にΔxを加えた際に、熟練度が最も高かった場合が示されている。この場合x=x+Δxの暗黙的特徴量が次に探索する特徴量として選ばれ、暗黙的特徴量xの各要素にさらにΔxを加え、技能判定部103で各特徴量に対応する技能レベルである熟練度を得る。このように探索を繰り返していくことで、反実仮想的な暗黙的特徴量を得ることができる。
図10では、例えば、指定した形式知の値Yが1に近づくほど評価が高くなるような評価関数が用いられる。或いは、図10では、暗黙的特徴量が近いものほど評価が高くなるような評価関数が用いられる。そして、評価が高い暗黙的特徴量が、優先して探索される。
ステップS311において、説明抽出部105は、作業者Pが形式知選択部106に入力した形式知を基に、例えば、図9の表2の選択された形式知と相関の高い暗黙的特徴量の軸を選択し、形式知の変化に伴う特徴空間上のプロット情報及び、熟練度の情報を可視化して表示するための提示情報を抽出する。図1に示される表示器15は、提示情報に基づく画像を表示する。可視化された例は、後述の図11に示される。
また、xを形式知紐付け部104に入力して、得られた形式知Sである技s,…,sを形式知選択部106の初期ラベルとして用いて、作業者Pが形式知選択部106で形式知を変更できるように構成してもよい。これに加えて、説明抽出部105は、形式知Sである技s,…,sの有無によって、熟練度が目標値以上になる確率を提示するための提示情報を抽出してもよい。説明抽出部105は、技s,…,sは、互いに独立であるという仮定のもと、熟練度が目標以上になったときに、技s,…,sが含まれている確率を求め、ベイズルール(Bay’s rule)によって熟練度が目標以上になる要因として形式知Sである技s,…,sが含まれる確率を算出し、これを形式知選択部106の設定参考値として作業者Pに提示するための提示情報を抽出してもよい。
図11は、可視化された説明の例を示す図である。図11において、901a及び901bは、作業者Pの操作に基づいて形式知選択部106によって選択された形式知Sである技s,…,s、もしくは、説明抽出部105の探索から、熟練度の向上に最も寄与する形式知Sである技s,…,sである。902a及び902bは、形式知Sである技s,…,sの変化を示す。また、903は、作業者Pが入力したセンサデータに対応する暗黙的特徴量の位置付けをプロットしたものである。904は、目標熟練度をヒートマップによる可視化したものである。図11のヒートマップは、2次元データの値を濃淡として表現した可視化グラフである。図11において、905a及び905bは、形式知Sである技s,…,sと相関の高い暗黙的特徴量の座標軸である。
ただし、可視化は、作業者Pがどの技s,…,sを習得するか判断するための一助となるような見せ方として、特徴空間を表示せずに形式知の空間のみを表示するように行われてもよい。また、可視化は、作業者Pが習得を希望する技能に関するセンサデータ以外のセンサデータに対応する暗黙的特徴量をプロットしたサーマルマップを、並べて表示するように行われてもよい。或いは、可視化は、説明抽出部105の探索で得られた他の暗黙的特徴量をプロットしたサーマルマップを並べて表示するように行われてもよい。
これに加え、説明抽出部105は、技s,…,sの有無によって、熟練度が目標値以上になる確率を提示するための提示情報を抽出してもよい。例えば、説明抽出部105は、技s,…,sは、互いに独立であるという仮定のもと、熟練度が目標以上になったときに、技s,…,sが含まれている確率を求め、ベイズルールによって熟練度が目標以上になる要因として技s,…,sが含まれる確率を算出し、これを形式知選択部106の設定参考値として作業者Pに提示するための提示情報を抽出してもよい。図1に示される表示器15は、提示情報に基づく画像を表示する。
以上のように構成された説明提示装置1を用いることで、作業者Pは、技s,…,sに基づいてどのようにして技能を体得すればよいかを、直感的に理解することが可能になる。
《実施の形態2》
実施の形態1では、暗黙的特徴量を用いた反実仮想的な説明を容易に理解できるようにするために、暗黙的特徴量に形式知を紐付けし、暗黙的特徴量と形式知とを、技能の向上を希望する作業者Pに提示するための提示情報を抽出する。しかし、実施の形態1では、技能の向上を希望する作業者Pに関するセンサデータを、他の作業者に関するセンサデータと比較して、比較結果を参照する処理は行われていない。そのため、例えば、以下の状況(1)~(3)が発生する可能性がある。
(1)形式知を習得することが目標クラスの出力を実現するための最短パスであっても、実例が無く非現実的な提案となる状況。
(2)技能を習得するまでの道のりが遠いため習得が困難である状況。
(3)反実仮想的な説明の探索空間が広いため、処理時間が長くなる状況。
そこで、実施の形態2では、他の作業者のセンサデータも加味して、習得すべき技を提示するための提示情報を抽出する説明提示装置2を提案する。
図12は、実施の形態2に係る説明提示装置2の構成を示す機能ブロック図である。図12に示されるように、説明提示装置2は、データ記憶部201と、特徴取得部としての特徴抽出部202と、技能判定部203と、形式知紐付け部204と、反実仮想的説明抽出部である説明抽出部205と、形式知選択部206と、特徴比較部207とを有する。実施の形態2に係る説明提示装置2は、作業者Pのセンサデータを特徴抽出部202に入力して得られた暗黙的特徴量と、他の作業者のセンサデータから得られた暗黙的特徴量とを比較する特徴比較部207を備えた点が、実施の形態1に係る説明提示装置1と相違する。データ記憶部201、特徴抽出部202、技能判定部203、形式知紐付け部204、説明抽出部205、及び形式知選択部206は、実施の形態1におけるデータ記憶部101、特徴抽出部102、技能判定部103、形式知紐付け部104、説明抽出部105、及び形式知選択部106とそれぞれ同様である。
図13は、実施の形態2に係る説明提示装置2の動作の例を示すフローチャートである。説明提示装置2の動作は、他の作業者の特徴と比較するステップS412を有する点が、実施の形態1に係る説明提示装置1の動作と異なる。ステップS401~S404、S411は、図7におけるステップS300~S304、S311と同様である。
ステップS412において、特徴比較部207は、作業者Pのセンサデータから得られた暗黙的特徴量xと、データ記憶部201に記憶しておいた他の作業者の暗黙的特徴量との距離を算出し、データ記憶部201に予め記憶する。
例えば、特徴比較部207は、暗黙的特徴量同士の近さを示す相関ベースの類似度を、例えば、分散共分散行列により算出し、行動Aの熟練度yよりも熟練度が高いデータの中から、距離の近い順にK個(Kは正の整数)のデータを得る。特徴抽出部202は、前記距離に基づいて特徴量を抽出する。
ここでは、距離として、相関ベースのものを挙げた。しかし、用いられる距離は、コサイン距離、PCA(principal component analysis)によって次元圧縮をかけた上でのユークリッド距離、などのような公知の様々な距離算出法で得られるいずれの距離であってもよい。
ステップS405~S410において、説明抽出部205は、暗黙的特徴量に変更を加えて探索を行う。ここで、説明抽出部205は、特徴比較部207により抽出したK個のデータを基に、熟練度の期待値が高くなるような暗黙的特徴量の要素を優先的に変化させ、かつ、K個のデータの暗黙的特徴量の範囲を大きく逸脱しないように探索を行う。
このように作業者Pと暗黙的特徴量が近いデータを基に反実仮想的な説明を抽出することで、実例を考慮した形式知の習得を促すことができ、効率的な習熟が可能であり、習熟時間の短縮が期待できる。
また、暗黙的特徴量同士の比較を実現することで、形式知紐付け部204は、ニューラルネットワークなどの教師あり学習による紐付けだけでなく、協調フィルタリングなどのモデル生成を必要としない紐付け方法を用いることが可能となる。
協調フィルタリングの例として、相関ベースの距離に基づく協調フィルタリングが挙げられる。図14は、実施の形態2に係る説明提示装置2によって生成されるデータの例を表形式(表3)で示す図である。図15は、得られた相関係数の例を表形式(表4)で示す図である。図16は、行動に紐付けられた形式知を相関係数で重み付けた値の和によって得られる熟練技能を得るために推奨される行動を表形式(表5)で示す図である。
図14の表3に示されるように、熟練度y,…,y>yとなる行動1,…,Lを抽出し、これらの特徴量同士の相関係数cov(a,j)を式(1)によって算出する。
Figure 0007158633000001
その結果、図15の表4に示されるような相関係数が得られる。行動A1aと相関係数0.7以上の行動を選択した場合、行動A3a、行動ALaが協調フィルタリングするためのデータとして選択される。これを基に、説明抽出部205は、図16の表5に示されるように、各行動と紐付けられた形式知を上記の相関係数で重み付けし、重み付けされた形式知の和を行動Aが熟練技能を得るために推奨される行動として提示するための提示情報を抽出する。図1に示される表示器15は、提示情報に基づく画像を表示する。
説明抽出部205は、ステップS405で相関係数の閾値をいくつに設定するか、目標とする到達熟練度をいくつに設定するかを変更することで、他の作業者の形式知を考慮して、暗黙的特徴量と形式知の紐付けが可能となる。
形式知紐付け部204は、上述した協調フィルタリングのような手法に限らず、ベイジアンネットワーク(Bayesian network)を用いて、熟練度y>yが得られたとき、その要因は、形式知である確率を算出するなどによって、事象の発生確率を基に値を推定することで、暗黙的特徴量と形式知の紐付けを行ってもよい。
以上の説明は、作業者と他の作業者のみの比較に基づいた例について示している。しかし、説明抽出部205の仮想現実的な暗黙的特徴量の探索方法を変えることで、説明抽出部205は、作業者Pが技能を体得したとして、少しずつ行動が近い人のやり方を学びながら、目標クラスに近づけていく学習方法になるように説明を提示するための提示情報を抽出することができる。
例えば、評価関数Fは、図10の探索キューを記憶済みの他の作業者の暗黙的特徴量と探索中の特徴量の距離の差が大きいほど評価が低く、目標熟練度に達するまでの形式知の変動ΣΔSが小さいほど評価が高く、熟練度が高いほど評価が高くなるように設計される。具体的には、評価関数Fは、以下の式(2)に示されるように設計されればよい。
Figure 0007158633000002
ステップS412において、特徴比較部207は、作業者Pのセンサデータから得られた暗黙的特徴量xと、データ記憶部201に記憶されている他の作業者のセンサデータから得られた暗黙的特徴量とを比較し、熟練度yよりも値が大きく、目標となる熟練度が達成できるようなセンサデータjがK個以上含まれるように、センサデータを抽出する。そして、特徴比較部207は、得られた全てのセンサデータについて評価関数Fによるスコアを求め、距離算出用の比較対象集合Jにjを加える。
ステップS405~S410において、説明抽出部205は、行動(式2におけるa)を開始点として、評価関数Fの値が高い順に探索キューから暗黙的特徴量xを取り出し、この値にΔxだけ変更を加えて、特徴比較部207により抽出したJ個のデータと形式知の行動(式2におけるaからi-1まで)の変化量の合計を基に評価関数Fでスコアを算出し、探索キューへのデータの追加を行う。以上のような評価関数Fを用いた処理を繰り返すことによって、目標とする熟練度を達成しつつ、特徴量が、獲得したデータから大きく離れないような探索が可能となる。
実施の形態2に係る説明提示装置2を用いれば、特徴比較部207を設けて他の作業者の行動との比較をし、その結果を用いることで、現実とかけ離れた反実仮想的な説明が提示されることを防ぐことが可能である。
《実施の形態3》
実施の形態1に係る説明提示装置1は、自動的に求められた暗黙的特徴量に形式知を紐付けし、どのような技を習得すれば、熟練度を向上させることができるかを作業者に提示する。しかし、作業者に対し、具体的に、どのような行動変容をすればよいかを提示できれば、作業者の技能の習得はより一層加速するものと考えられる。そこで、実施の形態3に係る説明提示装置3は、特徴取得部として技能データ生成部302を備えている。実施の形態3では、技能データ生成部302は、技能判定部が熟練度及び加工精度などの技能レベルを判定できるように、特徴抽出部が特徴量を自動抽出するのではなく、元のセンサデータを生成データとして再現できるように特徴量を抽出する。
図17は、実施の形態3に係る説明提示装置3の構成を示す機能ブロック図である。図17に示されるように、説明提示装置3は、データ記憶部301と、特徴取得部としての技能データ生成部302と、技能判定部303と、形式知紐付け部304と、反実仮想的説明抽出部である説明抽出部305と、形式知選択部306とを有する。実施の形態3に係る説明提示装置3は、特徴取得部として技能データ生成部302を備えた点が、実施の形態1に係る説明提示装置1と異なる。つまり、技能データ生成部302は、技能判定部が熟練度及び加工精度を判定できるように、元のセンサデータを再現できるように特徴量を抽出する。データ記憶部301、技能判定部303、形式知紐付け部304、説明抽出部305、及び形式知選択部306は、実施の形態1におけるデータ記憶部101、技能判定部103、形式知紐付け部104、説明抽出部105、及び形式知選択部106とそれぞれ同様である。
技能データ生成部302は、ニューラルネットワークにより特徴量の圧縮を行う。その後、技能判定部303は、技能レベルとして熟練度を判定する。また、技能データ生成部302の後半部分にはデコーダが設けられており、技能データ生成部302は、元のセンサデータを復元するようなマルチタスクラーニングを行う。
図18は、マルチタスクラーニングを実行するネットワークの構成例を示す図である。図18のネットワークでは、入力層141aからセンサデータdをニューラルネットワーク142aに与え、中間層145とニューラルネットワーク142bを介して熟練度yを出力する。また、これと共に、ニューラルネットワークの中間層145から、デコーダ143を介して、センサデータdを復元し、出力層141bから出力する。技能データ生成部302は、この分岐点の出力値を、暗黙的特徴量xとして抽出する。
図18の学習方法では、基本構成図のモデルと同様であり、教師信号となる熟練度yとセンサデータdとを用い、ニューラルネットワーク142bから出力される熟練度yとセンサデータdで構成されるロス関数Lが小さくなるようにパラメータの調整を行う。パラメータ調整後、データ記憶部301は、技能データ生成部302と技能判定部303が生成した学習済モデルM1を記憶する。
ロス関数Lは、例えば、デコーダ143のロスLdecodeと熟練度の推定部分のロスLの重み付き和で定義することができる。
図18のデコーダ143は、データを生成するモデルであれば、VAE(variational autoencoder)、GAN(Generative Adversarial Network)、など公知のものであることが可能である。
次に、反実仮想的な説明を提供する動作を説明する。図19は、反実仮想的な説明を提供する動作を示すフローチャートである。
ステップS507において、技能データ生成部302及び技能判定部303は、データ記憶部301から取得したデータを学習済モデルM1に暗黙的特徴量xとして入力する。そして、技能データ生成部302が学習したモデルは、図18に示されるように構成されているため、暗黙的特徴量xから熟練度yとセンサデータdの2つのデータが出力される。ステップS510でデータ記憶部301は、暗黙的特徴量x,センサデータd,熟練度y,形式知Sを記憶し、表6を得る。
図20は、実施の形態3に係る説明提示装置3によって生成されるデータの例を表形式(表6)で示す図である。図21は、図20に示されるセンサデータを可視化し、特に異なる部分を変化#1、変化#2として表示した図である。ステップS511で説明抽出部305は、図20の表6の反実仮想行動C~Cのセンサデータdを可視化し、センサデータdと特に異なる部分を、図21の変化#1、変化#2の部分のように強調表示するための提示情報を抽出する。図1に示される表示器15は、提示情報に基づく画像を表示する。
以上に説明したように、実施の形態3では、技能データ生成部302が暗黙的特徴量の抽出とセンサデータの復元とを共に行い、熟練度を判別するための特徴表現とセンサデータを紐付けることで、形式知を変化させた場合に実際にセンサデータがどのように変容するか示す提示情報を生成する。実施の形態3では、この対応関係(すなわち、形式知の変化と、センサデータの変容との対応関係)を利用し、技を習得する上で取るべき行動変容のヒントを示すことができる。
なお、実施の形態3では、センサデータの生成を行う生成モデルを用いているが、センサデータのどの部分の行動を変容するべきかを着目する方法として、アテンション機構(Attention Mechanism)を用いてもよい。
図22は、Attention Branch Network(ABN)の例を示す図である。実施の形態3に火且つ説明提示装置3は、例えば、図22に示されるABNに示されるように、中間の特徴量のうちどこに着目すべきかを抽出するアテンション機構を設け、このアテンション機構で、アテンションが高い箇所に該当するセンサデータを強調表示させるための提示情報を生成してもよい。この強調表示には、例えば、非特許文献1に記載の方法を用いることができる。
H.Fukui、 他3名著、 "Attention Branch Network: Learning of Attention Mechanism for Visual Explanation"、 arXiv preprint, arXiv:1812.10025, 2018、 インターネット〈https://arxiv.org/pdf/1812.10025.pdf〉
《実施の形態4》
実施の形態3では、技能データ生成部302は、行動変容させるべき領域(例えば、変化#1、変化#2)を確認するために用いられている。実施の形態4では、熟練技能に関する領域のセンサデータに対して摂動を与えることで、熟練度及び加工精度などの技能レベルがどのように変わりそうか、そして技能レベルの信憑性の確認、などを行うことが可能になる。これを実現するために、実施の形態4に係る説明提示装置4は、摂動確認部を備える。
図23は、実施の形態4に係る説明提示装置4の構成を示す機能ブロック図である。図23に示されるように、説明提示装置4は、データ記憶部401と、特徴取得部としての技能データ生成部402と、技能判定部403と、形式知紐付け部404と、反実仮想的説明抽出部である説明抽出部405と、形式知選択部406と、摂動確認部408とを有する。実施の形態4に係る説明提示装置4は、摂動確認部408を備えた点が、実施の形態3に係る説明提示装置3と異なる。データ記憶部401、技能データ生成部402、技能判定部403、形式知紐付け部404、説明抽出部405、及び形式知選択部406は、実施の形態3におけるデータ記憶部301、技能データ生成部302、技能判定部303、形式知紐付け部304、説明抽出部305、及び形式知選択部306とそれぞれ同様である。
以下に摂動確認の流れを示す。まず、作業者Pは、技能を習得したいと考えている行動に該当するセンサデータを入力し、形式知選択部406により形式知が選択される。その結果を受け、説明抽出部405は、選択された形式知だけができるだけ大きく変化するように探索の評価関数Fを変更し、暗黙的特徴量を変更して反実仮想的な説明としての暗黙的特徴量xの生成を行う。形式知紐付け部404は、生成された暗黙的特徴量xに対応する形式知を取得し、技能判定部403は、熟練度yを判定し、技能データ生成部402は、センサデータdを生成データとして再現する。
説明抽出部405は、上記の探索により目標の熟練度yを満たすようにするために、反実仮想的な形式知の候補を作業者Pに提示する。次に、作業者Pは、提示されたセンサデータのうち特に熟練度に影響を及ぼす重要な部分について、摂動確認部408によって摂動を加える(すなわち、入力するセンサデータに変化を与える)。これにより、摂動確認部408は、摂動により変更されたセンサデータをデータ記憶部401に登録し、技能データ生成部402は、摂動が加えられたセンサデータを読み込み、元のデータの生成を行い、データ記憶部401にセンサデータを登録する。
摂動確認部408は、技能データ生成部402に入力したセンサデータと、技能データ生成部402が出力したセンサデータを比較し、生成データと摂動が加えられたセンサデータとの差異を作業者Pに提示するための処理を行う。また、これに合わせて説明抽出部405は、センサデータに摂動が加えられた結果、熟練技能は、どのように変わったかを合わせて提示するための提示情報を抽出する。図1に示される表示器15は、提示情報に基づく画像を表示する。
以上に説明したように、実施の形態4に係る説明提示装置4は、摂動時に生成されるセンサデータの挙動を可視化することで、学習済モデルに含まれていないデータを用いた場合、適切な説明が生成され難くなり、説明の精度が著しく落ちることを利用する。実施の形態4に係る説明提示装置4は、このような方法により、生成される学習済モデルが扱うことのできるデータの許容範囲を決定でき、また、摂動がどのように熟練度に影響を与えるかを知ることができる。
また、実施の形態4の変形例として、作業者Pは、説明抽出部405のセンサデータの可視化のうち、特にどこに着目すべきかの範囲を摂動確認部408に入力(例えば、図21の変化#1、変化#2のいずれかを選択)すると、説明抽出部405は、該当部分のセンサデータのみが変化し、かつ、熟練度が現状よりも高くように暗黙的特徴量を探索し、そのセンサデータの変化の振れ幅を提示するようにしてもよい。
以上に説明したように、実施の形態4に係る説明提示装置4を用いれば、センサデータの摂動の幅を提示することで、作業者Pは、技能と体得する上で許容される行動変容を、再度の行動の登録を行う前に確認することが可能である。
《実施の形態5》
実施の形態1では、図3に示されるように、技能判定部103、特徴抽出部102、及び形式知紐付け部104のセットである学習装置によって形成される学習済モデルが、1個の学習済モデルM1である例を説明している。これに対し、実施の形態5に係る説明提示装置5は、複数の学習済モデルM1を生成し、これらの中から、作業者が習得を希望する技能に近い技能(すなわち、関連技能)に関する学習済モデルを探し当てる。
図24は、実施の形態5に係る説明提示装置5の構成を示す機能ブロック図である。図24に示されるように、説明提示装置5は、データ記憶部501と、特徴取得部としての特徴抽出部502と、技能判定部503と、形式知紐付け部504と、反実仮想的説明抽出部である説明抽出部505と、形式知選択部506と、モデル優先順位決定部509とを有する。実施の形態5に係る説明提示装置5は、複数の学習済モデルM1を生成する点と、モデル優先順位決定部509が複数の学習済モデルM1の中から作業者が習得を希望する技能に近い技能に関する学習済モデルを探し当てる点が、実施の形態1に係る説明提示装置1と異なる。言い換えれば、説明提示装置5は、技能判定部503、特徴抽出部502、及び形式知紐付け部504のセットを複数有し、モデル優先順位決定部509は、複数のセットの優先順位を決定する。つまり、説明提示装置5は、それぞれが技能判定部503、特徴抽出部502、及び形式知紐付け部504からなる複数の学習セットと、複数の学習セットの優先順位を決定するモデル優先順位決定部509とを有し、複数の学習セットは、データベースから時分割でセンサデータを取得する。データ記憶部501、特徴抽出部502、技能判定部503、形式知紐付け部504、説明抽出部505、及び形式知選択部506は、実施の形態1におけるデータ記憶部101、特徴抽出部102、技能判定部103、形式知紐付け部104、説明抽出部105、及び形式知選択部106とそれぞれ同様である。
モデル優先順位決定部509は、データ記憶部501に登録された作業者Pのセンサデータを読み出し、複数の学習済モデルの各々が扱うのに適した時間幅のセンサデータ(すなわち、時分割センサデータ)を取得する。
図25は、実施の形態5に係る説明提示装置5における時分割センサデータの例を示す図である。学習済モデル#1は、機械学習時に時間R1の時間データを用いているため、センサデータを時間R1ずつ区切って、且つ時間をt1ずつ進めて時分割を行う。学習済モデル#2は、機械学習時に時間R2の時間データを用いているため、センサデータを時間R2ずつ区切って、且つ時間をt2ずつ進めて時分割を行う。
次に、モデル優先順位決定部509は、取得した各時間幅のセンサデータを全ての学習済モデルに入力し、技能判定部503及び特徴抽出部502のニューラルネットワークの最終層におけるデータの分布が正規分布から外れているかどうかをチェックする。このチェックには、例えば、非特許文献2に記載の方法を用いることができる。
モデル優先順位決定部509は、上記最終層において、データの分布が正規分布から外れていない学習済モデルとセンサデータとの組み合わせを優先的に選択し、説明抽出部505の特徴空間の探索を行う。作業者Pが予め形式知選択部506で着目したい形式知を選択した場合、モデル優先順位決定部509は、形式知を学習データとして含んでいた学習済モデルに選択範囲を絞り込む。
モデル優先順位決定部509は、時分割したセンサデータdt1,dt2,…,dtrを各学習済モデルに入力し、熟練度の変動のしやすさを基準に学習済モデルを選択してもよい。また、モデル優先順位決定部509は、熟練度が全く変動しない学習済モデルは、関連が無いものとし、熟練度の変動が確認できる学習済モデルを優先的に用いてもよい。
また、実施の形態3及び4で説明したように、技能データ生成部302及び402がVAE、GANなどの手法を用いて、中間層から出力されるデータの分布が正規分布になるように次元圧縮を行い、元のセンサデータを復元するように構成し、実施の形態5におけるモデル優先順位決定部509が、データの分布が正規分布から外れているどうかによって、相関のあるセンサデータと学習済モデルのセットを決定してもよい。
図26は、可視化された提示情報の例を示す図である。まず、説明抽出部505は、これまでに蓄積されたデータベースの情報を基に、表7に示されるように、ベイズルールによって熟練度が目標以上になる要因として、形式知1~mが含まれる確率を算出し、これを形式知選択部506を操作するための設定参考値として、技能を習得したい作業者Pに提示するために、表示器(図1に示される)に表示させてもよい。図26の表8には、技能を習得したい作業者Pが形式知選択部506で形式知として「技1」を選択した場合の可視化の例が示される。表8では、「技1」の値が大きく、熟練度が現在のものよりも大きい反実仮想行動C~C10の例が、一覧表示される。例えば、図26の表8の例では、熟練度が現在の作業者のセンサデータを基にして技能判定部503によって判定されたものよりも大きく、かつ、「技1」を降順に、10件の反実仮想行動の例が並べ替えて可視化されている。また、表8の左から3列目には「技1」と関連の高い技能である関連技能(S、S、など)を1つ提示している。また、表8のセンサデータの列には、技能データ生成部503によって生成されたデータを基に、大きな変化が発生した箇所を太線枠又はカラー枠などで、強調表示した例が示されている。なお、作業者Pが形式知を選択しない場合、熟練度が高い順もしくは、暗黙的特徴量の相関が高い順もしくは、これらを組み合わせたスコア順に、10件の反実仮想行動の例が並べ替えられてもよい。なお、図26に示される形式知の可視化の方法は一例であり、センサデータの重畳度合い、特徴量の相関度合い、などをベースにして、形式知を可視化し、形式知同士のつながりを作業者Pが分かるように提示してもよい。なお、図26に示される提示情報の例を、他の実施の形態に適用してもよい。
以上に説明したように、実施の形態5に係る説明提示装置5を用いれば、作業者Pが、複数の学習済モデルの中から、学習済モデルに入力するデータに適した学習済モデルを選択する操作が不要又は容易になり、説明提示装置5が自動的に技能が抽出されそうな部分を選択し、これと共に対応する学習済モデルを選択することができる。
また、実施の形態5に係る説明提示装置5は、作業者Pが形式知選択部506で形式知を選択した際に、対応する形式知が取り込まれていて、かつ入力されたセンサデータと関連があると思われる学習済モデルを選択することが可能である。そして、複数の技能を扱う場合に、適切な学習済モデルが選択され、暗黙的特徴量に加えて技能の習得に適した形式知の提示が可能となる。
1~5 説明提示装置、 11 プロセッサ、 12 メモリ、 13 記憶装置、 14 操作装置、 15 表示器、 16 センサ、 20 学習装置、 21 データ取得部、 22 モデル生成部、 23 学習済モデル記憶部、 30 推論装置、 31 データ取得部、 32 推論部、 33 学習済モデル記憶部、 101、201、301、401、501 データ記憶部、 102、202、502 特徴抽出部(特徴取得部)、 302、402 技能データ生成部(特徴取得部)、 103、203、303、403、503 技能判定部、 104、204、304、404、504 形式知紐付け部、 105、205、305、405、505 説明抽出部、 106、206、306、406、506 形式知選択部、 207 特徴比較部、 408 摂動確認部、 509 モデル優先順位決定部。

Claims (14)

  1. 作業者の行動を検出して得られたセンサデータと取得した人間が解釈できる知識である形式知とを記憶するデータベースから、前記行動の特徴量を取得する特徴取得部と、
    前記特徴量から前記作業者の技能レベルを判定し、前記データベースに前記技能レベルを登録する技能判定部と、
    前記データベースにおいて、前記特徴量に形式知を紐付ける形式知紐付け部と、
    前記特徴量と前記特徴量に紐付けられた前記形式知とを含む提示情報を抽出する説明抽出部と、
    を有し、
    前記特徴取得部、前記技能判定部、及び前記形式知紐付け部は、前記特徴量と前記技能レベルとを含む第2の学習用データを用いて、前記特徴量に紐づけられる形式知を出力するための第2の学習済モデルを生成する
    説明提示装置。
  2. 前記特徴取得部及び前記技能判定部は、前記センサデータと前記センサデータの正解信号とを含む第1の学習用データを用いて、前記センサデータから前記技能レベルを判定するための第1の学習済モデルを生成する
    請求項1に記載の説明提示装置。
  3. 前記特徴取得部及び前記技能判定部は、前記第1の学習済モデルを用いて前記センサデータから前記技能レベルを判定する
    請求項2に記載の説明提示装置。
  4. 前記特徴取得部、前記技能判定部、及び前記形式知紐付け部は、前記第2の学習済モデルを用いて前記形式知を出力する
    請求項に記載の説明提示装置。
  5. 前記技能レベルは、熟練度及び加工精度の少なくとも一方を含む
    請求項1からのいずれか1項に記載の説明提示装置。
  6. 前記センサデータは、映像データを含む
    請求項1からのいずれか1項に記載の説明提示装置。
  7. 前記提示情報に基づく画像を表示する表示器をさらに有する
    請求項1からのいずれか1項に記載の説明提示装置。
  8. 作業者の行動を検出して得られたセンサデータと取得した人間が解釈できる知識である形式知とを記憶するデータベースから、前記行動の特徴量を取得する特徴取得部と、
    前記特徴量から前記作業者の技能レベルを判定し、前記データベースに前記技能レベルを登録する技能判定部と、
    前記データベースにおいて、前記特徴量に形式知を紐付ける形式知紐付け部と、
    前記特徴量と前記特徴量に紐付けられた前記形式知とを含む提示情報を抽出する説明抽出部と、
    前記作業者のセンサデータから得られた暗黙的特徴量と他の作業者のセンサデータから得られた他の暗黙的特徴量との距離を算出し前記データベースに予め記憶する特徴比較部と、
    を有し、
    前記特徴取得部は、前記距離に基づいて前記特徴量を取得する
    明提示装置。
  9. 前記特徴取得部は、前記距離に基づいて抽出された、限られた個数の特徴量を取得する
    請求項に記載の説明提示装置。
  10. 作業者の行動を検出して得られたセンサデータと取得した人間が解釈できる知識である形式知とを記憶するデータベースから、前記行動の特徴量を取得する特徴取得部と、
    前記特徴量から前記作業者の技能レベルを判定し、前記データベースに前記技能レベルを登録する技能判定部と、
    前記データベースにおいて、前記特徴量に形式知を紐付ける形式知紐付け部と、
    前記特徴量と前記特徴量に紐付けられた前記形式知とを含む提示情報を抽出する説明抽出部と、
    を有し、
    前記特徴取得部は、前記特徴量を取得するとともに、前記特徴量から元のセンサデータを生成データとして再現する技能データ生成部であり、
    前記説明抽出部は、前記提示情報を、前記センサデータと前記生成データの差の大きい範囲を強調表示させる表示にする
    明提示装置。
  11. 作業者の行動を検出して得られたセンサデータと取得した人間が解釈できる知識である形式知とを記憶するデータベースから、前記行動の特徴量を取得する特徴取得部と、
    前記特徴量から前記作業者の技能レベルを判定し、前記データベースに前記技能レベルを登録する技能判定部と、
    前記データベースにおいて、前記特徴量に形式知を紐付ける形式知紐付け部と、
    前記特徴量と前記特徴量に紐付けられた前記形式知とを含む提示情報を抽出する説明抽出部と、
    前記データベースに入力する前記センサデータに変化を与え、摂動が加えられたセンサデータを前記データベースに記憶させる摂動確認部と、
    を有し、
    前記特徴取得部は、前記特徴量を取得するとともに、前記特徴量から元のセンサデータを生成データとして再現する技能データ生成部であり、
    前記説明抽出部は、前記生成データと、前記摂動が加えられたセンサデータとの差異を提示する
    明提示装置。
  12. 作業者の行動を検出して得られたセンサデータと取得した人間が解釈できる知識である形式知とを記憶するデータベースから、前記行動の特徴量を取得する特徴取得部と、
    前記特徴量から前記作業者の技能レベルを判定し、前記データベースに前記技能レベルを登録する技能判定部と、
    前記データベースにおいて、前記特徴量に形式知を紐付ける形式知紐付け部と、
    前記特徴量と前記特徴量に紐付けられた前記形式知とを含む提示情報を抽出する説明抽出部と、
    それぞれが前記技能判定部、前記特徴取得部、及び前記形式知紐付け部からなる複数の学習セットと、
    前記複数の学習セットの優先順位を決定するモデル優先順位決定部と
    を有し、
    前記複数の学習セットは、前記データベースから時分割でセンサデータを取得する
    明提示装置。
  13. 説明提示装置によって実行される説明提示方法であって、
    作業者の行動を検出して得られたセンサデータと取得した人間が解釈できる知識である形式知とを記憶するデータベースから、前記行動の特徴量を取得するステップと、
    前記特徴量から前記作業者の技能レベルを判定し、前記データベースに前記技能レベルを登録するステップと、
    前記データベースにおいて、前記特徴量に形式知を紐付けるステップと、
    前記特徴量と前記特徴量に紐付けられた前記形式知とを含む提示情報を抽出するステップと、
    前記特徴量と前記技能レベルとを含む学習用データを用いて、前記特徴量に紐づけられる前記形式知を出力するための学習済モデルを生成するステップと、
    を有する説明提示方法。
  14. 作業者の行動を検出して得られたセンサデータと取得した人間が解釈できる知識である形式知とを記憶するデータベースから、前記行動の特徴量を取得するステップと、
    前記特徴量から前記作業者の技能レベルを判定し、前記データベースに前記技能レベルを登録するステップと、
    前記データベースにおいて、前記特徴量に形式知を紐付けるステップと、
    前記特徴量と前記特徴量に紐付けられた前記形式知とを含む提示情報を抽出するステップと、
    前記特徴量と前記技能レベルとを含む学習用データを用いて、前記特徴量に紐づけられる前記形式知を出力するための学習済モデルを生成するステップと、
    をコンピュータに実行させる説明提示プログラム。
JP2022542564A 2020-08-14 2020-08-14 説明提示装置、説明提示方法、及び説明提示プログラム Active JP7158633B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/030891 WO2022034685A1 (ja) 2020-08-14 2020-08-14 説明提示装置、説明提示方法、及び説明提示プログラム

Publications (3)

Publication Number Publication Date
JPWO2022034685A1 JPWO2022034685A1 (ja) 2022-02-17
JP7158633B2 true JP7158633B2 (ja) 2022-10-21
JPWO2022034685A5 JPWO2022034685A5 (ja) 2022-11-16

Family

ID=80247072

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022542564A Active JP7158633B2 (ja) 2020-08-14 2020-08-14 説明提示装置、説明提示方法、及び説明提示プログラム

Country Status (2)

Country Link
JP (1) JP7158633B2 (ja)
WO (1) WO2022034685A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002333826A (ja) 2001-05-10 2002-11-22 Nec Corp 技能向上支援装置
JP2017146577A (ja) 2016-02-15 2017-08-24 日本電信電話株式会社 技術支援装置、方法、プログラムおよびシステム
JP2020034849A (ja) 2018-08-31 2020-03-05 オムロン株式会社 作業支援装置、作業支援方法及び作業支援プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002333826A (ja) 2001-05-10 2002-11-22 Nec Corp 技能向上支援装置
JP2017146577A (ja) 2016-02-15 2017-08-24 日本電信電話株式会社 技術支援装置、方法、プログラムおよびシステム
JP2020034849A (ja) 2018-08-31 2020-03-05 オムロン株式会社 作業支援装置、作業支援方法及び作業支援プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
竜田 力、Dong Phuong、梶原祐輔、島川博光,身体動作に着目した農業指導,FIT2016 第15回情報科学技術フォーラム 講演論文集 第4分冊,日本,一般社団法人電子情報通信学会,2016年08月23日,pp.261-262(M-034)

Also Published As

Publication number Publication date
JPWO2022034685A1 (ja) 2022-02-17
WO2022034685A1 (ja) 2022-02-17

Similar Documents

Publication Publication Date Title
Dieber et al. Why model why? Assessing the strengths and limitations of LIME
US9721221B2 (en) Skill estimation method in machine-human hybrid crowdsourcing
US20180268262A1 (en) Information processing device and non-transitory computer readable medium
Altuwairqi et al. Student behavior analysis to measure engagement levels in online learning environments
JP7433601B2 (ja) エキスパートレポートエディタ
Rajendran et al. A theory-driven approach to predict frustration in an ITS
Shen et al. A scenario-driven decision support system for serious crime investigation
CN112231491A (zh) 基于知识结构的相似试题识别方法
Medjden et al. Adaptive user interface design and analysis using emotion recognition through facial expressions and body posture from an RGB-D sensor
Stanković et al. Artificial neural network model for prediction of students’ success in learning programming
Situmorang Analysis optimization k-nearest neighbor algorithm with certainty factor in determining student career
Beriwal et al. Techniques for suicidal ideation prediction: a qualitative systematic review
JP7158633B2 (ja) 説明提示装置、説明提示方法、及び説明提示プログラム
JP5931021B2 (ja) 対人認知傾向モデル学習装置、対人認知状態推定装置、対人認知傾向モデル学習方法、対人認知状態推定方法及びプログラム
CN102959560A (zh) 自动吸引力测量方法
JP2017207691A (ja) 択一問題の正答率予測方法
JP7409731B1 (ja) テキスト動画分類モデルを用いた事象判定方法、判定装置、及び判定プログラム
WO2023175802A1 (ja) 作業分析装置、作業分析システム、作業分析方法および記憶媒体
Mohamad Generating visualisation for crime scene investigation based on probability result of knowledge-based system
CN113658713B (zh) 传染趋势预测方法、装置、设备及存储介质
US20240020644A1 (en) Inclusive product design
Adilakshmi et al. A medical diagnosis system based on explainable artificial intelligence: autism spectrum disorder diagnosis
Chauhan et al. An experimental protocol for the evaluation of open-ended category learning algorithms
JP7435821B2 (ja) 学習装置、心理状態系列予測装置、学習方法、心理状態系列予測方法、及びプログラム
Kim Group affect and group cohesion in human-agent teams

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220721

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220721

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220913

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221011

R150 Certificate of patent or registration of utility model

Ref document number: 7158633

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150