JP2016053606A - 対話型問診訓練システム、対話型処理装置及びそのプログラム - Google Patents

対話型問診訓練システム、対話型処理装置及びそのプログラム Download PDF

Info

Publication number
JP2016053606A
JP2016053606A JP2014178642A JP2014178642A JP2016053606A JP 2016053606 A JP2016053606 A JP 2016053606A JP 2014178642 A JP2014178642 A JP 2014178642A JP 2014178642 A JP2014178642 A JP 2014178642A JP 2016053606 A JP2016053606 A JP 2016053606A
Authority
JP
Japan
Prior art keywords
patient
instruction
unit
state transition
trainee
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014178642A
Other languages
English (en)
Inventor
高西 淳夫
Atsuo Takanishi
淳夫 高西
石井 裕之
Hiroyuki Ishii
裕之 石井
健太朗 松永
Kentaro Matsunaga
健太朗 松永
保 片山
Tamotsu Katayama
保 片山
健一 布施
Kenichi Fuse
健一 布施
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KYOTO KAGAKU KK
Waseda University
Original Assignee
KYOTO KAGAKU KK
Waseda University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KYOTO KAGAKU KK, Waseda University filed Critical KYOTO KAGAKU KK
Priority to JP2014178642A priority Critical patent/JP2016053606A/ja
Publication of JP2016053606A publication Critical patent/JP2016053606A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Instructional Devices (AREA)

Abstract

【課題】医師等の訓練者による問診訓練を、実際の臨床現場に近い形で、よりリアルに行うことを可能にする。
【解決手段】対話型問診訓練システム10は、患者疑似体による動作を表現可能に設けられた患者シミュレーション装置11と、訓練者の音声による指示に基づく患者疑似体の対応を患者シミュレーション装置11に指令する対話型処理装置12とを備えている。対話型処理装置12は、訓練者の音声を認識するための音声認識手段18と、音声認識結果に基づいて患者疑似体が行う対応を決定する対応決定手段20とを備えている。対応決定手段20では、訓練者からの指示が音声認識された場合、当該指示に応じて患者疑似体が動作するように指令する一方、訓練者からの指示が最終的に音声認識されない場合、患者疑似体の現在の状態からなされ得る次回の動作の優先順位に従って患者疑似体が動作するように指令する。
【選択図】 図1

Description

本発明は、医師等の訓練者が患者に対する問診の訓練を行うための対話型問診訓練システム、対話型処理装置及びそのプログラムに関する。
中枢性麻痺等の神経疾患の患者に対する医師の問診は、当該医師の指示により患者に幾つかの動作を順に行って貰いながら、段階的に疾患の有無を診断することが一般的である。このため、神経疾患の患者に対する医師の診察時には、患者の性別、年齢、病歴等を加味した所定のシナリオに基づいて行われる。従って、医師や医学生が、神経疾患の患者に対する問診の訓練を行う場合、患者に指示する一連の動作手順を表すシナリオに基づいて訓練を行う必要があるが、当該神経疾患の患者に特化した問診訓練用のトレーニング装置は現存しない。そこで、当該問診訓練時に、医師の指示に基づいて患者を動作させるには、患者役となる協力者が必要で、当該患者役の協力者では、神経患者に見られる動きを再現することが困難な場合がある。
ところで、特許文献1には、医療用実習装置が開示されている。この医療用実習装置では、所定の動作を可能にする患者疑似体を有し、当該患者疑似体に歯科医師等の訓練者が口頭で指示を出すと、当該訓練者の音声の認識処理が行われ、この音声認識された指示内容に対応して患者疑似体が動作するようになっている。
特開2012−8226号公報
しかしながら、前記特許文献1では、訓練者の音声認識が不能である場合の言及はないが、この場合、通常であれば、患者疑似体を全く動作させずに、訓練者の指示を再度確認するメッセージ等が発せられることが考えられる。特に、現在製品化されている音声認識処理装置の精度は、必ずしも高いとは言えず、入力された音声を誤認識してしまい、或いは、全く認識できない場合も少なくない。その場合、装置側では、訓練者に何度も問いかけを行うことが想定され、このことは、神経疾患の患者に対する問診の訓練用装置として前記特許文献1の構成を仮に適用しても、円滑な訓練を阻害する要因になる。更に、あらゆる音声の認識処理を行うために必要となる単語や用語は、膨大な量であるため、当該単語や用語からなる辞書と入力音声とのマッチングに時間がかかり、音声認識処理速度の低下を招来する。その結果、前記特許文献1の構成を問診訓練用装置として適用しても、問診訓練時に実際の臨床現場では見られないようなタイムラグが発生し、これも、円滑な問診訓練を阻害する要因になり、臨床現場での問診とは程遠い訓練になってしまう虞がある。また、実際の臨床現場では、医師が患者に対して同一内容を複数回指示しても、患者がなお認識していないときには、患者が予測的に何等かの動作を行うことが多いという現状もある。
本発明は、このような課題に着目して案出されたものであり、その目的は、医師等の訓練者による問診訓練を、実際の臨床現場に近い形で、よりリアルに行うことができる対話型問診訓練システム、対話型処理装置及びそのプログラムを提供することにある。
前記目的を達成するため、主として、本発明は、問診を受ける患者と同様の動作をする患者疑似体に対して、訓練者が問診訓練を行うための対話型問診訓練システムにおいて、前記患者疑似体による前記動作を表現可能に設けられた患者シミュレーション装置と、前記訓練者の音声による指示に基づく前記患者疑似体の対応を前記患者シミュレーション装置に指令する対話型処理装置とを備え、前記対話型処理装置は、前記訓練者の音声を認識するための音声認識手段と、当該音声認識手段での認識結果に基づいて、前記患者疑似体が行う対応を決定する対応決定手段とを備え、前記対応決定手段では、前記訓練者からの指示が前記音声認識手段で認識された場合、当該認識された指示に応じて前記患者疑似体が動作するように、前記患者シミュレーション装置に指令する一方、前記訓練者からの指示が前記音声認識手段で最終的に認識されない場合、前記患者疑似体の現在の状態からなされ得る次回の動作の優先順位に従って前記患者疑似体が動作するように、前記患者シミュレーション装置に指令する、という構成を採っている。
本発明によれば、訓練者からの指示が音声認識されない場合に、現在の患者の状態における次の動作の優先順位に基づいて、患者シミュレーション装置における患者疑似体を動作させる。このため、当該場合に訓練者側に発話が何度も要求されることなく、実際の現状に即して患者疑似体が行うと思われる次の動作が選択されて患者疑似体が動作することから、音声認識不能の状態に陥っても、訓練がストップせずに継続され、円滑な訓練に資することになる。従って、人手を要さずに、実際の臨床現場に近い形の問診訓練をよりリアルに行うことが可能になる。
また、患者疑似体の現在の状態からの可能性のある次回の状態遷移に関連する単語及び用語が抽出される辞書更新部を備えた構成によれば、音声認識処理時に用いられる辞書が、次回に医師から指示されると思われる内容の範囲内の単語等に絞り込まれ、指示される可能性の無い不要な単語等を音声認識処理から除外することで、音声認識処理時間の短縮化がなされ、これによっても、円滑な問診訓練に資することになる。
本実施形態に係る対話型問診訓練システムの構成図。 状態遷移モデルを表す状態遷移図。 前記対話型問診訓練システムによる処理を説明するためのフローチャート。
以下、本発明の実施形態について図面を参照しながら説明する。
図1には、本実施形態に係る対話型問診訓練システムの構成図が示されている。この図において、対話型問診訓練システム10は、神経疾患の患者に対する医師や医学生等の訓練者が所定のシナリオに基づいて問診訓練を行うための対話型システムである。この対話型問診訓練システム10は、問診を受ける患者と同様の動作を患者疑似体により表現可能に設けられた患者シミュレーション装置11と、訓練者の音声による指示に応じ、患者シミュレーション装置11で表現される患者疑似体の動作や要求等の対応を患者シミュレーション装置11に指令する対話型処理装置12とにより構成されている。
前記患者シミュレーション装置11は、訓練者の発話による音声が入力されるマイク等の音声入力部14と、対話型処理装置12からの指令に基づき、患者疑似体の動作を表現可能な患者動作表現部15と、対話型処理装置12からの指令に基づき、患者疑似体から訓練者への要求内容を出力する患者要求出力部16とを備えている。
前記患者動作表現部15は、図示省略しているが、人間の顔面部及び腕部の動作を模擬して動作可能に設けられたロボットと、各種情報の入力や表示を可能にするGUI(グラフィカル・ユーザ・インターフェイス)とからなる。前記ロボットは、患者疑似体となり、対話型処理装置12からの指令に従い、当該指令に対応した動作制御がなされる。このロボットは、図示しないアクチュエータや各種機構により構成され、当該アクチュエータや各種機構を所定の動作指令によって動作可能に制御する公知の制御手法が採用されている。これらロボットの構成や制御手法は、本発明の本質部分ではないため、ここでは、詳細な説明を省略する。
なお、前記患者動作表現部15としては、ロボット等のハードウェアを用いて患者疑似体の動作を表現させる前述の構成に限定されず、ソフトウェアにより、3次元のグラフィックデザインで作成した患者疑似体をディスプレイ等の表示装置(図示省略)内で動かす構成を採ることもできる。また、患者動作表現部15では、訓練者による指示に基づき、神経疾患における患者特有の動きを患者疑似体に模擬させ、或いは、健常者と同等の動きを患者疑似体にさせても良い。例えば、訓練者からの「右腕を肩まで上げる」という指示に対し、後述する各種の処理の結果、当該指示に対応した動作を患者疑似体に行わせる際に、右腕が完全に肩まで上がらない動きの態様にしたり、右腕が完全に肩まで上がる動きの態様にしても良い。これら患者動作表現部15での患者疑似体の動きの態様は、神経疾患の各種症状等に対応した種々のモードを選択して決定することもできる。
前記患者要求出力部16は、図示しないスピーカ等から発せられる音声により、患者疑似体からの所定の要求内容を訓練者に知らせる構成としても良いし、当該要求内容を文字等により前記表示装置(図示省略)に表示させて訓練者に視認可能にする構成を採っても良い。
前記対話型処理装置12は、CPU等の演算処理装置及びメモリやハードディスク等の記憶装置等からなるコンピュータによって構成され、当該コンピュータを以下の各手段として機能させるためのプログラムがインストールされている。
この対話型処理装置12は、前記音声入力部14で入力された訓練者の音声を認識するための音声認識手段18と、音声認識手段18での認識結果に基づいて、患者シミュレーション装置11での対応を決定する対応決定手段20とを備えている。
前記音声認識手段18は、所定の単語、用語(以下、「単語等」と称する)が記憶された辞書記憶部22と、辞書記憶部22から、所定のタイミング毎に、次回の音声認識処理に適用される可能性のある単語等を抽出して辞書とする辞書更新部23と、辞書更新部23で更新された辞書の範囲内で、予め記憶された文法上のルールを用いながら訓練者の音声を認識する処理を行い、当該処理結果となる認識結果データを対応決定手段20に出力する音声認識処理部24とを備えている。
前記辞書更新部23では、辞書登録される種々の単語等について、次のようにして、所定のタイミング毎に、次回の音声認識処理時に適用される単語等の絞り込み、選択、調整が行われる。すなわち、前記対応決定手段20では、後述するように、患者疑似体が動作して所定の状態(姿勢)になったときに、当該状態に応じて、患者疑似体の次の動作が一又は複数パターン予測される。そこで、辞書更新部23では、当該予測結果から、当該予測される動作に関連する単語等のみが、次回の音声認識処理での辞書として活用されるように調整され、その他の単語等は、次回の音声認識処理で辞書に含めないように設定される。これにより、音声認識処理部24での音声と辞書とのマッチング処理量を大幅に減らすことができ、音声認識処理速度を大幅に向上させることができる。なお、本システム10は、医師や医学生等の医療従事関係者が使用するものであり、広く一般人が利用するものでない。これにより、神経疾患の問診において、ある状態から次の状態に患者疑似体を動作させるときには、訓練者から全く関係の無い発話はなされず、訓練者からの指示は、ある程度の範囲内で行われる。従って、辞書更新部23での辞書の絞り込みは、本システム10での音声認識処理に殆ど支障が生じない。但し、後述するように、訓練者の発話が音声認識処理部24で音声認識されなかった場合には、辞書更新部23で、その前までの辞書をリセットして、全ての単語等からなる辞書を用いて次回の音声認識処理がなされることになる。
前記音声認識処理部24は、公知の音声認識アルゴリズムによる処理により、辞書更新部23で構成単語等を都度変更した辞書と、訓練者の発話内容とを対比することで、当該発話内容について音声認識処理を行うようになっている。そして、音声認識処理の結果、訓練者の発話内容が認識された場合には、訓練者からの指示が認識された「指示認識」として、その内容のデータを前記認識結果データとして対応決定手段20に送られる。一方、訓練者の発話の内容が認識されなかった場合には、訓練者からの指示が認識できない「指示不認識」として、その旨の認識結果データが対応決定手段20に送られる。なお、前記音声認識アルゴリズム自体は、公知のものが用いられ、且つ、本発明の特徴ではないため、詳細な説明を省略する。
前記対応決定手段20は、問診時のシナリオに対応して患者疑似体の動作及び状態(姿勢)の変遷をルール化した状態遷移モデルが記憶された状態遷移モデル記憶部26と、状態遷移モデルに基づいて、患者疑似体における姿勢変更を含めた次回の動作(以下、「状態遷移」と称する。)における遷移確率を演算する遷移確率演算部27と、遷移確率演算部27で決定された幾つかの状態遷移における遷移確率の中から、最も高い遷移確率を有する状態遷移を次の状態遷移候補として特定する状態遷移候補特定部28と、前記音声認識処理部24で「指示認識」と判定された訓練者の指示に係る認識結果データと状態遷移モデルとを照合して当該モデルでの動作に合致するか否かを判定する動作適合判定部29と、音声認識処理部24での音声認識処理結果、状態遷移候補特定部28での特定結果、及び動作適合判定部29での判定結果を総合して、患者シミュレーション装置11に指令を行う指令部30とを備えている。
前記状態遷移モデルは、例えば、図2の状態遷移図に表されるように、患者疑似体の姿勢すなわち各状態(図2中円部分:S0〜S7)と、当該状態間を遷移させる動作や姿勢変更すなわち状態遷移(同図中矢印線部分:M1〜M29)とがルール化されたものである。また、状態遷移モデルにおいては、予め行った実験結果等に基づいて、各状態遷移それぞれの発生に関する初期確率が予め設定されている。本発明に採用可能な状態遷移モデルは、図2の態様に限定されるものではないが、以下の説明においては、同図に示される状態遷移モデルにおける状態や状態遷移を適宜例示的に用いることとする。同図におけるS0〜S7は、患者疑似体の姿勢に相当する状態を表し、これら各内容を以下の表1に示す。また、図2におけるM1〜M29は、各状態S0〜S7に対して、訓練者の発話に基づく音声認識処理の結果得られた指示内容(認識結果データ)が入力された場合のそれぞれの出力、換言すると、患者疑似体の状態遷移を表す。この状態遷移は、患者疑似体による姿勢変更のための動作や同一姿勢で行う動作を意味し、図中矢印方向に遷移するようになっている。これら図2のM1〜M28の内容を以下の表2に示す。例えば、図2中、状態遷移M1〜M4については、状態S0のまま、つまり、S0の姿勢を維持したまま、M1〜M4の各動作が行われるという意味であり、状態遷移M5については、状態S0から状態S1に姿勢変更の動作を行うという意味である。なお、M1〜M29の状態遷移は、神経疾患の診察に必要な検査のための動作と、当該検査を行う前段階として必要となる動作とからなる。
Figure 2016053606
Figure 2016053606
前記状態遷移モデル記憶部26には、それぞれ異なるシナリオに基づく種々の状態遷移モデルを記憶しておき、その中から訓練の度に任意に1の状態遷移モデルを選択可能とする機能を設けても良い。この場合、問診訓練前における訓練者や指導医等の操作により、所望のシナリオに基づく訓練が行われることになる。
前記遷移確率演算部27では、現在までに経た患者疑似体の状態や動作結果を考慮し、患者疑似体が次に行われると思われる幾つかの状態遷移すなわち動作及び姿勢変更の確率をそれぞれ演算し直すようになっている。
例えば、図2のモデルにおいて、最初となる第1回目に、患者疑似体が姿勢S0(「座位で手は膝の上」の姿勢)になっている場合、次は、状態遷移M1〜M7、M14、M15、M21、M22の計11通りが考えられる。状態遷移モデルの初期確率に基づいて、この11通りの動作が合わせて1になるように、各状態遷移の発生可能性の程度を表す確率(以下、「遷移確率」と称する)が定められる。この場合は、通常、最初にM1の動作(「目を強く瞑る」)が行われるように医師が患者に指示することから、このように予め記憶された経験的データに基づいて、状態遷移M1の遷移確率が最も高く設定される。このときには、前記状態遷移候補特定部28で、次回の状態遷移候補として状態遷移M1が特定される。そして、次に、M1の動作が行われた後で患者疑似体が姿勢S0の状態にあるときは、次の第2回目の動作として、前記モデル上、依然、前述の11通りの状態遷移が考えられるが、既に、M1の動作が行われているため、M1の動作の遷移確率を最も低くし、前記経験的データに基づいて、一般的な問診手順で次に行われることが多いM2の動作(「口角を挙上する」)における遷移確率が最も高く設定される。このときには、状態遷移候補特定部28で、次回の状態遷移候補として状態遷移M2が特定される。
また、遷移確率演算部27では、患者疑似体の次回の動作にて可能性のある全ての状態遷移について、都度、前記辞書更新部23に情報を送り、前述したように、当該状態遷移に絞って関連する単語等を辞書として、訓練者からの次の音声指示に対する音声認識処理がなされることになる。
前記動作適合判定部29では、訓練者の音声による指示が音声認識処理部24で「指示認識」と判定された場合、その認識結果データによる動作内容が、現時点での患者疑似体の姿勢から、状態遷移モデルに基づき可能性のある次の状態遷移の動作か否かが判定される。前述の例では、状態S0から前記第1回目の動作を行う場合において、例えば、認識結果データが状態遷移M1の内容に相当するときには、「状態遷移モデルと一致した動作」であると判定される。一方、同一の場合において、例えば、認識結果データが状態遷移M9の内容に相当するときには、図2により、状態S0から遷移し得ない動作であるため、「状態遷移モデルに一致しない動作」であると判定される。
前記指令部30では、次のようにして、患者シミュレーション装置11の患者動作表現部15での患者疑似体の動作を決定し、当該決定に基づき患者動作表現部15への指令が行われ、若しくは、患者要求出力部16に対して、患者疑似体からの要求を行う指令がなされる。すなわち、訓練者からの発話による指示が、音声認識処理を経て動作適合判定部29で、「状態遷移モデルと一致した動作」であると判定された場合には、遷移確率演算部27で求めた遷移確率に関係無く、訓練者の指示に相当する状態遷移をさせる動作指令が患者動作表現部15になされる。その結果、当該動作指令に応じた患者疑似体の動作が患者シミュレーション装置11で表現されることになる。
一方、訓練者からの発話による指示が、動作適合判定部29で、「状態遷移モデルと一致しない動作」であると判定された場合には、訓練者に対して再発話を要求するように、患者要求出力部16に指令される。その結果、患者要求出力部16にて、前記スピーカ(図示省略)を通じた音声や、前記表示装置(図示省略)を通じた文字やアイコン等によって、患者疑似体からの再発話の要求がなされ、訓練者が当該要求を認識可能になる。
また、訓練者からの発話による指示が音声認識できない「指示不認識」の認識結果データが得られた場合には、1回目であれば、再発話を要求するように、患者要求出力部16に指令される。そして、患者疑似体が同一の状態で遷移しない状況において、音声認識処理が複数回行われ、「指示不認識」の認識結果データが最終的に得られた場合には、状態遷移候補特定部28で特定された遷移確率の最も高い状態遷移に係る動作が選択され、当該動作指令が患者動作表現部15になされる。
次に、前記対話型問診訓練システム10での各種処理の手順につき、図3のフローチャートを用いながら説明する。
患者シミュレーション装置11で動作表現される患者疑似体に対し、訓練者の発話による指示がなされると、その音声が音声入力部14に入力される。そして、音声認識処理部24にて、音声認識処理回数がカウンタで1回追加された上で(ステップS101)、当該回数の情報が記憶され、音声入力部14に入力された音声について、音声認識処理がなされる(ステップS102)。そして、以降は、(1)〜(4)の4種のパターンにより、訓練終了まで種々の処理が行われる。
(1)認識された指示に即した動作
音声認識処理の結果、訓練者の音声が「指示認識」と判定された場合には、対応決定手段20の動作適合判定部29において、状態遷移モデルから、訓練者により指示された動作内容につき、現時点での患者疑似体の状態に対して可能性のある次の状態遷移の動作であるか否かが判定される(ステップS103)。そして、訓練者による指示内容が、次に可能性のある状態遷移の動作の何れかに該当する場合、すなわち、「状態遷移モデルと一致した動作」と判定された場合には、当該時点での患者疑似体の状態が記録される(ステップS104)。更に、指令部30からの指令により、患者シミュレーション装置11の患者動作表現部15にて、当該訓練者が指示した通りの患者疑似体の動作が表現される(ステップS105)。次に、この結果を受け、遷移確率演算部27において、状態遷移モデルにおける状態遷移の遷移確率が再計算される(ステップS106)。そして、次の動作において可能性のある状態遷移が抽出され(ステップS107)、音声認識手段18の辞書更新部23において、ここで抽出された状態遷移に関連する単語等のみが、次の音声認識処理時の辞書となるように調整される(ステップS108)。その後、音声認識処理回数が、カウンタで0回にリセットされた上で(ステップS109)、訓練者による次の指示があると、前記ステップS101からの音声認識処理が行われ、パターン(1)〜(4)における何れかの処理が訓練終了まで繰り返し行われる。
(2)指示不認識(1回目)
音声認識処理の結果、訓練者の音声が「指示不認識」と判定された場合には、カウンタで付加された音声認識処理回数について、1回か否かが判定される(ステップS110)。その結果、当該音声認識処理回数が1回である場合には、辞書更新部23において、前回、辞書として抽出された単語等がリセットされ、辞書記憶部22に記憶された全ての単語等を次回の音声認識処理時の辞書にするように、辞書中の単語等の範囲が拡張される(ステップS111)。その上で、指令部30からの指令により、患者シミュレーション装置11の患者要求出力部16を通じて、訓練者に再発話が要求される(ステップS112)。そして、訓練者から再発話がなされると、前記ステップS101を経て音声認識処理が行われ、パターン(1)〜(4)における何れかの処理が訓練終了まで繰り返し行われる。
(3)指示不認識(複数回)
音声認識処理の結果、訓練者の音声が「指示不認識」と判定され、更に、前記ステップS110により、音声認識処理回数が1回でないと判定された場合には、最終的に「指示不認識」とし、状態遷移候補特定部28で特定された次回の状態遷移が、次の動作として決定され(ステップS113)、当該動作を患者疑似体にさせるように、前記ステップS104及びステップS105の処理が行われる。その後は、前記(1)のパターンと同様、ステップS106〜ステップS109の処理が順に行われる。
(4)指示表現の明確な間違い
前記(1)のパターンと同様に、訓練者の音声が「指示認識」と判定されたものの、当該(1)のパターンと異なり、訓練者の指示内容が、状態遷移モデルで可能性のある次の状態遷移の動作の何れにも該当しない場合、すなわち、「状態遷移モデルに一致しない動作」と動作適合判定部29で判定された場合には、指令部30からの指令により、患者要求出力部16を通じて訓練者に再発話が要求される(ステップS112)。そして、訓練者から再発話がなされると、前記パターン(2)と同様に以降の処理が行われる。当該(4)の処理に基づく再発話の要求により、現時点での患者疑似体の状態において、不適切な姿勢変更や動作の指示がなされたことを訓練者に認識させることができる。
以上の実施形態によれば、予め設定された問診用のシナリオに基づく状態遷移モデルに相応する手順で、訓練者が患者疑似体に動作指示をしたときには、その通りに、患者シミュレーション装置11で患者疑似体の動作が表現されることになる。一方、訓練者からの発話に基づく音声認識が出来ない場合、患者疑似体が同一状態で遷移せずに音声認識処理が2回目以上になったときに、そのときの患者疑似体の状態に応じて、状態遷移モデルに基づき、次回なされ得る動作の優先順位に従って自動的に選択され、最も可能性の高い動作が患者動作表現部15で表現されることになる。従って、訓練者が正確に発話したつもりであっても、音声認識処理の精度不足等により音声認識が不能な場合、再発話が何度も繰り返し要求されることなく、患者疑似体は、可能性の高い次の動作を行うため、音声認識が進まない場合の訓練の停滞を阻止することができる。また、患者疑似体の動作後の次回の音声認識処理に適用される辞書は、状態遷移モデルに基づいて、次に可能性の有る患者疑似体の動作に関連する単語等に絞り込まれるため、あらゆる単語等からなる辞書による音声認識を行う場合に比べ、音声認識処理速度を大幅に向上させることができ、この点においても、訓練者の問診訓練の円滑化を促進することができる。本実施形態では、訓練者の音声が1回目に認識できない場合には、全ての単語等を辞書として利用可能に拡張されるため、辞書の絞り込みによる想定外の音声不認識に対する弊害もカバーすることができる。
なお、前記実施形態では、場合によって、訓練者に対して、再発話が要求される態様を採っているが、本発明はこれに限定されるものではなく、再発話を要求せずに、状態遷移候補特定部28で特定された次回の状態遷移を疑似患者体に行わせる以下の変形例を採用することもできる。
すなわち、音声認識処理の結果、訓練者の音声が「指示不認識」と判定されたときに、1回目であっても、再発話を要求せずに、最終的に「指示不認識」とし、前記実施形態での2回目以降の場合と同様に、前記次回の状態遷移を次の動作として決定し、当該動作を疑似患者体にさせるように、患者シミュレーション装置11に指令する態様を採っても良い。
また、動作適合判定部29で、「状態遷移モデルと一致しない動作」であると判定された場合でも、前述と同様、再発話を要求せずに、前記次回の状態遷移を次の動作として決定し、当該動作を疑似患者体にさせるように、患者シミュレーション装置11に指令する態様を採っても良い。
更に、再発話を要求する際の前記「指示不認識」の回数は、前記実施形態の「1回」に限定されるものではなく、前記変形例の「0回」の他、場合によっては、「2回」以上に設定しても良い。
その他、本発明における装置各部の構成は図示構成例に限定されるものではなく、実質的に同様の作用を奏する限りにおいて、種々の変更が可能である。
10 対話型問診訓練システム
11 患者シミュレーション装置
12 対話型処理装置
18 音声認識手段
20 対応決定手段
22 辞書記憶部
23 辞書更新部
24 音声認識処理部
26 状態遷移モデル記憶部
27 遷移確率演算部
28 状態遷移候補特定部
29 動作適合判定部
30 指令部

Claims (9)

  1. 問診を受ける患者と同様の動作をする患者疑似体に対して、訓練者が問診訓練を行うための対話型問診訓練システムにおいて、
    前記患者疑似体による前記動作を表現可能に設けられた患者シミュレーション装置と、前記訓練者の音声による指示に基づく前記患者疑似体の対応を前記患者シミュレーション装置に指令する対話型処理装置とを備え、
    前記対話型処理装置は、前記訓練者の音声を認識するための音声認識手段と、当該音声認識手段での認識結果に基づいて、前記患者疑似体が行う対応を決定する対応決定手段とを備え、
    前記対応決定手段では、前記訓練者からの指示が前記音声認識手段で認識された場合、当該認識された指示に応じて前記患者疑似体が動作するように、前記患者シミュレーション装置に指令する一方、前記訓練者からの指示が前記音声認識手段で最終的に認識されない場合、前記患者疑似体の現在の状態からなされ得る次回の動作の優先順位に従って前記患者疑似体が動作するように、前記患者シミュレーション装置に指令することを特徴とする対話型問診訓練システム。
  2. 前記対応決定手段は、問診用のシナリオに対応して前記患者疑似体の動作及び姿勢の変遷をルール化した状態遷移モデルが記憶された状態遷移モデル記憶部と、当該状態遷移モデルに基づいて、前記患者疑似体の次回の動作となる各状態遷移についての確率である遷移確率を演算する遷移確率演算部と、次回の動作となる各状態遷移の中から、前記遷移確率演算部で決定された遷移確率の中で、最も高い遷移確率を有する状態遷移を次回の状態遷移候補として特定する状態遷移候補特定部と、前記音声認識手段で認識された前記訓練者の指示内容を前記状態遷移モデルに照合して、当該状態遷移モデルでルール化された動作に合致するか否かを判定する動作適合判定部と、当該動作適合判定部での判定結果や前記状態遷移候補特定部での特定に基づき、前記患者シミュレーション装置への指令を行う指令部とを備えたことを特徴とする請求項1記載の対話型問診訓練システム。
  3. 前記指令部では、前記音声認識手段で訓練者からの指示が認識され、且つ、前記動作適合判定部により前記状態遷移モデルでルール化された動作に合致すると判定された場合に、訓練者からの指示内容に従って前記患者疑似体が動作するように前記指令を行う一方、前記音声認識手段で訓練者からの指示が最終的に認識されない場合に、前記状態遷移候補特定部で特定された次回の状態遷移に従って前記患者疑似体が動作するように前記指令を行うことを特徴とする請求項2記載の対話型問診訓練システム。
  4. 前記指令部では、前記音声認識手段での音声認識結果に基づき、前記患者シミュレーション装置への指令を行い、前記患者疑似体が所定の状態において訓練者からの指示内容が初めて認識されないときに、訓練者に対して再発話を要求するように前記患者シミュレーション装置に指令し、その後、前記患者疑似体が同一の状態で訓練者からの指示内容が再度認識されないときに、前記次回の状態遷移に従って前記患者疑似体が動作するように前記指令を行い、若しくは、前記患者疑似体が所定の状態において訓練者からの指示内容が初めて認識されないときでも、前記再発話を要求せずに前記次回の状態遷移に従って前記患者疑似体が動作するように前記指令を行うことを特徴とする請求項3記載の対話型問診訓練システム。
  5. 前記指令部では、前記音声認識手段で訓練者からの指示が認識されたものの、前記動作適合判定部で前記状態遷移モデルでの動作に合致しないと判定された場合に、訓練者に対して再発話を要求するように、若しくは、当該再発話を要求せずに前記次回の状態遷移に従って前記患者疑似体が動作するように、前記患者シミュレーション装置に指令することを特徴とする請求項3又は4記載の対話型問診訓練システム。
  6. 前記音声認識手段は、所定の単語や用語が記憶された辞書記憶部と、当該辞書記憶部から、所定のタイミング毎に、次回の音声認識処理に適用される可能性のある単語や用語を抽出して辞書とする辞書更新部と、当該辞書更新部で更新された辞書の範囲内で、予め記憶された文法上のルールを用いて訓練者の音声認識処理を行う音声認識処理部とを備え、
    前記辞書更新部では、前記遷移確率演算部による処理結果に基づき、前記患者疑似体の現在の状態から可能性のある次回の状態遷移を特定し、当該状態遷移に関連する単語や用語が抽出されることを特徴とする請求項2〜5の何れかに記載の対話型問診訓練システム。
  7. 前記辞書更新部では、前記患者疑似体が所定の状態において訓練者からの指示内容が初めて認識されないときに、その後の音声認識処理に際して、その前の辞書よりも単語や用語の適用範囲を拡げて抽出することを特徴とする請求項6に記載の対話型問診訓練システム。
  8. 問診を受ける患者と同様の動作を患者疑似体で表現可能に設けられた患者シミュレーション装置に対し、前記患者疑似体に問診訓練を行う訓練者からの音声指示に基づき、前記患者疑似体の対応を指令する対話型処理装置であって、
    前記訓練者の音声を認識するための音声認識手段と、当該音声認識手段での認識結果に基づいて、前記患者疑似体が行う対応を決定する対応決定手段とを備え、
    前記対応決定手段では、前記訓練者からの指示が前記音声認識手段で認識された場合、当該認識された指示に応じて前記患者疑似体を動作させるための処理を行う一方、前記訓練者からの指示が前記音声認識手段で最終的に認識されない場合、前記患者疑似体の現在の状態からなされ得る次回の動作の優先順位に従って前記患者疑似体を動作させるための処理を行うことを特徴とする対話型処理装置。
  9. 問診を受ける患者と同様の動作を患者疑似体で表現可能に設けられた患者シミュレーション装置に対し、前記患者疑似体に問診訓練を行う訓練者からの音声指示に基づき、前記患者疑似体の対応を指令する対話型処理装置のコンピュータを機能させるためのプログラムであって、
    前記訓練者の音声を認識するための音声認識手段と、当該音声認識手段での認識結果に基づいて、前記患者疑似体が行う対応を決定する対応決定手段として前記コンピュータを機能させ、
    前記対応決定手段では、前記訓練者からの指示が前記音声認識手段で認識された場合、当該認識された指示に応じて前記患者疑似体を動作させるための処理を行う一方、前記訓練者からの指示が前記音声認識手段で最終的に認識されない場合、前記患者疑似体の現在の状態からなされ得る次回の動作の優先順位に従って前記患者疑似体を動作させるための処理を行うことを特徴とする対話型処理装置のプログラム。
JP2014178642A 2014-09-03 2014-09-03 対話型問診訓練システム、対話型処理装置及びそのプログラム Pending JP2016053606A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014178642A JP2016053606A (ja) 2014-09-03 2014-09-03 対話型問診訓練システム、対話型処理装置及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014178642A JP2016053606A (ja) 2014-09-03 2014-09-03 対話型問診訓練システム、対話型処理装置及びそのプログラム

Publications (1)

Publication Number Publication Date
JP2016053606A true JP2016053606A (ja) 2016-04-14

Family

ID=55745206

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014178642A Pending JP2016053606A (ja) 2014-09-03 2014-09-03 対話型問診訓練システム、対話型処理装置及びそのプログラム

Country Status (1)

Country Link
JP (1) JP2016053606A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018147405A1 (ja) 2017-02-10 2018-08-16 株式会社アナリティックウェア 対話装置、制御装置、対話システム、対話方法、および制御方法
JP2021039421A (ja) * 2019-08-30 2021-03-11 株式会社シュルード設計 現場作業シミュレーションシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018147405A1 (ja) 2017-02-10 2018-08-16 株式会社アナリティックウェア 対話装置、制御装置、対話システム、対話方法、および制御方法
JP2021039421A (ja) * 2019-08-30 2021-03-11 株式会社シュルード設計 現場作業シミュレーションシステム

Similar Documents

Publication Publication Date Title
CN106653052B (zh) 虚拟人脸动画的生成方法及装置
Whitney et al. Reducing errors in object-fetching interactions through social feedback
US9530412B2 (en) System and method for multi-agent architecture for interactive machines
JP5967838B2 (ja) 人間型ロボットのジェスチャと音声の同期
WO2018006378A1 (zh) 智能机器人控制系统、方法及智能机器人
CN114616541A (zh) 具有渲染的图形输出的会话ai平台
López-Cózar et al. Review of spoken dialogue systems
US10607504B1 (en) Computer-implemented systems and methods for a crowd source-bootstrapped spoken dialog system
KR20200059112A (ko) 로봇 상호작용 시스템 및 그를 위한 프로그램
Carlmeyer et al. Towards closed feedback loops in hri: Integrating inprotk and pamini
JP2016053606A (ja) 対話型問診訓練システム、対話型処理装置及びそのプログラム
EP3573050A1 (en) Computing platform and method for modifying voice data
Schuller et al. Emotion sensitive speech control for human-robot interaction in minimal invasive surgery
KR20170128194A (ko) 지식모델을 이용한 로봇의 동작 구현 장치 및 방법
Haworth et al. Electromagnetic articulography in the development of ‘serious games’ for speech rehabilitation
Howard et al. Modelling vowel acquisition using the Birkholz synthesizer
JP6369907B2 (ja) ソーシャルタッチ制御装置
KR20210028370A (ko) 가상현실 기반 지능형 표준화환자 훈련 및 평가 시스템
Pande et al. Towards hybrid dialog management strategies for a health coach chatbot
WO2020114868A1 (en) Associating non-verbal communication content with verbal communication content
CN108172226A (zh) 一种可学习应答语音和动作的语音控制机器人
KR102544262B1 (ko) 사용자와 메타휴먼의 쌍방향 대화 응대 서비스를 스트리밍 기반으로 제공하는 전자 장치
WO2001038959A2 (en) An apparatus and method for determining emotional and conceptual context from a user input
US20240203435A1 (en) Information processing method, apparatus and computer program
Park et al. FreeTalky: Don't Be Afraid! Conversations Made Easier by a Humanoid Robot using Persona-based Dialogue