JP2015148842A - 対話装置、方法およびプログラム - Google Patents
対話装置、方法およびプログラム Download PDFInfo
- Publication number
- JP2015148842A JP2015148842A JP2014019725A JP2014019725A JP2015148842A JP 2015148842 A JP2015148842 A JP 2015148842A JP 2014019725 A JP2014019725 A JP 2014019725A JP 2014019725 A JP2014019725 A JP 2014019725A JP 2015148842 A JP2015148842 A JP 2015148842A
- Authority
- JP
- Japan
- Prior art keywords
- environment information
- situation
- expression
- similar
- solutions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/54—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
Abstract
【課題】効率的にユーザに解決策を提示できる。【解決手段】本実施形態に係る文書作成支援装置は、第1格納部、第1取得部、第1検索部、第2格納部、第2検索部および制御部を含む。第1格納部は、周囲の環境に関する第1環境情報と、周囲の状況を説明する状況説明文とを対応づけて、複数格納する。第1取得部は、処理対象となる周囲の環境に関する第2環境情報を取得する。第1検索部は、第2環境情報との類似度が第1閾値以上となる第1環境情報である類似環境情報を検索し、類似環境情報に対応する状況説明文を得る。第2格納部は、課題表現と課題表現の1以上の解決策とを対応づけて、複数格納する。第2検索部は、状況説明文との類似度が第2閾値以上となる課題表現である類似課題表現を検索し、類似課題表現に対応する1以上の解決策を得る。制御部は、取得した1以上の解決策を用いてユーザとの対話を制御する。【選択図】図5
Description
本発明の実施形態は、対話装置、方法およびプログラムに関する。
ユーザの困りごとやユーザが知りたい情報など、ユーザの曖昧な要求を含む発話に対して複数の解決策を提示する課題解決対話を行う対話デバイスがある。このような対話デバイスでは、ユーザが対話デバイスに対して発話することにより、課題解決対話を行うものと、ユーザが明示的に発話しなくても、各種センサ情報などにより所定の機能を提案する対話を開始できるものがある。
岩田憲治ほか5名:「課題解決知識を用いた音声アシスタント」、人工知能学会言語・音声理解と対話処理研究会資料、2013年1月25日、67巻、pp.13−14
各種センサ情報に基づいて所定の機能を提案する場合は、センサ値に基づくパラメータの条件とドメインごとに異なる解決策との組を予め定義する必要があり、作業コストが膨大となるという問題がある。
本開示は、上述の課題を解決するためになされたものであり、効率的にユーザに解決策を提示できる対話装置、方法およびプログラムを提供することを目的とする。
本実施形態に係る対話装置は、第1格納部、第1取得部、第1検索部、第2格納部、第2検索部および制御部を含む。第1格納部は、周囲の環境に関する第1環境情報と、該周囲の状況を説明する状況説明文とを対応づけて、複数格納する。第1取得部は、処理対象となる周囲の環境に関する第2環境情報を取得する。第1検索部は、前記第2環境情報との類似度が第1閾値以上となる第1環境情報である類似環境情報を前記第1格納部から検索し、前記類似環境情報に対応する状況説明文を得る。第2格納部は、課題として捉えうる内容を含む文である課題表現と該課題表現により示される課題を解決するための一案となる1以上の解決策とを対応づけて、複数格納する。第2検索部は、前記状況説明文との類似度が第2閾値以上となる課題表現である類似課題表現を前記第2格納部から検索し、前記類似課題表現に対応する1以上の解決策を得る。制御部は、取得した前記1以上の解決策を用いてユーザとの対話を制御する。
以下、図面を参照しながら本実施形態に係る対話装置、方法およびプログラムについて詳細に説明する。なお、以下の実施形態では、同一の参照符号を付した部分は同様の動作をおこなうものとして、重複する説明を適宜省略する。
本実施形態に係る対話装置で用いる状況説明文データベース(以下、状況説明文DBまたは第1格納部ともいう)を生成するデータ登録支援装置について図1のブロック図を参照して説明する。
本実施形態に係るデータ登録支援装置100は、情報取得部101(第1取得部ともいう)、説明文取得部102(第2取得部ともいう)、妥当性判定部103(第1判定部ともいう)、登録部104および状況説明文DB105を含む。
情報取得部101は、周囲の環境に関する情報である環境情報を取得する。具体的には、例えば、情報取得部101は、マイクを用いて音声を含む環境音データ(波形データ)を、カメラを用いて画像データおよび動画像データを、温度センサにより温度データを、湿度センサにより湿度データを、光センサにより照度データを、気圧センサにより気圧データをそれぞれ取得する。情報取得部101は、これらのデータの少なくとも1つを環境情報として得ればよい。なお、上述の例に限らず他のセンサを用いて得られたデータを環境情報として含んでもよい。また、これらのデータから抽出される特徴量を環境情報としてもよい。
本実施形態に係るデータ登録支援装置100は、情報取得部101(第1取得部ともいう)、説明文取得部102(第2取得部ともいう)、妥当性判定部103(第1判定部ともいう)、登録部104および状況説明文DB105を含む。
情報取得部101は、周囲の環境に関する情報である環境情報を取得する。具体的には、例えば、情報取得部101は、マイクを用いて音声を含む環境音データ(波形データ)を、カメラを用いて画像データおよび動画像データを、温度センサにより温度データを、湿度センサにより湿度データを、光センサにより照度データを、気圧センサにより気圧データをそれぞれ取得する。情報取得部101は、これらのデータの少なくとも1つを環境情報として得ればよい。なお、上述の例に限らず他のセンサを用いて得られたデータを環境情報として含んでもよい。また、これらのデータから抽出される特徴量を環境情報としてもよい。
説明文取得部102は、例えばキーボード、マイクであり、ユーザから説明文を受け取る。説明文は、環境情報を取得したときの周囲の状況を説明する文である。ユーザがキーボードを用いて説明文を入力する場合はテキストをそのまま利用すればよく、ユーザがマイクを用いて説明文を音声入力する場合は、一般的な音声認識処理をおこない、音声認識結果に対応するテキストを得ればよい。なお本実施形態では、説明文は、文に限らず単語であってもよい。
妥当性判定部103は、情報取得部101から環境情報を、説明文取得部102から説明文をそれぞれ受け取り、環境情報が示す周囲の状況の説明として、説明文が妥当であるかどうかを検証する。妥当性判定部103は、妥当であると判定される説明文を状況説明文として得る。妥当性判定部103の動作の詳細については後述する。
登録部104は、妥当性判定部103から状況説明文と環境情報とを受け取り、状況説明文と環境情報とを状況説明文DB105に登録する。
状況説明文DB105は、状況説明文と対応する環境情報とを組として、複数の組を格納する。
状況説明文DB105は、状況説明文と対応する環境情報とを組として、複数の組を格納する。
次に、データ登録支援装置100のデータ登録処理について図2のフローチャートを参照して説明する。
ステップS201では、情報取得部101が、環境情報を取得する。
ステップS202では、環境情報がユーザに提示される。環境情報の提示手法としては、例えば、環境情報をディスプレイ(図示せず)に表示させたり、環境情報をスピーカー(図示せず)を通じて出力したりすることでユーザに提示すればよい。
ステップS201では、情報取得部101が、環境情報を取得する。
ステップS202では、環境情報がユーザに提示される。環境情報の提示手法としては、例えば、環境情報をディスプレイ(図示せず)に表示させたり、環境情報をスピーカー(図示せず)を通じて出力したりすることでユーザに提示すればよい。
ステップS203では、説明文取得部102が、提示される環境情報に基づいて想定される状況に関する説明文を、ユーザから取得する。なお本実施形態では、環境情報に対する説明文として1つの説明文を取得する場合を想定するが、ユーザから一度に複数の説明文を取得するようにしてもよい。
ステップS204では、妥当性判定部103が、環境情報が示す周囲の状況の説明として、説明文が妥当であるかどうかを判定する。説明文が妥当であれば、当該説明文を状況説明文として決定し、ステップS205に進む。説明文が妥当でなければ、ステップS202へ戻り、同様の処理を繰り返す。説明文が妥当であるかどうかは、例えば、説明文中に、物事の「状態」を表す表現を含むかどうか、または、物事の「対象」および対象の「状態」を表す表現をともに含むかどうかにより判定すればよい。
具体例としては、説明文の中に「泣いている」、「異音がする」といった「状態」を表す表現が含まれていれば、妥当性判定部103は説明文が妥当であると判定する。また、説明文の中に「子供が泣いている」、「ベルトから異音がする」など、物事の「対象」となる表現と対象の「状態」を表す表現とが含まれていれば、妥当性判定部103は説明文が妥当であると判定する。
具体例としては、説明文の中に「泣いている」、「異音がする」といった「状態」を表す表現が含まれていれば、妥当性判定部103は説明文が妥当であると判定する。また、説明文の中に「子供が泣いている」、「ベルトから異音がする」など、物事の「対象」となる表現と対象の「状態」を表す表現とが含まれていれば、妥当性判定部103は説明文が妥当であると判定する。
ステップS205では、登録部104が、環境情報と対応する状況説明文とを状況説明文DB105に登録する。さらに、予め定義した状況説明文ごとにIDを割り振り、取得した環境情報に対応するIDを状況説明文としてもよい。IDを用いることで、状況説明文DB105に格納されるデータサイズを削減することができる。
以上で、データ登録支援装置100のデータ登録処理を終了する。
なお、ステップS204において、同じ環境情報に対してユーザから入力された説明文が妥当でないと判定され、規定回数以上の再入力があった場合は、当該環境情報に対する説明文の入力処理を終了し、他の環境情報を提示するようにしてもよい。または、データ登録処理そのものを終了するようにしてもよい。
次に、データ登録支援装置100のデータ登録処理の具体例について図3を参照して説明する。ここでは、周辺の環境として、赤ちゃんが泣いている状況を想定する。
以上で、データ登録支援装置100のデータ登録処理を終了する。
なお、ステップS204において、同じ環境情報に対してユーザから入力された説明文が妥当でないと判定され、規定回数以上の再入力があった場合は、当該環境情報に対する説明文の入力処理を終了し、他の環境情報を提示するようにしてもよい。または、データ登録処理そのものを終了するようにしてもよい。
次に、データ登録支援装置100のデータ登録処理の具体例について図3を参照して説明する。ここでは、周辺の環境として、赤ちゃんが泣いている状況を想定する。
情報取得部101は、赤ちゃんが泣いている状況の環境音の波形データ310を、環境情報として取得する。その後、波形データ310がユーザ350に提示され、説明文取得部102は、ユーザ350から入力される説明文を取得する。ここでは、説明文として、説明文311「赤ちゃんが泣いている」および説明文312「赤ちゃん」の2つのパターンが入力されると仮定する。
続いて、妥当性判定部103では、説明文の中に「状態」を表す表現、または、「対象」および「状態」を表す表現を含むかどうかを判定し、説明文312「赤ちゃん」には「状態」を表す表現が含まれないので、状況説明文313として妥当でないと判定する。一方、説明文311「赤ちゃんが泣いている」は、「赤ちゃん」が「対象」であり、かつ「泣いている」が対象の「状態」を表すので、状況説明文313として妥当であると判定する。
よって、登録部104が、環境音の波形データ310と状況説明文313「赤ちゃんが泣いている」とを対応づけて、状況説明文DB105に登録する。
よって、登録部104が、環境音の波形データ310と状況説明文313「赤ちゃんが泣いている」とを対応づけて、状況説明文DB105に登録する。
次に、状況説明文DB105に格納される環境情報と状況説明文との一例について図4を参照して説明する。
図4のテーブル400に示すように、環境情報401と状況説明文402とが対応づけられて、複数格納される。具体的には、例えば、環境情報401「赤ちゃんの泣き声(泣き声の波形データ)」と状況説明文402「赤ちゃんが泣いている」とが対応づけられる。また、環境情報401「35.34(気温値)」と状況説明文402「室内の温度が高い」とが対応づけられる。
図4のテーブル400に示すように、環境情報401と状況説明文402とが対応づけられて、複数格納される。具体的には、例えば、環境情報401「赤ちゃんの泣き声(泣き声の波形データ)」と状況説明文402「赤ちゃんが泣いている」とが対応づけられる。また、環境情報401「35.34(気温値)」と状況説明文402「室内の温度が高い」とが対応づけられる。
なお、ここでは、1つの環境情報(1つのセンサ値)に対して状況説明文を対応づける例を示すが、これに限らず、複数のセンサ値から得られる環境情報401に対して、状況説明文402を対応づけてもよい。具体的には、たとえば、気温センサの値と湿度センサの値との2つの値を環境情報401とし、状況説明文402「部屋が蒸し暑い」を対応づけてもよい。
次に、本実施形態に係る、データ登録支援装置100により生成された状況説明文DB105を用いる対話装置について図5のブロック図を参照して説明する。
本実施形態に係る対話装置500は、状況説明文DB105、情報取得部101、類似環境検索部501(第1検索部ともいう)、課題解決策データベース502(以下、課題解決策DB502または第2格納部ともいう)、類似表現検索部503(第2検索部ともいう)、意図判定部504(第2判定部ともいう)および対話制御部505を含む。なお、対話装置500は、データ登録支援装置100全体を含んでもよい。
以下、説明の便宜上、状況説明文DB105に予め格納される環境情報を第1環境情報という。
本実施形態に係る対話装置500は、状況説明文DB105、情報取得部101、類似環境検索部501(第1検索部ともいう)、課題解決策データベース502(以下、課題解決策DB502または第2格納部ともいう)、類似表現検索部503(第2検索部ともいう)、意図判定部504(第2判定部ともいう)および対話制御部505を含む。なお、対話装置500は、データ登録支援装置100全体を含んでもよい。
以下、説明の便宜上、状況説明文DB105に予め格納される環境情報を第1環境情報という。
情報取得部101は、外部から対話処理を行うときの周辺環境の情報である環境情報(以下、第2環境情報という)を取得する。
類似環境検索部501は、情報取得部101から第2環境情報を受け取り、状況説明文DB105を参照して第2環境情報に類似する第1環境情報である類似環境情報を検索し、類似環境情報に対応する状況説明文を得る。
課題解決策DB502は、課題表現と1以上の解決策とを対応づけて、複数格納する。課題表現は、課題として捉えることができる内容を含む文である。解決策は、課題表現に含まれる課題を解決するための一案となる文である。課題表現と1以上の解決策とは、予め生成された一般的なものを用いればよい。課題解決策DB502の詳細については、図6を参照して後述する。
類似環境検索部501は、情報取得部101から第2環境情報を受け取り、状況説明文DB105を参照して第2環境情報に類似する第1環境情報である類似環境情報を検索し、類似環境情報に対応する状況説明文を得る。
課題解決策DB502は、課題表現と1以上の解決策とを対応づけて、複数格納する。課題表現は、課題として捉えることができる内容を含む文である。解決策は、課題表現に含まれる課題を解決するための一案となる文である。課題表現と1以上の解決策とは、予め生成された一般的なものを用いればよい。課題解決策DB502の詳細については、図6を参照して後述する。
類似表現検索部503は、類似環境検索部501から状況説明文を受け取り、課題解決策DB502を参照して、状況説明文に類似する課題表現である類似課題表現があるかどうかを検索し、類似課題表現に対応する1以上の解決策を得る。
意図判定部504は、ユーザからの発話またはユーザからの指示を取得し、発話の内容または指示の内容を判定してユーザ意図を得る。
対話制御部505は、類似表現検索部503から1以上の解決策を受け取り、1以上の解決策に基づいて対話装置500の対話処理を制御する。対話処理の制御としては、例えば、図示しないが、出力部が音声合成により音声出力したり、または表示部が解決策を表す文字列を画面表示するなどにより、ユーザに解決策を提示することを制御する。また、対話制御部505は、意図判定部504からユーザ意図を受け取り、ユーザ意図に応じた処理を実行することまたはユーザに応答文を提示することを制御する。
なお、状況説明文DB105と課題解決策DB503とは、外部のサーバなどに存在してもよく、対話装置500は、外部のサーバにアクセスすることで検索するようにしてもよい。
次に、課題解決策DB502に格納される課題表現と解決策との一例について図6を参照して説明する。
図6に示すテーブル600には、課題表現601と1以上の解決策602とが対応づけられて、複数格納される。具体的には、例えば、課題表現601「赤ちゃんの泣き声がする」と、3つの解決策602「オムツを確かめてみませんか」、「お腹がすいていませんか」および「赤ちゃんが泣き止む音楽を再生しましょうか」とが対応づけられる。つまり、赤ちゃんが泣いているという状態は好ましい状態ではなく、赤ちゃんを泣き止ませたいという課題として捉えることができ、「赤ちゃんの泣き声がする」という文は、課題表現である。これに応じ、赤ちゃんが泣きやませるために確認すべき事項、または赤ちゃんを泣き止ませるために取るべき行動が解決策となる。
図6に示す例では、課題表現と1以上の解決策とは、家庭内で想定される課題と解決策とが対応付いた家庭ドメインだけのデータベースであるが、これに限らず、仕事場ドメイン、料理ドメインなど他のドメインにおける課題表現と解決策とを併せて格納してもよい。複数のドメインの課題と解決策とを含む場合は、ユーザの指示で手動で切り替えてもよいし、対話装置500がGPSなどにより位置情報を取得し、位置情報に基づいてドメインを切り替えてもよい。
図6に示すテーブル600には、課題表現601と1以上の解決策602とが対応づけられて、複数格納される。具体的には、例えば、課題表現601「赤ちゃんの泣き声がする」と、3つの解決策602「オムツを確かめてみませんか」、「お腹がすいていませんか」および「赤ちゃんが泣き止む音楽を再生しましょうか」とが対応づけられる。つまり、赤ちゃんが泣いているという状態は好ましい状態ではなく、赤ちゃんを泣き止ませたいという課題として捉えることができ、「赤ちゃんの泣き声がする」という文は、課題表現である。これに応じ、赤ちゃんが泣きやませるために確認すべき事項、または赤ちゃんを泣き止ませるために取るべき行動が解決策となる。
図6に示す例では、課題表現と1以上の解決策とは、家庭内で想定される課題と解決策とが対応付いた家庭ドメインだけのデータベースであるが、これに限らず、仕事場ドメイン、料理ドメインなど他のドメインにおける課題表現と解決策とを併せて格納してもよい。複数のドメインの課題と解決策とを含む場合は、ユーザの指示で手動で切り替えてもよいし、対話装置500がGPSなどにより位置情報を取得し、位置情報に基づいてドメインを切り替えてもよい。
次に、本実施形態に係る対話装置500の動作について図7のフローチャートを参照して説明する。
ステップS701では、情報取得部101が、外部から第2環境情報を取得する。
ステップS701では、情報取得部101が、外部から第2環境情報を取得する。
ステップS702では、類似環境検索部501が、状況説明文DB105を参照して、第2環境情報との類似度が閾値以上の第1環境情報である類似環境情報を検索する。類似環境情報が存在すれば、ステップS703へ進む。類似環境情報が存在しなければ、処理を終了する。
第1環境情報と第2環境情報との類似度は、例えば、第1環境情報と第2環境情報とを比較し、環境情報に含まれるデータ、例えば、波形データの一致度、画像の一致度、数値の一致度または特徴量の一致度が閾値以上であるかどうかを判定すればよい。一致度が閾値以上であれば、第1環境情報と第2環境情報とが類似する、すなわち類似環境情報が存在すると判定すればよい。
第1環境情報と第2環境情報との類似度は、例えば、第1環境情報と第2環境情報とを比較し、環境情報に含まれるデータ、例えば、波形データの一致度、画像の一致度、数値の一致度または特徴量の一致度が閾値以上であるかどうかを判定すればよい。一致度が閾値以上であれば、第1環境情報と第2環境情報とが類似する、すなわち類似環境情報が存在すると判定すればよい。
ステップS703では、類似環境検索部501が、類似環境情報に対応する状況説明文を得る。
ステップS704では、類似表現検索部503が、課題解決策DB502を参照して、状況説明文との類似度が閾値以上の課題表現である類似課題表現を検索する。類似課題表現が存在すれば、ステップS705に進み、類似課題表現が存在しなければ、処理を終了する。
状況説明文と課題表現との類似度は、例えば、状況説明文の文字列と課題表現の文字列との中に、同様の「状態」を表す表現が含まれているかどうか、または「対象」および「状態」を表す表現が含まれているかどうかにより判定すればよい。状況説明文と課題表現とに含まれる表現の一致度が閾値以上であれば、状況説明文と課題表現とが類似する、すなわち類似課題表現が存在すると判定すればよい。なお、状況説明文と課題表現との文字列が完全一致するかどうかにより類似度を判定してもよいし、同義語を含むかどうかにより類似度を判定してもよい。さらに、状況説明文と課題表現との特徴ベクトルのコサイン距離の近さ、または文字列間の類似度が閾値以上であるかどうかにより類似度を算出してもよい。
状況説明文と課題表現との類似度は、例えば、状況説明文の文字列と課題表現の文字列との中に、同様の「状態」を表す表現が含まれているかどうか、または「対象」および「状態」を表す表現が含まれているかどうかにより判定すればよい。状況説明文と課題表現とに含まれる表現の一致度が閾値以上であれば、状況説明文と課題表現とが類似する、すなわち類似課題表現が存在すると判定すればよい。なお、状況説明文と課題表現との文字列が完全一致するかどうかにより類似度を判定してもよいし、同義語を含むかどうかにより類似度を判定してもよい。さらに、状況説明文と課題表現との特徴ベクトルのコサイン距離の近さ、または文字列間の類似度が閾値以上であるかどうかにより類似度を算出してもよい。
ステップS705では、類似表現検索部503が、課題表現に対応する1以上の解決策を得る。課題表現に対応する解決策が複数である場合は、複数の解決策全てを得てもよいし、複数の解決策の中からいくつか選択して得てもよい。
ステップS706では、対話制御部505が、1以上の解決策を用いてユーザとの対話を制御する。例えば、対話制御部505は、出力情報をスピーカーまたはディスプレイなどの出力装置を介してユーザに提示する。
または、意図判定部504は、ユーザからの指示よりユーザの意図(ユーザ意図ともいう)を判定し、対話制御部505は、判定されたユーザ意図に応じて処理を実行することまたはユーザに応答文を提示するといった制御を行なってもよい。以上で対話装置500の処理を終了する。
次に、本実施形態に係る対話装置500の動作の第1具体例について図8を参照して説明する。
図8の例では、対話装置のユーザが母親810であり、家庭内で赤ちゃんが泣いている状況を想定する。また、状況説明文DB105には、赤ちゃんの泣き声の波形データと対応する説明文「赤ちゃんが泣いている」とが予め格納されているとする。また、課題解決策DB502には、図6に示す家庭ドメインの課題および解決策が予め格納されているとする。
または、意図判定部504は、ユーザからの指示よりユーザの意図(ユーザ意図ともいう)を判定し、対話制御部505は、判定されたユーザ意図に応じて処理を実行することまたはユーザに応答文を提示するといった制御を行なってもよい。以上で対話装置500の処理を終了する。
次に、本実施形態に係る対話装置500の動作の第1具体例について図8を参照して説明する。
図8の例では、対話装置のユーザが母親810であり、家庭内で赤ちゃんが泣いている状況を想定する。また、状況説明文DB105には、赤ちゃんの泣き声の波形データと対応する説明文「赤ちゃんが泣いている」とが予め格納されているとする。また、課題解決策DB502には、図6に示す家庭ドメインの課題および解決策が予め格納されているとする。
ステップS801では、情報取得部101が、環境情報として赤ちゃんの泣き声を含む環境音データを取得する。
ステップS802では、類似環境検索部501が、赤ちゃんの泣き声を含む環境情報をクエリとして、類似環境情報を状況説明文DB105から検索する。ここでは、類似環境情報が存在するとして、類似環境情報に対応する状況説明文「赤ちゃんが泣いている」を得ると仮定する。
ステップS803では、類似表現検索部503が、状況説明文「赤ちゃんが泣いている」をクエリとして、類似課題表現を課題解決策DB502から検索する。ここでは、課題解決策DB502に課題表現「赤ちゃんの泣き声がする」が格納されており、状況説明文「赤ちゃんが泣いている」と課題表現「赤ちゃんの泣き声がする」とが類似すると判定する。よって、課題表現「赤ちゃんの泣き声がする」を類似課題表現として得る。
続いて、類似表現検索部503が、類似課題表現に対応する3つの解決策「オムツを確かめてみませんか」、「お腹がすいていませんか」および「赤ちゃんが泣き止む音楽を再生しましょうか」を得る。
ステップS804では、対話制御部505が、ステップS803で得た3つの解決策を母親810に提示するように制御する。例えば3つの解決策を伝えるような発話文を生成し音声合成を使って読み上げればよい。
ステップS805では、意図判定部504が、ユーザ意図の判定として、母親810から3つの解決策から選択された解決策を判定する。例えば、母親810が解決策を選択するような発話を行い、その発話文を解析することにより、発話文が表す解決策がユーザ意図であると判定できる。ここでは、「赤ちゃんが泣き止む音楽を再生しましょうか」が選択されたとする。
ステップS806では、対話制御部505が、音楽を再生するアプリケーションを起動し、音楽を再生するように制御する。なお、「お腹がすいていませんか」などの解決策は、提示するだけでも母親810が行うべき行動を認識できるので有効であるが、例えば他のデバイスと連動して、母親810が「お腹がすいていませんか」を選択した場合に、ミルクを作るために自動でお湯を沸かすといった制御を行なえるようにしてもよい。
次に、対話装置500の動作の第2具体例について図9に示す。
対話装置500の動作は、図8で示した動作と同様であるが、課題解決策DB502に格納されるドメインが、家庭ドメインではなく託児所ドメインである点が異なる。託児所ドメインの解決策は、「体温を測定する」「散歩させる」「母親に連絡する」というように、対話装置500のユーザが託児所に勤務する保育士901などである場合に想定される解決策である。
この場合も、図8と同様の図9の対話処理を行うことで、課題解決策DB502に格納されるドメインを切り替えることにより、ユーザおよび状況に応じた解決策を適切に提示することができる。
対話装置500の動作は、図8で示した動作と同様であるが、課題解決策DB502に格納されるドメインが、家庭ドメインではなく託児所ドメインである点が異なる。託児所ドメインの解決策は、「体温を測定する」「散歩させる」「母親に連絡する」というように、対話装置500のユーザが託児所に勤務する保育士901などである場合に想定される解決策である。
この場合も、図8と同様の図9の対話処理を行うことで、課題解決策DB502に格納されるドメインを切り替えることにより、ユーザおよび状況に応じた解決策を適切に提示することができる。
以上に示した本実施形態によれば、環境情報に対して、その状況を説明する説明文を作成し、環境情報に対応する状況説明文を含む状況説明文DBを生成することにより、状況説明文DB105を参照することで、周囲の状況から課題を類推して、効率的にユーザに解決策を提示することができる。さらに、予め存在するドメインごとの課題と解決策とのデータベースから状況説明文に類似する課題を抽出するため、ドメインごとにセンサ値に応じた説明文を作成しなくとも、一度状況説明文DBを作成するだけで、ユーザを取り巻く現在の環境から検出できる解決すべき課題に対して、ユーザに解決策を提示し、効率的に課題解決対話を行うことができる。
上述の実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述した対話装置による効果と同様な効果を得ることも可能である。上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、CD−R、CD−RW、DVD−ROM、DVD±R、DVD±RW、Blu−ray(登録商標)Discなど)、半導体メモリ、又はこれに類する記録媒体に記録される。コンピュータまたは組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をCPUで実行させれば、上述した実施形態の対話装置と同様な動作を実現することができる。もちろん、コンピュータがプログラムを取得する場合又は読み込む場合はネットワークを通じて取得又は読み込んでもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
なお、本実施形態におけるコンピュータまたは組み込みシステムは、記録媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するためのものであって、パソコン、マイコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行なうことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
100・・・データ登録支援装置、101,501・・・情報取得部、102・・・説明文取得部、103・・・妥当性判定部、104・・・登録部、105・・・状況説明文データベース(状況説明文DB)、310・・・波形データ、311,312・・・説明文、350・・・ユーザ、400,600・・・テーブル、401・・・環境情報、313,402・・・状況説明文、500・・・対話装置、501・・・類似環境検索部、502・・・課題解決策データベース、503・・・類似表現検索部、504・・・意図判定部、505・・・対話制御部、601・・・課題表現、602・・・解決策、810・・・母親、901・・・保育士。
Claims (8)
- 周囲の環境に関する第1環境情報と、該周囲の状況を説明する状況説明文とを対応づけて、複数格納する第1格納部と、
処理対象となる周囲の環境に関する第2環境情報を取得する第1取得部と、
前記第2環境情報との類似度が第1閾値以上となる第1環境情報である類似環境情報を前記第1格納部から検索し、前記類似環境情報に対応する状況説明文を得る第1検索部と、
課題として捉えうる内容を含む文である課題表現と該課題表現により示される課題を解決するための一案となる1以上の解決策とを対応づけて、複数格納する第2格納部と、
前記状況説明文との類似度が第2閾値以上となる課題表現である類似課題表現を前記第2格納部から検索し、前記類似課題表現に対応する1以上の解決策を得る第2検索部と、
取得した前記1以上の解決策を用いてユーザとの対話を制御する制御部と、を具備することを特徴とする対話装置。 - 前記第1環境情報に対応する説明文を取得する第2取得部と、
前記第1環境情報が示す周囲の状況の説明として、前記説明文が妥当であるかどうかを判定し、妥当であると判定された説明文を前記状況説明文として得る第1判定部と、
前記状況説明文と前記第1環境情報とを対応づけて前記第1格納部に登録する登録部と、をさらに具備することを特徴とする請求項1に記載の対話装置。 - 前記第1判定部は、前記説明文に状態を表す表現が含まれる場合、該説明文が妥当であると判定することを特徴とする請求項2に記載の対話装置。
- 前記第1判定部は、前記説明文に、対象を表す表現および該対象の状態を表す表現が含まれる場合、該説明文が妥当であると判定することを特徴とする請求項2に記載の対話装置。
- 前記ユーザの発話と該ユーザからの指示との少なくともどちらか1つから、該ユーザの意図を判定する第2判定部をさらに具備し、
前記制御部は、取得した1以上の前記解決策を前記ユーザに提示したのち、前記意図に応じた処理の実行またはユーザへの応答文の提示を制御することを特徴とする請求項1から請求項4のいずれか1項に記載の対話装置。 - 前記第1取得部は、音声を含む環境音の波形データ、画像データおよび動画像データ、および、周囲の状況を表すデータを取得するセンサにより得られる値の少なくとも1つを、前記第1環境情報または前記第2環境情報として取得することを特徴とする請求項1から請求項5のいずれか1項に記載の対話装置。
- 周囲の環境に関する第1環境情報と、該周囲の状況を説明する状況説明文とを対応づけて、第1格納部に複数格納し、
処理対象となる周囲の環境に関する第2環境情報を取得し、
前記第2環境情報との類似度が第1閾値以上となる第1環境情報である類似環境情報を前記第1格納部から検索し、前記類似環境情報に対応する状況説明文を得、
課題として捉えうる内容を含む文である課題表現と該課題表現により示される課題を解決するための一案となる1以上の解決策とを対応づけて、第2格納部に複数格納し、
前記状況説明文との類似度が第2閾値以上となる課題表現である類似課題表現を前記第2格納部から検索し、前記類似課題表現に対応する1以上の解決策を得、
取得した前記1以上の解決策を用いてユーザとの対話を制御することを特徴とする対話方法。 - コンピュータを、
周囲の環境に関する第1環境情報と、該周囲の状況を説明する状況説明文とを対応づけて、複数格納する第1格納手段と、
処理対象となる周囲の環境に関する第2環境情報を取得する第1取得手段と、
前記第2環境情報との類似度が第1閾値以上となる第1環境情報である類似環境情報を前記第1格納手段から検索し、前記類似環境情報に対応する状況説明文を得る第1検索手段と、
課題として捉えうる内容を含む文である課題表現と該課題表現により示される課題を解決するための一案となる1以上の解決策とを対応づけて、複数格納する第2格納手段と、
前記状況説明文との類似度が第2閾値以上となる課題表現である類似課題表現を前記第2格納手段から検索し、前記類似課題表現に対応する1以上の解決策を得る第2検索手段と、
取得した前記1以上の解決策を用いてユーザとの対話を制御する制御手段として機能させるための対話プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014019725A JP2015148842A (ja) | 2014-02-04 | 2014-02-04 | 対話装置、方法およびプログラム |
PCT/JP2015/053313 WO2015119225A1 (en) | 2014-02-04 | 2015-01-30 | Interaction apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014019725A JP2015148842A (ja) | 2014-02-04 | 2014-02-04 | 対話装置、方法およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015148842A true JP2015148842A (ja) | 2015-08-20 |
Family
ID=53778026
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014019725A Pending JP2015148842A (ja) | 2014-02-04 | 2014-02-04 | 対話装置、方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2015148842A (ja) |
WO (1) | WO2015119225A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018060493A (ja) * | 2016-10-03 | 2018-04-12 | ジャパンモード株式会社 | 問題解決支援システム、問題解決支援方法、及び問題解決支援プログラム |
JP2018147145A (ja) * | 2017-03-03 | 2018-09-20 | 株式会社国際電気通信基礎技術研究所 | コミュニケーションロボット、制御方法および制御プログラム |
JP7007477B2 (ja) | 2017-10-30 | 2022-01-24 | 華為技術有限公司 | 以前に実行されたタスクの繰り返し実行をモバイルデバイスのコンテキストに基づいて簡略化するための装置および方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107368567B (zh) * | 2017-07-11 | 2020-12-25 | 深圳传音通讯有限公司 | 动物语言识别方法及用户终端 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0823869B2 (ja) * | 1992-08-21 | 1996-03-06 | 日本電気株式会社 | データベース類似検索方法 |
JP2003015877A (ja) * | 2001-06-28 | 2003-01-17 | Kawasaki Heavy Ind Ltd | 事例ベース推論方法および事例ベース推論装置 |
JP5098058B2 (ja) * | 2008-06-24 | 2012-12-12 | 株式会社インクス | 情報提供システム、情報提供装置、情報提供方法、及び、情報提供プログラム、並びに、コンピュータ読取可能記録媒体 |
JP5718664B2 (ja) * | 2011-02-04 | 2015-05-13 | 株式会社東芝 | 病院情報管理装置及び病院情報システム |
-
2014
- 2014-02-04 JP JP2014019725A patent/JP2015148842A/ja active Pending
-
2015
- 2015-01-30 WO PCT/JP2015/053313 patent/WO2015119225A1/en active Application Filing
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018060493A (ja) * | 2016-10-03 | 2018-04-12 | ジャパンモード株式会社 | 問題解決支援システム、問題解決支援方法、及び問題解決支援プログラム |
JP2018147145A (ja) * | 2017-03-03 | 2018-09-20 | 株式会社国際電気通信基礎技術研究所 | コミュニケーションロボット、制御方法および制御プログラム |
JP7007477B2 (ja) | 2017-10-30 | 2022-01-24 | 華為技術有限公司 | 以前に実行されたタスクの繰り返し実行をモバイルデバイスのコンテキストに基づいて簡略化するための装置および方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2015119225A1 (en) | 2015-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6923332B2 (ja) | 自動通訳方法及び装置 | |
US11170769B2 (en) | Detection of mission change in conversation | |
JP6310150B2 (ja) | 意図理解装置、方法およびプログラム | |
US9805718B2 (en) | Clarifying natural language input using targeted questions | |
US9626963B2 (en) | System and method of improving speech recognition using context | |
US10460731B2 (en) | Apparatus, method, and non-transitory computer readable storage medium thereof for generating control instructions based on text | |
KR20200127814A (ko) | 사용자의 입력 입력에 기초하여 타겟 디바이스를 결정하고, 타겟 디바이스를 제어하는 서버 및 그 동작 방법 | |
JP6143883B2 (ja) | 対話支援システム、方法、及びプログラム | |
US20180121560A1 (en) | Preview and optimization of publication for target computing device | |
US20200410992A1 (en) | Device for recognizing speech input from user and operating method thereof | |
US20200135213A1 (en) | Electronic device and control method thereof | |
US10909972B2 (en) | Spoken language understanding using dynamic vocabulary | |
JP2017167659A (ja) | 機械翻訳装置、方法、およびプログラム | |
JP2015148842A (ja) | 対話装置、方法およびプログラム | |
US20200243082A1 (en) | Dialog system and dialog method | |
US11257482B2 (en) | Electronic device and control method | |
JP6370962B1 (ja) | 生成装置、生成方法および生成プログラム | |
US20170161374A1 (en) | Classification apparatus and classification method | |
JP2015060127A (ja) | 音声同時処理装置、方法およびプログラム | |
US11158308B1 (en) | Configuring natural language system | |
JP6275569B2 (ja) | 対話装置、方法およびプログラム | |
JP6305630B2 (ja) | 文書検索装置、方法及びプログラム | |
US20220197694A1 (en) | Electronic apparatus and method for controlling electronic apparatus | |
US11657807B2 (en) | Multi-tier speech processing and content operations | |
US20220415310A1 (en) | Dynamic context-based routing of speech processing |