JP2017211610A - 出力制御装置、電子機器、出力制御装置の制御方法、および出力制御装置の制御プログラム - Google Patents

出力制御装置、電子機器、出力制御装置の制御方法、および出力制御装置の制御プログラム Download PDF

Info

Publication number
JP2017211610A
JP2017211610A JP2016106734A JP2016106734A JP2017211610A JP 2017211610 A JP2017211610 A JP 2017211610A JP 2016106734 A JP2016106734 A JP 2016106734A JP 2016106734 A JP2016106734 A JP 2016106734A JP 2017211610 A JP2017211610 A JP 2017211610A
Authority
JP
Japan
Prior art keywords
message
output
unit
utterance
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016106734A
Other languages
English (en)
Inventor
弘康 伊神
Hiroyasu Igami
弘康 伊神
和典 森下
Kazunori Morishita
和典 森下
慎哉 佐藤
Shinya Sato
慎哉 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2016106734A priority Critical patent/JP2017211610A/ja
Publication of JP2017211610A publication Critical patent/JP2017211610A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】発話内容に応じたメッセージを返せない場合でも会話が途切れないようにする。
【解決手段】出力制御装置(1)は、語句を検出する音声認識部(20)と、語句に対応するメッセージを出力対象のメッセージと決定するメッセージ決定部(122)とを備え、メッセージ決定部(122)は、語句に対応するメッセージを決定できない場合、過去のユーザの発話または過去に出力させたメッセージに応じたメッセージを、出力対象のメッセージと決定する。
【選択図】図1

Description

本発明は、ユーザの発話内容に応じたメッセージを出力させる出力制御装置等に関する。
従来から、ユーザとのコミュニケーションを主眼においた対話型ロボットが種々開発されている。このような対話型ロボットは、ユーザの発話内容を音声認識し、認識結果に基づいて最適な応答を決定する。
しかしながら、現実の音声認識は多様な状況下で行われるため、対話型ロボットは常にユーザの発話内容を正しく音声認識できるとは限らない。そのため、対話型ロボットが音声認識に失敗した場合に、ユーザに再度の発話を促して対話を進展させるような技術が開発されている。
例えば特許文献1には、入力音声について音声認識の誤認識が生じた場合に、音声入力の有無と、音声入力のタイミングと、発話音量と、発話速度と、発話長と、の少なくとも1つに基づいて誤認識要因を特定し、特定した誤認識要因に対応するガイダンスを出力する技術が開示されている。
特開2006−113439号公報(2006年4月27日公開)
しかしながら、音声認識が失敗するような状況下では、特許文献1に記載のようにユーザに同じ内容を、話し方を変えて発話させたとしても、なお音声認識が困難である場合が多い。そのため、特許文献1に記載のように単にガイダンスを出力するだけでは、音声認識を成功に導き、対話型ロボットにユーザとの会話を再開させることは困難であった。
また、音声認識の失敗が続いた場合、特許文献1に記載のように単にガイダンスを出力するだけだと、ユーザに同じ内容を繰り返し発話させることになる。そのため、ユーザは対話型ロボットとの会話が進展しないことに苛立ちを感じたり、会話に飽きてしまったりして、発話を止めてしまう虞があった。
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、ユーザの発話内容に応じたメッセージを返せない場合でも、会話が途切れないようにすることが可能な出力制御装置等を実現することにある。
上記の課題を解決するために、本発明の一態様に係る出力制御装置は、ユーザの発話内容に応じたメッセージを出力部に出力させる出力制御装置であって、上記発話に含まれる語句を1つ以上検出する語句検出部と、記憶部に記憶されたメッセージのうち、上記語句検出部が検出した語句の少なくとも1つに対応するメッセージを、出力対象のメッセージと決定するメッセージ決定部と、を備え、上記メッセージ決定部は、上記語句検出部が検出した語句に対応するメッセージを決定できない場合、過去の上記ユーザの発話または過去に上記出力部に出力させたメッセージと関連するメッセージを、上記出力対象のメッセージと決定することを特徴とする。
上記の課題を解決するために、本発明の一態様に係る出力制御装置の制御方法は、ユーザの発話内容に応じたメッセージを出力部に出力させる出力制御装置の制御方法であって、上記発話に含まれる語句を1つ以上検出する語句検出ステップと、記憶部に記憶されたメッセージのうち、上記語句検出ステップにて検出した語句の少なくとも1つに対応するメッセージを、出力対象のメッセージと決定するメッセージ決定ステップと、を含み、上記メッセージ決定ステップでは、上記語句検出ステップにて検出した語句に対応するメッセージを決定できない場合、過去の上記ユーザの発話または過去に上記出力部に出力させたメッセージと関連するメッセージを、上記出力対象のメッセージと決定することを特徴とする。
本発明の一態様によれば、ユーザの発話内容に応じたメッセージを返せない場合でも、会話が途切れないようにすることができる。
本発明の実施形態1に係る対話型ロボットの要部構成を示すブロック図である。 上記対話型ロボットとユーザとの会話の一例を示す図である。 図3の(a)は、上記対話型ロボットの記憶部に含まれるメッセージデータベースのデータ構成を示す図である。図3の(b)は上記対話型ロボットの記憶部に含まれるカテゴリデータベースのデータ構成を示す図である。図3の(c)は上記対話型ロボットの記憶部に含まれる出力履歴のデータ構成を示す図である。 上記対話型ロボットに含まれる出力制御装置が行う、メッセージ決定処理の流れを示すフローチャートである。 上記メッセージ決定処理の流れと処理の結果を、具体的な会話内容で示す図である。 本発明の実施形態2に係る対話型ロボットの要部構成を示すブロック図である。
〔実施形態1〕
以下、本発明の実施の形態について、詳細に説明する。まず始めに、本実施形態に係る対話型ロボット(電子機器)100の動作の概要を、図2を用いて説明する。図2は、対話型ロボット100とユーザとの会話の一例を示す図である。
≪対話型ロボットの動作概要≫
図2の(a)に示すようにユーザが発話すると、対話型ロボット100は発話を音声認識することで、発話内容をテキストデータに変換し、図2の(b)に示すように発話内容を語句に区切って認識する。なお、対話型ロボット100は発話内容全てを認識できなくても構わない。図2の(b)では、認識できなかった部分を?マークで示している。
次に、対話型ロボット100は自己が記憶しているメッセージの中で、これらの語句のうち少なくとも1つの語句に対応するメッセージを検索する。詳しくは後述するが、対話型ロボット100は語句の属するカテゴリと同じカテゴリに対応づけられているメッセージを検索する。検索の結果、該当するメッセージがある場合、対話型ロボット100は当該メッセージを出力対象のメッセージ(以下、出力メッセージと称する)と決定する。そして、対話型ロボット100は出力メッセージを図2の(c)に示すように音声出力する。対話型ロボット100はこのように、発話(対話型ロボット100に対する問いかけ等)に対し、当該発話内容に応じたメッセージを返す(出力する)ことでユーザとの会話を行う。図2の(a)〜(c)の例では、ユーザが「リンゴを買ってきたよ」と対話型ロボット100に問いかけると、対話型ロボット100が「リンゴはおいしい」と返答している。
ところで、ユーザの発話は多様であり、かつ対話型ロボット100の音声認識は多様な状況下で行われるため、対話型ロボット100は常にユーザの発話内容を正しく(ユーザの発言の意図通りに)音声認識できるとは限らない。例えば、図2の(a)〜(c)の会話の流れの後、ユーザが図2の(d)に示すような発話を行ったとする。この場合、対話型ロボット100は図2の(a)〜(b)に示したのと同様に、発話の音声認識および語句の特定を行う。ここで、音声認識またはカテゴリの特定が失敗した場合、対話型ロボット100は図2の(e)に示すように、直前に出力したメッセージを読み出す。なお、「音声認識またはカテゴリの特定が失敗した場合」とは、1回の発話の音声認識の結果を語句に区切ったときに、例えば発話内容が認識できなかった部分、助詞等その語句のみでは意味をなさない語句、および、意味不明または対応するカテゴリが記憶されていない語句、ならびにこれらの組合せしか存在しない場合を示す。
音声認識またはカテゴリの特定が失敗した場合、対話型ロボット100は図2の(e)に示すように、前回出力したメッセージを読み出し、当該メッセージに関連したメッセージを検索する。詳しくは後述するが、対話型ロボット100は前回出力したメッセージを語句に区切り、当該語句を用いてカテゴリの特定およびメッセージの決定を行う。そして、対話型ロボット100は、図2の(f)に示すように前回出力したメッセージに関連したメッセージを出力する。
このように、対話型ロボット100はユーザの1回の発話に含まれる語句に応じたメッセージを決定および出力できない場合、過去に(直前に)出力したメッセージと関連するメッセージを出力する。つまり、対話型ロボット100は、発話内容に応じたメッセージを返せなかった場合、過去のユーザとの会話に出現するキーワードと関連するメッセージを出力するといえる。これにより、対話型ロボット100は、単にエラーメッセージ等の定型文を出力した場合に比べて、ユーザが前回の発話(発話内容に応じたメッセージを返せなかった発話)と異なる発話を行うよう誘導することができる。
なお、図2の(d)〜(e)の会話の流れでは、結果的に図2の(d)に示すユーザの発話に沿わない返答を返すことになっている。対話型ロボット100はこのように、過去に出力したメッセージから次の出力メッセージを特定できれば、そのメッセージの内容が会話の流れに合っているか否かを判断しなくてもよい。
具体的に説明すると、図2の(d)に示すようにユーザが「朝ご飯を食べたいな」と対話型ロボット100に問いかけて、図2の(f)のように「リンゴは赤い」という会話の流れと異なるメッセージが返ってきたとする。この場合、ユーザは次に「食べたいのは、リンゴではなく朝ご飯」など、図2の(d)の発話内容と同じ話題を、違う文言で説明するような発話を行う可能性が高い。
このように、対話型ロボット100は過去に出力したメッセージから、出力メッセージを決定する、すなわち過去の会話から話題を類推してメッセージを出力することによって、ユーザに対話型ロボット100との会話を続けさせることができる。また、上述のように、違う文言でユーザが自分の意図を発話するため、対話型ロボット100は上記違う文言の発話について、音声認識を試みることができる。
したがって、エラーメッセ―ジ等でユーザに再度同じ内容を発話するよう促す場合に比べて、音声認識およびカテゴリ特定を成功させて、再びユーザの発話に応じたメッセージを返すことができるようになる可能性が高い。また、対話型ロボット100は過去の会話に応じて異なるメッセージを出力するため、定型文を一様に出力する場合よりも、ユーザが会話に飽きてしまう可能性を低減することができる。
≪要部構成≫
次に、対話型ロボット100の要部構成について、図1を用いて説明する。図1は、本実施形態に係る対話型ロボット100の要部構成を示すブロック図である。対話型ロボット100は図示の通り、音声入力部(音声検出部)2と、出力制御装置1と、音声合成部3と、音声出力部(出力部)4とを備えている。
音声入力部2は、ユーザの発話を検出するものである。音声入力部2は具体的には、マイク等の集音装置であればよい。音声入力部2は検出したユーザの発話を音声データとして出力制御装置1に送る。なお、音声入力部2は、ユーザの発話の間(音声を発していない時間)などから1回の発話(1まとまりの文または文章となる発話)を特定し、当該1回の発話毎の音声データを出力制御装置1に送信することが望ましい。
出力制御装置1は、音声入力部2から取得した音声データに基づき、ユーザの発話内容を音声認識する装置である。また、出力制御装置1は音声認識の結果に応じて、後述する音声出力部4に出力させるメッセージを決定するものである。出力制御装置1は、さらに詳しくは、音声認識部(語句検出部)20と、記憶部30と、主制御部10とを含む。
音声認識部20は、主制御部10から受信した、1回の発話の音声データについて音声認識を行う。なお、本発明において「音声認識」とは、発話の音声データから発話内容を示すテキストデータを得る処理を示す。音声認識部20の音声認識の方法は特に限定されず、従来あるいずれの方法を用いて音声認識を行ってもよい。
音声認識部20はさらに、音声認識により得たテキストデータから、発話内容を語句に区切る。語句の区切り方も特に限定されないが、音声認識部20は、後述するカテゴリ特定部121において語句のカテゴリが特定可能なように、音声認識したテキストデータを区切る。
記憶部30は、出力制御装置1が利用する各種データを記憶するものである。具体的には、記憶部30は少なくとも、メッセージデータベース(DB)31と、カテゴリDB32と、出力履歴33とを含む。以下、図3を用いてメッセージDB31および出力履歴33のデータ構成について説明する。
図3の(a)は、メッセージDB31のデータ構成を示す図である。メッセージDB31は図示の通り、対話型ロボット100が出力するためのメッセージ(メッセージのテキストデータ)を、所定のカテゴリに対応づけて記憶したデータベースである。なお、図示のように、1つのメッセージが複数のカテゴリに対応付けられていてもよい。メッセージDB31は、後述するメッセージ決定部122によって読み出される。なお、メッセージDB31は、メッセージおよびカテゴリに、さらにメッセージの出力の優先順位を示す情報を対応づけたデータ構成であってもよい。
図3の(b)は、カテゴリDB32のデータ構成を示す図である。カテゴリDB32は図示の通り、語句を所定のカテゴリに対応づけて記憶したデータベースである。なお、図示のように、1つの語句が複数のカテゴリに対応付けられていてもよい。カテゴリDB32は、後述するカテゴリ特定部121によって読み出される。なお、カテゴリDB32のカテゴリは、メッセージDB31にてメッセージと対応付けられているカテゴリの分類と同じものである。
図3の(c)は、出力履歴33のデータ構成を示す図である。出力履歴33は図示の通り、対話型ロボット100が過去に出力したメッセージ(メッセージのテキストデータ)を記憶している。なお、記憶部30は出力履歴33として、少なくとも直前に出力したメッセージのテキストデータを記憶していればよい。もしくは、記憶部30は、少なくとも直前に出力したメッセージが特定可能なように出力履歴33を記憶していることが望ましい。例えば、図3の(c)に示すようにメッセージを、当該メッセージを出力した日時に対応づけて記憶しておいてもよい。また、記憶部30は出力履歴33として、過去に出力したメッセージをそのままテキストデータで記憶しておくのではなく、過去に出力したメッセージに含まれる語句のテキストデータを記憶しておいてもよい。
主制御部10は、出力制御装置1を統括的に制御するものである。主制御部10は音声取得部11と、探索部(時刻特定部、位置特定部)12とを含む。音声取得部11は、音声入力部2から音声データを取得し、当該音声データを音声認識部20に送る。探索部12は、音声認識部20から音声認識の結果を受信し、当該認識結果に応じて出力メッセージを決定し、音声合成部3に送る。探索部12は、さらに詳しくは、カテゴリ特定部121とメッセージ決定部122とを含む。
カテゴリ特定部121は、音声認識部20から取得した語句でカテゴリDB32を検索することにより、上記語句がいずれのカテゴリに属するかを特定する。換言すると、カテゴリ特定部121は、上記語句をカテゴリに分類しているともいえる。カテゴリ特定部121は、音声認識部20から取得した、1回の発話に含まれる語句それぞれに対し、カテゴリの特定を試みる。カテゴリが特定できた場合、カテゴリ特定部121は特定したカテゴリをメッセージ決定部122に伝える。
一方、1回の発話に含まれるいずれの語句からもカテゴリを特定できなかった場合、カテゴリ特定部121は記憶部30の出力履歴33から、対話型ロボット100が直前に出力した出力メッセージ、すなわち出力制御装置1の探索部12が直前に決定した出力メッセージを読み出し、当該出力メッセージを語句に区切り、当該語句のカテゴリを特定する。例えば、音声認識部20が1回の発話から音声認識できた語句が、助詞などその語句だけでは特定の意味を持たない語句であった場合や、名詞等何らかの意味がある語句を認識できてはいるが、当該語句に対応するカテゴリを、カテゴリ特定部121が記憶していない場合、カテゴリ特定部121はカテゴリの特定が失敗したと判断し、直前の出力メッセージからのカテゴリ特定を行えばよい。カテゴリ特定部121は直前の出力メッセージから特定したカテゴリを、メッセージ決定部122に伝える。
ユーザは連続して発話する場合、直前の発話と関連することを発話する可能性が高い。したがって、カテゴリ特定部121は直前に出力したメッセージに関連するメッセージを出力メッセージとして特定することで、ユーザが発話した内容により近い内容のメッセージを音声出力部4に出力させることができる。
なお、カテゴリ特定部121は1つの語句から複数のカテゴリを特定してもよい。例えば、カテゴリ特定部121は図3の(b)に示したように「朝ご飯」という語句を、「食べ物」というカテゴリと、「朝」というカテゴリの両方に属するものであると判断し、メッセージ決定部122に対し「食べ物」というカテゴリと、「朝」というカテゴリの両方を伝えてもよい。
また、カテゴリ特定部121は、音声認識部20から取得した語句からカテゴリを特定できなかった場合(発話からのカテゴリ特定に失敗した場合)、直前の出力メッセージではなく、出力履歴33に記憶されている、過去の出力メッセージのなかから1つのメッセージを選択して読出し、当該メッセージを語句に区切り、カテゴリ特定を行ってもよい。さらには、出力履歴33が過去の出力メッセージを予め語句に分解した形で記憶している場合、カテゴリ特定部121は出力履歴33から直前の出力メッセージに含まれる語句を読み出し、それぞれの語句についてカテゴリ検索を行えば良い。
メッセージ決定部122は、記憶部30のメッセージDB31に記憶されたメッセージのうち、カテゴリ特定部121が検出したカテゴリの少なくとも1つと対応づけられているメッセージを、出力メッセージと決定する。メッセージ決定部122は決定した出力メッセージのテキストデータを音声合成部3に送るとともに、当該出力メッセージを記憶部30の出力履歴33に記憶させる。
なお、カテゴリ特定部121が検出したカテゴリの少なくとも1つと対応づけられているメッセージが複数存在する場合、メッセージ決定部122は該当するメッセージ全てを出力メッセージと決定してもよいし、該当するメッセージからいずれか1つ(または所定の個数)のメッセージを選択して、出力メッセージと決定してもよい。また、このときのメッセージの選択方法は特に限定しないが、例えばメッセージDBに出力の優先順位が記憶されている場合は当該優先順位に従って出力メッセージを選択すればよい。もしくは、該当するメッセージからランダムに選択すればよい。
音声合成部3は、出力制御装置1のメッセージ決定部122から受信したメッセージのテキストデータを音声データに変換する。音声合成部3は、変換した音声データを音声出力部4に出力する。なお、音声合成部3はメッセージ決定部122から、出力メッセージを示す情報を受信し、当該情報に従って記憶部30のメッセージDB31にアクセスすることで、出力メッセージのテキストデータを得てもよい。
音声出力部4は、音声合成部3から受信した音声データを出力する。音声出力部4は具体的には対話型ロボット100に備えられたスピーカ等で実現される。なお、図1の例では音声出力部4は対話型ロボット100に内蔵されているが、音声出力部4は対話型ロボット100に取付けられた外部装置であっても構わない。
なお、本実施形態に係る出力制御装置1は、必ずしもカテゴリ特定を行わなくてもよい。換言すると、出力制御装置1においてカテゴリ特定部121は必須ではない。カテゴリ特定を行わない場合、記憶部30はメッセージDB31として、語句にメッセージを対応付けたデータを記憶する。そして、探索部12のメッセージ決定部122は、音声認識部20から受信した語句それぞれに対応するメッセージをメッセージDB31から検索し、該当するメッセージを出力メッセージと決定すればよい。
また、メッセージ決定部122は、カテゴリ特定部121が検出したカテゴリを複数用いて、メッセージDB31を検索(複数カテゴリでのand検索)してもよい。また、メッセージ決定部122はカテゴリ特定部121が検出したカテゴリに検索の優先順位を設け、優先順位の高いカテゴリに対応するメッセージを出力メッセージと特定してもよい。さらには、メッセージ決定部122はメッセージの決定の際に、出力履歴33を参照し、直前または所定の時間または出力回数内に出力したメッセージと重複しないメッセージを、出力メッセージとして決定してもよい。これにより、対話型ロボット100が同じメッセージを繰り返し出力することを防ぐことができるため、ユーザが対話型ロボット100との会話に飽きることを防止することができる。
≪出力制御装置の処理の流れ≫
続いて、出力制御装置1がメッセージを決定する処理(メッセージ決定処理)の流れについて、図4を用いて説明する。図4は、出力制御装置1が行うメッセージ決定処理の流れを示すフローチャートである。
ユーザが発話すると、音声入力部2は当該発話を検出し、音声データを出力制御装置1の音声取得部11に送る。音声取得部11は音声データを取得すると(S1)、当該音声データを音声認識部20に送信する。音声認識部20は音声認識を行うことで発話の音声データをテキストデータに変換する(S2)。さらに、音声認識部20は当該テキストデータから語句を検出し(S3、語句検出ステップ)、探索部12に送信する。探索部12のカテゴリ特定部121は、音声認識部20から受信した、発話1回分の語句それぞれのカテゴリを特定する(S4)。ここで、音声認識部20から受信した語句のカテゴリを特定できた場合(S5でYES)、カテゴリ特定部121は当該カテゴリをメッセージ決定部122に送信し、メッセージ決定部122は当該カテゴリに対応するメッセージを出力メッセージと決定する(S8、メッセージ決定ステップ)。
一方、音声認識部20から受信した語句からカテゴリを特定できなかった場合(S5でNO)、カテゴリ特定部121は出力履歴33を参照し、直前に出力したメッセージ(前回出力したメッセージ)を読み出し(S6)、当該メッセージに含まれる語句のカテゴリを特定する(S7)。カテゴリ特定部121は特定したカテゴリをメッセージ決定部122に送信し、メッセージ決定部122は当該カテゴリに対応するメッセージを出力メッセージと決定する(S8)。決定された出力メッセージのテキストデータは、メッセージ決定部122から音声合成部3に送られ、音声合成部3は当該テキストデータから音声を合成し、音声出力部4に出力させる。
なお、S7において、直前に出力したメッセージに含まれる語句からもカテゴリを特定できなかった場合、カテゴリ特定部121は出力履歴33から、さらに前(前々回)に出力したメッセージを読み出し、当該メッセージに含まれる語句からカテゴリの特定を行ってもよい。そして、メッセージ決定部122は、前々回に出力したメッセージに含まれる語句から特定されたカテゴリに対応するメッセージを出力メッセージと決定してもよい。
≪メッセージ決定の具体的な流れ≫
最後に、メッセージ決定処理の流れを、メッセージの具体例を挙げて説明する。図5は、メッセージ決定処理の流れと処理の結果を、具体的な会話内容で示す図である。始めに、ユーザが例えば「朝ご飯を食べたいな」と発話した場合(S10)、音声入力部2は当該発話を検出し、音声データを音声取得部11に送る。音声取得部11は音声データを音声認識部20に送り、音声認識部20は音声認識および語句の特定を行い、語句のテキストデータをカテゴリ特定部121に送る。カテゴリ特定部121は当該語句に対応するカテゴリの特定を試みる。
カテゴリ特定部121が語句(ユーザの発話に含まれる語句)に対応するカテゴリを少なくとも1つ特定できた場合(S20でYES)、メッセージ決定部122は特定されたカテゴリに応じて出力メッセージを決定する。例えば、音声認識部20がS10の発話から、「朝ご飯」、「を」、「旅をから」の3つの語句を特定したとし、そのうち「朝ご飯」という語句でカテゴリ特定が成功したとする(S40)。図3の(b)によると、「朝ご飯」という語句のカテゴリは「朝」および「食べ物」である(S41)。したがって、メッセージ決定部122はカテゴリ「朝」または「食べ物」でメッセージDB31を検索する。例えばメッセージ決定部122はカテゴリ「朝」で図3の(a)に示したメッセージDB31を検索することで(S42)、「朝ご飯はトーストだね」というメッセージを出力メッセージと決定する(S43)。
一方、カテゴリ特定部121が、ユーザの発話に含まれる語句に対応するカテゴリを特定できなかった場合(S20でNO)、例えば上記語句が語句特定不能な部分(?部分)と、「を」、および「旅をから」という意味をなさない語句のみであった場合(S30)、カテゴリ特定部121は直前に出力したメッセージを参照し(S31)、当該メッセージに含まれる語句からカテゴリ特定を試みる。例えば、直前に出力したメッセージ(直前の出力履歴)が、「リンゴはおいしい」であり、図示のように「リンゴ」、「は」、「おいしい」という3つの語句に区切ることができた場合、図3の(b)に示したように「リンゴ」はカテゴリ「食べ物」および「色(赤)」に該当するため、カテゴリ特定部121はこれらのカテゴリを特定することができる。そして、メッセージ決定部122はカテゴリ「食べ物」または「色(赤)」からメッセージDB31を検索する(メッセージ検索、S32およびS34)。カテゴリ「食べ物」でメッセージDB31を検索した場合、図3の(a)に示したように、例えば「リンゴはおいしい」および「リンゴは赤い」というメッセージが検索に該当する。したがって、メッセージ決定部122は、これらのうち1つ以上、例えば「リンゴは赤い」というメッセージを出力メッセージと決定する(S33)。一方、カテゴリ「色(赤)」でメッセージDB31を検索した場合、図3の(a)に示したように、「イチゴはおいしい」というメッセージが検索に該当する。したがって、メッセージ決定部122は、「イチゴはおいしい」というメッセージを出力メッセージと決定する(S35)。
なお、出力制御装置1は、カテゴリ特定部121が音声認識部20の特定した語句からカテゴリを特定できず、さらに、出力履歴33に記憶された、過去に出力したメッセージからもカテゴリを特定できなかった場合、探索部12において発話(音声認識部20が音声認識を行った発話)が行われた時刻、または当該発話を行ったユーザの位置を特定し、メッセージ決定部122は、探索部12が特定した上記時刻または上記位置に応じて出力メッセージを決定してもよい。また、メッセージ決定部122が、カテゴリ特定部121が特定したカテゴリからメッセージを決定できなかった(カテゴリに対応するメッセージがメッセージDB31に記憶されていなかった場合など)場合も、同様に発話が行われた時刻およびユーザの位置に応じてメッセージを決定してよい。
発話が行われた時刻については、探索部12は音声取得部11が音声入力部2から音声データを取得した時刻を測定すればよい。なお、時刻測定は、出力制御装置1のリアルタイムクロック等に基づいて行うことができる。また、対話型ロボット100はメッセージ音声を通じてユーザと会話できる位置に居ると推定されるため、探索部12は対話型ロボット100自身(もしくは、音声入力部2または音声出力部4)の位置を、ユーザの位置と略一致するとみなすことで、ユーザの位置を特定すればよい。
そして、メッセージDB31にも上記時刻または位置にメッセージを対応づけた情報を記憶しておく。これにより、メッセージ決定部122は探索部12が特定した時刻または位置に基づきメッセージDB31を検索し、検索に該当するメッセージを出力メッセージと決定することができる。
より具体的には、図5のS31において、出力履歴33に記憶された直前に出力したメッセージを参照してもカテゴリ特定部121がカテゴリ特定に失敗した場合(S36)、またはメッセージ決定部122がカテゴリからの出力メッセージの決定に失敗した場合(S36)、探索部12は発話が行われた時刻(音声取得部11が音声を取得した時刻、または音声認識部20が音声認識を完了した時刻など)またはユーザの位置を特定し、メッセージ決定部122は当該時刻または位置についてメッセージDB31を検索することでメッセージ検索を行う(S37)。そして、検索に該当するメッセージが見つかれば、当該メッセージを出力メッセージと決定すればよい(S38)。
なお、メッセージ決定部122が決定するメッセージには、メッセージの決定後にテキストを補完するような可変部分が含まれていてもよい。そして、メッセージ決定部122は、メッセージを決定した後、当該可変部分のテキストをさらに決定してメッセージに埋め込み、当該埋め込み後のメッセージのテキストデータを音声合成部3に送信してもよい。つまり、図5のS33、S35、S38、およびS43において決定されたメッセージの主語または目的語等が可変部分となっていても構わない。
例えばS43の「朝ご飯はトーストだね」というメッセージの目的語(「トースト」の部分)が可変部分となっていても構わない。当該可変部分のテキストの決定方法は特に限定されないが、例えば対話型ロボット100の記憶部30に、上記可変部分に埋め込むべきテキスト(主語や目的語の単語群)を、関連する語句と対応付けて記憶しておき、決定したメッセージの可変でない部分の語句(例えば「朝ご飯」という語句)と関連する単語を上記可変部分に埋め込むテキストとして決定してもよい。また、上記可変部分のテキストを、認識履歴34に基づいて決定してもよい。
〔実施形態2〕
本発明に係る出力制御装置は、過去のユーザの発話に含まれる語句に対応するメッセージを、出力メッセージと決定してもよい。以下、本発明の第2の実施形態について、図6に基づいて説明する。なお、説明の便宜上、前記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。
図6は、実施形態2に係る対話型ロボット(電子機器)200の要部構成を示す図である。対話型ロボット200は、出力制御装置5の記憶部30に認識履歴34を備える点で、実施形態1に係る対話型ロボット100と異なる。なお、本実施形態においては、出力履歴33は必須構成ではない。
認識履歴34は、対話型ロボット200が過去に音声認識した発話に含まれていた語句を、テキストデータとして記憶している。なお、記憶部30は認識履歴34として、音声認識部20が認識した発話の少なくとも直前に音声認識しメッセージを返した(すなわち、ユーザが前回に発話した)発話1回分に含まれる語句のテキストデータを記憶していればよい。また、認識履歴34は、語句を音声認識した日時に対応づけて記憶しておいてもよい。また、記憶部30は認識履歴34として、過去に音声認識した発話をそのままテキストデータで記憶しておいてもよい。
本実施形態における出力制御装置5は、カテゴリ特定部123を備える点で、実施形態1に係る出力制御装置1と異なる。カテゴリ特定部123は、1回の発話に含まれるいずれの語句からもカテゴリを特定できなかった場合、ユーザの上記1回の発話の直前の発話内容を音声認識した結果(語句)を認識履歴34から読み出し、当該語句のカテゴリを特定する。
これにより、出力制御装置5は、現在のユーザの発話内容から出力メッセージを決定できない場合、過去のユーザの発話からユーザの発話の話題を類推して出力メッセージを決定することができる。したがって、ユーザが発話した内容により近い内容のメッセージを音声出力部4に出力させることができる。
なお、記憶部30に出力履歴33と認識履歴34との両方を備える場合、カテゴリ特定部123は実施形態1にて説明した出力履歴33からのメッセージの読出しおよび語句の特定と、本実施形態にて説明した認識履歴34からの語句の読出しとの両方を用いて、または両方を使い分けて、カテゴリの特定を行ってもよい。例えば、カテゴリ特定部123は、直前に出力したメッセージからもカテゴリ特定を行えなかった場合に、認識履歴34を参照して直前(前回)に音声認識した発話に含まれていた語句を用いてカテゴリ特定を行ってもよい。
また、本実施形態に係る出力制御装置5も、出力制御装置1と同様に、メッセージDB31に可変部分が含まれたメッセージを記憶しておき、メッセージ決定部122がメッセージ決定後に当該可変部分のテキストを決定してメッセージに埋め込んでもよい。また、当該可変部分のテキストは、出力履歴33に基づいて決定してよい。
〔実施形態3〕
なお、出力制御装置1または5の記憶部30は、出力履歴33として過去に出力したメッセージを、当該メッセージに対応するカテゴリに対応付けて記憶していてもよい。換言すると、記憶部30は、過去に出力制御装置1または5が音声合成部3に出力したメッセージを、図3の(a)に示すメッセージDB31のような形式で記憶していてもよい。
この場合、カテゴリ特定部121または123は、音声認識部20が検出する語句に対応するカテゴリを決定できない場合、直前(または過去)に出力したメッセージに対応付けられているカテゴリと同カテゴリに対応付けられたメッセージを、出力メッセージと決定してもよい。
これにより、出力制御装置1または5は、現在のユーザの発話内容からメッセージを決定できない場合、過去に出力したメッセージと同カテゴリ、すなわち同じ主題に基づいたメッセージを出力メッセージとして決定する。したがって、出力制御装置1または5は、ユーザが発話した内容により近い内容のメッセージを音声出力部4に出力させることができる。
〔変形例〕
上記各実施形態では、語句からカテゴリが特定できない場合、すなわち、音声認識部20が音声認識した語句が全て、カテゴリDB32に記憶されているカテゴリに分類不能な場合にのみ、出力履歴33や認識履歴34を参照して出力メッセージを決定することとした。しかしながら、本発明に係る出力制御装置1または5のメッセージ決定部122は、音声認識部20の音声認識および語句の特定が部分的に成功している場合(1つ以上、カテゴリ特定可能な語句を検出している場合)でも、出力履歴33に記憶された過去のメッセージや認識履歴34に記憶された過去のユーザの発話内容に応じて、出力メッセージを決定してもよい。
〔ソフトウェアによる実現例〕
出力制御装置1の制御ブロック(特に音声認識部20および探索部12)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
後者の場合、出力制御装置1は、各機能を実現するソフトウェアであるプログラムの命令を実行するCPU、上記プログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROM(Read Only Memory)または記憶装置(これらを「記録媒体」と称する)、上記プログラムを展開するRAM(Random Access Memory)などを備えている。そして、コンピュータ(またはCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
〔まとめ〕
本発明の態様1に係る出力制御装置(出力制御装置1および5)は、ユーザの発話内容に応じたメッセージを出力部(音声出力部4)に出力させる出力制御装置であって、上記発話に含まれる語句を1つ以上検出する語句検出部(音声認識部20)と、記憶部(記憶部30)に記憶されたメッセージのうち、上記語句検出部が検出した語句の少なくとも1つに対応するメッセージを、出力対象のメッセージと決定するメッセージ決定部(メッセージ決定部122)と、を備え、上記メッセージ決定部は、上記語句検出部が検出した語句に対応するメッセージを決定できない場合、過去の上記ユーザの発話または過去に上記出力部に出力させたメッセージと関連するメッセージを、上記出力対象のメッセージと決定することを特徴としている。
上記の構成によれば、出力制御装置は、ユーザの発話に含まれる語句に対応するメッセージを決定できない場合、過去のユーザの発話または過去出力させたメッセージと関連するメッセージを出力させる。なお、「メッセージを決定できない場合」とは、例えば語句検出部が語句検出に失敗した場合、または、語句検出部が検出した語句に対応するメッセージが記憶部に記憶されていない場合等を示す。
換言すると、出力制御装置は、ユーザの発話内容に応じたメッセージを出力させられない場合、過去のユーザの発話と出力メッセージとで行われた会話に関連するメッセージを出力する。これにより、単にエラーメッセージ等の定型文を出力した場合に比べて、ユーザが前回の発話(発話内容に応じたメッセージを返せなかった発話)と異なる発話を行うよう誘導することができる。そして、ユーザの発話が変化すると、当該発話の語句からメッセージを決定する機会を得ることができる。
また、過去の会話に応じて異なるメッセージが出力されるため、上記定型文を一様に出力する場合よりも、ユーザが会話に飽きてしまう可能性を低減することができる。したがって、出力制御装置は、ユーザの発話内容に応じたメッセージを返せない場合でも、会話が途切れないようにすることができる。
本発明の態様2に係る出力制御装置は、上記態様1において、上記メッセージ決定部は、上記語句検出部が検出した語句に対応するメッセージを決定できない場合、上記発話の直前の上記ユーザの発話、または上記発話の直前に上記出力部に出力させたメッセージと関連するメッセージを、上記出力対象のメッセージと決定することを特徴としている。
ユーザは連続して発話する場合、直前の発話と関連することを発話する可能性が高い。したがって、上記の構成のように、直前のユーザの発話、または当該直前のユーザの発話に応じて出力制御装置が出力部に出力させたメッセージから、当該発話またはメッセージに関連するメッセージを出力対象のメッセージとして特定することで、ユーザが発話した内容により近い内容のメッセージを出力部に出力させることができる。
本発明の態様3に係る出力制御装置は、上記態様1または2において、上記メッセージ決定部は、上記語句検出部が検出した語句に対応するメッセージを決定できない場合、過去に上記出力部に出力させたメッセージに含まれる語句に対応するメッセージを上記出力対象のメッセージと決定することを特徴としている。
上記の構成によれば、出力制御装置は、ユーザの発話内容に応じたメッセージを出力させられない場合、過去に出力部に出力させたメッセージから、ユーザの発話および出力部の過去出力したメッセージとの間の話題を類推してメッセージを出力させることができる。したがって、ユーザが発話した内容により近い内容のメッセージを出力部に出力させることができる。
本発明の態様4に係る出力制御装置は、上記態様1または2において、上記メッセージ決定部は、上記語句検出部が検出した語句に対応するメッセージを決定できない場合、過去の上記ユーザの発話に含まれる語句に対応するメッセージを上記出力対象のメッセージと決定することを特徴としている。
上記の構成によれば、出力制御装置は、現在のユーザの発話内容からメッセージを決定できない場合、過去のユーザの発話から、ユーザの発話の話題を類推してメッセージを決定することができる。したがって、ユーザが発話した内容により近い内容のメッセージを出力部に出力させることができる。
本発明の態様5に係る出力制御装置は、上記態様1または2において、上記記憶部は、上記メッセージを所定のカテゴリに対応付けて記憶しており、上記メッセージ決定部は、上記語句検出部が検出する語句に対応するメッセージを決定できない場合、過去に上記出力部に出力させたメッセージが上記記憶部にて対応付けられているカテゴリと、同じカテゴリに対応付けられたメッセージを、上記出力対象のメッセージと決定することを特徴としている。
上記の構成によれば、出力制御装置は、現在のユーザの発話内容からメッセージを決定できない場合、過去に出力部に出力させたメッセージと同カテゴリ、すなわち同じ主題に基づいたメッセージを出力対象のメッセージと決定する。したがって、出力制御装置は、ユーザが発話した内容により近い内容のメッセージを出力部に出力させることができる。
本発明の態様6に係る出力制御装置は、上記態様1〜5のいずれか一態様において、上記語句検出部が検出した語句が属するカテゴリを特定するカテゴリ特定部(カテゴリ特定部121および123)を備え、上記メッセージ決定部は、上記メッセージを所定のカテゴリに対応付けて記憶している上記記憶部から、上記カテゴリ特定部が特定した上記語句のカテゴリの少なくとも1つと一致するカテゴリと対応づけられたメッセージを上記出力対象のメッセージと決定することを特徴としている。
上記の構成によれば、出力制御装置は、ユーザの発話に含まれる語句のカテゴリ、すなわち、ユーザの発話の主題の種類を類推し、当該類推に基づいたメッセージを出力対象のメッセージと決定する。したがって、出力制御装置は、ユーザが発話した内容により近い内容のメッセージを出力部に出力させることができる。
本発明の態様7に係る出力制御装置は、上記態様1〜5のいずれか一態様において、上記発話が行われた時刻を特定する時刻特定部(探索部12)と、上記発話を行ったユーザの位置を特定する位置特定部(探索部12)と、を備え、上記メッセージ決定部は、過去の上記ユーザの発話または過去に上記出力部に出力させたメッセージと関連するメッセージを特定できない場合、上記発話が行われた時刻または上記ユーザの位置に応じて上記出力対象のメッセージと決定することを特徴としている。
上記の構成によれば、過去のユーザの発話または過去に出力部に出力させたメッセージと関連するメッセージを特定できない場合でも、発話が行われた時刻またはユーザの位置に応じて出力対象のメッセージを決定することができる。
本発明の態様8に係る電子機器は、上記態様1〜7のいずれか一態様に記載の出力制御装置と、ユーザの発話音声を検出する音声検出部(音声入力部2)と、上記出力部と、上記記憶部と、を備えることを特徴としている。
上記の構成によれば、上記出力制御装置と同様の効果を奏する電子機器を実現することができる。
本発明の態様9に係る出力制御装置(出力制御装置1および5)の制御方法は、ユーザの発話内容に応じたメッセージを出力部(音声出力部4)に出力させる出力制御装置の制御方法であって、上記発話に含まれる語句を1つ以上検出する語句検出ステップ(S3)と、記憶部(記憶部30)に記憶されたメッセージのうち、上記語句検出ステップにて検出した語句の少なくとも1つに対応するメッセージを、出力対象のメッセージと決定するメッセージ決定ステップ(S8)と、を含み、上記メッセージ決定ステップでは、上記語句検出ステップにて検出した語句に対応するメッセージを決定できない場合、過去の上記ユーザの発話または過去に上記出力部に出力させたメッセージと関連するメッセージを、上記出力対象のメッセージと決定することを特徴としている。
上記の構成によれば、上記出力制御装置と同様の効果を奏する。
本発明の各態様に係る出力制御装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記出力制御装置が備える各部(ソフトウェア要素)として動作させることにより上記出力制御装置をコンピュータにて実現させる出力制御装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。
1、5 出力制御装置
2 音声入力部(音声検出部)
3 音声合成部
4 音声出力部(出力部)
10 主制御部
11 音声取得部
12 探索部(時刻特定部、位置特定部)
121、123 カテゴリ特定部
122 メッセージ決定部
20 音声認識部(語句検出部)
30 記憶部
31 メッセージDB
32 カテゴリDB
33 出力履歴
34 認識履歴
100、200 対話型ロボット(電子機器)

Claims (10)

  1. ユーザの発話内容に応じたメッセージを出力部に出力させる出力制御装置であって、
    上記発話に含まれる語句を1つ以上検出する語句検出部と、
    記憶部に記憶されたメッセージのうち、上記語句検出部が検出した語句の少なくとも1つに対応するメッセージを、出力対象のメッセージと決定するメッセージ決定部と、を備え、
    上記メッセージ決定部は、上記語句検出部が検出した語句に対応するメッセージを決定できない場合、過去の上記ユーザの発話または過去に上記出力部に出力させたメッセージと関連するメッセージを、上記出力対象のメッセージと決定することを特徴とする出力制御装置。
  2. 上記メッセージ決定部は、上記語句検出部が検出した語句に対応するメッセージを決定できない場合、上記発話の直前の上記ユーザの発話、または上記発話の直前に上記出力部に出力させたメッセージと関連するメッセージを、上記出力対象のメッセージと決定することを特徴とする、請求項1に記載の出力制御装置。
  3. 上記メッセージ決定部は、上記語句検出部が検出した語句に対応するメッセージを決定できない場合、過去に上記出力部に出力させたメッセージに含まれる語句に対応するメッセージを上記出力対象のメッセージと決定することを特徴とする、請求項1または2に記載の出力制御装置。
  4. 上記メッセージ決定部は、上記語句検出部が検出した語句に対応するメッセージを決定できない場合、過去の上記ユーザの発話に含まれる語句に対応するメッセージを上記出力対象のメッセージと決定することを特徴とする、請求項1または2に記載の出力制御装置。
  5. 上記記憶部は、上記メッセージを所定のカテゴリに対応付けて記憶しており、
    上記メッセージ決定部は、上記語句検出部が検出する語句に対応するメッセージを決定できない場合、過去に上記出力部に出力させたメッセージが上記記憶部にて対応付けられているカテゴリと、同じカテゴリに対応付けられたメッセージを、上記出力対象のメッセージと決定することを特徴とする、請求項1または2に記載の出力制御装置。
  6. 上記語句検出部が検出した語句が属するカテゴリを特定するカテゴリ特定部を備え、
    上記メッセージ決定部は、上記メッセージを所定のカテゴリに対応付けて記憶している上記記憶部から、上記カテゴリ特定部が特定した上記語句のカテゴリの少なくとも1つと一致するカテゴリと対応づけられたメッセージを上記出力対象のメッセージと決定することを特徴とする、請求項1〜5のいずれか1項に記載の出力制御装置。
  7. 上記発話が行われた時刻を特定する時刻特定部と、
    上記発話を行ったユーザの位置を特定する位置特定部と、を備え、
    上記メッセージ決定部は、過去の上記ユーザの発話または過去に上記出力部に出力させたメッセージと関連するメッセージを特定できない場合、上記発話が行われた時刻または上記ユーザの位置に応じて上記出力対象のメッセージと決定することを特徴とする、請求項1〜5のいずれか1項に記載の出力制御装置。
  8. 請求項1〜7のいずれか1項に記載の出力制御装置と、
    ユーザの発話音声を検出する音声検出部と、
    上記出力部と、
    上記記憶部と、を備えることを特徴とする電子機器。
  9. ユーザの発話内容に応じたメッセージを出力部に出力させる出力制御装置の制御方法であって、
    上記発話に含まれる語句を1つ以上検出する語句検出ステップと、
    記憶部に記憶されたメッセージのうち、上記語句検出ステップにて検出した語句の少なくとも1つに対応するメッセージを、出力対象のメッセージと決定するメッセージ決定ステップと、を含み、
    上記メッセージ決定ステップでは、上記語句検出ステップにて検出した語句に対応するメッセージを決定できない場合、過去の上記ユーザの発話または過去に上記出力部に出力させたメッセージと関連するメッセージを、上記出力対象のメッセージと決定することを特徴とする出力制御装置の制御方法。
  10. 請求項1に記載の出力制御装置としてコンピュータを機能させるための制御プログラムであって、上記語句検出部および上記メッセージ決定部としてコンピュータを機能させるための制御プログラム。
JP2016106734A 2016-05-27 2016-05-27 出力制御装置、電子機器、出力制御装置の制御方法、および出力制御装置の制御プログラム Pending JP2017211610A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016106734A JP2017211610A (ja) 2016-05-27 2016-05-27 出力制御装置、電子機器、出力制御装置の制御方法、および出力制御装置の制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016106734A JP2017211610A (ja) 2016-05-27 2016-05-27 出力制御装置、電子機器、出力制御装置の制御方法、および出力制御装置の制御プログラム

Publications (1)

Publication Number Publication Date
JP2017211610A true JP2017211610A (ja) 2017-11-30

Family

ID=60476287

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016106734A Pending JP2017211610A (ja) 2016-05-27 2016-05-27 出力制御装置、電子機器、出力制御装置の制御方法、および出力制御装置の制御プログラム

Country Status (1)

Country Link
JP (1) JP2017211610A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019235100A1 (ja) * 2018-06-08 2019-12-12 株式会社Nttドコモ 対話装置
WO2020017165A1 (ja) * 2018-07-20 2020-01-23 ソニー株式会社 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム
KR20200128123A (ko) * 2018-03-05 2020-11-11 구글 엘엘씨 자동화 어시스턴트를 이용한 이전 대화 컨텍스트사이의 전환

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200128123A (ko) * 2018-03-05 2020-11-11 구글 엘엘씨 자동화 어시스턴트를 이용한 이전 대화 컨텍스트사이의 전환
KR102448388B1 (ko) 2018-03-05 2022-09-28 구글 엘엘씨 자동화 어시스턴트를 이용한 이전 대화 컨텍스트사이의 전환
KR20220134050A (ko) * 2018-03-05 2022-10-05 구글 엘엘씨 자동화 어시스턴트를 이용한 이전 대화 컨텍스트사이의 전환
US11727220B2 (en) 2018-03-05 2023-08-15 Google Llc Transitioning between prior dialog contexts with automated assistants
KR102567447B1 (ko) 2018-03-05 2023-08-16 구글 엘엘씨 자동화 어시스턴트를 이용한 이전 대화 컨텍스트사이의 전환
WO2019235100A1 (ja) * 2018-06-08 2019-12-12 株式会社Nttドコモ 対話装置
WO2020017165A1 (ja) * 2018-07-20 2020-01-23 ソニー株式会社 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム

Similar Documents

Publication Publication Date Title
US11887590B2 (en) Voice enablement and disablement of speech processing functionality
US11264030B2 (en) Indicator for voice-based communications
US11580960B2 (en) Generating input alternatives
US11496582B2 (en) Generation of automated message responses
US10074369B2 (en) Voice-based communications
US10453449B2 (en) Indicator for voice-based communications
US10453117B1 (en) Determining domains for natural language understanding
JP2020173483A (ja) 発話分類器
US10963497B1 (en) Multi-stage query processing
US11798559B2 (en) Voice-controlled communication requests and responses
US11195522B1 (en) False invocation rejection for speech processing systems
JP6715943B2 (ja) 対話装置、対話装置の制御方法、および制御プログラム
US9691389B2 (en) Spoken word generation method and system for speech recognition and computer readable medium thereof
JP7151181B2 (ja) 音声対話システム、その処理方法及びプログラム
JP2017211610A (ja) 出力制御装置、電子機器、出力制御装置の制御方法、および出力制御装置の制御プログラム
WO2018045154A1 (en) Voice-based communications
JP2010197644A (ja) 音声認識システム
US11563708B1 (en) Message grouping
JP2019207329A (ja) 電子機器、電子機器を制御する制御装置、制御プログラムおよび制御方法
US11735178B1 (en) Speech-processing system
US11250853B2 (en) Sarcasm-sensitive spoken dialog system
CN111078937A (zh) 语音信息检索方法、装置、设备和计算机可读存储介质
KR102392992B1 (ko) 음성 인식 기능을 활성화시키는 호출 명령어 설정에 관한 사용자 인터페이싱 장치 및 방법
JP2018163295A (ja) 音声対話装置および音声対話方法
JP2010151941A (ja) 音声応答装置、及びプログラム