JP2011227236A - 音声対話装置 - Google Patents
音声対話装置 Download PDFInfo
- Publication number
- JP2011227236A JP2011227236A JP2010095770A JP2010095770A JP2011227236A JP 2011227236 A JP2011227236 A JP 2011227236A JP 2010095770 A JP2010095770 A JP 2010095770A JP 2010095770 A JP2010095770 A JP 2010095770A JP 2011227236 A JP2011227236 A JP 2011227236A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- unit
- utterance
- answer
- response
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】 音声対話装置(コミュニケーションロボット)は、音声合成部21aによって、発話情報に基づいて音声出力(発話)する。音声対話装置は、音声入力部21bによって音声の入力を検出すると、発話中断処理手段473aによって音声合成部21aによる発話を中断させる。次に、音声対話装置は、応答行動選択手段473cによって、中断の原因となった入力音声に対する応答行動を選択して実行する。そして、音声対話装置は、再開位置決定手段473bによって、応答行動の実行状況に応じて、中断させた発話情報おける発話の再開位置を決定し、決定した再開位置から発話を再開させる。
【選択図】図8
Description
また、発話を中断させた後、発話を再開させるときに、音声対話装置は、中断させた発話文の最初からしか発話を再開できなかった。例えば、特許文献1(段落0020、図3参照)には、中断させた対話を再開させるときに、最後に応答した発話内容を再び発話させる音声対話装置が記載されている。
そして、音声対話装置は、音声出力部による音声出力を中断させた場合には、応答行動選択手段によって、音声出力部による音声出力の中断の原因となった状況に対する応答行動を選択する。
そして、音声対話装置は、この中断の原因となった状況に対する応答行動を実行後に、再開位置決定手段によって、この応答行動の実行状況に応じて、音声出力部による音声出力を中断させた発話情報における再開位置を決定する。
そして、音声対話装置は、応答行動制御手段によって、再開位置決定手段で決定した再開位置から、音声出力部による音声出力を中断させた発話情報の音声出力部による音声出力を再開させる。
これによって、音声対話装置は、外部情報に基づいて把握される状況に応じて、適宜に音声出力部による音声出力を中断して応答し、応答後にこの応答の実行状況に応じて音声出力部による音声出力が中断された元の発話情報の、音声出力部による音声出力を再開する。
請求項2に記載の発明によれば、音声対話装置は、少なくとも音量に基づいて音声出力を中断させるため、対話対象である人物の音声による質問などに対して、音声出力を中断させて迅速に応答することができる。
請求度4に記載の発明によれば、音声対話装置は、音声出力を中断させて、対話対象である人物の発話内容を音声認識した音声認識結果に応じた応答行動をするため、固定したシナリオに限定されず、自由なタイミングで対話対象と対話を行うことができる。
請求項5に記載の発明によれば、音声対話装置は、少なくとも音声認識結果に基づく回答要否判定結果に応じて応答行動を選択するため、例えば、対話対象である人物の相槌などの回答不要な音声が入力されたために音声出力を中断させた場合と、回答が必要な音声が入力されたために音声出力を中断させた場合とで、それぞれに適切な応答行動を行うため、対話対象である人物は、相槌や独り言などを誤って発声した場合でも、音声対話装置と円滑に対話することができる。
請求項7に記載の発明によれば、音声対話装置は、中断時間が長い場合は、音声出力を中断させた発話情報の先頭から音声出力を再開させ、中断時間が短い場合は、音声出力を中断させた意味のまとまりがある区切りの先頭から音声出力を再開させる。このため、再開した音声出力を聴取する人物は、中断時間が長い場合には、容易に内容を理解することができ、中断時間が短い場合には、同じ音声の繰り返しが低減されて冗長に感じることなく、かつ容易に内容を理解することができる。
請求項8に記載の発明によれば、音声対話装置は、回答要否判定結果が回答必要な場合には、音声出力を中断させた発話情報の先頭から音声出力を再開させ、回答要否判定結果が回答不要な場合には、音声出力を中断させた意味のまとまりがある区切りの先頭から音声出力を再開させる。このため、回答という比較的中断時間が長くなる応答行動の割り込み後には、発話情報の先頭から再開された音声出力を聴取する人物は、容易に内容を理解することができる。一方、所定の応答行動という比較的中断時間が短い応答行動の割り込み後には、同じ音声の繰り返しが低減されて再開された音声出力を聴取する人物は、冗長に感じることなく、かつ容易に内容を理解することができる。
請求項10に記載の発明によれば、音声対話装置は、発話情報の途中から音声出力を再開させる場合でも、係り受けによって意味のつながりがある区切りの先頭から音声出力を再開させるため、再開された音声出力を聴取する人物はさらに容易に内容を理解することができる。
まず、本発明の実施形態に係るロボットを含むロボット制御システムAの全体構成について図1を参照して説明する。
図1に示すように、ロボット制御システムAは、ロボットRと、このロボットRと無線通信によって接続された基地局1と、この基地局1とロボット専用ネットワーク2を介して接続された管理用コンピュータ3と、この管理用コンピュータ3にネットワーク4を介して接続された端末5とから構成される。
ロボットRは、管理用コンピュータ3から入力された実行命令に従ってタスクを実行するものであり、ロボットRがタスクを実行する領域として予め設定されたタスク実行エリア内に、少なくとも一台配置されている。
ここで、図1には、来訪者を会議室などの所定の場所に案内するという内容のタスク(案内タスク)を実行中のロボットRAと、荷物をある人に渡すという内容のタスク(荷物配達タスク)を実行中のロボットRBと、新たなタスクが割り当てられるまで待機中のロボットRCとが、例示されている。また、この例では、タスク実行エリア内に、3箇所のバッテリ補給エリアB1,B2,B3が設けられており、ロボットRは必要に応じてバッテリ充電(バッテリ充電タスク)を行うことができる。
基地局1は、ロボットRと管理用コンピュータ3との間のデータ交換を仲介するものである。
具体的には、基地局1は、管理用コンピュータ3から出力された実行命令をロボットRに送信するとともに、ロボットRから送信されたロボットRの状態に関するデータ(ステータス情報)やロボットRが実行命令を受信したことを示す信号(受信報告信号)を受信して、管理用コンピュータ3に出力するものである。
基地局1は、ロボットRと管理用コンピュータ3との間のデータ交換を確実に行えるようにするために、タスク実行エリア内に少なくとも一つ設けられている。
なお、タスク実行エリアが建物の数フロアに亘って設定されている場合には、フロアごとに設けられていることが好ましく、一つの基地局1では総てのタスク実行エリアをカバーできない場合には、複数の基地局1がタスク実行エリア内に設けられていることが好ましい。
図4に示すように、タスク情報データベース400には、タスクごとに割り当てられた固有の識別子であるタスクID、タスクの優先度、タスクの重要度、タスクを実行させるロボットの識別子であるロボットID、案内や運搬(荷物配達)などのタスクの内容、タスク実行エリア内におけるタスクを開始する位置(開始位置)、タスク実行エリア内におけるタスクを終了する位置(終了位置)、タスクの実行に要する時間(所要時間)、そしてタスクの開始予定時刻(開始時刻)、タスクの終了予定時刻(終了時刻)、そしてタスクの状態などが、情報項目として含まれている。
図5に示すように、タスクスケジュールテーブル500は、ロボットRに実行させるタスクの実行順位、タスク情報データベース400(図4参照)に登録されたタスクを特定するためのタスクID、タスクの優先度、タスクの内容、そしてタスクの状態を情報項目として含むテーブルである。
このタスクスケジュールテーブル500では、これら情報項目が、タスク実行エリア内に配置されたロボットRごとに整理されており、どの様なタスクが、どのような順番で各ロボットRに割り当てられているのかを把握できるようになっている。
端末5は、ネットワーク4を介して管理用コンピュータ3に接続し、管理用コンピュータ3の記憶部3aに、人物に関する情報などを登録する、もしくは登録されたこれらの情報を修正するものである。また、端末5は、ロボットRに実行させるタスクの登録や、管理用コンピュータ3において設定されるタスクスケジュールの変更や、ロボットRの動作命令の入力などを行うものである。
ロボットRは、頭部R1、腕部R2、脚部R3、胴部R4および背面格納部R5に加えて(図2参照)、これら各部R1〜R5の適所に、図6に示すように、カメラC,C、スピーカS、マイクMC,MC、画像処理部10、音声処理部20、記憶部30、主制御部40、自律移動制御部50、無線通信部60、バッテリ70、対象検知部80、および周辺状態検知部90を有する。
さらに、ロボットRは、ロボットRの向いている方向を検出するジャイロセンサSR1や、予め設定された地図上におけるロボットRの存在する位置座標を取得するためのGPS(Global Positioning System)受信器SR2を有している。
カメラ(視覚センサ)C,Cは、ロボットRの前方移動方向側の映像をデジタルデータとして取り込むことができるものであり、例えば、カラーCCD(Charge-Coupled Device)カメラが使用される。カメラC,Cは、左右に平行に並んで配置され、撮影した画像は画像処理部10に出力される。このカメラC,Cと、スピーカSおよびマイクMC,MCは、いずれも頭部R1の内部に配設される。スピーカSは、音声処理部20で音声合成された所定の音声を出力する(発話する)ことができる。
画像処理部10は、カメラC,Cが撮影した画像(撮影画像)を処理して、撮影された画像からロボットRの周囲の状況を把握するため、周囲の障害物や人物の認識を行う部分である。この画像処理部10は、ステレオ処理部11a、移動体抽出部11bおよび顔認識部11cを含んで構成される。
移動体の抽出をするために、移動体抽出部11bは、過去の数フレーム(コマ)の画像を記憶しており、最も新しいフレーム(画像)と、過去のフレーム(画像)とを比較して、パターンマッチングを行い、各画素の移動量を計算し、移動量画像を生成する。そして、視差画像と、移動量画像とから、カメラC,Cから所定の距離範囲内で、移動量の多い画素がある場合に、人物があると推定し、その所定距離範囲のみの視差画像として、移動体を抽出し、顔認識部11cへ移動体の画像を出力する。
顔認識部11cによって認識された顔の位置は、ロボットRが移動するときの情報として、また、その人とのコミュニケーションを取るため、主制御部40に出力される。
音声処理部20は、音声合成部21aと、音声入力部21bと、音声認識部21cと、音源定位部21dとを含んで構成される。
また、音声入力部21bは、変換した音声データを分析し、入力された音声データに音声(人物の音声)が含まれているかどうか、すなわち音声が存在するかどうかを検出する。さらにまた、音声入力部21bは、検出した音声の音量を算出するとともに、順次入力される音声データに、継続して音声が存在する時間を示す音声継続長を算出する。音声入力部21bは、音声の存在の検出結果、音量および音声継続長を音声分析結果として主制御部40に出力する。
(http://julius.sourceforge.jp/index.php?q=doc/cm.html参照)
また、発話長は、当該発話区間に含まれる音声フレーム数を計数し、フレーム長に乗ずることにより算出することができる。
なお、音声認識部21cは、音声入力部21bから音声データに加えて、音量および音声継続長を入力して、これらに基づいて発話毎の音量や発話長を算出するようにしてもよい。これによって音声入力部21bと重複する計算を省略することができる。
記憶部30は、例えば、一般的なハードディスク等から構成され、管理用コンピュータ3から送信された必要な情報(ローカル地図データ、発話データなど)を記憶するものである。また、記憶部30は、後記するように、主制御部40の各種動作を行うために必要な情報を記憶している。
主制御部40は、画像処理部10、音声処理部20、記憶部30、自律移動制御部50、無線通信部60、対象検知部80、および周辺状態検知部90を統括制御するものである。また、ジャイロセンサSR1、およびGPS受信器SR2が検出したデータは、主制御部40に出力され、ロボットRの行動を決定するために利用される。この主制御部40は、例えば、管理用コンピュータ3と通信を行うための制御、管理用コンピュータ3から取得したタスク実行命令に基づいて所定のタスクを実行するための制御、ロボットRを目的地に移動させるための制御、人物を識別するための制御、人物と対話するための制御を行うために、種々の判断を行ったり、各部の動作のための指令を生成したりする。
また、主制御部40は、画像処理部10、音声処理部20、対象検知部80、および周辺状態検知部90などの外部情報取得手段から入力した画像処理結果や音声認識結果などの外部状況を把握するための外部情報を、記憶部30に記憶される状況DB(状況データベース)に格納する。状況DBについては後記する。
自律移動制御部50は、主制御部40の指示に従い頭部R1、腕部R2、脚部R3および胴部R4を駆動するものである。この自律移動制御部50は、図示を省略するが、頭部R1の首関節を駆動させる首制御部、腕部R2の手の先の指関節を駆動させる手制御部、腕部R2の肩関節、肘関節、手首関節を駆動させる腕制御部、脚部R3に対して胴部R4を水平方向に回転駆動させる腰制御部、脚部R3の股関節、膝関節、足首関節を駆動させる足制御部を有している。これら首制御部、手制御部,腕制御部、腰制御部および足制御部は、頭部R1、腕部R2、脚部R3および胴部R4を駆動するアクチュエータに駆動信号を出力する。
無線通信部60は、管理用コンピュータ3とデータの送受信を行う通信装置である。無線通信部60は、公衆回線通信装置61aおよび無線通信装置61bを有する。
公衆回線通信装置61aは、携帯電話回線やPHS(Personal Handyphone System)回線などの公衆回線を利用した無線通信手段である。一方、無線通信装置61bは、IEEE802.11b規格に準拠するワイヤレスLANなどの、近距離無線通信による無線通信手段である。
無線通信部60は、管理用コンピュータ3からの接続要求に従い、公衆回線通信装置61aまたは無線通信装置61bを選択して管理用コンピュータ3とデータ通信を行う。
対象検知部80は、ロボットRの周囲にタグTを備える人物が存在するか否かを検知するものである。対象検知部80は、複数の発光部81(図6では1つのみ表示した)を備える。これら発光部81は、例えば、LEDから構成され、ロボットRの頭部R1外周に沿って前後左右などに配設される(図示は省略する)。対象検知部80は、発光部81から、各発光部81を識別する発光部IDを示す信号を含む赤外光をそれぞれ発信するとともに、この赤外光を受信したタグTから受信報告信号を受信する。いずれかの赤外光を受信したタグTは、その赤外光に含まれる発光部IDに基づいて、受信報告信号を生成するので、ロボットRは、この受信報告信号に含まれる発光部IDを参照することにより、当該ロボットRから視てどの方向にタグTが存在するかを特定することができる。また、対象検知部80は、タグTから取得した受信報告信号の電波強度に基づいて、タグTまでの距離を特定する機能を有する。したがって、対象検知部80は、受信報告信号に基づいて、タグTの位置(距離および方向)を、人物の位置として特定することができる。さらに、対象検知部80は、発光部81から赤外光を発光するだけではなく、ロボットIDを示す信号を含む電波を図示しないアンテナから発信する。これにより、この電波を受信したタグTは、赤外光を発信したロボットRを正しく特定することができる。
対象検知部80は、タグTから受信したタグ識別番号を主制御部40に出力する。
周辺状態検知部90は、ロボットRの周辺状態を検知するものであり、ジャイロセンサSR1やGPS受信器SR2によって検出された自己位置データを取得可能になっている。また、周辺状態検知部90は、探索域に向かってスリット光を照射するレーザ照射部91と、探索域に向かって赤外線を照射する赤外線照射部92と、スリット光または赤外線が照射された探索域を撮像する床面カメラ93とを有する。この周辺状態検知部90は、床面カメラ93で撮像したスリット光画像(スリット光が照射されたときの画像)を解析して路面状態を検出する。また、周辺状態検知部90は、床面カメラ93で撮像した赤外線画像(赤外線が照射されたときの画像)を解析してマークM(図2参照)を検出し、検出されたマークMの位置(座標)からマークMとロボットRとの相対的な位置関係を計算する。周辺状態検知部90は、検出した路面状態やマークMとロボットRとの相対的な位置関係などの情報を主制御部40に出力する。なお、周辺状態検知部90についての詳細は、例えば、特開2006−167844号公報に開示されている。この周辺状態検知部90は、外部情報取得手段として機能することができ、主制御部40に出力された路面状態や相対的な位置関係情報は、外部情報として主制御部40によって記憶部30に記憶される。
次に、図7を参照(適宜図6参照)してロボットRの主制御部40の構成を説明する。
主制御部40は、静止障害物統合部41と、オブジェクトデータ統合部42と、行動パターン部43と、身振り統合部44と、内部状態検出部45と、行動計画管理部46とを備えている。
なお、ルールDB記憶手段33が記憶する動作DBについては後記する。
なお、発話情報記憶手段34が記憶する発話データ(発話情報)の構成については後記する。
この状況DBの具体例については後記する。
なお、内部状態記憶手段37に記憶される中断位置情報および再開位置情報については後記する。
局所回避モジュールは、歩行中に障害物が検知されたときに、静止障害物統合部41で統合された障害物情報に基づいて、障害物を回避する迂回経路を探索するものである。
案内モジュールは、例えば、タスク実行エリア内の案内開始地点に来訪した来訪客を案内領域301(図3参照)の受付305にいる受付スタッフのもとへ案内するタスクを実行するものである。
なお、本実施形態では、応答行動制御手段47は、ロボットRが発話を含むタスクを実行する際に行動パターン部43によって生成され、音声入力の状況や入力された音声の音声認識処理の状況などを、例えば数ミリ秒程度の周期で常時監視して、その時々の状況に応じた行動を実行するものである。
次に、図8を参照(適宜図6および図7参照)して、応答行動制御手段47の詳細な構成について説明する。
応答行動制御手段47は、図8に示すように、即時中断判定手段471と、回答要否判定手段472と、応答行動決定手段473と、行動コマンド実行管理手段474とを備え、さらに応答行動決定手段473は、発話中断処理手段473aと、再開位置決定手段473bと、応答行動選択手段473cとを備えて構成されている。
ルールDBは、状況に応じた発話および動作のうちの少なくとも1つの実行命令を含むルールを複数格納したものである。
図9に示すように、ルールDB900は、項目として、ルールID、ルール内容、動作IDを有している。
ルールIDおよび動作IDは、それぞれ各ルールおよび各動作を識別するための識別子である。ルール内容は、動作IDで示される動作を実行する状況(条件)を示したものである。例えば、ルールID=「1」で示されるルールは、「大きな音がした(=マイククリップ)」場合に、「びっくりする」動作である動作ID=「4」で示される動作を実行するものである。ここで、動作IDで示される動作内容は、図10に示す動作DBに定められている。
また、ルールID=「7」で示されるルールは、回答不要(または回答不能)な音声入力があったときに、首を傾げて「ん?」と発話するという動作ID=「11」で定められた動作を行うものである。
なお、ルールID=「X」のルールは、ルール内容として「何もしない」ことを示す特別ルールである。
例えば、動作ID=「5」は、頭、腰および腕を使用することで、「顔と体とをターゲットに向けて手を挙げる」動作を行うことを示す。
また、動作ID=「11」は、首(頭)を傾けながら、「ん?」と発話する動作を行うことを示し、入力した音声に対して回答不要(または回答不能)と判定したときに行う応答行動として選択される動作である。
また、動作ID=「9」,「10」については、詳細は図示していないが、音声合成部21aによって合成する音声の音量ごとに、異なる動作IDを付与した。なお、図10に示した動作以外に、例えば、「腰をひねる」、「腕をぶらぶら振る」、「手指を閉じたり開いたりする」、「把持した旗等の物品を振る」等の動作を含んでもよい。
記憶部30に備えられた状況DB記憶手段36は、ロボットR(図6参照)の周囲状況である外部情報のデータベースである状況DB(状況データベース)と、平均音量DB(平均音量データベース)とを記憶している。
状況DB記憶手段36は、内部状態記憶手段37とともに、ロボットR(図6参照)が応答行動を制御するために必要な内外の状況に関する情報を記憶するための応答状況記憶手段35を構成している。
図11に示すように、本実施形態における状況DB1100は、項目として、状況IDと、状況内容と、現在表示とを有している。ここで、状況IDは、各状況を識別するための識別子であり、状況内容は、「画像異常」、「誰もいない」などの状況を示している。また、現在表示は、現在の状況を示すものである。現在表示が「on/off」で示しされるものは、「on」または「off」の状態をとり、「on」が状況内容に該当する場合を示し、「off」が状況内容に該当しない場合を示す。例えば、状況ID=「4」では、「小さな音がした」場合の現在表示が「on」となり、それ以外の音がしないか大きな音がした場合は現在表示が「off」となる。
さらにまた、状況ID=「12」の「音声認識結果」のように、現在表示が「構造データ」となっているものは、状況が単一の数値ではなく複数の数値などによって構成されて示されることを示す。
この平均音量は、個々の人物ごとに、予め種々の場面での音声を採集して、その平均音量を算出して平均音量DBに格納しておく。また、入力された音声の音量をタグ識別番号に対応付けて、逐次に音量履歴として記憶しておき、音量履歴からこれまで蓄積された音量の平均を算出して平均音量として用いるようにしてもよい。
記憶部30に備えられた発話情報記憶手段34は、前記したように発話データ(発話情報)を記憶している。
ここで、発話データの構成の具体例について図12を参照して説明する。
本実施形態における発話データは、図12(a)に示すように、例えば発話文100のように、文を単位として構成され、区切りK1〜K3に分割された構造を有するものである。そして、発話の実行制御は、区切りK1〜K3単位で行われる。
なお、発話データは、挨拶文のような定型文や製品説明のシナリオにおける説明文のように予め作成されて発話情報記憶手段36に記憶されているものと、対話状況に応じて適宜に単語を組み合わせてロボットR(図6参照)が作成するものとが含まれる。
本実施形態では、意味まとまりによって定められる区切りK1〜K3として、係り受けを考慮した文節のまとまり(文節の集合体)を単位とする。しかし、これに限定されるものではなく、単語を最小の単位とすることができる。この他に、例えば、文節を単位とした区切りに分割してもよく、文を単位とした区切りに分割してもよい。また、区切りの単位を、例えば「係り受けを考慮した文節」のみとするのではなく、意味内容のまとまりや長さを考慮して、文節、単語、文などを単位とする区切りを混在させるようにしてもよい。
図12(a)に示した例では、「これまで28の都道府県で活動を行ってきました。」が1つの発話文100である。これを単語(品詞)に分割すると、「これまで」「28」「の」「都道府県」「で」「活動」「を」「行って」「き」「まし」「た」「。」となる。
図12(b)に示した発話データ110は、項目として、発話文100を識別するための識別子である発話文IDと、区切り数と、区切り番号ごとの発話内容とを有している。
さらにまた、区切りを予め定めずに、発話時に発話文100を適宜に構成し、構成した発話文100を形態素解析して自動的に区切りK1〜K3に分割するようにしてもよい。
記憶部30に備えられた内部状態記憶手段37は、ロボットR(図6参照)の内部状態を示す情報として、発話状態に関する情報である中断位置情報および再開位置情報を含んで記憶している。
ここで、中断位置情報および再開位置情報の具体例について図13を参照(適宜図12参照)して説明する。
図13(a)に示すように、中断位置情報120は、項目として、中断した発話データを識別するための発話文IDと、発話文100において発話が中断された位置を示す中断位置とを有する。中断位置は、発話文100を構成する区切り単位で識別される。このため、中断が発生した区切りK1〜K3に対応する区切り番号が設定される。例えば、図13(a)に示した例では、区切り番号=「2」に対応する区切りK2の途中または区切り末で発話が中断されたことを示す。
即時中断判定手段471は、ロボットR(図6参照)が発話中に音声入力があったときに、その発話を即時中断するかどうかを、音量や音声継続長などの入力された音声の状況に基づいて判定する手段である。
これは、一定以上の音量による発話は、回答が必要である可能性が高いからである。
これによって、タグT(図6参照)を装着していない人物であっても、2回目以降の発話では、平均音量を参照することができる。
また、ロボットR(図6参照)の近傍に複数の人物がいて、各人物のタグ識別番号の認識が困難な場合でも、音源定位部21d(図6参照)から出力される音源定位情報に基づいて、発話を行った人物のオブジェクトデータを特定することができる。そして、特定したオブジェクトデータに対応付けてこの発話の音量を状況DB記憶手段36にこの人物の音量の履歴として記憶しておくことにより、一度発話を行った人物に対しては、タグ識別番号を特定できなくとも、2度目以降の発話の際にはこの人物の平均音量を参照することができる。
回答要否判定手段472は、状況DB記憶手段36に記憶されている状況DBを定期的に参照し、音声認識部21cから音声認識結果が出力されたかどうかを監視する。回答要否判定手段472は、音声認識部21cから音声認識結果が出力されたことを検知すると、状況DB記憶手段36から、状況DBに格納されている音声認識結果である単語、単語信頼度、音量および発話長と、対象検知部80が検知した対話対象である人物を特定するタグ識別番号とを入力する。また、回答要否判定手段472は、状況DB記憶手段36から、このタグ識別番号に対応付けられて平均音量DBに格納されている平均音量を入力する。回答要否判定手段472は、音声認識結果を含むこれらの情報に基づいて、入力された音声に対して回答が必要かどうかを判定し、判定した結果である回答要否判定結果を再開位置決定手段473bおよび応答行動選択手段473cに出力する。
なお、回答要否判定手段472の詳細な構成については後記する。
一方、即時中断判定結果が「即時中断しない」との判定結果の場合は、発話中断処理手段473aは、音声が入力されたときに発話中の区切りK1〜K3(図12参照)の発話が完了したところ(区切り末)で発話を中断させることを示す中断コマンドである区切り末中断コマンドを行動コマンド実行管理手段474に出力して、区切り末での発話の中断を実行させる。
なお、中断すべき発話が音声出力以外の身振りなどの動作を伴うときには、発話とともに動作も中断させる。また、以下の説明において発話を中断させるときも、同様に発話の中断とともに動作も中断させるものとする。
これによって、ロボットR(図6参照)は、音声認識結果に基づいて迅速かつ適切に応答することができる。
応答行動選択手段473cは、回答要否判定結果が「回答必要」の場合には、音声認識結果である単語(文字情報)を解析して、この解析結果に応じた回答内容としての行動内容を、ルールDB記憶手段33に記憶されたシナリオの中から選択し、選択した行動内容を行動コマンド実行管理手段474に出力して実行させる。
また、行動コマンド実行管理手段474は、音声合成部21aおよび身振り統合部44から、それぞれに出力した発話データおよび動作内容の実行の終了を通知する発話終了信号および動作終了信号を入力する。
行動コマンド実行管理手段474は、音声合成部21aおよび身振り統合部44に対して中断コマンドを出力することによって、発話および発話に伴う動作を即時中断させることができる。また、行動コマンド実行管理手段474は、現在発話中および動作中の区切りに対しては中断コマンドを出力せず、次の区切りに対応する発話データおよび動作内容の音声合成部21aおよび身振り統合部44への出力を中止することにより、現在発話中および動作中の区切り末で発話および動作を中断させることができる。
このように、行動コマンド実行管理手段474は、発話および動作の実行および中断を区切り単位で管理することで、発話および動作の中断処理を実行した場合の中断位置を認識することができる。
例えば、再開位置決定手段473bは回答要否判定結果に基づいて、回答要否判定結果が「回答必要」の場合は「先頭」を、回答要否判定結果が「回答不要」の場合は「中断位置」を中断された発話の再開位置の条件として決定し、決定した再開位置の条件を応答行動選択手段473cに出力する。応答行動選択手段473cは、再開位置決定手段473bから入力した再開位置の条件を示す「先頭」または「中断位置」を再開コマンドに付加して行動コマンド実行管理手段474に出力するようにする。そして、行動コマンド実行管理手段474は、再開コマンドに付加された再開位置の条件が「先頭」である場合は、内部状態記憶手段37に記憶されている中断位置情報に設定されている発話文ID(図13(a)参照)の発話データの先頭の区切りから発話を再開し、再開コマンドに付加された再開位置の条件が「中断位置」である場合は、内部状態記憶手段37に記憶されている中断位置情報で設定されている発話文ID(図13(a)参照)の発話データの中断位置の区切りから発話を再開するようにすればよい。この場合は、再開位置情報の作成は不要である。
図14に示すように、回答要否判定手段472は、音量係数算出手段472aと、発話長係数算出手段472bと、単語信頼度平均算出手段472cと、判定閾値設定手段472dと、単語信頼度判定手段472eと、回答不要語判定手段472fと、総合判定手段472gとを備えて構成されている。
音量係数算出手段472aは、状況DB記憶手段36から、状況DBに格納されている音声認識部21cが音声認識結果の一部として出力した音量と、対象検知部80が検知したタグ識別番号とを入力する。また、音量係数算出手段472aは、入力したタグ識別番号で特定される人物を、対話対象である入力された音声の発話者とみなして、状況DB記憶手段36から、タグ識別番号に対応付られて平均音量DBに格納されているこの対話対象の平均音量を入力する。そして、この音量と平均音量とから音量係数を算出し、算出した音量係数を単語信頼度判定手段472eに出力する。
ロボットR(図6参照)が発話中に対話対象となる人物が発話する場合、音量が小さい場合は回答が不要な相槌や独り言などであることが多く、音量が大きい場合は回答が必要な質問や要求などであることが多い。そこで、本実施形態では、単語信頼度平均算出手段472cが算出する平均スコアに基づいて回答の要否を判定する際に、音量の大小で平均スコアを補正するための音量係数を、式(1−1)によって算出するものである。
(音量係数)=(音量)/(音量基準値) ・・・式(1−1)
なお、音量の単位は[dB(デシベル)]を用いることができるが、これに限定されるものではない。
(音量係数)={6−((音量基準値)−(音量))}/6 ・・・式(1−2)
発話長係数算出手段472bは、状況DB記憶手段36から、状況DBに格納されている音声認識部21cが出力した音声認識の対象となった一連の音声の継続時間である発話長を入力する。そして、発話長係数算出手段472bは、この発話長と予め定められた基準発話長とから発話長係数を算出し、算出した発話長係数を単語信頼度判定手段472eに出力する。
ロボットR(図6参照)が発話中に対話対象となる人物が発話する場合、発話長が短い場合は回答が不要な相槌や独り言などであることが多く、発話長が長い場合は回答が必要な質問や要求などであることが多い。そこで、本実施形態では、前記した音量係数とともに、単語信頼度平均算出手段472cが算出する平均スコアに基づいて回答の要否を判定する際に、発話長の長短で平均スコアを補正するための発話長係数を、式(2)によって算出するものである。
(発話長係数)=(発話長)/(基準発話長) ・・・式(2)
単語信頼度平均算出手段472cは、状況DB記憶手段36から、状況DBに格納されている音声認識部21cが音声認識結果として出力した一連の音声に含まれるすべての単語についての単語信頼度を入力し、これらの単語ごとに算出された単語信頼度の平均である平均スコアを、式(3)によって算出する。
(平均スコア)=Σ(単語信頼度)/(単語数) ・・・式(3)
単語信頼度平均算出手段472cは、算出した平均スコアを単語信頼度判定手段472eに出力する。
音声認識部21cは、マイクMC,MC(図6参照)を介して入力された対話対象の一連の音声を音声認識し、この一連の音声に含まれる単語とともに、単語ごとに音声認識の信頼度示す単語信頼度を算出する。
そこで、本実施形態では、平均スコアの大きさに基づいて回答の要否を判定するものである。
判定閾値設定手段472dは、単語信頼度判定手段472eにおいて、平均スコア、音量係数および発話長係数に基づく回答の要否判定を行うための判定閾値を設定する手段である。判定閾値設定手段472dは、予め定められた判定閾値を単語信頼度判定手段472eに出力する。
また、平均スコアに基づいて回答要否を判定する際に、平均スコアに前記した音量係数や発話長係数を乗じた評価値に基づいて回答要否を判定する場合には、判定閾値を定めるための実験データとして、前記した平均スコアに替えて、平均スコアに音量係数や発話長係数を乗じた評価値を用いるようにすればよい。これによって、音量係数や発話長係数を用いる場合の判定閾値を適切に定めることができる。
単語信頼度判定手段472eは、単語信頼度を利用して回答要否の判定を行う手段である。
単語信頼度判定手段472eは、音量係数算出手段472aから入力した音量係数と、発話長係数算出手段472bから入力した発話長係数と、単語信頼度平均算出手段472cから入力した平均スコアと、判定閾値設定手段472dから入力した判定閾値とに基づいて回答要否の判定を行い、単語信頼度を利用した判定結果である単語信頼度判定結果を総合判定手段472gに出力する。
(評価値)=(平均スコア)×(音量係数)×(発話長係数) ・・・式(4)
なお、本実施形態では、評価値として平均スコアに音量係数と発話長係数とを乗じて算出して用いるようにしたが、これに限定されるものではなく、平均スコアをそのまま用いてもよく、音量係数のみ、または発話長係数のみを乗じて算出して用いるようにしてもよい。この場合、評価値の算出方法に応じた判定閾値を判定閾値設定手段472dに設定するようにすればよい。
また、本実施形態では、単語信頼度の平均スコアに基づいて、回答要否の判定を行うようにしたが、これに限定されるものではなく、音声認識の結果の信頼度を示す他の評価値(スコア)に基づいて回答要否の判定を行うようにしてもよい。
回答不要語判定手段472fは、状況DB記憶手段36から、状況DBに格納されている音声認識部21cが出力した単語を入力し、入力した単語が予め定められた回答不要語に該当するかどうかを記憶部30(図6参照)に記憶されている回答不要語DB(不図示)を検索して判定する。回答不要語判定手段472fは、判定した結果である回答不要語判定結果を総合判定手段472gに出力する。
また、対話履歴や対話対象である人物の位置などを条件として、発話の中断を判定するようにしてもよい。
そして、これらの外部情報に基づく状況の発生に対して発話を中断した後、中断の原因となった状況に応答し、この応答に要した時間に応じて中断した元の発話の再開位置を決定するようにしてもよい。
さらにまた、中断の原因となった状況に対する応答に要した時間に替えて、またはこれに加えて、前記した種々の外部情報を参照して発話を再開するときの再開位置の決定をするようにしてもよい。
次に、図6に示したロボットRの動作について、主として応答行動制御手段47の動作を中心に図17を参照(適宜図6から図8参照)して説明する。
応答行動制御手段47は、ロボットRが音声合成部21aを介してスピーカSから発話(音声出力)を実行する場合において、外部情報として、マイクMC,MCを介して音声入力部21bに音声の入力(人物の音声の入力)があったときに、この入力された音声に対して、発話の中断、音声への回答、発話の再開などの応答行動を行う必要があるときに行動パターン部43によって予め起動される。応答行動制御手段47は、稼働中は、例えば数ミリ秒程度の周期で、図17に示す処理を繰り返し実行するものである。
また、状況DB記憶手段36に記憶されている状況DBに格納される音声分析結果や音声認識結果などの外部情報は、音声入力部21bや音声認識部21cなどの外部情報取得手段によって時々刻々に変化する。応答行動制御手段47は、時々刻々に変化する状況DBに格納された外部情報を、前記したように周期的に参照して、適宜に外部情報に応じた応答行動を実行するものである。
そして、応答行動制御手段47は、行動コマンド実行管理手段474によって、発話の中断位置を示す中断位置情報を作成して内部状態記憶手段37に記憶する(ステップS23)。
なお、ステップS23において、発話データの区切りの途中で即時中断された場合は、その区切りを中断位置とし、発話データの区切り末で中断された場合は、区切り末まで発話されたこの区切りを中断位置として示す中断位置情報が作成される。
例えば、音声認識された質問内容が「燃費は?」であったとすると、応答行動制御手段47は、応答行動選択手段473cによって、燃費に関する説明のためのシナリオを行動内容としてルールDB記憶手段33から選択する。また、回答が予め定められた所定の時間よりも長く要する場合には、シナリオの最後に、例えば、「元の説明に戻ります。」のように、中断された発話に戻ることを示す発話を行うようにするのが望ましい。これによって、対話対象である人物にストレスを与えることなく、円滑に元の発話を再開させることができる。
ステップS18で即時中断する行動を選択すると、応答行動制御手段47は、選択した行動である発話の即時中断を実行するために、発話中断処理手段473aによって、即時に発話の中断を指示する即時中断コマンドを行動コマンド実行管理手段474に出力し、さらに行動コマンド実行管理手段474によって中断コマンドを音声合成部21aおよび身振り統合部44に出力する。これによって、発話および発話に伴う動作が即時中断される(ステップS15)。
ステップS19で区切り末で発話を中断する行動を選択すると、応答行動制御手段47は、選択した行動である発話の区切り末での発話の中断を実行するために、発話中断処理手段473aによって、区切り末での発話の中断を指示する区切り末中断コマンドを行動コマンド実行管理手段474に出力する。このとき、応答行動制御手段47は、行動コマンド実行管理手段474によって音声合成部21aおよび身振り統合部44には中断コマンドは出力せず、かつ次の区切りの発話データおよび動作内容の音声合成部21aおよび身振り統合部44への出力を中止する。これによって、現在発話中の区切りの発話および発話に伴う動作が終了した時点で発話および発話に伴う動作が中断される(ステップS15)。
応答行動制御手段47は、選択した行動の実行である待機をする(ステップS15)。なお、待機とは、次の区切りの発話データが残っている場合でも、行動コマンド実行管理手段474によって次の区切りの発話データおよび動作内容の出力をせず、積極的には処理を実行しないことを意味する。
応答行動制御手段47は、選択した行動である発話の継続を実行する(ステップS15)。なお、発話の継続とは、行動コマンド実行管理手段474による中断コマンドの出力をせず、積極的には処理を実行しないことを意味する。
ここで、回答要否判定結果は「回答不要」であるから、再開位置決定手段473bは、再開位置として、中断された元の発話データにおいて、発話が中断された区切りから発話を再開するように再開位置情報を作成する。
ここで、回答要否判定結果は「回答必要」であるから、再開位置決定手段473bは、再開位置として、中断された元の発話データにおいて、先頭の区切りのから発話を再開するように再開位置情報を作成する。
この場合の、応答行動制御手段47の処理は、再開位置情報の内容が異なる以外は、ステップS36と同様であるから、詳細な説明は省略する。
本実施形態では、音声対話装置を、2足歩行可能な自律移動型のコミュニケーションロボットとして説明したが、これに限定されず、車輪で移動する自律移動型ロボットへの応用も可能である。また、脚部などの移動手段を有さない据え置き型や携帯型の音声対話装置としてもよく、カーナビゲーション装置のように、自動車などの移動体に搭載可能な音声対話装置としてもよい。さらに、頭部や腕部のような可動部を有さない音声対話装置としてもよい。そして可動部の替わりに画像表示手段を備えている場合には、例えば、首を傾げる動作に替えて、首を傾げる動作を行う人物の映像を画像表示手段に表示するようにしてもよく、単に「?」マークを画像表示手段に大きく表示するようにしてもよい。
R ロボット(コミュニケーションロボット)(音声対話装置)
R1 頭部
R2 腕部
R3 脚部
R4 胴体部
R5 背面格納部
1 基地局
2 ロボット専用ネットワーク
3 管理用コンピュータ
3a 記憶部
4 ネットワーク
5 端末
10 画像処理部(外部情報取得手段)
20 音声処理部
21a 音声合成部(音声出力部)
21b 音声入力部(外部情報取得手段)
21c 音声認識部(外部情報取得手段)
21d 音源定位部(外部情報取得手段)
30 記憶部
31 オブジェクトデータ記憶手段
32 ローカル地図データ記憶手段
33 ルールDB記憶手段
34 発話情報記憶手段
35 応答状況記憶手段
36 状況DB記憶手段
37 内部状態記憶手段
40 主制御部
41 静止障害物統合部
42 オブジェクトデータ統合部
43 行動パターン部
44 身振り統合部
45 内部状態検出部
46 行動計画管理部
47 応答行動制御手段
50 自律移動制御部
60 無線通信部
70 バッテリ
80 対象検知部(外部情報取得手段)
90 周辺状態検知部(外部情報取得手段)
100 発話文
110 発話データ(発話情報)
120 中断位置情報
130 再開位置情報
471 即時中断判定手段
472 回答要否判定手段
472a 音量係数算出手段
472b 発話長係数算出手段
472c 単語信頼度平均算出手段
472d 判定閾値設定手段
472e 単語信頼度判定手段
472f 回答不要語判定手段
472g 総合判定手段
473 応答行動決定手段
473a 発話中断処理手段
473b 再開位置決定手段
473c 応答行動選択手段
474 行動コマンド実行管理手段
C カメラ
K1、K2、K3 区切り
MC マイク
S スピーカ
SR1 ジャイロセンサ
SR2 GPS受信器
Claims (10)
- 周囲状況としての外部情報を取得する外部情報取得手段と、
発話情報に基づいて音声出力する音声出力部と、
前記音声出力部による前記発話情報に基づく音声出力を中断させ、前記中断に対する応答行動を選択し、前記選択した応答行動を実行した後に前記中断させた前記発話情報に基づく音声出力を再開させる応答行動制御手段と、
を備えた音声対話装置であって、
前記応答行動制御手段は、
前記外部情報取得手段が取得した外部情報に基づいて前記音声出力部による前記発話情報に基づく音声出力を中断させる音声出力中断処理手段と、
前記外部情報に基づいて前記応答行動を選択する応答行動選択手段と、
前記応答行動の実行状況に応じて、前記発話情報における音声出力を再開する位置である再開位置を決定する再開位置決定手段と、
を有することを特徴とする音声対話装置。 - 前記外部情報取得手段は、入力された音声を分析して少なくとも音量を含む音声分析結果を前記外部情報として出力する音声入力部を少なくとも備え、
前記音声出力中断処理手段は、少なくとも前記音声入力部が出力した前記音声分析結果に基づいて前記音声出力部による音声出力を中断させることを特徴とする請求項1に記載の音声対話装置。 - 前記音声出力中断処理手段は、前記外部情報に基づいて、前記音声出力部による前記発話情報に基づく音声出力を即時に中断させるか、または前記発話情報における意味のまとまりによって定められる区切りであって、前記音声出力部により音声出力中の前記区切りの末尾で前記音声出力部による音声出力を中断させるかを決定することを特徴とする請求項1または請求項2に記載の音声対話装置。
- 前記外部情報取得手段は、入力された音声を音声認識して少なくとも単語を含む音声認識結果を前記外部情報として出力する音声認識部をさらに備え、
前記応答行動選択手段は、少なくとも前記音声認識結果を含む前記外部情報に基づいて応答行動の内容を選択することを特徴とする請求項1ないし請求項3の何れか一項に記載の音声対話装置。 - 前記応答行動制御手段は、少なくとも前記音声認識結果に基づいて、当該音声認識された入力音声に対して回答する必要があるか不要かを判定する回答要否判定手段をさらに有し、
前記応答行動選択手段は、前記回答要否判定手段による判定結果である回答要否判定結果が回答必要の場合には、前記応答行動として前記音声認識結果に対する回答を行うことを選択し、前記回答要否判定結果が回答不要の場合には、前記応答行動として予め定められた所定の発話を含む所定の応答行動を行うことを選択することを特徴とする請求項4に記載の音声対話装置。 - 前記再開位置決定手段は、少なくとも前記応答行動を実行するために前記音声出力部による音声出力が中断された時間の長さである中断時間長に基づいて前記再開位置を決定することを特徴とする請求項1ないし請求項5の何れか一項に記載の音声対話装置。
- 前記再開位置決定手段は、前記中断時間長が、予め定められた所定の閾値を超える場合には、前記音声出力部による音声出力が中断された発話情報における先頭を前記再開位置として決定し、前記中断時間長が前記所定の閾値以下の場合には、意味のまとまりによって定められる区切りの先頭であって前記音声出力部による音声出力が中断された発話情報における中断位置の直前の前記区切りの先頭を前記再開位置として決定することを特徴とする請求項6に記載の音声対話装置。
- 前記再開位置決定手段は、前記回答要否判定結果が回答必要の場合には、前記音声出力部による音声出力が中断された発話情報における先頭を前記再開位置として決定し、前記回答要否判定結果が回答不要の場合には、意味のまとまりによって定められる少なくとも1つの単語を含んで構成される区切りの先頭であって前記音声出力部による音声出力が中断された発話情報における中断位置の直前の前記区切りの先頭を前記再開位置として決定することを特徴とする請求項5に記載の音声対話装置。
- 前記区切りは、1つまたは複数の文節によって構成されることを特徴とする請求項7または請求項8に記載の音声対話装置。
- 前記区切りは、係り受けによって意味のまとまりがある1つまたは複数の文節によって構成されることを特徴とする請求項9に記載の音声対話装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010095770A JP5405381B2 (ja) | 2010-04-19 | 2010-04-19 | 音声対話装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010095770A JP5405381B2 (ja) | 2010-04-19 | 2010-04-19 | 音声対話装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011227236A true JP2011227236A (ja) | 2011-11-10 |
JP5405381B2 JP5405381B2 (ja) | 2014-02-05 |
Family
ID=45042648
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010095770A Expired - Fee Related JP5405381B2 (ja) | 2010-04-19 | 2010-04-19 | 音声対話装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5405381B2 (ja) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014077969A (ja) * | 2012-10-12 | 2014-05-01 | Honda Motor Co Ltd | 対話システム及び対話システム向け発話の判別方法 |
JP2015018344A (ja) * | 2013-07-09 | 2015-01-29 | シャープ株式会社 | 再生装置、再生装置の制御方法、および、制御プログラム |
JP2015111253A (ja) * | 2013-10-31 | 2015-06-18 | シャープ株式会社 | サーバ、発話制御方法、発話装置、発話システムおよびプログラム |
JP2015152868A (ja) * | 2014-02-18 | 2015-08-24 | シャープ株式会社 | 情報処理装置 |
JP2016208491A (ja) * | 2015-04-16 | 2016-12-08 | パナソニックIpマネジメント株式会社 | 情報通知方法及び音声出力装置 |
JP2017215639A (ja) * | 2016-05-30 | 2017-12-07 | シャープ株式会社 | ネットワークシステム、音声出力方法、サーバおよび電気機器 |
WO2019026360A1 (ja) | 2017-07-31 | 2019-02-07 | ソニー株式会社 | 情報処理装置および情報処理方法 |
KR20190071953A (ko) * | 2017-12-15 | 2019-06-25 | 한국전자통신연구원 | 발화 정지 시점을 고려한 발화 제어 방법 및 이를 위한 장치 |
JP2020008635A (ja) * | 2018-07-04 | 2020-01-16 | 株式会社日立製作所 | 音声対話システム、音声対話装置および音声対話方法 |
CN111226125A (zh) * | 2017-10-16 | 2020-06-02 | 三菱重工制冷空调系统株式会社 | 位置推定装置、空调系统、位置推定方法以及程序 |
CN111312229A (zh) * | 2018-11-26 | 2020-06-19 | 夏普株式会社 | 信息处理装置、信息处理方法以及记录介质 |
CN111312242A (zh) * | 2020-02-13 | 2020-06-19 | 上海凯岸信息科技有限公司 | 一种不影响对话管理的意图打断智能语音机器人方案 |
CN111583923A (zh) * | 2020-04-28 | 2020-08-25 | 北京小米松果电子有限公司 | 信息控制方法及装置、存储介质 |
WO2021071271A1 (en) * | 2019-10-10 | 2021-04-15 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
CN113076394A (zh) * | 2021-03-25 | 2021-07-06 | 浙江天畅智链科技有限公司 | 一种交互机器人 |
CN113450788A (zh) * | 2020-03-26 | 2021-09-28 | 本田技研工业株式会社 | 声音输出的控制方法和声音输出控制装置 |
WO2022060970A1 (en) * | 2020-09-21 | 2022-03-24 | Amazon Technologies, Inc. | Dialog management for multiple users |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220037299A (ko) | 2020-09-17 | 2022-03-24 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6240577A (ja) * | 1985-08-16 | 1987-02-21 | Toshiba Corp | 音声対話装置 |
JPS62105198A (ja) * | 1985-10-31 | 1987-05-15 | 富士通株式会社 | 音声出力制御方式 |
JPS6395532A (ja) * | 1986-10-13 | 1988-04-26 | Nippon Telegr & Teleph Corp <Ntt> | 音声ガイダンス出力制御方法 |
JPH05323993A (ja) * | 1992-03-16 | 1993-12-07 | Toshiba Corp | 音声対話システム |
JP2002169750A (ja) * | 2000-11-30 | 2002-06-14 | Nec Corp | ブラウザ搭載装置 |
JP2002278575A (ja) * | 2001-03-22 | 2002-09-27 | Sony Corp | 音声出力装置および音声出力方法、並びにプログラムおよび記録媒体 |
JP2003302991A (ja) * | 2002-04-12 | 2003-10-24 | Brother Ind Ltd | 文章読み上げ装置、文章読み上げ方法、及びプログラム |
JP2004004953A (ja) * | 2003-07-30 | 2004-01-08 | Matsushita Electric Ind Co Ltd | 音声合成装置および音声合成方法 |
JP2007206888A (ja) * | 2006-01-31 | 2007-08-16 | Toyota Central Res & Dev Lab Inc | 応答生成装置、方法及びプログラム |
JP2008051883A (ja) * | 2006-08-22 | 2008-03-06 | Canon Inc | 音声合成制御方法および装置 |
-
2010
- 2010-04-19 JP JP2010095770A patent/JP5405381B2/ja not_active Expired - Fee Related
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6240577A (ja) * | 1985-08-16 | 1987-02-21 | Toshiba Corp | 音声対話装置 |
JPS62105198A (ja) * | 1985-10-31 | 1987-05-15 | 富士通株式会社 | 音声出力制御方式 |
JPS6395532A (ja) * | 1986-10-13 | 1988-04-26 | Nippon Telegr & Teleph Corp <Ntt> | 音声ガイダンス出力制御方法 |
JPH05323993A (ja) * | 1992-03-16 | 1993-12-07 | Toshiba Corp | 音声対話システム |
JP2002169750A (ja) * | 2000-11-30 | 2002-06-14 | Nec Corp | ブラウザ搭載装置 |
JP2002278575A (ja) * | 2001-03-22 | 2002-09-27 | Sony Corp | 音声出力装置および音声出力方法、並びにプログラムおよび記録媒体 |
JP2003302991A (ja) * | 2002-04-12 | 2003-10-24 | Brother Ind Ltd | 文章読み上げ装置、文章読み上げ方法、及びプログラム |
JP2004004953A (ja) * | 2003-07-30 | 2004-01-08 | Matsushita Electric Ind Co Ltd | 音声合成装置および音声合成方法 |
JP2007206888A (ja) * | 2006-01-31 | 2007-08-16 | Toyota Central Res & Dev Lab Inc | 応答生成装置、方法及びプログラム |
JP2008051883A (ja) * | 2006-08-22 | 2008-03-06 | Canon Inc | 音声合成制御方法および装置 |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014077969A (ja) * | 2012-10-12 | 2014-05-01 | Honda Motor Co Ltd | 対話システム及び対話システム向け発話の判別方法 |
JP2015018344A (ja) * | 2013-07-09 | 2015-01-29 | シャープ株式会社 | 再生装置、再生装置の制御方法、および、制御プログラム |
JP2015111253A (ja) * | 2013-10-31 | 2015-06-18 | シャープ株式会社 | サーバ、発話制御方法、発話装置、発話システムおよびプログラム |
JP2015152868A (ja) * | 2014-02-18 | 2015-08-24 | シャープ株式会社 | 情報処理装置 |
WO2015125549A1 (ja) * | 2014-02-18 | 2015-08-27 | シャープ株式会社 | 情報処理装置 |
JP2016208491A (ja) * | 2015-04-16 | 2016-12-08 | パナソニックIpマネジメント株式会社 | 情報通知方法及び音声出力装置 |
JP2017215639A (ja) * | 2016-05-30 | 2017-12-07 | シャープ株式会社 | ネットワークシステム、音声出力方法、サーバおよび電気機器 |
WO2019026360A1 (ja) | 2017-07-31 | 2019-02-07 | ソニー株式会社 | 情報処理装置および情報処理方法 |
JPWO2019026360A1 (ja) * | 2017-07-31 | 2020-05-28 | ソニー株式会社 | 情報処理装置および情報処理方法 |
CN111226125A (zh) * | 2017-10-16 | 2020-06-02 | 三菱重工制冷空调系统株式会社 | 位置推定装置、空调系统、位置推定方法以及程序 |
CN111226125B (zh) * | 2017-10-16 | 2023-08-22 | 三菱重工制冷空调系统株式会社 | 空调系统和空调控制方法 |
KR20190071953A (ko) * | 2017-12-15 | 2019-06-25 | 한국전자통신연구원 | 발화 정지 시점을 고려한 발화 제어 방법 및 이를 위한 장치 |
KR102170155B1 (ko) * | 2017-12-15 | 2020-10-28 | 한국전자통신연구원 | 발화 정지 시점을 고려한 발화 제어 방법 및 이를 위한 장치 |
JP2020008635A (ja) * | 2018-07-04 | 2020-01-16 | 株式会社日立製作所 | 音声対話システム、音声対話装置および音声対話方法 |
JP7068077B2 (ja) | 2018-07-04 | 2022-05-16 | 株式会社日立製作所 | 音声対話システム、音声対話装置および音声対話方法 |
CN111312229A (zh) * | 2018-11-26 | 2020-06-19 | 夏普株式会社 | 信息处理装置、信息处理方法以及记录介质 |
WO2021071271A1 (en) * | 2019-10-10 | 2021-04-15 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
CN111312242A (zh) * | 2020-02-13 | 2020-06-19 | 上海凯岸信息科技有限公司 | 一种不影响对话管理的意图打断智能语音机器人方案 |
CN113450788A (zh) * | 2020-03-26 | 2021-09-28 | 本田技研工业株式会社 | 声音输出的控制方法和声音输出控制装置 |
CN111583923A (zh) * | 2020-04-28 | 2020-08-25 | 北京小米松果电子有限公司 | 信息控制方法及装置、存储介质 |
CN111583923B (zh) * | 2020-04-28 | 2023-11-14 | 北京小米松果电子有限公司 | 信息控制方法及装置、存储介质 |
WO2022060970A1 (en) * | 2020-09-21 | 2022-03-24 | Amazon Technologies, Inc. | Dialog management for multiple users |
US11908468B2 (en) | 2020-09-21 | 2024-02-20 | Amazon Technologies, Inc. | Dialog management for multiple users |
CN113076394A (zh) * | 2021-03-25 | 2021-07-06 | 浙江天畅智链科技有限公司 | 一种交互机器人 |
Also Published As
Publication number | Publication date |
---|---|
JP5405381B2 (ja) | 2014-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5405381B2 (ja) | 音声対話装置 | |
JP4560078B2 (ja) | コミュニケーションロボット | |
JP5411789B2 (ja) | コミュニケーションロボット | |
JP5366048B2 (ja) | 情報提供システム | |
JP2008254122A (ja) | ロボット | |
EP3463244B1 (en) | Guide robot and method and system for operating the same | |
JP4718987B2 (ja) | インターフェース装置およびそれを備えた移動ロボット | |
JP4276624B2 (ja) | ロボット制御装置、ロボット制御方法、及びロボット制御プログラム | |
CN106328132A (zh) | 一种智能设备的语音交互控制方法和装置 | |
CN109571499A (zh) | 一种智能导航引领机器人及其实现方法 | |
Chaccour et al. | Computer vision guidance system for indoor navigation of visually impaired people | |
JP4886572B2 (ja) | ロボット | |
JP2009248193A (ja) | 接客システム及び接客方法 | |
KR20190106921A (ko) | 커뮤니케이션 로봇 및 그의 구동 방법 | |
JP4764377B2 (ja) | 移動型ロボット | |
Chaccour et al. | Novel indoor navigation system for visually impaired and blind people | |
JP4178846B2 (ja) | 自律駆動式支援装置およびプログラム | |
JP5324956B2 (ja) | 道案内ロボット | |
JP2020182092A (ja) | 警備システム及び監視表示装置 | |
JP5866646B2 (ja) | コミュニケーションシステム、発話内容生成装置、発話内容生成プログラムおよび発話内容生成方法 | |
Goetze et al. | Multimodal human-machine interaction for service robots in home-care environments | |
JP2019144612A (ja) | 走行装置 | |
KR20230095585A (ko) | 안내 로봇 및 그것의 동작 방법 | |
JP7308068B2 (ja) | 警備システム及び監視表示装置 | |
RU108172U1 (ru) | Многомодальный подвижный автомат информационного обслуживания |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121127 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130719 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130730 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130912 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130920 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131022 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131030 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5405381 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |