JP4798039B2 - 音声対話装置および方法 - Google Patents
音声対話装置および方法 Download PDFInfo
- Publication number
- JP4798039B2 JP4798039B2 JP2007079309A JP2007079309A JP4798039B2 JP 4798039 B2 JP4798039 B2 JP 4798039B2 JP 2007079309 A JP2007079309 A JP 2007079309A JP 2007079309 A JP2007079309 A JP 2007079309A JP 4798039 B2 JP4798039 B2 JP 4798039B2
- Authority
- JP
- Japan
- Prior art keywords
- response
- timing
- prediction
- voice
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
003-7(3/2)を参照)。しかし、相槌や頷きを行うタイミングをポーズや発話末の表現によって判定する手法では、発話にオーバーラップする相槌を実現することができない。
図1は本実施形態の音声対話装置1の構成を示すブロック図である。
図1に示すように、音声対話装置1は、利用者が発話した音声を入力する音声入力部2と、音声を出力する音声出力部3と、音声入力部2からの入力に応じて各種処理を実行し、音声出力部3を制御する制御部4とを備えている。
また制御部4は、CPU,ROM,RAM,I/O及びこれらの構成を接続するバスラインなどからなる周知のマイクロコンピュータを中心に構成されており、ROM及びRAMに記憶されたプログラムに基づいて各種処理を実行する。
図2に示すように、制御部4は、音声入力部2で入力した音声の認識処理を行う音声認識部11と、音声認識部11による認識結果に基づいて対話を進めるための応答(例えば、相槌や、「明日の天気はどうですか?」という音声入力に対して「明日は晴れです」というような応答)を生成する応答生成部12と、応答生成部12で生成された応答を音声出力部3に出力させる出力部13と、音声認識部11による認識結果に基づいて相槌等の応答を出力するタイミングを予測する出力タイミング予測部14と、出力タイミング予測部14で予測された出力タイミングで出力部13に音声出力部3による出力をさせる出力タイミング制御部15と、出力タイミング予測部14での予測結果に基づいて出力部13に音声出力部3による応答を変更させる応答変更部16と、出力タイミング予測部14での予測に用いる予測モデル(例えば、コーパス等の学習データ等を用いて予め作成したモデル)を記憶するモデル記憶部17とを備えている。
ここで、音声対話装置1の制御部4が実行する音声対話処理の手順を、図3,図4を用いて説明する。図3は音声対話処理を示すフローチャート、図4は出力タイミング予測の方法を説明する図である。
音声対話処理が実行されると、制御部4は、まずS10にて、音声入力部2に音声が入
力したか否かを判断する。ここで音声が入力していない場合には(S10)、音声対話処理を一旦終了する。一方、音声が入力した場合には(S10)、S20にて、音声入力部2に入力した音声について音声認識を行う。
判断し(S100)、S110にて、応答生成部12で生成された応答を、S90で設定された音量パラメータに対応した音量で音声出力部3に出力させ、音声対話処理を一旦終了する。
例えば、上記実施形態においては、音声対話装置1は、音声出力部3から音声を出力することにより相槌などの応答するものを示したが、これに限られるものではなく、視覚的に応答するものであってもよい。例えば、LEDを備えてLEDの点灯により応答するものであってもよいし、ディスプレイを備えて頷く動作を表示させるようにしてもよいし、ロボットに頷く動作をさせるようにしてもよい。
高くなるように設定された時定数の少なくとも1つ以上の情報を用いて、S70における確信度を算出してもよい。
Claims (6)
- 利用者が発した音声を入力する入力手段と、
前記入力手段に入力した音声に基づいて、該入力した音声に対応した応答を行う応答タイミングの予測結果を示すタイミング予測情報を取得する予測手段と、
前記予測手段により取得されたタイミング予測情報に基づいて、前記応答タイミングになったか否かを判断するタイミング判断手段と、
前記タイミング判断手段により前記応答タイミングになったと判断された場合に、前記応答を行う応答手段と、
前記予測手段による前記応答タイミングの予測結果についての確信度を算出する確信度算出手段と、
前記確信度算出手段により算出された確信度を前記応答タイミングの予測結果に付加する付加手段と
を備え、
前記予測手段は、
前記付加手段により付加された確信度に基づいて、前記応答タイミングの予測結果の中から、前記タイミング予測情報とするものを選択する
ことを特徴とする音声対話装置。 - 前記確信度算出手段は、
前記予測手段での予測結果とモデルとの一致率、N―gram確率、前記入力手段に入力した音声についての音声認識の確信度、及び時定数の少なくとも1つの情報を用いて前記確信度を算出する
ことを特徴とする請求項1に記載の音声対話装置。 - 前記応答タイミングの予測結果に付加された確信度に応じて、前記応答手段による応答の内容を変更する応答変更手段を備える
ことを特徴とする請求項1または請求項2に記載の音声対話装置。 - 利用者が発した音声を入力する入力ステップと、
前記入力ステップに入力した音声に基づいて、該入力した音声に対応した応答を行う応答タイミングの予測結果を示すタイミング予測情報を取得する予測ステップと、
前記予測ステップにより取得されたタイミング予測情報に基づいて、前記応答タイミングになったか否かを判断するタイミング判断ステップと、
前記タイミング判断ステップにより前記応答タイミングになったと判断された場合に、前記応答を行う応答ステップと、
前記予測ステップによる前記応答タイミングの予測結果についての確信度を算出する確信度算出ステップと、
前記確信度算出ステップにより算出された確信度を前記応答タイミングの予測結果に付加する付加ステップと
を備え、
前記予測ステップは、
前記付加ステップにより付加された確信度に基づいて、前記応答タイミングの予測結果の中から、前記タイミング予測情報とするものを選択する
ことを特徴とする音声対話方法。 - 前記確信度算出ステップは、
前記予測ステップでの予測結果とモデルとの一致率、N―gram確率、前記入力ステップにより入力した音声についての音声認識の確信度、及び時定数の少なくとも1つの情報を用いて前記確信度を算出する
ことを特徴とする請求項4に記載の音声対話方法。 - 前記応答タイミングの予測結果に付加された確信度に応じて、前記応答ステップによる応答の内容を変更する応答変更ステップを備える
ことを特徴とする請求項4または請求項5に記載の音声対話方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007079309A JP4798039B2 (ja) | 2007-03-26 | 2007-03-26 | 音声対話装置および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007079309A JP4798039B2 (ja) | 2007-03-26 | 2007-03-26 | 音声対話装置および方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011131432A Division JP2011175304A (ja) | 2011-06-13 | 2011-06-13 | 音声対話装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008241890A JP2008241890A (ja) | 2008-10-09 |
JP4798039B2 true JP4798039B2 (ja) | 2011-10-19 |
Family
ID=39913361
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007079309A Expired - Fee Related JP4798039B2 (ja) | 2007-03-26 | 2007-03-26 | 音声対話装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4798039B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7135896B2 (ja) * | 2019-01-28 | 2022-09-13 | トヨタ自動車株式会社 | 対話装置、対話方法及びプログラム |
JP7229847B2 (ja) | 2019-05-13 | 2023-02-28 | 株式会社日立製作所 | 対話装置、対話方法、及び対話コンピュータプログラム |
JP7274210B2 (ja) * | 2019-09-24 | 2023-05-16 | 学校法人早稲田大学 | 対話システムおよびプログラム |
CN112185363B (zh) * | 2020-10-21 | 2024-02-13 | 北京猿力未来科技有限公司 | 音频处理方法及装置 |
-
2007
- 2007-03-26 JP JP2007079309A patent/JP4798039B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008241890A (ja) | 2008-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11538478B2 (en) | Multiple virtual assistants | |
US9972318B1 (en) | Interpreting voice commands | |
US11061644B2 (en) | Maintaining context for voice processes | |
JP5195405B2 (ja) | 応答生成装置及びプログラム | |
US10140973B1 (en) | Text-to-speech processing using previously speech processed data | |
US11862174B2 (en) | Voice command processing for locked devices | |
JP5381988B2 (ja) | 対話音声認識システム、対話音声認識方法および対話音声認識用プログラム | |
EP3370230B1 (en) | Voice interaction apparatus, its processing method, and program | |
WO2015075975A1 (ja) | 対話制御装置及び対話制御方法 | |
CN109545197B (zh) | 语音指令的识别方法、装置和智能终端 | |
US11579841B1 (en) | Task resumption in a natural understanding system | |
KR20230150377A (ko) | 대화 동안 텍스트 음성 변환에서의 즉각적인 학습 | |
US11783824B1 (en) | Cross-assistant command processing | |
US20220415307A1 (en) | Interactive content output | |
WO2018034169A1 (ja) | 対話制御装置および方法 | |
JP4798039B2 (ja) | 音声対話装置および方法 | |
JP2000267687A (ja) | 音声応答装置 | |
JP2011175304A (ja) | 音声対話装置および方法 | |
US20230360633A1 (en) | Speech processing techniques | |
JP5074759B2 (ja) | 対話制御装置、対話制御方法及び対話制御プログラム | |
US12001260B1 (en) | Preventing inadvertent wake in a speech-controlled device | |
US11922938B1 (en) | Access to multiple virtual assistants | |
EP4445364A1 (en) | Multiple wakeword detection | |
US11763809B1 (en) | Access to multiple virtual assistants | |
US12073838B1 (en) | Access to multiple virtual assistants |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090525 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110310 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110412 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110613 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110705 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110718 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140812 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4798039 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140812 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |