JP6721676B2 - 対話装置、対話装置の制御方法、および制御プログラム - Google Patents
対話装置、対話装置の制御方法、および制御プログラム Download PDFInfo
- Publication number
- JP6721676B2 JP6721676B2 JP2018515402A JP2018515402A JP6721676B2 JP 6721676 B2 JP6721676 B2 JP 6721676B2 JP 2018515402 A JP2018515402 A JP 2018515402A JP 2018515402 A JP2018515402 A JP 2018515402A JP 6721676 B2 JP6721676 B2 JP 6721676B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- response
- user
- unit
- directed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 23
- 230000002452 interceptive effect Effects 0.000 title claims description 16
- 230000004044 response Effects 0.000 claims description 86
- 230000003993 interaction Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000009118 appropriate response Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- User Interface Of Digital Computer (AREA)
Description
以下、図1〜5を参照して、本発明の実施形態1について、詳細に説明する。まず、図2を参照して、本実施形態の概要について説明する。
図2は、本実施形態の概要を説明するための図である。図2(a)に示すように、ユーザAが対話装置1に話しかける場合、対話装置1は、ユーザAの発話を認識し、当該発話に対し応答することにより対話を行うことができる。
次に、図1を参照して、対話装置1の構成について説明する。図1は、対話装置1の要部構成を示すブロック図である。図1に示すように、対話装置1は、制御部10、記憶部20、入力受付部30、および音声出力部40を含む。
次に、図5を参照して、対話装置1における対話処理の流れを説明する。図5は、対話装置1における対話処理の流れを示すフローチャートである。
本発明の他の実施形態について、図6に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、前記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。
対話装置1の制御ブロック(特に制御部10(音声認識部11、ユーザ識別部12、判定部13、応答部14、タイマ部15、音声入力部16、出力制御部17))は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
本発明の態様1に係る対話装置は、ユーザとの対話を行う対話装置であって、上記ユーザの音声を認識する音声認識部と、上記音声認識部が認識した上記音声から、当該音声が自装置に向けられたものか否かを判定する判定部と、上記判定部が、上記音声を自装置に向けられたものと判定した場合、上記音声に対する応答を行う応答部と、を備えている構成である。
10 制御部
11 音声認識部
12 ユーザ識別部
13 判定部
14 応答部
15 タイマ部
16 音声入力部
17 出力制御部
20 記憶部
21 認識辞書データ
22 応答音声データ
23 出力音声テーブル
30 入力受付部
40 音声出力部
Claims (7)
- ユーザとの対話を行う対話装置であって、
上記ユーザの音声を認識する音声認識部と、
上記音声認識部が認識した上記音声から、当該音声が自装置に向けられたものか否かを判定する判定部と、
上記判定部が、上記音声を自装置に向けられたものと判定した場合、上記音声に対する応答を行う応答部と、を備え、
上記判定部は、所定時間内に上記音声認識部が認識した音声を発したユーザが1人かどうかを判定することによって、上記音声が、自装置に向けられたものか否かを判定することを特徴とする対話装置。 - 上記判定部は、上記所定時間内に、上記音声認識部が認識した音声が複数存在した場合、それぞれの音声の音響的特徴を比較して、ユーザが1人かどうかを判定することを特徴とする請求項1に記載の対話装置。
- 上記応答部は、上記所定時間内に上記音声認識部が認識した上記音声のうち、当該音声を認識した時点が最新の音声に対し、上記応答を行うことを特徴とする請求項1または2に記載の対話装置。
- 上記応答部は、上記応答後、当該応答したユーザと同じユーザに対し、上記判定部が自装置に向けられたものではないと判定し、応答しなかった音声がある場合、当該音声に対する応答である時間差応答を行うことを特徴とする請求項1〜3のいずれか1項に記載の対話装置。
- 上記応答部は、上記時間差応答を実行する場合、以前に応答しなった音声に対する応答であることを明示して応答することを特徴とする請求項4に記載の対話装置。
- ユーザとの対話を行う対話装置の制御方法であって、
上記ユーザの音声を認識する音声認識ステップと、
上記音声認識ステップで認識した上記音声から、当該音声が自装置に向けられたものか否かを判定する判定ステップと、
上記判定ステップで、上記音声を自装置に向けられたものと判定した場合、上記音声に対する応答を行う応答ステップと、を含み、
上記判定ステップでは、所定時間内に上記音声認識ステップで認識した音声を発したユーザが1人かどうかを判定することによって、上記音声が、自装置に向けられたものか否かを判定することを特徴とする対話装置の制御方法。 - 請求項1〜5のいずれか1項に記載の対話装置としてコンピュータを機能させるための制御プログラムであって、上記各部としてコンピュータを機能させるための制御プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016092466 | 2016-05-02 | ||
JP2016092466 | 2016-05-02 | ||
PCT/JP2017/010060 WO2017191710A1 (ja) | 2016-05-02 | 2017-03-14 | 対話装置、対話装置の制御方法、および制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017191710A1 JPWO2017191710A1 (ja) | 2019-02-21 |
JP6721676B2 true JP6721676B2 (ja) | 2020-07-15 |
Family
ID=60202959
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018515402A Active JP6721676B2 (ja) | 2016-05-02 | 2017-03-14 | 対話装置、対話装置の制御方法、および制御プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6721676B2 (ja) |
WO (1) | WO2017191710A1 (ja) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9715875B2 (en) * | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
-
2017
- 2017-03-14 JP JP2018515402A patent/JP6721676B2/ja active Active
- 2017-03-14 WO PCT/JP2017/010060 patent/WO2017191710A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JPWO2017191710A1 (ja) | 2019-02-21 |
WO2017191710A1 (ja) | 2017-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3284832B2 (ja) | 音声認識対話処理方法および音声認識対話装置 | |
KR102097710B1 (ko) | 대화 분리 장치 및 이에서의 대화 분리 방법 | |
JPH096390A (ja) | 音声認識対話処理方法および音声認識対話装置 | |
JP4667085B2 (ja) | 音声対話システム、コンピュータプログラム、対話制御装置及び音声対話方法 | |
KR102628211B1 (ko) | 전자 장치 및 그 제어 방법 | |
JP2019090942A (ja) | 情報処理装置、情報処理システム、情報処理方法、および情報処理プログラム | |
WO2018043138A1 (ja) | 情報処理装置および情報処理方法、並びにプログラム | |
US20170270923A1 (en) | Voice processing device and voice processing method | |
JP2023548157A (ja) | 通話およびオーディオメッセージからのその他の話者の音声フィルタリング | |
KR102019470B1 (ko) | 음성 발화 양식을 이용한 발화자 감정인식 방법 및 시스템 | |
JP6559417B2 (ja) | 情報処理装置、情報処理方法、対話システム、および制御プログラム | |
JPWO2018135276A1 (ja) | 言動制御装置、ロボット、制御プログラムおよび言動制御装置の制御方法 | |
JP2009175179A (ja) | 音声認識装置、プログラム、及び発話信号抽出方法 | |
US20180366127A1 (en) | Speaker recognition based on discriminant analysis | |
JP6721676B2 (ja) | 対話装置、対話装置の制御方法、および制御プログラム | |
JP2019045831A (ja) | 音声処理装置、方法およびプログラム | |
JP2017211610A (ja) | 出力制御装置、電子機器、出力制御装置の制御方法、および出力制御装置の制御プログラム | |
JP2019132997A (ja) | 音声処理装置、方法およびプログラム | |
US20210304750A1 (en) | Open Smart Speaker | |
JP2009086207A (ja) | 議事録情報生成システム、議事録情報生成方法、及び議事録情報生成プログラム | |
JP3846500B2 (ja) | 音声認識対話装置および音声認識対話処理方法 | |
JP6711343B2 (ja) | 音声処理装置、音声処理方法及びプログラム | |
JP2021149664A (ja) | 出力装置、出力方法及び出力プログラム | |
WO2019138477A1 (ja) | スマートスピーカー、スマートスピーカーの制御方法、及びプログラム | |
JP2010230994A (ja) | 受付装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181009 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191217 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200602 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200618 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6721676 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |