JP2020086096A - 音声対話装置および音声対話システム - Google Patents
音声対話装置および音声対話システム Download PDFInfo
- Publication number
- JP2020086096A JP2020086096A JP2018219515A JP2018219515A JP2020086096A JP 2020086096 A JP2020086096 A JP 2020086096A JP 2018219515 A JP2018219515 A JP 2018219515A JP 2018219515 A JP2018219515 A JP 2018219515A JP 2020086096 A JP2020086096 A JP 2020086096A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- signal
- response
- input
- identification information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Telephonic Communication Services (AREA)
Abstract
Description
(項1)
利用者の発話音声に反応して音声対話手段(4)により音声合成された応答音声信号に基づいて、スピーカ(5)から応答音声を出力する音声対話装置(10)であって、
応答音声信号の可聴帯域外の周波数帯域に、前記応答音声信号であることを示す識別情報を埋め込む識別情報埋込手段(1)と、
マイクロフォン(6)から入力される入力音声信号の可聴帯域外の周波数帯域に、前記識別情報が含まれているか否かを判別する識別情報判別手段(2)と、
前記識別情報が含まれていると判別された場合に、前記入力音声信号から少なくとも前記応答音声信号を除外した音声信号を、音声対話手段(4)に出力する応答音声除外手段(3)と、
を備える、音声対話装置。
(項2)
前記応答音声除外手段(3)は、前記入力音声信号に前記識別情報が含まれていない場合に、前記入力音声信号を前記音声対話手段(4)に出力する、項1に記載の音声対話装置。
(項3)
前記識別情報判別手段(2)は、
前記入力音声信号の周波数帯域を制限する第1の帯域制限手段(21,26)と、
前記入力音声信号の電力と帯域が制限された前記入力音声信号の電力とを計算する第1の電力計算手段(22,27)と、
前記入力音声信号の電力と帯域が制限された前記入力音声信号の電力との比率に基づいて、前記入力音声信号に前記識別情報が含まれているか否かを判別する判別手段(23,28)と、
を備える、項1または2に記載の音声対話装置。
(項4)
前記応答音声除外手段(3)は、前記入力音声信号に前記識別情報が含まれている場合に、前記入力音声信号をミュートする、項1から3のいずれか一項に記載の音声対話装置。
(項5)
前記応答音声除外手段(3)は、
前記入力音声信号の周波数帯域を制限して、前記入力音声信号を出力する第2の帯域制限手段(31)と、
前記識別情報の判別結果に基づいて、ミュートされた前記入力音声信号と前記入力音声信号とを切り替えて出力する第1の切替手段(32)と、
を備える、項4に記載の音声対話装置。
(項6)
前記識別情報埋込手段(1)は、
前記可聴帯域外の周波数を有する信号を前記応答音声信号に重畳する第1の重畳手段(12)
を備える、項4または5に記載の音声対話装置。
(項7)
前記応答音声除外手段(3)は、前記入力音声信号に前記識別情報が含まれている場合に、前記入力音声信号から前記応答音声信号を差し引いた音声信号を、前記音声対話手段(4)に出力する、項1から3のいずれか一項に記載の音声対話装置。
(項8)
前記応答音声除外手段(3)は、
前記入力音声信号の周波数帯域を制限して、前記入力音声信号を出力する第3の帯域制限手段(34)と、
前記入力音声信号にキャリア信号を乗算して、復調信号を生成する復調手段(35)と、
前記復調信号から応答音声信号を推定する応答音声推定手段(37)と、
推定された前記応答音声信号を前記入力音声信号から差し引く応答音声差引手段(38)と、
前記識別情報の判別結果に基づいて、前記応答音声差引手段(38)の出力と前記入力音声信号とを切り替えて出力する第2の切替手段(39)と、
を備える、項7に記載の音声対話装置。
(項9)
前記識別情報埋込手段(1)は、
前記応答音声信号の周波数帯域を制限する第4の帯域制限手段(15)と、
帯域が制限された前記応答音声信号にキャリア信号を乗算することにより、変調信号を生成する変調手段(16)と、
前記応答音声信号に前記変調信号を重畳することにより、前記応答音声信号の、前記キャリア信号のキャリア周波数を含む周波数帯域に、前記識別情報として前記変調信号を埋め込む第2の重畳手段(17)と、
を備え、
前記変調信号の周波数帯域の上限および下限の周波数が、前記可聴帯域外の周波数である、項7または8に記載の音声対話装置。
(項10)
前記可聴帯域が20Hz〜15kHzの範囲の周波数帯域である、項1から9のいずれか一項に記載の音声対話装置。
(項11)
項1から10のいずれかに記載の音声対話装置の各手段としてコンピュータを機能させるためのプログラム。
(項12)
項1から10のいずれかに記載の音声対話装置(10)と、
入力音声に基づいて、前記音声対話装置(10)に前記入力音声信号を出力するマイクロフォン(6)と、
前記音声対話装置(10)から入力される前記応答音声信号に基づいて、前記応答音声を出力するスピーカ(5)と、
を備える、音声対話システム。
図1は、本発明の一実施形態に係る音声対話システム100の概略的な構成を説明するためのブロック図である。
第1の実施形態では、音声対話装置10Aは、入力音声信号に識別情報が含まれている場合に、入力音声信号をミュートする。
第2の実施形態では、音声対話装置10Bは、入力音声信号に識別情報が含まれている場合に、入力音声信号から応答音声信号を差し引いた音声信号を、音声対話手段4に出力する。
第1および第2の実施形態では、音声対話装置10(10A,10B)が備える各手段は、各手段が備える各機能毎に作製された電子回路によりハードウェアとして実現されている。第3の実施形態では、音声対話装置10(10A,10B)が備える各手段の少なくとも一部の機能を、ソフトウェアとして実現する。
以上、本発明を特定の実施形態によって説明したが、本発明は上記した実施形態に限定されるものではない。
1(1A,1B) 識別情報埋込手段
2 識別情報判別手段
3(3A,3B) 応答音声除外手段
4 音声対話手段
5 スピーカ
6 マイクロフォン
10(10A,10B) 音声対話装置
11 発振手段
12 重畳手段
14 アップサンプル手段
15 帯域制限手段
16 変調手段
17 重畳手段
21 帯域制限手段
22(22A,22B) 電力計算手段
23 判別手段
31 帯域制限手段
32 切替手段
33 ダウンサンプル手段
34 帯域制限手段
35 復調手段
36(36A,36B) ダウンサンプル手段
37 応答音声推定手段
38 応答音声差引手段
39 切替手段
81(81A,81B) 従来の音声対話システム
82 スピーカ
83 マイクロフォン
84 応答音声
85 発話音声
86 誤認識による誤った応答音声
89 利用者
Claims (12)
- 利用者の発話音声に反応して音声対話手段により音声合成された応答音声信号に基づいて、スピーカから応答音声を出力する音声対話装置であって、
応答音声信号の可聴帯域外の周波数帯域に、前記応答音声信号であることを示す識別情報を埋め込む識別情報埋込手段と、
マイクロフォンから入力される入力音声信号の可聴帯域外の周波数帯域に、前記識別情報が含まれているか否かを判別する識別情報判別手段と、
前記識別情報が含まれていると判別された場合に、前記入力音声信号から少なくとも前記応答音声信号を除外した音声信号を、音声対話手段に出力する応答音声除外手段と、
を備える、音声対話装置。 - 前記応答音声除外手段は、前記入力音声信号に前記識別情報が含まれていない場合に、前記入力音声信号を前記音声対話手段に出力する、請求項1に記載の音声対話装置。
- 前記識別情報判別手段は、
前記入力音声信号の周波数帯域を制限する第1の帯域制限手段と、
前記入力音声信号の電力と帯域が制限された前記入力音声信号の電力とを計算する第1の電力計算手段と、
前記入力音声信号の電力と帯域が制限された前記入力音声信号の電力との比率に基づいて、前記入力音声信号に前記識別情報が含まれているか否かを判別する判別手段と、
を備える、請求項1または2に記載の音声対話装置。 - 前記応答音声除外手段は、前記入力音声信号に前記識別情報が含まれている場合に、前記入力音声信号をミュートする、請求項1から3のいずれか一項に記載の音声対話装置。
- 前記応答音声除外手段は、
前記入力音声信号の周波数帯域を制限して、前記入力音声信号を出力する第2の帯域制限手段と、
前記識別情報の判別結果に基づいて、ミュートされた前記入力音声信号と前記入力音声信号とを切り替えて出力する第1の切替手段と、
を備える、請求項4に記載の音声対話装置。 - 前記識別情報埋込手段は、
前記可聴帯域外の周波数を有する信号を前記応答音声信号に重畳する第1の重畳手段
を備える、請求項4または5に記載の音声対話装置。 - 前記応答音声除外手段は、前記入力音声信号に前記識別情報が含まれている場合に、前記入力音声信号から前記応答音声信号を差し引いた音声信号を、前記音声対話手段に出力する、請求項1から3のいずれか一項に記載の音声対話装置。
- 前記応答音声除外手段は、
前記入力音声信号の周波数帯域を制限して、前記入力音声信号を出力する第3の帯域制限手段と、
前記入力音声信号にキャリア信号を乗算して、復調信号を生成する復調手段と、
前記復調信号から応答音声信号を推定する応答音声推定手段と、
推定された前記応答音声信号を前記入力音声信号から差し引く応答音声差引手段と、
前記識別情報の判別結果に基づいて、前記応答音声差引手段の出力と前記入力音声信号とを切り替えて出力する第2の切替手段と、
を備える、請求項7に記載の音声対話装置。 - 前記識別情報埋込手段は、
前記応答音声信号の周波数帯域を制限する第4の帯域制限手段と、
帯域が制限された前記応答音声信号にキャリア信号を乗算することにより、変調信号を生成する変調手段と、
前記応答音声信号に前記変調信号を重畳することにより、前記応答音声信号の、前記キャリア信号のキャリア周波数を含む周波数帯域に、前記識別情報として前記変調信号を埋め込む第2の重畳手段と、
を備え、
前記変調信号の周波数帯域の上限および下限の周波数が、前記可聴帯域外の周波数である、請求項7または8に記載の音声対話装置。 - 前記可聴帯域が20Hz〜15kHzの範囲の周波数帯域である、請求項1から9のいずれか一項に記載の音声対話装置。
- 請求項1から10のいずれかに記載の音声対話装置の各手段としてコンピュータを機能させるためのプログラム。
- 請求項1から10のいずれかに記載の音声対話装置と、
入力音声に基づいて、前記音声対話装置に前記入力音声信号を出力するマイクロフォンと、
前記音声対話装置から入力される前記応答音声信号に基づいて、前記応答音声を出力するスピーカと、
を備える、音声対話システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018219515A JP7106120B2 (ja) | 2018-11-22 | 2018-11-22 | 音声対話装置および音声対話システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018219515A JP7106120B2 (ja) | 2018-11-22 | 2018-11-22 | 音声対話装置および音声対話システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020086096A true JP2020086096A (ja) | 2020-06-04 |
JP7106120B2 JP7106120B2 (ja) | 2022-07-26 |
Family
ID=70907775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018219515A Active JP7106120B2 (ja) | 2018-11-22 | 2018-11-22 | 音声対話装置および音声対話システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7106120B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002297199A (ja) * | 2001-03-29 | 2002-10-11 | Toshiba Corp | 合成音声判別方法と装置及び音声合成装置 |
JP2003044069A (ja) * | 2001-07-19 | 2003-02-14 | Samsung Electronics Co Ltd | 音声認識による誤動作の防止及び音声認識率の向上が可能な電子機器及び方法 |
JP2005338454A (ja) * | 2004-05-27 | 2005-12-08 | Toshiba Tec Corp | 音声対話装置 |
JP2013093742A (ja) * | 2011-10-26 | 2013-05-16 | Hitachi Consumer Electronics Co Ltd | 制御端末、電子機器、及び、制御端末における制御方法 |
-
2018
- 2018-11-22 JP JP2018219515A patent/JP7106120B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002297199A (ja) * | 2001-03-29 | 2002-10-11 | Toshiba Corp | 合成音声判別方法と装置及び音声合成装置 |
JP2003044069A (ja) * | 2001-07-19 | 2003-02-14 | Samsung Electronics Co Ltd | 音声認識による誤動作の防止及び音声認識率の向上が可能な電子機器及び方法 |
JP2005338454A (ja) * | 2004-05-27 | 2005-12-08 | Toshiba Tec Corp | 音声対話装置 |
JP2013093742A (ja) * | 2011-10-26 | 2013-05-16 | Hitachi Consumer Electronics Co Ltd | 制御端末、電子機器、及び、制御端末における制御方法 |
Also Published As
Publication number | Publication date |
---|---|
JP7106120B2 (ja) | 2022-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10586534B1 (en) | Voice-controlled device control using acoustic echo cancellation statistics | |
JP6279181B2 (ja) | 音響信号強調装置 | |
US9536540B2 (en) | Speech signal separation and synthesis based on auditory scene analysis and speech modeling | |
US8032364B1 (en) | Distortion measurement for noise suppression system | |
US9293133B2 (en) | Improving voice communication over a network | |
JP5183828B2 (ja) | 雑音抑圧装置 | |
US9570072B2 (en) | System and method for noise reduction in processing speech signals by targeting speech and disregarding noise | |
US20120022864A1 (en) | Method and device for classifying background noise contained in an audio signal | |
KR100745977B1 (ko) | 음성 구간 검출 장치 및 방법 | |
US20200296510A1 (en) | Intelligent information capturing in sound devices | |
WO2014127543A1 (en) | Detecting and switching between noise reduction modes in multi-microphone mobile devices | |
JP2011027825A (ja) | 音声処理装置、音声処理方法およびプログラム | |
US8793128B2 (en) | Speech signal processing system, speech signal processing method and speech signal processing method program using noise environment and volume of an input speech signal at a time point | |
JP2018132624A (ja) | 音声対話装置 | |
JP2020086096A (ja) | 音声対話装置および音声対話システム | |
KR101547344B1 (ko) | 음성복원장치 및 그 방법 | |
US9210507B2 (en) | Microphone hiss mitigation | |
KR20200095370A (ko) | 음성 신호에서의 마찰음의 검출 | |
JP2017216525A (ja) | 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム | |
JP2014021307A (ja) | 音声信号復元装置および音声信号復元方法 | |
KR20200116617A (ko) | 주변의 환경에 기초하여 오디오의 전처리 방법을 결정하는 방법 및 장치 | |
JP2017097160A (ja) | 音声処理装置、音声処理方法、およびプログラム | |
CN111145770B (zh) | 音频处理方法和装置 | |
JP2017097101A (ja) | 雑音除去装置、雑音除去プログラム、及び雑音除去方法 | |
CN111145776B (zh) | 音频处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20181211 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210810 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220420 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220525 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220607 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220706 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7106120 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |