JP2000075896A - 音声認識制御装置 - Google Patents
音声認識制御装置Info
- Publication number
- JP2000075896A JP2000075896A JP11258220A JP25822099A JP2000075896A JP 2000075896 A JP2000075896 A JP 2000075896A JP 11258220 A JP11258220 A JP 11258220A JP 25822099 A JP25822099 A JP 25822099A JP 2000075896 A JP2000075896 A JP 2000075896A
- Authority
- JP
- Japan
- Prior art keywords
- reference signal
- output
- unit
- input
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
る音声認識手段(4)と、データを音に復号して出力し且
つ前記出力に基準信号を重畳させて出力する音出力手段
からの出力を前記入力部から受け、前記出力に含まれる
基準信号を検出する基準信号検出手段と、前記音声認識
手段(4)の音声認識動作中に、基準信号検出手段が基準
信号を検出した場合は、前記入力部からの入力を無効と
し、前記基準信号が検出されなくなった後に、前記入力
部からの入力を有効にする制御手段よりなる。
Description
行なう音声認識制御装置に関する。
は、音声出力したものが音声入力部のマイクに入って、
誤って音声認識が行なわれるケースがあった。特に、何
を入力すべきかを音声ガイダンスにより指示する場合
や、音声認識結果の出力を音声出力部によって行なう装
置の場合には、その装置から出力した音声がマイクに入
り込み、誤動作の原因となっていた。
において、前記音声出力部を有する装置が近接して設け
られている場合にも誤入力が生じる。
ことが必要である。
15に示すようなものがある。
イクであり、マイク1から入力する音声は、アンプ2で
増幅され、A/D変換器3によりデジタル信号に変換さ
れた後に、認識部4により音声の認識が行なわれる。認
識部4は入力するデジタル信号の特徴を抽出し、標準パ
ターンメモリからパターン照合を行なって認識したデー
タを制御部5に出力し、制御部5は認識したデータを上
位装置に送る。
あり、メモリ6には波形符号化データとして、例えば音
声ガイダンスのための固定したメッセージを示すデータ
などが格納される。この符号化データは復号部7により
復号され、D/A変換器8よりアナログ信号に変換さ
れ、アンプ9により増幅された後にスピーカ10から音
声出力される。
うな従来の音声認識制御装置にあっては、話者が発声し
ていないのに、音声出力が入力して認識結果が出力され
たり、また、入力のために発声した音声と音声出力が重
なり、誤認識の原因となるという問題点があった。
てなされたものであって、誤入力を防止することで誤認
識の発生を防止するようにした音声認識制御装置を提供
することを目的としている。
1、参照)は、入力部から入力された音声を認識する音
声認識手段と、データを音に復号して出力し且つ前記出
力に基準信号を重畳させて出力する音出力手段からの出
力を前記入力部から受け、前記出力に含まれる基準信号
を検出する基準信号検出手段と、前記音声認識手段の音
声認識動作中に、基準信号検出手段が基準信号を検出し
た場合は、前記入力部からの入力を無効とし、前記基準
信号が検出されなくなった後に、前記入力部からの入力
を有効にする制御手段を有する。
部から入力された音声を認識する音声認識手段と、デー
タを音に復号して出力し且つ前記出力に基準信号を重畳
させて出力する音出力手段と、前記音出力手段からの出
力を前記入力部から受け、前記出力に含まれる基準信号
を検出する基準信号検出手段と、前記音声認識手段の音
声認識動作中に、基準信号検出手段が基準信号を検出し
た場合は、前記入力部からの入力を無効とし、前記基準
信号が検出されなくなった後に、前記入力部からの入力
を有効にする制御手段を有する。
ら入力された音声を認識する音声認識手段と、データを
音に復号して出力し且つ前記出力に基準信号を重畳させ
て出力する音出力手段からの出力を前記入力部から受
け、前記出力に含まれる基準信号を検出する基準信号検
出手段と、前記音声認識手段の音声認識動作中に、基準
信号検出手段が基準信号を検出した場合は、前記音声認
識動作を中断し、前記基準信号が検出されなくなった後
に前記音声認識手段の音声認識動作を再開させる制御手
段を有する。
ら入力された音声を認識する音声認識手段と、データを
音に復号して出力し且つ前記出力に基準信号を重畳させ
て出力する音出力手段からの出力を前記入力部から受
け、前記出力に含まれる基準信号を検出する基準信号検
出手段と、前記音声認識手段に設けられた区間検出手段
であって、入力部から入力された音声の始端および終端
を検出する区間検出手段と、前記音声認識手段の音声認
識動作中に、基準信号検出手段が基準信号を検出した場
合で、且つ、前記音声認識手段に設けられた区間検出手
段が入力音声の終端の検出を終了していない場合は、前
記音声認識手段の認識動作を中断し、前記基準信号が検
出されなくなった後に前記音声認識手段の音声認識動作
を再開させ、前記音声認識手段の音声認識動作中に、基
準信号検出手段が基準信号を検出した場合で、且つ、前
記音声認識手段に設けられた区間検出手段が入力音声の
終端の検出を終了している場合は、前記音声認識手段の
認識動作を続行させる制御を行う制御手段を有する。
基づいて説明する。
示す図である。
イク、1Aは音声入力を切断するマイクスイッチ、2は
入力した音声を増幅するアンプ、3はアンプ2の出力信
号をデジタル信号に変換するA/D変換器、4はA/D
変換器3で変換したデジタル信号の音声認識を行なう認
識部であり、これらが音声を入力してそれを認識する第
1手段11を構成している。
ータの特徴を抽出する特徴抽出部4Aと、標準パターン
を格納してある標準パターンメモリ4Bと、入力データ
の始端および終端を検出する区間検出部4Cと、パター
ンの照合を行なうパターン照合部4Dを有している。
ば音声ガイダンスのメッセージを示す波形符号化データ
が格納されている。
8は復号したデジタル信号をアナログ信号に変換するD
/A変換器、9は変換したアナログ信号を増幅するアン
プ、10は増幅した音声を出力するスピーカであり、こ
れらが波形符号化データを音声に復号してこれを出力す
る第2手段12を構成している。
部5は上位装置に認識部4の出力データを送るとともに
上位装置の指示を受けて、前記第1手段11および第2
手段12を制御する。
部であり、音声検出部13は音声出力が開始されたとき
これを検出して、停止信号をマイクスイッチ1Aに出力
してマイク入力を切断する。音声検出部13は、第1手
段11の動作を停止させる第3手段を構成している。
出力が開始されると、音声検出部13はこれを検出し
て、停止信号をマイクスイッチ1Aに出力し、マイク入
力を切断するので、音声出力中は音声が入力されなくな
る。したがって、誤入力を防止することができ、その結
果、誤認識の発生を防止することができる。
る。
を検出する音声検出部、14はしきい値が格納されてい
るメモリ、15は音声検出部(第3手段)13で検出し
た出力パワーとしきい値を比較し、出力パワーがしきい
値を越えるとき、停止信号をマイクスイッチ1Aに出力
する比較部である。
がしきい値を越えるとき、マイク出力を切断するので、
誤入力を防止することができる。その結果、前記実施形
態と同様な効果を得ることができる。
手段)であり、音声検出部13Aは復号部7に接続さ
れ、音声出力を検出すると、認識部4に対してセット信
号およびリセット信号を出力する。
中に音声出力が開始された場合には、認識部4の動作を
一時的に中止して、初期状態に戻し、音声出力が終了後
に再度認識動作を開始させる。本実施形態においても前
記実施形態と同様な効果を得ることができる。
プ2、A/D変換器3、および認識部4が音声を入力
し、認識する第1手段11を構成している。
図である。
力を検出する音声検出部、14はしきい値を格納してお
くメモリ、15は音声出力のパワーとしきい値を比較し
て認識部4にセット信号およびリセット信号を出力する
比較部である。
に音声出力のパワーがしきい値を越えるときは、認識部
4の動作を一時的に中断し、音声出力の終了後に再度認
識動作を開始させる。本実施形態においても、前記実施
形態と同様な効果を得ることができる。
を示す図である。
れる音声検出部であり、音声検出部(第5手段)13C
は図8に示す区間検出部4Cから入力音声の始端および
終端が入力する判別部4Eにセット信号およびリセット
信号を出力する。
に音声出力が開始された場合で、かつ、認識部4で入力
音声の終端を検出していない場合には、認識動作を中断
し、初期状態に戻し、音声出力の終了後に、再度認識動
作を開始させる。
され、また、入力音声の終端を検出後に音声出力が開始
されたときは、認識動作の中断を行なわない場合は、図
9(B)に示される。
す図である。
される音声検出部、14はしきい値を格納しておくメモ
リ、15はしきい値と音声出力のパワーを比較する比較
部である。
に音声出力のパワーがしきい値を越えたときであって、
入力音声の終端が検出されていないときは、認識動作を
一時中断し、音声出力のパワーがしきい値以下となった
とき、再度認識動作を開始する。
な効果を得ることができる。
す図である。
音声が入力する基準信号検出部(第3手段)であり、基
準信号検出部13Cは、入力する音声のうちの基準信号
を検出してマイクスイッチ1Aを切断する。
接した場所で使用される場合に、その装置からの音声出
力が入力するのを防止するために、その音声出力に重畳
されるものであって、基準信号としては、PB音、低周
波(例えば20Hz)、または高周波(例えば20KH
z)の正弦波などを用いる。
な効果が得られる。なお、本実施形態においては、符号
化データを音声に復号しこれを出力する第2手段12は
設けられていないが、設けられている場合にも同様の効
果が得られる。
図である。
の中から基準信号を検出する基準信号検出部であり、基
準信号検出部13Cは、認識部4に対してセット信号お
よびリセット信号を出力する。
に音声入力に基準信号が検出されたときに、認識部4の
動作を一時的に中断し、音声入力に基準信号が含まれな
くなったら、再度認識動作を開始する。
な効果を得ることができる。
態を示す図である。
ら入力音声の始端信号および終端信号が入力する判断
部、13Cは判断部4Eにセット信号およびリセット信
号を出力する基準信号検出部である(図8、参照)。
に入力に基準信号が検出された場合で、かつ、認識部4
で入力音声の終端が検出されないときは、認識動作を中
断し、初期状態に戻し、入力に基準信号が含まれなくな
ったら、再度認識動作を開始する。
す。
な効果を得ることができる。
ば、音声出力または入力に基準信号を検出したときは、
音声入力部または認識部の動作を停止または一時的に中
断するようにしたため、誤入力を防止することができ、
誤認識の発生を防止することができる。
Claims (4)
- 【請求項1】入力部から入力された音声を認識する音声
認識手段と、 データを音に復号して出力し且つ前記出力に基準信号を
重畳させて出力する音出力手段からの出力を前記入力部
から受け、前記出力に含まれる基準信号を検出する基準
信号検出手段と、 前記音声認識手段の音声認識動作中に、基準信号検出手
段が基準信号を検出した場合は、前記入力部からの入力
を無効とし、前記基準信号が検出されなくなった後に、
前記入力部からの入力を有効にする制御手段を有するこ
とを特徴とする音声認識制御装置。 - 【請求項2】入力部から入力された音声を認識する音声
認識手段と、 データを音に復号して出力し且つ前記出力に基準信号を
重畳させて出力する音出力手段と、 前記音出力手段からの出力を前記入力部から受け、前記
出力に含まれる基準信号を検出する基準信号検出手段
と、 前記音声認識手段の音声認識動作中に、基準信号検出手
段が基準信号を検出した場合は、前記入力部からの入力
を無効とし、前記基準信号が検出されなくなった後に、
前記入力部からの入力を有効にする制御手段を有するこ
とを特徴とする音声認識制御装置。 - 【請求項3】入力部から入力された音声を認識する音声
認識手段と、 データを音に復号して出力し且つ前記出力に基準信号を
重畳させて出力する音出力手段からの出力を前記入力部
から受け、前記出力に含まれる基準信号を検出する基準
信号検出手段と、 前記音声認識手段の音声認識動作中に、基準信号検出手
段が基準信号を検出した場合は、前記音声認識動作を中
断し、前記基準信号が検出されなくなった後に前記音声
認識手段の音声認識動作を再開させる制御手段を有する
ことを特徴とする音声認識制御装置。 - 【請求項4】入力部から入力された音声を認識する音声
認識手段と、 データを音に復号して出力し且つ前記出力に基準信号を
重畳させて出力する音出力手段からの出力を前記入力部
から受け、前記出力に含まれる基準信号を検出する基準
信号検出手段と、 前記音声認識手段に設けられた区間検出手段であって、
入力部から入力された音声の始端および終端を検出する
区間検出手段と、 前記音声認識手段の音声認識動作中に、基準信号検出手
段が基準信号を検出した場合で、且つ、前記音声認識手
段に設けられた区間検出手段が入力音声の終端の検出を
終了していない場合は、前記音声認識手段の認識動作を
中断し、前記基準信号が検出されなくなった後に前記音
声認識手段の音声認識動作を再開させ、前記音声認識手
段の音声認識動作中に、基準信号検出手段が基準信号を
検出した場合で、且つ、前記音声認識手段に設けられた
区間検出手段が入力音声の終端の検出を終了している場
合は、前記音声認識手段の認識動作を続行させる制御を
行う制御手段を有することを特徴とする音声認識制御装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11258220A JP3023365B2 (ja) | 1999-09-13 | 1999-09-13 | 音声認識制御装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11258220A JP3023365B2 (ja) | 1999-09-13 | 1999-09-13 | 音声認識制御装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2098596A Division JP3023137B2 (ja) | 1990-04-13 | 1990-04-13 | 音声認識制御装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000075896A true JP2000075896A (ja) | 2000-03-14 |
JP3023365B2 JP3023365B2 (ja) | 2000-03-21 |
Family
ID=17317195
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11258220A Expired - Lifetime JP3023365B2 (ja) | 1999-09-13 | 1999-09-13 | 音声認識制御装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3023365B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005338454A (ja) * | 2004-05-27 | 2005-12-08 | Toshiba Tec Corp | 音声対話装置 |
JP2018185401A (ja) * | 2017-04-25 | 2018-11-22 | トヨタ自動車株式会社 | 音声対話システムおよび音声対話方法 |
JP2019045532A (ja) * | 2017-08-29 | 2019-03-22 | アルパイン株式会社 | 音声認識装置、車載システム及びコンピュータプログラム |
WO2021100555A1 (ja) * | 2019-11-21 | 2021-05-27 | ソニーグループ株式会社 | 情報処理システム、情報処理装置、情報処理方法及びプログラム |
-
1999
- 1999-09-13 JP JP11258220A patent/JP3023365B2/ja not_active Expired - Lifetime
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005338454A (ja) * | 2004-05-27 | 2005-12-08 | Toshiba Tec Corp | 音声対話装置 |
JP2018185401A (ja) * | 2017-04-25 | 2018-11-22 | トヨタ自動車株式会社 | 音声対話システムおよび音声対話方法 |
JP2019045532A (ja) * | 2017-08-29 | 2019-03-22 | アルパイン株式会社 | 音声認識装置、車載システム及びコンピュータプログラム |
WO2021100555A1 (ja) * | 2019-11-21 | 2021-05-27 | ソニーグループ株式会社 | 情報処理システム、情報処理装置、情報処理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP3023365B2 (ja) | 2000-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7069221B2 (en) | Non-target barge-in detection | |
JP3284832B2 (ja) | 音声認識対話処理方法および音声認識対話装置 | |
JPS6250839B2 (ja) | ||
JP2008033198A (ja) | 音声対話システム、音声対話方法、音声入力装置、プログラム | |
JP3023365B2 (ja) | 音声認識制御装置 | |
KR102417899B1 (ko) | 차량의 음성인식 시스템 및 방법 | |
JP5375423B2 (ja) | 音声認識システム、音声認識方法および音声認識プログラム | |
JP3916861B2 (ja) | 音声認識装置 | |
JP2006058390A (ja) | 音声認識装置 | |
JPH08263092A (ja) | 応答音声生成方法および音声対話システム | |
JP2019132997A (ja) | 音声処理装置、方法およびプログラム | |
JP2006251061A (ja) | 音声対話装置および音声対話方法 | |
JP3023137B2 (ja) | 音声認識制御装置 | |
JP2006039382A (ja) | 音声認識装置 | |
JP4810343B2 (ja) | 音声処理装置およびその制御方法 | |
JP2754960B2 (ja) | 音声認識装置 | |
JP3588929B2 (ja) | 音声認識装置 | |
JPH02103599A (ja) | 音声認識装置 | |
KR20040082756A (ko) | 비음성 제거에 의한 음성 추출 방법 | |
JP2004037803A (ja) | 応答制御装置、方法及び応答制御プログラム、記録媒体 | |
JP2656234B2 (ja) | 会話音声理解方法 | |
JP2018091911A (ja) | 音声対話システム及び音声対話方法 | |
JP2008136530A (ja) | 録音データ自動出力システム | |
JP2002006881A (ja) | 音声認識による制御装置 | |
JP2000155600A (ja) | 音声認識システムおよび入力音声レベル警告方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19991214 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080114 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090114 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100114 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110114 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110114 Year of fee payment: 11 |