JP2000075896A - 音声認識制御装置 - Google Patents

音声認識制御装置

Info

Publication number
JP2000075896A
JP2000075896A JP11258220A JP25822099A JP2000075896A JP 2000075896 A JP2000075896 A JP 2000075896A JP 11258220 A JP11258220 A JP 11258220A JP 25822099 A JP25822099 A JP 25822099A JP 2000075896 A JP2000075896 A JP 2000075896A
Authority
JP
Japan
Prior art keywords
reference signal
output
unit
input
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11258220A
Other languages
English (en)
Other versions
JP3023365B2 (ja
Inventor
Takayuki Fujimoto
教幸 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP11258220A priority Critical patent/JP3023365B2/ja
Publication of JP2000075896A publication Critical patent/JP2000075896A/ja
Application granted granted Critical
Publication of JP3023365B2 publication Critical patent/JP3023365B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 誤認識の発生を防止する。 【解決手段】 入力部(1)から入力された音声を認識す
る音声認識手段(4)と、データを音に復号して出力し且
つ前記出力に基準信号を重畳させて出力する音出力手段
からの出力を前記入力部から受け、前記出力に含まれる
基準信号を検出する基準信号検出手段と、前記音声認識
手段(4)の音声認識動作中に、基準信号検出手段が基準
信号を検出した場合は、前記入力部からの入力を無効と
し、前記基準信号が検出されなくなった後に、前記入力
部からの入力を有効にする制御手段よりなる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力音声の認識を
行なう音声認識制御装置に関する。
【0002】音声出力部を有する音声認識装置において
は、音声出力したものが音声入力部のマイクに入って、
誤って音声認識が行なわれるケースがあった。特に、何
を入力すべきかを音声ガイダンスにより指示する場合
や、音声認識結果の出力を音声出力部によって行なう装
置の場合には、その装置から出力した音声がマイクに入
り込み、誤動作の原因となっていた。
【0003】また、音声出力部をもたない音声認識装置
において、前記音声出力部を有する装置が近接して設け
られている場合にも誤入力が生じる。
【0004】したがって、このような誤入力をなくする
ことが必要である。
【0005】
【従来の技術】従来の音声認識装置としては、例えば図
15に示すようなものがある。
【0006】図15において、1は音声入力部であるマ
イクであり、マイク1から入力する音声は、アンプ2で
増幅され、A/D変換器3によりデジタル信号に変換さ
れた後に、認識部4により音声の認識が行なわれる。認
識部4は入力するデジタル信号の特徴を抽出し、標準パ
ターンメモリからパターン照合を行なって認識したデー
タを制御部5に出力し、制御部5は認識したデータを上
位装置に送る。
【0007】6は波形符号化データを格納するメモリで
あり、メモリ6には波形符号化データとして、例えば音
声ガイダンスのための固定したメッセージを示すデータ
などが格納される。この符号化データは復号部7により
復号され、D/A変換器8よりアナログ信号に変換さ
れ、アンプ9により増幅された後にスピーカ10から音
声出力される。
【0008】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の音声認識制御装置にあっては、話者が発声し
ていないのに、音声出力が入力して認識結果が出力され
たり、また、入力のために発声した音声と音声出力が重
なり、誤認識の原因となるという問題点があった。
【0009】本発明は、このような従来の問題点に鑑み
てなされたものであって、誤入力を防止することで誤認
識の発生を防止するようにした音声認識制御装置を提供
することを目的としている。
【0010】
【課題を解決するための手段】請求項1の発明(図1
1、参照)は、入力部から入力された音声を認識する音
声認識手段と、データを音に復号して出力し且つ前記出
力に基準信号を重畳させて出力する音出力手段からの出
力を前記入力部から受け、前記出力に含まれる基準信号
を検出する基準信号検出手段と、前記音声認識手段の音
声認識動作中に、基準信号検出手段が基準信号を検出し
た場合は、前記入力部からの入力を無効とし、前記基準
信号が検出されなくなった後に、前記入力部からの入力
を有効にする制御手段を有する。
【0011】請求項2の発明(図11の変形)は、入力
部から入力された音声を認識する音声認識手段と、デー
タを音に復号して出力し且つ前記出力に基準信号を重畳
させて出力する音出力手段と、前記音出力手段からの出
力を前記入力部から受け、前記出力に含まれる基準信号
を検出する基準信号検出手段と、前記音声認識手段の音
声認識動作中に、基準信号検出手段が基準信号を検出し
た場合は、前記入力部からの入力を無効とし、前記基準
信号が検出されなくなった後に、前記入力部からの入力
を有効にする制御手段を有する。
【0012】請求項3の発明(図12、参照)入力部か
ら入力された音声を認識する音声認識手段と、データを
音に復号して出力し且つ前記出力に基準信号を重畳させ
て出力する音出力手段からの出力を前記入力部から受
け、前記出力に含まれる基準信号を検出する基準信号検
出手段と、前記音声認識手段の音声認識動作中に、基準
信号検出手段が基準信号を検出した場合は、前記音声認
識動作を中断し、前記基準信号が検出されなくなった後
に前記音声認識手段の音声認識動作を再開させる制御手
段を有する。
【0013】請求項4の発明(図13、参照)入力部か
ら入力された音声を認識する音声認識手段と、データを
音に復号して出力し且つ前記出力に基準信号を重畳させ
て出力する音出力手段からの出力を前記入力部から受
け、前記出力に含まれる基準信号を検出する基準信号検
出手段と、前記音声認識手段に設けられた区間検出手段
であって、入力部から入力された音声の始端および終端
を検出する区間検出手段と、前記音声認識手段の音声認
識動作中に、基準信号検出手段が基準信号を検出した場
合で、且つ、前記音声認識手段に設けられた区間検出手
段が入力音声の終端の検出を終了していない場合は、前
記音声認識手段の認識動作を中断し、前記基準信号が検
出されなくなった後に前記音声認識手段の音声認識動作
を再開させ、前記音声認識手段の音声認識動作中に、基
準信号検出手段が基準信号を検出した場合で、且つ、前
記音声認識手段に設けられた区間検出手段が入力音声の
終端の検出を終了している場合は、前記音声認識手段の
認識動作を続行させる制御を行う制御手段を有する。
【0014】
【発明の実施の形態】以下、本発明の実施形態を図面に
基づいて説明する。
【0015】図2および図3は本発明の第1実施形態を
示す図である。
【0016】図2において、1は音声の入力を行なうマ
イク、1Aは音声入力を切断するマイクスイッチ、2は
入力した音声を増幅するアンプ、3はアンプ2の出力信
号をデジタル信号に変換するA/D変換器、4はA/D
変換器3で変換したデジタル信号の音声認識を行なう認
識部であり、これらが音声を入力してそれを認識する第
1手段11を構成している。
【0017】認識部4は図3に示すように、入力するデ
ータの特徴を抽出する特徴抽出部4Aと、標準パターン
を格納してある標準パターンメモリ4Bと、入力データ
の始端および終端を検出する区間検出部4Cと、パター
ンの照合を行なうパターン照合部4Dを有している。
【0018】6はメモリであり、メモリ6内には、例え
ば音声ガイダンスのメッセージを示す波形符号化データ
が格納されている。
【0019】7は波形符号化データを復号する復号部、
8は復号したデジタル信号をアナログ信号に変換するD
/A変換器、9は変換したアナログ信号を増幅するアン
プ、10は増幅した音声を出力するスピーカであり、こ
れらが波形符号化データを音声に復号してこれを出力す
る第2手段12を構成している。
【0020】5は制御手段としての制御部であり、制御
部5は上位装置に認識部4の出力データを送るとともに
上位装置の指示を受けて、前記第1手段11および第2
手段12を制御する。
【0021】13は復号部7の出力を検出する音声検出
部であり、音声検出部13は音声出力が開始されたとき
これを検出して、停止信号をマイクスイッチ1Aに出力
してマイク入力を切断する。音声検出部13は、第1手
段11の動作を停止させる第3手段を構成している。
【0022】本実施形態においては、復号部7から音声
出力が開始されると、音声検出部13はこれを検出し
て、停止信号をマイクスイッチ1Aに出力し、マイク入
力を切断するので、音声出力中は音声が入力されなくな
る。したがって、誤入力を防止することができ、その結
果、誤認識の発生を防止することができる。
【0023】図4は本発明の第2実施形態を示す図であ
る。
【0024】図4において、13はアンプ9の音声出力
を検出する音声検出部、14はしきい値が格納されてい
るメモリ、15は音声検出部(第3手段)13で検出し
た出力パワーとしきい値を比較し、出力パワーがしきい
値を越えるとき、停止信号をマイクスイッチ1Aに出力
する比較部である。
【0025】本実施形態においては、音声出力のパワー
がしきい値を越えるとき、マイク出力を切断するので、
誤入力を防止することができる。その結果、前記実施形
態と同様な効果を得ることができる。
【0026】図5は本発明の第3実施形態である。
【0027】図5において、13Aは音声検出部(第4
手段)であり、音声検出部13Aは復号部7に接続さ
れ、音声出力を検出すると、認識部4に対してセット信
号およびリセット信号を出力する。
【0028】この実施形態においては、認識部4が動作
中に音声出力が開始された場合には、認識部4の動作を
一時的に中止して、初期状態に戻し、音声出力が終了後
に再度認識動作を開始させる。本実施形態においても前
記実施形態と同様な効果を得ることができる。
【0029】なお、この実施形態では、マイク1、アン
プ2、A/D変換器3、および認識部4が音声を入力
し、認識する第1手段11を構成している。
【0030】次に、図6は本発明の第4実施形態を示す
図である。
【0031】図6において、13Aはアンプ9の音声出
力を検出する音声検出部、14はしきい値を格納してお
くメモリ、15は音声出力のパワーとしきい値を比較し
て認識部4にセット信号およびリセット信号を出力する
比較部である。
【0032】本実施形態においては、認識部4が動作中
に音声出力のパワーがしきい値を越えるときは、認識部
4の動作を一時的に中断し、音声出力の終了後に再度認
識動作を開始させる。本実施形態においても、前記実施
形態と同様な効果を得ることができる。
【0033】次に、図7〜図9は本発明の第5実施形態
を示す図である。
【0034】図7において、13Bは復号部7に接続さ
れる音声検出部であり、音声検出部(第5手段)13C
は図8に示す区間検出部4Cから入力音声の始端および
終端が入力する判別部4Eにセット信号およびリセット
信号を出力する。
【0035】本実施形態においては、認識部4が動作中
に音声出力が開始された場合で、かつ、認識部4で入力
音声の終端を検出していない場合には、認識動作を中断
し、初期状態に戻し、音声出力の終了後に、再度認識動
作を開始させる。
【0036】この場合の処理の流れは、図9(A)に示
され、また、入力音声の終端を検出後に音声出力が開始
されたときは、認識動作の中断を行なわない場合は、図
9(B)に示される。
【0037】次に、図10は本発明の第6実施形態を示
す図である。
【0038】図10において、13Bはアンプ9に接続
される音声検出部、14はしきい値を格納しておくメモ
リ、15はしきい値と音声出力のパワーを比較する比較
部である。
【0039】本実施形態においては、認識部4が動作中
に音声出力のパワーがしきい値を越えたときであって、
入力音声の終端が検出されていないときは、認識動作を
一時中断し、音声出力のパワーがしきい値以下となった
とき、再度認識動作を開始する。
【0040】本実施形態においても前記実施形態と同様
な効果を得ることができる。
【0041】次に、図11は本発明の第7実施形態を示
す図である。
【0042】図11において、13Cはアンプ2からの
音声が入力する基準信号検出部(第3手段)であり、基
準信号検出部13Cは、入力する音声のうちの基準信号
を検出してマイクスイッチ1Aを切断する。
【0043】基準信号は、音声出力部を備えた装置が近
接した場所で使用される場合に、その装置からの音声出
力が入力するのを防止するために、その音声出力に重畳
されるものであって、基準信号としては、PB音、低周
波(例えば20Hz)、または高周波(例えば20KH
z)の正弦波などを用いる。
【0044】本実施形態においても前記実施形態と同様
な効果が得られる。なお、本実施形態においては、符号
化データを音声に復号しこれを出力する第2手段12は
設けられていないが、設けられている場合にも同様の効
果が得られる。
【0045】図12は本実施形態の第8実施形態を示す
図である。
【0046】図12において、13Cはアンプ2の出力
の中から基準信号を検出する基準信号検出部であり、基
準信号検出部13Cは、認識部4に対してセット信号お
よびリセット信号を出力する。
【0047】本実施形態においては、認識部4が動作中
に音声入力に基準信号が検出されたときに、認識部4の
動作を一時的に中断し、音声入力に基準信号が含まれな
くなったら、再度認識動作を開始する。
【0048】本実施形態においても前記実施形態と同様
な効果を得ることができる。
【0049】図13および図14は本発明の第9実施形
態を示す図である。
【0050】図13において、4Eは区間検出部4Cか
ら入力音声の始端信号および終端信号が入力する判断
部、13Cは判断部4Eにセット信号およびリセット信
号を出力する基準信号検出部である(図8、参照)。
【0051】本実施形態においては、認識部4が動作中
に入力に基準信号が検出された場合で、かつ、認識部4
で入力音声の終端が検出されないときは、認識動作を中
断し、初期状態に戻し、入力に基準信号が含まれなくな
ったら、再度認識動作を開始する。
【0052】図14(A),(B)に処理の流れを示
す。
【0053】本実施形態においても前記実施形態と同様
な効果を得ることができる。
【0054】
【発明の効果】以上説明してきたように、本発明によれ
ば、音声出力または入力に基準信号を検出したときは、
音声入力部または認識部の動作を停止または一時的に中
断するようにしたため、誤入力を防止することができ、
誤認識の発生を防止することができる。
【図面の簡単な説明】
【図1】本発明の原理説明図
【図2】本発明の第1実施形態を示す図
【図3】認識部の構成図
【図4】本発明の第2実施形態を示す図
【図5】本発明の第3実施形態を示す図
【図6】本発明の第4実施形態を示す図
【図7】本発明の第5実施形態を示す図
【図8】他の認識部の構成図
【図9】(A),(B)は処理の流れの説明図
【図10】本発明の第6実施形態を示す図
【図11】本発明の第7実施形態を示す図
【図12】本発明の第8実施形態を示す図
【図13】本発明の第9実施形態を示す図
【図14】他の処理の流れの説明図
【図15】従来例を示す図
【符号の説明】 1…マイク 1A…マイクスイッチ 2…アンプ 3…A/D変換器 4…認識部 4A…特徴抽出部 4B…標準パターンメモリ 4C…区間検出部 4D…パターン照合部 4E…判断部 5…制御部(制御手段) 6…メモリ 7…復号部 8…D/A変換部 9…アンプ 10…スピーカ 11…第1手段 12…第2手段 13,13A,13B…音声検出部 13C…基準信号検出部 14…しきい値メモリ 15…比較部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】入力部から入力された音声を認識する音声
    認識手段と、 データを音に復号して出力し且つ前記出力に基準信号を
    重畳させて出力する音出力手段からの出力を前記入力部
    から受け、前記出力に含まれる基準信号を検出する基準
    信号検出手段と、 前記音声認識手段の音声認識動作中に、基準信号検出手
    段が基準信号を検出した場合は、前記入力部からの入力
    を無効とし、前記基準信号が検出されなくなった後に、
    前記入力部からの入力を有効にする制御手段を有するこ
    とを特徴とする音声認識制御装置。
  2. 【請求項2】入力部から入力された音声を認識する音声
    認識手段と、 データを音に復号して出力し且つ前記出力に基準信号を
    重畳させて出力する音出力手段と、 前記音出力手段からの出力を前記入力部から受け、前記
    出力に含まれる基準信号を検出する基準信号検出手段
    と、 前記音声認識手段の音声認識動作中に、基準信号検出手
    段が基準信号を検出した場合は、前記入力部からの入力
    を無効とし、前記基準信号が検出されなくなった後に、
    前記入力部からの入力を有効にする制御手段を有するこ
    とを特徴とする音声認識制御装置。
  3. 【請求項3】入力部から入力された音声を認識する音声
    認識手段と、 データを音に復号して出力し且つ前記出力に基準信号を
    重畳させて出力する音出力手段からの出力を前記入力部
    から受け、前記出力に含まれる基準信号を検出する基準
    信号検出手段と、 前記音声認識手段の音声認識動作中に、基準信号検出手
    段が基準信号を検出した場合は、前記音声認識動作を中
    断し、前記基準信号が検出されなくなった後に前記音声
    認識手段の音声認識動作を再開させる制御手段を有する
    ことを特徴とする音声認識制御装置。
  4. 【請求項4】入力部から入力された音声を認識する音声
    認識手段と、 データを音に復号して出力し且つ前記出力に基準信号を
    重畳させて出力する音出力手段からの出力を前記入力部
    から受け、前記出力に含まれる基準信号を検出する基準
    信号検出手段と、 前記音声認識手段に設けられた区間検出手段であって、
    入力部から入力された音声の始端および終端を検出する
    区間検出手段と、 前記音声認識手段の音声認識動作中に、基準信号検出手
    段が基準信号を検出した場合で、且つ、前記音声認識手
    段に設けられた区間検出手段が入力音声の終端の検出を
    終了していない場合は、前記音声認識手段の認識動作を
    中断し、前記基準信号が検出されなくなった後に前記音
    声認識手段の音声認識動作を再開させ、前記音声認識手
    段の音声認識動作中に、基準信号検出手段が基準信号を
    検出した場合で、且つ、前記音声認識手段に設けられた
    区間検出手段が入力音声の終端の検出を終了している場
    合は、前記音声認識手段の認識動作を続行させる制御を
    行う制御手段を有することを特徴とする音声認識制御装
    置。
JP11258220A 1999-09-13 1999-09-13 音声認識制御装置 Expired - Lifetime JP3023365B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11258220A JP3023365B2 (ja) 1999-09-13 1999-09-13 音声認識制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11258220A JP3023365B2 (ja) 1999-09-13 1999-09-13 音声認識制御装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2098596A Division JP3023137B2 (ja) 1990-04-13 1990-04-13 音声認識制御装置

Publications (2)

Publication Number Publication Date
JP2000075896A true JP2000075896A (ja) 2000-03-14
JP3023365B2 JP3023365B2 (ja) 2000-03-21

Family

ID=17317195

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11258220A Expired - Lifetime JP3023365B2 (ja) 1999-09-13 1999-09-13 音声認識制御装置

Country Status (1)

Country Link
JP (1) JP3023365B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005338454A (ja) * 2004-05-27 2005-12-08 Toshiba Tec Corp 音声対話装置
JP2018185401A (ja) * 2017-04-25 2018-11-22 トヨタ自動車株式会社 音声対話システムおよび音声対話方法
JP2019045532A (ja) * 2017-08-29 2019-03-22 アルパイン株式会社 音声認識装置、車載システム及びコンピュータプログラム
WO2021100555A1 (ja) * 2019-11-21 2021-05-27 ソニーグループ株式会社 情報処理システム、情報処理装置、情報処理方法及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005338454A (ja) * 2004-05-27 2005-12-08 Toshiba Tec Corp 音声対話装置
JP2018185401A (ja) * 2017-04-25 2018-11-22 トヨタ自動車株式会社 音声対話システムおよび音声対話方法
JP2019045532A (ja) * 2017-08-29 2019-03-22 アルパイン株式会社 音声認識装置、車載システム及びコンピュータプログラム
WO2021100555A1 (ja) * 2019-11-21 2021-05-27 ソニーグループ株式会社 情報処理システム、情報処理装置、情報処理方法及びプログラム

Also Published As

Publication number Publication date
JP3023365B2 (ja) 2000-03-21

Similar Documents

Publication Publication Date Title
US7069221B2 (en) Non-target barge-in detection
JP3284832B2 (ja) 音声認識対話処理方法および音声認識対話装置
JPS6250839B2 (ja)
JP2008033198A (ja) 音声対話システム、音声対話方法、音声入力装置、プログラム
JP3023365B2 (ja) 音声認識制御装置
KR102417899B1 (ko) 차량의 음성인식 시스템 및 방법
JP5375423B2 (ja) 音声認識システム、音声認識方法および音声認識プログラム
JP3916861B2 (ja) 音声認識装置
JP2006058390A (ja) 音声認識装置
JPH08263092A (ja) 応答音声生成方法および音声対話システム
JP2019132997A (ja) 音声処理装置、方法およびプログラム
JP2006251061A (ja) 音声対話装置および音声対話方法
JP3023137B2 (ja) 音声認識制御装置
JP2006039382A (ja) 音声認識装置
JP4810343B2 (ja) 音声処理装置およびその制御方法
JP2754960B2 (ja) 音声認識装置
JP3588929B2 (ja) 音声認識装置
JPH02103599A (ja) 音声認識装置
KR20040082756A (ko) 비음성 제거에 의한 음성 추출 방법
JP2004037803A (ja) 応答制御装置、方法及び応答制御プログラム、記録媒体
JP2656234B2 (ja) 会話音声理解方法
JP2018091911A (ja) 音声対話システム及び音声対話方法
JP2008136530A (ja) 録音データ自動出力システム
JP2002006881A (ja) 音声認識による制御装置
JP2000155600A (ja) 音声認識システムおよび入力音声レベル警告方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19991214

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080114

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090114

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100114

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110114

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110114

Year of fee payment: 11