JPH0635497A - 音声入力装置 - Google Patents

音声入力装置

Info

Publication number
JPH0635497A
JPH0635497A JP4210702A JP21070292A JPH0635497A JP H0635497 A JPH0635497 A JP H0635497A JP 4210702 A JP4210702 A JP 4210702A JP 21070292 A JP21070292 A JP 21070292A JP H0635497 A JPH0635497 A JP H0635497A
Authority
JP
Japan
Prior art keywords
voice
guidance
level
noise level
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4210702A
Other languages
English (en)
Inventor
Mizuhiro Hida
瑞広 飛田
Yoshitake Suzuki
義武 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP4210702A priority Critical patent/JPH0635497A/ja
Publication of JPH0635497A publication Critical patent/JPH0635497A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 周囲騒音が大きく変動するときでも良好なヒ
ューマンマシンインターフェースを確保し高い認識性能
を提供する音声入力装置を提供することを目的とする。 【構成】 音声ガイダンスにしたがって被認識単語を発
声し、該音声ガイダンスが終了した直後から前記被認識
単語が発声されるまでの期間内の周囲の騒音レベルを測
定し、入力される被認識単語音声の区間を検出するため
の第1のしきい値を前記騒音レベルに従って適応的に設
定する音声入力装置において、前記騒音レベルが調節可
能な第2のしきい値を越えるときはその旨を音声ガイダ
ンスにより使用者に知らせて音声入力を制限し、騒音レ
ベルが前記第2のしきい値以下となったときに被認識単
語の音声入力ができるように構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声認識装置を特に周
囲騒音が大きくかつ変動している場所で使用したとき
に、良好なヒューマンマシンインタフェースを確保し、
高い認識性能を得る音声入力装置に関する。
【0002】
【従来の技術】情報の伝達手段としては、一般的には手
で操作するタイプライタや押しボタン等に比べて、音声
を用いた場合の方が伝送速度や操作性の点で優れてい
る。音声を情報伝達の手段に用いる場合には、伝達する
相手が機械の場合、発声音声の内容を正しく認識してや
るための音声認識装置が必要となる。
【0003】一般に、音声認識装置の使用環境は、静寂
な室内だけでなく騒音が大きくかつ変動している場所に
おいても使用される。従来の音声認識装置においては、
使用者に発声のタイミングを案内することと、発声のタ
イミングに合った周囲の騒音レベルを検出し測定するた
めに、音声ガイダンスを出力することにより、この出力
終了の時刻を基準として騒音レベルの測定並びに発話の
タイミングを指定して、音声認識装置に取り込む手段が
講じられていた。
【0004】図3は、従来例による上記した各状態のタ
イムチャートを示したものである。該図に於てその動作
を説明する。まず、コントローラによって音声ガイダン
スを出力するための起動が掛かり、使用者に発声を促す
ための音声ガイダンス、ここでは“発声をどーぞ”とい
うメッセージが出力される。ガイダンスの終了と同時に
騒音レベルの測定がコントローラによって起動され開始
される。騒音の測定は、“発声をどーぞ”というガイダ
ンス音声の終了に対して、使用者の発声のタイミングを
失しない0.5秒程度の短時間で行われる。騒音レベル
の測定後に、測定の終了を知らせるためのガイド音、例
えば“ピッ”という音が出力される場合もあるし、又こ
れを出力しない構成のものもあるが、いずれにしても騒
音レベルの測定終了とほぼ同時に、音声認識装置はある
一定期間の間例えば約10秒から20秒の間は音声入力
待の状態となる。
【0005】通常は、この期間内に被認識単語が発声さ
れて認識装置へ取り込まれ、音声認識を行うための処理
が実行される手順となる。
【0006】一方、発声環境での周囲の騒音レベルを測
定する必要性は、以下の点にある。すなわち、音声認識
を行う場合は、音声と騒音のレベル比(いわゆるSN
比)がある値以上となることが良い認識結果を得るため
の大切な条件となる。そこで、この条件をクリヤするた
めに周囲騒音のレベルに依存して、発声される音声レベ
ルのしきい値を適応的に可変設定する方式が一般的に採
用される。すなわち、騒音レベルが大きい場合は、被認
識音声の発声レベルも大きいことが十分なSN比を確保
するために必要であり、一方騒音レベルが小さければ発
声レベルは普通のレベルでも十分なSN比が確保され
て、その音声が認識装置へ入力されることとなる。
【0007】しかしこの場合、以下に述べるような問題
が生じて来る。すなわち、図3に示した音声ガイダンス
の発声終了間際にたまたま大きな騒音が発生し、これが
騒音測定の期間中に及んだ場合で、その後騒音の発生が
収まって音声の入力待になるという状態である。この様
な一時的に大きな騒音が発生する場面は、一般の室内に
おいては電話の呼び出し音やドアのバタンと締まる音
等、自動車の中などで有れば、クラクションや大形車両
の通過音等種々の例を挙げることが出来る。
【0008】従って、このような場合においても測定さ
れた騒音レベルが基準となって、音声入力レベルのしき
い値が設定されることとなるため、話者が発声する時点
に於て周囲騒音が比較的小となった場合でも先に測定さ
れた騒音レベルを上回る発声レベルを要求されることと
なる。さらに、これをクリヤ出来るレベルの大声で発声
して認識装置へ入力出来たとしても、ここで生じた発声
変形のために正しく認識される確率は大幅に低減してし
まうということと、この動作の内容を理解していない使
用者にとっては、周囲の騒音レベルが小さくなったのに
符合して、発声レベルを小さめに調整するため、図3に
示した音声入力待時間の間中、例えば10秒とか20秒
の期間は、何の応答もなくなり使用者に多大の不安感を
生じせしめるという使用上の大きな欠点を有していた。
【0009】
【発明が解決しようとする課題】本発明は上記欠点を改
善し、周囲騒音が大きく変動するときでも良好なヒュー
マンマシンインタフェースを確保し高い認識性能を提供
する音声入力装置を提供することを目的とする。
【0010】
【課題を解決するための手段】本発明の特徴は、音声ガ
イダンスにしたがって被認識単語を発声し、該音声ガイ
ダンスが終了した直後から前記被認識単語が発声される
までの期間内の周囲の騒音レベルを測定し、入力される
被認識単語音声の区間を検出するための第1のしきい値
を前記騒音レベルに従って適応的に設定する音声入力装
置において、前記騒音レベルが調節可能な第2のしきい
値を越えるときはその旨を音声ガイダンスにより使用者
に知らせて音声入力を制限し、騒音レベルが前記第2の
しきい値以下となったときに被認識単語の音声入力がで
きるように構成した音声入力装置にある。
【0011】
【作用】本発明は周囲の騒音レベルを測定した結果に応
じて被認識音声の発声を促すか、否かの判定を行いこれ
を音声ガイダンスもしくは表示器等により使用者に知ら
しめる事によって、音声認識装置使用時のヒューマンマ
シンインタフェースの向上と併せて、実用上十分な認識
性能を得るための音声入力装置を実現しようとするもの
である。
【0012】従来例で示した騒音レベルの測定までのタ
イムチャートによる手順は、そのまま踏襲できるもので
ある。
【0013】ここで本発明のポイントは、予め設定した
第2のしきい値レベル以上の騒音が検出された場合に
は、発声を促すメッセージを出力することに代えて、周
囲の騒音レベルが高い旨の適切なガイダンスをタイミン
グ良く出力して、使用者に知らしめることにある。
【0014】
【実施例】以下に本発明の実施例について詳細に説明す
る。図1は、本発明の一実施例を説明するための音声入
力装置の構成図、図2はその動作のフローを示したもの
である。
【0015】図1において、1は使用者の音声並びに周
囲騒音を電気信号に変換するためのマイクロホン、2は
コントローラで3のガイダンス音声出力部の起動や、4
の騒音や音声の音響レベルの測定を行わしめるための起
動や、終了状態を検知し制御するための動作を行う。5
はスピーカで、ガイダンス音声の電気信号を音響信号に
変換するもの、6は騒音や音声の音響レベルを視認する
ためのレベル表示部、7はマイク1に入力された音声を
認識する音声認識部である。このような構成に於て、そ
の動作を図2に示したフローに従って以下に説明する。
【0016】まず、音声入力を行うためのスタート起動
が、例えば音声による制御語の入力あるいはキー入力等
によってコントローラ2で掛けられると、ガイダンス音
声出力部3から例えば“発声をどーぞ”というメッセー
ジがスピーカ5から出力され、使用者がこれを聴取する
ことにより発声を開始する準備を行う。このとき、カウ
ンタnを0に設定する。
【0017】前述した“発声をどーぞ”というガイダン
ス音声の出力終了と同時にコントローラ2は、騒音、音
声レベルの測定部4に対して、音響レベル測定の開始起
動をかけ周囲騒音レベルの測定を行う。つぎに、騒音レ
ベルの測定結果は、ディスプレー等のレベル表示部6に
表示されて視覚的に確認出来ると共に、その値が事前に
設定したしきい値(第2のしきい値)を超過していた場
合は、カウンタnを1個加算した後ガイダンス音声出力
部3より、例えば“騒音レベルが高すぎます、ちょっと
お待ち下さい”というガイダンスを出力後、適当な時間
経過後再度周囲騒音レベルの測定を行いしきい値に対す
る判定を行う。それでもまだ騒音レベルがしきい値以上
である場合は、例えばカウンタnの値が5以上となった
処で、“騒音源から遠ざかる等の処置を取るよう”ガイ
ダンス音声を出力し、騒音レベルの低減策を講ずるよう
使用者に注意を促す。
【0018】一方、騒音レベルの測定結果がしきい値以
下で有れば、カウンタはn≧1であるので“発声をどー
ぞ”というガイダンス音声を出力し、使用者に被認識単
語の発声を促す。ここで発声された音声は、音声認識部
へ入力されて音声認識の処理が開始される。
【0019】なお、最初の騒音レベルの測定結果が、事
前に設定したしきい値よりも小の場合は、カウンタはn
=0であるので、頭書のガイダンス音声がそのまま有効
となるので、非認識単語の発声待の状態に遷移する。こ
の時使用者は、非認識単語を発声することとなり、その
出力が音声認識部へ入力される。
【0020】さらに、事前に設定する騒音レベルのしき
い値は、装置を出荷するときに収音系の利得を考慮して
決定する方法の他に、装置を使用する場合に手動で設定
することも可能である。手動によるしきい値の設定法と
しては、音声認識装置を使用したい騒音環境下に配置し
て、使用者が騒音レベルの使用限界と判断する騒音が発
生しているときに、例えば“リセットボタン”あるいは
“しきい値レベル設定ボタン”等を押下することによ
り、このときマイクに入力されている騒音レベルの測定
結果を新しいしきい値とするように設定するものであ
る。この方法の利点は、例えば装置に付属しているマイ
クの感度が変化した場合や、使用するマイクを異なった
機種に変更した場合のいわゆる入力系の利得に変動を生
じた場合のしきい値の設定が可能となることや、使用す
る環境の騒音レベルが相対的に大きい場所か小さい場所
か等に適合したしきい値を設定して使用することが出来
ることにある。
【0021】
【発明の効果】以上説明したように、本発明による音声
入力装置を用いることにより、認識装置を使用する場合
の周囲騒音レベルの変動に対応した音声の取り込みを、
事前に設定した騒音レベル以下の時に行うことが可能と
なり、結果として高確度な認識性能を確保することが期
待出来るとともに、騒音レベルが高い場合は、その旨音
声ガイダンスもしくはレベル表示器等で知ることが出来
るため良好なヒューマンマシンインターフェース条件を
満たした装置の実現が可能となる。すなわち、従来例で
みられるような一時的に大きな騒音レベルが発生した場
合には、音声入力の取り込みが事実上不可となるような
しきい値の設定がなされるために、一定の音声入力期間
を無応答状態で待たされるという状態から開放されると
ともに、動作の状態がどのようになっているのかを使用
者が的確に把握できるため、心理的にも良好な状態で使
用することが可能となる特徴を有する。
【図面の簡単な説明】
【図1】本発明による音声入力装置のブロック図であ
る。
【図2】本発明による音声入力装置の動作フローであ
る。
【図3】従来例による状態遷移の説明図である。
【符号の説明】
1 音声並びに騒音を収音するためのマイクロホン 2 コントローラ 3 ガイダンス音声の出力部 4 騒音並びに音声のレベル測定部 5 ガイダンス音声を出力するためのスピーカ 6 レベル表示部 7 音声認識部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 音声ガイダンスにしたがって被認識単語
    を発声し、該音声ガイダンスが終了した直後から前記被
    認識単語が発声されるまでの期間内の周囲の騒音レベル
    を測定し、入力される被認識単語音声の区間を検出する
    ための第1のしきい値を前記騒音レベルに従って適応的
    に設定する音声入力装置において、 前記騒音レベルが調節可能な第2のしきい値を越えると
    きはその旨を音声ガイダンスにより使用者に知らせて音
    声入力を制限し、 騒音レベルが前記第2のしきい値以下となったときに被
    認識単語の音声入力ができるように構成したことを特徴
    とする音声入力装置。
JP4210702A 1992-07-16 1992-07-16 音声入力装置 Withdrawn JPH0635497A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4210702A JPH0635497A (ja) 1992-07-16 1992-07-16 音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4210702A JPH0635497A (ja) 1992-07-16 1992-07-16 音声入力装置

Publications (1)

Publication Number Publication Date
JPH0635497A true JPH0635497A (ja) 1994-02-10

Family

ID=16593685

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4210702A Withdrawn JPH0635497A (ja) 1992-07-16 1992-07-16 音声入力装置

Country Status (1)

Country Link
JP (1) JPH0635497A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001236095A (ja) * 2000-02-23 2001-08-31 Olympus Optical Co Ltd 音声記録装置
WO2004102530A3 (en) * 2003-05-13 2005-03-17 Ultratec Inc Real-time transcription correction system
JP2007199247A (ja) * 2006-01-25 2007-08-09 Kddi Corp 音響分析装置及びコンピュータプログラム、音声認識システム
JP2008102384A (ja) * 2006-10-20 2008-05-01 Fujitsu Ltd 音声入力支援プログラム、音声入力支援装置、音声入力支援方法
JP2008170806A (ja) * 2007-01-12 2008-07-24 Yamaha Corp 発音期間を特定する音信号処理装置およびプログラム
JP2008531359A (ja) * 2005-02-17 2008-08-14 ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング 自動車における機器またはシステムの音声制御方法および装置
JP2010237269A (ja) * 2009-03-30 2010-10-21 Toshiba Corp 音声認識装置、その方法及びそのプログラム
JP2013531273A (ja) * 2010-06-03 2013-08-01 ジョンソン コントロールズ テクノロジー カンパニー スピーカ及びマイクロホンを備える音声認識システムを調整する方法、及び音声認識システム
US9378737B2 (en) 2012-11-05 2016-06-28 Mitsubishi Electric Corporation Voice recognition device
WO2016136044A1 (ja) * 2015-02-23 2016-09-01 ソニー株式会社 情報処理システムおよび情報処理方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7164753B2 (en) 1999-04-08 2007-01-16 Ultratec, Incl Real-time transcription correction system
JP2001236095A (ja) * 2000-02-23 2001-08-31 Olympus Optical Co Ltd 音声記録装置
WO2004102530A3 (en) * 2003-05-13 2005-03-17 Ultratec Inc Real-time transcription correction system
JP2008531359A (ja) * 2005-02-17 2008-08-14 ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング 自動車における機器またはシステムの音声制御方法および装置
JP2007199247A (ja) * 2006-01-25 2007-08-09 Kddi Corp 音響分析装置及びコンピュータプログラム、音声認識システム
JP2008102384A (ja) * 2006-10-20 2008-05-01 Fujitsu Ltd 音声入力支援プログラム、音声入力支援装置、音声入力支援方法
JP2008170806A (ja) * 2007-01-12 2008-07-24 Yamaha Corp 発音期間を特定する音信号処理装置およびプログラム
JP2010237269A (ja) * 2009-03-30 2010-10-21 Toshiba Corp 音声認識装置、その方法及びそのプログラム
JP2013531273A (ja) * 2010-06-03 2013-08-01 ジョンソン コントロールズ テクノロジー カンパニー スピーカ及びマイクロホンを備える音声認識システムを調整する方法、及び音声認識システム
US10115392B2 (en) 2010-06-03 2018-10-30 Visteon Global Technologies, Inc. Method for adjusting a voice recognition system comprising a speaker and a microphone, and voice recognition system
US9378737B2 (en) 2012-11-05 2016-06-28 Mitsubishi Electric Corporation Voice recognition device
DE112012007103B4 (de) * 2012-11-05 2017-02-02 Mitsubishi Electric Corporation Spracherkennungsvorrichtung
WO2016136044A1 (ja) * 2015-02-23 2016-09-01 ソニー株式会社 情報処理システムおよび情報処理方法
US10522140B2 (en) 2015-02-23 2019-12-31 Sony Corporation Information processing system and information processing method

Similar Documents

Publication Publication Date Title
JP3674990B2 (ja) 音声認識対話装置および音声認識対話処理方法
US8306815B2 (en) Speech dialog control based on signal pre-processing
US8521537B2 (en) Detection and use of acoustic signal quality indicators
GB2346001A (en) Communication device and method for screening speech recognizer input
US20070150287A1 (en) Method for driving a dialog system
US7167544B1 (en) Telecommunication system with error messages corresponding to speech recognition errors
EP1494208A1 (en) Method for controlling a speech dialog system and speech dialog system
KR19980016324A (ko) 음성을 이용한 차량 시동 제어장치
JPH0635497A (ja) 音声入力装置
JPH06236196A (ja) 音声認識方法および装置
JPS60247697A (ja) 音声対話装置
WO2020223304A1 (en) Speech dialog system aware of ongoing conversations
JP2000029486A (ja) 音声認識システムおよび方法
JP2807241B2 (ja) 音声認識装置
JP2006251061A (ja) 音声対話装置および音声対話方法
JP2020148805A (ja) 音声認識システム、及び、音声認識方法
JPS62150295A (ja) 音声認識方法
US7092884B2 (en) Method of nonvisual enrollment for speech recognition
WO2017085815A1 (ja) 困惑状態判定装置、困惑状態判定方法、及びプログラム
JP3079006B2 (ja) 音声認識制御装置
US7664635B2 (en) Adaptive voice detection method and system
JP4765394B2 (ja) 音声対話装置
JP3846500B2 (ja) 音声認識対話装置および音声認識対話処理方法
JPH02103599A (ja) 音声認識装置
JP3360978B2 (ja) 音声認識装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19991005