JPH0764594A

JPH0764594A - 音声認識装置

Info

Publication number: JPH0764594A
Application number: JP5235596A
Authority: JP
Inventors: Junichiro Fujimoto; 潤一郎藤本
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1993-08-27
Filing date: 1993-08-27
Publication date: 1995-03-10

Abstract

(57)【要約】【目的】例えば自動車内のような騒音環境下で用いら
れる場合にも、再生出力された音声認識結果を聞き取り
やすくすることができる。【構成】音声認識処理を行なうため、利用者が音声を
発すると、この音声は、入力部１から音声認識部２に送
られて認識処理がなされる。音声認識部２からの認識結
果は、認識結果出力部３に送られ、認識結果出力部３で
は、認識結果に対応した音声または音響を例えばスピ−
カから出力する。利用者は、この音声または音響を聞く
ことで、認識結果を知ることができる。騒音などによ
り、この音声または音響を聞き取りにくいときには、利
用者は調整部（例えば外部スイッチ）５を操作すること
により音声または音響の特徴を変化させて、認識結果と
して出力される音声または音響を騒音などと区別し易い
ように変えることができる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、話者の音声を認識する
音声認識装置に関する。

【０００２】

【従来の技術】従来、音声の認識結果を登録者の声で再
生するものとして、例えば、特開平２−２９０５５号に
開示されているような音声認識装置が知られている。こ
の音声認識装置では、利用者が音声認識用に発声した声
を登録し、さらにこれを圧縮して再生用デ−タとして予
め記憶しておき、音声認識結果が得られたときに、この
認識結果に対応する再生用デ−タを再生し、音声出力す
るようにしている。これにより、利用者は、音声認識さ
れた結果を利用者の声で聞き取ることができる。

【０００３】

【発明が解決しようとする課題】しかしながら、この種
の音声認識装置を例えば自動車内で用いる場合には、自
動車内での騒音により、再生された認識結果を聞き取り
にくいなどの問題が生じる。すなわち、自動車の騒音
は、主に、エンジン音と、道路とタイヤとの摩擦音であ
り、低周波成分が多く、高周波成分は少ないことが知ら
れており、この場合、音声認識装置の利用者が，例え
ば、男性で、しかも声の低い者であるときには、利用者
の声で認識結果が再生出力されても、この再生音は車の
中の騒音と周波数帯域が非常に近いために騒音と区別で
きず、利用者はこの再生音を聞き取りにくいという問題
があった。また、自動車内で用いられる場合に限らず、
認識結果が利用者の声で再生される場合には、この再生
音が大きいと、これが再度マイクロフォンから入力され
て本来認識されるべきでない音声が認識されてしまうと
いう問題もあった。

【０００４】このように、音声認識結果を音声で再生出
力する場合、従来では、環境によって認識結果出力を聞
き取りにくく、また、この認識結果出力が再び音声認識
装置に入力することによって、本来認識されるべきでな
い音声が認識されてしまうという欠点があった。

【０００５】本発明は、例えば自動車内のような騒音環
境下で用いられる場合にも、再生出力された音声認識結
果を聞き取りやすく、また、再生出力された音声認識結
果が再び音声認識されてしまうという事態が生ずるのを
低減することの可能な音声認識装置を提供することを目
的としている。

【０００６】

【課題を解決するための手段および作用】上記目的を達
成するために、請求項１乃至請求項８記載の発明は、認
識結果出力手段で発せられる音響または音声の特徴を変
化させるようになっている。これにより、例えば自動車
内のような騒音環境下で用いられる場合にも、再生出力
された音声認識結果を聞き取りやすく、また、再生出力
された音声認識結果が再び音声認識されてしまうという
事態が生ずるのを低減することできる。

【０００７】特に、請求項４記載の発明では、認識結果
出力手段で発せられる音響または音声の特徴を、環境音
に応じて変化させるようになっているので、認識結果の
音の特徴を手動調節によらずに最適に変化させることが
できる。

【０００８】また、請求項５記載の発明では、入力され
た音声を分析し、認識結果出力手段で発せられる音響ま
たは音声の特徴を分析結果と異なった特徴を有するよう
に変化させるようになっているので、利用者は、認識結
果をより聞き取り易くなる。

【０００９】また、請求項９乃至請求項１５記載の発明
は、認識結果出力手段から発せられる該認識結果の音声
が音声認識手段で認識されないような制御がなされるよ
うになっている。これにより、スピ−カから出力される
音響または音声がどれだけ大きくても、これによって認
識装置が誤動作するという事態は生じない。この結果、
スピーカ２２からの音響または音声の音量を大きくする
ことができて、利用者が、騒音中であるいは認識装置か
ら離れた場所で装置を使用していても、認識結果を大き
な音響または音声で知ることができる。

【００１０】また、請求項１６乃至請求項２０記載の発
明は、認識結果の再生音が入力され認識されて、これが
正規の認識結果として扱われるのを有効に防止できる。

【００１１】

【実施例】以下、本発明の実施例を図面に基づいて説明
する。図１は本発明に係る音声認識装置の第１の実施例
の構成図である。図１を参照すると、この第１の実施例
の音声認識装置は、音が入力するマイクロフォンなどの
入力部１と、入力部１から入力された音声を認識する音
声認識部２と、音声認識部２からの認識結果を音響また
は音声で出力する認識結果出力部３と、調整部５とを有
している。

【００１２】ここで、音声認識部２には、例えば利用者
の標準的な音声の特徴量が予め登録されている音声認識
用辞書１０が設けられており、音声認識部２は、入力部
１から入力された音声の特徴量を音声認識用辞書１０と
照合し、認識結果（リジェクトを含む）を得るようにな
っている。

【００１３】また、認識結果出力部３には、音発生部８
と、登録部９とが設けられており、音発生部８は、音声
認識部２から認識結果が送られたときに、この認識結果
に対応した音響または音声を生成し、これを例えばスピ
ーカから出力するようになっている。また、認識結果出
力部３の登録部９は、認識結果出力部３が認識結果を音
声で出力するよう構成されている場合に特に必要とさ
れ、登録部９には、音声認識部２から送られるべき各種
の認識結果に対応させて、音声再生用デ−タが例えば圧
縮して保存されており、音声認識部２から所定の認識結
果が音発生部８に送られたときに、登録部９からは該認
識結果に対応した音声再生用デ−タが音発生部８により
読み出されるようになっている。

【００１４】なお、認識結果出力部３が認識結果を音響
で出力するよう構成されている場合にも、各種の認識結
果に対応させて音響再生用デ−タを登録部９に予め登録
しておくこともできるが、認識結果が音響で出力されて
いる場合には、登録部９を設けずに、音発生部８におい
て認識結果に応じた音響を直接発生させることも可能で
ある。

【００１５】また、調整部５は、認識結果出力部３の音
発生部８で発生する音響または音声の特徴を変化させる
ためのものであり、例えば利用者の操作に従って音響ま
たは音声の特徴を変化させる外部スイッチによって構成
されている。

【００１６】次に、このような構成の第１の実施例の音
声認識装置の動作について説明する。なお、実際の動作
を行なわせるに先立って、利用者に標準音声を発声さ
せ、この標準音声の特徴量を抽出して音声認識用辞書１
０を予め作成しておく。また、このときに発声した標準
音声の一部をデジタル信号処理で良く知られたＡＤＰＣ
Ｍ等により圧縮し、これを音声再生用データとして、認
識結果出力部３の登録部９に予め保存しておくことがで
きる。

【００１７】音声認識処理を行なうため、利用者が音声
を発すると、この音声はまず入力部１に入力する。入力
部１に入力した音声は、音声認識部２に送られ、そこ
で、例えば辞書１０との照合による認識処理がなされ
る。音声認識部２からの認識結果は、次いで、認識結果
出力部３に送られ、認識結果出力部３では、認識結果に
対応した音声または音響を例えばスピ−カから出力す
る。利用者は、この音声または音響を聞くことで、認識
結果を知ることができる。周囲の環境（騒音など）によ
り、この音声または音響を聞き取りにくいときには、利
用者は調整部（例えば外部スイッチ）５を操作すること
により音声または音響の特徴を変化させて、認識結果と
して出力される音声または音響を周囲の環境（騒音な
ど）と区別し易いように変えることができる。

【００１８】次に、第１の実施例の音声認識装置の具体
例を説明する。先ず、第１の具体例として、認識結果出
力部３，すなわち音発生部８が認識結果を音響で出力す
るようになっており、また、調整部５が、音響の特徴
（例えば周波数）を変化させるように構成されている場
合を考える。なお、この場合、登録部９は設けられてお
らずとも良く、音発生部８が音響を生成する機能を有し
ているときには、認識結果に対応した音響を音発生部８
において直接発生させることができる。

【００１９】いま、この第１の具体例の音声認識装置
を、３種類の品物のそれぞれの個数を計数するようなシ
ステムに適用する場合を考える。利用者が入力部１に向
かって品名を音声で発声すると、音声認識部２では、品
名の音声を認識し、３種類の品物のうちのいずれの種類
のものであるかを認識する。

【００２０】なお、音声認識部２がさらに各種類の品物
の個数を計数する機能を有しているとすると、音声認識
部２は、利用者により発声された品名音声からその品物
の種類を認識したときに、これと同時にこの品物のカウ
ント値を“１”だけ歩進し、この品物の個数をカウント
することができる。

【００２１】品物の種類の認識結果は、各品物に対して
３種類の周波数の音響で出力され、利用者はこの音響を
聞いて、利用者の発声した品名を音声認識部３が正しく
認識したか否かを判断する。この場合、上記３種類の周
波数が調整部（外部スイッチ）５により例えば５００Ｈ
ｚ，１１００Ｈｚ，２８００Ｈｚに設定されているとす
ると、利用者は、周りの騒音に低周波数成分が多いとき
は、１１００Ｈｚ，２８００Ｈｚの音響については、こ
れを聞き取ることができるが、５００Ｈｚの音響につい
ては、これを聞き取れないことが多く、認識装置がリジ
ェクトしているのか、正しく認識しているのか区別でき
ないことがある。そこで、利用者は、調整部（外部スイ
ッチ）５により５００Ｈｚの周波数を例えば４３００Ｈ
ｚ程度の周波数に設定し直すことによって、周りの騒音
と認識結果の出力音響とを区別しやすくすることができ
る。

【００２２】なお、純音で周波数だけを変化させる時に
は、それぞれの音の周波数が整数倍の関係にあると、同
じ音程に聞こえたり、あるいは協和音程になって区別し
にくくなることがあるので、注意が必要である。また、
上述の例では、音響の周波数を変化させているが、これ
のかわりに、あるいは、これとともに、音の振幅を変え
たり、あるいは振幅変調をしたり、また、他の変調方法
により音の特徴を変化させることもできる。

【００２３】図２は、上記の変調を実現する振幅変調器
の一例を示す図である。この振幅変調器は、所定周波数
の音響用の信号，すなわちキャリアを発生する正弦波発
振器１１と、正弦波発振器１１から発生したキャリアを
増幅する増幅器１２と、振幅変調用の変調波を発生する
正弦波発振器１３と、正弦波発振器１３から発生した変
調波を可変増幅する増幅器１４と、乗算器１５とを有し
ており、乗算器１５において、増幅器１２からのキャリ
アに増幅器１４からの変調波を掛けあわせることによ
り、振幅変調波を得ることができる。このとき、正弦波
発振器１３の周波数を変えることもできるし、または、
発振器１３の周波数を変えずに、増幅器１４の増幅率を
変える（振幅を変える）こともできるし、あるいは、両
方を変化させることもできる。これにより、音響の特徴
を様々に変化させることができ、認識結果の出力音響を
周りの騒音から区別し易くするための調整をより容易に
行なうことができる。

【００２４】また、第２の具体例として、認識結果出力
部３，すなわち音発生部８が認識結果を音声で，すなわ
ち再生音声あるいは合成音声で出力するようになってお
り、また、調整部５が、再生音声あるいは合成音声の特
徴（例えば、再生音声あるいは合成音声の長さ、また
は、再生音声あるいは合成音声のピッチ）を変化させる
ように構成されている場合を考える。

【００２５】なお、認識結果を再生音声で出力する場
合、音発生部８は、音声再生部として構成され、登録部
９には、例えば利用者が音声認識用辞書１０の作成時に
発声した標準音声のデ−タ（すなわち音声信号デ−タ）
をデジタル信号処理で良く知られたＡＤＰＣＭ等の方法
などにより圧縮したデ−タが再生用デ−タとして保存さ
れており、音声認識部２から所定の認識結果が送られた
ときに、音発生部８は、この認識結果に対応した再生用
デ−タを登録部９から読み出してこの再生用デ−タに基
づき音声を再生し、再生音声として出力するようになっ
ている。また、認識結果を合成音声で出力する場合に
は、音発生部８は、例えば音合成器として構成されてい
る。なお、音発生部８が音合成器として構成されている
場合、登録部９は必要ではない。

【００２６】ここで、再生音声あるいは合成音声の特徴
として、再生音声あるいは合成音声の長さを変える場
合、例えば再生音声の長さを変える場合には、再生用デ
−タに基づき再生される音声信号において定常的に変化
する部分，あるいは振幅の大きな部分の長さを変化させ
れば良い。すなわち、定常的に変化する部分，あるいは
振幅の大きな部分の前後にこの部分のデ−タと同じデ−
タを例えば複数回コピ−して挿入することにより、声の
高低を変えることなく、長さを変える（いまの場合、長
くする）ことができる。例えば、図３（ａ）に示す元の
再生波形の一部Ｐ₀をその前後にコピ−して挿入するこ
とによって、図３（ｂ）に示すような伸長された再生波
形を得ることができる。

【００２７】認識結果出力部３が、上記のように、再生
音声の特徴をその長さを変えて変化させるよう構成され
ているときには、この音声認識装置を例えばパルス状の
雑音が多いところで用いるような場合にも、その雑音の
長さに比べて再生音声の長さを長くすることにより、こ
の再生音声，すなわち認識結果を利用者に聞き取り易く
させることができる。

【００２８】また、利用者が、この音声認識装置の近く
にいるとき，あるいは、入力部１から離れた位置にいる
ときに、一般には、利用者の音声と再生音声の音量の差
が少ないか、または再生音声の方が大きくなってしまう
ため、再生音声が誤って認識されるという問題が生じ
る。しかしながら、一般に通常の発声で、一つの単語の
発声長の変動が２割乃至３割程度であることを利用し
て、例えば、再生音声の長さを元の再生音声の長さより
も３割以上長く又は短くなるようにし、さらに、音声認
識部２において音声を認識する際、辞書１０に登録され
た音声の長さと入力された音声の長さとが３割以上違う
ものをリジェクトするようにしておくことにより、再生
音声が音声認識部２において誤って認識されるという事
態を有効に防止することができる。合成音声の場合に
も、同様にして、その長さを変えることができて、これ
により、上記と同様の効果を得ることができる。

【００２９】このように、再生音声あるいは合成音声の
長さを変化させることによって、騒音環境下でも認識結
果をより正確に聞き取ることができ、また、利用者が、
音声認識装置の近くにいるとき，あるいは、入力部１か
ら離れた位置にいるときにも、利用者の音声を認識結果
の再生音声あるいは合成音声と混同させることなく音声
認識部２に認識させることができる。

【００３０】また、再生音声あるいは合成音声の特徴と
して、再生音声あるいは合成音声のピッチを変化させる
場合、例えば合成音声のピッチを変化させる場合には、
線形予測係数を用いることができる。図４は線形予測係
数を用いて合成音声のピッチを変化させる回路の構成例
を示す図である。なお、この回路は、文献「“音声情報
処理の基礎” オーム社１９８１年第８６頁」に示
されているような音声合成回路であって、この音声合成
回路により調整部５を含めた音発生部８を音合成部とし
て構成することができる。

【００３１】図４を参照すると、この音声合成回路は、
音源ＶＳ_A〜ＶＳ_Dと、音源ＶＳ_A〜ＶＳ_Dのいずれか１つ
を選択するためのスイッチＳＷと、単位遅延素子ＤＬ₁
〜ＤＬ_nと、各単位遅延素子ＤＬ₁〜ＤＬ_nから出力され
る信号に所定の線形予測係数α₁〜α_nをそれぞれ乗算す
る乗算器ＭＬ₁〜ＭＬ_nと、乗算器ＭＬ₁〜ＭＬ_nからの出
力信号を加算して予測値ｙ_n’を得る加算器ＡＤ₁と、ス
イッチＳＷにより選択された音源からの出力ε_nと加算
器ＡＤ₁からの出力すなわち予測値ｙ_n’とを加算して、
合成音声波形ｙ_nを得る加算器ＡＤ₂とを有している。

【００３２】ここで、音源ＶＳ_Aは、例えばホワイトノ
イズ発生源であるとし、音源ＶＳ_B〜ＶＳ_Dは、それぞれ
所定周波数ｆ_B，ｆ_C，ｆ_Dのパルスを発生するパルス発
生源であるとする。このような構成において、無声音を
出力させる場合には、無声音はホワイトノイズで駆動さ
れることが知られているので、音源ＶＳ_Aを選択するよ
うにスイッチＳＷを切替える。また、有声音を出力する
場合には、有声音はパルスで駆動されることが知られて
いるので、音源ＶＳ_B〜ＶＳ_Dのいずれかを選択するよう
にスイッチＳＷを切替える。すなわち、有声音を出力す
る場合、パルス間隔が音声のピッチに相当するので、音
源ＶＳ_B〜ＶＳ_DをスイッチＳＷにより切替え選択し、適
切な駆動パルス間隔を選択することにより合成音声のピ
ッチを適宜変化させることができる。

【００３３】調整部５，音発生部８に図４の音声合成回
路を用いる場合、例えば、騒音環境下において、認識結
果の合成音声が低く、これを聞き取りにくいときには、
利用者は、スイッチＳＷを操作して高いピッチ周波数の
音源を選択すれば良い。これにより、騒音環境下におい
ても、認識結果を確認し易くなる。なお、図４では、有
声音源として、予め、所定のピッチ周波数ｆ_B，ｆ_C，ｆ
_Dが設定されている音源ＶＳ_B，ＶＳ_C，ＶＳ_Dを用いた
が、これらの有声音源として、発振器のように周波数を
自由に変化させることのできるものを用いても良い。

【００３４】このように、音声認識の結果である再生音
声あるいは合成音声のピッチを変化させることによって
も、騒音環境下で、再生音声あるいは合成音声を聞き取
り易くすることができる。

【００３５】図５は本発明に係る音声認識装置の第２の
実施例の構成図である。図５の音声認識装置は、音が入
力するマイクロホンなどの入力部１，１７と、入力部１
から入力された音声を認識する音声認識部２と、音声認
識部２からの認識結果を音響または音声で出力する認識
結果出力部３と、調整部５と、入力部１７からの入力音
を分析し、その結果に応じて、認識結果出力部３の音発
生部８で生成する音響または音声の特徴を変化させる音
分析部１６とを有している。

【００３６】ここで、入力部１は、音声認識用の音声を
入力するために設けられているのに対し、入力部１７
は、音声認識装置の利用環境の音を取り込むために設け
られており、音分析部１６では、入力部１７により取り
込まれた利用環境の音を分析し、利用環境の音と区別で
きる方向に、音発生部８で発生する音響または音声の特
徴（例えば、音響または音声の振幅，あるいは周波数特
性，あるいはピッチ）を変化させるようになっている。
すなわち、前述した第１の実施例では、音発生部８で発
生する音響または音声の特徴を利用環境の音と区別でき
るように、調整部５（例えば外部スイッチ）により、主
に手動操作で変化させるようにしたが、この第２の実施
例では、調整部５による手動調整を必要とすることな
く、音分析部１６において、利用環境の音を自動分析
し、この分析結果に応じて音発生部８で発生する音響ま
たは音声の特徴を自動的に最適変化させるよう構成され
ている。

【００３７】次に、この第２の実施例の音声認識装置の
具体例を説明する。先ず、第１の具体例として、変化さ
せる音響または音声の特徴が振幅である場合について説
明する。

【００３８】いま、音声認識用として用いられる入力部
１が、利用者の動きに合せて利用者が自由に持ち回れる
ように構成されている（すなわち、入力部１が相当の長
さのコードなどにより音声認識装置本体からの位置を自
由に変えることができるように構成されている）一方
で、入力部１７が音声認識装置本体に取り付けられてい
るとする。

【００３９】この場合、利用者は、動きながら入力部１
を利用することが考えられるので、この入力部１からの
信号に基づいては話者が認識装置本体の近くにいるか否
かを判断することはできない。そこで、この第１の具体
例では、入力部１７からの信号に基づいて利用者と音声
認識装置本体との距離を音分析部１６において判断さ
せ、その距離に応じて、音発生部８から発生する音響ま
たは音声の振幅を変化させるようになっている。

【００４０】すなわち、入力部１７からの信号に含まれ
ている音声の成分と環境音の成分との比，すなわちＳ／
Ｎ比を音分析部１６において計算し、Ｓ／Ｎ比が小さい
ときには、利用者が装置本体から離れていると判断し
て、音発生部８に再生音の振幅を大きくするような制御
信号を与える一方で、Ｓ／Ｎ比が大きいときには、利用
者が装置本体の近くにいると判断して、音発生部８に再
生音の振幅を小さくするような制御信号を与えるように
なっている。なお、入力部１７からの信号に含まれてい
る音声の成分を検出するのに、図５の例では、音分析部
１６は、入力部１からの信号を用いるようになってい
る。

【００４１】次に、この第１の具体例の動作について説
明する。図５の装置において、入力部１，１７には、利
用者が音声を発していない状態では、周囲の環境音のみ
が入力する一方、利用者が音声を発しているときには、
環境音と利用者の音声とが重畳して入力する。ところ
で、入力部１を利用者が動きながら利用する場合、入力
部１は常に利用者のすぐ近くにあるので、利用者が音声
を発生しているときに、利用者の音声は、入力部１にほ
とんど減衰せず入力する。これに対し、入力部１７は音
声認識装置に固定されているので、入力部１７に入力す
る利用者の音声の強さは、利用者と音声認識装置との距
離に応じて変化する。図６（ａ），（ｂ）はそれぞれ入
力部１，入力部１７からの信号の一例を示す図である。
先ず、図６（ａ）を参照すると、入力部１には、時刻ｔ
₁からＬ₂の期間利用者の音声が入力し、これにより、入
力部１からは音声信号Ｖ₀が出力される状態が示されて
いる。また、図６（ｂ）を参照すると、入力部１７に
は、時刻ｔ₂までは環境音だけが入力し、従って、入力
部１７からは環境音信号Ｅのみが出力され、時刻ｔ₂以
後は、入力部１に時刻ｔ₁に入力した音声に対応した音
声が所定時間の遅れで入力し、入力部１７からは環境音
信号Ｅに重畳してこの音声信号Ｖ₁がＬ₂の期間出力され
る状態が示されている。なお、図６（ｂ）において、環
境音信号Ｅに音声信号Ｖ₁が重畳した期間Ｌ₂の部分を音
声部と称し、この音声部に先立つ環境音信号Ｅのみの期
間Ｌ₁の部分を環境部と称する。また、入力部１にも、
入力部１７と同様に環境音が入力するが、この環境音は
話者音声に比べて相対的に非常に小さいので、図６
（ａ）では環境音信号を省略している。

【００４２】図７は第１の具体例の処理動作を示すフロ
ーチャートである。図７を参照すると、音分析部１６で
は、先ず、図６（ａ）に示すような入力部１からの信号
と図６（ｂ）に示すような入力部１７からの信号とを比
較し、入力部１７からの信号から音声部を検出する（ス
テップＳ１）。この際、図６（ａ）と図６（ｂ）とを比
べればわかるように、音声信号Ｖ₀とＶ₁とは、出力され
る期間Ｌ₂が同じであり、単に所定の時間遅れがあるだ
けであるので、入力部１からの信号，すなわち音声信号
Ｖ₀に基づき、入力部１７からの信号から音声部を容易
に検出することができる。

【００４３】音声部を検出した後、音分析部１６は、入
力部１７からの信号において、音声部と環境部とを分離
し、Ｓ／Ｎ比の計算を行なう（ステップＳ２，Ｓ３）。
この場合、音声部には、音声成分とともに環境音（騒
音）成分も含まれるので、Ｓ／Ｎ比を計算するために
は、音声部から環境音成分を差し引き、音声成分だけの
大きさＳ_Vを抽出する必要がある。

【００４４】音声成分の大きさは、具体的には、図６
（ｂ）において、期間Ｌ₁の環境部における合計音強度
をＳ₁とし、期間Ｌ₂の音声部における合計音強度をＳ₂
とするとき、次式により求めることができる。

【００４５】

【数１】Ｓ_V＝（Ｓ₂／Ｌ₂）−（Ｓ₁／Ｌ₁）

【００４６】また、環境音成分の大きさＳ_Nは、次式に
より求めることができる。

【００４７】

【数２】Ｓ_N＝Ｓ₁／Ｌ₁

【００４８】従って、Ｓ／Ｎ比を、Ｓ_V／Ｓ_Nとして計算
することができる。なお、この例では、音声部に先立つ
期間Ｌ₁の部分を環境部とし、この環境部における信号
に基づき環境音成分の大きさＳ_Nを求めたが、これのか
わりに、音声部が終了した後の期間の部分を環境部と
し、環境音成分の大きさＳ_Nを求めても良いし、あるい
は音声部に先立つ期間，音声部が終了した後の期間の両
方を用いて、環境音成分の大きさＳ_Nを求めても良い。

【００４９】このようにして、Ｓ／Ｎ比を計算した後、
音分析部１６は、このＳ／Ｎ比に基づき、音発生部８か
ら出力されるべき音響または音声の振幅の大きさ，すな
わち振幅の増幅率を決定する（ステップＳ４）。この増
幅率の決め方は、音発生部８において用いるスピ−カの
種類等に応じて異なるが、図８に示すように、Ｓ／Ｎ比
が大きいほど、増幅率が小さくなるように、また、Ｓ／
Ｎ比が小さいほど、増幅率が大きくなるように決定す
る。

【００５０】増幅率を決定すると、音分析部１６は、決
定した増幅率を音発生部８に送る（ステップＳ５）。こ
れにより、音発生部８は、送られた増幅率に従って、音
響または音声の振幅を増幅して出力することができ、利
用者が音声認識装置から離れて動きながらこれを使用す
る場合にも、利用者の音声認識装置に対する距離を考慮
して、認識結果の音の大きさを最適に変化させることが
できる。

【００５１】次に、第２の実施例の音声認識装置の第２
の具体例として、変化させる特徴が周波数特性である場
合について説明する。この第２の具体例では、音分析部
１６は、入力部１７から入力された環境音信号をＦＦＴ
（高速フ−リエ変換）等で周波数分析し、環境音の代表
的な周波数帯域と区別しうる周波数成分を取り出し、こ
の周波数成分に基づき、音発生部８で発生する音響また
は音声に対する変調信号を生成し、音発生部８に与える
ようになっている。例えば、音発生部８が図２に示すよ
うな振幅変調器を備えている場合には、音発生部８は、
この変調信号により、音響または音声を振幅変調して例
えばスピ−カから出力するようになっている。

【００５２】この第２の具体例の動作を図９のフロ−チ
ャ−トを用いて説明する。音分析部１６は、先ず、利用
者が音声を発していないときの入力部１７からの信号
（すなわち，環境音だけの信号）を周波数分析する（ス
テップＳ１１）。図１０（ａ）には、環境音信号の周波
数分析結果の一例が示されており、この例からわかるよ
うに、環境音信号（周囲の騒音信号）には、周波数の低
い帯域の成分が多い。

【００５３】従って、音分析部１６は、この周波数分析
結果に基づき、図１０（ｂ）に示すように、環境音成分
がある一定値ＴＨよりも少なく、かつ、できるだけ低い
周波数の点ｆ₀を、環境音の代表的な周波数帯域と区別
しうる周波数成分として検出し、この周波数成分ｆ₀を
図１０（ｃ）に示すように取り出す（ステップＳ１
２）。

【００５４】次いで、音分析部１６は、音発生部８にお
いて図２に示すような振幅変調器により音を振幅変調す
る場合、ステップＳ１２で取り出した周波数成分ｆ₀を
搬送波に採用するか、変調波に採用するかを決め、それ
に応じた変調信号を生成して音発生部８に送る（ステッ
プＳ１３）。音発生部８は、音分析部１６からの変調信
号によって音響または音声を変調し、例えばスピ−カか
ら出力する。この際、環境音が変動する毎に、音分析部
１６において取り出される周波数成分ｆ₀も変化し、音
発生部８には、環境音の周波数帯域に応じた変調信号が
送られる。これにより、音発生部８からは、環境音が変
化しても、環境音を考慮した聞き取り易い認識結果の音
響または音声が出力される。

【００５５】次に、第２の実施例の音声認識装置の第３
の具体例として、変化させる特徴がピッチである場合に
ついて説明する。この第３の具体例では、音分析部１６
は、入力部１７から入力された環境音信号を周波数分析
し、環境音の代表的な周波数帯域と区別しうる周波数成
分を決定して音発生部８に与え、また、音発生部８は、
音分析部１６において決定された周波数成分を用いてピ
ッチを選択し合成音の再生を行なうように構成されてい
る。

【００５６】この第３の具体例の動作を図１１のフロ−
チャ−トを用いて説明する。この第３の具体例では、音
分析部１６は、先ず、第２の具体例とほぼ同様の処理を
行ない、入力部１７から入力された環境音信号を分析し
て、図１０（ｃ）に示すような周波数成分ｆ₀を最適周
波数として決定する（ステップＳ２１）。

【００５７】次いで、決定した最適周波数ｆ₀を音発生
部８に与える（ステップＳ２２）。音発生部８は、これ
が例えば図４に示すような音声合成回路になっている場
合、この音声合成回路において、送られた最適周波数に
最も近いピッチをスイッチＳＷにより選択し合成音声の
再生を行なう（ステップＳ２３）。このような動作によ
り、環境音が変化しても、合成音声のピッチを環境音と
区別可能なものに自動的に変えることができるので、手
動調整を必要とせずに、常に聞き取り易い認識結果の合
成音声を出力することができる。

【００５８】また、上記第２の実施例の変形例として、
音分析部１６において入力部１７からの入力音を分析す
るかわりに、入力部１からの入力音（利用者の音声）を
分析し、その分析結果に基づき、音発生部８において、
利用者の音声の特徴と異なる特徴の音を発生させること
も可能である。例えば、利用者の音声のピッチと異なる
ピッチの再生音を発生させることも可能であり、利用者
の音声ピッチと異なるピッチの再生音を発生させること
により、利用者はこの再生音をより聞き取り易くなる。
すなわち、再生音が自分の声のピッチと同じような場
合、利用者にとって聞き取りにくいことがあるが、異な
るピッチの再生音を発生させることで、より聞き取り易
くなる。

【００５９】図１２は本発明に係る音声認識装置の第３
の実施例の構成図である。第３の実施例の音声認識装置
は、認識結果出力部３からの認識結果の再生音声が再び
入力部１から入力されて音声認識部２で認識されてしま
うという事態を確実に防止することを意図するものであ
る。すなわち、前述の各実施例においても、再生する音
の特徴を変化させることで、音声認識部２で再生音が認
識されてしまうという事態を防止することはできるが、
音声認識部２が不特定話者方式を採用しているようなと
きには、再生音が認識されてしまうことがある。このよ
うな事態を確実に防止するため、第３の実施例の音声認
識装置では、入力部１と音声認識部２との間の接続を認
識結果出力部３からの所定の信号によりオン，オフする
ためのスイッチ２１が設けられている。

【００６０】このような構成の音声認識装置では、通
常、スイッチ２１はオンの状態になっており、入力部１
からの信号は、音声認識部２に送られて音声認識され、
認識結果が認識結果出力部３に送られる。そして、認識
結果出力部３では、認識結果に応じた音響または音声を
音発生部８で生成し（より詳しくは、音響信号または音
声信号を生成し）、これを例えばスピーカ２２に与える
ことで、スピーカ２２から認識結果が音響または音声と
して出力される。この第３の実施例の装置では、この
時、スピ−カ２２へ音響信号または音声信号を渡すと同
時に、音発生部８からの信号によってスイッチ２１をオ
フ状態にする。これにより、スピ−カ２２からどのよう
な音響または音声が再生出力されようとも、その音響ま
たは音声の入力信号が入力部１から音声認識部２に送ら
れるのを防止できる。従って、スピ−カ２２から出力さ
れる音響または音声がどれだけ大きくても、これによっ
て認識装置が誤動作するという事態は生じない。この結
果、スピーカ２２から出力される音響または音声の音量
を大きくすることができて、利用者が、騒音中であるい
は認識装置から離れた場所で、装置を使用していても、
認識結果を大きな音響または音声で知ることができる。

【００６１】また、図１３は図１２の音声認識装置の変
形例を示す図である。なお、図１２の音声認識装置は図
１の音声認識装置に対応した構成になっているのに対
し、図１３の音声認識装置は図５の音声認識装置に対応
した構成となっている。

【００６２】図１３の音声認識装置では、入力部１７か
ら入力された信号を音分析部１６で分析し、その結果を
音発生部８に与えると、音発生部８では、これに基づき
音響または音声の特徴を変化させて、音響または音声を
生成し、これを例えばスピーカ２２から出力する。この
とき、図１３の装置では、音発生部８が音響信号または
音声信号をスピーカ２２に渡すと同時に、音発生部８か
らの信号によってスイッチ２１をオフ状態にする。これ
により、スピ−カ２２からどのような音響または音声が
再生出力されようとも、図１２の装置と同様に、その音
響または音声の入力信号が入力部１から音声認識部２に
送られるのを防止でき、スピ−カ２２から出力される音
響または音声がどれだけ大きくても、これによって認識
装置が誤動作するという事態は生ぜず、この結果、スピ
ーカ２２からの音響または音声の音量を大きくすること
ができて、利用者が、騒音中であるいは認識装置から離
れた場所で装置を使用していても、認識結果を大きな音
響または音声で知ることができる。

【００６３】図１４は本発明の音声認識装置の第４の実
施例の構成図である。第４の実施例の音声認識装置で
は、スイッチ２１を設けるかわりに、認識結果出力部３
から音声認識部２に対して音声認識機能の停止処理ある
いはそれと同等の処理を行なわせるよう構成されてい
る。

【００６４】具体的には、例えば、認識結果出力部３の
音発生部８が、認識結果を音響または音声で出力するた
めの信号をスピーカ２２に対して出すと同時に、音声認
識部２に対してはプログラムにホルト(ＨＡＬＴ)をかけ
るような処理を行なうよう構成されている。これによ
り、認識結果が音響または音声で出力されているときに
は音声認識部２の機能を止め、スピ−カ２２からどのよ
うな音響または音声が再生出力されようとも、音声認識
部２では認識処理がなされない。従って、スピ−カ２２
から出力される音響または音声がどれだけ大きくても、
これによって認識装置が誤動作するという事態は生じな
い。この結果、スピーカ２２からの音響または音声の音
量を大きくすることができて、利用者が、騒音中である
いは認識装置から離れた場所で装置を使用していても、
認識結果を大きな音響または音声で知ることができる。

【００６５】また、図１５は図１４の音声認識装置の変
形例を示す図である。なお、図１４の音声認識装置は図
１の音声認識装置に対応した構成になっているのに対
し、図１５の音声認識装置は図５の音声認識装置に対応
した構成となっている。図１５の音声認識装置では、入
力部１７から入力された信号を音分析部１６で分析し、
その結果を音発生部８に与えると、音発生部８では、こ
れに基づき音響または音声の特徴を変化させて、音響ま
たは音声を生成し、例えばスピーカ２２から出力する。
このとき、図１５の装置では、音発生部８は、音響信号
または音声信号をスピーカ２２に渡すと同時に、音声認
識部２に対してプログラムにホルトをかけるような処理
を行なう。これにより、図１４の装置と同様に、スピ−
カ２２から出力される音響または音声がどれだけ大きく
ても、これによって認識装置が誤動作するという事態は
生じない。この結果、スピーカ２２からの音響または音
声の音量を大きくすることができて、利用者が、騒音中
であるいは認識装置から離れた場所で装置を使用してい
ても、認識結果を大きな音響または音声で知ることがで
きる。

【００６６】図１６は本発明に係る音声認識装置の第５
の実施例の構成図である。図１６の音声認識装置は、音
声が入力するマイクロホンなどの入力部１と、入力部１
から入力された音声を認識する音声認識部２と、音声認
識部２からの認識結果を音響または音声で出力する認識
結果出力部３と、音声認識部２から１回の認識結果が出
力されたときに、これを保持するメモリ３１と、メモリ
３１に１回の認識結果が保持された時点から時間を計測
し、所定時間経過後、メモリ３１に保持されている内容
を消去する計時部３２と、音声認識部２から２回の認識
結果が時間的に前後して出力されたときに、メモリ３１
に保持されている前の認識結果と音声認識部２から後に
出力された認識結果とを比較する判定部３３とを有し、
後の認識結果が、前の認識結果と同じものであり、か
つ、前の認識結果から一定時間以内に得られたものであ
る場合、後の認識結果をリジェクトするようになってい
る。

【００６７】このような構成の音声認識装置の動作につ
いて説明する。なお、当初、メモリ３１はクリアされて
いるものとする。利用者が音声を発声すると、入力部１
からの入力音声は、音声認識部２で認識され、その認識
結果は判定部３３に加わる。判定部３３では、メモリ３
１の内容と、いま音声認識部２から送られてきた認識結
果(１回目の認識結果)とが同じであるか否かを判定する
が、当初、メモリ３１はクリアされているので、メモリ
３１の内容と音声認識部２からの１回目の認識結果とは
同じではなく、従って、判定部３３は、１回目の認識結
果を正規の認識結果として扱い、これをメモリ３１に格
納するとともに、認識結果出力部３に与える。計時部３
２は、１回目の認識結果がメモリ３１に格納されると、
計時を開始し、一定時間が経過すると、計時部３２はメ
モリ３１の内容を消去する。なお、この一定の時間とし
ては、認識結果がメモリ３１に格納された後、認識結果
出力部３から出力される再生音が入力部１に入力し、音
声認識部２で認識されてその認識結果が判定部３３に送
られるのに要する程度の時間間隔が良く、例えば数秒以
内に設定される。

【００６８】従って、判定部３３が次の認識結果(２回
目の認識結果)を受取った時に、前の認識結果(１回目の
認識結果)をメモリ３１に格納した時点から一定時間が
経過していたならば、メモリ３１の内容は消されてお
り、比較の結果が等しくなることはない。すなわち、２
回目の認識結果が認識結果出力部３からの再生音に基づ
くものではないことを表わしており、この場合、判定部
３３は、２回目の認識結果をも正規のものとして扱い、
認識結果出力部３に与える。

【００６９】これに対し、判定部３３が次の認識結果
(２回目の認識結果)を受け取った時に、前の認識結果
(１回目の認識結果)をメモリ３１に格納した時点から一
定時間が経過していないならば、メモリ３１には１回目
の認識結果がまだ保持されており、判定部３３は、２回
目の認識結果と１回目の認識結果とを比較することにな
る。この比較の結果、２回目の認識結果が１回目の認識
結果と同じ場合は、数秒前に認識された結果が今回の認
識結果と同じということであって、２回目の認識結果が
話者の発声音声に基づくものであるとするには非常に確
率が低く、１回目の認識結果の再生音が入力部１に入力
して認識された蓋然性が非常に高いものであるので、正
規の認識結果としては扱わない。これによって、スピ−
カ２２からの再生音が入力部１に入力されたとしても、
その認識結果では動作することはなくなる。従って、ス
ピ−カ２２の再生音がどれだけ大きくても認識装置への
影響はない。この結果、再生音の音量を大きくすること
ができて、利用者は、この装置を騒音中や認識装置から
離れた場所で使用していても、認識結果を音声で確実に
知ることができる。

【００７０】図１７，図１８，図１９は図１６の音声認
識装置の変形例である。図１６の音声認識装置では、２
回の認識結果が時間的に前後して得られたときに、後の
認識結果が前の認識結果と同じものであり、かつ一定時
間内に得られたものである場合、後の認識結果を自動的
にリジェクトするようになっているが、図１７の音声認
識装置は、後の認識結果が前の認識結果と同じで、かつ
一定時間以内に得られた場合、後の認識結果を有効とす
るか無効とするかをの判断を使用者に委ねるように構成
されている。

【００７１】すなわち、図１７の音声認識装置の基本構
成は図１６と同じであるが、表示および入力機能を有す
る操作部４１がさらに設けられている。このような構成
の音声認識装置では、入力部１からの音声は、音声認識
部２で認識され、判定部３３では、メモリ３１に格納さ
れている内容と、いま音声認識部２から送られてきた認
識結果とが同じか否かを判定する。その結果、同じで無
ければ、この認識結果を正規のものとして扱い、認識結
果出力部３に与える。これに対し、メモリ３１に格納さ
れている内容といま認識部２から送られてきた認識結果
とが同じであれば、認識結果出力部３には認識結果を与
えずに、操作部４１にこれを正規の認識結果として扱っ
て良いか否かを示す表示を行なう。なお、表示のかわり
に、これを再生音声で行なっても良い。この表示，ある
いは再生音声により、利用者はその認識結果を正規のも
のとして扱うか否かを決める。これによって、スピ−カ
２２からの再生音が入力部１に入力されたとしても、そ
の認識結果で装置が動作するという事態を防止でき、さ
らには、何らかの必要があって、同じ言葉を２回使用し
た時でも、これを正規の認識結果として扱うことがで
き、装置を正常に動作させることができる。

【００７２】また、図１８の音声認識装置は、後の認識
結果が前の認識結果と同じで、かつ後の認識結果の基と
なった音声のパタ−ン長と前の認識結果を再生したとき
の再生音声の時間長との差が所定値以内の時、後の認識
結果をリジェクトするように構成されている。なお、こ
の場合、図１６と同様に、メモリ３１には認識結果が保
持され、認識結果が保持された時点から一定時間が経過
すると、その内容は計時部３２によって消去されるよう
になっている。

【００７３】このような構成では、判定部３３は、メモ
リ３１に保持されている内容と、今回の認識結果とが同
じであるか否かを判定し、同じであれば、いま入力され
た音声の時間長，すなわちパタ−ンの長さと、前の認識
結果を再生した時の再生音声の時間長との差を求め、こ
れが一定値以下なら、再生音が入力部１からフィ−ドバ
ックされて認識されたものと判定して、認識結果をリジ
ェクトする。なお、上記の一定値としては、音声をデジ
タル信号に変換するときの量子化誤差程度を見込めばよ
い。仮に、認識結果が同じでも音声の時間長が違う時
は、再生音が入力部１からフィ−ドバックされたもので
はではないことを表わしている。

【００７４】これに対し、メモリ３１に保持されている
内容(認識結果)と今回の認識結果とが同じで、かつ今回
の認識結果の基となった音声のパターン長を前の認識結
果を再生したときの再生音声の時間長とが同じ場合は、
別の発声で利用者が入力したものと考えることは非常に
確率が低いので、今回の認識結果は前の認識結果の再生
音に基づいたものであると判断して、正規の認識結果と
して扱わない。これによって、スピ−カ２２からの再生
音が入力部１に入力されて音声認識されたとしても、音
声認識装置は、その認識結果では動作することはない。
従って、スピ−カ２２の再生音がどれだけ大きくても認
識装置への影響はない。この結果、再生音の音量を大き
くすることができて、利用者は、この装置を騒音中や認
識装置から離れた場所で使用していても、認識結果を音
声で確実に知ることができる。

【００７５】なお、図１８の装置においても、図１６の
装置と同様の操作部４１を設け、後の認識結果が前の認
識結果と同じで、かつ後の認識結果の基となった音声の
パタ−ン長と前の認識結果を再生したときの再生音声の
時間長との差が所定値以内のときに、図１６の装置のよ
うに、後の認識結果を有効とするか無効とするかの判断
を使用者に委ねるようにすることも可能である。

【００７６】また、図１８の装置において、後の認識結
果の基となった音声のパターン長と前の認識結果を再生
したときの再生音声の時間長との差が所定値以内のとき
に、後の認識結果をリジェクトするかわりに、後の認識
結果の基となった音声のパタ−ン(例えば特徴パタ−ン)
と前の認識結果を再生したときの再生音声のパタ−ン
(例えば特徴パタ−ン)との類似性を調べ、これらが類似
しているときに、後の認識結果をリジェクトするように
することもできる。より具体的には、メモリ３１には、
前回認識した時の認識結果と、その結果を再生した時の
再生音パタ−ンとを保存させ(但し、この内容は一定時
間が経過すると、計時部３２によって消される)、判定
部３３はメモリ３１に保存されている認識結果と今回の
認識結果とが同じであるか否かを判定し、同じであれ
ば、いま入力された音声のパタ−ンと、メモリ３１に保
存されている再生音パタ−ンとの類似性を調べる。例え
ば、これらのパターン(特徴パタ−ン)間の距離を取って
類似判断を行なうことができ、距離が一定値以下(すな
わち、類似度が一定値以上)である場合には、類似と判
断し、後の認識結果は、再生音が入力部１からフィ−ド
バックされて認識されたものと判定して、リジェクトす
る。これによって、スピ−カ２２からの再生音が入力部
１に入力されて音声認識されたとしても、その結果では
動作することはなくなる。従って、スピ−カ２２の再生
音がどれだけ大きくても、認識装置への影響はない。こ
の結果、再生音の音量を大きくすることができて、利用
者は、この装置を騒音中や認識装置から離れた場所で使
用していても、認識結果を音声で確実に知ることができ
る。

【００７７】また、音声のパタ−ンが類似であると判断
されたときに、後の認識結果を有効とするか無効とする
かの判断を使用者に委ねるようにすることも可能であ
る。図１９は、音声のパターンが類似であると判断され
たときに、後の認識結果を有効とするか無効とするかの
判断を使用者に委ねるようにすることの可能な音声認識
装置の構成例を示す図である。図１９の音声認識装置の
基本構成は図１８と同じであるが、表示および入力機能
を有する操作部４１がさらに設けられている。このよう
な構成の音声認識装置では、入力部１からの音声は音声
認識２で認識され、判定部３３では、メモリ３１に格納
されている内容(認識結果)と、いま認識部２から送られ
てきた認識結果とが同じか否かを判定する。その結果、
同じで無ければ、この認識結果を正規のものとして扱
い、認識結果出力部３に与える。これに対し、メモリ３
１に格納されている認識結果といま送られてきた認識結
果とが同じであれば、いま入力された音声のパタ−ンと
メモリ３１に保持されている前回の音声のパタ−ンとの
類似性を比較する。この結果、類似度が一定値以上であ
る場合には、認識結果出力部３には認識結果を与えずに
操作部４１に、認識結果として扱って良いか否かを示す
表示を行なう。なお、表示のかわりに、これを再生音声
で行なっても良い。この表示，あるいは再生音声によ
り、利用者はその認識結果を正規のものとして扱うか否
かを決める。これによって、スピ−カ２２からの再生音
が入力部１に入力されたとしても、その認識結果で装置
が動作するという事態を防止でき、さらには、何らかの
必要があって、同じ言葉を２回使用した時でも、これを
正規の認識結果として扱うことができ、装置を正常に動
作させることができる。

【００７８】なお、図１７，図１９では、計時部３２が
設けられたものとなっているが、図１７，図１９の装置
において、計時部３２は必ずしも必要ではない。

【００７９】

【発明の効果】以上に説明したように、請求項１乃至請
求項８記載の発明によれば、認識結果出力手段で発せら
れる音響または音声の特徴を変化させるようになってい
るので、例えば自動車内のような騒音環境下で用いられ
る場合にも、再生出力された音声認識結果を聞き取りや
すく、また、再生出力された音声認識結果が再び音声認
識されてしまうという事態が生ずるのを低減することで
きる。

【００８０】特に、請求項４記載の発明では、認識結果
出力手段で発せられる音響または音声の特徴を、環境音
に応じて変化させるようになっているので、認識結果の
音の特徴を手動調節によらずに最適に変化させることが
できる。

【００８１】また、請求項５記載の発明では、入力され
た音声を分析し、認識結果出力手段で発せられる音響ま
たは音声の特徴を分析結果と異なった特徴を有するよう
に変化させるようになっているので、利用者は、認識結
果をより聞き取り易くなる。

【００８２】また、請求項９乃至請求項１５記載の発明
によれば、認識結果出力手段から発せられる該認識結果
の音声が音声認識手段で認識されないような制御がなさ
れるので、スピ−カから出力される音響または音声がど
れだけ大きくても、これによって認識装置が誤動作する
という事態は生じない。この結果、スピーカ２２からの
音響または音声の音量を大きくすることができて、利用
者が、騒音中であるいは認識装置から離れた場所で装置
を使用していても、認識結果を大きな音響または音声で
知ることができる。

【００８３】また、請求項１６乃至請求項２０記載の発
明によれば、認識結果の再生音が入力され認識されて、
これが正規の認識結果として扱われるのを有効に防止で
きる。

【図面の簡単な説明】

【図１】本発明に係る音声認識装置の第１の実施例の構
成図である。

【図２】振幅変調器の一例を示す図である。

【図３】再生音声の長さを変える様子を示す図である。

【図４】音声合成回路の一例を示す図である。

【図５】本発明に係る音声認識装置の第２の実施例の構
成図である。

【図６】入力部からの信号の一例を示す図である。

【図７】本発明の第２の実施例の第１の具体例の動作を
示すフローチャートである。

【図８】音発生部から出力されるべき音響または音声の
振幅の増幅率の決定の仕方を説明するための図である。

【図９】本発明の第２の実施例の第２の具体例の動作を
示すフローチャートである。

【図１０】入力部からの信号に対する周波数分析の一例
を示す図である。

【図１１】本発明の第２の実施例の第３の具体例の動作
を示すフローチャートである。

【図１２】本発明に係る音声認識装置の第３の実施例の
構成図である。

【図１３】図１２の音声認識装置の変形例を示す図であ
る。

【図１４】本発明に係る音声認識装置の第４の実施例の
構成図である。

【図１５】図１４の音声認識装置の変形例を示す図であ
る。

【図１６】本発明に係る音声認識装置の第５の実施例の
構成図である。

【図１７】図１６の音声認識装置の変形例を示す図であ
る。

【図１８】図１６の音声認識装置の変形例を示す図であ
る。

【図１９】図１６の音声認識装置の変形例を示す図であ
る。

【符号の説明】

１入力部２音声認識部３認識結果出力部５調整部８音発生部９登録部１０音声認識用辞書１１，１３正弦波発振器１２，１４増幅器１５乗算器１６音分析部１７入力部２１スイッチ２２スピーカ３１メモリ３２計時部３３判定部４１操作部

Claims

【特許請求の範囲】

【請求項１】音声を入力する入力手段と、入力された
音声を認識する音声認識手段と、認識結果を音響または
音声で発する認識結果出力手段と、認識結果出力手段で
発せられる音響または音声の特徴を変化させるための変
化手段とを有していることを特徴とする音声認識装置。
【請求項２】請求項１記載の音声認識装置において、
前記認識結果出力手段から発せられる音声は、所定の再
生用データに基づいて作成された再生音声、または、音
声合成により作成された合成音声であることを特徴とす
る音声認識装置。
【請求項３】請求項１記載の音声認識装置において、
前記変化手段は、認識結果出力手段で発せられる音響ま
たは音声の特徴を手動により変化させることが可能に構
成されていることを特徴とする音声認識装置。
【請求項４】請求項１記載の音声認識装置において、
さらに、環境音を検出する環境音検出手段を備え、前記
変化手段は、認識結果出力手段で発せられる音響または
音声の特徴を、前記環境音検出手段で検出された環境音
に応じて変化させることを特徴とする音声認識装置。
【請求項５】請求項１記載の音声認識装置において、
前記変化手段は、前記入力手段から入力された音声を分
析し、認識結果出力手段で発せられる音響または音声の
特徴を分析結果と異なった特徴を有するように変化させ
ることを特徴とする音声認識装置。
【請求項６】請求項１記載の音声認識装置において、
前記変化手段は、音響または音声の特徴として、音響ま
たは音声の振幅を変化させることを特徴とする音声認識
装置。
【請求項７】請求項１記載の音声認識装置において、
前記変化手段は、音響または音声の特徴として、音響ま
たは音声の周波数特性を変化させることを特徴とする音
声認識装置。
【請求項８】請求項１記載の音声認識装置において、
前記変化手段は、音響または音声の特徴として、音声の
ピッチを変化させることを特徴とする音声認識装置。
【請求項９】音声を入力する入力手段と、入力された
音声を認識する音声認識手段と、認識結果を音響または
音声で発する認識結果出力手段とを有し、認識結果出力
手段から発せられる認識結果の音声が音声認識手段で認
識されないような制御がなされることを特徴とする音声
認識装置。
【請求項１０】請求項９記載の音声認識装置におい
て、認識結果出力手段で認識結果の音声が発せられる際
に、該認識結果の音声に基づく信号が前記音声認識手段
に到達しないような制御がなされることを特徴とする音
声認識装置。
【請求項１１】請求項９記載の音声認識装置におい
て、、認識結果出力手段で認識結果の音声が発せられる
際に、前記音声認識手段の音声認識機能を停止する処
理，あるいはそれと同等の処理がなされるようになって
いることを特徴とする音声認識装置。
【請求項１２】音声を入力する入力手段と、入力され
た音声を認識する音声認識手段と、認識結果を音響また
は音声で発する認識結果出力手段と、認識結果出力手段
で発せられる音響または音声の特徴を変化させるための
変化手段とを有し、認識結果出力手段から認識結果の音
声の特徴を変化させて発する際に、該認識結果の音声が
音声認識手段で認識されないような制御がなされること
を特徴とする音声認識装置。
【請求項１３】請求項９記載の音声認識装置におい
て、認識結果出力手段で認識結果の音声の特徴を変化さ
せて発する際に、該認識結果の音声に基づく信号が前記
音声認識手段に到達しないような制御がなされることを
特徴とする音声認識装置。
【請求項１４】請求項９記載の音声認識装置におい
て、認識結果出力手段で認識結果の音声の特徴を変化さ
せて発する際に、前記音声認識手段の音声認識機能を停
止する処理，あるいはそれと同等の処理がなされるよう
になっていることを特徴とする音声認識装置。
【請求項１５】音声を入力する入力手段と、入力され
た音声を認識する音声認識手段と、認識結果を音声で発
する認識結果出力手段とを有し、２回の認識結果が時間
的に前後して得られたときに、後の認識結果が前の認識
結果と同じで、かつ一定時間以内に得られた場合、後の
認識結果をリジェクトすることを特徴とする音声認識装
置。
【請求項１６】音声を入力する入力手段と、入力され
た音声を認識する音声認識手段と、認識結果を音声で発
する認識結果出力手段とを有し、２回の認識結果が時間
的に前後して得られたときに、後の認識結果が前の認識
結果と同じで、かつ一定時間以内に得られた場合、後の
認識結果を有効とするか無効とするかをの判断を使用者
に委ねるようになっていることを特徴とする音声認識装
置。
【請求項１７】音声を入力する入力手段と、入力され
た音声を認識する音声認識手段と、認識結果を音声で発
する認識結果出力手段とを有し、２回の認識結果が時間
的に前後して得られたときに、後の認識結果が前の認識
結果と同じで、かつ一定時間以内に得られた場合、後の
認識結果の基となった音声のパターン長と前の認識結果
を再生したときの再生音声の時間長との差が一定値以内
のときに、後の認識結果をリジェクトすることを特徴と
する音声認識装置。
【請求項１８】音声を入力する入力手段と、入力され
た音声を認識する音声認識手段と、認識結果を音声で発
する認識結果出力手段とを有し、２回の認識結果が時間
的に前後して得られたときに、後の認識結果が前の認識
結果と同じで、かつ一定時間以内に得られた場合、後の
認識結果の基となった音声のパターン長と前の認識結果
を再生したときの再生音声の時間長との差が一定値以内
のときに、後の認識結果を有効とするか無効とするかを
の判断を使用者に委ねるようになっていることを特徴と
する音声認識装置。
【請求項１９】音声を入力する入力手段と、入力され
た音声を認識する音声認識手段と、認識結果を音声で発
する認識結果出力手段とを有し、２回の認識結果が時間
的に前後して得られたときに、後の認識結果が前の認識
結果と同じで、かつ一定時間以内に得られた場合、後の
認識結果の基となった音声のパターンと前の認識結果を
再生した音声のパターンとが類似しているときに、後の
認識結果をリジェクトすることを特徴とする音声認識装
置。
【請求項２０】音声を入力する入力手段と、入力され
た音声を認識する音声認識手段と、認識結果を音声で発
する認識結果出力手段とを有し、２回の認識結果が時間
的に前後して得られたときに、後の認識結果が前の認識
結果と同じで、かつ一定時間以内に得られた場合、後の
認識結果の基となった音声のパターンと前の認識結果を
再生した音声のパターンとが類似しているときに、後の
認識結果を有効とするか無効とするかをの判断を使用者
に委ねるようになっていることを特徴とする音声認識装
置。