JPH0764594A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH0764594A
JPH0764594A JP5235596A JP23559693A JPH0764594A JP H0764594 A JPH0764594 A JP H0764594A JP 5235596 A JP5235596 A JP 5235596A JP 23559693 A JP23559693 A JP 23559693A JP H0764594 A JPH0764594 A JP H0764594A
Authority
JP
Japan
Prior art keywords
voice
recognition result
recognition
sound
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5235596A
Other languages
English (en)
Inventor
Junichiro Fujimoto
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP5235596A priority Critical patent/JPH0764594A/ja
Publication of JPH0764594A publication Critical patent/JPH0764594A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

(57)【要約】 【目的】 例えば自動車内のような騒音環境下で用いら
れる場合にも、再生出力された音声認識結果を聞き取り
やすくすることができる。 【構成】 音声認識処理を行なうため、利用者が音声を
発すると、この音声は、入力部1から音声認識部2に送
られて認識処理がなされる。音声認識部2からの認識結
果は、認識結果出力部3に送られ、認識結果出力部3で
は、認識結果に対応した音声または音響を例えばスピ−
カから出力する。利用者は、この音声または音響を聞く
ことで、認識結果を知ることができる。騒音などによ
り、この音声または音響を聞き取りにくいときには、利
用者は調整部(例えば外部スイッチ)5を操作すること
により音声または音響の特徴を変化させて、認識結果と
して出力される音声または音響を騒音などと区別し易い
ように変えることができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、話者の音声を認識する
音声認識装置に関する。
【0002】
【従来の技術】従来、音声の認識結果を登録者の声で再
生するものとして、例えば、特開平2−29055号に
開示されているような音声認識装置が知られている。こ
の音声認識装置では、利用者が音声認識用に発声した声
を登録し、さらにこれを圧縮して再生用デ−タとして予
め記憶しておき、音声認識結果が得られたときに、この
認識結果に対応する再生用デ−タを再生し、音声出力す
るようにしている。これにより、利用者は、音声認識さ
れた結果を利用者の声で聞き取ることができる。
【0003】
【発明が解決しようとする課題】しかしながら、この種
の音声認識装置を例えば自動車内で用いる場合には、自
動車内での騒音により、再生された認識結果を聞き取り
にくいなどの問題が生じる。すなわち、自動車の騒音
は、主に、エンジン音と、道路とタイヤとの摩擦音であ
り、低周波成分が多く、高周波成分は少ないことが知ら
れており、この場合、音声認識装置の利用者が,例え
ば、男性で、しかも声の低い者であるときには、利用者
の声で認識結果が再生出力されても、この再生音は車の
中の騒音と周波数帯域が非常に近いために騒音と区別で
きず、利用者はこの再生音を聞き取りにくいという問題
があった。また、自動車内で用いられる場合に限らず、
認識結果が利用者の声で再生される場合には、この再生
音が大きいと、これが再度マイクロフォンから入力され
て本来認識されるべきでない音声が認識されてしまうと
いう問題もあった。
【0004】このように、音声認識結果を音声で再生出
力する場合、従来では、環境によって認識結果出力を聞
き取りにくく、また、この認識結果出力が再び音声認識
装置に入力することによって、本来認識されるべきでな
い音声が認識されてしまうという欠点があった。
【0005】本発明は、例えば自動車内のような騒音環
境下で用いられる場合にも、再生出力された音声認識結
果を聞き取りやすく、また、再生出力された音声認識結
果が再び音声認識されてしまうという事態が生ずるのを
低減することの可能な音声認識装置を提供することを目
的としている。
【0006】
【課題を解決するための手段および作用】上記目的を達
成するために、請求項1乃至請求項8記載の発明は、認
識結果出力手段で発せられる音響または音声の特徴を変
化させるようになっている。これにより、例えば自動車
内のような騒音環境下で用いられる場合にも、再生出力
された音声認識結果を聞き取りやすく、また、再生出力
された音声認識結果が再び音声認識されてしまうという
事態が生ずるのを低減することできる。
【0007】特に、請求項4記載の発明では、認識結果
出力手段で発せられる音響または音声の特徴を、環境音
に応じて変化させるようになっているので、認識結果の
音の特徴を手動調節によらずに最適に変化させることが
できる。
【0008】また、請求項5記載の発明では、入力され
た音声を分析し、認識結果出力手段で発せられる音響ま
たは音声の特徴を分析結果と異なった特徴を有するよう
に変化させるようになっているので、利用者は、認識結
果をより聞き取り易くなる。
【0009】また、請求項9乃至請求項15記載の発明
は、認識結果出力手段から発せられる該認識結果の音声
が音声認識手段で認識されないような制御がなされるよ
うになっている。これにより、スピ−カから出力される
音響または音声がどれだけ大きくても、これによって認
識装置が誤動作するという事態は生じない。この結果、
スピーカ22からの音響または音声の音量を大きくする
ことができて、利用者が、騒音中であるいは認識装置か
ら離れた場所で装置を使用していても、認識結果を大き
な音響または音声で知ることができる。
【0010】また、請求項16乃至請求項20記載の発
明は、認識結果の再生音が入力され認識されて、これが
正規の認識結果として扱われるのを有効に防止できる。
【0011】
【実施例】以下、本発明の実施例を図面に基づいて説明
する。図1は本発明に係る音声認識装置の第1の実施例
の構成図である。図1を参照すると、この第1の実施例
の音声認識装置は、音が入力するマイクロフォンなどの
入力部1と、入力部1から入力された音声を認識する音
声認識部2と、音声認識部2からの認識結果を音響また
は音声で出力する認識結果出力部3と、調整部5とを有
している。
【0012】ここで、音声認識部2には、例えば利用者
の標準的な音声の特徴量が予め登録されている音声認識
用辞書10が設けられており、音声認識部2は、入力部
1から入力された音声の特徴量を音声認識用辞書10と
照合し、認識結果(リジェクトを含む)を得るようにな
っている。
【0013】また、認識結果出力部3には、音発生部8
と、登録部9とが設けられており、音発生部8は、音声
認識部2から認識結果が送られたときに、この認識結果
に対応した音響または音声を生成し、これを例えばスピ
ーカから出力するようになっている。また、認識結果出
力部3の登録部9は、認識結果出力部3が認識結果を音
声で出力するよう構成されている場合に特に必要とさ
れ、登録部9には、音声認識部2から送られるべき各種
の認識結果に対応させて、音声再生用デ−タが例えば圧
縮して保存されており、音声認識部2から所定の認識結
果が音発生部8に送られたときに、登録部9からは該認
識結果に対応した音声再生用デ−タが音発生部8により
読み出されるようになっている。
【0014】なお、認識結果出力部3が認識結果を音響
で出力するよう構成されている場合にも、各種の認識結
果に対応させて音響再生用デ−タを登録部9に予め登録
しておくこともできるが、認識結果が音響で出力されて
いる場合には、登録部9を設けずに、音発生部8におい
て認識結果に応じた音響を直接発生させることも可能で
ある。
【0015】また、調整部5は、認識結果出力部3の音
発生部8で発生する音響または音声の特徴を変化させる
ためのものであり、例えば利用者の操作に従って音響ま
たは音声の特徴を変化させる外部スイッチによって構成
されている。
【0016】次に、このような構成の第1の実施例の音
声認識装置の動作について説明する。なお、実際の動作
を行なわせるに先立って、利用者に標準音声を発声さ
せ、この標準音声の特徴量を抽出して音声認識用辞書1
0を予め作成しておく。また、このときに発声した標準
音声の一部をデジタル信号処理で良く知られたADPC
M等により圧縮し、これを音声再生用データとして、認
識結果出力部3の登録部9に予め保存しておくことがで
きる。
【0017】音声認識処理を行なうため、利用者が音声
を発すると、この音声はまず入力部1に入力する。入力
部1に入力した音声は、音声認識部2に送られ、そこ
で、例えば辞書10との照合による認識処理がなされ
る。音声認識部2からの認識結果は、次いで、認識結果
出力部3に送られ、認識結果出力部3では、認識結果に
対応した音声または音響を例えばスピ−カから出力す
る。利用者は、この音声または音響を聞くことで、認識
結果を知ることができる。周囲の環境(騒音など)によ
り、この音声または音響を聞き取りにくいときには、利
用者は調整部(例えば外部スイッチ)5を操作すること
により音声または音響の特徴を変化させて、認識結果と
して出力される音声または音響を周囲の環境(騒音な
ど)と区別し易いように変えることができる。
【0018】次に、第1の実施例の音声認識装置の具体
例を説明する。先ず、第1の具体例として、認識結果出
力部3,すなわち音発生部8が認識結果を音響で出力す
るようになっており、また、調整部5が、音響の特徴
(例えば周波数)を変化させるように構成されている場
合を考える。なお、この場合、登録部9は設けられてお
らずとも良く、音発生部8が音響を生成する機能を有し
ているときには、認識結果に対応した音響を音発生部8
において直接発生させることができる。
【0019】いま、この第1の具体例の音声認識装置
を、3種類の品物のそれぞれの個数を計数するようなシ
ステムに適用する場合を考える。利用者が入力部1に向
かって品名を音声で発声すると、音声認識部2では、品
名の音声を認識し、3種類の品物のうちのいずれの種類
のものであるかを認識する。
【0020】なお、音声認識部2がさらに各種類の品物
の個数を計数する機能を有しているとすると、音声認識
部2は、利用者により発声された品名音声からその品物
の種類を認識したときに、これと同時にこの品物のカウ
ント値を“1”だけ歩進し、この品物の個数をカウント
することができる。
【0021】品物の種類の認識結果は、各品物に対して
3種類の周波数の音響で出力され、利用者はこの音響を
聞いて、利用者の発声した品名を音声認識部3が正しく
認識したか否かを判断する。この場合、上記3種類の周
波数が調整部(外部スイッチ)5により例えば500H
z,1100Hz,2800Hzに設定されているとす
ると、利用者は、周りの騒音に低周波数成分が多いとき
は、1100Hz,2800Hzの音響については、こ
れを聞き取ることができるが、500Hzの音響につい
ては、これを聞き取れないことが多く、認識装置がリジ
ェクトしているのか、正しく認識しているのか区別でき
ないことがある。そこで、利用者は、調整部(外部スイ
ッチ)5により500Hzの周波数を例えば4300H
z程度の周波数に設定し直すことによって、周りの騒音
と認識結果の出力音響とを区別しやすくすることができ
る。
【0022】なお、純音で周波数だけを変化させる時に
は、それぞれの音の周波数が整数倍の関係にあると、同
じ音程に聞こえたり、あるいは協和音程になって区別し
にくくなることがあるので、注意が必要である。また、
上述の例では、音響の周波数を変化させているが、これ
のかわりに、あるいは、これとともに、音の振幅を変え
たり、あるいは振幅変調をしたり、また、他の変調方法
により音の特徴を変化させることもできる。
【0023】図2は、上記の変調を実現する振幅変調器
の一例を示す図である。この振幅変調器は、所定周波数
の音響用の信号,すなわちキャリアを発生する正弦波発
振器11と、正弦波発振器11から発生したキャリアを
増幅する増幅器12と、振幅変調用の変調波を発生する
正弦波発振器13と、正弦波発振器13から発生した変
調波を可変増幅する増幅器14と、乗算器15とを有し
ており、乗算器15において、増幅器12からのキャリ
アに増幅器14からの変調波を掛けあわせることによ
り、振幅変調波を得ることができる。このとき、正弦波
発振器13の周波数を変えることもできるし、または、
発振器13の周波数を変えずに、増幅器14の増幅率を
変える(振幅を変える)こともできるし、あるいは、両
方を変化させることもできる。これにより、音響の特徴
を様々に変化させることができ、認識結果の出力音響を
周りの騒音から区別し易くするための調整をより容易に
行なうことができる。
【0024】また、第2の具体例として、認識結果出力
部3,すなわち音発生部8が認識結果を音声で,すなわ
ち再生音声あるいは合成音声で出力するようになってお
り、また、調整部5が、再生音声あるいは合成音声の特
徴(例えば、再生音声あるいは合成音声の長さ、また
は、再生音声あるいは合成音声のピッチ)を変化させる
ように構成されている場合を考える。
【0025】なお、認識結果を再生音声で出力する場
合、音発生部8は、音声再生部として構成され、登録部
9には、例えば利用者が音声認識用辞書10の作成時に
発声した標準音声のデ−タ(すなわち音声信号デ−タ)
をデジタル信号処理で良く知られたADPCM等の方法
などにより圧縮したデ−タが再生用デ−タとして保存さ
れており、音声認識部2から所定の認識結果が送られた
ときに、音発生部8は、この認識結果に対応した再生用
デ−タを登録部9から読み出してこの再生用デ−タに基
づき音声を再生し、再生音声として出力するようになっ
ている。また、認識結果を合成音声で出力する場合に
は、音発生部8は、例えば音合成器として構成されてい
る。なお、音発生部8が音合成器として構成されている
場合、登録部9は必要ではない。
【0026】ここで、再生音声あるいは合成音声の特徴
として、再生音声あるいは合成音声の長さを変える場
合、例えば再生音声の長さを変える場合には、再生用デ
−タに基づき再生される音声信号において定常的に変化
する部分,あるいは振幅の大きな部分の長さを変化させ
れば良い。すなわち、定常的に変化する部分,あるいは
振幅の大きな部分の前後にこの部分のデ−タと同じデ−
タを例えば複数回コピ−して挿入することにより、声の
高低を変えることなく、長さを変える(いまの場合、長
くする)ことができる。例えば、図3(a)に示す元の
再生波形の一部P0をその前後にコピ−して挿入するこ
とによって、図3(b)に示すような伸長された再生波
形を得ることができる。
【0027】認識結果出力部3が、上記のように、再生
音声の特徴をその長さを変えて変化させるよう構成され
ているときには、この音声認識装置を例えばパルス状の
雑音が多いところで用いるような場合にも、その雑音の
長さに比べて再生音声の長さを長くすることにより、こ
の再生音声,すなわち認識結果を利用者に聞き取り易く
させることができる。
【0028】また、利用者が、この音声認識装置の近く
にいるとき,あるいは、入力部1から離れた位置にいる
ときに、一般には、利用者の音声と再生音声の音量の差
が少ないか、または再生音声の方が大きくなってしまう
ため、再生音声が誤って認識されるという問題が生じ
る。しかしながら、一般に通常の発声で、一つの単語の
発声長の変動が2割乃至3割程度であることを利用し
て、例えば、再生音声の長さを元の再生音声の長さより
も3割以上長く又は短くなるようにし、さらに、音声認
識部2において音声を認識する際、辞書10に登録され
た音声の長さと入力された音声の長さとが3割以上違う
ものをリジェクトするようにしておくことにより、再生
音声が音声認識部2において誤って認識されるという事
態を有効に防止することができる。合成音声の場合に
も、同様にして、その長さを変えることができて、これ
により、上記と同様の効果を得ることができる。
【0029】このように、再生音声あるいは合成音声の
長さを変化させることによって、騒音環境下でも認識結
果をより正確に聞き取ることができ、また、利用者が、
音声認識装置の近くにいるとき,あるいは、入力部1か
ら離れた位置にいるときにも、利用者の音声を認識結果
の再生音声あるいは合成音声と混同させることなく音声
認識部2に認識させることができる。
【0030】また、再生音声あるいは合成音声の特徴と
して、再生音声あるいは合成音声のピッチを変化させる
場合、例えば合成音声のピッチを変化させる場合には、
線形予測係数を用いることができる。図4は線形予測係
数を用いて合成音声のピッチを変化させる回路の構成例
を示す図である。なお、この回路は、文献「“音声情報
処理の基礎” オーム社 1981年 第86頁」に示
されているような音声合成回路であって、この音声合成
回路により調整部5を含めた音発生部8を音合成部とし
て構成することができる。
【0031】図4を参照すると、この音声合成回路は、
音源VSA〜VSDと、音源VSA〜VSDのいずれか1つ
を選択するためのスイッチSWと、単位遅延素子DL1
〜DLnと、各単位遅延素子DL1〜DLnから出力され
る信号に所定の線形予測係数α1〜αnをそれぞれ乗算す
る乗算器ML1〜MLnと、乗算器ML1〜MLnからの出
力信号を加算して予測値yn’を得る加算器AD1と、ス
イッチSWにより選択された音源からの出力εnと加算
器AD1からの出力すなわち予測値yn’とを加算して、
合成音声波形ynを得る加算器AD2とを有している。
【0032】ここで、音源VSAは、例えばホワイトノ
イズ発生源であるとし、音源VSB〜VSDは、それぞれ
所定周波数fB,fC,fDのパルスを発生するパルス発
生源であるとする。このような構成において、無声音を
出力させる場合には、無声音はホワイトノイズで駆動さ
れることが知られているので、音源VSAを選択するよ
うにスイッチSWを切替える。また、有声音を出力する
場合には、有声音はパルスで駆動されることが知られて
いるので、音源VSB〜VSDのいずれかを選択するよう
にスイッチSWを切替える。すなわち、有声音を出力す
る場合、パルス間隔が音声のピッチに相当するので、音
源VSB〜VSDをスイッチSWにより切替え選択し、適
切な駆動パルス間隔を選択することにより合成音声のピ
ッチを適宜変化させることができる。
【0033】調整部5,音発生部8に図4の音声合成回
路を用いる場合、例えば、騒音環境下において、認識結
果の合成音声が低く、これを聞き取りにくいときには、
利用者は、スイッチSWを操作して高いピッチ周波数の
音源を選択すれば良い。これにより、騒音環境下におい
ても、認識結果を確認し易くなる。なお、図4では、有
声音源として、予め、所定のピッチ周波数fB,fC,f
Dが設定されている音源VSB,VSC,VSDを用いた
が、これらの有声音源として、発振器のように周波数を
自由に変化させることのできるものを用いても良い。
【0034】このように、音声認識の結果である再生音
声あるいは合成音声のピッチを変化させることによって
も、騒音環境下で、再生音声あるいは合成音声を聞き取
り易くすることができる。
【0035】図5は本発明に係る音声認識装置の第2の
実施例の構成図である。図5の音声認識装置は、音が入
力するマイクロホンなどの入力部1,17と、入力部1
から入力された音声を認識する音声認識部2と、音声認
識部2からの認識結果を音響または音声で出力する認識
結果出力部3と、調整部5と、入力部17からの入力音
を分析し、その結果に応じて、認識結果出力部3の音発
生部8で生成する音響または音声の特徴を変化させる音
分析部16とを有している。
【0036】ここで、入力部1は、音声認識用の音声を
入力するために設けられているのに対し、入力部17
は、音声認識装置の利用環境の音を取り込むために設け
られており、音分析部16では、入力部17により取り
込まれた利用環境の音を分析し、利用環境の音と区別で
きる方向に、音発生部8で発生する音響または音声の特
徴(例えば、音響または音声の振幅,あるいは周波数特
性,あるいはピッチ)を変化させるようになっている。
すなわち、前述した第1の実施例では、音発生部8で発
生する音響または音声の特徴を利用環境の音と区別でき
るように、調整部5(例えば外部スイッチ)により、主
に手動操作で変化させるようにしたが、この第2の実施
例では、調整部5による手動調整を必要とすることな
く、音分析部16において、利用環境の音を自動分析
し、この分析結果に応じて音発生部8で発生する音響ま
たは音声の特徴を自動的に最適変化させるよう構成され
ている。
【0037】次に、この第2の実施例の音声認識装置の
具体例を説明する。先ず、第1の具体例として、変化さ
せる音響または音声の特徴が振幅である場合について説
明する。
【0038】いま、音声認識用として用いられる入力部
1が、利用者の動きに合せて利用者が自由に持ち回れる
ように構成されている(すなわち、入力部1が相当の長
さのコードなどにより音声認識装置本体からの位置を自
由に変えることができるように構成されている)一方
で、入力部17が音声認識装置本体に取り付けられてい
るとする。
【0039】この場合、利用者は、動きながら入力部1
を利用することが考えられるので、この入力部1からの
信号に基づいては話者が認識装置本体の近くにいるか否
かを判断することはできない。そこで、この第1の具体
例では、入力部17からの信号に基づいて利用者と音声
認識装置本体との距離を音分析部16において判断さ
せ、その距離に応じて、音発生部8から発生する音響ま
たは音声の振幅を変化させるようになっている。
【0040】すなわち、入力部17からの信号に含まれ
ている音声の成分と環境音の成分との比,すなわちS/
N比を音分析部16において計算し、S/N比が小さい
ときには、利用者が装置本体から離れていると判断し
て、音発生部8に再生音の振幅を大きくするような制御
信号を与える一方で、S/N比が大きいときには、利用
者が装置本体の近くにいると判断して、音発生部8に再
生音の振幅を小さくするような制御信号を与えるように
なっている。なお、入力部17からの信号に含まれてい
る音声の成分を検出するのに、図5の例では、音分析部
16は、入力部1からの信号を用いるようになってい
る。
【0041】次に、この第1の具体例の動作について説
明する。図5の装置において、入力部1,17には、利
用者が音声を発していない状態では、周囲の環境音のみ
が入力する一方、利用者が音声を発しているときには、
環境音と利用者の音声とが重畳して入力する。ところ
で、入力部1を利用者が動きながら利用する場合、入力
部1は常に利用者のすぐ近くにあるので、利用者が音声
を発生しているときに、利用者の音声は、入力部1にほ
とんど減衰せず入力する。これに対し、入力部17は音
声認識装置に固定されているので、入力部17に入力す
る利用者の音声の強さは、利用者と音声認識装置との距
離に応じて変化する。図6(a),(b)はそれぞれ入
力部1,入力部17からの信号の一例を示す図である。
先ず、図6(a)を参照すると、入力部1には、時刻t
1からL2の期間利用者の音声が入力し、これにより、入
力部1からは音声信号V0が出力される状態が示されて
いる。また、図6(b)を参照すると、入力部17に
は、時刻t2までは環境音だけが入力し、従って、入力
部17からは環境音信号Eのみが出力され、時刻t2
後は、入力部1に時刻t1に入力した音声に対応した音
声が所定時間の遅れで入力し、入力部17からは環境音
信号Eに重畳してこの音声信号V1がL2の期間出力され
る状態が示されている。なお、図6(b)において、環
境音信号Eに音声信号V1が重畳した期間L2の部分を音
声部と称し、この音声部に先立つ環境音信号Eのみの期
間L1の部分を環境部と称する。また、入力部1にも、
入力部17と同様に環境音が入力するが、この環境音は
話者音声に比べて相対的に非常に小さいので、図6
(a)では環境音信号を省略している。
【0042】図7は第1の具体例の処理動作を示すフロ
ーチャートである。図7を参照すると、音分析部16で
は、先ず、図6(a)に示すような入力部1からの信号
と図6(b)に示すような入力部17からの信号とを比
較し、入力部17からの信号から音声部を検出する(ス
テップS1)。この際、図6(a)と図6(b)とを比
べればわかるように、音声信号V0とV1とは、出力され
る期間L2が同じであり、単に所定の時間遅れがあるだ
けであるので、入力部1からの信号,すなわち音声信号
0に基づき、入力部17からの信号から音声部を容易
に検出することができる。
【0043】音声部を検出した後、音分析部16は、入
力部17からの信号において、音声部と環境部とを分離
し、S/N比の計算を行なう(ステップS2,S3)。
この場合、音声部には、音声成分とともに環境音(騒
音)成分も含まれるので、S/N比を計算するために
は、音声部から環境音成分を差し引き、音声成分だけの
大きさSVを抽出する必要がある。
【0044】音声成分の大きさは、具体的には、図6
(b)において、期間L1の環境部における合計音強度
をS1とし、期間L2の音声部における合計音強度をS2
とするとき、次式により求めることができる。
【0045】
【数1】SV=(S2/L2)−(S1/L1
【0046】また、環境音成分の大きさSNは、次式に
より求めることができる。
【0047】
【数2】SN=S1/L1
【0048】従って、S/N比を、SV/SNとして計算
することができる。なお、この例では、音声部に先立つ
期間L1の部分を環境部とし、この環境部における信号
に基づき環境音成分の大きさSNを求めたが、これのか
わりに、音声部が終了した後の期間の部分を環境部と
し、環境音成分の大きさSNを求めても良いし、あるい
は音声部に先立つ期間,音声部が終了した後の期間の両
方を用いて、環境音成分の大きさSNを求めても良い。
【0049】このようにして、S/N比を計算した後、
音分析部16は、このS/N比に基づき、音発生部8か
ら出力されるべき音響または音声の振幅の大きさ,すな
わち振幅の増幅率を決定する(ステップS4)。この増
幅率の決め方は、音発生部8において用いるスピ−カの
種類等に応じて異なるが、図8に示すように、S/N比
が大きいほど、増幅率が小さくなるように、また、S/
N比が小さいほど、増幅率が大きくなるように決定す
る。
【0050】増幅率を決定すると、音分析部16は、決
定した増幅率を音発生部8に送る(ステップS5)。こ
れにより、音発生部8は、送られた増幅率に従って、音
響または音声の振幅を増幅して出力することができ、利
用者が音声認識装置から離れて動きながらこれを使用す
る場合にも、利用者の音声認識装置に対する距離を考慮
して、認識結果の音の大きさを最適に変化させることが
できる。
【0051】次に、第2の実施例の音声認識装置の第2
の具体例として、変化させる特徴が周波数特性である場
合について説明する。この第2の具体例では、音分析部
16は、入力部17から入力された環境音信号をFFT
(高速フ−リエ変換)等で周波数分析し、環境音の代表
的な周波数帯域と区別しうる周波数成分を取り出し、こ
の周波数成分に基づき、音発生部8で発生する音響また
は音声に対する変調信号を生成し、音発生部8に与える
ようになっている。例えば、音発生部8が図2に示すよ
うな振幅変調器を備えている場合には、音発生部8は、
この変調信号により、音響または音声を振幅変調して例
えばスピ−カから出力するようになっている。
【0052】この第2の具体例の動作を図9のフロ−チ
ャ−トを用いて説明する。音分析部16は、先ず、利用
者が音声を発していないときの入力部17からの信号
(すなわち,環境音だけの信号)を周波数分析する(ス
テップS11)。図10(a)には、環境音信号の周波
数分析結果の一例が示されており、この例からわかるよ
うに、環境音信号(周囲の騒音信号)には、周波数の低
い帯域の成分が多い。
【0053】従って、音分析部16は、この周波数分析
結果に基づき、図10(b)に示すように、環境音成分
がある一定値THよりも少なく、かつ、できるだけ低い
周波数の点f0を、環境音の代表的な周波数帯域と区別
しうる周波数成分として検出し、この周波数成分f0
図10(c)に示すように取り出す(ステップS1
2)。
【0054】次いで、音分析部16は、音発生部8にお
いて図2に示すような振幅変調器により音を振幅変調す
る場合、ステップS12で取り出した周波数成分f0
搬送波に採用するか、変調波に採用するかを決め、それ
に応じた変調信号を生成して音発生部8に送る(ステッ
プS13)。音発生部8は、音分析部16からの変調信
号によって音響または音声を変調し、例えばスピ−カか
ら出力する。この際、環境音が変動する毎に、音分析部
16において取り出される周波数成分f0も変化し、音
発生部8には、環境音の周波数帯域に応じた変調信号が
送られる。これにより、音発生部8からは、環境音が変
化しても、環境音を考慮した聞き取り易い認識結果の音
響または音声が出力される。
【0055】次に、第2の実施例の音声認識装置の第3
の具体例として、変化させる特徴がピッチである場合に
ついて説明する。この第3の具体例では、音分析部16
は、入力部17から入力された環境音信号を周波数分析
し、環境音の代表的な周波数帯域と区別しうる周波数成
分を決定して音発生部8に与え、また、音発生部8は、
音分析部16において決定された周波数成分を用いてピ
ッチを選択し合成音の再生を行なうように構成されてい
る。
【0056】この第3の具体例の動作を図11のフロ−
チャ−トを用いて説明する。この第3の具体例では、音
分析部16は、先ず、第2の具体例とほぼ同様の処理を
行ない、入力部17から入力された環境音信号を分析し
て、図10(c)に示すような周波数成分f0を最適周
波数として決定する(ステップS21)。
【0057】次いで、決定した最適周波数f0を音発生
部8に与える(ステップS22)。音発生部8は、これ
が例えば図4に示すような音声合成回路になっている場
合、この音声合成回路において、送られた最適周波数に
最も近いピッチをスイッチSWにより選択し合成音声の
再生を行なう(ステップS23)。このような動作によ
り、環境音が変化しても、合成音声のピッチを環境音と
区別可能なものに自動的に変えることができるので、手
動調整を必要とせずに、常に聞き取り易い認識結果の合
成音声を出力することができる。
【0058】また、上記第2の実施例の変形例として、
音分析部16において入力部17からの入力音を分析す
るかわりに、入力部1からの入力音(利用者の音声)を
分析し、その分析結果に基づき、音発生部8において、
利用者の音声の特徴と異なる特徴の音を発生させること
も可能である。例えば、利用者の音声のピッチと異なる
ピッチの再生音を発生させることも可能であり、利用者
の音声ピッチと異なるピッチの再生音を発生させること
により、利用者はこの再生音をより聞き取り易くなる。
すなわち、再生音が自分の声のピッチと同じような場
合、利用者にとって聞き取りにくいことがあるが、異な
るピッチの再生音を発生させることで、より聞き取り易
くなる。
【0059】図12は本発明に係る音声認識装置の第3
の実施例の構成図である。第3の実施例の音声認識装置
は、認識結果出力部3からの認識結果の再生音声が再び
入力部1から入力されて音声認識部2で認識されてしま
うという事態を確実に防止することを意図するものであ
る。すなわち、前述の各実施例においても、再生する音
の特徴を変化させることで、音声認識部2で再生音が認
識されてしまうという事態を防止することはできるが、
音声認識部2が不特定話者方式を採用しているようなと
きには、再生音が認識されてしまうことがある。このよ
うな事態を確実に防止するため、第3の実施例の音声認
識装置では、入力部1と音声認識部2との間の接続を認
識結果出力部3からの所定の信号によりオン,オフする
ためのスイッチ21が設けられている。
【0060】このような構成の音声認識装置では、通
常、スイッチ21はオンの状態になっており、入力部1
からの信号は、音声認識部2に送られて音声認識され、
認識結果が認識結果出力部3に送られる。そして、認識
結果出力部3では、認識結果に応じた音響または音声を
音発生部8で生成し(より詳しくは、音響信号または音
声信号を生成し)、これを例えばスピーカ22に与える
ことで、スピーカ22から認識結果が音響または音声と
して出力される。この第3の実施例の装置では、この
時、スピ−カ22へ音響信号または音声信号を渡すと同
時に、音発生部8からの信号によってスイッチ21をオ
フ状態にする。これにより、スピ−カ22からどのよう
な音響または音声が再生出力されようとも、その音響ま
たは音声の入力信号が入力部1から音声認識部2に送ら
れるのを防止できる。従って、スピ−カ22から出力さ
れる音響または音声がどれだけ大きくても、これによっ
て認識装置が誤動作するという事態は生じない。この結
果、スピーカ22から出力される音響または音声の音量
を大きくすることができて、利用者が、騒音中であるい
は認識装置から離れた場所で、装置を使用していても、
認識結果を大きな音響または音声で知ることができる。
【0061】また、図13は図12の音声認識装置の変
形例を示す図である。なお、図12の音声認識装置は図
1の音声認識装置に対応した構成になっているのに対
し、図13の音声認識装置は図5の音声認識装置に対応
した構成となっている。
【0062】図13の音声認識装置では、入力部17か
ら入力された信号を音分析部16で分析し、その結果を
音発生部8に与えると、音発生部8では、これに基づき
音響または音声の特徴を変化させて、音響または音声を
生成し、これを例えばスピーカ22から出力する。この
とき、図13の装置では、音発生部8が音響信号または
音声信号をスピーカ22に渡すと同時に、音発生部8か
らの信号によってスイッチ21をオフ状態にする。これ
により、スピ−カ22からどのような音響または音声が
再生出力されようとも、図12の装置と同様に、その音
響または音声の入力信号が入力部1から音声認識部2に
送られるのを防止でき、スピ−カ22から出力される音
響または音声がどれだけ大きくても、これによって認識
装置が誤動作するという事態は生ぜず、この結果、スピ
ーカ22からの音響または音声の音量を大きくすること
ができて、利用者が、騒音中であるいは認識装置から離
れた場所で装置を使用していても、認識結果を大きな音
響または音声で知ることができる。
【0063】図14は本発明の音声認識装置の第4の実
施例の構成図である。第4の実施例の音声認識装置で
は、スイッチ21を設けるかわりに、認識結果出力部3
から音声認識部2に対して音声認識機能の停止処理ある
いはそれと同等の処理を行なわせるよう構成されてい
る。
【0064】具体的には、例えば、認識結果出力部3の
音発生部8が、認識結果を音響または音声で出力するた
めの信号をスピーカ22に対して出すと同時に、音声認
識部2に対してはプログラムにホルト(HALT)をかけ
るような処理を行なうよう構成されている。これによ
り、認識結果が音響または音声で出力されているときに
は音声認識部2の機能を止め、スピ−カ22からどのよ
うな音響または音声が再生出力されようとも、音声認識
部2では認識処理がなされない。従って、スピ−カ22
から出力される音響または音声がどれだけ大きくても、
これによって認識装置が誤動作するという事態は生じな
い。この結果、スピーカ22からの音響または音声の音
量を大きくすることができて、利用者が、騒音中である
いは認識装置から離れた場所で装置を使用していても、
認識結果を大きな音響または音声で知ることができる。
【0065】また、図15は図14の音声認識装置の変
形例を示す図である。なお、図14の音声認識装置は図
1の音声認識装置に対応した構成になっているのに対
し、図15の音声認識装置は図5の音声認識装置に対応
した構成となっている。図15の音声認識装置では、入
力部17から入力された信号を音分析部16で分析し、
その結果を音発生部8に与えると、音発生部8では、こ
れに基づき音響または音声の特徴を変化させて、音響ま
たは音声を生成し、例えばスピーカ22から出力する。
このとき、図15の装置では、音発生部8は、音響信号
または音声信号をスピーカ22に渡すと同時に、音声認
識部2に対してプログラムにホルトをかけるような処理
を行なう。これにより、図14の装置と同様に、スピ−
カ22から出力される音響または音声がどれだけ大きく
ても、これによって認識装置が誤動作するという事態は
生じない。この結果、スピーカ22からの音響または音
声の音量を大きくすることができて、利用者が、騒音中
であるいは認識装置から離れた場所で装置を使用してい
ても、認識結果を大きな音響または音声で知ることがで
きる。
【0066】図16は本発明に係る音声認識装置の第5
の実施例の構成図である。図16の音声認識装置は、音
声が入力するマイクロホンなどの入力部1と、入力部1
から入力された音声を認識する音声認識部2と、音声認
識部2からの認識結果を音響または音声で出力する認識
結果出力部3と、音声認識部2から1回の認識結果が出
力されたときに、これを保持するメモリ31と、メモリ
31に1回の認識結果が保持された時点から時間を計測
し、所定時間経過後、メモリ31に保持されている内容
を消去する計時部32と、音声認識部2から2回の認識
結果が時間的に前後して出力されたときに、メモリ31
に保持されている前の認識結果と音声認識部2から後に
出力された認識結果とを比較する判定部33とを有し、
後の認識結果が、前の認識結果と同じものであり、か
つ、前の認識結果から一定時間以内に得られたものであ
る場合、後の認識結果をリジェクトするようになってい
る。
【0067】このような構成の音声認識装置の動作につ
いて説明する。なお、当初、メモリ31はクリアされて
いるものとする。利用者が音声を発声すると、入力部1
からの入力音声は、音声認識部2で認識され、その認識
結果は判定部33に加わる。判定部33では、メモリ3
1の内容と、いま音声認識部2から送られてきた認識結
果(1回目の認識結果)とが同じであるか否かを判定する
が、当初、メモリ31はクリアされているので、メモリ
31の内容と音声認識部2からの1回目の認識結果とは
同じではなく、従って、判定部33は、1回目の認識結
果を正規の認識結果として扱い、これをメモリ31に格
納するとともに、認識結果出力部3に与える。計時部3
2は、1回目の認識結果がメモリ31に格納されると、
計時を開始し、一定時間が経過すると、計時部32はメ
モリ31の内容を消去する。なお、この一定の時間とし
ては、認識結果がメモリ31に格納された後、認識結果
出力部3から出力される再生音が入力部1に入力し、音
声認識部2で認識されてその認識結果が判定部33に送
られるのに要する程度の時間間隔が良く、例えば数秒以
内に設定される。
【0068】従って、判定部33が次の認識結果(2回
目の認識結果)を受取った時に、前の認識結果(1回目の
認識結果)をメモリ31に格納した時点から一定時間が
経過していたならば、メモリ31の内容は消されてお
り、比較の結果が等しくなることはない。すなわち、2
回目の認識結果が認識結果出力部3からの再生音に基づ
くものではないことを表わしており、この場合、判定部
33は、2回目の認識結果をも正規のものとして扱い、
認識結果出力部3に与える。
【0069】これに対し、判定部33が次の認識結果
(2回目の認識結果)を受け取った時に、前の認識結果
(1回目の認識結果)をメモリ31に格納した時点から一
定時間が経過していないならば、メモリ31には1回目
の認識結果がまだ保持されており、判定部33は、2回
目の認識結果と1回目の認識結果とを比較することにな
る。この比較の結果、2回目の認識結果が1回目の認識
結果と同じ場合は、数秒前に認識された結果が今回の認
識結果と同じということであって、2回目の認識結果が
話者の発声音声に基づくものであるとするには非常に確
率が低く、1回目の認識結果の再生音が入力部1に入力
して認識された蓋然性が非常に高いものであるので、正
規の認識結果としては扱わない。これによって、スピ−
カ22からの再生音が入力部1に入力されたとしても、
その認識結果では動作することはなくなる。従って、ス
ピ−カ22の再生音がどれだけ大きくても認識装置への
影響はない。この結果、再生音の音量を大きくすること
ができて、利用者は、この装置を騒音中や認識装置から
離れた場所で使用していても、認識結果を音声で確実に
知ることができる。
【0070】図17,図18,図19は図16の音声認
識装置の変形例である。図16の音声認識装置では、2
回の認識結果が時間的に前後して得られたときに、後の
認識結果が前の認識結果と同じものであり、かつ一定時
間内に得られたものである場合、後の認識結果を自動的
にリジェクトするようになっているが、図17の音声認
識装置は、後の認識結果が前の認識結果と同じで、かつ
一定時間以内に得られた場合、後の認識結果を有効とす
るか無効とするかをの判断を使用者に委ねるように構成
されている。
【0071】すなわち、図17の音声認識装置の基本構
成は図16と同じであるが、表示および入力機能を有す
る操作部41がさらに設けられている。このような構成
の音声認識装置では、入力部1からの音声は、音声認識
部2で認識され、判定部33では、メモリ31に格納さ
れている内容と、いま音声認識部2から送られてきた認
識結果とが同じか否かを判定する。その結果、同じで無
ければ、この認識結果を正規のものとして扱い、認識結
果出力部3に与える。これに対し、メモリ31に格納さ
れている内容といま認識部2から送られてきた認識結果
とが同じであれば、認識結果出力部3には認識結果を与
えずに、操作部41にこれを正規の認識結果として扱っ
て良いか否かを示す表示を行なう。なお、表示のかわり
に、これを再生音声で行なっても良い。この表示,ある
いは再生音声により、利用者はその認識結果を正規のも
のとして扱うか否かを決める。これによって、スピ−カ
22からの再生音が入力部1に入力されたとしても、そ
の認識結果で装置が動作するという事態を防止でき、さ
らには、何らかの必要があって、同じ言葉を2回使用し
た時でも、これを正規の認識結果として扱うことがで
き、装置を正常に動作させることができる。
【0072】また、図18の音声認識装置は、後の認識
結果が前の認識結果と同じで、かつ後の認識結果の基と
なった音声のパタ−ン長と前の認識結果を再生したとき
の再生音声の時間長との差が所定値以内の時、後の認識
結果をリジェクトするように構成されている。なお、こ
の場合、図16と同様に、メモリ31には認識結果が保
持され、認識結果が保持された時点から一定時間が経過
すると、その内容は計時部32によって消去されるよう
になっている。
【0073】このような構成では、判定部33は、メモ
リ31に保持されている内容と、今回の認識結果とが同
じであるか否かを判定し、同じであれば、いま入力され
た音声の時間長,すなわちパタ−ンの長さと、前の認識
結果を再生した時の再生音声の時間長との差を求め、こ
れが一定値以下なら、再生音が入力部1からフィ−ドバ
ックされて認識されたものと判定して、認識結果をリジ
ェクトする。なお、上記の一定値としては、音声をデジ
タル信号に変換するときの量子化誤差程度を見込めばよ
い。仮に、認識結果が同じでも音声の時間長が違う時
は、再生音が入力部1からフィ−ドバックされたもので
はではないことを表わしている。
【0074】これに対し、メモリ31に保持されている
内容(認識結果)と今回の認識結果とが同じで、かつ今回
の認識結果の基となった音声のパターン長を前の認識結
果を再生したときの再生音声の時間長とが同じ場合は、
別の発声で利用者が入力したものと考えることは非常に
確率が低いので、今回の認識結果は前の認識結果の再生
音に基づいたものであると判断して、正規の認識結果と
して扱わない。これによって、スピ−カ22からの再生
音が入力部1に入力されて音声認識されたとしても、音
声認識装置は、その認識結果では動作することはない。
従って、スピ−カ22の再生音がどれだけ大きくても認
識装置への影響はない。この結果、再生音の音量を大き
くすることができて、利用者は、この装置を騒音中や認
識装置から離れた場所で使用していても、認識結果を音
声で確実に知ることができる。
【0075】なお、図18の装置においても、図16の
装置と同様の操作部41を設け、後の認識結果が前の認
識結果と同じで、かつ後の認識結果の基となった音声の
パタ−ン長と前の認識結果を再生したときの再生音声の
時間長との差が所定値以内のときに、図16の装置のよ
うに、後の認識結果を有効とするか無効とするかの判断
を使用者に委ねるようにすることも可能である。
【0076】また、図18の装置において、後の認識結
果の基となった音声のパターン長と前の認識結果を再生
したときの再生音声の時間長との差が所定値以内のとき
に、後の認識結果をリジェクトするかわりに、後の認識
結果の基となった音声のパタ−ン(例えば特徴パタ−ン)
と前の認識結果を再生したときの再生音声のパタ−ン
(例えば特徴パタ−ン)との類似性を調べ、これらが類似
しているときに、後の認識結果をリジェクトするように
することもできる。より具体的には、メモリ31には、
前回認識した時の認識結果と、その結果を再生した時の
再生音パタ−ンとを保存させ(但し、この内容は一定時
間が経過すると、計時部32によって消される)、判定
部33はメモリ31に保存されている認識結果と今回の
認識結果とが同じであるか否かを判定し、同じであれ
ば、いま入力された音声のパタ−ンと、メモリ31に保
存されている再生音パタ−ンとの類似性を調べる。例え
ば、これらのパターン(特徴パタ−ン)間の距離を取って
類似判断を行なうことができ、距離が一定値以下(すな
わち、類似度が一定値以上)である場合には、類似と判
断し、後の認識結果は、再生音が入力部1からフィ−ド
バックされて認識されたものと判定して、リジェクトす
る。これによって、スピ−カ22からの再生音が入力部
1に入力されて音声認識されたとしても、その結果では
動作することはなくなる。従って、スピ−カ22の再生
音がどれだけ大きくても、認識装置への影響はない。こ
の結果、再生音の音量を大きくすることができて、利用
者は、この装置を騒音中や認識装置から離れた場所で使
用していても、認識結果を音声で確実に知ることができ
る。
【0077】また、音声のパタ−ンが類似であると判断
されたときに、後の認識結果を有効とするか無効とする
かの判断を使用者に委ねるようにすることも可能であ
る。図19は、音声のパターンが類似であると判断され
たときに、後の認識結果を有効とするか無効とするかの
判断を使用者に委ねるようにすることの可能な音声認識
装置の構成例を示す図である。図19の音声認識装置の
基本構成は図18と同じであるが、表示および入力機能
を有する操作部41がさらに設けられている。このよう
な構成の音声認識装置では、入力部1からの音声は音声
認識2で認識され、判定部33では、メモリ31に格納
されている内容(認識結果)と、いま認識部2から送られ
てきた認識結果とが同じか否かを判定する。その結果、
同じで無ければ、この認識結果を正規のものとして扱
い、認識結果出力部3に与える。これに対し、メモリ3
1に格納されている認識結果といま送られてきた認識結
果とが同じであれば、いま入力された音声のパタ−ンと
メモリ31に保持されている前回の音声のパタ−ンとの
類似性を比較する。この結果、類似度が一定値以上であ
る場合には、認識結果出力部3には認識結果を与えずに
操作部41に、認識結果として扱って良いか否かを示す
表示を行なう。なお、表示のかわりに、これを再生音声
で行なっても良い。この表示,あるいは再生音声によ
り、利用者はその認識結果を正規のものとして扱うか否
かを決める。これによって、スピ−カ22からの再生音
が入力部1に入力されたとしても、その認識結果で装置
が動作するという事態を防止でき、さらには、何らかの
必要があって、同じ言葉を2回使用した時でも、これを
正規の認識結果として扱うことができ、装置を正常に動
作させることができる。
【0078】なお、図17,図19では、計時部32が
設けられたものとなっているが、図17,図19の装置
において、計時部32は必ずしも必要ではない。
【0079】
【発明の効果】以上に説明したように、請求項1乃至請
求項8記載の発明によれば、認識結果出力手段で発せら
れる音響または音声の特徴を変化させるようになってい
るので、例えば自動車内のような騒音環境下で用いられ
る場合にも、再生出力された音声認識結果を聞き取りや
すく、また、再生出力された音声認識結果が再び音声認
識されてしまうという事態が生ずるのを低減することで
きる。
【0080】特に、請求項4記載の発明では、認識結果
出力手段で発せられる音響または音声の特徴を、環境音
に応じて変化させるようになっているので、認識結果の
音の特徴を手動調節によらずに最適に変化させることが
できる。
【0081】また、請求項5記載の発明では、入力され
た音声を分析し、認識結果出力手段で発せられる音響ま
たは音声の特徴を分析結果と異なった特徴を有するよう
に変化させるようになっているので、利用者は、認識結
果をより聞き取り易くなる。
【0082】また、請求項9乃至請求項15記載の発明
によれば、認識結果出力手段から発せられる該認識結果
の音声が音声認識手段で認識されないような制御がなさ
れるので、スピ−カから出力される音響または音声がど
れだけ大きくても、これによって認識装置が誤動作する
という事態は生じない。この結果、スピーカ22からの
音響または音声の音量を大きくすることができて、利用
者が、騒音中であるいは認識装置から離れた場所で装置
を使用していても、認識結果を大きな音響または音声で
知ることができる。
【0083】また、請求項16乃至請求項20記載の発
明によれば、認識結果の再生音が入力され認識されて、
これが正規の認識結果として扱われるのを有効に防止で
きる。
【図面の簡単な説明】
【図1】本発明に係る音声認識装置の第1の実施例の構
成図である。
【図2】振幅変調器の一例を示す図である。
【図3】再生音声の長さを変える様子を示す図である。
【図4】音声合成回路の一例を示す図である。
【図5】本発明に係る音声認識装置の第2の実施例の構
成図である。
【図6】入力部からの信号の一例を示す図である。
【図7】本発明の第2の実施例の第1の具体例の動作を
示すフローチャートである。
【図8】音発生部から出力されるべき音響または音声の
振幅の増幅率の決定の仕方を説明するための図である。
【図9】本発明の第2の実施例の第2の具体例の動作を
示すフローチャートである。
【図10】入力部からの信号に対する周波数分析の一例
を示す図である。
【図11】本発明の第2の実施例の第3の具体例の動作
を示すフローチャートである。
【図12】本発明に係る音声認識装置の第3の実施例の
構成図である。
【図13】図12の音声認識装置の変形例を示す図であ
る。
【図14】本発明に係る音声認識装置の第4の実施例の
構成図である。
【図15】図14の音声認識装置の変形例を示す図であ
る。
【図16】本発明に係る音声認識装置の第5の実施例の
構成図である。
【図17】図16の音声認識装置の変形例を示す図であ
る。
【図18】図16の音声認識装置の変形例を示す図であ
る。
【図19】図16の音声認識装置の変形例を示す図であ
る。
【符号の説明】
1 入力部 2 音声認識部 3 認識結果出力部 5 調整部 8 音発生部 9 登録部 10 音声認識用辞書 11,13 正弦波発振器 12,14 増幅器 15 乗算器 16 音分析部 17 入力部 21 スイッチ 22 スピーカ 31 メモリ 32 計時部 33 判定部 41 操作部

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】 音声を入力する入力手段と、入力された
    音声を認識する音声認識手段と、認識結果を音響または
    音声で発する認識結果出力手段と、認識結果出力手段で
    発せられる音響または音声の特徴を変化させるための変
    化手段とを有していることを特徴とする音声認識装置。
  2. 【請求項2】 請求項1記載の音声認識装置において、
    前記認識結果出力手段から発せられる音声は、所定の再
    生用データに基づいて作成された再生音声、または、音
    声合成により作成された合成音声であることを特徴とす
    る音声認識装置。
  3. 【請求項3】 請求項1記載の音声認識装置において、
    前記変化手段は、認識結果出力手段で発せられる音響ま
    たは音声の特徴を手動により変化させることが可能に構
    成されていることを特徴とする音声認識装置。
  4. 【請求項4】 請求項1記載の音声認識装置において、
    さらに、環境音を検出する環境音検出手段を備え、前記
    変化手段は、認識結果出力手段で発せられる音響または
    音声の特徴を、前記環境音検出手段で検出された環境音
    に応じて変化させることを特徴とする音声認識装置。
  5. 【請求項5】 請求項1記載の音声認識装置において、
    前記変化手段は、前記入力手段から入力された音声を分
    析し、認識結果出力手段で発せられる音響または音声の
    特徴を分析結果と異なった特徴を有するように変化させ
    ることを特徴とする音声認識装置。
  6. 【請求項6】 請求項1記載の音声認識装置において、
    前記変化手段は、音響または音声の特徴として、音響ま
    たは音声の振幅を変化させることを特徴とする音声認識
    装置。
  7. 【請求項7】 請求項1記載の音声認識装置において、
    前記変化手段は、音響または音声の特徴として、音響ま
    たは音声の周波数特性を変化させることを特徴とする音
    声認識装置。
  8. 【請求項8】 請求項1記載の音声認識装置において、
    前記変化手段は、音響または音声の特徴として、音声の
    ピッチを変化させることを特徴とする音声認識装置。
  9. 【請求項9】 音声を入力する入力手段と、入力された
    音声を認識する音声認識手段と、認識結果を音響または
    音声で発する認識結果出力手段とを有し、認識結果出力
    手段から発せられる認識結果の音声が音声認識手段で認
    識されないような制御がなされることを特徴とする音声
    認識装置。
  10. 【請求項10】 請求項9記載の音声認識装置におい
    て、認識結果出力手段で認識結果の音声が発せられる際
    に、該認識結果の音声に基づく信号が前記音声認識手段
    に到達しないような制御がなされることを特徴とする音
    声認識装置。
  11. 【請求項11】 請求項9記載の音声認識装置におい
    て、、認識結果出力手段で認識結果の音声が発せられる
    際に、前記音声認識手段の音声認識機能を停止する処
    理,あるいはそれと同等の処理がなされるようになって
    いることを特徴とする音声認識装置。
  12. 【請求項12】 音声を入力する入力手段と、入力され
    た音声を認識する音声認識手段と、認識結果を音響また
    は音声で発する認識結果出力手段と、認識結果出力手段
    で発せられる音響または音声の特徴を変化させるための
    変化手段とを有し、認識結果出力手段から認識結果の音
    声の特徴を変化させて発する際に、該認識結果の音声が
    音声認識手段で認識されないような制御がなされること
    を特徴とする音声認識装置。
  13. 【請求項13】 請求項9記載の音声認識装置におい
    て、認識結果出力手段で認識結果の音声の特徴を変化さ
    せて発する際に、該認識結果の音声に基づく信号が前記
    音声認識手段に到達しないような制御がなされることを
    特徴とする音声認識装置。
  14. 【請求項14】 請求項9記載の音声認識装置におい
    て、認識結果出力手段で認識結果の音声の特徴を変化さ
    せて発する際に、前記音声認識手段の音声認識機能を停
    止する処理,あるいはそれと同等の処理がなされるよう
    になっていることを特徴とする音声認識装置。
  15. 【請求項15】 音声を入力する入力手段と、入力され
    た音声を認識する音声認識手段と、認識結果を音声で発
    する認識結果出力手段とを有し、2回の認識結果が時間
    的に前後して得られたときに、後の認識結果が前の認識
    結果と同じで、かつ一定時間以内に得られた場合、後の
    認識結果をリジェクトすることを特徴とする音声認識装
    置。
  16. 【請求項16】 音声を入力する入力手段と、入力され
    た音声を認識する音声認識手段と、認識結果を音声で発
    する認識結果出力手段とを有し、2回の認識結果が時間
    的に前後して得られたときに、後の認識結果が前の認識
    結果と同じで、かつ一定時間以内に得られた場合、後の
    認識結果を有効とするか無効とするかをの判断を使用者
    に委ねるようになっていることを特徴とする音声認識装
    置。
  17. 【請求項17】 音声を入力する入力手段と、入力され
    た音声を認識する音声認識手段と、認識結果を音声で発
    する認識結果出力手段とを有し、2回の認識結果が時間
    的に前後して得られたときに、後の認識結果が前の認識
    結果と同じで、かつ一定時間以内に得られた場合、後の
    認識結果の基となった音声のパターン長と前の認識結果
    を再生したときの再生音声の時間長との差が一定値以内
    のときに、後の認識結果をリジェクトすることを特徴と
    する音声認識装置。
  18. 【請求項18】 音声を入力する入力手段と、入力され
    た音声を認識する音声認識手段と、認識結果を音声で発
    する認識結果出力手段とを有し、2回の認識結果が時間
    的に前後して得られたときに、後の認識結果が前の認識
    結果と同じで、かつ一定時間以内に得られた場合、後の
    認識結果の基となった音声のパターン長と前の認識結果
    を再生したときの再生音声の時間長との差が一定値以内
    のときに、後の認識結果を有効とするか無効とするかを
    の判断を使用者に委ねるようになっていることを特徴と
    する音声認識装置。
  19. 【請求項19】 音声を入力する入力手段と、入力され
    た音声を認識する音声認識手段と、認識結果を音声で発
    する認識結果出力手段とを有し、2回の認識結果が時間
    的に前後して得られたときに、後の認識結果が前の認識
    結果と同じで、かつ一定時間以内に得られた場合、後の
    認識結果の基となった音声のパターンと前の認識結果を
    再生した音声のパターンとが類似しているときに、後の
    認識結果をリジェクトすることを特徴とする音声認識装
    置。
  20. 【請求項20】 音声を入力する入力手段と、入力され
    た音声を認識する音声認識手段と、認識結果を音声で発
    する認識結果出力手段とを有し、2回の認識結果が時間
    的に前後して得られたときに、後の認識結果が前の認識
    結果と同じで、かつ一定時間以内に得られた場合、後の
    認識結果の基となった音声のパターンと前の認識結果を
    再生した音声のパターンとが類似しているときに、後の
    認識結果を有効とするか無効とするかをの判断を使用者
    に委ねるようになっていることを特徴とする音声認識装
    置。
JP5235596A 1993-08-27 1993-08-27 音声認識装置 Pending JPH0764594A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5235596A JPH0764594A (ja) 1993-08-27 1993-08-27 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5235596A JPH0764594A (ja) 1993-08-27 1993-08-27 音声認識装置

Publications (1)

Publication Number Publication Date
JPH0764594A true JPH0764594A (ja) 1995-03-10

Family

ID=16988351

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5235596A Pending JPH0764594A (ja) 1993-08-27 1993-08-27 音声認識装置

Country Status (1)

Country Link
JP (1) JPH0764594A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000002756A (ko) * 1998-06-23 2000-01-15 김영환 음성인식을 사용한 차량의 편의시설 제어방법
KR20040035151A (ko) * 2002-10-18 2004-04-29 현대모비스 주식회사 차량용 음성인식 장치 및 작동방법
JP2010014914A (ja) * 2008-07-02 2010-01-21 Fujitsu Ltd 音声強調装置
US8990092B2 (en) 2010-06-28 2015-03-24 Mitsubishi Electric Corporation Voice recognition device
JP2020042163A (ja) * 2018-09-11 2020-03-19 川崎重工業株式会社 乗物の音声システム及び音声出力方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000002756A (ko) * 1998-06-23 2000-01-15 김영환 음성인식을 사용한 차량의 편의시설 제어방법
KR20040035151A (ko) * 2002-10-18 2004-04-29 현대모비스 주식회사 차량용 음성인식 장치 및 작동방법
JP2010014914A (ja) * 2008-07-02 2010-01-21 Fujitsu Ltd 音声強調装置
US8990092B2 (en) 2010-06-28 2015-03-24 Mitsubishi Electric Corporation Voice recognition device
JP2020042163A (ja) * 2018-09-11 2020-03-19 川崎重工業株式会社 乗物の音声システム及び音声出力方法

Similar Documents

Publication Publication Date Title
EP1208563B1 (en) Noisy acoustic signal enhancement
JP4327241B2 (ja) 音声強調装置および音声強調方法
EP3203380A1 (en) Multi-mode audio recognition and auxiliary data encoding and decoding
KR20010014352A (ko) 음성 통신 시스템에서 음성 강화를 위한 방법 및 장치
JP2000511651A (ja) 記録されたオーディオ信号の非均一的時間スケール変更
JPH02242298A (ja) 声門波形に基づく話者識別装置
JPWO2007080764A1 (ja) 対象音分析装置、対象音分析方法および対象音分析プログラム
US7058190B1 (en) Acoustic signal enhancement system
CN108257605B (zh) 多通道录音方法、装置及电子设备
US11727949B2 (en) Methods and apparatus for reducing stuttering
ATE368922T1 (de) System und verfahren zur audiosignalverarbeitung
JP2012163692A (ja) 音声信号処理システム、音声信号処理方法および音声信号処理方法プログラム
JPH0764594A (ja) 音声認識装置
JP2002236494A (ja) 音声区間判別装置、音声認識装置、プログラム及び記録媒体
JPS6367197B2 (ja)
JP3284968B2 (ja) 話速変換機能を有する補聴器
JP2007017840A (ja) 音声認証装置
JP3223552B2 (ja) メッセージ出力装置
JPH0462600B2 (ja)
JP2004233510A (ja) 音声処理方法および装置
JP2003099094A (ja) 音声処理装置
KR20000047295A (ko) 음성신호 가공방법 및 가공장치
JP3632384B2 (ja) 聴覚補助装置
JP2006317556A (ja) 音声対話装置
JP2000242287A (ja) 発声補助装置およびプログラム記録媒体