JP2001215996A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP2001215996A
JP2001215996A JP2000021880A JP2000021880A JP2001215996A JP 2001215996 A JP2001215996 A JP 2001215996A JP 2000021880 A JP2000021880 A JP 2000021880A JP 2000021880 A JP2000021880 A JP 2000021880A JP 2001215996 A JP2001215996 A JP 2001215996A
Authority
JP
Japan
Prior art keywords
recognition
voice
likelihood
noise
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000021880A
Other languages
English (en)
Inventor
Akinori Usami
彰規 宇佐美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Wiring Systems Ltd
AutoNetworks Technologies Ltd
Sumitomo Electric Industries Ltd
Original Assignee
Sumitomo Wiring Systems Ltd
AutoNetworks Technologies Ltd
Sumitomo Electric Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Wiring Systems Ltd, AutoNetworks Technologies Ltd, Sumitomo Electric Industries Ltd filed Critical Sumitomo Wiring Systems Ltd
Priority to JP2000021880A priority Critical patent/JP2001215996A/ja
Publication of JP2001215996A publication Critical patent/JP2001215996A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 誤認識の少ない音声認識装置を提供する。 【解決手段】 音声認識の開始要求がなされると(S1
01)、音声認識処理を行ない(S103)、複数の候
補となる単語とそれぞれの尤度とを算出する(S10
5)。第1候補と第2候補との間の尤度差と雑音パワー
比との双方に基づいて、雑音を認識しているかが判定さ
れる(S107)。雑音での認識でなければ、尤度差に
基づき誤認識であるか否かの判定が行なわれ(S10
9)、誤認識でない場合に認識結果の出力が行なわれる
(S111)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は音声認識装置に関
し、特に誤認識率を低減させることができる音声認識装
置に関する。
【0002】
【従来の技術】従来より、人間の話し声を入力しその音
声を認識する音声認識装置が知られている。
【0003】図14は、音声認識装置における処理を説
明するための図である。図を参照して、入力された音声
に対してアプリケーションソフトウェアから認識要求が
なされると、認識エンジンにより音声認識処理が行なわ
れ、その認識結果がアプリケーションソフトウェアに送
られる。
【0004】認識結果には、以下のデータが含まれる。 (1) 複数の認識候補となる単語 (2) 上記(1)のそれぞれの単語に対する尤度 ここに尤度とは、その単語の正解率(得点)であり、尤
度が小さい単語の方が音声入力された単語と近似してい
ることを意味している。
【0005】アプリケーションソフトウェアでは、第1
候補となる単語の尤度と第2候補となる単語の尤度との
差が所定値以上である場合に、第1候補となる単語を最
終的な認識単語とする。
【0006】
【発明が解決しようとする課題】しかしながら、従来の
音声認識装置を用いると、音声の誤認識が多いという問
題があった。特に、音声認識処理を行なう環境に雑音が
多い場合には、誤認識率が高くなる。
【0007】また、音声認識の対象となる音声には認識
に必要最適な音声パワー範囲と、必要となるA/D(ア
ナログ/デジタル)変換分解能とがある。
【0008】しかし、マイクロホンが音を電気信号に変
換する場合に個々のマイクロホンに存在する変換固有
差、マイクロホンの指向特性や取付け位置や向き、マイ
クロホンと発声話者との距離、入力回路のばらつき、お
よび発声話者の違いにより取得できる音声パワーに差が
生じる。
【0009】また、入力される音声が小さい場合などに
は、十分な音声パワーやA/D変換の分解能を得ること
ができない場合がある。さらに、音声認識を利用する環
境などによっては、取得した音声パワーがA/D変換レ
ンジをオーバする可能性がある。また、使用する音声認
識エンジンによっても音声パワーやA/D変換の分解能
は異なる。このような原因により、音声認識の誤認識率
が高くなるという問題があった。
【0010】そこでこの発明は、誤認識の少ない音声認
識装置を提供することを目的としている。
【0011】
【課題を解決するための手段】上記目的を達成するため
この発明のある局面に従うと、音声認識装置は、音声を
入力する入力手段と、入力された音声の雑音パワー比を
算出する算出手段と、入力された音声の認識を行ない、
複数の認識候補となる単語を決定する第1の決定手段
と、決定された複数の認識候補となる単語のそれぞれの
尤度を決定する第2の決定手段と、算出された雑音パワ
ー比と、第2の決定手段で決定された複数の認識候補と
なる単語の尤度とに基づいて、入力手段に入力された音
声が雑音であるか否かを判定する判定手段とを備える。
【0012】この発明によると、算出された雑音パワー
比と複数の認識候補となる単語の尤度とに基づいて、入
力された音声が雑音であるか否かが判定される。これに
より、誤認識の少ない音声認識装置を提供することが可
能となる。
【0013】好ましくは第2の決定手段は、第1候補と
なる単語の尤度と第2候補となる単語の尤度との間の尤
度差を算出し、判定手段は、算出された雑音パワー比と
尤度差とに基づいて判定を行なう。
【0014】このように第1候補となる単語の尤度と第
2候補となる単語の尤度との間の尤度差に基づいて判定
を行なうこととすると、誤認識の少ない音声認識装置を
提供することが可能となる。
【0015】この発明の他の局面に従うと、音声認識装
置は、音声を入力する入力手段と、入力された音声のゲ
イン調整を行なう調整手段と、調整手段によりゲイン調
整が行なわれた音声の認識を行なう認識手段とを備え
る。
【0016】この発明によると、入力された音声のゲイ
ン調整が行なわれ、ゲイン調整が行なわれた音声の認識
が行なわれるため、誤認識の少ない音声認識装置を提供
することが可能となる。
【0017】好ましくは調整手段は、環境による音声パ
ワーの違いを吸収するための調整と、音声パワーの過不
足を吸収するための調整とを行なう。
【0018】このように環境による音声パワーの違いを
吸収するための調整と、音声パワーの過不足を吸収する
ための調整とを行なうことで、より誤認識の少ない音声
認識装置を提供することが可能となる。
【0019】好ましくは調整手段は、周囲の雑音が大き
い場合にはゲイン値を小さくする。このように周囲の雑
音が大きい場合にゲイン値を小さくすることで、より誤
認識の少ない音声認識装置を提供することが可能とな
る。
【0020】
【発明の実施の形態】図1は、本発明の実施の形態の1
つにおける音声認識装置の構成を示すブロック図であ
る。
【0021】図を参照して音声認識装置は、接続される
マイクM1,M2の出力を増幅するアンプ301,30
3と、接続されるスピーカSPへの信号の増幅を行なう
アンプ305と、A(アナログ)/D(デジタル)変換
またはD/A変換を行なうA/DおよびD/Aチップ3
07と、A/D変換結果を取得するA/D取得部309
と、入力された音声のゲイン調整を行なうAGC(オー
トゲインコントロール)部100と、音声の認識を行な
い認識結果を出力する認識エンジン313と、音声認識
に用いられる辞書を記録する辞書部311と、認識エン
ジン313の認識結果に基づき単語を選定する認識単語
選定部200と、音声合成を行なう合成エンジン315
と、外部装置との間で通信処理を行なう通信処理部31
7とから構成される。
【0022】AGC部100は、入力された音声の中の
発声区間の検出を行なう検出部101と、音声パワーの
検出を行なう検出部103と、ソフトウェアによりゲイ
ン値の算出を行なうゲイン値算出部105と、音声デー
タを一時記憶するバッファ107と、音声データに対す
るゲイン調整を行なうゲイン調整部109とを備えてい
る。
【0023】マイクM1またはM2を介して音声の入力
が行なわれると、マイクM1またはM2からのアナログ
信号は、アンプ301,303により増幅され、A/D
およびD/Aチップ307によりデジタル信号に変換さ
れる。そのデジタル信号に対しAGC部100によりゲ
イン調整が行なわれる。
【0024】AGC部100からの出力に基づき、認識
エンジン313は辞書部311に記録されたデータを参
照しながら、複数の認識候補となる単語を決定する。同
時に、認識エンジン313は、決定された複数の認識候
補となる単語のそれぞれの尤度を決定する。
【0025】認識候補となる単語および尤度は認識単語
選定部200に送られ、ここで最終的な認識単語が決定
される。
【0026】図2は、認識エンジン313の出力する認
識結果の具体例を示す図である。図を参照して、複数の
候補(第1〜第3候補)として単語A〜Cが認識されて
おり、それぞれの単語の尤度が決定されている。なおこ
こに第1〜第3候補の単語のそれぞれの尤度をa,b,
cとしており、a<b<cであるものとする。
【0027】ここで、第2候補の単語の尤度bから第1
候補の単語の尤度aを引いた値(b−a)が尤度差と定
義される。
【0028】認識単語選定部200は、候補となる単語
とその尤度と音声の雑音パワー比とに基づいて、入力さ
れた音声の判定を行なう。判定結果として以下の3種類
がある。
【0029】(1) 正解認識(第1候補の単語を最終
的な認識単語とするもの) (2) 誤認識(尤度差が小さく、最終的な認識単語を
決定できない場合) (3) 雑音による認識(雑音(ロードノイズ、エアコ
ンの音など)を音声として判断し、認識を行なった場
合。すなわち、発話者が音声を発していないのに認識が
行なわれた場合) 図3は、認識単語選定部200の行なう処理を示すフロ
ーチャートである。
【0030】図を参照して、ステップS101で認識開
始要求がなされると、ステップS103で認識エンジン
313により音声認識処理が行なわれる。ステップS1
05において、認識単語選定部200は認識結果(図2
参照)を取得する。
【0031】ステップS107で、認識が雑音に対して
なされたかが判定される。NOであれば、ステップS1
09で誤認識であるかが判定される。NOであれば、正
解認識としてステップS111で第1候補の単語を最終
的な認識単語として出力する。
【0032】また、ステップS107またはS109の
いずれかでYESであれば、ステップS103へ戻る。
このとき、ステップS107でYESのときはそのまま
ステップS103へ戻り、ステップS109でYESの
ときはスピーカSPから「もう一度音声入力をお願いし
ます。」のような音声出力を行なってから、ステップS
103へ戻ることが好ましい。
【0033】ステップS107での判断は、尤度差と雑
音パワー比との双方に基づいて行なわれる。
【0034】ここに雑音パワー比SNRは以下の式によ
り算出される。 SNR=10×log((Sp−Np)/Np) ただし、 Sp=Σ(ADs2)/M Np=Σ(ADn2)/M なお、この式においてMはデータ数を示し、ADsは音
声信号のA/D変換された値を示す。また、SpはAD
sの二乗平均である。ADnは雑音信号のA/D変換さ
れた値を示し、NpはADnの二乗平均である。
【0035】上記の式により、音声に雑音成分が多くな
ると、SNRの値は小さくなることがわかる。
【0036】具体的には、ステップS107において
は、SNRの値が所定値より小さく、かつ尤度差(b−
a)が第1のしきい値以下であれば、雑音による認識と
判断される。本実施の形態において尤度差を考慮した判
定を行なっているのは、もしもSNRの値のみで判定を
行なうと、雑音が多い環境で音声認識を行なったとき
に、本来なら正解認識であっても誤認識であると判定さ
れることが多くなるからである。
【0037】また、雑音が多い環境下で認識処理を行な
った場合において、音声データに発声単語が含まれてい
るときには、雑音によって認識した場合と比較して尤度
差が大きくなる。このことを考慮して、本実施の形態に
おいては雑音パワー比と尤度差とによって雑音による認
識が行なわれたか否かを判定しているのである。
【0038】また、ステップS109においては、尤度
差が第2のしきい値以下であるときにYESと判定す
る。
【0039】このような、認識単語選定部200の動作
により、本実施の形態によると以下の効果が導かれる。
【0040】(1) 誤認識率を低減させることができ
る。 (2) 雑音が多い環境下での音声認識処理に対して有
効に認識結果を得ることができる。
【0041】(3) トークスイッチ(ユーザが音声を
入力するときに押下するスイッチ)を必要とせず、常に
認識処理が可能な状態とすることができる。また、ユー
ザの発声に対してのみ認識結果を得ることができ、雑音
に反応して認識結果が出力されることが少なくなる。
【0042】次に、AGC部100の行なう動作につい
て説明する。AGC部では、ゲイン調整として、以下の
2種類の調整を行なう。
【0043】(1) 使用環境による違いの吸収 (2) 音声パワーの過不足の調整 使用環境による違いの吸収とは、使用するマイクやハー
ドウェアによる音声パワーの違いを調整するための処理
である。すなわち、2つ以上のマイクを音声認識に用い
る場合に、個々のマイクによって得られる出力信号に違
いが生じる。この違いを吸収するために、出力信号の比
較を行ない、ゲイン調整により常に同じレベルの出力信
号が得られるようにするのである。また、ハードウェア
の違いにより、入力信号処理回路から出力される信号の
大きさに違いが生じる。この違いを吸収するために、出
力信号に対してゲイン調整を行ない、常に一定レベルの
信号を得ることができるようにするものである。
【0044】また、音声パワーの過不足の調整とは、入
力された音声が小さい場合にゲイン値を大きくし、逆に
ノイズなどの雑音が多い場合にゲイン値を下げるもので
ある。
【0045】すなわち、初回に行なわれる音声認識はゲ
イン値を「1」として処理を行なう。音声処理中に新た
なゲイン値が算出される。その算出されたゲイン値を以
降に行なわれる音声認識のゲイン値として利用する。
【0046】また、音声認識処理中に取得された音声デ
ータをバッファ107に保管し、また同時にゲイン値を
算出し、保管された音声データと算出されたゲイン値と
を用いて音声認識処理を行なうことも可能である。
【0047】また、マイクロホンの取付け位置や向き、
話者との距離によって、取得することができる音声パワ
ーに違いが生じる。このような違いを吸収するために、
出力信号に対してゲイン調整を行ない、常に一定レベル
の信号を得ることができるようにする。
【0048】また、エンジンやロードノイズなどの周囲
の雑音が多い場合、発声と雑音とによりA/D変換のレ
ンジをオーバする可能性がある。そこで、周囲の雑音が
多い場合にはゲイン値を小さくし、レンジオーバを防
ぐ。
【0049】なお、発声によりA/D変換のレンジオー
バを起こした場合、ゲイン値を小さく設定し、音声合成
を用いて発声話者に対して音量を小さくして再度発声す
るべき旨スピーカSPより指示し、レンジオーバを防ぐ
ことが好ましい。
【0050】次に、ゲイン値算出部105で行なわれる
ゲイン値の算出方法について説明する。
【0051】(1) ゲイン値の算出対象 ゲイン値の算出の対象として、A/D変換した音声デー
タDt(t=0,1,2,…)を用いる。
【0052】(2) ゲイン値の算出フロー 図4は、ゲイン値の算出フローを示す図である。図を参
照して、ステップS201でA/D変換された音声が取
得される。ステップS203で、使用環境による違いの
吸収が行なわれる。ステップS205で音声パワーの過
不足の調整が行なわれる。そして、ステップS207で
調整されたA/D変換値が取得される。
【0053】 使用環境による違いを吸収する場合 2つ以上の入力系(たとえば2つのマイクなど)を有す
る場合、音声認識装置の起動直後にA/D変換値を取得
し、信号レベルの比較を行ない、レベルの高い方に信号
レベルが一致するようにゲイン値を算出する。これによ
り、入力系の差が吸収される。なお、このゲイン値の算
出はシステム起動直後の1回のみとする。
【0054】図5は、使用環境による違いを吸収する場
合のゲイン値の算出フローを示す図である。
【0055】図を参照して、ステップS301で装置の
起動直後に2つ以上の入力系からA/D値が取得され
る。ステップS303で各入力値の比較が行なわれ、一
致している場合にはそのまま終了するが、一致していな
い場合にはステップS305で一致させるためのゲイン
値が算出される。
【0056】 音声パワーの過不足の調整を行なう場
合 図6は、音声パワーの過不足を調整するための処理を示
すフローチャートである。この処理では、音声認識エン
ジン313の要求する最適範囲内に音声信号が収まるよ
うなゲイン値が算出される。また、算出処理は音声認識
処理を行なうごとに毎回行なわれる。
【0057】図6を参照して、ステップS401で発声
区間の検出が行なわれる。ステップS403で入力波形
のレンジが最適範囲内であるかが判定され、YESであ
ればそのまま終了する。
【0058】ステップS403でNOであれば、ステッ
プS405でゲイン値の算出が行なわれ、ステップS4
07でレンジオーバしているかが判定される。ステップ
S407でYESであれば、ステップS409でゲイン
値の補正が行なわれる。なお、ステップS407でNO
であれば、そのまま終了する。
【0059】図7はゲイン値の算出方法を説明するため
の図である。図を参照して、入力された音声の波形の中
のピーク波形の最大値の平均値をCとし、ピーク波形の
最小値の平均値をDとしている。
【0060】ここで、波形の最適値をX1とすると、ゲ
イン値はX1/Cで算出することができる。
【0061】また、音声パワーの過不足を調整する場合
において、周囲の雑音を測定し、雑音成分が多い場合に
はゲインを下げ、少ない場合は反対にゲイン値を大きく
する処理が行なわれる。
【0062】具体的には図8を参照して、ステップS5
01で周囲の雑音が取得され、ステップS503で雑音
が許容範囲内であるかが判定される。YESであればそ
のまま終了し、NOであればステップS505で許容範
囲となるようにゲイン値を下げる処理が行なわれる。
【0063】(3) 最適範囲へのゲイン調整 図9に示されるように、ゲイン調整は音声認識の処理が
行なわれるごとに段階的に行なわれる。これにより、何
回かの認識処理が行なわれることにより、音声のレベル
は最適範囲内に収まることになる。
【0064】また、話者の音声パワーのばらつきを求
め、最適範囲に対する現在の音声レベルの比率を求める
ことで、調整を行なってもよい(図10参照)。
【0065】次に、ゲイン調整部109で行なわれるゲ
イン調整方法について以下に述べる。
【0066】(1) 使用環境による違いを吸収する場
合 図11に示されるように、音声認識装置が起動した直後
に算出されたゲイン値を用い、A/D変換を行なった後
(S601)、逐次ゲイン調整を行なう(S603)。
【0067】(2) 音声パワーの過不足の調整を行な
う場合 音声認識の開始と同時にゲイン値の算出を行ない、音声
認識の終了後、算出されたゲイン値と、前回算出された
ゲイン値との平均を求める。そして、求められた平均値
を用いて次の音声認識のA/D変換値に対して調整が行
なわれる。
【0068】図12は、この音声パワーの過不足の調整
処理を示すフローチャートである。図を参照して、ステ
ップS701で音声認識開始要求がなされたのであれ
ば、ステップS703でA/D値の取得が行なわれる。
ステップS705でゲインの調整が行なわれる。なお、
このとき初期ゲイン値は「1」とする。
【0069】ステップS707で、音声認識処理が行な
われる。ステップS709で認識処理が終了したか否か
が判定され、NOであればステップS703へ戻る。
【0070】ステップS709でYESであれば、ステ
ップS711でゲイン調整値の算出が行なわれ、処理を
終了する。
【0071】なお、図12に示される処理によることな
く、音声データを一時的にバッファに保管し、同時にゲ
イン値を算出し、音声データの取得終了後、算出された
ゲイン値を保管した音声データに対して用いることで調
整を行ない、調整した音声データを用いて再度音声認識
の処理を行なうこととしてもよい。
【0072】すなわち、図13を参照して、ステップS
801において音声認識開始の要求がなされたのであれ
ば、ステップS803でA/D値の取得が行なわれる。
ステップS805で音声認識処理が行なわれ、ステップ
S807で認識処理が終了したか否かを判定する。ステ
ップS807でNOであれば、ステップS803へ戻
る。
【0073】ステップS807でYESであれば、ステ
ップS809で再認識処理が終了したかが判定され、N
OであればステップS811でゲイン調整値の算出が行
なわれ、ステップS813でゲイン調整が行なわれる。
その後、ステップS805へ戻る(再認識処理)。
【0074】ステップS809でYESとなれば、処理
を終了する。以上のように、本実施の形態によるとAG
C部を用いてゲインの調整を行なうことで以下のような
利点を奏する。
【0075】(1) 発声話者の音声パワーに依存せ
ず、常に一定の出力信号を得ることができる。
【0076】(2) マイクの取付け位置や向きに関係
なく、自由にマイクの配置が可能となる。また、マイク
のデザイン的な制約を受けることがなくなる。
【0077】(3) マイクと話者との間の距離による
音声認識率の低下を防ぐことができる。
【0078】(4) 周囲の雑音の程度に関係なく、常
に一定の出力結果を得ることができる。
【0079】(5) ハードの違いによって生じる取得
される信号の違いをなくすことができる。
【0080】なお、上述のフローチャートに示される処
理をハードディスク、ROM、CD−ROM、フロッピ
ーディスクなどの記録媒体に記録させ、音声認識プログ
ラムを記録した記録媒体を提供することも可能である。
【0081】今回開示された実施の形態はすべての点で
例示であって制限的なものではないと考えられるべきで
ある。本発明の範囲は上記した説明ではなくて特許請求
の範囲によって示され、特許請求の範囲と均等の意味お
よび範囲内でのすべての変更が含まれることが意図され
る。
【図面の簡単な説明】
【図1】 本発明の実施の形態の1つにおける音声認識
装置の構成を示すブロック図である。
【図2】 認識エンジン313の認識結果を示す図であ
る。
【図3】 認識単語選定部200における処理を示すフ
ローチャートである。
【図4】 AGC部100で行なわれる処理を示すフロ
ーチャートである。
【図5】 使用環境による違いを吸収するためのゲイン
値を算出する処理を示すフローチャートである。
【図6】 音声パワーの過不足を調整するためのゲイン
値を算出する処理を示すフローチャートである。
【図7】 図6で行なわれる処理を説明するための図で
ある。
【図8】 周囲の雑音に合わせてゲイン値を修正する処
理を説明するためのフローチャートである。
【図9】 ゲイン値の第1の調整方法を示す図である。
【図10】 ゲイン値の第2の調整方法を示す図であ
る。
【図11】 使用環境による違いを吸収するためのゲイ
ン調整方法を示すフローチャートである。
【図12】 音声パワーの過不足の調整を行なうための
ゲイン調整方法を示すフローチャートである。
【図13】 音声パワーの過不足の調整を行なうための
ゲイン調整方法の他の例を示すフローチャートである。
【図14】 音声認識処理を説明するための図である。
【符号の説明】
100 AGC部、101 発声区間検出部、103
音声パワー検出部、105 ゲイン値算出部、107
バッファ、109 ゲイン調整部、200 認識単語選
定部、313 認識エンジン、M1,M2 マイク。
フロントページの続き (72)発明者 宇佐美 彰規 愛知県名古屋市南区菊住1丁目7番10号 株式会社ハーネス総合技術研究所内 Fターム(参考) 5D015 EE05 9A001 EE05 HH17

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 音声を入力する入力手段と、 前記入力された音声の雑音パワー比を算出する算出手段
    と、 前記入力された音声の認識を行ない、複数の認識候補と
    なる単語を決定する第1の決定手段と、 前記決定された複数の認識候補となる単語のそれぞれの
    尤度を決定する第2の決定手段と、 前記算出された雑音パワー比と、前記第2の決定手段で
    決定された複数の認識候補となる単語の尤度とに基づい
    て、前記入力手段に入力された音声が雑音であるか否か
    を判定する判定手段とを備えた、音声認識装置。
  2. 【請求項2】 前記第2の決定手段は、第1候補となる
    単語の尤度と第2候補となる単語の尤度との間の尤度差
    を算出し、 前記判定手段は、前記算出された雑音パワー比と前記尤
    度差とに基づいて判定を行なう、請求項1に記載の音声
    認識装置。
  3. 【請求項3】 音声を入力する入力手段と、 前記入力された音声のゲイン調整を行なう調整手段と、 前記調整手段によりゲイン調整が行なわれた音声の認識
    を行なう認識手段とを備えた、音声認識装置。
  4. 【請求項4】 前記調整手段は、環境による音声パワー
    の違いを吸収するための調整と、音声パワーの過不足を
    吸収するための調整とを行なう、請求項3に記載の音声
    認識装置。
  5. 【請求項5】 前記調整手段は、周囲の雑音が大きい場
    合にはゲイン値を小さくする、請求項3または4に記載
    の音声認識装置。
JP2000021880A 2000-01-31 2000-01-31 音声認識装置 Withdrawn JP2001215996A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000021880A JP2001215996A (ja) 2000-01-31 2000-01-31 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000021880A JP2001215996A (ja) 2000-01-31 2000-01-31 音声認識装置

Publications (1)

Publication Number Publication Date
JP2001215996A true JP2001215996A (ja) 2001-08-10

Family

ID=18548235

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000021880A Withdrawn JP2001215996A (ja) 2000-01-31 2000-01-31 音声認識装置

Country Status (1)

Country Link
JP (1) JP2001215996A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004094077A (ja) * 2002-09-03 2004-03-25 Nec Corp 音声認識装置及び制御方法並びにプログラム
WO2009147927A1 (ja) * 2008-06-06 2009-12-10 株式会社レイトロン 音声認識装置、音声認識方法および電子機器
JP2011154341A (ja) * 2009-12-28 2011-08-11 Fujitsu Ltd 音声認識装置、音声認識方法および音声認識プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004094077A (ja) * 2002-09-03 2004-03-25 Nec Corp 音声認識装置及び制御方法並びにプログラム
WO2009147927A1 (ja) * 2008-06-06 2009-12-10 株式会社レイトロン 音声認識装置、音声認識方法および電子機器
JPWO2009147927A1 (ja) * 2008-06-06 2011-10-27 株式会社レイトロン 音声認識装置、音声認識方法および電子機器
JP5467043B2 (ja) * 2008-06-06 2014-04-09 株式会社レイトロン 音声認識装置、音声認識方法および電子機器
JP2011154341A (ja) * 2009-12-28 2011-08-11 Fujitsu Ltd 音声認識装置、音声認識方法および音声認識プログラム

Similar Documents

Publication Publication Date Title
WO2011048813A1 (ja) 音響処理装置、音響処理方法及び補聴器
JP2008256802A (ja) 音声認識装置および音声認識方法
JP5716595B2 (ja) 音声補正装置、音声補正方法及び音声補正プログラム
US7103543B2 (en) System and method for speech verification using a robust confidence measure
US6850886B2 (en) System and method for speech verification using an efficient confidence measure
US6473735B1 (en) System and method for speech verification using a confidence measure
JP6459330B2 (ja) 音声認識装置、音声認識方法、及び音声認識プログラム
JP5614767B2 (ja) 音声処理装置
JP3760755B2 (ja) 音声入力装置
EP1300832A1 (en) Speech recognizer, method for recognizing speech and speech recognition program
JP2001215996A (ja) 音声認識装置
JP4548953B2 (ja) 音声自動利得制御装置、音声自動利得制御方法、音声自動利得制御用のアルゴリズムを持つコンピュータプログラムを格納する記憶媒体及び音声自動利得制御用のアルゴリズムを持つコンピュータプログラム
CN116490924A (zh) 声音采集系统、声音采集方法和程序
JPS6257040B2 (ja)
JP7257834B2 (ja) 音声処理装置、音声処理方法、および音声処理システム
JP3284968B2 (ja) 話速変換機能を有する補聴器
JP2005500580A (ja) ロバストな信頼度尺度を用いて音声検証を行う装置及び方法
JP3629145B2 (ja) 音声認識装置
JP2002041073A (ja) 音声認識装置
JP2500761Y2 (ja) 音声認識装置
US20070076895A1 (en) Audio processing system and method for hearing protection
JPH03274599A (ja) 車載用音声認識装置
KR102167469B1 (ko) 피드백 처리 방법
JP2870421B2 (ja) 話速変換機能を有する補聴器
JP2975808B2 (ja) 音声認識装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070403