JPH06236196A - 音声認識方法および装置 - Google Patents

音声認識方法および装置

Info

Publication number
JPH06236196A
JPH06236196A JP5020250A JP2025093A JPH06236196A JP H06236196 A JPH06236196 A JP H06236196A JP 5020250 A JP5020250 A JP 5020250A JP 2025093 A JP2025093 A JP 2025093A JP H06236196 A JPH06236196 A JP H06236196A
Authority
JP
Japan
Prior art keywords
voice
level
unit
pattern
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5020250A
Other languages
English (en)
Inventor
Mizuhiro Hida
瑞広 飛田
Yoshitake Suzuki
義武 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP5020250A priority Critical patent/JPH06236196A/ja
Publication of JPH06236196A publication Critical patent/JPH06236196A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 周囲騒音が大きな場所においても高い認識性
能を示す音声認識方法および装置を提供する。 【構成】 普通の発声レベルおよび発声変形を生ぜしめ
るこれとは異なる発声レベルにより発声した音声を使用
して作成した複数の標準音声パターンを蓄積11し、音
声認識時の騒音レベル4および音声の収音距離9の値か
ら被認識音声の発声変形量を予測し、この予測発声変形
量に基づいて被認識単語の発声レベルに近い発声音声に
より作成した標準音声パターンを選択し、選択された標
準音声パターンと被認識音声パターンとを照合12する
音声認識方法および装置。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声認識方法および
装置に関し、特に、周囲騒音が大きな場所において使用
した場合も良好なマンマシンインタフェースを確保する
と共に高い認識性能を示す音声認識方法および装置に関
する。
【0002】
【従来の技術】マンマシンインタフェースにおいて、情
報の伝達手段としては一般に手動操作によるタイプライ
タ、押しボタンその他の手段が採用されているが、音声
を使用した情報伝達手段はこれら手動による伝達手段と
比較して伝送速度、操作性に関して優れている。音声を
情報伝達手段に使用し、情報を伝達する相手が機械の場
合、伝達内容である発声内容を正しく認識する音声認識
装置が必要とされる。
【0003】ところで、音声認識装置は静寂な室内のみ
に留まらずに音声認識性能を低下させる騒音の大きな環
境条件下においても使用される。音声認識装置をこの様
な高騒音環境下において使用した場合の音声認識装置の
認識性能を向上せしめる手法としては、SN比を改善し
てクリヤな音声を獲得することを目的として騒音の影響
を極力排除する処理を施した後に音声認識計算処理を実
行する手法が一般的である。騒音の影響を極力排除する
処理をするに、指向性の鋭いマイクロホンを使用して騒
音を除去する手法、或は2個のマイクロホンを適切に配
置した2入力回路を構成してサブトラクション法により
騒音を除去する手法を採用してSN比の改善を図ること
が行われている。
【0004】しかし、騒音レベルの大きな場所において
発声する場合の音声レベルは、図1に示される如く、騒
音レベルに依存して大きくなることが知られている。こ
のことに起因して、発声変形を伴なった音声を生ずるこ
ととなる。図1における実線は、日本国内における電話
伝送について考慮した場合の騒音レベルに対する発声レ
ベルの変化の様子を示す(出典:電子通信学会編“新版
聴覚と音声”,P.422,昭和57年7月30日
刊)。破線により示されるRichards曲線は外国における
商用電話伝送について求めた例を示し、そして、鎖線に
より示されるKorn曲線は室内騒音下において文章を朗読
した場合の実験結果を示す。図1から明らかな如く、騒
音レベルが80dBA程度になると、通常の発声レベル
に対して10dB程度の発声レベルの上昇を生じてく
る。
【0005】一方、周囲の騒音レベルが大きな場合であ
っても、当該騒音レベルを上回って発声レベルの方をよ
り大きくすれば、所望のSN比は確保されることとなっ
て音声認識には有利に働く様に考えられる。しかし、こ
の様な場合は、騒音の少ない室内において収音した通常
の発声レベルの音声を使用して作成した標準パターンと
比較して発声音声の認識照合を行っても、発声を大きく
したことによる発声変形に起因して実用上充分な認識性
能を得ることが困難となる。
【0006】これを避けるための方法としては、通常レ
ベルの発声音声から大声で発声した音声への変換、若し
くはこの逆の変換を、物理的な特性変化のパラメータを
明らかにし且つ発声レベルの変化に伴って各パラメータ
の変化量を定量化して規則的に創り出し、これを使用し
て標準テンプレートを作成して音声認識に使用すれば良
い結果を得ることができるものと考えられる。
【0007】
【発明が解決しようとする課題】上述の方法によれば、
普通の発声レベルで1回だけ発声すればこれで標準パタ
ーン作成のための発声は終了したことになるところか
ら、これは音声認識使用者に多大の利点をもたらすこと
となる。しかし、大声で発声した場合にフォルマント周
波数の上昇、下降を伴うことその他、物理的な変化のメ
カニズムの一部が明らかにされつつあるが、普通の発声
音声データから発声変形を施した音声データを音声認識
を行う場合に充分な特性を有して復元する手法、或はこ
の逆を行う手法は確立されていないのが実状であり、結
局、上述の方法は現実的な方法であると言うことはでき
ない。
【0008】この発明は、従って、騒音レベルの大きな
環境下において発声した音声を認識する場合、事前に発
声変形を伴った音声を使用して標準パターンを作成して
蓄積しておき、実際の音声認識時の騒音レベルおよび音
声の収音距離の値から被認識音声の発声変形量を予測し
て、音声認識照合に使用する標準パターンを抽出選択し
て音声認識を行い、これを実行するに際して良好なマン
マシンインタフェースを確保すると共に実用上充分な音
声認識性能を示す音声認識方法および装置を提供するも
のである。
【0009】
【課題を解決するための手段】普通の発声レベルおよび
発声変形を生ぜしめるこれとは異なる発声レベルにより
発声した音声を使用して作成した複数の標準音声パター
ンを蓄積し、音声認識時の騒音レベルおよび音声の収音
距離の値から被認識音声の発声変形量を予測し、この予
測発声変形量に基づいて被認識単語の発声レベルに近い
発声音声により作成した標準音声パターンを選択し、選
択された標準音声パターンと被認識音声パターンとを照
合する音声認識方法を構成した。
【0010】そして、この方法を実施する装置として、
音響を音響信号に変換するマイクロホン1を具備し、マ
イクロホン1と話者0との間の距離Lを測定する距離セ
ンサ9を具備し、音響信号が入力されたときマイクロホ
ン1の感度特性を含めた系利得を出力レベルが所定レベ
ルとされる如くに可変設定する増幅部2を具備し、音響
信号の音圧レベルを測定するレベル測定部4を具備し、
増幅部2の出力レベルに比例して指示が変化するレベル
表示部5を具備し、音声信号の特徴量を抽出して分析す
る特徴量分析部10を具備し、普通の発声レベルおよび
発声変形を生ぜしめるこれとは異なる発声レベルにより
発声した音声を使用して作成した複数の標準音声パター
ンを蓄積すると共に被認識単語の発声レベルに近い発声
音声により作成した標準音声パターンを選択出力する標
準パターン蓄積部11を具備し、被認識音声パターンと
標準音声パターンとを照合するパターン照合部12を具
備し、パターン照合結果を出力する照合結果出力部13
を具備する音声認識装置を構成した。
【0011】また、上述の音声認識装置に、更に、音響
信号の音圧レベルを視覚的に表示するレベル表示部5、
指示および音声認識結果を出力する音声ガイダンス出力
部7を具備せしめた音声認識装置をも構成した。
【0012】
【実施例】この発明の実施例を図2を参照して説明す
る。図2において、1は音声、騒音その他の音響を音響
信号に変換するマイクロホンである。2は音響信号を増
幅する増幅部であり、その利得は制御部6から供給され
る制御信号により変化設定される。3は増幅部2から供
給されるアナログ音響信号をディジタル音響信号に変換
するAD変換部である。4は音圧レベル測定部であり、
AD変換部3から送り込まれるディジタル音響信号に基
づいて相対的な音圧レベルを測定し、或は騒音レベルを
測定する。5はマイクロホン1から出力される音響信号
が増幅部2を介して送り込まれるレベル表示部であり、
この音響信号の出力レベルを表示する。7は音声ガイダ
ンス出力部であり、制御部6の制御により種々のメッセ
ージを出力して音声認識装置の使用者にこれを周知せし
め、指示を行うものである。8は音声ガイダンスを音響
として出力するスピーカである。9は話者とマイクロホ
ンとの間の距離を測定する距離センサである。結局、上
述された1〜9の各部分は音響信号入出力部Sを構成す
る。
【0013】10は発声された音声信号の音声区間を音
声のパワ情報その他の特徴量を使用して判定検出すると
共に当該音声区間の特徴パラメータを抽出分析する音声
の特徴量分析部である。11は標準音声のパターンを登
録蓄積する標準パターン蓄積部である。12は被認識音
声と標準音声との間のパターン照合を行うパターン照合
部である。13はパターン照合部12により得られる照
合結果を出力するための照合結果の出力部である。図2
の実線は各部間の電気信号の接続を示す線であり、破線
は制御部6を介して各部を制御する制御線を示す。
【0014】図3は音声、騒音その他の音響信号を収音
してAD変換部3に入力する部分の詳細を示す図であ
る。図3において、話者0とマイクロホン1との間の距
離Lは、距離センサ9により測定され、この距離測定結
果は制御部6に取り込まれる。標準音声パターンの作成
および実際の音声認識を行う場合、増幅部2の利得は、
制御部6により音声の収音距離Lおよび発声レベルの変
化に対応して、以下に説明される如くに制御される。
【0015】図3において、話者とマイクロホン間の距
離を1mと仮定すると、普通の会話における発声音声の
音圧レベルは、マイクロホンの位置において約−30d
B(0dB=1Pa)であることが知られている[例え
ば、早坂、石井、吉川;音響工学概論、日刊工業新聞社
刊、p15、s51年11月30日改定版]。マイクロ
ホン1の感度が例えば−50dB(0dB=1V/P
a)である場合、増幅部2の出力端におけるレベルを0
dB(1V)とするには、増幅部2の利得を80dBと
すれば良い(当然のことながら、マイクロホン1として
感度が例えば20dB高い−30dBのものを使用すれ
ば、増幅部2の利得は60dBとすれば良い。更に、話
者とマイクロホンとの間の距離が10cmに接近すれ
ば、同一の発声レベルである−30dBであっても、マ
イクロホン1への入力音圧レベルは更に20dB上昇す
ることから、増幅部2の出力端におけるレベルを0dB
とするに必要な増幅部2の利得は40dBとなる)。こ
こにおいては、マイクロホン1の感度と増幅部2の利得
とを含めて増幅部の系利得をGと表現することにする。
この場合の系利得Gは30dB(G=−50+80)で
ある。
【0016】増幅部2の出力は、一方においてレベル表
示部5に接続している。レベル表示部5のレベル表示の
具体的な例を図4に示す。図4において、○印は入力信
号レベルの大小に応じて点滅するランプであり、適正レ
ベルである0dBを基準にして5dB間隔のレベル表示
をする様に構成されている。このレベル表示部5は、増
幅部2の出力レベルが0dB(1V)のときに適正表示
である0dBのランプが点灯する様に調整されている場
合、例えば10dB大きな声で発声して増幅部の系利得
を変更しないとすればレベル表示部5のランプは+10
dBを示すに到る。
【0017】上述した通りの音声認識装置により音声の
標準パターンを作成する方法を図5のフローチャートを
参照して説明をする。図5は標準音声パターンを作成す
るフローチャートを示す。標準音声パターンの作成は、
制御部6に設けられた例えば起動ボタンを操作すること
により開始され、音声ガイダンス出力部7を介して例え
ば“発声して下さい”というメッセージがスピーカ8か
ら出力される。話者はこの音声ガイダンスに従って被認
識単語を発声する。この場合、話者とマイクロホンとの
間の距離を距離センサ9により測定し、測定結果を制御
部6に記憶しておく。標準音声パターンを作成する場合
の発声は、互いに異なる発声レベルにより2回以上異な
る発声をすることを基本とする。即ち、1回目は例えば
普通の発声レベルにより発声し、2回目は発声変形を生
ずる程度の1回目より大きな発声レベル(この時のレベ
ル差をC(dB)と表示する)により発声し、3回目は
2回目より更にに大きな発声レベルにより発声すること
とする。
【0018】標準音声パターンの作成は、先ず第1回目
の普通の発声レベルにより発声したときの音声を使用し
て行う。マイクロホン1の感度特性および増幅部2の利
得特性を含めた増幅部の系利得GをAD変換部3の入力
端において過大或は過小とならない適正な値G1 (d
B)に制御部6により設定し、このときの増幅部2の出
力レベルをV0 (dB)とする。同時に、話者とマイク
ロホン間の距離L1 (単位:m)を距離センサ9により
測定し、この測定値を制御部6に蓄積する。レベル表示
部5は、話者の発声レベルに応じたレベル変化を視覚的
に表示、確認することができるものである。このレベル
表示部5は、図4に示される如く、音声の発声レベルが
“大きい”、“適正”および“小さい”という表示が一
目瞭然となる様に構成されている。ここで、普通のレベ
ルにより発声し且つ増幅部2の出力レベルがV0 のと
き、“適正”表示の値(図4の例においては0dB)と
なる様に設定、調整する。
【0019】この様な設定をした音響信号入出力部Sを
使用して、先ず普通のレベルにより発声した音声の特徴
パラメータの抽出、分析を音声の特徴量分析部10にお
いて行い、その分析結果を第1の標準パターン単語列S
1 として標準パターン蓄積部11に蓄積し、ここにおい
て第1回目の普通の発声レベルによる標準パターンの作
成は終了とする。この時、話者の口元から1m前方の仮
想の点を基準位置としたこの位置における相対音圧レベ
ルP1 (単位:dB、0dB=1Pa)を式(1)によ
り求めて制御部6に蓄積する。
【0020】 P1 =20log10 1 −G1 +V0 (1) 次いで、第2回目は、第1回目より大きな音圧レベルP
2 (単位:dB、0dB=1Pa)の音声により発声す
ることを制御部6から音声ガイダンスにより使用者に指
示する。P1 、P2 は上述の基準位置における発声レベ
ルを示し、P2はP1 より一定のレベルC(dB)大き
く発声した音声を準備したいものとすれば、以下に示さ
れる式(2)においてj=2として与えられる値とな
る。
【0021】この場合、増幅部の系利得G2 (単位:d
B)は、普通のレベルにより発声した時に設定されてい
た増幅部の系利得G1 (単位:dB)に対して、話者と
マイクロホンとの間の距離をL2 (単位:m)とした
時、距離の違いによる音圧レベルの変化量を補正する項
を含めて、制御部6からの制御信号により式(3)にお
いてj=2として示される値に設定する。
【0022】 Pj =P1 +(j−1)C (2) Gj =G1 +20 log10(Lj /L1 )+(P1 −Pj ) (3) ここで、j=2、3、・・・・、m この様な設定がなされた後、音声ガイダンスにより“大
きな声で発声して下さい”というメッセージがスピーカ
から出力され、これに従って話者が発声することとなる
が、ここでL2 =L1 であれば、増幅部の系利得は先の
普通に発声した場合よりもC(dB)低減しているがた
めに(j=2の場合、式(2)、(3)から、G2 =G
1 −C)、その分だけ大きな音声により発声しなけれ
ば、レベル表示部5の“適正”という値にはならないこ
とに加えて、この状態が発声者に視覚的に伝わると共
に、話者にとっては音声認識装置側が要求している適正
なレベルに到る発声量の調整が感覚的に把握することが
できるので、この音声認識装置は標準音声パターンの作
成に関して使用者にとって使いやすい構成のものである
と言うことができる。
【0023】更に、発声レベルの適否は、音圧レベル測
定部4の測定結果に基づいて制御部6を介して音声ガイ
ダンス出力部7に測定結果の内容に応じたメッセージ、
例えば“発声レベルが大きすぎるので、もう少し小さな
声で発声して下さい”或はこの逆のメッセージ内容を選
択する制御が行われ、スピーカ8から出力される音声に
より聴覚的にも確認することが併せて行われる。
【0024】なお、音声の収音に使用するマイクロホン
の種類によっては、収音する距離が変化したときにその
感度周波数特性が大きく変化するものもあるので、この
様な場合はその距離変化によるf特性の変化を補正する
ことが必要となる。収音距離が変化したとき、マイクロ
ホンの感度f特性の変化量が既知であるときのf特性の
補正方法に関しては、当該特許出願人が以前に出願した
特願平1−51455“音響信号入力装置”において開
示した通り公知であるが、この場合、f特性を平坦化す
るか或は標準音声と被認識音声間の周波数スペクトル特
性の傾きを等しくすることが認識性能の向上には大切な
要因であるため、このf特性の傾きを補正する機能を増
幅部2に持たせることは有効なことである。
【0025】発声レベルが指示値に対して適正な場合
は、当該音声について先に述べたと同じ手順に従って音
声の特徴量分析部10において特徴パラメータの分析を
行い、その結果を標準パターン蓄積部11に単語内容を
ラベル付けして第2の標準パターンの単語列S2 として
蓄積する。以上の手順により2個以上の複数の発声レベ
ル、即ち式(2)においてPj (j=2〜m)として求
まる異なる条件における単語列の発声を完了し、標準パ
ターンの単語列(Si )(i=1〜m)の作成および蓄
積のフローを終了し、ここにおいて音声認識装置を使用
するための準備が完了したことになる。
【0026】ここで、騒音がある環境下における音声認
識装置の実音声認識時の動作を図6を参照して説明をす
る。図6は実音声認識時のフローを示す図である。音声
認識装置は、起動せしめられると、音声ガイダンスによ
り例えば“発声して下さい”というメッセージが出力さ
れ、音声認識装置使用者はこれに従って被認識単語を発
声する。この時の発声レベルは、例えば上述の音声ガイ
ダンスの終了直後の騒音レベルを音圧レベル測定部4に
より測定し、この騒音レベルに応じて音声区間の検出お
よび音声認識性能の低下を生じない様に設定した、予め
定めた値以上のSN比が確保される様に、増幅部の系利
得Gを制御部6により制御し、レベル表示部5が適正レ
ベル範囲となる様に発声することを音声認識装置側から
要求する。これと共に、騒音レベルおよび話者、マイク
ロホン間の音声収音の距離の大小に応じて、標準パター
ン蓄積部11に蓄積されている発声レベルの異なる音声
により作成した複数の認識照合用の標準パターン列の中
の1組を選択する。
【0027】標準パターン選択の基準は下記の通りであ
る。マイクロホン位置における周囲騒音の相対音圧レベ
ルPN (単位:dB、0dB=1Pa)が小さく、且つ
音声の収音距離LT が大であっても、普通のレベルで発
声した音声により所望とする予め設定したSN比の値P
SN(単位:dB)が得られるとすれば、式(4)が成り
立つので、この時の増幅部の系利得GT (単位:dB)
は、式(5)により求まる値とする。この場合、当然普
通のレベルにより発声したときにレベル表示部5の“適
当な範囲”の表示範囲に入ることとなる。
【0028】 P1 ≧PN +PSN (4) GT =G1 +20 log10(LT /L1 ) (5) 従って、この場合は、標準パターン蓄積部11に蓄積さ
れている標準音声パターンは普通の発声音圧レベルP1
(単位:dB、0dB=1Pa)により発声した音声で
作成したものを認識照合用として選択する。
【0029】一方、周囲騒音の相対音圧レベルPN (単
位:dB、0dB=1Pa)が大の場合は、 P1 <PN +PSN (6) となり、十分な音声認識性能を確保するに必要な所望の
SN比(PSN)を得るためには、話者とマイクロホン間
の距離LT に依存して発声レベルを変化する必要があ
る。
【0030】例えば、周囲騒音の音圧レベルPN がマイ
クロホン位置で−14dB(=80dBA)程度ある場
合であって所望のSN比PSNを10dBと仮定すれば、
マイクロホン1に入力される音声の発声レベルは−4d
B(=90dBA)が必要となるが、これはマイクロホ
ンと発声者の口元との間の距離LT の違いにより変化す
る。即ち、口元とマイクロホンとの間の音声の収音距離
T が小さく、これが例えば約5cmであれば普通に発
声した場合であってもその音量は、収音距離が1mの場
合に比べて26dB上昇して約−4dB(=90dB
A)となるから、図1に示される周囲騒音の影響による
発声レベルの上昇効果を期待するまでもなく(図1から
は、約10dB上昇することが分かる)、上述の所望の
SN比が満足される値を採る。しかし、口元とマイクロ
ホンとの間の距離LT が例えば50cm程度に離れたと
ころにおいて使用した場合のSN比は、普通の発声レベ
ルにおいてはマイクロホンの位置で約−24dB(=7
0dBA)であるところから−10dBとなり、図1に
示される騒音の影響による発声音量の増加分(いわゆる
ロンバート効果)を10dBと見込んでも、SN比は0
dBの値しか得られないことになる。この結果、良好な
音声認識は勿論、音声区間の検出を行うことさえ困難と
なる。この様な条件下においては、普通の発声より約1
0倍(20dB)の大きさにより発声することが要求さ
れ、これを満たすことにより所望のSN比として仮定し
た10dBの値が確保され、この結果、音声区間の検出
および良好な音声認識効果が期待される。即ち、式
(6)が成り立つ騒音条件下における増幅部の系利得G
T (単位:dB)は増幅部の出力レベルがV0 (単位:
dB)となる様に式(7)により与えられ、基準位置に
おける発声レベルが式(8)により求められるPT (単
位:dB、0dB=1Pa)となるように制御される。
【0031】 GT =G1 +20 log10(LT /L1 )+P1 −(PN +PSN) (7) PT =G1 −GT +20 log10T +P1 (8) 以上のことから、騒音環境下において音声認識装置を使
用する時の発声レベルは、普通のレベルにより発声した
ときの基準位置における音圧レベルP1 の値を基準とし
て、周囲騒音レベルPN と、所望とするSN比PSNと、
話者とマイクロホンとの間の距離LT とから算出するこ
とができる。従って、音声認識照合に使用する発声レベ
ルの異なる音声により作成した標準パターンの選択は、
T に近い発声レベルPi (i=1〜mの中のいずれ
か)により作成されたものを一義的に決定することがで
きる。なお、認識処理時間が多少長くなることが許容さ
れれば、発声レベルの異なる標準パターンを複数組使用
するいわゆるマルチテンプレート法による照合を行え
ば、より被認識単語の発声音声に近いものが認識距離の
計算結果として選択される可能性が高くなり、より良い
音声認識性能の達成が期待される。
【0032】上述の通りの手順により音声認識された結
果が、音声ガイダンス出力部を介してスピーカ8より出
力される。例えば音声ダイヤルである場合、認識結果が
正しければ、動作モードはダイヤル信号の送出処理へ移
行する。もし、照合結果が誤りであれば、次の順位の認
識結果を選出する処理過程を経て出力がなされることと
なる。
【0033】
【発明の効果】以上の通りであって、この発明による音
声認識方法および装置は、周囲騒音レベルの大きな環境
下において使用する場合であっても高い認識性能を示
す。即ち、標準音声パターンの作成を高騒音レベル下に
おける発声を想定した発声変形を伴った音声を使用して
行うことと、実際に高騒音下において音声認識装置を使
用する場合に話者とマイクロホンとの間の距離、周囲の
騒音レベルおよび所望のSN比を満足する発声を音声ガ
イダンスおよびレベル表示部により話者に適切に指示す
ると共に、これらの各部の条件の設定値および測定値か
ら発声変形量を予測して認識照合に使用する標準テンプ
レートを選択して認識処理を実行することにより、マン
マシンインタフェースを向上し、高い認識性能を示す音
声認識方法および装置を構成することができた。
【図面の簡単な説明】
【図1】室内の騒音レベルの変化が発声レベルに及ぼす
影響を示す図。
【図2】この発明による音声認識装置のブロック図。
【図3】音声収音の構成を示す図。
【図4】レベル表示部の表示の実施例を示す図。
【図5】この発明による音声の標準パターン作成を説明
するフロー図。
【図6】音声認識を説明するフロー図。
【符号の説明】
1 マイクロホン 2 増幅部 3 AD変換部 4 パワーレベル測定部 5 レベル表示部 6 制御部 7 音声ガイダンス出力部 8 スピーカ 9 距離センサ 10 音声の特徴量分析部 11 標準パターン蓄積部 12 パターン照合部 13 照合結果の出力部 0 話者 L 収音距離

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 普通の発声レベルおよび発声変形を生ぜ
    しめるこれとは異なるる発声レベルにより発声した音声
    を使用して作成した複数の標準音声パターンを蓄積し、
    音声認識時の騒音レベルおよび音声の収音距離の値から
    被認識音声の発声変形量を予測し、この予測発声変形量
    に基づいて被認識単語の発声レベルに近い発声音声によ
    り作成した標準音声パターンを選択し、選択された標準
    音声パターンと被認識音声パターンとを照合することを
    特徴とする音声認識方法。
  2. 【請求項2】 音響信号を電気信号に変換するマイクロ
    ホンを具備し、マイクロホンと話者との間の距離を測定
    する距離センサを具備し、音響信号が入力されたときマ
    イクロホンの感度特性を含めた系利得を出力レベルが所
    定レベルとされる如くに可変設定する増幅部を具備し、
    音響信号の音圧レベルを測定するレベル測定部を具備
    し、増幅部の出力レベルに比例して指示が変化するレベ
    ル表示部を具備し、音声信号の特徴量を抽出して分析す
    る特徴量分析部を具備し、普通の発声レベルおよび発声
    変形を生ぜしめるこれとは異なる発声レベルにより発声
    した音声を使用して作成した複数の標準音声パターンを
    蓄積すると共に被認識単語の発声レベルに近い発声音声
    により作成した標準音声パターンを選択出力する標準パ
    ターン蓄積部を具備し、被認識音声パターンと標準音声
    パターンとを照合するパターン照合部を具備し、パター
    ン照合結果を出力する照合結果出力部を具備することを
    特徴とする音声認識装置。
  3. 【請求項3】 請求項2に記載される音声認識装置にお
    いて、音響信号の音圧レベルを視覚的に表示するレベル
    表示部を具備し、指示および音声認識結果を出力する音
    声ガイダンス出力部を具備することを特徴とする音声認
    識装置。
JP5020250A 1993-02-08 1993-02-08 音声認識方法および装置 Pending JPH06236196A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5020250A JPH06236196A (ja) 1993-02-08 1993-02-08 音声認識方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5020250A JPH06236196A (ja) 1993-02-08 1993-02-08 音声認識方法および装置

Publications (1)

Publication Number Publication Date
JPH06236196A true JPH06236196A (ja) 1994-08-23

Family

ID=12021956

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5020250A Pending JPH06236196A (ja) 1993-02-08 1993-02-08 音声認識方法および装置

Country Status (1)

Country Link
JP (1) JPH06236196A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001075580A (ja) * 1999-08-18 2001-03-23 Siemens Ag 音声認識方法および音声認識装置
JP2003504653A (ja) * 1999-07-01 2003-02-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ノイズのある音声モデルからのロバスト音声処理
WO2003036617A1 (fr) 2001-10-22 2003-05-01 Sony Corporation Appareil de reconnaissance vocale et procede de reconnaissance de la parole
JP2006227499A (ja) * 2005-02-21 2006-08-31 Toyota Motor Corp 音声認識装置
JP2007241304A (ja) * 2007-04-20 2007-09-20 Sony Corp 音声認識装置および音声認識方法、並びにプログラムおよび記録媒体
JP2008228129A (ja) * 2007-03-15 2008-09-25 Matsushita Electric Ind Co Ltd リモコン装置
JP2009192942A (ja) * 2008-02-15 2009-08-27 Toshiba Corp 音声対話装置及び支援方法
JP2015018015A (ja) * 2013-07-08 2015-01-29 本田技研工業株式会社 音声処理装置、音声処理方法、及び音声処理プログラム
JP2015019124A (ja) * 2013-07-08 2015-01-29 本田技研工業株式会社 音声処理装置、音声処理方法、及び音声処理プログラム
WO2015167008A1 (ja) * 2014-05-02 2015-11-05 株式会社ソニー・コンピュータエンタテインメント 案内装置、案内方法、プログラム及び情報記憶媒体
WO2020071712A1 (en) * 2018-10-01 2020-04-09 Samsung Electronics Co., Ltd. Method for controlling plurality of voice recognizing devices and electronic device supporting the same

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003504653A (ja) * 1999-07-01 2003-02-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ノイズのある音声モデルからのロバスト音声処理
JP4818556B2 (ja) * 1999-07-01 2011-11-16 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 確率論的ロバスト音声処理
JP4520596B2 (ja) * 1999-08-18 2010-08-04 シーメンス アクチエンゲゼルシヤフト 音声認識方法および音声認識装置
JP2001075580A (ja) * 1999-08-18 2001-03-23 Siemens Ag 音声認識方法および音声認識装置
WO2003036617A1 (fr) 2001-10-22 2003-05-01 Sony Corporation Appareil de reconnaissance vocale et procede de reconnaissance de la parole
JP2003131683A (ja) * 2001-10-22 2003-05-09 Sony Corp 音声認識装置および音声認識方法、並びにプログラムおよび記録媒体
US7031917B2 (en) 2001-10-22 2006-04-18 Sony Corporation Speech recognition apparatus using distance based acoustic models
US7321853B2 (en) 2001-10-22 2008-01-22 Sony Corporation Speech recognition apparatus and speech recognition method
JP2006227499A (ja) * 2005-02-21 2006-08-31 Toyota Motor Corp 音声認識装置
JP2008228129A (ja) * 2007-03-15 2008-09-25 Matsushita Electric Ind Co Ltd リモコン装置
JP2007241304A (ja) * 2007-04-20 2007-09-20 Sony Corp 音声認識装置および音声認識方法、並びにプログラムおよび記録媒体
JP2009192942A (ja) * 2008-02-15 2009-08-27 Toshiba Corp 音声対話装置及び支援方法
US8155968B2 (en) 2008-02-15 2012-04-10 Kabushiki Kaisha Toshiba Voice recognition apparatus and method for performing voice recognition comprising calculating a recommended distance range between a user and an audio input module based on the S/N ratio
JP2015018015A (ja) * 2013-07-08 2015-01-29 本田技研工業株式会社 音声処理装置、音声処理方法、及び音声処理プログラム
JP2015019124A (ja) * 2013-07-08 2015-01-29 本田技研工業株式会社 音声処理装置、音声処理方法、及び音声処理プログラム
US9646627B2 (en) 2013-07-08 2017-05-09 Honda Motor Co., Ltd. Speech processing device, method, and program for correction of reverberation
WO2015167008A1 (ja) * 2014-05-02 2015-11-05 株式会社ソニー・コンピュータエンタテインメント 案内装置、案内方法、プログラム及び情報記憶媒体
JPWO2015167008A1 (ja) * 2014-05-02 2017-04-20 株式会社ソニー・インタラクティブエンタテインメント 案内装置、案内方法、プログラム及び情報記憶媒体
US9870772B2 (en) 2014-05-02 2018-01-16 Sony Interactive Entertainment Inc. Guiding device, guiding method, program, and information storage medium
WO2020071712A1 (en) * 2018-10-01 2020-04-09 Samsung Electronics Co., Ltd. Method for controlling plurality of voice recognizing devices and electronic device supporting the same
US11398230B2 (en) 2018-10-01 2022-07-26 Samsung Electronics Co., Ltd. Method for controlling plurality of voice recognizing devices and electronic device supporting the same

Similar Documents

Publication Publication Date Title
JP3180655B2 (ja) パターンマッチングによる単語音声認識方法及びその方法を実施する装置
US8306815B2 (en) Speech dialog control based on signal pre-processing
JP4263614B2 (ja) リモートコントロール装置及び情報端末装置
KR20010093334A (ko) 잡음 신호에서 음성의 엔드포인팅 방법
JPH096390A (ja) 音声認識対話処理方法および音声認識対話装置
JP4246703B2 (ja) 自動音声認識の方法
JP5411807B2 (ja) チャネル統合方法、チャネル統合装置、プログラム
JP5431282B2 (ja) 音声対話装置、方法、プログラム
JPH06236196A (ja) 音声認識方法および装置
WO1999034353A1 (en) Feedback modification for accent reduction
JP2004199053A (ja) 絶対音量を使用して音声信号を処理する方法
JPH0792988A (ja) 音声検出装置と映像切り替え装置
JP2012163692A (ja) 音声信号処理システム、音声信号処理方法および音声信号処理方法プログラム
US7110948B1 (en) Method and a system for voice dialling
JP2005070430A (ja) 音声出力装置および方法
JPH0635497A (ja) 音声入力装置
JP2003177779A (ja) 音声認識のための話者学習法
JPH0229232B2 (ja)
JP2004251998A (ja) 対話理解装置
JPH0950288A (ja) 音声認識装置及び音声認識方法
JP4765394B2 (ja) 音声対話装置
JP5519126B2 (ja) 音声認識装置及び音声認識方法
JP2004341340A (ja) 話者認識装置
JP2019191477A (ja) 音声認識装置及び音声認識方法
JP2006171077A (ja) 音声認識装置および音声認識方法