JP4682700B2 - 音声認識装置 - Google Patents

音声認識装置 Download PDF

Info

Publication number
JP4682700B2
JP4682700B2 JP2005154326A JP2005154326A JP4682700B2 JP 4682700 B2 JP4682700 B2 JP 4682700B2 JP 2005154326 A JP2005154326 A JP 2005154326A JP 2005154326 A JP2005154326 A JP 2005154326A JP 4682700 B2 JP4682700 B2 JP 4682700B2
Authority
JP
Japan
Prior art keywords
signal
noise
voice
noise removal
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005154326A
Other languages
English (en)
Other versions
JP2006330389A (ja
Inventor
朗 馬場
新平 日比谷
吉彦 徳永
賢二 中北
はるか 天沼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Electric Works Co Ltd
Original Assignee
Panasonic Corp
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Works Ltd filed Critical Panasonic Corp
Priority to JP2005154326A priority Critical patent/JP4682700B2/ja
Publication of JP2006330389A publication Critical patent/JP2006330389A/ja
Application granted granted Critical
Publication of JP4682700B2 publication Critical patent/JP4682700B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、騒音のある環境において利用者の入力した音声を認識する音声認識装置に関する。
音声認識の技術は、優れたヒューマンインターフェースを実現する上で重要な役割を担っている。音声認識の技術を適用した装置の1つに、予め音声の特徴パターンを収集し、これを隠れマルコフモデルなどのモデル化手法を用いて標準パターンを作成し、利用者の音声を認識する際にこの標準パターンと利用者の音声の特徴パターンとの類似度を計算して音声を認識する装置がある(例えば、非特許文献1参照)。
ところで、このような音声認識装置では、装置の使用環境と標準パターンを作成したときの環境が異なる場合に、利用者の音声と標準パターンとの間に相違が生じることにより、認識率が低下するという性質があり、そのため環境騒音が入力音声に混入するような場合には認識性能が低下するという問題がある。このような問題に対して、様々な雑音除去技術がこれまで提案されており、入力音声に混入された騒音を取り除くことにより、入力音声と標準パターンの類似度の向上を図ってきた。
雑音除去部を有する音声認識装置の構成例を図4に示す。音声認識装置は、音声を入力する音声入力部51と、音声入力部51からの出力信号をA/D変換するA/D変換部52と、A/D変換部52からの出力信号に対して雑音除去処理として例えばスペクトルサブトラクション法やカルマンフィルタなどの適応フィルタやマイクロホンアレー信号処理を行った雑音除去後音声を出力する雑音除去部53と、雑音除去部53からの出力信号の単位時間あたりの信号パワーを計測して所定の信号パワーよりも大きい場合に音声区間として入力された信号を出力する音声区間検出部54と、音声区間検出部54から出力された音声信号を周波数変換する周波数変換部55と、標準音声の音声パターンを記憶している標準パターン記憶部57と、周波数変換部55から出力された音声パターンと標準パターン記憶部57に記憶されている標準パターンの類似度を計算して、類似度が所定の値よりも大きい標準パターンが1つあるいは複数照合された場合には最も類似度が高い標準パターンを認識結果として出力し、類似度が所定の値よりも小さな標準パターンしか照合できなかった場合には認識結果を出力しない、パターン照合部56を有する。
「音声認識のためのマイクロホンアレー技術」、東芝レビュー、Vol.59 No.9、2004
一般的に、雑音除去処理を実施すると、雑音成分も除去されるが音声成分も多少の劣化を伴う。通常、雑音除去処理を強く行えば行うほど、音声成分の劣化も大きくなる。従って、過度に雑音除去を行うと逆に認識性能が低下する恐れもあるため、適度な雑音除去を行う必要がある。また、音声区間検出部54は、音声信号のパワーにより音声区間を判別しているので、雑音が強く混入されていると正しく音声区間を判別することができない。このように音声区間が検出されない場合は、入力された音声はパターン照合も行われないので、音声を認識することは不可能であり、著しく認識性能が低下する。しかしながら、雑音除去処理を行うことにより、雑音成分が低減されるので、音声区間の検出を行いやすくなるという性質がある。従って、音声区間を正しく検出するためには、前述の音声成分の劣化により音声のパワーが無くならない範囲で可能な限り雑音を除去することが望ましい。以上のように、パターン照合部56にとって最適な雑音除去処理の強さと、音声区間検出部54にとって最適な雑音除去処理の強さは異なるので、強い騒音環境下では、十分に音声区間の検出ができるまで強く雑音除去をすると、パターン照合部56においては正しく照合できず、認識性能が低下するという問題があった(第1の問題点)。
また、特に非特許文献1のようなマイクロホンアレー信号処理によって、入力信号を音声成分と雑音成分に分離したのち、両成分間で減算処理を行う雑音除去方式においては、反射の強い環境で騒音のない場合には、入力信号を音声成分と壁などに反射した音声成分の2つの音声成分に分離することがある。その場合、これら2つの音声成分間で減算処理を行うと、音声成分のパワーが著しく低下するとともに、得られた音声成分が極端に歪むことにより、音声認識性能が低下するという問題があった(第2の問題点)。
本発明は、上記問題点を解決するために成されたものであり、その目的は、雑音環境下において、強い雑音除去を行った場合にも正しく音声区間を検出するとともに、歪みの少ない雑音除去後音声を照合することにより、高い認識性能が得られる音声認識装置を実現することである。
本発明の特徴は、認識の対象となる音声とこの音声以外の音からなる雑音とを含む音声信号から雑音成分を互いに異なる強度で除去して、SN比が良い第1の雑音除去信号及び音声成分の劣化が少ない第2の雑音除去信号を生成する雑音除去部と、第1の雑音除去信号の信号パワーに基づいて、音声信号のうち音声成分が存在する区間を検出する音声区間検出部と、第2の雑音除去信号から、音声成分が存在する区間に対応する区間の信号を抽出して、周波数変換を行う周波数変換部と、周波数変換が行われた第2の雑音除去信号と予め準備された音声パターン信号との類似度を求めるパターン照合部と、一定区間内での音声信号の信号パワーの平均値を計測するパワー計測部とを備えた音声認識装置であって、雑音除去部は、アレー信号処理により音声信号を音声部分と雑音部分に分離し、その後、音声部分から雑音部分を互いに異なる強度で減算することにより、第1及び第2の雑音除去信号を生成し、雑音除去部は、信号パワーの平均値が所定の値よりも小さい場合は、第1の雑音除去信号を生成する際の音声信号から雑音部分を減算する強度を弱くし、信号パワーの平均値が所定の値よりも大きい場合は、第1の雑音除去信号を生成する際の音声信号から雑音部分を減算する強度を強くすることを要旨とする。
本発明によれば、雑音環境下において、強い雑音除去を行った場合にも正しく音声区間を検出するとともに、歪みの少ない雑音除去後音声を照合することにより、高い認識性能が得られる音声認識装置を実現することが出来る。
以下図面を参照して、本発明の実施の形態を説明する。図面の記載において同一あるいは類似の部分には同一あるいは類似な符号を付している。
(第1の実施の形態)
図1に示すように、本発明の第1の実施の形態に係わる音声認識装置は、音声を入力する音声入力部1と、音声入力部1からの音声信号(アナログ信号)をA/D変換するA/D変換部2と、A/D変換された音声信号ST(デジタル信号)から雑音成分を互いに異なる強度で除去して、第1の雑音除去信号S1及び第2の雑音除去信号S2を生成する雑音除去部3と、第1の雑音除去信号S1の信号パワーに基づいて、音声信号のうち音声成分が存在する区間を検出する音声区間検出部4と、第2の雑音除去信号S2から、音声成分が存在する区間に対応する区間の信号を抽出して、周波数変換を行う周波数変換部5と、周波数変換が行われた第2の雑音除去信号S2と予め準備された音声パターン信号との類似度を求めるパターン照合部6と、予め準備された音声パターン信号を記憶する標準パターン記憶部7とを備える。
ここで、「音声信号」とは、認識の対象となる音声と音声以外の音からなる雑音とを含む信号を示す。
雑音除去部3は、入力された音声信号STに対して雑音が少ない第1の雑音除去信号S1を作成する一方、当該入力された音声信号STに対して音声成分の劣化が少ない第2の雑音除去信号S2を作成し、第1の雑音除去信号S1を音声区間検出部4に、第2の雑音除去信号S2を周波数変換部5に送信する。換言すれば、雑音除去部3は、音声信号STに対して比較的強い雑音除去処理を施すことにより、雑音は少ない(SN比は良い)が、認識対象となる音声の当該音声成分の劣化(歪み)は大きい、第1の雑音除去信号S1を生成する。そして、雑音除去部3は、音声信号STに対して比較的弱い雑音除去処理を施すことにより、雑音は多く残るが、当該音声成分の劣化(歪み)は小さい、第2の雑音除去信号S2を生成する。
音声区間検出部4は、第1の雑音除去信号S1に対して単位時間あたりの信号パワーを計測し、その計測値が所定の信号パワーを越えた場合に、その超えた区間を音声区間信号SDとして周波数変換部5へと出力する。
周波数変換部5は、第2の雑音除去信号S2のうち、音声区間検出部4により検出された音声区間信号SDに該当する区間の音声信号を抽出し、その抽出した信号の周波数変換を行う。
パターン照合部6は、周波数変換が行われた第2の雑音除去信号S2と標準パターン記憶部7に予め記憶されている音声の標準パターンからなる音声パターン信号との類似度を求め、当該類似度に基づいて第2の雑音除去信号S2と音声パターン信号が照合するか否かを判定する。判定結果は、認識結果RCとして出力される。
第1の実施の形態に係わる音声認識装置を設計する際には、雑音除去部3における雑音除去の強さを正しく設定する必要がある。
第1の雑音除去信号S1については、音声区間検出部4が最も高い性能で音声が存在する区間を検出できるように雑音除去の強さを調節しておく。更に詳細には、音声区間検出部4が、雑音だけが入力されている区間を誤って音声区間として検出せず、かつ雑音まじりの音声が入力された区間であっても、これを確実に音声区間として検出できることを目的として、雑音除去部3における雑音除去の強さを調節しておく。通常、このような目的においては、SNR(Signal Noise Rate)の改善量が最も大きくなるように強い雑音除去を行うとよい。
第2の雑音除去信号については、正しく検出された区間における音声に対する認識性能が高くなるように雑音除去の強さを調節しておく。更に詳細には、周波数変換された音声信号の標準パターンに対する類似度が最も高くなるように雑音除去部3における雑音除去の強さを調節する。この場合、過度な雑音除去は行わず、第2の雑音除去信号S2に含まれる音声成分の歪が小さくなるように、弱い雑音除去を行うとよい。
音声区間検出部4は、雑音の少ない第1の雑音除去信号S1について、音声区間の検出処理を行う。音声区間検出部4は、例えば過去数十ミリ秒程度の短い時間区間での音声信号パワーを例えば10ミリ秒間隔で常に計測しており、この音声信号パワーが所定の値をこえたときに音声信号が入力されたと判断し、音声の先頭部分の欠落を防ぐために数百ミリ秒遡った時刻を音声開始時刻とする。また、音声の終了時刻としては、同様に短い区間での音声信号パワーを計測しておき、このパワーが音声区間内の無音部分を想定した数百ミリ秒よりも長い間連続して所定の値を下回ったときとする。このようにして音声区間の開始時刻と終端時刻を検出すると、これらの時刻情報を音声区間信号SDとして周波数変換部5へ送信する。
周波数変換部5は、雑音除去部3から受信した音声の歪みの少ない第2の雑音除去信号S2のうち、音声区間検出部4からの時刻情報に相当する時間間隔の音声信号を周波数変換してパターン照合部6に送信する。通常、音声区間の開始時刻は現在の時刻から一定時間遡った時刻であるので、時刻を遡って周波数変換できるように、音声区間検出部4はバッファ構造になっている。
以上説明したように、第1の実施の形態では、雑音除去部3が、入力された音声信号STに対して雑音が少ない第1の雑音除去信号S1を作成する一方、当該入力された音声信号STに対して音声成分の劣化が少ない第2の雑音除去信号S2を作成する。これにより、第1の雑音除去信号S1を用いて確実な音声区間を検出できるとともに、検出された音声区間情報にもとづいて、音声の劣化の少ない第2の雑音除去信号S2でパターン照合を実施することができる。
このように、雑音の少ない雑音除去後の音声(S1)で音声区間検出を行い、得られた音声区間情報に基づいて音声の歪みの少ない雑音除去後の音声(S2)から周波数変換するので、より高精度な音声区間検出と、より正確なパターン照合が可能となり、その結果として音声認識性能が向上する。即ち、上述した第1の問題点を解決することが出来る<請求項1の効果>。
なお、第1の実施の形態においては、雑音除去方式として、例えばスペクトルサブトラクション法やカルマンフィルタなどの適応フィルタやマイクロホンアレー信号処理のように、雑音除去の強さを調節することが可能で、かつ、雑音除去を強く行う場合には、雑音はよく除去されるが一方で音声も歪む性質をもつ雑音除去方式に適用可能である。例えば、マイクロホンアレー信号処理(アレー信号処理)により音声信号STを音声部分と雑音部分に分離し、その後、当該音声部分から当該雑音部分を互いに異なる強度で減算することにより、第1及び第2の雑音除去信号を生成しても構わない。
また、通話方向を音声パワーで自動的に切り替えるインターホンのような装置にも応用可能である。
(第2の実施の形態)
第2の実施の形態においては、雑音除去部3の第1の雑音除去信号S1を作成するための雑音除去の強さを、周囲環境に応じて動的に変更する音声認識装置の例について説明する。
図2に示すように、本発明の第2の実施の形態に係わる音声認識装置は、音声入力部51と、A/D変換部52と、雑音除去部3と、音声区間検出部4と、周波数変換部5と、パターン照合部6と、標準パターン記憶部7と、一定区間内での音声信号STの信号パワーの平均値を計測するパワー計測部8とを備える。
図1と比べて、図2の音声認識装置は、パワー計測部8を更に備える点が異なる。よって、音声入力部51、A/D変換部52、雑音除去部3、音声区間検出部4、周波数変換部5、パターン照合部6、及び標準パターン記憶部7についての説明は省略する。
パワー計測部8は、A/D変換された音声信号STのパワーを計測して、音声信号STのパワーの平均値を計測結果として雑音除去部3へ通知する。雑音除去部3は、信号パワーの平均値に基づいて音声部分から雑音部分を減算する強度を制御する。換言すれば、雑音除去部3がパワー計測部8の計測結果に基づいて雑音除去動作を逐次変更する。
また、雑音除去部3は、パターン照合部6による第2の雑音除去信号S2と音声パターン信号が照合するか否かの判定結果に基づいて、第1の雑音除去信号S1の生成における雑音除去の強度を調整する。即ち、雑音除去部3がパワー計測部8の計測結果に基づいて雑音除去動作を変更する際にパターン照合部6における照合結果を参照し、パワー計測結果が音声区間に対するものである場合には、雑音除去動作を変更しないようにする。具体的には、雑音除去部3は、音声成分が存在する区間を音声区間検出部4が検出した際、雑音除去の強度を一定に保ち、音声成分が存在する区間を音声区間検出部4が検出しなくなり、パターン照合部6が照合しないと判定している場合、パワー計測部8からの信号パワーの平均値に基づいて音声部分から雑音部分を減算する強度、つまり雑音除去の強度を変更する。
音声区間検出部4は、音声区間信号STを周波数変換部5のみならず雑音除去部3へも送信する。
パターン照合部は、パターン照合結果信号SRとして、パターン照合の結果として認識結果が得られた場合には「照合あり」を、パターン照合の結果として認識結果が得られなかった場合には「照合なし」を、雑音除去部3へ送信する。
雑音除去部3は、各部から受信した信号に基づいて、第1の雑音除去信号S1を作成するための雑音除去の強さを変更する。図3に、雑音除去部3の動作を説明するために、雑音除去部3の内部状態遷移図を示す。図3において、雑音除去部3は「強い雑音除去を行う状態」にある場合には、第1の実施の形態と同様に強い雑音除去を行って、雑音の少ない信号を第1の雑音除去信号S1として出力する。また、「弱い雑音除去を行う状態」の場合には、弱い雑音除去を行った信号を第1の雑音除去信号S1として出力する。この結果、弱い雑音除去を行う状態では、第1の雑音除去信号S1も第2の雑音除去信号S2も同じ弱い雑音除去を行った信号となる。
各状態間の遷移条件について説明する。強い雑音除去を行う状態にあるとき、音声区間検出部4からの音声区間の開始時刻の通知がなく、かつ、パワー計測部8からの計測パワーが所定の値よりも小さい場合には、雑音がないものとして弱い雑音除去を行う状態に遷移する。「音声区間検出部4からの音声区間の開始時刻の通知がない」という条件は、音声区間の途中で雑音除去動作を変更しないためである。
弱い雑音除去を行う状態から、強い雑音除去を行う状態への遷移は、2つの場合がある。一つ目の場合として、音声区間検出部4からの音声区間の開始時刻の通知がなく、かつ、パワー計測部8からの計測パワーの平均値が所定の値よりも大きい場合には、雑音があるものとして強い雑音除去を行う状態に遷移する。二つ目の場合として、音声区間検出部4からの音声区間の開始時刻の通知があった場合には、パターン照合部6からの照合結果が通知されるのを待ち、通知結果が「照合なし」の場合には、音声区間検出部4からの音声区間の開始時刻と終端時刻の間に受信した計測パワーの平均値が所定の値よりも大きいかどうかの判定を行い、判定の結果、計測パワーの平均値が所定の値よりも大きかった場合には、強い雑音除去を行う状態に遷移する。
音声認識装置が初期状態として例えば弱い雑音除去を行う場合について説明する。このとき、周囲の騒音がなければ、そのまま弱い雑音除去を行う状態にあるので、ユーザが発話した音声に対して弱い雑音除去を行い、第1の雑音除去信号S1として出力する。第1の雑音除去信号S1は、元々騒音の少ない信号から弱い雑音除去を行った信号であるので、十分に区間検出が可能である。このようにして、区間検出を行ったのち、第2の雑音除去信号S2によりパターン照合を行う。
これに対して、例えば、本音声認識装置をキッチン環境で利用しているものとすると、水の流れる音や換気扇などの騒音が発生することがある。このようなとき、パワー計測部8の計測パワーが大きくなるので、強い雑音除去を行う状態に遷移する。その結果、第1の雑音除去信号S1は強い雑音除去を行われているので、正しく音声区間の検出ができるようになる。
もし、急に強い騒音が発生した場合には、強い雑音除去に遷移する前に、音声区間検出部4が騒音を音声区間として誤って検出する場合も起こり得る。このような場合には、パターン照合の結果は低い照合度しか得られないので、多くの場合は「照合なし」として処理され、パターン照合結果信号SRが雑音除去部3にフィードバックされるため、音声認識装置は誤動作しない。音声区間として検出された騒音のパワーが所定の値よりも大きい場合はより強い雑音除去を行う必要があると判断し、強い雑音除去状態へ遷移する。遷移後はこのような誤った区間検出は行われにくくなる。
騒音のない場合でユーザが連続的に発話している状況では、計測パワーは大きいが、発話区間の開始を検知しており、さらに、ユーザの発話は高い確率で「照合あり」と判断されるので、ユーザの連続的な発話を騒音と誤判断して強い雑音除去状態へ遷移することは防止される。
以上説明したように、騒音環境下において強い雑音除去を行う状態に遷移した場合には、計測パワーが小さくならない限り、強い雑音除去を行う。もし、周囲の騒音が十分に小さくなったときには、計測パワーが所定の値よりも小さくなるので、自動的に弱い雑音除去を行う状態に遷移する。
雑音除去部3は、信号パワーの平均値に基づいて音声部分から雑音部分を減算する強度を制御することにより、周囲騒音の弱いときに強い雑音除去を行った音声信号で区間検出をすることがなくなる。よって、前述の第2の問題点にあるように、2つの分離信号が両方とも音声だったとしても、減算処理により音声パワーが著しく低下することがない。その結果、正しく音声区間の検出が可能となり、高い認識性能を得られる<請求項2の効果>。
また、パターン照合部6における照合結果に基づいて、雑音除去動作を変更するので、連続的な発話を騒音と誤判断して、実際には騒音がないのに強い雑音除去を行ってしまって、認識性能が低下するという問題が発生しなくなる<請求項3の効果>。
なお、第2の実施の形態では、騒音が少ない場合に弱い雑音除去を行った信号で区間検出するために、音声区間検出部4への出力信号(第1の雑音除去信号S1)の雑音除去の程度を変更する構成になっている。しかし本発明はこれに限定されること無く、そのかわりに、周波数変換部5へ出力している弱い雑音除去信号(第2の雑音除去信号S2)を音声区間検出部4へも送信するようにしてもよい。
また、図3に示した雑音除去部3の内部状態遷移の条件の中で、弱い雑音除去状態から強い雑音除去状態へ遷移する条件として「音声区間の開始時刻の通知があり、かつ、パターン照合結果が『照合なし』であり、かつ、音声区間での計測パワーの平均値が所定の値より大」という条件をあげたが「音声区間の開始時刻の通知があり、かつ、パターン照合結果が『照合なし』」に変更してもよい。この場合、騒音を誤って音声区間として切り出すと、雑音除去部3の内部状態は常に強い雑音除去状態に遷移し、誤った区間検出は行われにくくなる。しかし、この場合は切り出された騒音のパワーに依存せずに、常に強い雑音除去状態に遷移するため、誤った区間検出は減少するが騒音のパワーが小さい場合に音声がひずみ、音声認識率が低下する可能性が増加する。
上記のように、本発明は、第1及び第2の実施の形態によって記載したが、この開示の一部をなす論述及び図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施の形態、実施例及び運用技術が明らかとなろう。即ち、本発明はここでは記載していない様々な実施の形態等を包含するということを理解すべきである。したがって、本発明はこの開示から妥当な特許請求の範囲に係る発明特定事項によってのみ限定されるものである。
本発明の第1の実施の形態に係わる音声認識装置の構成を示すブロック図である。 本発明の第2の実施の形態に係わる音声認識装置の構成を示すブロック図である。 雑音除去部の動作を説明するための雑音除去部の内部状態遷移図を示す。 従来の雑音除去部を有する音声認識装置の構成例を示すブロック図である。
符号の説明
1、51…音声入力部(マイクロホン)
2、52…A/D変換部
3、53…雑音除去部
4、54…音声区間検出部
5、55…周波数変換部
6、56…パターン照合部
7、57…標準パターン記憶部
8…パワー計測部

Claims (2)

  1. 認識の対象となる音声と前記音声以外の音からなる雑音とを含む音声信号から雑音成分を互いに異なる強度で除去して、SN比が良い第1の雑音除去信号及び前記音声成分の劣化が少ない第2の雑音除去信号を生成する雑音除去部と、
    前記第1の雑音除去信号の信号パワーに基づいて、前記音声信号のうち音声成分が存在する区間を検出する音声区間検出部と、
    前記第2の雑音除去信号から、前記区間に対応する区間の信号を抽出して、周波数変換を行う周波数変換部と、
    周波数変換が行われた前記第2の雑音除去信号と予め準備された音声パターン信号との類似度を求めるパターン照合部と
    一定区間内での前記音声信号の信号パワーの平均値を計測するパワー計測部と、を備え、
    前記雑音除去部は、アレー信号処理により前記音声信号を音声部分と雑音部分に分離し、その後、前記音声部分から前記雑音部分を互いに異なる強度で減算することにより、前記第1及び第2の雑音除去信号を生成し、
    前記雑音除去部は、前記信号パワーの平均値が所定の値よりも小さい場合は、前記第1の雑音除去信号を生成する際の前記音声信号から前記雑音部分を減算する強度を弱くし、前記信号パワーの平均値が所定の値よりも大きい場合は、前記第1の雑音除去信号を生成する際の前記音声信号から前記雑音部分を減算する強度を強くする
    ことを特徴とする音声認識装置。
  2. 前記パターン照合部は、前記類似度に基づいて前記第2の雑音除去信号と前記音声パターン信号とを照合し、照合の結果、認識結果が得られたかどうかを判定し、
    前記雑音除去部は、
    音声成分が存在する区間を前記音声区間検出部が検出した際、減算する強度を一定に保ち、
    音声成分が存在する区間を前記音声区間検出部が検出しなくなり、前記パターン照合部が、照合の結果、認識結果が得られなかったと判定している場合において、
    前記信号パワーの平均値が所定の値よりも小さい場合は、前記第1の雑音除去信号を生成する際の前記音声信号から前記雑音部分を減算する強度を弱くし、前記信号パワーの平均値が所定の値よりも大きい場合は、前記第1の雑音除去信号を生成する際の前記音声信号から前記雑音部分を減算する強度を強くすることを特徴とする請求項記載の音声認識装置。
JP2005154326A 2005-05-26 2005-05-26 音声認識装置 Expired - Fee Related JP4682700B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005154326A JP4682700B2 (ja) 2005-05-26 2005-05-26 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005154326A JP4682700B2 (ja) 2005-05-26 2005-05-26 音声認識装置

Publications (2)

Publication Number Publication Date
JP2006330389A JP2006330389A (ja) 2006-12-07
JP4682700B2 true JP4682700B2 (ja) 2011-05-11

Family

ID=37552133

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005154326A Expired - Fee Related JP4682700B2 (ja) 2005-05-26 2005-05-26 音声認識装置

Country Status (1)

Country Link
JP (1) JP4682700B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5561195B2 (ja) * 2011-02-07 2014-07-30 株式会社Jvcケンウッド ノイズ除去装置およびノイズ除去方法
JP5216114B2 (ja) * 2011-03-01 2013-06-19 日本電信電話株式会社 通話区間検出装置、その方法、及びプログラム
JP5971646B2 (ja) * 2012-03-26 2016-08-17 学校法人東京理科大学 多チャネル信号処理装置、方法、及びプログラム
JP2014145838A (ja) * 2013-01-28 2014-08-14 Honda Motor Co Ltd 音響処理装置及び音響処理方法
JP5709973B2 (ja) * 2013-12-27 2015-04-30 クラリオン株式会社 ノイズ除去装置
JP2019020678A (ja) * 2017-07-21 2019-02-07 株式会社レイトロン ノイズ低減装置および音声認識装置
CN113436623A (zh) * 2021-05-24 2021-09-24 青岛海尔空调器有限总公司 一种空调器的语音控制方法及空调器
CN113266933A (zh) * 2021-05-24 2021-08-17 青岛海尔空调器有限总公司 一种空调器的语音控制方法及空调器
WO2023152803A1 (ja) * 2022-02-08 2023-08-17 ファナック株式会社 音声認識装置、及びコンピュータが読み取り可能な記録媒体

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001265368A (ja) * 2000-03-17 2001-09-28 Omron Corp 音声認識装置および認識対象検出方法
JP2005321539A (ja) * 2004-05-07 2005-11-17 Nippon Telegr & Teleph Corp <Ntt> 音声認識方法、その装置およびプログラム、その記録媒体

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03147000A (ja) * 1989-11-02 1991-06-21 Ricoh Co Ltd 音声入力装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001265368A (ja) * 2000-03-17 2001-09-28 Omron Corp 音声認識装置および認識対象検出方法
JP2005321539A (ja) * 2004-05-07 2005-11-17 Nippon Telegr & Teleph Corp <Ntt> 音声認識方法、その装置およびプログラム、その記録媒体

Also Published As

Publication number Publication date
JP2006330389A (ja) 2006-12-07

Similar Documents

Publication Publication Date Title
JP4682700B2 (ja) 音声認識装置
KR101437830B1 (ko) 음성 구간 검출 방법 및 장치
JP5870476B2 (ja) 雑音推定装置、雑音推定方法および雑音推定プログラム
US8775173B2 (en) Erroneous detection determination device, erroneous detection determination method, and storage medium storing erroneous detection determination program
KR101444099B1 (ko) 음성 구간 검출 방법 및 장치
JP5156043B2 (ja) 音声判別装置
KR101340520B1 (ko) 잡음을 제거하는 장치 및 방법
WO2005055197A3 (en) Noise suppressor for speech coding and speech recognition
JPH10210075A (ja) 有音検知装置および方法
JP2013140226A (ja) 音声認識装置、音声認識方法及び音声認識プログラム
US8935168B2 (en) State detecting device and storage medium storing a state detecting program
JP6878776B2 (ja) 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム
JP2019020678A (ja) ノイズ低減装置および音声認識装置
Ramırez et al. A new adaptive long-term spectral estimation voice activity detector
JP2005338454A (ja) 音声対話装置
CN111226278B (zh) 低复杂度的浊音语音检测和基音估计
JP2010164992A (ja) 音声対話装置
JP2005321539A (ja) 音声認識方法、その装置およびプログラム、その記録媒体
JP2005107384A (ja) 音声認識装置および方法、プログラム並びに記録媒体
JP3355473B2 (ja) 音声検出方法
JP2007248529A (ja) 音声認識装置、音声認識プログラム、及び音声動作可能な装置
JP2007264132A (ja) 音声検出装置及びその方法
KR20020082643A (ko) 고속 푸우리에 변환(fft) 및 역고속 푸우리에변환(ifft)을 이용한 송,수신기의 동기검출장치
JP3484559B2 (ja) 音声認識装置および音声認識方法
KR101615766B1 (ko) 돌발 잡음 검출기, 돌발 잡음 검출 방법 및 돌발 잡음 제거 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100921

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110111

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110124

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140218

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees