JP2005257817A - 雑音除去装置、方法、及びプログラム - Google Patents

雑音除去装置、方法、及びプログラム Download PDF

Info

Publication number
JP2005257817A
JP2005257817A JP2004066397A JP2004066397A JP2005257817A JP 2005257817 A JP2005257817 A JP 2005257817A JP 2004066397 A JP2004066397 A JP 2004066397A JP 2004066397 A JP2004066397 A JP 2004066397A JP 2005257817 A JP2005257817 A JP 2005257817A
Authority
JP
Japan
Prior art keywords
rank
noise
area
value
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004066397A
Other languages
English (en)
Other versions
JP3909709B2 (ja
Inventor
Osamu Ichikawa
治 市川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2004066397A priority Critical patent/JP3909709B2/ja
Priority to US11/075,519 priority patent/US20050203735A1/en
Publication of JP2005257817A publication Critical patent/JP2005257817A/ja
Application granted granted Critical
Publication of JP3909709B2 publication Critical patent/JP3909709B2/ja
Priority to US12/127,573 priority patent/US7797154B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Abstract

【課題】SS法による雑音除去に際し、ミュージカル・ノイズの発生を支障なく低減させる。
【解決手段】周波数スペクトルの時間変化を示す観測信号X(f,t)の雑音区間において時間軸及び周波数軸方向の所定の大きさを有する第1の領域に含まれる各要素について、その値による順位を算出する第1の順位算出手段14と、観測信号における時間軸及び周波数軸方向の所定の大きさを有する第2の領域に含まれる各要素について、その値による順位を算出する第2の順位算出手段16と、第2領域の各要素の値から、その要素と順位が対応する第1領域中の要素の値に基づく値を減算する減算手段17、18とにより雑音除去装置を構成する。
【選択図】図1

Description

本発明は、スペクトルサブトラクション法により観測信号中の雑音成分を除去する雑音除去装置、雑音除去方法、及び雑音除去プログラムであって、ミュージカル・ノイズの発生を抑制するようにしたものに関する。
従来、雑音が重畳された音声に基づく観測信号において雑音成分を抑圧する技術としてスペクトルサブトラクション法(以下、「SS法」という。)、ウィーナーフィルタ法、MMSE法(最小2乗平均誤差法)等が知られている。
SS法においては、定常雑音の存在を前提としており、非音声区間である雑音区間において、周波数毎の雑音成分の平均パワーを学習し、音声区間における観測信号のパワーから雑音信号の平均パワーを周波数毎に減算するようにしている(例えば、非特許文献1参照)。減算の際には、通常、雑音成分の平均パワーに対して過剰な減算重み1.0〜4.0を乗じ、減算結果としての出力が元の音声信号の0.01〜0.5倍以下に低下した場合には、減算結果を、元の音声信号にフロアリング係数を乗じた値に置き換える処理、すなわちフロアリングが併用される。
大きめの減算重みを適用すればミュージカル・ノイズは低減するが、音声区間における情報の欠落と音声の歪みが顕著になるので、それを補うために大きめのフロアリング係数が必要になる。しかし、大きめのフロアリング係数を適用すると、雑音信号のパワーは十分には低下しない。したがって、小さめの減算重み1.0〜1.5を用いる場合でも、ミュージカル・ノイズが発生しないようにするための改善策があれば、減算後の音声の欠落や歪みは最小限に抑えることができるとともに、小さめのフロアリング係数0.01〜0.1を採用することができるので、雑音信号のパワーを十分に低減させることができると考えられる。
SS法には複数の派生方式があり、SNR(信号対雑音比)に応じて周波数毎の減算重みを調整する非線形SS(NSS)法や(例えば非特許文献2参照)、雑音区間及び音声区間の区別をせずに時々刻々のローカルな平均パワーを減算する連続SS(CSS)法がある(例えば非特許文献3参照)。これらの方法においても、程度の差こそあれ、ミュージカル・ノイズは発生する。
SS処理後の出力を観察し、ミュージカル・ノイズらしきものを見つけたら除去していくという事後処理も提案されている。具体的には、周波数と時間の軸上でスペクトルのパワーを観察し、孤立した島のように見える部分を消去したり(例えば非特許文献4参照)、メディアン・フィルタにより除去したりする。また、隣り合う数フレーム分のパワーを平均化するスペクトル・スムージング法がある。しかし、これらの方式によれば、限界があり、ミュージカル・ノイズの除去性能は不十分である。
そもそも、ミュージカル・ノイズは「減算」処理に起因する。「減算」ではなく、「乗算」によって雑音成分除去後の音声信号を作成すれば、ミュージカル・ノイズは発生しないと考えられる。
ウィーナーフィルタ法によれば、クリーンな音声を何らかの方法で推定し、それと一致するようにウィーナーフィルタの伝達関数を決めるようにしている。ここで、クリーンな音声というのはもともと不明なので、その音声についての推定値が用いられるが、その推定値の推定方法により、実装するウィーナーフィルタの性質は大きく変わる。一般にこの方式によっても、残留ノイズの低減と音声歪みの最小化の両立は困難である。
MMSE法では、雑音及び音声において独立したパワー分布が存在すると仮定し、最小2乗法により、周波数毎の乗算係数を調整するようにしている(例えば非特許文献5参照)。「乗算」を行うので、ミュージカル・ノイズは発生しない。しかしMMSE法の処理音声は音声歪みが大きく、特に音声認識で広く用いられているメル・ケプストラムの尺度で測定した場合にそれが顕著であるため、音声認識への応用に向いていない。
S.Boll, "Suppression of AcousticNoise in Speech Using Spectral Subtraction", IEEE Trans. on ASSP, Vol.ASSP-27, pp.113-120, April 1979 LOCKWOOD, P., BOUDY, J., "ExperimentsWith a Nonlinear Spectral Subtractor (NSS), Hidden Markov Models andProjection, For Robust Recognition in Car", Speech Commun., vol. 11, pp. 215-228, June 1992. J.A.Nolazco Flores, S.J.Young, "Continuous speech recognition in noise using spectral subtractionand HMM adaptation",Proc. of ICASSP, 1994,vol.I, pp. 409-412 Gary Whipple, "Low Residual Noisespeech enhancement utilizing time-frequency filtering", ICASSP94 Y.Ephraim, D.Malah, "Speech enhancementusing a minimum mean-square error short-time spectral amplitude estimator", IEEE Trans. on ASSP, Vol.ASSP-32, pp1109-1121
高速道路の非常電話等の過酷な雑音環境下において、明瞭な音声通話を実現することが求められている。また、聴覚障害者のための補聴器の分野では、明瞭度の高い音声強調手法が求められている。
定常雑音が重畳された音声に基づく観測信号から雑音成分を除去して音声成分を強調するには、雑音成分の平均スペクトルを観測信号から減算するSS法が有効である。しかしながら、従来のSS法によれば、副作用として耳障りなミュージカル・ノイズが発生するのを避けることができない。
すなわち、現状のSS法の枠組みでは、音声の明瞭さと音声認識性能は、必ずしも両立しない。音声の歪みを最小限に抑えるためには小さめの減算重みを採用したいが、減算重みを小さくすると、雑音の引き残しが多く発生し、騒音環境下での音声認識性能は低下する。非音声区間を含めた総合的な雑音パワーを低くするためには、小さめのフロアリング係数を採用したいが、フロアリング係数を小さくすると、ミュージカル・ノイズが顕著になり、短い単語についての湧き出しエラーの発生につながる。したがって、音声認識性能を優先すれば、音声の聴覚上の明瞭さが犠牲になることがある。
また、これと同じ理由で、従来のSS法によれば、雑音除去後の観測信号による音声認識の性能が、減算重みとフロアリング係数という2つのパラメータによる影響を受けやすい。最適なパラメータ値は、雑音の量(S/N)や性質、さらには音声認識のタスクによっても変化するため、実環境ではやや扱いにくい。よりロバストな音声認識を実現するためには、パラメータの変化に鋭敏でない雑音の除去手法が求められている。
本発明の目的は、かかる従来技術の問題点に鑑み、SS法による雑音除去に際し、ミュージカル・ノイズの発生を、支障なく、効果的に低減させることにある。
この目的を達成するため、本発明に係る雑音除去装置は、周波数スペクトルの時間変化を示す観測信号の雑音区間において時間軸及び周波数軸方向の所定の大きさを有する第1の領域に含まれる各要素について、その値による順位を算出する第1の順位算出手段と、前記観測信号における時間軸及び周波数軸方向の所定の大きさを有する第2の領域に含まれる各要素について、その値による順位を算出する第2の順位算出手段と、前記第2領域の各要素の値から、その要素と前記順位が対応する前記第1領域中の要素の値に基づく値を減算する減算手段とを具備することを特徴とする。
また、本発明に係る雑音除去方法は、周波数スペクトルの時間変化を示す観測信号の雑音区間において時間軸及び周波数軸方向の所定の大きさを有する第1の領域に含まれる各要素について、その値による順位を算出する第1の順位算出手順と、観測信号における時間軸及び周波数軸方向の所定の大きさを有する第2の領域に含まれる各要素について、その値による順位を算出する第2の順位算出手順と、第2領域の各要素の値から、その要素と順位が対応する第1領域中の要素の値に基づく値を減算する減算手順とを具備することを特徴とする。
ここで、観測データとしては例えば、雑音成分が重畳された音声信号を所定のフレーム長及びフレーム周期で短時間スペクトルの時系列に変換したものが該当する。各要素の値としては、例えば、振幅や強度が該当する。減算に際しては、従来のSS法の場合と同様に、減算される値に対して減算係数を乗じたり、減算結果の値が観測データにフロアリング係数を乗じた値以下となる場合に、減算結果を、観測データにフロアリング係数を乗じた値に置き換えるフロアリングを行うようにしたりしてもよい。なお、観測データの雑音区間とは、観測信号中に雑音成分のみが含まれる時間的区間を意味する。
この構成において、観測信号における各要素の値から、観測信号の雑音区間における各要素の値を減算することにより、観測信号から雑音成分が除去される。しかし従来、かかるスペクトル減算に際し、観測信号の雑音区間における各要素の値の平均値を、観測信号における各要素の値から減算するようにしていたため、雑音値の分布の不均一さに応じた値の引き過ぎや引き残しが発生し、これによってミュージカル・ノイズが発生するという問題があった。
これに対し本発明によれば、観測信号の雑音区間における第1領域に含まれる各要素、及び観測信号における第2領域に含まれる各要素について、要素の値による順位を算出し、第2領域の各要素の値から、その要素の順位に対応する順位を有する第1領域の要素の値に基づく値を減算するようにしている。このため、第2領域中の、雑音成分が多く含まれると考えられる順位が高い要素からは、第1領域中の順位が高い要素の大きい雑音値が減算されるとともに、第2領域中の、雑音成分が少ないと考えられる順位が低い要素からは、第1領域中の順位が低い要素の小さな雑音値が減算される。したがって、第2領域において、雑音値の引き過ぎや引き残しが解消され、ミュージカル・ノイズの発生が抑制される。
本発明の好ましい態様においては、第1及び第2領域は周波数軸方向において所定の周波数増分毎に複数設定され、第1領域の設定位置は、時間軸方向における所定のタイミング位置となるように、順次更新されるとともに、第2領域の設定位置は、所定の時間位置間隔で順次変化するように、順次更新される。
第1及び第2領域を周波数軸方向において所定の周波数増分毎に複数設定するとともに、その際、第1及び第2領域の大きさを、周波数軸方向についての雑音成分の分布状況に応じて変化させるようにしてもよい。また、観測信号に周期性雑音の成分が含まれている場合には、第1及び第2領域の時間軸方向の大きさを、周期性雑音の周期と同じ、又はそれよりも大きく設定するようにしてもよい。また、本発明における、第2領域の要素と順位が対応する第1領域中の要素としては、例えば、第2領域の要素と相対的な順位が対応する第1領域中の要素が該当する。
また、第1及び第2領域中の各要素の順位を、複数の順位の範囲に区分し、第1及び第2領域の各区分を順位の低いものの方から順に相互に対応させ、対応する第1領域側の区分と第2領域側の区分とは相対的な順位の範囲が異なるようにすることができる。この場合、上述の、第2領域の要素と順位が対応する第1領域中の要素としては、該第2領域の要素が属する区分に対応する第1領域の区分に属する要素であって、その第1領域の区分における順位が、該第2領域の区分における該第2領域の要素の順位と相対的に一致する要素を採用することができる。
この場合、例えば、第1領域中の各要素の順位を、全順位の中央値を境界として2つの順位範囲に区分し、第2領域中の各要素の順位を、前記中央値における値と同一の値を有する、第2領域中の要素の順位を境界として2つの順位範囲に区分するようにしてもよい。
観測信号としては、例えば、雑音成分が重畳された音声信号を所定のフレーム長及びフレーム周期で短時間スペクトルの時系列に変換したものを用いることができるが、その場合、各要素は各フレームにおいて周波数サブバンド毎のものとして存在し、第1領域は所定のフレーム数に所定の周波数サブバンド数を乗じた大きさを有し、第2領域は所定のフレーム数に第1領域と同一の周波数サブバンド数を乗じた大きさを有するように設定することができる。
本発明によれば、ミュージカル・ノイズの発生を効果的に抑制することができる。また減算係数やフロアリング係数の値を好ましい値に維持することによって音声歪を抑制しながら、ミュージカル・ノイズの発生を効果的に低減させることができる。
まず、ミュージカル・ノイズの発生メカニズムについて説明する。図4は、男性による発声音「十五日」に対してホワイトノイズを重畳したテスト音声のスペクトログラムである。図中のBlock1は、150×10(フレーム数×周波数サブバンド数)のサイズを有する検査領域(以下、「ブロック1」という。)であり、各フレームにおける周波数サブバンド毎の要素により構成されている。ブロック1は215[Hz]の中心周波数を有し、この中心周波数における雑音のパワー分布を検査するために、雑音区間において設定されている。Block2は20×10(フレーム数×周波数サブバンド数)のサイズを有する検査領域(以下、「ブロック2」という。)であり、各フレームにおける周波数サブバンド毎の要素により構成されている。ブロック2の中心周波数は215Hzであり、中心フレームは1.9秒に位置する。ブロック2はこの中心周波数及び中心フレームにおける音声のパワー分布を検査するために設定されている。Block3は、ブロック2とは中心フレームのみが異なる、雑音区間における検査領域(以下、「ブロック3」という。)である。
図5はブロック1に含まれる1500の全要素についての音声パワーを、値の小さいものから大きいものへ順位付けし、その結果を、横軸を順位、縦軸をパワーとして示すグラフである。同図からわかるように、定常のホワイトノイズとはいっても、局所的に見れば決して定常ではなく、パワーの最小値と最大値との間には、10の4乗倍以上の差がある。したがって、従来のSS法のように、雑音パワーの平均値にのみ注目し、その平均値を各要素の音声パワーから減算すると、多くの要素について、雑音パワーの引き残しと引き過ぎが発生することがわかる。この、引き残した分と引き過ぎた分のパワーがミュージカル・ノイズとなる。
図6は、図4の音声の、従来のSS法によりスペクトル減算を行った後のスペクトログラムである。使用した減算重みは1.5、フロアリング係数は0.0である。従来のSS法によれば、図6に示されるようなミュージカル・ノイズが発生する。
次に、本発明に従ったミュージカル・ノイズの低減方法について説明する。この方法は、イメージ的には、周波数―時間(フレーム)平面における雑音スペクトルをテキスチャ(地模様)として考え、図4のブロック2や3のような平面内の小ブロック毎にテキスチャの一致する模様部分を削除しようとする試みとして理解することができる。テキスチャは微視的にはランダムであるため、雑音区間においてさえテキスチャが完全に一致するブロックは存在しない。このため、単純な減算によってはテキスチャを削除することはできない。しかし、ブロックサイズをやや大きめに設定した場合、雑音区間におけるブロックの単位で考えれば、各ブロック内では、図5のようなパワーの分布がほぼ同一であると考えられる。
すなわち、図4のブロック1で学習した図5のパワー分布と同様のパワー分布を、図4中のブロック3も有していると考えることができる。したがって、ブロック3内の各要素において減算すべき雑音パワーは、ブロック3内の各要素について、パワー値による順位(ランク)を求め、図5の学習済みパワー分布の中でその順位と相対的な順位が一致する要素のパワー値を取得することにより求めることができる。このようにしてブロック3内の各要素について求められるパワー値を、各要素のパワーから減算することにより、各要素における雑音パワーの引き残しや引き過ぎを最小限に抑えることができる。この原理による雑音除去法をランクベース・スペクトル・サブトラクション法(以下、「RBSS法」という。)と呼ぶ。図4中のブロック2のように音声が存在する区間においてもRBSS法を適用することができる。
図7は、図4のブロック2及びブロック1のそれぞれにおける図5と同様のパワー分布を示す。図7中の71は、ブロック1のパワー分布を示す点列であり、72はブロック2のパワー分布を示す点列である。ブロック2における音声成分が重畳されている要素は極めてパワーが高いので、高順位に序列される。RBSS法によれば、ブロック2の要素について、相対的な順位が一致するブロック1の要素の雑音パワーが参照されるため、ブロック1における雑音パワーの高い要素は、主にブロック2の音声重畳部分の要素に対して集中的に割り当てられることになる。
このことは、一見、音声信号の劣化要因となるように見える。しかし図7のように、音声パワーと雑音パワーとの間に10の2乗倍もの差があるような状況では、対応する要素において音声パワーから雑音パワーを減算したとしても、音声パワー及び雑音パワーのオーダが異なるので、大きな影響を与えることはない。そうでないような状況、すなわち音声パワーと雑音パワーが拮抗するような状況では、もともとSS法の枠組みが音声パワーをあぶりだすようにはできていないので、従来法と比較して、RBSS法が著しく不利ということはない。なお、雑音パワーの減算に際しては、通常のSS法の場合と同様に、雑音パワーに減算重みを乗じてから減算を行う。
以上のようにして、図4のブロック1のような学習用のブロックと、これに対応するブロック2や3のような減算用ブロックとの間でのパワー分布の順位によるマッピングを考慮した雑音パワーの減算を、時間軸及び周波数軸方向の各位置において行うことにより、クリーンな音声パワーの推定値を求めることができる。ただし、図8に示すブロック81〜83のように、各ブロックの領域が互いに重なり合うように、それらの周波数軸及び時間軸方向の位置(ω,T)、(ω+Δω,T)及び(ω,T+ΔT)並びにサイズを設定することができるので、あるフレーム及び周波数サブバンドの要素について複数の推定値が得られる場合がありうる。その場合には、複数の推定値の平均値をその要素についての最終的な推定値とする。最終的な推定値が得られたら、通常のSS法の場合と同様にフロアリングを行い、その結果として得られる値を出力する。
以上のRBSS法による処理を次式により示す。
ここで、f,tは各要素の周波数サブバンド番号及びフレーム番号、X(f,t)は要素(f,t)の観測値、F,Tは減算用ブロックを識別するための周波数軸方向及び時間軸方向のインデックス、rankF,Tは減算用ブロック(F,T)内でのX(f,t)の順位RF,T(f,t)を出力する関数、Fは学習用ブロックを識別するための周波数軸方向のインデックス、NF(RF,T(f,t))は順位RF,T(f,t)に対応する順位を有する学習用ブロック(F)中の要素の雑音パワー、aは減算係数、bはフロアリング係数、Mf,tは要素(f,t)が属する減算用ブロックの数、Y(f,t)は観測値X(f,t)についての雑音除去後の出力である。学習用ブロックと減算用ブロックとはインデックスFが同一のもの同士が対応しており、対応する学習用ブロック及び減算用ブロックは周波数軸方向の大きさ及び位置が等しい。
ある1つの要素(f,t)の観測値X(f,t)についての雑音除去処理に際しては、まず、式(1)により、要素(f,t)が属する各小ブロック(F,T)における要素(f,t)についての順位RF,T(f,t)を求める。次に、式(2)により、各順位RF,T(f,t)に対応する順位を有する、対応する各学習用ブロック(F)中の要素の雑音パワーNF(RF,T(f,t))に減算重みaを乗じた値を、観測値X(f,t)から減算し、SF,T(f,t)を求める。そして、式(3)により、各順位RF,T(f,t)についての値SF,T(f,t)の平均値、及び観測値X(f,t)にフロアリング係数bを乗じた値のうち大きい方の値を、雑音除去済みの音声パワーY(f,t)とする。
図9は、このようなRBSS法により各観測値X(f,t)について雑音除去処理を行った後の音声信号のスペクトログラムである。ただし、雑音除去処理において使用した減算重みaは1.5 、フロアリング係数bは0.0、減算用ブロックのサイズは20×20(フレーム数×周波数サブバンド数)である。同図から、RBSS法によれば、図6に示されるようなミュージカル・ノイズを除去することができることがわかる。
図1は本発明の一実施形態に係る雑音除去装置を示すシステム構成図である。この装置は、上述のRBSS法を実施すべく、コンピュータとソフトウェアにより構成されるものである。同図に示すようにこの装置は、音声成分及び雑音成分を含む入力信号に基づき、観測値X(f,t)を出力するFFT部11、観測値X(f,t)の各フレームが雑音区間に属するか否かを判定する区間判定部12、観測値X(f,t)の雑音区間において学習用ブロックを設定する学習用ブロック設定部13、学習用ブロックにおける各要素についてパワーによる順位を算出する雑音パワー順位算出部14、観測値X(f,t)において減算用ブロックを設定する減算用ブロック設定部15、減算用ブロックにおける各要素についてパワーによる順位RF,T(f,t)を算出する音声パワー順位算出部16、各順位算出部14及び16による順位算出結果に基づき、減算用ブロック内の各要素について、観測値X(f,t)から減算すべき雑音パワーを算出する雑音パワー算出部17、算出された雑音パワーを観測値X(f,t)から減算して雑音パワーが除去された信号Y(f,t)を出力する減算部18を備える。
FFT部11は入力信号を、所定のフレーム長及びフレーム周期で高速フーリエ変換することにより、短時間スペクトルの時系列としての観測値X(f,t)を出力する。区間判定部12は、各フレーム(t)のパワー値に基づき、そのフレームが雑音区間に属するかどうかを判定する。
学習用ブロック設定部13は、学習用ブロックを周波数軸方向において、図8に示すような周波数増分Δω毎に多数設定するとともに、その時間軸方向の設定位置を、所定のタイミング位置となるように順次更新する。このタイミング位置としては、例えば、学習用ブロックが音声区間の直前の位置となるようなタイミング位置を採用することができる。雑音パワー順位算出部14は、各学習用ブロックについて、各要素のパワーによる順位を、前記設定位置の更新毎に算出する。
小ブロック設定部15は、小ブロックを周波数軸方向において、図8に示すような周波数増分Δω毎に多数設定するとともに、その設定位置を、所定の時間位置間隔で順次変化するように、順次更新する。音声パワー順位算出部16は、各減算用ブロックについて、各要素のパワーによる順位を、前記設定位置の更新毎に算出する。
雑音パワー算出部17は、減算用ブロックの設定位置の更新毎に、各減算用ブロックについて、各要素と相対的順位が一致する、対応学習用ブロック中の要素のパワー値を、雑音パワー値として取得する。減算部18は、減算用ブロックの設定位置の更新毎に、減算用ブロックについて、各要素のパワー値から、対応する雑音パワー値を減算し、得られる値を、雑音が除去された音声パワー値として出力する。
図2は図1の装置を構成するコンピュータを示すブロック図である。このコンピュータは、プログラムに基づくデータ処理や各部の制御を行う中央処理装置21、中央処理装置21が実行中のプログラムや関連するデータを高速にアクセスできるように記憶する主記憶装置22、プログラムやデータを記憶する補助記憶装置23、データや指令を入力するための入力装置24、中央処理装置21による処理結果の出力や、入力装置24との協働によるGUI機能を行うための出力装置25等を備える。図中の実線はデータの流れ、破線は制御信号の流れを示している。このコンピュータには、コンピュータに図1の装置における各部の機能を実行させるための雑音除去プログラムがインストールされている。また、入力装置24には、図1のFFT部11に供給される入力信号を生成するためのマイクロホンが含まれている。
図3は図1の装置における雑音処理プログラムに従った処理の手順を示すフローチャートである。ただしこの処理において、学習用ブロックのサイズをN×m(フレーム数×周波数サブバンド数)とし、減算用ブロックのサイズをn×m(フレーム数×周波数サブバンド数)とし、学習用ブロック及び小ブロックの周波数軸方向の設定数をkとし、図8に示すようなブロックの重なりはないものとする。
処理を開始すると、まず、ステップ31において、FFT部11により1フレーム分の観測値X(f,t)を取得する。次に、ステップ32において、区間判定部12により、取得した観測値X(f,t)に基づき、該フレームが雑音区間に属するかどうかを判定する。雑音区間に属すると判した場合、ステップ33において、学習用ブロック設定部13により、取得した観測値X(f,t)を学習用バッファに追加し、ステップ37に進む。したがって、学習用バッファには、雑音区間が継続する限りにおいて、フレーム毎に観測値X(f,t)が蓄積されてゆく。
ステップ32において該フレームが雑音区間のものでないと判定した場合には、ステップ34において、雑音パワー分布の更新登録、すなわち学習用ブロックの設定位置の更新を行うか否かを判定する。更新を行う旨の判定は、学習用ブロックを構成するに足る連続したNフレームについての観測値X(f,t)が蓄積されている場合に行われる。雑音パワー分布の更新登録を行うと判定した場合には、ステップ35において、蓄積されている最新のNフレーム分の観測値X(f,t)に基づき、それにより構成される各学習用ブロックについて、各要素のパワーによる順位を算出し、その結果を、新たなパワー分布として登録する。これにより雑音パワーの分布に関する1回の学習が完了する。この学習が、学習ブロックの設定位置の更新に相当する。この後、ステップ36において学習用バッファをクリアしてから、ステップ37へ進む。ステップ34において雑音パワー分布の更新登録をしないと判定した場合は、そのままステップ37へ進む。
ステップ37では、ステップ31で取得した最新の1フレーム分の観測値X(f,t)を、減算用バッファに追加する。次に、ステップ38において、減算用バッファに、減算用ブロックの時間軸方向サイズに相当するnフレーム分の観測値X(f,t)が蓄積されたか否かを判定する。蓄積されていないと判定した場合はステップ31に戻る。
ステップ38においてnフレーム分の観測値が蓄積されたと判定した場合は、ステップ39において、減算用バッファ中のnフレーム分の観測値で構成される各減算用ブロックについて、上述の式(1)により各要素の順位RF,T(f,t)を算出するとともに、登録されている雑音パワー分布を参照して雑音パワーNF(RF,T(f,t))を取得し、さらに上述の式(2)及び(3)を用いて、雑音が除去されたパワー値Y(f,t)を算出し、出力する。
次にステップ40において、減算用バッファをクリアする。そして、ステップ41において所定の理由により処理を終了すると判断されない限り、ステップ31に戻り、上述の各処理を繰り返す。このようにして、減算用バッファにnフレーム分の観測値が蓄積される毎にそのnフレーム分の観測値についての雑音が除去されたパワー値Y(f,t)が出力される。すなわち、nフレーム毎に減算用ブロックの時間軸方向位置が順次更新されることになる。
なお、この処理手順では、学習用ブロック及び減算用ブロックのそれぞれについて、図8に示すような重なりがないことを前提としているが、重なりがある場合は、ブロック単位ではなく、隣接ブロックを含む単位で雑音パワーを計算し、上述式(3)における平均化を行うようにすればよい。
図10は本発明の別の実施形態に係る雑音除去装置における雑音パワーの算出方法を示す。この装置は図1の装置の場合と同様のシステム構成を有するが、図1の装置とは雑音パワー算出部17における処理のみが異なる。これによれば、次のようにして、RBSS法における雑音パワーの推定精度をさらに向上させることができる。
図10中の左のグラフは図5と同様の雑音パワーの分布を示すものであり、右のグラフは雑音パワーに対して音声パワーが合成された場合のパワー分布を示す。例えば、図4におけるブロック2のように、雑音区間から音声区間へ移行する途中の減算用ブロック内において、雑音パワーに対し音声パワーが合成されるとき、音声パワーは相対的に大きいので、図10において矢印101で示されるように、主に高順位の位置に合成され、これにより同図右のグラフのような音声区間におけるパワー分布が生成されたと考えられる。この場合、音声区間のパワー分布と雑音区間のパワー分布は、相対的順位の直接的な一致により対応させる場合に比べて、図10のように、順位軸を適当な大きさの区分に分割し、雑音区間のパワー分布における低順位側の区分は、音声区間のパワー分布における低順位側のより小さな区分に対応させるとともに、雑音区間のパワー分布における高順位側の区分は、音声区間のパワー分布における高順位側のより大きな区分に対応させるのがより正確である。
このように順位軸を分割し、大きさの異なる区分同士を対応させる方法としては、種々の方法が考えられるが、図10ではその一例が示されている。すなわち、まず、雑音区間のパワー分布における順位の中央値の左側を区分Aとし、右側を区分Bとする。次に、順位の中央値におけるパワーと同一のパワーとなる順位を、音声区間のパワー分布において求め、その順位の左側を音声区間における区分Aとし、右側を区分Bとする。そして、両パワー分布の区分A同士、区分B同士をそれぞれ対応させる。
この場合、雑音パワー算出部17における雑音パワーの算出は、対応する各区分における相対的順位の一致に基づいて行う。すなわち、対象となる観測値X(f,t)の順位が区分Bに属しているとすれば、その区分Bにおける相対的順位が一致する、雑音パワー分布の区分Bにおける相対的順位の雑音パワーが、求める雑音パワーとなる。
次に、上述の図10の実施形態に係る雑音除去装置により雑音除去を実施した結果を、雑音除去前、及び従来のSS法による場合と対比させて、図11〜図14に示す。観測信号としては、高速走行中の車両の車室内における女性話者の発声による「国際」の発話音に基づくものを用いている。また、車の走行雑音は低域に集中しているので、小ブロックのサイズを、周波数方向に狭く設定し、50×4(フレーム数×周波数サブバンド数)としている。
図11は雑音除去前の音声のスペクトログラムであり、図12及び図13は従来のSS法により減算を行った音声のスペクトログラムである。ただし図12の結果は、減算重みを1.5とし、フロアリング係数を0.0とした場合のものであり、図13の結果は図9の場合に比べ、減算重みを2.5に増やした場合のものである。従来のSS法によれば、減算重みを2.5に増やしても、ミュージカル・ノイズが顕著に発生することがわかる。
図14は図10の形態によるRBSS法に従って雑音除去を行った後の音声のスペクトログラムである。ただし、使用した減算重みは1.5、フロアリング係数は0.0である。従来のSS法に比べ、ミュージカル・ノイズの発生が格段に少ないことがわかる。
次に、上述の各実施形態に係る雑音除去装置を音声認識に適用した場合の性能を実験により検証した結果を示す。実験は、エンジン停止状態の自動車内で、8名の話者(男性4名、女性4名)に、40文ずつ発話してもらい、サンバイザに設置したマイクロホンにより収録した入力信号に基づいて行った。発話内容は、1文につき1個から11個までのデジット(digits;桁なし連続数字)である。総単語数は2538語である。また、前記入力信号に対し、時速100kmの走行時に収録した走行雑音を重畳することにより、走行時の発声を人工的に模擬した入力信号を用いた実験も行った。実験に際しては、収録のサンプリング周波数を22KHzとし、IBM社製の音声認識プログラムであるデスクトップ版ViaVoiceに含まれるクリーンな音響モデルにより、音声認識を行った。
図15はエンジン停止時の入力信号に基づく音声認識結果を示すグラフであり、図16は時速100kmで走行中の場合の入力信号に基づく音声認識結果を示すグラフである。縦軸のWER(%)は単語誤り率である。図中の「オリジナル」は、未処理の原音声を使用した場合の結果、「SS」は、従来のSS法による結果、「RBSS」はRBSSに従った図1の装置による結果、「RBSS−fit」は図10の実施形態による結果である。「a」は減算重み、「b」はフロアリング係数である。
図15及び図16から、エンジン停止時及び100km走行時のいずれの場合においても、従来のSS法によれば、減算重みaが小さい場合や、フロアリング係数bが小さい場合には顕著に認識誤り率が増大することがわかる。これに対し、RBSS法によれば、それらのパラメータaやbの変化による影響を受けにくいことがわかる。例えば、フロアリング係数bを0.1に固定して考えた場合、減算重みaが1.5〜3.5の間で変化しても、認識誤り率はあまり変化せず、常にベストに近い認識率を保持している。
さらに、時速100km走行時のケースでは、フロアリング係数が、小さい方の0.01の場合でも、同様に、ベストに近い認識率を保持している。エンジン停止時のケースにおいては、フロアリング係数が小さい方の0.01とした場合には認識誤り率は増えているが、その増え方は従来のSS法に比べるとはるかに穏やかである。図10の形態のRBSS法によれば、時速100km走行時のケースにおいて、パラメータa、bとして種々の値を選択した場合において、図1の装置によるRBSS法による場合よりも良い結果を示している。
次に、周期性雑音が入力信号に重畳されている場合についても上述各実施形態による雑音除去装置が有効であることを示す。図17は女性による「7518」の発話音に対し、周期性雑音が重畳した音声のスペクトログラムである。図18はこの音声についての、従来のSS法により、減算重みを1.5、フロアリング係数を0.0として処理した場合のスペクトログラムである。従来のSS法によれば、雑音パワーの平均値を一様に減算するようにしているため、処理後の音声においても、周期性雑音は消えることはない。
図19は従来のSS法により、図18の場合に比べ、減算重みを増やして3.5として処理した場合の、図17の音声についてのスペクトログラムである。図18及び図19から、従来のSS法によれば、減算重みを増やしても周期性雑音は消えないことがわかる。
図20は図1の雑音除去装置により図17の音声を処理して得た音声信号のスペクトログラムである。使用した減算重みは1.5、フロアリング係数は0.0、減算用ブロックのサイズは10×10である。RBSS法によれば、雑音成分は減算用ブロック単位のテキスチャパターンとして消去されるので、小ブロックを周期性雑音の周期以上の大きさに設定することにより、図20に示すように、周期性雑音をほとんど消去することができる。
なお、本発明は上述実施形態に限定されることなく、適宜変形して実施することができる。例えば、上述においては、学習用ブロック及び減算用ブロックのサイズを一定としているが、この代わりに、雑音成分の性質に応じて、周波数ごとにサイズを変えるようにしてもよい。例えば、ある周波数帯域においてノイズが集中していることが予めわかっている場合には、その帯域においては周波数軸方向が小さく、時間軸方向に長いブロックを設定するようにしてもよい。また、雑音成分が、全周波数領域にわたって一様な雑音であるホワイトノイズの場合には、各ブロックの周波数軸方向のサイズを大きめに設定するようにしてもよい。
本発明の一実施形態に係る雑音除去装置を示すシステム構成図である。 図1の装置を構成するコンピュータの構成を示すブロック図である。 図1の装置における雑音処理プログラムに従った処理の手順を示すフローチャートである。 男性による発声「十五日」に対してホワイトノイズを重畳したテスト音声のスペクトログラムである。 雑音区間の学習用ブロック含まれる全要素について、雑音パワーを、パワー値によって順位付けした結果を示すグラフである。 従来のSS法によりスペクトル減算を行った後の音声のスペクトログラムである。 図4のブロック2及びブロック1のそれぞれにおけるパワー分布を示すグラフである。 小ブロックの重なりを示す図である。 本発明に従ったRBSS法により各観測値について雑音除去処理を行った後の音声信号のスペクトログラムである。 本発明の別の実施形態に係る雑音除去装置における雑音パワーの算出原理を示す図である。 雑音除去前の音声のスペクトログラムである。 従来のSS法により減算を行った音声のスペクトログラムである。 従来のSS法により減算を行った音声の別のスペクトログラムである。 図10の形態によるRBSS法に従って雑音除去を行った後の音声のスペクトログラムである。 本発明の効果を示すための、エンジン停止時の入力信号に基づく音声認識結果を示すグラフである。 本発明の効果を示すための、時速100kmで走行中の場合の入力信号に基づく音声認識結果を示すグラフである。 女性による発話音に対し、周期性雑音が重畳した音声のスペクトログラムである。 従来のSS法により処理した場合の、図17の音声のスペクトログラムである。 従来のSS法により減算重みを増やして処理した場合の、図17の音声のスペクトログラムである。 図1の雑音除去装置により処理した場合の、図17の音声のスペクトログラムである。
符号の説明
11:FFT部、12:区間判定部、13:学習用ブロック設定部、14:雑音パワー順位算出部、15:減算用ブロック設定部、16:観測パワー順位算出部、17:雑音パワー算出部、18:減算部、21:中央処理装置、22:主記憶装置、23:補助記憶装置、24:入力装置、25:出力装置、71,72:点列、81〜83:ブロック。

Claims (17)

  1. 周波数スペクトルの時間変化を示す観測信号の雑音区間において時間軸及び周波数軸方向の所定の大きさを有する第1の領域に含まれる各要素について、その値による順位を算出する第1の順位算出手段と、
    前記観測信号における時間軸及び周波数軸方向の所定の大きさを有する第2の領域に含まれる各要素について、その値による順位を算出する第2の順位算出手段と、
    前記第2領域の各要素の値から、その要素と前記順位が対応する前記第1領域中の要素の値に基づく値を減算する減算手段とを具備することを特徴とする雑音除去装置。
  2. 前記第1及び第2領域を周波数軸方向において所定の周波数増分毎に複数設定し、前記第1領域の設定位置を、時間軸方向における所定のタイミング位置となるように、順次更新するとともに、前記第2領域の設定位置を、所定の時間位置間隔で順次変化するように、順次更新する領域設定手段を有することを特徴とする請求項1に記載の雑音除去装置。
  3. 前記第1及び第2領域を周波数軸方向において所定の周波数増分毎に複数設定するとともに、その際、各第1及び第2領域の大きさを、周波数軸方向についての雑音成分の分布状況に応じて変化させる領域設定手段を有することを特徴とする請求項1に記載の雑音除去装置。
  4. 前記観測信号に周期性雑音の成分が含まれている場合、前記第1及び第2領域の時間軸方向の大きさを、該周期性雑音の周期と同じ、又はそれよりも大きく設定する領域設定手段を有することを特徴とする請求項1に記載の雑音除去装置。
  5. 前記第2領域の要素と順位が対応する第1領域中の要素とは、前記第2領域の要素と相対的な順位が対応する第1領域中の要素であることを特徴とする請求項1に記載の雑音除去装置。
  6. 前記第1及び第2領域中の各要素の順位は、複数の順位の範囲に区分されており、前記第1及び第2領域の各区分は低順位側のものから順に相互に対応しており、対応する第1領域側の区分と第2領域側の区分とは相対的な順位の範囲が異なっており、
    前記第2領域の要素と順位が対応する第1領域中の要素とは、該第2領域の要素が属する区分に対応する前記第1領域の区分に属する要素であって、その第1領域の区分における順位が、該第2領域の区分における該第2領域の要素の順位と相対的に一致する要素であることを特徴とする請求項1に記載の雑音除去装置。
  7. 前記第1領域中の各要素の順位は、全順位の中央値を境界として2つの順位範囲に区分されており、前記第2領域中の各要素の順位は、前記中央値における値と同一の値を有する、前記第2領域中の要素の順位を境界として2つの順位範囲に区分されていることを特徴とする請求項6に記載の雑音除去装置。
  8. 前記観測信号は雑音成分が重畳された音声信号を所定のフレーム長及びフレーム周期で短時間スペクトルの時系列に変換したものであり、前記要素は各フレームにおいて周波数サブバンド毎に存在し、前記第1領域は所定のフレーム数に所定の周波数サブバンド数を乗じた大きさを有し、前記第2領域は所定のフレーム数に前記第1領域と同一の周波数サブバンド数を乗じた大きさを有することを特徴とする請求項1に記載の雑音除去装置。
  9. 周波数スペクトルの時間変化を示す観測信号の雑音区間において時間軸及び周波数軸方向の所定の大きさを有する第1の領域に含まれる各要素について、その値による順位を算出する第1の順位算出手順と、
    前記観測信号における時間軸及び周波数軸方向の所定の大きさを有する第2の領域に含まれる各要素について、その値による順位を算出する第2の順位算出手順と、
    前記第2領域の各要素の値から、その要素と前記順位が対応する前記第1領域中の要素の値に基づく値を減算する減算手順とを具備することを特徴とする雑音除去方法。
  10. 前記第1及び第2領域を周波数軸方向において所定の周波数増分毎に複数設定し、前記第1領域の設定位置を、時間軸方向における所定のタイミング位置となるように、順次更新するとともに、前記第2領域の設定位置を、所定の時間位置間隔で順次変化するように、順次更新する領域設定手順を有することを特徴とする請求項9に記載の雑音除去方法。
  11. 前記第1及び第2領域を周波数軸方向において所定の周波数増分毎に複数設定するとともに、その際、各第1及び第2領域の大きさを、周波数軸方向についての雑音成分の分布状況に応じて変化させる領域設定手順を有することを特徴とする請求項9に記載の雑音除去方法。
  12. 前記観測信号に周期性雑音の成分が含まれている場合、前記第1及び第2領域の時間軸方向の大きさを、該周期性雑音の周期と同じ、又はそれよりも大きく設定する領域設定手順を有することを特徴とする請求項9に記載の雑音除去方法。
  13. 前記第2領域の要素と順位が対応する第1領域中の要素とは、前記第2領域の要素と相対的な順位が対応する第1領域中の要素であることを特徴とする請求項9に記載の雑音除去方法。
  14. 前記第1及び第2領域中の各要素の順位は、複数の順位の範囲に区分されており、前記第1及び第2領域の各区分は低順位側のものから順に相互に対応しており、対応する第1領域側の区分と第2領域側の区分とは相対的な順位の範囲が異なっており、
    前記第2領域の要素と順位が対応する第1領域中の要素とは、該第2領域の要素が属する区分に対応する前記第1領域の区分に属する要素であって、その第1領域の区分における順位が、該第2領域の区分における該第2領域の要素の順位と相対的に一致する要素であることを特徴とする請求項9に記載の雑音除去方法。
  15. 前記第1領域中の各要素の順位は、全順位の中央値を境界として2つの順位範囲に区分されており、前記第2領域中の各要素の順位は、前記中央値における値と同一の値を有する、前記第2領域中の要素の順位を境界として2つの順位範囲に区分されていることを特徴とする請求項14に記載の雑音除去方法。
  16. 前記観測信号は雑音成分が重畳された音声信号を所定のフレーム長及びフレーム周期で短時間スペクトルの時系列に変換したものであり、前記要素は各フレームにおいて周波数サブバンド毎に存在し、前記第1領域は所定のフレーム数に所定の周波数サブバンド数を乗じた大きさを有し、前記第2領域は所定のフレーム数に前記第1領域と同一の周波数サブバンド数を乗じた大きさを有することを特徴とする請求項9に記載の雑音除去方法。
  17. コンピュータに、請求項9の雑音除去方法における各手順を実行させることを特徴とする雑音除去プログラム。
JP2004066397A 2004-03-09 2004-03-09 雑音除去装置、方法、及びプログラム Expired - Fee Related JP3909709B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2004066397A JP3909709B2 (ja) 2004-03-09 2004-03-09 雑音除去装置、方法、及びプログラム
US11/075,519 US20050203735A1 (en) 2004-03-09 2005-03-09 Signal noise reduction
US12/127,573 US7797154B2 (en) 2004-03-09 2008-05-27 Signal noise reduction

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004066397A JP3909709B2 (ja) 2004-03-09 2004-03-09 雑音除去装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2005257817A true JP2005257817A (ja) 2005-09-22
JP3909709B2 JP3909709B2 (ja) 2007-04-25

Family

ID=34918328

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004066397A Expired - Fee Related JP3909709B2 (ja) 2004-03-09 2004-03-09 雑音除去装置、方法、及びプログラム

Country Status (2)

Country Link
US (2) US20050203735A1 (ja)
JP (1) JP3909709B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008252389A (ja) * 2007-03-29 2008-10-16 Casio Comput Co Ltd 撮像装置、雑音除去方法及びプログラム
WO2010140358A1 (ja) * 2009-06-02 2010-12-09 パナソニック株式会社 補聴器、補聴システム、歩行検出方法および補聴方法
WO2011077636A1 (ja) * 2009-12-25 2011-06-30 三菱電機株式会社 雑音除去装置及び雑音除去プログラム
JP2013541023A (ja) * 2010-12-07 2013-11-07 ミツビシ・エレクトリック・リサーチ・ラボラトリーズ・インコーポレイテッド 試験音声信号の雑音を除去する結果として試験雑音除去音声信号内で減衰したスペクトル成分を復元するための方法
CN113454716A (zh) * 2018-12-20 2021-09-28 诺基亚技术有限公司 用于控制降噪的装置、方法和计算机程序

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
JP4868999B2 (ja) * 2006-09-22 2012-02-01 富士通株式会社 音声認識方法、音声認識装置及びコンピュータプログラム
US8229754B1 (en) * 2006-10-23 2012-07-24 Adobe Systems Incorporated Selecting features of displayed audio data across time
US8296135B2 (en) * 2008-04-22 2012-10-23 Electronics And Telecommunications Research Institute Noise cancellation system and method
US8521530B1 (en) * 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
WO2011029048A2 (en) * 2009-09-04 2011-03-10 Massachusetts Institute Of Technology Method and apparatus for audio source separation
US8666092B2 (en) * 2010-03-30 2014-03-04 Cambridge Silicon Radio Limited Noise estimation
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
KR101176207B1 (ko) * 2010-10-18 2012-08-28 (주)트란소노 음성통신 시스템 및 음성통신 방법
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
DE112015003945T5 (de) 2014-08-28 2017-05-11 Knowles Electronics, Llc Mehrquellen-Rauschunterdrückung
CN108376544B (zh) * 2018-03-27 2021-10-15 京东方科技集团股份有限公司 一种信息处理方法、装置、设备及计算机可读存储介质

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW272341B (ja) * 1993-07-16 1996-03-11 Sony Co Ltd
JP3484757B2 (ja) * 1994-05-13 2004-01-06 ソニー株式会社 音声信号の雑音低減方法及び雑音区間検出方法
US5774846A (en) * 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
JP2760373B2 (ja) * 1995-03-03 1998-05-28 日本電気株式会社 雑音消去装置
DE19508711A1 (de) * 1995-03-10 1996-09-12 Siemens Ag Verfahren zur Erkennung einer Signalpause zwischen zwei Mustern, welche in einem zeitvarianten Meßsignal vorhanden sind
US5706395A (en) * 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
US6263307B1 (en) * 1995-04-19 2001-07-17 Texas Instruments Incorporated Adaptive weiner filtering using line spectral frequencies
US5878389A (en) * 1995-06-28 1999-03-02 Oregon Graduate Institute Of Science & Technology Method and system for generating an estimated clean speech signal from a noisy speech signal
US5848163A (en) * 1996-02-02 1998-12-08 International Business Machines Corporation Method and apparatus for suppressing background music or noise from the speech input of a speech recognizer
US5806025A (en) * 1996-08-07 1998-09-08 U S West, Inc. Method and system for adaptive filtering of speech signals using signal-to-noise ratio to choose subband filter bank
JPH10105191A (ja) * 1996-09-30 1998-04-24 Toshiba Corp 音声認識装置及びマイクロホン周波数特性変換方法
US6144937A (en) * 1997-07-23 2000-11-07 Texas Instruments Incorporated Noise suppression of speech by signal processing including applying a transform to time domain input sequences of digital signals representing audio information
US6230122B1 (en) * 1998-09-09 2001-05-08 Sony Corporation Speech detection with noise suppression based on principal components analysis
US6108610A (en) * 1998-10-13 2000-08-22 Noise Cancellation Technologies, Inc. Method and system for updating noise estimates during pauses in an information signal
US7610205B2 (en) * 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7106541B2 (en) * 2001-09-14 2006-09-12 Convergent Systems Solutions, Llc Digital device configuration and method
US7065486B1 (en) * 2002-04-11 2006-06-20 Mindspeed Technologies, Inc. Linear prediction based noise suppression
WO2004042702A1 (en) * 2002-11-05 2004-05-21 Koninklijke Philips Electronics N.V. Spectrogram reconstruction by means of a codebook

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008252389A (ja) * 2007-03-29 2008-10-16 Casio Comput Co Ltd 撮像装置、雑音除去方法及びプログラム
WO2010140358A1 (ja) * 2009-06-02 2010-12-09 パナソニック株式会社 補聴器、補聴システム、歩行検出方法および補聴方法
CN102124758A (zh) * 2009-06-02 2011-07-13 松下电器产业株式会社 助听器、助听系统、步行检测方法和助听方法
US8391524B2 (en) 2009-06-02 2013-03-05 Panasonic Corporation Hearing aid, hearing aid system, walking detection method, and hearing aid method
CN102124758B (zh) * 2009-06-02 2014-03-12 松下电器产业株式会社 助听器、助听系统、步行检测方法和助听方法
WO2011077636A1 (ja) * 2009-12-25 2011-06-30 三菱電機株式会社 雑音除去装置及び雑音除去プログラム
CN102667928A (zh) * 2009-12-25 2012-09-12 三菱电机株式会社 噪声消除装置以及噪声消除程序
JP5383828B2 (ja) * 2009-12-25 2014-01-08 三菱電機株式会社 雑音除去装置及び雑音除去プログラム
US9087518B2 (en) 2009-12-25 2015-07-21 Mitsubishi Electric Corporation Noise removal device and noise removal program
JP2013541023A (ja) * 2010-12-07 2013-11-07 ミツビシ・エレクトリック・リサーチ・ラボラトリーズ・インコーポレイテッド 試験音声信号の雑音を除去する結果として試験雑音除去音声信号内で減衰したスペクトル成分を復元するための方法
CN113454716A (zh) * 2018-12-20 2021-09-28 诺基亚技术有限公司 用于控制降噪的装置、方法和计算机程序

Also Published As

Publication number Publication date
JP3909709B2 (ja) 2007-04-25
US20080306734A1 (en) 2008-12-11
US20050203735A1 (en) 2005-09-15
US7797154B2 (en) 2010-09-14

Similar Documents

Publication Publication Date Title
US7797154B2 (en) Signal noise reduction
JP5666444B2 (ja) 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法
US8073689B2 (en) Repetitive transient noise removal
Viikki et al. Cepstral domain segmental feature vector normalization for noise robust speech recognition
Ghanbari et al. A new approach for speech enhancement based on the adaptive thresholding of the wavelet packets
JP4532576B2 (ja) 処理装置、音声認識装置、音声認識システム、音声認識方法、及び音声認識プログラム
US7313518B2 (en) Noise reduction method and device using two pass filtering
US8326621B2 (en) Repetitive transient noise removal
JP4705414B2 (ja) 音声認識装置、音声認識方法、音声認識プログラムおよび記録媒体
JP2011033717A (ja) 雑音抑圧装置
Alam et al. Robust feature extraction based on an asymmetric level-dependent auditory filterbank and a subband spectrum enhancement technique
Wolfel Enhanced speech features by single-channel joint compensation of noise and reverberation
JP3907194B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
Seltzer et al. Robust bandwidth extension of noise-corrupted narrowband speech.
WO2006114101A1 (en) Detection of speech present in a noisy signal and speech enhancement making use thereof
KR20110061781A (ko) 실시간 잡음 추정에 기반하여 잡음을 제거하는 음성 처리 장치 및 방법
JP2009276365A (ja) 処理装置、音声認識装置、音声認識システム、音声認識方法
JPH10133688A (ja) 音声認識装置
JP4058521B2 (ja) 背景雑音歪みの補正処理方法及びそれを用いた音声認識システム
Cerisara et al. α-Jacobian environmental adaptation
KR20090111739A (ko) 잡음 제거 장치 및 방법
JP2007058237A (ja) 雑音除去方法
JP4173978B2 (ja) 雑音除去装置、及び、音声認識装置、並びに音声通信装置
Shozakai et al. A speech enhancement approach E-CMN/CSS for speech recognition in car environments
Prasad et al. Two microphone technique to improve the speech intelligibility under noisy environment

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061121

TRDD Decision of grant or rejection written
RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20061220

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070118

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110202

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120202

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees