JPWO2006082636A1 - 信号処理方法および信号処理装置 - Google Patents

信号処理方法および信号処理装置 Download PDF

Info

Publication number
JPWO2006082636A1
JPWO2006082636A1 JP2007501472A JP2007501472A JPWO2006082636A1 JP WO2006082636 A1 JPWO2006082636 A1 JP WO2006082636A1 JP 2007501472 A JP2007501472 A JP 2007501472A JP 2007501472 A JP2007501472 A JP 2007501472A JP WO2006082636 A1 JPWO2006082636 A1 JP WO2006082636A1
Authority
JP
Japan
Prior art keywords
noise
spectrum
section
signal
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007501472A
Other languages
English (en)
Other versions
JP4519169B2 (ja
Inventor
光良 松原
光良 松原
猛 大谷
猛 大谷
遠藤 香緒里
香緒里 遠藤
大田 恭士
恭士 大田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2006082636A1 publication Critical patent/JPWO2006082636A1/ja
Application granted granted Critical
Publication of JP4519169B2 publication Critical patent/JP4519169B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Noise Elimination (AREA)

Abstract

雑音レベルの急増区間において推定雑音の追従速度を高めつつ、且つ音声区間において音声の影響による雑音スペクトルの推定誤差が生じ難いような信号処理方法及び装置を提供するため、入力信号の標本化データである時間領域信号を抽出し、フレーム毎に、該時間領域信号を周波数領域信号に変換して入力スペクトルを算出し、さらに、該入力スペクトルの極小値を求めて該入力音声信号に含まれる雑音成分の周波数領域信号である雑音スペクトルを推定する。さらには、入力スペクトルと雑音スペクトルとを比較して、雑音区間か、又は雑音と音声の混在区間かを判定する。

Description

本発明は、信号処理方法および信号処理装置に関し、特に、例えば、ディジタル携帯電話等で用いられるノイズキャンセラやVAD等の音声信号処理に必要な方法および装置に関するものである。
ディジタル方式携帯電話等において、通話音声中の背景雑音を抑圧して音声を聞こえ易くする技術としてノイズキャンセラがある。また、入力信号について、音声の有無に応じて送信出力のON/OFFを行うことで送信部の省電力化を図る技術としてVADがある。これらノイズキャンセラやVAD等では通話中に音声が存在する区間もしくは音声が存在しない区間を判定する必要がある。
区間判定の方法として、例えば、過去において算出した電力の長期平均を雑音の電力とみなし、これと現区間の電力とを比較して、現区間の電力の大きい区間を音声区間と判定するという方法がある。しかしながら、このような単純な電力の比較だけでは、背景雑音レベルが大きく信号対雑音比SNRnが小さい場合に、音声を雑音と誤判定してしまう場合がある。
この対策として音声の周波数領域信号を利用して、区間判定を行う手法が提案されている(例えば、特許文献1参照。)。以下にこの技術を説明する。
入力信号について、一定期間毎に時間−周波数変換を行い、入力信号の周波数領域信号(以降、入力スペクトルと称する。)を算出する。ここで、過去において算出した入力スペクトルの長期平均を雑音のスペクトル(以降、平均雑音スペクトルと称する。)とみなす。この平均雑音スペクトルと入力スペクトルについて帯域別の信号対雑音比SNRnを算出し、所望の帯域において帯域別の信号対雑音比SNRnの平均値、正(負)変動量、分散値などを算出する。そして、これらの値を用いて区間判定を行う。また、上記区間判定により雑音区間と判定された場合のみ、入力スペクトルを用いて平均雑音スペクトルの更新を行う。以上のようにして、より精度の高い区間判定を実現しようとするものである。
特開2001−265367
しかしながら、特許文献1に記載されているような従来の技術では、雑音区間のみで平均雑音スペクトルの更新を行うため、雑音レベルが急激に増大した場合に雑音区間を音声区間と誤判定し、その後の平均雑音スペクトルの更新が行われず、誤判定を継続してしまうという問題がある。
これを回避するために、特許文献1には区間判定結果によらず、帯域別の信号対雑音比SNRnの値に応じて雑音更新の時定数を制御し雑音更新を行う、という方法も開示されている。
しかしながら、音声区間において平均雑音スペクトルの更新を行うと、少なからず音声の影響により平均雑音スペクトルが過大評価されてしまうため、小レベルの音声区間が雑音区間と誤判定され易くなるという新たな問題が生じる。
本発明は上記のような課題を解決するためになされたもので、雑音レベルの急増区間において推定雑音の追従速度を高めつつ、且つ信号区間において音声の影響による雑音スペクトルの推定誤差が生じ難いような信号処理方法及び装置を提供することを目的とする。
(1)上記の目的を達成するため、本発明に係る信号処理方法は、入力信号の標本化データである時間領域信号を抽出する時間領域信号抽出ステップと、フレーム毎に、該時間領域信号を周波数領域信号に変換して入力スペクトルを算出する周波数領域信号分析ステップと、該入力スペクトルの極小成分を利用して、該入力信号に含まれる雑音成分の周波数領域信号である雑音スペクトルを推定するステップとを含むことを特徴としている。これを、図を参照して説明する。
まず、図1のような入力信号(雑音重畳音声)を例とした場合、図中の区間(i)、(iv)は「雑音のみの区間」(以下、雑音区間と称する。)であり、区間(iii)で雑音レベルの急増が生じている。区間(ii)、(v)は「音声と雑音の混在区間」(以下、混在区間と称する。)である。図2に上記の区間(i)、(ii)、(iv)、(v)の各区間における典型的な入力スペクトルを示す。
また、図2の区間(i)と区間(ii)の入力スペクトルAを比較すると、区間(ii)の「音声と雑音の混在区間」において、入力スペクトルAの極小部分(図中の黒丸部分)は重畳雑音によりマスクされており雑音の寄与度が高いので、区間(i)の「雑音のみの区間」の入力スペクトルの極小部分の値と同等となる。これは、雑音レベルが増加した場合でも同様で、区間(iv)の「雑音のみの区間」と区間(v)の「音声と雑音の混在区間」のスペクトルの極小部分の値は同等となる。以下の説明では、入力スペクトルの極小部分を直線で結んで、図2に示す如く極小スペクトルBと称する。
このような原理に基づき、本発明では、時間領域信号抽出ステップと周波数領域信号分析ステップにおいて、所定区間の時間領域の入力信号から周波数領域信号である入力スペクトルAを算出する。そして、雑音推定ステップにおいて、この入力スペクトルAの極小値を用いて、極小スペクトルBを求め、現フレーム中の雑音成分の周波数領域信号である雑音スペクトルを推定する。
このように、本発明ではこのスペクトルの極小部分を利用して推定雑音を算出することで、音声信号の影響による雑音スペクトルの推定誤差が生じ難く、且つ雑音レベルの急増区間においても推定雑音の追従速度を高めることが可能となる。
(2)上記(1)において、該雑音推定ステップでは、該雑音スペクトルとして、フレーム毎の瞬時雑音スペクトルを求めることができる。
従って、雑音スペクトルの推定ステップはフレーム内で閉じているので、より応答性の高い雑音の推定が可能となる。また、比較的小規模の回路構成での実装が可能となる。
(3)上記(1)において、該雑音推定ステップでは、該雑音スペクトルとして、該瞬時雑音スペクトルの複数のフレームにわたる平均雑音スペクトルを求めることができる。
これにより、推定された雑音スペクトルは、長時間平均されることとなり、より安定した雑音の推定が可能となる。
(4)上記(1)乃至(3)のいずれか1つにおいて、該雑音スペクトルと該入力スペクトルとを比較して、それぞれのフレームが音声と雑音の混在した区間又は音声を含まない雑音区間の何れであるかを判定する区間判定ステップを更に含むことができる。
すなわち、図1および図2に示したように、入力スペクトルAと、極小スペクトルBに基づく瞬時雑音スペクトルを比較することによって、混在区間と雑音区間を特定でき、雑音抑圧と省電力に優れたシステムを構築できる。
(5)上記(4)において、該雑音推定ステップでは、前フレームまでの該区間判定ステップでの判定結果が該混在区間を示しているときには、該瞬時雑音スペクトルを用いて該平均雑音スペクトルを求め、該雑音区間を示しているときには該入力スペクトルを用いて該平均雑音スペクトルを求めることができる。
すなわち、該区間判定ステップでの前フレームまでの判定結果が、該混在区間を示しているときには、上記のとおり、該瞬時雑音スペクトルを用いて該平均雑音スペクトルを求めるが、該判定結果が該雑音区間を示しているときには、該瞬時雑音スペクトルを用いる必要はなく、該入力スペクトルを用いればよいので、この入力スペクトルに基づいて該平均雑音スペクトルを求めることになる。
(6)上記(4)において、該区間判定ステップでの判定結果を考慮し、さらに該雑音スペクトルと該入力スペクトルに基づき該入力信号に対する抑圧量を帯域毎に算出して該入力信号の雑音抑圧を行う抑圧量算出ステップをさらに含むことができる。
これにより、入力信号に対する抑圧量を雑音スペクトルと入力スペクトルに基づいて算出するが、この抑圧量を該区間判定ステップでの判定結果を考慮して、例えば該混在区間の場合には抑圧量を小さくし、該雑音区間の場合には抑圧量を大きくすれば、より効果的な雑音抑圧が可能となる。
これにより、応答性と安定性のバランスの取れた雑音推定が可能となる。
(7)上記(1)乃至(6)のいずれかにおいて、該入力信号は、音声信号でもよい。この場合、実効ある応用が提供される。
なお、本発明では、上記(1)乃至(7)に記載の信号処理方法を、それぞれ実施する為の信号処理装置を実現する事ができる。
本発明によれば、雑音レベルの急増区間において推定雑音の追従速度を高めつつ、混在区間において音声の影響による雑音スペクトルの推定誤差を低減し、正確な区間判定を行うことができる。
以下、図面を参照して、本発明の実施形態を説明する。
第1の実施形態
図3は、本発明の第1の実施形態による雑音推定装置及び雑音区間判定装置として機能する信号処理装置を示す構成ブロック図である。この信号処理装置は、時間領域信号抽出部1と、周波数領域信号分析部2と、雑音推定装置3aと、区間判定装置4aとで構成されている。以下に各ブロックの詳細を説明する。
時間領域信号抽出部1は、アナログの入力音声信号を量子化し、単位時間(フレーム)毎の標本化データとしての時間領域信号xn(k)を抽出する(ここで、nはフレーム番号を表す。)。また、周波数領域信号分析部2は、時間領域信号xn(k)について、例えばFFT(高速フーリエ変換)などを用いて周波数分析を行い、入力信号のスペクトル振幅である入力スペクトルXn(f)(図2の入力スペクトルAに対応)を算出する。ここで、FFTについては「ディジタル信号処理シリーズ第1巻 ディジタル信号処理(辻井、鎌田)、 94〜120頁、昭晃堂」や「 コンピュータ音楽(Curtis Roads著、青柳他訳・監修) 452〜457頁、東京電機大学出版局」等で詳細に説明されている。
なお、入力スペクトルXn(f)を複数の帯域に分割し、それぞれの帯域で重み付け平均等により算出した帯域スペクトルを入力スペクトルの代わりに用いても良い。
また、BPF(バンドパスフィルタ)により算出した帯域別入力振幅
Figure 2006082636
を入力スペクトルXn(f)の代わりに用いることができる。ここで、帯域別入力振幅
Figure 2006082636
は以下の手順により算出する。
先ず、次式より、入力信号xn(t)を帯域信号
Figure 2006082636
に分割する。
Figure 2006082636
次に、次式より、フレーム毎に帯域別入力振幅
Figure 2006082636
を算出する。
Figure 2006082636
以上のようにして求めた入力スペクトルを、雑音推定装置3aと区間判定装置4aへの入力とする。
雑音推定装置3aは、瞬時雑音推定部31を備えている。この瞬時雑音推定部31では、周波数領域信号分析部2で算出した入力スペクトルXn(f)の概形から現フレーム中の雑音のスペクトルである瞬時雑音スペクトルNn(f)を推定する。ここで、瞬時雑音スペクトルNn(f)は以下の手順により算出する。
先ず、入力スペクトルXn(f)からスペクトルの極小値mn(k)を選択する。例えば、以下のような条件式を満たす入力スペクトルXn(f)を極小値mn(k)として選択する。
Figure 2006082636
次に、極小値mn(k)より極小スペクトルMn(f)(図2の極小スペクトルBに対応)を算出する。ここで、k番目の極小値mn(k)の周波数をfとすると、極小スペクトルMn(f)は極小値mn(k)とfの関数で表せる。例えば極小スペクトルMn(f)が、図4に示すような関数である時、極小スペクトルMn(f)は次式で表せる。
Figure 2006082636
なお、図4では極小スペクトルMn(f)の算出に非線形関数を用いた例を示したが、高次多項式や線形関数等を用いてもよい。
次に、このようにして求めた極小スペクトルMn(f)を用いて瞬時雑音スペクトルNn(f)を算出する。ここで、瞬時雑音スペクトルNn(f)は、極小スペクトルMn(f)に補正係数αn(f)を加算、もしくは乗算することにより算出することができる。
ここで補正係数αn(f)は、事前に実際の雑音から(雑音の分散等を考慮して)経験的に求めておいた定数でも良く、フレーム毎に算出した変数でも良い。以下に、αn(f)が変数である場合を、算出例1及び算出例2として示す。
算出例1としては、後段の雑音/音声判定部42で雑音と判定された過去の区間において入力スペクトルXn(f)の分散値σn(f)を算出しておき、この分散値σn(f)より補正係数αn(f)を算出する。ここで分散値σn(f)は周波数帯域毎に算出しても良く、または、或る特定の帯域における重み付け平均等により算出しても良い。
分散値σn(f)による補正係数αn(f)の算出の一例として、次のような計算式を用いることができる。
Figure 2006082636
ここで、係数γn(f)は、実験的に求められる経験値である。
算出例2としては、入力スペクトルXn(f)と極小スペクトルMn(f)との比の積分値Rxmnに応じて算出する。ここで、積分値Rxmnは次式で表せる。
Figure 2006082636
ここで、積分値Rxmnは図5の斜線領域の面積に対応し、同図(1)に示す雑音区間では小さく、同図(2)に示す音声と雑音の混在区間では大きな値をとる。したがって、補正係数αn(f)を積分値Rxmnの関数として例えば図6のように規定すると、入力信号中の音声信号の寄与度に応じて瞬時雑音算出時の補正係数αn(f)を変化させ、より実態に近い雑音スペクトルを推定することが可能となる。
この時、積分値Rxmnを或る特定の帯域において算出しても良い。またRxm-1、Rxm-2、α-1(f)、α-2(f)は各周波数帯域で異なる値を用いても良く、或る特定の帯域において同じ値を用いても良い。これは、現実の雑音スペクトルに対応するように適宜選択される。
このようにして瞬時雑音推定部31で推定された瞬時雑音スペクトルNn(f)は雑音推定装置3aから出力される。
これと共に瞬時雑音スペクトルNn(f)は区間判定装置4aに送られる。区間判定装置4aは、雑音/音声判定用パラメータ算出部41aと雑音/音声判定部42とを備えている。雑音/音声判定用パラメータ算出部41aでは、瞬時雑音推定部31にて算出した瞬時雑音スペクトルNn(f)と、周波数領域信号分析部2からの入力スペクトルXn(f)を用いて区間判定用のパラメータを算出する。
この区間判定用のパラメータとしては、例えば入力スペクトルXn(f)から入力信号の電力を算出し、瞬時雑音スペクトルNn(f)から瞬時雑音の電力を算出する。そして各電力から算出した信号対雑音比SNRnを区間判定用のパラメータとして利用する。または、入力スペクトルXn(f)と瞬時雑音スペクトルNn(f)より算出した帯域毎の信号対雑音比の積分値Rn等を、区間判定用のパラメータとして用いてもよい。ここで、積分値Rnは次式で表せる。
Figure 2006082636
なお、積分値Rnを求める周波数の積分範囲を、或る特定の帯域に限定して算出しても良い。
雑音/音声判定部42では、雑音/音声判定用パラメータ算出部41aにて算出した区間判定用パラメータと閾値とを比較することにより区間判定を行い、判定結果vad_flagを出力する。すなわち、判定結果vad_flagがFALSEなら、そのフレームが音声を含む混在区間であることを意味し、判定結果vad_flagがTRUEなら、そのフレームが音声を含まない雑音区間であることを意味する。
ここで、区間判定用パラメータとしては、雑音/音声判定用パラメータ算出部41aで算出した信号対雑音比SNRnまたは積分値Rnを用いる。より効果的な実装としては、雑音/音声判定用パラメータ算出部41aを、信号対雑音比SNRn及び積分値Rnの両方を算出するように構成し、信号対雑音比SNRn及び積分値Rnの両方の関数として、区間判定用パラメータを計算し、判定に利用することもできる。
第2の実施形態
図7は、本発明の第2の実施形態により雑音推定装置及び雑音区間判定装置として機能する信号処理装置を示す。この信号処理装置は、第1の実施形態による信号処理装置と同様に、時間領域信号抽出部1と、周波数領域信号分析部2と、雑音推定装置3bと、区間判定装置4bとで構成されている。ただし、ここでは、第1の実施形態のように、瞬時雑音スペクトルをそのまま推定雑音スペクトルとするのではなく、これを用いて、平均雑音スペクトルを算出し、この平均雑音スペクトルを推定雑音スペクトルとして出力している。なお、図3と同じ番号のブロックについては第1の実施形態と同様であり、ここでの説明は省略する。
すなわち、雑音推定装置3bにおいて、平均雑音推定部32bは、瞬時雑音推定部31で算出した瞬時雑音スペクトルNn(f)を用いて、平均雑音スペクトル
Figure 2006082636
を算出する。以下に平均雑音スペクトル
Figure 2006082636
の具体例として、算出例1および算出例2を示す。
算出例1としては、FIRフィルタを用いて算出する。この時、平均雑音スペクトル
Figure 2006082636
は現フレームも含めた過去Kフレーム分の瞬時雑音スペクトルNn(f)の重み付け平均により算出する。これは次式で表せる。
Figure 2006082636
ここで、重み係数βn(f)は、周波数毎に異なる値に設定しても良い。
算出例2としては、IIRフィルタにより算出する。この時、平均雑音スペクトル
Figure 2006082636
は瞬時雑音スペクトルNn(f)の長時間平均により算出する。これは次式で表せる。
Figure 2006082636
ここでも、重み係数λn(f)を、周波数毎に異なる値に設定しても良い。
このようにして平均雑音推定部32bにて求めた平均雑音スペクトル
Figure 2006082636
を受けた雑音/音声判定用パラメータ算出部41bでは、第1の実施形態の雑音/音声判定用パラメータ算出部41aに記載の信号対雑音比SNRnや帯域毎の信号対雑音比の積分値Rnを、瞬時雑音スペクトルNn(f)の代わりに平均雑音スペクトル
Figure 2006082636
を用いて同様に算出すればよい。この後の雑音/音声判定部42での処理は第1の実施形態と同様である。
第3の実施形態
図8は、本発明の第3の実施形態により雑音推定装置及び雑音区間判定装置として機能する信号処理装置を示す。この信号処理装置は、第1の実施形態による信号処理装置と同様に、時間領域信号抽出部1と、周波数領域信号分析部2と、雑音推定装置3cと、区間判定装置4cとを備えている。ただし、第2の実施形態との違いは、雑音区間と判定された区間の入力スペクトルを、そのまま、次のフレームにおける平均雑音スペクトルの算出に利用する点にある。なお、図3と同じ番号のブロックについては第1の実施形態と同様であり、ここでの説明は省略する。
平均雑音推定部32cでは、平均雑音スペクトル
Figure 2006082636
を算出する。ここでは、平均雑音スペクトル
Figure 2006082636
を算出するに当たり、まず区間判定装置4cにおいて入力スペクトルXn(f)と前フレームまでに算出した平均雑音スペクトル
Figure 2006082636
を用いて区間判定を行う。
この結果、混在区間と判定(vad_flag=FALSE)された区間では瞬時雑音スペクトルNn(f)を用いて平均雑音スペクトル
Figure 2006082636
の算出を行い、雑音区間と判定(vad_flag=TRUE)された区間では入力スペクトルXn(f)を用いて平均雑音スペクトル
Figure 2006082636
の算出を行う。
すなわち、判定結果が雑音区間を示しているときには、入力信号が雑音成分そのものであるので、上記のように瞬時雑音スペクトルを用いず入力スペクトルを用いればよい。
雑音/音声判定用パラメータ算出部41cでは、第1の実施形態の雑音/音声判定用パラメータ算出部41aで算出された信号対雑音比SNRnや帯域毎の信号対雑音比の積分値Rnを、瞬時雑音スペクトルNn(f)の代わりに平均雑音推定部32cにて前フレームまでに算出した平均雑音スペクトル
Figure 2006082636
を用いて算出する。
第4の実施形態(雑音抑圧装置)
図9は、本発明の第4の実施形態により雑音抑圧装置として機能する信号処理装置を示す。この雑音抑圧装置は、第1の実施形態による信号処理装置で既に説明した時間領域信号抽出部1と、周波数領域信号分析部2と雑音推定装置3aと区間判定装置4aを有している。そして、この第4の実施形態による雑音抑圧装置では、更に、抑圧量算出部5と抑圧部6と時間領域信号合成部7とをさらに備えている。
まず、周波数領域信号分析部2にてFFTを用いて、入力スペクトルXn(f)を生成する。そして、抑圧量算出部5では、周波数領域信号分析部2で算出した入力スペクトルXn(f)と瞬時雑音推定部31で算出した瞬時雑音スペクトルNn(f)を用いて帯域毎の抑圧係数Gn(f)を算出する。ここで、抑圧係数Gn(f)は次式より算出する。
Figure 2006082636
なお、この式(10)における係数Wn(f)は、雑音/音声判定部42での判定結果vad_flagが混在区間を示しているときには、係数Wn(f)を小さいものとし、雑音区間を示しているときには、係数Wn(f)を大きく取ることにより、雑音区間での抑圧係数を混在区間のものより大きくすることができる。従って、抑圧量を増加させることができる。
抑圧部6では、抑圧量算出部5で算出した抑圧係数Gn(f)と入力スペクトルXn(f)とを用いて雑音抑圧後の帯域毎の振幅スペクトルYn(f)を算出する。ここで、振幅スペクトルYn(f)は次式より算出する。
Figure 2006082636
時間領域信号合成部7では、振幅スペクトルYn(f)をIFFT(逆高速フーリェ変換)により周波数領域から時間領域に逆変換し、出力信号yn(t)を算出する。
ここで、図9では、雑音推定装置3a及び区間判定装置4aとして、第1の実施形態に示したものを用いているが、これらの雑音推定装置3a及び区間判定装置4aは第2の実施形態、もしくは第3の実施形態に示したものでも良い。この時、抑圧量算出部5では、瞬時雑音スペクトルNn(f)の代わりに平均雑音スペクトル
Figure 2006082636
を用いて抑圧係数Gn(f)を算出する。
以上、本発明を実施例により詳細に説明したが、当業者にとっては、本発明が本願中に説明した実施例に限定されるものではないということは明らかである。本発明の装置は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。
例えば、本発明の第4の実施形態による雑音抑圧装置において、FFTにより算出した入力スペクトルXn(f)に代えて、FIRフィルタにより算出した帯域別入力振幅
Figure 2006082636
を用いる場合、IFFTに代えて、帯域別入力振幅に対応した逆変換を用いて、時間領域の出力信号yn(t)を算出することができる。
本発明の原理を説明するために、入力音声信号の変化を区間毎に示した波形図である。 図1の入力音声信号のスペクトルを、それぞれの区間毎に示したスペクトル図である。 本発明の第1の実施形態による信号処理装置を示す構成ブロック図である。 本発明の第1の実施形態による信号処理装置で算出された極小スペクトルの例を示すスペクトル図である。 本発明の第1の実施形態による信号処理装置で算出された極小スペクトルへ乗算する補正係数の算出を説明するためのスペクトル図である。 本発明の第1の実施形態による信号処理装置で算出された極小スペクトルへ乗算する補正係数の算出を説明するための関係図である。 本発明の第2の実施形態による信号処理装置を示す構成ブロック図である。 本発明の第3の実施形態による信号処理装置を示す構成ブロック図である。 本発明の第4の実施形態により雑音抑圧装置として機能する信号処理装置を示す構成ブロック図である。
符号の説明
1 時間領域信号抽出部
2 周波数領域信号分析部
3a、3b、3c 雑音推定装置
4a、4b、4c 区間判定装置
5 抑圧量算出部
7 時間領域信号合成部
31 瞬時雑音推定部
32b、32c 平均雑音推定部
41a、41b、41c 音声判定用パラメータ算出部
42 雑音/音声判定部
図中、同一符号は同一又は相当部分を示す。

Claims (14)

  1. 入力信号の標本化データである時間領域信号を抽出する時間領域信号抽出ステップと、
    フレーム毎に、該時間領域信号を周波数領域信号に変換して入力スペクトルを算出する周波数領域信号分析ステップと、
    該入力スペクトルの極小成分を利用して、該入力信号に含まれる雑音成分の周波数領域信号である雑音スペクトルを推定する雑音推定ステップと、
    を含むことを特徴とする信号処理方法。
  2. 請求項1において、
    該雑音推定ステップが、該雑音スペクトルとして、フレーム毎の瞬時雑音スペクトルを求めることを特徴とした信号処理方法。
  3. 請求項2において、
    該雑音推定ステップが、該雑音スペクトルとして、該瞬時雑音スペクトルの複数のフレームにわたる平均雑音スペクトルを求めることを特徴とした信号処理方法。
  4. 請求項1乃至3のいずれか1つにおいて、
    該雑音スペクトルと該入力スペクトルとを比較して、それぞれのフレームが音声と雑音の混在した区間又は音声を含まない雑音区間の何れであるかを判定する区間判定ステップを更に含むことを特徴とした信号処理方法。
  5. 請求項4において、
    該雑音推定ステップが、前フレームまでの該区間判定ステップでの判定結果が該混在区間を示しているときには、該瞬時雑音スペクトルを用いて該平均雑音スペクトルを求め、該雑音区間を示しているときには該入力スペクトルを用いて該平均雑音スペクトルを求めることを特徴とした信号処理方法。
  6. 請求項4において、
    該区間判定ステップでの判定結果を考慮し、さらに該雑音スペクトルと該入力スペクトルに基づき該入力信号に対する抑圧量を帯域毎に算出して該入力信号の雑音抑圧を行う抑圧量算出ステップをさらに含むことを特徴とした信号処理方法。
  7. 請求項1乃至6のいずれか1つにおいて、
    該入力信号が、音声信号であることを特徴とした信号処理方法。
  8. 入力信号の標本化データである時間領域信号を抽出する時間領域信号抽出部と、
    フレーム毎に、該時間領域信号を周波数領域信号に変換して入力スペクトルを算出する周波数領域信号分析部と、
    該入力スペクトルの極小成分を利用して、該入力信号に含まれる雑音成分の周波数領域信号である雑音スペクトルを推定する雑音推定部と、
    を含むことを特徴とする信号処理装置。
  9. 請求項8において、
    該雑音推定部が、該雑音スペクトルとして、フレーム毎の瞬時雑音スペクトルを求めることを特徴とした信号処理装置。
  10. 請求項9において、
    該雑音推定部が、該雑音スペクトルとして、該瞬時雑音スペクトルの複数のフレームにわたる平均雑音スペクトルを求めることを特徴とした信号処理装置。
  11. 請求項8乃至10のいずれか1つにおいて、
    該雑音スペクトルと該入力スペクトルとを比較して、それぞれのフレームが音声と雑音の混在した区間又は音声を含まない雑音区間の何れであるかを判定する区間判定部を更に含むことを特徴とした信号処理装置。
  12. 請求項11において、
    該雑音推定部が、前フレームまでの該区間判定部での判定結果が該混在区間を示しているときには、該瞬時雑音スペクトルを用いて該平均雑音スペクトルを求め、該雑音区間を示しているときには該入力スペクトルを用いて該平均雑音スペクトルを求めることを特徴とした信号処理装置。
  13. 請求項11において、
    該区間判定部での判定結果を考慮し、さらに該雑音スペクトルと該入力スペクトルに基づき該入力信号に対する抑圧量を帯域毎に算出して該入力信号の雑音抑圧を行う抑圧量算出部をさらに含むことを特徴とした信号処理装置。
  14. 請求項8乃至13のいずれか1つにおいて、
    該入力信号が、音声信号であることを特徴とした信号処理装置。
JP2007501472A 2005-02-02 2005-02-02 信号処理方法および信号処理装置 Expired - Fee Related JP4519169B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2005/001515 WO2006082636A1 (ja) 2005-02-02 2005-02-02 信号処理方法および信号処理装置

Publications (2)

Publication Number Publication Date
JPWO2006082636A1 true JPWO2006082636A1 (ja) 2008-06-26
JP4519169B2 JP4519169B2 (ja) 2010-08-04

Family

ID=36777031

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007501472A Expired - Fee Related JP4519169B2 (ja) 2005-02-02 2005-02-02 信号処理方法および信号処理装置

Country Status (5)

Country Link
US (1) US20070265840A1 (ja)
EP (1) EP1845520A4 (ja)
JP (1) JP4519169B2 (ja)
CN (1) CN100593197C (ja)
WO (1) WO2006082636A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080084829A1 (en) * 2006-10-05 2008-04-10 Nokia Corporation Apparatus, method and computer program product providing link adaptation
WO2009035613A1 (en) * 2007-09-12 2009-03-19 Dolby Laboratories Licensing Corporation Speech enhancement with noise level estimation adjustment
JP2011100029A (ja) * 2009-11-06 2011-05-19 Nec Corp 信号処理方法、情報処理装置、及び信号処理プログラム
US8744068B2 (en) * 2011-01-31 2014-06-03 Empire Technology Development Llc Measuring quality of experience in telecommunication system
PL2676266T3 (pl) 2011-02-14 2015-08-31 Fraunhofer Ges Forschung Układ kodowania na bazie predykcji liniowej wykorzystujący kształtowanie szumu w dziedzinie widmowej
PL2676268T3 (pl) 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
AU2012217158B2 (en) 2011-02-14 2014-02-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
AR085895A1 (es) * 2011-02-14 2013-11-06 Fraunhofer Ges Forschung Generacion de ruido en codecs de audio
CN103493129B (zh) 2011-02-14 2016-08-10 弗劳恩霍夫应用研究促进协会 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法
PT2676267T (pt) 2011-02-14 2017-09-26 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
JP6160045B2 (ja) 2012-09-05 2017-07-12 富士通株式会社 調整装置および調整方法
CN103440870A (zh) * 2013-08-16 2013-12-11 北京奇艺世纪科技有限公司 一种音频降噪方法及装置
JP6059130B2 (ja) * 2013-12-05 2017-01-11 日本電信電話株式会社 雑音抑圧方法とその装置とプログラム
CN105791530B (zh) * 2014-12-26 2019-04-16 联芯科技有限公司 输出音量调节方法和装置
TWI684912B (zh) * 2019-01-08 2020-02-11 瑞昱半導體股份有限公司 語音喚醒裝置及方法
CN114285505A (zh) * 2021-12-16 2022-04-05 重庆会凌电子新技术有限公司 一种自动噪底计算方法和系统
CN115291151B (zh) * 2022-09-28 2023-01-13 中国科学院精密测量科学与技术创新研究院 一种基于低相关分段的高精度磁共振信号频率测量方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06208395A (ja) * 1992-10-30 1994-07-26 Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho ホルマント検出装置及び音声加工装置
JPH07248793A (ja) * 1994-03-08 1995-09-26 Mitsubishi Electric Corp 雑音抑圧音声分析装置及び雑音抑圧音声合成装置及び音声伝送システム
JP2000082999A (ja) * 1998-09-07 2000-03-21 Nippon Telegr & Teleph Corp <Ntt> 雑音低減処理方法、その装置及びプログラム記憶媒体
JP2003280696A (ja) * 2002-03-19 2003-10-02 Matsushita Electric Ind Co Ltd 音声強調装置及び音声強調方法

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3027389B2 (ja) * 1990-03-26 2000-04-04 株式会社リコー 2値化パターン生成方式
FR2704111B1 (fr) * 1993-04-16 1995-05-24 Sextant Avionique Procédé de détection énergétique de signaux noyés dans du bruit.
SE505156C2 (sv) * 1995-01-30 1997-07-07 Ericsson Telefon Ab L M Förfarande för bullerundertryckning genom spektral subtraktion
JP3484801B2 (ja) * 1995-02-17 2004-01-06 ソニー株式会社 音声信号の雑音低減方法及び装置
KR970011336B1 (ko) * 1995-03-31 1997-07-09 삼성코닝 주식회사 접착용 유리조성물
FI100840B (fi) * 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
JPH09212196A (ja) * 1996-01-31 1997-08-15 Nippon Telegr & Teleph Corp <Ntt> 雑音抑圧装置
JPH09311696A (ja) * 1996-05-21 1997-12-02 Nippon Telegr & Teleph Corp <Ntt> 自動利得調整装置
JP3250604B2 (ja) * 1996-09-20 2002-01-28 日本電信電話株式会社 音声認識方法および装置
JP3418855B2 (ja) * 1996-10-30 2003-06-23 京セラ株式会社 雑音除去装置
US6104993A (en) * 1997-02-26 2000-08-15 Motorola, Inc. Apparatus and method for rate determination in a communication system
US7072831B1 (en) * 1998-06-30 2006-07-04 Lucent Technologies Inc. Estimating the noise components of a signal
US7209567B1 (en) * 1998-07-09 2007-04-24 Purdue Research Foundation Communication system with adaptive noise suppression
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
JP3454190B2 (ja) * 1999-06-09 2003-10-06 三菱電機株式会社 雑音抑圧装置および方法
FR2797343B1 (fr) * 1999-08-04 2001-10-05 Matra Nortel Communications Procede et dispositif de detection d'activite vocale
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
JP3325248B2 (ja) * 1999-12-17 2002-09-17 株式会社ワイ・アール・ピー高機能移動体通信研究所 音声符号化パラメータの取得方法および装置
JP4282227B2 (ja) * 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
US7171357B2 (en) * 2001-03-21 2007-01-30 Avaya Technology Corp. Voice-activity detection using energy ratios and periodicity
US6820054B2 (en) * 2001-05-07 2004-11-16 Intel Corporation Audio signal processing for speech communication
JP4058987B2 (ja) * 2002-04-15 2008-03-12 三菱電機株式会社 雑音除去装置及び雑音除去方法
EP1681670A1 (en) * 2005-01-14 2006-07-19 Dialog Semiconductor GmbH Voice activation
JP4670483B2 (ja) * 2005-05-31 2011-04-13 日本電気株式会社 雑音抑圧の方法及び装置
US7366658B2 (en) * 2005-12-09 2008-04-29 Texas Instruments Incorporated Noise pre-processor for enhanced variable rate speech codec

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06208395A (ja) * 1992-10-30 1994-07-26 Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho ホルマント検出装置及び音声加工装置
JPH07248793A (ja) * 1994-03-08 1995-09-26 Mitsubishi Electric Corp 雑音抑圧音声分析装置及び雑音抑圧音声合成装置及び音声伝送システム
JP2000082999A (ja) * 1998-09-07 2000-03-21 Nippon Telegr & Teleph Corp <Ntt> 雑音低減処理方法、その装置及びプログラム記憶媒体
JP2003280696A (ja) * 2002-03-19 2003-10-02 Matsushita Electric Ind Co Ltd 音声強調装置及び音声強調方法

Also Published As

Publication number Publication date
WO2006082636A1 (ja) 2006-08-10
EP1845520A1 (en) 2007-10-17
CN101111888A (zh) 2008-01-23
JP4519169B2 (ja) 2010-08-04
EP1845520A4 (en) 2011-08-10
CN100593197C (zh) 2010-03-03
US20070265840A1 (en) 2007-11-15

Similar Documents

Publication Publication Date Title
JP4519169B2 (ja) 信号処理方法および信号処理装置
JP4836720B2 (ja) ノイズサプレス装置
US8571231B2 (en) Suppressing noise in an audio signal
JP3963850B2 (ja) 音声区間検出装置
EP2008379B1 (en) Adjustable noise suppression system
EP2444966B1 (en) Audio signal processing device and audio signal processing method
JP5036874B2 (ja) エコー消去装置
JP2014232331A (ja) アダプティブ・インテリジェント・ノイズ抑制システム及び方法
JP2001134287A (ja) 雑音抑圧装置
US9343073B1 (en) Robust noise suppression system in adverse echo conditions
EP2234105A1 (en) Background noise estimation
JP6135106B2 (ja) 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
JPWO2006046293A1 (ja) 雑音抑圧装置
JP2014122939A (ja) 音声処理装置および方法、並びにプログラム
WO2014168021A1 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP2004341339A (ja) 雑音抑圧装置
JP2000330597A (ja) 雑音抑圧装置
JP2008309955A (ja) ノイズサプレス装置
JP5086442B2 (ja) 雑音抑圧方法及び装置
WO2017128910A1 (zh) 一种语音出现概率的确定方法、装置及电子设备
EP1278185A2 (en) Method for improving noise reduction in speech transmission
JP2003058186A (ja) 雑音抑圧方法および雑音抑圧装置
KR20070084312A (ko) 적응 시간-기반 잡음 억제
KR20090082700A (ko) 노이지 음성 신호의 처리 장치 및 그 장치를 포함하는 음성기반 어플리케이션 장치
KR20050047374A (ko) 통신 기기용 하이브리드 소음 제거 시스템 및 방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100518

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100518

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4519169

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees