JPWO2013032025A1 - 信号処理装置、信号処理方法、およびコンピュータ・プログラム - Google Patents
信号処理装置、信号処理方法、およびコンピュータ・プログラム Download PDFInfo
- Publication number
- JPWO2013032025A1 JPWO2013032025A1 JP2013531457A JP2013531457A JPWO2013032025A1 JP WO2013032025 A1 JPWO2013032025 A1 JP WO2013032025A1 JP 2013531457 A JP2013531457 A JP 2013531457A JP 2013531457 A JP2013531457 A JP 2013531457A JP WO2013032025 A1 JPWO2013032025 A1 JP WO2013032025A1
- Authority
- JP
- Japan
- Prior art keywords
- signal
- suppression
- unit
- noise
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004590 computer program Methods 0.000 title claims description 5
- 238000003672 processing method Methods 0.000 title claims description 3
- 230000001629 suppression Effects 0.000 claims abstract description 326
- 238000004458 analytical method Methods 0.000 claims abstract description 108
- 238000000034 method Methods 0.000 claims abstract description 33
- 230000008569 process Effects 0.000 claims abstract description 24
- 238000001228 spectrum Methods 0.000 claims description 132
- 230000003595 spectral effect Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 description 74
- 238000010586 diagram Methods 0.000 description 56
- 230000006870 function Effects 0.000 description 27
- 238000006243 chemical reaction Methods 0.000 description 21
- 230000009466 transformation Effects 0.000 description 16
- 238000001514 detection method Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 206010002953 Aphonia Diseases 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 206010010356 Congenital anomaly Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000011410 subtraction method Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Noise Elimination (AREA)
Abstract
[課題]重要な信号成分を残すことにより高品質な信号処理を達成すること。[解決手段]信号処理装置100は、第1信号と第2信号とが混在した混在信号を加工することにより、前記第2信号を抑圧する抑圧部103と、前記抑圧部による抑圧結果を遅延させることによって、過去の抑圧結果を生成する遅延部104と、前記混在信号に含まれる第1信号の重要度を、前記過去の抑圧結果を参照して周波数成分ごとに分析する分析部101と、前記分析部における分析の結果と前記過去の抑圧結果とを参照して、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記第2信号の抑圧を抑制する抑制部102と、を備える。
Description
本発明は、第1信号と第2信号とが混在した混在信号を処理することにより、その第2信号を抑圧する信号処理の技術分野に関する。
雑音抑圧技術(noise suppressing technology)が知られている。雑音抑圧技術は、第1信号と第2信号とが混在した混在信号を処理することにより、その第2信号を抑圧し、これにより強調信号(所望の信号を強調した信号)を出力する技術である。例えば、ノイズサプレッサは、所望の音声信号に重畳されている雑音(ノイズ)を抑圧するシステムであり、携帯電話など様々な音声端末において利用されている。より一般的には、目的とする所望信号に重畳されている目的信号以外の信号を抑圧するシステムであると言える。すなわち、所望信号は音声信号に限定されることはなく、音楽や環境音など任意の信号であってよい。
この種の技術に関し、特許文献1には、入力信号に1より小さな抑圧係数を乗算することによって、ノイズを抑圧する方法が開示されている。特許文献2には、推定された雑音を劣化信号から直接減算することによって、雑音を抑圧する方法が開示されている。
この種の技術に関し、特許文献1には、入力信号に1より小さな抑圧係数を乗算することによって、ノイズを抑圧する方法が開示されている。特許文献2には、推定された雑音を劣化信号から直接減算することによって、雑音を抑圧する方法が開示されている。
しかしながら、上述の特許文献1に開示された構成では、重要な信号か否かに拘わらず、推定した雑音情報を用いて劣化信号中の雑音を抑圧するため、この推定した雑音が過大であるときには、出力が正しい値よりも小さくなる。この場合、ユーザ(人)は、出力を歪として知覚することがある。特に、所望信号のうち、重要な周波数成分に対する処理によって信号品質が劣化してしまう場合には、ユーザは、出力を深刻な音質の劣化として知覚する。
以上を踏まえ、本発明は、上述の課題を解決する信号処理技術を提供することを1つの目的とする。
以上を踏まえ、本発明は、上述の課題を解決する信号処理技術を提供することを1つの目的とする。
上記目的を達成するため、本発明に係る装置は、
第1信号と第2信号とが混在した混在信号を加工することにより、前記第2信号を抑圧する抑圧部と、
前記抑圧部による抑圧結果を遅延させることによって、過去の抑圧結果を生成する遅延部と、
前記混在信号に含まれる第1信号の重要度を、前記過去の抑圧結果を参照して周波数成分ごとに分析する分析部と、
前記分析部における分析の結果と前記過去の抑圧結果とを参照して、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記第2信号の抑圧を抑制する抑制部と、
を備えることを特徴とする。
上記目的を達成するため、本発明に係る方法は、
第1信号と第2信号とが混在した混在信号を加工することにより、前記第2信号を抑圧し、
抑圧結果を遅延させることによって、過去の抑圧結果を生成し、
前記混在信号に含まれる第1信号の重要度を、前記過去の抑圧結果を参照して周波数成分ごとに分析し、
分析の結果と前記過去の抑圧結果とを参照して、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記第2信号の抑圧を抑制する、
ことを特徴とする。
上記目的を達成するため、本発明に係るコンピュータ・プログラムは、
第1信号と第2信号とが混在した混在信号を加工することにより、前記第2信号を抑圧する抑圧処理と、
前記抑圧処理による抑圧結果を遅延させることによって、過去の抑圧結果を生成する遅延処理と、
前記混在信号に含まれる第1信号の重要度を、前記過去の抑圧結果を参照して周波数成分ごとに分析する分析処理と、
前記分析処理における分析の結果と前記過去の抑圧結果とを参照して、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記第2信号の抑圧を抑制する抑制処理と、
をコンピュータに実行させることを特徴とする。
第1信号と第2信号とが混在した混在信号を加工することにより、前記第2信号を抑圧する抑圧部と、
前記抑圧部による抑圧結果を遅延させることによって、過去の抑圧結果を生成する遅延部と、
前記混在信号に含まれる第1信号の重要度を、前記過去の抑圧結果を参照して周波数成分ごとに分析する分析部と、
前記分析部における分析の結果と前記過去の抑圧結果とを参照して、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記第2信号の抑圧を抑制する抑制部と、
を備えることを特徴とする。
上記目的を達成するため、本発明に係る方法は、
第1信号と第2信号とが混在した混在信号を加工することにより、前記第2信号を抑圧し、
抑圧結果を遅延させることによって、過去の抑圧結果を生成し、
前記混在信号に含まれる第1信号の重要度を、前記過去の抑圧結果を参照して周波数成分ごとに分析し、
分析の結果と前記過去の抑圧結果とを参照して、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記第2信号の抑圧を抑制する、
ことを特徴とする。
上記目的を達成するため、本発明に係るコンピュータ・プログラムは、
第1信号と第2信号とが混在した混在信号を加工することにより、前記第2信号を抑圧する抑圧処理と、
前記抑圧処理による抑圧結果を遅延させることによって、過去の抑圧結果を生成する遅延処理と、
前記混在信号に含まれる第1信号の重要度を、前記過去の抑圧結果を参照して周波数成分ごとに分析する分析処理と、
前記分析処理における分析の結果と前記過去の抑圧結果とを参照して、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記第2信号の抑圧を抑制する抑制処理と、
をコンピュータに実行させることを特徴とする。
本発明によれば、重要な信号成分をより正確に残すことが可能となり、高品質な信号処理を達成できる。
以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。
(第1実施形態)
本発明の第1実施形態としての信号処理装置100について、図1を用いて説明する。信号処理装置100は、第1信号と第2信号とが混在した混在信号を加工(処理)することにより、前記第2信号を抑圧する装置である。
図1に示すように、信号処理装置100は、信号分析部(分析部)101と抑圧抑制部(抑制部)102と信号抑圧部(抑圧部)103と遅延部104とを含む。信号分析部101は、混在信号に含まれる第1信号の重要度を周波数成分ごとに分析する。抑圧抑制部102は、分析の結果、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する第2信号の抑圧を抑制する。信号抑圧部103は、混在信号を加工することにより第2信号を抑圧する。遅延部104は、信号抑圧部103の出力である抑圧結果を遅延させることにより、過去の抑圧結果を生成する。遅延部104は、生成した過去の抑圧結果を抑圧抑制部102および信号分析部101に帰還する。ここで、信号分析部101は、混在信号に含まれる第1信号の重要度を、過去の抑圧結果を参照することにより周波数成分ごとに分析する。また、抑圧抑制部102は、分析の結果と過去の抑圧結果とを参照することにより、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する第2信号の抑圧を抑制する。
言い換えれば、信号分析部101は、第1信号を分析した結果を、遅延部104を介して受ける。そして、信号分析部101は、第1信号を分析した結果を信号分析に利用する。信号分析部101は、過去の抑圧結果を用いて信号分析を行うことにより、より正確な分析結果を得る。これは、抑圧抑制部102における正確な処理を可能にし、信号抑圧部103における第2信号の正確な抑圧につながる。
また、抑圧抑制部102は、第1信号を分析した結果を、遅延部104を介して受ける。そして、抑圧抑制部102は、第1信号を分析した結果を抑圧抑制に利用する。抑圧抑制部102は、過去の抑圧結果を用いて抑圧抑制を行うことにより、より正確な抑圧抑制結果を得る。これは、信号抑圧部103における第2信号の正確な抑圧につながる。
遅延部104が信号抑圧部103の出力である抑圧結果を遅延させる量は、任意に設定されうる。例えば、遅延させる量として、Lサンプル(Lは正の整数)の遅延量が設定されると、抑制抑圧部102及び信号抑圧部103は、Lサンプル過去の抑圧結果を用いて、信号分析と抑圧抑制を行うことができる。また、遅延させる量は、L1サンプルの遅延量とL2サンプルの遅延量(L1とL2はどちらも正の整数)を与えた複数の抑圧結果を遅延部104が出力できるように設定されてもよい。この場合、遅延部104は、前者を信号分析部101に、後者を抑圧抑制部102に帰還することもできる。さらに、遅延させる量は、L1、L2、L3、L4の4種類の遅延量(L1からL4はいずれも正の整数)を与えた抑圧結果を遅延部104が出力できるように設定されてもよい。この場合、遅延部104は、遅延量L1とL2の抑圧結果を信号分析部101に、遅延量L3とL4の抑圧結果を抑圧抑制部102に帰還することもできる。このように、本実施形態における信号処理装置100は、より多様な過去の抑圧結果を信号分析と抑圧抑制に利用することによって、より正確な第2信号の抑圧を達成することができる。
一方、遅延させる量は、L=0と設定されてもよい。L=0と設定することは、現在の信号抑圧結果を信号分析と抑圧抑制に利用することを意味する。すなわち、L=0と設定することは、仮に信号を分析して、その結果に基づいて得られた仮の信号抑圧結果を用いてさらに信号分析と抑圧を行うことを意味する。このような反復処理は、2パス処理と呼ばれる。一つの例としては、本実施形態における信号処理装置100は、まず複数の周波数成分をひとまとめに取り扱って信号分析、抑圧抑制、信号抑圧を行う。そして、本実施形態における信号処理装置100は、その結果を用いて各周波数成分に対して独立の処理を適用する。本実施形態における信号処理装置100は、第2信号の悪影響を一部取り除いてから信号分析を行うので、より正確な第2信号の抑圧を達成することができる。
以上の構成により、本実施形態における信号処理装置100は、重要な信号成分をより正確に残すことが可能となり、高品質な信号処理を達成できる。
(第2実施形態)
本発明の第2実施形態としての雑音抑圧装置について図2乃至図11を用いて説明する。本実施形態の雑音抑圧装置200は、例えばデジタルカメラ、ノートパソコン、携帯電話などといった装置の一部としても機能する。しかしながら、本実施形態の雑音抑圧装置200は、上述した装置の構成に限定されるものではなく、入力信号からのノイズ除去を要求されるあらゆる信号処理装置に適用可能である。
《全体構成》
図2Aは、雑音抑圧装置200の全体構成を示すブロック図である。図2Aに示すように、雑音抑圧装置200は、入力端子201と、変換部202と、逆変換部203と出力端子204の他、雑音抑圧部205と雑音推定部206と雑音補正部208と遅延部209とを含む。入力端子201には、劣化信号(第1信号としての所望信号と第2信号としての雑音の混在する混在信号)210が、サンプル値系列として供給される。入力端子201に供給された劣化信号210は、変換部202においてフーリエ変換などの変換を施されて複数の周波数成分に分割される。複数の周波数成分は各周波数で独立に処理される。ここでは、特定の周波数成分に注目して説明を続ける。周波数成分のうち振幅スペクトル(振幅成分)220は雑音抑圧部205へ供給され、位相スペクトル(位相成分)230は逆変換部203に供給される。なお、ここでは雑音抑圧部205に振幅スペクトル220が供給されているが、本実施形態はこれに限定されるものではなく、その二乗に相当するパワースペクトルが雑音抑圧部205に供給されてもよい。
雑音推定部206は、変換部202から供給される劣化信号振幅スペクトル220を用いて、雑音を推定することにより、推定第2信号としての雑音情報250を生成する。ここで、劣化信号振幅スペクトル220は、劣化信号(第1信号としての所望信号と第2信号としての雑音の混在する混在信号)の振幅スペクトルである。また、雑音補正部208は、変換部202から供給された劣化信号振幅スペクトル220と、生成した雑音情報250とを用いて、信号の重要度別に雑音を補正する。信号の重要度は、スペクトル中における振幅がどの程度知覚されやすいかによって決まる。すなわち、雑音補正部208は、振幅それ自体だけではなく、近傍周波数の信号成分によるマスキングを考慮して、重要度を決定してもよい。そして、雑音補正部208は、重要な周波数の信号については雑音を補正して、抑圧する雑音を小さくする。つまり、雑音の抑圧程度を低減する。
補正後の雑音情報である補正雑音260は、雑音抑圧部205に供給されて劣化信号220から減算することにより、強調信号振幅スペクトル240として逆変換部203に供給される。ここで、本実施形態における、強調信号振幅スペクトル240は、強調信号(所望の信号の重要度の高い周波数成分を強調した信号)の振幅スペクトルである。逆変換部203は、変換部202から供給された位相スペクトル230と、強調信号振幅スペクトル240とを合成して逆変換を行うことにより、強調信号として、出力端子204に供給する。
また、強調信号振幅スペクトル240は、遅延部209を介して、雑音補正部208に帰還される。雑音補正部208は、強調信号振幅スペクトル240を用いて、信号の重要度別に雑音を補正する。遅延部209は、強調信号振幅スペクトル240を遅延させて、過去の強調信号振幅スペクトル240を雑音補正部208に供給する。
《雑音補正部の構成》
図2B〜図2Iは、それぞれ雑音補正部208の内部構成の8つの例を示す図である。図2Bに示す雑音補正部208は、劣化信号振幅スペクトルのピークを、重要度を表す情報(以下、重要度情報と略称する)として検出する信号分析部251と、スペクトルピークでは雑音情報が小さくなるように補正する雑音補正部252Aとを備える。
信号分析部251は、入力された劣化信号振幅スペクトル220に基づいて、スペクトルのピークを、各周波数におけるスペクトルを隣接する周波数におけるスペクトルと比較することにより、十分に大きいかどうかを評価して検出する。例えば、信号分析部251は、各周波数のスペクトルをその両隣(低域側および高域側)のスペクトルと比較することにより、その差が閾値より大きいときにピークと判定する。ここでのピーク検出用閾値は、両側のスペクトルに対して等しい必要はない。日本工業規格JIS×4332−3「音響映像オブジェクトの符号化 ―第3部 音響―」、2002年3月には、高域側の差分閾値を低域側差分閾値よりも小さくすることが、聴覚特性に合致すると記載されている。この文献と同様に、雑音補正部208は、低域側および高域側の複数の周波数に対して差分を求めることにより、これらの情報を総合してピークを検出してもよい。すなわち、雑音補正部208は、すぐ隣の周波数に対しては差分が大きいが、それよりも離れた隣接周波数同士においては差分が小さい周波数を検出すれば、それをピークとして検出する。信号分析部251は、このようにして検出したピークの位置(周波数)を、雑音補正部252Aへ供給する。
なお、信号分析部251は、ピークと判定したすべての周波数を雑音補正部252Aに供給しなくてもよい。例えば、信号分析部251は、全体のピークの振幅上位所定割合(例えば80%)以上に入っている周波数のみ抽出してもよい。また、信号分析部251は、特定の周波数帯域に含まれるピークだけを雑音補正部252Aに供給してもよい。このような周波数帯域の例としては、低域周波数がある。低域周波数は、知覚的に重要であり、低域にあるピーク成分の雑音抑圧程度を低減することにより、主観的な音質が向上する。さらに、信号分析部251は、一定の周波数間隔で規則的に出現する規則的ピークがある場合、または一定の時間間隔で規則的に出現する規則的ピークがある場合には、その規則的ピークが現われる周波数をより重要な周波数と判定してもよい。同様に、信号分析部251は、時間軸方向のピークの定常性を利用して、ピークを検出してもよい。すなわち、特定の周波数がピークと判定されると、その周波数がその後もピークである可能性が高い。信号分析部251は、この性質を利用すると、一回ピークとして検出された周波数に基づいて、その後検出閾値を通常よりも小さく設定することによって、雑音などに妨害されて検出が失敗することを防止することができる。また、信号分析部251は、ピーク成分として連続して検出された後にピーク成分として検出されなくなってからしばらくの間は、検出閾値を小さく設定してもよい。この閾値の設定は、検出されない連続時間が長くなるにつれて繰り返し小さく設定してゆき、一定値を下回ったときに通常の閾値に再設定してもよい。
図2Bにおいて、雑音補正部252Aは、信号分析部251から受け取ったスペクトルピーク周波数を重要度の高い周波数成分と判断する。そして、雑音補正部252Aは、そのスペクトルピーク周波数において、入力された雑音情報250から一定値Pを減算する。この結果、入力した雑音情報250は、補正雑音260Aに補正される。
その際に、雑音補正部252Aは、かかる値Pを過去の抑圧結果に基づいて、適応的に決定してもよい。例えば、現在の抑圧結果|xo(k)|を現在の混在信号|xi(k)|に対する通常の抑圧結果よりもPだけ強力に抑圧することを考える。その抑圧を行うためには、混在信号から減算される推定雑音NをN+Pで置換すればよい。過去の抑圧結果と現在の混在信号は周波数ごとに異なる値をとるので、かかる値Pは周波数ごとに異なることが普通である。
同様に、特定のレベルGまで抑圧することを考える。雑音推定値NからN−G+|xi(k)|を減算すると、抑圧結果はGとなる。したがって、図2Bにおいて、かかる値Pは、P=N+G−|xi(k)|と設定すればよい。
次に、過去の抑圧結果と同じレベルまで抑圧することを考える。既に説明したGの代わりに過去の抑圧結果|xo(k−1)|を用いればよいので、図2Bにおいて、かかる値Pは、P=N+|xo(k−1)|−|xi(k)|と設定すればよい。
次に、現在の混在信号と同じレベルを現在の抑圧結果とすることを考える。減算するべきノイズの推定値がゼロになればよいので、図2Bにおいて、かかる値Pは、P=Nと設定すればよい。
図2Cは、図2Bに対して異なる補正処理を行なう雑音補正部252Bを備えた雑音補正部208を示す。図2Cに示す雑音補正部252Bは、信号分析部251から受け取ったスペクトルピーク周波数において、入力した雑音情報250に一定値Qを乗算する。この結果、入力した雑音情報250は、補正雑音260Bに補正される。
その際に、雑音補正部252Bは、Pの値を過去の抑圧結果に基づいて、適応的に決定してもよい。例えば、過去の抑圧結果|xo(k−1)|より閾値δ以上大きなスペクトルが入力された場合、現在の抑圧結果|xo(k)|を現在の混在信号|xi(k)|に対する通常の抑圧結果よりも特定値Qだけ強力に抑圧することを考える。そのためには、混在信号から減算される推定雑音NをNxQで置換すればよい。過去の抑圧結果と現在の混在信号は周波数ごとに異なる値をとるので、かかる値Qは周波数ごとに異なることが普通である。このように急激なスペクトル増大は、突発的な雑音の入力、すなわち、第2信号の急な増大によって生じる。したがって、重要な情報として判定されても、その成分は抑圧することが正しい処理となる。
同様に、特定のレベルGまで抑圧することを考える。雑音推定値Nに(|xi(k)|−G)/Nを乗算すると、抑圧結果はGとなる。したがって、図2Cにおいて、かかる値Qは、Q=(|xi(k)|−G)/Nと設定すればよい。
次に、過去の抑圧結果と同じレベルまで抑圧することを考える。既に説明したGの代わりに過去の抑圧結果|xo(k−1)|を用いればよいので、図2Cにおいて、かかる値Qは、Q=(|xi(k)|−|xo(k−1)|)/Nと設定すればよい。
次に、現在の混在信号と同じレベルを現在の抑圧結果とすることを考える。減算するべきノイズの推定値がゼロになればよいので、図2Cにおいて、かかる値Qは、Q=0と設定すればよい。
図2Dは、図2Bに対して、異なる信号分析処理を行なう信号分析部261を備えた雑音補正部208を示す。図2Dに示す信号分析部261は、重要度情報として、単なるピークではなく「劣化信号振幅スペクトルの大きさ」を分析する。つまり信号分析部261は、スペクトルがピークを形成しなくても、振幅値(またはパワー値)が大きい場合、その周波数を重要度の高い周波数成分と判断して検出する。例えば、大きな値のスペクトルが周波数方向に連続すると、ピークとしては検出されないが、このような部分は、聴覚にとって重要である。そこで、信号分析部261は、検出した大振幅の位置(周波数)を、雑音補正部252Aへ供給する。ここでは、信号分析部261は、劣化信号振幅スペクトルが重要か否かを、所定の閾値よりも大きいか否かによって判定する。所定の閾値は、周波数全体のパワースペクトルの平均値、その平均値のN倍、特定の周波数帯域の中の一番大きい振幅のN倍などといった値を用いてもよい。特に、信号分析部261は、周波数帯域に分割して閾値を決めることにより、該当する周波数帯域の中で重要な周波数成分を検出することができる。帯域平均パワーが小さい領域にある周波数で重要な成分は、このように処理することで検出漏れを防ぐことができる。雑音補正部252Aは、図2Bで説明したものと同様であるため説明を省略する。
図2Eは、図2Dの信号分析部261と、図2Cの雑音補正部252Bとを組み合わせた雑音補正部208を示している。それぞれの動作は、図2C、図2Dで説明したものと同様であるため、ここでは説明を省略する。
図2Fは、重要度情報として、より重要なピークを選別して雑音補正を行なう雑音補正部208の構成を示す図である。ここでの信号分析部271は、スペクトルピーク周波数のうち、振幅値が一定値を超える周波数を選択する。そして、雑音補正部252Cは、振幅値が一定値を超える周波数については、雑音が一定値を下回るようにクリッピングする。例えば、スペクトルピーク周波数の雑音上限値を上限値Rとすると、雑音補正部252Cは、スペクトルピーク周波数での雑音情報が上限値Rより大きい場合には、上限値Rを出力する。一方、雑音補正部252Cは、スペクトルピーク周波数での雑音情報が上限値Rより小さい場合には、その雑音情報をそのまま出力する。その際に、雑音補正部252Cは、上限値Rの値を過去の抑圧結果に基づいて、適応的に決定してもよい。例えば、雑音補正部252Cは、過去の時点k−1における雑音N(k−1)と現在の雑音N(k)のうち小さい方をRに設定してもよい。この結果、入力した雑音情報250は、補正雑音260Cに補正される。
図2Gは、重要度情報として、劣化信号からピーク周波数およびピーク振幅を取り出し、それらを用いて雑音を補正する雑音補正部208の構成を示す図である。信号分析部281は、検出したピークの位置(周波数)および大きさ(振幅)を、雑音補正部252Dへ供給する。雑音補正部252Dは、ピークの大きさに応じて推定雑音を小さくする。ここでは例として、雑音情報(N1,N2,...)から、ピークの大きさ(A1,A5,...)に比例する値を減算している。βは定数である。その際に、現在のピークの大きさの代わりに過去のピークの大きさを含む情報を用いてもよい。例えば、現在のピークの大きさA(k)と過去のピークの大きさA(k−1)の平均値に比例する値を減算する。平均値の代わりに、最大値や最小値を用いてもよい。この結果、入力した雑音情報250は、補正雑音260Dに補正される。
図2Hは、図2Bに対して、異なる信号分析処理を行なう信号分析部291を備えた雑音補正部208を示している。図2Hに示す信号分析部291は、重要度情報として、過去のピークであるという情報と過去の抑圧結果|xo(k−1)|との関係を利用する。例えば、信号分析部291は、過去の時点k−1にスペクトルピークであった周波数において、過去の抑圧結果|xo(k−1)|より大きなスペクトルであるか否かを判定する。その結果、信号分析部291は、過去の抑圧結果|xo(k−1)|より大きなスペクトルである場合にその周波数を検出する。また、信号分析部291は、過去の抑圧結果|xo(k−1)|の代わりに|xo(k−1)|+δ(δは定数)を用いてもよい。このように急激なスペクトル増大は、突発的な雑音の入力、すなわち、第2信号の急な増大によって生じる。したがって、重要な情報として判定されても、その成分は抑圧することが正しい処理となる。このような抑圧の調整は、雑音補正部252Aにおける雑音の補正で実現できる。
同様に、信号分析部291は、過去の抑圧結果|xo(k−1)|より小さなスペクトルであるか否かを判定し、過去の抑圧結果|xo(k−1)|より小さなスペクトルである場合にその周波数を検出することもできる。このようなスペクトルは、ノイズまたは弱い目標信号成分によって生じる。混在信号自体が過去の抑圧結果より小さいので、抑圧結果の自然性を維持するために、何も処理せずに混在信号をそのまま抑圧結果とすることが正しい処理となる。このような抑圧の調整は、雑音補正部252Aにおける雑音の補正で実現できる。
さらに、信号分析部291は、過去の抑圧結果|xo(k−1)|より大きく|xo(k−1)|+δより小さいスペクトルであるか否かを判定し、過去の抑圧結果|xo(k−1)|より大きく|xo(k−1)|+δより小さいスペクトルである場合にその周波数を検出することも可能である。このように過去の抑圧結果と同等か、それより少し大きなスペクトルは、現在と過去の混在信号が似ていることを表す。したがって、過去と同程度に抑圧することが正しい処理となる。このような抑圧の調整は、雑音補正部252Aにおける雑音の補正で実現できる。
信号分析部291は、このようにして検出した周波数を、雑音補正部252Aへ供給する。雑音補正部252Aは、図2Bで説明したものと同様であるため説明を省略する。
図2Iは、図2Hに対して異なる補正処理を行なう雑音補正部252Bを備えた雑音補正部208を示している。図2Iに示す雑音補正部252Bは、信号分析部291から受け取ったスペクトルピーク周波数において、入力した雑音情報250に一定値Qを乗算する。この結果、入力した雑音情報250は、補正雑音260Bに補正される。雑音補正部252Bについては、図2Cを用いて説明したので、詳細な説明を省略する。
その他、雑音補正部208は、劣化信号振幅スペクトルの雑音らしさを分析してもよい。例えば、検出されたピークのうち、低域に存在するピークは雑音の可能性が低い。また、スペクトル値が小さくピークでない位置では雑音らしさが高い。すなわち、雑音補正部208は、低域に存在するピーク周波数では雑音情報が小さくするように補正してもよい。
雑音補正部208の生成する重要度情報は、既に説明したピーク、大振幅、および雑音らしさを適切に組み合わせてもよい。例えば、大振幅のスペクトルに対してピーク検出の閾値を低くして、振幅が大きい帯域では小さなピークも検出されるように制御することなどがその例である。雑音補正部208は、指標を組み合わせて用いることによって、より正確な重要度情報を得ることができる。また、これまでの他の説明のように、雑音補正部208は、処理を特定の周波数帯域に限定する、サブバンド処理などを適用してもよい。
雑音補正部208による補正により、重要度が高い場合には弱い雑音抑圧を、重要度が低い場合には強い雑音抑圧を実行する。その結果、重要な周波数の振幅は維持されることから、強調信号の音質が格段に向上する。言い換えれば、雑音の振幅またはパワースペクトルに対して、重要度を加味した抑圧を行なうことができるから、より高品質の出力を得ることができる。
《変換部の構成》
図3は、変換部202の構成を示すブロック図である。図3に示すように、変換部202はフレーム分割部301、窓がけ処理部(windowing unit)302、およびフーリエ変換部303を含む。劣化信号サンプルは、フレーム分割部301に供給される。そして、フレーム分割部301は、劣化信号サンプルをK/2サンプル毎のフレームに分割する。ここで、Kは偶数とする。フレームに分割された劣化信号サンプルは、窓がけ処理部302に供給される。そして、窓がけ処理部302は、フレームに分割された劣化信号サンプルと窓関数(window function)であるw(t)との乗算を行う。第nフレームの入力信号yn(t)(t=0,1,...,K/2−1)に対するw(t)により窓がけ(windowing)された信号は、次式(1)で与えられる。
また、窓がけ処理部302は、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。窓がけ処理部302は、オーバラップ長としてフレーム長の50%を仮定すれば、t=0,1,...,K/2−1に対して、以下の式(2)で得られる左辺を出力する。
窓がけ処理部2302は、実数信号に対しては、左右対称窓関数を用いてもよい。また、窓関数は、MMSE‐STSA(minimum mean−square−error short−time spectral amplitude estimator)法における抑圧係数を1に設定したとき、またはSS法(spectral subtraction method)においてゼロを減算したときの入力信号と出力信号が計算誤差を除いて一致するように設計される。これは、w(t)+w(t+K/2)=1となることを意味する。
以後、連続する2フレームの50%をオーバラップして窓がけする場合を例として説明を続ける。窓かけ処理部202は、w(t)として、例えば、次式(3)に示すハニング窓を用いてもよい。
このほかにも、ハミング窓、ケイザー窓、ブラックマン窓など、様々な窓関数が知られている。窓がけされた出力はフーリエ変換部303に供給される。フーリエ変換部303は、窓がけされた出力を劣化信号振幅スペクトルYn(k)に変換する。劣化信号スペクトルYn(k)は、位相と振幅に分離される。分離された劣化信号位相スペクトルargYn(k)は、逆変換部203に供給される。分離された劣化信号振幅スペクトル|Yn(k)|は、雑音推定部206に供給される。既に説明したように、振幅スペクトルの代わりにパワースペクトルを利用してもよい。
《逆変換部の構成》
図4は、逆変換部203の構成を示すブロック図である。図4に示すように、逆変換部203は逆フーリエ変換部401、窓がけ処理部402、および、フレーム合成部403を含む。逆フーリエ変換部401は、雑音抑圧部205から供給された強調信号振幅スペクトル240と変換部202から供給された劣化信号位相スペクトル230とを乗算することにより、強調信号(以下の式(4)の左辺)を求める。
逆フーリエ変換部401は、得られた強調信号に逆フーリエ変換を施す。逆フーリエ変換を施された強調信号は、1フレームがKサンプルを含む時間領域サンプル値系列xn(t)(t=0,1,...,K−1)として、窓がけ処理部402に供給される。窓がけ処理部402は、窓関数w(t)との乗算を行う。第nフレームの入力信号xn(t)(t=0,1,...,K/2−1)に対してw(t)で窓がけされた信号は、次式(5)の左辺で与えられる。
また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけすることも広く行なわれている。フレーム長の50%をオーバラップ長として仮定すれば、t=0,1,...,K/2−1に対して、以下の式の左辺が、窓がけ処理部402の出力となり、フレーム合成部403に伝達される。
フレーム合成部403は、窓がけ処理部402からの隣接する2フレームの出力を、K/2サンプルずつ取り出して重ね合わせ、以下の式(7)によって、t=0,1,...,K−1における出力信号(式(7)の左辺)を得る。得られた出力信号は、フレーム合成部403から出力端子204に伝達される。
なお、本実施形態では、図3と図4において変換部202と逆変換部203における変換をフーリエ変換として説明したが、フーリエ変換に代えて、コサイン変換、修正コサイン変換、アダマール変換、ハール変換、ウェーブレット変換など、他の変換を用いてもよい。例えば、コサイン変換や修正コサイン変換は、変換結果として振幅だけしか得られない。このため、図2における変換部202から逆変換部203に至る経路は不要になる。また、雑音記憶部に記録する雑音情報も、振幅(またはパワー)だけとなり、記憶容量の削減、雑音抑圧処理における演算量の削減に貢献する。ハール変換は、乗算が不要となり、LSI(Large Scale Integration)化したときの面積を小さくすることができる。ウェーブレット変換は、周波数によって時間解像度を異なったものに変更できるために、雑音抑圧効果の向上が期待できる。
《雑音推定部の構成》
図5は、図2Aの雑音推定部206の構成を示すブロック図である。雑音推定部206は、推定雑音計算部501、重み付き劣化音声計算部502、およびカウンタ503から構成される。雑音推定部206に供給された劣化音声パワースペクトルは、推定雑音計算部501、および重み付き劣化音声計算部502に伝達される。重み付き劣化音声計算部502は、供給された劣化音声パワースペクトルと推定雑音パワースペクトルを用いて重み付き劣化音声パワースペクトルを計算する。そして、重み付き劣化音声計算部502は、計算した重み付き劣化音声パワースペクトル推定雑音計算部501に伝達する。推定雑音計算部501は、劣化音声パワースペクトル、重み付き劣化音声パワースペクトル、およびカウンタ503から供給されるカウント値を用いて雑音のパワースペクトルを推定することにより、推定雑音パワースペクトルとして出力すると同時に、重み付き劣化音声計算部502に帰還する。
図6は、図5に含まれる推定雑音計算部501の構成を示すブロック図である。推定雑音計算部501は、更新判定部601、レジスタ長記憶部602、推定雑音記憶部603、スイッチ604、シフトレジスタ605、加算器606、最小値選択部607、除算部608、カウンタ609を有する。スイッチ604には、重み付き劣化音声パワースペクトルが供給されている。スイッチ604が回路を閉じたときに、重み付き劣化音声パワースペクトルは、シフトレジスタ605に伝達される。シフトレジスタ605は、更新判定部601から供給される制御信号に応じて、内部レジスタの記憶値を隣接レジスタにシフトする。シフトレジスタ長は、後述するレジスタ長記憶部602に記憶されている値に等しい。シフトレジスタ605の全レジスタ出力は、加算器606に供給される。加算器606は、供給された全レジスタ出力を加算して、加算結果を除算部608に伝達する。
一方、更新判定部601には、カウント値、周波数別劣化音声パワースペクトルおよび周波数別推定雑音パワースペクトルが供給されている。更新判定部601は、カウント値があらかじめ設定された値に到達するまでは常に″1″を、到達した後は入力された劣化音声信号が雑音であると判定されたときに″1″’を、それ以外のときに″0″を出力し、カウンタ609、スイッチ604、およびシフトレジスタ605に伝達する。スイッチ604は、更新判定部から供給された信号が″1″のときに回路を閉じ、″0″のときに開く。カウンタ609は、更新判定部から供給された信号が″1″のときにカウント値を増加し、″0″のときには変更しない。シフトレジスタ605は、更新判定部から供給された信号が″1″のときにスイッチ604から供給される信号サンプルを1サンプル取り込むと同時に、内部レジスタの記憶値を隣接レジスタにシフトする。最小値選択部607には、カウンタ609の出力とレジスタ長記憶部602の出力が供給されている。
最小値選択部607は、供給されたカウント値とレジスタ長のうち、小さい方を選択して、除算部608に伝達する。除算部608は、加算器606から供給された劣化音声パワースペクトルの加算値をカウント値またはレジスタ長の小さい方の値で除算し、商を周波数別推定雑音パワースペクトルλn(k)として出力する。Bj(k)(j=n,n−1,..,n−N+1)をシフトレジスタ605に保存されている劣化音声パワースペクトルのサンプル値とすると、λn(k)は、以下の式で与えられる。
ただし、jは仮フレーム番号、nは現フレーム番号、Nはカウント値とレジスタ長のうち、小さい方の値である。カウント値はゼロから始まって単調に増加するので、最初はカウント値で除算が行なわれ、後にはレジスタ長Nで除算が行なわれる。レジスタ長で除算が行なわれることは、シフトレジスタに格納された値の平均値を求めることになる。すなわち、シフトレジスタ605に格納されている、現フレームnから過去に向かってNフレーム分のデータを平均化したものがλn(k)となる。最初は、シフトレジスタ605に十分多くの値が記憶されていないために、実際に値が記憶されているレジスタの数で除算する。実際に値が記憶されているレジスタの数は、カウント値がレジスタ長より小さいときはカウント値に等しく、カウント値がレジスタ長Nより大きくなると、レジスタ長と等しくなる。
図7は、図6に含まれる更新判定部601の構成を示すブロック図である。更新判定部601は、論理和計算部701、比較部702、704、閾値記憶部705、703、閾値計算部706を有する。図5のカウンタ503から供給されるカウント値は、比較部702に伝達される。閾値記憶部703の出力である閾値も、比較部702に伝達される。比較部702は、供給されたカウント値と閾値を比較することによって、カウント値が閾値より小さいときに″1″を、カウント値が閾値より大きいときに″0″を、論理和計算部701に伝達する。一方、閾値計算部706は、図6の推定雑音記憶部603から供給される推定雑音パワースペクトルに応じた値を計算し、閾値として閾値記憶部705に出力する。最も簡単な閾値の計算方法は、推定雑音パワースペクトルの定数倍である。
その他に、高次多項式や非線形関数を用いて閾値を計算してもよい。閾値記憶部705は、閾値計算部706から出力された閾値を記憶することにより、1フレーム前に記憶された閾値を比較部704へ出力する。比較部704は、閾値記憶部705から供給される閾値と変換部202から供給される劣化音声パワースペクトルを比較し、劣化音声パワースペクトルが閾値よりも小さければ″1″を、大きければ″0″を論理和計算部701に出力する。すなわち、推定雑音パワースペクトルの大きさをもとに、劣化音声信号が雑音であるか否かを判別している。論理和計算部701は、比較部702の出力値と比較部704の出力値との論理和を計算することにより、計算結果を図6のスイッチ604、シフトレジスタ605およびカウンタ609に出力する。このように、初期状態や無音区間だけでなく、有音区間でも劣化音声パワーが小さい場合には、更新判定部601は″1″を出力する。すなわち、推定雑音の更新が行われる。閾値の計算は各周波数で行われるため、各周波数で推定雑音の更新を行うことができる。
図8は、重み付き劣化音声計算部502の構成を示すブロック図である。重み付き劣化音声計算部502は、推定雑音記憶部801、周波数別SNR計算部802、非線形処理部804、および乗算器803を有する。ここで、SNR(signal−noise ratio)とは、信号雑音比のことである。推定雑音記憶部801は、図5に示す推定雑音計算部501から供給される推定雑音パワースペクトルを記憶し、1フレーム前に記憶された推定雑音パワースペクトルを周波数別SNR計算部802へ出力する。周波数別SNR計算部802は、推定雑音記憶部801から供給される推定雑音パワースペクトルと変換部202から供給される劣化音声パワースペクトルを用いてSNRを周波数帯域ごとに求め、求めたSNRを非線形処理部804に出力する。具体的には、次式(9)に従って、供給された劣化音声パワースペクトルを推定雑音パワースペクトルによって除算して周波数別
スペクトルである。
非線形処理部804は、周波数別SNR計算部802から供給されるSNRを用いて重み係数ベクトルを計算し、計算した重み係数ベクトルを乗算器803に出力する。乗算器803は、変換部202から供給される劣化音声パワースペクトルと、非線形処理部804から供給される重み係数ベクトルとの積を周波数帯域ごとに計算し、計算した重み付き劣化音声パワースペクトルを図5の推定雑音計算部501に出力する。
非線形処理部804は、多重化された入力値それぞれに応じた実数値を出力する、非線形関数を有する。図9に、非線形関数の例を示す。f1を入力値としたとき、図9に示される非線形関数の出力値f2は、以下の式で表わされる。ただし、aとbは任意の実数である。
非線形処理部804は、周波数別SNR計算部802から供給される周波数帯域別SNRを、非線形関数によって処理して重み係数を求め、求めた重み係数を乗算器803に伝達する。すなわち、非線形処理部804は、SNRに応じた1から0までの重み係数を出力する。非線形処理部804は、SNRが小さい時は1を、大きい時は0を出力する。
図8の乗算器803において劣化音声パワースペクトルと乗算される重み係数は、SNRに応じた値になっているため、SNRが大きい程、すなわち劣化音声に含まれる音声成分が大きい程、重み係数の値は小さくなる。推定雑音の更新には一般に劣化音声パワースペクトルが用いられる。しかしながら、推定雑音の更新に用いる劣化音声パワースペクトルに対して、SNRに応じた重みづけを行うことにより、劣化音声パワースペクトルに含まれる音声成分の影響を小さくすることができる。このため、より精度の高い雑音推定を行うことができる。なお、重み係数の計算に非線形関数を用いた例を示したが、非線形関数以外にも線形関数や高次多項式など、他の形で表されるSNRの関数を用いてもよい。
以上のように本実施形態の構成によれば、重要な信号成分を残すことにより高品質な信号処理を達成できる。
(第3実施形態)
図10は、本発明の第3実施形態としての雑音抑圧装置1000の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置1000は、第2実施形態と異なり、雑音推定部206の代わりに雑音記憶部1006を備えている。
雑音記憶部1006は、半導体メモリなどの記憶素子を含み、雑音情報(雑音の特性に関する情報)を記憶している。雑音記憶部1006は、雑音情報として、まず、雑音のスペクトルの形を記憶している。しかし、雑音情報は、スペクトルに加えて、位相の周波数特性、特定の周波数における強弱や時間変化などの特徴量などを用いてもよい。雑音情報は、その他でも、統計量(最大、最小、分散、メジアン)などでもよい。スペクトルが1024の周波数成分で表わされている場合、雑音記憶部1006には、1024の振幅(またはパワー)データが記憶されている。雑音記憶部1006に記録された雑音情報250は、雑音補正部208に供給される。
他の構成および動作は、第2実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
本実施形態によっても、第2実施形態と同様に、重要な信号成分を残して、高品質な信号処理を行なうことができる。
(第4実施形態)
図11は、本発明の第4実施形態としての雑音抑圧装置1100の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置1100は、第3実施形態と異なり、雑音記憶部1006からの出力に対して雑音修正部1101で修正を加えた上で雑音補正部208に供給している。
雑音修正部1101は、雑音抑圧部205からの出力240を受けとり、雑音抑圧結果のフィードバックに応じて雑音を修正する。
その他の構成および動作は、第3実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
本実施形態によっても、第3実施形態と同様に、重要な信号成分を残して、高品質な信号処理を行なうことができ、さらに、より精度の高い雑音抑圧を実行できる。
(第5実施形態)
図12は、本発明の第5実施形態としての雑音抑圧装置1200の概略構成を示すブロック図である。図2Aと図12を見比べると、本実施形態に係る雑音抑圧装置1200は、第2実施形態と異なり、雑音情報と劣化信号とを用いて抑圧係数を生成する抑圧係数生成部1210を備えている。また、本実施形態に係る雑音抑圧装置1200は、乗算を行なう雑音抑圧部1205を備えている。その他の構成および動作は、第2実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
《抑圧係数生成部の構成》
図13は、図12に含まれる抑圧係数生成部1210の構成を示すブロック図である。図13に示すように、抑圧係数生成部1210は、後天的SNR計算部1301と推定先天的SNR計算部1302と雑音抑圧係数計算部1303と、音声非存在確率記憶部1304とを備えている。
後天的SNR計算部1301は、入力された劣化音声パワースペクトルと推定雑音パワースペクトルを用いて周波数別に後天的SNRを計算する。そして、後天的SNR計算部1301は、計算した後天的SNRを推定先天的SNR計算部1302と雑音抑圧係数計算部1303に供給する。推定先天的SNR計算部1302は、入力された後天的SNR、および雑音抑圧係数計算部1303から帰還された抑圧係数を用いて先天的SNRを推定する。そして、推定先天的SNR計算部1302は、推定した先天的SNRを推定先天的SNRとして、雑音抑圧係数計算部1303に伝達する。雑音抑圧係数計算部1303は、入力として供給された後天的SNR、推定先天的SNRおよび音声非存在確率記憶部1304から供給される音声非存在確率を用いて雑音抑圧係数を生成する。
して出力する。
図14は、図13に含まれる推定先天的SNR計算部1302の構成を示すブロック図である。推定先天的SNR計算部1302は、値域限定処理部1401、後天的SNR記憶部1402、抑圧係数記憶部1403、乗算器1404、1405、重み記憶部1406、重み付き加算部1407、加算器1408を有する。後天的SNR計算部1301から供給される後天的SNRγn(k)(k=0,1,...,M−1)は、後天的SNR記憶部1402と加算器1408とに伝達される。後天的SNR記憶部1402は、第nフレームにおける後天的SNRγn(k)を記憶すると共に、第n−1フレームにおける後天的SNRγn−1(k)を乗算器1405に伝達する。
1407に過去の推定SNR922として伝達する。
加算器1408の他方の端子には−1が供給されており、加算結果γn(k)−1が値域限定処理部1401に伝達される。値域限定処理部1401は、加算器1408から供給された加算結果γn(k)−1に値域限定演算子P[x]による演算を施し、演算結果であるP[γn(k)−1]を重み付き加算部1407に瞬時推定SNR921として伝達する。ただし、P[x]は次式で定められる。
重み付き加算部1407には、また、重み記憶部1406から重み923が供給されている。重み付き加算部1407は、これらの供給された瞬時推定SNR921、過去の推定SNR922、重み923を用いて推定先天的SNR924を求める。重み923をαとし、
図15は、図14に含まれる重み付き加算部1407の構成を示すブロック図である。重み付き加算部1407は、乗算器1501、1503、定数乗算器1505、加算器1502、1504を有する。図14の値域限定処理部1401から周波数帯域別瞬時推定SNRが、図14の乗算器1405から過去の周波数帯域別SNRが、図14の重み記憶部1406から重みが、それぞれ入力として供給される。値αを有する重みは、定数乗算器1505と乗算器1503に伝達される。定数乗算器1505は入力信号を−1倍して得られた−αを、加算器1504に伝達する。加算器1504のもう一方の入力としては1が供給されており、加算器1504の出力は両者の和である1−αとなる。1−αは乗算器1501に供給されて、もう一方の入力である周波数帯域別瞬時推定SNRP[γn(k)−1]と乗算され、積である(1−α)P[γn(k)−1]が加算器1502に伝達される。一方、乗算器1503では、重みとして供給されたαと過去の推定SNRが乗算され、積である
図16は、図13に含まれる雑音抑圧係数計算部1303を示すブロック図である。雑音抑圧係数計算部1303は、MMSE STSAゲイン関数値計算部1601、一般化尤度比計算部1602、および抑圧係数計算部1603を有する。以下、IEEE TRANSACTIONS ON ACOUSTICS,SPEECH,AND SIGNAL PROCESSING,VOL.32,NO.6,PP.1109−1121,DEC,1984、1109〜1121ページに記載されている計算式をもとに、抑圧係数の計算方法を説明する。
フレーム番号をn、周波数番号をkとし、γn(k)を後天的SNR計算部1301から供給
周波数別推定先天的SNR、qを音声非存在確率記憶部1304から供給される音声非存在確率とする。
MMSE STSAゲイン関数値計算部1601は、後天的SNR計算部1301から供給される後天的SNRγn(k)、推定先天的SNR計算部1302から供給される推定先天
在確率qをもとに、周波数帯域ごとにMMSE STSAゲイン関数値を計算し、抑圧係数計算部1603に出力する。周波数帯域毎のMMSE STSAゲイン関数値Gn(k)は、以下の式で与えられる。
ここに、I0(z)は0次変形ベッセル関数、I1(z)は1次変形ベッセル関数である。変形ベッセル関数については、1985年、数学辞典、岩波書店、374.Gページに記載されている。
一般化尤度比計算部1602は、後天的SNR計算部1301から供給される後天的S
よび音声非存在確率記憶部1304から供給される音声非存在確率qをもとに、周波数帯域ごとに一般化尤度比を計算し、抑圧係数計算部1603に伝達する。周波数帯域毎の一般化尤度比Λn(k)は、以下の式で与えられる。
抑圧係数計算部1603は、MMSE STSAゲイン関数値計算部1601から供給されるMMSE STSAゲイン関数値Gn(k)と一般化尤度比計算部1602から供給される一般化尤度比Λn(k)から周波数帯域ごとに抑圧係数を計算し、抑圧係数補正部6
周波数帯域別にSNRを計算する代わりに、複数の周波数帯域から構成される広い帯域に共通なSNRを求めて、これを用いてもよい。
以上の構成により、抑圧係数を用いた雑音抑圧においても、同様に所望信号と雑音の比に応じて雑音が小さくなるように制御するので、高品質の信号処理が可能となる。つまり、本実施形態によっても、第2実施形態と同様に、重要な信号成分を残して、高品質な信号処理を行なうことができ、さらに、より精度の高い雑音抑圧を実行できる。
(第6実施形態)
図17は、本発明の第6実施形態としての雑音抑圧装置1700の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置1700は、第5実施形態と異なり、雑音推定部206の代わりに第3実施形態で説明した雑音記憶部1006を備えている。他の構成および動作は、第5実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
本実施形態によっても、第5実施形態と同様に、重要な信号成分を残して、高品質な信号処理を行なうことができる。
(第7実施形態)
図18は、本発明の第7実施形態としての雑音抑圧装置1800の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置1800は、第6実施形態と異なり、雑音記憶部1006からの出力に対して雑音修正部1101で修正を加え、修正された雑音情報250を雑音補正部208に供給している。
雑音修正部1101は、雑音抑圧部1205からの出力240を受けとり、雑音抑圧結果のフィードバックに応じて雑音を修正する。
その他の構成および動作は、第6実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
本実施形態によっても、第6実施形態と同様に、重要な信号成分を残して、高品質な信号処理を行なうことができ、さらに、より精度の高い雑音抑圧を実行できる。
(第8実施形態)
図19は、本発明の第8実施形態としての雑音抑圧装置1900の概略構成を示すブロック図である。図12と図19を見比べると、本実施形態に係る雑音抑圧装置1900は、第5実施形態と異なり、雑音補正部208を有さず、その代わりに、抑圧係数生成部1210から供給された抑圧係数を重要度に応じて補正する抑圧係数補正部1908を備える。その他の構成および動作は、第5実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
抑圧係数補正部1908は、抑圧係数生成部1210で生成された抑圧係数を入力信号(周波数)の重要度別に補正する。具体的に、抑圧係数補正部1908は、図2B〜図2Gで説明した雑音補正部252、253、272、282を、抑圧係数補正部に変更した構成となっており、雑音情報の代わりに抑圧係数を入力して同様の補正を加える。
これにより、抑圧係数補正部1908は、重要な周波数成分信号については、抑圧係数を小さくする。これにより、抑圧係数補正部1908は、雑音抑圧部1205における信号の抑圧を抑制する。
以上の構成により、本実施形態は、抑圧係数を用いた雑音抑圧においても、同様に所望信号と雑音の比に応じて抑圧係数が小さくなるように制御するので、高品質の信号処理が可能となる。つまり、本実施形態によっても、第2実施形態と同様に、重要な信号成分を残して、高品質な信号処理を行なうことができ、さらに、より精度の高い雑音抑圧を実行できる。
(第9実施形態)
図20は、本発明の第9実施形態としての雑音抑圧装置2000の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置2000は、図19で説明した第8実施形態と異なり、雑音推定部206の代わりに第3実施形態で説明した雑音記憶部1006を備えている。他の構成および動作は、第8実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
本実施形態によっても、第8実施形態と同様に、重要な信号成分を残して、高品質な信号処理を行なうことができる。
(第10実施形態)
図21は、本発明の第10実施形態としての雑音抑圧装置2100の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置2100は、第9実施形態と異なり、抑圧係数生成部2110に対して、補正後の抑圧係数をフィードバックしている。抑圧係数生成部2110は、フィードバックされた抑圧係数を用いて次の抑圧係数を生成する。これにより抑圧係数の精度が上がり音質の向上につながる。
その他の構成および動作は、第9実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
本実施形態によっても、第9実施形態と同様に、重要な信号成分を残して、高品質な信号処理を行なうことができ、さらに、より精度の高い雑音抑圧を実行できる。
(第11実施形態)
図22は、本発明の第11実施形態としての雑音抑圧装置2200の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置2200は、第9実施形態と異なり、雑音記憶部1006からの出力に対して雑音修正部1101で修正を加え、修正された雑音情報250を抑圧係数生成部1210に供給している。
雑音修正部1101は、雑音抑圧部1205からの出力240を受けとり、雑音抑圧結果のフィードバックに応じて雑音を修正する。
その他の構成および動作は、第9実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
本実施形態によっても、第9実施形態と同様に、重要な信号成分を残して、高品質な信号処理を行なうことができ、さらに、より精度の高い雑音抑圧を実行できる。
(第12実施形態)
図23は、本発明の第12実施形態としての雑音抑圧装置2300の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置2300は、第9実施形態と異なり、抑圧係数生成部2110に対して、補正後の抑圧係数をフィードバックしている。抑圧係数生成部2110は、フィードバックされた抑圧係数を用いて次の抑圧係数を生成する。これにより抑圧係数の精度が上がり音質の向上につながる。さらに、本実施形態に係る雑音抑圧装置2300は、雑音記憶部1006からの出力に対して雑音修正部1101で修正を加え、修正された雑音情報250を抑圧係数生成部2110に供給している。雑音修正部1101は、雑音抑圧部1205からの出力240を受けとり、雑音抑圧結果のフィードバックに応じて雑音を修正する。
その他の構成および動作は、第9実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
本実施形態によっても、第9実施形態と同様に、重要な信号成分を残して、高品質な信号処理を行なうことができ、さらに、より精度の高い雑音抑圧を実行できる。
(他の実施形態)
以上説明してきた第1乃至第12実施形態では、それぞれ別々の特徴を持つ雑音抑圧装置について説明したが、それらの特徴を如何様に組み合わせた雑音抑圧装置も、本発明の範疇に含まれる。
また、上述した各実施形態を例に説明した本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、実施形態の機能を実現する信号処理プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納したコンピュータ読み取り可能な記憶媒体、そのプログラムをダウンロードさせるWWW(World Wide Web)サーバも、本発明の範疇に含まれる。
図24は、第1実施形態を信号処理プログラムにより構成する場合に、その信号処理プログラムを実行するコンピュータ2400の構成図である。コンピュータ2400は、入力部2401と、CPU(Central Processing Unit)2402と、メモリ2403と、出力部2404とを含む。
CPU2402は、信号処理プログラムを読み込むことにより、コンピュータ2400の動作(処理)を制御する。すなわち、CPU2402は、メモリ2403に格納されたコンピュータ・プログラムを実行することにより、第1信号と第2信号とが混在した混在信号に含まれる第1信号の重要度を周波数成分ごとに分析する(S2411)。次に、CPU2402は、分析の結果、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する第2信号の抑圧を抑制するよう制御する(S2412)。そして、抑制制御に基づいて混在信号を処理して第2信号を抑圧する(S2413)。
これにより、第1実施形態と同様の効果を得ることができる。
[実施形態の他の表現]
上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
第1信号と第2信号とが混在した混在信号を加工することにより前記第2信号を抑圧する抑圧部と、
前記抑圧部による抑圧結果を遅延させることによって、過去の抑圧結果を生成する遅延部と、
前記混在信号に含まれる第1信号の重要度を、前記過去の抑圧結果を参照して周波数成分ごとに分析する分析部と、
前記分析部における分析の結果と前記過去の抑圧結果とを参照して、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記第2信号の抑圧を抑制する抑制部と、
を備えることを特徴とする信号処理装置。
(付記2)
前記分析部は、前記混在信号のスペクトルピーク周波数を分析し、分析結果を用いて、過去にスペクトルピークと判定された周波数を分析対象として、前記重要度の高い周波数成分を判断することを特徴とする付記1に記載の信号処理装置。
(付記3)
前記分析部は、前記混在信号のスペクトルピーク周波数を分析し、分析結果を用いて、過去にスペクトルピークと判定された周波数のうちで、過去の抑圧結果よりも大きなスペクトル値をもつ周波数成分を、前記重要度の高い周波数成分と判断することを特徴とする付記2に記載の信号処理装置。
(付記4)
前記分析部は、前記混在信号のスペクトルピーク周波数を分析し、分析結果を用いて、過去にスペクトルピークと判定された周波数のうちで、過去の抑圧結果よりも小さなスペクトル値をもつ周波数成分を、前記重要度の高い周波数成分と判断することを特徴とする付記2に記載の信号処理装置。
(付記5)
前記分析部は、前記混在信号のスペクトルピーク周波数を分析し、分析結果を用いて、過去にスペクトルピークと判定された周波数のうちで、過去の抑圧結果よりも大きく、過去の抑圧結果との差分が所定値よりも小さいスペクトル値をもつ周波数成分を、前記重要度の高い周波数成分と判断することを特徴とする付記2に記載の信号処理装置。
(付記6)
前記分析部は、第1周波数における振幅値またはパワー値と、前記第1周波数に隣接する第2周波数における振幅値またはパワー値との差分が所定の閾値よりも大きい場合に、前記第1周波数をスペクトルピーク周波数と判定することを特徴とする付記1乃至5のいずれか1項に記載の信号処理装置。
(付記7)
前記分析部は、規則的に出現するスペクトルピーク周波数を、より前記重要度の高い周波数成分と判断することを特徴とする付記1乃至6のいずれか1項に記載の信号処理装置。
(付記8)
前記分析部は、振幅値またはパワー値が所定の閾値を超えるスペクトルピーク周波数を、より前記重要度の高い周波数成分と判断することを特徴とする付記1乃至7のいずれか1項に記載の信号処理装置。
(付記9)
前記抑圧部は、前記混在信号に混在する前記第2信号を推定し、推定第2信号を用いて前記混在信号を処理し、
前記抑制部は、
前記分析部における分析の結果を参照することにより、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記推定第2信号の値を小さく補正することを特徴とする付記1乃至8のいずれか1項に記載の信号処理装置。
(付記10)
前記抑圧部は、前記混在信号に混在すると予測される前記第2信号をあらかじめ記憶し、記憶された第2信号を用いて前記混在信号を処理し、
前記抑制部は、
前記分析部における分析の結果を参照することにより、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記記憶第2信号の値を小さく補正することを特徴とする付記1乃至9のいずれか1項に記載の信号処理装置。
(付記11)
前記抑圧部は、抑圧係数を前記混在信号に乗算することによって前記混在信号中の前記第2信号を抑圧し、
前記抑制部は、
重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記抑圧係数の値を小さく補正することを特徴とする付記1乃至10のいずれか1項に記載の信号処理装置。
(付記12)
前記第2信号は雑音であり、
前記抑制部は、前記抑圧部で抑圧に用いられる推定雑音を小さく補正することを特徴とする付記1乃至11のいずれか1項に記載の信号処理装置。
(付記13)
第1信号と第2信号とが混在した混在信号を加工することにより、前記第2信号を抑圧し、
抑圧結果を遅延させることによって、過去の抑圧結果を生成し、
前記混在信号に含まれる第1信号の重要度を、前記過去の抑圧結果を参照して周波数成分ごとに分析し、
分析の結果と前記過去の抑圧結果とを参照して、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記第2信号の抑圧を抑制する、
ことを特徴とする信号処理方法。
(付記14)
第1信号と第2信号とが混在した混在信号を加工することにより前記第2信号を抑圧する抑圧処理と、
前記抑圧処理による抑圧結果を遅延させることによって、過去の抑圧結果を生成する遅延処理と、
前記混在信号に含まれる第1信号の重要度を、前記過去の抑圧結果を参照して周波数成分ごとに分析する分析処理と、
前記分析処理における分析の結果と前記過去の抑圧結果とを参照して、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記第2信号の抑圧を抑制する抑制処理と、
をコンピュータに実行させることを特徴とするコンピュータ・プログラム。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2011年8月29日に出願された日本出願特願2011−186621を基礎とする優先権を主張し、その開示の全てをここに取り込む。
(第1実施形態)
本発明の第1実施形態としての信号処理装置100について、図1を用いて説明する。信号処理装置100は、第1信号と第2信号とが混在した混在信号を加工(処理)することにより、前記第2信号を抑圧する装置である。
図1に示すように、信号処理装置100は、信号分析部(分析部)101と抑圧抑制部(抑制部)102と信号抑圧部(抑圧部)103と遅延部104とを含む。信号分析部101は、混在信号に含まれる第1信号の重要度を周波数成分ごとに分析する。抑圧抑制部102は、分析の結果、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する第2信号の抑圧を抑制する。信号抑圧部103は、混在信号を加工することにより第2信号を抑圧する。遅延部104は、信号抑圧部103の出力である抑圧結果を遅延させることにより、過去の抑圧結果を生成する。遅延部104は、生成した過去の抑圧結果を抑圧抑制部102および信号分析部101に帰還する。ここで、信号分析部101は、混在信号に含まれる第1信号の重要度を、過去の抑圧結果を参照することにより周波数成分ごとに分析する。また、抑圧抑制部102は、分析の結果と過去の抑圧結果とを参照することにより、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する第2信号の抑圧を抑制する。
言い換えれば、信号分析部101は、第1信号を分析した結果を、遅延部104を介して受ける。そして、信号分析部101は、第1信号を分析した結果を信号分析に利用する。信号分析部101は、過去の抑圧結果を用いて信号分析を行うことにより、より正確な分析結果を得る。これは、抑圧抑制部102における正確な処理を可能にし、信号抑圧部103における第2信号の正確な抑圧につながる。
また、抑圧抑制部102は、第1信号を分析した結果を、遅延部104を介して受ける。そして、抑圧抑制部102は、第1信号を分析した結果を抑圧抑制に利用する。抑圧抑制部102は、過去の抑圧結果を用いて抑圧抑制を行うことにより、より正確な抑圧抑制結果を得る。これは、信号抑圧部103における第2信号の正確な抑圧につながる。
遅延部104が信号抑圧部103の出力である抑圧結果を遅延させる量は、任意に設定されうる。例えば、遅延させる量として、Lサンプル(Lは正の整数)の遅延量が設定されると、抑制抑圧部102及び信号抑圧部103は、Lサンプル過去の抑圧結果を用いて、信号分析と抑圧抑制を行うことができる。また、遅延させる量は、L1サンプルの遅延量とL2サンプルの遅延量(L1とL2はどちらも正の整数)を与えた複数の抑圧結果を遅延部104が出力できるように設定されてもよい。この場合、遅延部104は、前者を信号分析部101に、後者を抑圧抑制部102に帰還することもできる。さらに、遅延させる量は、L1、L2、L3、L4の4種類の遅延量(L1からL4はいずれも正の整数)を与えた抑圧結果を遅延部104が出力できるように設定されてもよい。この場合、遅延部104は、遅延量L1とL2の抑圧結果を信号分析部101に、遅延量L3とL4の抑圧結果を抑圧抑制部102に帰還することもできる。このように、本実施形態における信号処理装置100は、より多様な過去の抑圧結果を信号分析と抑圧抑制に利用することによって、より正確な第2信号の抑圧を達成することができる。
一方、遅延させる量は、L=0と設定されてもよい。L=0と設定することは、現在の信号抑圧結果を信号分析と抑圧抑制に利用することを意味する。すなわち、L=0と設定することは、仮に信号を分析して、その結果に基づいて得られた仮の信号抑圧結果を用いてさらに信号分析と抑圧を行うことを意味する。このような反復処理は、2パス処理と呼ばれる。一つの例としては、本実施形態における信号処理装置100は、まず複数の周波数成分をひとまとめに取り扱って信号分析、抑圧抑制、信号抑圧を行う。そして、本実施形態における信号処理装置100は、その結果を用いて各周波数成分に対して独立の処理を適用する。本実施形態における信号処理装置100は、第2信号の悪影響を一部取り除いてから信号分析を行うので、より正確な第2信号の抑圧を達成することができる。
以上の構成により、本実施形態における信号処理装置100は、重要な信号成分をより正確に残すことが可能となり、高品質な信号処理を達成できる。
(第2実施形態)
本発明の第2実施形態としての雑音抑圧装置について図2乃至図11を用いて説明する。本実施形態の雑音抑圧装置200は、例えばデジタルカメラ、ノートパソコン、携帯電話などといった装置の一部としても機能する。しかしながら、本実施形態の雑音抑圧装置200は、上述した装置の構成に限定されるものではなく、入力信号からのノイズ除去を要求されるあらゆる信号処理装置に適用可能である。
《全体構成》
図2Aは、雑音抑圧装置200の全体構成を示すブロック図である。図2Aに示すように、雑音抑圧装置200は、入力端子201と、変換部202と、逆変換部203と出力端子204の他、雑音抑圧部205と雑音推定部206と雑音補正部208と遅延部209とを含む。入力端子201には、劣化信号(第1信号としての所望信号と第2信号としての雑音の混在する混在信号)210が、サンプル値系列として供給される。入力端子201に供給された劣化信号210は、変換部202においてフーリエ変換などの変換を施されて複数の周波数成分に分割される。複数の周波数成分は各周波数で独立に処理される。ここでは、特定の周波数成分に注目して説明を続ける。周波数成分のうち振幅スペクトル(振幅成分)220は雑音抑圧部205へ供給され、位相スペクトル(位相成分)230は逆変換部203に供給される。なお、ここでは雑音抑圧部205に振幅スペクトル220が供給されているが、本実施形態はこれに限定されるものではなく、その二乗に相当するパワースペクトルが雑音抑圧部205に供給されてもよい。
雑音推定部206は、変換部202から供給される劣化信号振幅スペクトル220を用いて、雑音を推定することにより、推定第2信号としての雑音情報250を生成する。ここで、劣化信号振幅スペクトル220は、劣化信号(第1信号としての所望信号と第2信号としての雑音の混在する混在信号)の振幅スペクトルである。また、雑音補正部208は、変換部202から供給された劣化信号振幅スペクトル220と、生成した雑音情報250とを用いて、信号の重要度別に雑音を補正する。信号の重要度は、スペクトル中における振幅がどの程度知覚されやすいかによって決まる。すなわち、雑音補正部208は、振幅それ自体だけではなく、近傍周波数の信号成分によるマスキングを考慮して、重要度を決定してもよい。そして、雑音補正部208は、重要な周波数の信号については雑音を補正して、抑圧する雑音を小さくする。つまり、雑音の抑圧程度を低減する。
補正後の雑音情報である補正雑音260は、雑音抑圧部205に供給されて劣化信号220から減算することにより、強調信号振幅スペクトル240として逆変換部203に供給される。ここで、本実施形態における、強調信号振幅スペクトル240は、強調信号(所望の信号の重要度の高い周波数成分を強調した信号)の振幅スペクトルである。逆変換部203は、変換部202から供給された位相スペクトル230と、強調信号振幅スペクトル240とを合成して逆変換を行うことにより、強調信号として、出力端子204に供給する。
また、強調信号振幅スペクトル240は、遅延部209を介して、雑音補正部208に帰還される。雑音補正部208は、強調信号振幅スペクトル240を用いて、信号の重要度別に雑音を補正する。遅延部209は、強調信号振幅スペクトル240を遅延させて、過去の強調信号振幅スペクトル240を雑音補正部208に供給する。
《雑音補正部の構成》
図2B〜図2Iは、それぞれ雑音補正部208の内部構成の8つの例を示す図である。図2Bに示す雑音補正部208は、劣化信号振幅スペクトルのピークを、重要度を表す情報(以下、重要度情報と略称する)として検出する信号分析部251と、スペクトルピークでは雑音情報が小さくなるように補正する雑音補正部252Aとを備える。
信号分析部251は、入力された劣化信号振幅スペクトル220に基づいて、スペクトルのピークを、各周波数におけるスペクトルを隣接する周波数におけるスペクトルと比較することにより、十分に大きいかどうかを評価して検出する。例えば、信号分析部251は、各周波数のスペクトルをその両隣(低域側および高域側)のスペクトルと比較することにより、その差が閾値より大きいときにピークと判定する。ここでのピーク検出用閾値は、両側のスペクトルに対して等しい必要はない。日本工業規格JIS×4332−3「音響映像オブジェクトの符号化 ―第3部 音響―」、2002年3月には、高域側の差分閾値を低域側差分閾値よりも小さくすることが、聴覚特性に合致すると記載されている。この文献と同様に、雑音補正部208は、低域側および高域側の複数の周波数に対して差分を求めることにより、これらの情報を総合してピークを検出してもよい。すなわち、雑音補正部208は、すぐ隣の周波数に対しては差分が大きいが、それよりも離れた隣接周波数同士においては差分が小さい周波数を検出すれば、それをピークとして検出する。信号分析部251は、このようにして検出したピークの位置(周波数)を、雑音補正部252Aへ供給する。
なお、信号分析部251は、ピークと判定したすべての周波数を雑音補正部252Aに供給しなくてもよい。例えば、信号分析部251は、全体のピークの振幅上位所定割合(例えば80%)以上に入っている周波数のみ抽出してもよい。また、信号分析部251は、特定の周波数帯域に含まれるピークだけを雑音補正部252Aに供給してもよい。このような周波数帯域の例としては、低域周波数がある。低域周波数は、知覚的に重要であり、低域にあるピーク成分の雑音抑圧程度を低減することにより、主観的な音質が向上する。さらに、信号分析部251は、一定の周波数間隔で規則的に出現する規則的ピークがある場合、または一定の時間間隔で規則的に出現する規則的ピークがある場合には、その規則的ピークが現われる周波数をより重要な周波数と判定してもよい。同様に、信号分析部251は、時間軸方向のピークの定常性を利用して、ピークを検出してもよい。すなわち、特定の周波数がピークと判定されると、その周波数がその後もピークである可能性が高い。信号分析部251は、この性質を利用すると、一回ピークとして検出された周波数に基づいて、その後検出閾値を通常よりも小さく設定することによって、雑音などに妨害されて検出が失敗することを防止することができる。また、信号分析部251は、ピーク成分として連続して検出された後にピーク成分として検出されなくなってからしばらくの間は、検出閾値を小さく設定してもよい。この閾値の設定は、検出されない連続時間が長くなるにつれて繰り返し小さく設定してゆき、一定値を下回ったときに通常の閾値に再設定してもよい。
図2Bにおいて、雑音補正部252Aは、信号分析部251から受け取ったスペクトルピーク周波数を重要度の高い周波数成分と判断する。そして、雑音補正部252Aは、そのスペクトルピーク周波数において、入力された雑音情報250から一定値Pを減算する。この結果、入力した雑音情報250は、補正雑音260Aに補正される。
その際に、雑音補正部252Aは、かかる値Pを過去の抑圧結果に基づいて、適応的に決定してもよい。例えば、現在の抑圧結果|xo(k)|を現在の混在信号|xi(k)|に対する通常の抑圧結果よりもPだけ強力に抑圧することを考える。その抑圧を行うためには、混在信号から減算される推定雑音NをN+Pで置換すればよい。過去の抑圧結果と現在の混在信号は周波数ごとに異なる値をとるので、かかる値Pは周波数ごとに異なることが普通である。
同様に、特定のレベルGまで抑圧することを考える。雑音推定値NからN−G+|xi(k)|を減算すると、抑圧結果はGとなる。したがって、図2Bにおいて、かかる値Pは、P=N+G−|xi(k)|と設定すればよい。
次に、過去の抑圧結果と同じレベルまで抑圧することを考える。既に説明したGの代わりに過去の抑圧結果|xo(k−1)|を用いればよいので、図2Bにおいて、かかる値Pは、P=N+|xo(k−1)|−|xi(k)|と設定すればよい。
次に、現在の混在信号と同じレベルを現在の抑圧結果とすることを考える。減算するべきノイズの推定値がゼロになればよいので、図2Bにおいて、かかる値Pは、P=Nと設定すればよい。
図2Cは、図2Bに対して異なる補正処理を行なう雑音補正部252Bを備えた雑音補正部208を示す。図2Cに示す雑音補正部252Bは、信号分析部251から受け取ったスペクトルピーク周波数において、入力した雑音情報250に一定値Qを乗算する。この結果、入力した雑音情報250は、補正雑音260Bに補正される。
その際に、雑音補正部252Bは、Pの値を過去の抑圧結果に基づいて、適応的に決定してもよい。例えば、過去の抑圧結果|xo(k−1)|より閾値δ以上大きなスペクトルが入力された場合、現在の抑圧結果|xo(k)|を現在の混在信号|xi(k)|に対する通常の抑圧結果よりも特定値Qだけ強力に抑圧することを考える。そのためには、混在信号から減算される推定雑音NをNxQで置換すればよい。過去の抑圧結果と現在の混在信号は周波数ごとに異なる値をとるので、かかる値Qは周波数ごとに異なることが普通である。このように急激なスペクトル増大は、突発的な雑音の入力、すなわち、第2信号の急な増大によって生じる。したがって、重要な情報として判定されても、その成分は抑圧することが正しい処理となる。
同様に、特定のレベルGまで抑圧することを考える。雑音推定値Nに(|xi(k)|−G)/Nを乗算すると、抑圧結果はGとなる。したがって、図2Cにおいて、かかる値Qは、Q=(|xi(k)|−G)/Nと設定すればよい。
次に、過去の抑圧結果と同じレベルまで抑圧することを考える。既に説明したGの代わりに過去の抑圧結果|xo(k−1)|を用いればよいので、図2Cにおいて、かかる値Qは、Q=(|xi(k)|−|xo(k−1)|)/Nと設定すればよい。
次に、現在の混在信号と同じレベルを現在の抑圧結果とすることを考える。減算するべきノイズの推定値がゼロになればよいので、図2Cにおいて、かかる値Qは、Q=0と設定すればよい。
図2Dは、図2Bに対して、異なる信号分析処理を行なう信号分析部261を備えた雑音補正部208を示す。図2Dに示す信号分析部261は、重要度情報として、単なるピークではなく「劣化信号振幅スペクトルの大きさ」を分析する。つまり信号分析部261は、スペクトルがピークを形成しなくても、振幅値(またはパワー値)が大きい場合、その周波数を重要度の高い周波数成分と判断して検出する。例えば、大きな値のスペクトルが周波数方向に連続すると、ピークとしては検出されないが、このような部分は、聴覚にとって重要である。そこで、信号分析部261は、検出した大振幅の位置(周波数)を、雑音補正部252Aへ供給する。ここでは、信号分析部261は、劣化信号振幅スペクトルが重要か否かを、所定の閾値よりも大きいか否かによって判定する。所定の閾値は、周波数全体のパワースペクトルの平均値、その平均値のN倍、特定の周波数帯域の中の一番大きい振幅のN倍などといった値を用いてもよい。特に、信号分析部261は、周波数帯域に分割して閾値を決めることにより、該当する周波数帯域の中で重要な周波数成分を検出することができる。帯域平均パワーが小さい領域にある周波数で重要な成分は、このように処理することで検出漏れを防ぐことができる。雑音補正部252Aは、図2Bで説明したものと同様であるため説明を省略する。
図2Eは、図2Dの信号分析部261と、図2Cの雑音補正部252Bとを組み合わせた雑音補正部208を示している。それぞれの動作は、図2C、図2Dで説明したものと同様であるため、ここでは説明を省略する。
図2Fは、重要度情報として、より重要なピークを選別して雑音補正を行なう雑音補正部208の構成を示す図である。ここでの信号分析部271は、スペクトルピーク周波数のうち、振幅値が一定値を超える周波数を選択する。そして、雑音補正部252Cは、振幅値が一定値を超える周波数については、雑音が一定値を下回るようにクリッピングする。例えば、スペクトルピーク周波数の雑音上限値を上限値Rとすると、雑音補正部252Cは、スペクトルピーク周波数での雑音情報が上限値Rより大きい場合には、上限値Rを出力する。一方、雑音補正部252Cは、スペクトルピーク周波数での雑音情報が上限値Rより小さい場合には、その雑音情報をそのまま出力する。その際に、雑音補正部252Cは、上限値Rの値を過去の抑圧結果に基づいて、適応的に決定してもよい。例えば、雑音補正部252Cは、過去の時点k−1における雑音N(k−1)と現在の雑音N(k)のうち小さい方をRに設定してもよい。この結果、入力した雑音情報250は、補正雑音260Cに補正される。
図2Gは、重要度情報として、劣化信号からピーク周波数およびピーク振幅を取り出し、それらを用いて雑音を補正する雑音補正部208の構成を示す図である。信号分析部281は、検出したピークの位置(周波数)および大きさ(振幅)を、雑音補正部252Dへ供給する。雑音補正部252Dは、ピークの大きさに応じて推定雑音を小さくする。ここでは例として、雑音情報(N1,N2,...)から、ピークの大きさ(A1,A5,...)に比例する値を減算している。βは定数である。その際に、現在のピークの大きさの代わりに過去のピークの大きさを含む情報を用いてもよい。例えば、現在のピークの大きさA(k)と過去のピークの大きさA(k−1)の平均値に比例する値を減算する。平均値の代わりに、最大値や最小値を用いてもよい。この結果、入力した雑音情報250は、補正雑音260Dに補正される。
図2Hは、図2Bに対して、異なる信号分析処理を行なう信号分析部291を備えた雑音補正部208を示している。図2Hに示す信号分析部291は、重要度情報として、過去のピークであるという情報と過去の抑圧結果|xo(k−1)|との関係を利用する。例えば、信号分析部291は、過去の時点k−1にスペクトルピークであった周波数において、過去の抑圧結果|xo(k−1)|より大きなスペクトルであるか否かを判定する。その結果、信号分析部291は、過去の抑圧結果|xo(k−1)|より大きなスペクトルである場合にその周波数を検出する。また、信号分析部291は、過去の抑圧結果|xo(k−1)|の代わりに|xo(k−1)|+δ(δは定数)を用いてもよい。このように急激なスペクトル増大は、突発的な雑音の入力、すなわち、第2信号の急な増大によって生じる。したがって、重要な情報として判定されても、その成分は抑圧することが正しい処理となる。このような抑圧の調整は、雑音補正部252Aにおける雑音の補正で実現できる。
同様に、信号分析部291は、過去の抑圧結果|xo(k−1)|より小さなスペクトルであるか否かを判定し、過去の抑圧結果|xo(k−1)|より小さなスペクトルである場合にその周波数を検出することもできる。このようなスペクトルは、ノイズまたは弱い目標信号成分によって生じる。混在信号自体が過去の抑圧結果より小さいので、抑圧結果の自然性を維持するために、何も処理せずに混在信号をそのまま抑圧結果とすることが正しい処理となる。このような抑圧の調整は、雑音補正部252Aにおける雑音の補正で実現できる。
さらに、信号分析部291は、過去の抑圧結果|xo(k−1)|より大きく|xo(k−1)|+δより小さいスペクトルであるか否かを判定し、過去の抑圧結果|xo(k−1)|より大きく|xo(k−1)|+δより小さいスペクトルである場合にその周波数を検出することも可能である。このように過去の抑圧結果と同等か、それより少し大きなスペクトルは、現在と過去の混在信号が似ていることを表す。したがって、過去と同程度に抑圧することが正しい処理となる。このような抑圧の調整は、雑音補正部252Aにおける雑音の補正で実現できる。
信号分析部291は、このようにして検出した周波数を、雑音補正部252Aへ供給する。雑音補正部252Aは、図2Bで説明したものと同様であるため説明を省略する。
図2Iは、図2Hに対して異なる補正処理を行なう雑音補正部252Bを備えた雑音補正部208を示している。図2Iに示す雑音補正部252Bは、信号分析部291から受け取ったスペクトルピーク周波数において、入力した雑音情報250に一定値Qを乗算する。この結果、入力した雑音情報250は、補正雑音260Bに補正される。雑音補正部252Bについては、図2Cを用いて説明したので、詳細な説明を省略する。
その他、雑音補正部208は、劣化信号振幅スペクトルの雑音らしさを分析してもよい。例えば、検出されたピークのうち、低域に存在するピークは雑音の可能性が低い。また、スペクトル値が小さくピークでない位置では雑音らしさが高い。すなわち、雑音補正部208は、低域に存在するピーク周波数では雑音情報が小さくするように補正してもよい。
雑音補正部208の生成する重要度情報は、既に説明したピーク、大振幅、および雑音らしさを適切に組み合わせてもよい。例えば、大振幅のスペクトルに対してピーク検出の閾値を低くして、振幅が大きい帯域では小さなピークも検出されるように制御することなどがその例である。雑音補正部208は、指標を組み合わせて用いることによって、より正確な重要度情報を得ることができる。また、これまでの他の説明のように、雑音補正部208は、処理を特定の周波数帯域に限定する、サブバンド処理などを適用してもよい。
雑音補正部208による補正により、重要度が高い場合には弱い雑音抑圧を、重要度が低い場合には強い雑音抑圧を実行する。その結果、重要な周波数の振幅は維持されることから、強調信号の音質が格段に向上する。言い換えれば、雑音の振幅またはパワースペクトルに対して、重要度を加味した抑圧を行なうことができるから、より高品質の出力を得ることができる。
《変換部の構成》
図3は、変換部202の構成を示すブロック図である。図3に示すように、変換部202はフレーム分割部301、窓がけ処理部(windowing unit)302、およびフーリエ変換部303を含む。劣化信号サンプルは、フレーム分割部301に供給される。そして、フレーム分割部301は、劣化信号サンプルをK/2サンプル毎のフレームに分割する。ここで、Kは偶数とする。フレームに分割された劣化信号サンプルは、窓がけ処理部302に供給される。そして、窓がけ処理部302は、フレームに分割された劣化信号サンプルと窓関数(window function)であるw(t)との乗算を行う。第nフレームの入力信号yn(t)(t=0,1,...,K/2−1)に対するw(t)により窓がけ(windowing)された信号は、次式(1)で与えられる。
以後、連続する2フレームの50%をオーバラップして窓がけする場合を例として説明を続ける。窓かけ処理部202は、w(t)として、例えば、次式(3)に示すハニング窓を用いてもよい。
《逆変換部の構成》
図4は、逆変換部203の構成を示すブロック図である。図4に示すように、逆変換部203は逆フーリエ変換部401、窓がけ処理部402、および、フレーム合成部403を含む。逆フーリエ変換部401は、雑音抑圧部205から供給された強調信号振幅スペクトル240と変換部202から供給された劣化信号位相スペクトル230とを乗算することにより、強調信号(以下の式(4)の左辺)を求める。
《雑音推定部の構成》
図5は、図2Aの雑音推定部206の構成を示すブロック図である。雑音推定部206は、推定雑音計算部501、重み付き劣化音声計算部502、およびカウンタ503から構成される。雑音推定部206に供給された劣化音声パワースペクトルは、推定雑音計算部501、および重み付き劣化音声計算部502に伝達される。重み付き劣化音声計算部502は、供給された劣化音声パワースペクトルと推定雑音パワースペクトルを用いて重み付き劣化音声パワースペクトルを計算する。そして、重み付き劣化音声計算部502は、計算した重み付き劣化音声パワースペクトル推定雑音計算部501に伝達する。推定雑音計算部501は、劣化音声パワースペクトル、重み付き劣化音声パワースペクトル、およびカウンタ503から供給されるカウント値を用いて雑音のパワースペクトルを推定することにより、推定雑音パワースペクトルとして出力すると同時に、重み付き劣化音声計算部502に帰還する。
図6は、図5に含まれる推定雑音計算部501の構成を示すブロック図である。推定雑音計算部501は、更新判定部601、レジスタ長記憶部602、推定雑音記憶部603、スイッチ604、シフトレジスタ605、加算器606、最小値選択部607、除算部608、カウンタ609を有する。スイッチ604には、重み付き劣化音声パワースペクトルが供給されている。スイッチ604が回路を閉じたときに、重み付き劣化音声パワースペクトルは、シフトレジスタ605に伝達される。シフトレジスタ605は、更新判定部601から供給される制御信号に応じて、内部レジスタの記憶値を隣接レジスタにシフトする。シフトレジスタ長は、後述するレジスタ長記憶部602に記憶されている値に等しい。シフトレジスタ605の全レジスタ出力は、加算器606に供給される。加算器606は、供給された全レジスタ出力を加算して、加算結果を除算部608に伝達する。
一方、更新判定部601には、カウント値、周波数別劣化音声パワースペクトルおよび周波数別推定雑音パワースペクトルが供給されている。更新判定部601は、カウント値があらかじめ設定された値に到達するまでは常に″1″を、到達した後は入力された劣化音声信号が雑音であると判定されたときに″1″’を、それ以外のときに″0″を出力し、カウンタ609、スイッチ604、およびシフトレジスタ605に伝達する。スイッチ604は、更新判定部から供給された信号が″1″のときに回路を閉じ、″0″のときに開く。カウンタ609は、更新判定部から供給された信号が″1″のときにカウント値を増加し、″0″のときには変更しない。シフトレジスタ605は、更新判定部から供給された信号が″1″のときにスイッチ604から供給される信号サンプルを1サンプル取り込むと同時に、内部レジスタの記憶値を隣接レジスタにシフトする。最小値選択部607には、カウンタ609の出力とレジスタ長記憶部602の出力が供給されている。
最小値選択部607は、供給されたカウント値とレジスタ長のうち、小さい方を選択して、除算部608に伝達する。除算部608は、加算器606から供給された劣化音声パワースペクトルの加算値をカウント値またはレジスタ長の小さい方の値で除算し、商を周波数別推定雑音パワースペクトルλn(k)として出力する。Bj(k)(j=n,n−1,..,n−N+1)をシフトレジスタ605に保存されている劣化音声パワースペクトルのサンプル値とすると、λn(k)は、以下の式で与えられる。
図7は、図6に含まれる更新判定部601の構成を示すブロック図である。更新判定部601は、論理和計算部701、比較部702、704、閾値記憶部705、703、閾値計算部706を有する。図5のカウンタ503から供給されるカウント値は、比較部702に伝達される。閾値記憶部703の出力である閾値も、比較部702に伝達される。比較部702は、供給されたカウント値と閾値を比較することによって、カウント値が閾値より小さいときに″1″を、カウント値が閾値より大きいときに″0″を、論理和計算部701に伝達する。一方、閾値計算部706は、図6の推定雑音記憶部603から供給される推定雑音パワースペクトルに応じた値を計算し、閾値として閾値記憶部705に出力する。最も簡単な閾値の計算方法は、推定雑音パワースペクトルの定数倍である。
その他に、高次多項式や非線形関数を用いて閾値を計算してもよい。閾値記憶部705は、閾値計算部706から出力された閾値を記憶することにより、1フレーム前に記憶された閾値を比較部704へ出力する。比較部704は、閾値記憶部705から供給される閾値と変換部202から供給される劣化音声パワースペクトルを比較し、劣化音声パワースペクトルが閾値よりも小さければ″1″を、大きければ″0″を論理和計算部701に出力する。すなわち、推定雑音パワースペクトルの大きさをもとに、劣化音声信号が雑音であるか否かを判別している。論理和計算部701は、比較部702の出力値と比較部704の出力値との論理和を計算することにより、計算結果を図6のスイッチ604、シフトレジスタ605およびカウンタ609に出力する。このように、初期状態や無音区間だけでなく、有音区間でも劣化音声パワーが小さい場合には、更新判定部601は″1″を出力する。すなわち、推定雑音の更新が行われる。閾値の計算は各周波数で行われるため、各周波数で推定雑音の更新を行うことができる。
図8は、重み付き劣化音声計算部502の構成を示すブロック図である。重み付き劣化音声計算部502は、推定雑音記憶部801、周波数別SNR計算部802、非線形処理部804、および乗算器803を有する。ここで、SNR(signal−noise ratio)とは、信号雑音比のことである。推定雑音記憶部801は、図5に示す推定雑音計算部501から供給される推定雑音パワースペクトルを記憶し、1フレーム前に記憶された推定雑音パワースペクトルを周波数別SNR計算部802へ出力する。周波数別SNR計算部802は、推定雑音記憶部801から供給される推定雑音パワースペクトルと変換部202から供給される劣化音声パワースペクトルを用いてSNRを周波数帯域ごとに求め、求めたSNRを非線形処理部804に出力する。具体的には、次式(9)に従って、供給された劣化音声パワースペクトルを推定雑音パワースペクトルによって除算して周波数別
スペクトルである。
非線形処理部804は、多重化された入力値それぞれに応じた実数値を出力する、非線形関数を有する。図9に、非線形関数の例を示す。f1を入力値としたとき、図9に示される非線形関数の出力値f2は、以下の式で表わされる。ただし、aとbは任意の実数である。
図8の乗算器803において劣化音声パワースペクトルと乗算される重み係数は、SNRに応じた値になっているため、SNRが大きい程、すなわち劣化音声に含まれる音声成分が大きい程、重み係数の値は小さくなる。推定雑音の更新には一般に劣化音声パワースペクトルが用いられる。しかしながら、推定雑音の更新に用いる劣化音声パワースペクトルに対して、SNRに応じた重みづけを行うことにより、劣化音声パワースペクトルに含まれる音声成分の影響を小さくすることができる。このため、より精度の高い雑音推定を行うことができる。なお、重み係数の計算に非線形関数を用いた例を示したが、非線形関数以外にも線形関数や高次多項式など、他の形で表されるSNRの関数を用いてもよい。
以上のように本実施形態の構成によれば、重要な信号成分を残すことにより高品質な信号処理を達成できる。
(第3実施形態)
図10は、本発明の第3実施形態としての雑音抑圧装置1000の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置1000は、第2実施形態と異なり、雑音推定部206の代わりに雑音記憶部1006を備えている。
雑音記憶部1006は、半導体メモリなどの記憶素子を含み、雑音情報(雑音の特性に関する情報)を記憶している。雑音記憶部1006は、雑音情報として、まず、雑音のスペクトルの形を記憶している。しかし、雑音情報は、スペクトルに加えて、位相の周波数特性、特定の周波数における強弱や時間変化などの特徴量などを用いてもよい。雑音情報は、その他でも、統計量(最大、最小、分散、メジアン)などでもよい。スペクトルが1024の周波数成分で表わされている場合、雑音記憶部1006には、1024の振幅(またはパワー)データが記憶されている。雑音記憶部1006に記録された雑音情報250は、雑音補正部208に供給される。
他の構成および動作は、第2実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
本実施形態によっても、第2実施形態と同様に、重要な信号成分を残して、高品質な信号処理を行なうことができる。
(第4実施形態)
図11は、本発明の第4実施形態としての雑音抑圧装置1100の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置1100は、第3実施形態と異なり、雑音記憶部1006からの出力に対して雑音修正部1101で修正を加えた上で雑音補正部208に供給している。
雑音修正部1101は、雑音抑圧部205からの出力240を受けとり、雑音抑圧結果のフィードバックに応じて雑音を修正する。
その他の構成および動作は、第3実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
本実施形態によっても、第3実施形態と同様に、重要な信号成分を残して、高品質な信号処理を行なうことができ、さらに、より精度の高い雑音抑圧を実行できる。
(第5実施形態)
図12は、本発明の第5実施形態としての雑音抑圧装置1200の概略構成を示すブロック図である。図2Aと図12を見比べると、本実施形態に係る雑音抑圧装置1200は、第2実施形態と異なり、雑音情報と劣化信号とを用いて抑圧係数を生成する抑圧係数生成部1210を備えている。また、本実施形態に係る雑音抑圧装置1200は、乗算を行なう雑音抑圧部1205を備えている。その他の構成および動作は、第2実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
《抑圧係数生成部の構成》
図13は、図12に含まれる抑圧係数生成部1210の構成を示すブロック図である。図13に示すように、抑圧係数生成部1210は、後天的SNR計算部1301と推定先天的SNR計算部1302と雑音抑圧係数計算部1303と、音声非存在確率記憶部1304とを備えている。
後天的SNR計算部1301は、入力された劣化音声パワースペクトルと推定雑音パワースペクトルを用いて周波数別に後天的SNRを計算する。そして、後天的SNR計算部1301は、計算した後天的SNRを推定先天的SNR計算部1302と雑音抑圧係数計算部1303に供給する。推定先天的SNR計算部1302は、入力された後天的SNR、および雑音抑圧係数計算部1303から帰還された抑圧係数を用いて先天的SNRを推定する。そして、推定先天的SNR計算部1302は、推定した先天的SNRを推定先天的SNRとして、雑音抑圧係数計算部1303に伝達する。雑音抑圧係数計算部1303は、入力として供給された後天的SNR、推定先天的SNRおよび音声非存在確率記憶部1304から供給される音声非存在確率を用いて雑音抑圧係数を生成する。
して出力する。
図14は、図13に含まれる推定先天的SNR計算部1302の構成を示すブロック図である。推定先天的SNR計算部1302は、値域限定処理部1401、後天的SNR記憶部1402、抑圧係数記憶部1403、乗算器1404、1405、重み記憶部1406、重み付き加算部1407、加算器1408を有する。後天的SNR計算部1301から供給される後天的SNRγn(k)(k=0,1,...,M−1)は、後天的SNR記憶部1402と加算器1408とに伝達される。後天的SNR記憶部1402は、第nフレームにおける後天的SNRγn(k)を記憶すると共に、第n−1フレームにおける後天的SNRγn−1(k)を乗算器1405に伝達する。
1407に過去の推定SNR922として伝達する。
加算器1408の他方の端子には−1が供給されており、加算結果γn(k)−1が値域限定処理部1401に伝達される。値域限定処理部1401は、加算器1408から供給された加算結果γn(k)−1に値域限定演算子P[x]による演算を施し、演算結果であるP[γn(k)−1]を重み付き加算部1407に瞬時推定SNR921として伝達する。ただし、P[x]は次式で定められる。
図16は、図13に含まれる雑音抑圧係数計算部1303を示すブロック図である。雑音抑圧係数計算部1303は、MMSE STSAゲイン関数値計算部1601、一般化尤度比計算部1602、および抑圧係数計算部1603を有する。以下、IEEE TRANSACTIONS ON ACOUSTICS,SPEECH,AND SIGNAL PROCESSING,VOL.32,NO.6,PP.1109−1121,DEC,1984、1109〜1121ページに記載されている計算式をもとに、抑圧係数の計算方法を説明する。
フレーム番号をn、周波数番号をkとし、γn(k)を後天的SNR計算部1301から供給
周波数別推定先天的SNR、qを音声非存在確率記憶部1304から供給される音声非存在確率とする。
MMSE STSAゲイン関数値計算部1601は、後天的SNR計算部1301から供給される後天的SNRγn(k)、推定先天的SNR計算部1302から供給される推定先天
在確率qをもとに、周波数帯域ごとにMMSE STSAゲイン関数値を計算し、抑圧係数計算部1603に出力する。周波数帯域毎のMMSE STSAゲイン関数値Gn(k)は、以下の式で与えられる。
一般化尤度比計算部1602は、後天的SNR計算部1301から供給される後天的S
よび音声非存在確率記憶部1304から供給される音声非存在確率qをもとに、周波数帯域ごとに一般化尤度比を計算し、抑圧係数計算部1603に伝達する。周波数帯域毎の一般化尤度比Λn(k)は、以下の式で与えられる。
以上の構成により、抑圧係数を用いた雑音抑圧においても、同様に所望信号と雑音の比に応じて雑音が小さくなるように制御するので、高品質の信号処理が可能となる。つまり、本実施形態によっても、第2実施形態と同様に、重要な信号成分を残して、高品質な信号処理を行なうことができ、さらに、より精度の高い雑音抑圧を実行できる。
(第6実施形態)
図17は、本発明の第6実施形態としての雑音抑圧装置1700の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置1700は、第5実施形態と異なり、雑音推定部206の代わりに第3実施形態で説明した雑音記憶部1006を備えている。他の構成および動作は、第5実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
本実施形態によっても、第5実施形態と同様に、重要な信号成分を残して、高品質な信号処理を行なうことができる。
(第7実施形態)
図18は、本発明の第7実施形態としての雑音抑圧装置1800の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置1800は、第6実施形態と異なり、雑音記憶部1006からの出力に対して雑音修正部1101で修正を加え、修正された雑音情報250を雑音補正部208に供給している。
雑音修正部1101は、雑音抑圧部1205からの出力240を受けとり、雑音抑圧結果のフィードバックに応じて雑音を修正する。
その他の構成および動作は、第6実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
本実施形態によっても、第6実施形態と同様に、重要な信号成分を残して、高品質な信号処理を行なうことができ、さらに、より精度の高い雑音抑圧を実行できる。
(第8実施形態)
図19は、本発明の第8実施形態としての雑音抑圧装置1900の概略構成を示すブロック図である。図12と図19を見比べると、本実施形態に係る雑音抑圧装置1900は、第5実施形態と異なり、雑音補正部208を有さず、その代わりに、抑圧係数生成部1210から供給された抑圧係数を重要度に応じて補正する抑圧係数補正部1908を備える。その他の構成および動作は、第5実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
抑圧係数補正部1908は、抑圧係数生成部1210で生成された抑圧係数を入力信号(周波数)の重要度別に補正する。具体的に、抑圧係数補正部1908は、図2B〜図2Gで説明した雑音補正部252、253、272、282を、抑圧係数補正部に変更した構成となっており、雑音情報の代わりに抑圧係数を入力して同様の補正を加える。
これにより、抑圧係数補正部1908は、重要な周波数成分信号については、抑圧係数を小さくする。これにより、抑圧係数補正部1908は、雑音抑圧部1205における信号の抑圧を抑制する。
以上の構成により、本実施形態は、抑圧係数を用いた雑音抑圧においても、同様に所望信号と雑音の比に応じて抑圧係数が小さくなるように制御するので、高品質の信号処理が可能となる。つまり、本実施形態によっても、第2実施形態と同様に、重要な信号成分を残して、高品質な信号処理を行なうことができ、さらに、より精度の高い雑音抑圧を実行できる。
(第9実施形態)
図20は、本発明の第9実施形態としての雑音抑圧装置2000の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置2000は、図19で説明した第8実施形態と異なり、雑音推定部206の代わりに第3実施形態で説明した雑音記憶部1006を備えている。他の構成および動作は、第8実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
本実施形態によっても、第8実施形態と同様に、重要な信号成分を残して、高品質な信号処理を行なうことができる。
(第10実施形態)
図21は、本発明の第10実施形態としての雑音抑圧装置2100の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置2100は、第9実施形態と異なり、抑圧係数生成部2110に対して、補正後の抑圧係数をフィードバックしている。抑圧係数生成部2110は、フィードバックされた抑圧係数を用いて次の抑圧係数を生成する。これにより抑圧係数の精度が上がり音質の向上につながる。
その他の構成および動作は、第9実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
本実施形態によっても、第9実施形態と同様に、重要な信号成分を残して、高品質な信号処理を行なうことができ、さらに、より精度の高い雑音抑圧を実行できる。
(第11実施形態)
図22は、本発明の第11実施形態としての雑音抑圧装置2200の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置2200は、第9実施形態と異なり、雑音記憶部1006からの出力に対して雑音修正部1101で修正を加え、修正された雑音情報250を抑圧係数生成部1210に供給している。
雑音修正部1101は、雑音抑圧部1205からの出力240を受けとり、雑音抑圧結果のフィードバックに応じて雑音を修正する。
その他の構成および動作は、第9実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
本実施形態によっても、第9実施形態と同様に、重要な信号成分を残して、高品質な信号処理を行なうことができ、さらに、より精度の高い雑音抑圧を実行できる。
(第12実施形態)
図23は、本発明の第12実施形態としての雑音抑圧装置2300の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置2300は、第9実施形態と異なり、抑圧係数生成部2110に対して、補正後の抑圧係数をフィードバックしている。抑圧係数生成部2110は、フィードバックされた抑圧係数を用いて次の抑圧係数を生成する。これにより抑圧係数の精度が上がり音質の向上につながる。さらに、本実施形態に係る雑音抑圧装置2300は、雑音記憶部1006からの出力に対して雑音修正部1101で修正を加え、修正された雑音情報250を抑圧係数生成部2110に供給している。雑音修正部1101は、雑音抑圧部1205からの出力240を受けとり、雑音抑圧結果のフィードバックに応じて雑音を修正する。
その他の構成および動作は、第9実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
本実施形態によっても、第9実施形態と同様に、重要な信号成分を残して、高品質な信号処理を行なうことができ、さらに、より精度の高い雑音抑圧を実行できる。
(他の実施形態)
以上説明してきた第1乃至第12実施形態では、それぞれ別々の特徴を持つ雑音抑圧装置について説明したが、それらの特徴を如何様に組み合わせた雑音抑圧装置も、本発明の範疇に含まれる。
また、上述した各実施形態を例に説明した本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、実施形態の機能を実現する信号処理プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納したコンピュータ読み取り可能な記憶媒体、そのプログラムをダウンロードさせるWWW(World Wide Web)サーバも、本発明の範疇に含まれる。
図24は、第1実施形態を信号処理プログラムにより構成する場合に、その信号処理プログラムを実行するコンピュータ2400の構成図である。コンピュータ2400は、入力部2401と、CPU(Central Processing Unit)2402と、メモリ2403と、出力部2404とを含む。
CPU2402は、信号処理プログラムを読み込むことにより、コンピュータ2400の動作(処理)を制御する。すなわち、CPU2402は、メモリ2403に格納されたコンピュータ・プログラムを実行することにより、第1信号と第2信号とが混在した混在信号に含まれる第1信号の重要度を周波数成分ごとに分析する(S2411)。次に、CPU2402は、分析の結果、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する第2信号の抑圧を抑制するよう制御する(S2412)。そして、抑制制御に基づいて混在信号を処理して第2信号を抑圧する(S2413)。
これにより、第1実施形態と同様の効果を得ることができる。
[実施形態の他の表現]
上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
第1信号と第2信号とが混在した混在信号を加工することにより前記第2信号を抑圧する抑圧部と、
前記抑圧部による抑圧結果を遅延させることによって、過去の抑圧結果を生成する遅延部と、
前記混在信号に含まれる第1信号の重要度を、前記過去の抑圧結果を参照して周波数成分ごとに分析する分析部と、
前記分析部における分析の結果と前記過去の抑圧結果とを参照して、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記第2信号の抑圧を抑制する抑制部と、
を備えることを特徴とする信号処理装置。
(付記2)
前記分析部は、前記混在信号のスペクトルピーク周波数を分析し、分析結果を用いて、過去にスペクトルピークと判定された周波数を分析対象として、前記重要度の高い周波数成分を判断することを特徴とする付記1に記載の信号処理装置。
(付記3)
前記分析部は、前記混在信号のスペクトルピーク周波数を分析し、分析結果を用いて、過去にスペクトルピークと判定された周波数のうちで、過去の抑圧結果よりも大きなスペクトル値をもつ周波数成分を、前記重要度の高い周波数成分と判断することを特徴とする付記2に記載の信号処理装置。
(付記4)
前記分析部は、前記混在信号のスペクトルピーク周波数を分析し、分析結果を用いて、過去にスペクトルピークと判定された周波数のうちで、過去の抑圧結果よりも小さなスペクトル値をもつ周波数成分を、前記重要度の高い周波数成分と判断することを特徴とする付記2に記載の信号処理装置。
(付記5)
前記分析部は、前記混在信号のスペクトルピーク周波数を分析し、分析結果を用いて、過去にスペクトルピークと判定された周波数のうちで、過去の抑圧結果よりも大きく、過去の抑圧結果との差分が所定値よりも小さいスペクトル値をもつ周波数成分を、前記重要度の高い周波数成分と判断することを特徴とする付記2に記載の信号処理装置。
(付記6)
前記分析部は、第1周波数における振幅値またはパワー値と、前記第1周波数に隣接する第2周波数における振幅値またはパワー値との差分が所定の閾値よりも大きい場合に、前記第1周波数をスペクトルピーク周波数と判定することを特徴とする付記1乃至5のいずれか1項に記載の信号処理装置。
(付記7)
前記分析部は、規則的に出現するスペクトルピーク周波数を、より前記重要度の高い周波数成分と判断することを特徴とする付記1乃至6のいずれか1項に記載の信号処理装置。
(付記8)
前記分析部は、振幅値またはパワー値が所定の閾値を超えるスペクトルピーク周波数を、より前記重要度の高い周波数成分と判断することを特徴とする付記1乃至7のいずれか1項に記載の信号処理装置。
(付記9)
前記抑圧部は、前記混在信号に混在する前記第2信号を推定し、推定第2信号を用いて前記混在信号を処理し、
前記抑制部は、
前記分析部における分析の結果を参照することにより、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記推定第2信号の値を小さく補正することを特徴とする付記1乃至8のいずれか1項に記載の信号処理装置。
(付記10)
前記抑圧部は、前記混在信号に混在すると予測される前記第2信号をあらかじめ記憶し、記憶された第2信号を用いて前記混在信号を処理し、
前記抑制部は、
前記分析部における分析の結果を参照することにより、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記記憶第2信号の値を小さく補正することを特徴とする付記1乃至9のいずれか1項に記載の信号処理装置。
(付記11)
前記抑圧部は、抑圧係数を前記混在信号に乗算することによって前記混在信号中の前記第2信号を抑圧し、
前記抑制部は、
重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記抑圧係数の値を小さく補正することを特徴とする付記1乃至10のいずれか1項に記載の信号処理装置。
(付記12)
前記第2信号は雑音であり、
前記抑制部は、前記抑圧部で抑圧に用いられる推定雑音を小さく補正することを特徴とする付記1乃至11のいずれか1項に記載の信号処理装置。
(付記13)
第1信号と第2信号とが混在した混在信号を加工することにより、前記第2信号を抑圧し、
抑圧結果を遅延させることによって、過去の抑圧結果を生成し、
前記混在信号に含まれる第1信号の重要度を、前記過去の抑圧結果を参照して周波数成分ごとに分析し、
分析の結果と前記過去の抑圧結果とを参照して、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記第2信号の抑圧を抑制する、
ことを特徴とする信号処理方法。
(付記14)
第1信号と第2信号とが混在した混在信号を加工することにより前記第2信号を抑圧する抑圧処理と、
前記抑圧処理による抑圧結果を遅延させることによって、過去の抑圧結果を生成する遅延処理と、
前記混在信号に含まれる第1信号の重要度を、前記過去の抑圧結果を参照して周波数成分ごとに分析する分析処理と、
前記分析処理における分析の結果と前記過去の抑圧結果とを参照して、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記第2信号の抑圧を抑制する抑制処理と、
をコンピュータに実行させることを特徴とするコンピュータ・プログラム。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2011年8月29日に出願された日本出願特願2011−186621を基礎とする優先権を主張し、その開示の全てをここに取り込む。
100 信号処理装置
101 信号分析部
102 抑圧抑制部
103 信号抑圧部
104 遅延部
200、1000、1100、1200、1700、1800、1900、2000、2100、2200、2300 雑音抑圧装置
201 入力端子
202 変換部
203 逆変換部
204 出力端子
205 雑音抑圧部
206 雑音推定部
208 雑音補正部
209 遅延部
210 劣化信号
220 振幅スペクトル
230 位相スペクトル
240 強調信号振幅スペクトル
250 雑音情報
251、261、271、281、291 信号分析部
252A、252B、252C、252D 雑音補正部
260、260A、260B、260C、260D 補正雑音
301 フレーム分割部
302、402 窓がけ処理部
303 フーリエ変換部
401 逆フーリエ変換部
403 フレーム合成部
501 指定雑音計算部
502 重み付け劣化音声計算部
503、609 カウンタ
601 更新判定部
602 レジスタ長記憶部
603 推定雑音記憶部
604 スイッチ
605 シフトレジスタ
606、1408、1502、1504 加算器
607 最小値選択部
608 除算部
701 論理和計算部
702、704 比較部
703、705 閾値記憶部
706 閾値計算部
801 推定雑音記憶部
802 周波数別SNR計算部
803、1404、1405、1501、1503 乗算器
804 非線形処理部
921 瞬時推定SNR
922 過去の推定SNR
923 重み
1006 雑音記憶部
1101 雑音修正部
1205 雑音抑圧部
1210、2110 抑圧係数生成部
1301 後天的SNR計算部
1302 推定先天的SNR計算部
1303 雑音抑圧係数計算部
1304 音声非存在確率記憶部
1401 値域限定処理部
1402 後天的SNR記憶部
1403 抑圧係数記憶部
1406 重み記憶部
1407 重み付き加算部
1505 定数乗算器
1601 MMSE STSAゲイン関数値計算部
1602 一般化尤度比計算部
1603 抑圧係数計算部
1908 抑圧係数補正部
101 信号分析部
102 抑圧抑制部
103 信号抑圧部
104 遅延部
200、1000、1100、1200、1700、1800、1900、2000、2100、2200、2300 雑音抑圧装置
201 入力端子
202 変換部
203 逆変換部
204 出力端子
205 雑音抑圧部
206 雑音推定部
208 雑音補正部
209 遅延部
210 劣化信号
220 振幅スペクトル
230 位相スペクトル
240 強調信号振幅スペクトル
250 雑音情報
251、261、271、281、291 信号分析部
252A、252B、252C、252D 雑音補正部
260、260A、260B、260C、260D 補正雑音
301 フレーム分割部
302、402 窓がけ処理部
303 フーリエ変換部
401 逆フーリエ変換部
403 フレーム合成部
501 指定雑音計算部
502 重み付け劣化音声計算部
503、609 カウンタ
601 更新判定部
602 レジスタ長記憶部
603 推定雑音記憶部
604 スイッチ
605 シフトレジスタ
606、1408、1502、1504 加算器
607 最小値選択部
608 除算部
701 論理和計算部
702、704 比較部
703、705 閾値記憶部
706 閾値計算部
801 推定雑音記憶部
802 周波数別SNR計算部
803、1404、1405、1501、1503 乗算器
804 非線形処理部
921 瞬時推定SNR
922 過去の推定SNR
923 重み
1006 雑音記憶部
1101 雑音修正部
1205 雑音抑圧部
1210、2110 抑圧係数生成部
1301 後天的SNR計算部
1302 推定先天的SNR計算部
1303 雑音抑圧係数計算部
1304 音声非存在確率記憶部
1401 値域限定処理部
1402 後天的SNR記憶部
1403 抑圧係数記憶部
1406 重み記憶部
1407 重み付き加算部
1505 定数乗算器
1601 MMSE STSAゲイン関数値計算部
1602 一般化尤度比計算部
1603 抑圧係数計算部
1908 抑圧係数補正部
Claims (10)
- 第1信号と第2信号とが混在した混在信号を加工することにより、前記第2信号を抑圧する抑圧部と、
前記抑圧部による抑圧結果を遅延させることによって、過去の抑圧結果を生成する遅延部と、
前記混在信号に含まれる第1信号の重要度を、前記過去の抑圧結果を参照して周波数成分ごとに分析する分析部と、
前記分析部における分析の結果と前記過去の抑圧結果とを参照して、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記第2信号の抑圧を抑制する抑制部と、
を備えることを特徴とする信号処理装置。 - 前記分析部は、前記混在信号のスペクトルピーク周波数を分析し、分析結果を用いて、過去にスペクトルピークと判定された周波数を分析対象として、前記重要度の高い周波数成分を判断することを特徴とする請求項1に記載の信号処理装置。
- 前記分析部は、前記混在信号のスペクトルピーク周波数を分析し、分析結果を用いて、過去にスペクトルピークと判定された周波数のうち、過去の抑圧結果よりも大きなスペクトル値をもつ周波数成分を、前記重要度の高い周波数成分と判断することを特徴とする請求項2に記載の信号処理装置。
- 前記分析部は、前記混在信号のスペクトルピーク周波数を分析し、分析結果を用いて、過去にスペクトルピークと判定された周波数のうち、過去の抑圧結果よりも小さなスペクトル値をもつ周波数成分を、前記重要度の高い周波数成分と判断することを特徴とする請求項2に記載の信号処理装置。
- 前記分析部は、前記混在信号のスペクトルピーク周波数を分析し、分析結果を用いて、過去にスペクトルピークと判定された周波数のうち、過去の抑圧結果よりも大きく、過去の抑圧結果との差分が所定値よりも小さいスペクトル値をもつ周波数成分を、前記重要度の高い周波数成分と判断することを特徴とする請求項2に記載の信号処理装置。
- 前記分析部は、第1周波数における振幅値またはパワー値と、前記第1周波数に隣接する第2周波数における振幅値またはパワー値との差分が所定の閾値よりも大きい場合に、前記第1周波数をスペクトルピーク周波数と判定することを特徴とする請求項1乃至5のいずれか1項に記載の信号処理装置。
- 前記分析部は、規則的に出現するスペクトルピーク周波数を、より前記重要度の高い周波数成分と判断することを特徴とする請求項1乃至6のいずれか1項に記載の信号処理装置。
- 前記分析部は、振幅値またはパワー値が所定の閾値を超えるスペクトルピーク周波数を、より前記重要度の高い周波数成分と判断することを特徴とする請求項1乃至7のいずれか1項に記載の信号処理装置。
- 第1信号と第2信号とが混在した混在信号を加工することにより、前記第2信号を抑圧し、
抑圧結果を遅延させることによって、過去の抑圧結果を生成し、
前記混在信号に含まれる第1信号の重要度を、前記過去の抑圧結果を参照して周波数成分ごとに分析し、
分析の結果と前記過去の抑圧結果とを参照して、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記第2信号の抑圧を抑制する、
ことを特徴とする信号処理方法。 - 第1信号と第2信号とが混在した混在信号を加工することにより、前記第2信号を抑圧する抑圧処理と、
前記抑圧処理による抑圧結果を遅延させることによって、過去の抑圧結果を生成する遅延処理と、
前記混在信号に含まれる第1信号の重要度を、前記過去の抑圧結果を参照して周波数成分ごとに分析する分析処理と、
前記分析処理における分析の結果と前記過去の抑圧結果とを参照して、重要度の低い周波数成分に比べて、重要度の高い周波数成分に対する前記第2信号の抑圧を抑制する抑制処理と、
をコンピュータに実行させることを特徴とするコンピュータ・プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011186621 | 2011-08-29 | ||
JP2011186621 | 2011-08-29 | ||
PCT/JP2012/072530 WO2013032025A1 (ja) | 2011-08-29 | 2012-08-29 | 信号処理装置、信号処理方法、およびコンピュータ・プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2013032025A1 true JPWO2013032025A1 (ja) | 2015-03-23 |
JP6011536B2 JP6011536B2 (ja) | 2016-10-19 |
Family
ID=47756488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013531457A Active JP6011536B2 (ja) | 2011-08-29 | 2012-08-29 | 信号処理装置、信号処理方法、およびコンピュータ・プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6011536B2 (ja) |
WO (1) | WO2013032025A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6301891B2 (ja) * | 2015-09-29 | 2018-03-28 | 日本電信電話株式会社 | 学習装置、識別装置、その方法、およびプログラム |
CN112967729B (zh) * | 2021-02-24 | 2024-07-02 | 辽宁省视讯技术研究有限公司 | 一种车载局部音频模糊处理方法、装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011100082A (ja) * | 2009-11-09 | 2011-05-19 | Nec Corp | 信号処理方法、情報処理装置、及び信号処理プログラム |
JP2012058358A (ja) * | 2010-09-07 | 2012-03-22 | Sony Corp | 雑音抑圧装置、雑音抑圧方法およびプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002236497A (ja) * | 2001-02-08 | 2002-08-23 | Alpine Electronics Inc | ノイズリダクションシステム |
JP4529611B2 (ja) * | 2004-09-17 | 2010-08-25 | 日産自動車株式会社 | 音声入力装置 |
EP2192579A4 (en) * | 2007-09-19 | 2016-06-08 | Nec Corp | NOISE SUPPRESSION DEVICE, ITS METHOD AND PROGRAM |
-
2012
- 2012-08-29 WO PCT/JP2012/072530 patent/WO2013032025A1/ja active Application Filing
- 2012-08-29 JP JP2013531457A patent/JP6011536B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011100082A (ja) * | 2009-11-09 | 2011-05-19 | Nec Corp | 信号処理方法、情報処理装置、及び信号処理プログラム |
JP2012058358A (ja) * | 2010-09-07 | 2012-03-22 | Sony Corp | 雑音抑圧装置、雑音抑圧方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2013032025A1 (ja) | 2013-03-07 |
JP6011536B2 (ja) | 2016-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101052445B1 (ko) | 잡음 억압을 위한 방법과 장치, 및 컴퓨터 프로그램 | |
JP5791092B2 (ja) | 雑音抑圧の方法、装置、及びプログラム | |
JP5435204B2 (ja) | 雑音抑圧の方法、装置、及びプログラム | |
JP5310494B2 (ja) | 信号処理方法、情報処理装置、及び信号処理プログラム | |
JP6064600B2 (ja) | 信号処理装置、信号処理方法、及び信号処理プログラム | |
JP5867389B2 (ja) | 信号処理方法、情報処理装置、及び信号処理プログラム | |
JP2006337415A (ja) | 雑音抑圧の方法及び装置 | |
WO2012070670A1 (ja) | 信号処理装置、信号処理方法、及び信号処理プログラム | |
US9858946B2 (en) | Signal processing apparatus, signal processing method, and signal processing program | |
JP5788873B2 (ja) | 信号処理方法、情報処理装置、及び信号処理プログラム | |
WO2014168021A1 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
JP2008216721A (ja) | 雑音抑圧の方法、装置、及びプログラム | |
JP6070953B2 (ja) | 信号処理装置、信号処理方法、及び記憶媒体 | |
JP6011536B2 (ja) | 信号処理装置、信号処理方法、およびコンピュータ・プログラム | |
JP5413575B2 (ja) | 雑音抑圧の方法、装置、及びプログラム | |
JP4395772B2 (ja) | ノイズ除去方法及び装置 | |
JP2011100031A (ja) | 情報処理装置、その付属装置、情報処理システム、その制御方法並びに制御プログラム | |
US10388264B2 (en) | Audio signal processing apparatus, audio signal processing method, and audio signal processing program | |
JP6182862B2 (ja) | 信号処理装置、信号処理方法、及び信号処理プログラム | |
JP2011100030A (ja) | 信号処理方法、情報処理装置、及び信号処理プログラム | |
WO2011055829A1 (ja) | 信号処理方法、情報処理装置、及び信号処理プログラム | |
JP4968355B2 (ja) | 雑音抑圧の方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150722 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160823 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160905 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6011536 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |