JP6544234B2 - 信号処理装置、信号処理方法および信号処理プログラム - Google Patents
信号処理装置、信号処理方法および信号処理プログラム Download PDFInfo
- Publication number
- JP6544234B2 JP6544234B2 JP2015511204A JP2015511204A JP6544234B2 JP 6544234 B2 JP6544234 B2 JP 6544234B2 JP 2015511204 A JP2015511204 A JP 2015511204A JP 2015511204 A JP2015511204 A JP 2015511204A JP 6544234 B2 JP6544234 B2 JP 6544234B2
- Authority
- JP
- Japan
- Prior art keywords
- component signal
- signal
- amplitude component
- amplitude
- steady
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 4
- 238000001228 spectrum Methods 0.000 claims description 125
- 238000006467 substitution reaction Methods 0.000 claims description 90
- 238000006243 chemical reaction Methods 0.000 claims description 45
- 238000001514 detection method Methods 0.000 claims description 29
- 230000001629 suppression Effects 0.000 claims description 24
- 230000009466 transformation Effects 0.000 claims description 21
- 230000001131 transforming effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 49
- 230000006870 function Effects 0.000 description 43
- 238000000034 method Methods 0.000 description 26
- 238000004364 calculation method Methods 0.000 description 20
- 230000003595 spectral effect Effects 0.000 description 10
- 239000000203 mixture Substances 0.000 description 6
- 238000013507 mapping Methods 0.000 description 4
- 238000009499 grossing Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 101150068393 argx gene Proteins 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/0332—Details of processing therefor involving modification of waveforms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Noise Elimination (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Description
入力信号を、周波数領域における振幅成分信号に変換する変換手段と、
周波数領域における前記振幅成分信号に基づいて、定常的な特性を備えた周波数スペクトルを有する定常成分信号を推定する定常成分推定手段と、
前記振幅成分信号と前記定常成分信号とがある周波数においてあらかじめ定められた大小関係を満たすときに、前記振幅成分信号または前記定常成分信号を用いて当該周波数における新たな振幅成分信号を生成し、前記変換手段が求めた振幅成分信号を前記新たな振幅成分信号に置き換える置換手段と、
前記新たな振幅成分信号を用いて強調信号に逆変換する逆変換手段と、
を備えた。
入力信号を、周波数領域における振幅成分信号に変換する変換ステップと、
周波数領域における前記振幅成分信号に基づいて、定常的な特性を備えた周波数スペクトルを有する定常成分信号を推定する定常成分推定ステップと、
前記振幅成分信号と前記定常成分信号とがある周波数においてあらかじめ定められた大小関係を満たすときに、前記振幅成分信号または前記定常成分信号を用いて当該周波数における新たな振幅成分信号を生成し、前記変換手段が求めた振幅成分信号を前記新たな振幅成分信号に置き換える置換ステップと、
前記新たな振幅成分信号を用いて強調信号に逆変換する逆変換ステップと、
を備えた。
入力信号を、周波数領域における振幅成分信号に変換する変換ステップと、
周波数領域における前記振幅成分信号に基づいて、定常的な特性を備えた周波数スペクトルを有する定常成分信号を推定する定常成分推定ステップと、
前記振幅成分信号と前記定常成分信号とがある周波数においてあらかじめ定められた大小関係を満たすときに、前記振幅成分信号または前記定常成分信号を用いて当該周波数における新たな振幅成分信号を生成し、前記変換手段が求めた振幅成分信号を前記新たな振幅成分信号に置き換える置換ステップと、
前記新たな振幅成分信号を用いて強調信号に逆変換する逆変換ステップと、
をコンピュータに実行させる。
本発明の第1実施形態としての信号処理装置100について、図1を用いて説明する。図1に示すように、信号処理装置100は、変換部101と定常成分推定部102と置換部103と逆変換部104とを含む装置である。
《全体構成》
本発明の第2実施形態としての信号処理装置について図を用いて説明する。本実施形態としての信号処理装置は、例えば、風切り音のような非定常雑音を適切に抑圧する。簡単に説明すると、周波数領域において、入力音中の定常成分を推定して、推定された定常成分で入力音の一部または全部を置換する。ここで入力音は音声に限定されるものではない。例えば、音声以外に、環境音(街頭の雑踏の音、電車・自動車の走行音、警報・警告音、拍手の音など)、人や動物の声(小鳥のさえずり、犬・猫の鳴き声、笑い声や泣き声、歓声、など)、音楽などを入力音としてもよい。なお、本実施形態では、音声を入力音の代表例として説明する。
図2Bは、変換部201の構成を示すブロック図である。図2Bに示すように、変換部201はフレーム分割部211、窓がけ処理部(windowing unit)212、およびフーリエ変換部213を含む。劣化信号サンプルは、フレーム分割部211に供給され、K/2サンプルごとのフレームに分割される。ここで、Kは偶数とする。フレームに分割された劣化信号サンプルは、窓がけ処理部212に供給され、窓関数(window function)であるw(t)との乗算が行なわれる。第nフレームの入力信号x(t, n) (t=0, 1, ..., K/2-1) に対するw(t)で窓がけ(windowing)された信号は、次式で与えられる。
また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。オーバラップ長としてフレーム長の50%を仮定すれば、t=0, 1, ..., K-1 に対して、以下の式で得られる左辺が、窓がけ処理部212の出力となる。
実数信号に対しては、左右対称窓関数が用いられる。また、窓関数は、変換部201の出力を逆変換部204に直接供給したときの入力信号と出力信号が計算誤差を除いて一致するように設計される。これは、w2(t)+w2(t+K/2)=1 となることを意味する。
このほかにも、ハミング窓、三角窓など、様々な窓関数が知られている。窓がけされた出力はフーリエ変換部213に供給され、劣化信号スペクトルX(k, n)に変換される。劣化信号スペクトルX(k, n)は位相と振幅に分離され、劣化信号位相スペクトルargX(k, n)は逆変換部204に、劣化信号振幅スペクトル|X(k, n)|は、定常成分推定部202および置換部203に供給される。既に説明したように、振幅スペクトルの代わりにパワースペクトルを利用することもできる。
図2Cは、逆変換部204の構成を示すブロック図である。図2Cに示すように、逆変換部204は逆フーリエ変換部241、窓がけ処理部242およびフレーム合成部243を含む。逆フーリエ変換部241は、置換部203から供給された強調信号振幅スペクトル(|Y(k, n)|)(図中Y)と変換部201から供給された劣化信号位相スペクトル220(arg X(k, n))とを用いて、以下のように強調信号スペクトルY(k, n)を求める。
ただし、j は虚数単位である。
得られた強調信号スペクトルに逆フーリエ変換を施し、1フレームがKサンプルを含む時間領域サンプル値系列 y(t, n) (t=0, 1, ..., K-1)として、窓がけ処理部242に供給され、窓関数w(t)との乗算が行なわれる。第nフレームの強調信号 y(t, n) (t=0, 1, ..., K-1)に対してw(t)で窓がけされた信号は、次式の左辺で与えられる。
定常成分スペクトルとは、入力信号振幅スペクトルに含まれる定常成分のことである。定常成分は、パワーの時間変化が入力信号よりも小さいという特徴を持つ。時間変化は差分または比で算出されることが一般的である。時間変化を差分で計算する場合、あるフレーム n において入力信号振幅スペクトルと定常成分スペクトルを比較すると、次式の関係を満足する周波数 k が少なくとも1つは存在する。
また、時間変化を比で計算する場合には、次式の関係を満足する周波数 k が少なくとも1つは存在する。
つまり、全てのフレームnと周波数 k において、上式の左辺のほうが右辺よりも必ず大きい場合、N(k, n)は定常成分スペクトルでは無い、と定義できる。関数がXとNの指数や対数、累乗でも同様に定義できる。
定常成分スペクトルの推定には、非特許文献1や非特許文献2に記載の方法など、様々な推定方法が利用できる。
図3は、ある時刻 n における、劣化信号振幅スペクトル(以降、入力信号ともいう)|X(k, n)|と定常成分スペクトル(定常成分信号)N(k, n)と、強調信号振幅スペクトル(以降、処理結果)|Y(k, n)|との関係を示す図である。図中では、それぞれX、N、およびYと表記している。本実施形態では、全ての周波数において入力信号|X(k, n)|を定常成分信号N(k, n)の所定係数α(k, n)倍のα(k, n)N(k, n)で置き換える。図3では、α(k, n)=0.8とした場合の例を示している。
定常成分信号N(k, n)に積算する係数α(k, n)としては経験的に適切な値を決める。例えば、α(k, n)=1なら、|Y(k, n)|=N(k, n)となり、定常成分信号N(k, n)がそのまま逆変換部104への出力信号となる。このとき、定常成分信号N(k, n)が大きいと、大きな雑音が残ってしまう。そこで、逆変換部104へ出力する振幅成分の最大値が所定値以下になるように、α(k, n)を定めてもよい。例えば、α(k, n)=0.5ならパワー半分の定常成分信号N(k, n)に置き換えることになる。α(k, n)=0.1だと、音は小さくなって形は定常成分信号N(k, n)と同じスペクトル形になる。
次に本発明の第3実施形態に係る信号処理装置について、図6〜図8を用いて説明する。図6は、本実施形態に係る信号処理装置の置換部603の構成を説明するための図である。本実施形態に係る置換部603は、上記第2実施形態と比べると、比較部631と上側置換部632を有する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
(1)あらかじめ入力信号の短時間移動平均X_bar(k, n)(kとnは、それぞれ周波数および時刻に対応するインデックス)を、例えば、以下のように計算しておく|X_bar(k, n)| = (|X(k, n-2)| + |X(k, n-1)| + |X(k, n)| + |X(k, n+1)| + |X(k, n+2)|)/5(2)短時間移動平均(|X_bar(k, n)|)と置き換え後の値(α2(k, n)・N(k, n))の差分を計算し、差分が大きければ、差分が小さくなるようにα2(k, n)の値を変更する。変更後の値を α2_hat(k, n) とすると、変更方法は、以下が考えられる。 (a)一様に α2_hat(k, n) = 0.5・α2(k, n) とする (あらかじめ定めた値で定数倍する)。 (b)α2_hat(k, n) = |X_bar(k, n)|/|N(k, n)| とする (|X_bar(k, n)| と |N(k, n)|を使って計算する)。 (c)α2_hat(k, n) = 0.8・|X_bar(k, n)|/|N(k, n)| + 0.2 とする (同上)。
計算式1:α2(k, n-1) = |X_bar(k, n)|/N(k, n)
計算式2:α2(k, n) = |X_bar(k, n)|/N(k, n)
計算式3:α2(k, n+1) = |X_bar(k, n)|/N(k, n)
このように、定常成分信号N(k, n)では短い時間での振幅成分信号の「飛び出し」を抑えきれない場合には、短時間移動平均を用いて置換して、音質を向上させることもできる。
次に本発明の第4実施形態に係る信号処理装置について、図9〜図11を用いて説明する。図9は、本実施形態に係る信号処理装置の置換部903の構成を説明するための図である。本実施形態に係る置換部903は、上記第2実施形態と比べると、比較部931と下側置換部932を有する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
(1)あらかじめ入力信号の短時間移動平均X_bar(k, n)(kとnは、それぞれ周波数および時刻に対応するインデックス)を、例えば、以下のように計算しておくX_bar(k, n) = (X(k, n-2) + X(k, n-1) + X(k, n) + X(k, n+1) + X(k, n+2))/5(2)短時間移動平均(X_bar(k, n))と置き換え後の値(β2(k, n)・N(k, n))の差分を計算し、差分が大きければ、差分が小さくなるようにβ2(k, n)の値を変更する。変更後の値を β2_hat(k, n) とすると、変更方法は、以下が考えられる。 (a)一様に β2_hat(k, n) = 0.5・β2(k, n) とする (あらかじめ定めた値で定数倍する)。 (b)β2_hat(k, n) = X_bar(k, n)/N(k, n) とする (X_bar(k, n) と N(k, n)を使って計算する)。 (c)β2_hat(k, n) = 0.8・X_bar(k, n)/N(k, n) + 0.2 とする (同上)。
計算式1:β2(k, n-1) = X_bar(k, n)/N(k, n)
計算式2:β2(k, n) = X_bar(k, n)/N(k, n)
計算式3:β2(k, n+1) = X_bar(k, n)/N(k, n)
このように、定常成分信号N(k, n)では、短い時間での振幅成分の「飛び出し」を抑えきれない場合には、短時間移動平均を用いて置換して、音質を向上させることもできる。
次に本発明の第5実施形態に係る信号処理装置について、図12、図13を用いて説明する。図12は、本実施形態に係る信号処理装置の置換部1203の構成を説明するための図である。本実施形態に係る置換部1203は、上記第2実施形態と比べると、第1比較部1231と上側置換部1232と第2比較部1233と下側置換部1234を有する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第6実施形態に係る信号処理装置について、図14、図15を用いて説明する。図14は、本実施形態に係る信号処理装置の置換部1403の構成を説明するための図である。本実施形態に係る置換部1403は、上記第3実施形態と比べると、上側置換部1432が劣化信号振幅スペクトル|X(k, n)|の係数α(k, n)倍を用いて置換を行う処理が異なる。その他の構成および動作は、第3実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第7実施形態に係る信号処理装置について、図16を用いて説明する。図16は、本実施形態に係る信号処理装置の置換部1603の構成を説明するための図である。本実施形態に係る置換部1603は、上記第5実施形態と比べると、上側置換部1632が、第6実施形態の置換部1403のように劣化信号振幅スペクトル|X(k, n)|の係数|α(k, n)|倍を用いて置換を行う処理が異なる。その他の構成および動作は、第5実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第8実施形態に係る信号処理装置について、図17を用いて説明する。図17は、本実施形態に係る信号処理装置1700の構成を説明するための図である。本実施形態に係る信号処理装置1700は、上記第2実施形態と比べると、音声検出部1701を備え、置換部1703が音声検出結果に応じた置換処理を行う点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第9実施形態に係る信号処理装置について、図18〜図21を用いて説明する。図18は、本実施形態に係る信号処理装置1800の構成を説明するための図である。本実施形態に係る信号処理装置1800は、上記第2実施形態と比べると、音声検出部1801を備え、置換部1803が音声検出結果に応じた置換処理を行う点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第10実施形態に係る信号処理装置について、図22を用いて説明する。図22は、本実施形態に係る置換部2203の構成を説明するための図である。本実施形態に係る置換部2203は、上記第8実施形態と比べると、比較部631と上側置換部2232を有する点で異なる。比較部631は、図6を用いて説明したものと同様であり、その他の構成および動作は、第8実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第11実施形態に係る信号処理装置について、図23を用いて説明する。図23は、本実施形態に係る信号処理装置の置換部2303の構成を説明するための図である。本実施形態に係る置換部2303は、上記第8実施形態と比べると、比較部931と下側置換部2332を有する点で異なる。また、比較部931は、図9において説明したものと同様であり、その他の構成および動作は、第8実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第12実施形態に係る信号処理装置について、図24を用いて説明する。図24は、本実施形態に係る信号処理装置の置換部2403の構成を説明するための図である。本実施形態に係る置換部2403は、上記第8実施形態と比べると、第1比較部1231と上側置換部2432と第2比較部1233と下側置換部2434を有する点で異なる。また、第1比較部1231と第2比較部1233は、図12において説明したものと同様のものであり、その他の構成および動作は、第8実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第13実施形態に係る信号処理装置について、図25を用いて説明する。図25は、本実施形態に係る信号処理装置の置換部2503の構成を説明するための図である。本実施形態に係る置換部2503は、上記第10実施形態と比べると、上側置換部2532が、第6実施形態と同様に劣化信号振幅スペクトル|X(k, n)|の係数α2(k, n)倍を用いて置換を行う処理が異なる。その他の構成および動作は、第10実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第14実施形態に係る信号処理装置について、図26を用いて説明する。図26は、本実施形態に係る信号処理装置の置換部2603の構成を説明するための図である。本実施形態に係る置換部2603は、上記第12実施形態と比べると、上側置換部2632が、第7実施形態と同様に劣化信号振幅スペクトル|X(k, n)|の係数α2(k, n)倍を用いて置換を行う処理が異なる。その他の構成および動作は、第11実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第15実施形態に係る信号処理装置について、図27、図28を用いて説明する。図27は、本実施形態に係る信号処理装置2700の構成を説明するための図である。本実施形態に係る信号処理装置2700は、上記第2実施形態と比べると雑音抑圧部2701を備え、置換部203が雑音抑圧結果を置換する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第16実施形態に係る信号処理装置について、図29を用いて説明する。図29は、本実施形態に係る置換部2903の構成を説明するための図である。本実施形態に係る置換部2903は、上記第2実施形態と比べると、第1比較部2931、上側置換部2932、第2比較部2933、下側置換部2934、およびゲイン計算部2935を備える点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
次に本発明の第17実施形態に係る信号処理装置について、図30を用いて説明する。図30は、本実施形態に係る信号処理装置3000の構成を説明するための図である。本実施形態に係る信号処理装置3000は、上記第15実施形態と比べると、さらに、図17で説明した音声検出部1701を備える点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
上記実施形態の信号処理装置は、ビデオ撮影時や音声録音時の風切り音、車両通過音(自動車・新幹線)、ヘリコプター飛行音、街頭の騒音、カフェテリア雑音、オフィス雑音、衣擦れ音などの抑圧に適用できる。ただし、本発明はこれに限定されるものではなく、入力信号からの非定常雑音の抑圧を要求されるあらゆる信号処理装置に適用可能である。
上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
入力信号を、周波数領域における振幅成分信号に変換する変換手段と、
周波数領域における前記振幅成分信号に基づいて、定常的な特性を備えた周波数スペクトルを有する定常成分信号を推定する定常成分推定手段と、
前記変換手段が求めた振幅成分信号と前記定常成分信号とを用いて、新たな振幅成分信号を生成し、前記振幅成分信号を、前記新たな振幅成分信号に置き換える置換手段と、
前記新たな振幅成分信号を用いて強調信号に逆変換する逆変換手段と、
を備えた信号処理装置。
(付記2)
前記置換手段は、少なくとも一部の周波数において、前記定常成分信号の関数に基づいて、前記新たな振幅成分信号を生成する付記1に記載の信号処理装置。
(付記3)
前記置換手段は、少なくとも一部の周波数において、前記定常成分信号に係数を乗算して前記新たな振幅成分信号を生成する付記1または2に記載の信号処理装置。
(付記4)
前記置換手段は、前記定常成分信号の第1関数に基づいて決定された第1閾値よりも前記振幅成分信号が大きい周波数において、前記定常成分信号の第2関数に基づいて前記新たな振幅成分信号を生成する請求項1、2又は3に記載の信号処理装置。
(付記5)
前記置換手段は、
前記第1閾値と前記振幅成分信号とを比較する比較手段と、
前記振幅成分信号が前記第1閾値よりも大きい周波数において、前記振幅成分信号を前記定常成分信号の第2関数に基づいて前記新たな振幅成分信号を生成し、前記振幅成分信号が前記第1閾値以下の周波数において、前記変換手段が求めた振幅成分信号をそのまま前記新たな振幅成分信号とする上側置換手段と、
を含む付記4に記載の信号処理装置。
(付記6)
前記置換手段は、
前記第1閾値としての前記定常成分信号の第1係数倍と、前記振幅成分信号とを比較する比較手段と、
前記振幅成分信号が前記定常成分信号の第1係数倍よりも大きい場合に、前記第2関数としての前記定常成分信号の第2係数倍を前記新たな振幅成分信号とし、前記振幅成分信号が前記定常成分信号の第1係数倍以下の場合に、前記変換手段が求めた振幅成分信号をそのまま前記新たな振幅成分信号とする上側置換手段と、
を含む付記4に記載の信号処理装置。
(付記7)
前記置換手段は、前記定常成分信号の第3関数に基づいて決定された第2閾値よりも前記振幅成分信号が小さい周波数において、前記定常成分信号の第4関数に基づいて前記新たな振幅成分信号を生成する付記1乃至6のいずれか1項に記載の信号処理装置。
(付記8)
前記置換手段は、
前記第2閾値と前記振幅成分信号とを比較する比較手段と、
前記振幅成分信号が前記第2閾値よりも大きい周波数において、前記振幅成分信号を前記定常成分信号の第2関数に基づいて前記新たな振幅成分信号を生成し、前記振幅成分信号が前記第2閾値以下の周波数において、前記変換手段が求めた振幅成分信号をそのまま前記新たな振幅成分信号とする上側置換手段と、
を含む付記1乃至7のいずれか1項に記載の信号処理装置。
(付記9)
前記置換手段は、
前記第2閾値としての前記定常成分信号の第3係数倍と、前記振幅成分信号とを比較する比較手段と、
前記振幅成分信号が前記定常成分信号の前記第3係数倍よりも小さい場合に、前記定常成分信号の第4係数倍を前記新たな振幅成分信号とし、前記振幅成分信号が前記定常成分信号の前記第3係数倍以上の場合に、前記変換手段が求めた振幅成分信号をそのまま前記新たな振幅成分信号とする下側置換手段と、
を含む付記7に記載の信号処理装置。
(付記10)
前記置換手段は、
前記定常成分信号の第5関数に基づいて決定された第3閾値よりも前記振幅成分信号が大きい周波数において、前記定常成分信号の第6関数に基づいて前記新たな振幅成分信号を生成して置換し、
前記振幅成分信号が前記定常成分信号の第7関数に基づいて決定された第4閾値よりも小さい周波数において、前記定常成分信号の第8関数に基づいて前記新たな振幅成分信号を生成して置換し、
前記第3閾値は、前記第4閾値以上である付記1乃至9のいずれか1項に記載の信号処理装置。
(付記11)
前記置換手段は、
前記第3閾値としての前記定常成分信号の第5係数倍と前記振幅成分信号とを比較する第1比較手段と、
前記振幅成分信号が前記定常成分信号の前記第5係数倍よりも大きい場合に、前記定常成分信号の第6係数倍を前記新たな振幅成分信号として前記振幅成分信号を置換し、前記振幅成分信号が前記定常成分信号の第5係数倍以下の場合に、前記変換手段が求めた振幅成分信号をそのまま前記新たな振幅成分信号とする上側置換手段と、
前記第4閾値としての前記定常成分信号の第6係数倍と前記上側置換手段が出力した新たな振幅成分信号とを比較する第2比較手段と、
前記上側置換手段が出力した新たな振幅成分信号が前記定常成分信号の第6係数倍よりも小さい場合に、前記定常成分信号の第7係数倍を用いて、前記上側置換手段が求めた新たな振幅成分信号をさらに置換し、前記振幅成分信号が前記定常成分信号の第6係数倍以上の場合に、前記上側置換手段が求めた新たな振幅成分信号をそのまま出力する下側置換手段と、
を含む付記10に記載の信号処理装置。
(付記12)
前記置換手段は、
前記振幅成分信号と前記定常成分信号の第7係数倍とを比較する比較手段と、
前記振幅成分信号が前記定常成分信号の第7係数倍よりも大きい場合に、前記振幅成分信号の第8係数倍を、前記新たな振幅成分信号として前記振幅成分信号を置換し、前記振幅成分信号が前記定常成分信号の前記第7係数倍以下の場合に、前記変換手段が求めた振幅成分信号をそのまま前記新たな振幅成分信号とする上側置換手段と、
を含む付記1に記載の信号処理装置。
(付記13)
前記置換手段は、
前記振幅成分信号と前記定常成分信号の第9係数倍とを比較する第1比較手段と、
前記振幅成分信号が前記定常成分信号の第9係数倍よりも大きい場合に、前記振幅成分信号の第10係数倍を、前記新たな振幅成分信号として置換し、前記振幅成分信号が前記定常成分信号の第9係数倍以下の場合に、前記変換手段が求めた振幅成分信号をそのまま前記新たな振幅成分信号とする上側置換手段と、
前記上側置換手段が出力した前記新たな振幅成分信号と前記定常成分信号の第11係数倍とを比較する第2比較手段と、
前記振幅成分信号が前記定常成分信号の第11係数倍よりも小さい場合に、前記定常成分信号の第12係数倍を用いて、前記上側置換手段が求めた新たな振幅成分信号をさらに置換し、前記振幅成分信号が前記定常成分信号の第11係数倍以上の場合に、前記上側置換手段が求めた新たな振幅成分信号を出力する下側置換手段と、
を含む付記1に記載の信号処理装置。
(付記14)
前記振幅成分信号から音声を検出する音声検出手段をさらに有し、
前記置換手段は、非音声区間について、前記変換手段が求めた振幅成分信号を置換する付記1乃至13のいずれか1項に記載の信号処理装置。
(付記15)
前記振幅成分信号から音声の存在確率を検出する音声検出手段をさらに有し、
前記置換手段は、周波数領域において、音声の存在確率が低いほど、前記定常成分信号により近づくように、前記変換手段が求めた振幅成分信号を置換する付記1乃至13のいずれか1項に記載の信号処理装置。
(付記16)
前記振幅成分信号に含まれる雑音を抑圧する雑音抑圧手段をさらに備え、
前記置換手段は、
前記雑音抑圧手段が求めた強調振幅成分信号と前記定常成分信号とを用いて、新たな振幅成分信号を生成し、前記振幅成分信号を、前記新たな振幅成分信号に置き換える付記1乃至15のいずれか1項に記載の信号処理装置。
(付記17)
入力信号を、周波数領域における振幅成分信号に変換する変換ステップと、
周波数領域における前記振幅成分信号に基づいて、定常的な特性を備えた周波数スペクトルを有する定常成分信号を推定する定常成分推定ステップと、
前記変換ステップで求めた振幅成分信号と前記定常成分信号とを用いて、新たな振幅成分信号を生成し、前記振幅成分信号を、前記新たな振幅成分信号に置き換える置換ステップと、
前記新たな振幅成分信号を用いて強調信号に逆変換する逆変換ステップと、
を含む信号処理方法。
(付記18)
入力信号を、周波数領域における振幅成分信号に変換する変換ステップと、
周波数領域における前記振幅成分信号に基づいて、定常的な特性を備えた周波数スペクトルを有する定常成分信号を推定する定常成分推定ステップと、
前記変換ステップで求めた振幅成分信号と前記定常成分信号とを用いて、新たな振幅成分信号を生成し、前記振幅成分信号を、前記新たな振幅成分信号に置き換える置換ステップと、
前記新たな振幅成分信号を用いて強調信号に逆変換する逆変換ステップと、
をコンピュータに実行させる信号処理プログラム。
この出願は、2013年4月11日に出願された日本出願特願2013−83411を基礎とする優先権を主張し、その開示の全てをここに取り込む。
Claims (14)
- 入力信号を、周波数領域における振幅成分信号に変換する変換手段と、
周波数領域における前記振幅成分信号に基づいて、定常的な特性を備えた周波数スペクトルを有する定常成分信号を推定する定常成分推定手段と、
前記振幅成分信号と前記定常成分信号とがある周波数においてあらかじめ定められた大小関係を満たすときに、前記振幅成分信号または前記定常成分信号を用いて当該周波数における新たな振幅成分信号を生成し、前記変換手段が求めた振幅成分信号を前記新たな振幅成分信号に置き換える置換手段と、
前記新たな振幅成分信号を用いて強調信号に逆変換する逆変換手段と、
を備えた信号処理装置。 - 前記置換手段は、前記定常成分信号の第1係数倍よりも前記振幅成分信号が大きい周波数において、前記新たな振幅成分信号を生成する請求項1に記載の信号処理装置。
- 前記置換手段は、
前記定常成分信号の前記第1係数倍と前記振幅成分信号とを比較する第1比較手段と、
前記振幅成分信号が前記定常成分信号の前記第1係数倍よりも大きい場合に、前記定常成分信号の第2係数倍を前記新たな振幅成分信号とし、前記振幅成分信号が前記定常成分信号の前記第1係数倍以下の場合に、前記変換手段が求めた振幅成分信号をそのまま前記新たな振幅成分信号とする第1上側置換手段と、
を含む請求項1に記載の信号処理装置。 - 前記置換手段は、前記定常成分信号の第3係数倍よりも前記振幅成分信号が小さい周波数において、前記新たな振幅成分信号を生成する請求項1に記載の信号処理装置。
- 前記置換手段は、
前記定常成分信号の第3係数倍と前記振幅成分信号とを比較する第2比較手段と、
前記振幅成分信号が前記定常成分信号の前記第3係数倍よりも小さい場合に、前記定常成分信号の第4係数倍を前記新たな振幅成分信号とし、前記振幅成分信号が前記定常成分信号の前記第3係数倍以上の場合に、前記変換手段が求めた振幅成分信号をそのまま前記新たな振幅成分信号とする第1下側置換手段と、
を含む請求項1に記載の信号処理装置。 - 前記置換手段は、
前記定常成分信号の前記第1係数倍よりも前記振幅成分信号が大きい周波数において、前記定常成分信号に基づいて前記新たな振幅成分信号を生成して置換し、
前記振幅成分信号が前記定常成分信号の第3係数倍よりも小さい周波数において、前記定常成分信号に基づいて前記新たな振幅成分信号を生成して置換し、
前記第1係数は、前記第3係数以上である請求項1乃至5のいずれか1項に記載の信号処理装置。 - 前記置換手段は、
前記定常成分信号の第1係数倍と前記振幅成分信号とを比較する第1比較手段と、
前記振幅成分信号が前記定常成分信号の前記第1係数倍よりも大きい場合に、前記定常成分信号の第2係数倍を前記新たな振幅成分信号として前記振幅成分信号を置換し、前記振幅成分信号が前記定常成分信号の第1係数倍以下の場合に、前記変換手段が求めた振幅成分信号をそのまま前記新たな振幅成分信号とする第1上側置換手段と、
前記定常成分信号の第3係数倍と前記第1上側置換手段が出力した新たな振幅成分信号とを比較する第3比較手段と、
前記第1上側置換手段が出力した新たな振幅成分信号が前記定常成分信号の第3係数倍よりも小さい場合に、前記定常成分信号の第4係数倍で前記第1上側置換手段が求めた新たな振幅成分信号をさらに置換し、前記振幅成分信号が前記定常成分信号の第3係数倍以上の場合に、前記第1上側置換手段が求めた新たな振幅成分信号をそのまま出力する第2下側置換手段と、
を含む請求項1に記載の信号処理装置。 - 前記置換手段は、
前記定常成分信号の第1係数倍と前記振幅成分信号とを比較する第1比較手段と、
前記振幅成分信号が前記定常成分信号の第1係数倍よりも大きい場合に、前記振幅成分信号の第2係数倍を、前記新たな振幅成分信号として前記振幅成分信号を置換し、前記振幅成分信号が前記定常成分信号の前記第1係数倍以下の場合に、前記変換手段が求めた振幅成分信号をそのまま前記新たな振幅成分信号とする第2上側置換手段と、
を含む請求項1に記載の信号処理装置。 - 前記置換手段は、
前記振幅成分信号と前記定常成分信号の第1係数倍とを比較する第1比較手段と、
前記振幅成分信号が前記定常成分信号の第1係数倍よりも大きい場合に、前記振幅成分信号の第2係数倍を、前記新たな振幅成分信号として置換し、前記振幅成分信号が前記定常成分信号の第1係数倍以下の場合に、前記変換手段が求めた振幅成分信号をそのまま前記新たな振幅成分信号とする第2上側置換手段と、
前記第2上側置換手段が出力した前記新たな振幅成分信号と前記定常成分信号の第3係数倍とを比較する第3比較手段と、
前記振幅成分信号が前記定常成分信号の第3係数倍よりも小さい場合に、前記定常成分信号の第4係数倍を用いて、前記第2上側置換手段が求めた新たな振幅成分信号をさらに置換し、前記振幅成分信号が前記定常成分信号の第3係数倍以上の場合に、前記第2上側置換手段が求めた新たな振幅成分信号を出力する第3下側置換手段と、
を含む請求項1に記載の信号処理装置。 - 前記振幅成分信号から音声を検出する音声検出手段をさらに有し、
前記置換手段は、非音声区間について、前記変換手段が求めた振幅成分信号を置換する請求項1乃至9のいずれか1項に記載の信号処理装置。 - 前記振幅成分信号から音声の存在確率を検出する音声検出手段をさらに有し、
前記置換手段は、周波数領域において、音声の存在確率が低いほど、前記定常成分信号により近づくように、前記変換手段が求めた振幅成分信号を置換する請求項1乃至9のいずれか1項に記載の信号処理装置。 - 前記振幅成分信号に含まれる雑音を抑圧する雑音抑圧手段をさらに備え、
前記置換手段は、
前記雑音抑圧手段が求めた強調振幅成分信号と前記定常成分信号とを用いて、新たな振幅成分信号を生成し、前記振幅成分信号を、前記新たな振幅成分信号に置き換える請求項1乃至11のいずれか1項に記載の信号処理装置。 - 入力信号を、周波数領域における振幅成分信号に変換する変換ステップと、
周波数領域における前記振幅成分信号に基づいて、定常的な特性を備えた周波数スペクトルを有する定常成分信号を推定する定常成分推定ステップと、
前記振幅成分信号と前記定常成分信号とがある周波数においてあらかじめ定められた大小関係を満たすときに、前記振幅成分信号または前記定常成分信号を用いて、当該周波数における新たな振幅成分信号を生成し、前記振幅成分信号を、前記新たな振幅成分信号に置き換える置換ステップと、
前記新たな振幅成分信号を用いて強調信号に逆変換する逆変換ステップと、
を含む信号処理方法。 - 入力信号を、周波数領域における振幅成分信号に変換する変換ステップと、
周波数領域における前記振幅成分信号に基づいて、定常的な特性を備えた周波数スペクトルを有する定常成分信号を推定する定常成分推定ステップと、
前記振幅成分信号と前記定常成分信号とがある周波数においてあらかじめ定められた大小関係を満たすときに、前記振幅成分信号または前記定常成分信号を用いて、当該周波数における新たな振幅成分信号を生成し、前記振幅成分信号を、前記新たな振幅成分信号に置き換える置換ステップと、
前記新たな振幅成分信号を用いて強調信号に逆変換する逆変換ステップと、
をコンピュータに実行させる信号処理プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013083411 | 2013-04-11 | ||
JP2013083411 | 2013-04-11 | ||
PCT/JP2014/058961 WO2014168021A1 (ja) | 2013-04-11 | 2014-03-27 | 信号処理装置、信号処理方法および信号処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2014168021A1 JPWO2014168021A1 (ja) | 2017-02-16 |
JP6544234B2 true JP6544234B2 (ja) | 2019-07-17 |
Family
ID=51689432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015511204A Active JP6544234B2 (ja) | 2013-04-11 | 2014-03-27 | 信号処理装置、信号処理方法および信号処理プログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US10741194B2 (ja) |
EP (1) | EP2985761B1 (ja) |
JP (1) | JP6544234B2 (ja) |
CN (1) | CN105144290B (ja) |
WO (1) | WO2014168021A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10181329B2 (en) * | 2014-09-05 | 2019-01-15 | Intel IP Corporation | Audio processing circuit and method for reducing noise in an audio signal |
US9838737B2 (en) * | 2016-05-05 | 2017-12-05 | Google Inc. | Filtering wind noises in video content |
CN106101925B (zh) * | 2016-06-27 | 2020-02-21 | 联想(北京)有限公司 | 一种控制方法及电子设备 |
JP7152112B2 (ja) * | 2018-08-24 | 2022-10-12 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
CN109547848B (zh) | 2018-11-23 | 2021-02-12 | 北京达佳互联信息技术有限公司 | 响度调整方法、装置、电子设备以及存储介质 |
US11932256B2 (en) * | 2021-11-18 | 2024-03-19 | Ford Global Technologies, Llc | System and method to identify a location of an occupant in a vehicle |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6122384A (en) | 1997-09-02 | 2000-09-19 | Qualcomm Inc. | Noise suppression system and method |
JP4282227B2 (ja) | 2000-12-28 | 2009-06-17 | 日本電気株式会社 | ノイズ除去の方法及び装置 |
JP2003058186A (ja) * | 2001-08-13 | 2003-02-28 | Yrp Kokino Idotai Tsushin Kenkyusho:Kk | 雑音抑圧方法および雑音抑圧装置 |
JP4286637B2 (ja) * | 2002-11-18 | 2009-07-01 | パナソニック株式会社 | マイクロホン装置および再生装置 |
US7577262B2 (en) * | 2002-11-18 | 2009-08-18 | Panasonic Corporation | Microphone device and audio player |
JP4670483B2 (ja) * | 2005-05-31 | 2011-04-13 | 日本電気株式会社 | 雑音抑圧の方法及び装置 |
CN101627428A (zh) * | 2007-03-06 | 2010-01-13 | 日本电气株式会社 | 抑制杂音的方法、装置以及程序 |
JP5219499B2 (ja) | 2007-08-01 | 2013-06-26 | 三洋電機株式会社 | 風雑音低減装置 |
DE102007030209A1 (de) * | 2007-06-27 | 2009-01-08 | Siemens Audiologische Technik Gmbh | Glättungsverfahren |
JP5207479B2 (ja) * | 2009-05-19 | 2013-06-12 | 国立大学法人 奈良先端科学技術大学院大学 | 雑音抑圧装置およびプログラム |
US8571231B2 (en) * | 2009-10-01 | 2013-10-29 | Qualcomm Incorporated | Suppressing noise in an audio signal |
JP5728870B2 (ja) | 2010-09-29 | 2015-06-03 | 井関農機株式会社 | コンバイン |
JP6064600B2 (ja) | 2010-11-25 | 2017-01-25 | 日本電気株式会社 | 信号処理装置、信号処理方法、及び信号処理プログラム |
JP5919647B2 (ja) | 2011-05-11 | 2016-05-18 | 富士通株式会社 | 風雑音抑圧装置、半導体集積回路及び風雑音抑圧方法 |
JP6004792B2 (ja) | 2011-07-06 | 2016-10-12 | 本田技研工業株式会社 | 音響処理装置、音響処理方法、及び音響処理プログラム |
-
2014
- 2014-03-27 CN CN201480020786.1A patent/CN105144290B/zh active Active
- 2014-03-27 JP JP2015511204A patent/JP6544234B2/ja active Active
- 2014-03-27 WO PCT/JP2014/058961 patent/WO2014168021A1/ja active Application Filing
- 2014-03-27 EP EP14783172.1A patent/EP2985761B1/en active Active
- 2014-03-27 US US14/782,932 patent/US10741194B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10741194B2 (en) | 2020-08-11 |
EP2985761B1 (en) | 2021-01-13 |
WO2014168021A1 (ja) | 2014-10-16 |
EP2985761A1 (en) | 2016-02-17 |
US20160055863A1 (en) | 2016-02-25 |
CN105144290B (zh) | 2021-06-15 |
EP2985761A4 (en) | 2016-12-21 |
CN105144290A (zh) | 2015-12-09 |
JPWO2014168021A1 (ja) | 2017-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6544234B2 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
JP7191793B2 (ja) | 信号処理装置、信号処理方法、及びプログラム | |
US9113241B2 (en) | Noise removing apparatus and noise removing method | |
JP5127754B2 (ja) | 信号処理装置 | |
JP5528538B2 (ja) | 雑音抑圧装置 | |
JP6780644B2 (ja) | 信号処理装置、信号処理方法、および信号処理プログラム | |
CN105103230B (zh) | 信号处理装置、信号处理方法、信号处理程序 | |
US20100207689A1 (en) | Noise suppression device, its method, and program | |
JP6225245B2 (ja) | 信号処理装置、方法及びプログラム | |
US20150205575A1 (en) | Audio signal processing apparatus and method thereof | |
JP6064600B2 (ja) | 信号処理装置、信号処理方法、及び信号処理プログラム | |
KR20150032390A (ko) | 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법 | |
JP2008216721A (ja) | 雑音抑圧の方法、装置、及びプログラム | |
JP5443547B2 (ja) | 信号処理装置 | |
US9697848B2 (en) | Noise suppression device and method of noise suppression | |
US10951978B2 (en) | Output control of sounds from sources respectively positioned in priority and nonpriority directions | |
JP5413575B2 (ja) | 雑音抑圧の方法、装置、及びプログラム | |
JP2006215228A (ja) | 音声信号分析方法およびこの分析方法を実施する装置、この音声信号分析装置を用いた音声認識装置、この分析方法を実行するプログラムおよびその記憶媒体 | |
JP2003131689A (ja) | ノイズ除去方法及び装置 | |
JP5316127B2 (ja) | 音処理装置およびプログラム | |
JPWO2013032025A1 (ja) | 信号処理装置、信号処理方法、およびコンピュータ・プログラム | |
JP2013130815A (ja) | 雑音抑圧装置 | |
JP6559576B2 (ja) | 雑音抑圧装置、雑音抑圧方法及びプログラム | |
JP2006084659A (ja) | オーディオ信号分析方法、その方法を用いた音声認識方法、それらの装置、プログラムおよびその記録媒体 | |
JP2006084665A (ja) | オーディオ信号分析方法、その方法を用いた音声認識方法、それらの装置、プログラムおよびその記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180403 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180604 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181025 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190521 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190603 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6544234 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |