JP2010249939A - ノイズ低減装置、ノイズ判定方法 - Google Patents
ノイズ低減装置、ノイズ判定方法 Download PDFInfo
- Publication number
- JP2010249939A JP2010249939A JP2009097189A JP2009097189A JP2010249939A JP 2010249939 A JP2010249939 A JP 2010249939A JP 2009097189 A JP2009097189 A JP 2009097189A JP 2009097189 A JP2009097189 A JP 2009097189A JP 2010249939 A JP2010249939 A JP 2010249939A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- signal
- interpolation
- audio signal
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 109
- 230000005236 sound signal Effects 0.000 claims abstract description 227
- 238000005070 sampling Methods 0.000 claims abstract description 65
- 230000008569 process Effects 0.000 claims description 80
- 230000009467 reduction Effects 0.000 claims description 71
- 238000004364 calculation method Methods 0.000 claims description 69
- 238000010606 normalization Methods 0.000 claims description 55
- 238000000059 patterning Methods 0.000 claims description 31
- 230000015572 biosynthetic process Effects 0.000 claims description 10
- 238000003786 synthesis reaction Methods 0.000 claims description 10
- 230000002194 synthesizing effect Effects 0.000 claims description 8
- 230000002238 attenuated effect Effects 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000009826 distribution Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 2
- 230000004044 response Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 138
- 230000008859 change Effects 0.000 abstract description 14
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 88
- 238000001514 detection method Methods 0.000 description 41
- 238000009432 framing Methods 0.000 description 10
- 238000004519 manufacturing process Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000005562 fading Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000013506 data mapping Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02168—Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
- G11B2020/10537—Audio or video recording
- G11B2020/10546—Audio or video recording specifically adapted for audio data
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/20—Disc-shaped record carriers
- G11B2220/21—Disc-shaped record carriers characterised in that the disc is of read-only, rewritable, or recordable type
- G11B2220/215—Recordable discs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Noise Elimination (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】入力音声信号について周波数信号に変換したうえで、周波数信号を成す分割周波数ごとに、そのサンプリング点を補間する多項式を算出する。この多項式によっては、例えば、離散的にしか得られていない分割周波数ごとの時間軸での振幅変化を連続的に扱うことができる。そして、この多項式の係数によるパターン(係数パターン)と、この係数パターンとして示されるノイズ音に対応のマッチング範囲とを比較することに基づいて、ノイズの有無についての判定を行うようにする。
【選択図】図2
Description
本願発明は、例えばノイズ除去を行うために、第1には、除去対象であるノイズの発生状況をこれまでよりも正確に判定できるようにすることを、その課題とする。
つまり、音声信号を入力する音声信号入力手段と、上記音声信号入力手段により入力して得られる入力音声信号を周波数信号に変換する時間−周波数変換手段と、上記周波数信号における分割周波数ごとに、サンプリング点間を補間するものとしてのn次の多項式(nは自然数)を求め、この多項式の各次数の係数の値の組から成る係数パターンを取得するパターン化手段と、ノイズとしてみなされる係数パターンの範囲であるマッチング範囲を示すマッチングデータを、上記分割周波数に対応させて保持する、マッチングデータ保持手段と、上記パターン化手段により取得した係数パターンと、上記マッチングデータが示すマッチング範囲とを比較した結果に基づいて、少なくとも、このとき比較した上記係数パターンデータが対応する分割周波数におけるノイズ発生の有無を判別するノイズ判定手段とを備えて構成することとした。
上記のようにして求められる多項式によっては、例えば、離散的にしか得られていない分割周波数ごとの時間軸での振幅変化を連続的に扱うことができる。これにより、多項式に基づくノイズ認識結果としては、より高い精度が得られる。
<1.ノイズ除去処理の全体的な流れ>
<2.ノイズ認識処理部の構成例(第1例)>
[2−1.全体構成]
[2−2.FFT処理]
[2−3.ピーク検出]
[2−4.多項式演算/正規化処理]
[2−5.ノイズ有無判定処理]
<3.ノイズ認識処理部の構成例(第2例)>
<4.ノイズ低減装置の構成例(第1例)>
[4−1.全体構成]
[4−2.ノイズ発生期間判定処理]
<5.ノイズ低減装置の構成例(第2例)>
<6.ノイズ低減装置の構成例(第3例)>
[6−1.全体構成例]
[6−2.ピッチに基づく補間信号生成処理(第1例)]
[6−3.ピッチに基づく補間信号生成処理(第2例)]
[6−4.ピッチに基づく補間信号生成処理(第3例)]
<7.ノイズ低減装置の構成例(第4例)>
なお、以降において、ノイズを対象としての除去、若しくは低減、という語句を用いるが、本願においては、ノイズを対象とする除去、低減は、同等の意味を持つものとする。ノイズの除去は、音声信号に重畳されているノイズを取り除こうとする動作、処理からみた語句といえる。このノイズ除去の結果としては、例えば厳密な意味で完全にノイズが取り除かれるのではなく、或る程度の成分が残留する場合がある。ノイズ低減は、このようにしてノイズ除去処理の結果からみた語句といえる。
図1のフローチャートは、本実施形態としてのノイズ低減処理装置に適用できる、ノイズ低減のための処理の全体的な手順例を示している。
なお、前提として、本実施形態のノイズ低減装置は、音声に重畳されるノイズとして、時間的に断続して不規則に発生するノイズを除去対象とする。このような時間的に断続して不規則に発生するノイズは、例えば電子機器がディスクドライブ装置を内蔵する記録再生装置などである場合には、この内蔵のディスクドライブ装置のヘッドシーク音やリトラクト音などが発生源となり得る。またビデオカメラ装置、デジタルスチルカメラなどの撮像部を備える場合には、レンズ機構におけるレンズ駆動音、また、ユーザ操作などによるクリック音、タッチ音などが発生源となる。
ステップS103においては、上記ステップS102により抽出したノイズ特徴量の情報と、ステップS104により入力したノイズ定義の情報とを比較する。ノイズ定義の情報は、予め想定したノイズ発生源が発するとするノイズの音などから得たノイズ特徴量のデータから成る。
ステップS104での比較結果として、ノイズ定義の情報とノイズ特徴量の情報とについて、一定以上の近似率があると判定されたときには、ノイズ有りと判定する。これに対して上記近似率が一定以下であると判定されたときにはノイズ無しと判定する。
これに対して、ノイズ有りとの判定結果が得られた場合には、ステップS105,S106の処理を実行する。
また、ノイズ除去処理によりノイズとしての音成分が除去される結果、元の入力音声信号のノイズ除去対象区間においては、その除去されたノイズ音声に応じた音声情報の欠落が生じる。そこで、この場合には、この音声情報の欠落を補うために、音声信号成分を補間する処理を実行する。そして、ステップS107により、ノイズ除去及び補間の補間が施された音声信号を出力する。
[2−1.全体構成]
上記図1におけるステップS101〜S105までの処理は、本実施形態のノイズ低減装置におけるノイズ認識処理部1が実行すべき処理を一般化したものとしてみることができる。
図2により、図1におけるステップS101〜S105に対応する処理、つまり、ノイズ認識処理部1について、本実施形態に対応してより具体化させた第1例としての構成例の全体を示す。
フレーム化部11は、図1のステップS101に対応して音声信号を入力する。ステップS102のノイズ特徴量抽出の処理は、フレーム化部11、FFT部12、三次元対応パターン化部13の処理が対応する。
本実施形態では、入力された時間軸による音声信号を、例えばFFT(Fast Fourier Transform:高速フーリエ変換)により周波数領域の信号(周波数信号)に変換するものとする。
フレーム化部11は、FFTの前処理として、入力音声信号について、FFTの処理単位であるフレーム単位とする処理を実行する。
フレーム化部11が入力する入力音声信号は、所定のサンプリング周波数fsと量子化ビット数による時間領域の実数データ(時間領域データ)である。一具体例として、入力音声信号のサンプリング周波数fs=44.1kHzであるとして、フレーム化部11は、図3(a)に示すように、所定の時間幅に対応する1024のデータ数により1フレームを形成するものとする。
図3(a)のように、1フレームのデータ数が1024、サンプリング周波数fs=44.1kHzである場合、実数データReと虚数データImは、それぞれ図3(b)(c)に示すようにして、ナイキスト周波数22.05kHz(44.1kHz/2)、データ数512となる。このとき実数データRe、虚数データImそれぞれの周波数分解能は、約43Hz(22.05kHz/512:ナイキスト周波数/データ数)となる。つまり、この場合のFFT処理によっては、0〜22.05kHzの周波数帯域範囲について43Hzごとに512分割して得られる周波数(以降、これを分割周波数ともいう)ごとのデータにより周波数信号が得られることになる。
なお、上記(数1)による絶対値振幅Vaは、例えば図3との対応では、実数データReと虚数データImをそれぞれ形成する512のデータのうち、同じ分割周波数のデータReを利用して求めるものとなる。また、絶対値振幅Vaは、1フレームにつき、分割周波数ごとに対応して512個が得られることになる。
本実施形態では、FFT部12の後段の三次元対応パターン化部13は、上記絶対値振幅Vaを入力して処理を実行するものとする。
FFT処理は、フレームにおける複数データを利用して行われる。このために、フレームの開始/終了位置近傍でのFFT処理は、本来は、1つのフレームの開始位置より前若しくは終了位置より後ろのデータを利用しなければならないのに、これを利用することができないために、FFT処理後のデータとしては正確な値を得ることが難しい。
そこで上記のオーバーラップ区間を設けることとすれば、1つのフレームにおける開始/終了位置近傍のFFT処理は、これとオーバーラップする他のフレームにおいて、必要なデータを全て利用して適正に実行されていることになる。これにより、FFT処理についての時間分解能を高めて、FFT処理の演算結果をより正確にすることが可能になる。
なお、このオーバーラップ区間についてのオーバーラップ率、即ち、1フレーム分の時間に対する、前後のフレームをオーバーラップさせる時間の割合については、0%〜100%未満の間で、FFT処理の周波数分解能と時間分解能とのバランスなどを考慮して適宜設定されるべきものとなる。
FFT部12により得られた周波数信号は、図2の三次元対応パターン化部13に対して出力される。
三次元対応パターン化部13は、FFT部12により得られた周波数信号に基づいて、以降説明するようにして、音声信号のノイズ成分ごとに多項式化を行い、その多項式の係数パターンを得る。即ち、ノイズのパターン認識(パターン化)を行う。また、このノイズパターン認識がステップS102によるノイズ特徴量の抽出に相当する
この図に示す三次元対応パターン化部13は、ピーク検出部21と、n個の多項式演算正規化部22−1〜22−nとから成るものとしている。
先に述べたように、FFT部12からの周波数信号は、図3(b)(c)に示す実数データReと虚数データImから成る。例えばさらには、実数データReと虚数データImが有するデータ数ごと、即ち図3の例では約43Hzの周波数分解能を有するとされる1〜512の帯域(分割周波数)ごとに、(数1)に示される演算により求められる512個の絶対値振幅Va(1)〜Va(512)として得ることができる。
このために、ピーク検出部21は、入力される周波数信号のデータ(分割周波数ごとの絶対値振幅データ)を利用してデータマッピングを行って、図7に示すマップデータを得る。このマップデータは、図6に例示するような三次元波形を表現するものとなる。
図7のマップデータは、横軸に時間をとり、縦軸に周波数をとっている。ここでは、マップデータの一部として、時間T1,T2,T3,T4,T5・・・・と、周波数F1,F2,F3,F4,F5・・・・のマトリクスとなっている部分を示している。ここでの周波数F1,F2,F3,F4,F5・・・・のそれぞれは、実数データReと虚数データImを成す512のデータごとに対応する、個々の分割された周波数に相当する。また、時間T1,T2,T3,T4,T5・・・・は、それぞれ、1つのフレームが得られる時間に相当する。
次に、このピーク検出範囲において、破線の矢印により示すように、同一時間方向と同一周波数方向にピークの探査を行い、この探査結果として時間方向と周波数方向とで同じサンプリング点でピークが得られた場合に、そのサンプリング点が対応する時間-周波数座標を第1暫定ピーク点とする。
さらに、同じピーク検出範囲において、一点鎖線により示すようにして、周波数と時間をまたぐようにして、上記時間方向/周波数方向に対して直交する2方向によりピークの探査を行い、この探査結果として時間方向と周波数方向とで同じサンプリング点でピークが得られた場合に、そのサンプリング点が対応する時間-周波数座標を第2暫定ピーク点とする。
そして、第1暫定ピーク点と第2暫定ピーク点が同じサンプリング点である場合に、そのサンプリング点の時間−周波数座標を真のピーク点として検出したものとする。
ここで、図8(a)(b)は、それぞれ、FFT部12から出力される周波数信号に基づいて得られる、時系列の帯域信号(分割周波数信号)を、或る特定の周波数Fa,Fbにおける時間経過に応じた絶対値振幅の変化により示している。ここでは、横軸が時間(T軸)とされ、縦軸が絶対値振幅(A軸)とされている。
本実施形態において扱う音声信号はデジタルデータであり、従って、時間的に離散してサンプリングされる。例として、図8(a)の周波数Faの帯域信号においては、時間T1,T2,T3,T4,T5,T6,T7ごとのサンプリング点の絶対値振幅は、それぞれ、A1a,A2a,A3a,A4a,A5a,A6a,A7aとしてその値が示されている。また、図8(b)の周波数Fbの信号においては、時間T1,T2,T3,T4,T5,T6,T7ごとのサンプリング点の絶対値振幅は、それぞれ、A1b,A2b,A3b,A4b,A5b,A6b,A7bとしてその値が示されている。
例えば、図8(a)に示されるサンプリング点ごとの絶対値振幅のピークは、時間T4におけるA4aとなる。しかし、時間T1〜T7の絶対値振幅A1a〜A7aを仮想的に曲線(図において破線で示す)で結ぶことで推定される真のピークは、時間T4よりも前のタイミングで現れている。
同じく、図8(b)においてサンプルされた絶対値振幅のピークは、時間T5におけるA5bであるが、時間T1〜T7の絶対値振幅A1b〜A7bを仮想的に曲線(図において破線で示す)で結ぶことで推定される真のピークは、時間T5よりも前のタイミングで現れている。
3次元対応パターン化部13における多項式演算/正規化部22−1〜22−nは、検出されたピークに応じたパターンを得るため、次に説明する処理を実行する。
図7との対応であれば、ピーク検出部21は、先ず、時間T2にて周波数F4のピーク1を検出し、これに対応するピーク検出信号1を出力する。次に時間T4にて周波数F2のピーク2を検出し、これに対応するピーク検出信号2を出力する。
ここで、上記の基準サンプリング点の前後のサンプリング点の数Nとしては、次に説明するようにして多項式演算/正規化部22(22−1〜22−n)が演算して求める多項式の次数設定に応じて決まるものとなる。
このようにして求められる多項式は、ピークが検出された帯域信号の波形を表現している。
ここで、n+1個の離散サンプリング点x0、x1、x2、……、xn(ただし、x0<x1<x2<……<xn)におけるデータ、y0、y1、y2、……、ynがあるとする。これらの点、(x0,y0)、(x1,y1)、(x2,y2)、……、(xn,yn)を通るラグランジェ補間曲線としての関数F(x)は、n次の多項式となるものであり、下記の(数2)により求めることができる。
4次多項式の場合には、5個(=n+1)のサンプリング点が必要であることになる。従って,この場合のピーク検出信号としては、基準サンプリング点と、この基準サンプリング点と同じ周波数で、時間的に前後する各2個のサンプリング点とを多項式演算/正規化部22に出力することになる。
これらの座標のうち、座標(0.0 , 7.0)が基準サンプリング点であり、座標(-1.0 , 6.0),(-2.0 , 1.0)が、基準サンプリング点の直前の2つのサンプリング点であり、座標(1.0 , 3.0),(2.0 , 1.0)が、基準サンプリング点の直後の2つのサンプリング点である。
F(x) = 0.3 x^4 + 0.5 x^3 - 2.8 x^2 - 2.0 x + 7.0・・・(式1)
図9(a)に示される曲線が、上記(式1)により表されるものとなる。
なお、上記のようにして多項式化する処理は、周波数軸と振幅軸とによる2次元の表現を持つ周波数信号について、さらに、時間軸(図9,図10のx軸)を加えて3次元化する処理とみることができる。
図9(b)に示される曲線を表す4次多項式、即ち、時間方向の正規化により得られた4次多項式は、下記の(式2)により表される。
F(x) = 0.3 x^4 + 0.1 x^3 - 3.1 x^2 + 7.3・・・(式2)
上記(式2)と(式1)とを比較しても分かるように、x^3による奇数次項の係数については、0.1、即ち0としてみなしてよい値に変換されている。また、xによる奇数次項の係数については0となっている。
これにより、4次多項式としては、下記(式3)により表されるものとなり、その曲線は、図9(c)に示すようにして、極大値の座標が(0.0 , 7.0)となる。
F(x) = 0.3 x^4 + 0.1 x^3 - 3.1 x^2 + 7.0・・・(式3)
このようにして切片を整数化すれば、係数パターンにおける切片の値については整数値のみを用意すればよいことになり、上記の係数パターンの単純化がより促進される。
2次多項式(n=2)の場合、多項式演算/正規化部22は、基準サンプリング点と、これに対して時間的に前後する各1つのサンプリング点との、計3個(=n+1)のサンプリング点を、ピーク検出信号として取り込む。すると、図9と同じ帯域信号の場合には、図10(a)に示すようにして、ピーク検出信号として、(0.0 , 7.0),(-1.0 , 6.0),(1.0 , 3.0)の3つのサンプリング点を得ることになる。
F(x) = -2.5 x^2 - 1.5 x + 7.0・・・(式4)
F(x) = -2.5 x^2 + 7.2・・・(式5)
上記(式5)からも分かるように、時間軸方向の正規化により、奇数次項であるxの係数は0となっている。
F(x) = -2.5 x^2 + 7.0・・・(式6)
つまり、4次多項式であれば、その一般式は、
F(x) = ax^4 + bx^3 + cx^2 + dx + e
として表すことができる。そこで、多項式演算/正規化部22は、正規化された4次多項式の係数[a,b,c,d,e]の組み合わせを示すデータを出力する。なお、ここでは、切片(e)は、x^0の係数として扱うこととしている。
また、2次多項式であれば、その一般式は、
F(x) =ax^2 + bx+ c
として表すことができる。そこで、多項式演算/正規化部22は、正規化された2次多項式の係数[a,b,c]の組み合わせを示すデータを出力する。
3次元対応パターン化部13から出力されるパターン化データF(x)は、図2に示すように、ノイズ判定部14に入力される。
ノイズ判定部14は、上記パターン化データF(x)と、マッチングテーブル15にて保持されている参照パターンデータP(x)とを比較し、その比較結果に基づいて、分割周波数ごとにノイズの有無を判定する。
先ず、本実施形態のノイズ低減装置が除去対象とするノイズ音を想定することとし、このノイズ音(想定ノイズ音)について、先に述べた多項式演算及び正規化処理を行って、正規化された多項式を求めることとする。ここでは、2次多項式(正規化2次多項式)を求めるものとする。
この図おいては、縦軸に多項式の係数値を取り、横軸に周波数をとっている。この図に示されるように、想定ノイズ音の正規化2次多項式が取り得る係数の数値範囲は、周波数に応じて定まることが分かる。
本実施形態では、このようにして求められる想定ノイズ音の正規化多項式の係数パターンの範囲を、マッチング範囲とする。なお、図11においては、マッチング範囲として、係数a、係数b、及び係数aと係数cについての係数比-c/aを定義している。
例えばマッチング範囲として、上記係数比-c/aに代えて、通常に係数cを定義してもよい。しかし、本実施形態の正規化多項式に関しては、係数aが大きいときには、係数c(切片)も大きくなる傾向にある。そこで、係数cに代えて、例えば上記の係数比-c/aを定義することとしている。これにより、単純に係数cをマッチング範囲として定義する場合よりも係数変化を平準化される。この結果、マッチング範囲のぶれが抑制されてマッチング範囲を狭くすることができ、より正確なノイズ判定結果が期待できる。
分割された各分割帯域範囲に対応する実周波数の範囲は、図示するようにして、データ位置1〜8が43.1kHz〜344.5Hz、データ位置9〜40が387.6Hz〜1.72kHz、データ位置41〜53が1.77kHz〜2.28kHz、データ位置54〜512が2.33kHz〜22.1kHzとなる。
また、データ位置54〜512に対応する最も高い分割帯域範囲2.33kHz〜22.1kHzについては、有効なマッチング範囲の上限値、下限値は格納されていない。これは、この場合に想定しているノイズ音は、約2.3kHzより高い周波数帯域では発生しないことによる。換言すれば,ここで想定しているノイズ音は、約2.3kHz(2.28kHz)以下の周波数帯域で発生するものとしている。
この場合、実際にマッチングテーブル15として持つべきデータは、データ位置1〜8(分割帯域範囲43.1kHz〜344.5Hz)、データ位置9〜40(分割帯域周波数387.6Hz〜1.72kHz)、データ位置41〜53(分割帯域周波数1.77kHz〜2.28kHz)までに対応するマッチング範囲(上限値、下限値)のデータでよいことになる。このようにして、マッチングテーブル15としては、必ずしも、FFT後のデータに対応する全ての分割周波数に応じたマッチング範囲のデータを持つ必要はなく、ノイズ音が発生する周波数帯域範囲の分割周波数のみに対応したマッチング範囲のデータを持てばよい。これにより、マッチングテーブル15として実際に必要なデータサイズを小さくできる。
ノイズ判定部14は、先ず、3次元対応パターン化部13からパターン化データF(x)として、ピークが検出された帯域信号ごとに対応するピーク1係数データ〜ピークn係数データを入力する。また、マッチングテーブル15から、ピーク1係数データ〜ピークn係数データのそれぞれ対応する分割周波数(データ位置)に対応付けられている、係数a,b及び係数比-c/a(又は係数c)のマッチング範囲(上限値/下限値)のデータを、参照パターンデータP(x)として入力する。
次にノイズ判定部14は、比較処理として、ピーク1係数データが示す係数a,b、係数比-c/aについて、それぞれ、同じ分割周波数(データ位置)に対応付けられている係数a,b、係数比-c/aのマッチング範囲に含まれるものであるか否かを判定する。
ここで、ピーク1係数データが示す係数a,b、係数比-c/aの全てがマッチング範囲に含まれていれば、ピーク1係数データの元となった帯域信号はノイズ音である判定する。つまり、ノイズ有りとの判定結果を得る。これに対して、ピーク1係数データが示す係数a,b、係数比-c/aのうち、1つでもマッチング範囲に含まれていないのであれば、ノイズ無しとの判定結果を得る。
他のピーク2係数データ〜ピークn係数データのそれぞれについても、上記と同様にして、各係数データが示す係数a,b、係数比-c/aの全てがマッチング範囲に含まれているか否かに基づき、対応する分割周波数についてノイズの有り/無しを判定する。
このようにして、本実施形態では、分割周波数ごとにノイズの有無が判定される。
本実施形態としては、上記のピーク検出部21を省略してピーク検出は行わない構成を採ることも可能である。この場合には、多項式演算/正規化部22−1〜22−nは、分割周波数ごとに対応して設けられる。図3との対応であれば、データ数、即ち分割周波数の分割数は512であるから、これに対応して512個の多項式演算/正規化部22−1〜22−512を設けることになる。ただし、図12にも例示したように、ノイズ音の周波数特性が、FFT後に得られる全周波数帯域の一部帯域に限定される場合には、ノイズ音に対応する周波数帯域に含まれる分割周波数ごとに対応させた多項式演算/正規化部22を設ければよい。
この場合の多項式演算/正規化部22−1〜22−nは、入力される帯域信号のサンプルごとに定常的に多項式演算と正規化処理を実行していき、順次、係数データを出力する。このようにして出力される係数データは、そのときの帯域信号がノイズであれば、マッチングテーブル15が持つマッチング範囲に含まれることになり、ノイズでなければマッチング範囲から外れるものとなる。
そこで、ノイズ判定部14は、定常的に3次元対応パターン化部13からパターン化データF(x)として出力される、分割周波数(帯域信号)ごとの係数データと、マッチングテーブル15から読み出した参照パターンデータP(x)、即ち、上記分割周波数ごとの各係数のマッチング範囲とを比較する。そして、この比較結果として、例えば上記係数データが示す各係数値がマッチング範囲に含まれているのであれば、その帯域信号についてノイズ有りと判定し、含まれていないのであればノイズ無しと判定する。
そこで、本実施形態としては、先に述べたようにしてピーク検出を行うこととしている。本実施形態において除去対象とする「時間的に断続して不規則に発生するノイズ」は、先にも述べたようにして、比較的急峻に立ち上がる特性を有しているので、ノイズが発生するときには相応に顕著なピークが得られることになる。これは、ピークが検出されない状態は、ノイズは発生していないとみてよいことを意味する。そこで、ピークが検出された場合にのみ、多項式演算/正規化処理、及びノイズ有無の判定処理を行うこととしても、発生したノイズの検出を逃すことはない。そして、定常的に多項式演算/正規化処理、及びノイズ有無の判定処理を行う必要はないために、処理はそれだけ軽いものとなり、例えば処理に必要なリソースも節約できる。
図13は、ノイズ認識処理部としての他の構成例(第2例)を示している。この図において、図2と同一部分には同一符号を付して説明を省略する。
この図に示されるノイズ認識処理部1Aにおいては、図2に示した構成に対して、2次元対応パターン化部16、パターンマッチング部17、及びノイズパターン記憶部18が追加される。
上記相関度Efは、例えば下記の演算により求めることができる。
上記(数3)において、Nは、1フレーム内のFFTポイント(サンプルポイント)数である。即ち、n=1〜Nまでのサンプルポイントについてのノイズパターンと音声信号との間での相関が高いほど、相関度Efは1に近づいていく。つまり、相関度Efが1に近いほど、ノイズであることの可能性は高くなる。
基本的には、先の説明と同様にして、帯域信号ごとの係数パターンと、マッチングテーブル15のマッチング範囲とを比較してノイズの有無についての判定を行う。但し、図13においては、上記マッチングテーブル15を利用した判定結果に加えて、上記相関度Efについて予め定めた閾値異常であるか否かを判定要素として加える。つまり、1つの帯域信号に対応するノイズ判定として、その帯域信号の係数パターンが、マッチングテーブル15のマッチング範囲に含まれており、かつ、相関度Efが閾値以上である周波数領域である場合に、ノイズ有りと判定する。帯域信号の係数パターンが、マッチングテーブル15のマッチング範囲に含まれていても、相関度Efが閾値未満の周波数領域である場合には、ノイズ無しと判定する。
ことで、ノイズ有無の判定結果をさらに正確なものとすることができる。
[4−1.全体構成]
上記第1例としてのノイズ認識処理部1、若しくは第2例としてのノイズ認識処理部1Aを備える、本実施形態としてのノイズ低減装置の第1例の構成を、図14に示す。
図14に示すノイズ低減装置は、マイクロフォン31、アンプ32、ノイズ除去フィルタ33、加算器34、補間信号源発生部35、補間フィルタ36、ノイズ認識処理部37、ノイズタイミング生成処理部38、スイッチ39を備えて構成される。
マイクロフォン31に入力された音声は、音声信号とされてアンプ32により増幅される。
ノイズ除去フィルタ33から出力された音声信号は、加算器34において、補間フィルタ36から出力される補間信号と合成される。
先ず、補間信号源発生部35は、本実施形態においてノイズとして扱われる周波数帯域(例えば図12との対応では43.1Hz〜2.28kHz)を持つ周波数特性の信号を補間信号源として生成する。
この図に示される補間信号源発生部35は、トーン信号発生部41、M系列信号発生部42、及び合成部43とを備えて成るものとしている。
なお、上記の合成比については、例えば固定とするのではなく、適応的に変化させることが考えられる。例えば1つには、マイクロフォン31により得た収音音声について解析を行って、トーン信号成分とM系列信号成分とについての近似率などを求めるようにする。そして、この近似率に基づいて合成比を可変する。これにより、例えば収音音声がトーン信号成分を多く持つ場合には、これに近い成分合成による補間信号源を、また、M系列信号を多く持つ場合には、これに近い成分合成による補間信号源を出力させることができる。この結果、補間後の音声信号について、より自然な聴感を得ることが可能になる。
また、場合によっては、トーン信号のみ、若しくはM系列信号のみが補間信号源として出力されるようにして合成比を固定的に設定してよい。
これにより、補間フィルタ36からは、ノイズ除去フィルタ33にて遮断された帯域に対応する帯域成分のみが抽出された補間信号源が出力される。これが、補間信号として、加算器34に対して出力される。
ノイズタイミング生成手段38は、判定結果に基づいて、ノイズ発生期間の時間タイミングを指示する、ノイズタイミング信号tmg_nzを、スイッチ39に対して出力する。
これに対して、ノイズタイミング信号tmg_ngが出力されている期間、即ち、ノイズが発生しているとする期間においては、スイッチ39は、端子tm1を端子tm2と接続し、加算器34から出力される音声信号、つまり、ノイズ除去・補間処理を経た音声信号を出力する。
例えば本実施形態のノイズ低減装置が録音可能な機器に実装されている場合には、このスイッチ39から出力される音声信号、つまり、ノイズ低減装置から出力される音声信号を録音(記録)することになる。
この図において、ノイズ発生期間は、ノイズタイミング信号tmg_ngが出力されている期間に対応する。
ノイズ発生期間より前の期間においては、アンプ32から直接的に入力される音声信号(入力音声信号)がスイッチ39から出力されている。つまり、ノイズ除去・補間処理を経ていない音声信号が出力されている。なお、ここでは、ノイズ発生期間より前の期間において出力されるノイズ除去・補間処理を経ていない音声信号については前音声信号として示している。
そして、ノイズタイミング信号tmg_ngの出力が停止されてノイズ発生期間が終了したとされると、スイッチ39は、これまでの加算器34からの音声信号(ノイズ除去・補間処理を経た音声信号)に代えて、アンプ32からの音声信号(ノイズ除去・補間処理を経ていない音声信号)の出力に切り換える。なお、ノイズ発生期間より後の期間において出力されるノイズ除去・補間処理を経ていない音声信号については後音声信号としている。
ここでのノイズ除去信号とは、ノイズ除去フィルタ33から出力される音声信号である。つまり、ノイズ除去フィルタ33によって、元の音声信号からノイズが発生した分割周波数の帯域成分を除去した音声信号である。このノイズ除去信号は、ノイズが発生した帯域が除去されている分、元の音声信号よりも信号パワーが低くなる。しかし、補間信号は、元の音声信号から除去された周波数帯域から成る音声信号であるから、この補間信号が加算器34により合成されることで、スイッチ39から出力されるノイズ除去処理を経た音声信号としては、元の音声信号と同等の信号パワーを持つことになる。図18(a)においては、ノイズ発生期間における音声信号のエンベロープが、前信号と後信号のエンベロープとつながっていることにより、ノイズ除去処理を経た音声信号と、元の音声信号の信号パワー(レベル)が同等であることを示している。
例えば、ノイズ除去及び補間として、ノイズ発生期間において、元の音声信号の全周波数帯域の成分を除去することで先ずノイズ除去を行う。そのうえで、このノイズ除去を行った音声信号について、元の音声信号の全周波数帯域を持つ補間信号を合成して、ノイズ除去・補間処理を経た音声信号を生成する、という手法も考えられる。しかし、この場合には、ノイズ発生期間の音声信号は、全帯域が補間信号に変わってしまうことから、聴感上不自然にきこえやすい。
そのうえで、クロスフェード期間においては、一方のアッテネータの制御係数c1については時間経過に応じて0〜1に増加していくように変化させることとしたうえで、他方のアッテネータの制御係数c2については、c2=1-c1で求められる変化を与えるようにする。
また、クロスフェード期間の時間は、ノイズタイミング信号tmg_ngに基づいて判断できるようにすればよい。例えばノイズタイミング信号tmg_ngとしては、ノイズ発生期間の開始/終了時間を指示する内容とする。例えばクロスフェードスイッチとしてのスイッチ39は、ノイズ発生期間の開始時間から一定時間において、冒頭のクロスフェード処理を実行する。また、ノイズ発生期間の終了時間からクロスフェード期間分さかのぼった時間を特定し、この特定した時間からノイズ発生期間の終了時間までの間で、終わりのクロスフェード処理を実行する。
次に、上記図14のノイズタイミング生成処理部38が実行するとされるノイズ発生タイミングの判定処理について図19を参照して説明する。なお、この図の説明にあたっては、多項式演算に2次多項式を採用している場合を例に挙げる。
座標Q(0,y1)は、上記係数データにより表される2次多項式により表される曲線の極大値の座標である。座標P(-1,y0)は、2次多項式により表される曲線において、座標Qに対して時間的に前となる任意の座標で、座標R(1,y2)は、2次多項式により表される曲線において、座標Qに対して時間的に後となる任意の座標である。ここでは、座標Pについては、時間軸の座標値が-1となる曲線上の点であるとしている。また、座標Rは、時間軸の座標値が1となる曲線上の点であるとしている。
また、同様にして、閾値ラインLmと接線TLrの交点座標を求め、この交点座標におけるx座標が実際に対応する時間を、発生したノイズの終了時点、即ちノイズ終了点Eとする。
つまり、検出されるノイズ発生期間Tnとしては、図示するように、ノイズ開始点Sとしての時間からノイズ終了点Eとしての時間までの期間となる。
上記のノイズ発生期間の検出(判定)は、帯域信号のサンプリング点を利用して求めた多項式を利用している。帯域信号を多項式化することによっては、先にも述べたようにして、より真に近い帯域信号波形を得ることができ、これにより、分割周波数ごとに、高い精度でノイズ有無の判定が行える。ノイズ発生期間は、同じ多項式に基づいて求められるものであり、従って、例えばノイズ発生期間としての開始・終了時間について、これまでより高い精度で検出できることになる。
一例としては、ノイズタイミング信号tmg_ngは、分割周波数ごとに判定したノイズ発生期間の論理和を演算し、この論理和の出力をノイズタイミング信号tmg_ngとする。この場合のノイズタイミング信号tmg_ngとしては、すくなくとも1つの分割周波数においてノイズが発生していると判定されている期間においてHレベルとなり、ノイズが発生していると判定される分割周波数が1つも無いときにはLレベルとなる信号として得られる。スイッチ39は、ノイズタイミング信号tmg_ngがHレベルのときに端子tm2と端子tm1を接続して、ノイズ除去処理が施された音声信号(加算器34の出力音声信号)を出力する。また、ノイズタイミング信号tmg_ngがLレベルのときには端子tm3と端子tm1を接続して、ノイズ除去処理が施されていない音声信号(アンプ32の出力音声信号)を出力する。
図15は、本実施形態のノイズ低減装置としての第2例の構成を示している。この図において,図14と同一部分には同一符号を付して説明を省略する。
この補間信号源発生部35には、アンプ32からの元の音声信号が入力される。また、ノイズタイミング生成処理部38からのノイズ認識情報が入力される。
図17には、元の音声信号の波形が示されている。この波形は、横軸が時間(T軸)とされ、縦軸が振幅(A軸)となっている。
ここでのノイズ発生期間ts〜teとしての時間を示す信号としては、例えばノイズタイミング生成処理部38がスイッチ39に対して出力するノイズタイミング信号tmg_ngと同一の信号とされればよい。また、ピーク時間tqを示す信号は、例えばノイズ認識処理部37から取り込んだノイズ認識情報(正規化された多項式の係数)から求めることができる。これにより、元補間信号生成部35Aは、音声信号においてノイズの発生が開始/終了する開始時間ts/終了時間teと、音声信号において発生したノイズの振幅がピークとなるピーク時間tqを認識できることになる。
先ず、元補間信号生成部35Aは、前補間信号の生成処理として、ノイズ発生期間における開始時間tsからピーク時間tqまでの時間幅(時間長)W1を求める。次に、開始時点tsから時間幅W1だけ遡った時点tprを求める。そして、期間tpr〜tsの区間の音声信号、即ち、開始時間tsの直前における時間幅W1の区間の音声信号(ノイズ前信号)を前補間信号として取得する。
また、元補間信号生成部35Aは、後補間信号の生成処理として、ノイズ発生期間におけるピーク時間tqから終了時間teまでの時間幅W2を求め、さらに終了時点teから時間幅W2だけ進行した時点tpsを求める。そして、期間te〜tpsの区間の音声信号、即ち、終了時間teの直後における時間幅W2の区間の音声信号(ノイズ後信号)を前補間信号として取得する。
つまり、本実施形態では、補間信号として、ノイズが発生しておらず、かつ、ノイズ発生区間の音声内容と連続性が高い音声内容を持つ音声信号を利用しているといえる。これにより、ノイズ除去処理が行われた音声として、さらに自然な聴感を得ることが期待できる。
ただし、音声信号の音声内容は、ノイズ発生前とノイズ発生後とで変化し得るものであり、例えば、発生したノイズのピークを境界としてその変化が生じやすい。そこで、自然な聴感が得られるようにすることを優先する場合には、図17に例示したように、前補間信号と後補間信号を生成するようにして、さらに、前補間信号と後補間信号の連結点を、ノイズ発生期間におけるノイズのピークに対応する時間とすることが好ましいことになる。
なお、前補間信号と後補間信号により元補間信号を生成する場合の変形として、例えば、単純に、ノイズ発生期間の中間時点など、予め固定的に定めた境界時点にて前補間信号と後補間信号とを連結する手法も考えられる。
[6−1.全体構成例]
続いて、本実施形態のノイズ低減装置の第3例及び第4例について説明する。第3例及び第4例に関しては、後述する、ピッチ周期に基づく補間信号生成処理が適用される。
また、この図においては、ノイズ除去フィルタ33、加算器34、補間信号源発生部35、元補間信号生成部35B、補間フィルタ36、及びピッチ算出部51から成る部位を、ノイズ除去・補間部50としており、ノイズタイミング生成処理部38からは、このノイズ除去・補間部50に対してノイズ認識情報を出力する構成としている。
ピッチを求める手法としては各種知られているが、ここでは、一例として、AMDF(Average Magnitude Difference Function)について簡単に説明しておく。AMDFは、演算処理が加算/減算のみであり、例えば自己相関やFFTを採用する場合よりも簡易で処理が軽いにもかかわらず、比較的にピッチの抽出精度が高いことで知られている。
AMDFによるピッチは、下記(数4)により求めることができる。
上記のようにして求められたピッチの情報は、補間信号生成部35Bが入力し、元補間信号の生成に利用する。
加算器34では、ノイズ除去フィルタ33からの音声信号と上記補間信号とを合成して、ノイズ除去・補間処理が施された音声信号として出力する。
続いて、上記図20に示した第3例のノイズ低減装置において実行される、入力音声信号(利用音声信号)のピッチに基づく補間信号生成処理(ピッチ対応補間信号生成処理)について説明する。このピッチ対応補間信号生成処理としては、第1例〜第3例による3つの態様を挙げる。
次に、ピッチ算出部51は、入力音声信号の時系列において、認識した開始時間tsより時間的に前であり、かつ、ノイズ発生期間Tnの近傍における所定時間分の期間をピッチ算出期間Tpとして設定する。図22においては、開始時間tsの直前においてピッチ算出期間Tpを設定した例が示されている。
ピッチ算出部51は、上記のようにして設定したピッチ算出期間Tpの入力音声信号を利用して、例えば先に述べたAMDFなどの手法に従って、入力音声信号のピッチを算出する処理を実行する。
ここで、ピッチ算出期間Tpは、ノイズ発生期間Tnより前の音声信号区間である。つまり、入力音声信号におけるどの帯域においてもノイズが発生していない信号である。このように本実施形態では、ノイズが発生していない区間の音声信号を利用してピッチ算出が行われるようにしている。これにより、正確なピッチ算出結果が安定して得られる。
次に元補間信号生成部35Bは、ノイズ発生期間Tn=1.5*Ts1で表される時間長によるノイズ前元信号区間Ts1を設定する。このノイズ前元信号区間Ts1は、図22に示すように、入力音声信号における、開始時間tsの直前に対して設定される。
先ず、図23(a)には、ノイズ前元信号区間Ts1の入力音声信号における冒頭部分が示されている。
元補間信号生成部35Bは、図23(a)に示すようにして、ノイズ前元信号区間Ts1の入力音声信号について、ピッチ算出部51により算出されたピッチとしての周期時間picthの1/2(=picth/2)の単位(単位周期区間)で、時系列に従って区切る。このようにして区切られた信号単位については、時間順に従い、区間信号1,2・・・・という。
次に元補間信号生成部35Bは、図23(a)から図23(b)の遷移として示すようにして、上記picth/2周期の区間信号1,2・・・を利用して、元補間信号を生成する。
つまり、補間信号としては、まず、その先頭1番目のpicth/2周期区間に、順時間方向の区間信号1をコピーする。これは、図23(a)に示される入力音声信号の区間信号1をそのままLIFO(Last In First Out)で読み出すように処理すればよい。つまり、区間信号を時系列に従ってメモリに一旦書き込み、書き込み時と同じ順序で読み出しを行えばよい。
次の2番目のpicth/2周期区間には、時系列を元信号の逆時間方向に変換した区間信号1及び区間信号2を利用する。このような逆時間方向の区間信号は、図23(a)の入力音声信号の区間信号をFILO(First In first Out)で出力する、つまり、区間信号を時系列に従ってメモリに一旦書き込み、書き込み時とは逆の順序で読み出しを行って出力する。
そのうえで、これらの逆時間方向の区間信号1,2について、例えば時間経過に従って、区間信号1が100%〜0%に減衰し、区間信号2が0%〜100%に増加していくようにしてクロスフェード(オーバーラップ)するようにして合成処理を行う。このようにして得られた音声信号を、2番目のpicth/2周期区間分の音声信号として連結する。
また、次の3番目のpicth/2周期区間には、時間順方向の区間信号2を連結する。
この場合、ノイズ前元信号区間Ts1を形成する全ての区間信号を利用して形成される元補間信号の時間長としては、図22にて示しているように、1.5*Ts1で表されることになる。つまり、この場合の元補間信号は、ノイズ前元信号区間Ts1を1.5倍分により時間方向に拡張するようにして生成されているものとみることができる。
なお、このように入力音声信号から求めたピッチに基づいて設定した周期区間による区間信号を並べるようにして生成される補間信号は、入力音声信号のピッチに対応した周波数特性を有する。つまり入力音声信号と補間信号とで周波数特性面での連続性が得られる。
また、2番目のpicth/2周期区間の終了位置と、3番目のpicth/2周期区間の開始位置とについても、同様にして、同じ区間信号2を逆時間方向−順時間方向の順で連結していることで、その境界において振幅波形が接続する状態が得られている。つまり、元補間信号におけるpicth/2周期区間の境界にて必ず接続された状態が得られるようにしている。
つまり、ノイズ発生期間の開始点に対して前後する1ピッチ周期分の2つの信号区間をクロスフェードさせた1ピッチ周期分の重み付け加算信号を生成する。そして、この同じ1つの重み付け加算信号を繰り返して連結することでノイズ発生期間分の前半信号を生成する。また、同様の要領で、後半信号を生成する。つまり、ノイズ発生期間の終了点に対して前後する1ピッチ周期分の2つの信号区間をクロスフェードさせた1ピッチ周期分の重み付け加算信号を生成し、この同じ1つの重み付け加算信号を繰り返して連結することでノイズ発生期間分の後半信号を生成する。
次に、上記のように生成した前半信号と後半信号をクロスフェードさせることで、ノイズ発生期間分の補間信号を生成する。
また、上記特許文献での補間信号は、重み付け加算信号を2つの音声信号のクロスフェードにより形成し、さらに最終的に得られる補間信号も、前半信号と後半信号のクロスフェードにより形成されている。このようにしてクロスフェードすることにより、例えば単一の音声信号を用いる場合より、前後の音声信号との連続性を保ちやすくはなる。
しかし、クロスフェードさせる2つの音声信号の位相差の条件によっては、相互に打ち消し合うような結果となって信号レベルを低下させる可能性が避けられなくなる。このようなレベル低下が発生すれば、ノイズ除去処理の期間中において、この状態が繰り返される、あるいは継続されることになり、充分な補間の効果を得ることができない場合があると考えられる。
また、上記特許文献での補間信号は、入力音声信号を元にして生成されるので、この点で、ノイズ発生期間前後の音声信号と補間信号との連続性は得られやすい。しかし、重み付け加算信号の1/2は、ノイズ発生期間における冒頭若しくは終端の音声信号を利用しているので、ノイズが混入した補間信号となる可能性があり、これが自然な聴感を妨げる要因となる場合があると考えられる。
さらに、元補間信号生成部35Bにより生成された元補間信号は、補間フィルタ36によって、ノイズが発生したと判定された周波数のみに制限される。この段階で、上記点接続に対応して発生した高調波成分はほぼ完全に除去されるので、問題になることはない。
そのうえで、この場合には、前の単位補間信号部分partにおける最後の区間信号の1/2pitch周期期間と、後の単位補間信号部分partにおける1番目の区間信号の1/2pitch周期期間については、重複させているものとしてみることができる。そのうえで、この重複する1/2pitch周期期間においては、クロスフェードによる合成を行っているものである。
また、第1例は、同じ順番(単位周期区間)の区間信号を偶数個利用して単位補間信号部分partを形成するとした場合において、具体的に2個を利用した場合の処理として見ることができる。
続いて、本実施形態によるピッチ対応補間信号生成処理の第2例について、図24を参照して説明する。
図24は、単位補間信号部分partを、同じ時間(単位周期区間)における奇数の区間信号により形成する場合として、その最小数である3つにより形成する例を示したものである。
なお、ノイズ低減装置におけるピッチ算出部51によるピッチ算出と、元補間信号生成部35Bによる元補間信号(生成元信号)の生成の概略については、第1例のピッチ対応補間信号生成処理と同様に、図22に示したものとなる。
続いて、元補間信号における4番目のpicth/2周期区間には、順時間方向の区間信号2を配置する。続けて、5番目のpicth/2周期区間には逆時間方向の区間信号2を配置し、6番目のpicth/2周期区間には順時間方向の区間信号2を配置する。
つまり、第2例のピッチ対応補間信号生成処理では、1つの区間信号について、順時間方向、逆時間方向、順時間方向の順により配列することとして、これを区間信号の時系列順に繰り返していくようにする。
また、この第2例の場合のようにして、奇数の区間信号により単位補間信号部分partを形成するとした場合には、前の単位補間信号部分partの最後の区間信号と、後の単位補間信号部分partの最初の区間信号とを、ともに順時間方向とすることができる。つまり、前の単位補間信号部分partの最後の区間信号と、後の単位補間信号部分partの最初の区間信号から成る期間は、本来、時間的に連続している2つの区間信号がそのまま連結される。従って、これらの区間信号の境界においては、振幅波形は、点接続された結果として、これより良好な接線接続の状態が得られることになる。つまり、奇数の区間信号により単位補間信号部分partを形成する場合には、単位補間信号部分partを、生成元の区間信号の時間順に従って単純に連結していけばよい。
また、これにより、元補間信号において区間信号がクロスフェードする区間は全く形成しなくともよい。従って、クロスフェードする2つの信号の位相条件によるレベル低減の問題は生じない。
さらに、この場合には、元補間信号は、ノイズ前元信号区間Ts1の3倍に拡張された時間長を持てることになる。つまり、元補間信号に対応するノイズ発生期間Tnとの関係として、Tn=3*Ts1が成立する。これは、ノイズ前元信号区間Ts1としては、ノイズ発生期間Tnの1/3の時間長があればよいことを意味する。例えば第1例との比較では、同じノイズ発生期間Tnに対応して必要なノイズ前元信号区間Ts1を1/2にまで短くできる。
このようにして第2例では、元補間信号生成のため必要な入力音声信号の時間が短くて済み、それだけ処理は軽いものにできる。また、本実施形態が除去対象とするノイズは、時間的に断続して不規則に発生するノイズである。このようなノイズが短時間で複数発生したような場合、現ノイズ発生期間と1つ前のノイズ発生期間の間のノイズが発生していない期間が短くなってしまう場合があるが、このようなときにも、ノイズが発生していないノイズ前元信号を得られる可能性が高くなる。
本実施形態によるピッチ対応補間信号生成処理の第3例について、図25及び図26により説明する。
図25は、第3例に対応する、ノイズ低減装置におけるピッチ算出部51によるピッチ算出と、元補間信号生成部35Bによる元補間信号(生成元信号)の生成の概略を示している。
この場合にも、ピッチ算出部51には、ノイズタイミング生成処理部38から出力されるノイズ認識情報として、ノイズ発生期間を示す信号(例えばノイズタイミング信号tmg_ng)が入力される。ピッチ算出部51は、この信号に基づいて、ノイズ発生期間Tnの開始時間ts、及び終了時間teを認識する。また、この場合のピッチ算出部51は、ノイズタイミング生成処理部38から出力されるノイズ認識情報として出力される、ノイズ発生期間Tnにおける音声信号(ノイズ音)の振幅のピーク時間tpを示す信号により、ピーク時間tpも認識する。
さらに、この場合のピッチ算出部51は、入力音声信号の時系列において、終了時間teより時間的に後で、かつ、ノイズ発生期間Tnの近傍における所定時間分の期間をピッチ算出期間Tp2として設定する。図24においては、終了時間teの直後においてピッチ算出期間Tp2を設定している。そして、ピッチ算出部51は、ピッチ算出期間Tp2の入力音声信号を利用して後ピッチを算出する。
そこで、補間信号生成部35Bは、認識した開始時間tsからピーク時間tpまでによる前補間信号期間Tn-1としての時間長を認識し、この前補間信号期間Tn-1の時間長に基づいて、ノイズ発生期間の直前のノイズ前信号区間Ts1として設定すべき時間長を求める。
同様に、補間信号生成部35Bは、認識したピーク時間tpから終了時間Teまでによる後補間信号期間Tn-2しての時間長を認し、この後補間信号期間Tn-1の時間長に基づいて、ノイズ発生期間の直後のノイズ後信号区間Ts2として設定すべき時間長を求める。
なお、ノイズ前信号区間Ts1、後補間信号期間Tn-1の各時間長の求め方については、図26により次に述べる。
まず、第3例にあっても、先の各例に準じて、元補間信号生成部35Bは、ノイズ前元信号区間Ts1と、ノイズ後元信号区間Ts2の各入力音声信号について、1/2pitch周期による区間信号単位に分割する。
図26(a)には、ノイズ前元信号区間Ts1の入力音声信号として、その終端の2つの区間信号N-1,Nが示されている。また、図26(b)には、ノイズ後元信号区間Ts2の入力音声信号として、その終端の2つの区間信号N+1,N+2が示されている。
図26(c)においては、まず、前補間信号の終端部分として、ノイズ前元信号区間Ts1における最後の1つ前の区間信号N-1について、順時間方向、逆時間方向、順時間方向の順で配列したことにより、1つの単位補間信号部分partが形成された状態が示されている。
次の1/2pitch区間は、前補間信号と後補間信号の境界に対応する区間となるが、これに続く、1/2pitch区間は、後補間信号の区間となるもので、図示するようにして、ノイズ後元信号区間Ts2の2番目の区間信号N+2を、1/2pitch区間ごとに順次、順時間方向、逆時間方向、順時間方向の順で配列している。これより後は、3番目以降の区間信号ごとに、順時間方向、逆時間方向、順時間方向の順で、1/2pitch区間に対して順次配列していくようにする。これをノイズ後元信号区間Ts2の最後の区間信号まで行うと、後補間信号が終端まで形成されることになる。
この連結部分combには、ノイズ前元信号区間Ts1の最後の区間信号Nと、ノイズ後元信号区間Ts2の最初の区間信号N+1とをクロスフェードさせた音声信号を配置する。このときのクロスフェードとしては、区間信号Nが0%〜100%で増加し、区間信号N+1が100%〜0%で減衰するようにされている。これにより、直前の1/2pitch区間とクロスフェードの1/2pitch区間との境界では、順時間方向の区間信号N-1の終了位置と、順時間方向の区間信号Nの開始位置との点接続が得られる。また、クロスフェードの1/2pitch区間とその直後の1/2pitch区間との境界では、順時間方向の区間信号N+1の終了位置と、順時間方向の区間信号N+2の開始位置との点接続が得られる。
また、この第3例の場合、同じ時間幅によるノイズ発生期間Tnに対しては、ノイズ前元信号区間Ts1、ノイズ後元信号区間Ts2のそれぞれについて、第2例における図22のノイズ前元信号区間Ts1よりも短くできるというメリットもある。
図21は、第4例としてのノイズ低減装置の構成例を示している。
なお、この図において、第1例として図14に示した構成と同一部分には同一符号を付して説明を省略する。この図21に示す構成は、入力音声信号に基づくのではなく、補間信号源発生部35にて発生される補間信号源(利用音声信号)を基として補間信号を生成しようとする点では、図14の第1例と共通している。
また、この図においても、図20に準じて、ノイズ除去フィルタ33、加算器34、補間信号源発生部35、元補間信号生成部35C、補間フィルタ36、及びピッチ算出部51から成る部位を、ノイズ除去・補間部50としており、ノイズタイミング生成処理部38からは、このノイズ除去・補間部50に対してノイズ認識情報を出力する構成としている。
なお、ピッチ算出部51については、先の第1例、第2例に準じたピッチ対応補間信号生成処理とする場合には、図22と同じ処理を実行させるように構成する。つまり、ノイズ発生期間Tnを除いた、その前後における何れか一方の入力音声信号を利用してピッチを算出する。また、先の第3例に準じたピッチ対応補間信号生成処理とする場合には、図25と同じ処理を実行させるように構成する。
この場合の元補間信号生成部35Cは、補間信号源としての音声信号から、ノイズ発生期間Tnの2/3倍の時間幅の音声信号を取り出す。これは、図22におけるノイズ前元信号区間Ts1を設定し、このノイズ前元信号区間Ts1内の音声信号を取り出す処理に相当する。ただし、補間信号源は、連続的に発生される音声信号であり、入力音声信号のようにしてノイズが混入することはない。従って、補間信号源からノイズ発生期間Tnの2/3倍の時間幅の音声信号を取り出すタイミングは任意でよい。
そのうえで、元補間信号生成部35Cは、補間信号源を1/2pitch周期の区間信号に区分し、図24にて説明したのと同じ処理により、ノイズ発生期間Tnだけの時間幅の元補間信号を生成し、これを補間フィルタ36に出力する。
そのうえで、元補間信号生成部35Cは、ノイズ前元信号とノイズ後元信号を1/2pitch周期の区間信号に区分し、ここでは、図26と同じ処理によって元補間信号を生成する。
しかし、このような入力音声信号とは異なる信号により補間する場合にも、入力音声信号のピッチに基づいて、上記の処理により元補間信号を生成することで、例えば単純に補間信号源を順時間方向で連結して元補間信号を生成した場合と比較して、より自然な聴感が得られる。このことについては、本願発明者が実験により確認している。
しかし、ピッチ対応補間信号生成処理(第1例〜第3例)に関しては、ノイズ発生期間において、入力音声信号の全帯域を除去し、代わりに、この全帯域と同じ帯域特性を有する補間信号を補間するようにして構成してもよい。
このようなノイズ除去・補間の手法を採用したとしても、補間信号自体は、図23,図24,図26に示したピッチ対応補間信号生成処理(第1例〜第3例)としての処理により生成される。従って、1/2pitch周期区間ごとに波形が点接続されて高調波の発生が抑制されること、クロスフェード期間が短い,若しくは無くなることで、位相条件によるレベル低下の発生が解消されるなどの利点は、有効に得られるからである。
しかし、本実施形態のノイズ低減装置が入力する、ノイズ音を含み得る音声源としては、マイクロフォンにより収音したものだけではなく、例えば、既に記録媒体に録音(記録)された音声を読み出して得られる音声信号とすることについて、何ら支障はない。つまり、入力音声信号を得るための音声信号入力手段としてはマイクロフォンを備える音声入力系に限定されない。
31 マイクロフォン、32 アンプ、33 ノイズ除去フィルタ、34 加算器、35 補間信号源発生部、35a・35b・35c 元補間信号生成部、36 補間フィルタ、37 ノイズ認識処理部、38 ノイズタイミング生成処理部、39 スイッチ、41 トーン信号発生部、42 M系列信号発生部、43 合成部、51 ピッチ算出部
Claims (16)
- 音声信号を入力する音声信号入力手段と、
上記音声信号入力手段により入力して得られる入力音声信号を周波数信号に変換する時間−周波数変換手段と、
上記周波数信号における分割周波数ごとに、サンプリング点間を補間するものとしてのn次の多項式(nは自然数)を求め、この多項式の各次数の係数の値の組から成る係数パターンを取得するパターン化手段と、
ノイズとしてみなされる係数パターンの範囲であるマッチング範囲を示すマッチングデータを、上記分割周波数に対応させて保持する、マッチングデータ保持手段と、
上記パターン化手段により取得した係数パターンと、上記マッチングデータが示すマッチング範囲とを比較した結果に基づいて、少なくとも、このとき比較した上記係数パターンデータが対応する分割周波数におけるノイズ発生の有無を判別するノイズ判定手段と、
を備えるノイズ低減装置。 - 上記パターン化手段は、上記多項式について、その極値のときのx座標値が0となるようにして時間方向に対応する正規化を実行する、
請求項1に記載のノイズ低減装置。 - 上記パターン化手段は、上記多項式について、その極値としてのy座標値が整数値となるようにして振幅方向に対応する正規化を実行する、
請求項2に記載のノイズ低減装置。 - 上記ノイズ判定手段は、ノイズ有りと判定したことに応じて、上記多項式の曲線上において、極値のときのx座標よりも小さい値のx座標を通過する第1の接線、及び上記極値のときのx座標よりも大きい値のx座標を通過する第2の接線を求め、
上記第1の接線が閾値として設定したy座標値と交差するときのx座標値に対応する時間をノイズ発生開始時点として設定し、
上記第2の接線が閾値として設定したy座標値と交差するときのx座標値に対応する時間をノイズ発生終了時点として設定する、
請求項1乃至請求項3の何れかに記載のノイズ低減装置。 - 上記周波数信号から、その振幅がピークとなるサンプリング点を判定するピーク判定手段を備え、
上記多項式演算手段は、上記ピーク判定手段によりピークとなるサンプリング点の判定された分割周波数を対象として上記多項式を求める、
請求項1乃至請求項4の何れかに記載のノイズ低減装置。 - 上記ピーク判定手段は、上記周波数信号としてのサンプリング点の絶対値振幅を、周波数軸と時間軸からなる二次元方向にマッピングし、このマッピングされた絶対値振幅の分布状態に基づいて、上記ピークとなるサンプリング点を判定する、
請求項5に記載のノイズ低減装置。 - 上記マッチングデータ保持手段は、ノイズが発生するとされる周波数帯域のみに対応する分割周波数に対応させて上記マッチングデータを保持する、
請求項1乃至請求項6に記載のノイズ低減装置。 - 上記ノイズ判定手段によりノイズ有りと判定された分割周波数のみを遮断する通過帯域特性を設定して上記入力音声信号を通過させることでノイズ除去された音声信号を出力するノイズ除去フィルタ手段と、
上記ノイズ判定手段によりノイズ有りと判定された分割周波数の帯域成分のみから成る補間信号を生成する補間信号生成手段と、
上記ノイズ除去された音声信号と上記補間信号とを合成した音声信号を出力する合成手段と、
をさらに備える請求項1乃至請求項7の何れかに記載のノイズ低減装置。 - 上記補間信号生成手段は、
上記入力音声信号から、上記ノイズ判定手段の判定結果に基づいて認識されるノイズ発生期間よりも時間軸上で前となる区間の前音声信号と、上記ノイズ発生期間よりも時間軸上で後となる区間の後音声信号とを抽出し、上記前音声信号の後ろに上記後音声信号を連結することで、上記ノイズ発生期間に対応する時間幅の元補間信号を生成する、元補間信号生成手段と、
上記ノイズ判定手段によりノイズ有りと判定された分割周波数のみを通過させる通過帯域特性を設定し、上記元補間信号を通過させることで、上記補間信号を生成する、補間フィルタ手段とから成る、
請求項1乃至請求項8の何れかに記載のノイズ低減装置。 - 上記元補間信号生成手段は、
上記ノイズ判定手段の判定結果に基づいて認識されるノイズ発生期間の開始時点から、上記ノイズ発生期間内において振幅がピークとなるピーク時点までの時間幅の上記前音声信号を抽出し、
上記ピーク時点から、上記ノイズ判定手段の判定結果に基づいて認識されるノイズ発生期間の終了時点までの時間幅の上記後音声信号を抽出する、
請求項9に記載のノイズ低減装置。 - 上記補間信号生成手段は、
上記入力音声信号から、上記ノイズ判定手段の判定結果に基づいて認識されるノイズ発生期間よりも時間軸上で前となる区間におけるノイズ発生期間分の時間幅の前音声信号、若しくは、上記ノイズ発生期間よりも時間軸上で後となる区間におけるノイズ発生期間分の時間幅の後音声信号を抽出して元補間信号とし、
上記ノイズ判定手段によりノイズ有りと判定された分割周波数のみを通過させる通過帯域特性を設定し、上記元補間信号を通過させることで、上記補間信号を生成する、補間フィルタ手段とから成る、
請求項1乃至請求項8の何れかに記載のノイズ低減装置。 - 上記補間信号生成手段は、
上記入力音声信号の入力に基づかない音声信号である補間信号源を発生させる補間信号源発生手段と、
上記ノイズ判定手段によりノイズ有りと判定された分割周波数のみを通過させる通過帯域特性を設定し、上記補間信号源としての音声信号を通過させることで、上記補間信号を生成する、補間フィルタ手段とから成る、
請求項8に記載のノイズ低減装置。 - 上記周波数信号のパターンと、ノイズとして扱われる周波数信号のパターンとの相関度を求める相関度算出手段をさらに備え、
上記ノイズ判定手段は、上記パターン化手段により取得した係数パターンデータと、上記マッチングデータが示すマッチング範囲とを比較した結果と、上記相関度とに基づいて、少なくとも、上記ノイズ発生の有無を判別する、
請求項1乃至請求項12のいずれかに記載のノイズ低減装置。 - 上記合成手段から出力される音声信号と上記入力音声信号とを入力して、上記ノイズ判定手段の判定結果に基づいて認識されるノイズ発生期間においては、上記合成手段から出力される音声信号を出力し、上記ノイズ判定手段の判定結果に基づいて認識されるノイズ非発生期間においては、上記入力音声信号を出力する、スイッチ手段をさらに備える、
請求項1乃至請求項13の何れかに記載のノイズ低減装置。 - 上記スイッチ手段は、
上記ノイズ発生期間における始めの期間においては、上記合成手段から出力される音声信号のレベルが徐々に増大し、上記入力音声信号のレベルが徐々に減衰されるように、
上記ノイズ発生期間における終わりの期間においては、上記合成手段から出力される音声信号のレベルが徐々に減衰し、上記入力音声信号のレベルが徐々に増大されるように、クロスフェード処理を実行する、
請求項14に記載のノイズ低減装置。 - 音声信号を入力する音声信号入力手順と、
上記音声信号入力手順により入力して得られる入力音声信号を周波数信号に変換する時間−周波数変換手順と、
上記周波数信号における分割周波数ごとに、サンプリング点間を補間するものとしてのn次の多項式(nは自然数)を求め、この多項式の各次数の係数の値の組から成る係数パターンを取得するパターン化手順と、
ノイズとしてみなされる係数パターンの範囲であるマッチング範囲を示すマッチングデータを、上記分割周波数に対応させて保持する、マッチングデータ保持手順と、
上記パターン化手順により取得した係数パターンと、上記マッチングデータが示すマッチング範囲とを比較した結果に基づいて、少なくとも、このとき比較した上記係数パターンデータが対応する分割周波数におけるノイズ発生の有無を判別するノイズ判定手順と、
を実行するノイズ判定方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009097189A JP2010249939A (ja) | 2009-04-13 | 2009-04-13 | ノイズ低減装置、ノイズ判定方法 |
US12/718,508 US8320583B2 (en) | 2009-04-13 | 2010-03-05 | Noise reducing device and noise determining method |
CN201010154460.1A CN101877237B (zh) | 2009-04-13 | 2010-04-02 | 降噪装置和噪声确定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009097189A JP2010249939A (ja) | 2009-04-13 | 2009-04-13 | ノイズ低減装置、ノイズ判定方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010249939A true JP2010249939A (ja) | 2010-11-04 |
Family
ID=42934426
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009097189A Pending JP2010249939A (ja) | 2009-04-13 | 2009-04-13 | ノイズ低減装置、ノイズ判定方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8320583B2 (ja) |
JP (1) | JP2010249939A (ja) |
CN (1) | CN101877237B (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014051149A (ja) * | 2012-09-05 | 2014-03-20 | Yamaha Corp | エンジン音加工装置 |
JP2020113675A (ja) * | 2019-01-15 | 2020-07-27 | 中国電力株式会社 | 周波数応答波形生成装置、異常診断装置、周波数応答波形生成方法、異常診断方法 |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7173623B2 (en) * | 2003-05-09 | 2007-02-06 | Microsoft Corporation | System supporting animation of graphical display elements through animation object instances |
WO2009037733A1 (ja) * | 2007-09-21 | 2009-03-26 | Fujitsu Limited | 能動消音装置および能動消音装置の制御方法 |
US8849663B2 (en) | 2011-03-21 | 2014-09-30 | The Intellisis Corporation | Systems and methods for segmenting and/or classifying an audio signal from transformed audio information |
US8767978B2 (en) | 2011-03-25 | 2014-07-01 | The Intellisis Corporation | System and method for processing sound signals implementing a spectral motion transform |
US8548803B2 (en) | 2011-08-08 | 2013-10-01 | The Intellisis Corporation | System and method of processing a sound signal including transforming the sound signal into a frequency-chirp domain |
US9183850B2 (en) | 2011-08-08 | 2015-11-10 | The Intellisis Corporation | System and method for tracking sound pitch across an audio signal |
US8620646B2 (en) | 2011-08-08 | 2013-12-31 | The Intellisis Corporation | System and method for tracking sound pitch across an audio signal using harmonic envelope |
CN103135811A (zh) * | 2011-11-24 | 2013-06-05 | 联咏科技股份有限公司 | 噪声过滤方法 |
US9024739B2 (en) * | 2012-06-12 | 2015-05-05 | Guardity Technologies, Inc. | Horn input to in-vehicle devices and systems |
JP6003487B2 (ja) * | 2012-09-28 | 2016-10-05 | オムロンヘルスケア株式会社 | 血圧測定装置、血圧測定方法、血圧測定プログラム |
JP6252183B2 (ja) * | 2013-02-12 | 2017-12-27 | 株式会社リコー | 画像検査装置、画像検査システム及び画像検査方法 |
US9058820B1 (en) | 2013-05-21 | 2015-06-16 | The Intellisis Corporation | Identifying speech portions of a sound model using various statistics thereof |
US9484044B1 (en) | 2013-07-17 | 2016-11-01 | Knuedge Incorporated | Voice enhancement and/or speech features extraction on noisy audio signals using successively refined transforms |
US9530434B1 (en) | 2013-07-18 | 2016-12-27 | Knuedge Incorporated | Reducing octave errors during pitch determination for noisy audio signals |
US9208794B1 (en) | 2013-08-07 | 2015-12-08 | The Intellisis Corporation | Providing sound models of an input signal using continuous and/or linear fitting |
CN104200815B (zh) * | 2014-07-16 | 2017-06-16 | 电子科技大学 | 一种基于相关分析的音频噪声实时检测方法 |
WO2016103312A1 (ja) * | 2014-12-22 | 2016-06-30 | 株式会社島津製作所 | 分析データ処理方法及び装置 |
CN104602157B (zh) * | 2015-01-28 | 2018-11-02 | 深圳市冠旭电子股份有限公司 | 一种耳机降噪方法及装置 |
US9922668B2 (en) | 2015-02-06 | 2018-03-20 | Knuedge Incorporated | Estimating fractional chirp rate with multiple frequency representations |
US9842611B2 (en) | 2015-02-06 | 2017-12-12 | Knuedge Incorporated | Estimating pitch using peak-to-peak distances |
US9870785B2 (en) | 2015-02-06 | 2018-01-16 | Knuedge Incorporated | Determining features of harmonic signals |
CN106356069B (zh) * | 2015-07-17 | 2019-12-17 | 北京信息科技大学 | 一种信号处理方法和装置 |
FR3049132B1 (fr) * | 2016-03-18 | 2018-03-23 | Continental Automotive France | Procede pour limiter le bruit radio, notamment dans la bande fm, par interpolation polynomiale |
US10283135B2 (en) * | 2016-12-22 | 2019-05-07 | Microsoft Technology Licensing, Llc | Touchscreen tapping noise suppression |
CN109327768B (zh) * | 2017-07-31 | 2020-11-20 | 骅讯电子企业股份有限公司 | 主动式降噪系统 |
CN108391190B (zh) * | 2018-01-30 | 2019-09-20 | 努比亚技术有限公司 | 一种降噪方法、耳机及计算机可读存储介质 |
JP2022051974A (ja) * | 2019-02-12 | 2022-04-04 | ソニーグループ株式会社 | 情報処理装置および方法、並びにプログラム |
US11971332B2 (en) * | 2019-07-30 | 2024-04-30 | Nippon Telegraph And Telephone Corporation | Feature extraction apparatus, anomaly score estimation apparatus, methods therefor, and program |
US11550434B2 (en) * | 2020-10-19 | 2023-01-10 | Synaptics Incorporated | Short-term noise suppression |
CN112712817B (zh) * | 2020-12-24 | 2024-04-09 | 惠州Tcl移动通信有限公司 | 一种声音过滤方法、移动设备及计算机可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0293697A (ja) * | 1988-09-30 | 1990-04-04 | Sanyo Electric Co Ltd | 雑音除去方法 |
WO2007130766A2 (en) * | 2006-05-04 | 2007-11-15 | Sony Computer Entertainment Inc. | Narrow band noise reduction for speech enhancement |
JP2008288910A (ja) * | 2007-05-18 | 2008-11-27 | Sony Corp | 収音装置 |
JP2008287041A (ja) * | 2007-05-18 | 2008-11-27 | Sony Corp | 撮像装置、音声処理回路、ノイズ低減回路、ノイズ低減方法およびプログラム |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1071081B1 (en) * | 1996-11-07 | 2002-05-08 | Matsushita Electric Industrial Co., Ltd. | Vector quantization codebook generation method |
US6122384A (en) * | 1997-09-02 | 2000-09-19 | Qualcomm Inc. | Noise suppression system and method |
US6449519B1 (en) * | 1997-10-22 | 2002-09-10 | Victor Company Of Japan, Limited | Audio information processing method, audio information processing apparatus, and method of recording audio information on recording medium |
JP3675179B2 (ja) * | 1998-07-17 | 2005-07-27 | 三菱電機株式会社 | オーディオ信号の雑音除去装置 |
GB0202386D0 (en) * | 2002-02-01 | 2002-03-20 | Cedar Audio Ltd | Method and apparatus for audio signal processing |
JP4423300B2 (ja) * | 2004-10-28 | 2010-03-03 | 富士通株式会社 | 雑音抑圧装置 |
JP2008052772A (ja) | 2006-08-22 | 2008-03-06 | Sony Corp | 記録装置、ノイズ除去方法、ノイズ除去装置 |
JP4826402B2 (ja) | 2006-09-12 | 2011-11-30 | ソニー株式会社 | 記録装置、ノイズ除去方法、ノイズ除去装置 |
JP2008077707A (ja) | 2006-09-19 | 2008-04-03 | Sony Corp | 記録装置、ノイズ除去方法、ノイズ除去装置 |
JP2010249940A (ja) * | 2009-04-13 | 2010-11-04 | Sony Corp | ノイズ低減装置、ノイズ低減方法 |
-
2009
- 2009-04-13 JP JP2009097189A patent/JP2010249939A/ja active Pending
-
2010
- 2010-03-05 US US12/718,508 patent/US8320583B2/en not_active Expired - Fee Related
- 2010-04-02 CN CN201010154460.1A patent/CN101877237B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0293697A (ja) * | 1988-09-30 | 1990-04-04 | Sanyo Electric Co Ltd | 雑音除去方法 |
WO2007130766A2 (en) * | 2006-05-04 | 2007-11-15 | Sony Computer Entertainment Inc. | Narrow band noise reduction for speech enhancement |
JP2009535997A (ja) * | 2006-05-04 | 2009-10-01 | 株式会社ソニー・コンピュータエンタテインメント | コンソール上にファーフィールドマイクロフォンを有する電子装置におけるノイズ除去 |
JP2008288910A (ja) * | 2007-05-18 | 2008-11-27 | Sony Corp | 収音装置 |
JP2008287041A (ja) * | 2007-05-18 | 2008-11-27 | Sony Corp | 撮像装置、音声処理回路、ノイズ低減回路、ノイズ低減方法およびプログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014051149A (ja) * | 2012-09-05 | 2014-03-20 | Yamaha Corp | エンジン音加工装置 |
JP2020113675A (ja) * | 2019-01-15 | 2020-07-27 | 中国電力株式会社 | 周波数応答波形生成装置、異常診断装置、周波数応答波形生成方法、異常診断方法 |
JP7275589B2 (ja) | 2019-01-15 | 2023-05-18 | 中国電力株式会社 | 周波数応答波形生成装置、異常診断装置、周波数応答波形生成方法、異常診断方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101877237A (zh) | 2010-11-03 |
CN101877237B (zh) | 2013-01-02 |
US20100260353A1 (en) | 2010-10-14 |
US8320583B2 (en) | 2012-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2010249939A (ja) | ノイズ低減装置、ノイズ判定方法 | |
JP2010249940A (ja) | ノイズ低減装置、ノイズ低減方法 | |
JP2007316254A (ja) | オーディオ信号補間方法及びオーディオ信号補間装置 | |
CN111383646B (zh) | 一种语音信号变换方法、装置、设备和存储介质 | |
JP6174856B2 (ja) | 雑音抑制装置、その制御方法、及びプログラム | |
JP4031813B2 (ja) | オーディオ信号処理装置、オーディオ信号処理方法およびその方法をコンピュータに実行させるプログラム | |
JP5147851B2 (ja) | オーディオ信号補間装置及びオーディオ信号補間方法 | |
CN110136735A (zh) | 一种音频修复方法、设备及可读存储介质 | |
JP2005266797A (ja) | 音源信号分離装置及び方法、並びにピッチ検出装置及び方法 | |
JP5651945B2 (ja) | 音響処理装置 | |
JP4119112B2 (ja) | 混合音の分離装置 | |
JP2798003B2 (ja) | 音声帯域拡大装置および音声帯域拡大方法 | |
JP4952368B2 (ja) | 収音装置 | |
JP2002175099A (ja) | 雑音抑制方法および雑音抑制装置 | |
JP5163606B2 (ja) | 音声分析合成装置、及びプログラム | |
JP4513556B2 (ja) | 音声分析合成装置、及びプログラム | |
JP2009282536A (ja) | 既知音響信号除去方法及び装置 | |
JP5169533B2 (ja) | インパルス応答加工装置、残響付与装置およびプログラム | |
EP4276824A1 (en) | Method for modifying an audio signal without phasiness | |
EP3447767A1 (en) | Method for phase correction in a phase vocoder and device | |
JP3733964B2 (ja) | 分析結果を用いた音源波形合成装置 | |
JP4512008B2 (ja) | 楽音情報生成装置、方法及びプログラム | |
JP4313740B2 (ja) | 残響除去方法、プログラムおよび記録媒体 | |
JP5495858B2 (ja) | 音楽音響信号のピッチ推定装置及び方法 | |
JP2018049228A (ja) | 音響処理装置および音響処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20120118 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120224 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121204 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130402 |