JP4440937B2 - 暗騒音存在時の音声を改善するための方法および装置 - Google Patents
暗騒音存在時の音声を改善するための方法および装置 Download PDFInfo
- Publication number
- JP4440937B2 JP4440937B2 JP2006545874A JP2006545874A JP4440937B2 JP 4440937 B2 JP4440937 B2 JP 4440937B2 JP 2006545874 A JP2006545874 A JP 2006545874A JP 2006545874 A JP2006545874 A JP 2006545874A JP 4440937 B2 JP4440937 B2 JP 4440937B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- noise
- value
- frequency band
- scaling gain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 78
- 230000001629 suppression Effects 0.000 claims abstract description 63
- 230000003595 spectral effect Effects 0.000 claims abstract description 37
- 238000004458 analytical method Methods 0.000 claims description 60
- 238000012545 processing Methods 0.000 claims description 41
- 230000005236 sound signal Effects 0.000 claims description 40
- 238000001228 spectrum Methods 0.000 claims description 37
- 238000009499 grossing Methods 0.000 claims description 18
- 206010019133 Hangover Diseases 0.000 claims description 10
- 238000005259 measurement Methods 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 3
- 238000005192 partition Methods 0.000 abstract 1
- 230000009467 reduction Effects 0.000 description 37
- 238000010183 spectrum analysis Methods 0.000 description 20
- 230000007774 longterm Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 238000005070 sampling Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000001914 filtration Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 230000000630 rising effect Effects 0.000 description 4
- 230000005534 acoustic noise Effects 0.000 description 3
- 238000009432 framing Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000011946 reduction process Methods 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 230000010355 oscillation Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Description
複数の周波数ビンを具備する音声信号のスペクトル領域表示を生成するために周波数分析を行うステップと、
上記周波数ビンを複数の周波数帯域にグループ化するステップとを有する方法において、上記音声信号の中に有声化音声活性状態を検出したときに、周波数帯域の第1の数に対しては周波数ビン毎のベースでノイズの抑制を行い、上記周波数帯域第2の数に対しては周波数帯域毎のベースでノイズの抑制を行うことを特徴とする方法が提供される。
複数の周波数ビンを具備する音声信号のスペクトル領域表示を生成するために周波数分析を行うように構成され、
上記周波数ビンを複数の周波数帯域にグループ化するように構成される装置において、上記音声信号の中に有声化音声活性状態を検出したときに、周波数帯域の第1の数に対しては周波数ビン毎のベースでノイズの抑制を行い、上記周波数帯域第2の数に対しては周波数帯域毎のベースでノイズの抑制を行うことを特徴とする装置が提供される。
複数の周波数ビンを具備する音声信号のスペクトル領域表示を生成するために周波数分析を行うように構成され、
上記周波数ビンを複数の周波数帯域にグループ化するように構成される装置において、前記音声信号の中に有声化音声活性状態を検出したときに、周波数帯域の第1の数に対しては周波数ビン毎のベースでノイズの抑制を行い、上記周波数帯域の第2の数に対しては周波数帯域毎のベースでノイズの抑制を行うことを特徴とする音声エンコーダが提供される。
複数の周波数ビンを具備する音声信号のスペクトル領域表示を生成するために周波数分析を行うように構成され、
上記周波数ビンを複数の周波数帯域にグループ化するように構成される装置において、上記音声信号の中に有声化音声活性状態を検出したときに、周波数帯域の第1の数に対しては周波数ビン毎のベースでノイズの抑制を行い、上記周波数帯域の第2の数に対しては周波数帯域毎のベースでノイズの抑制を行うことを特徴とする自動音声認識システムが提供される。
複数の周波数ビンを具備する音声信号のスペクトル領域表示を生成するために周波数分析を行うように構成され、
上記周波数ビンを複数の周波数帯域にグループ化するように構成される装置において、上記音声信号の中に有声化音声活性状態を検出したときに、周波数帯域の第1の数に対しては周波数ビン毎のベースでノイズの抑制を行い、上記周波数帯域の第2の数に対しては周波数帯域毎のベースでノイズの抑制を行うことを特徴とする移動電話が提供される。
離散フーリエ変換を利用してスペクトル分析並びにスペクトルエネルギの推定が行われる。50%のオーバラップを用いて256ポイント高速フーリエ変換(FFT)を利用してフレーム毎に2回周波数分析が行われる(図2に例示されているように)。分析ウィンドウが配置され、それによってすべての先読みが利用されることになる。音声エンコーダの現フレームの開始点の24サンプル後に第1のウィンドウの開始点が配置される。第2のウィンドウはさらに128サンプル後に配置される。周波数分析用の入力信号の重み付けを行うために、ハニング(Hanning)ウィンドウ(サインウィンドウに相当する)の平方根が利用されてきた。このウィンドウは、オーバラップ追加方法用として特に好適である(したがって、この特別のスペクトル分析は、スペクトル減算およびオーバラップ追加分析/合成に基づいてノイズ抑制アルゴリズムで利用される)。平方根ハニング・ウィンドウは下記の式によって与えられる。
臨界帯域={100.0,20,0.0,300.0,400.0,510.0,630.0,770.0,920.0,1080.0,1270.0,1480.0,1720.0,2000.0,2320.0,2700.0,3150.0,3700.0,4400.0,5300.0,6350.0}Hz
(ディー.ジョンストン(D.Johnston)の「知覚ノイズ基準を利用するオーディオ信号の変換符号化」(IEEEJセレクション、通信分野、巻6、第314頁〜第323頁、1988年2月)を参照のこと)
Et=10*log(0.5(Eframe(0)+Eframe(1))、dB (5)
前述のスペクトル分析はフレーム当たり2回実行される。前述の式(2)により計算されているように、ECB (1)(i)とECB (2)(i)とは、それぞれ第1と第2のスペクトル分析用の臨界帯域情報当たりのエネルギを示すものとする。フレーム全体に対する臨界帯域毎の平均エネルギおよび前回のフレームの一部は下記の式として計算される。
SNRCB(i)=Eav(i)/NCB(i)(SNRCB≧1により規定される) (7)
但し、NCB(i)は、次のセクションで説明することになるような臨界帯域毎の推定されるノイズエネルギである。次いで、フレーム当たりの平均SNRは、下記の式として計算される。
thVAD=0.4346SNRLT+13.9575
そうでない(ノイズのない音声の)場合には、
thVAD=1.0333SNRLT−7
狭帯域信号の場合、SNRLT<29.6(ノイズの多い音声)ならば、
thVAD=0.313 SNRLT+14.6
そうでない(ノイズのない音声の)場合には、
thVAD=1.0333 SNRLT−7
thVAD=0.95thVAD
thVAD=thVAD−11
本セクションでは、総ノイズエネルギ、相対フレームエネルギ、長期平均ノイズエネルギと長期平均フレームエネルギとの更新値、および、臨界帯域毎の平均エネルギ並びに騒音補正係数が計算される。さらに、ノイズエネルギの初期化と下方への更新とが行われる。
フレーム全体の臨界帯域毎のフレームエネルギはフレーム内の双方のスペクトル分析からエネルギを平均化することによって計算される。すなわち、下記の式により計算される。
信号領域に対してノイズ低減処理を適用し、オーバラップと追加とを利用して脱ノイズ化信号の再構成が行われる。低減処理は、gminと1との間に制限値を設けたスケーリング利得値であって、当該臨界帯域における信号対雑音比(SNR)から導き出したスケーリング利得値を用いて、個々の臨界帯域においてスペクトルのスケーリングを行うことにより実行される。ノイズ抑制における新たな特徴として、信号の有声化に関係する或る一定の周波数よりも低い周波数に対して、周波数ビン毎のベースで処理を実行し、臨界帯域ベースでは実行しないという特徴が挙げられる。このようにして、当該周波数ビン内のSNRから導き出されるすべての周波数ビンに対してスケーリング利得値が印加されることになる(SNRは、当該ビンを含む臨界帯域のノイズエネルギによって分割されたビンエネルギを利用して計算される)。この新たな特徴によって、歪みを防止するために高調波間でノイズを強く低減させながら、高調波近くの周波数でエネルギを保持することが可能となる。有声信号に対してのみ、そして、利用される周波数分析の周波数分解能が与えられている場合に、相対的に短いピッチ周期を有する信号に対して上記特徴を利用することが可能となる。しかし、正確に言えば、これらの信号は高調波間のノイズを最も知覚できる信号である。
(gs)2=ksSNR+cs (gmin≦gs≦1) (20)
gBIN,LP(i)=αgsgBIN,LP(i)+(1−αgs)gs (26)
gBIN,LP(k)=αgsgBIN,LP(k)+(1−αg)gs (28)
但し、前述の式(26)の場合と同様、αgs=1−gs
スケーリングされたスペクトル成分XR(k)とX’I(k)の決定後、逆FFTがスケーリングされたスペクトルに適用され、下記の式に示すように、時間領域においてウィンドウ化された脱ノイズ化信号が取得される。
このモジュールは、ノイズ抑制用として臨界帯域毎のノイズエネルギ推定値を更新するものである。更新は不活性発話時間中に実行される。しかし、臨界帯域毎のSNRに基づいて上記で実行されるVAD決定は、ノイズエネルギ推定値を更新するかどうかの決定には用いられない。別の決定が、臨界帯域毎のSNRに依存しない別のパラメータに基づいて実行される。ノイズ更新決定用として使用されるパラメータには、以下の、ピッチ安定性、信号の非静的状態、有声化、および、2次LP線形予測残差エネルギと16次LP線形予測残差エネルギとの間の比率パラメータがあり、一般に低感度のノイズレベルの変動を有する。
pc=|d0−d-1|+|d1−d0|+|d2−d1| (31)
但し、d-1は、前回のフレームの第2のハーフフレームの通信のタイムラグである。本実施例では、122よりもさらに大きなピッチラグ用として、オープンループピッチ探索モジュールがd2=d1を設定する。したがって、このような通信のタイムラグに対して、前述の式(31)のpcの値に3/2を乗じて、数式の欠落している第3項の補正が行われる。ピッチ安定性はpcの値が12未満であれば、真となる。さらに、低い有声化用フレームに対して、pcを12に設定して、ピッチの不安定性を示す。
すなわち、下記の式により表される。
(cnorm(d0)+cnorm(d1)+cnorm(d2))/3+re<0.7ならば、pc=12 (32)
但し、cnorm(d)は生の正規化相関値であり、reは、低減値を補正するために、暗騒音の存在時の正規化相関値に追加されるオプションの補正値である。本実施例では、デシメーションを受けた重み付き音声信号swd(n)に基づいて正規化相関値が計算され、下記の式によって与えられる。
d=10,...,16の場合Lsec=40
d=17,...,31の場合Lsec=40
d=32,...,61の場合Lsec=62
d=62,...,115の場合Lsec=115
広帯域信号の場合、αe=0.0245Etot−0.235 (0.5≦αe≦0.99)
狭帯域信号の場合、αe=0.00091Etot+0.3185(0.5≦αe≦0.999)
voicing=(cnorm(d0)+cnorm(d1))/2+re (35)
resid_ratio=E(2)/E(16) (36)
但し、E(2)およびE(16)は、2次および16次の分析後のLP残留エネルギであり、当業者にとっては周知のレヴィンソン−ダービン漸化式(Levinson-Durbin recursion)で計算される。この比率は、信号スペクトル包絡を表すためには、一般に、より高次のLPの方がノイズ用の音声信号にとって必要であるという事実を反映する比率である。言い換えれば、 E(2)とE(16)との間の差分はノイズ用の活性音声用の場合よりも低くなるように仮定されている。
(nonstat>thstat)または(pc<12)(有声化>0.85)または(resid_ratio>thresid)の場合、
noise_update=noise_update+2
そうでない場合には、
noise_update=noise_update−10
但し、広帯域信号に対して、thstat=350000かつthresid=1.9、および、狭帯域信号に対して、thstat=500000かつthresid=11
i=0...19に対して、NCB(i)=Ntmp(i)になる。但し、Ntmp(i)は、前述の式(17)ですでに計算された一時的に更新されたノイズエネルギである。
それ未満の周波数の信号が有声音であると見なされるカットオフ周波数が更新される。この周波数を利用して臨界帯域の数が決定され、この臨界帯域に対して周波数ビン毎の処理を利用してノイズ抑制が実行される。
(0.4cnorm(d1)+06Cnorm(d2)≦0.72)または(d1>116)または(d2>116)ならば、k=0
Claims (83)
- 音声信号のノイズ抑制方法であって、
複数の周波数ビンを具備する音声信号のスペクトル領域表示を生成するために周波数分析を行うステップと、
前記周波数ビンを複数の周波数帯域にグループ化するステップとを有する方法において、前記音声信号の中に有声化音声活性状態を検出したときに、周波数帯域の第1の数に対しては周波数ビン毎のベースでノイズの抑制を行い、前記周波数帯域の第2の数に対しては周波数帯域毎のベースでノイズの抑制を行うことを特徴とする音声信号のノイズ抑制方法。 - 周波数帯域の前記第1の数が、有声化された周波数帯域の前記第1の数に従って決定される請求項1に記載の方法。
- それ未満の周波数の信号が有声音であると見なされる有声化カットオフ周波数に関して、周波数帯域の前記第1の数を決定する請求項1に記載の方法。
- 周波数帯域の前記第1の数が、前記音声信号のすべての周波数帯域を含み、前記すべての周波数帯域が前記有声化カットオフ周波数を上回らない上位周波数を有する請求項3に記載の方法。
- 周波数帯域の前記第1の数が所定の固定数である請求項1に記載の方法。
- 前記音声信号の周波数帯域が有声化されていない場合、すべての周波数帯域に対して周波数帯域毎のベースでノイズの抑制を行う請求項1に記載の方法。
- 前記音声信号が、複数のサンプルを含む音声フレームを含み、請求項1に記載の方法を適用して、音声フレーム内のノイズの抑制を行う請求項1に記載の方法。
- 前記音声フレームの第1のサンプルに関してm個のサンプルによってオフセットされる分析ウィンドウを利用して、請求項1の前記周波数分析を行うステップを有する請求項7に記載の方法。
- 前記音声フレームの第1のサンプルに関してm個のサンプルによってオフセットされる第1の分析ウィンドウを利用して、第1の周波数分析を行うステップと、前記音声フレームの第2のサンプルに関してp個のサンプルによってオフセットされる第2の分析ウィンドウを利用して、第2の周波数分析を行うステップとを有する請求項7に記載の方法。
- m=24で、p=128である請求項9に記載の方法。
- 前記第2の分析ウィンドウが、前記音声フレームから、後続する音声フレームの中へ延在する先読み部分を含む請求項9に記載の方法。
- 前記周波数ビンおよび周波数帯域の少なくとも一方にスケーリング利得値を印加してノイズの抑制を行うステップを有する請求項1に記載の方法。
- 周波数ビン毎のベースでノイズの抑制を行うときに、周波数ビンに対して周波数ビン固有のスケーリング利得値を決定するステップをさらに有する請求項1に記載の方法。
- 周波数帯域毎のベースでノイズの抑制を行うときに、周波数帯域に対して周波数帯域特有のスケーリング利得値を決定するステップを有する請求項1に記載の方法。
- 一定のスケーリング利得値を印加することによってノイズの抑制を行うステップを有する請求項6に記載の方法。
- 周波数ビンに対して決定された前記周波数ビンの信号対雑音比(SNR)に関して、前記周波数ビンに対して周波数ビン特有のスケーリング利得値を決定するステップを有する請求項13に記載の方法。
- 周波数帯域に対して決定された前記周波数帯域の信号対雑音比(SNR)に関して、前記周波数帯域に対して周波数帯域特有のスケーリング利得値を決定するステップを有する請求項14に記載の方法。
- 前記第1および第2の周波数分析の各々に対して請求項16に記載のステップを有する請求項16に記載の方法。
- 前記第1と第2の周波数分析の各々に対して請求項17に記載のステップを有する請求項17に記載の方法。
- 前記スケーリング利得値が、平滑化済みのスケーリング利得値である請求項12〜14のいずれか一項に記載の方法。
- 或る特定の周波数ビン、または或る特定の周波数帯域のスケーリング利得値に対して逆比例する値を有する平滑化係数を用いて、前記特定の周波数ビン、または前記特定の周波数帯域に対して印加すべき平滑化済みのスケーリング利得値を計算するステップを有する請求項12〜14のいずれか一項に記載の方法。
- 平滑化ステップが、小さな値のスケーリング利得に対してより強くなるように決定された値を有する平滑化係数を用いて、前記特定の周波数ビン、または前記特定の周波数帯域に対して印加すべき平滑化済みのスケーリング利得値を計算するステップを有する請求項12〜14のいずれか一項に記載の方法。
- 前記スケーリング利得の値を決定するステップが、音声フレーム毎にn回(nは1よりも大きい)発生する請求項13または14に記載の方法。
- n=2である請求項23に記載の方法。
- 音声フレーム毎にn回(nは1よりも大きい)前記スケーリング利得の値を決定するステップを有する方法であって、前記有声化カットオフ周波数が少なくとも部分的に前回の音声フレーム内の前記音声信号の関数である請求項13または14に記載の方法。
- 周波数ビン毎のベースのノイズ抑制が、17の帯域に対応する74ビンの最大値で行われる請求項13に記載の方法。
- 周波数ビン毎のベースのノイズ抑制が、3700Hzの周波数に従って最大数の周波数ビンで行われる請求項13に記載の方法。
- 第1のSNR値に対しては前記スケーリング利得の値が最小値に設定され、前記第1のSNR値よりも大きな第2のSNR値に対しては前記スケーリング利得の値が1に設定される請求項16に記載の方法。
- 前記第1のSNR値が約1dBに等しく、前記第2のSNR値が約45dBである請求項28に記載の方法。
- 活性音声を含まない音声信号の検出セクションをさらに具備する請求項20に記載の方法。
- 活性音声を含まない音声信号のセクションの検出に応答して、前記平滑化済みのスケーリング利得を最小値にリセットするステップをさらに有する請求項30に記載の方法。
- 複数の周波数帯域内の最大ノイズエネルギがしきい値未満であるときに、前記ノイズ抑制手法が活性音声フレームでは実行されない請求項7に記載の方法。
- 短いハングオーバ音声フレームの発生に応答して、第1のx周波数帯域用の帯域毎のベースで決定された平滑化済みのスケーリング利得を印加して前記音声信号の周波数スぺクトルのスケーリングを行うステップと、前記スケーリング利得の単一値を印加して前記音声信号の周波数スぺクトルの残りの周波数帯域のスケーリングを行うステップとをさらに有する請求項7に記載の方法。
- 前記第1のx周波数帯域が、1700Hzまでの周波数に対応する請求項33に記載の方法。
- 狭帯域音声信号に対して、個々の周波数帯域が少なくとも2つの周波数ビンを具備する第1のx周波数帯域であって、前記第1のx周波数帯域が3700Hzまでの周波数に対応する前記周波数帯域毎のベースで決定された平滑化済みのスケーリング利得値を印加することによってノイズの抑制を行うステップと、3700Hzに対応する前記周波数ビンで、前記スケーリング利得の値を印可することによってノイズの抑制を行うステップと、前記音声信号の周波数スぺクトルの残りの周波数帯域をゼロにするステップとをさらに有する請求項20に記載の方法。
- 前記狭帯域音声信号が、12800Hzまでアップサンプリングされた狭帯域音声信号である請求項35に記載の方法。
- 計算された有声音測定値を用いて前記有声化カットオフ周波数を決定する請求項3に記載の方法。
- 前記有声化カットオフ周波数を上回らない上位周波数を有する臨界帯域の数をさらに決定するステップを有しており、x周波数帯域の最小値とy周波数帯域の最大値とに対して周波数ビン毎の処理を実行するように境界周波数を設定する請求項37に記載の方法。
- x=3およびy=17である請求項38に記載の方法。
- 325Hz以上で、かつ、3700Hz以下となるように前記有声化カットオフ周波数の境界周波数を設ける請求項37に記載の方法。
- 音声信号内のノイズを抑制する装置であって、
複数の周波数ビンを具備する音声信号のスペクトル領域表示を生成するために周波数分析を行うように構成され、
前記周波数ビンを複数の周波数帯域にグループ化するように構成される装置において、前記音声信号の中に有声化音声活性状態を検出したときに、周波数帯域の第1の数に対しては周波数ビン毎のベースでノイズの抑制を行い、前記周波数帯域の第2の数に対しては周波数帯域毎のベースでノイズの抑制を行うことを特徴とする音声信号内のノイズを抑制する装置。 - 周波数帯域の前記第1の数が、有声化された周波数帯域の第1の数に従って決定される請求項41に記載の装置。
- それ未満の周波数の信号は有声音であると見なされる有声化カットオフ周波数に関して、周波数帯域の前記第1の数を決定するように構成される請求項41に記載の装置。
- 周波数帯域の前記第1の数が、前記音声信号のすべての周波数帯域を含み、前記すべての周波数帯域が前記有声化カットオフ周波数を上回らない上位周波数を有する請求項43に記載の装置。
- 周波数帯域の前記第1の数が所定の固定数である請求項41に記載の装置。
- 前記音声信号の周波数帯域が有声化されていない場合、すべての周波数帯域に対して周波数帯域毎のベースでノイズの抑制を行う請求項41に記載の装置。
- 前記音声信号が複数のサンプルを含む音声フレームを含み、音声フレーム内のノイズの抑制を行うように構成される請求項41に記載の装置。
- 前記音声フレームの第1のサンプルに関してm個のサンプルによってオフセットされる分析ウィンドウを利用して、前記周波数分析を行うように構成される請求項47に記載の装置。
- 前記音声フレームの第1のサンプルに関してm個のサンプルによってオフセットされる第1の分析ウィンドウを利用して、第1の周波数分析を行い、前記音声フレームの第2のサンプルに関してp個のサンプルによってオフセットされる第2の分析ウィンドウを利用して、第2の周波数分析を行うように構成される請求項47に記載の装置。
- m=24で、p=128である請求項49に記載の装置。
- 前記第2の分析ウィンドウが、前記音声フレームから、後続する音声フレームの中へ延在する先読み部分を含む請求項49に記載の装置。
- 前記周波数ビンおよび周波数帯域の少なくとも一方にスケーリング利得値を印加してノイズの抑制を行うように構成される請求項41に記載の装置。
- 周波数ビン毎のベースでノイズの抑制を行うときに、周波数ビンに対して周波数ビン特有のスケーリング利得値を決定するようにさらに構成される請求項41に記載の装置。
- 周波数帯域毎のベースでノイズの抑制を行うときに、周波数帯域に対して周波数帯域固有のスケーリング利得値を決定するようにさらに構成される請求項41に記載の装置。
- すべての周波数帯域に対して一定のスケーリング利得値を印加することによってノイズの抑制を行うように構成される請求項46に記載の装置。
- 前記周波数ビンに対して決定された周波数ビンの信号対雑音比(SNR)に関して、前記周波数ビンに対して周波数ビン固有のスケーリング利得値を決定するように構成される請求項53に記載の装置。
- 前記周波数帯域に対して決定された前記周波数帯域の信号対雑音比(SNR)に関して、前記周波数帯域に対して周波数帯域固有のスケーリング利得値を決定するように構成される請求項54に記載の装置。
- 前記第1と第2の周波数分析の各々に対して請求項56に記載のステップを実行するように構成される請求項56に記載の装置。
- 前記第1と第2の周波数分析の各々に対して請求項57に記載のステップを実行するように構成される請求項57に記載の装置。
- 前記スケーリング利得値が平滑化済みのスケーリング利得値である請求項52〜54のいずれか一項に記載の装置。
- 或る特定の周波数ビン、または或る特定の周波数帯域のスケーリング利得値に対して逆比例する値を有する平滑化係数を用いて、前記特定の周波数ビン、または前記特定の周波数帯域に対して印加すべき平滑化済みのスケーリング利得値を計算するように構成される請求項52〜54のいずれか一項に記載の装置。
- 平滑化ステップが、小さな値のスケーリング利得値に対してより強くなるように決定された値を有する平滑化係数を用いて、前記特定の周波数ビン、または前記特定の周波数帯域に対して印加すべき平滑化済みのスケーリング利得値を計算するように構成される請求項52〜54のいずれか一項に記載の装置。
- 音声フレーム毎にn回(nは1よりも大)前記スケーリング利得値を決定するように構成される請求項53または54に記載の装置。
- n=2である請求項63に記載の装置。
- 音声フレーム毎にn回(nは1よりも大きい)前記スケーリング利得値を決定するように構成される装置であって、前記有声化カットオフ周波数が少なくとも部分的に前回の音声フレーム内の前記音声信号の関数である請求項53または54に記載の装置。
- 17の帯域に対応する74ビンの最大値で周波数ビン毎のベースのノイズ抑制を行うように構成される請求項53に記載の装置。
- 3700Hzの周波数に対応する最大数の周波数ビンで周波数ビン毎のベースのノイズ抑制を行うように構成される請求項53に記載の装置。
- 第1のSNR値に対しては前記スケーリング利得値を最小値に設定し、前記第1のSNR値よりも大きな第2のSNR値に対しては前記スケーリング利得値を1に設定する請求項56に記載の装置。
- 前記第1のSNR値が約1dBに等しく、前記第2のSNR値が約45dBである請求項68に記載の装置。
- 活性音声を含まない音声信号のセクションを検出するように構成される請求項60に記載の装置。
- 活性音声を含まない音声信号のセクションの検出に応答して、前記平滑化済みのスケーリング利得値を最小値にリセットするように構成される請求項70に記載の装置。
- 複数の周波数帯域内の最大ノイズエネルギがしきい値未満であるときに、活性音声フレームでノイズ抑制を行わないように構成される請求項47に記載の装置。
- 短いハングオーバ音声フレームの発生に応答して、第1のx周波数帯域に対して周波数帯域毎のベースで決定されたスケーリング利得値を平滑化することによってノイズ抑制を行い、残りの周波数帯域に対してスケーリング利得の単一値を印加することによってノイズ抑制を行うように構成される請求項47に記載の装置。
- 前記第1のx周波数帯域が、1700Hzまでの周波数に対応する請求項73に記載の装置。
- 狭帯域音声信号に対して、3700Hzまでの周波数に対応する第1のx周波数帯域に対して、前記周波数帯域毎のベースで決定された平滑化済みのスケーリング利得値を印加することによってノイズの抑制を行い、3700Hzに対応する前記周波数ビンのスケーリング利得値を3700Hzと4000Hzとの間の前記周波数ビンに印加することによってノイズの抑制を行い、前記第1のx周波数帯域が前記音声信号の周波数スぺクトルの残りの周波数帯域をゼロにするように構成される請求項60に記載の装置。
- 前記狭帯域音声信号が、12800Hzまでアップサンプリングされた狭帯域音声信号である請求項75に記載の装置。
- 計算された有声音測定値を用いて前記有声化カットオフ周波数を決定する請求項43に記載の装置。
- 前記有声化カットオフ周波数を上回らない上位周波数を有する臨界帯域の数をさらに決定するステップを有しており、x周波数帯域の最小値とy周波数帯域の最大値とで周波数ビン毎の処理を実行するように構成される境界周波数を設定する請求項77に記載の装置。
- x=3およびy=17である請求項78に記載の装置。
- 325Hz以上で、かつ、3700Hz以下となるように前記有声化カットオフ周波数の境界周波数を設ける請求項77に記載の装置。
- ノイズ抑制装置を具備する音声エンコーダであって、前記ノイズ抑制装置が、
複数の周波数ビンを具備する音声信号のスペクトル領域表示を生成するために周波数分析を行うように構成され、
前記周波数ビンを複数の周波数帯域にグループ化するように構成される装置において、前記音声信号の中に有声化音声活性状態を検出したときに、周波数帯域の第1の数に対しては周波数ビン毎のベースでノイズの抑制を行い、前記周波数帯域の第2の数に対しては周波数帯域毎のベースでノイズの抑制を行うことを特徴とする音声エンコーダ。 - ノイズ抑制装置を具備する自動音声認識システムであって、前記ノイズ抑制装置が、
複数の周波数ビンを具備する音声信号のスペクトル領域表示を生成するために周波数分析を行うように構成され、
前記周波数ビンを複数の周波数帯域にグループ化するように構成される装置において、前記音声信号の中に有声化音声活性状態を検出したときに、周波数帯域の第1の数に対しては周波数ビン毎のベースでノイズの抑制を行い、前記周波数帯域の第2の数に対しては周波数帯域毎のベースでノイズの抑制を行うことを特徴とする自動音声認識システム。 - ノイズ抑制装置を具備する移動電話であって、前記ノイズ抑制装置が、
複数の周波数ビンを具備する音声信号のスペクトル領域表示を生成するために周波数分析を行うように構成され、
前記周波数ビンを複数の周波数帯域にグループ化するように構成される装置において、前記音声信号の中に有声化音声活性状態を検出したときに、周波数帯域の第1の数に対しては周波数ビン毎のベースでノイズの抑制を行い、前記周波数帯域の第2の数に対しては周波数帯域毎のベースでノイズの抑制を行うことを特徴とする移動電話。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CA002454296A CA2454296A1 (en) | 2003-12-29 | 2003-12-29 | Method and device for speech enhancement in the presence of background noise |
PCT/CA2004/002203 WO2005064595A1 (en) | 2003-12-29 | 2004-12-29 | Method and device for speech enhancement in the presence of background noise |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007517249A JP2007517249A (ja) | 2007-06-28 |
JP4440937B2 true JP4440937B2 (ja) | 2010-03-24 |
Family
ID=34683070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006545874A Active JP4440937B2 (ja) | 2003-12-29 | 2004-12-29 | 暗騒音存在時の音声を改善するための方法および装置 |
Country Status (19)
Country | Link |
---|---|
US (1) | US8577675B2 (ja) |
EP (1) | EP1700294B1 (ja) |
JP (1) | JP4440937B2 (ja) |
KR (1) | KR100870502B1 (ja) |
CN (1) | CN100510672C (ja) |
AT (1) | ATE441177T1 (ja) |
AU (1) | AU2004309431C1 (ja) |
BR (1) | BRPI0418449A (ja) |
CA (2) | CA2454296A1 (ja) |
DE (1) | DE602004022862D1 (ja) |
ES (1) | ES2329046T3 (ja) |
HK (1) | HK1099946A1 (ja) |
MX (1) | MXPA06007234A (ja) |
MY (1) | MY141447A (ja) |
PT (1) | PT1700294E (ja) |
RU (1) | RU2329550C2 (ja) |
TW (1) | TWI279776B (ja) |
WO (1) | WO2005064595A1 (ja) |
ZA (1) | ZA200606215B (ja) |
Families Citing this family (92)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7113580B1 (en) * | 2004-02-17 | 2006-09-26 | Excel Switching Corporation | Method and apparatus for performing conferencing services and echo suppression |
JP5230103B2 (ja) * | 2004-02-18 | 2013-07-10 | ニュアンス コミュニケーションズ,インコーポレイテッド | 自動音声認識器のためのトレーニングデータを生成する方法およびシステム |
DE102004049347A1 (de) * | 2004-10-08 | 2006-04-20 | Micronas Gmbh | Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale |
TWI319565B (en) * | 2005-04-01 | 2010-01-11 | Qualcomm Inc | Methods, and apparatus for generating highband excitation signal |
US9043214B2 (en) | 2005-04-22 | 2015-05-26 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor attenuation |
JP4765461B2 (ja) * | 2005-07-27 | 2011-09-07 | 日本電気株式会社 | 雑音抑圧システムと方法及びプログラム |
US7366658B2 (en) * | 2005-12-09 | 2008-04-29 | Texas Instruments Incorporated | Noise pre-processor for enhanced variable rate speech codec |
US7930178B2 (en) * | 2005-12-23 | 2011-04-19 | Microsoft Corporation | Speech modeling and enhancement based on magnitude-normalized spectra |
US9185487B2 (en) * | 2006-01-30 | 2015-11-10 | Audience, Inc. | System and method for providing noise suppression utilizing null processing noise subtraction |
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
US7593535B2 (en) * | 2006-08-01 | 2009-09-22 | Dts, Inc. | Neural network filtering techniques for compensating linear and non-linear distortion of an audio transducer |
CN101246688B (zh) * | 2007-02-14 | 2011-01-12 | 华为技术有限公司 | 一种对背景噪声信号进行编解码的方法、系统和装置 |
JP5530720B2 (ja) * | 2007-02-26 | 2014-06-25 | ドルビー ラボラトリーズ ライセンシング コーポレイション | エンターテイメントオーディオにおける音声強調方法、装置、およびコンピュータ読取り可能な記録媒体 |
EP3070714B1 (en) * | 2007-03-19 | 2018-03-14 | Dolby Laboratories Licensing Corporation | Noise variance estimation for speech enhancement |
CN101320559B (zh) * | 2007-06-07 | 2011-05-18 | 华为技术有限公司 | 一种声音激活检测装置及方法 |
WO2009000073A1 (en) * | 2007-06-22 | 2008-12-31 | Voiceage Corporation | Method and device for sound activity detection and sound signal classification |
ATE514163T1 (de) | 2007-09-12 | 2011-07-15 | Dolby Lab Licensing Corp | Spracherweiterung |
JPWO2009051132A1 (ja) * | 2007-10-19 | 2011-03-03 | 日本電気株式会社 | 信号処理システムと、その装置、方法及びそのプログラム |
US8688441B2 (en) * | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
US8554551B2 (en) | 2008-01-28 | 2013-10-08 | Qualcomm Incorporated | Systems, methods, and apparatus for context replacement by audio level |
US8433582B2 (en) * | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US20090201983A1 (en) * | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
EP2863390B1 (en) * | 2008-03-05 | 2018-01-31 | Voiceage Corporation | System and method for enhancing a decoded tonal sound signal |
CN101483042B (zh) * | 2008-03-20 | 2011-03-30 | 华为技术有限公司 | 一种噪声生成方法以及噪声生成装置 |
US8606573B2 (en) * | 2008-03-28 | 2013-12-10 | Alon Konchitsky | Voice recognition improved accuracy in mobile environments |
KR101317813B1 (ko) * | 2008-03-31 | 2013-10-15 | (주)트란소노 | 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터판독 가능한 기록매체 |
US9142221B2 (en) * | 2008-04-07 | 2015-09-22 | Cambridge Silicon Radio Limited | Noise reduction |
US9253568B2 (en) * | 2008-07-25 | 2016-02-02 | Broadcom Corporation | Single-microphone wind noise suppression |
US8515097B2 (en) * | 2008-07-25 | 2013-08-20 | Broadcom Corporation | Single microphone wind noise suppression |
US8463412B2 (en) * | 2008-08-21 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus to facilitate determining signal bounding frequencies |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
EP2416315B1 (en) * | 2009-04-02 | 2015-05-20 | Mitsubishi Electric Corporation | Noise suppression device |
WO2011004299A1 (en) * | 2009-07-07 | 2011-01-13 | Koninklijke Philips Electronics N.V. | Noise reduction of breathing signals |
CA2778342C (en) * | 2009-10-19 | 2017-08-22 | Martin Sehlstedt | Method and background estimator for voice activity detection |
JP2013508773A (ja) * | 2009-10-19 | 2013-03-07 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 音声エンコーダの方法およびボイス活動検出器 |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
ES2930203T3 (es) | 2010-01-19 | 2022-12-07 | Dolby Int Ab | Transposición armónica basada en bloque de sub bandas mejorada |
JP5649084B2 (ja) * | 2010-03-09 | 2015-01-07 | フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | 再生速度またはピッチを変更する際にオーディオ信号における過渡音声事象を処理するための装置および方法 |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
KR101173980B1 (ko) * | 2010-10-18 | 2012-08-16 | (주)트란소노 | 음성통신 기반 잡음 제거 시스템 및 그 방법 |
KR101176207B1 (ko) * | 2010-10-18 | 2012-08-28 | (주)트란소노 | 음성통신 시스템 및 음성통신 방법 |
US8831937B2 (en) * | 2010-11-12 | 2014-09-09 | Audience, Inc. | Post-noise suppression processing to improve voice quality |
EP2458586A1 (en) * | 2010-11-24 | 2012-05-30 | Koninklijke Philips Electronics N.V. | System and method for producing an audio signal |
EP3726530A1 (en) * | 2010-12-24 | 2020-10-21 | Huawei Technologies Co., Ltd. | Method and apparatus for adaptively detecting a voice activity in an input audio signal |
KR20120080409A (ko) * | 2011-01-07 | 2012-07-17 | 삼성전자주식회사 | 잡음 구간 판별에 의한 잡음 추정 장치 및 방법 |
CN103415818B (zh) * | 2011-01-11 | 2017-11-17 | 西门子公司 | 用于信号滤波的方法和装置以及用于过程的控制装置 |
US8650029B2 (en) * | 2011-02-25 | 2014-02-11 | Microsoft Corporation | Leveraging speech recognizer feedback for voice activity detection |
US20140114653A1 (en) * | 2011-05-06 | 2014-04-24 | Nokia Corporation | Pitch estimator |
TWI459381B (zh) | 2011-09-14 | 2014-11-01 | Ind Tech Res Inst | 語音增強方法 |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
US8712076B2 (en) | 2012-02-08 | 2014-04-29 | Dolby Laboratories Licensing Corporation | Post-processing including median filtering of noise suppression gains |
KR101679209B1 (ko) | 2012-02-23 | 2016-12-06 | 돌비 인터네셔널 에이비 | 고 주파수 오디오 콘텐트의 효율적인 복구를 위한 방법들 및 시스템들 |
CN103325380B (zh) | 2012-03-23 | 2017-09-12 | 杜比实验室特许公司 | 用于信号增强的增益后处理 |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
KR101626438B1 (ko) | 2012-11-20 | 2016-06-01 | 유니파이 게엠베하 운트 코. 카게 | 오디오 데이터 프로세싱을 위한 방법, 디바이스, 및 시스템 |
CA2948015C (en) | 2012-12-21 | 2018-03-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Comfort noise addition for modeling background noise at low bit-rates |
CN103886867B (zh) * | 2012-12-21 | 2017-06-27 | 华为技术有限公司 | 一种噪声抑制装置及其方法 |
US9495951B2 (en) * | 2013-01-17 | 2016-11-15 | Nvidia Corporation | Real time audio echo and background noise reduction for a mobile device |
AU2014211544B2 (en) * | 2013-01-29 | 2017-03-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Noise filling in perceptual transform audio coding |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
JP6303340B2 (ja) * | 2013-08-30 | 2018-04-04 | 富士通株式会社 | 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム |
KR20150032390A (ko) * | 2013-09-16 | 2015-03-26 | 삼성전자주식회사 | 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법 |
DE102013111784B4 (de) | 2013-10-25 | 2019-11-14 | Intel IP Corporation | Audioverarbeitungsvorrichtungen und audioverarbeitungsverfahren |
US9449615B2 (en) * | 2013-11-07 | 2016-09-20 | Continental Automotive Systems, Inc. | Externally estimated SNR based modifiers for internal MMSE calculators |
US9449610B2 (en) * | 2013-11-07 | 2016-09-20 | Continental Automotive Systems, Inc. | Speech probability presence modifier improving log-MMSE based noise suppression performance |
US9449609B2 (en) * | 2013-11-07 | 2016-09-20 | Continental Automotive Systems, Inc. | Accurate forward SNR estimation based on MMSE speech probability presence |
CN104681034A (zh) | 2013-11-27 | 2015-06-03 | 杜比实验室特许公司 | 音频信号处理 |
GB2523984B (en) | 2013-12-18 | 2017-07-26 | Cirrus Logic Int Semiconductor Ltd | Processing received speech data |
CN107086043B (zh) | 2014-03-12 | 2020-09-08 | 华为技术有限公司 | 检测音频信号的方法和装置 |
US10176823B2 (en) * | 2014-05-09 | 2019-01-08 | Apple Inc. | System and method for audio noise processing and noise reduction |
KR20160000680A (ko) * | 2014-06-25 | 2016-01-05 | 주식회사 더바인코퍼레이션 | 광대역 보코더용 휴대폰 명료도 향상장치와 이를 이용한 음성출력장치 |
CA2956531C (en) | 2014-07-29 | 2020-03-24 | Telefonaktiebolaget Lm Ericsson (Publ) | Estimation of background noise in audio signals |
US9799330B2 (en) | 2014-08-28 | 2017-10-24 | Knowles Electronics, Llc | Multi-sourced noise suppression |
US9978388B2 (en) | 2014-09-12 | 2018-05-22 | Knowles Electronics, Llc | Systems and methods for restoration of speech components |
US9947318B2 (en) * | 2014-10-03 | 2018-04-17 | 2236008 Ontario Inc. | System and method for processing an audio signal captured from a microphone |
US9886966B2 (en) * | 2014-11-07 | 2018-02-06 | Apple Inc. | System and method for improving noise suppression using logistic function and a suppression target value for automatic speech recognition |
TWI569263B (zh) * | 2015-04-30 | 2017-02-01 | 智原科技股份有限公司 | 聲頻訊號的訊號擷取方法與裝置 |
KR102015742B1 (ko) * | 2015-12-01 | 2019-08-28 | 미쓰비시덴키 가부시키가이샤 | 음성 인식 장치, 음성 강조 장치, 음성 인식 방법, 음성 강조 방법 및 네비게이션 시스템 |
US9820042B1 (en) | 2016-05-02 | 2017-11-14 | Knowles Electronics, Llc | Stereo separation and directional suppression with omni-directional microphones |
CN108022595A (zh) * | 2016-10-28 | 2018-05-11 | 电信科学技术研究院 | 一种语音信号降噪方法和用户终端 |
CN106782504B (zh) * | 2016-12-29 | 2019-01-22 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
CN111183476B (zh) * | 2017-10-06 | 2024-03-22 | 索尼欧洲有限公司 | 基于子窗口序列内的rms功率的音频文件包络 |
US10771621B2 (en) * | 2017-10-31 | 2020-09-08 | Cisco Technology, Inc. | Acoustic echo cancellation based sub band domain active speaker detection for audio and video conferencing applications |
RU2701120C1 (ru) * | 2018-05-14 | 2019-09-24 | Федеральное государственное казенное военное образовательное учреждение высшего образования "Военный учебно-научный центр Военно-Морского Флота "Военно-морская академия имени Адмирала флота Советского Союза Н.Г. Кузнецова" | Устройство для обработки речевого сигнала |
US10681458B2 (en) * | 2018-06-11 | 2020-06-09 | Cirrus Logic, Inc. | Techniques for howling detection |
KR102327441B1 (ko) * | 2019-09-20 | 2021-11-17 | 엘지전자 주식회사 | 인공지능 장치 |
US11217262B2 (en) * | 2019-11-18 | 2022-01-04 | Google Llc | Adaptive energy limiting for transient noise suppression |
US11264015B2 (en) | 2019-11-21 | 2022-03-01 | Bose Corporation | Variable-time smoothing for steady state noise estimation |
US11374663B2 (en) * | 2019-11-21 | 2022-06-28 | Bose Corporation | Variable-frequency smoothing |
CN111429932A (zh) * | 2020-06-10 | 2020-07-17 | 浙江远传信息技术股份有限公司 | 语音降噪方法、装置、设备及介质 |
CN112634929A (zh) * | 2020-12-16 | 2021-04-09 | 普联国际有限公司 | 一种语音增强方法、装置及存储介质 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57161800A (en) * | 1981-03-30 | 1982-10-05 | Toshiyuki Sakai | Voice information filter |
AU633673B2 (en) * | 1990-01-18 | 1993-02-04 | Matsushita Electric Industrial Co., Ltd. | Signal processing device |
US5432859A (en) * | 1993-02-23 | 1995-07-11 | Novatel Communications Ltd. | Noise-reduction system |
JP3297307B2 (ja) * | 1996-06-14 | 2002-07-02 | 沖電気工業株式会社 | 背景雑音消去装置 |
US6098038A (en) * | 1996-09-27 | 2000-08-01 | Oregon Graduate Institute Of Science & Technology | Method and system for adaptive speech enhancement using frequency specific signal-to-noise ratio estimates |
US6097820A (en) * | 1996-12-23 | 2000-08-01 | Lucent Technologies Inc. | System and method for suppressing noise in digitally represented voice signals |
US6456965B1 (en) * | 1997-05-20 | 2002-09-24 | Texas Instruments Incorporated | Multi-stage pitch and mixed voicing estimation for harmonic speech coders |
US6044341A (en) * | 1997-07-16 | 2000-03-28 | Olympus Optical Co., Ltd. | Noise suppression apparatus and recording medium recording processing program for performing noise removal from voice |
US20020002455A1 (en) * | 1998-01-09 | 2002-01-03 | At&T Corporation | Core estimator and adaptive gains from signal to noise ratio in a hybrid speech enhancement system |
US6088668A (en) * | 1998-06-22 | 2000-07-11 | D.S.P.C. Technologies Ltd. | Noise suppressor having weighted gain smoothing |
US7209567B1 (en) * | 1998-07-09 | 2007-04-24 | Purdue Research Foundation | Communication system with adaptive noise suppression |
US6351731B1 (en) * | 1998-08-21 | 2002-02-26 | Polycom, Inc. | Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6233549B1 (en) * | 1998-11-23 | 2001-05-15 | Qualcomm, Inc. | Low frequency spectral enhancement system and method |
US6363345B1 (en) * | 1999-02-18 | 2002-03-26 | Andrea Electronics Corporation | System, method and apparatus for cancelling noise |
US6618701B2 (en) * | 1999-04-19 | 2003-09-09 | Motorola, Inc. | Method and system for noise suppression using external voice activity detection |
JP4242516B2 (ja) | 1999-07-26 | 2009-03-25 | パナソニック株式会社 | サブバンド符号化方式 |
FI116643B (fi) * | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
CA2290037A1 (en) * | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
US6366880B1 (en) * | 1999-11-30 | 2002-04-02 | Motorola, Inc. | Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies |
US7058572B1 (en) * | 2000-01-28 | 2006-06-06 | Nortel Networks Limited | Reducing acoustic noise in wireless and landline based telephony |
US6704711B2 (en) * | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
US6898566B1 (en) * | 2000-08-16 | 2005-05-24 | Mindspeed Technologies, Inc. | Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal |
US6862567B1 (en) * | 2000-08-30 | 2005-03-01 | Mindspeed Technologies, Inc. | Noise suppression in the frequency domain by adjusting gain according to voicing parameters |
JP2002149200A (ja) * | 2000-08-31 | 2002-05-24 | Matsushita Electric Ind Co Ltd | 音声処理装置及び音声処理方法 |
US6947888B1 (en) * | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
US6925435B1 (en) | 2000-11-27 | 2005-08-02 | Mindspeed Technologies, Inc. | Method and apparatus for improved noise reduction in a speech encoder |
JP4282227B2 (ja) * | 2000-12-28 | 2009-06-17 | 日本電気株式会社 | ノイズ除去の方法及び装置 |
US7155385B2 (en) * | 2002-05-16 | 2006-12-26 | Comerica Bank, As Administrative Agent | Automatic gain control for adjusting gain during non-speech portions |
US7492889B2 (en) * | 2004-04-23 | 2009-02-17 | Acoustic Technologies, Inc. | Noise suppression based on bark band wiener filtering and modified doblinger noise estimate |
-
2003
- 2003-12-29 CA CA002454296A patent/CA2454296A1/en not_active Abandoned
-
2004
- 2004-12-22 US US11/021,938 patent/US8577675B2/en active Active
- 2004-12-27 TW TW093140706A patent/TWI279776B/zh active
- 2004-12-27 MY MYPI20045377A patent/MY141447A/en unknown
- 2004-12-29 JP JP2006545874A patent/JP4440937B2/ja active Active
- 2004-12-29 AU AU2004309431A patent/AU2004309431C1/en active Active
- 2004-12-29 DE DE602004022862T patent/DE602004022862D1/de active Active
- 2004-12-29 PT PT04802378T patent/PT1700294E/pt unknown
- 2004-12-29 RU RU2006126530/09A patent/RU2329550C2/ru active
- 2004-12-29 AT AT04802378T patent/ATE441177T1/de not_active IP Right Cessation
- 2004-12-29 WO PCT/CA2004/002203 patent/WO2005064595A1/en active Application Filing
- 2004-12-29 KR KR1020067015437A patent/KR100870502B1/ko active IP Right Grant
- 2004-12-29 CN CNB2004800417014A patent/CN100510672C/zh active Active
- 2004-12-29 EP EP04802378A patent/EP1700294B1/en active Active
- 2004-12-29 MX MXPA06007234A patent/MXPA06007234A/es active IP Right Grant
- 2004-12-29 CA CA2550905A patent/CA2550905C/en active Active
- 2004-12-29 BR BRPI0418449-1A patent/BRPI0418449A/pt not_active Application Discontinuation
- 2004-12-29 ES ES04802378T patent/ES2329046T3/es active Active
-
2006
- 2006-07-27 ZA ZA200606215A patent/ZA200606215B/xx unknown
-
2007
- 2007-07-13 HK HK07107508.3A patent/HK1099946A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
EP1700294A4 (en) | 2007-02-28 |
EP1700294A1 (en) | 2006-09-13 |
RU2329550C2 (ru) | 2008-07-20 |
KR100870502B1 (ko) | 2008-11-25 |
DE602004022862D1 (de) | 2009-10-08 |
CN100510672C (zh) | 2009-07-08 |
MXPA06007234A (es) | 2006-08-18 |
CA2550905A1 (en) | 2005-07-14 |
CA2454296A1 (en) | 2005-06-29 |
TW200531006A (en) | 2005-09-16 |
AU2004309431B2 (en) | 2008-10-02 |
EP1700294B1 (en) | 2009-08-26 |
TWI279776B (en) | 2007-04-21 |
RU2006126530A (ru) | 2008-02-10 |
CN1918461A (zh) | 2007-02-21 |
PT1700294E (pt) | 2009-09-28 |
US20050143989A1 (en) | 2005-06-30 |
CA2550905C (en) | 2010-12-14 |
AU2004309431C1 (en) | 2009-03-19 |
WO2005064595A1 (en) | 2005-07-14 |
ATE441177T1 (de) | 2009-09-15 |
ES2329046T3 (es) | 2009-11-20 |
ZA200606215B (en) | 2007-11-28 |
AU2004309431A1 (en) | 2005-07-14 |
KR20060128983A (ko) | 2006-12-14 |
MY141447A (en) | 2010-04-30 |
JP2007517249A (ja) | 2007-06-28 |
US8577675B2 (en) | 2013-11-05 |
HK1099946A1 (en) | 2007-08-31 |
BRPI0418449A (pt) | 2007-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4440937B2 (ja) | 暗騒音存在時の音声を改善するための方法および装置 | |
US6453289B1 (en) | Method of noise reduction for speech codecs | |
RU2470385C2 (ru) | Система и способ улучшения декодированного тонального звукового сигнала | |
US11325407B2 (en) | Frequency band extension in an audio signal decoder | |
Cohen | Speech enhancement using super-Gaussian speech models and noncausal a priori SNR estimation | |
WO2000017855A1 (en) | Noise suppression for low bitrate speech coder | |
EP1386313B1 (en) | Speech enhancement device | |
CN114005457A (zh) | 一种基于幅度估计与相位重构的单通道语音增强方法 | |
US10672411B2 (en) | Method for adaptively encoding an audio signal in dependence on noise information for higher encoding accuracy | |
Jelinek et al. | Noise reduction method for wideband speech coding | |
KR20180010115A (ko) | 스피치를 향상하는 장치 | |
CN109346106B (zh) | 一种基于子带信噪比加权的倒谱域基音周期估计方法 | |
Charoenruengkit et al. | Multiband excitation for speech enhancement | |
EP2760022B1 (en) | Audio bandwidth dependent noise suppression | |
Balaji et al. | A Novel DWT Based Speech Enhancement System through Advanced Filtering Approach with Improved Pitch Synchronous Analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091208 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100107 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130115 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4440937 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130115 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |