JP4819881B2 - ノイズを抑制するための方法と装置 - Google Patents

ノイズを抑制するための方法と装置 Download PDF

Info

Publication number
JP4819881B2
JP4819881B2 JP2008508189A JP2008508189A JP4819881B2 JP 4819881 B2 JP4819881 B2 JP 4819881B2 JP 2008508189 A JP2008508189 A JP 2008508189A JP 2008508189 A JP2008508189 A JP 2008508189A JP 4819881 B2 JP4819881 B2 JP 4819881B2
Authority
JP
Japan
Prior art keywords
celp
tdac
signal
decoded
decoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008508189A
Other languages
English (en)
Other versions
JP2008539456A (ja
Inventor
ガルトナー マーティン
シャンドル シュテファン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from DE102005019863A external-priority patent/DE102005019863A1/de
Priority claimed from DE200510032079 external-priority patent/DE102005032079A1/de
Application filed by Siemens AG filed Critical Siemens AG
Publication of JP2008539456A publication Critical patent/JP2008539456A/ja
Application granted granted Critical
Publication of JP4819881B2 publication Critical patent/JP4819881B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)
  • Treating Waste Gases (AREA)
  • Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
  • Filters And Equalizers (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Diaphragms For Electromechanical Transducers (AREA)
  • Analogue/Digital Conversion (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

本発明は、ハイブリッドコーダにより符号化された信号を復号化するための方法に関する。さらに本発明は相応に構成された復号化のための装置に関する。
オーディオ信号を符号化するために種々の方法が殊に効果的であることが判明している。つまり例えば、符号化されたデータストリームのビットレートが低い場合において、良好な品質を有する音声信号を質的に良好に符号化するためには、いわゆるCELP技術(符号励振線形予測:Code Excited Linear Prediction)が好適であることが分かった。CELPは時間領域において機能し、また可変フィルタのための励振モデルを基礎とする。音声信号はフィルタパラメータによっても、励振信号を記述するパラメータによっても表される。
たいていの場合コーダに関しては符号化されたデータを再び解号ないし復号化することができる相応のデコーダも問題になる。相応の通信機器はデータを送受信することができるいわゆるコーデックを有する。これは通信にとって必要である。
殊に符号化されたデータストリームのビットレートが比較的高い場合であっても非常に高い品質を有するべき音楽信号および音声信号を符号化するために、殊にいわゆる知覚型コーデック(perceptuelle Codec(コーデック=コーダ/デコーダ))が使用されている。この知覚型コーデックは周波数領域における情報低減を基礎としており、人間の聴覚系のマスキング効果を利用する。すなわち、例えば人間が認識することのできない変更または所定の周波数は表現されない。これによって、コーダまたはコーデックの複雑性が低減される。この種のコーダはたいていの場合、時間信号を周波数領域に変換し、この変換は例えばMDCT(修正離散コサイン変換:Modified Discrete Cosine Transformation)により行われるので、しばしば変換コーダまたは変換コーデックとも称される。本明細書においてはこの用語を使用する。
最近ではいわゆるスケーラブルコーデックがますます使用されている。スケーラブルコーデックは符号化されたデータストリームの比較的高いビットレートにおいて差し当たり良好なオーディオ品質を形成するコーデックである。これにより周期的に伝送すべき比較的長いパケットが得られる。
パケットとは所定の期間に生じ、またそれと共にこのパケットにおいて伝送される複数のデータである。パケットにおいては先ず重要なデータが伝送され、続けてそれよりも重要性の低いデータが伝送されることが多い。しかしながらそのような長いパケットにおいてはデータの一部が除去されることにより、殊にパケットの時間的に最後に伝送される部分が切り取られることによりパケットが短くなる可能性がある。したがってもちろん品質も劣化する。
前述の特性のためにスケーラブルコーデックに関しては、ビットレートが低い場合にはCELPコーデックにより動作し、またビットレートが比較的高い場合には変換コーデックにより動作することが提案されている。このことはハイブリッドCELP/変換コーデックの発展に繋がった。このCELP/変換コーデックは良好な品質を有するベース信号をCELP方法により符号化し、この符号化に付加的に変換コーデック方法により付加信号を形成し、この付加信号によりベース信号が改善される。これにより所望の良好な品質が得られる。
この変換コーデックを使用する場合の欠点はいわゆる「プリエコー現象」が発生することである。このプリエコー現象は変換コーダブロックの全体のブロック長にわたり一様に分散している妨害ノイズである。ここでブロックとは一緒に符号化されるデータの総体と解される。変換コーデックに関して典型的なブロック長は40m秒である。プリエコー現象の妨害ノイズは伝送されるスペクトル成分の量子化エラーによって生じる。信号レベルが一定である場合には、この妨害ノイズのレベルはあらゆる所で有効信号のレベル以下になる。もっとも、突発的な高いレベルの信号に続いてゼロレベルを有する有効信号が生じる場合には、この妨害ノイズは高いレベルの信号が生じる前に著しく高くなる可能性がある。これに関して文献に記載されている公知の例はカスタネットを叩く際の信号経過である。
この現象を低減するために既に種々の方法が適用されている。しかしながらそれらの方法は全て付加情報の伝送を伴い、これによりコーダの設計が非常に複雑になるか、コーダを一時的に高められたビットレートで動作させなければならなくなる。
この従来技術に基づく本発明の課題は、付加情報を必要とせずに、ハイブリッドコーダを用いて符号化された信号における妨害ノイズの低減を簡単に実現できるようにすることである。
この課題は独立請求項に記載されている構成により解決される。有利な実施形態は従属請求項に記載されている。
第1のデコーダ、例えばCELPデコーダに由来する信号と、第2のデコーダ、例えば変換デコーダに由来する信号とからなる復号化された信号におけるこのノイズの低減に関して以下のステップが実施される。
復号化された2つの信号成分から所属の包絡線がそれぞれ求められる。包絡線とは殊に時間にわたる信号のエネルギ経過と解される。
2つの包絡線の比較から特性値、例えば比率が形成される。
この特性値はやはり増幅率を導出するために使用される。
この方法は、例えば復号化された第1の信号成分を生じさせる符号化方法においてエネルギが確実に識別される場合には殊に有利である。すなわち、特性値または増幅率によって偏差を識別することができる。
殊に復号化された第2の信号成分を増幅率と乗算することができる。これによって上述の偏差を補正することができる。
全ての信号を時間区分に分割することができ、殊に復号化された第1の信号成分に関して使用される時間区分を復号化された第2の信号成分に関して使用される時間区分よりも短くすることができる。したがって、比較的高い時間解像度に基づき、第2の信号成分におけるエネルギ偏差をより良好に補正することができる。
第1の信号成分はCELP符号化された信号を復号化するCELPデコーダに由来し、第2の信号成分は変換符号化された信号を復号化する変換デコーダに由来する。この変換符号化された信号は殊にCELP復号化された第1の信号成分も含むことができ、この第1の信号成分は復号後に変換符号化され、送信器から伝送された変換符号化された信号に加えられ(すなわち既に周波数領域にあり)、また変換デコーダにおいて第2の信号成分に寄与するものとして復号化される。
これに択一的に、伝送されたCELP符号化された信号と伝送された変換符号化された信号の和形成を時間領域において行うこともできる。
増幅率は殊に特性値と同じでも良い。殊に第2の復号化された信号成分がプリエコーノイズを含む場合、適切な比率を形成する際には復号化された第2の信号成分の相応の減衰が行われる。
殊に、第1のデコーダはCELP技術を基礎とするデコーダである、および/または、第2のコーダは変換コーダである。したがって、復号化された信号の品質が良好であるのと同時に殊に効果的なノイズ低減が達成される。
受信した和信号のデコーダ側における変更は、殊に所定の判定基準が満たされている場合にのみ行われる。殊に受信した和信号の変更は、信号レベル変化が所定の閾値を越える場合にのみ行われる。このことは殊に効果的なプリエコー低減を実現する。何故ならば、プリエコー現象は上述のように、プリエコーノイズが信号レベルを上回るために、主としてレベル変化時に生じるからである。他方ではこの選択的な変更によって、第2のコーダによる不必要な品質改善は省略される。
本発明の別の実施形態によれば、前述の方法を基礎として復号化された信号ないしその復号化された第1および第2の信号成分が周波数領域に従い別個に処理される方法が提供される。これは以下の利点を有する。復号化の際には複数の周波数帯域に関してこれらの周波数帯域のための目標エネルギが既知である。すなわち、周波数領域に従い分けられた個々の復号化された第1の信号成分、例えばCELP信号のエネルギから目標エネルギが既知である。第2の復号化された信号成分によって、アドオン信号(付加信号成分)を提供することができるが、このアドオン信号はエネルギが著しく偏差している可能性がある。殊に第2の復号化された信号成分のエネルギが例えばプリエコー現象に起因して著しく高い場合には問題である。この方法はそれぞれ別個に処理される周波数帯域に関して、第2の信号成分のエネルギ(ないしレベル)の制限を第1の信号成分のエネルギに依存して行う。この方法は、周波数帯域がこのようにして別個に処理されるようになればなるほど効果的になる。
本発明のさらなる利点を例示的な実施形態に基づき説明する。
ここで、
図1は、符号化/復号化プロセスの例示的な経過を説明するためのコーダ側およびデコーダ側における重要な構成要素を示す。
図2は、通信ネットワークを介して通信機器間において符号化された信号を伝送するための通信装置の概略図を示し、
図3は、CELP信号を基礎とするゲイン適応によるプリエコーの低減を説明するためのデコーダ装置ないしノイズ抑制装置を示し、
図4はプリエコーのレベル適合ないし低減のための別の実施形態を示す。
図1には、実施形態に基づいた符号化プロセスおよび復号化プロセスの概略的な経過が示されている。コーダ側Cにおいては、受信器に伝送すべきアナログ信号Sが事前処理装置PPでもって符号化のために、例えばこのアナログ信号がディジタル化されることにより事前処理ないし処理される。さらには分割ユニットFにおいて信号が期間ないしフレームに分割される。このようにして事前処理された信号は符号化ユニットCODに供給される。符号化ユニットCODはハイブリッドコーダを有し、このハイブリッドコーダは第1のコーダとしてCELPコーダCOD1を有し、また第2のコーダとして変換コーダCOD2を有する。CELPコーダCOD1は異なる周波数領域において動作する複数のCELPコーダCOD1_A、COD1_B、COD1_Cを有する。異なる周波数領域への分割により、殊に精確な符号化を保証することができる。さらにこのような異なる周波数領域への分割はスケーラブルコーデックのコンセプトを非常に良好に支援する。何故ならば、ただ1つ、複数または全ての周波数領域の所望のスケーリングに応じて伝送を行うことができるからである。CELPコーダCOD1は符号化された和信号S_GESについての基本成分S_Gを供給する。変換コーダCOD2は符号化された和信号S_GESについての付加成分S_Zを供給する。符号化された和信号S_GESはコーダ側Cの通信装置KCによりデコーダ側Dの通信装置KDに伝送される。処理装置PROCにおいては、データないし受信した符号化されている和信号S_GESの処理(例えば符号化された和信号の成分S_GおよびS_Zへの分割)が必要に応じて行われ、続いて処理されたデータないし処理された信号が後続の復号DECのためにデコーダ装置DEC(図3および図4も参照されたい)に伝送される。デコーダ部にはノイズ低減装置NRにおけるノイズ低減部が接続されており、このノイズ低減部は図3において拡大して詳細に示されている。
図2には、第1の通信機器COM1(例えば図1のコーダ側Cにおける構成要素を表す)が示されており、この通信機器COM1はデータを伝送および/または受信するための送受信ユニットANT1(例えば通信装置KCに対応する)、ならびにコーダ側Cにおける構成要素を実現するため、もしくは図1に示した符号化方法(コーダ側Cにおける処理)を実施するための計算ユニットCPU1を有する。データの伝送は送受信ユニットANT1により通信ネットワークCN(例えば使用すべき通信機器に応じてインターネット、電話網、移動無線網として実施されている)を介して行われる。受信は第2の通信機器COM2(図1の右側における構成要素を表す)によって行われ、この第2の通信機器COM2はやはり送受信ユニットANT2(例えば通信装置KDに対応する)、ならびにデコーダ側Dにおける構成要素を実現するため、もしくは図1に示した復号化方法(デコーダ側Dにおける処理)を実施するための計算ユニットCPU2を有する。本方法を適用することができる通信機器COM1およびCOM2の考えられる実現形態の例はIP電話、ボイスゲートウェイまたは移動電話である。
ここで、プリエコー低減の経過を概略的に説明するための本質的な構成要素を有する復号化装置DECおよびノイズ低減装置NRが示されている図3を参照する。CELP符号化された信号S_COD,CELP(信号S_Gに対応する)が全帯域CELPデコーダDEC_GES,CELPにより復号化される。復号化された信号S_CELPは一方では所属の包絡線ENV_CELPを検出するためのエネルギ包絡線検出ユニットGE1に供給され、他方ではTDAC(時間領域エイリアスキャンセル:Time domain aliasing cancellation)エンコーダCOD_TDACに供給される。TDAC符号化は例えば変換符号化の例である。
符号化された信号S_COD,CELPTDACは受信側に由来する変換符号化された信号S_COD,TDAC(信号S_Zに対応する)と共に変換デコーダDEC_TDACに供給され、復号化された信号S_TDACが形成される。この復号化された信号S_TDACからも同様に(第2の)包絡線曲線検出ユニットGE2において所属のエネルギ包絡線ENV_TDACが検出される。比率検出ユニットDにおいては、エネルギ包絡線の比率Rが相互に特性値として時間毎に検出される。条件設定ユニットBFEにおいては、比率Rが設定された最小間隔1(1:2つの包絡線曲線が等しい)を有するか否か、すなわち2つの信号のレベルが等しいか否か、または少なくとも所定のパーセンテージだけ相互に偏差しているか否かが確認される。
結果は増幅率ないし減衰率Gであり、この増幅率ないし減衰率Gは図示した例においては比率R(特性値)に等しく、この比率Rと変換復号化された信号成分S_TDACとが乗算装置Mにおいて乗算され、妨害ノイズの低減された最終的な信号S_OUTが得られる。詳細に説明すると、例えば比率RがR=ENV_CELP/ENV_TDACによって形成され、この比率が所定の閾値SWを下回ってはならないと設定されたことを前提とすると、この閾値SWを下回った場合には変換符号化された信号成分S_TDACには増幅率G、例えばG=Rが乗算され、これにより信号成分S_TDACが減衰される。さらには、閾値SWを下回らない場合には、増幅率Gに値「1」が対応付けられ、その結果いかなる場合にも実施することができる信号成分S_TDACの乗算時にはS_TDACの値は変化しないままであることも考えられる。
したがって、変換符号化された信号成分S_TDACの結果が偏差(このような偏差はまさに前述プリエコー現象である)する場合においては、この信号成分のエネルギないしレベルをCELP復号化された信号S_CELPの許容値まで動かすことができるので、その結果最終的な信号S_OUTの妨害ノイズは低減されている。
次に図4を参照すると、プリエコー現象を低減するための別の実施形態が示されている。
ただ1つのCELPコーデックの代わりに、周波数領域に従い分けられた複数の(CELPまたは他の)コーデックを設けることも考えられる。図4に示されている実施形態の大部分は図3に示した実施例に対応しているが、図3に示した方法がCELP(または他の)デコーダおよび変換デコーダの和信号に適用されるのではなく、この方法が周波数領域に従い別個に適用される拡張形態を表す。すなわち、周波数領域に従った和信号ないし個々の信号成分の分割が先ず行われる。図3の方法を周波数領域毎に個々の信号成分に適用することができる。
この利点を以下において説明する。デコーダにおいては複数の周波数帯域に関してこの周波数帯域のための目標エネルギが既知である。すなわち、周波数領域に従い分けられた個々のCELP信号のエネルギから目標エネルギが既知である。変換デコーダはアドオン信号(付加信号成分)を供給するが、このアドオン信号はエネルギが著しく偏差している可能性がある。殊に変換デコーダからの信号のエネルギが例えばプリエコー現象に起因して著しく高い場合には問題である。本方法は、別個に処理される各周波数帯域に対して、変換コーデックエネルギの制限をCELPエネルギに依存して行う。本方法は周波数帯域がこのようにして別個に処理されるようになればなるほど効果的である。
このことを以下の例に基づき詳細に説明する。
和信号は2000Hzトーンからなり、この和信号は完全にCELPコーデック成分に由来する。付加的に、プリエコー現象に基づいて変換コーデックは6000Hzの周波数を有する妨害信号をさらに供給する。妨害信号のエネルギは2000Hzトーンのエネルギの10%である。
変換コーデック成分を制限するための判定基準は、この変換コーデック成分がCELP成分と最大限に等しくてよいというものである。
ケース1:周波数帯域に従った分割は行われない(第1の実施形態):この場合6000Hzの妨害信号は抑制されない。何故ならば、この妨害信号はCELPコーデックに由来する2000Hzトーンのエネルギの僅か10%しか有していないからである。
ケース2:周波数帯域A:0〜4000Hzと周波数帯域B:4000Hz〜8000Hzが別個に処理される(別の実施形態):このケースにおいては妨害信号が完全に抑制される。何故ならば上記の周波数帯域においてはCELP成分が0であり、したがって変換コーデック信号も値0に制限されるからである。
図4には、レベル適応ないしプリエコー低減の経過を概略的に説明するための本質的な構成要素を有する(図3に対応する)復号化装置DECおよびノイズ低減装置NRが示されている。符号化された信号の形成もしくは受信器への伝送に関しては図1または図2を再度参照されたい。
CELP符号化された信号S_COD,CELP(信号S_Gに対応する)が全帯域CELPデコーダDEC_GES,CELP’によって復号される。全帯域CELPデコーダは2つの復号化装置、すなわち第1の周波数帯域Aにおける信号S_COD,CELPを復号するための第1の復号化装置DEC_FB_Aと、第2の周波数帯域Bにおける信号S_COD,CELPを復号するための第2の復号化装置DEC_FB_Bとを包含する。復号化された第1の信号S_CELP_Aは所属の包絡線ENV_CELP_Aを検出するために(第1の)エネルギ包絡線検出ユニットGE1_Aに供給され、復号化された第2の信号S_CELP_Bは所属の包絡線ENV_CELP_Bを検出するために(第2の)エネルギ包絡線検出ユニットGE1_Bに供給される。
受信器側に由来する変換符号化された信号S_COD,TDAC(信号S_Zに対応する)は変換デコーダDEC_TDACに供給され、復号化された信号S_TDACが形成され、この信号S_TDACはやはり周波数帯域スプリッタ(周波数帯域分割器)FBSに供給される。この周波数帯域スプリッタは信号S_TDACを2つの信号、すなわち周波数帯域Aに関するS_TDAC_Aおよび周波数帯域Bに関するS_TDAC_Bに分割する。選択的に、周波数帯域への分割は時間領域への逆変換を行う前に周波数領域において行うこともできる。殊にこれによって、時間領域において動作する周波数帯域スプリッタ(ハイパスフィルタ、ローパスフィルタまたはバンドパスフィルタ)に付随する遅延もなくなる。この復号化された周波数帯域に依存する信号S_TDAC_AおよびS_TDAC_Bからも同様に、(第3の)包絡線曲線検出ユニットGE2_Aないし(第4の)包絡線曲線検出ユニットGE2_Bにおいて所属のエネルギ包絡線ENV_TDAC_AないしENV_TDAC_Bが検出される。
第1の増幅検出ユニットBD_Aにおいては周波数帯域Aに関してエネルギ包絡線ENV_CELP_AおよびENV_TDAC_Aに基づき、増幅率(または増幅は負である場合には減衰率)G_Aが決定され、第2の増幅検出ユニットBD_Bにおいては周波数帯域Bに関してエネルギ包絡線ENV_CELP_BおよびENV_TDAC_Bに基づき、増幅率(減衰率も)G_Bが決定される。それぞれの増幅率の検出を図3の検出に応じて(構成要素D,BFEを参照されたい)行うことができる。例えばそれぞれの周波数帯域AおよびBに関する包絡線のそれぞれの比率(特性値)R_A,R_B、すなわちR_A=ENV_CELP_A/ENV_TDAC_AないしR_B=ENV_CELP_B/ENV_TDAC_Bを形成することができ、この際それぞれの周波数帯域に関して閾値SW_AないしSW_Bが設定され、この閾値を下回る場合にはそれぞれの増幅率G_A(例えばG_A=R_A)ないしG_B(例えばG_B=R_B)が形成され、この増幅率を最終的に(減衰させるために)それぞれの周波数帯域に依存する信号S_TDAC_AないしS_TDAC_Bに適用することができる。それぞれの閾値を下回らない場合には、それぞれの増幅率G_AないしG_Bを「1」に設定することができ、その結果乗算の際にはそれぞれの周波数帯域に依存する信号S_TDAC_AないしS_TDAC_Bは変更されないままである。
最終的に、周波数帯域Aのための第1の乗算装置M_Aにおいては増幅率G_Aが信号S_TDAC_Aと乗算され、周波数帯域Bのための第2の乗算装置M_Bにおいては増幅率G_Bが信号S_TDAC_Bと乗算される。最終的に、乗算された(場合によっては減衰された)周波数帯域に依存する信号が統合され、最終的な妨害ノイズの低減された(総周波数)信号S_OUT’が得られる。
この実施例においては、復号化された信号成分S_CELP_A,S_CELP_B,S_TDAC_AおよびS_TDAC_Bの2つの周波数領域AおよびBへの分割しか行われていないが、3つまたはそれ以上の周波数領域への分割も実現することができ、また有利となりうる。
符号化/復号化プロセスの例示的な経過を説明するためのコーダ側およびデコーダ側における重要な構成要素。 通信ネットワークを介して通信機器間において符号化された信号を伝送するための通信装置の概略図。 CELP信号を基礎とするゲイン適応によるプリエコーの低減を説明するためのデコーダ装置ないしノイズ抑制装置。 プリエコーのレベル適合ないし低減のための別の実施形態。

Claims (13)

  1. CELPデコーダに由来する、復号化された第1の信号成分(S_CELP)と、変換デコーダに由来する、復号化された第2の信号成分(S_TDAC)とからなる復号化された信号におけるノイズを抑制する(S_OUT)方法において、
    a.前記復号化された第1の信号成分(S_CELP)の第1のエネルギ包絡線(ENV_CELP)および前記復号化された第2の信号成分(S_TDAC)の第2のエネルギ包絡線(ENV_TDAC)を求めるステップと、
    b.前記第1のエネルギ包絡線(ENV_CELP)と前記第2のエネルギ包絡線(ENV_TDAC)との比較に依存して特性値(R)を形成するステップと、
    c.前記特性値(R)に依存して増幅率(G)を導出するステップと、
    d.前記特性値(R)が所定の判定基準(C)を満たしていない場合に、前記復号化された第2の信号成分(S_TDAC)と前記増幅率(G)を乗算するステップとを有することを特徴とする、復号化された信号におけるノイズを抑制する方法。
  2. 復号化された信号成分(S_TDAC、S_CELP)を時間区分に分割し、前記ステップa)〜d)を時間区分に応じて実施する、請求項記載の方法。
  3. 前記復号化された第1の信号成分(S_CELP)に関する時間区分の長さと前記復号化された第2の信号成分(S_TDAC)に関する時間区分の長さは異なり、短い方の時間区分にわたり前記ステップa)〜d)を時間区分に応じて実施する、請求項記載の方法。
  4. 第1のコーダ成分(S_COD,CELP)の復号化によって復号化された前記第1の信号成分(S_CELP)は第1のデコーダ(DEC_GES,CELP)に由来し、第2のコーダ成分(S_COD,TDAC,S_COD,CELP,TDAC)の復号化によって復号化された前記第2の信号成分(S_TDAC)は第2のデコーダ(DEC_TDAC)に由来する、請求項1からまでのいずれか1項記載の方法。
  5. 前記第2のコーダ成分(S_COD,TDAC,S_COD,CELP,TDAC)は前記第1のコーダ成分(S_COD,CELP)を包含する、請求項記載の方法。
  6. 前記第1のエネルギ包絡線(ENV_CELP)と前記第2のエネルギ包絡線(ENV_TDAC)との比率により前記特性値(R)を形成する、請求項1からまでのいずれか1項記載の方法。
  7. 前記増幅率(G)は前記特性値(R)に等しい、請求項1からまでのいずれか1項記載の方法。
  8. 前記復号化された第1の信号(S_CELP)を、異なる周波数領域において動作する複数の第1のコーダ(COD1_A,COD1_B,COD_C)に由来する信号(S_COD,CELP)の復号化により形成する、請求項1からまでのいずれか1項記載の方法。
  9. 前記第1のデコーダ(DEC_GES,CELP)をCELPデコーダにより形成する、請求項または記載の方法。
  10. 前記第2のデコーダ(DEC_TDAC)を変換デコーダにより形成する、請求項またはのいずれか1項記載の方法。
  11. 前記第1のデコーダ(DEC_CELP)および前記第2のデコーダ(DEC_TDAC)は同一の周波数領域を有する、請求項または10のいずれか1項記載の方法。
  12. 1つの周波数帯域に対応付けられている復号化された信号におけるノイズを抑制する方法であって、
    前記信号は前記周波数帯域のそれぞれの部分周波数帯域に関して、CELPデコーダに由来する、それぞれ復号化された第1の信号成分(S_CELP_A,S_CELP_B)と、変換デコーダに由来する、それぞれ復号化された第2の信号成分(S_TDAC_A,S_TDAC_B)とからなる、復号化された信号におけるノイズを抑制する方法において、
    a.それぞれの部分周波数帯域に関して、前記それぞれ復号化された第1の信号成分の第1のエネルギ包絡線(ENV_CELP_A,ENV_CELP_B)および前記それぞれ復号化された第2の信号成分の第2のエネルギ包絡線(ENV_TDAC_A,ENV_TDAC_B)を求めるステップと、
    b.それぞれの部分周波数帯域に関して、前記第1のエネルギ包絡線と前記第2のエネルギ包絡線との比較に依存してそれぞれの特性値(R_A,R_B)を形成するステップと、
    c.ぞれぞれの部分周波数帯域に関して、前記それぞれの特性値に依存してそれぞれの増幅率(G_A,G_B)を導出するステップと、
    d.前記それぞれの特性値(R_A,R_B)が所定の判定基準を満たしていない場合に、それぞれの部分周波数帯域に関して、前記復号化された第2の信号成分(S_TDAC_A,S_TDAC_B)と前記それぞれの増幅率(G_A、G_B)を乗算するステップを有することを特徴とする、復号化された信号におけるノイズを抑制する方法。
  13. 請求項1から12記載の方法を実施する計算ユニット(CPU2)を備えた装置。
JP2008508189A 2005-04-28 2006-04-12 ノイズを抑制するための方法と装置 Expired - Fee Related JP4819881B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
DE102005019863A DE102005019863A1 (de) 2005-04-28 2005-04-28 Verfahren und Vorrichtung zur Geräuschunterdrückung
DE102005019863.5 2005-04-28
DE102005028182 2005-06-17
DE102005028182.6 2005-06-17
DE200510032079 DE102005032079A1 (de) 2005-07-08 2005-07-08 Verfahren und Vorrichtung zur Geräuschunterdrückung
DE102005032079.1 2005-07-08
PCT/EP2006/061537 WO2006114368A1 (de) 2005-04-28 2006-04-12 Verfahren und vorrichtung zur geräuschunterdrückung

Publications (2)

Publication Number Publication Date
JP2008539456A JP2008539456A (ja) 2008-11-13
JP4819881B2 true JP4819881B2 (ja) 2011-11-24

Family

ID=36621841

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008508189A Expired - Fee Related JP4819881B2 (ja) 2005-04-28 2006-04-12 ノイズを抑制するための方法と装置

Country Status (11)

Country Link
US (1) US8612236B2 (ja)
EP (2) EP1953739B1 (ja)
JP (1) JP4819881B2 (ja)
KR (1) KR100915726B1 (ja)
AT (1) ATE435481T1 (ja)
CA (1) CA2574468C (ja)
DE (1) DE502006004136D1 (ja)
DK (1) DK1869671T3 (ja)
ES (1) ES2327566T3 (ja)
PL (1) PL1869671T3 (ja)
WO (1) WO2006114368A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2897733A1 (fr) * 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
US20090006081A1 (en) * 2007-06-27 2009-01-01 Samsung Electronics Co., Ltd. Method, medium and apparatus for encoding and/or decoding signal
RU2481650C2 (ru) * 2008-09-17 2013-05-10 Франс Телеком Ослабление опережающих эхо-сигналов в цифровом звуковом сигнале
PL2473995T3 (pl) * 2009-10-20 2015-06-30 Fraunhofer Ges Forschung Koder sygnału audio, dekoder sygnału audio, sposób dostarczania zakodowanej reprezentacji treści audio, sposób dostarczania dekodowanej reprezentacji treści audio oraz program komputerowy do wykorzystania w zastosowaniach z małym opóźnieniem
CN102884574B (zh) * 2009-10-20 2015-10-14 弗兰霍菲尔运输应用研究公司 音频信号编码器、音频信号解码器、使用混迭抵消来将音频信号编码或解码的方法
WO2011048798A1 (ja) 2009-10-20 2011-04-28 パナソニック株式会社 符号化装置、復号化装置およびこれらの方法
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
CN101908342B (zh) * 2010-07-23 2012-09-26 北京理工大学 利用频域滤波后处理进行音频暂态信号预回声抑制的方法
US8615394B1 (en) * 2012-01-27 2013-12-24 Audience, Inc. Restoration of noise-reduced speech
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
US9978388B2 (en) 2014-09-12 2018-05-22 Knowles Electronics, Llc Systems and methods for restoration of speech components
DE112016000545B4 (de) 2015-01-30 2019-08-22 Knowles Electronics, Llc Kontextabhängiges schalten von mikrofonen
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263098A (ja) * 1995-03-28 1996-10-11 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法、音響信号復号化方法
JP2003044097A (ja) * 2001-06-26 2003-02-14 Microsoft Corp 音声信号および音楽信号を符号化する方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5825320A (en) * 1996-03-19 1998-10-20 Sony Corporation Gain control method for audio encoding device
DE19736669C1 (de) * 1997-08-22 1998-10-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals
US6169971B1 (en) * 1997-12-03 2001-01-02 Glenayre Electronics, Inc. Method to suppress noise in digital voice processing
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
US6453289B1 (en) * 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
US6442275B1 (en) * 1998-09-17 2002-08-27 Lucent Technologies Inc. Echo canceler including subband echo suppressor
US6353808B1 (en) * 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
CN1149534C (zh) * 1998-12-07 2004-05-12 三菱电机株式会社 声音解码装置和声音解码方法
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US6757395B1 (en) * 2000-01-12 2004-06-29 Sonic Innovations, Inc. Noise reduction apparatus and method
US7058572B1 (en) * 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
FR2813722B1 (fr) * 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
JP4282227B2 (ja) * 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
SE522553C2 (sv) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
DE60204038T2 (de) 2001-11-02 2006-01-19 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zum codieren bzw. decodieren eines audiosignals
JP4290917B2 (ja) * 2002-02-08 2009-07-08 株式会社エヌ・ティ・ティ・ドコモ 復号装置、符号化装置、復号方法、及び、符号化方法
US7146316B2 (en) * 2002-10-17 2006-12-05 Clarity Technologies, Inc. Noise reduction in subbanded speech signals
KR100547113B1 (ko) * 2003-02-15 2006-01-26 삼성전자주식회사 오디오 데이터 인코딩 장치 및 방법
JP4739023B2 (ja) * 2003-08-18 2011-08-03 ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー デジタル音声信号におけるクリッキングノイズ検出
EP1638083B1 (en) * 2004-09-17 2009-04-22 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited audio signals
MX2007012187A (es) * 2005-04-01 2007-12-11 Qualcomm Inc Sistemas, metodos y aparatos para deformacion en tiempo de banda alta.

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263098A (ja) * 1995-03-28 1996-10-11 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法、音響信号復号化方法
JP2003044097A (ja) * 2001-06-26 2003-02-14 Microsoft Corp 音声信号および音楽信号を符号化する方法

Also Published As

Publication number Publication date
EP1953739B1 (de) 2014-06-04
EP1953739A3 (de) 2008-10-08
EP1869671A1 (de) 2007-12-26
US8612236B2 (en) 2013-12-17
PL1869671T3 (pl) 2009-12-31
ATE435481T1 (de) 2009-07-15
EP1869671B1 (de) 2009-07-01
JP2008539456A (ja) 2008-11-13
DE502006004136D1 (de) 2009-08-13
WO2006114368A1 (de) 2006-11-02
US20070282604A1 (en) 2007-12-06
CA2574468A1 (en) 2006-11-02
CA2574468C (en) 2014-01-14
KR100915726B1 (ko) 2009-09-04
ES2327566T3 (es) 2009-10-30
EP1953739A2 (de) 2008-08-06
KR20070062493A (ko) 2007-06-15
DK1869671T3 (da) 2009-10-19

Similar Documents

Publication Publication Date Title
JP4819881B2 (ja) ノイズを抑制するための方法と装置
EP1509903B1 (en) Method and device for efficient frame erasure concealment in linear predictive based speech codecs
JP2021131569A (ja) セカンダリチャンネルを符号化するためにプライマリチャンネルのコーディングパラメータを使用するステレオ音声信号を符号化するための方法およびシステム
JP3623449B2 (ja) 符号化されたオーディオ信号中のエラーを隠蔽する方法と装置および符号化されたオーディオ信号を復号化する方法と装置
US8630864B2 (en) Method for switching rate and bandwidth scalable audio decoding rate
US10147432B2 (en) Comfort noise addition for modeling background noise at low bit-rates
JP2004310088A (ja) 半レート・ボコーダ
KR20080103088A (ko) 디코더 및 대응 디바이스에서 디지털 신호의 반향들의 안전한 구별과 감쇠를 위한 방법
JP2004287397A (ja) 相互使用可能なボコーダ
JP2014506687A (ja) 低遅延の統合されたスピーチ及びオーディオ符号化におけるエラー隠しのための装置及び方法
KR20090110377A (ko) 오디오 신호 인코딩
JP7008756B2 (ja) デジタルオーディオ信号におけるプレエコーを識別し、減衰させる方法及び装置
CA2244008A1 (en) Nonlinear filter for noise suppression in linear prediction speech pr0cessing devices
US10672411B2 (en) Method for adaptively encoding an audio signal in dependence on noise information for higher encoding accuracy
US8571852B2 (en) Postfilter for layered codecs
RU2351024C2 (ru) Способ и устройство для подавления шумов
US8849655B2 (en) Encoder, decoder and methods thereof
CN1993734B (zh) 噪声抑止的方法和设备
EP0984433A2 (en) Noise suppresser speech communications unit and method of operation

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101227

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110803

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110901

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees