JP5295372B2 - デジタルオーディオ信号におけるプリエコーの減衰 - Google Patents

デジタルオーディオ信号におけるプリエコーの減衰 Download PDF

Info

Publication number
JP5295372B2
JP5295372B2 JP2011527373A JP2011527373A JP5295372B2 JP 5295372 B2 JP5295372 B2 JP 5295372B2 JP 2011527373 A JP2011527373 A JP 2011527373A JP 2011527373 A JP2011527373 A JP 2011527373A JP 5295372 B2 JP5295372 B2 JP 5295372B2
Authority
JP
Japan
Prior art keywords
sub
signal
attenuation
block
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011527373A
Other languages
English (en)
Other versions
JP2012503214A (ja
Inventor
バラーツ・コヴシー
ステファン・ラゴ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of JP2012503214A publication Critical patent/JP2012503214A/ja
Application granted granted Critical
Publication of JP5295372B2 publication Critical patent/JP5295372B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、デジタルオーディオ信号の復号化の間にプリエコーを減衰させるための方法及び装置に関係する。
例えば固定ネットワークまたは携帯電話ネットワークである伝送ネットワークを介したデジタルオーディオ信号の転送のために、あるいは信号の保存のために、変換ベースの周波数符号化または時間符号化タイプの符号化システムを実装する圧縮プロセス(または、ソース符号化)が使用される。
本発明の主題である方法及び装置は、従って、アプリケーションの分野として、音響信号、特に周波数変換によって符号化されたデジタルオーディ信号の圧縮を有する。
図1は、実例として、従来技術に従った加算/オーバラップ分析−統合を含む変換による、デジタルオーディオ信号の符号化の基本線図及び復号化の基本線図を表す。
衝突音のようなある音の系列、及び破裂音のようなある音声セグメント(/k/、/t/、・・・)は、少量のサンプルの空間における信号の動的な振幅において非常に速い遷移及び非常に強い変化となる、非常に突然の音の立ち上がりによって特徴付けられる。代表的な遷移は、図1において、サンプル410に基づいて与えられる。
符号化/復号化処理のために、入力信号は、長さLのサンプルのブロックにスライスされる(それは、ここでは垂直の点線で表される。)。入力信号は、“x(n)”で表示される。連続するブロックへのスライスは、ブロック“x=[x(N.L)・・・x(N.L+L−1)]=[x(0)・・・x(L−1)]”を定義することにつながると共に、ここで、“N”はフレームのインデックスであり、そして“L”はフレームの長さである。図1において、L=160サンプルである。修正コサイン変調変換(modified cosine modulated transform)MDCT(英語表記では“修正離散コサイン変換(Modified Discrete Cosine Transform))の場合、インデックス“N”のフレームと関連付けられた変換された係数のブロックを与えるために、2つのブロック“x(n)”及び“xN+1(n)”が一緒に分析される。
変換符号化によって実行される、フレームとも呼ばれるブロックへの分割は、完全に音響信号から独立していると共に、それらの遷移は、従って、分析窓のあらゆるポイントで現れる。今、変換復号化の後で、再構成された信号は、量子化(Q)−逆量子化(Q−1)操作により生成された“雑音”(または歪み)によって損なわれる。この符号化雑音は、変換されたブロックの時間的なサポートの全体にわたって、すなわち、(L個のサンプルのオーバラップを伴う)2L個のサンプルの長さの窓の長さの全体にわたって、比較的一定の方法で、時間的に分配される。符号化雑音のエネルギーは、概して、ブロックのエネルギーと比例すると共に、復号化レートに依存している。
(図1のブロック320〜340のような)音の立ち上がりを含むブロックに関して、信号のエネルギーは高いと共に、従って、その雑音も高いレベルにある。
変換符号化において、符号化雑音のレベルは、すぐ遷移の後に続く高エネルギーのサンプルに関する信号のレベルより下であるが、しかし、特に遷移に先行する部分(図1のサンプル160〜410)にわたって、符号化雑音のレベルは、より低いエネルギーのサンプルに関する信号のレベルより上である。前述の部分に関して、信号対雑音比は負であると共に、その結果生じる劣化は、聞いている間、非常にうっとうしいと思われ得る。遷移の前の符号化雑音は、プリエコーと呼ばれ、遷移の後の符号化雑音は、ポストエコーと呼ばれる。
図1において、プリエコーが、遷移に先行するフレームに対して、その遷移が発生するフレームと同様に、影響を及ぼすことが観察され得る。
サイコアコースティック(Psycho-acoustic)の実験は、人間の耳が、およそ2、3ミリ秒の次元である、かなり限られた、時間的な音のプリマスキング(pre-masking:逆行マスキング)を遂行することを示した。音の立ち上がりに先行する雑音またはプリエコーは、プリエコーの時間がプリマスキングの時間より大きいときに聞こえる。
同じく人間の耳は、高エネルギー系列から低エネルギー系列に変化するときに、5〜60ミリ秒の更に長い持続時間のポストマスキング(post-masking:順向マスキング)を遂行する。従って、ポストエコーに関する不快感の受け入れられる程度またはレベルは、プリエコーに関するものより更に大きい。
サンプルの数に関してブロックの長さがより大きいほど、プリエコーのより重大な現象が特に厄介である。ここで、変換符号化では、最も有意の周波数ゾーンの忠実な解像度を有することが必要である。固定したサンプリング周波数及び固定したレートにおいて、もし窓のポイントの数が増加するならば、有益であると思われる周波数スペクトル線を符号化するために、サイコアコースティックモデルによって、更に多くのビットが利用可能であり、これは、従って大きな長さのブロックを使用することの利点である。例えば、MPEGのAAC符号化(Advanced Audio Coding)は、例えば、2048個の固定数のサンプルを含む、すなわち32[kHz]のサンプリング周波数における64[ms]の継続時間にわたる、大きな長さの窓を使用する。会話アプリケーションに使用された変換符号器は、多くの場合、16[kHz]において継続時間40[ms]の窓、及び20[ms]のフレーム更新期間を使用する。
プリエコーの現象の前述のうっとうしい影響を減少させる目的に関して、これまで様々な解決法が提案された。
第1の解決法は、適応可能なフィルタリングを適用することにある。音の立ち上がりによる遷移の前のゾーンでは、再構成された信号は、実際には、元の信号と、信号の上に重ねられた量子化雑音から成る。
対応するフィルタ技術は、“Y. Mahieux”と“J. P. Petit”とによって発表された1994年11月の“IEEE Trans. On Communications Vol 42, No. 11”の“High Quality Audio Transform Coding at 64 kbits”と題名が付けられた論文において示された。
そのようなフィルタリングの実施は、その内のいくつかが雑音のあるサンプルに基づいて復号器によって推定されたパラメータの情報を必要とする。一方、元の信号のエネルギーのような情報は、符号器でのみ知られ得ると共に、従って伝送されなければならない。受信されたブロックが動的な振幅において突然の変化を含むとき、フィルタリング処理がそれに適用される。
前述のフィルタリング処理は、元の信号を取り出すことを可能にしないが、しかしプリエコーを大きく減少させる。しかしながら、それは、追加の補助のパラメータが復号器に伝送されることを必要とする。
補助のパラメータの伝送を必要としない手法は、仏国特許出願第0601466号(FR 06 01466)において説明される。説明された方式は、プリエコーの存在を識別すると共に、プリエコーを生成する変換符号化、及び全くプリエコーを生成しない時間符号化に基づいて、階層符号化(多層2進系列(binary train:バイナリトレイン)を生成すること)によって生成されたデジタルオーディオ信号のプリエコーを減衰させることを可能にする。
この特許出願は、復号器における高いエネルギーのゾーンへの遷移の前の低いエネルギーのゾーンの検出と、検出された低いエネルギーのゾーンにおけるプリエコーの減衰、そして高いエネルギーのゾーンにおけるプリエコーの減衰の抑制を更に正確に説明する。プリエコーを減衰させることを可能にする処理は、(プリエコーを生成する)変換復号化から生じる信号と、(エコーを生成しない)時間復号化から生じる信号との間の比較に基づいている。
この技術は、符号器から来る特定の補助情報の伝送を全く必要としないが、しかし、時間復号化から生じる基準信号の存在を必要とする。
時間復号化から生じる基準信号は、必ずしも変換復号化を使用する全ての復号器に利用可能であるとは限らない。更に、そのような基準信号が復号器に利用可能である場合において、それは、常にプリエコーの減衰を計算することに適当であるとは限らない。
ステレオのスケーラブル符号器、例えば“ITU−T G.729.1”標準のステレオ拡張は、以下に示された方法において作動し得る。
その符号器は、ステレオ信号の2つのチャンネル、左チャンネル及び右チャンネルの平均を計算すると共に、次に、G.729.1符号器によってこの平均値を符号化し、そして最終的に追加のステレオ拡張パラメータを伝送する。従って復号器に伝送された2進系列は、追加のステレオ拡張層を有するG.729.1層を含む。例えば、第1の追加の層は、(変換されたドメインにおける)ステレオ信号の2つのチャンネル間のサブバンドごとのエネルギーにおける差異を反映するパラメータを含む。第2の層は、例えば、元の信号とG.729.1の2進系列及び第1の層に基づいて復号化された信号との間の差異として定義される残留信号の変換された係数を含む。
拡張モードにおけるG.729.1復号器は、第一に、モノラルの信号を復号化すると共に、伝送されたパラメータの関数として、両方のチャンネル、左チャンネル及び右チャンネルの変換された係数を取り出す。
G.729.1タイプの復号器によるモノラルの信号の復号化は、2つチャンネルの平均値に基づく基準信号を生成する。2つチャンネルの間のレベルの差異が大きい場合、その場合に、モノラルの信号の時間的なエンベロープは、より大きいレベルのチャンネルの逆変換の出力に対しては低く、より小さいレベルのチャンネルの逆変換の出力に対しては高くなる。
プリエコーを減衰させるためのG.729.1復号器の出力のような基準の使用は、従ってステレオの復号化に対して効果的ではないであろう。具体的には、より大きいレベルのチャンネルでは、あまりにも多くのプリエコーが誤って検出されると共に、有益な信号が従って取り除かれることになり、一方、より小さいレベルのチャンネルでは、必ずしも全てのプリエコーが検出されるとは限らないか、もしくは取り除かれるとは限らないであろう。
仏国特許出願第0601466号
"Y. Mahieux"、"J. P. Petit"、"High Quality Audio Transform Coding at 64 kbits"、IEEE Trans. On Communications Vol 42, No. 11, November 1994
従って、時間復号化から生じる信号が利用可能ではないか、あるいは効果的ではない場合、そして符号器によって補助情報が送信されない場合に、復号化する際にプリエコーを正確に減衰する技術に関する必要性が存在する。更に、この技術は、モノラルの符号化、及びステレオの符号化のために作動することができなければならない。
この目的のために、本発明は、変換符号化に基づいて生成されたデジタルオーディオ信号において、このデジタルオーディオ信号の現在のフレームに関して復号化するときに、プリエコーを減衰させる方法であって、前記方法が、−少なくとも現在のフレームの再構成された信号に基づいて、連結された信号を定義するステップと、−前記連結された信号を確定した長さのサンプルのサブブロックに分割するステップと、−前記連結された信号の時間的なエンベロープを計算するステップと、−前記時間的なエンベロープの高エネルギーゾーンへの遷移を検出するステップと、−遷移が検出されたサブブロックに先行する低いエネルギーのサブブロックを判定するステップと、−判定された前記サブブロックにおける減衰のステップとを含み、前記方法は、前記減衰が判定された前記サブブロックの各々に関して前記連結された信号の前記時間的なエンベロープの関数として計算された減衰係数に従って遂行されることを特徴とする方法に関係する。
従って、減衰係数は、復号化された信号に特有の特性に基づいて定義され、それは、符号器からの情報の伝送を全く必要としないか、あるいはエコーを生成しない復号化から生じる信号を全く必要としない。
現在のフレームの各サブブロックに適していると共に、再構成された信号に基づいて計算された係数は、プリエコー減衰処理の品質を改良することを可能にする。
連結された信号は、図2を参照して続いて定義されるような、現在のフレーム及び現在のフレームの第2の部分の再構成された信号に基づいて定義され得る。この場合、その方式は、時間的遅延を全く導入しない。
時間的遅延が容認されている場合において、連結された信号は、現在のフレームの再構成された信号、及び次のフレームの再構成された信号として定義される。
連結された信号は、サブブロックとして様々な場所に物理的に保存され得る。
以下に言及された様々な特別な実施例は、独立して、もしくは相互に組み合わせて、上記で定義された方法のステップに加えられ得る。
従って、特定の実施例において、前のフレームの再構成された信号の前記時間的なエンベロープの関数として、前記係数の減衰値に関して最小値が決定される。
これは、特にバックグラウンド雑音レベルにおける、あるフレームから別のフレームに対するあまりにも大きな減衰の差異を回避すると共に、人工音が聞こえることを回避することを可能にする。
前のフレームの再構成された信号の時間的なエンベロープは、例えば、サブブロックごとの最小エネルギーの計算によって、または、さもなければ平均エネルギーの計算によって、または、あらゆる他の計算によって決定され得る。
本発明の特定の実施例において、前記減衰係数は、前記サブブロックの時間的なエンベロープの関数として、前記遷移を含む前記サブブロックの時間的なエンベロープの最大値の関数として、そして、前のフレームの再構成された信号の時間的なエンベロープの関数として、決定される。
代表的な実施例において、前記時間的なエンベロープは、サブブロックのエネルギー計算によって決定される。
有利に、その方法は、判定された前記サブブロックにおける前記減衰のステップの後に、前記現在のフレームの前記時間的なエンベロープを計算して保存するステップを更に含む。
この時間的なエンベロープ計算は、従って、次のフレームを処理するために使用されることになる。その信号がプリエコーによってもはや妨害されないので、この計算は正確である。
有利に、値1の減衰係数が、前記遷移を含む前記サブブロックの前記サンプル、及び前記現在のフレームにおける次のサブブロックの前記サンプルに割り当てられる。
その減衰は、従ってプリエコーを全く含まないこれらのサブブロックでは抑制される。
特定の実施例において、前記減衰係数は、以下の、−現在のサブブロックのエネルギーに対する遷移を含む前記サブブロックにおいて判定された最大エネルギーの比率を計算するステップと、−前記比率を第1のしきい値と比較するステップと、−前記比率が前記第1のしきい値以下である場合に、前記減衰を抑制する値を前記減衰係数に割り当てるステップと、−前記比率が前記第1のしきい値より大きい場合に、・前記比率を第2のしきい値と比較し、・前記比率が前記第2のしきい値以下である場合に、低い減衰値を前記減衰係数に割り当て、・前記比率が前記第2のしきい値より大きい場合に、高い減衰値を前記減衰係数に割り当てるステップと、に従って、判定されたサブブロックごとに決定される。
この特定の実施例は、特に効果的であるということが分かり、そして実装するのが簡単である。
有利に、前記方法は、サンプルごとに計算された前記係数の間の平滑化関数の決定を提供する。
これは、同様に、減衰値のあまりにも突然の変化の間に聞こえる人工音を回避することを可能にする。
実施の変形において、遷移を含むサブブロックに先行するサブブロックの所定数のサンプルに適用された前記減衰係数に対して、前記減衰を抑制する減衰値を適用するこによって、遷移を含むサブブロックに先行するサブブロックに関して、係数補正が実行される。
これは、従って、減衰値のために定義された平滑化関数によって、音の立ち上がりの振幅を減少させないことを可能にする。
本発明は、更に、変換符号化に基づいて生成されたデジタルオーディオ信号において、プリエコーを減衰させるための装置であって、前記装置が、このデジタルオーディオ信号の現在のフレームの処理のために、−少なくとも現在のフレームの再構成された信号に基づいて、連結された信号を定義するためのモジュールと、−前記連結された信号を確定した長さのサンプルのサブブロックに分割するためのモジュールと、−前記連結された信号の時間的なエンベロープを計算するためのモジュールと、−前記時間的なエンベロープの高エネルギーゾーンへの遷移を検出するためのモジュールと、−遷移が検出されたサブブロックに先行する低いエネルギーのサブブロックを判定するためのモジュールと、−判定された前記サブブロックにおける減衰のためのモジュールとを備える復号器と関連付けられることを特徴とする装置を目的としている。
前記装置は、前記減衰モジュールが判定された前記サブブロックの各々に関して前記連結された信号の前記時間的なエンベロープの関数として計算された減衰係数に従って前記減衰を遂行する。
本発明は、上記で説明された装置を備えることを特徴とするデジタルオーディオ信号の復号器を目的としている。
そのような復号器は、例えばITU−Tの委員会(commission)16の課題(question)23において研究されたG.729.1−SWB/ステレオタイプの復号器であり得る。
本発明は、ステレオモードにおける、もしくはSWB(超広帯域:Super Wide Band)モードにおけるそのような復号器に統合され得る。
最終的に、本発明は、プロセッサによって実行されるときに上記で説明されたような減衰方法のステップを実行するためのコード命令を含むことを特徴とするコンピュータプログラムを目的としている。
従来技術に従って変換符号化−復号化システムを例証する以前に示された図である。 信号の現在のフレームに関して再構成された信号の構成を例証する図である。 デジタルオーディオ信号復号器内のプリエコーを減衰させる装置を例証する図である。 遷移が現在のフレームの第2の部分にある場合の連結された信号を表す図である。 遷移が現在のフレームの再構成された信号にある場合の連結された信号を表す図である。 本発明による減衰係数の計算ステップの一般的な実施例を表すフローチャートを例証する図である。 本発明の実施例による減衰方法の実施の詳細なフローチャートを例証する図である。 本発明による減衰係数の計算の特別な実施例を例証する図である。 実施例による発明が実施される代表的なデジタルオーディオ信号を例証する図である。 変形の実施例による発明が実施される同じデジタルオーディオ信号を例証する図である。 音の立ち上がりが現在のフレームの第2の部分の第2のサブブロックに位置する場合の連結された信号を例証する図である。 音の立ち上がりが現在のフレームの第2の部分の第3のサブブロックに位置する場合の連結された信号を例証する図である。 音の立ち上がりが現在のフレームの第2の部分の第1のサブブロックに位置する場合の連結された信号を例証する図である。 音の立ち上がりが現在のフレームの第2の部分の第4のサブブロックに位置する場合の連結された信号を例証する図である。 G.729.1のSWB/ステレオタイプの符号器を例証する図である。 本発明による減衰装置を備えるG.729.1のSWB/ステレオタイプの復号器を例証する図である。 G.729.1のSWBタイプの符号器を例証する図である。 本発明による減衰装置を備えるG.729.1のSWBタイプの復号器を例証する図である。 本発明による減衰装置の一例を例証する図である。
本発明の他の特性及び利点は、添付された図面を参照して、単に制限しない例として与えられた以下の説明を読むことにより明確に明らかになるであろう。
図2は、復号化された信号のフレーム、及び図1を参照して説明されたような重なり部分(オーバラップ:overlap)の加算によって再構成された信号の構成を表す。以下では、次の表記法が、図2を参照して、及び以下の式を参照して使用される。
Figure 0005295372
ここで、“N”は、フレームのインデックスであり、“L”は、フレームの長さであり、“xrec、N”は、フレーム“N”の再構成された信号であり、“xtr、N”は、フレーム“N”のMDCTの逆変換から生じる長さ“2L”の信号である。MDCT変換の詳細及びMDCTの逆変換の詳細に踏みいることなく、フレーム“N”に関する長さ“2L”の中間の信号“xtr、N”の詳細は、以下のように定義される。
Figure 0005295372
ここで、“y(n)”及び“y(n)”は、ここで詳述されない中間の信号である。その場合に、フレーム“N”の再構成された信号“xrec、N”が以下の式によって与えられることが示され得る。
Figure 0005295372
従って、再構成は、重なり部分の加算によって行われる。
中間の信号が、反対称的な部分及び対照的な部分を含むということに注意が必要である。フレーム“N”の復号化の間、“xtr,N”を発見することを可能にする2進系列が受信され、それは、従って、“xrec、N(n)、但しn=0・・・L−1”を再構成することが可能である。一方、インデックス“N+1”の将来のフレームに関しては“半分”の情報だけが利用可能であり、すなわち、インデックス“N+1”の将来のフレームに関しては、“xtr,N、但しn=L・・・2L−1”である。MDCT(及びその逆変換)の全ての変形の実施例に関して、以上で定義された形式の中間の信号“xtr,N”を定義することが常に可能であることに注意することが重要である。しかしながら、ある具現化において、信号“xtr,N”は、それ自体明確ではなく、“時間的エイリアシング”を含む中間の信号“y(n)”及び“y(n)”のみが、利用可能である。
従って、変換復号器において、現在のフレームの再構成された信号(“xrec、N(n)、但しn=0〜L−1”)は、以前のフレームのMDCT係数の逆変換の出力の第2の部分(“xtr、N−1(n)、但しn=L〜2L−1”)、及び、現在のフレームのMDCT係数の逆変換の出力の第1の部分(xtr、N(n)、但しn=0〜L−1)の重み付けされた加算によって獲得される。現在のフレームのMDCT係数の逆変換の出力の第2の部分(“xtr、N(n)、但しn=L〜2L−1”)は、次のフレームの再構成された信号を獲得するのに利用されるために、メモリにおいて保持されると共に、“xtr、N−1(n)、但しn=L〜2L−1”になるであろう。以下では、簡単にするために、用語“現在のフレームの第1の部分”、“現在のフレームの第2の部分”、“現在のフレームの再構成された信号”が使用される。次のフレームにおいて、現在のフレームの第2の部分は、従って前のフレームの第2の部分になる。
更に図面を単純化するために、拡大された、すなわちMDCT変換合成窓の最大値を乗算された現在のフレームの第2の部分に関して、以下の“xcur2h,N(n)=h(L)・xtr,N(L+n)、但しn=0〜L−1”という表記法が、同様に、導入される。
特に、現在のフレームに位置する音の立ち上がりに関して、第1の部分または第2の部分において、本発明の実施例によるプリエコーを減衰させる方法は、現在のフレーム“xrec、N(n)”の再構成された信号に基づいて、そして、拡大された現在のフレーム“xcur2h,N(n)”の第2の部分の信号に基づいて、連結された信号[xrec,N(0)、・・・xrec,N(L−1)、xcur2h,N(0)、・・・xcur2h,N(L−1)]を生成する。
この連結された信号は、決定された長さであると共に、ここでは偶数のサンプルのサブブロックに分割される。
その方法は、プリエコーの減衰を必要とする現在のブロックのサブブロックを判定する。
更に、減衰方法は、判定されたサブブロックに適用されるべき減衰係数を計算するステップを含む。その計算は、連結された信号の時間的なエンベロープの関数として、サブブロックのそれぞれに関して実行される。
この計算は、同様に、前のフレームの再構成された信号の時間的なエンベロープの更なる関数として、実行され得る。
従って、図3を参照すると、減衰装置100は、連結された信号を定義するためのモジュール101と、連結された信号をサブブロックに分割するためのモジュール102と、連結された信号の時間的なエンベロープを計算するためのモジュール103と、時間的なエンベロープの高エネルギーゾーンへの遷移を検出すると共に、遷移が検出されたサブブロックに先行する低いエネルギーのサブブロックを判定するためのモジュール104と、判定されたサブブロックにおける減衰のためのモジュール105とを備える。減衰モジュールは、モジュール104によって判定されたサブブロックに減衰係数を適用することができると共に、減衰係数は、減衰モジュールによって、連結された信号の時間的なエンベロープの関数として決定される。
図3を参照すると、減衰装置は、逆の量子化(Q−1)のためのモジュール110と、逆変換(MDCT−1)のためのモジュール120と、図1を参照して説明されたような加算/オーバラップ(add/ovl)、及び再構成された信号を本発明に基づく減衰装置に対して供給することによって、信号を再構成するためのモジュール130と、を備える復号器に含まれる。
図4a及び図4bは、信号における遷移または音の立ち上がりを含む信号の例を例証する。MDCT窓における信号の一部分のエネルギーが他の部分のエネルギーより著しく大きい場合(音の立ち上がり)に、プリエコー現象は存在する。その場合に、プリエコーは、音の立ち上がりの前の低エネルギー部分において観察される。従って、この部分では、プリエコーを減衰させる必要がある。
図2に表されるように、信号の音の立ち上がりまたは遷移が、現在のフレーム(最初のL個のサンプル)に、もしくは、現在のフレームの第2の部分に対応する次のフレーム(次のL個のサンプル)に存在する場合に、2つの場合があり得る。
図4aは、現在のフレームの第2の部分における信号の音の立ち上がりと連結された信号を表す。この図面において、K個の長さNのサンプルのサブブロックkにスライスすることができ、N=L/K、K=4であることを理解することが可能である。最初のL個サンプルは、現在のフレーム“xrec,N(n)、但しn=0、・・・、L−1”の再構成された信号を表す。次のL個のサンプル(L〜2L−1)は、現在のフレーム“xcut2h,N(n)、但しn=0、・・・、L−1”の第2の部分を表す。次のフレームにおいて、この第2の部分は、前のフレームの第1の部分になる。
現在のフレームの第2の部分がMDCTの逆変換の特質によって対称的である点に注意が必要である。実際には、本発明によれば、プリエコーは、追加の遅延を変換復号化に導入せずに減衰される。現在のフレームの復号化の間、復号器は、サンプル“xtr,N(n)、但しn=0、・・・、2L−1”を合成するが、しかし、“xrec,N(n)、但しn=0、・・・、L−1”を再構成するために、サンプル“xtr,N(n)、但しn=0、・・・、L−1”だけを使用することができる。
音の立ち上がりまたは遷移は、(更にその位置を与えることができずにではあるが)次のフレームに存在するということが理解され、従って、再構成された信号の現在のフレームの最初のL個サンプルに関して、プリエコーを減衰させることが必要である。
図4bは、1フレーム後の同じ信号を表し、このときに、音の立ち上がりは、再構成された信号の現在のフレーム、すなわち第3のサブブロック(k=2)に存在する。最初の2つのサブブロックでプリエコーを減衰させることが、従って必要である。
本発明によるプリエコーを減衰させる方法は、フレームの各サンプルに関するプリエコー減衰係数を供給する。この方法は、図5、及び図6を参照してここから説明されることになる。
図5に表されるフローチャートは、本発明による、現在のフレームに関して減衰係数を計算する様々なステップを例証する。
ステップ201において、現在のフレームの再構成された信号の時間的なエンベロープが計算されると共に、ステップ202において、拡大された現在のフレームの第2の部分の時間的なエンベロープが計算される。
時間的なエンベロープは、例えば、図6を参照して説明されたように、サブブロックに基づいてエネルギーを計算することによって獲得される。例えば、サブブロックに基づく信号の絶対値の平均値、または、そのほかに各サブブロックの最大値あるいは中央値を計算することによって、それは、他の方式によって獲得され得る。そのエンベロープは、同様に、例えば、ローパスフィルタが後に接続された、ティーガー−カイザー(Teager-Kaiser)タイプの演算器によって獲得され得る。全ての場合において、普遍性の損失なしに、時間的なエンベロープがサブブロックごとの値の時間的な分解能によって定義されると共に、サブブロックのサイズは適応性があると、ここでは仮定される。
ステップ203において、減衰係数関数が、ステップ201及び202で定義された現在のフレームのエンベロープに基づいて、そして、前のフレームの再構成された信号のエンベロープ(Tenv(xrec,N−1(n))に基づいて定義される。
ステップ204は、処理された信号に現れるであろう不連続性を回避するために、任意に、減衰係数に関して獲得された値に対する平滑化関数を定義する。
図6を参照して、本発明の詳述される実施例における減衰方法が、ここから説明されることになる。
従って、ステップ301において、図4aまたは図4bで例証されたように、信号が長さN=L/Kのサブブロックにスライスされる。従って、2K個のサブブロックを獲得する。
ステップ302において、再構成された信号“xrec,N(n)”のK個のサブブロックのエネルギーEn(k)が計算される。
ステップ303において、拡大された現在のフレーム“xcur2h,N(n)”の第2の部分の各サブブロックのエネルギーが計算される。図4aに示されたように、信号のこの部分の対称性のために、値“K/2”だけ異なる。
ステップ304において、サブブロック“xrec,N(n)”と“xcur2h(n)”の信号のエネルギーの最大値が“K+K/2=3K/2”個のブロックにわたって計算され、そのインデックスがindに保存される。
従って、計算された最大エネルギーの値“maxen”が同様に保存される。
ステップ305において、ループカウンタが初期化される。ステップ306〜309のループにおいて、インデックスindのサブブロックに先行する各サブブロックに関して、減衰係数“g(k)”が、そのエネルギー“En(k)”の関数として、最大エネルギー“maxen”の関数として、そして前のフレーム“xrec,N−1”の再構成された信号の平均エネルギーの関数として、ステップ307において決定されると共に、この係数は、ステップ308において、サブブロックの全てのサンプルに割当てられる。
ステップ310において、最大エネルギーのサブブロックの第1のサンプルのインデックスが計算される。ステップ311において、それがフレームの長さより小さいかどうかを確認するために、検査が実行される。もしそうであるならば、最大エネルギーのサブブロックは現在のフレームに存在すると共に、ステップ311、312、313のループにおいて、係数1、すなわち減衰を抑制する値が、サブブロックの初めからフレームの終わりまでの全てのサンプルに割当てられる。
ステップ314において、再構成された現在のフレーム、すなわち再構成された信号“xrec,N(n)”の最初のK個のブロックの平均エネルギーが、計算されて、保存される。それは、新しい係数の計算のために、次のフレームにおいて使用されることになる。変形において、このステップの方程式は、例えば以下の式のような、プリエコーの減衰を同様に考慮する別のものと交換され得る。
Figure 0005295372
従って、プリエコーによってもはや妨害されない処理された信号が考慮される。
ステップ315及びステップ316において、係数の非常に突然の変化を回避するために、係数を円滑にするための関数が決定され、サンプルごとに適用される。
この平滑化関数は、例えば、以下の式によって定義される。
Figure 0005295372
ここで、前のサンプルのために定義された係数及び現在のサンプルの係数が、平滑化された係数を獲得するために、重み付けされる。
ステップ315において、現在のフレームの減衰されるべき最後のサブブロックに関する最後の減衰係数が、次のフレームにおける使用のために保存される。
例えば(例えば、0.05の増加による)一定の勾配、または(例えば16個のサンプルにわたる)固定長のいずれかによる係数の2つの値の間の線形の遷移のような、他の平滑化関数が実行可能である。
一度、それらの係数がこのように計算されたならば、以下のように各サンプルに対して、対応する係数を乗算することによって、プリエコーの減衰が、現在のフレームの再構成された信号に関して実行される。
Figure 0005295372
サブブロックに関する減衰係数を計算するステップ307が、図7を参照して、本発明の特定の実施例においてここから詳述される。
この実施例において、処理されたサブブロックのエネルギーに対するステップ304において決定された最大エネルギーの比率“maxen/En(k)”が、最初に、ステップ401において計算される。
実際には、この比率は、反転され得ると共に、従って、それらのしきい値も適合される。
ステップ402は、この比率が第1のしきい値“S1”以下であるかどうかを検査する。“S1”の値は、一例では、16に固定されており、この値は実験的に最適化されている。
もしそうならば、うっとうしいプリエコーを生じさせる最大エネルギーに対するエネルギーの変化は小さく、その場合に、減衰は必要ではない。係数は、その場合に、ステップ403において、減衰を抑制する減衰値、すなわち“1”に固定される。
そうでなければ、ステップ404は、比率rが第2のしきい値“S2”以下であるかどうかを検査する。“S2”の値は、一例では、32に固定されており、この値は実験的に最適化されている。
もしそうならば、これは、小さなうっとうしいプリエコーが存在する可能性があり、それは、ステップ405において、係数を低い減衰値、例えば“0.5”に固定することによって、わずかに減衰されなければならないことを意味する。その比率がこの第2のしきい値より大きい場合、その場合に、プリエコーの危険性は最大であると共に、ステップ406において、高い減衰値、例えば“0.1”が係数に適用される。
ほとんどの場合、特にプリエコーがうっとうしい場合に、プリエコーのフレームに先行するフレームは、この瞬間のバックグラウンド雑音のエネルギーに対応する一様なエネルギーを有している。経験によれば、プリエコー処理後に、信号のエネルギーが前のフレームの平均エネルギーより小さい状態になることは、有益でないと共に、更に望ましくない。
ステップ407において、係数の制限値limが、従って計算され、それによって、前のフレームの平均エネルギーと正確に同じエネルギーが、与えられたサブブロックに関して獲得される。次に、ステップ408において、ここでは減衰値が興味のある値であるので、この値は最大“1”に制限される。
従って獲得された値limは、ステップ409において、減衰係数の最終の計算における下限値として役立つ。
減衰係数計算の変形の実施例において、送信された信号の速度特性が考慮され得る。実際には、低い速度(rate)の伝送において、量子化雑音は概して考慮に値すると共に、それによって、うっとうしいプリエコーの危険性を増大させる。逆に、非常に高い速度(rate)において、符号化品質は、非常に良くなり得ると共に、プリエコーの減衰はその場合に必要ではない。
マルチレート符号化/復号化の場合は、速度(rate)情報が、減衰係数を決定するために、従って考慮され得る。
図8a及び図8bは、典型的な例に関して、本発明の減衰方法の実施を例証する。
この例において、その信号は、8[kHz]でサンプリングされると共に、フレームの長さは、160個のサンプルであり、そして、各フレームは、40個のサンプルの4つのサブブロックに分割される。
図8aの“a.)”部分において、16[kHz]でサンプリングされた、ステレオ信号の左チャンネルの狭帯域部分(0〜4000[Hz])に対応する元の信号の3つのフレームが表される。信号における音の立ち上がりまたは遷移は、インデックス360から始まるサブブロックに位置する。この信号は、例えば、G.729.1の符号器のステレオ拡張によって符号化された。
図8aの“b.)”部分において、プリエコー処理なしの(左チャンネルだけの)復号化の結果が例証される。サンプル160(音の立ち上がりを有するフレームに先行するフレームの始まり)からプリエコーを観察することができる。
“c.)”部分は、本発明による方法を実施することによって獲得されたプリエコーの減衰係数の漸進的変化(実線)を示す。点線は、平滑化の前の係数を表す。
“d.)”部分は、プリエコー処理の適用(信号“b.)”と信号“c.)”との乗算)後の復号化の結果を例証する。プリエコーが実際に除去されたということが理解される。
図8bは、本発明による減衰方法の変形の実施例の実施が行われる、同じ典型的な例を例証する。
図8aが念入りに観察されるならば、平滑化された係数は、音の立ち上がりの瞬間に元の“1”に上昇せず、音の立ち上がりの振幅における減少を意味しているということが認識される。この減少の聞き取れる影響は、非常に小さいが、しかし、それでもなお回避され得る。
この目的のために、平滑化の前に、音の立ち上がりが位置するサブブロックに先行するサブブロックの最後の少量のサンプルに対して、係数値“1”を割り当てることが、例えば可能である。図8bの“c.)”部分は、そのような修正の例を示す。この例において、インデックス344に基づいて、音の立ち上がりを有するサブブロックに先行するサブブロックの最後の16個のサンプルに対して、係数値“1”が割り当てられた。
従って、平滑化関数は、音の立ち上がりの瞬間に“1”に近接する値を有するように、係数を次第に増加する。その場合に、音の立ち上がりの振幅は保持される。
この方式を備える難しさは、音の立ち上がりを含むフレームに先行するフレームにおいて、音の立ち上がりが第1のサブブロックに位置するかどうかを知ることである。
もし音の立ち上がりが第1のサブブロックに位置するならば、係数値“1”がフレームの最後のサンプルに割り当てられなければならない。問題は、連結された信号に関して、実際にはMDCT変換の“時間的なエイリアシング(aliasing)”の周知の特質を反映する連結された信号のこの部分の対称性のために、確実に音の立ち上がりの位置を判定することが不可能であることである。
図9及び図10は、図8a及び図8bの第2のフレームに対応する連結された信号を例証する。
実際には、音の立ち上がりが連結された信号のサブブロックk=5に存在することを理解することが可能である。この音の立ち上がりは、従って、次のフレームの再構成された信号の第2または第3のサブブロックに存在することになる。それは、従って、次のフレームの第1のサブブロックに存在しないことになる。その場合に、係数値“1”を現在のフレームの最後のサンプルに割り当てることは必要ではない。信号が、実際に、次のフレームの第2のサブブロックに音の立ち上がりを有している(図9の場合)か、または次のフレームの第3のサブブロックに音の立ち上がりを有している(図10の場合)か否かに拘らず、これは有効である。
一方、図11、または図12に表されるように、音の立ち上がりが、次のフレームの第1のサブブロックもしくは第4のサブブロックに存在する場合に、音の立ち上がりは、連結された信号のこの部分の対称性のために、連結された信号のサブブロックk=4において検出される。
ここで、音の立ち上がりが第1のサブブロックに存在するならば、係数値“1”が、フレームの最後のサンプルに割り当てられなければならないが、しかし、音の立ち上がりが第4のサブブロックに存在するならば、これは必要ではない。
1つの解決法は、もし音の立ち上がりが連結された信号の第4のサブブロックにおいて検出されるならば、係数値“1”をフレームの最後のサンプルに常に割り当てることである。次のフレームにおいて、音の立ち上がりが第1のサブブロックに存在する(図11の場合)ならば、その場合に、操作は最適である。一方、音の立ち上がりが第4のサブブロックに存在する(図12の場合)ならば、フレームの終わり辺りで、少量のサンプルに関してプリエコー減衰係数が“1”に向かって増加すると共に、次に、次のフレームの始まりにおける正しい減衰レベルに反落するので、減衰が準最適である。音の立ち上がりが次のフレームの第4のサブブロックに存在する場合に、その振幅は、分析窓によって非常に減少するので、この準最適性の本来備わっている効果は弱い。この音の立ち上がりによって引き起こされるプリエコーは弱い。
図9から図12は、音の立ち上がりの位置をフレーム内で移動させるように、サブブロックの長さでそれをシフトすることによって、同じ入力信号によって獲得された。例えば、図11と図12を比較することによって、音の立ち上がりの位置の関数として、プリエコーレベルにおける差異を観察することが可能であり、例えば、音の立ち上がりが第4のサブブロックに存在する場合、プリエコーは著しく弱い。
本発明の主題である方法は、音の立ち上がりの始まりを計算する(サブブロックごとのエネルギーの最大値を検索する)ために特別な例を使用するが、しかし、音の立ち上がりの始まりを判定するためのあらゆる他の方式と共に機能し得る。
前述の発明の主題である方法は、MDCTフィルタバンク、または実数値または複素数値への完全再構成によるあらゆるフィルターバンク、または準完全再構成によるフィルタバンクの他に、フーリエ変換またはウェーブレット変換を用いるフィルタバンクを使用する、あらゆる変換符号器において、プリエコーの減衰に適用される。
フレームの遅延がデコーダにおいて許容できる場合に、過渡応答(音の立ち上がり)を連結された信号の第2の部分に配置することの問題が回避され得ることに注意が必要である。プリエコーを減少させるための方法は、その場合に、直接再構成された信号に適用されると共に、もはや、再構成された信号/時間的エリアシングを有する中間的な信号の間の混成物である連結された信号には適用されない。以前に説明された、遷移を検出するための手段、減衰係数を計算するための手段、及びプリエコーを減少させるための手段が適用される。
更に、連結された信号が明白に定義されない場合、以前に説明された操作を実行するために、現在のフレームにおいて再構成された信号及び逆MDCTの中間信号を利用することが、まだ可能である。
本発明を適用する例が、以下に示される。
代表的なステレオ信号の符号器が、図13aを参照して説明される。本発明による減衰装置を備える適切な復号器が、図13bを参照して説明される。
図13aは、ステレオの情報が、周波数帯域ごとに送信されると共に、周波数領域で復号化される、代表的な符号器を示す。
モノラルの信号Mは、マトリクス化手段500によって、左の入力信号L及び右の入力信号Rの経路に基づいて計算される。
符号器は、更に、例えば離散フーリエ変換またはDFT、MDCT変換(“修正離散コサイン変換”)、MCLT変換(“変調複素重複変換(Modulated Complex Lapped Transform)”)のような変換を実行することができる時間−周波数変換手段502、503、及び504を統合する。
左Lの周波数信号の値及び右Rの周波数信号の値、そしてモノラルMの周波数信号の値は、従って、左、右、及びモノラルの時間信号に対応する値L、R、及びMに基づいて獲得される。図13、及び図14を説明するために、イタリック体における文字が、周波数領域の信号に対して使用されることになる。
モノラルの信号Mは、同様に、手段501によって、例えばITU−Tにおいて標準化されたG.729.1符号器によって、量子化されて符号化される。このモジュールは、コアの2進系列“bst”と、更に、周波数領域に変換された復号化されたモノラルの信号
Figure 0005295372
を供給する。
モジュール505は、周波数信号L、R、及びMに基づいて、そして復号化された信号
Figure 0005295372
に基づいて、ステレオのパラメータの符号化を遂行する。それは、2進系列“bst”のための第1の任意の拡張階層、及び2つの階層“bst”及び“bst”を復号化することによって獲得された復号化されたステレオ信号
Figure 0005295372
の2つのチャンネルを供給する。
周波数領域におけるステレオの残留信号が、手段506及び507によって計算されると共に、符号化手段508によって符号化され、そして2進系列“bst”のための第2の任意の拡張階層が獲得される。
符号化されたコア信号“bst”、及び任意の拡張階層“bst”と“bst”は、復号器に伝送される。
図13bは、符号化されたコア信号“bst”、及び任意の拡張階層“bst”と“bst”を受信することができる代表的な復号器を示す。
復号化手段600は、コアの2進系列“bst”を復号化すると共に、モノラルの復号化信号
Figure 0005295372
を獲得することを可能にする。もし第1の任意の拡張階層“bst”が利用可能であるならば、それは、モノラルの復号化信号
Figure 0005295372
に基づいて、復号化されたステレオの信号
Figure 0005295372
を組み立てるために、パラメータのステレオ復号化手段601によって復号化される。そうでなければ、
Figure 0005295372
は、
Figure 0005295372
に等しいであろう。
第2の任意の拡張階層“bst”が同様に利用可能である場合、それは、周波数領域におけるステレオの残留信号を獲得するために、復号化手段602によって復号化される。これは、信号の周波数表現の正確度を増加させるために、復号化されたステレオの信号
Figure 0005295372
に加えられる。そうでなければ、この第2の拡張階層が利用可能ではない場合、
Figure 0005295372
は変わらないままである。
これらの2つの信号は、モジュール605及び606によって周波数−時間逆変換を受け、それぞれのモジュール607及び608によって加算/オーバラップによる再構成を受ける。本発明によるプリエコーの削減は、その場合に、復号化された時間的なステレオの信号の2つのチャンネル
Figure 0005295372
を獲得するために、例えば図3を参照して説明されたように、減衰モジュール609及び610によって遂行される。
本発明による装置を含む別の代表的な復号器が、図14a及び図14bを参照してこれから説明される。
図14aは、G.729.1タイプの広帯域符号器の超広帯域拡張の代表的な符号器を示す。超広帯域の入力信号“S32”は、広帯域信号“S16”を獲得するために、サブサンプリング手段700によって、サブサンプリングされる。この信号は、手段701によって、例えばITU G.729.1符号器によって、量子化されて符号化される。このモジュールは、コアの2進系列“bst1”、そして更に、周波数領域における復号化された広帯域信号
Figure 0005295372
を供給する。
超広帯域入力信号“S32”は、変換手段703によって周波数領域に変換される。広帯域部分において符号化されない高域(帯域7000〜14000[Hz])の周波数は、符号化手段704によって符号化されることになる。この符号化は、復号化された広帯域信号
Figure 0005295372
のスペクトルに基づいている。符号化されたパラメータは、2進系列の第1の任意の拡張階層“bst”を構成する。
符号化手段705によって供給された2進系列の第2の任意の拡張階層“bst”は、広帯域(50〜7000[Hz])の品質を改善するためのパラメータを含む。
図14bの復号器は、図14aの符号器に対応する超広帯域復号器(50〜14000[Hz])を表す。コアの2進系列“bst”は、G.729.1タイプの広帯域復号器(モジュール800)によって復号化される。広帯域の復号化された信号のスペクトルが、従って獲得される。このスペクトルは、第2の任意の拡張階層“bst”のモジュール801における復号化によって、任意に改善される。モジュール801は、更に、広帯域信号の周波数−時間変換を含む。本発明は、ここではエコーのない時間信号(G.729.1符号器のCELP成分及びTDBWE成分)が利用可能であるので、プリエコーを減少させるために、この周波数−時間変換に介在せず、従って、仏国特許出願第0601466号(FR 06 01466)において説明された技術が適用され得る。復号化された広帯域信号は、従って、オーバサンプリング手段802において、2倍にオーバサンプリングされる。
第1の任意の拡張階層“bst”を復号器が利用可能である場合、それは復号化手段803によって復号化される。
この復号化は、復号化された広帯域信号
Figure 0005295372
のスペクトルに基づいている。従って、獲得されたスペクトルは、広帯域部分によって符号化されない7000〜14000[Hz]の周波数ゾーンにおいて、もっぱらゼロでない値を含む。この構成では、7000[Hz]と14000[Hz]との間で、プリエコーなしの基準信号は、従って利用可能ではない。従って、本発明による減衰装置が実装される。
時間信号が、モジュール804による周波数−時間逆変換によって獲得される。加算/オーバラップ再構成モジュールは、再構成された信号を提供する。本発明によるプリエコーの削減は、図3を参照して説明されたような減衰モジュール807によって遂行される。
このアプリケーションに関しては、MDCT逆変換後の信号が7000[Hz]より上の周波数のみを含む点に注意が必要である。この信号の時間的なエンベロープは、従って、非常に高い正確度によって決定され得ると共に、それによって、本発明の減衰方法によるプリエコーの減衰の有効性を増大させる。
本発明による減衰装置の代表的な実施例が、図15を参照してここから説明される。
ハードウェアに関して、本発明の手段の中のこの装置100は、一般的に、例えば現在のフレームの時間的なエンベロープ、現在のフレームの最後のサンプルに関して計算された減衰定数、現在のフレームのサブブロックのエネルギー、または図5から図7を参照して説明されるような減衰方法の実施のために必要とされるあらゆる他のデータを保存するための手段である記憶装置及び/またはワークメモリ、及び上述のバッファメモリMEMを有するメモリブロックBM、と協働するプロセッサμPを備える。この装置は、デジタル信号“Se”の連続するフレームを入力として受け取り、そして、適切な場合、プリエコーの減衰によって再構成された信号“Sa”を供給する。
メモリブロックBMは、装置のプロセッサμPによって実行される場合に本発明による方法のステップ、そして特に、少なくとも現在のフレームの再構成された信号に基づいて、連結された信号を定義するステップと、前記連結された信号を確定した長さのサンプルのサブブロックに分割するステップと、前記連結された信号の時間的なエンベロープを計算するステップと、前記時間的なエンベロープの高エネルギーゾーンへの遷移を検出するステップと、遷移が検出されたサブブロックに先行する低いエネルギーのサブブロックを判定するステップと、判定された前記サブブロックにおける減衰のステップ(ATT)とを実施するためのコード命令を有するコンピュータプログラムを含むことができる。
その減衰は、判定されたサブブロックの各々に関して連結された信号の時間的なエンベロープの関数として計算された減衰係数に従って遂行される。
図5〜図7は、そのようなコンピュータプログラムのアルゴリズムを例証し得る。
本発明によるこの減衰装置は、独立しているか、もしくはデジタル信号復号器に統合され得る。
100 減衰装置
101 連結された信号を定義するためのモジュール
102 連結された信号をサブブロックに分割するためのモジュール
103 連結された信号の時間的なエンベロープを計算するためのモジュール
104 時間的なエンベロープの高エネルギーゾーンへの遷移を検出すると共に、遷移が検出されたサブブロックに先行する低いエネルギーのサブブロックを判定するためのモジュール
105 判定されたサブブロックにおける減衰のためのモジュール
110 逆の量子化(Q−1)のためのモジュール
120 逆変換(MDCT−1)のためのモジュール
500 マトリクス化手段
501 モノラル符号化手段
502、503、504 時間−周波数変換手段
505 パラメータのステレオ符号化モジュール
506、507 減算手段
508 残留信号符号化手段
600 モノラル復号化手段
601 パラメータのステレオ復号化手段
602 残留信号復号化手段
603、604 加算手段
605、606 周波数−時間逆変換モジュール
607、608 加算/オーバラップモジュール
609、610 減衰モジュール
700 サブサンプリング手段
701 符号化手段(ITU G.729.1符号器)
703 変換手段
704 高域符号化手段
705 広帯域符号化手段
800 広帯域復号器モジュール(ITU G.729.1復号器)
801 復号化/周波数−時間変換モジュール
802 オーバサンプリング手段
803 高域復号化手段
804 周波数−時間逆変換モジュール
805 加算手段
806 加算/オーバラップ再構成モジュール
807 減衰モジュール

Claims (12)

  1. 変換符号化に基づいて生成されたデジタルオーディオ信号において、時間復号化から生じる基準信号及び符号器から送信される特定の補助情報が利用可能でない場合に、このデジタルオーディオ信号の現在のフレームに関して復号化するときに、プリエコーを減衰させる方法であって、前記方法が、
    −少なくとも現在のフレームの再構成された信号に基づいて、連結された信号を定義するステップ(CONC)と、
    −前記連結された信号を確定した長さのサンプルのサブブロックに分割するステップ(DIV、101)と、
    −前記連結された信号の時間的なエンベロープを計算するステップ(ENV、102)と、
    −前記時間的なエンベロープの高エネルギーゾーンへの遷移を検出するステップ(DETECT、104)と、
    −遷移が検出されたサブブロックに先行する低いエネルギーのサブブロックを判定するステップ(DETECT、104)と、
    −判定された前記サブブロックにおける減衰のステップ(ATT)とを含み、
    前記方法は、前記減衰が判定された前記サブブロックの各々に関して前記連結された信号の前記時間的なエンベロープの関数として、そして、前のフレームの再構成された信号の時間的なエンベロープの関数として計算された減衰係数に従って遂行される
    ことを特徴とする方法。
  2. 前のフレームの再構成された信号の前記時間的なエンベロープの関数として、前記係数の減衰値に関して最小値が決定される
    ことを特徴とする請求項1に記載の方法。
  3. 前記減衰係数が、前記サブブロックの時間的なエンベロープの関数として、前記遷移を含む前記サブブロックの時間的なエンベロープの最大値の関数として、そして、前のフレームの再構成された信号の時間的なエンベロープの関数として、決定される
    ことを特徴とする請求項1に記載の方法。
  4. 前記時間的なエンベロープが、サブブロックのエネルギー計算によって決定される
    ことを特徴とする請求項1から請求項3のいずれか一項に記載の方法。
  5. 前記方法が、判定された前記サブブロックにおける前記減衰のステップの後に、前記現在のフレームの前記時間的なエンベロープを計算して保存するステップを更に含む
    ことを特徴とする請求項1に記載の方法。
  6. 値1の減衰係数が、前記遷移を含む前記サブブロックの前記サンプル、及び前記現在のフレームにおける次のサブブロックの前記サンプルに割り当てられる
    ことを特徴とする請求項1に記載の方法。
  7. 前記減衰係数が、以下の、
    −現在のサブブロックのエネルギーに対する遷移を含む前記サブブロックにおいて判定された最大エネルギーの比率を計算するステップと、
    −前記比率を第1のしきい値と比較するステップと、
    −前記比率が前記第1のしきい値以下である場合に、前記減衰を抑制する値を前記減衰係数に割り当てるステップと、
    −前記比率が前記第1のしきい値より大きい場合に、
    ・前記比率を第2のしきい値と比較し、
    ・前記比率が前記第2のしきい値以下である場合に、低い減衰値を前記減衰係数に割り当て、
    ・前記比率が前記第2のしきい値より大きい場合に、高い減衰値を前記減衰係数に割り当てるステップと、
    に従って、判定されたサブブロックごとに決定される
    ことを特徴とする請求項4に記載の方法。
  8. 平滑化関数が、サンプルごとに計算された前記係数の間で決定される
    ことを特徴とする請求項1に記載の方法。
  9. 遷移を含むサブブロックに先行するサブブロックの所定数のサンプルに適用された前記減衰係数に対して、前記減衰を抑制する減衰値を適用することによって、遷移を含むサブブロックに先行するサブブロックに関して、係数補正が実行される
    ことを特徴とする請求項1に記載の方法。
  10. 変換符号に基づいて生成されたデジタルオーディオ信号において、時間復号化から生じる基準信号及び前記符号器から送信される特定の補助情報が利用可能でない場合に、プリエコーを減衰させるための装置であって、
    前記装置が、このデジタルオーディオ信号の現在のフレームの処理のために、
    −少なくとも現在のフレームの再構成された信号に基づいて、連結された信号を定義するためのモジュール(101)と、
    −前記連結された信号を確定した長さのサンプルのサブブロックに分割するためのモジュール(102)と、
    −前記連結された信号の時間的なエンベロープを計算するためのモジュール(103)と、
    −前記時間的なエンベロープの高エネルギーゾーンへの遷移を検出するためのモジュール(104)と、
    −遷移が検出されたサブブロックに先行する低いエネルギーのサブブロックを判定するためのモジュール(104)と、
    −判定された前記サブブロックにおける減衰のためのモジュール(105)とを備える復号器と関連付けられ、
    前記装置は、前記減衰モジュールが判定された前記サブブロックの各々に関して前記連結された信号の前記時間的なエンベロープの関数として、そして、前のフレームの再構成された信号の時間的なエンベロープの関数として計算された減衰係数に従って前記減衰を遂行する
    ことを特徴とする装置。
  11. 請求項10に記載された装置を備える
    ことを特徴とするデジタルオーディオ信号の復号器。
  12. プロセッサによって実行されるときに請求項1から請求項9のいずれか一項に記載された方法のステップを実行するためのコード命令を含む
    ことを特徴とするコンピュータプログラム。
JP2011527373A 2008-09-17 2009-09-15 デジタルオーディオ信号におけるプリエコーの減衰 Active JP5295372B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0856248 2008-09-17
FR0856248 2008-09-17
PCT/FR2009/051724 WO2010031951A1 (fr) 2008-09-17 2009-09-15 Attenuation de pre-echos dans un signal audionumerique

Publications (2)

Publication Number Publication Date
JP2012503214A JP2012503214A (ja) 2012-02-02
JP5295372B2 true JP5295372B2 (ja) 2013-09-18

Family

ID=40174728

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011527373A Active JP5295372B2 (ja) 2008-09-17 2009-09-15 デジタルオーディオ信号におけるプリエコーの減衰

Country Status (8)

Country Link
US (1) US8676365B2 (ja)
EP (1) EP2347411B1 (ja)
JP (1) JP5295372B2 (ja)
KR (1) KR101655913B1 (ja)
CN (1) CN102160114B (ja)
ES (1) ES2400987T3 (ja)
RU (1) RU2481650C2 (ja)
WO (1) WO2010031951A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101414305B1 (ko) * 2009-10-20 2014-07-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 저 지연 애플리케이션들에서 사용하기 위한 오디오 신호 인코더, 오디오 신호 디코더, 오디오 콘텐츠의 인코딩된 표현을 제공하는 방법, 오디오 콘텐츠의 디코딩된 표현을 제공하는 방법 및 컴퓨터 프로그램
FR2992766A1 (fr) * 2012-06-29 2014-01-03 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique
FR3000328A1 (fr) * 2012-12-21 2014-06-27 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
FR3025923A1 (fr) * 2014-09-12 2016-03-18 Orange Discrimination et attenuation de pre-echos dans un signal audionumerique
US10354668B2 (en) * 2017-03-22 2019-07-16 Immersion Networks, Inc. System and method for processing audio data

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2674710B1 (fr) * 1991-03-27 1994-11-04 France Telecom Procede et systeme de traitement des preechos d'un signal audio-numerique code par transformee frequentielle.
DE19736669C1 (de) * 1997-08-22 1998-10-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals
BR0206446A (pt) * 2001-11-16 2003-12-30 Koninkl Philips Electronics Nv Método e arranjo para ajustar um sinal de dados suplementares a ser embutido em um sinal de informação, dispositivo para embutir um sinal de dados suplementares em um sinal de informação, sinal de informação tendo embutido no mesmo um sinal de dados suplementares, e, meio de armazenamento
JP4290917B2 (ja) * 2002-02-08 2009-07-08 株式会社エヌ・ティ・ティ・ドコモ 復号装置、符号化装置、復号方法、及び、符号化方法
CN1458646A (zh) * 2003-04-21 2003-11-26 北京阜国数字技术有限公司 一种滤波参数矢量量化和结合量化模型预测的音频编码方法
DE10324438A1 (de) * 2003-05-28 2004-12-16 Knorr-Bremse Systeme für Schienenfahrzeuge GmbH Bremsvorrichtung eines Schienenfahrzeugs
SE527670C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
RU2351024C2 (ru) * 2005-04-28 2009-03-27 Сименс Акциенгезелльшафт Способ и устройство для подавления шумов
US8612236B2 (en) * 2005-04-28 2013-12-17 Siemens Aktiengesellschaft Method and device for noise suppression in a decoded audio signal
DE102005019863A1 (de) * 2005-04-28 2006-11-02 Siemens Ag Verfahren und Vorrichtung zur Geräuschunterdrückung
WO2007028280A1 (fr) * 2005-09-08 2007-03-15 Beijing E-World Technology Co., Ltd. Codeur et decodeur pour commande de pre echo et son procede
FR2897733A1 (fr) 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
KR100880995B1 (ko) * 2007-01-25 2009-02-03 후지쯔 가부시끼가이샤 오디오 부호화 장치 및 오디오 부호화 방법

Also Published As

Publication number Publication date
EP2347411B1 (fr) 2012-12-05
KR20110076936A (ko) 2011-07-06
EP2347411A1 (fr) 2011-07-27
RU2481650C2 (ru) 2013-05-10
KR101655913B1 (ko) 2016-09-08
CN102160114A (zh) 2011-08-17
RU2011115003A (ru) 2012-10-27
US20110178617A1 (en) 2011-07-21
WO2010031951A1 (fr) 2010-03-25
US8676365B2 (en) 2014-03-18
ES2400987T3 (es) 2013-04-16
JP2012503214A (ja) 2012-02-02
CN102160114B (zh) 2012-08-29

Similar Documents

Publication Publication Date Title
KR101376762B1 (ko) 디코더 및 대응 디바이스에서 디지털 신호의 반향들의 안전한 구별과 감쇠를 위한 방법
JP6271531B2 (ja) デジタル音声信号における効果的なプレエコー減衰
JP4512574B2 (ja) 音声活動に基づくゲイン制限による音声強化についての方法、記録媒体、及び装置
JP3224130B2 (ja) 高品質オーディオ用符号器・復号器
KR102156846B1 (ko) 디지털 오디오 신호 내의 프리-에코의 효과적인 감쇠
JP2008519306A (ja) 信号の組のエンコード及びデコード
JP2004101720A (ja) 音響符号化装置及び音響符号化方法
JP7008756B2 (ja) デジタルオーディオ信号におけるプレエコーを識別し、減衰させる方法及び装置
JP5295372B2 (ja) デジタルオーディオ信号におけるプリエコーの減衰
CN106030704B (zh) 用于对音频信号进行编码/解码的方法和设备
JP2019133169A (ja) バーストフレーム誤り処理
KR20160050097A (ko) 오디오 신호의 부호화, 복호화 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130514

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130611

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5295372

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250