JP5255575B2 - レイヤード・コーデックのためのポストフィルタ - Google Patents

レイヤード・コーデックのためのポストフィルタ Download PDF

Info

Publication number
JP5255575B2
JP5255575B2 JP2009551966A JP2009551966A JP5255575B2 JP 5255575 B2 JP5255575 B2 JP 5255575B2 JP 2009551966 A JP2009551966 A JP 2009551966A JP 2009551966 A JP2009551966 A JP 2009551966A JP 5255575 B2 JP5255575 B2 JP 5255575B2
Authority
JP
Japan
Prior art keywords
signal
primary
decoded
enhancement
decoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009551966A
Other languages
English (en)
Other versions
JP2010520504A (ja
Inventor
ステファン ブルーン,
Original Assignee
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Publication of JP2010520504A publication Critical patent/JP2010520504A/ja
Application granted granted Critical
Publication of JP5255575B2 publication Critical patent/JP5255575B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Solid-Sorbent Or Filter-Aiding Compositions (AREA)

Description

本発明は、オーディオコーデックに関し、特に、符号化中に音声に挿入される符号化ノイズを低減することに関する。
一般に、オーディオ符号化(audio coding)、特に音声符号化(speech coding)は、符号化領域においてアナログ入力オーディオ信号又は音声信号をデジタル表現にマッピングし、再びアナログ出力オーディオ信号又は音声信号に戻す。デジタル表現は、オーディオ又は音声を表す値又はパラメータの量子化又は離散化に必要である。量子化又は離散化は、符号化ノイズにより本来の値又はパラメータを乱すと考えられる。オーディオ符号化又は音声符号化の技術は、所与のビットレートの復号化音声における符号化ノイズの影響が可能な限り小さくなるように符号化を行う。しかし、音声が符号化される際に与えられるビットレートによって、符号化ノイズが最も低減される理論上の限度が規定される。符号化ノイズを少なくとも可能な限り除去することが目的となる。
スケーラブル符号化(scalable coding)又はエンベデッド符号化(embedded coding)は、符号化が階層的に行われる符号化パラダイムである。基本レイヤ又はコアレイヤが低ビットレートで信号を符号化する一方、各々が互いに重なり合う追加のレイヤは、コアから先の各レイヤまでの全てのレイヤにより達成される符号化に対して多少の改善を提供する。各レイヤは、多少の追加のビットレートを加える。生成されたビットストリームは埋め込まれる。これは、下位レイヤの符号化のビットストリームが上位レイヤのビットストリームに埋め込まれることを意味する。この特性により、送信機又は受信機の任意の場所で上位レイヤに属するビットをドロップできる。そのような取り除かれたビットストリームは、ビットが保持されるレイヤまで依然として復号化可能である。
符号化ノイズに対する適切な考えは、その符号化ノイズが付加的なホワイトノイズ又はカラーノイズであると仮定することである。デコーダでオーディオ信号又は音声信号の復号化した後に、符号化ノイズをより低減するように修正し、その結果、オーディオ信号又は音声の品質を向上させるある種のエンハンスメント方法が存在する。そのような技術は、一般に「ポストフィルタリング」と呼ばれる。これは、実際のデコーダの後の後処理において、改善されたオーディオ信号又は音声信号が得られることを意味する。ポストフィルタによる音質の改善に関する文献は多く存在する。最も基本的な文献の一部は非特許文献1乃至4である。
本発明の説明は、ピッチポストフィルタ又は微細構造ポストフィルタに関する。それらの基本的な動作原理は、発声された音声の高調波間のスペクトルの谷に入り込む(符号化)ノイズの少なくとも一部を除去することである。これは、一般に、復号化音声信号を、その復号化音声信号をタイムシフトした信号に重み付き重ね合わせすることにより達成される。ここで、タイムシフトは音声のピッチラグ又はピッチ周期に対応する。後続の音声信号サンプルにタイムシフトされた信号が更に含まれるのが好ましい。
P. Kroon、B. Atal, "Quantization procedures for 4.8 kbps CELP coders", in Proc IEEE ICASSP, pp. 1650-1654, 1987. V. Ramamoorthy, N.S. Jayant, "Enhancement of ADPCM speech by adaptive postfiltering", AT&T Bell Labs Tech. J., pp. 1465-1475, 1984. V. Ramamoorthy, N.S., Jayant, R. Cox, M. Sondhi, "Enhancement of ADPCM speech coding with backward-adaptive algorithms for postfiltering and noise feed-back", IEEE J. on Selected Areas in Communications, vol. SAC-6, pp. 364-382, 1988. J. H. Chen, A. Gersho, "Adaptive postfiltering for quality enhancements of coded speech", IEEE Trans. Speech Audio Process., vol. 3, no. 1, 1995
後続の音声信号を評価するピッチポストフィルタの1つの問題は、後続の1ピッチ周期の復号化オーディオ信号又は音声信号へのアクセスを必要とすることである。一般に、この後続の信号をポストフィルタにより利用可能にすることは、復号化オーディオ信号又は音声信号をバッファリングすることにより可能である。しかし、オーディオコーデック又は音声コーデックの従来の応用例において、これはコーデックのアルゴリズム的な遅延が増加するものであり、通信品質及び特に対話性に影響を与えるため、望ましくない。
本発明の目的は、スケーラブルなデコーダ装置によりオーディオ又は音声の品質を向上することである。本発明の更なる目的は、オーディオ信号又は音声信号の遅延増加の原因とならないスケーラブルなデコーダ装置用の効果的なポストフィルタの構成を提供することである。
上記目的は、添付の請求の範囲に係る装置及び方法により達成される。第1の側面によれば、オーディオ又は音声を表す信号のためのデコーダ装置、好ましくはスケーラブルデコーダ装置は、符号化信号のパラメータを入力する入力部と、入力部に接続される1次デコーダとを含む。1次デコーダは、パラメータに基づいて1次復号化信号を出力する。1次ポストフィルタは、1次デコーダの出力部に接続され、1次ポストフィルタ信号を出力する。2次デコーダは、入力部に接続され、パラメータに基づいて2次復号化信号を出力する。スケーラブル復号化装置は、1次ポストフィルタ信号と2次復号化信号に基づく信号とを合成して出力信号を得る合成器を更に含む。合成は、1次ポストフィルタ信号と2次復号化信号に基づく信号との重み付け合成である。スケーラブル復号化装置は、合成器に接続され、出力信号を出力する出力部を更に有する。
第2の側面によれば、オーディオ又は音声を表す符号化信号を復号化する方法は、符号化信号のパラメータを受信するステップと、パラメータを1次復号化して1次復号化信号を得るステップとを含む。1次復号化信号は1次ポストフィルタリングされて1次ポストフィルタ信号が得られる。また、パラメータは2次復号化されて2次復号化信号が得られる。方法は、1次ポストフィルタオーディオ信号と2次復号化信号に基づく信号とを合成して出力信号を得るステップを更に有する。出力信号は、1次ポストフィルタ信号と2次復号化信号に基づく信号との重み付け合成によって得られる。その後、出力信号が出力される。
本発明によれば、遅延を増加させることなく、スケーラブル音声及びオーディオコーデックの再構成信号の品質を向上させることができる。
ポストフィルタを有するオーディオコーデック又は音声コーデックの基本構造を示す図である。 一般的なスケーラブルオーディオコーデック又は音声コーデックシステムを示すブロック図である。 上位レイヤが非音声オーディオ信号の符号化をサポートする別のスケーラブルオーディオコーデックシステムを示すブロック図である。 本発明に係る方法の一実施形態の手順を示すフローチャートである。 本発明に係るデコーダ装置の一実施形態を示すブロック図である。 本発明に係るスケーラブルデコーダ装置の一実施形態を示すブロック図である。 本発明に係るスケーラブルデコーダ装置の別の実施形態を示すブロック図である。 本発明に係る方法の別の実施形態の手順を示すフローチャートである。 本発明に係るスケーラブルデコーダ装置の別の実施形態を示すブロック図である。 図7に係る方法の特定の実施形態の部分的な手順を示すフローチャートである。 本発明に係るスケーラブルデコーダ装置の別の実施形態を示すブロック図である。 本発明に係るスケーラブルデコーダ装置の別の実施形態を示すブロック図である。 本発明に係る方法の更に別の実施形態の手順を示すフローチャートである。 本発明に係るスケーラブルデコーダ装置の別の実施形態を示すブロック図である。
本開示において、各図面及び実施形態における同等の又は直接対応する機能は同一の符号で示される。
詳細な説明の十分な理解を提供するため、いくつかの用語については混乱を避けるために、明示的に定義をしておく必要があろう。本開示において、用語「パラメータ」は一般名称として使用され、ビット又はビットストリームを含む任意の種類の信号の表現を表す。
2次デコーダに関係する種々の手段及び信号は以下のように規定される。「2次デコーダ(secondary decoder)」は、種々の2次復号化構成の一般的な表現である。これは、例えば2次エンハンスメントデコーダ又は2次再構成デコーダを含む。「2次エンハンスメントデコーダ(secondary enhancement decoder)」は、スケーラブル符号化に関係し、2次デコーダの部分集合である。そのような「2次エンハンスメントデコーダ」は、1次復号化信号等に加えられるある種の改善信号を提供する。「2次再構成デコーダ(secondary reconstruction decoder)」は、再構成信号空間の出力、すなわち再構成音声信号又はオーディオ信号を出力する2次デコーダを意味する。これは、2次デコーダがそのような出力を生成するか、あるいはスケーラブルコーデックの場合には出力が1次デコーダ出力及び2次エンハンスメントデコーダの出力に基づいて導出されることを意味してもよい。そのような2次デコーダから出力される信号は同様に示される。
本発明により達成される利点を理解するために、詳細な説明は、一般的なポストフィルタリングの簡単な説明から始める。図1は、ポストフィルタを含むオーディオ又は音声コーデックの基本構造を示す。送信機1は、入力オーディオ又は音声信号3をパラメータ4のストリームに符号化するエンコーダ10を含む。一般に、パラメータ4は符号化され、受信機2に転送される。受信機2はデコーダ20を含み、デコーダ20は、元のオーディオ又は音声信号3を表すパラメータ4を受信し、それらのパラメータ4を復号化オーディオ又は音声信号5に復号化する。復号化オーディオ又は音声信号5は、可能な限り元のオーディオ又は音声信号3と類似することが意図される。しかし、復号化オーディオ又は音声信号5は多少の符号化ノイズを常に含む。受信機2はポストフィルタ30を更に含み、ポストフィルタ30は、復号化オーディオ又は音声信号5をデコーダ20から受信し、ポストフィルタリング手順を実行し、そしてポストフィルタ復号化オーディオ又は音声信号6を出力する。
ポストフィルタの基本概念は、符号化ノイズがより低減されるように符号化ノイズのスペクトル形状を形成することであり、これは実質的に人間の聴知覚特性を活用する。一般にこれは、音声信号が相対的に高い電力(スペクトルピーク)を有する知覚感度の低い周波数領域にノイズが移動し、音声信号が低い電力(スペクトル谷)を有する領域からノイズが除去されるように行われる。2つの基本的なポストフィルタ手法として、フォルマントポストフィルタ、ピッチポストフィルタ、微細構造ポストフィルタとも呼ばれる短期ポストフィルタ及び長期ポストフィルタがある。適切な性能を得るために、適応ポストフィルタがよく使用される。
上述のように、ピッチポストフィルタ又は微細構造ポストフィルタは本発明で有用である。復号化音声信号のタイムシフトされた信号への復号化音声信号の重ね合わせの結果、特に音声高調波間において所望の音声信号に対して相関性のない符号化ノイズが減衰する。上述の効果は、非再帰型フィルタ構造及び再帰型フィルタ構造の双方により得られる。非特許文献4で説明される1つのそのような一般的な形式は以下の式で与えられる。
Figure 0005255575
ただし、Tは音声のピッチ周期に対応する。
実際には、非再帰型フィルタ構造が好ましい。最近の1つの非再帰型ピッチポストフィルタ方法は、米国特許出願公開第2005/0165603号において説明される。これは、3GPP(第3世代パートナーシッププロジェクト)のAMR-WB+(拡張適応マルチレート広帯域コーデック)[3GPP TS 26.290]及び、3GPP2のVMR-WB(可変レートマルチモード広帯域(VMR-WB)コーデック)[3GPP2 C.S0052-A: "Source-Controlled Variable-Rate Multimode Wideband Speech Codec (VMR-WB), Service Options 62 and 63 for Spread Spectrum Systems"]オーディオ及び音声符号化規格において適用される。ここで、基本概念は、第1に以下の関係により符号化ノイズ推定値r(n)を計算することである。
r(n) = y(n) - yp(n)
ただし、y(n)は復号化オーディオ又は音声信号、ypは以下のように計算される予測信号である。
yp = 0.5・(y(n-T)) + y(n+T))
第2に、ノイズ推定値をローパス(又はバンドパス)フィルタリングし、係数αで重み付けした値を音声信号から減算し、その結果、エンハンスメントオーディオ又は音声信号を得る。
yenh(n) = y(n) - α・LP{r(n)}
符号が反転した場合のローパスフィルタリングされたノイズ信号の適切な解釈は、その信号を符号化ノイズの低周波数部分を補償するエンハンスメント信号として見ることである。係数αは、予測信号及び復号化音声信号の相関性、予測信号のエネルギ、並びに音声信号及び予測信号の差のエネルギのある時間平均に応じて適応化される。
上述のように、上記定義式 yp = 0.5・(y(n-T)) + y(n+T)) を評価する従来技術のピッチポストフィルタの1つの問題は、それらのポストフィルタが後続の1ピッチ周期の復号化音声信号y(n+T)が必要となり、その結果、アルゴリズム的な遅延が増加することである。AMR-WB+及びVMR-WBでは、利用可能な復号化オーディオ又は音声信号に基づいて、復号化オーディオ又は音声信号を後方に延ばすことにより、また、そのオーディオ又は音声信号はピッチ周期Tで周期的に延びていくと仮定することにより、その問題を解決している。復号化オーディオ又は音声信号が時間インデックスn+までのみ利用可能であるという仮定の下、後続のピッチ周期は以下の式に従って計算される。
Figure 0005255575
この拡張は、単なる近似であるため、本来の後続の復号化音声信号を使用した場合に得られる品質と比較すると、品質に関しては妥協したものとなる。
本発明は、スケーラブル・オーディオ又は音声コーデック装置を考慮し、本発明の基本概念と共に使用できるいくつかのシステムを以下に簡単に説明する。図2は、一般的なスケーラブル・オーディオ又は音声コーデックシステムを示すブロック図である。ここでは、送信機1は、入力オーディオ又は音声信号3をパラメータ4のストリームに符号化するエンコーダ10を含む。符号化全体は、2つのレイヤ、送信機における1次エンコーダ11を含む下位レイヤ7及び送信機における2次エンコーダ15を含む少なくとも1つの上位レイヤ8において行われる。スケーラブルコーデック装置は追加のレイヤを有してもよいが、ここでは2レイヤのデコーダシステムがモデルシステムとして使用される。しかし、本発明の原理は、3つ以上のレイヤを含むスケーラブルコーデックにも適用可能である。
1次エンコーダ11は、入力オーディオ又は音声信号3を受信し、それを1次パラメータ12のストリームに符号化する。更に1次エンコーダは、1次パラメータ12を推定1次信号13に復号化する。推定1次信号13は、デコーダ側で1次パラメータ12から取得される信号に対応するのが理想的である。推定1次信号13は、比較器14、この場合は減算器、において、元の入力オーディオ又は音声信号3と比較される。従って、差信号が、1次エンコーダ11の1次符号化ノイズ信号16である。1次符号化ノイズ信号16は2次エンコーダに供給され、2次エンコーダはその信号を2次パラメータ17のストリームに符号化する。それらの2次パラメータ17は、1次パラメータ12から復号化可能な信号の好適なエンハンスメントパラメータとして考えられる。それと共に、1次パラメータ12及び2次パラメータ17は、入力オーディオ又は音声信号3のパラメータ4の一般的なストリームを形成する。
一般に、パラメータ4は符号化されて受信機2に転送される。受信機2はデコーダ20を含み、デコーダ20は、元のオーディオ又は音声信号3を表すパラメータ4を受信し、それらのパラメータ4を復号化オーディオ又は音声信号5に復号化する。復号化全体は、2つのレイヤ、すなわち下位レイヤ7及び上位レイヤ8において行われる。受信機において、下位レイヤ7は1次デコーダ21を含む。同様に、上位レイヤ8は受信機において2次デコーダ25を含む。1次デコーダ21は、パラメータ4のストリームの入力1次パラメータ22を受信する。それらのパラメータはエンコーダ10において作成されるパラメータと同一であるのが理想的であるが、送信ノイズはパラメータを歪ませている場合がある。1次デコーダ21は、入力1次パラメータ22を復号化1次オーディオ又は音声信号23に復号化する。2次デコーダ25は、同様に、パラメータ4のストリームの入力2次パラメータ27を受信する。それらのパラメータはエンコーダ10において作成されるパラメータと同一であるのが理想的であるが、この場合も送信ノイズによってパラメータが歪んでいる場合がある。2次デコーダ21は、入力2次パラメータ22を復号化エンハンスメントオーディオ又は音声信号26に復号化する。この復号化エンハンスメントオーディオ又は音声信号26は、可能な限り正確に1次エンコーダ11の符号化ノイズに対応し、それにより1次デコーダ21から得られる符号化ノイズと類似することが意図される。復号化1次オーディオ又は音声信号23及び復号化エンハンスメントオーディオ又は音声信号26は、加算器24で加算され、最終的な出力信号5が出力される。
1次パラメータ22のみが受信機2で受信される場合、受信機2が1次復号化のみをサポートする場合、あるいは、何らかの理由により2次復号化を実行しないと決定した場合は、得られる復号化エンハンスメントオーディオ又は音声信号26はゼロとなり、出力信号5は復号化1次オーディオ又は音声信号23と同一になる。これが、スケーラブルコーデックシステムの概念のフレキシビリティである。従来技術によれば、一般に、ポストフィルタリングは出力信号5に対して実行される。
今日、最も使用されるスケーラブル音声圧縮アルゴリズムは、1998年11月のITU−T勧告G.711「音声周波数のパルス符号変調(PCM)(Pulse code modulation (PCM) of voice frequencies)」による64kbpsのA/U-law対数PCMコーデックである。8kHzサンプリングのG.711コーデックは、12ビット又は13ビットリニアPCM(パルス符号変調)サンプルを8ビット対数サンプルに変換する。対数サンプルのビット表現は、G.711ビットストリームの最下位ビット(LSB)スチールを可能にし、G.711コーデックは実際には48、56及び64kbpsの間でSNR(信号対雑音比)スケーラブルとなる。このG.711コーデックのスケーラビリティは、帯域内制御信号の目的で回線交換通信網において使用される。このG.711のスケーラビリティの使用の最近の例は、従来の64kbpsのPCMリンクを介する広帯域音声の設定及び転送を可能にする3GPP−TFOプロトコル(3GPPのTS28.062によると、TFO=Tandem Free Operation)である。元の64kbpsのG.711ストリームのうちの8kbpsは、狭帯域サービス品質にそれ程影響を及ぼさずに広帯域音声サービスの呼設定を可能にするためにまず使用される。呼設定の後、広帯域音声は、64kbpsのG.711ストリームのうち16kbpsを使用する。オープンループ・スケーラビリティをサポートする他の従来の音声符号化規格としては、1990年12月のITU−T勧告G.727「5-, 4-, 3-, and 2-bit/sample embedded adaptive differential pulse code modulation (ADPCM)」や、G.722(サブバンドADPCM)がある。
スケーラブル音声符号化技術における更に最近の進歩は、MPEG−4(MPEG=Moving Picture Experts Group)CELPにスケーラビリティを提供するMPEG−4規格(ISO/IEC−14496)である。MPE基本レイヤは、追加のフィルタパラメータ情報又は追加の新しいパラメータ情報の送信により拡張されうる。国際電気通信連合の標準化部門であるITU−Tは、近年、G.729.EVと呼ばれるITU−T勧告G.729.1「G.729 based Embedded Variable bit-rate coder: An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729」(2006年5月)に係る新たなスケーラブルコーデックの標準化を終了した。このスケーラブル音声コーデックのビットレートの範囲は、8kbps〜32kbpsである。このコーデックの主な使用例は、いくつかのVoIP(Voice over IP(インターネットプロトコル))呼び出しの間の共有xDSL64/128kbps(DSL=デジタル加入者回線、xDSL=種々の特定のDSL方法の一般的名称)アップリンク等のホーム又はオフィスゲートウェイにおける制限のある帯域幅リソースの効率的な共有を可能にすることである。
スケーラブル音声符号化の最近の1つの傾向は、音楽等の非音声オーディオ信号の符号化のサポートを上位レイヤで提供することである。1つのそのような方法を図3に示す。そのようなコーデックにおいて、下位レイヤ7は、例えばCELP(符号励振線形予測)が周知の例である合成による分析(AbS)パラダイムによる従来の音声符号化を採用する。本実施形態において、1次エンコーダ11はCELPエンコーダ18であり、1次デコーダ21はCELPデコーダ28である。そのような符号化は音声にのみよく適しており、音楽等の非音声オーディオ信号にはあまり適さないため、上位レイヤ8はオーディオコーデックにおいて使用される符号化パラダイムに従って動作する。従って、本実施形態において、2次エンコーダはオーディオエンコーダ19であり、2次デコーダはオーディオデコーダ29である。本実施形態において、一般に上位レイヤ8の符号化は下位レイヤの符号化の符号化誤差に対して動作する。
次に、本発明の中心部分を説明する。本発明は、上述のスケーラブル音声又はオーディオコーデックに対する構造的な類似点を有するコーデックに関する。1次復号化及び2次復号化が利用され、結果として得られる信号が合成される。現在、一般的な実現例はスケーラブル音声又はオーディオコーデックであると考えられており、この実現例において、コーデックは1次下位レイヤ符号化を実行し、2次上位レイヤコーデックが使用される。この概念は、一般に1次コーデックが2次コーデックよりアルゴリズム的に短い遅延を有するということを更に使用する。一般にこれは、例えば1次コーデックが時間領域音声コーデックであり、2次コーデックが例えば周波数領域オーディオコーデックである場合である。2つの符号化原理は互いに異なり、従って異なる種類の符号化ノイズを発生する。ポストフィルタリングが復号化1次オーディオ又は音声信号から構成される場合、信号を強調するために2つの異なる信号が利用可能である。概念は、2つの成分強調信号の合成として、1次符号化ノイズを補償する最終的なエンハンスメント信号を構成する。第1の成分は、下位レイヤ1次復号化信号から得られ、ポストフィルタリングにより強調され、第2の成分は、上位レイヤ2次復号化信号から得られる。特定の一実施形態において、ポストフィルタリングはピッチポストフィルタに関係する。
図4は、本発明に係る方法の一実施形態の手順を示すフローチャートである。オーディオを表す符号化信号を復号化する方法はステップ200で開始する。ステップ210において、符号化信号のパラメータが受信される。1次復号化信号へのパラメータの1次復号化は、ステップ220において実行される。ステップ222において、1次復号化信号は1次ポストフィルタリングされて1次ポストフィルタ信号が出力される。同時に、符号化信号のパラメータは、ステップ230において2次復号化されて2次復号化信号が出力される。本実施形態において、ステップ230は2つのサブステップを含む。ステップ231において、符号化信号のパラメータは、2次復号化エンハンスメント信号に復号化された2次エンハンスメントである。ステップ232において、2次復号化再構成信号は、2次復号化エンハンスメント信号及び1次復号化信号に基づいて出力される。一般にこれは、必要に応じて2次復号化エンハンスメント信号を得るためのアルゴリズム的な遅延に等しい量だけ遅延される1次復号化信号に2次復号化エンハンスメント信号を加算することにより行われる。なお、一般に2次エンハンスメント信号は重み付き音声領域において符号化され、符号化の知覚特性を向上させる。実質的に、重み付き領域における符号化により、符号化ノイズのスペクトルは、そのような重み付けを行わない場合と比較して低減されるように形成される。従って、好ましくは、1次信号は2次復号化エンハンスメント信号の加算前に重み演算子Wを使用して重み付き音声領域に変換される必要がある。加算後、和信号は演算子W-1を使用して逆重み付けされ、重み付けされていない2次復号化再構成信号を生成する。1次ポストフィルタリングのステップは、2次復号化及び1次復号化による遅延差を利用するのが好ましい。ステップ240において、1次ポストフィルタ信号及び2次復号化信号に基づく信号が出力信号に合成される。本実施形態において、2次復号化信号に基づく信号は、2次復号化信号をフィルタリングした信号である。合成は、1次ポストフィルタ信号及び2次復号化エンハンスメント信号に基づく信号からの寄与が重み付けられるように実行される。重み付けは適応可能であることが好ましい。合成ステップは、信号特性を検出し、それにより信号重みが検出された特性に応じて適応されることを含むとよい。そのような信号特性の例については以下で説明する。ステップ248で、出力信号が出力される。ステップ249において、処理は終了する。
一般に、1次復号化信号が2次復号化信号より少ない遅延を有するため、下位レイヤ及び上位レイヤの双方に対するデコーダは、デコーダの加算ポイントにおいて双方の信号を適切に合成するために遅延差を補償する必要がある。これは、単純にその遅延差を使用して1次復号化信号を遅延させるか又はバッファリングすることにより行われる。本発明によると、高品質ポストフィルタリングに対してその利用可能な余分な遅延を利用することは有用である。そのような利用により、追加の情報がポストフィルタリングにおいて利用されることを可能にする。レイヤ遅延補償バッファにおいて、更なる将来の1次復号化信号はより大きな時間インデックスn+まで利用可能である。ここでは1次復号化信号の対応する追加の時間延長が回避されるため、その信号に対するポストフィルタは符号化ノイズを除去する際に明らかにより適切なジョブを行える。
本発明の別の側面は、2次コーデックが1次コーデックの実際の符号化誤差に対して動作することである。従って、2次コーデックは、そのビットレート及び性能に依存して、1次コーデックによって生じる符号化ノイズを少なくともある程度補償する。換言すると、1次復号化オーディオ信号を向上することを目的とする利用可能なエンハンスメント信号は2つ存在する。種々の状況において、エンハンスメント信号の一方又は他方がより適切である。本発明は、それを利用し、種々のエンハンスメント信号及び1次復号化オーディオ信号を最終的な出力信号に合成する。使用される種々のエンハンスメント信号の相対的な量を実際に受信された信号の特性に依存させることにより、適切な混合が提供される。ある状況においては、2次デコーダエンハンスメントのみが使用され、他の状況においては、ポストフィルタ1次復号化信号のみが使用され、更に他の状況においては、それらの間の混合が存在する。
図5は、本発明に係るデコーダ装置50の一実施形態を示すブロック図である。オーディオ又は音声を表す信号に対するデコーダ装置50は、符号化信号のパラメータ4の入力部40を含む。1次デコーダ21は、入力部40に接続される。1次デコーダ21は、パラメータ4に基づいて1次復号化信号23を提供するように構成される。1次ポストフィルタ31は、1次デコーダ21の出力に接続され、1次復号化信号23を受信する。1次ポストフィルタ31は、本実施形態においては高遅延ポストフィルタ33であり、2次デコーダ25及び1次デコーダ21による遅延差を利用し、ポストフィルタリングの目的で「将来」の情報を利用することを可能にする。これにより、1次ポストフィルタ31は1次ポストフィルタ信号32を出力する。
上述のように、デコーダ装置50は、入力部40に接続される2次デコーダ25を含む。2次デコーダ25は、パラメータ4に基づいて2次復号化信号44を出力するように構成される。本実施形態において、2次復号化信号は2次復号化再構成信号でもある。
デコーダ装置50は、1次ポストフィルタ信号32と2次復号化信号44に基づく信号53とを合成し、出力部60を介して出力される出力信号6を得る合成器55を更に含む。本実施形態において、2次復号化信号44に基づく信号53は、2次復号化信号44自体である。合成器55は、1次ポストフィルタ信号32及び2次復号化信号44からの寄与のために重みβ及び(1-β)をそれぞれ有する1次ポストフィルタ信号32及び2次復号化信号44を加算する適応加算器56を含む。
本実施形態は、単一の係数βを使用してその合成を行い、β×1次ポストフィルタ信号+(1-β)×2次復号化信号、として合計デコーダ出力を構成する単純な方法を示す。このように、合計再構成信号の電力が重み付け係数の影響を受けないことが保証される。本実施形態において、重み付けは、係数βの大きさを制御する適応制御51により制御される。係数βは、適応制御51により制御され、βの値は0≦β≦1であると仮定する。合成器55は、信号特性を検出する手段54を含む。本実施形態において、信号特性は、パラメータ4を含むビットストリームの特性である。適応制御51は、検出された信号特性に応じて係数βの値を選択する。それにより、適応加算器56は、検出された特性に基づいて重み、すなわち係数βを適応化し、2つのエンハンスメント信号間の適切な混合を提供できる。そのような信号特性は、例えば受信したビットストリームのビットレート及び損失/破損したビット又はフレームの指示であってもよい。特に、受信したビットストリームが2次エンコーダビットを少しでも含むかに依存して適応化が行われる。
更に、符号化信号の特性又は信号を適切に符号化するコーデックの能力に応じた適応化が考えられる。
図6は、本発明に係るデコーダ装置50の別の実施形態を示すブロック図である。本実施形態は、オーディオ又は音声を表す信号のためのスケーラブルデコーダ装置である。ここでは、1次デコーダ21は、パラメータ4に基づいて及び特に下位レイヤパラメータ22に基づいて1次復号化信号23を提供するように構成される。本実施形態において、これはコアデコーダ41により実行される。特定の実施形態において、コアデコーダ41は、実際にはスケーラブルであり2つのレイヤを有する。第1のレイヤは8kbpsのレートで動作し、第2のレイヤまでの符号化は12kbpsのレートを提供する。
2次デコーダ25は、パラメータ4又は特にその上位レイヤパラメータ27に基づいて2次復号化信号44を提供するように構成される。本実施形態において、2次デコーダ25は、2次再構成デコーダ125である。2次再構成デコーダ125は2次エンハンスメントデコーダ45を含み、2次エンハンスメントデコーダ45は上位レイヤパラメータに基づいて2次復号化エンハンスメント信号52を提供するように構成される。本実施形態において、2次エンハンスメントデコーダ45はレイヤード2次デコーダ47を含む。レイヤード2次デコーダは、16kbpsの合計レートを与える1つのレイヤ、24kbpsを与える別のレイヤ及び32kbpsを与える更に別のレイヤを有する。この特定の実施形態における2次エンハンスメントデコーダ45は、IMDCT46(逆修正離散コサイン変換)を更に含む。本実施形態において、2次デコーダ25は、1次デコーダ21の出力に更に接続され、1次復号化信号23にアクセスできる。1次復号化信号23は、2次エンハンスメント信号が加算される重み付き音声領域に変換されるために、重み付きフィルタ42を通過するのが好ましい。上述のように、本実施形態の2次エンハンスメントデコーダ45は、1フレームの余分な遅延を有する2次エンハンスメント信号を復号化する。この余分な遅延は、実際の2次デコーダ合成により発生する可能性がある。しかし、余分な遅延は、復号化中ではなく符号化中のより大きな遅延によっても発生する可能性がある。従って、1次復号化信号23はバッファ43において1フレーム分遅延する。2次復号化エンハンスメント信号52及び遅延する1次復号化信号は加算器48で合計される。この合計された信号は逆フィルタ49を通過し、2次復号化再構成信号144の形式で2次復号化信号を提供する。換言すると、本実施形態において、2次デコーダ25はパラメータ4及び1次復号化信号23に基づいて2次復号化信号を提供するように構成される。
なお、2次エンハンスメントデコーダ45が復号化エンハンスメント信号を提供できない場合、2次復号化再構成信号144は遅延する1次復号化信号と同一になる。別の実施形態において、2次復号化再構成信号144はヌル信号に設定され、合成器により抑制される。
スケーラブルデコーダ装置50は、図5と類似する合成器55を更に含む。ここでも、合成器55は信号特性を検出する手段54を含む。上述のように、本実施形態においては、受信したビットストリームが、1次復号化信号とは異なる2次復号化信号を再生する2次エンコーダビットを少しでも含むかどうかに依存して、適応化が行われる。これによって、合成は、着目する低周波帯域における1次復号化信号と前記2次復号化信号との間の類似性に基づいて行われる。
一般に、2次デコーダはある程度の符号化ノイズを残す。図7は、その事実に対処するスケーラブルデコーダ装置50の一実施形態を示すブロック図である。2次符号化ノイズは2次ポストフィルタ34により低減されるが、2次ポストフィルタ34は完全なコーデックの符号化遅延を増加しないように復号化信号の時間延長を適用する必要がある。2次ポストフィルタ34は、2次再構成デコーダ25の出力に接続され、2次復号化信号44、本実施形態においては2次復号化再構成信号144を受信する。上述のように、本実施形態において、2次ポストフィルタ34は低遅延ポストフィルタ36である。それにより、2次ポストフィルタ34は2次ポストフィルタ信号35を提供する。この2次ポストフィルタ信号35は、合成器55において2次復号化信号44に基づく信号53として利用される。
図8は、同様のデコーダ構成により使用される方法の一実施形態を示すフローチャートである。図4において提供されるステップに加え、追加のステップ234が追加される。ステップ234において、2次復号化信号は2次ポストフィルタ信号に2次ポストフィルタリングされる。それにより、2次ポストフィルタ信号は2次復号化エンハンスメント信号に基づく信号として使用される。
ここで、1次復号化信号に提供される高遅延高品質ポストフィルタは、符号化ノイズを補償するための適切な能力を有することが当業者には理解されよう。同時に、好ましくは低遅延ポストフィルタと組み合わされる2次コーデックもまた、基本的に1次エンコーダの符号化ノイズを補償する。従って、双方の要素の符号化ノイズ補償能力は競合し、高品質ポストフィルタを有する1次デコーダの出力又は低遅延ポストフィルタを有する2次デコーダの出力のうちのどちらがより適切な合計デコーダ出力信号を提供するかは明らかではない。
2次エンコーダの性能が低い場合、一般に、高品質ポストフィルタによる1次復号化信号の出力が好ましい。これは、例えばビットレートが低いか又は2次復号化信号が全く入手可能でない場合である。2次コーデックがほぼ全ての符号化ノイズを補償できる場合、低遅延ポストフィルタによる2次復号化信号の出力が好ましい。これは、一般に2次コーデックの性能及びビットレートが高い場合である。概念は、双方の信号の線形結合としてデコーダの合計出力を構成し、この線形結合における重み付け係数を適応化させることである。
本発明の1つの更なる側面は、特に、使用されるピッチポストフィルタ及びスケーリング係数αに関する。スケーリング係数αは、復号化音声信号から減算される前に符号化ノイズ推定値をスケーリングする。高品質1次ポストフィルタがより正確に符号化ノイズを推定するため、より正確でない符号化ノイズ推定を実行する2次ポストフィルタより強いスケーリング係数αを使用するのが適切である。
本発明に係るスケーラブルデコーダ装置50の別の実施形態を図9に示す。ここで、合計デコーダ出力信号に対する合成エンハンスメント信号65は、1次ポストフィルタエンハンスメント信号64及び本実施形態においては2次ポストフィルタエンハンスメント信号63である2次エンハンスメント信号69に基づくエンハンスメント信号に基づいて計算される。合成器55は、1次ポストフィルタエンハンスメント信号64を抽出する手段を有する。その目的のために、1次復号化信号23は、1次ポストフィルタ31のアルゴリズム的な遅延に対応する時間だけバッファ57において遅延される。1次ポストフィルタエンハンスメント信号64は、減算器58において遅延した1次復号化信号を高品質1次ポストフィルタ信号32から減算することにより取得される。
同様に、2次ポストフィルタエンハンスメント信号63が取得される。すなわち、合成器55は2次ポストフィルタエンハンスメント信号63を抽出する手段を更に含む。これは、2次復号化信号44を低遅延2次ポストフィルタ信号35から減算することにより減算器59において実行される。上記実施形態のように、これらの2つのポストフィルタエンハンスメント信号63、64は、好ましくは単一の制御係数βを使用して線形結合される。結果として得られる合計合成エンハンスメント信号65が作成される。
合成エンハンスメント信号65は、フィルタ61においてローパス(又はバンドパス)フィルタリングされてローパスフィルタ合成エンハンスメント信号66とされるのが好ましい。合成エンハンスメント信号65又はローパスフィルタ合成エンハンスメント信号66等の合成エンハンスメント信号65に基づく任意の信号は、加算器62において1次復号化信号に基づく信号に加算され、出力信号6を提供する。本実施形態において、1次復号化信号に基づく信号は2次復号化再構成信号144である。その結果、最終的には、エンハンスメント合計デコーダ出力信号6が得られる。先の実施形態と比較して本実施形態の利点は、2つのポストフィルタにおける可能なローパス(又はバンドパス)フィルタリングが回避されることであり、それにより数値的な複雑さ及び数値的な精度が低減される。
本実施形態において、1次ポストフィルタ信号及び2次ポストフィルタ信号の線形結合係数βは、考慮されるポストフィルタの関連する低周波数帯域における1次復号化信号及び2次復号化信号の類似性に基づいて適応される。本実施形態において、受信信号の特性を検出する手段54は、遅延する1次復号化信号68及び2次復号化信号44の特性を検出するように構成される。これらの信号が非常に類似する場合、係数βは大きな値(1に近い値)をとり、1次高品質ポストフィルタエンハンスメント信号の出力が好ましいことを意味する。考慮されるローバンドの1次復号化信号及び2次復号化信号の類似性が、そのバンドにおける2次コーデックの効果は小さく、高品質ポストフィルタの符号化ノイズ除去効果が好ましいことを意味するため、これは適切な適応である。
図10は、本発明に係る方法の一実施形態の対応する合成ステップの部分的なステップを示すフローチャートである。この合成ステップ240は、第2の復号化信号及びその信号のポストフィルタリングが使用可能である場合に使用されることを意図する。合成ステップ240は、ステップ241において1次ポストフィルタエンハンスメント信号を抽出することを含む。ステップ242において、本実施形態においては2次ポストフィルタエンハンスメント信号である2次復号化信号に基づくエンハンスメント信号が抽出される。ステップ243において、1次ポストフィルタエンハンスメント信号及び2次復号化信号に基づくエンハンスメント信号は合成エンハンスメント信号に合成される。上記実施形態と同様に、合成は寄与する信号の重み付けにより行われる。ステップ244において、合成エンハンスメント信号は合成エンハンスメント信号に基づく信号にローパスフィルタリングされる。あるいは、合成エンハンスメント信号は帯域フィルタリングされるか又はステップが省略される。最後にステップ245において、前記合成エンハンスメント信号に基づく信号、すなわち本実施形態においてはローパスフィルタ合成エンハンスメント信号は、1次復号化信号に基づく信号に加算され、出力信号を提供する。本実施形態において、1次復号化信号に基づく信号は2次復号化信号である。
本発明に係るスケーラブルデコーダ装置50の別の実施形態を図11に示す。これは、図9の実施形態にある程度類似しており、ここでは相違点のみを説明する。本実施形態において、前記2次復号化エンハンスメント信号69に基づく信号、すなわち合計2次エンハンスメント信号67は、2次ポストフィルタ信号と1次復号化信号を遅延した信号68との差として抽出される。この合計2次エンハンスメント信号67は、2次ポストフィルタ及び2次デコーダからの合成エンハンスメントを表す。本実施形態において、合成エンハンスメント信号65は、信号66にローパスフィルタリングされた後に1次復号化信号23を遅延した信号68に加算される。1次復号化信号の遅延は、その信号が1次ポストフィルタエンハンスメント信号64及び2次ポストフィルタエンハンスメント信号67の抽出に関わるため既に利用可能である。
これまでの種々の実施形態において、完全に復号化された2次信号は手順のあるステップにおいて提供される。しかし、直接組み合わせて2次復号化エンハンスメント信号52を使用することも可能である。本発明に係るスケーラブルデコーダ装置50のそのような一実施形態を図12に示す。ここでは、2次復号化エンハンスメント信号69に基づくエンハンスメント信号は2次復号化エンハンスメント信号52自体である。完全な2次復号化再構成信号が利用可能でないため、本実施形態において、1次復号化信号に基づく信号は前記1次復号化信号23を遅延した信号68である。
図13は、対応するフローチャートを示す。先のフローチャートと比較すると、複数のステップが省略される。2次再構成復号化は実行されず、2次ポストフィルタリングも実行されない。2次復号化エンハンスメント信号のみが利用可能であるため、適切な2次ポストフィルタエンハンスメント信号を抽出するステップも省略される。
図12に対する別の実施形態を図14に示す。ここでは、2次ポストフィルタ34は、2次エンハンスメントデコーダ45の出力に直接接続される。それにより、2次復号化エンハンスメント信号69に基づくエンハンスメント信号は2次ポストフィルタ34からの出力信号である。対応する方法は、2次ポストフィルタリングステップが追加された状態の図13に従う。
上述の実施形態は、本発明のいくつかの例として理解されよう。本発明の範囲から逸脱することなく、実施形態に対する種々の変形、組み合わせ、変更が行われうることは、当業者には理解されるだろう。特に、技術的に可能であれば、種々の実施形態における種々の部分的な解決策は他の構成と組み合わせ可能である。本発明の範囲は添付の特許請求の範囲によって定義される。

Claims (32)

  1. オーディオ又は音声を表す信号のためのデコーダ装置(50)であって、
    符号化信号のパラメータ(4)を入力する入力部(40)と、
    前記入力部(40)に接続され、前記パラメータ(4)に基づいて1次復号化信号(23)を出力する1次デコーダ(21)と、
    前記1次デコーダ(21)の出力部に接続され、1次ポストフィルタ信号(32)を出力する1次ポストフィルタ(31)と、
    前記1次デコーダ(21)に加え、前記入力部(40)に接続され、前記パラメータ(4)に基づいて、前記1次復号化信号(23)とは異なる2次復号化信号(44)を出力する2次デコーダ(25)と、
    前記1次ポストフィルタ信号(32)と前記2次復号化信号に基づく信号(53)との重み付け平均をとることで、前記1次ポストフィルタ信号(32)と前記2次復号化信号に基づく信号(53)とを重み付け合成して出力信号(6)を得る合成器(55)と、
    前記合成器(55)に接続され、前記出力信号(6)を出力する出力部(60)と、
    を有し、
    前記合成器(55)は、信号特性を検出する手段(54)を含み、前記信号特性に応じて前記重み付け合成における重み付け係数(β)を適応化する
    ことを特徴とするデコーダ装置。
  2. 前記信号特性を検出する手段(54)は、着目する低周波帯域における前記1次復号化信号(23)と前記2次復号化信号(44)との間の類似性を検出することを特徴とする請求項に記載のデコーダ装置。
  3. 前記信号特性を検出する手段(54)は、受信したビットストリームの、前記1次復号化信号(23)とは異なる前記2次復号化信号(44)を再生する部分を検出することを特徴とする請求項に記載のデコーダ装置。
  4. 前記1次ポストフィルタ(31)は、前記1次復号化信号(23)と前記2次復号化信号(44)との遅延差を利用する高遅延ポストフィルタ(33)であることを特徴とする請求項1乃至のいずれか1項に記載のデコーダ装置。
  5. 前記2次デコーダ(25)は、2次エンハンスメントデコーダ(45)を有する2次再構成デコーダ(125)であり、更に、前記1次デコーダ(21)の出力と接続され、
    前記2次エンハンスメントデコーダ(45)は、前記パラメータ(4)に基づいて2次復号化エンハンスメント信号(52)を出力し、
    前記2次再構成デコーダ(125)は、前記2次復号化エンハンスメント信号(52)と前記1次復号化信号(23)とに基づいて2次復号化再構成信号(144)を出力する
    ことを特徴とする請求項1乃至のいずれか1項に記載のデコーダ装置。
  6. 前記2次復号化信号に基づく前記信号(53)は、前記2次復号化再構成信号(144)であることを特徴とする請求項に記載のデコーダ装置。
  7. 前記2次デコーダ(25)の出力と接続され、2次ポストフィルタ信号(35)を出力する2次ポストフィルタ(34)を更に有し、
    前記2次復号化信号に基づく信号(53)は、前記2次ポストフィルタ信号(35)である
    ことを特徴とする請求項に記載のデコーダ装置。
  8. 前記合成器(55)は、1次ポストフィルタエンハンスメント信号(64)を抽出する手段を更に含み、
    前記合成器(55)は、前記1次ポストフィルタエンハンスメント信号(64)と前記2次復号化信号(44)に基づくエンハンスメント信号(69)とを重み付け合成して合成エンハンスメント信号(65)を得るように構成され、
    前記合成器(55)は、前記合成エンハンスメント信号(65)に基づく信号と前記1次復号化信号(23)に基づく信号とを加算して前記出力信号(6)を出力する手段(62)を更に含む
    ことを特徴とする請求項1乃至のいずれか1項に記載のデコーダ装置。
  9. 前記合成器(55)は、前記合成エンハンスメント信号(65)をフィルタリングして、前記合成エンハンスメント信号(65)に基づく前記信号として使用されるフィルタ信号(66)を得るローパスフィルタ(61)及びバンドパスフィルタのうちのいずれか一方を更に含むことを特徴とする請求項に記載のデコーダ装置。
  10. 前記2次デコーダ(25)は、2次エンハンスメントデコーダ(45)であり、
    前記2次エンハンスメントデコーダ(45)は、前記パラメータ(4)に基づいて2次復号化エンハンスメント信号(52)を出力する
    ことを特徴とする請求項又は9に記載のデコーダ装置。
  11. 前記2次復号化信号に基づく前記エンハンスメント信号(69)は、前記2次復号化エンハンスメント信号(52)であり、
    前記1次復号化信号(23)に基づく前記信号は、前記1次復号化信号を遅延した信号(68)である
    ことを特徴とする請求項1に記載のデコーダ装置。
  12. 前記2次エンハンスメントデコーダ(45)の出力に接続される2次ポストフィルタ(34)を更に有し、
    前記2次復号化信号に基づく前記エンハンスメント信号(69)は、前記2次ポストフィルタからの出力信号(35)であり、
    前記1次復号化信号(23)に基づく前記信号は、前記1次復号化信号を遅延させた信号(68)である
    ことを特徴とする請求項1に記載のデコーダ装置。
  13. 前記2次デコーダ(25)は、2次エンハンスメントデコーダ(45)を有する2次再構成デコーダ(125)であり、更に、前記1次デコーダ(21)の出力と接続され、
    前記2次エンハンスメントデコーダ(45)は、前記パラメータ(4)に基づいて2次復号化エンハンスメント信号(52)を出力し、
    前記2次再構成デコーダ(125)は、前記2次復号化エンハンスメント信号(52)と前記1次復号化信号(23)とに基づいて2次復号化再構成信号(144)を出力し、
    前記2次デコーダ(25)の出力と接続され、2次ポストフィルタ信号(35)を出力する2次ポストフィルタ(34)を更に有する
    ことを特徴とする請求項又はに記載のデコーダ装置。
  14. 前記合成器(55)は、前記2次復号化信号(44)に基づく前記エンハンスメント信号(69)として使用される2次ポストフィルタエンハンスメント信号(67)を抽出する手段を更に含み、
    前記1次復号化信号に基づく前記信号は、前記2次復号化再構成信号(144)である
    ことを特徴とする請求項1に記載のデコーダ装置。
  15. 前記合成器(55)は、前記2次ポストフィルタ信号(35)と前記1次復号化信号を遅延させた信号(68)との差として前記2次復号化信号に基づく前記エンハンスメント信号(69)を抽出する手段を更に含み、
    前記1次復号化信号(23)に基づく前記信号は、前記1次復号化信号を遅延させた信号(68)である
    ことを特徴とする請求項1に記載のデコーダ装置。
  16. 前記デコーダ装置(50)はスケーラブルデコーダ装置であることを特徴とする請求項1乃至1のいずれか1項に記載のデコーダ装置。
  17. オーディオ又は音声を表す符号化信号を復号化する方法であって、
    符号化信号のパラメータ(4)を受信する受信ステップ(210)と、
    前記パラメータ(4)を1次復号化して1次復号化信号(23)を得るステップ(220)と、
    前記1次復号化信号(23)を1次ポストフィルタリングして1次ポストフィルタ信号(32)を得る1次ポストフィルタリングステップ(222)と、
    前記1次復号化するステップ(220)に加え、前記パラメータを2次復号化して、前記1次復号化信号(23)とは異なる2次復号化信号(44)を得る2次復号化ステップ(230)と、
    前記1次ポストフィルタ信号(32)と前記2次復号化信号(44)に基づく信号(53)との重み付け平均をとることで、前記1次ポストフィルタ信号(32)と前記2次復号化信号(44)に基づく信号(53)とを重み付け合成して出力信号(6)を得る合成ステップ(240)と、
    前記出力信号(6)を出力する出力ステップ(248)と、
    を有し、
    前記合成ステップ(240)は、信号特性を検出する検出ステップを含み、前記検出された信号特性に応じて前記重み付け合成における重み付け係数(β)を適応化する
    ことを特徴とする方法。
  18. 前記検出ステップは、着目する低周波帯域における前記1次復号化信号(23)と前記2次復号化信号(44)との間の類似性を検出するステップを含むことを特徴とする請求項17に記載の方法。
  19. 前記検出ステップは、受信ビットストリームの、前記1次復号化信号(23)とは異なる前記2次復号化信号(44)を再生する部分を検出するステップを含むことを特徴とする請求項17に記載の方法。
  20. 前記1次ポストフィルタリングステップは、前記1次復号化信号(23)と前記2次復号化信号(44)との遅延差を利用することを特徴とする請求項1乃至19のいずれか1項に記載の方法。
  21. 前記2次復号化ステップ(230)は、
    前記パラメータ(4)を2次エンハンスメント復号化して2次復号化エンハンスメント信号(52)を得るステップ(231)と、
    前記2次復号化エンハンスメント信号(52)と前記1次復号化信号(23)とに基づいて、前記2次復号化信号(44)として使用される2次復号化再構成信号(144)を再構成するステップ(232)と、
    を含むことを特徴とする請求項1乃至2のいずれか1項に記載の方法。
  22. 前記2次復号化信号(44)に基づく前記信号(53)は、前記2次復号化再構成信号(144)であることを特徴とする請求項2に記載の方法。
  23. 前記2次復号化再構成信号(144)を2次ポストフィルタリングして2次ポストフィルタ信号(35)を得るステップ(234)を更に有し、
    前記2次ポストフィルタ信号(35)は、前記2次復号化信号(44)に基づく前記信号(53)として使用される
    ことを特徴とする請求項2に記載の方法。
  24. 前記合成ステップは、
    1次ポストフィルタエンハンスメント信号(64)を抽出するステップ(241)と、
    前記1次ポストフィルタエンハンスメント信号(64)と前記2次復号化信号(44)に基づくエンハンスメント信号(69)とを重み付け合成して合成エンハンスメント信号(65)を得るステップ(243)と、
    前記合成エンハンスメント信号(65)に基づく信号と前記1次復号化信号(23)に基づく信号とを加算して前記出力信号(6)を出力するステップ(245)と、
    を含むことを特徴とする請求項1乃至2のいずれか1項に記載の方法。
  25. 前記合成ステップ(240)は、前記合成エンハンスメント信号(56)に対してローパスフィルタリング(244)及びバンドパスフィルタリングのうちの少なくとも一方を行い、前記合成エンハンスメント信号に基づく前記信号として使用されるフィルタ信号(66)を得るフィルタリングステップを更に含むことを特徴とする請求項2に記載の方法。
  26. 前記2次復号化ステップ(230)は、前記パラメータ(4)を2次エンハンスメント復号化して前記2次復号化信号(44)として使用される2次復号化エンハンスメント信号(52)を得るステップ(231)を含むことを特徴とする請求項2又は2に記載の方法。
  27. 前記1次復号化信号(23)を遅延させるステップを更に有し、
    前記2次復号化エンハンスメント信号(52)は、前記2次復号化信号(44)に基づく前記エンハンスメント信号(69)として使用され、
    前記1次復号化信号(23)を遅延させた前記信号(68)は、前記1次復号化信号(23)に基づく前記信号として使用される
    ことを特徴とする請求項26に記載の方法。
  28. 前記1次復号化信号を遅延させるステップと、
    前記2次復号化エンハンスメント信号(52)を2次ポストフィルタリングして2次ポストフィルタエンハンスメント信号を得るステップと、
    を更に有し、
    前記2次ポストフィルタエンハンスメント信号は、前記2次復号化エンハンスメント信号に基づく前記エンハンスメント信号(69)として使用され、
    前記1次復号化信号(23)を遅延させた前記信号(68)は、前記1次復号化信号(23)に基づく前記信号として使用される
    ことを特徴とする請求項26に記載の方法。
  29. 前記2次復号化ステップ(230)は、
    前記パラメータ(4)を2次エンハンスメント復号化して2次復号化エンハンスメント信号(52)を得るステップ(231)と、
    前記2次復号化エンハンスメント信号(52)と前記1次復号化信号(23)とに基づいて前記2次復号化信号(44)として使用される2次復号化再構成信号(144)を再構成するステップ(232)と、
    を含み、
    前記方法は、前記2次復号化信号(44)を2次ポストフィルタリングして2次ポストフィルタ信号(35)を得るステップ(234)を更に有する
    ことを特徴とする請求項2又は2に記載の方法。
  30. 前記合成ステップ(240)は、前記2次復号化信号(44)に基づく前記エンハンスメント信号(69)として使用される2次ポストフィルタエンハンスメント信号を抽出するステップ(242)を含み、
    前記2次復号化再構成信号(144)は、前記1次復号化信号(23)に基づく前記信号として使用される
    ことを特徴とする請求項29に記載の方法。
  31. 前記1次復号化信号(23)を遅延させるステップを更に有し、
    前記合成ステップ(240)は、前記2次ポストフィルタ信号と前記1次復号化信号(23)を遅延させた前記信号(68)との差として前記2次復号化信号に基づく前記エンハンスメント信号(69)を抽出するステップ(242)を含み、
    前記1次復号化信号(23)を遅延させた前記信号(68)は、前記1次復号化信号に基づく前記信号として使用される
    ことを特徴とする請求項29に記載の方法。
  32. 前記パラメータ(4)は、スケーラブルエンコーダパラメータであることを特徴とする請求項1乃至3のいずれか1項に記載の方法。
JP2009551966A 2007-03-02 2007-12-14 レイヤード・コーデックのためのポストフィルタ Expired - Fee Related JP5255575B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US89263807P 2007-03-02 2007-03-02
US60/892,638 2007-03-02
PCT/SE2007/050999 WO2008108701A1 (en) 2007-03-02 2007-12-14 Postfilter for layered codecs

Publications (2)

Publication Number Publication Date
JP2010520504A JP2010520504A (ja) 2010-06-10
JP5255575B2 true JP5255575B2 (ja) 2013-08-07

Family

ID=39738488

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009551966A Expired - Fee Related JP5255575B2 (ja) 2007-03-02 2007-12-14 レイヤード・コーデックのためのポストフィルタ

Country Status (6)

Country Link
US (1) US8571852B2 (ja)
EP (1) EP2132732B1 (ja)
JP (1) JP5255575B2 (ja)
CN (1) CN101622667B (ja)
AT (1) ATE548727T1 (ja)
WO (1) WO2008108701A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102222505B (zh) * 2010-04-13 2012-12-19 中兴通讯股份有限公司 可分层音频编解码方法系统及瞬态信号可分层编解码方法
US8886523B2 (en) * 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
US9258429B2 (en) * 2010-05-18 2016-02-09 Telefonaktiebolaget L M Ericsson Encoder adaption in teleconferencing system
ES2902392T3 (es) * 2010-07-02 2022-03-28 Dolby Int Ab Descodificación de audio con pos-filtración selectiva
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
US9026451B1 (en) * 2012-05-09 2015-05-05 Google Inc. Pitch post-filter

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0163298B1 (en) * 1984-05-30 1992-09-30 Hitachi, Ltd. Pcm coder/decoder with two-wire/four-wire conversion
US5293449A (en) * 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
US5694519A (en) * 1992-02-18 1997-12-02 Lucent Technologies, Inc. Tunable post-filter for tandem coders
JP2964879B2 (ja) * 1994-08-22 1999-10-18 日本電気株式会社 ポストフィルタ
JPH08163594A (ja) * 1994-12-12 1996-06-21 Sony Corp 動画像復号化方法及び動画像復号化装置
US5867814A (en) * 1995-11-17 1999-02-02 National Semiconductor Corporation Speech coder that utilizes correlation maximization to achieve fast excitation coding, and associated coding method
US5798795A (en) * 1996-03-01 1998-08-25 Florida Atlantic University Method and apparatus for encoding and decoding video signals
JP2940464B2 (ja) * 1996-03-27 1999-08-25 日本電気株式会社 音声復号化装置
US6167375A (en) * 1997-03-17 2000-12-26 Kabushiki Kaisha Toshiba Method for encoding and decoding a speech signal including background noise
JP3206497B2 (ja) * 1997-06-16 2001-09-10 日本電気株式会社 インデックスによる信号生成型適応符号帳
AU730123B2 (en) * 1997-12-08 2001-02-22 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for processing sound signal
CA2368453C (en) * 1999-04-16 2009-12-08 Grant Allen Davidson Using gain-adaptive quantization and non-uniform symbol lengths for audio coding
AU2547201A (en) * 2000-01-11 2001-07-24 Matsushita Electric Industrial Co., Ltd. Multi-mode voice encoding device and decoding device
US7606703B2 (en) * 2000-11-15 2009-10-20 Texas Instruments Incorporated Layered celp system and method with varying perceptual filter or short-term postfilter strengths
EP1484841B1 (en) 2002-03-08 2018-12-26 Nippon Telegraph And Telephone Corporation DIGITAL SIGNAL ENCODING METHOD, DECODING METHOD, ENCODING DEVICE, DECODING DEVICE and DIGITAL SIGNAL DECODING PROGRAM
JP3960932B2 (ja) * 2002-03-08 2007-08-15 日本電信電話株式会社 ディジタル信号符号化方法、復号化方法、符号化装置、復号化装置及びディジタル信号符号化プログラム、復号化プログラム
AU2003234763A1 (en) * 2002-04-26 2003-11-10 Matsushita Electric Industrial Co., Ltd. Coding device, decoding device, coding method, and decoding method
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
AU2003274524A1 (en) * 2002-11-27 2004-06-18 Koninklijke Philips Electronics N.V. Sinusoidal audio coding
US7433815B2 (en) * 2003-09-10 2008-10-07 Dilithium Networks Pty Ltd. Method and apparatus for voice transcoding between variable rate coders
US7478040B2 (en) * 2003-10-24 2009-01-13 Broadcom Corporation Method for adaptive filtering
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US8271272B2 (en) 2004-04-27 2012-09-18 Panasonic Corporation Scalable encoding device, scalable decoding device, and method thereof
JP4771674B2 (ja) * 2004-09-02 2011-09-14 パナソニック株式会社 音声符号化装置、音声復号化装置及びこれらの方法
JP4989971B2 (ja) * 2004-09-06 2012-08-01 パナソニック株式会社 スケーラブル復号化装置および信号消失補償方法
US7305139B2 (en) * 2004-12-17 2007-12-04 Microsoft Corporation Reversible 2-dimensional pre-/post-filtering for lapped biorthogonal transform
WO2006075663A1 (ja) * 2005-01-14 2006-07-20 Matsushita Electric Industrial Co., Ltd. 音声切替装置および音声切替方法
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
US8315863B2 (en) 2005-06-17 2012-11-20 Panasonic Corporation Post filter, decoder, and post filtering method
DE602006018618D1 (de) 2005-07-22 2011-01-13 France Telecom Verfahren zum umschalten der raten- und bandbreitenskalierbaren audiodecodierungsrate
FR2897733A1 (fr) * 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
US7873511B2 (en) * 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic

Also Published As

Publication number Publication date
US20100063801A1 (en) 2010-03-11
JP2010520504A (ja) 2010-06-10
EP2132732A4 (en) 2010-12-15
CN101622667A (zh) 2010-01-06
WO2008108701A1 (en) 2008-09-12
EP2132732B1 (en) 2012-03-07
CN101622667B (zh) 2012-08-15
US8571852B2 (en) 2013-10-29
EP2132732A1 (en) 2009-12-16
ATE548727T1 (de) 2012-03-15

Similar Documents

Publication Publication Date Title
CA2997331C (en) Method and system for encoding a stereo sound signal using coding parameters of a primary channel to encode a secondary channel
KR101303145B1 (ko) 계층적 오디오 신호를 코딩하기 위한 시스템, 오디오 신호를 코딩하는 방법, 컴퓨터-판독가능한 매체 및 계층적 오디오 디코더
US8630864B2 (en) Method for switching rate and bandwidth scalable audio decoding rate
JP3490685B2 (ja) 広帯域信号の符号化における適応帯域ピッチ探索のための方法および装置
US8260620B2 (en) Device for perceptual weighting in audio encoding/decoding
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
JP5097219B2 (ja) 非因果性ポストフィルタ
AU2008221657B2 (en) Method and arrangement for smoothing of stationary background noise
JP5255575B2 (ja) レイヤード・コーデックのためのポストフィルタ
US20090299755A1 (en) Method for Post-Processing a Signal in an Audio Decoder
Bhatt Implementation and overall performance evaluation of CELP based GSM AMR NB coder over ABE
Schmidt et al. On the Cost of Backward Compatibility for Communication Codecs

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111222

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120309

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120620

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120924

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121211

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130319

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130412

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130419

R150 Certificate of patent or registration of utility model

Ref document number: 5255575

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160426

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees