JP2014531056A - フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置 - Google Patents

フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置 Download PDF

Info

Publication number
JP2014531056A
JP2014531056A JP2014537002A JP2014537002A JP2014531056A JP 2014531056 A JP2014531056 A JP 2014531056A JP 2014537002 A JP2014537002 A JP 2014537002A JP 2014537002 A JP2014537002 A JP 2014537002A JP 2014531056 A JP2014531056 A JP 2014531056A
Authority
JP
Japan
Prior art keywords
frame
error
unit
signal
previous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014537002A
Other languages
English (en)
Other versions
JP5973582B2 (ja
Inventor
ソン,ホ−サン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2014531056A publication Critical patent/JP2014531056A/ja
Application granted granted Critical
Publication of JP5973582B2 publication Critical patent/JP5973582B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Error Detection And Correction (AREA)

Abstract

エラーフレームをなす第1複数個の帯域から構成された複数個のグループについて、グループ単位で回帰分析を行ってパラメータを予測する段階、及びグループ別に予測されたパラメータを利用して、エラーフレームのエラーを隠匿する段階を含むフレームエラー隠匿方法である。

Description

本発明は、フレームエラー隠匿に係り、さらに具体的には、周波数ドメインにおいて、低複雑度でさらなる遅延なしに、信号の特性に適応的に、エラーフレームをさらに正確に復元するためのフレームエラー隠匿方法及びその装置、オーディオ復号化方法及びその装置、並びにそれを採用するマルチメディア機器に関する。
有無線網を介して符号化されたオーディオ信号を伝送するにあたり、伝送上のエラーによって、一部パケットが損失されたり歪曲される場合が生じれば、復号化されたオーディオ信号の一部フレームにエラーが発生しうる。その場合、フレームに生じたエラーを適切に処理しなければ、エラーが生じたフレーム(以下、エラーフレームとする)区間で復号化されたオーディオ信号の音質が低下してしまう。
フレームエラーを隠匿するための方法の例としては、エラーフレームにおける信号の振幅を低減させることにより、エラーが出力信号に及ぼす影響を弱化させる黙音(muting)法、エラーフレームの以前正常フレーム(PGF:previous good frame)を反復して再生することにより、エラーフレームの信号を復元する反復(repetition)法、以前正常フレーム(PGF)と次の正常フレーム(NGF:next good frame)とのパラメータを補間し、エラーフレームのパラメータを予測する補間(interpolation)法、以前正常フレーム(PGF)のパラメータを補外し、エラーフレームのパラメータを求める補外(extrapolation)法、以前正常フレーム(PGF)のパラメータを回帰分析し、エラーフレームのパラメータを求める回帰分析法(regression analysis)などがある。
ところで、既存には、入力信号の特性にかかわらず、同一方式を画一的に適用し、エラーフレームを復元したので、フレームエラーが効率的に隠匿されず、音質が低下してしまうという問題がある。そして、補間法の場合、フレームエラーを効率的に隠匿することができるが、1フレームというさらなる遅延を必要とするので、遅延に敏感な通信用コーデックでは、採択することが適切ではない。また、回帰分析法の場合、既存のエネルギーをある程度考慮した隠匿が可能であるが、信号が徐々に大きくなったり、信号の変動がはなはだしいところでは、効率低下が発生する。また、回帰分析法は、周波数ドメインの各帯域別に回帰分析を行えば、各帯域の瞬間的なエネルギー変化によって、意図しない信号が予測される場合もある。
本発明が解決しようとする課題は、周波数ドメインにおいて、低複雑度でさらなる遅延なしに、信号の特性に適応的に、エラーフレームをさらに正確に復元するためのフレームエラー隠匿方法及びその装置を提供するところにある。
本発明が解決しようとする他の課題は、周波数ドメインにおいて、低複雑度でさらなる遅延なしに、信号の特性に適応的に、エラーフレームをさらに正確に復元することにより、フレームエラーによる音質低下を最小化させるオーディオ復号化方法及びその装置、その記録媒体と、それを採用するマルチメディア機器とを提供するところのにある。
本発明が解決しようとする他の課題は、フレームエラー隠匿方法あるいはオーディオ復号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供するところにある。
本発明が解決しようとする他の課題は、フレームエラー隠匿装置あるいはオーディオ復号化装置を採用するマルチメディア機器を提供するところにある。
前記課題を達成するための本発明の一実施形態によるフレームエラー隠匿方法は、エラーフレームをなす第1複数個の帯域から構成された複数個のグループに対して、グループ単位で回帰分析を行ってパラメータを予測する段階と、グループ別に予測されたパラメータを利用して、前記エラーフレームのエラーを隠匿する段階と、を含んでもよい。
前記課題を達成するための本発明の一実施形態によるオーディオ復号化方法は、正常フレームに対して復号化を行ってスペクトル係数を獲得する段階と、エラーフレームをなす第1複数個の帯域から構成された複数個のグループに対して、グループ単位で回帰分析を行ってパラメータを予測し、グループ別に予測されたパラメータを利用して、前記エラーフレームのスペクトル係数を獲得する段階と、前記正常フレームあるいは前記エラーフレームの復号化されたスペクトル係数に対して時間ドメインに変換し、オーバーラップ処理及びアド処理を行って時間ドメインの信号に復元する段階と、を含んでもよい。
本発明によれば、急激な信号変動を平滑化させ、周波数ドメインにおいて、低複雑度で、さらなる遅延なしに、信号の特性、特に、トランジェントである特性及びバーストエラー区間に適応的に、エラーフレームをさらに正確に復元することができる。
本発明が適用されるオーディオ符号化装置の一例による構成を示したブロック図である。 本発明が適用されるオーディオ復号化装置の一例による構成を示したブロック図である。 本発明が適用されるオーディオ符号化装置の他の例による構成を示したブロック図である。 本発明が適用されるオーディオ復号化装置の他の例による構成を示したブロック図である。 本発明が適用されるオーディオ符号化装置の他の例による構成を示したブロック図である。 本発明が適用されるオーディオ復号化装置の他の例による構成を示したブロック図である。 本発明が適用されるオーディオ符号化装置及びオーディオ復号化装置の他の例による構成を示したブロック図である。 本発明が適用されるオーディオ符号化装置及びオーディオ復号化装置の他の例による構成を示したブロック図である。 本発明の一実施形態による周波数ドメイン復号化装置の構成を示したブロック図である。 本発明の一実施形態によるスペクトル復号化部の構成を示したブロック図である。 本発明の一実施形態によるフレームエラー隠匿部の構成を示したブロック図である。 本発明の一実施形態によるメモリ更新部の構成を示したブロック図である。 は本発明に適用された帯域分割の例を示した図面である。 本発明に適用された線形回帰分析と非線形回帰分析との概念を示した図面である。 本発明において回帰分析を適用するためにグルーピングされたサブバンド構造の一例を示した図面である。 7.6kHzまで支援する広帯域(wideband)に対して回帰分析を適用するためにグルーピングされたサブバンド構造の一例を示した図面である。 13.6kHzまで支援する超広帯域(super-wideband)に対して回帰分析を適用するためにグルーピングされたサブバンド構造の一例を示した図面である。 20kHzまで支援する全帯域(fullband)に対して回帰分析を適用するためにグルーピングされたサブバンド構造の一例を示した図面である。 16kHzまで支援して帯域拡張(BWE)を使用する場合、超広帯域に対して回帰分析を適用するためにグルーピングされたサブバンド構造の例を示した図面である。 16kHzまで支援して帯域拡張(BWE)を使用する場合、超広帯域に対して回帰分析を適用するためにグルーピングされたサブバンド構造の例を示した図面である。 16kHzまで支援して帯域拡張(BWE)を使用する場合、超広帯域に対して回帰分析を適用するためにグルーピングされたサブバンド構造の例を示した図面である。 次の正常フレーム(NGF)の時間信号を利用したオーバーラップ・アンド・アド方式の例を示した図面である。 次の正常フレーム(NGF)の時間信号を利用したオーバーラップ・アンド・アド方式の例を示した図面である。 次の正常フレーム(NGF)の時間信号を利用したオーバーラップ・アンド・アド方式の例を示した図面である。 本発明の一実施形態によるマルチメディア機器の構成を示したブロック図である。 本発明の他の実施形態によるマルチメディア機器の構成を示したブロック図である。
本発明は、多様な変換を加えることができ、さまざまな実施形態を有することができるが、特定実施形態を図面に例示し、詳細な説明で具体的に説明する。しかし、それは、本発明を特定の実施形態について限定するものではなく、本発明の技術的思想及び技術範囲に含まれる全ての変換、均等物あるいは代替物を含むものであると理解するのである。本発明の説明において、関連公知技術に係わる具体的な説明が、本発明の要旨を不明確なものにすると判断される場合、その詳細な説明を省略する。
第1、第2のような用語は、多様な構成要素の説明に使用されるが、構成要素が用語によって限定されるものではない。用語は、1つの構成要素を他の構成要素から区別する目的のみに使用される。
本発明で使用した用語は、ただ特定の実施形態を説明するために使用されたものであり、本発明を限定する意図ではない。本発明で使用した用語は、本発明での機能を考慮しながら、可能な限り現在広く使用される一般的な用語を選択したが、それは当業者の意図、判例、または新たな技術の出現などによって異なりもする。また、特定の場合は、出願人が任意に選定した用語もあり、その場合、当該発明の説明部分で、詳細にその意味を記載する。従って、本発明で使用される用語は、単純な用語の名称ではない、その用語が有する意味、及び本発明の全般にわたった内容を基に定義されなければならない。
単数の表現は、文脈上明白に特定されて意味しない限り、複数の表現を含む。本発明で、「含む」または「有する」のような用語は、明細書上に記載された特徴、数字、段階、動作、構成要素、部品、またはそれらを組み合わせたものが存在するということを指定するものであり、一つまたはそれ以上の他の特徴、数字、段階、動作、構成要素、部品、またはそれらを組み合わせたものの存在または付加の可能性をあらかじめ排除するものではないということを理解しなければならない。
以下、本発明の実施形態について、添付図面を参照して詳細に説明する。
図1A及び図1Bは、本発明が適用されるオーディオ符号化装置及びオーディオ復号化装置の一例による構成をそれぞれ示したブロック図である。
図1Aに図示されたオーディオ符号化装置110は、前処理部112、周波数ドメイン符号化部114及びパラメータ符号化部116を含んでもよい。各構成要素は、少なくとも一つ以上のモジュールに一体化され、少なくとも一つ以上のプロセッサ(図示せず)でもって具現される。
図1Aにおいて、前処理部112は、入力信号に対して、フィルタリングあるいはダウンサンプリングなどを行うが、それらに限定されるものではない。入力信号は、音声信号、音楽信号、あるいは音声と音楽とが混合された信号を含んでもよい。以下では、説明の便宜のために、オーディオ信号とする。
周波数ドメイン符号化部114は、前処理部112から提供されるオーディオ信号に対して、時間・周波数変換を行い、オーディオ信号のチャンネル数、符号化帯域及びビット率に対応して符号化ツールを選択し、選択された符号化ツールを利用して、オーディオ信号に対する符号化を行う。時間・周波数変換は、MDCT(modified discrete cosine transform)またはFFT(fast Fourier transform)を使用するが、それらに限定されるものではない。ここで、与えられたビット数によって、十分な場合、全体帯域に対して、一般的な変換符号化方式を適用し、十分ではない場合、一部帯域に対しては、帯域拡張(BWE)方式を適用することができる。一方、オーディオ信号がステレオあるいはマルチチャネルである場合、与えられたビット数によって、十分な場合、各チャネル別に符号化し、十分ではない場合、ダウンミキシング方式を適用することができる。周波数ドメイン符号化114からは、符号化されたスペクトル係数が生成される。
パラメータ符号化部116は、周波数ドメイン符号化部114から提供される符号化されたスペクトル係数からパラメータを抽出し、抽出されたパラメータを符号化する。パラメータは、サブバンド別に抽出され、各サブバンドは、スペクトル係数をグルーピングした単位であり、臨界帯域を反映させ、均一長あるいは非均一長を有する。非均一長を有する場合、低周波数帯域に存在するサブバンドの場合、高周波数帯域と比べ、相対的に短い長さを有する。1フレームに含まれるサブバンドの個数及び長さは、コーデックアルゴリズムによって異なり、符号化性能に影響を及ぼす。一方、パラメータは、サブバンドのスケールファクタ、パワー、平均エネルギーあるいはnormを例として挙げることができるが、それらに限定されるものではない。符号化の結果として得られるスペクトル係数とパラメータは、ビットストリームを形成し、チャネルを介して、パケット状で伝送されたり、あるいは記録媒体に保存される。
図1Bに図示されたオーディオ復号化装置130は、パラメータ復号化部132、周波数ドメイン復号化部134及び後処理部136を含んでもよい。ここで、周波数ドメイン復号化部134は、フレームエラー隠匿アルゴリズムを含んでもよい。各構成要素は、少なくとも一つ以上のモジュールに一体化され、少なくとも一つ以上のプロセッサ(図示せず)でもって具現される。
図1Bにおいて、パラメータ復号化部132は、パケット状で伝送されるビットストリームからパラメータを復号化し、復号化されたパラメータから、フレーム単位で、エラー発生をチェックすることができる。エラーチェックは、公知の多様な方法を使用することができ、現在フレームが正常フレームであるかエラーフレームであるかに係わる情報を、周波数ドメイン復号化部134に提供する。
周波数ドメイン復号化部134は、現在フレームが正常フレームである場合、一般的な変換復号化過程を介して復号化を行い、合成されたスペクトル係数を生成し、エラーフレームである場合、周波数ドメインでのフレームエラー隠匿アルゴリズムを介して、以前正常フレームのスペクトル係数をスケーリングして合成されたスペクトル係数を生成することができる。周波数ドメイン復号化部134は、合成されたスペクトル係数に対し、て周波数・時間変換を遂行して時間ドメイン信号を生成することができる。
後処理部136は、周波数ドメイン復号化部134から提供される時間ドメイン信号に対して、フィルタリングあるいはアップサンプリングなどを行うことができるが、それらに限定されるものではない。後処理部136は、出力信号として復元されたオーディオ信号を提供する。
図2A及び図2Bは、本発明が適用されるオーディオ符号化装置及びオーディオ復号化装置の他の例による構成をそれぞれ示したブロック図であり、スイッチング構造を有する。
図2Aに図示されたオーディオ符号化装置210は、前処理部212、モード決定部213、周波数ドメイン符号化部214、時間ドメイン符号化部215及びパラメータ符号化部216を含んでもよい。各構成要素は、少なくとも一つ以上のモジュールに一体化され、少なくとも一つ以上のプロセッサ(図示せず)でもって具現される。
図2Aにおいて、前処理部212は、図1Aの前処理部112と実質的に同一であるので、説明を省略する。
モード決定部213は、入力信号の特性を参照し、符号化モードを決定することができる。入力信号の特性によって、現在フレームが音声モードであるか、または音楽モードであるかを決定することができ、また現在フレームに効率的な符号化モードが、時間ドメインモードであるか、あるいは周波数ドメインモードであるかについて決定することができる。ここで、フレームの短区間特性、あるいは複数のフレームに対する長久間特性などを利用して、入力信号の特性を把握することができるが、それに限定されるものではない。モード決定部213は、入力信号の特性が音楽モードあるいは周波数ドメインモードに該当する場合には、前処理部212の出力信号を、周波数ドメイン符号化部214に、入力信号の特性が音声モードあるいは時間ドメインモードに該当する場合には、時間ドメイン符号化部215に提供する。
周波数ドメイン符号化部214は、図1Aの周波数ドメイン符号化部114と実質的に同一であるので、説明を省略する。
時間ドメイン符号化部215は、前処理部212から提供されるオーディオ信号に対して、CELP(code excited linear prediction)符号化を行うことができる。具体的には、ACELP(algebraic CELP)を使用することができるが、それに限定されるものではない。時間ドメイン符号化215からは、符号化されたスペクトル係数が生成される。
パラメータ符号化部216は、周波数ドメイン符号化部214あるいは時間ドメイン符号化部215から提供される符号化されたスペクトル係数からパラメータを抽出し、抽出されたパラメータを符号化する。パラメータ符号化部216は、図1Aのパラメータ符号化部116と実質的に同一であるので、説明を省略する。符号化の結果として得られるスペクトル係数とパラメータは、符号化モード情報と共にビットストリームを形成し、チャネルを介してパケット状で伝送されたり、あるいは記録媒体に保存される。
図2Bに図示されたオーディオ復号化装置230は、パラメータ復号化部232、モード決定部233、周波数ドメイン復号化部234、時間ドメイン復号化部235及び後処理部236を含んでもよい。ここで、周波数ドメイン復号化部234と時間ドメイン復号化部235は、それぞれ当該ドメインでのフレームエラー隠匿アルゴリズムを含んでもよい。各構成要素は、少なくとも一つ以上のモジュールに一体化されて、なくとも一つ以上のプロセッサ(図示せず)でもって具現される。
図2Bにおいて、パラメータ復号化部232は、パケット状で伝送されるビットストリームからパラメータを復号化し、復号化されたパラメータから、フレーム単位で、エラー発生をチェックすることができる。エラーチェックは、公知の多様な方法を使用することができ、現在フレームが正常フレームであるかエラーフレームであるかに係わる情報を、周波数ドメイン復号化部234あるいは時間ドメイン復号化部235に提供する。
モード決定部233は、ビットストリームに含まれた符号化モード情報をチェックし、現在フレームを周波数ドメイン復号化部234あるいは時間ドメイン復号化部235に提供する。
周波数ドメイン復号化部234は、符号化モードが音楽モードあるいは周波数ドメインモードである場合動作し、現在フレームが正常フレームである場合、一般的な変換復号化過程を介して復号化を行い、合成されたスペクトル係数を生成する。一方、現在フレームがエラーフレームであり、以前フレームの符号化モードが音楽モードあるいは周波数ドメインモードである場合、周波数ドメインでのフレームエラー隠匿アルゴリズムを介して、以前正常フレームのスペクトル係数をスケーリングし、合成されたスペクトル係数を生成することができる。周波数ドメイン復号化部234は、合成されたスペクトル係数に対して周波数・時間変換を行い、時間ドメイン信号を生成することができる。
時間ドメイン復号化部235は、符号化モードが音声モードあるいは時間ドメインモードである場合に動作し、現在フレームが正常フレームである場合、一般的なCELP復号化過程を介して復号化を行い、時間ドメイン信号を生成する。一方、現在フレームがエラーフレームであり、以前フレームの符号化モードが音声モードあるいは時間ドメインモードである場合、時間ドメインでのフレームエラー隠匿アルゴリズムを実行することができる。
後処理部236は、周波数ドメイン復号化部234あるいは時間ドメイン復号化部235から提供される時間ドメイン信号に対して、フィルタリングあるいはアップサンプリングなどを行うことができるが、それらに限定されるものではない。後処理部236は、出力信号として復元されたオーディオ信号を提供する。
図3A及び図3Bは、本発明が適用されるオーディオ符号化装置及びオーディオ復号化装置の他の例による構成をそれぞれ示したブロック図であり、スイッチング構造を有する。
図3Aに図示されたオーディオ符号化装置310は、前処理部312、LP(linear prediction)分析部313、モード決定部314、周波数ドメイン励起符号化部315、時間ドメイン励起符号化部316及びパラメータ符号化部317を含んでもよい。各構成要素は、少なくとも一つ以上のモジュールに一体化され、少なくとも一つ以上のプロセッサ(図示せず)でもって具現される。
図3Aにおいて、前処理部312は、図1Aの前処理部112と実質的に同一であるので、説明を省略する。
LP分析部313は、入力信号に対してLP分析を行ってLP係数を抽出し、抽出されたLP係数から励起信号を生成する。励起信号は、符号化モードにより、周波数ドメイン励起符号化部315及び時間ドメイン励起符号化部316のうち一つに提供される。
モード決定部314は、図2Bのモード決定部213と実質的に同一であるので、説明を省略する。
周波数ドメイン励起符号化部315は、符号化モードが音楽モードあるいは周波数ドメインモードである場合に動作し、入力信号が励起信号であることを除いては、図1Aの周波数ドメイン符号化部114と実質的に同一であるので、説明を省略する。
時間ドメイン励起符号化部316は、符号化モードが音声モードあるいは時間ドメインモードである場合に動作し、入力信号が励起信号であることを除いては、図2Aの時間ドメイン符号化部215と実質的に同一であるので、説明を省略する。
パラメータ符号化部317は、周波数ドメイン励起符号化部315あるいは時間ドメイン励起符号化部316から提供される符号化されたスペクトル係数からパラメータを抽出し、抽出されたパラメータを符号化する。パラメータ符号化部317は、図1Aのパラメータ符号化部116と実質的に同一であるので、説明を省略する。符号化の結果として得られるスペクトル係数とパラメータは、符号化モード情報と共にビットストリームを形成し、チャネルを介してパケット状で伝送されたり、あるいは記録媒体に保存される。
図3Bに図示されたオーディオ復号化装置330は、パラメータ復号化部332、モード決定部333、周波数ドメイン励起復号化部334、時間ドメイン励起復号化部335、LP合成部336及び後処理部337を含んでもよい。ここで、周波数ドメイン励起復号化部334と時間ドメイン励起復号化部335は、それぞれ当該ドメインでのフレームエラー隠匿アルゴリズムを含んでもよい。各構成要素は、少なくとも一つ以上のモジュールに一体化され、少なくとも一つ以上のプロセッサ(図示せず)でもって具現される。
図3Bにおいて、パラメータ復号化部332は、パケット状で伝送されるビットストリームからパラメータを復号化し、復号化されたパラメータから、フレーム単位で、エラー発生をチェックすることができる。エラーチェックは、公知の多様な方法を使用することができ、現在フレームが正常フレームであるかエラーフレームであるかに係わる情報を、周波数ドメイン励起復号化部334あるいは時間ドメイン励起復号化部335に提供する。
モード決定部333は、ビットストリームに含まれた符号化モード情報をチェックし、現在フレームを周波数ドメイン励起復号化部334あるいは時間ドメイン励起復号化部335に提供する。
周波数ドメイン励起復号化部334は、符号化モードが音楽モードあるいは周波数ドメインモードである場合に動作し、現在フレームが正常フレームである場合、一般的な変換復号化過程を介して復号化を行い、合成されたスペクトル係数を生成する。一方、現在フレームがエラーフレームであり、以前フレームの符号化モードが音楽モードあるいは周波数ドメインモードである場合、周波数ドメインでのフレームエラー隠匿アルゴリズムを介して以前正常フレームのスペクトル係数をスケーリングし、合成されたスペクトル係数を生成することができる。周波数ドメイン励起復号化部334は、合成されたスペクトル係数に対して周波数・時間変換を行い、時間ドメイン信号である励起信号を生成することができる。
時間ドメイン励起復号化部335は、符号化モードが音声モードあるいは時間ドメインモードである場合に動作し、現在フレームが正常フレームである場合、一般的なCELP復号化過程を介して復号化を行い、時間ドメイン信号である励起信号を生成する。一方、現在フレームがエラーフレームであり、以前フレームの符号化モードが音声モードあるいは時間ドメインモードである場合、時間ドメインでのフレームエラー隠匿アルゴリズムを実行することができる。
LP合成部336は、周波数ドメイン励起復号化部334あるいは時間ドメイン励起復号化部335から提供される励起信号に対してLP合成を行い、時間ドメイン信号を生成する。
後処理部337は、LP合成部336から提供される時間ドメイン信号に対して、フィルタリングあるいはアップサンプリングなどを行うことができるが、それらに限定されるものではない。後処理部337は、出力信号として復元されたオーディオ信号を提供する。
図4A及び図4Bは、本発明が適用されるオーディオ符号化装置及びオーディオ復号化装置の他の例による構成をそれぞれ示したブロック図であり、スイッチング構造を有する。
図4Aに図示されたオーディオ符号化装置410は、前処理部412、モード決定部413、周波数ドメイン符号化部414、LP分析部415、周波数ドメイン励起符号化部416、時間ドメイン励起符号化部417及びパラメータ符号化部418を含んでもよい。各構成要素は、少なくとも一つ以上のモジュールに一体化され、少なくとも一つ以上のプロセッサ(図示せず)でもって具現される。図4Aに図示されたオーディオ符号化装置410は、図2Aのオーディオ符号化装置210と、図3Aのオーディオ符号化装置310とを結合したものと見られるので、共通する部分の動作説明は省略する一方、モード決定部413の動作について説明する。
モード決定部413は、入力信号の特性及びビット率を参照し、入力信号の符号化モードを決定することができる。モード決定部413は、入力信号の特性によって、現在フレームが音声モードであるか、あるいは音楽モードであるかということにより、また現在フレームに効率的な符号化モードが時間ドメインモードであるか、あるいは周波数ドメインモードであるかにより、CELPモードと、それ以外のモードとに決定することができる。もし入力信号の特性が音声モードである場合には、CELPモードに決定し、音楽モードでありながら、高ビット率である場合、周波数ドメインモードに決定し、音楽モードでありながら低ビット率である場合、オーディオモードに決定することができる。モード決定部413は、周波数ドメインモードである場合、入力信号を周波数ドメイン符号化部414に、オーディオモードである場合、LP分析部415を介して周波数ドメイン励起符号化部416に、CELPモードである場合、LP分析部415を介して時間ドメイン励起符号化部417に提供することができる。
周波数ドメイン符号化部414は、図1Aのオーディオ符号化装置110の周波数ドメイン符号化部114、あるいは図2Aのオーディオ符号化装置210の周波数ドメイン符号化部214に、周波数ドメイン励起符号化部416あるいは時間ドメイン励起符号化部417は、図3Aのオーディオ符号化装置310の周波数ドメイン励起符号化部315あるいは時間ドメイン励起符号化部316に対応する。
図4Bに図示されたオーディオ復号化装置430は、パラメータ復号化部432、モード決定部433、周波数ドメイン復号化部434、周波数ドメイン励起復号化部435、時間ドメイン励起復号化部436、LP合成部437及び後処理部438を含んでもよい。ここで、周波数ドメイン復号化部434、周波数ドメイン励起復号化部435及び時間ドメイン励起復号化部436は、それぞれ当該ドメインでのフレームエラー隠匿アルゴリズムを含んでもよい。各構成要素は、少なくとも一つ以上のモジュールに一体化され、少なくとも一つ以上のプロセッサ(図示せず)でもって具現される。図4Bに図示されたオーディオ復号化装置430は、図2Bのオーディオ復号化装置230と、図3Bのオーディオ復号化装置330とを結合したものであると見られるので、共通する部分の動作説明は省略する一方、モード決定部433の動作について説明する。
モード決定部433は、ビットストリームに含まれた符号化モード情報をチェックし、現在フレームを周波数ドメイン復号化部434、周波数ドメイン励起復号化部435あるいは時間ドメイン励起復号化部436に提供する。
周波数ドメイン復号化部434は、図1Bのオーディオ符号化装置130の周波数ドメイン復号化部134あるいは図2Bのオーディオ復号化装置230の周波数ドメイン復号化部234に、周波数ドメイン励起復号化部435あるいは時間ドメイン励起復号化部436は、図3Bのオーディオ復号化装置330の周波数ドメイン励起復号化部334あるいは時間ドメイン励起復号化部335に対応する。
図5は、本発明の一実施形態による周波数ドメイン復号化装置の構成を示したブロック図であり、図2Bのオーディオ復号化装置230の周波数ドメイン復号化部234と、図3Bのオーディオ復号化装置330の周波数ドメイン励起復号化部334とに対応する。
図5に図示された周波数ドメイン復号化装置500は、エラー隠匿部510、スペクトル復号化部530、メモリ更新部550、逆変換部570及びオーバーラップ・アンド・アド部590を含んでもよい。メモリ更新部550に内蔵されるメモリ(図示せず)を除いた各構成要素は、少なくとも一つ以上のモジュールに一体化され、少なくとも一つ以上のプロセッサ(図示せず)でもって具現される。
図5において、まず復号化されたパラメータから、現在フレームにエラーが発生していないということが判断されれば、スペクトル復号化部530、メモリ更新部550、逆変換部570及びオーバーラップ・アンド・アド部590を経て、復号化過程が遂行され、最終時間ドメイン信号を生成することができる。具体的には、スペクトル復号化部530は、復号化されたパラメータを利用して、スペクトル復号化を行い、スペクトル係数を合成することができる。メモリ更新部550は、正常フレームである現在フレームについて、合成されたスペクトル係数、復号化されたパラメータ、パラメータを利用して得られた情報、現在まで連続したエラーフレームの個数、以前フレームの特性(デコーダで合成された信号分析を介した信号特性、例えば、トランジェント特性、normal特性、stationary特性など)、及び以前フレームのタイプ情報(エンコーダから伝送された情報、例えば、トランジェントフレーム、normalフレームなど)などを次のフレームのために更新することができる。逆変換部570は、合成されたスペクトル係数に対して周波数・時間変換を行い、時間ドメイン信号を生成することができる。オーバーラップ・アンド・アド部590は、以前フレームの時間ドメイン信号を利用して、オーバーラップ・アンド・アド処理を行い、その結果、現在フレームに対する最終時間ドメイン信号を生成することができる。
一方、復号化されたパラメータから、現在フレームにエラーが生じたと判断されれば、復号化されたパラメータのうち、例えば、BFI(bad frame indicator)が1に設定され、エラーフレームである現在フレームについては、何らの情報も存在しなくなる。その場合、以前フレームの復号化モードをチェックし、周波数ドメインである場合、現在フレームについて、周波数ドメインでのエラー隠匿アルゴリズムを実行することができる。
すなわち、エラー隠匿部510は、現在フレームがエラーフレームであり、以前フレームの復号化モードが周波数ドメインである場合に動作することができる。エラー隠匿部510は、メモリ更新部550に保存された情報を利用して、現在フレームのスペクトル係数を復元することができる。現在フレームの復元されたスペクトル係数は、スペクトル復号化部530、メモリ更新部550、逆変換部570及びオーバーラップ・アンド・アド部590を経て、復号化過程が遂行され、最終時間ドメイン信号を生成することができる。
ここで、オーバーラップ・アンド・アド部590は、現在フレームがエラーフレームであり、以前フレームが正常フレームであり、復号化モードが周波数ドメインであるか、あるいは現在フレーム及び以前フレームが正常フレームであり、復号化モードが周波数ドメインである場合には、正常フレームである以前フレームの時間ドメイン信号を利用して、オーバーラップ・アンド・アド過程を遂行することができる。一方、現在フレームが、正常フレーム、エラーフレームに連続した以前フレームの個数が2個以上であり、以前フレームがエラーフレームであり、最後の正常フレームである以前フレームの復号化モードが周波数ドメインである場合には、正常フレームである以前フレームの時間ドメイン信号を利用して、オーバーラップ・アンド・アド過程を遂行するのではなく、正常フレームである現在フレームで求められた時間ドメイン信号を利用して、オーバーラップ・アンド・アド過程を遂行することができる。その条件は、次のように示すことができる。
if (bfi==0)&&(st→old_bfi_int>1)&&(st→prev_bfi==1)&&
(st→last_core==FREQ_CORE))
ここで、bfiは、現在フレームに対するエラーフレーム指示子、st→old_bfi_intは、以前フレームの連続したエラーフレームの個数、st→prev_bfiは、以前フレームのbfi情報、st→last_coreは、以前の最後の正常フレームに係るコアの復号化モードであり、周波数ドメイン(FREQ_CORE)あるいは時間ドメイン(TIME_CORE)を例として挙げることができる。
図6は、本発明の一実施形態によるスペクトル復号化部の構成を示したブロック図である。図6に図示されたスペクトル復号化部600は、無損失復号化部610、パラメータ逆量子化部620、ビット割当て部630、スペクトル逆量子化部640、ノイズ・フィリング部650及びスペクトル・シェーピング部660を含んでもよい。ここで、ノイズ・フィリング部650は、スペクトル・シェーピング部660の後端に位置することもできる。各構成要素は、少なくとも一つ以上のモジュールに一体化され、少なくとも一つ以上のプロセッサ(図示せず)でもって具現される。
図6を参照すれば、無損失復号化部610は、符号化過程で無損失符号化が行われたパラメータ、例えば、norm値に対して無損失復号化を行うことができる。
パラメータ逆量子化部620は、無損失復号化されたnorm値に対して逆量子化を行うことができる。符号化過程で、norm値は、多様な方式、例えば、VQ(vector quantization)、SQ(scalar quantization)、TCQ(trellis coded quantization)、LVQ(lattice vector quantization)などを利用して量子化され、対応する方式を使用して逆量子化を行うことができる。
ビット割当て部630は、量子化されたnorm値に基づいて、帯域別に必要となるビットを割り当てることができる。その場合、帯域別に割り当てられたビットは、符号化過程で割り当てられるビットと同一である。
スペクトル逆量子化部640は、帯域別に割り当てられたビットを使用して、逆量子化過程を遂行し、正規化されたスペクトル係数を生成することができる。
ノイズ・フィリング部650は、帯域別にノイズ・フィリングを必要とする部分に対して、ノイズ信号を充填することができる。
スペクトル・シェーピング部660は、逆量子化されたnorm値を利用して、正規化されたスペクトル係数をシェーピングすることができる。スペクトル・シェーピング過程を介して、最終的に復号化されたスペクトル係数が得られる。
図7は、本発明の一実施形態によるフレームエラー隠匿部の構成を示したブロック図である。図7に図示されたフレームエラー隠匿部700は、信号特性判断部710、パラメータ制御部730、回帰分析部750、利得算出部770及びスケーリング部790を含んでもよい。各構成要素は、少なくとも一つ以上のモジュールに一体化され、少なくとも一つ以上のプロセッサ(図示せず)でもって具現される。
図7を参照すれば、信号特性判断部710は、復号化された信号を利用して信号の特性を判断し、復号化された信号の特性をトランジェント、normal、stationaryなどに分類する。そのうち、トランジェント・フレームを判断する方法は、次の通りである。一実施形態によれば、以前フレームのフレームエネルギー及び移動平均エネルギーを利用して、現在フレームがトランジェントであるか否かを判断することができる。そのために、正常フレームについて得られる移動平均エネルギー(Energy_MA)と差エネルギー(Energy_diff)とを使用することができる。Energy_MAとEnergy_diffとを得る方法は、次の通りである。
フレームのエネルギーまたはnorm値の和をEnergy_Currとすれば、Energy_MAは、Energy_MA=Energy_MA*0.8+Energy_Curr*0.2のように求めることができる。そのとき、Energy_MAの初期値は、例えば、100に設定することができる。
次に、Energy_diffは、Energy_MAとEnergy_Currとの差を正規化させたものであり、Energy_diff=(Energy_Curr−Energy_MA)/Energy_MAのように示すことができる。
トランジェント判断部710は、Energy_diffが所定のしきい値、例えば、1.0以上である場合、現在フレームをトランジェントと判断することができる。ここで、Energy_diffが1.0である場合には、Energy_CurrがEnergy_MAの2倍であるということを示し、以前フレームと比べ、現在フレームのエネルギー変動が非常に大きいということを意味する。
信号特性判断部710で決定された信号特性、エンコーダから伝送された情報であるフレームタイプや符号化モードなどを利用して、フレームエラー隠匿のためのパラメータを制御することができる。一方、トランジェント判断は、エンコーダから伝送された情報を利用したり、あるいは信号特性判断部710で求められたトランジェント情報を利用することができる。ところで、二つを同時に利用する場合には、下記のような条件を利用することができる。すなわち、エンコーダから伝送されたトランジェント情報であるis_transientが1であるか、あるいはデコーダで求められた情報であるEnergy_diffがしきい値(ED_THRES)、例えば、1.0以上である場合、現在フレームが、エネルギー変化がはなはだしいトランジェント・フレームであるということを意味し、従って、回帰分析に使用される以前正常フレームの個数(num_pgf)を減少させ、それ以外の場合は、トランジェントしていないフレームと判断し、以前正常フレームの個数(num_pgf)を増加させることができる。
if((Energy_diff<ED_THRES)&&(is_transient==0))
{
num_pgf = 4;
}
else
{
num_pgf = 2;
}
ここでED_THRESは、しきい値であり、一例によれば、1.0に設定することができる。
前述のトランジェント判断結果によって、フレームエラー隠匿のためのパラメータを制御することができる。ここで、フレームエラー隠匿のためのパラメータの例としては、回帰分析に使用された以前正常フレームの個数を有することができる。フレームエラー隠匿のためのパラメータの他の例としては、バーストエラー区間に係わるスケーリング方式を有することができる。1つのバーストエラー区間で、同一のEnergy_diff値を使用することができる。エラーフレームである現在フレームがトランジェントではないと判断されれば、バーストエラーが発生した場合、例えば、5番目のフレームからは、以前フレームで復号化されたスペクトル係数について、回帰分析とは別途に、強制的に3dBずつ固定された値でスケーリングすることができる。一方、エラーフレームである現在フレームがトランジェントと判断されれば、バーストエラーが発生した場合、例えば、2番目のフレームからは、以前フレームで復号化されたスペクトル係数について、回帰分析とは別途に、強制的に3dBずつ固定された値でスケーリングすることができる。フレームエラー隠匿のためのパラメータの他の例としては、適応的ミューティング及びランダム符号の適用方式を有することができる。それについては、スケーリング部790で説明する。
回帰分析部750は、保存されている以前フレームに係わるパラメータを利用して、回帰分析を行うことができる。回帰分析は、単一のエラーフレームについて行うこともでき、バーストエラーが発生した場合に限定して行うこともできる。回帰分析を行うエラーフレームの条件については、デコーダ設計時にあらかじめ定義される。もし単一のエラーフレームで回帰分析を行う場合には、エラーが発生したフレームで即時に行うことができる。遂行された結果によって求められた関数によって、エラーフレームで必要なパラメータを予測する。
もしバーストエラーが発生したときに回帰分析を行う場合、下記のように、連続したエラーフレームの個数を意味するbfi_cntが2、すなわち、2番目に連続したエラーフレームから回帰分析を行う。その場合、最初のエラーフレームは、以前フレームで求めたスペクトル係数を単純反復したり、あるいは決定された値ほどスケーリングする方法が可能である。
if (bfi_cnt==2){
regression_anaysis();
}if
一方、周波数ドメインでは、時間ドメインでオーバーラッピングされた信号を変換した結果に対して、連続したエラーが発生しなかったにもかかわらず、連続したエラーと類似した問題が発生しうる。例えば、1フレーム飛ばしてエラーが発生する場合、すなわち、エラーフレーム−正常フレーム−エラーフレームの順序でエラーが発生すれば、50%のオーバーラッピングで変換ウィンドウを構成した場合、中間に正常フレームが存在するにもかかわらず、音質は、エラーフレーム−エラーフレーム−エラーフレームの順序でエラーが発生した場合と大差がない。それは、後述する図16Cでのように、フレームnが正常フレームだとしても、n−1フレームとn+1フレームとがエラーフレームである場合、オーバーラッピング過程で、全く異なる信号が作られるからである。従って、エラーフレーム−正常フレーム−エラーフレームの順序でエラーが発生する場合、2番目のエラーが発生する3番目のフレームのbfi_cntは、1であるが、1を強制的に増加させる。その結果、bfi_cntが2になり、バーストエラーが発生したと判断され、回帰分析が使用される。
if((prev_old_bfi==1) && (bfi_cnt==1))
{
st->bfi_cnt++;
}
if(bfi_cnt==2){
regression_anaysis();
}
ここで、prev_old_bfiは、2フレーム以前のフレームエラー情報を意味する。前記過程は、現在フレームがエラーフレームである場合に適用される。
回帰分析部750は、低い複雑度のために、2個以上の帯域を1つのグループで構成し、各グループの代表値を導き出し、代表値に対して回帰分析を適用することができる。代表値の一例としては、平均値、中間値、最大値などを使用することができるが、それらに限定されるものではない。一実施形態によれば、各グループに含まれた帯域のnorm平均値であるグルーピングされたnormの平均ベクトルを代表値として使用することができる。
一方、信号特性判断部710で決定された信号特性や、エンコーダから伝送された情報であるフレームタイプなどを利用して、現在フレームの特性を決定するとき、現在フレームがトランジェント・フレームと決定された場合には、回帰分析のための以前正常フレーム(PGF)の個数を減らし、正常(stationary)フレームである場合には、以前正常フレーム(PGF)の個数を増やす。一実施形態によれば、以前フレームのトランジェントいかんを意味するis_transientが1である場合、すなわち、以前フレームがトランジェントである場合には、以前正常フレーム(PGF)の個数(num_pgf)を2に設定し、それ以外の正常フレームについては、4に設定することができる。
if(is_transient==1)
{
num_pgf = 2;
}
else
{
num_pgf = 4;
}
そして、回帰分析のための行列のロウ(row)の個数は、一例を挙げ、2に設定することができる。
回帰分析部750での回帰分析の結果、エラーフレームについて、各グループの平均normを予測することができる。すなわち、エラーフレームで、1つのグループに属する各帯域は、同一のnorm値と予測される。具体的には、回帰分析部750は、回帰分析を介して、後述する線形回帰分析方程式あるいは非線形回帰分析方程式で、a及びb値を算出し、算出されたa及びb値を利用して、エラーフレームのaverage grouped normをグループ別に予測することができる。
利得算出部770は、エラーフレームについて予測された各グループの平均normと、直前good frameでの各グループの平均normとの利得を求めることができる。
スケーリング部790は、利得算出部770で求められた利得を、直前good frameのスペクトル係数に乗じ、エラーフレームのスペクトル係数を生成することができる。
一方、スケーリング部790は、一実施形態によれば、入力信号の特性によって、エラーフレームについて適応的ミューティング(adaptive muting)を適用したり、あるいは予測されたスペクトル係数について、ランダム符号(random sign)を適用することができる。
まず、入力信号を、トランジェント信号と、トランジェントではない信号とに区分することができる。トランジェントではない信号のうち、正常(stationary)である信号を分類し、他の方式で処理することができる。例えば、入力信号に、高調波成分が多く存在すると判断された場合、信号の変化が大きくない正常(stationary)である信号と決定し、それに対応したエラー隠匿アルゴリズムを実行することができる。一般的に、入力信号の高調波情報は、エンコーダから伝送される情報を利用することができる。低い複雑度を必要としない場合には、デコーダで合成された信号を利用して求めることもできる。
入力信号を、トランジェント信号、正常な信号、そして残りの信号の三種に大別する場合、適応的ミューティング及びランダム符号は、下記のように適用される。ここで、mute_startが意味する数字は、連続したエラーが発生したとき、bfi_cntがmute_start以上である場合、強制的にミューティングを始めるということを意味する。ランダム符号と係わるrandom_startも同一の方式で解釈される。
if((old_clas == HARMONIC) && (is_transient==0)) /* Stationaryである場合 */
{
mute_start = 4;
random_start = 3;
}
else if((Energy_diff<ED_THRES) && (is_transient==0)) /* 残りの信号 */
{
mute_start = 3;
random_start = 2;
}
else /* Transientである信号 */
{
mute_start = 2;
random_start = 2;
}
ここで、適応的ミューティングを適用する方式は、スケーリング遂行時、強制的に固定された値にダウンさせる。例えば、現在フレームのbfi_cntが4であり、現在フレームが正常(stationary)フレームである場合には、現在フレームで、スペクトル係数のスケーリングを3dBずつダウンさせる。
そして、スペクトル係数の符号をランダムに修正するのは、フレームごとにスペクトル係数の反復によって発生する変調ノイズ(modulation noise)を低減させるためのものである。ランダム符号を適用する方式としては、多様な公知の方式を使用することができる。
一実施形態によれば、フレームの全体スペクトル係数に対してランダム符号を適用することもでき、他の実施形態によれば、ランダム符号を適用し始める周波数帯域をあらかじめ定義した後、定義された周波数帯域以上について、ランダム符号を適用することができる。その理由は、非常に低い周波数帯域では、符号の変化によって、波形やエネルギーが大きく変わる場合が生じるので、非常に低い周波数帯域、すなわち、例えば、200Hz以下、または最初の帯域では、以前フレームと同一のスペクトル係数の符号を使用する方が、さらに良好な性能を有することができるのである。
図8は、本発明の一実施形態によるメモリ更新部の構成を示したブロック図である。図8に図示されたメモリ更新部800は、第1パラメータ獲得部820、normグルーピング部840、第2パラメータ獲得部860及び保存部880を含んでもよい。
図8を参照すれば、第1パラメータ獲得部820は、トランジェントいかんを判断するためのEnergy_CurrとEnergy_MAとの値を求め、求められたEnergy_CurrとEnergy_MAとの値を保存部880に提供する。
normグルーピング部840は、あらかじめ定義されたグループに、norm値をグルーピングする。
第2パラメータ獲得部860は、グループ別平均norm値を求め、求められたグループ別平均normを、保存部880に提供する。
保存部880は、第1パラメータ獲得部820から提供されるEnergy_Curr値及びEnergy_MA値、第2パラメータ獲得部860から提供されるグループ別平均norm、エンコーダから伝送される現在フレームがトランジェントであるか否かを示すトランジェント・フラグ、現在フレームが時間ドメイン符号化であるか、周波数ドメイン符号化であるかを示す符号化モード、そしてgood frameに係わるスペクトル係数を現在フレームの値にアップデートして保存する。
図9は、本発明に適用された帯域分割の例を示したものである。48kHzの全帯域(fullband)の場合、20msサイズのフレームについて、50%のオーバーラッピングを支援し、MDCTを適用する場合、符号化するスペクトル係数の個数は、960個になる。もし20kHzまで符号化する場合、符号化されるスペクトル係数の個数は、800個になる。
図9において、A部分は、狭帯域(narrowband)に該当し、0〜3.2kHzまで支援し、帯域当たり8個のサンプルを利用して、全16個のサブバンドに分割した例である。B部分は、広帯域(wideband)を支援するために、狭帯域に追加される帯域に該当し、3.2〜6.4kHzまで追加して支援し、帯域当たり16個のサンプルを利用して、全8個のサブバンドに分割した例である。C部分は、超広帯域(super-wideband)を支援するために、広帯域に追加される帯域に該当し、6.4〜13.6kHzまで追加して支援し、帯域当たり24個のサンプルを利用して、全12個のサブバンドに分割した例である。D部分は、全帯域(fullband)を支援するために、超広帯域に追加される帯域に該当し、13.6〜20kHzまで追加して支援し、帯域当たり32個のサンプルを利用して、全8個のサブバンドに分割した例である。
サブバンドに分割された信号を符号化する方式は、多様なものがある。スペクトルのエンベロープを符号化するためには、帯域別エネルギー、スケールファクタまたはnormなどを利用することができる。スペクトルのエンベロープをまず符号化した後、帯域別微細構造(fine structure)、すなわち、スペクトル係数を符号化することができる。実施形態によれば、帯域別normを利用して、全体帯域のエンベロープを符号化することができる。normは、下記数式(1)を介して求められる。
Figure 2014531056
ここで、normに該当する値は、gであり、log scaleのnが、実際に量子化される。量子化されたnを利用して、量子化されたg値を求め、本来の入力信号xを、量子化されたg値で割れば、y値が求められ、そのy値に対して、微細構造量子化過程が遂行される。
図10は、本発明に適用された線形回帰分析と非線形回帰分析との概念を示したものであり、norm平均は、多くの帯域をまとめて求められた平均norm値であり、回帰分析が適用される対象である。以前フレームの平均norm値について、量子化されたg値を使用すれば、線形回帰分析になって、ログスケールである量子化されたn値を使用すれば、非線形回帰分析になる。その理由は、ログスケールでの線形値は、実際でには線形値であるからである。回帰分析に使用される以前正常フレームの個数を意味するPGF(previous good frame)数は、可変的に設定される。
線形回帰分析の一例は、下記数式(2)のように示すことができる。
Figure 2014531056
このように、一次方程式を使用する場合、a及びbを求めれば、今後の推移を予測することができる。数式(2)で、a,b値は、逆行列によって求めることができる。簡単に逆行列を求める方式は、Gauss−Jordan eliminationを利用することができる。
非線形回帰分析の一例は、下記数式(3)のように示すことができる。
Figure 2014531056
ここで、a及びbを求めれば、今後の推移を予測することができる。ここで、ln値はn値を利用して置き換えることができる。
図11は、本発明において回帰分析を適用するためにグルーピングされたサブバンド構造の一例を示したものである。図11を参照すれば、最初の領域は、8個の帯域が1つのグループになり、平均norm値を求め、以前フレームについて求められたグルーピングされた平均norm値を利用して、エラーフレームのグルーピングされた平均norm値を予測する。各帯域別に、具体的なバンドの使用例は、図12ないし図14のように示すことができる。
図12は、7.6kHzまで支援する広帯域(wideband)符号化のために回帰分析を適用する場合、グルーピングされたサブバンド構造の例を示したものである。図13は、13.6kHzまで支援する超広帯域(super-wideband)符号化のために回帰分析を適用する場合、グルーピングされたサブバンド構造の例を示したものである。図14は、20kHzまで支援する全帯域(fullband)符号化のために回帰分析を適用する場合、グルーピングされたサブバンド構造の例を示したものである。
グルーピングされたサブバンドで求められたグルーピングされた平均norm値は,1つのベクトルを形成し、そのベクトルを,グルーピングされたnormの平均ベクトル(average vector of the grouped norm)とする。グルーピングされたnormの平均ベクトルを利用して、図10で述べた行列式に代入し、勾配及びy切片にそれぞれ該当するa値及びb値を求めることができる。
図15Aないし図15Cは、16kHzまで支援し、帯域拡張(BWE)を使用する場合、超広帯域(super-wideband)について回帰分析を適用するためにグルーピングされたサブバンド構造の例を示したものである。
超広帯域で、20msのフレームサイズを、50%オーバーラッピングしてMDCTを行えば、全640個のスペクトル係数が得られる。実施形態では、コア(core)部分とBWE部分とを分離してグルーピングされたサブバンドを決定することができる。ここで、最初の開始部分からBWEが始める部分までを、コーダ符号化という。そのとき、コア部分とBWE部分とで使用されるスペクトル・エンベロープを示す方式は異なる。例えば、コア部分では、norm値またはスケールファクタなどを利用することができ、同様に、BWE部分でも、norm値またはスケールファクタなどを利用することができるが、コア部分とBWE部分とで、互いに異なるものを使用しても差し支えない。
図15Aは、コア符号化に多くのビットが使用された場合の例であり、図15B及び図15Cに行きつつ、コア符号化に割り当てられるビットが少なくなる。BWE部分は、各グルーピングされたサブバンドの例であり、各サブバンドの数字は、スペクトル係数の個数を示す。スペクトル・エンベロープのnormを利用する場合、回帰分析を利用したフレームエラー隠匿アルゴリズムは、次の通りである。まず、回帰分析は、BWE部分に該当するグルーピングされた平均norm値を利用してメモリを更新する。コア部分と独立して、以前フレームのBWE部分のグルーピングされた平均norm値を利用して、回帰分析を行い、現在フレームのグルーピングされた平均norm値を予測する。
図16Aないし図16Cは、次の正常フレームの時間信号を利用したオーバーラップ・アンド・アド方式の例を示したものである。
図16Aは、以前フレームがエラーフレームではない場合、以前フレームを利用して、反復や利得スケーリングを行う方法について説明する。一方、図16Bを参照すれば、さらなる遅延を使用しないように、オーバーラッピングを介してまだ復号化されていない部分についてのみ、次の正常フレームである現在フレームで復号化された時間ドメイン信号を、過去に反復しながらオーバーラッピングを行い、それに加え、利得スケーリングを行う。反復信号の大きさは、オーバーラッピングされる部分の大きさより小さいか、あるいはそれと同じ値が選択される。一実施形態によれば、オーバーラッピングされる部分の大きさは、13*L/20でもある。ここで、Lは、例えば、狭帯域(narrowband)である場合には、160、広帯域(wideband)である場合には、320、超広帯域(super-wideband)である場合には、640、全帯域(fullband)である場合には、960である。
一方、時間オーバーラッピング過程に使用される信号を導出するために次、の正常フレームの時間ドメイン信号を、反復を介して求める方式は、以下の通りである。
図16Bにおいて、n+2フレームの未来部分に表示された13*L/20サイズのブロックを、n+1フレームの同一位置に該当する未来部分にコピーし、既存値を置き換えならばスケールを調整する。ここで、スケーリングされる値の例は、−3dBである。コピーするとき、以前n+1フレームとの不連続性をなくすために、最初の3*L/20サイズについては、以前フレーム値である図16Bのn+1フレームで得られた時間ドメイン信号と、未来部分でコピーされた信号とについて、線形的にオーバーラッピングを行う。その過程を介して、最終的に、オーバーラッピングのための信号が得られ、修正されたn+1信号とn+2信号とがオーバーラッピングされれば、最終N+2フレームに係わる時間ドメイン信号が出力される。
一方、他の例として、図16Cを参照すれば、伝送されたビットストリームは、復号化過程を介して、「MDCT−domain decoded Spectrum」を構成する。例えば、50%のオーバーラッピングを使用する場合、実際パラメータの個数は、フレームサイズの2倍になる。復号化されたスペクトル係数に対して逆変換を行えば、同一サイズの時間ドメイン信号が生成され、時間ドメイン信号に対して、「Time windowing」過程を遂行し、ウィンドウイングされた信号(auOut)を生成する。ウィンドウイングされた信号に対して、「Time Overlap-and-add」過程を遂行し、最終「Time Output」を生成する。フレームnを基準とするとき、以前フレームでオーバーラッピングがなされていない部分(OldauOut)は、保存されて次のフレームで使用される。
図17は、本発明の一実施形態によるマルチメディア機器の構成を示したブロック図である。図17に図示されたマルチメディア機器1700は、通信部1710と復号化モジュール1730とを含んでもよい。また、復号化の結果として得られる復元されたオーディオ信号の用途によって、復元されたオーディオ信号を保存する保存部1750をさらに含んでもよい。また、マルチメディア機器1700は、スピーカ1770をさらに含んでもよい。すなわち、保存部1750とスピーカ1770は、オプションとして具備される。一方、図17に図示されたマルチメディア機器1700は、任意の符号化モジュール(図示せず)、例えば、一般的な符号化機能を遂行する符号化モジュールをさらに含んでもよい。ここで、復号化モジュール1730は、マルチメディア機器1700に具備される他の構成要素(図示せず)と共に一体化され、少なくとも1つの以上のプロセッサ(図示せず)でもって具現される。
図17を参照すれば、通信部1710は、外部から提供される符号化されたビットストリームと、オーディオ信号のうち少なくとも一つとを受信したり、あるいは復号化モジュール1730の復号化の結果として得られる復元されたオーディオ信号と、符号化の結果として得られるオーディオ・ビットストリームのうち少なくとも一つとを送信することができる。
通信部1710は、無線インターネット、無線イントラネット、無線電話網、無線LAN(local area network)、Wi−Fi(wireless fidelity)、WFD(Wi−Fi direct)、3G(generation)、4G(4generation)、ブルートゥース((登録商標)Bluetooth)、赤外線通信(IrDA:infrared data association)、RFID(radio frequency identification、UWB(ultra-wideband)、ジグビー((登録商標)Zigbee)、NFC(near field communication)のような無線ネットワーク、または有線電話網、有線インターネットのような有線ネットワークを介して、外部のマルチメディア機器とデータを送受信することができるように構成される。
復号化モジュール1730は、前述の本発明の多様な実施形態によるオーディオ復号化装置を利用して具現される。
保存部1750は、復号化モジュール1730で生成される復元されたオーディオ信号を保存することができる。一方、保存部1750は、マルチメディア機器1700の運用に必要な多様なプログラムを保存することができる。
スピーカ1770は、復号化モジュール1730で生成される復元されたオーディオ信号を外部に出力することができる。
図18は、本発明の他の実施形態によるマルチメディア機器の構成を示したブロック図である。図18に図示されたマルチメディア機器1800は、通信部1810、符号化モジュール1820及び復号化モジュール1830を含んでもよい。また、符号化の結果として得られるオーディオ・ビットストリーム、あるいは復号化の結果として得られる復元されたオーディオ信号の用途によって、オーディオ・ビットストリームあるいは復元されたオーディオ信号を保存する保存部1840をさらに含んでもよい。また、マルチメディア機器1800は、マイクロホン1850あるいはスピーカ1860をさらに含んでもよい。ここで、符号化モジュール1820と復号化モジュール1830は、マルチメディア機器1800に具備される他の構成要素(図示せず)と共に一体化され、少なくとも一つ以上のプロセッサ(図示せず)でもって具現される。図18に図示された構成要素のうち、図17に図示されたマルチメディア機器1700の構成要素と重複される部分については、その詳細な説明を省略する。
図18において、符号化モジュール1820は、公知の多様な符号化アルゴリズムを搭載し、オーディオ信号に対して符号化を行い、ビットストリームを生成することができる。符号化アルゴリズムとしては、AMR−WB(adaptive multi-rate-wideband)、MPEG−2 & 4AAC(advanced audio coding)などを挙げることができるが、それらに限定されるものではない。
保存部1840は、符号化モジュール1820で生成される符号化されたビットストリームを保存することができる。一方、保存部1840は、マルチメディア機器1800の運用に必要な多様なプログラムを保存することができる。
マイクロホン1850は、ユーザあるいは外部のオーディオ信号を、符号化モジュール1820に提供することができる。
図17及び図18に図示されたマルチメディア機器1700,1800には、電話、モバイルフォンなどを含む音声通信専用端末、TV(television)、MP3プレーヤなどを含む放送あるいは音楽の専用装置、あるいは音声通信専用端末と、放送あるいは音楽の専用装置との融合端末装置が含まれるが、それらに限定されるものではない。また、マルチメディア機器1700,1800は、クライアント、サーバ、あるいはクライアントとサーバとの間に配置される変換器として使用される。
一方、マルチメディア機器1700,1800が、例えば、モバイルフォンである場合、図示されていないが、キーパッドのようなユーザ入力部、ユーザ・インターフェース、あるいはモバイルフォンで処理される情報をディスプレイするディスプレイ部、モバイルフォンの全般的な機能を制御するプロセッサをさらに含んでもよい。また、モバイルフォンは、撮像機能を有するカメラ部と、モバイルフォンで必要とする機能を遂行する少なくとも一つ以上の構成要素とをさらに含んでもよい。
一方、マルチメディア機器1700,1800が、例えば、TVである場合、図示されていないが、キーパッドのようなユーザー入力部、受信された放送情報をディスプレイするディスプレイ部、TVの全般的な機能を制御するプロセッサをさらに含んでもよい。また、TVは、TVで必要とする機能を遂行する少なくとも一つ以上の構成要素をさらに含んでもよい。
前記実施形態による方法は、コンピュータで実行されるプログラムで作成可能であり、コンピュータで読み取り可能な記録媒体を利用して、前記プログラムを動作させる汎用デジタル・コンピュータで具現される。また、前述の本発明の実施形態で使用されるデータ構造、プログラム命令、あるいはデータファイルは、コンピュータで読み取り可能な記録媒体に多様な手段を介して記録される。コンピュータで読み取り可能な記録媒体は、コンピュータ・システムによって読み取り可能なデータが保存される全種の保存装置を含んでもよい。コンピュータで読み取り可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体(magnetic media);CD(compact disc)−ROM(read-only memory)、DVD(digital versatile disc)のような光記録媒体(optical media);フロプティカルディスク(floptical disk)のような磁気・光媒体(magneto-optical media);及びROM、RAM(random-access memory)、フラッシュメモリのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置が含まれる。また、コンピュータで読み取り可能な記録媒体は、プログラム命令、データ構造などを指定する信号を伝送する伝送媒体でもある。プログラム命令の例としては、コンパイラによって作われるような械語コードだけではなく、インタープリタなどを使用して、コンピュータによって実行される高級言語コードを含んでもよい。
以上、本発明の一実施形態は、たとえ限定された実施形態と図面とによって説明したにしても、本発明の一実施形態は、前述の実施形態に限定されるものではなく、本発明が属する分野で当業者であるならば、そのような記載から、多様な修正及び変形が可能であろう。従って、本発明のスコープは、前述の説明ではなく、特許請求の範囲にしめされており、それと均等または等価的変形は、いずれも本発明技術的思想の範疇に属するものである。

Claims (12)

  1. エラーフレームをなす第1複数個の帯域から構成された複数個のグループについて、グループ単位で回帰分析を行ってパラメータを予測する段階と、
    グループ別に予測されたパラメータを利用して、前記エラーフレームのエラーを隠匿する段階と、を含むフレームエラー隠匿方法。
  2. 前記予測されたパラメータは、各グループに含まれる第2複数個の帯域の平均エネルギーであることを特徴とする請求項1に記載のフレームエラー隠匿方法。
  3. 前記パラメータ予測段階は、
    前記第1複数個の帯域から、前記複数個のグループを構成する段階と、
    前記エラーフレームの信号特性を判断する段階と、
    前記判断段階の結果によって、回帰分析に使用される以前正常フレームの個数を決定し、決定された個数の以前正常フレームを利用して、グループ単位で前記回帰分析を行う段階と、を含むことを特徴とする請求項1に記載のフレームエラー隠匿方法。
  4. 前記信号特性判断段階は、エンコーダから伝送されるトランジェント・フラグを利用して、以前フレームがトランジェントである場合、前記エラーフレームをトランジェントと判断することを特徴とする請求項3に記載のフレームエラー隠匿方法。
  5. 前記信号特性判断段階は、以前正常フレームまで求められる移動平均エネルギーと、前記以前正常フレームと、前記移動平均エネルギーとの差エネルギーと、を利用して、前記差エネルギーと、所定のしきい値との比較結果により、前記エラーフレームをトランジェントと判断することを特徴とする請求項3に記載のフレームエラー隠匿方法。
  6. 前記信号特性判断段階は、エンコーダから伝送されるトランジェント・フラグ、以前正常フレームまで求められる移動平均エネルギーと、前記エラーフレームと前記以前正常フレームとの差エネルギーと、を利用して遂行されることを特徴とする請求項3に記載のフレームエラー隠匿方法。
  7. 前記エラー隠匿段階は、
    前記グループ別に予測されたパラメータと、以前正常フレームで対応するグループのパラメータとの利得を求める段階と、
    前記エラーフレームのパラメータを生成するために、前記求められた利得を利用して、前記以前正常フレームの各帯域のパラメータをスケーリングする段階と、を含むことを特徴とする請求項1に記載のフレームエラー隠匿方法。
  8. 前記スケーリング段階では、前記エラーフレームが、バーストエラー区間を形成する場合、前記エラーフレームが、トランジェントであるか否かということにより、前記バーストエラー区間のうち一部について固定された値にスケーリングダウンさせることを特徴とする請求項7に記載のフレームエラー隠匿方法。
  9. 前記スケーリング段階では、前記エラーフレームが、バーストエラー区間を形成する場合、前記以前正常フレームの信号特性により、前記バーストエラー区間のうち一部についてスケーリングダウンさせることを特徴とする請求項7に記載のフレームエラー隠匿方法。
  10. 前記スケーリング段階では、前記エラーフレームが、バーストエラー区間を形成する場合、前記以前正常フレームの信号特性により、前記バーストエラー区間のうち一部についてランダム符号を適用することを特徴とする請求項7に記載のフレームエラー隠匿方法。
  11. 正常フレームについて復号化を行ってスペクトル係数を獲得する段階と、
    エラーフレームをなす第1複数個の帯域から構成された複数個のグループについて、グループ単位で回帰分析を行ってパラメータを予測し、グループ別に予測されたパラメータを利用して、前記エラーフレームのスペクトル係数を獲得する段階と、
    前記正常フレームあるいは前記エラーフレームの復号化されたスペクトル係数に対して時間ドメインに変換し、オーバーラップ処理及びアド処理を行って時間ドメインの信号に復元する段階と、を含むオーディオ復号化方法。
  12. 前記オーバーラップ処理及びアド処理は、現在フレームが正常フレームであり、以前の連続したエラーフレームの個数が2個以上であり、前記以前フレームがエラーフレームであり、前記最後の正常フレームの符号化モードが周波数ドメインである場合、前記現在フレームは、次の正常フレームの時間ドメイン信号とオーバーラッピングを行うことを特徴とする請求項11に記載のオーディオ復号化方法。
JP2014537002A 2011-10-21 2012-10-22 フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置 Active JP5973582B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161549953P 2011-10-21 2011-10-21
US61/549,953 2011-10-21
PCT/KR2012/008689 WO2013058635A2 (ko) 2011-10-21 2012-10-22 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2016139585A Division JP6259024B2 (ja) 2011-10-21 2016-07-14 フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置

Publications (2)

Publication Number Publication Date
JP2014531056A true JP2014531056A (ja) 2014-11-20
JP5973582B2 JP5973582B2 (ja) 2016-08-23

Family

ID=48141574

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2014537002A Active JP5973582B2 (ja) 2011-10-21 2012-10-22 フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置
JP2016139585A Active JP6259024B2 (ja) 2011-10-21 2016-07-14 フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置
JP2017235512A Active JP6546256B2 (ja) 2011-10-21 2017-12-07 フレームエラー隠匿方法及びその装置

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2016139585A Active JP6259024B2 (ja) 2011-10-21 2016-07-14 フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置
JP2017235512A Active JP6546256B2 (ja) 2011-10-21 2017-12-07 フレームエラー隠匿方法及びその装置

Country Status (9)

Country Link
US (4) US20130144632A1 (ja)
EP (1) EP2770503B1 (ja)
JP (3) JP5973582B2 (ja)
KR (3) KR102070430B1 (ja)
CN (3) CN107068156B (ja)
MX (1) MX338070B (ja)
TR (1) TR201908217T4 (ja)
TW (2) TWI610296B (ja)
WO (1) WO2013058635A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016184182A (ja) * 2011-10-21 2016-10-20 サムスン エレクトロニクス カンパニー リミテッド フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置
JP2021036332A (ja) * 2014-07-28 2021-03-04 サムスン エレクトロニクス カンパニー リミテッド パケット損失隠匿方法
JP2022521188A (ja) * 2019-02-21 2022-04-06 テレフオンアクチーボラゲット エルエム エリクソン(パブル) Mdct係数からのスペクトル形状予測

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103516440B (zh) * 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
EP3098811B1 (en) * 2013-02-13 2018-10-17 Telefonaktiebolaget LM Ericsson (publ) Frame error concealment
WO2014175617A1 (ko) * 2013-04-23 2014-10-30 ㈜ 소닉티어 직접 오디오 채널 데이터 및 간접 오디오 채널 데이터를 이용한 스케일러블 디지털 오디오 인코딩/디코딩 방법 및 장치
CA2916150C (en) * 2013-06-21 2019-06-18 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method realizing improved concepts for tcx ltp
CN110867190B (zh) * 2013-09-16 2023-10-13 三星电子株式会社 信号编码方法和装置以及信号解码方法和装置
CN103646647B (zh) * 2013-12-13 2016-03-16 武汉大学 混合音频解码器中帧差错隐藏的谱参数代替方法及系统
US10157620B2 (en) * 2014-03-04 2018-12-18 Interactive Intelligence Group, Inc. System and method to correct for packet loss in automatic speech recognition systems utilizing linear interpolation
EP2980797A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition
TWI602172B (zh) 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
BR112018067944B1 (pt) * 2016-03-07 2024-03-05 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Unidade de ocultação de erro, método de ocultação de erro,decodificador de áudio, codificador de áudio, método para fornecer uma representação de áudio codificada e sistema
TWI789577B (zh) * 2020-04-01 2023-01-11 同響科技股份有限公司 音訊資料重建方法及系統
CN111726629B (zh) * 2020-06-09 2022-02-11 绍兴图信科技有限公司 基于多元线性回归的smvq压缩数据隐藏方法
KR102492212B1 (ko) * 2020-10-19 2023-01-27 주식회사 딥히어링 음성 데이터의 품질 향상 방법, 및 이를 이용하는 장치
CN113035205B (zh) * 2020-12-28 2022-06-07 阿里巴巴(中国)有限公司 音频丢包补偿处理方法、装置及电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001013998A (ja) * 1999-06-30 2001-01-19 Matsushita Electric Ind Co Ltd 音声復号化装置及び符号誤り補償方法
JP2003099096A (ja) * 2001-09-26 2003-04-04 Toshiba Corp オーディオ復号処理装置及びこの装置に用いられる誤り補償装置
JP2004361731A (ja) * 2003-06-05 2004-12-24 Nec Corp オーディオ復号装置及びオーディオ復号方法
JP2005266458A (ja) * 2004-03-19 2005-09-29 Matsushita Electric Ind Co Ltd エラー補償装置およびエラー補償方法
WO2006049205A1 (ja) * 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル符号化装置
JP2007514977A (ja) * 2003-12-19 2007-06-07 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 改良された周波数領域におけるエラー隠蔽技術
JP2010511201A (ja) * 2006-11-28 2010-04-08 サムスン エレクトロニクス カンパニー リミテッド フレームエラー隠匿方法及び装置、これを利用した復号化方法及び装置
JP2011509428A (ja) * 2007-12-31 2011-03-24 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
JP2011075936A (ja) * 2009-09-30 2011-04-14 Panasonic Corp オーディオエンコーダ及びデコーダ

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR970011728B1 (ko) * 1994-12-21 1997-07-14 김광호 음향신호의 에러은닉방법 및 그 장치
US5636231A (en) 1995-09-05 1997-06-03 Motorola, Inc. Method and apparatus for minimal redundancy error detection and correction of voice spectrum parameters
JP2776775B2 (ja) * 1995-10-25 1998-07-16 日本電気アイシーマイコンシステム株式会社 音声符号化装置及び音声復号化装置
US6137915A (en) * 1998-08-20 2000-10-24 Sarnoff Corporation Apparatus and method for error concealment for hierarchical subband coding and decoding
US6327689B1 (en) * 1999-04-23 2001-12-04 Cirrus Logic, Inc. ECC scheme for wireless digital audio signal transmission
DE19921122C1 (de) * 1999-05-07 2001-01-25 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
US6658112B1 (en) * 1999-08-06 2003-12-02 General Dynamics Decision Systems, Inc. Voice decoder and method for detecting channel errors using spectral energy evolution
FR2813722B1 (fr) * 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
US7031926B2 (en) * 2000-10-23 2006-04-18 Nokia Corporation Spectral parameter substitution for the frame error concealment in a speech decoder
EP1339041B1 (en) 2000-11-30 2009-07-01 Panasonic Corporation Audio decoder and audio decoding method
US7069208B2 (en) * 2001-01-24 2006-06-27 Nokia, Corp. System and method for concealment of data loss in digital audio transmission
US7590525B2 (en) * 2001-08-17 2009-09-15 Broadcom Corporation Frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
DE60217522T2 (de) * 2001-08-17 2007-10-18 Broadcom Corp., Irvine Verbessertes verfahren zur verschleierung von bitfehlern bei der sprachcodierung
EP1722359B1 (en) * 2004-03-05 2011-09-07 Panasonic Corporation Error conceal device and error conceal method
CN1989548B (zh) * 2004-07-20 2010-12-08 松下电器产业株式会社 语音解码装置及补偿帧生成方法
KR100686174B1 (ko) * 2005-05-31 2007-02-26 엘지전자 주식회사 오디오 에러 은닉 방법
KR100736041B1 (ko) * 2005-06-30 2007-07-06 삼성전자주식회사 에러 은닉 방법 및 장치
KR100723409B1 (ko) 2005-07-27 2007-05-30 삼성전자주식회사 프레임 소거 은닉장치 및 방법, 및 이를 이용한 음성복호화 방법 및 장치
US8620644B2 (en) * 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
KR101292771B1 (ko) * 2006-11-24 2013-08-16 삼성전자주식회사 오디오 신호의 오류은폐방법 및 장치
CN101046964B (zh) * 2007-04-13 2011-09-14 清华大学 基于重叠变换压缩编码的错误隐藏帧重建方法
CN101399040B (zh) * 2007-09-27 2011-08-10 中兴通讯股份有限公司 一种帧错误隐藏的谱参数替换方法
CN100550712C (zh) * 2007-11-05 2009-10-14 华为技术有限公司 一种信号处理方法和处理装置
CN101207665B (zh) 2007-11-05 2010-12-08 华为技术有限公司 一种衰减因子的获取方法
US8301440B2 (en) * 2008-05-09 2012-10-30 Broadcom Corporation Bit error concealment for audio coding systems
WO2009152124A1 (en) 2008-06-10 2009-12-17 Dolby Laboratories Licensing Corporation Concealing audio artifacts
KR101228165B1 (ko) * 2008-06-13 2013-01-30 노키아 코포레이션 프레임 에러 은폐 방법, 장치 및 컴퓨터 판독가능한 저장 매체
DE102008042579B4 (de) 2008-10-02 2020-07-23 Robert Bosch Gmbh Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten
EP2458585B1 (en) * 2010-11-29 2013-07-17 Nxp B.V. Error concealment for sub-band coded audio signals
BR112013020324B8 (pt) * 2011-02-14 2022-02-08 Fraunhofer Ges Forschung Aparelho e método para supressão de erro em fala unificada de baixo atraso e codificação de áudio
CN107068156B (zh) 2011-10-21 2021-03-30 三星电子株式会社 帧错误隐藏方法和设备以及音频解码方法和设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001013998A (ja) * 1999-06-30 2001-01-19 Matsushita Electric Ind Co Ltd 音声復号化装置及び符号誤り補償方法
JP2003099096A (ja) * 2001-09-26 2003-04-04 Toshiba Corp オーディオ復号処理装置及びこの装置に用いられる誤り補償装置
JP2004361731A (ja) * 2003-06-05 2004-12-24 Nec Corp オーディオ復号装置及びオーディオ復号方法
JP2007514977A (ja) * 2003-12-19 2007-06-07 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 改良された周波数領域におけるエラー隠蔽技術
JP2005266458A (ja) * 2004-03-19 2005-09-29 Matsushita Electric Ind Co Ltd エラー補償装置およびエラー補償方法
WO2006049205A1 (ja) * 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル符号化装置
JP2010511201A (ja) * 2006-11-28 2010-04-08 サムスン エレクトロニクス カンパニー リミテッド フレームエラー隠匿方法及び装置、これを利用した復号化方法及び装置
JP2011509428A (ja) * 2007-12-31 2011-03-24 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
JP2011075936A (ja) * 2009-09-30 2011-04-14 Panasonic Corp オーディオエンコーダ及びデコーダ

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016184182A (ja) * 2011-10-21 2016-10-20 サムスン エレクトロニクス カンパニー リミテッド フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置
US10468034B2 (en) 2011-10-21 2019-11-05 Samsung Electronics Co., Ltd. Frame error concealment method and apparatus, and audio decoding method and apparatus
US10984803B2 (en) 2011-10-21 2021-04-20 Samsung Electronics Co., Ltd. Frame error concealment method and apparatus, and audio decoding method and apparatus
US11657825B2 (en) 2011-10-21 2023-05-23 Samsung Electronics Co., Ltd. Frame error concealment method and apparatus, and audio decoding method and apparatus
JP2021036332A (ja) * 2014-07-28 2021-03-04 サムスン エレクトロニクス カンパニー リミテッド パケット損失隠匿方法
US11417346B2 (en) 2014-07-28 2022-08-16 Samsung Electronics Co., Ltd. Method and apparatus for packet loss concealment, and decoding method and apparatus employing same
JP7126536B2 (ja) 2014-07-28 2022-08-26 サムスン エレクトロニクス カンパニー リミテッド パケット損失隠匿方法
JP2022521188A (ja) * 2019-02-21 2022-04-06 テレフオンアクチーボラゲット エルエム エリクソン(パブル) Mdct係数からのスペクトル形状予測
JP7335968B2 (ja) 2019-02-21 2023-08-30 テレフオンアクチーボラゲット エルエム エリクソン(パブル) Mdct係数からのスペクトル形状予測
US11862180B2 (en) 2019-02-21 2024-01-02 Telefonaktiebolaget Lm Ericsson (Publ) Spectral shape estimation from MDCT coefficients

Also Published As

Publication number Publication date
US10468034B2 (en) 2019-11-05
JP5973582B2 (ja) 2016-08-23
MX338070B (es) 2016-04-01
TWI610296B (zh) 2018-01-01
CN104011793B (zh) 2016-11-23
JP6259024B2 (ja) 2018-01-10
JP6546256B2 (ja) 2019-07-17
JP2016184182A (ja) 2016-10-20
US10984803B2 (en) 2021-04-20
KR20200143348A (ko) 2020-12-23
US20130144632A1 (en) 2013-06-06
MX2014004796A (es) 2014-08-21
CN104011793A (zh) 2014-08-27
EP2770503B1 (en) 2019-05-29
KR102328123B1 (ko) 2021-11-17
WO2013058635A2 (ko) 2013-04-25
KR20130044194A (ko) 2013-05-02
US20190172469A1 (en) 2019-06-06
US20200066284A1 (en) 2020-02-27
CN107103910B (zh) 2020-09-18
CN107068156A (zh) 2017-08-18
TW201337912A (zh) 2013-09-16
KR102070430B1 (ko) 2020-01-28
TWI585747B (zh) 2017-06-01
TW201725581A (zh) 2017-07-16
US11657825B2 (en) 2023-05-23
KR102194558B1 (ko) 2020-12-23
EP2770503A2 (en) 2014-08-27
CN107103910A (zh) 2017-08-29
WO2013058635A3 (ko) 2013-06-20
TR201908217T4 (tr) 2019-06-21
EP2770503A4 (en) 2015-09-30
KR20200013253A (ko) 2020-02-06
US20210217427A1 (en) 2021-07-15
CN107068156B (zh) 2021-03-30
JP2018041109A (ja) 2018-03-15

Similar Documents

Publication Publication Date Title
JP6259024B2 (ja) フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置
KR102117051B1 (ko) 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치
JP6346322B2 (ja) フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140617

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160614

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160714

R150 Certificate of patent or registration of utility model

Ref document number: 5973582

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250