JP2014523548A - 帯域幅拡張信号生成装置及びその方法 - Google Patents

帯域幅拡張信号生成装置及びその方法 Download PDF

Info

Publication number
JP2014523548A
JP2014523548A JP2014518822A JP2014518822A JP2014523548A JP 2014523548 A JP2014523548 A JP 2014523548A JP 2014518822 A JP2014518822 A JP 2014518822A JP 2014518822 A JP2014518822 A JP 2014518822A JP 2014523548 A JP2014523548 A JP 2014523548A
Authority
JP
Japan
Prior art keywords
frequency band
spectrum
encoding
decoding
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014518822A
Other languages
English (en)
Other versions
JP2014523548A5 (ja
JP6001657B2 (ja
Inventor
チュ,キ−ヒョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2014523548A publication Critical patent/JP2014523548A/ja
Publication of JP2014523548A5 publication Critical patent/JP2014523548A5/ja
Application granted granted Critical
Publication of JP6001657B2 publication Critical patent/JP6001657B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Abstract

低周波数帯域のスペクトルに対して、反希薄性処理を行う反希薄性処理部と、反希薄性処理が行われた低周波数帯域のスペクトルを利用して、周波数ドメインで高周波数帯域の拡張復号化を行うFD高周波数拡張復号化部と、を備える帯域幅拡張信号生成装置である。

Description

本発明は、オーディオ符号化/復号化に係り、より詳しくは、高帯域のための帯域幅拡張信号に存在するメタリックノイズを減少させる帯域幅拡張信号生成装置及びその方法に関する。
高周波数領域に該当する信号は、低周波数領域に該当する信号に比べて、周波数の微細構造に敏感性が低い。したがって、オーディオ信号を符号化する時に使用可能なビットの制約を克服するために、符号化効率を向上させる場合、低周波数領域に該当する信号に、多くのビットを割り当てて符号化する一方、高周波数領域に該当する信号に、相対的に少ないビットを割り当てて符号化する。
かかる方式が適用された技術がSBR(Spectral Band Replication)である。SBRは、スペクトルの低帯域またはコア帯域のような下部帯域を符号化する一方、高帯域のような上部帯域は、包絡線のようなパラメータを利用して符号化する。SBRは、下部帯域の特徴を抽出して、上部帯域を予測するように、下部帯域と上部帯域の相関関係を利用する。
かかるSBR技術において、高帯域のための帯域幅拡張信号を生成するためのさらに改善された方法が要求される。
本発明が解決しようとする課題は、高帯域のための帯域幅拡張信号に存在するメタリックノイズを減少させる帯域幅拡張信号生成装置及び方法を提供することにある。
前記課題を解決するための本発明の一実施形態による帯域幅拡張信号生成方法は、低周波数帯域のスペクトルに対して、反希薄性処理を行うステップと、前記反希薄性処理が行われた低周波数帯域のスペクトルを利用して、周波数ドメインで高周波数帯域の拡張符号化を行うステップと、を含む。
前記課題を解決するための本発明の他の実施形態による帯域幅拡張信号生成装置は、低周波数帯域のスペクトルに対して、反希薄性処理を行う反希薄性処理部と、前記反希薄性処理が行われた低周波数帯域のスペクトルを利用して、周波数ドメインで高周波数帯域の拡張復号化を行うFD高周波数拡張復号化部と、を備える。
本発明の一実施形態によるオーディオ符号化装置の構成を示すブロック図である。 図1に示したFD符号化部の一実施形態による構成を示すブロック図である。 図1に示したFD符号化部の他の実施形態による構成を示すブロック図である。 本発明の一実施形態による反希薄性処理部の構成を示すブロック図である。 本発明の一実施形態によるFD高周波数拡張符号化部の構成を示すブロック図である。 図1に示したFD符号化モジュールで拡張符号化が行われる領域を示す図面である。 図1に示したFD符号化モジュールで拡張符号化が行われる領域を示す図面である。 本発明の他の実施形態によるオーディオ符号化装置の構成を示すブロック図である。 本発明のさらに他の実施形態によるオーディオ符号化装置の構成を示すブロック図である。 本発明の一実施形態によるオーディオ復号化装置の構成を示すブロック図である。 図9に示したFD復号化部の一実施形態による構成を示すブロック図である。 図10に示したFD高周波数拡張復号化部の一実施形態による構成を示すブロック図である。 本発明の他の実施形態によるオーディオ復号化装置の構成を示すブロック図である。 本発明のさらに他の実施形態によるオーディオ復号化装置の構成を示すブロック図である。 本発明の一実施形態によるコードブック共有方法を説明する図面である。 本発明の一実施形態による符号化モードシグナリング方法を説明する図面である。
本発明は、多様な変換が可能であり、色々な実施形態を有するところ、特定の実施形態を図面に例示し、詳細な説明に具体的に説明する。しかし、これは、本発明を特定の実施形態に対して限定しようとするものではなく、本発明の技術的思想及び技術範囲に含まれる全ての変換、均等物ないし代替物を含むものと理解される。本発明を説明するにあたって、関連した公知技術についての具体的な説明が、本発明の要旨を不明確にすると判断される場合、その詳細な説明を省略する。
第1、第2などの用語は、多様な構成要素を説明するのに使われるが、構成要素が用語によって限定されるものではない。用語は、一つの構成要素を、他の構成要素から区別する目的で使われる。
本発明において使用した用語は、単に特定の実施形態を説明するために使われたものであって、本発明を限定しようとする意図ではない。本発明において使用した用語は、本発明における機能を考慮しつつ、可能な限り現在広く使われる一般的な用語を選択したが、それは、当業者の意図、判例、または新たな技術の出現などによって変わるものである。また、特定の場合は、出願人が任意に選定した用語もあり、その場合、該当する発明の説明部分で詳細にその意味を記載する。したがって、本発明において使われる用語は、単純な用語の名称ではなく、その用語が有する意味と、本発明の全般的な内容に基づいて定義されなければならない。
単数の表現は、文脈上明白に取り立てて意味しない限り、複数の表現を含む。本発明において、“含む”または“有する”などの用語は、明細書上に記載された特徴、数字、ステップ、動作、構成要素、部品またはそれらを組み合わせたものが存在することを指定しようとするものであって、一つまたはそれ以上の他の特徴、数字、ステップ、動作、構成要素、部品またはそれらを組み合わせたものの存在または付加の可能性を予め排除しないものと理解されなければならない。
以下、本発明の実施形態を、添付図面を参照して詳細に説明する。ここで、同一のまたは対応する構成要素は、同一な図面番号を付与し、それについての重複説明は省略する。
図1は、本発明の一実施形態によるオーディオ符号化装置の構成を示すブロック図である。図1に示したオーディオ符号化装置は、マルチメディア機器を構成し、電話、モバイルフォンなどを含む音声通信専用端末機、TV、MP3プレーヤなどを含む放送あるいは音楽専用端末機、あるいは音声通信専用端末機と、放送あるいは音楽専用端末機との融合端末機が含まれるが、それらに限定されるものではない。また、オーディオ符号化装置は、クライアント、サーバー、あるいはクライアントとサーバーとの間に配置される変換機として使われる。
図1に示したオーディオ符号化装置100は、符号化モード決定部110、スイッチング部130、CELP(Code Excited Linear Prediction)符号化モジュール150、及びFD(Frequency Domain)符号化モジュール170を備える。CELP符号化モジュール150は、CELP符号化部151と、TD(Time Domain)拡張符号化部153とを備え、FD符号化モジュール170は、変換部171と、FD符号化部173とを備える。各構成要素は、少なくとも一つ以上のモジュールに一体化されて、少なくとも一つ以上のプロセッサ(図示せず)により具現される。
図1を参照すれば、符号化モード決定部110は、信号の特性を参照して、入力信号の符号化モードを決定する。符号化モード決定部110は、信号の特性によって、現在のフレームが音声モードであるか音楽モードであるかを決定し、また、現在のフレームに効率的な符号化モードが、TDモードであるかFDモードであるかを決定する。その時、フレームの短区間特性、あるいは複数のフレームの長区間特性などを利用して、信号の特性を把握できるが、それらに限定されるものではない。符号化モード決定部110は、信号の特性が音声モードあるいはTDモードに該当する場合には、CELPモードに決定し、信号の特性が音楽モードあるいはFDモードに該当する場合には、FDモードに決定する。
一実施形態によれば、符号化モード決定部110の入力信号は、ダウンサンプリング部(図示せず)によりダウンサンプリングされた信号となる。例えば、入力信号は、32kHzまたは48kHzのサンプリングレートを有する信号をリサンプリングあるいはダウンサンプリングして得られる12.8kHzまたは16kHzのサンプリングレートを有する信号となる。ここで、32kHzのサンプリングレートを有する信号は、SWB(Super Wide Band)信号であって、FB(Full Band)信号といい、16kHzのサンプリングレートを有する信号は、WB(Wide Band)信号という。
他の実施形態によれば、符号化モード決定部110は、リサンプリングあるいはダウンサンプリングの動作が行われてもよい。
これによれば、符号化モード決定部110は、リサンプリングあるいはダウンサンプリングされた信号に対して、符号化モードを決定する。
符号化モード決定部110により決定された符号化モードは、スイッチング部130に提供される一方、フレーム単位でビットストリームに含まれて保存あるいは伝送される。
スイッチング部130は、符号化モード決定部110から提供される符号化モードによって、入力信号を、CELP符号化モジュール150及びFD符号化モジュール170のうち一つに提供する。ここで、入力信号は、リサンプリングあるいはダウンサンプリングされた信号であって、12.8kHzまたは16kHzのサンプリングレートを有する低周波数帯域信号となる。具体的には、スイッチング部130は、符号化モードがCELPモードである場合、入力信号をCELP符号化モジュール150に提供し、符号化モードがFDモードである場合、入力信号をFD符号化モジュール170に提供する。
CELP符号化モジュール150は、符号化モードがCELPモードである場合に動作し、CELP符号化部151は、入力信号に対して、CELP符号化を行う。一実施形態によれば、CELP符号化部151は、リサンプリングあるいはダウンサンプリングされた信号から、励起信号を抽出し、抽出された励起信号を、ピッチ情報に該当するフィルタリングされた適応コードベクトル(すなわち、adaptive codebook contribution)、及びフィルタリングされた固定コードベクトル(すなわち、fixed or innovation codebook contribution)それぞれを考慮して量子化する。他の実施形態によれば、CELP符号化部151は、線形予測係数(Linear Prediction Coefficient: LPC)を抽出し、抽出された線形予測係数を量子化し、量子化された線形予測係数を利用して励起信号を抽出し、抽出された励起信号を、ピッチ情報に該当するフィルタリングされた適応コードベクトル(すなわち、adaptive codebook contribution)、及びフィルタリングされた固定コードベクトル(すなわち、fixed or innovation codebook contribution)それぞれを考慮して量子化する。
一方、CELP符号化部151は、信号の特性によって、異なる符号化モードを適用できる。適用される符号化モードとしては、有声音符号化モード、無声音符号化モード、トランジェント符号化モード、及び一般の符号化モードを有するが、それらに限定されるものではない。
CELP符号化部151の符号化結果として得られる低周波数帯域の励起信号、すなわち、CELP情報は、TD拡張符号化部153に提供される一方、ビットストリームに含まれて保存あるいは伝送される。
CELP符号化モジュール150において、TD拡張符号化部153は、CELP符号化部151から提供される低周波数帯域の励起信号をフォールディングあるいは複製して、高周波数帯域の拡張符号化を行う。TD拡張符号化部153の拡張符号化結果として得られる高周波数帯域の拡張情報は、ビットストリームに含まれて保存あるいは伝送される。TD拡張符号化部153は、入力信号の高周波数帯域に対応する線形予測係数を量子化する。その時、TD拡張符号化部153は、入力信号の高周波信号の線形予測係数を抽出し、抽出された線形予測係数を量子化することもできる。また、TD拡張符号化部153は、入力信号の低周波数帯域の励起信号を使用して、入力信号の高周波数帯域の線形予測係数を生成することもできる。ここで、高周波数帯域の線形予測係数は、高周波数帯域の包絡線情報を表すのに使われる。
一方、FD符号化モジュール170は、符号化モードがFDモードである場合に動作し、変換部171は、リサンプリングあるいはダウンサンプリングされた信号を、TDからFDに変換する。この時、MDCT(Modified Discrete Cosine Transform)を使用できるが、それに限定されるものではない。FD符号化モジュール170において、FD符号化部173は、変換部171から提供されるリサンプリングあるいはダウンサンプリングされたスペクトルに対して、FD符号化を行う。FD符号化の一例としては、AAC(Advanced Audio Codec)に適用されたアルゴリズムがあるが、それに限定されるものではない。FD符号化部173のFD符号化結果として得られるFD情報は、ビットストリームに含まれて保存あるいは伝送される。一方、隣接するフレーム間の符号化モードが、CELPモードからFDモードに変更される場合、FD符号化部173のFD符号化結果として得られるビットストリームに、予測データがさらに含まれる。具体的には、N番目のフレームに対して、CELPモードによる符号化が行われ、N+1番目のフレームに対して、FDモードによる符号化が行われれば、FDモードによる符号化結果のみで、N+1番目のフレームについての復号化を行うことができないので、復号化時に参照するための予測データをさらに含む必要がある。
図1に示したオーディオ符号化装置100によれば、符号化モード決定部110により決定された符号化モードによって、二つの形態のビットストリームが生成される。ここで、ビットストリームは、ヘッダ及びペイロードを含む。
具体的には、符号化モードがCELPモードである場合、ビットストリームは、ヘッダに、符号化モードについての情報を含み、ペイロードに、CELP情報及びTD拡張情報を含む。一方、符号化モードがFDモードである場合、ビットストリームは、ヘッダに、符号化モードについての情報を含み、ペイロードに、FD情報及び予測データを含む。ここで、FD情報は、FD高周波数拡張情報をさらに含む。
一方、各ビットストリームは、フレームエラーが発生する場合に備えるために、ヘッダに、以前のフレームの符号化モードについての情報をさらに含む。例えば、ビットストリームのヘッダは、現在のフレームの符号化モードがFDモードとして決定された場合、以前のフレームの符号化モードについての情報をさらに含む。
図1に示したオーディオ符号化装置100は、信号の特性によって、CELPモードまたはFDモードのうちいずれか一つに動作するようにスイッチングされることによって、信号の特性に適応的に効率的な符号化を行う。一方、図1のスイッチング構造は、望ましくは、高ビット率環境に適用される。
図2は、図1に示したFD符号化部の一実施形態による構成を示すブロック図である。
図2を参照すれば、FD符号化部200は、Norm符号化部210、FPC(Factorial Pulse Coding)符号化部230、FD低周波数拡張符号化部240、ノイズ付加情報生成部250、反希薄性処理部270、及びFD高周波数拡張符号化部290を備える。
Norm符号化部210は、変換部171(図1)から提供される周波数スペクトルに対して、周波数帯域、例えば、サブバンド別にNorm値を推定あるいは算出し、推定あるいは算出されたNorm値を量子化する。ここで、Norm値は、サブバンド単位で求められた平均スペクトルエネルギーを意味するものであって、パワーで代替してもよい。Norm値は、サブバンド単位で周波数スペクトルを正規化するのに使用する。また、ターゲットビット率による全体のビット数に対して、各サブバンド単位でNorm値を利用してマスキング閾値を計算し、マスキング閾値を利用して、各サブバンドの知覚的符号化に必要な割り当てビット数を、整数単位あるいは小数点単位で決定する。Norm符号化部210により量子化されたNorm値は、FPC符号化部230に提供される一方、ビットストリームに含まれて保存あるいは伝送される。
FPC符号化部230は、正規化されたスペクトルに対して、各サブバンドの割り当てビット数を利用して量子化を行い、量子化された結果に対して、FPC符号化を行う。FPC符号化によれば、割り当てられたビット数の範囲内で、パルスの位置、パルスの大きさ、及びパルスの符号のような情報が階乗形式で表現される。FPC符号化部230により得られるFPC情報は、ビットストリームに含まれて保存あるいは伝送される。
ノイズ付加情報生成部250は、FPC符号化結果によって、ノイズ付加情報、すなわち、サブバンド単位のノイズレベルを生成する。具体的には、FPC符号化部230により符号化された周波数スペクトルは、ビット数の不足によって、サブバンド単位に符号化されない部分、すなわち、ホールが発生する。一実施形態によれば、符号化されないスペクトル係数のレベルの平均を利用して、ノイズレベルを生成する。ノイズ付加情報生成部250により生成されたノイズレベルは、ビットストリームに含まれて保存あるいは伝送される。また、フレーム単位でノイズレベルを生成する。
反希薄性処理部270は、低周波数帯域についての復元スペクトルから、ノイズの付加位置及びノイズの大きさを決定し、ノイズレベルを利用して、ノイズフィリングが行われた周波数スペクトルに対して、決定されたノイズの付加位置及びノイズの大きさによる反希薄性処理を行って、FD高周波数拡張符号化部290に提供する。一実施形態によれば、低周波数帯域についての復元スペクトルは、FPC復号化結果に対して、低周波数帯域を拡張し、ノイズフィリングを行った後、反希薄性処理を行った結果物を意味する。
FD高周波数拡張符号化部290は、反希薄性処理部270から提供される低周波数帯域のスペクトルを利用して、高周波数帯域の拡張符号化を行う。その時、本来の高周波数帯域のスペクトルも、FD高周波数拡張符号化部290に提供される。一実施形態によれば、FD高周波数拡張符号化部290は、低周波数帯域のスペクトルをフォールディングあるいは複製して、拡張された高周波数帯域のスペクトルが得られ、本来の高周波数帯域のスペクトルに対して、サブバンド単位でエネルギーを抽出し、抽出されたエネルギーを調節し、調節されたエネルギーを量子化する。
エネルギーの調節は、一実施形態によれば、本来の高周波数帯域のスペクトルに対して、サブバンド単位で第1トナリティを算出し、低周波数帯域のスペクトルを利用して拡張された高周波数帯域の励起信号に対して、サブバンド単位で第2トナリティを算出して、第1トナリティと第2トナリティの割合に対応して行われる。または、エネルギーの制御は、他の実施形態によれば、本来の高周波数帯域のスペクトルに対して、サブバンド単位で第1トナリティを算出して、信号にノイズ成分が含まれた程度を表す第1ノイジネスファクタを求め、低周波数帯域のスペクトルを利用して、拡張された高周波数帯域の励起信号に対して、サブバンド単位で第2トナリティを算出して、第2ノイジネスファクタを求めて、第1ノイジネスファクタと第2ノイジネスファクタの割合に対応して行われる。それによれば、第2トナリティが第1トナリティよりも大きい場合、あるいは第1ノイジネスファクタが第2ノイジネスファクタよりも大きい場合、当該サブバンドのエネルギーを減少させることによって、復元時にノイズが増加する現象を防止できる。一方、逆の場合、当該サブバンドのエネルギーを増加させる。
一方、エネルギーの量子化には、MSVQ(Multistage Vector Quantization)方式が適用されるが、それに限定されるものではない。具体的には、FD高周波数拡張符号化部290は、現在のステージで、所定の個数のサブバンドのうち、奇数番目のサブバンドのエネルギーを集めてベクトル量子化を行い、奇数番目のサブバンドについてのベクトル量子化結果を利用して、偶数番目のサブバンドの予測エラーを獲得し、獲得された予測エラーについてのベクトル量子化を、次のステージで行う。一方、それとは逆の場合も可能である。すなわち、FD高周波数拡張符号化部290は、第n番目のサブバンドについてのベクトル量子化結果と、第n+2番目のサブバンドについてのベクトル量子化結果とを利用して、第n+1番目のサブバンドについての予測エラーを獲得する。
一方、エネルギーについてのベクトル量子化時、エネルギーベクトルそれぞれに対して平均値を差し引いた信号、あるいはエネルギーベクトルそれぞれの重要度についての加重値を計算する。その時、重要度についての加重値は、合成音の音質を最大化する方向に計算される。重要度についての加重値が計算された場合、加重値が適用されたWMSE(Weighted Mean Square Error)を利用して、エネルギーベクトルについての最適化された量子化インデックスを求める。
FD高周波数拡張符号化部290は、高周波数信号の特性によって、多様な励起信号生成方式を使用するマルチモード帯域幅拡張方式を適用できる。マルチモード帯域幅拡張方式は、高周波数信号の特性によって、トランジェントモード、ノーマルモード、ハーモニックモード、ノイズモードなどで動作する。FD高周波数拡張符号化部290は、静的なフレームに対して適用されるので、高周波数信号の特性によって、フレーム別にノーマルモード、ハーモニックモードまたはノイズモードのうち一つのモードを使用して、励起信号を生成する。
また、FD高周波数拡張符号化部290は、ビット率によって異なる高周波数帯域についての信号を生成する。すなわち、FD高周波数拡張符号化部290で拡張符号化が行われる高周波数帯域は、ビット率によって異なって設定される。例えば、FD高周波数拡張符号化部290は、16kbpsのビット率では、約6.4ないし14.4kHzの周波数帯域に対して拡張符号化を行い、16kbps以上のビット率では、約8ないし16kHzの周波数帯域に対して拡張符号化を行う。
このために、一実施形態によれば、FD高周波数拡張符号化部290は、異なるビット率に対して、同一なコードブックを共有して、エネルギー量子化を行う。
一方、FD符号化部200は、静的なフレームが入力される場合、Norm符号化部210、FPC符号化部230、ノイズ付加情報生成部250、反希薄性処理部270及びFD拡張符号化部290が動作する。特に、反希薄性処理部270は、静的なフレームのうち、ノーマルモードに対して動作することが望ましい。一方、非静的なフレーム、すなわち、トランジェントフレームが入力される場合、ノイズ付加情報生成部250、反希薄性処理部270及びFD拡張符号化部290は動作しない。その場合、FPC符号化部230は、静的なフレームが入力される場合と比較して、FPCを行うように割り当てられた上位周波数帯域Fcoreをさらに高く、例えば、Fendまで適用できる。
図3は、図1に示したFD符号化部の他の実施形態による構成を示すブロック図である。図3を参照すれば、FD符号化部300は、Norm符号化部310、FPC符号化部330、FD低周波数拡張符号化部340、反希薄性処理部370、及びFD高周波数拡張符号化部390を備える。ここで、Norm符号化部310、FPC符号化部330及びFD高周波数拡張符号化部390の動作は、図2のNorm符号化部210、FPC符号化部230及びFD高周波数拡張符号化部290の動作と同様であるので、詳細な説明は省略する。
図2との相違点は、反希薄性処理部370が別途のノイズレベルを使用せず、Norm符号化部310からサブバンド単位で得られるNorm値を利用するものである。すなわち、反希薄性処理部370は、低周波数帯域についての復元スペクトルから、ノイズの付加位置及びノイズの大きさを決定し、Norm値を利用してノイズフィリングが行われた周波数スペクトルに対して、決定されたノイズの付加位置及びノイズの大きさによる反希薄性処理を行い、FD高周波数拡張符号化部290に提供する。具体的には、0に逆量子化された部分を含むサブバンドに対して、ノイズ成分を生成し、ノイズ成分のエネルギーと、逆量子化されたNorm値、すなわち、スペクトルエネルギーとの比を利用して、ノイズ成分のエネルギーを調節する。他の実施形態によれば、0に逆量子化された部分を含むサブバンドに対して、ノイズ成分を生成し、ノイズ成分の平均エネルギーが1となるように調節する。
図4は、本発明の一実施形態による反希薄性処理部の構成を示すブロック図である。図4を参照すれば、反希薄性処理部400は、復元スペクトル生成部410、ノイズ位置決定部430、ノイズ大きさ決定部440、及びノイズ付加部450を備える。
復元スペクトル生成部410は、FPC符号化部230(図2)あるいはFPC符号化部330(図3)から提供されるFPC情報と、ノイズレベルあるいはNorm値のようなノイズフィリング情報とを利用して、低周波数帯域の復元スペクトルを生成する。その時、FcoreとFfpcとが異なる場合、FD低周波数拡張符号化をさらに行い、低周波数帯域の復元スペクトルを生成する。
ノイズ位置決定部430は、低周波数帯域の復元スペクトルから、0に復元されるスペクトルを、ノイズ位置として決定する。他の実施形態によれば、0に復元されるスペクトルのうち、周辺スペクトルの大きさを考慮して、ノイズ位置を決定する。例えば、0に復元されるスペクトルに隣接した周辺スペクトルの大きさが所定の値以上である場合、当該0に復元されるスペクトルを、ノイズ位置として決定する。ここで、所定の値は、シミュレーションを通じて、あるいは実験的に0に復元されるスペクトルに隣接した周辺スペクトルの情報損失が最小化されるように、予め最適の値に設定される。
ノイズ大きさ決定部440は、決定されたノイズ位置に付加するノイズの大きさを決定する。一実施形態によれば、ノイズレベルに基づいて、ノイズの大きさを決定する。例えば、所定の割合ほどノイズレベルを可変させて、ノイズの大きさを決定する。具体的には、(0.5*ノイズレベル)のような方式により決定できるが、それに限定されるものではない。他の実施形態によれば、決定されたノイズ位置の周辺スペクトルの大きさを考慮して適応的に可変させて、ノイズの大きさを決定する。周辺スペクトルの大きさが、付加されるノイズの大きさよりも小さい場合、ノイズの大きさを、周辺スペクトルの大きさよりもさらに小さい値に変更する。
ノイズ付加部450は、ランダムノイズを使用して、決定されたノイズ位置と、決定されたノイズ大きさに基づいて、ノイズを付加する。一実施形態によれば、ランダム符号を適用できる。ノイズの大きさは、固定された値を使用し、ランダムシードを通じて発生したランダム信号が奇数であるか偶数であるかによって、符号を可変させる。例えば、ランダム信号が偶数である場合には、+符号を付加し、奇数である場合には、−符号を付加する。ノイズ付加部450によりノイズが付加された低周波数帯域のスペクトルは、FD高周波数拡張符号化部290(図2)に提供される。
図5は、本発明の一実施形態によるFD高周波数拡張符号化部の構成を示すブロック図である。図5を参照すれば、FD高周波数拡張符号化部500は、スペクトルコピー部510、第1トナリティ算出部520、第2トナリティ算出部530、励起信号生成方式決定部540、エネルギー調節部550、及びエネルギー量子化部560を備える。一方、符号化装置において高周波数帯域の復元スペクトルを必要とする場合、高周波数復元スペクトル生成モジュール570をさらに備える。高周波数復元スペクトル生成モジュール570は、高周波励起信号生成部571と、高周波数スペクトル生成部573とを備える。特に、FD符号化部173(図1)において以前のフレームとオーバーラップ・アドを通じて復元が可能な変換、例えば、MDCTを使用し、フレーム間にCELPモードとFDモードとの間にスイッチングが存在する場合、高周波数復元スペクトル生成モジュール570を追加する必要がある。
スペクトルコピー部510は、反希薄性処理部270(図2)あるいは反希薄性処理部370(図3)から提供される低周波数帯域スペクトルをフォールディングあるいは複製して、高周波数帯域に拡張する。例えば、0ないし8kHzの低周波数帯域スペクトルを利用して、8ないし16kHzの高周波数帯域に拡張する。一実施形態によれば、反希薄性処理部270(図2)あるいは反希薄性処理部370(図3)から提供される低周波数帯域スペクトルの代わりに、本来の低周波数スペクトルをフォールディングあるいは複製して、高周波数帯域に拡張する。
第1トナリティ算出部520は、所定のサブバンド単位で、本来の高周波数帯域のスペクトルに対して、第1トナリティを算出する。
第2トナリティ算出部530は、スペクトルコピー部510により低周波数帯域のスペクトルを利用して拡張された高周波数帯域のスペクトルに対して、サブバンド単位で第2トナリティを算出する。
第1及び第2トナリティは、サブバンドのスペクトルの平均大きさと最大大きさの割合に基づいたスペクトル平坦度を利用して算出される。具体的には、スペクトル平坦度は、周波数スペクトルの幾何平均と算術平均の関係を通じて測定される。すなわち、第1及び第2トナリティは、スペクトルがピーキーな(peaky)特性を有したか平坦な特性を有したかを表す尺度である。第1トナリティ算出部520と第2トナリティ算出部530は、同一な方式及び同一なサブバンド単位で動作することが望ましい。
励起信号生成方式決定部540は、第1トナリティと第2トナリティとを比較して、高周波励起信号生成方式を決定する。高周波励起信号を生成する方式は、低周波数帯域のスペクトルを変形して生成された高周波数帯域のスペクトルと、ランダムノイズの適応的加重値とを通じて決定する。その時、適応的加重値に該当する値が励起信号のタイプ情報であり、励起信号のタイプ情報がビットストリームに含まれて保存あるいは伝送される。一実施形態によれば、励起信号のタイプ情報を、2ビットで構成する。ここで、2ビットは、ランダムノイズに付加される加重値を基準として、4ステップで構成する。励起信号のタイプ情報は、フレーム当たり1回伝送される。また、複数個のサブバンドを一つのグループに形成し、各グループに対して励起信号のタイプ情報を定義して、グループ別に伝送する。
一実施形態によれば、励起信号生成方式決定部540は、本来の高周波数帯域の信号特性のみを考慮して、高周波励起信号を生成する方式を決定する。具体的には、サブバンド別に求められた第1トナリティの平均が属する領域を区分し、励起信号のタイプ情報の個数を基準として、第1トナリティの値がどの領域に該当するかによって、励起信号を生成する方式を決定する。かかる方式によれば、トナリティの値が高い場合、すなわち、スペクトルのピーキーな特性が大きい場合には、ランダムノイズに付加する加重値を小さく設定する。
他の実施形態によれば、励起信号生成方式決定部540は、本来の高周波数帯域の信号特性と、帯域拡張を通じて生成される高周波数信号特性とを同時に考慮して、高周波励起信号を生成する方式を決定する。例えば、本来の高周波数帯域の信号特性と、帯域拡張を通じて生成される高周波数信号特性とが類似していれば、ランダムノイズの加重値を小さく設定し、本来の高周波数帯域の信号特性と、帯域拡張を通じて生成される高周波数信号特性とが異なれば、ランダムノイズの加重値を大きく設定する。一方、第1トナリティと第2トナリティのサブバンド別の差値の平均を基準として設定される。第1トナリティと第2トナリティのサブバンド別の差値の平均が大きければ、ランダムノイズの加重値を大きく設定し、第1トナリティと第2トナリティのサブバンド別の差値の平均が小さければ、ランダムノイズの加重値を小さく設定する。一方、励起信号のタイプ情報をグループ別に伝送する場合には、第1トナリティと第2トナリティのサブバンド別の差値の平均は、一つのグループに属するサブバンドの平均を利用して求められる。
エネルギー調節部550は、本来の高周波数帯域のスペクトルに対して、サブバンド単位でエネルギーを求め、第1トナリティと第2トナリティとを利用して、エネルギー調節を行う。例えば、第1トナリティが大きく、第2トナリティが小さい場合、すなわち、本来の高周波数帯域のスペクトルがピーキーであり、反希薄性処理部270,370の出力スペクトルが平坦であれば、第1及び第2トナリティの割合に基づいて、エネルギーを調節する。
エネルギー量子化部560は、調節されたエネルギーをベクトル量子化し、ベクトル量子化結果として生成される量子化インデックスを、ビットストリームに含めて保存あるいは伝送する。
一方、高周波数復元スペクトル生成モジュール570において、高周波励起信号生成部571、及び高周波数スペクトル生成部573の動作は、図11の高周波励起信号生成部1130、及び高周波数スペクトル生成部1170の動作と実質的に同様であるので、詳細な説明は省略する。
図6A及び図6Bは、図1に示したFD符号化モジュール170により拡張符号化が行われる領域を示すものである。図6Aは、実際にFPCが行われた上位周波数帯域Ffpcが、FPCを行うように割り当てられた低周波数帯域、すなわち、コア周波数帯域Fcoreと同一な場合を表し、その場合、Fcoreまでの低周波数帯域に対しては、FPC及びノイズフィリングが行われ、Fend−Fcoreに該当する高周波数帯域に対しては、低周波数帯域の信号を利用して、拡張符号化が行われる。ここで、Fendは、高周波数拡張により得られる最大周波数となる。
一方、図6Bは、実際にFPCが行われた上位周波数帯域Ffpcが、コア周波数帯域Fcoreよりも小さい場合を表し、Ffpcまでの低周波数帯域に対しては、FPC及びノイズフィリングが行われ、Fcore−Ffpcに該当する低周波数帯域に対して、FPC及びノイズフィリングが行われた低周波数帯域の信号を利用して、拡張符号化が行われ、Fend−Fcoreに該当する高周波数帯域に対しては、低周波数帯域の全体の信号を利用して、拡張符号化が行われる。同様に、Fendは、高周波数拡張により得られる最大周波数となる。
ここで、FcoreとFendは、ビット率によって可変的に設定できる。例えば、ビット率によって、Fcoreは、6.4kHz,8kHz,9.6kHzに制限されるが、それらに限定されず、Fendは、14kHz,14.4kHz,16kHzまで拡張されるが、それらに限定されない。一方、実際にFPCが行われた上位周波数帯域Ffpcまでが、ノイズフィリングを行う周波数帯域に該当する。
図7は、本発明の他の実施形態によるオーディオ符号化装置の構成を示すブロック図である。図7に示したオーディオ符号化装置700は、符号化モード決定部710、LPC符号化部705、スイッチング部730、CELP符号化モジュール750、及びオーディオ符号化モジュール770を備える。CELP符号化モジュール750は、CELP符号化部751と、TD拡張符号化部753とを備え、オーディオ符号化モジュール770は、オーディオ符号化部771と、FD拡張符号化部773とを備える。各構成要素は、少なくとも一つ以上のモジュールに一体化されて、少なくとも一つ以上のプロセッサ(図示せず)により具現される。
図7を参照すれば、LPC符号化部705は、入力信号から線形予測係数を抽出し、抽出された線形予測係数を量子化する。例えば、LPC符号化部705は、TCQ(Trellis Coded Quantization)方式、MSVQ(Multi-stage Vector Quantization)方式、LVQ(Lattice Vector Quantization)方式などを使用して、線形予測係数を量子化するが、それらに限定されるものではない。LPC符号化部705により量子化された線形予測係数は、ビットストリームに含まれて保存あるいは伝送される。
具体的には、LPC符号化部705は、32kHzまたは48kHzのサンプリングレートを有する入力信号をリサンプリングあるいはダウンサンプリングして、12.8kHzまたは16kHzのサンプリングレートを有する信号から、線形予測係数を抽出する。
符号化モード決定部710は、図1の符号化モード決定部110と同様に、信号の特性を参照して、入力信号の符号化モードを決定する。符号化モード決定部710は、信号の特性によって、現在のフレームが音声モードであるか音楽モードであるかを決定し、また、現在のフレームに効率的な符号化モードがTDモードであるかFDモードであるかについて決定する。
一実施形態によれば、符号化モード決定部710の入力信号は、ダウンサンプリング部(図示せず)によりダウンサンプリングされた信号となる。例えば、入力信号は、32kHzまたは48kHzのサンプリングレートを有する信号をリサンプリングあるいはダウンサンプリングして得られる12.8kHzまたは16kHzのサンプリングレートを有する信号となる。ここで、32kHzのサンプリングレートを有する信号は、SWB信号であって、FB信号といい、16kHzのサンプリングレートを有する信号は、WB信号という。
他の実施形態によれば、符号化モード決定部710により、リサンプリングあるいはダウンサンプリング動作が行われてもよい。
これによれば、符号化モード決定部710は、リサンプリングあるいはダウンサンプリングされた信号に対して、符号化モードを決定する。
符号化モード決定部710により決定された符号化モードは、スイッチング部730に提供される一方、フレーム単位でビットストリームに含まれて保存あるいは伝送される。
スイッチング部730は、符号化モード決定部710から提供される符号化モードによって、LPC符号化部705から提供される低周波数帯域の線形予測係数を、CELP符号化モジュール750及びオーディオ符号化モジュール770のうち一つに提供する。具体的には、スイッチング部730は、符号化モードがCELPモードである場合、低周波数帯域の線形予測係数を、CELP符号化モジュール750に提供し、符号化モードがオーディオモードである場合、低周波数帯域の線形予測係数を、オーディオ符号化モジュール770に提供する。
CELP符号化モジュール750は、符号化モードがCELPモードである場合に動作し、CELP符号化部751は、低周波数帯域の線形予測係数から得られる励起信号に対して、CELP符号化を行う。一実施形態によれば、CELP符号化部751は、LPC励起信号を、ピッチ情報に該当するフィルタリングされた適応コードベクトル(すなわち、adaptive codebook contribution)、及びフィルタリングされた固定コードベクトル(すなわち、fixed or innovation codebook contribution)それぞれを考慮して量子化する。ここで、励起信号は、LPC符号化部705により生成されて、CELP符号化部751に提供されるか、またはCELP符号化部751により生成される。
一方、CELP符号化部751は、信号の特性によって、異なる符号化モードを適用できる。適用される符号化モードとしては、有声音符号化モード、無声音符号化モード、トランジェント符号化モード、及び一般の符号化モードを有するが、それらに限定されるものではない。
CELP符号化部751の符号化結果として得られる低周波数帯域の励起信号、すなわち、CELP情報は、TD拡張符号化部753に提供される一方、ビットストリームに含まれる。
CELP符号化モジュール750において、TD拡張符号化部753は、CELP符号化部751から提供される低周波数帯域の励起信号をフォールディングあるいは複製して、高周波数帯域の拡張符号化を行う。TD拡張符号化部151の拡張符号化結果として得られる高周波数帯域の拡張情報は、ビットストリームに含まれる。
一方、オーディオ符号化モジュール770は、符号化モードがオーディオモードである場合に動作し、オーディオ符号化部771は、低周波数帯域の線形予測係数から得られる励起信号をFDに変換して、オーディオ符号化を行う。一実施形態によれば、オーディオ符号化部771は、DCT(Discrete Cosine Transform)のように、フレーム間に重畳される領域が存在しない変換方式を使用する。また、オーディオ符号化部771は、FDに変換された励起信号に対して、LVQ及びFPC符号化を行う。さらに、オーディオ符号化部771は、励起信号の量子化を行う時にビットの余裕がある場合、フィルタリングされた適応コードベクトル(すなわち、adaptive codebook contribution)、及びフィルタリングされた固定コードベクトル(fixed or innovation codebook contribution)のようなTD情報をさらに考慮して量子化することもできる。
オーディオ符号化モジュール770において、FD拡張符号化部773は、オーディオ符号化部771から提供される低周波数帯域の励起信号を利用して、高周波数帯域の拡張符号化を行う。FD拡張符号化部773の動作は、入力信号が異なるのみ、FD高周波数拡張符号化部290(図2)あるいはFD高周波数拡張符号化部390(図3)の動作と同様であるので、詳細な説明は省略する。
図7に示したオーディオ符号化装置700によれば、符号化モード決定部710により決定された符号化モードによって、二つの形態のビットストリームが生成される。ここで、ビットストリームは、ヘッダ及びペイロードを含む。
具体的には、符号化モードがCELPモードである場合、ビットストリームは、ヘッダに、符号化モードについての情報を含み、ペイロードに、CELP情報と、TD高周波数拡張情報とを含む。一方、符号化モードがオーディオモードである場合、ビットストリームは、ヘッダに、符号化モードについての情報を含み、ペイロードに、オーディオ符号化についての情報、すなわち、オーディオ情報と、FD高周波数拡張情報とを含む。
図7に示したオーディオ符号化装置700は、信号の特性によって、CELPモードまたはオーディオモードのうちいずれか一つに動作するようにスイッチングされることによって、信号の特性に適応的に効率的な符号化を行う。一方、図1のスイッチング構造は、望ましくは、低ビット率環境に適用される。
図8は、本発明のさらに他の実施形態によるオーディオ符号化装置の構成を示すブロック図である。図8に示したオーディオ符号化装置800は、符号化モード決定部810、スイッチング部830、CELP符号化モジュール850、FD符号化モジュール870、及びオーディオ符号化モジュール890を備える。CELP符号化モジュール850は、CELP符号化部851と、TD拡張符号化部853とを備え、FD符号化モジュール870は、変換部871と、FD符号化部873とを備え、オーディオ符号化モジュール890は、オーディオ符号化部891と、FD拡張符号化部893とを備える。各構成要素は、少なくとも一つ以上のモジュールに一体化されて、少なくとも一つ以上のプロセッサ(図示せず)により具現される。
図8を参照すれば、符号化モード決定部810は、信号の特性及びビット率を参照して、入力信号の符号化モードを決定する。符号化モード決定部810は、信号の特性によって、現在のフレームが音声モードであるか音楽モードであるかによって、また、現在のフレームに効率的な符号化モードがTDモードであるかFDモードであるかによって、CELPモードと、その他のモードに決定する。信号の特性が音声モードである場合には、CELPモードに決定し、音楽モードであり、かつ高ビット率である場合、FDモードに決定し、音楽モードであり、かつ低ビット率である場合、オーディオモードに決定する。
スイッチング部830は、符号化モード決定部810から提供される符号化モードによって、入力信号を、CELP符号化モジュール850、FD符号化モジュール870及びオーディオ符号化モジュール890のうち一つに提供する。
一方、図8のオーディオ符号化装置800は、CELP符号化部851が、入力信号から線形予測係数を抽出し、オーディオ符号化部891が、入力信号から線形予測係数を抽出する点を除いては、図1のオーディオ符号化装置100と、図7のオーディオ符号化装置700とを結合したものと類似している。
図8に示したオーディオ符号化装置800は、信号の特性によって、CELPモード、FDモードあるいはオーディオモードのうちいずれか一つに動作するようにスイッチングされることによって、信号の特性に適応的に効率的な符号化を行う。一方、図8のスイッチング構造は、ビット率に関係なく適用される。
図9は、本発明の一実施形態によるオーディオ復号化装置の構成を示すブロック図である。図9に示したオーディオ復号化装置は、単独で、あるいは図1に示したオーディオ符号化装置と共に、マルチメディア機器を構成し、電話、モバイルフォンなどを含む音声通信専用端末機、TV、MP3プレーヤなどを含む放送あるいは音楽専用端末機、あるいは音声通信専用端末機と、放送あるいは音楽専用端末機との融合端末機が含まれるが、それらに限定されるものではない。また、オーディオ復号化装置は、クライアント、サーバー、あるいはクライアントとサーバーとの間に配置される変換機として使われる。
図9に示したオーディオ復号化装置900は、スイッチング部910、CELP復号化モジュール930、及びFD復号化モジュール950を備える。CELP復号化モジュール930は、CELP復号化部931と、TD拡張復号化部933とを備え、FD復号化モジュール950は、FD復号化部951と、逆変換部953とを備える。各構成要素は、少なくとも一つ以上のモジュールに一体化されて、少なくとも一つ以上のプロセッサ(図示せず)により具現される。
図9を参照すれば、スイッチング部910は、ビットストリームに含まれた符号化モードについての情報を参照して、ビットストリームを、CELP復号化モジュール930及びFD復号化モジュール950のうち一つに提供する。具体的には、符号化モードがCELPモードである場合、ビットストリームを、CELP復号化モジュール930に提供し、FDモードである場合、FD復号化モジュール950に提供する。
CELP復号化モジュール930において、CELP復号化部931は、ビットストリームに含まれた線形予測係数を復号化し、フィルタリングされた適応コードベクトル、及びフィルタリングされた固定コードベクトルについての復号化を行い、復号化結果を合成して、低周波数帯域についての復元信号を生成する。
TD拡張復号化部933は、CELP復号化結果、及び低周波数帯域の励起信号のうち少なくとも一つを利用して、高周波数帯域についての拡張復号化を行い、高周波数帯域の復元信号を生成する。その時、低周波数帯域の励起信号は、ビットストリームに含まれる。また、TD拡張復号化部933は、高周波数帯域についての復元信号を生成するために、ビットストリームに含まれた低周波数帯域についての線形予測係数情報を活用する。
一方、TD拡張復号化部933は、生成された高周波数帯域についての復元信号を、CELP復号化部931により生成された低周波数帯域の復元信号と合成して、復元されたSWB信号を生成する。その時、TD拡張復号化部933は、復元されたSWB信号を生成するために、低周波数帯域の復元信号と、高周波数帯域の復元信号とのサンプリングレートを同一であるように変換する作業をさらに行う。
FD復号化モジュール950において、FD復号化部951は、FD符号化されたフレームに対して、FD復号化を行う。FD復号化部951は、ビットストリームを復号化して、周波数スペクトルを生成する。また、FD復号化部951は、ビットストリームに含まれた以前のフレームのモード情報を参照して、復号化を行うこともできるということが分かる。すなわち、FD復号化部951は、FD符号化されたフレームに対して、ビットストリームに含まれた以前のフレームのモード情報を参照して、FD復号化を行う。
逆変換部953は、FD復号化結果をTDに逆変換する。逆変換部953は、FD復号化された周波数スペクトルに対して逆変換を行い、復元信号を生成する。例えば、逆変換部953は、IMDCT(Inverse MDCT)を行うが、それに限定されるものではない。
これによって、オーディオ復号化装置900は、フレーム単位で符号化モードを参照して、ビットストリームについての復号化を行う。
図10は、図9に示したFD復号化部の一実施形態による構成を示すブロック図である。図10に示したFD復号化部1000は、Norm復号化部1010、FPC復号化部1020、ノイズフィリング部1030、FD低周波数拡張復号化部1040、反希薄性処理部1050、FD高周波数拡張復号化部1060、及び結合部1070を備える。
Norm復号化部1010は、ビットストリームに含まれたNorm値を復号化して、復元されたNorm値を求める。
FPC復号化部1020は、復元されたNorm値を利用して、割り当てビット数を決定し、FPC符号化されたスペクトルに対して、割り当てビット数を利用してFPC復号化を行う。ここで、割り当てビット数は、FPC符号化部230(図2)あるいはFPC符号化部330(図3)と同様に決定される。
ノイズフィリング部1030は、FPC復号化部1020のFPC復号化結果を参照して、オーディオ符号化装置から別途に生成されて提供されるノイズレベルを利用して、ノイズフィリングを行うか、または復元されたNorm値を利用して、ノイズフィリングを行う。
FD低周波数拡張復号化部1040は、実際にFPC復号化が行われた上位周波数帯域Ffpcが、コア周波数帯域Fcoreよりも小さい場合、Ffpcまでの低周波数帯域に対しては、FPC復号化及びノイズフィリングが行われ、Fcore−Ffpcに該当する低周波数帯域に対して、FPC及びノイズフィリングが行われた低周波数帯域の信号を利用して、拡張復号化を行う。
反希薄性処理部1050は、FD低周波数拡張復号化部1040から提供される低周波数帯域のスペクトルから、ノイズの付加位置及びノイズの大きさを決定し、低周波数帯域のスペクトルに対して、決定されたノイズの付加位置及びノイズの大きさによる反希薄性処理を行い、FD高周波数拡張復号化部1060に提供する。反希薄性処理部1050は、図4に示した復元スペクトル生成部410を除き、ノイズ位置決定部430、ノイズ大きさ決定部440及びノイズ付加部450を備える。
FD高周波数拡張復号化部1060は、反希薄性処理部1050によりノイズが付加された低周波数帯域のスペクトルを利用して、高周波数帯域についての拡張符号化を行う。一実施形態によれば、FD高周波数拡張復号化部1060は、異なるビット率に対して、同一なコードブックを共有して、エネルギー逆量子化を行う。
結合部1070は、FD低周波数拡張復号化部1040から提供される低周波数帯域のスペクトルと、FD高周波数拡張復号化部1060から提供される高周波数帯域のスペクトルとを結合して、SWBの復元スペクトルを生成する。
図11は、図10に示したFD高周波数拡張復号化部の一実施形態による構成を示すブロック図である。図11に示したFD高周波数拡張符号化部1100は、スペクトルコピー部1110、高周波励起信号生成部1130、エネルギー逆量子化部1150、及び高周波数スペクトル生成部1170を備える。
スペクトルコピー部1110は、図5のスペクトルコピー部510と同様に、反希薄性処理部1050(図10)から提供される低周波数帯域スペクトルをフォールディングあるいは複製して、高周波数帯域に拡張する。
高周波励起信号生成部1130は、スペクトルコピー部1110から提供される拡張された高周波数帯域スペクトルと、ビットストリームから抽出された励起信号タイプ情報とを利用して、高周波励起信号を生成する。
高周波励起信号生成部1130は、スペクトルコピー部1110から提供される拡張された高周波数帯域スペクトルを変形したスペクトルG(n)と、ランダムノイズR(n)との加重値を通じて、高周波励起信号を生成する。ここで、変形されたスペクトルは、スペクトルコピー部1110の出力を、既存のサブバンドの代わりに、新たに定義したサブバンドにより、サブバンド単位で平均大きさを求め、当該平均大きさにスペクトルを正規化する過程を通じて求められる。このように生成された変形されたスペクトルは、ランダムノイズとレベルを合わせるために、さらに予め設定されたサブバンド単位でレベルを整合させる過程を経る。レベル整合は、サブバンド別に平均大きさが、ランダムノイズと変形されたスペクトルとを同一にする過程である。一実施形態によれば、変形された信号の大きさを若干大きく設定することもできる。最終的に生成された高周波励起信号は、下記の数式(1)のように求められる。
E(n)=G(n)*(1-w(n))+R(n)*w(n) (1)
ここで、w(n)は、励起信号のタイプ情報によって決定された値を表し、nは、スペクトルビンのインデックスを表す。w(n)は、定数値であってもよく、サブバンド別に伝送される場合には、サブバンド別に同一な値として定義される。また、隣接したサブバンド間のスムージングを考慮して設定されてもよい。
w(n)は、励起信号のタイプ情報が0,1,2,3の2ビットで定義される時、0である場合に最大値、3である場合に最小値となるように割り当てる。
エネルギー逆量子化部1150は、ビットストリームに含まれた量子化インデックスを逆量子化して、エネルギーを復元する。
高周波数スペクトル生成部1170は、高周波励起信号のエネルギーが、復元されたエネルギーにマッチングされるように、高周波励起信号のエネルギーと、復元されたエネルギーの割合に基づいて、高周波励起信号から、高周波数帯域スペクトルを復元する。
一方、高周波数スペクトル生成部1170は、本来の高周波数帯域スペクトルがピーキーであるか、またはハーモニック成分を含んで強い音調特性を有する場合、反希薄性処理部1050(図10)から提供される低周波数帯域スペクトルの代わりに、入力信号をスペクトルコピー部1110の入力に活用して、高周波スペクトルを生成する。
図12は、本発明の他の実施形態によるオーディオ復号化装置の構成を示すブロック図である。図12に示したオーディオ復号化装置1200は、LPC復号化部1205、スイッチング部1210、CELP復号化モジュール1230、及びオーディオ復号化モジュール1250を備える。CELP復号化モジュール1230は、CELP復号化部1231と、TD拡張復号化部1233とを備え、オーディオ復号化モジュール1250は、オーディオ復号化部1251と、FD拡張復号化部1253とを備える。各構成要素は、少なくとも一つ以上のモジュールに一体化されて、少なくとも一つ以上のプロセッサ(図示せず)により具現される。
図12を参照すれば、LPC復号化部1205は、ビットストリームに対して、フレーム単位でLPC復号化を行う。
スイッチング部1210は、ビットストリームに含まれた符号化モードについての情報を参照して、LPC復号化部1205の出力を、CELP復号化モジュール1230、及びオーディオ復号化モジュール1250のうち一つに提供する。具体的には、符号化モードがCELPモードである場合、LPC復号化部1205の出力を、CELP復号化モジュール1230に提供し、オーディオモードである場合、オーディオ復号化モジュール1250に提供する。
CELP復号化モジュール1230において、CELP復号化部1231は、CELP符号化されたフレームに対して、CELP復号化を行う。例えば、CELP復号化部1231は、フィルタリングされた適応コードベクトル、及びフィルタリングされた固定コードベクトルについての復号化を行い、復号化結果を合成して、低周波数帯域についての復元信号を生成する。
TD拡張復号化部1233は、CELP復号化結果、及び低周波数帯域の励起信号のうち少なくとも一つを利用して、高周波数帯域についての拡張復号化を行い、高周波数帯域の復元信号を生成する。その時、低周波数帯域の励起信号は、ビットストリームに含まれる。また、TD拡張復号化部1233は、高周波数帯域についての復元信号を生成するために、ビットストリームに含まれた低周波数帯域についての線形予測係数情報を活用する。
一方、TD拡張復号化部1233は、生成された高周波数帯域についての復元信号を、CELP復号化部1231により生成された低周波数帯域の復元信号と合成して、復元されたSWB信号を生成する。その時、TD拡張復号化部1233は、復元されたSWB信号を生成するために、低周波数帯域の復元信号と、高周波数帯域の復元信号のサンプリングレートを同一であるように変換する作業をさらに行う。
オーディオ復号化モジュール1250において、オーディオ復号化部1251は、オーディオ符号化されたフレームに対して、オーディオ復号化を行う。例えば、オーディオ復号化部1251は、ビットストリームを参照して、TD寄与分(contribution)が存在する場合、TD寄与分及びFD寄与分を考慮して復号化を行い、TD寄与分が存在しない場合、FD寄与分を考慮して復号化を行う。
また、オーディオ復号化部1251は、FPCまたはLVQ量子化された信号に対して、IDCT(Inverse DCT)などを利用した周波数逆変換を行い、復号化された低周波数帯域の励起信号を生成し、生成された励起信号を、逆量子化されたLPC係数と合成して、低周波数帯域の復元信号を生成する。
FD拡張復号化部1253は、オーディオ復号化が行われた結果を利用して、拡張復号化を行う。例えば、FD拡張復号化部1253は、復号化された低周波数帯域の信号を、高周波数拡張復号化に好適なサンプリングレートに変換し、変換された信号に、MDCTのような周波数変換を行う。FD拡張復号化部1253は、量子化された高周波数帯域のエネルギーを逆量子化し、高周波帯域幅拡張の多様なモードによって、低周波数帯域の信号を利用して、高周波数帯域の励起信号を生成し、生成された励起信号のエネルギーが、逆量子化されたエネルギーにマッチングされるようにゲインを適用することによって、高周波数帯域の復元信号を生成する。例えば、高周波帯域幅拡張の多様なモードは、ノーマルモード、トランジェントモード、ハーモニックモード、またはノイズモードのうちいずれか一つのモードとなる。
また、FD拡張復号化部1253は、生成された高周波数帯域の復元信号、及び低周波数帯域の復元信号に対して、IMDCTのような周波数逆変換を行って、最終の復元信号を生成する。
さらに、FD拡張復号化部1253は、帯域幅拡張にトランジェントモードが適用された場合、周波数逆変換が行われた後に復号化された信号が、復号化された時間的な包絡線にマッチングされるように、TDで求めたゲインを適用し、ゲインが適用された信号を合成することもできる。
これにより、オーディオ復号化装置は、ビットストリームに対して、フレーム単位で符号化モードを参照して、ビットストリームについての復号化を行う。
図13は、本発明のさらに他の実施形態によるオーディオ復号化装置の構成を示すブロック図である。図13に示したオーディオ復号化装置1300は、スイッチング部1310、CELP復号化モジュール1330、FD復号化モジュール1350及びオーディオ復号化モジュール1370を備える。CELP復号化モジュール1330は、CELP復号化部1331と、TD拡張復号化部1333とを備え、FD復号化モジュール1350は、FD復号化部1351と、逆変換部1353とを備え、オーディオ復号化モジュール1370は、オーディオ復号化部1371と、FD拡張復号化部1373とを備える。各構成要素は、少なくとも一つ以上のモジュールに一体化されて、少なくとも一つ以上のプロセッサ(図示せず)により具現される。
図13を参照すれば、スイッチング部1310は、ビットストリームに含まれた符号化モードについての情報を参照して、ビットストリームを、CELP復号化モジュール1330、FD復号化モジュール1350及びオーディオ復号化モジュール1370のうち一つに提供する。具体的には、符号化モードがCELPモードである場合、ビットストリームを、CELP復号化モジュール1330に提供し、FDモードである場合、FD復号化モジュール1350に提供し、オーディオモードである場合、オーディオ復号化モジュール1370に提供する。
ここで、CELP復号化モジュール1330、FD復号化モジュール1350、及びオーディオ復号化モジュール1370は、図8のCELP符号化モジュール850、FD符号化モジュール870、及びオーディオ符号化モジュール890と可逆的な動作を行うので、詳細な説明は省略する。
図14は、本発明の一実施形態によるコードブック共有方法を説明する図面である。図7に示したFD拡張符号化部773、または図8に示したFD拡張符号化部893は、異なるビット率に対して、同一なコードブックを共有して、エネルギー量子化を行う。それによって、FD拡張符号化部773、またはFD拡張符号化部893は、入力信号に対応する周波数スペクトルを、所定の個数のサブバンドに分割するにあたって、異なるビット率に対して、同一なサブバンド別の帯域幅を有させる。
16kbpsのビット率で、約6.4ないし14.4kHzの周波数帯域を分割する場合1410と、16kbps以上のビット率で、約8ないし16kHzの周波数帯域を分割する場合1420とを例として説明すれば、下記の通りである。
具体的には、最初のサブバンドについての帯域幅1430は、16kbpsのビット率及び16kbps以上のビット率の両方で0.4kHzであり、二番目のサブバンドについての帯域幅1440は、16kbpsのビット率及び16kbps以上のビット率の両方で0.6kHzである。
かかる方式によって、異なるビット率に対して、同一なサブバンド別の帯域幅を有させることによって、FD拡張符号化部773、またはFD拡張符号化部893は、異なるビット率に対して、同一なコードブックを共有して、エネルギー量子化を行う。
その結果、CELPモードとFDモードとがスイッチングされる設定(configuration)、CELPモードとオーディオモードとがスイッチングされる設定、またはCELPモード、FDモード及びオーディオモードがスイッチングされる設定において、マルチモード帯域幅拡張技法を適用し、その時、多様なビット率を支援できるコードブックの共有を行うことによって、メモリ(例えば、ROM)のサイズを減少させ、具現の複雑度を減少させる。
図15は、本発明の一実施形態による符号化モードシグナリング方法を説明する図面である。図15を参照すれば、ステップ1510において、入力信号がトランジェント成分に該当するか否かを判断する。トランジェント成分の検出は、公知の多様な方法を使用して行う。
ステップ1520では、ステップ1510での判断結果、トランジェント成分に該当する場合、小数点単位のビット割り当てを行う。
ステップ1530では、入力信号に対して、トランジェントモードで符号化を行い、1ビットのトランジェント指示子を利用して、トランジェントモードで符号化されたことをシグナリングする。
一方、ステップ1540では、ステップ1510での判断結果、トランジェント成分に該当しない場合、ハーモニック成分に該当するか否かを判断する。ハーモニック成分の検出は、公知の多様な方法を使用して行う。
ステップ1550では、ステップ1540での判断結果、ハーモニック成分に該当する場合、入力信号に対して、ハーモニックモードで符号化を行い、1ビットのトランジェント指示子と共に、1ビットのハーモニック指示子を利用して、ハーモニックモードで符号化されたことをシグナリングする。
一方、ステップ1560では、ステップ1540での判断結果、ハーモニック成分に該当しない場合、小数点単位のビット割り当てを行う。
ステップ1570では、入力信号に対して、ノーマルモードで符号化を行い、1ビットのトランジェント指示子と共に、1ビットのハーモニック指示子を利用して、ノーマルモードで符号化されたことをシグナリングする。
すなわち、2ビットの指示子を利用して、三つのモード、すなわち、トランジェントモード、ハーモニックモード、及びノーマルモードをシグナリングする。
前記実施形態による装置から導出される方法は、コンピュータで実行可能なプログラムとして作成可能であり、コンピュータで読み取り可能な記録媒体を利用して、前記プログラムを動作させる汎用のデジタルコンピュータで具現される。また、前述した本発明の実施形態において使用可能なデータ構造、プログラム命令、あるいはデータファイルは、コンピュータで読み取り可能な記録媒体に、多様な手段を通じて記録される。コンピュータで読み取り可能な記録媒体は、コンピュータシステムにより読み取られるデータが保存される全ての種類の保存装置を含む。コンピュータで読み取り可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体;CD−ROM、DVDのような光記録媒体;フロプティカルディスクのような磁気−光媒体;並びにROM、RAM、フラッシュメモリのようなプログラム命令を保存して行うように特に構成されたハードウェア装置が含まれる。また、コンピュータで読み取り可能な記録媒体は、プログラム命令、データ構造などを指定する信号を伝送する伝送媒体であってもよい。プログラム命令の例としては、コンパイラーにより作られるような機械語コードだけでなく、インタープリタなどを使用して、コンピュータにより実行される高級言語コードを含む。
以上のように、本発明の一実施形態は、たとえ限定された実施形態と図面により説明されたとしても、本発明の一実施形態は、前述した実施形態に限定されるものではなく、それは、当業者ならば、当該記載から多様な修正及び変形が可能である。したがって、本発明の範囲は、前述した説明ではなく、特許請求の範囲に表れており、それらの均等または等価的変形は、いずれも本発明の技術的思想の範疇に属するといえるであろう。

Claims (21)

  1. 符号化された低周波数帯域のスペクトルに対して、反希薄性処理を行うステップと、
    前記反希薄性処理が行われた低周波数帯域のスペクトルを利用して、周波数ドメインで高周波数帯域の拡張符号化を行うステップと、を含むことを特徴とする帯域幅拡張信号の符号化方法。
  2. 前記方法は、
    入力信号の低周波数帯域のスペクトルに対して、周波数バンドの単位で、スペクトルエネルギーに基づいてビット数を割り当て、割り当てられたビット数を利用して量子化を行い、前記符号化された低周波数帯域のスペクトルを生成するステップをさらに含み、
    前記反希薄性処理を行うステップは、前記量子化の実行結果、0に量子化されたスペクトルにノイズを付加することを特徴とする請求項1に記載の帯域幅拡張信号の符号化方法。
  3. 前記反希薄性処理を行うステップは、前記低周波数帯域の復元スペクトルを利用して、付加するノイズの大きさを決定することを特徴とする請求項2に記載の帯域幅拡張信号の符号化方法。
  4. 前記反希薄性処理を行うステップは、
    前記量子化の実行結果に対応して、前記周波数バンドの単位でノイズレベルを生成するステップをさらに含むことを特徴とする請求項2に記載の帯域幅拡張信号の符号化方法。
  5. 前記スペクトルエネルギーは、Normであることを特徴とする請求項2に記載の帯域幅拡張信号の符号化方法。
  6. 前記量子化を行うステップは、階乗パルスコーディングを利用することを特徴とする請求項2に記載の帯域幅拡張信号の符号化方法。
  7. 前記方法は、
    前記階乗パルスコーディングを行うように割り当てられた上位周波数帯域と、実際に階乗パルスコーディングが行われた上位周波数帯域とが異なる場合、低周波数帯域の拡張符号化を行うステップをさらに含み、
    前記符号化された低周波数帯域のスペクトルと共に、前記拡張符号化が行われた低周波数帯域に対して、反希薄性処理を行うことを特徴とする請求項6に記載の帯域幅拡張信号の符号化方法。
  8. 前記高周波数帯域の拡張符号化を行うステップは、
    前記反希薄性処理が行われた低周波数帯域のスペクトルを利用して、前記高周波数帯域のスペクトルを生成するステップと、
    本来の高周波数帯域のスペクトルと、前記生成された高周波数帯域のスペクトルからそれぞれ得られるトナリティを利用して、前記生成された高周波数帯域のスペクトルのエネルギーを調節するステップと、
    前記調節されたエネルギーを量子化するステップと、を含むことを特徴とする請求項1に記載の帯域幅拡張信号の符号化方法。
  9. 前記高周波数帯域の拡張符号化を行うステップは、ビット率によって異なる帯域の信号を生成することを特徴とする請求項1に記載の帯域幅拡張信号の符号化方法。
  10. 前記高周波数帯域の拡張符号化を行うステップは、異なるビット率に対する同一なコードブックを共有して、エネルギー量子化を行うことを特徴とする請求項1に記載の帯域幅拡張信号の符号化方法。
  11. 復号化された低周波数帯域のスペクトルに対して、反希薄性処理を行うステップと、
    前記反希薄性処理が行われた低周波数帯域のスペクトルを利用して、周波数ドメインで高周波数帯域の拡張復号化を行うステップと、を含むことを特徴とする帯域幅拡張信号の復号化方法。
  12. 前記方法は、
    符号化された低周波数帯域のスペクトルに対して、周波数バンドの単位で、スペクトルエネルギーに基づいてビット数を割り当て、割り当てられたビット数を利用して逆量子化を行い、前記復号化された低周波数帯域のスペクトルを生成するステップと、
    前記逆量子化の結果に対応して、ノイズレベルに基づいてノイズフィリングを行うステップと、をさらに含むことを特徴とする請求項11に記載の帯域幅拡張信号の復号化方法。
  13. 前記ノイズフィリングを行うステップは、全てのスペクトルが0に逆量子化された周波数バンドに対して、ノイズを付加することを特徴とする請求項12に記載の帯域幅拡張信号の復号化方法。
  14. 前記反希薄性処理を行うステップは、0に逆量子化されたスペクトルを含み、かつ前記ノイズフィリングが行われていない周波数バンドに対して、ノイズを付加することを特徴とする請求項12に記載の帯域幅拡張信号の復号化方法。
  15. 前記反希薄性処理を行うステップは、前記ノイズレベルに基づいて、付加されるノイズの大きさを決定することを特徴とする請求項14に記載の帯域幅拡張信号の復号化方法。
  16. 前記逆量子化は、階乗パルスデコーディングを利用することを特徴とする請求項12に記載の帯域幅拡張信号の復号化方法。
  17. 前記方法は、
    階乗パルスデコーディングを行うように割り当てられた上位周波数帯域と、実際に階乗パルスデコーディングが行われた上位周波数帯域とが異なる場合、低周波数帯域の拡張復号化を行うステップをさらに含み、
    前記復号化された低周波数帯域のスペクトルと共に、前記拡張復号化が行われた低周波数帯域に対して、前記反希薄性処理を行うことを特徴とする請求項12ないし16のうちいずれか一項に記載の帯域幅拡張信号の復号化方法。
  18. 前記拡張復号化が行われた低周波数帯域のうち、0に逆量子化されたスペクトルを含む周波数バンドに対して、前記反希薄性処理を行うことを特徴とする請求項17に記載の帯域幅拡張信号の復号化方法。
  19. 前記高周波数帯域の拡張復号化を行うステップは、ビット率によって異なる帯域の信号を生成することを特徴とする請求項11に記載の帯域幅拡張信号の復号化方法。
  20. 前記高周波数帯域の拡張復号化を行うステップは、
    受信されたエネルギーを逆量子化するステップと、
    前記反希薄性処理が行われた低周波数帯域のスペクトルを利用して、励起信号タイプ情報に対応して、前記高周波数帯域の励起信号を生成するステップと、
    前記逆量子化されたエネルギーに基づいて、前記高周波数帯域の励起信号のエネルギーを調節して、高周波数拡張信号を生成するステップと、を含むことを特徴とする請求項11に記載の帯域幅拡張信号の復号化方法。
  21. 前記高周波数帯域の拡張復号化を行うステップは、異なるビット率に対する同一なコードブックを共有して、エネルギー逆量子化を行うことを特徴とする請求項20に記載の帯域幅拡張信号の復号化方法。
JP2014518822A 2011-06-30 2012-07-02 帯域幅拡張信号生成装置及びその方法 Active JP6001657B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161503241P 2011-06-30 2011-06-30
US61/503,241 2011-06-30
PCT/KR2012/005258 WO2013002623A2 (ko) 2011-06-30 2012-07-02 대역폭 확장신호 생성장치 및 방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2016170949A Division JP6247358B2 (ja) 2011-06-30 2016-09-01 帯域幅拡張信号の復号化装置

Publications (3)

Publication Number Publication Date
JP2014523548A true JP2014523548A (ja) 2014-09-11
JP2014523548A5 JP2014523548A5 (ja) 2015-07-23
JP6001657B2 JP6001657B2 (ja) 2016-10-05

Family

ID=47424723

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2014518822A Active JP6001657B2 (ja) 2011-06-30 2012-07-02 帯域幅拡張信号生成装置及びその方法
JP2016170949A Active JP6247358B2 (ja) 2011-06-30 2016-09-01 帯域幅拡張信号の復号化装置
JP2017221260A Active JP6599419B2 (ja) 2011-06-30 2017-11-16 帯域幅拡張信号の復号化装置

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2016170949A Active JP6247358B2 (ja) 2011-06-30 2016-09-01 帯域幅拡張信号の復号化装置
JP2017221260A Active JP6599419B2 (ja) 2011-06-30 2017-11-16 帯域幅拡張信号の復号化装置

Country Status (12)

Country Link
US (3) US9349380B2 (ja)
EP (1) EP2728577A4 (ja)
JP (3) JP6001657B2 (ja)
KR (3) KR102078865B1 (ja)
CN (3) CN103843062B (ja)
AU (3) AU2012276367B2 (ja)
BR (3) BR122021019877B1 (ja)
CA (2) CA2840732C (ja)
MX (3) MX350162B (ja)
TW (3) TWI576832B (ja)
WO (1) WO2013002623A2 (ja)
ZA (1) ZA201400704B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016511431A (ja) * 2013-01-29 2016-04-14 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 知覚的な変換オーディオ符号化におけるノイズフィリング
JP2017526004A (ja) * 2014-07-28 2017-09-07 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 独立したノイズ充填を用いた強化された信号を生成するための装置および方法

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX350162B (es) * 2011-06-30 2017-08-29 Samsung Electronics Co Ltd Aparato y método para generar señal extendida de ancho de banda.
CN103854653B (zh) 2012-12-06 2016-12-28 华为技术有限公司 信号解码的方法和设备
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
JP6633547B2 (ja) * 2014-02-17 2020-01-22 サムスン エレクトロニクス カンパニー リミテッド スペクトル符号化方法
CN106463143B (zh) 2014-03-03 2020-03-13 三星电子株式会社 用于带宽扩展的高频解码的方法及设备
WO2015133795A1 (ko) * 2014-03-03 2015-09-11 삼성전자 주식회사 대역폭 확장을 위한 고주파 복호화 방법 및 장치
KR102653849B1 (ko) 2014-03-24 2024-04-02 삼성전자주식회사 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치
RU2689181C2 (ru) * 2014-03-31 2019-05-24 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер, способ кодирования, способ декодирования и программа
CN105336336B (zh) * 2014-06-12 2016-12-28 华为技术有限公司 一种音频信号的时域包络处理方法及装置、编码器
FR3024581A1 (fr) * 2014-07-29 2016-02-05 Orange Determination d'un budget de codage d'une trame de transition lpd/fd
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US10896684B2 (en) 2017-07-28 2021-01-19 Fujitsu Limited Audio encoding apparatus and audio encoding method
KR102457573B1 (ko) * 2021-03-02 2022-10-21 국방과학연구소 잡음 신호 생성 장치 및 방법, 컴퓨터 판독 가능한 기록 매체 및 컴퓨터 프로그램
KR102473886B1 (ko) 2021-11-25 2022-12-06 한국프리팩 주식회사 친환경 발포 다층시트, 이를 이용한 아이스팩 및 그의 제조방법
KR102574372B1 (ko) 2023-01-26 2023-09-05 한국프리팩 주식회사 공압출된 친환경 발포 다층필름 및 이를 이용한 아이스팩

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5650400A (en) * 1979-10-01 1981-05-07 Nippon Telegraph & Telephone Drive sound source signal generator
JPS57125999A (en) * 1981-01-29 1982-08-05 Seiko Instr & Electronics Voice synthesizer
US20050004803A1 (en) * 2001-11-23 2005-01-06 Jo Smeets Audio signal bandwidth extension
WO2005104094A1 (ja) * 2004-04-23 2005-11-03 Matsushita Electric Industrial Co., Ltd. 符号化装置
JP2009524108A (ja) * 2006-01-20 2009-06-25 マイクロソフト コーポレーション 拡張帯域周波数コーディングによる複素変換チャネルコーディング
JP2009541790A (ja) * 2006-06-21 2009-11-26 サムスン エレクトロニクス カンパニー リミテッド 適応的高周波数領域の符号化及び復号化方法及び装置
JP2010538317A (ja) * 2007-08-27 2010-12-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) ノイズ補充の方法及び装置
JP2011527455A (ja) * 2008-07-11 2011-10-27 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ノイズ充填装置、ノイズ充填パラメータ演算装置、ノイズ充填パラメータを提供する方法、オーディオ信号のノイズ充填されたスペクトル表現を提供する方法、それに対応するコンピュータプログラムおよび符号化されたオーディオ信号
JP2012505423A (ja) * 2008-10-08 2012-03-01 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチ分解能切替型のオーディオ符号化及び復号化スキーム

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6058359A (en) * 1998-03-04 2000-05-02 Telefonaktiebolaget L M Ericsson Speech coding including soft adaptability feature
US6029125A (en) * 1997-09-02 2000-02-22 Telefonaktiebolaget L M Ericsson, (Publ) Reducing sparseness in coded speech signals
DE60110086T2 (de) * 2000-07-27 2006-04-06 Activated Content Corp., Inc., Burlingame Stegotextkodierer und -dekodierer
KR100510434B1 (ko) * 2001-04-09 2005-08-26 니폰덴신뎅와 가부시키가이샤 Ofdm신호전달 시스템, ofdm신호 송신장치 및ofdm신호 수신장치
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
MX2007012187A (es) * 2005-04-01 2007-12-11 Qualcomm Inc Sistemas, metodos y aparatos para deformacion en tiempo de banda alta.
US7813931B2 (en) * 2005-04-20 2010-10-12 QNX Software Systems, Co. System for improving speech quality and intelligibility with bandwidth compression/expansion
KR20070115637A (ko) * 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
CN101089951B (zh) * 2006-06-16 2011-08-31 北京天籁传音数字技术有限公司 频带扩展编码方法及装置和解码方法及装置
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101375582B1 (ko) * 2006-11-17 2014-03-20 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
CN101939782B (zh) * 2007-08-27 2012-12-05 爱立信电话股份有限公司 噪声填充与带宽扩展之间的自适应过渡频率
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
ATE539433T1 (de) * 2008-07-11 2012-01-15 Fraunhofer Ges Forschung Bereitstellen eines zeitverzerrungsaktivierungssignals und codierung eines audiosignals damit
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
US8880410B2 (en) * 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
CA3107567C (en) * 2009-01-28 2022-08-02 Dolby International Ab Improved harmonic transposition
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
ES2559040T3 (es) * 2011-03-10 2016-02-10 Telefonaktiebolaget Lm Ericsson (Publ) Relleno de subvectores no codificados en señales de audio codificadas por transformada
RU2648595C2 (ru) 2011-05-13 2018-03-26 Самсунг Электроникс Ко., Лтд. Распределение битов, кодирование и декодирование аудио
MX350162B (es) * 2011-06-30 2017-08-29 Samsung Electronics Co Ltd Aparato y método para generar señal extendida de ancho de banda.

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5650400A (en) * 1979-10-01 1981-05-07 Nippon Telegraph & Telephone Drive sound source signal generator
JPS57125999A (en) * 1981-01-29 1982-08-05 Seiko Instr & Electronics Voice synthesizer
US20050004803A1 (en) * 2001-11-23 2005-01-06 Jo Smeets Audio signal bandwidth extension
JP2005509928A (ja) * 2001-11-23 2005-04-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号帯域幅拡張
WO2005104094A1 (ja) * 2004-04-23 2005-11-03 Matsushita Electric Industrial Co., Ltd. 符号化装置
JP2009524108A (ja) * 2006-01-20 2009-06-25 マイクロソフト コーポレーション 拡張帯域周波数コーディングによる複素変換チャネルコーディング
JP2009541790A (ja) * 2006-06-21 2009-11-26 サムスン エレクトロニクス カンパニー リミテッド 適応的高周波数領域の符号化及び復号化方法及び装置
JP2010538317A (ja) * 2007-08-27 2010-12-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) ノイズ補充の方法及び装置
JP2011527455A (ja) * 2008-07-11 2011-10-27 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ノイズ充填装置、ノイズ充填パラメータ演算装置、ノイズ充填パラメータを提供する方法、オーディオ信号のノイズ充填されたスペクトル表現を提供する方法、それに対応するコンピュータプログラムおよび符号化されたオーディオ信号
JP2012505423A (ja) * 2008-10-08 2012-03-01 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチ分解能切替型のオーディオ符号化及び復号化スキーム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016511431A (ja) * 2013-01-29 2016-04-14 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 知覚的な変換オーディオ符号化におけるノイズフィリング
US9792920B2 (en) 2013-01-29 2017-10-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling concept
US10410642B2 (en) 2013-01-29 2019-09-10 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling concept
US11031022B2 (en) 2013-01-29 2021-06-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling concept
JP2017526004A (ja) * 2014-07-28 2017-09-07 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 独立したノイズ充填を用いた強化された信号を生成するための装置および方法
JP2017526957A (ja) * 2014-07-28 2017-09-14 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 独立したノイズ充填を用いた強化された信号を生成するための装置および方法
JP2019194704A (ja) * 2014-07-28 2019-11-07 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 独立したノイズ充填を用いた強化された信号を生成するための装置および方法
JP2022046504A (ja) * 2014-07-28 2022-03-23 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 独立したノイズ充填を用いた強化された信号を生成するための装置および方法

Also Published As

Publication number Publication date
MX340386B (es) 2016-07-07
TWI619116B (zh) 2018-03-21
CA2840732A1 (en) 2013-01-03
MX350162B (es) 2017-08-29
CN103843062A (zh) 2014-06-04
AU2017202211A1 (en) 2017-04-27
JP2016197271A (ja) 2016-11-24
WO2013002623A2 (ko) 2013-01-03
JP6247358B2 (ja) 2017-12-13
US20170345443A1 (en) 2017-11-30
KR20130007485A (ko) 2013-01-18
BR112013033900A2 (pt) 2017-12-12
AU2012276367A1 (en) 2014-01-30
BR122021019877B1 (pt) 2022-07-19
JP2018025830A (ja) 2018-02-15
ZA201400704B (en) 2021-05-26
AU2012276367B2 (en) 2016-02-04
WO2013002623A3 (ko) 2013-04-11
EP2728577A4 (en) 2016-07-27
BR112013033900B1 (pt) 2022-03-15
CA2966987C (en) 2019-09-03
MX2014000161A (es) 2014-02-19
KR102078865B1 (ko) 2020-02-19
US20160247519A1 (en) 2016-08-25
KR102343332B1 (ko) 2021-12-24
CN103843062B (zh) 2016-10-05
BR122021019883B1 (pt) 2023-03-14
US20140188464A1 (en) 2014-07-03
CN106157968A (zh) 2016-11-23
KR20200019164A (ko) 2020-02-21
US9734843B2 (en) 2017-08-15
JP6599419B2 (ja) 2019-10-30
CA2840732C (en) 2017-06-27
TW201401268A (zh) 2014-01-01
CN106128473A (zh) 2016-11-16
WO2013002623A4 (ko) 2013-06-06
AU2016202120A1 (en) 2016-04-28
TW201743320A (zh) 2017-12-16
AU2017202211C1 (en) 2018-08-02
TW201715513A (zh) 2017-05-01
EP2728577A2 (en) 2014-05-07
KR20200143665A (ko) 2020-12-24
KR102240271B1 (ko) 2021-04-14
CN106157968B (zh) 2019-11-29
AU2017202211B2 (en) 2018-01-18
CN106128473B (zh) 2019-12-10
TWI605448B (zh) 2017-11-11
JP6001657B2 (ja) 2016-10-05
TWI576832B (zh) 2017-04-01
US9349380B2 (en) 2016-05-24
CA2966987A1 (en) 2013-01-03
US10037766B2 (en) 2018-07-31
AU2016202120B2 (en) 2017-01-05
MX370012B (es) 2019-11-28

Similar Documents

Publication Publication Date Title
JP6599419B2 (ja) 帯域幅拡張信号の復号化装置
JP6787941B2 (ja) 高周波数帯域幅拡張のための符号化/復号化装置及びその方法
JP6346322B2 (ja) フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150303

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20150603

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160802

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160901

R150 Certificate of patent or registration of utility model

Ref document number: 6001657

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250