JP4209717B2

JP4209717B2 - 多様なフレームサイズを支援する整数コーディング方法及びそれを適用したコデック装置

Info

Publication number: JP4209717B2
Application number: JP2003136463A
Authority: JP
Inventors: 基錫張
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2002-06-05
Filing date: 2003-05-14
Publication date: 2009-01-14
Anticipated expiration: 2023-05-14
Also published as: KR20030093762A; GB2389983B; US6847314B2; GB2389983A; DE10318413A1; CN1471318A; KR100477649B1; JP2004015803A; GB0312141D0; US20030227975A1; CN1237812C

Description

【０００１】
【発明の属する技術分野】
本発明はデジタル信号処理システムに係り、特に多様なフレームサイズを支援する整数コーディング方法及びこれを適用したコデック（ＣＯＤＥＣ：Ｃｏｄｅｒ−Ｄｅｃｏｄｅｒ）装置に関する。
【０００２】
【従来の技術】
最近、マルチメディアコンテンツを提供する製品は高速のデジタル信号演算のために高性能のＤＳＰ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ）コデックを使用している。
【０００３】
ＤＳＰアルゴリズムは多量の浮動小数点（ｆｌｏａｔｉｎｇ−ｐｏｉｎｔ）演算を使用する。また、ＤＳＰアルゴリズムは速度を向上させる時、またはプラットホームへの適用時に浮動小数点演算を整数演算に変換する。ここで、整数コーディングとは、コデック上の浮動小数点演算を固定小数点演算に変える作業を意味する。
【０００４】
ビデオ、オーディオなどの大部分のマルチメディア関連ＤＳＰコデックは、ＤＣＴ（ＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）やＤＦＴ（ＤｉｓｃｒｅｔｅＦｏｕｒｉｅｒＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）を通じた周波数領域の特性を用いている。このようなＤＣＴやＤＦＴは高速の演算のためにＦＦＴを用いる。ＦＦＴはアルゴリズムの特性上、乗算演算を多用するために整数コーディング時の精度に敏感である。
【０００５】
図１は、従来のＩＤＦＴの整数コーディング方法を示すフローチャートである。
まず、ＶＬＣ（ＶａｒｉａｂｌｅＬｅｎｇｔｈＣｏｄｅ）の形で入力されるフレーム単位のサンプルを逆量子化して実数値のサンプルを生成する（１１０過程）。
【０００６】
次いで、逆量子化されたサンプルを最大値及び有効ビットによって２^ｎ乗算する（１２０過程）。ここで、最大値とは、全てのサンプル値のうち最大絶対値を意味し、図２に示されたように有効ビット２１０は符号ビットｓ+整数ビット２２０+小数ビット２３０で構成される。そして、ｎは有効ビット−最大値ビットで決定される。
【０００７】
次いで、２^ｎ乗算したサンプルをＩＤＦＴする（１３０過程）。
図１に示されたような既存の整数コーディング方法は、ＩＤＦＴが処理するフレームのサンプル数が多様な場合、最大フレームサイズの最大値及び有効ビットによって倍数が決定される。また、この倍数は最大フレームサイズより少ないサンプル数を有するフレームでも固定的に適用される。したがって、既存の整数コーディング方法は、少ないサンプル数を有するフレームを整数演算する場合、小数ビット領域２３０が固定されて整数ビット領域２２０の余る領域を活用できないために精度が落ちる問題点がある。
【０００８】
【発明が解決しようとする課題】
本発明が解決しようとする技術的な課題は、フレームのサンプル数によってＩＤＦＴされる入力サンプルに倍数を別々に乗算して精度を向上させる整数コーディング方法を提供することである。
【０００９】
本発明が解決しようとする他の技術的課題は、前記整数コーディング方法を適用してＩＤＦＴで整数コーディングの精度を向上させるコデック装置を提供することである。
【００１０】
【課題を解決するための手段】
前記技術的な課題を達成するために、オーディオ及び／またはビデオ信号を符号化／復号化するＤＳＰコデックの整数コーディング方法において、相異なるサンプル数を有する複数のフレームに対してそれぞれの最大サンプル値を検出する過程と、前記過程で検出された各フレームの最大サンプル値に対して最大フレームの最大値を基準に正規化する過程と、前記正規化された値のうち最大サンプル値を検出する過程と、前記過程で検出された最大サンプル値に基づいて各フレームサイズによって倍数を決定し、前記倍数を各フレームのサンプル値に乗算して整数コードを生成する過程と、を含むことを特徴とする。
【００１１】
前記技術的な課題を達成するために、フレーム単位のオーディオ及び／またはビデオデータを符号化／復号化するコデック装置において、ＶＬＣコード形態のサンプルを逆量子化して実数値のサンプルを生成する逆量子化部と、前記逆量子化部で逆量子化されたフレーム単位のサンプルのうち最大サンプル値及び有効ビットに基づいてフレームサイズによって倍数を決定し、その倍数を前記逆量子化されたフレーム単位のサンプルに乗算して整数演算する整数コーディング部と、前記整数コーディング部で乗算されたサンプルを整数に逆フーリエ変換する整数逆変換部と、を含むことを特徴とする。
【００１２】
【発明の実施の形態】
以下、添付した図面に基づき、本発明の望ましい実施例を説明する。
図３は、本発明の整数コーディング方法を適用したコデック装置を示すブロック図である。
図３を参照すれば、まず、送信端でビデオまたはオーディオ信号を圧縮してフレーム単位のＶＬＣコードで送信する。このフレームはそのサンプル値情報を記録したヘッダとデータとからなる。
【００１３】
逆量子化部３１０は、送信端からのＶＬＣコードを逆量子化して実数値のサンプルを生成する。
整数コーディング部３２０は、倍数決定部３２２と整数生成部３２４とで構成される。すなわち、倍数決定部３２２は、逆量子化部３１０で逆量子化されたフレーム単位のサンプルを用いて有効ビット、サンプルの最大値、フレームサイズを求め、それらに基づいて倍数を決定する。整数生成部３２４は、倍数決定部３２２で決定された倍数を逆量子化された実数値のサンプルに乗算して整数を生成する。
整数逆変換部３３０は、実施例としてＩＤＦＴやＩＦＦＴを適用し、整数コーディング部３２０で生成された整数値をもって逆フーリエ変換を行う。
【００１４】
図４は、本発明に係る整数コーディング方法を示すフローチャートである。
まず、ＶＬＣの形に入力されるフレーム単位のサンプルを逆量子化して実数値のサンプルを生成する（４１０過程）。
次いで、入力されるフレームサンプル数が２^ｍ〜２^ｎ（ｍ＜ｎ）であれば、各フレームに対してヘッダに記録された各フレームの最大サンプル値を調べる（４２０過程）。ここで、入力フレームサンプルの最大値は該当フレームサイズに密接な関係がある。すなわち、フレームサイズが２０４８である場合、最大値がｍであれば、フレームサイズが１０２４である場合の最大値はｍ／２、フレームサイズが５１２である場合の最大値はｍ／４、またフレームサイズが２５６である場合の最大値はｍ／８となる。例えば、“５１２個のサンプルを有するフレーム”、“１０２４個のサンプルを有するフレーム”、“２５６個のサンプルを有するフレーム”、“１０２４個のサンプルを有するフレーム”、“２５６個のサンプルを有するフレーム”、“１０２４個のサンプルを有するフレーム”が順次に入力されるとすれば、各フレームでの最大サンプル値は“４００”、“７９９”、“２０１”、“８１０”、“１９８”、“８０５”として抽出されうる。
【００１５】
次いで、各フレームの最大サンプル値のうち最大フレームの最大サンプル値を基準に正規化を行う（４２２過程）。例えば、入力されるフレームのうち“１０２４サンプルのフレーム”は８１０＊１＝８１０、“５１２サンプルのフレーム”は４００＊２＝８００、“２５６サンプルのフレーム”は２０１＊４＝８０４として計算される。
【００１６】
次いで、正規化された値のうち最大サンプル値を検出する（４３０過程）。
最大値がＭａｘ_ｉであると仮定すれば、最大サンプル値は数式２のようである。
【００１７】
【数２】

【００１８】
例えば、正規化された値８１０、８００、８０４のうちＭａｘ_{ｔｏｔａｌ}は８１０となる。
次いで、求められた全体フレームに対する最大サンプル値及び有効ビット、各フレームのサンプル数によって相異なる倍数を決定する（４４０過程）。プラットホームが提供する有効ビット数をＢｉｔ_{ｐｌａｔｆｏｒｍ}とし、Ｍａｘ_ｔｏｔ _ａｌの符号及び整数部が占めるビット数をＢｉｔ_ｍａｘとすれば、サンプル数２^ｉの場合に最終的にフレームの各サンプルに乗算される倍数は数式３のようである。ここで、有効ビットは符号ビット＋整数ビット＋小数ビットで構成される。
【００１９】
【数３】

【００２０】
ここで、２^ｎは最大フレームのサンプル数、２^ｉは現在計算されるフレームサンプル数である。結局、数式４が小数ビット領域のビット数となる。
【００２１】
【数４】

【００２２】
例えば、“１０２４サンプルフレーム”、“５１２サンプルフレーム”、“２５６サンプルフレーム”の倍数が数式３によって求められる。
次いで、前記のようにフレームサイズ別に学習過程を経て決定された倍数を逆量子化したサンプルに乗算する（４５０過程）。
【００２３】
例えば、フレームサイズが２０４８である場合には各サンプルに２^５が乗算され、フレームサイズが１０２４である場合には各サンプルに２^６が乗算され、フレームサイズが５１２である場合には各サンプルに２^７が乗算され、フレームサイズが２５６である場合には各サンプルには２^８が乗算される。
【００２４】
したがって、小数ビットは入力されるフレームのサンプル数によって可変されるために整数演算時の精度を向上させる。
最終的に、フレームのサンプル数にＱ_ｉ倍を取った値を逆フーリエ変換する（４６０過程）。
本発明は前述した実施例に限定されず、本発明の思想内で当業者による変形が可能であることはもちろんである。
【００２５】
【発明の効果】
以上述べたように、本発明によれば、コデックにおいてフレームのサイズによって相異なる倍数を取ることによって小数ビット領域を可変させて整数コーディング時の精度を向上させうる。
【図面の簡単な説明】
【図１】従来のＩＤＦＴの整数コーディング方法を示すフローチャートである。
【図２】浮動小数点の表現方法を示す概念図である。
【図３】本発明の整数コーディング方法を適用した信号デコーディング装置を示すブロック図である。
【図４】本発明に係る整数コーディング方法を示すフローチャートである。
【符号の説明】
３１０逆量子化部
３２０整数コーディング部
３２２倍数決定部
３２４整数生成部
３３０整数逆変換部

Claims

オーディオ及び／またはビデオ信号を符号化／復号化するＤＳＰコデックの整数コーディング方法において、
相異なるサンプル数を有する複数のフレームに対してそれぞれの最大サンプル値を検出する過程と、
前記過程で検出された各フレームの最大サンプル値に対して最大フレームの最大サンプル値を基準に正規化する過程と、
前記正規化された値のうち最大の最大サンプル値を検出する過程と、
前記過程で検出された最大の最大サンプル値及び各フレームサイズによって倍数を決定し、前記倍数を各フレームのサンプル値に乗算して整数コードを生成する過程と、を含む整数コーディング方法。
前記倍数は、

によって決定され、ここで２^ｎは最大フレームのサンプル数、２^ｉは該当フレームのサンプル数であり、Ｂｉｔ_{ｐｌａｔｆｏｒｍ}は有効ビット数であり、Ｂｉｔ_ｍａｘは全体フレームのうち前記最大の最大サンプル値の符号及び整数部が占めるビット数であることを特徴とする請求項１に記載の整数コーディング方法。
前記フレームのサンプル数によって他の倍数を取ったサンプル値を整数に逆フーリエ変換する過程をさらに含むことを特徴とする請求項１に記載の整数コーディング方法。
前記決定された倍数は逆量子化されたサンプル値を整数コードとして生成する時に適用されることを特徴とする請求項１に記載の整数コーディング方法。
フレーム単位のオーディオ及び／またはビデオデータを符号化／復号化するコデック装置において、
ＶＬＣコード形態のサンプルを逆量子化して実数値のサンプルを生成する逆量子化部と、
前記逆量子化部で逆量子化されたフレーム単位のサンプルに対して最大フレームの最大サンプル値を基準に正規化して、前記正規化された値のうち最大の最大サンプル値を検出し、前記最大の最大サンプル値及び有効ビット及びフレームサイズによって倍数を決定し、その倍数を前記逆量子化されたフレーム単位のサンプルに乗算して整数演算する整数コーディング部と、
前記整数コーディング部で乗算されたサンプルを整数に逆フーリエ変換する整数逆変換部と、を含むコデック装置。
前記整数コーディング部は、
前記逆量子化部で逆量子化されたサンプルに対する最大サンプル値、有効ビットに基づいてフレームサイズによる倍数を決定する倍数決定部と、
前記倍数決定部で決定された倍数を前記逆量子化部で逆量子化されたサンプルに乗算して整数コードを生成する整数生成部と、を含むことを特徴とする請求項５に記載のコデック装置。