JP4209717B2 - 多様なフレームサイズを支援する整数コーディング方法及びそれを適用したコデック装置 - Google Patents
多様なフレームサイズを支援する整数コーディング方法及びそれを適用したコデック装置 Download PDFInfo
- Publication number
- JP4209717B2 JP4209717B2 JP2003136463A JP2003136463A JP4209717B2 JP 4209717 B2 JP4209717 B2 JP 4209717B2 JP 2003136463 A JP2003136463 A JP 2003136463A JP 2003136463 A JP2003136463 A JP 2003136463A JP 4209717 B2 JP4209717 B2 JP 4209717B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- integer
- maximum
- sample
- sample value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
- H04N19/45—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder performing compensation of the inverse transform mismatch, e.g. Inverse Discrete Cosine Transform [IDCT] mismatch
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
【発明の属する技術分野】
本発明はデジタル信号処理システムに係り、特に多様なフレームサイズを支援する整数コーディング方法及びこれを適用したコデック(CODEC:Coder−Decoder)装置に関する。
【0002】
【従来の技術】
最近、マルチメディアコンテンツを提供する製品は高速のデジタル信号演算のために高性能のDSP(Digital Signal Processing)コデックを使用している。
【0003】
DSPアルゴリズムは多量の浮動小数点(floating−point)演算を使用する。また、DSPアルゴリズムは速度を向上させる時、またはプラットホームへの適用時に浮動小数点演算を整数演算に変換する。ここで、整数コーディングとは、コデック上の浮動小数点演算を固定小数点演算に変える作業を意味する。
【0004】
ビデオ、オーディオなどの大部分のマルチメディア関連DSPコデックは、DCT(Discrete Cosine Transform)やDFT(Discrete Fourier Cosine Transform)を通じた周波数領域の特性を用いている。このようなDCTやDFTは高速の演算のためにFFTを用いる。FFTはアルゴリズムの特性上、乗算演算を多用するために整数コーディング時の精度に敏感である。
【0005】
図1は、従来のIDFTの整数コーディング方法を示すフローチャートである。
まず、VLC(Variable Length Code)の形で入力されるフレーム単位のサンプルを逆量子化して実数値のサンプルを生成する(110過程)。
【0006】
次いで、逆量子化されたサンプルを最大値及び有効ビットによって2n乗算する(120過程)。ここで、最大値とは、全てのサンプル値のうち最大絶対値を意味し、図2に示されたように有効ビット210は符号ビットs+整数ビット220+小数ビット230で構成される。そして、nは有効ビット−最大値ビットで決定される。
【0007】
次いで、2n乗算したサンプルをIDFTする(130過程)。
図1に示されたような既存の整数コーディング方法は、IDFTが処理するフレームのサンプル数が多様な場合、最大フレームサイズの最大値及び有効ビットによって倍数が決定される。また、この倍数は最大フレームサイズより少ないサンプル数を有するフレームでも固定的に適用される。したがって、既存の整数コーディング方法は、少ないサンプル数を有するフレームを整数演算する場合、小数ビット領域230が固定されて整数ビット領域220の余る領域を活用できないために精度が落ちる問題点がある。
【0008】
【発明が解決しようとする課題】
本発明が解決しようとする技術的な課題は、フレームのサンプル数によってIDFTされる入力サンプルに倍数を別々に乗算して精度を向上させる整数コーディング方法を提供することである。
【0009】
本発明が解決しようとする他の技術的課題は、前記整数コーディング方法を適用してIDFTで整数コーディングの精度を向上させるコデック装置を提供することである。
【0010】
【課題を解決するための手段】
前記技術的な課題を達成するために、オーディオ及び/またはビデオ信号を符号化/復号化するDSPコデックの整数コーディング方法において、相異なるサンプル数を有する複数のフレームに対してそれぞれの最大サンプル値を検出する過程と、前記過程で検出された各フレームの最大サンプル値に対して最大フレームの最大値を基準に正規化する過程と、前記正規化された値のうち最大サンプル値を検出する過程と、前記過程で検出された最大サンプル値に基づいて各フレームサイズによって倍数を決定し、前記倍数を各フレームのサンプル値に乗算して整数コードを生成する過程と、を含むことを特徴とする。
【0011】
前記技術的な課題を達成するために、フレーム単位のオーディオ及び/またはビデオデータを符号化/復号化するコデック装置において、VLCコード形態のサンプルを逆量子化して実数値のサンプルを生成する逆量子化部と、前記逆量子化部で逆量子化されたフレーム単位のサンプルのうち最大サンプル値及び有効ビットに基づいてフレームサイズによって倍数を決定し、その倍数を前記逆量子化されたフレーム単位のサンプルに乗算して整数演算する整数コーディング部と、前記整数コーディング部で乗算されたサンプルを整数に逆フーリエ変換する整数逆変換部と、を含むことを特徴とする。
【0012】
【発明の実施の形態】
以下、添付した図面に基づき、本発明の望ましい実施例を説明する。
図3は、本発明の整数コーディング方法を適用したコデック装置を示すブロック図である。
図3を参照すれば、まず、送信端でビデオまたはオーディオ信号を圧縮してフレーム単位のVLCコードで送信する。このフレームはそのサンプル値情報を記録したヘッダとデータとからなる。
【0013】
逆量子化部310は、送信端からのVLCコードを逆量子化して実数値のサンプルを生成する。
整数コーディング部320は、倍数決定部322と整数生成部324とで構成される。すなわち、倍数決定部322は、逆量子化部310で逆量子化されたフレーム単位のサンプルを用いて有効ビット、サンプルの最大値、フレームサイズを求め、それらに基づいて倍数を決定する。整数生成部324は、倍数決定部322で決定された倍数を逆量子化された実数値のサンプルに乗算して整数を生成する。
整数逆変換部330は、実施例としてIDFTやIFFTを適用し、整数コーディング部320で生成された整数値をもって逆フーリエ変換を行う。
【0014】
図4は、本発明に係る整数コーディング方法を示すフローチャートである。
まず、VLCの形に入力されるフレーム単位のサンプルを逆量子化して実数値のサンプルを生成する(410過程)。
次いで、入力されるフレームサンプル数が2m〜2n(m<n)であれば、各フレームに対してヘッダに記録された各フレームの最大サンプル値を調べる(420過程)。ここで、入力フレームサンプルの最大値は該当フレームサイズに密接な関係がある。すなわち、フレームサイズが2048である場合、最大値がmであれば、フレームサイズが1024である場合の最大値はm/2、フレームサイズが512である場合の最大値はm/4、またフレームサイズが256である場合の最大値はm/8となる。例えば、“512個のサンプルを有するフレーム”、“1024個のサンプルを有するフレーム”、“256個のサンプルを有するフレーム”、“1024個のサンプルを有するフレーム”、“256個のサンプルを有するフレーム”、“1024個のサンプルを有するフレーム”が順次に入力されるとすれば、各フレームでの最大サンプル値は“400”、“799”、“201”、“810”、“198”、“805”として抽出されうる。
【0015】
次いで、各フレームの最大サンプル値のうち最大フレームの最大サンプル値を基準に正規化を行う(422過程)。例えば、入力されるフレームのうち“1024サンプルのフレーム”は810*1=810、“512サンプルのフレーム”は400*2=800、“256サンプルのフレーム”は201*4=804として計算される。
【0016】
次いで、正規化された値のうち最大サンプル値を検出する(430過程)。
最大値がMaxiであると仮定すれば、最大サンプル値は数式2のようである。
【0017】
【数2】
【0018】
例えば、正規化された値810、800、804のうちMaxtotalは810となる。
次いで、求められた全体フレームに対する最大サンプル値及び有効ビット、各フレームのサンプル数によって相異なる倍数を決定する(440過程)。プラットホームが提供する有効ビット数をBitplatformとし、Maxtot alの符号及び整数部が占めるビット数をBitmaxとすれば、サンプル数2iの場合に最終的にフレームの各サンプルに乗算される倍数は数式3のようである。ここで、有効ビットは符号ビット+整数ビット+小数ビットで構成される。
【0019】
【数3】
【0020】
ここで、2nは最大フレームのサンプル数、2iは現在計算されるフレームサンプル数である。結局、数式4が小数ビット領域のビット数となる。
【0021】
【数4】
【0022】
例えば、“1024サンプルフレーム”、“512サンプルフレーム”、“256サンプルフレーム”の倍数が数式3によって求められる。
次いで、前記のようにフレームサイズ別に学習過程を経て決定された倍数を逆量子化したサンプルに乗算する(450過程)。
【0023】
例えば、フレームサイズが2048である場合には各サンプルに25が乗算され、フレームサイズが1024である場合には各サンプルに26が乗算され、フレームサイズが512である場合には各サンプルに27が乗算され、フレームサイズが256である場合には各サンプルには28が乗算される。
【0024】
したがって、小数ビットは入力されるフレームのサンプル数によって可変されるために整数演算時の精度を向上させる。
最終的に、フレームのサンプル数にQi倍を取った値を逆フーリエ変換する(460過程)。
本発明は前述した実施例に限定されず、本発明の思想内で当業者による変形が可能であることはもちろんである。
【0025】
【発明の効果】
以上述べたように、本発明によれば、コデックにおいてフレームのサイズによって相異なる倍数を取ることによって小数ビット領域を可変させて整数コーディング時の精度を向上させうる。
【図面の簡単な説明】
【図1】 従来のIDFTの整数コーディング方法を示すフローチャートである。
【図2】 浮動小数点の表現方法を示す概念図である。
【図3】 本発明の整数コーディング方法を適用した信号デコーディング装置を示すブロック図である。
【図4】 本発明に係る整数コーディング方法を示すフローチャートである。
【符号の説明】
310 逆量子化部
320 整数コーディング部
322 倍数決定部
324 整数生成部
330 整数逆変換部
Claims (6)
- オーディオ及び/またはビデオ信号を符号化/復号化するDSPコデックの整数コーディング方法において、
相異なるサンプル数を有する複数のフレームに対してそれぞれの最大サンプル値を検出する過程と、
前記過程で検出された各フレームの最大サンプル値に対して最大フレームの最大サンプル値を基準に正規化する過程と、
前記正規化された値のうち最大の最大サンプル値を検出する過程と、
前記過程で検出された最大の最大サンプル値及び各フレームサイズによって倍数を決定し、前記倍数を各フレームのサンプル値に乗算して整数コードを生成する過程と、を含む整数コーディング方法。 - 前記フレームのサンプル数によって他の倍数を取ったサンプル値を整数に逆フーリエ変換する過程をさらに含むことを特徴とする請求項1に記載の整数コーディング方法。
- 前記決定された倍数は逆量子化されたサンプル値を整数コードとして生成する時に適用されることを特徴とする請求項1に記載の整数コーディング方法。
- フレーム単位のオーディオ及び/またはビデオデータを符号化/復号化するコデック装置において、
VLCコード形態のサンプルを逆量子化して実数値のサンプルを生成する逆量子化部と、
前記逆量子化部で逆量子化されたフレーム単位のサンプルに対して最大フレームの最大サンプル値を基準に正規化して、前記正規化された値のうち最大の最大サンプル値を検出し、前記最大の最大サンプル値及び有効ビット及びフレームサイズによって倍数を決定し、その倍数を前記逆量子化されたフレーム単位のサンプルに乗算して整数演算する整数コーディング部と、
前記整数コーディング部で乗算されたサンプルを整数に逆フーリエ変換する整数逆変換部と、を含むコデック装置。 - 前記整数コーディング部は、
前記逆量子化部で逆量子化されたサンプルに対する最大サンプル値、有効ビットに基づいてフレームサイズによる倍数を決定する倍数決定部と、
前記倍数決定部で決定された倍数を前記逆量子化部で逆量子化されたサンプルに乗算して整数コードを生成する整数生成部と、を含むことを特徴とする請求項5に記載のコデック装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2002-0031606A KR100477649B1 (ko) | 2002-06-05 | 2002-06-05 | 다양한 프레임 사이즈를 지원하는 정수 코딩 방법 및 그를적용한 코덱 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004015803A JP2004015803A (ja) | 2004-01-15 |
JP4209717B2 true JP4209717B2 (ja) | 2009-01-14 |
Family
ID=19720663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003136463A Expired - Fee Related JP4209717B2 (ja) | 2002-06-05 | 2003-05-14 | 多様なフレームサイズを支援する整数コーディング方法及びそれを適用したコデック装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US6847314B2 (ja) |
JP (1) | JP4209717B2 (ja) |
KR (1) | KR100477649B1 (ja) |
CN (1) | CN1237812C (ja) |
DE (1) | DE10318413A1 (ja) |
GB (1) | GB2389983B (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100668319B1 (ko) | 2004-12-07 | 2007-01-12 | 삼성전자주식회사 | 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치 |
JP4523885B2 (ja) * | 2005-06-30 | 2010-08-11 | 日本電信電話株式会社 | 信号の符号化装置、方法、プログラムおよび記録媒体 |
US20070074008A1 (en) * | 2005-09-28 | 2007-03-29 | Donofrio David D | Mixed mode floating-point pipeline with extended functions |
TW200746655A (en) * | 2005-11-18 | 2007-12-16 | Sony Corp | Encoding device and method, decoding device and method, and transmission system |
US8879632B2 (en) | 2010-02-18 | 2014-11-04 | Qualcomm Incorporated | Fixed point implementation for geometric motion partitioning |
JP2013524730A (ja) * | 2010-04-12 | 2013-06-17 | クゥアルコム・インコーポレイテッド | 幾何学的動き区分のための固定小数点実装形態 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62130480A (ja) * | 1985-12-02 | 1987-06-12 | Canon Inc | 画像情報の符号化方法 |
KR890702151A (ko) * | 1987-08-21 | 1989-12-23 | 앨프리드 퍼어내트 | 변환 프로세싱 회로 |
US5625714A (en) * | 1991-01-10 | 1997-04-29 | Olympus Optical Co., Ltd. | Image signal decoding device capable of removing block distortion with simple structure |
JP3161614B2 (ja) * | 1991-11-30 | 2001-04-25 | ソニー株式会社 | 動画像復号化装置 |
JP3254924B2 (ja) * | 1994-09-05 | 2002-02-12 | ソニー株式会社 | データ再生方法およびデータ再生装置 |
US6400680B1 (en) * | 1997-12-30 | 2002-06-04 | Koninklijke Philips Electronics N.V. | Data transformation of the inverse-fourier type |
US6584154B1 (en) * | 1998-11-26 | 2003-06-24 | Oki Electric Industry Co., Ltd. | Moving-picture coding and decoding method and apparatus with reduced computational cost |
JP4639441B2 (ja) * | 1999-09-01 | 2011-02-23 | ソニー株式会社 | ディジタル信号処理装置および処理方法、並びにディジタル信号記録装置および記録方法 |
KR100659200B1 (ko) * | 1999-09-11 | 2006-12-19 | 유티스타콤코리아 유한회사 | 이동 통신 단말기의 보코딩 시스템에서 음성신호 정규화방법 |
-
2002
- 2002-06-05 KR KR10-2002-0031606A patent/KR100477649B1/ko not_active IP Right Cessation
-
2003
- 2003-04-23 DE DE2003118413 patent/DE10318413A1/de not_active Ceased
- 2003-05-14 JP JP2003136463A patent/JP4209717B2/ja not_active Expired - Fee Related
- 2003-05-15 US US10/437,978 patent/US6847314B2/en not_active Expired - Fee Related
- 2003-05-20 CN CNB031362605A patent/CN1237812C/zh not_active Expired - Fee Related
- 2003-05-28 GB GB0312141A patent/GB2389983B/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
KR20030093762A (ko) | 2003-12-11 |
GB2389983B (en) | 2004-06-09 |
US6847314B2 (en) | 2005-01-25 |
GB2389983A (en) | 2003-12-24 |
DE10318413A1 (de) | 2004-01-29 |
CN1471318A (zh) | 2004-01-28 |
KR100477649B1 (ko) | 2005-03-23 |
JP2004015803A (ja) | 2004-01-15 |
GB0312141D0 (en) | 2003-07-02 |
US20030227975A1 (en) | 2003-12-11 |
CN1237812C (zh) | 2006-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI398854B (zh) | 用於計算轉換值及執行定窗運算之方法、裝置、電路及電腦可讀媒體,及用於提供一解碼器之方法 | |
JP4425824B2 (ja) | 動画像コーデック変換の高速実装 | |
JP2021036333A (ja) | Hoa信号の係数領域表現からこのhoa信号の混合した空間/係数領域表現を生成する方法および装置 | |
JP2001184080A (ja) | 圧縮オーディオデータへの電子透かし方法およびそのシステム | |
US10366698B2 (en) | Variable length coding of indices and bit scheduling in a pyramid vector quantizer | |
EP2863388B1 (en) | Bit allocation method and device for audio signal | |
KR20080110892A (ko) | 오디오 코딩 및 디코딩에서의 여기의 프로세싱 | |
JP2002135131A (ja) | 可変サイズベクトルエントロピ符号化を実行するための方法および装置 | |
JP5280607B2 (ja) | 音声信号圧縮装置及び方法、音声信号復元装置及び方法、ならびにコンピュータ読取可能な記録媒体 | |
US9886962B2 (en) | Extracting audio fingerprints in the compressed domain | |
JP4209717B2 (ja) | 多様なフレームサイズを支援する整数コーディング方法及びそれを適用したコデック装置 | |
JP5256375B2 (ja) | 符号化方法、復号方法、装置、プログラム及び記録媒体 | |
US20070192086A1 (en) | Perceptual quality based automatic parameter selection for data compression | |
WO2020253054A1 (zh) | 评估音频信号损失的方法、装置及存储介质 | |
James et al. | Audio compression using DCT and DWT techniques | |
JP3353267B2 (ja) | 音響信号変換符号化方法及び復号化方法 | |
Ahmed et al. | Audio Compression Using Transform Coding with LZW and Double Shift Coding | |
Jabbar et al. | A Survey of Transform Coding for High-Speed Audio Compression | |
Rahman et al. | A lossless speech signal compression technique | |
Aloui et al. | New algorithm for speech compression based on discrete hartley transform | |
JP3979026B2 (ja) | 信号復号方法および信号復号装置ならびに信号復号処理プログラムを記録した記録媒体 | |
RU2817687C2 (ru) | Способ и устройство для формирования из представления hoa-сигналов в области коэффициентов смешанного представления упомянутых hoa-сигналов в пространственной области/области коэффициентов | |
WO2024085903A1 (en) | Non-windowed dct-based audio coding using advanced quantization | |
Jabbar et al. | Compression of speech audio signals using Tap97-wavelet, short DCT, and BZIP2 encoder | |
JP3222967B2 (ja) | ディジタル信号処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050812 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050816 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051116 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20051213 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060310 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20060419 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20060512 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080819 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081023 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111031 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121031 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131031 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |