JP4209717B2 - 多様なフレームサイズを支援する整数コーディング方法及びそれを適用したコデック装置 - Google Patents

多様なフレームサイズを支援する整数コーディング方法及びそれを適用したコデック装置 Download PDF

Info

Publication number
JP4209717B2
JP4209717B2 JP2003136463A JP2003136463A JP4209717B2 JP 4209717 B2 JP4209717 B2 JP 4209717B2 JP 2003136463 A JP2003136463 A JP 2003136463A JP 2003136463 A JP2003136463 A JP 2003136463A JP 4209717 B2 JP4209717 B2 JP 4209717B2
Authority
JP
Japan
Prior art keywords
frame
integer
maximum
sample
sample value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003136463A
Other languages
English (en)
Other versions
JP2004015803A (ja
Inventor
基錫 張
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2004015803A publication Critical patent/JP2004015803A/ja
Application granted granted Critical
Publication of JP4209717B2 publication Critical patent/JP4209717B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • H04N19/45Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder performing compensation of the inverse transform mismatch, e.g. Inverse Discrete Cosine Transform [IDCT] mismatch
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

【0001】
【発明の属する技術分野】
本発明はデジタル信号処理システムに係り、特に多様なフレームサイズを支援する整数コーディング方法及びこれを適用したコデック(CODEC:Coder−Decoder)装置に関する。
【0002】
【従来の技術】
最近、マルチメディアコンテンツを提供する製品は高速のデジタル信号演算のために高性能のDSP(Digital Signal Processing)コデックを使用している。
【0003】
DSPアルゴリズムは多量の浮動小数点(floating−point)演算を使用する。また、DSPアルゴリズムは速度を向上させる時、またはプラットホームへの適用時に浮動小数点演算を整数演算に変換する。ここで、整数コーディングとは、コデック上の浮動小数点演算を固定小数点演算に変える作業を意味する。
【0004】
ビデオ、オーディオなどの大部分のマルチメディア関連DSPコデックは、DCT(Discrete Cosine Transform)やDFT(Discrete Fourier Cosine Transform)を通じた周波数領域の特性を用いている。このようなDCTやDFTは高速の演算のためにFFTを用いる。FFTはアルゴリズムの特性上、乗算演算を多用するために整数コーディング時の精度に敏感である。
【0005】
図1は、従来のIDFTの整数コーディング方法を示すフローチャートである。
まず、VLC(Variable Length Code)の形で入力されるフレーム単位のサンプルを逆量子化して実数値のサンプルを生成する(110過程)。
【0006】
次いで、逆量子化されたサンプルを最大値及び有効ビットによって2乗算する(120過程)。ここで、最大値とは、全てのサンプル値のうち最大絶対値を意味し、図2に示されたように有効ビット210は符号ビットs+整数ビット220+小数ビット230で構成される。そして、nは有効ビット−最大値ビットで決定される。
【0007】
次いで、2乗算したサンプルをIDFTする(130過程)。
図1に示されたような既存の整数コーディング方法は、IDFTが処理するフレームのサンプル数が多様な場合、最大フレームサイズの最大値及び有効ビットによって倍数が決定される。また、この倍数は最大フレームサイズより少ないサンプル数を有するフレームでも固定的に適用される。したがって、既存の整数コーディング方法は、少ないサンプル数を有するフレームを整数演算する場合、小数ビット領域230が固定されて整数ビット領域220の余る領域を活用できないために精度が落ちる問題点がある。
【0008】
【発明が解決しようとする課題】
本発明が解決しようとする技術的な課題は、フレームのサンプル数によってIDFTされる入力サンプルに倍数を別々に乗算して精度を向上させる整数コーディング方法を提供することである。
【0009】
本発明が解決しようとする他の技術的課題は、前記整数コーディング方法を適用してIDFTで整数コーディングの精度を向上させるコデック装置を提供することである。
【0010】
【課題を解決するための手段】
前記技術的な課題を達成するために、オーディオ及び/またはビデオ信号を符号化/復号化するDSPコデックの整数コーディング方法において、相異なるサンプル数を有する複数のフレームに対してそれぞれの最大サンプル値を検出する過程と、前記過程で検出された各フレームの最大サンプル値に対して最大フレームの最大値を基準に正規化する過程と、前記正規化された値のうち最大サンプル値を検出する過程と、前記過程で検出された最大サンプル値に基づいて各フレームサイズによって倍数を決定し、前記倍数を各フレームのサンプル値に乗算して整数コードを生成する過程と、を含むことを特徴とする。
【0011】
前記技術的な課題を達成するために、フレーム単位のオーディオ及び/またはビデオデータを符号化/復号化するコデック装置において、VLCコード形態のサンプルを逆量子化して実数値のサンプルを生成する逆量子化部と、前記逆量子化部で逆量子化されたフレーム単位のサンプルのうち最大サンプル値及び有効ビットに基づいてフレームサイズによって倍数を決定し、その倍数を前記逆量子化されたフレーム単位のサンプルに乗算して整数演算する整数コーディング部と、前記整数コーディング部で乗算されたサンプルを整数に逆フーリエ変換する整数逆変換部と、を含むことを特徴とする。
【0012】
【発明の実施の形態】
以下、添付した図面に基づき、本発明の望ましい実施例を説明する。
図3は、本発明の整数コーディング方法を適用したコデック装置を示すブロック図である。
図3を参照すれば、まず、送信端でビデオまたはオーディオ信号を圧縮してフレーム単位のVLCコードで送信する。このフレームはそのサンプル情報を記録したヘッダとデータとからなる。
【0013】
逆量子化部310は、送信端からのVLCコードを逆量子化して実数値のサンプルを生成する。
整数コーディング部320は、倍数決定部322と整数生成部324とで構成される。すなわち、倍数決定部322は、逆量子化部310で逆量子化されたフレーム単位のサンプルを用いて有効ビット、サンプルの最大値、フレームサイズを求め、それらに基づいて倍数を決定する。整数生成部324は、倍数決定部322で決定された倍数を逆量子化された実数値のサンプルに乗算して整数を生成する。
整数逆変換部330は、実施例としてIDFTやIFFTを適用し、整数コーディング部320で生成された整数値をもって逆フーリエ変換を行う。
【0014】
図4は、本発明に係る整数コーディング方法を示すフローチャートである。
まず、VLCの形に入力されるフレーム単位のサンプルを逆量子化して実数値のサンプルを生成する(410過程)。
次いで、入力されるフレームサンプル数が2〜2(m<n)であれば、各フレームに対してヘッダに記録された各フレームの最大サンプル値を調べる(420過程)。ここで、入力フレームサンプルの最大値は該当フレームサイズに密接な関係がある。すなわち、フレームサイズが2048である場合、最大値がmであれば、フレームサイズが1024である場合の最大値はm/2、フレームサイズが512である場合の最大値はm/4、またフレームサイズが256である場合の最大値はm/8となる。例えば、“512個のサンプルを有するフレーム”、“1024個のサンプルを有するフレーム”、“256個のサンプルを有するフレーム”、“1024個のサンプルを有するフレーム”、“256個のサンプルを有するフレーム”、“1024個のサンプルを有するフレーム”が順次に入力されるとすれば、各フレームでの最大サンプル値は“400”、“799”、“201”、“810”、“198”、“805”として抽出されうる。
【0015】
次いで、各フレームの最大サンプル値のうち最大フレームの最大サンプル値を基準に正規化を行う(422過程)。例えば、入力されるフレームのうち“1024サンプルのフレーム”は810*1=810、“512サンプルのフレーム”は400*2=800、“256サンプルのフレーム”は201*=804として計算される。
【0016】
次いで、正規化された値のうち最大サンプル値を検出する(430過程)。
最大値がMaxであると仮定すれば、最大サンプル値は数式2のようである。
【0017】
【数2】
Figure 0004209717
【0018】
例えば、正規化された値810、800、804のうちMaxtotalは810となる。
次いで、求められた全体フレームに対する最大サンプル値及び有効ビット、各フレームのサンプル数によって相異なる倍数を決定する(440過程)。プラットホームが提供する有効ビット数をBitplatformとし、Maxtot alの符号及び整数部が占めるビット数をBitmaxとすれば、サンプル数2の場合に最終的にフレームの各サンプルに乗算される倍数は数式3のようである。ここで、有効ビットは符号ビット+整数ビット+小数ビットで構成される。
【0019】
【数3】
Figure 0004209717
【0020】
ここで、2は最大フレームのサンプル数、2は現在計算されるフレームサンプル数である。結局、数式4が小数ビット域のビット数となる。
【0021】
【数4】
Figure 0004209717
【0022】
例えば、“1024サンプルフレーム”、“512サンプルフレーム”、“256サンプルフレーム”の倍数が数式3によって求められる。
次いで、前記のようにフレームサイズ別に学習過程を経て決定された倍数を逆量子化したサンプルに乗算する(450過程)。
【0023】
例えば、フレームサイズが2048である場合には各サンプルに2が乗算され、フレームサイズが1024である場合には各サンプルに2が乗算され、フレームサイズが512である場合には各サンプルに2が乗算され、フレームサイズが256である場合には各サンプルには2が乗算される。
【0024】
したがって、小数ビットは入力されるフレームのサンプル数によって可変されるために整数演算時の精度を向上させる。
最終的に、フレームのサンプル数にQ倍を取った値を逆フーリエ変換する(460過程)。
本発明は前述した実施例に限定されず、本発明の思想内で当業者による変形が可能であることはもちろんである。
【0025】
【発明の効果】
以上述べたように、本発明によれば、コデックにおいてフレームのサイズによって相異なる倍数を取ることによって小数ビット領域を可変させて整数コーディング時の精度を向上させうる。
【図面の簡単な説明】
【図1】 従来のIDFTの整数コーディング方法を示すフローチャートである。
【図2】 浮動小数点の表現方法を示す概念図である。
【図3】 本発明の整数コーディング方法を適用した信号デコーディング装置を示すブロック図である。
【図4】 本発明に係る整数コーディング方法を示すフローチャートである。
【符号の説明】
310 逆量子化部
320 整数コーディング部
322 倍数決定部
324 整数生成部
330 整数逆変換部

Claims (6)

  1. オーディオ及び/またはビデオ信号を符号化/復号化するDSPコデックの整数コーディング方法において、
    相異なるサンプル数を有する複数のフレームに対してそれぞれの最大サンプル値を検出する過程と、
    前記過程で検出された各フレームの最大サンプル値に対して最大フレームの最大サンプル値を基準に正規化する過程と、
    前記正規化された値のうち最大の最大サンプル値を検出する過程と、
    前記過程で検出された最大の最大サンプル値及び各フレームサイズによって倍数を決定し、前記倍数を各フレームのサンプル値に乗算して整数コードを生成する過程と、を含む整数コーディング方法。
  2. 前記倍数は、
    Figure 0004209717
    によって決定され、ここで2は最大フレームのサンプル数、2は該当フレームのサンプル数であり、Bitplatformは有効ビット数であり、Bitmaxは全体フレームのうち前記最大の最大サンプル値の符号及び整数部が占めるビット数であることを特徴とする請求項1に記載の整数コーディング方法。
  3. 前記フレームのサンプル数によって他の倍数を取ったサンプル値を整数に逆フーリエ変換する過程をさらに含むことを特徴とする請求項1に記載の整数コーディング方法。
  4. 前記決定された倍数は逆量子化されたサンプル値を整数コードとして生成する時に適用されることを特徴とする請求項1に記載の整数コーディング方法。
  5. フレーム単位のオーディオ及び/またはビデオデータを符号化/復号化するコデック装置において、
    VLCコード形態のサンプルを逆量子化して実数値のサンプルを生成する逆量子化部と、
    前記逆量子化部で逆量子化されたフレーム単位のサンプルに対して最大フレームの最大サンプル値を基準に正規化して、前記正規化された値のうち最大の最大サンプル値を検出し、前記最大の最大サンプル値及び有効ビット及びフレームサイズによって倍数を決定し、その倍数を前記逆量子化されたフレーム単位のサンプルに乗算して整数演算する整数コーディング部と、
    前記整数コーディング部で乗算されたサンプルを整数に逆フーリエ変換する整数逆変換部と、を含むコデック装置。
  6. 前記整数コーディング部は、
    前記逆量子化部で逆量子化されたサンプルに対する最大サンプル値、有効ビットに基づいてフレームサイズによる倍数を決定する倍数決定部と、
    前記倍数決定部で決定された倍数を前記逆量子化部で逆量子化されたサンプルに乗算して整数コードを生成する整数生成部と、を含むことを特徴とする請求項5に記載のコデック装置。
JP2003136463A 2002-06-05 2003-05-14 多様なフレームサイズを支援する整数コーディング方法及びそれを適用したコデック装置 Expired - Fee Related JP4209717B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2002-0031606A KR100477649B1 (ko) 2002-06-05 2002-06-05 다양한 프레임 사이즈를 지원하는 정수 코딩 방법 및 그를적용한 코덱 장치

Publications (2)

Publication Number Publication Date
JP2004015803A JP2004015803A (ja) 2004-01-15
JP4209717B2 true JP4209717B2 (ja) 2009-01-14

Family

ID=19720663

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003136463A Expired - Fee Related JP4209717B2 (ja) 2002-06-05 2003-05-14 多様なフレームサイズを支援する整数コーディング方法及びそれを適用したコデック装置

Country Status (6)

Country Link
US (1) US6847314B2 (ja)
JP (1) JP4209717B2 (ja)
KR (1) KR100477649B1 (ja)
CN (1) CN1237812C (ja)
DE (1) DE10318413A1 (ja)
GB (1) GB2389983B (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100668319B1 (ko) 2004-12-07 2007-01-12 삼성전자주식회사 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치
JP4523885B2 (ja) * 2005-06-30 2010-08-11 日本電信電話株式会社 信号の符号化装置、方法、プログラムおよび記録媒体
US20070074008A1 (en) * 2005-09-28 2007-03-29 Donofrio David D Mixed mode floating-point pipeline with extended functions
TW200746655A (en) * 2005-11-18 2007-12-16 Sony Corp Encoding device and method, decoding device and method, and transmission system
US8879632B2 (en) 2010-02-18 2014-11-04 Qualcomm Incorporated Fixed point implementation for geometric motion partitioning
JP2013524730A (ja) * 2010-04-12 2013-06-17 クゥアルコム・インコーポレイテッド 幾何学的動き区分のための固定小数点実装形態

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62130480A (ja) * 1985-12-02 1987-06-12 Canon Inc 画像情報の符号化方法
KR890702151A (ko) * 1987-08-21 1989-12-23 앨프리드 퍼어내트 변환 프로세싱 회로
US5625714A (en) * 1991-01-10 1997-04-29 Olympus Optical Co., Ltd. Image signal decoding device capable of removing block distortion with simple structure
JP3161614B2 (ja) * 1991-11-30 2001-04-25 ソニー株式会社 動画像復号化装置
JP3254924B2 (ja) * 1994-09-05 2002-02-12 ソニー株式会社 データ再生方法およびデータ再生装置
US6400680B1 (en) * 1997-12-30 2002-06-04 Koninklijke Philips Electronics N.V. Data transformation of the inverse-fourier type
US6584154B1 (en) * 1998-11-26 2003-06-24 Oki Electric Industry Co., Ltd. Moving-picture coding and decoding method and apparatus with reduced computational cost
JP4639441B2 (ja) * 1999-09-01 2011-02-23 ソニー株式会社 ディジタル信号処理装置および処理方法、並びにディジタル信号記録装置および記録方法
KR100659200B1 (ko) * 1999-09-11 2006-12-19 유티스타콤코리아 유한회사 이동 통신 단말기의 보코딩 시스템에서 음성신호 정규화방법

Also Published As

Publication number Publication date
KR20030093762A (ko) 2003-12-11
GB2389983B (en) 2004-06-09
US6847314B2 (en) 2005-01-25
GB2389983A (en) 2003-12-24
DE10318413A1 (de) 2004-01-29
CN1471318A (zh) 2004-01-28
KR100477649B1 (ko) 2005-03-23
JP2004015803A (ja) 2004-01-15
GB0312141D0 (en) 2003-07-02
US20030227975A1 (en) 2003-12-11
CN1237812C (zh) 2006-01-18

Similar Documents

Publication Publication Date Title
TWI398854B (zh) 用於計算轉換值及執行定窗運算之方法、裝置、電路及電腦可讀媒體,及用於提供一解碼器之方法
JP4425824B2 (ja) 動画像コーデック変換の高速実装
JP2021036333A (ja) Hoa信号の係数領域表現からこのhoa信号の混合した空間/係数領域表現を生成する方法および装置
JP2001184080A (ja) 圧縮オーディオデータへの電子透かし方法およびそのシステム
US10366698B2 (en) Variable length coding of indices and bit scheduling in a pyramid vector quantizer
EP2863388B1 (en) Bit allocation method and device for audio signal
KR20080110892A (ko) 오디오 코딩 및 디코딩에서의 여기의 프로세싱
JP2002135131A (ja) 可変サイズベクトルエントロピ符号化を実行するための方法および装置
JP5280607B2 (ja) 音声信号圧縮装置及び方法、音声信号復元装置及び方法、ならびにコンピュータ読取可能な記録媒体
US9886962B2 (en) Extracting audio fingerprints in the compressed domain
JP4209717B2 (ja) 多様なフレームサイズを支援する整数コーディング方法及びそれを適用したコデック装置
JP5256375B2 (ja) 符号化方法、復号方法、装置、プログラム及び記録媒体
US20070192086A1 (en) Perceptual quality based automatic parameter selection for data compression
WO2020253054A1 (zh) 评估音频信号损失的方法、装置及存储介质
James et al. Audio compression using DCT and DWT techniques
JP3353267B2 (ja) 音響信号変換符号化方法及び復号化方法
Ahmed et al. Audio Compression Using Transform Coding with LZW and Double Shift Coding
Jabbar et al. A Survey of Transform Coding for High-Speed Audio Compression
Rahman et al. A lossless speech signal compression technique
Aloui et al. New algorithm for speech compression based on discrete hartley transform
JP3979026B2 (ja) 信号復号方法および信号復号装置ならびに信号復号処理プログラムを記録した記録媒体
RU2817687C2 (ru) Способ и устройство для формирования из представления hoa-сигналов в области коэффициентов смешанного представления упомянутых hoa-сигналов в пространственной области/области коэффициентов
WO2024085903A1 (en) Non-windowed dct-based audio coding using advanced quantization
Jabbar et al. Compression of speech audio signals using Tap97-wavelet, short DCT, and BZIP2 encoder
JP3222967B2 (ja) ディジタル信号処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050816

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051116

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051213

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060310

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060419

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20060512

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080819

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081023

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111031

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121031

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131031

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees