JP4056466B2 - ビット率を調節できるオーディオ符号化方法、復号方法、符号化装置及び復号装置 - Google Patents

ビット率を調節できるオーディオ符号化方法、復号方法、符号化装置及び復号装置 Download PDF

Info

Publication number
JP4056466B2
JP4056466B2 JP2003417409A JP2003417409A JP4056466B2 JP 4056466 B2 JP4056466 B2 JP 4056466B2 JP 2003417409 A JP2003417409 A JP 2003417409A JP 2003417409 A JP2003417409 A JP 2003417409A JP 4056466 B2 JP4056466 B2 JP 4056466B2
Authority
JP
Japan
Prior art keywords
bit
symbol
information
layer
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003417409A
Other languages
English (en)
Other versions
JP2004199064A (ja
Inventor
重 會 金
▲尚▼ ▲焜▼ 金
殷 美 ▲呉▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2004199064A publication Critical patent/JP2004199064A/ja
Application granted granted Critical
Publication of JP4056466B2 publication Critical patent/JP4056466B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明はオーディオデータの符号化及び復号(化)に係り、さらに詳細にはオーディオデータをビット率(ビットレート:bit rate)の調節ができるように符号化する方法、復号する方法、その符号化装置及び復号装置に関する。
最近のデジタル信号処理技術の発達によって、オーディオ信号は一般にデジタルデータとして保存/再生される場合がほとんどである。デジタルオーディオ保存/再生装置は、アナログオーディオ信号をサンプリングし、かつ量子化して、デジタル信号であるPCM(Pulse Code Modulation)オーディオデータに変換してCD、DVDのような情報保存媒体に保存した後、ユーザが必要とする時にこれを再生して聞かせる。デジタル方式によるオーディオ信号の保存/復元方式は、LP(Long-Play Record)、マグネチックテープのようなアナログ保存/復元方式に比べて音質を大きく向上させ、保存期間による劣化現象を顕著に減少させたが、デジタルデータのサイズが大きくなり保存及び伝送が問題となるようになった。
このような問題点を解決するために、デジタルオーディオ信号のサイズを低減するために多様な圧縮方式が利用されている。ISO(International Standard Organization)によって標準化作業がなされたMPEG/audio(MPEGは、Moving Pictures Expert Groupの略称)やDolby社によって開発されたAC−2/AC−3は、人間の心理音響モデルを利用してデータの量を低減する方法を採用し、その結果信号の特性に関係なく効率的にデータ量を低減することが可能となった。すなわち、MPEG/audio標準やAC−2/AC−3方式は、以前のデジタル符号化方式に比べて1/6ないし1/8に少ない64〜384Kbpsビット率だけでCDの音質とほぼ同じ程度の音質を提供する。
しかし、これらの方法は、全て固定されたビット率に対して最適の状態を探して量子化過程と符号化過程とを経る方式に従うので、ネットワークを通じて伝送する時にネットワーク状況が悪くて伝送帯域幅が低くなるとカットオフが発生し、ユーザにこれ以上のサービスを提供できなくなる問題点がある。また、保存容量に制限がある移動式機器に適するようにさらに小さなサイズのビットストリームに変換しようとする時、サイズを低減するためには再符号化過程を経なければならないので、より多くの計算量が要求されることになってしまう。
このような問題に対応するために、本出願人は、ビット分割算術符号化(BSAC:Bit-Sliced Arithmetic Coding)技法を使用してビット率を調節できるオーディオ符号化/復号方法及び装置を1997年11月19日付の韓国特許出願第97−61298号として出願した(これは、後に2000年4月17日付の韓国特許登録第261253号として登録された。特許文献1参照)。BSACによれば、高いビット率で符号化されたビットストリームを低いビット率のビットストリームにすることが可能であるとともに、一部のビットストリームからの復元が可能であるので、ネットワークに過負荷がかかったり、復号器の性能がよくなかったり、またはユーザが低いビット率を要求した場合に、ビットストリームの一部だけしかなくても−−ビット率が低くなっただけ性能の劣化を示すとはいえ−−ユーザにある程度の音質でサービスを提供できる。
しかし、BSACは、算術符号化を採用しているので圧縮ゲインは高いが、多くの計算量を要求するので、複雑性が高く、実際に装置として商品化しようとすると、コストが高くなる点が問題である。
大韓民国特許登録第261253号公報
本発明が解決しようとする課題は、FGS(Fine Grain Scalability)を提供しつつ、複雑性がさらに低いビット率を調節できるオーディオ符号化方法、復号方法、その符号化装置及び復号装置を提供することである。
前記課題を解決するために、本発明による一例としての符号化方法は、(a)複数の階層に対応するようにオーディオデータを分割する段階と、(b)前記複数の階層に各々対応するスケールバンド情報及びコーディングバンド情報を得る段階と、(c)第一階層に対応するスケールバンド情報及びコーディングバンド情報によるスケールファクター情報及びコーディングモデル情報を含む付加情報を差分符号化(DPCM:Differential PCM)する段階と、(d)前記第一階層に当るオーディオデータを対応するスケールファクター情報を参照して量子化して量子化サンプルを得る段階と、(f)得られた複数の量子化サンプルを前記コーディングモデル情報を参照して最上位ビットで構成されたシンボルから最下位ビットで構成されたシンボル順にシンボル単位にハフマン符号化する段階と、(g)前記複数の階層に対する符号化が完了するまで毎回前記階層の前に付加された序数を1ずつ増やしつつ、前記(c)段階ないし(f)段階を反復して階層構造を有するようにパッキングする段階と、を含み、前記(f)段階は、(f1)複数の量子化サンプルをビットプレーン上にマッピングする段階と、(f2)最上位ビットで構成されたシンボルから最下位ビットで構成されたシンボル順に対応する階層が許容するビット範囲だけシンボル単位に符号化する段階と、を含み、前記(f1)段階は、N個の量子化サンプルをビットプレーン上にマッピングする段階であり、前記(f2)段階は、Nビットの2進データで構成された前記シンボルに対応する一つのスカラー値を求める段階と、前記Nビットの2進データ、求められたスカラー値と前記ビットプレーン上で現在のシンボルに対する上位シンボルに対応するスカラー値とを参照してハフマン符号化を行う段階と、を含むことを特徴とする(Nは整数)
前記(f)段階以前に(e)前記複数の階層に対して各々使用可能なビット範囲を求める段階を含み、前記(f)段階は、符号化されたビット数をカウントし、カウントされたビット数が対応するビット範囲を超えれば符号化を中止し、割当てられた量子化サンプルを全部符号化した以後にもカウントされたビット数が対応するビット範囲より小さければ下位階層で符号化できず、残されたビットを前記ビット範囲が許容するだけ符号化する段階を含むことが望ましい。
前記(a)段階は、(a1)オーディオデータをMDCT(Modified Discrete Cosine Transform)変換する段階と、(a2)MDCT変換されたオーディオデータをカットオフ周波数を参照して前記複数の階層に対応するように分割する段階とを含むことが望ましい。
また、本発明の他の例としての復号方法は、階層構造に符号化されたオーディオデータをビット率調節可能に復号する方法において、(a)第一階層に対応するスケールファクター情報及びコーディングモデル情報を含む付加情報を差分復号する段階と、(b)前記コーディングモデル情報を参照して最上位ビットで構成されたシンボルから最下位ビットで構成されたシンボル順にシンボル単位にハフマン復号して量子化サンプルを得る段階と、(c)得られた量子化サンプルを前記スケールファクター情報を参照して逆量子化する段階と、(d)逆量子化されたサンプルをMDCT逆変換する段階と、(e)あらかじめ決定された階層まで復号が完了するまで毎回前記階層の前に付加された序数を1ずつ増やしつつ、前記(a)段階ないし(d)段階を反復して行う段階と、含み、前記(b)段階は、(b1)最上位ビットで構成されたシンボルから最下位ビットで構成されたシンボル順に対応する階層が許容するビット範囲だけシンボル単位に復号する段階と、(b2)復号されたシンボルが配列されたビットプレーンから量子化されたサンプルを得る段階と、を含み、前記(b1)段階は、復号されたシンボルで構成された4×Nビットプレーンを得る段階であり、前記(b2)段階は、前記4×NビットプレーンからN個の量子化サンプルを得る段階と、を含むことを特徴とする(Nは整数)
また、本発明の他の例としての復号装置は、前記目的は、階層構造に符号化されたオーディオデータをビット率調節可能に復号する装置において、第一階層に対応するスケールファクター情報及びコーディングモデル情報を含む付加情報を差分復号し、前記コーディングモデル情報を参照して最上位ビットで構成されたシンボルから最下位ビットで構成されたシンボル順にシンボル単位にハフマン復号して量子化サンプルを得るアンパッキング部と、得られた量子化サンプルを前記スケールファクター情報を参照して逆量子化する逆量子化部と、逆量子化されたサンプルを逆変換する逆変換部と、を含み、前記アンパッキング部は、最上位ビットで構成されたシンボルから最下位ビットで構成されたシンボル順に対応する階層が許容するビット範囲だけシンボル単位に復号し、復号されたシンボルで構成された4×Nビットプレーンを得た後、前記4×NビットプレーンからN個の量子化サンプルを得る(Nは整数)
また、本発明のさらに他の例としての符号化装置は、オーディオデータをビット率調節可能に符号化する装置において、前記オーディオデータをMDCT変換する変換部と、各階層に当る、MDCT変換されたオーディオデータを前記スケールファクター情報を参照して量子化して量子化サンプルを出力する量子化部と、各階層に対応するスケールファクター情報及びコーディングモデル情報を含む付加情報をDPCMし、前記量子化部からの複数の量子化サンプルを前記コーディングモデル情報を参照して最上位ビットで構成されたシンボルから最下位ビットで構成されたシンボルの順にシンボル単位にハフマン符号化するパッキング部と、を含み、前記パッキング部は、K個の量子化サンプルをビットプレーン上にマッピングし、Kビットの2進データで構成された前記シンボルに対応する一つのスカラー値を求めた後、前記Kビットの2進データ、求められたスカラー値と前記ビットプレーン上で現在のシンボルに対する上位シンボルに対応するスカラー値とを参照してハフマン符号化することにより、最上位ビットで構成されたシンボルから最下位ビットで構成されたシンボル順に対応する階層が許容するビット範囲だけシンボル単位に符号化する(Kは整数)
前記パッキング部は、複数の階層に各々対応するスケールバンド情報及びコーディングバンド情報を得て各階層に対応するスケールバンド情報及びコーディングバンド情報によるスケールファクター情報及びコーディングモデル情報を含む付加情報を符号化することが望ましい。
前記パッキング部は、符号化されたビット数をカウントし、カウントされたビット数が各階層に許容されるビット範囲を超えれば符号化を中止し、割当てられた量子化サンプルを全て符号化した以後にもカウントされたビット数が対応するビット範囲より小さければ下位階層で符号化できず、残されたビットを前記ビット範囲が許容するだけ符号化することが望ましい。
前記パッキング部は、MDCT変換されたオーディオデータを前記カットオフ周波数を参照して複数の階層に対応するように分割することが望ましい
本発明によれば、ビット分割した後、シンボル単位に符号化することによってトップダウン方式にビット率を調節できるスケーラビリティを提供するので、符号化装置の計算量がスケーラビリティを提供しない装置のそれに比べてあまり多くならない。すなわち、本発明によれば、FGSを提供しつつ、複雑性がさらに低い、ビット率を調節できるオーディオ符号化方法、復号方法、その符号化装置及び復号装置を得ることができる。
さらに、算術符号化を利用するMPEG−4 Audio BSACに比べてハフマン符号化を利用する本発明の符号化装置/復号装置は、ビットパッキング/アンパッキング過程で計算量を大きく減らすことができる。FGSを提供するために本発明によるビットパッキングを行ってもオーバーヘッドが少なくて符号化利得の側面でスケーラビリティを提供しない場合とほとんど類似である。
また、本発明による装置は、階層構造を有するので、サーバー側でビット率を調節できるようにビットストリームを再生成する過程が非常に単純であり、したがって変換符号化装置の複雑性が低く、ネットワークを通じたオーディオストリームの伝送時、ユーザの意志あるいはネットワーク環境によって伝送ビット率を変更して伝送することによって継続的なサービスの提供が可能である。
さらに、容量の制限を有する情報保存媒体に保存する時、ファイルサイズを任意に調節して保存できる。ビット率が低くなれば帯域が制限されているため、主に符号化/復号装置の複雑性のほとんどを占めるフィルターの複雑性が非常に減少するため、ビット率に反比例して符号化装置/復号装置の実際複雑性も減少する。
以下、添付された図面を参照して本発明の望ましい実施例について詳細に説明する。
図1は、本発明の望ましい実施例による符号化装置のブロック図である。図1を参照すれば、符号化装置は、本発明によってビット率を調節できるようにオーディオデータを階層構造に符号化する装置であって、変換部11、心理音響部12、量子化部13及びビットパッキング部14を含む。
変換部11は、時間領域のオーディオ信号であるPCMオーディオデータを入力し、心理音響部12から提供される音響心理モデルに関する情報を参照して周波数領域の信号に変換する。時間領域では、人間が認知するオーディオ信号の特性の差があまり大きくないが、変換を通じて得られた周波数領域のオーディオ信号は、人間の音響心理モデルによって各周波数帯域で人間が感じとれる(可聴)信号と感じとれない(非可聴)信号との特性差が大きいため、各周波数帯域別に割当てられるビット数を異ならせて圧縮の効率を高められる。本実施例で、変換部11は、MDCT変換を行う。
心理音響部12は、アタック感知情報のような音響心理モデルに関する情報を変換部11に提供する一方、変換部11によって変換されたオーディオ信号を適切なサブバンドの信号で縛り、各信号の相互作用によって発生するマスキング現象を利用して各サブバンドでのマスキングしきい値を計算して量子化部13に提供する。マスキングしきい値とは、オーディオ信号の相互作用によって人間が聞いても感じとれない信号の最大サイズである。本実施例で、心理音響部12は、BMLD(Binaural Masking Level Depression)を利用してステレオ成分に対するマスキングしきい値を計算する。
量子化部13は、人間が聞いても感じとれないように各帯域の量子化雑音のサイズが心理音響部12から提供されたマスキングしきい値より小さいように各帯域のオーディオ信号を対応するスケールファクター情報に基づいてスカラー量子化して量子化サンプルを出力する。すなわち、量子化部13は、音響心理部12で計算されたマスキングしきい値と各帯域で発生する雑音との比率であるNMR(Noise-to-Mask Ratio)を利用して前帯域のNMR値が0 dB以下となるように量子化する。NMR値が0 dB以下であるというのは、量子化雑音を人間が聞きとれないことを意味する。
ビットパッキング部14は、各階層に属する量子化サンプル及び付加情報を符号化して階層構造にパッキングする。付加情報は、各階層に当るスケールバンド情報、コーディングバンド情報、そのスケールファクター情報及びコーディングモデル情報を含む。スケールバンド情報とコーディングバンド情報とは、ヘッダ情報としてパッキングされて復号装置で伝送されることもあり、各階層ごとの付加情報として符号化され、かつパッキングされて復号装置で伝送されることもあり、復号装置にあらかじめ保存されているので伝送されないこともある。
さらに具体的に、ビットパッキング部14は、第一階層に対応するスケールファクター情報及びコーディングモデル情報を含む付加情報を符号化する一方、第一階層に対応するコーディングモデル情報を参照して最上位ビットで構成されたシンボルから最下位ビットで構成されたシンボル順にシンボル単位に符号化する。次いで、第二階層に対しても同じ過程を反復する。すなわち、あらかじめ決定された複数の階層に対する符号化が完了するまで階層を増やしつつ符号化する。本実施例で、ビットパッキング部14は、スケールファクター情報とコーディングモデル情報とはDPCMし、量子化サンプルはハフマン符号化する。本発明によって符号化されたビットストリームの階層構造は後述する。
スケールバンド情報は、オーディオ信号の周波数特性によってさらに適切に量子化を行うための情報であって、周波数領域を複数のバンドに分け、各バンドに適したスケールファクターを割当てた時、各階層に対応するスケールバンドを知らせる情報である。したがって、各階層は少なくとも一つのスケールバンドに属する。各スケールバンドは、割当てられた一つのスケールファクターを有する。コーディングバンド情報もまたオーディオ信号の周波数特性によってさらに適切に符号化を行うための情報であって、周波数領域を複数のバンドに分け、各バンドに適したコーディングモデルを割当てた時、各階層に対応するコーディングバンドを知らせる情報である。スケールバンドとコーディングバンドとは実験によって適切に分けられ、対応するスケールファクターとコーディングモデルとが決定される。
図2は、本発明の望ましい実施例による復号装置のブロック図である。図2を参照すれば、復号装置は、ネットワーク状況、復号装置の性能、ユーザの選択によって決定されたターゲット階層まで復号することによってビット率を調節できる装置であって、アンパッキング部21、逆量子化部22及び逆変換部23を含む。
アンパッキング部21は、ビットストリームをターゲット階層までアンパッキングし、各階層別に復号する。すなわち、各階層に対応するスケールファクター情報、コーディングモデル情報が含まれた付加情報を復号した後、得たコーディングモデル情報に基づいて各階層に属する符号化された量子化サンプルを再び復号して量子化サンプルを得る。本実施例で、アンパッキング部21は、スケールファクター情報とコーディングモデル情報とを差分復号し、符号化された量子化サンプルはハフマン復号する。
一方、スケールバンド情報とコーディングバンド情報とは、ビットストリームのヘッダ情報から得るか、または各階層別の付加情報を復号して得られる。代案的に、復号装置がスケールバンド情報及びコーディングバンド情報をあらかじめ保存していることもある。逆量子化部22は、各階層の量子化サンプルを対応するスケールファクター情報によって逆量子化して復元する。逆変換部23は、復元されたサンプルを周波数/時間マッピングして時間領域のPCMオーディオデータに変換して出力する。本実施例で逆変換部23は、MDCTによる逆変換を行う。
図3は、本発明によってビット率を調節できるように階層構造に符号化されたビットストリームを構成するフレームの構造を示す。図3を参照すれば、本発明によるビットストリームのフレームは、FGSのために量子化サンプルと付加情報とを階層構造にマッピングさせて符号化されている。すなわち、下位階層のビットストリームが上位階層のビットストリームに含まれている階層構造を有する。各階層に必要な付加情報は、階層別に分けられて符号化される。
ビットストリームの先頭には、ヘッダ情報が保存されたヘッダ領域が設けられ、階層0の情報がパッキングされており、上位階層である階層1ないし階層Nに属する情報が順にパッキングされている。ヘッダ領域から階層0情報までを基底階層とし、ヘッダ領域から階層1情報までを階層1、階層2情報までを階層2とする。同じ方式で、最上位階層は、ヘッダ領域から階層N情報まで、すなわち基底階層から上位階層である階層Nまでである。各階層情報としては付加情報と符号化されたオーディオデータとが保存されている。例えば、階層2情報として付加情報2と符号化された量子化サンプルとが保存されている。ここで、Nは1より大きいまたは同じ整数である。
図4は、付加情報の詳細構造を示す。図4を参照すれば、任意の階層情報としては付加情報と符号化された量子化サンプルとが保存されており、本実施例で付加情報はハフマンコーディングモデル情報、量子化ファクター情報、チャンネルに対する付加情報及びその他の付加情報を含む。ハフマンコーディングモデル情報は、対応する階層に属する量子化サンプルの符号化に使われるか、または復号に使われなければならないハフマンコーディングモデルに対するインデックス情報である。量子化ファクター情報は、対応する階層に属するオーディオデータを量子化するか、または逆量子化するための量子化ステップサイズを知らせる。チャンネルに対する付加情報とは、M/S stereoのようなチャンネルに関する情報である。その他の付加情報は、M/S stereoの採用の如何に関するフラッグ情報である。
本実施例で、ビットパッキング部14は、ハフマンコーディングモデル情報と量子化ファクター情報とをDPCMする。差分符号化途中にすぐ前のバンドの値の差分値が符号化される。チャンネルに関する付加情報は、ハフマン符号化する。
図5は、本発明による符号化方式を概略的に説明するための参考図である。図5を参照すれば、符号化しなければならない量子化サンプル全体が3階層で構成されている。斜線をつけた四角形は、量子化サンプルで構成されたスペクトルラインを示し、実線はスケールバンドを示し、帯線はコーディングバンドを示す。階層0には、スケールバンド[1]、[2]、[3]、[4]及び[5]が属し、コーディングバンド[1]、[2]、[3]、[4]及び[5]が属し、階層1にはスケールバンド[5]及び[6]が属し、コーディングバンド[6]、[7]、[8]、[9]及び[10]が属し、階層2にはスケールバンド[6]及び[7]が属し、コーディングバンド[11]、[12]、[13]、[14]及び[15]が属する。一方、階層0は、周波数帯域[a]まで符号化するように固定されており、階層1は、周波数帯域[b]まで符号化するように固定されており、階層2は、周波数帯域[c]まで符号化するように固定されている。
まず、100ビット内で階層0に当る量子化サンプルを当該コーディングバンド[1]、[2]、[3]、[4]及び[5]に決まっているコーディングモデルを使用して符号化する。また、階層0の付加情報として、階層0に属するスケールバンド[1]、[2]、[3]、[4]、[5]とコーディングバンド[1]、[2]、[3]、[4]、[5]とを符号化する。階層0のサンプルをシンボル単位に符号化しつつ、ビット数をカウントして許容されたビット範囲、すなわち100ビットを超えれば、階層0の符号化を中断し、階層1を符号化する。符号化されていない階層0のサンプルは、階層1及び階層2に許容されたビット範囲に余裕が生じた時に符号化する。
次いで、階層1に属するコーディングバンド、すなわちコーディングバンド[6]、[7]、[8]、[9]及び[10]のうち、符号化しようとする量子化サンプルが属するコーディングバンドのコーディングモデルを使用して階層1に属する量子化サンプルを符号化する。また、階層1の付加情報として階層1に属するスケールバンド[5]及び[6]とコーディングバンド[6]、[7]、[8]、[9]及び[10]とを符号化する。もし、階層1に当るサンプルを全て符号化しても許容されたビット範囲、すなわち100ビットとならない場合には100ビットになるまで階層0で符号化できなかったサンプルを符号化する。階層1に当るサンプルをシンボル単位に符号化しつつ、ビット数をカウントして許容されたビット範囲、すなわち100ビットを超えれば階層1の符号化を中断し、階層2の符号化に移る。
最後に、階層2に属するコーディングバンド、すなわちコーディングバンド[11]、[12]、[13]、[14]及び[15]のうち、符号化しようとする量子化サンプルが属するコーディングバンドのコーディングモデルを使用して階層2に属する量子化サンプルを符号化する。また、階層2の付加情報として階層2に属するスケールバンド[6]及び[7]とコーディングバンド[11]、[12]、[13]、[14]及び[15]とを符号化する。もし、階層1に当るサンプルを全て符号化しても許容されたビット範囲、すなわち100ビットとならない場合には、100ビットになるまで階層0で符号化できなかったサンプルを符号化する。階層1に当るサンプルをシンボル単位に符号化しつつ、ビット数をカウントして許容されたビット範囲、すなわち100ビットを超えれば階層1の符号化を中断し、階層2の符号化に移る。
もし、階層0で許容されたビット範囲を考慮せずに当該量子化サンプルを全て符号化してしまえば、言い換えれば、符号化されたビット数が既に許容されたビット範囲、すなわち100ビットを超過したにも拘わらず、全て符号化すれば、結局、次の階層である階層1に許容されたビット範囲の少なくとも一部を借用して、階層1に属する量子化サンプルを符号化できなくなることが発生する。したがって、ビット率を調節できるように復号する場合、階層1までにだけ復号すれば、階層1の周波数[b]まで符号化できなかったため、復号された量子化サンプルは、周波数[b]以下で上り下りする。この時、音質が劣化されるバーディ効果が現れる。
一方、複数の階層(ターゲット階層)を決定する時、符号化しなければならないオーディオデータ全体のサイズを考慮してビット範囲が割当てられるので、全体的に符号化しなければならないビット範囲が足りなくて符号化できない場合は発生しない。
復号過程も符号化と同様に、その逆過程を行いつつ許容するビット範囲によってビット数をカウントするため、階層1に復号する時点が分かる。
図6は、本発明による符号化方式をさらに具体的に説明するための参考図である。
本発明によれば、ビットパッキング部14は、各階層に当る量子化されたサンプルをビットプレーン符号化とハフマン符号化とを採用して符号化する。
複数の量子化サンプルをビットプレーン上にマッピングさせて2進データに表し、2進データの最上位ビット(Most Significant Bit:MSB)で構成されたシンボルから最下位ビット(Least Significant Bit:LSB)で構成されたシンボル順に該当階層に割当てられたビット範囲内で符号化する。ビットプレーン上で重要な情報は先に符号化し、相対的に重要でない情報は後に符号化できる。符号化過程で各階層に当るビット率及び階層別の周波数帯域を固定してバーディ効果と呼ばれる歪曲を低減するためである。
図6は、msbで構成されたシンボルのビット数が4以下である場合に対する符号化の例であって、量子化サンプル9、2、4、0をビットプレーンにマッピングすれば、各々1001b、0010b、0100b、0000bの2進データに表示される。すなわち、本実施例で、ビットプレーン上で符号化単位となる符号化ブロックのサイズは、4×4である。
msbで構成されたシンボルは、“1000b”であり、その次のビットmsb−1で構成されたシンボルは“0010b”であり、その次のビットmsb−2で構成されたシンボルは“0100b”であり、最下位ビットmsb−3で構成されたシンボルは“1000b”である。
ハフマン符号化のためのハフマンモデル情報、すなわち、コードブックインデックスは表1の通りである。
Figure 0004056466
表1によれば、同じ重要度(本実施例ではmsb)に対しても二つのモデルが存在するのが分かるが、これは相異なる分布を示す量子化サンプルに対して二つのモデルを生成したためである。
図6の例を表1によって符号化する過程をさらに具体的に説明すれば、次の通りである。
シンボルのビット数が4以下である場合、本発明によるハフマン符号化は数式1による。
Figure 0004056466
すなわち、ハフマン符号化は、3つの入力変数として、コードブックインデックス、上位ビットプレーン及びシンボルを有する。コードブックインデックスは、表1から得られた値であり、上位ビットプレーンはビットプレーン上で現在符号化しようとするシンボルのすぐ上側のシンボルを表す。シンボルは、現在符号化しようとするシンボルである。
図6の例でハフマンモデルは、msbが4であるので、13−16または17−20が選択される。符号化される付加情報が7であれば、
msbで構成されたシンボルのコードブックインデックスは16、
msb−1で構成されたシンボルのコードブックインデックスは15、
msb−2で構成されたシンボルのコードブックインデックスは14、
msb−3で構成されたシンボルのコードブックインデックスは13
となる。
一方、msbで構成されたシンボルは、上位ビットプレーンのデータを有していないので、上位ビットプレーン値を0と仮定すれば、HuffmanCodebook[16][0b][1000b]のコードに符号化される。msb−1で構成されたシンボルは、上位ビットプレーンが1000bであるので、HuffmanCodebook[15][1000b][0010b]のコードに符号化される。msb−2で構成されたシンボルは、上位ビットプレーンが0010bであるのでHuffmanCodebook[14][0010b][0100b]のコードに符号化される。msb−3で構成されたシンボルは、上位ビットプレーンが0100bであるので、HuffmanCodebook[13][0100b][1000b]のコードに符号化される。
ビットパッキング部14は、シンボル単位に符号化した後、符号化された総ビット数をカウントし、使用可能なビット数と比較して符号化されたビット数が該当階層で使用可能なビット数を超える場合に符号化を中止する。符号化されず、残されたビットは次の階層に余裕空間が生じる時に符号化して入れる。該当階層に割当てられた量子化サンプルを全て符号化して使用可能なビット数が残る場合、すなわち、余裕空間が生じる場合には下位階層で符号化されずに残された量子化サンプルを符号化する。
一方、msbで構成されたシンボルのビット数が5以上である場合には、現在ビットプレーン上の位置を利用してハフマンコード値を決定する。すなわち、重要度が5以上である場合には、それぞれのビットプレーン上のデータは、統計的に大きい差を示さないため、全て同じハフマンモデルを使用してハフマン符号化する。すなわち、ビットプレーン当り一つのハフマンモデルが存在する。
重要度が5以上である場合(シンボルのビット数が5以上である場合)、本発明によるハフマン符号化は、数式2による。
Figure 0004056466
ここで、bplは、現在コーディングしようとするビットプレーンのインデックスを示し、したがって、1以上の整数値を有する。20は、表1の付加情報8に対応するハフマンモデルの最後のインデックスが20であるので、インデックスを21から始めるために加算する値である。したがって、コーディングバンドに対する付加情報は、単純に重要度だけを表す。下記の表2でハフマンモデルは、現在符号化しようとするビットプレーンのインデックスによって決定される。
Figure 0004056466
一方、付加情報のうち量子化ファクター情報とハフマンモデル情報とは、対応するコーディングバンドに対してDPCMを行う。量子化ファクター情報を符号化する時、DPCMの初期値は、フレームのヘッダ情報に8ビットに表現される。ハフマンモデル情報に対するDPCMの初期値は、0にセッティングする。
本発明による符号化方式と従来のBSACとの差異点は、次の通りである。第一、BSACは、ビット単位に符号化したが、本発明によればシンボル単位に符号化する。第二、BSACは、算術符号化したが、本発明はハフマン符号化する。算術符号化は、圧縮ゲインは高いが、多くの計算量が要求されて複雑性とコストとが高まる問題点がある。したがって、本発明ではビット単位に符号化せず、シンボル単位にハフマン符号化することによって複雑性とコストとを低くした。
ビット率を調整するためには、すなわち、スケーラビリティを適用する場合、一フレームに当るビットストリームを各階層で使用可能なビット数を考慮してカットオフすることによって少ないデータだけでも復号できる。例えば、最高ビット率が96kbpsであり、対応するビットストリームのサイズが2096ビットである場合、48kbpsに当るビットストリームだけを復号しようとする時にはビットストリームを1048ビットだけ取ることによって48kbpsに当る復号されたオーディオデータを得られる。
前述した構成に基づいて、本発明による符号化方法及び復号方法を説明すれば、次の通りである。
符号化装置は、PCMオーディオデータを読取ってメモリ(図示せず)に保存し、保存されたPCMオーディオデータを利用して心理音響モデルを経てマスキングしきい値と付加情報とを求める。PCMオーディオデータは、時間領域の信号であるので、これを周波数領域の信号にMDCT変換する。次いで、符号化装置は、変換された信号を量子化バンド情報と量子化ファクター情報とによって量子化して量子化サンプルを得る。量子化サンプルを前述したようにビット分割符号化、シンボル単位符号化及びハフマン符号化を採用して符号化してパッキングする。
図7は、本発明の望ましい実施例による符号化方法を説明するためのフローチャートである。
図7を参照すれば、符号化装置のビットパッキング部14によって量子化サンプルを符号化してパッキングする過程は、次の通りである。
まず、ビットパッキング部14は、与えられたターゲットビット率と付加情報とに基づいて各階層に当る情報を抽出する。この過程は、段階701ないし703を通じて行われる。すなわち、各階層に分割する基準となるカットオフ周波数を求め(701段階)、各階層に当る量子化バンド情報とコーディングバンド情報とを求め(702段階)、符号化されなければならないビットを利用して階層当り符号化可能なビット範囲を割り当てる(703段階)。
次いで、基盤階層に当る(704段階)量子化バンド情報とコーディングバンド情報とを含んで付加情報を符号化する(705段階)。
次いで、基盤階層に当る量子化サンプルをビットプレーン上にマッピングし、4×4ブロック単位にmsbで構成されたシンボルから符号化しつつ(706段階)、符号化されたビット数をカウントし、カウントされたビット数が該当階層で使用可能なビット範囲を超えれば(707段階)、現在階層の符号化を中止し、次の階層に移る。カウントされたビット数が該当階層で使用可能なビット範囲以下であれば(707段階)、次の階層に対して前記705段階に移る(709段階)。708段階は、基盤階層の場合には、それより低い下位階層がないので行われないが、以後階層に対しては行われる。前記過程を経てターゲット階層まで全て符号化する。
前記706段階、すなわち、量子化サンプルを符号化する過程は、次の通りである。
1.各階層に当る量子化サンプルをN個の単位に縛ってビットプレーン上にマッピングする。
2.マッピングされた2進データのmsbで構成されたシンボルから順にハフマン符号化する。
2の過程を再び細分して説明すれば、次の通りである。
2.1.現在符号化しようとするシンボルに対応する一つのスカラー値curValを求める。
2.2.上位ビットプレーン、すなわち、現在符号化しようとするシンボルの上段に存在するシンボルに対応するスカラー値upperValに対応するハフマンコードを求め、求められたコードに符号化する。
付加情報のうち量子化ファクター情報とハフマンモデル情報とは、対応するコーディングバンドに対してDPCMを行う。量子化ファクター情報を符号化する時、DPCMの初期値は、フレームのヘッダ情報に8bitに表現される。ハフマンモデル情報に対するDPCMの初期値は、0にセッティングする。
図8は、本発明の望ましい実施例による復号方法を説明するためのフローチャートである。
図8を参照すれば、復号装置は、階層構造に符号化されたオーディオデータで構成されたビットストリームを受信してフレーム別に設けられたヘッダ情報を復号する。次いで、第一階層に対応するスケールファクター情報及びコーディングモデル情報を含む付加情報を復号した後(801段階)、コーディングモデル情報を参照して最上位ビットで構成されたシンボルから最下位ビットで構成されたシンボル順にシンボル単位に復号して量子化サンプルを得る(802段階)。得られた量子化サンプルを前記スケールファクター情報を参照して逆量子化し(803段階)、逆量子化されたサンプルを逆変換する(804段階)。あらかじめ決定されたターゲット階層に対する復号が完了するまで毎回前記階層の前に付加された序数を1ずつ増やしつつ、前記801段階ないし804段階を反復して行う。
図9は、本発明の望ましい実施例による復号方法を説明するためのフローチャートである。
図9を参照すれば、復号装置は、階層構造に符号化されたオーディオデータで構成されたビットストリームを受信してフレーム別に設けられたヘッダ情報から各階層に当るカット−オフ周波数を復号し(901段階)、ヘッダ情報から各階層に当る量子化バンド情報とコーディングバンド情報とを復号した後(902段階)、各階層別に使用可能なビット範囲を得る(903段階)。次いで、基盤階層に対する(904段階)付加情報を復号し(905段階)、最上位ビットで構成されたシンボルから最下位ビットで構成されたシンボル順に対応する階層が許容するビット範囲だけシンボル単位に復号して量子化されたサンプルを得る(906段階)。あらかじめ決定されたターゲット階層まで(907段階)、階層を1ずつ増やしつつ、前記905段階ないし906段階を反復する。前記901段階ないし903段階は、カットオフ周波数、量子化バンド情報、コーディングバンド情報及びビット範囲は、受信されたビットストリームのフレームごとに保存されたヘッダ情報から得る代わりに復号装置があらかじめ有していることもあり、そのような場合、復号装置は保存された情報を読取って各情報を得る。
本発明はオーディオ符号化方法、復号方法、その符号化装置及び復号装置に適用できるが、ビット率を調節できるスケーラビリティを提供するので、符号化装置の計算量を顕著に減少させ、ネットワークを通じたオーディオストリームの伝送時、ユーザの意志あるいはネットワークの環境によって伝送ビット率を変更して伝送することによって、継続的なサービスを提供する分野に有利であり、また容量が限定された情報保存媒体に保存する時、ファイルサイズを任意に調節して保存できる。
本発明の望ましい実施例による符号化装置のブロック図である。 本発明の望ましい実施例による復号装置のブロック図である。 本発明によってビット率を調節できるように階層構造に符号化されたビットストリームを構成するフレームの構造図である。 付加情報の詳細構造図である。 本発明による符号化方式を概略的に説明するための参考図である。 本発明による符号化方式をさらに具体的に説明するための参考図である。 本発明の望ましい実施例による符号化方法を説明するためのフローチャートである。 本発明の望ましい実施例による復号方法を説明するためのフローチャートである。 本発明の望ましい実施例による復号方法を説明するためのフローチャートである。

Claims (9)

  1. (a)複数の階層に対応するようにオーディオデータを分割する段階と、
    (b)前記複数の階層に各々対応するスケールバンド情報及びコーディングバンド情報を得る段階と、
    (c)第一階層に対応するスケールバンド情報及びコーディングバンド情報によるスケールファクター情報及びコーディングモデル情報を含む付加情報を差分符号化する段階と、
    (d)前記第一階層に当るオーディオデータを対応するスケールファクター情報を参照して量子化して量子化サンプルを得る段階と、
    (f)得られた複数の量子化サンプルを前記コーディングモデル情報を参照して最上位ビットで構成されたシンボルから最下位ビットで構成されたシンボルの順にシンボル単位にハフマン符号化する段階と、
    (g)前記複数の階層に対する符号化が完了するまで、毎回前記階層の前に付加された序数を1ずつ増やしつつ、前記(c)段階ないし(f)段階を反復して階層構造を有するようにパッキングする段階と、を含み、
    前記(f)段階は、
    (f1)複数の量子化サンプルをビットプレーン上にマッピングする段階と、
    (f2)最上位ビットで構成されたシンボルから最下位ビットで構成されたシンボル順に対応する階層が許容するビット範囲だけシンボル単位に符号化する段階と、を含み、
    前記(f1)段階は、
    N個の量子化サンプルをビットプレーン上にマッピングする段階であり、
    前記(f2)段階は、
    Nビットの2進データで構成された前記シンボルに対応する一つのスカラー値を求める段階と、
    前記Nビットの2進データ、求められたスカラー値と前記ビットプレーン上で現在のシンボルに対する上位シンボルに対応するスカラー値とを参照してハフマン符号化を行う段階と、を含むことを特徴とする符号化方法(Nは整数)
  2. 前記(f)段階以前に、
    (e)前記複数の階層に対して各々使用可能なビット範囲を求める段階を含み、
    前記(f)段階は、
    符号化されたビット数をカウントし、カウントされたビット数が対応するビット範囲を超えれば符号化を中止し、割当てられた量子化サンプルを全て符号化した以後にもカウントされたビット数が対応するビット範囲より小さければ下位階層で符号化できずに残されたビットを前記ビット範囲が許容するだけ符号化する段階を含むことを特徴とする請求項1に記載の符号化方法。
  3. 前記(a)段階は、
    (a1)オーディオデータをMDCT変換する段階と、
    (a2)MDCT変換されたオーディオデータをカットオフ周波数を参照して前記複数の階層に対応するように分割する段階と、を含むことを特徴とする請求項1に記載の符号化方法。
  4. 階層構造に符号化されたオーディオデータをビット率調節可能に復号する方法において、
    (a)第一階層に対応するスケールファクター情報及びコーディングモデル情報を含む付加情報を差分復号する段階と、
    (b)前記コーディングモデル情報を参照して最上位ビットで構成されたシンボルから最下位ビットで構成されたシンボル順にシンボル単位にハフマン復号して量子化サンプルを得る段階と、
    (c)得られた量子化サンプルを前記スケールファクター情報を参照して逆量子化する段階と、
    (d)逆量子化されたサンプルをMDCT逆変換する段階と、
    (e)あらかじめ決定された階層まで復号が完了するまで毎回前記階層の前に付加された序数を1ずつ増やしつつ、前記(a)段階ないし(d)段階を反復して行う段階と、を含み、
    前記(b)段階は、
    (b1)最上位ビットで構成されたシンボルから最下位ビットで構成されたシンボル順に対応する階層が許容するビット範囲だけシンボル単位に復号する段階と、
    (b2)復号されたシンボルが配列されたビットプレーンから量子化されたサンプルを得る段階と、を含み、
    前記(b1)段階は、
    復号されたシンボルで構成された4×Nビットプレーンを得る段階であり、
    前記(b2)段階は、
    前記4×NビットプレーンからN個の量子化サンプルを得る段階と、を含むことを特徴とする復号方法(Nは整数)
  5. 階層構造に符号化されたオーディオデータをビット率調節可能に復号する装置において、
    第一階層に対応するスケールファクター情報及びコーディングモデル情報を含む付加情報を差分復号し、前記コーディングモデル情報を参照して最上位ビットで構成されたシンボルから最下位ビットで構成されたシンボル順にシンボル単位にハフマン復号して量子化サンプルを得るアンパッキング部と、
    得られた量子化サンプルを前記スケールファクター情報を参照して逆量子化する逆量子化部と、
    逆量子化されたサンプルを逆変換する逆変換部と、を含み、
    前記アンパッキング部は、
    最上位ビットで構成されたシンボルから最下位ビットで構成されたシンボル順に対応する階層が許容するビット範囲だけシンボル単位に復号し、復号されたシンボルで構成された4×Nビットプレーンを得た後、前記4×NビットプレーンからN個の量子化サンプルを得ることを特徴とする復号装置(Nは整数)
  6. オーディオデータをビット率調節可能に符号化する装置において、
    前記オーディオデータをMDCT変換する変換部と、
    各階層に当る、MDCT変換されたオーディオデータを前記スケールファクター情報を参照して量子化して量子化サンプルを出力する量子化部と、
    各階層に対応するスケールファクター情報及びコーディングモデル情報を含む付加情報を差分符号化し、前記量子化部からの複数の量子化サンプルを前記コーディングモデル情報を参照して最上位ビットで構成されたシンボルから最下位ビットで構成されたシンボル順にシンボル単位にハフマン符号化するパッキング部と、を含み、
    前記パッキング部は、
    K個の量子化サンプルをビットプレーン上にマッピングし、Kビットの2進データで構成された前記シンボルに対応する一つのスカラー値を求めた後、前記Kビットの2進データ、求められたスカラー値と前記ビットプレーン上で現在のシンボルに対する上位シンボルに対応するスカラー値とを参照してハフマン符号化することにより、最上位ビットで構成されたシンボルから最下位ビットで構成されたシンボル順に対応する階層が許容するビット範囲だけシンボル単位に符号化することを特徴とする符号化装置(Kは整数)
  7. 前記パッキング部は、
    複数の階層に各々対応するスケールバンド情報及びコーディングバンド情報を得て各階層に対応するスケールバンド情報及びコーディングバンド情報によるスケールファクター情報及びコーディングモデル情報を含む付加情報を符号化することを特徴とする請求項に記載の符号化装置。
  8. 前記パッキング部は、
    符号化されたビット数をカウントし、カウントされたビット数が各階層に許容されるビット範囲を超えれば符号化を中止し、割当てられた量子化サンプルを全て符号化した以後にもカウントされたビット数が対応するビット範囲より小さければ下位階層で符号化できずに残されたビットを前記ビット範囲が許容するだけ符号化することを特徴とする請求項に記載の符号化装置。
  9. 前記パッキング部は、
    MDCT変換されたオーディオデータを前記カットオフ周波数を参照して複数の階層に対応するように分割することを特徴とする請求項に記載の符号化装置。
JP2003417409A 2002-12-16 2003-12-16 ビット率を調節できるオーディオ符号化方法、復号方法、符号化装置及び復号装置 Expired - Fee Related JP4056466B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020020080320A KR100908117B1 (ko) 2002-12-16 2002-12-16 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치

Publications (2)

Publication Number Publication Date
JP2004199064A JP2004199064A (ja) 2004-07-15
JP4056466B2 true JP4056466B2 (ja) 2008-03-05

Family

ID=32388327

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003417409A Expired - Fee Related JP4056466B2 (ja) 2002-12-16 2003-12-16 ビット率を調節できるオーディオ符号化方法、復号方法、符号化装置及び復号装置

Country Status (6)

Country Link
US (2) US8046234B2 (ja)
EP (1) EP1431963B1 (ja)
JP (1) JP4056466B2 (ja)
KR (1) KR100908117B1 (ja)
CN (1) CN1525436B (ja)
DE (1) DE60316099T2 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
KR101015497B1 (ko) * 2003-03-22 2011-02-16 삼성전자주식회사 디지털 데이터의 부호화/복호화 방법 및 장치
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
KR20070037945A (ko) * 2005-10-04 2007-04-09 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
US20070112563A1 (en) * 2005-11-17 2007-05-17 Microsoft Corporation Determination of audio device quality
KR101237413B1 (ko) * 2005-12-07 2013-02-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치
KR100793287B1 (ko) * 2006-01-26 2008-01-10 주식회사 코아로직 비트율 조절이 가능한 오디오 복호화 장치 및 그 방법
CN101395661B (zh) * 2006-03-07 2013-02-06 艾利森电话股份有限公司 音频编码和解码的方法和设备
WO2007105586A1 (ja) * 2006-03-10 2007-09-20 Matsushita Electric Industrial Co., Ltd. 符号化装置および符号化方法
KR101322392B1 (ko) * 2006-06-16 2013-10-29 삼성전자주식회사 스케일러블 코덱의 부호화 및 복호화 방법 및 장치
US8010370B2 (en) * 2006-07-28 2011-08-30 Apple Inc. Bitrate control for perceptual coding
US8032371B2 (en) * 2006-07-28 2011-10-04 Apple Inc. Determining scale factor values in encoding audio data with AAC
KR20090089304A (ko) * 2006-10-06 2009-08-21 에이전시 포 사이언스, 테크놀로지 앤드 리서치 부호화 방법, 복호화 방법, 부호화기, 복호화기 및 컴퓨터 프로그램 제품
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR100988010B1 (ko) * 2008-04-23 2010-10-18 (주)휴맥스 결정 비트를 이용한 부호화/복호화 방법 및 장치
EP2232833A2 (fr) * 2007-12-10 2010-09-29 France Telecom Traitement d'erreurs binaires dans une trame binaire audionumerique
EP2237269B1 (en) * 2009-04-01 2013-02-20 Motorola Mobility LLC Apparatus and method for processing an encoded audio data signal
US8965545B2 (en) * 2010-09-30 2015-02-24 Google Inc. Progressive encoding of audio
WO2014005327A1 (zh) * 2012-07-06 2014-01-09 深圳广晟信源技术有限公司 对多声道数字音频编码的方法
US9865269B2 (en) * 2012-07-19 2018-01-09 Nokia Technologies Oy Stereo audio signal encoder
CN104934034B (zh) * 2014-03-19 2016-11-16 华为技术有限公司 用于信号处理的方法和装置
EP3324407A1 (en) * 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic
EP3324406A1 (en) 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a variable threshold

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0559348A3 (en) * 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder
KR100261253B1 (ko) 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
KR100261254B1 (ko) 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
DE19747132C2 (de) 1997-10-24 2002-11-28 Fraunhofer Ges Forschung Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
JP2001134294A (ja) 1999-11-10 2001-05-18 Toshiba Corp オーディオ信号のビットストリームの処理方法及び処理装置
JP3609323B2 (ja) 2000-05-08 2005-01-12 日本電信電話株式会社 楽音符号化方法および楽音復号化方法、符号生成方法およびこれらの方法を実行するプログラムを記録した記録媒体
US7395209B1 (en) * 2000-05-12 2008-07-01 Cirrus Logic, Inc. Fixed point audio decoding system and method
JP2002156998A (ja) * 2000-11-16 2002-05-31 Toshiba Corp オーディオ信号のビットストリーム処理方法、この処理方法を記録した記録媒体、及び処理装置
AUPR192700A0 (en) * 2000-12-06 2001-01-04 Canon Kabushiki Kaisha Storing coding image data in storage of fixed memory size

Also Published As

Publication number Publication date
US20040181394A1 (en) 2004-09-16
EP1431963A1 (en) 2004-06-23
JP2004199064A (ja) 2004-07-15
CN1525436B (zh) 2010-05-26
EP1431963B1 (en) 2007-09-05
DE60316099T2 (de) 2008-05-29
KR100908117B1 (ko) 2009-07-16
CN1525436A (zh) 2004-09-01
DE60316099D1 (de) 2007-10-18
US20120101825A1 (en) 2012-04-26
US8046234B2 (en) 2011-10-25
KR20040053865A (ko) 2004-06-25

Similar Documents

Publication Publication Date Title
JP4056466B2 (ja) ビット率を調節できるオーディオ符号化方法、復号方法、符号化装置及び復号装置
JP5048680B2 (ja) オーディオ信号の符号化及び復号化方法、オーディオ信号の符号化及び復号化装置
EP1455345B1 (en) Method and apparatus for encoding and/or decoding digital data using bandwidth extension technology
JP3354863B2 (ja) ビット率の調節可能なオーディオデータ符号化/復号化方法及び装置
JPH08190764A (ja) ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
JP3964860B2 (ja) ステレオオーディオの符号化方法、ステレオオーディオ符号化装置、ステレオオーディオの復号化方法、ステレオオーディオ復号化装置及びコンピュータで読み取り可能な記録媒体
JP4647923B2 (ja) デジタルデータの符号化/復号化方法および装置
KR100528327B1 (ko) 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
KR100923301B1 (ko) 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
KR100908116B1 (ko) 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
KR100923300B1 (ko) 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060104

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060403

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060406

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20061101

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061107

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070605

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070620

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071113

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071211

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101221

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101221

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111221

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111221

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121221

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121221

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131221

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees