JP3412081B2 - ビット率の調節可能なオーディオ符号化/復号化方法及びその装置及びその方法を記録した記録媒体 - Google Patents

ビット率の調節可能なオーディオ符号化/復号化方法及びその装置及びその方法を記録した記録媒体

Info

Publication number
JP3412081B2
JP3412081B2 JP27582998A JP27582998A JP3412081B2 JP 3412081 B2 JP3412081 B2 JP 3412081B2 JP 27582998 A JP27582998 A JP 27582998A JP 27582998 A JP27582998 A JP 27582998A JP 3412081 B2 JP3412081 B2 JP 3412081B2
Authority
JP
Japan
Prior art keywords
encoding
audio
data
bit
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP27582998A
Other languages
English (en)
Other versions
JPH11186911A (ja
Inventor
成 熈 朴
延 培 金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Priority to CN 99108323 priority Critical patent/CN1123011C/zh
Publication of JPH11186911A publication Critical patent/JPH11186911A/ja
Application granted granted Critical
Publication of JP3412081B2 publication Critical patent/JP3412081B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Materials For Photolithography (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はオーディオデータ符
号化/復号化に関し、特にビット分割算術符号化を用い
たビット率の調節可能なオーディオデータ符号化/復号
化方法及び装置及びその方法を記録した記録媒体に関す
る。
【0002】
【従来の技術】MPEG/オーディオ標準やAC-2/AC-3 方式
は、従来のデジタル符号化に比べて1/6 乃至1/8 に減っ
た64Kbps-384Kbpsのビット率でコンパクトディスクの音
質とほぼ同じくらいの音質を提供する。このため、MPEG
/オーディオ標準は,DAB(Digital Audio Broadcastin
g)、インターネット電話、AOD(Audio on Demand)及びマ
ルチメディアシステムのようなオーディオ信号の保存と
伝送システムにおいて重要な役割をするはずである。
【0003】しかし、さらに低いビット率で原音に透明
な音質を提供しうる方式に対する研究が進行されてき
て、この方式はMPEG-2アドバンストオーディオコーディ
ング(AAC) との方式で新たな国際標準として認証され
た。MPEG-2AAC は64kbpsで原音に透明な音質を提供しう
る方式であって専門家グループにより推奨されている。
【0004】これら従来の方法は、符号化装置において
固定されたビット率が与えられ、与えられたビット率に
最適の状態を探して量子化及び符号化過程を経るので、
固定されたビット率を使用する場合には、良い効率とな
る。
【0005】
【発明が解決しようとする課題】しかしながら、マルチ
メディア時代の渡来と共に従来の低いビット率符号化の
みならず多様な機能性を有している符号化器/復号化器
に対する要求が多くなっている。その要求の1つがビッ
ト率の大きさの調節可能なスカラブルオーディオコデッ
ク(scalable audio codec)である。ビット率の調節可能
なスカラブルオーディオコデックは、高ビット率で符号
化されたビットストリームを低ビット率のビットストリ
ームに形成でき、そのうち一部のビットストリームのみ
で復元できるべきである。これにより、ネットワークに
過負荷がかかる場合、または復号化器の性能が劣った
り、使用者の要求によりビット率が低まる場合にビット
ストリームの一部のみでビット率の低くなった分だけ性
能の劣化を示すが、ある程度の性能で使用者に信号を復
元する。
【0006】MPEG-2AAC 標準案のような従来のオーディ
オ符号化技法は固定されたビット率が与えられ、与えら
れたビット率に最適の状態を探して量子化及び符号化過
程を経て、与えられたビット率に合せてビットストリー
ムを形成する。従って、1つのビットストリーム内に1
つのビット率に対した情報を含んでいる。即ち、ビット
ストリームヘッダにビット率に対した情報を含んで固定
的に使用する。このような方法の長所は、固定された特
定ビット率のみを使用する場合に特定ビット率にて最良
の効率となることである。例えば、何れか一つのビット
ストリームが64Kbpsのビット率に符号化器から形成され
た場合、64Kbpsに対応する復号化器に復元すれば64Kbps
のビット率では最上の品質に復元された音が聞ける。
【0007】このような方式のビットストリームは一つ
のビット率のみで構成されるために、ビットストリーム
の順序は考慮せず、与えられたビット率に適合した大き
さにビットストリームが構成される。実際、このように
構成されたビットストリームがネットワークを通じて伝
送される場合、このビットストリームは幾つのスロット
に割られて伝送される。伝送線路に過負荷がかかった
り、伝送線路の帯域幅が狭くて送信端から受信端に伝送
したスロット全体が到着せず、一部のみ到着する場合に
正しいデータが再生できない。また、ビットストリーム
の順序が重要度に応じて構成されていないので、全体ビ
ットストリームでない一部ビットストリームのみで復元
する場合、相当耳障りな音を再生することになる。
【0008】また、このような問題点を解決するため
に、ビット率の調節可能に形成されたスカラブルオーデ
ィオコデックの場合、基盤階層に対して符号化し、元の
信号と符号化された信号との誤差信号を再び次の階層で
符号化する方式を使用する K.Brandenburg,et al.,"Fir
st Ideas on Scalable Audio Coding",97th AES-Conven
tion,preprint 3924,San Francisco,1994 K.Brandenbu
rg,et al.,"A Two- or Three-Stage Bit Rate Scalable
Audio Coding System",99th AES-Convention,preprint
4132,New York,1995 。従って、階層が多くなるほど
高ビット率における性能は相対的に劣化される。前述の
ようなビット率の調節可能な符号化器を使用する場合、
良質の音声信号を再生して聞いているうちに、通信網の
状態不良や、受信端の復号化器へ多くの負荷がかかる場
合、低ビット率の音声を聞くことになる。従って、前述
のような符号化方式は実際にビット率の調節が必要な場
合には適しない。図6は従来のビット率の調節可能なコ
デックの構造を示したものである。
【0009】従って、本発明は、従来のオーディオ符号
化/復号化に用いられる基本モジュールはそのまま使用
しながら無損失符号化モジュールのみをビット分割符号
化方式に代替し、ビット分割算術符号化(BSAC 、Bit-Sl
iced Arithmetic Coding) 技法を用いてビット率の調節
可能なデジタルオーディオデータ符号化方法及びその装
置及びその方法を記録した記録媒体を提供することを目
的とする。
【0010】本発明の他の目的は、ビット分割算術符号
化技法を用いてビット率の調節可能なデジタルオーディ
オデータ復号化方法及び装置及びその方法を記録した記
録媒体を提供することである。
【0011】
【課題を解決するための手段】前述の技術的課題を解決
するために、本発明によるビット率の調節可能なデジタ
ルオーディオ符号化方法は、オーディオ信号を基盤階層
と少なくとも一つの上位階層よりなる階層的なデータス
トリームに符号化するオーディオ符号化方法であって、
(1)入力オーディオ信号を信号処理して所定の符号化
帯域別に量子化する量子化処理段階と、(2)量子化処
理段階において量子化処理されたデータをビットストリ
ームでパッキングするビットストリーム生成段階とを備
えている。そして、ビットストリーム生成段階は、
(1)基盤階層に対応する量子化されたデータを符号化
する基盤階層符号化段階と、(2)基盤階層符号化段階
において符号化された階層の次の上位階層に属する量子
化されたデータ及び符号化された階層に属しながら階層
の大きさの制限により符号化されずに残っている量子化
されたデータを符号化する階層符号化段階と、(3)階
層符号化段階を全ての階層に対して行ってビットストリ
ームに形成する順次符号化段階とを有している。そし
て、基盤階層符号化段階と、階層符号化段階と、順次符
号化段階との符号化は、符号化しようとする階層に対応
する付加情報及び量子化されたデータを所定数のビット
で表し、重要度の最も高いビットよりなる最上位ビット
シーケンスから重要度の低いビットよりなるビットシー
ケンス順に、所定の確率モデルを使用して算術符号化
し、付加情報はスケールファクター及び算術符号化に使
用される確率モデル情報を含む。
【0012】また、本発明のビット率の調節可能なオー
ディオ符号化装置は、(1)入力オーディオ信号を信号
処理して所定の符号化帯域別に量子化する量子化処理部
と、(2)ビット率の調節可能に基盤階層に対応する帯
域制限をし、付加情報を符号化し、量子化された値に対
する情報を最上位ビットから、そして低周波数から高周
波数の順に符号化し、基盤階層に対する符号化が終わる
と、その次の階層に対する付加情報及びオーディオデー
タの量子化値を符号化して階層的構造を有するビットス
トリームを生成するビットパッキング部とを備える。
【0013】また、本発明の階層的なビット率を有する
ように符号化されたオーディオデータを復号化する方法
は、(1)階層的構造を有するデータストリームから階
層の生成順序に応じて少なくともスケールファクター及
び各帯域に適用される算術符号化モデル情報を含む付加
情報及び量子化されたデータを復号化するが、データス
トリームを構成しているビットの重要度を分析して重要
度の高いビットから低いビット順に量子化されたデータ
に対応する算術符号化モデルに基づいて復号化する段階
と、(2)復号化されたスケールファクター及び量子化
されたデータを元の大きさの信号に復元する段階と、
(3)逆量子化された周波数領域のオーディオ信号を時
間領域の信号に変換する段階とを備える。
【0014】また、本発明のビット率の調節可能なオー
ディオ復号化器は、(1)階層的な構造を有するビット
ストリームからビットストリームの形成順序に応じて少
なくともスケールファクター、算術符号化モデルを含む
付加情報及び量子化されたデータを復号化するビットス
トリーム分析部と、(2)復号化されたスケールファク
ター及び量子化されたデータを元の大きさの信号に復元
する逆量子化部と、(3)逆量子化された信号を周波数
領域のオーディオ信号から時間領域の信号に変換する周
波数/時間マッピング部とを備える。
【0015】また、本発明のオーディオ符号化方法を実
行させるためのプログラムを記録したコンピュータで読
出可能な記録媒体は、上述したビット率の調節可能なオ
ーディオ符号化方法を記録している。
【0016】本発明により形成されるビットストリーム
は、1つのビット率に対してのみで構成することではな
く、基盤階層(Base Layer)を基盤として多数の上位階層
(Enhancement Layer) で構成される。本発明は従来の符
号化方式のように決まったビット率で最上の性能を示す
符号化効率に優れた方法だけでなく、マルチメディア時
代に好適に符号化されたビット率以内のビット率のうち
一つで復元しうる符号化/復号化方法及び装置に関す
る。
【0017】そして、本発明はISO/IEC JTC1/SC29/WG11
N1903(ISO/IEC Committee Draft 14496-3 SUBPART 4)
として採択された。
【0018】
【発明の実施の形態】以下、添付された図面に基づき本
発明を詳しく説明する。図1は本発明の実施の形態に係
るビット率の調節可能なオーディオ符号化装置の構成を
示すブロック図であって、量子化処理部230とビット
パッキング部240とに大別される。
【0019】量子化処理部230は入力オーディオ信号
を信号処理して、所定の符号化帯域別に量子化するブロ
ックであって、時間/周波数マッピング部200と、音
響心理部210と量子化部220より構成される。時間
/周波数マッピング部200は、時間領域の入力オーデ
ィオ信号を周波数領域の信号に変換する。時間的に人間
の耳の信号特性の認知差はあまり大きくない。しかし、
変換された周波数領域の信号においては人間の音響心理
モデルに応じて各帯域で人間が感じられる信号と感じら
れない信号との差が大きい。従って、各周波数帯域に応
じて割当てられるビット数を異にすれば圧縮効率を向上
させることができる。
【0020】音響心理部210は、時間/周波数マッピ
ング部200により周波数成分に変換された入力オーデ
ィオ信号を所定の帯域信号に結合し、各信号の相互作用
により発生されるマスキング現象を用いて各帯域におけ
るマスキング域値を計算する。マスキング現象とは何れ
のオーディオ信号(音)により他の信号(音)が聞こえ
なくなる現象を意味する。例えば、駅で列車が通る時、
低い声で会話をすると相手の声が列車音により聞こえな
くなる現象である。
【0021】量子化部220は、各帯域の量子化ノイズ
がマスキング域値より小さくなるように所定の符号化帯
域別に量子化する。即ち、各帯域の量子化ノイズの大き
さがマスキング域値より小さくなるように各帯域の周波
数信号をスカラー量子化し、人間が聞いても感じられな
いようにする。音響心理部210で計算したマスキング
域値と各帯域から発生するノイズの比率のNMR(Noise-to
- Mask Ratio) を用いて全帯域のNMR 値が0dB以下にな
るように量子化を行なう。NMR 値が0dB以下というのは
量子化ノイズに比べてマスキング域値値が高いことを示
し、これは量子化ノイズを人が聞取れないという意味で
ある。
【0022】ビットパッキング部240は最低のビット
率の基盤階層に該当する付加情報及び量子化されたデー
タを算術符号化し、この基盤階層に対する符号化が終わ
ると、その次の階層に対する付加情報及び量子化された
データを符号化し、これを全ての階層に対して行ってビ
ットストリームを形成する。ここで、付加情報はスケー
ルファクター及び算術符号化に使用される確率モデル情
報を含む。ビットパッキング部240の各階層における
量子化されたデータの符号化は、量子化されたデータの
各々を所定の同一数のビットよりなる2進データで表
し、ビット単位に集め、結合し、分割されたビットから
最上位ビットシーケンスから最下位ビットシーケンス順
に所定の確率モデルを使用して算術符号化する。
【0023】そして、量子化されたデータが符号データ
と大きさデータよりなる時、ビットパッキング部240
はビット分割されたデータのうち重要度の同じ同一順位
のビットに対する大きさデータを集めて符号化し、符号
化された大きさデータ中の零でない大きさデータに対応
する符号データ中の符号化されていない符号データを符
号化する。ここで、大きさデータ及び符号データの符号
化は最上位ビットから下位ビット順に順次に行う。
【0024】一方、前述した構成を有する符号化器より
形成されたビットストリームは、図2に示すようにビッ
ト率に応じて下位階層のビットストリームが上位階層の
ビットストリームに含まれている階層構造よりなる。従
来では、付加情報を先に符号化して、次に残りの情報を
符号化してビットストリームを形成していた。しかし、
本発明では図2のように各階層の付加情報は別々に符号
化される。また、従来の符号化方式では量子化されたデ
ータを全てサンプル単位で順次に符号化したが、本発明
では量子化されたデータを2進法で示し、2進データの
最上位ビット(Most Significant Bit :MSB)から符号化
して許容可能なビット量内でビットストリームを構成す
る。
【0025】次に、符号化器の作用を説明する。入力オ
ーディオ信号は符号化され、ビットストリームに形成さ
れる。入力信号は時間/周波数マッピング部200にて
MDCT(Modified Discrete Cosine Transform)により周波
数領域の信号に変換される。そして、音響心理部210
は周波数信号を適当な帯域(スケールファクターバン
ド)に結合して、マスキング域値を求める。
【0026】量子化部220では、許容可能なビット数
内で人が聞いても感じられないように、各スケールファ
クターの量子化ノイズの大きさをマスキング域値より小
さくスカラー量子化する。このような条件を満たすよう
に量子化過程を経ると、各スケールファクターバンドに
対するスケールファクター及び量子化された周波数値が
生成される。
【0027】一般に、人間は心理音響学的において、低
周波数では細密な間隔の周波数成分を容易に区別するこ
とができる。しかし、周波数が高くなるほど人が区別し
うる周波数間隔は広まる。よって、スケールファクター
バンドの帯域幅は周波数帯域が高まることによって徐々
に広まる。しかし、符号化時は、不均一な帯域幅を有す
るスケールファクターバンドを使用せずに一定の帯域幅
を有する符号化帯域を使用する。符号化帯域は32個の
量子化された周波数係数値を含む。
【0028】次に、スケールファクターの符号化につい
て説明する。スケールファクターを圧縮するために算術
符号化方式を使用する。スケールファクターを圧縮する
ために、まずスケールファクター値の最大値(max _sc
alefactor)を求める。そして、各スケールファクター
とmax _scalefactor に対する差を求め、このスケール
ファクターの差を算術符号化する。4種類のモデルがス
ケールファクターの差の算術符号化に使用されている。
4種類のモデルを表1、表2、表3、表4に示す。モデ
ルに対する情報はscalefactor _model に蓄積される。
【0029】
【表47】
【0030】
【表48】
【0031】
【表49】
【0032】
【表50】
【0033】次に、算術符号化モデル指数の符号化につ
いて説明する。各符号化帯域は32個の周波数成分を含
む。この32個の量子化された周波数係数を算術符号化
することになる。各符号化帯域の算術符号化に使用され
るモデルを決定し、この情報が算術符号化モデル指数(A
rModel) に蓄積される。ArModel を圧縮するために算術
符号化方式を使用する。ArModel を圧縮するためにはま
ずArModel 値の最小値(min_ArModel)を求める。そし
て、各ArModel とmin _ArModel に対する差を求め、こ
の差を算術符号化する。この際、4種類のモデルが算術
符号化に使用される。これらモデルを表5、表6、表
7、表8に示す。この4種類のモデルのうち使われたモ
デルに対する情報はArModel _modelに蓄積される。
【0034】
【表51】
【0035】
【表52】
【0036】
【表53】
【0037】
【表54】
【0038】次に、量子化された周波数成分のビット分
割符号化について説明する。一般に、最上位ビット(MS
B)1ビットの重要度は最下位ビット(LSB)1ビットの重要
度に比べて大変高い。しかし、従来の方式で符号化する
場合、ビットの重要度に関係なく符号化されるため、全
体のビットストリームのうち前から一部のビットストリ
ームのみを使用する場合、後の使用されないビットスト
リームに含まれた情報に比べて重要でない情報が前のビ
ットストリームに相当量含まれることになる。
【0039】従って、本発明では各帯域の量子化された
信号を最上位ビットから最下位ビット順に符号化する方
式を使用する。即ち、各量子化された信号を2進数で表
現し、各周波数成分の量子化された値をビット単位で低
周波数成分から高周波数成分に処理することになる。ま
ず、各周波数成分の最上位ビットを求めて順に1ビット
ずつ集めて符号化した後、その次の上位ビットを符号化
し、順に最下位ビットまで処理する。このような順序で
符号化することにより、重要な情報が先に符号化され、
ビットストリームが前から形成される。
【0040】まず、量子化された値の符号(sign)値を別
に保存してその絶対値を取り、正の値で表す。量子化さ
れた周波数データをビット単位に分割して最上位ビット
(MSB) から最下位ビット(LSB)順に順次に配列する。こ
のようにビット分割されたデータから4次元ベクトルに
再構成する。各々4ビットを有する8個の量子化された
値を次のように2進法で表すと仮定する。
【0041】従来の方式によれば、まず最低周波数成分
の値の1001を符号化してから1000、0101、0010の順に、
即ち各周波数成分に対して水平方向に符号化する。しか
し、本発明によれば、最低周波数成分の最上位ビットの
1と、次の周波数成分の最上位ビットの0、次の周波数
成分の最上位ビットの1、0…などの最上位ビットより
なる最上位ビットシーケンスを求めて、順序通り適当に
幾つのビットずつ束ねて処理する。例えば、4ビットず
つ1つの単位に符号化すれば最上位ビットシーケンス'1
0100000'で1010を符号化した後、0000の順に符号化す
る。それから最上位ビットの符号化が終わるとその次の
上位ビットシーケンス、即ち0001、0000... の順に符号
化し、最下位ビットシーケンスまで同じ方式で符号化す
る。
【0042】4ビットずつ1つの単位で束ねられたもの
を各4次元ベクトルとする際、4次元ベクトルは状態に
応じて2つのサブベクトルに再び分けられる。2つのサ
ブベクトルは効率的な無損失符号化方法の1つである算
術符号化方法で符号化される。このために各符号化帯域
の算術符号化に使用されるモデルを決定することにな
り、情報は算術符号化モデル指数ArModel に保存され
る。各算術符号化モデルは幾つの下位モデルで構成され
る。サブベクトルは算術モデルの幾つの下位モデルのう
ち1つを用いて符号化される。下位モデルは符号化する
サブベクトルの次元、ベクトルの重要性そして各サンプ
ルの符号化状態等に応じて分類される。ベクトルの重要
性は、符号化されるベクトルのビット位置により決定さ
れる。即ち、ビット分割された時、分割されたビット情
報がMSB に対するものか、その次のMSB に対するもの
か、そうでなければLSB に対するものかに応じてベクト
ルの重要性が変わり、MSB が最高の重要性を有し、LSB
は最低の重要性を有する。各サンプルの符号化状態はMS
B からLSB にベクトルを符号化しながらその値が更新さ
れる。最初にその値が0に初期化される。そして、ビッ
ト値が0でない値の場合1となる。
【0043】次に、符号ビットの符号化について説明す
る。符号ビットを符号化する基本的な概念は、最上位ビ
ットシーケンスから最下位ビットシーケンス順次に符号
化することであり、一度符号ビット(ここでは1)が符
号化された周波数成分データは符号化を保存し、符号ビ
ットが符号化されない周波数成分データを先に符号化す
ることである。こうして全ての周波数成分に対する符号
ビットが符号化されると、保存された周波数成分データ
は再び上位ビットシーケンス順に符号化を行う。
【0044】これを具体的な例を挙げて説明する。上記
例を再び引用すれば、まず上記例において最上位ビット
シーケンス(1010、0000)は全て符号化される。なぜな
ら以前に符号ビットを符号化しなかったため、符号化を
保存する対象がないからである。次に、その次の上位ビ
ットシーケンス(0001、0000)に対して符号化を行う。
この際、ビットシーケンスのうち「0001」の最初の0と
3番目の0は最上位ビットシーケンスで符号ビット
「1」が符号化されたため、一端符号化を保存する。そ
して、2番目の0と4番目の1、即ち「01」を符号化
する。そして、次の0000の値を見ると上位ビットで符号
ビットを符号化したことが無いので、0000を符号化する
ことになる。このように最下位ビットまでの符号ビット
を符号化した後、残りの符号化されない保存された情報
を再び上位ビット順に符号化する。
【0045】次に、スケーラブルビットストリーム(sca
lable bitstream)の構成を説明する。本発明により生成
されるビットストリームの構造を説明すれば、各周波数
成分値を2進数で表す際、基盤階層では最上位ビット(M
SB) が先に符号化され、その次の上位階層ではその次の
上位ビットが符号化され、最後に最上位階層では最下位
ビット(LSB) が符号化される。即ち、基盤階層では周波
数成分全体に対する輪郭のみ符号化されてから、ビット
率の増加に応じてさらに多くのビットが表されることに
よりさらに細密な情報を示すことになる。このように階
層の進行により細密なデータ値が表現されるので、階層
の上昇に応じて良質の音質を示しうる。このように表現
されるビットストリームをスケーラブルビットストリー
ムと称する。
【0046】スケーラブルビットストリームを構成する
方法は次の通りである。まず、基盤階層のビットストリ
ームを製作する。基盤階層に使用される付加情報を符号
化する。付加情報はスケールファクターバンドのスケー
ルファクター情報と各符号化帯域に対する算術符号化モ
デル指数を含む。付加情報に対する符号化が終わると、
量子化された値に対する情報を最上位ビットから最下位
ビット順に符号化するが、周波数成分は低周波数から高
周波数順に符号化する。もちろん現在符号化しているビ
ットが何れの符号化帯域に割当てられたビットより大き
い場合、符号化をせずに通り過ぎ、その帯域に割当てら
れたビットと同一になると符号化を始める。即ち、所定
の帯域制限内で符号化を行う。
【0047】このように帯域を制限する理由は次の通り
である。各階層の信号を符号化する時、何らの帯域の制
限がなければ最上位から帯域に関係なく符号化すること
になる。こうなると、ビット率の低い階層の場合には各
帯域の信号を復元してみると信号が断続される現象とな
るため、相当耳障りな音を聞くことになる。従って、ビ
ット率に応じて適当に帯域を制限して符号化を行う。ま
た、各階層に応じて帯域を制限すれば、階層に応じて必
要な復号化器の複雑度も減ることになる。従って、質的
スケーラビリティ(quality scalability) だけでなく複
雑度スケーラビリティ (compleixy scalability)も共に
実現しうる。基盤階層に対する符号化が終わると、その
次の階層に対する付加情報及びオーディオデータの量子
化値を符号化する。このような方法で全ての階層のデー
タを符号化し、全ての情報を集めてビットストリームを
構成することになる。
【0048】一方、図3は本発明の実施の形態によるビ
ット率の調節可能な復号化器の構成を示すブロック図で
あって、ビットストリーム分析部400、逆量子化部4
10及び周波数/時間マッピング部420よりなる。ビ
ットストリーム分析部400は、階層的構造を有する入
力ビットストリームからビットストリームが形成された
順序に応じて少なくともスケールファクター及び算術符
号化モデルを含む付加情報とビット分割された量子化さ
れたデータを復号化する。このように復号化されたデー
タに対した以降の処理は、AAC標準案等従来のオーデ
ィオアルゴリズムのような処理モジュールを通して時間
領域の信号に復元する。まず、逆量子化部410は復号
化されたスケールファクターと量子化されたデータを有
し、元の大きさの信号に復元する。そして、周波数/時
間マッピング部420は逆量子化された信号を周波数領
域のオーディオ信号から時間領域の信号に変換して再生
する。
【0049】次に、符号化器で形成されたビットストリ
ームの復号化過程を説明する。生成されたビットストリ
ームの復号化過程は符号化過程の逆順である。まず、基
盤階層に対する情報を復号化する。簡単にその過程を説
明すれば、全体階層に共通的に使用されるべき情報(ヘ
ッダ情報)がビットストリームに最先端に保存されるた
めにこの情報を先に復号化する。基盤階層に用いられる
付加情報は、基盤階層に割当てられた帯域に対するスケ
ールファクターと算術符号化モデル指数よりなる。従っ
て、スケールファクター及び算術符号化モデル指数を復
号化する。このように復号化された算術符号化モデル指
数を通して各符号化帯域に割当てられたビットがわか
る。そして、割当てられたビットのうち最大値を求め
る。前述した符号化過程で技術された順序と同様に、こ
のように求められた最大ビットより、そして低周波数か
ら高周波数順にビットストリームから量子化された値を
徐々に復号化することができる。勿論、現在復号化して
いるビットより所定の帯域の割当てられたビットが小さ
い場合、所定の復号化過程無しに通りすぎ、その符号化
帯域が割当てられたビットと同一になる時に復号化し始
める。
【0050】基盤階層に割当てられた大きさのビットス
トリームに対する復号化が終わると、その次の階層に対
する付加情報及びオーディオデータの量子化値を復号化
する。このような方法で全ての階層のデータを復号化す
ることができる。このように復号化過程を経て量子化さ
れたデータは前の符号化器とは逆の順序で、即ち図3の
ように逆量子化部410と周波数/時間マッピング部4
20を経て復元された信号に作られる。
【0051】次に、本発明の好適な一実施例を説明す
る。本発明はAAC標準案の基本構造に適用され、ビッ
ト率の調節可能なデジタルオーディオデータ符号化器を
実現する。即ち、AACの符号化/復号化に使用される
基本モジュールはそのまま使用しながら,無損失符号化
モジュールのみをビット分割符号化方式に代替する。従
って、本発明による符号化器から作られたビットストリ
ームはAACとは異なる形のビットストリームを有する
ことになる。一つのビットストリーム内に一つのビット
率に対するもののみで構成するのではなく、基盤階層を
基にして多数の上位階層のデータを共に表現する。従っ
て、図2に示すように、多数の階層のビット率に対する
情報を一つのビットストリームに階層的な構造で表す
が、重要な信号成分順に表す。
【0052】このように作られたビットストリームは、
使用者の要求または伝送線路の状態に応じて最高ビット
率のビットストリームに含まれた低ビット率のビットス
トリームを簡単に再構成して、低ビット率のビットスト
リームが作り出せる。即ち、実時間に符号化器から作ら
れたビットストリームや、または所定の媒体に保存され
ているビットストリームを使用者の要求に応じて所望の
ビット率に対してビットストリームに作って伝送するこ
とができる。また、使用者が完全なビットストリーム有
していても使用者のハードウェアの性能が劣ったり、使
用者が復号化器の複雑性を低めようとしたら、このビッ
トストリームのうち一部のみで復元することができる。
これにより、システムの複雑性を低め、複雑性の調節を
可能にしうる。
【0053】一例として、基盤階層は16kbps、最上位階
層は64kbps、各上位階層は8kbps 間隔のビット率を有す
るビットストリームを構成する。即ち、16、24、32、4
0、48、56、64kbpsの7階層のスケール調節可能なビッ
トストリームを構成する。各階層は表9のように定義す
る。符号化器で構成されるビットストリームは図2のよ
うな階層的構造で構成されるため、最上位階層の64kbps
に対するビットストリーム内に各階層16、24、32、40、
48、56、64kbpsに対するビットストリームが含まれてい
る。使用者が最上位階層に対するデータを要求する場
合、このビットストリームを所定の加工をせずに伝達す
る。他の使用者が基盤階層(16kbps に該当)に対するデ
ータを要求するならば、単に前部のビットストリームの
みを切取って伝達する。
【0054】
【表55】
【0055】
【表56】
【0056】
【表57】
【0057】
【表58】
【0058】
【表59】
【0059】
【表60】
【0060】他の例として、さらに細密な間隔に階層を
構成することもできる。基盤階層を16kbps、最上位階層
を64kbpsとし、各上位階層が1kbps 間隔のビット率を有
するビットストリームを構成することができる。各階層
は表15のように構成することができる。16kbpsから64
kbpsまで1kbps の間隔にスケール調節可能なビットスト
リームを構成するファイングラニュールスケーラビリテ
ィ(fine granule scalability)を実現することもでき
る。
【0061】
【表61】
【0062】
【表62】
【0063】
【表63】
【0064】
【表64】
【0065】
【表65】
【0066】
【表66】
【0067】各階層はビット率に応じて帯域幅を制限す
るが、8kbps 間隔にスケーラビリティを提供しようとす
るなら、帯域制限は表10と表11のようになる。1kbp
s 間隔ならば帯域制限は表16と表17のように定義さ
れる。入力データは48kHz でサンプリングされたPCM デ
ータであり、1フレームの大きさは1024個である。64kb
psのビット率の場合に1フレームで使えるビット数は平
均64000 ビット/1秒×(1024/48000)=1365.3333ビットと
なる。同様に、各ビット率に応じて1 フレームに使用し
うるビットの大きさを計算することができる。このよう
に計算されたフレーム当り使用可能なビット数が8kbpの
間隔ならば表12と同一であり、1kbps の間隔ならば表
18と同一である。
【0068】次に、符号化過程について説明する。全体
的な符号化は、MPEG−2AAC国際標準案と同一な
過程を経たのち、無損失符号化過程として本発明で提案
されたビット分割符号化を適用する。音響心理部につい
て説明する。量子化の前に、先ず入力データで音響心理
モデル(Psychoaccoustic Model )を用いて、現在処理
されているフレームのブロックタイプ(長い、開始、短
い、停止)と各スケールファクターバンドのSMR値
(Signal-to-Masked ThresholdRatio)、短いブロック
の場合のグループ情報、そして音響心理モデルと時間/
周波数マッピング部に伝達する。音響心理モデルを計算
する方法はISO/IEC11172-3のMode2を使用する(MPEG C
ommittee pictures and associawted audio fordata st
orage media to about 1.5Mbit/s-Part 3: Audio, ISO/
IEC IS11172-3.1993)。
【0069】次に、時間/周波数マッピング部について
説明する。時間/周波数マッピング部は、MPEG−2
AAC国際標準案に定義されているものを使用する。音
響心理モデルの出力のプロックタイプに応じて時間/周
波数マッピング部ではMDCT(Modified Discrete Cosine
Transform)を用いて、時間領域のデータを周波数領域の
データに変換する。この際、ブロックの大きさが長い/
開始/停止ブロックの場合2048であり、短いブロッ
クの場合の大きさは256である。従って、長い/開始
/停止ブロックは、MDCTを8回行う(MPEG Committ
ee ISO/IEC/JTC1/SC29/WG11,ISO/IEC MPEG-2AAC IS 138
18-7,1997)。これまでの過程は従来のMPEG−2AA
C(MPEG Committee ISO/IEC/JTC1/SC29/WG11,ISO/IEC M
PEG-2AAC IS 13818-7,1997) と同じ方式を使用する。
【0070】次に、量子化部について説明する。周波数
領域に変換されたデータは表21や表22のようなスケ
ールファクターバンドで周波数成分を束ねて、スケール
ファクターバンドのSNR値が音響心理モデルの出力値
のSMR値より小さくなるように、スケールファクター
を変化させながら量子化する。量子化はSNR値とSM
R値とを考慮しながら、人間が感じるノイズの量を最小
化する。正確な量子化過程はMPEG−2AACに記述
されている過程を使用する。この歳、得られる出力は量
子化されたデータと各スケールファクターバンドのスケ
ールファクターである。
【0071】
【表67】
【0072】
【表68】
【0073】次に、周波数成分の配列を説明する。周波
数成分を符号化の利便性のために再配列することにな
る。ブロックタイプに応じて再配列の順序が変わる。ブ
ロックタイプがロングウィンドウを使用する場合、図4
のようにスケールファクターバンドの順序通り配列され
る。図4において、sfb はスケールファクターバンドを
示す。そして、ブロックタプがショートウィンドウの場
合には図5のように8個の各ブロックからの周波数成分
のうち4個ずつ上位差順に繰り返し、挟み込まれて配列
される。図5において、Bは8個のブロックを示し、そ
の下の数字は各ブロックにおける周波数成分を示す。
【0074】次に、ビット分割算術符号化(BSAC)を用い
たビットパッキング部を説明する。上述のように再配列
された量子化データとスケールファクターを階層構造を
有するビットストリームで構成することになる。ビット
ストリームは表23乃至表31のようなシンタックスに
よって構成される。
【0075】
【表69】
【0076】
【表70】
【0077】
【表71】
【0078】
【表72】
【0079】
【表73】
【0080】
【表74】
【0081】
【表75】
【0082】
【表76】
【0083】
【表77】
【0084】ビットストリームの構成要素は前方にAA
Cと共に使用可能な部分を共有し、新たに本発明を適用
刷るためのものは別に分離した。従って、大きな構造は
AAC標準案と類似に構成した。次に、本発明で新たに
使用したビットストリームの構成要素を説明する。
【0085】表27はbsac_channel _streamの符号化
に対するシンタックスを示したものであって、「max _
scalefactor 」とのスケールファクターのうち最大値を
意味し、整数値で8ビットを有する。表28はbsac_da
taの符号化に対するシンタックスを示したものであっ
て、「frame _length」は一つのフレームに対するビッ
トストリーム全体の大きさを意味し、バイト単位で示さ
れる。そして、「encoded _layer 」はビットストリー
ムの符号化された最高階層(top layer) に対する情報を
符号化する。8kbs 間隔なら3ビット、1kbs 間隔なら
6ビットが使用される。階層に対する情報は表9及び表
15に示されている。また、「scalefactor _model 」
はスケールファクターの差を算術符号化する際に使用す
るモデルに関する情報を示し、モデルを表32に示す。
「ArModel _model 」は算術符号化モデル指数とmin _
ArModel との差信号を算術符号化するために用いられる
モデルに関する情報を示し、情報を表33に示す。
【0086】
【表78】
【0087】
【表79】
【0088】表31はbsac_side_infoの符号化に対す
るシンタックスを示したものであって、全ての階層に共
通に使用される情報を先に符号してから各階層に共通に
使用される付加情報を符号化する。「acode _ArModel
」はArModel を算術符号化したコードワードを示し、A
rModel は表34に示されるモデルのいずれかが選択さ
れたかに関する情報である。
【0089】
【表80】
【0090】
【表81】
【0091】
【表82】
【0092】
【表83】
【0093】
【表84】
【0094】
【表85】
【0095】
【表86】
【0096】
【表87】
【0097】
【表88】
【0098】
【表89】
【0099】
【表90】
【0100】
【表91】
【0101】
【表92】
【0102】
【表93】
【0103】表31はbsac_spectral_dataの符号化に
対するシンタックスを示したものであって、各階層に共
用される付加情報を使用した後、量子化された周波数成
分をBSAC(ビット分割算術符号化)技術を用いてビット
分割した後算術符号化する。「acode _vec0」は、ArMo
del値として定義されている算術モデルを用いて、最初
のサブベクトル(サブベクトル0)を算術符号化したコ
ードワードである。「acode _vec1」は、ArModel値と
して定義されている算術モデルを用いて、二番目のサブ
ベクトル(サブベクトル1)を算術符号化したコードワ
ードである。「acode _sign」は符号ビットに対する情
報を表48のモデルで算術符号化したコードワードであ
る。
【0104】
【表94】
【0105】各サブベクトルの符号化に用いられたビッ
ト数を計算し、各階層において使用可能なビット数と比
較する。使われたビット数が使用可能なビット数と同一
または大きい場合、次の階層の符号化を新たに始める。
基盤階層の帯域幅は、長いブロックの場合、21番目ま
でのスケールファクターバンドに帯域制限される。そし
て、21番目のスケールファクターバンドまでのスケー
ルファクターに対応する各符号化帯域の算術符号化モデ
ルを符号化する。算術符号化モデルより各符号化帯域の
ビット割当情報を得ることができ、この値のうち割当て
られたビットの最大値を求め、この最大値より前述した
方法を用いて符号化を行う。そして、順次に次のビット
に対する符号化を行う。ここで、現在符号化しているビ
ットよりある符号化帯域の割当ビットが小さい場合、符
号化を行わない。符号化帯域のが割当ビットと現在符号
化されているビットが同一になる時、はじめて符号化が
行われる。基盤階層のビット率は16kbpsなので、許容可
能な全体ビットは336ビットとなる。従って、使用す
る総ビット量を連続して計算し、ビット量が336ビッ
ト以上になるとき、一旦符号化を中止する。
【0106】基盤階層(16kbps)に対するビットストリー
ムを形成した後、その次の階層に対してビットストリー
ムを形成する。階層が高くなると制限帯域が大きくなる
ので、基盤階層の制限帯域に新たに追加される帯域に対
してのみスケールファクターの符号化と算術符号化モデ
ルの符号化を行う。そして、総使用ビット量の大きさが
使用可能なビット数より大きくなると符号化を中止し、
次の階層のビットストリーム作成の用意が行われる。こ
のような方法で残りの階層(32、40、48、56、64Kbps)
のビットストリームを作成する。
【0107】次に、復号化過程を説明する。 (1)ビットストリーム分析及び復号化 1. bsac _channel_streamの復号化 bsac_channel_streamにおいて復号化は、表27に示
されたようにmax_scalefactor、ics_info( )、BSAC d
ataの順に行われる。 2. bsac _dataの復号化 表28に示されたように、frame_length、encoded_la
yer、 scalefactormodel及びArmodel_modelを復号化す
るのに必要な付加情報をビットストリームより復号化す
る。 3. bsac _side_infoの復号化 先に作られたスケーラブルビットストリームは階層構造
を有している。まず、基盤階層に対する付加情報をビッ
トストリームより分離して復号化する。そして、基盤階
層のビットストリームに含まれる量子化された周波数成
分のビット分割情報をビットストリームより分離して復
号化する。他の上位階層に対しても基盤階層と同じ過程
を経て復号化を行う。
【0108】1) スケールファクターの復号化 周波数成分は4の倍数の周波数係数を含むスケールファ
クターバンドに分けられる。各スケールファクターバン
ドは各々一つのスケールファクターを有する。max_sca
lefactorが8ビットの符号の整数(unsigned integer)で
復号化される。全てのスケールファクターに対してオフ
セット値のmax_scalefactorとの差を求め、この差信号
を表32のモデルを用いて算術復号化する。差信号を復
号化するために用いられる算術モデルは,ビットストリ
ームを構成する1つの要素であり、先にビットストリー
ムより復号化される。従って、符号化の逆の順序で元の
スケールファクターを復元することができる。
【0109】次の擬似コード(pseudo code)は、基盤階
層と異なる上位階層でスケールファクターを復号化する
方法である。 for(g=0;g<num_window_group;g++){ for(sfb=layer_sfb layer ;sfb<layer_sfb layer+1 ;sfb++){ sf g sfb =max_scalefactor-arithmetic_decoding( ); } } ここで、layer_sfb layer は各階層でスケールファク
ターを復号化するための開始スケールファクターバンド
であり、layer_sfb layer+1 は終了スケールファクタ
ーバンドである。
【0110】2) 算術符号化モデル指数の復号化 周波数成分は無損失符号化をするために32個の周波数係
数を含む符号化帯域に分割される。符号化帯域は無損失
符号化に使用される基本単位である。算術符号化モデル
指数は、各符号化帯域のビット分割データを算術符号化
/復号化するために用いられるモデルに関する情報であ
る。これは表34に挙げられたモデルのうちどれを使用
するかを示す。全ての算術符号化モデル指数に対してオ
フセット値に対する差が計算され、その差信号を表33
に挙げられたモデルを用いて算術符号化する。この際、
表33の4個のモデルのうちどのモデルを使用するかは
ArModel_model値が示し、ビットストリームに2ビット
で保存される。オフセット値は、ビットストリームにmi
n_ArModel値で保存される5ビットである。従って、こ
のような符号化過程の逆の順序で差信号に対する復号化
を行い、差信号とオフセット値とを合せて算術符号化モ
デル指数を復元する。
【0111】次の擬似コードは、各階層で算術符号化モ
デル指数、ArModel cband をどのように復号化するかを
示す。 for(sfb=layer_sfb layer ;sfb<layer_sfb layer+1 ;sfb++) for(g=0;g<num_window_group;g++){ band=(sfb*num_window_group)+g for(i=0;swb_offset band ;i<swb_offset band+1 ;i+=4){ cband=index2cb(g、i); if(!decode_cband ch g cband ){ ArModel g cband =min_ArModel+arithmetic_decoding( ); decode_cband ch g cband =1; } } } ここで、layer_sfb layer は各階層で算術符号化モデ
ル指数を復号化するための開始スケールファクターバン
ドであり、layer_sfb layer+1 は終了スケールファク
ターバンドである。そしてdecode_cband ch g cband
は算術符号化モデルが復号化されたか(1)、または
そうでないか(0)を示すフラッグである。
【0112】4. ビット分割されたデータの復号化 量子化されたシーケンスはビット分割されたシーケンス
よりなる。各4次元ベクトルは状態に応じて2個のサブ
ベクトルに再び分けられる。2個のサブベクトルを効率
よく圧縮するために無損失符号化として算術符号化す
る。各符号化帯域の算術符号化に使用されるモデルを決
定し、この情報が算術符号化モデル指数ArModelに保存
される。
【0113】表34乃至表47に示したように各算術符
号化モデルは多数個の下位モデルよりなる。サブベクト
ルは算術モデルの可能な多数個の下位モデルらのうち1
つを用いて符号化される。下位モデルは符号化するサブ
ベクトルの次元、ベクトルの重要性、そして各サンプル
の符号化状態等に応じて分類される。ベクトルの重要性
は符号化されるベクトルのビット位置に応じて決定され
る。即ち、ビット分割された時、分割されたビット情報
がMSBに対するものか、その次のMSBに対するものなの
か、またはLSBに対するものかによって、ベクトルの重
要性が異なる。MSBが最も高い重要性を有し、LSBが最も
低い重要性を有する。各サンプルの符号化状態は、MSB
からLSBにベクトルを符号化しながらその値が更新され
る。最初にはその値は0に初期化される。そして、ビッ
ト値が0でないとき、符号化状態は1となる。
【0114】2つに分けられたサブベクトルは1乃至4
次元のベクトルとなる。このサブベクトルはMSBからLSB
に、低周波数から高周波数成分に行きながら算術符号化
される。算術符号化に使用される算術符号化モデル指数
は、符号化帯域単位にビット分割データを伝送する前に
低周波数から高周波数順に予めビットストリームに保存
される。各ビット分割されたデータに対する算術復号化
の結果はコードワード指数(codeword index)である。こ
の指数は次のような擬似コードによりビット結合されて
元の量子化されたデータに復元される。
【0115】「pre _state 」は現在復号化された値
が「0」か否かを示す状態である。「snf 」は復号化さ
れるベクトルの重要度を示す。「idx0」は前の状態が
「0」のコードワード指数である。「idx1」は前の状態
が「1」のコードワード指数である。「dec_sample
」は復号化されるデータを示す。「start _i 」は復
号化されたベクトルの開始周波数ラインである。
【0116】量子化された周波数係数のビット分割され
たデータがMSBからLSBに符号化し、初めて0でない値が
符号化される時、0でない周波数係数に対する符号ビッ
トは算術符号化される。符号ビットが負の場合は1を示
し、正の場合は0を示す。従って、復号化器においても
ビット分割データに対する算術復号化が行われ、算術復
号化されたビット値が初めて0でない場合、ビットスト
リームで符号に対する情報であるacode_signがついて
くる。
【0117】この情報を以ってsign_bitを表47のよ
うなモデルで算術復号化する。そして、sign_bitが1
ならば、先に分離されたデータを結合し量子化されたデ
ータyに符号に対する情報を次のように与えることがで
きる。
【0118】(2) 逆量子化 逆量子化部では、復号化されたスケールファクターと量
子化されたデータを以って元の大きさの信に復元する役
割をする。逆量子化過程はAAC標準案に記述されてい
る。
【0119】(3) 周波数/時間マッピング 周波数/時間マッピング部は周波数領域のオーディオ信
号を再び時間領域の信号に変換して使用者が再生可能に
する。周波数信号を時間領域の信号にマッピングする方
式はAAC標準案に定義されている。また、マッピングに
関連したウィンドウなど様々な関連した事項が共にAAC
標準案に記述されている。
【0120】一方、詳述した本発明の実施の形態は、コ
ンピュータで実行可能なプログラムで作成することが可
能である。そして、コンピュータで使用される媒体に書
込まれたプログラムを動作させる汎用デジタルコンピュ
ーターで実現することができる。媒体は磁気記録媒体
(例えば、ROM、フロッピーディスク、ハードディス
ク等)、光学的読み出し媒体(例えば、CD-ROM、DVD
等)及びキャリアウェーブ(例えば、インターネットを
通した伝送)のような記録媒体を含む。
【0121】例えば、記録媒体は、オーディオ信号を基
盤階層と少なくとも一つの上位階層よりなる階層的なデ
ータストリームに符号化するため、入力オーディオ信号
を信号処理して、所定の符号化帯域別に量子化する量子
化処理段階及び量子化処理されたデータをビットストリ
ームにパッキングするビットストリーム生成段階よりな
るオーディオデータ符号化方法を行うプログラムコード
手段において、ビットストリーム生成段階は、基盤階層
に相応する量子化されたデータを符号化する基盤階層符
号化段階を行うプログラムコード手段と、符号化された
階層の次の上位階層に属する量子化されたデータ及び符
号化された階層に属しながら階層の大きさ制限により符
号化されなく残っている量子化されたデータを符号化す
る階層符号化段階を行うプログラムコード手段と、階層
符号化段階を全ての階層に対して行ってビットストリー
ムに形成する順次符号化段階を行うコード手段とを含
む。
【0122】基盤階層符号化段階、階層符号化段階及び
順次符号化段階の符号化は符号化しようとする階層に相
応する付加情報及び量子化されたデータを所定数のビッ
トで表現して重要度の最も高いビットよりなる最上位ビ
ットシーケンスから重要度の低いビットよりなるビット
シーケンス順に所定の確率モデルを使用して算術符号化
するが、付加情報はスケールファクター及び算術符号化
に使用される確率モデル情報を含む。
【0123】そして、本発明を実現するための機能的な
プログラム、コード及びコードセグメントは、本発明が
属する技術分野のプログラマーにより容易に推論されう
る。
【0124】
【発明の効果】本発明によれば、MPEG-2AAC標準案のよ
うな従来のオーディオアルゴリズムのような構造を使用
しながら無損失符号化する部分のみを別に使用してスケ
ーラビリティを提供する。従来のオーディオアルゴリズ
ムのような構造を使用することにより本発明を容易に実
現することができる。
【0125】本発明によれば、ビット率の調節が可能な
ビットストリームなので、一つのビットストリーム内に
多数個のビット率を有するビットストリームを含んでい
る。本発明によれば、他のスケーラブルオーディオコデ
ックとは異なって高ビット率で良い音質を提供する。AA
C標準案と結合されると最上位階層のビット率ではAACと
ほぼ同じ音質を示す。
【0126】本発明によれば、各階層において、前の階
層で量子化された信号と元の信号の差を再び処理して符
号化せず、量子化されたデータをビット単位に分割し、
分割されたビットの重要度に応じて符号化するので、符
号化器の複雑度が低減される。
【0127】本発明によれば、一つのビットストリーム
内に多数個のビットストリームを含んでいるため、多数
階層のビットストリームを簡単に生成でき、変号化器(t
ranscoder)の複雑度が低い。
【0128】本発明によれば、ビット率が低まると帯域
が制限されるために主に符号化/復号化において複雑性
の大分を占めるフィルターの複雑性が相当低減されるの
で、ビット率に比例して符号化器/復号化器の実際の複
雑性も減少することになる。
【0129】本発明によれば、使用者の復号化器の性
能、伝送線路の帯域幅/混雑度または使用者の要求に応
じてビット率や複雑性の調節が可能である。
【0130】本発明によれば、多様な使用者の要求に相
応するために,ビットストリームの構成を柔軟にしなが
らも高いビット率における性能は、従来の圧縮のみを考
慮した場合の符号化器のような性能を提供する。即ち、
使用者の要求に応じて多数の階層のビット率に対した情
報を重複なしに一つのビットストリームに結合させるこ
とにより、特に高いビット率で良い音質のビットストリ
ームを提供することができる。また、送信端末と受信端
末との間に変換器は不要であり、伝送線路の状態や使用
者のいかなる要求も満たせるという長所がある。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る符号化器の構造を示
すブロック図である。
【図2】本発明の実施の形態に係るビットストリームの
構造を示す図面である。
【図3】本発明の実施の形態に係る復号化器の構造を示
すブロック図である。
【図4】長いブロック(ウィンドウ大きさ=2048 )にお
ける周波数成分配列を示す図である。
【図5】短いブロック(ウィンドウ大きさ=256)におけ
る周波数成分配列を示す図である。
【図6】スケーラブルコデックの構造の概念を簡単に示
すブロック図である。
【符号の簡単な説明】
200…時間/周波数マッピング部 210…音響心理部 220…量子化部 230…量子化処理部 240…ビットパッキング部 400…ビットストリーム分析部 410…逆量子化部 420…周波数/時間マッピング部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭60−96041(JP,A) 特開 昭63−285032(JP,A) 特開 平8−186815(JP,A) 特開 平9−182074(JP,A) (58)調査した分野(Int.Cl.7,DB名) H03M 7/30

Claims (33)

    (57)【特許請求の範囲】
  1. 【請求項1】 オーディオ信号を基盤階層と少なくとも
    一つの上位階層よりなる階層的なデータストリームに符
    号化するオーディオ符号化方法であって、 入力オーディオ信号を信号処理して所定の符号化帯域別
    に量子化する量子化処理段階と、 前記量子化処理段階において量子化処理されたデータを
    ビットストリームでパッキングするビットストリーム生
    成段階と、 を備え、 前記ビットストリーム生成段階は、 基盤階層に対応する量子化されたデータを符号化する基
    盤階層符号化段階と、 前記基盤階層符号化段階において符号化された階層の次
    の上位階層に属する量子化されたデータ及び前記符号化
    された階層に属しながら階層の大きさの制限により符号
    化されずに残っている量子化されたデータを符号化する
    階層符号化段階と、 前記階層符号化段階を全ての階層に対して行ってビット
    ストリームに形成する順次符号化段階とを有し、 前記基盤階層符号化段階と、前記階層符号化段階と、前
    記順次符号化段階での符号化は、符号化しようとする階
    層に対応する付加情報及び量子化されたデータを所定数
    のビットで表し、 重要度の最も高いビットよりなる最上位ビットシーケン
    スから重要度の低いビットよりなるビットシーケンス順
    に、所定の確率モデルを使用して算術符号化し、前記付
    加情報はスケールファクター及び算術符号化に使用され
    る確率モデル情報を含むことを特徴とするビット率の調
    節可能なオーディオ符号化方法。
  2. 【請求項2】 前記スケールファクターの符号化は、ス
    ケールファクター値のうち最大値を求める段階と、各ス
    ケールファクターと前記最大値に対する差を求めて算術
    符号化する段階よりなることを特徴とする請求項1に記
    載のビット率の調節可能なオーディオ符号化方法。
  3. 【請求項3】 前記差に対する算術符号化は、 【表1】 【表2】 【表3】 【表4】 表に示される算術モデル1乃至算術モデル4を用いて算
    術符号化することを特徴とする請求項2に記載のビット
    率の調節可能なオーディオ符号化方法。
  4. 【請求項4】 前記算術符号化に使用される確率モデル
    は、 【表5】 【表6】 【表7】 【表8】 【表9】 【表10】 【表11】 【表12】 【表13】 【表14】 【表15】 【表16】 【表17】 表に示されるモデルを用いることを特徴とする請求項1
    に記載のビット率の調節可能なオーディオ符号化方法。
  5. 【請求項5】 前記確率モデルに対する情報の符号化
    は、 前記確率モデル情報のうち最小値を求める段階と、 前記最小値と確率モデル情報との差を求めて算術符号化
    することを特徴とする請求項4に記載のビット率の調節
    可能なオーディオ符号化方法。
  6. 【請求項6】 前記算術符号化に使用される確率モデル
    は、 【表18】 【表19】 【表20】 【表21】 表に示されるモデルを使用することを特徴とする請求項
    5に記載のビット率の調節可能なオーディオ符号化方
    法。
  7. 【請求項7】 前記量子化されたデータが符号データ及
    び大きさデータよりなる時、前記符号化は、 同一ビット数で表現された前記量子化されたデータの大
    きさデータの重要度の最も高い最上位ビットよりなる最
    上位ビットシーケンスを所定の符号化方法により符号化
    する段階と、 前記符号化された最上位ビットシーケンスのうち零でな
    いデータに該当する符号データを符号化する段階と、 前記データの符号化されない大きさデータのうち重要度
    の最も高いビットシーケンスを所定の符号化方法により
    符号化する大きさ符号化段階と、 符号化されたデジットシーケンスのうち零でない大きさ
    データに該当する符号データのうち符号化されない符号
    データを符号化する符号符号化段階と、 前記大きさ符号化段階及び符号符号化段階を前記データ
    の各ビットに対して行う段階と、 を含むことを特徴とする請求項1に記載のビット率の調
    節可能なオーディオ符号化方法。
  8. 【請求項8】 前記符号データの算術符号化は、大きさ
    が2であり、累積頻度数値として8192、0 を有する確率
    モデルを使用することを特徴とする請求項7に記載のビ
    ット率の調節可能なオーディオ符号化方法。
  9. 【請求項9】 前記算術符号化は、前記大きさデータ及
    び符号データに対する各ビットシーケンスを構成してい
    るビットを所定数のビット単位で束ねて符号化すること
    を特徴とする請求項7に記載のビット率の調節可能なオ
    ーディオ符号化方法。
  10. 【請求項10】 前記ビット数は4であることを特徴と
    する請求項9に記載のビット率の調節可能なオーディオ
    符号化方法。
  11. 【請求項11】 前記ビット単位で束ねられた4次元ベ
    クトルを各サンプルの符号化状態に応じて2個のサブベ
    クトルに分離して算術符号化することを特徴とする請求
    項9または10に記載のビット率の調節可能なオーディ
    オ符号化方法。
  12. 【請求項12】 基盤階層を16kbpsとし、階層間間隔を
    8kbps とすることを特徴とする請求項1に記載のビット
    率の調節可能なオーディオ符号化方法。
  13. 【請求項13】 基盤階層を16kbpsとし、階層間間隔を
    1kbps とすることを特徴とする請求項1に記載のビット
    率の調節可能なオーディオ符号化方法。
  14. 【請求項14】 全ての帯域に用いられる共通情報を符
    号化し、各階層に必要な付加情報及び量子化された周波
    数をビット分割された情報で構成して階層的に符号化す
    ることを特徴とする請求項1に記載のビット率の調節可
    能なオーディオ符号化方法。
  15. 【請求項15】 前記量子化処理段階は、 時間領域の入力オーディオ信号を周波数領域の信号に変
    換する段階と、 前記時間周波数マッピングにより周波数成分に変換され
    た入力オーディオ信号を所定の帯域信号で束ね、前記各
    帯域におけるマスキング域値を計算する段階と、 各帯域の量子化ノイズがマスキング域値より小さくなる
    ように所定の符号化帯域別に量子化する段階よりなるこ
    とを特徴とする請求項1に記載のビット率の調節可能な
    オーディオ符号化方法。
  16. 【請求項16】 入力オーディオ信号を信号処理して所
    定の符号化帯域別に量子化する量子化処理部と、 ビット率の調節可能に基盤階層に対応する帯域制限を
    し、付加情報を符号化し、量子化された値に対する情報
    を最上位ビットからいくつかのビット単位に束ねて符号
    化する際、前記束ねたビットにおいて周波数から高
    周波数の順に符号化し、基盤階層に対する符号化が終
    わると、その次の階層に対する付加情報及びオーディオ
    データの量子化値を符号化して階層的構造を有するビッ
    トストリームを生成するビットパッキング部と、 を備えることを特徴とするビット率の調節可能なオーデ
    ィオ符号化装置。
  17. 【請求項17】 前記量子化処理部は、時間領域の入力
    オーディオ信号を周波数領域の信号に変換する時間/周
    波数マッピング部と、 入力信号を時間/周波数マッピングにより周波数成分に
    変換されたオーディオ信号を適当な帯域の信号で束ねて
    各信号の相互作用により発生されるマスキング現象を用
    いて各帯域におけるマスキング域値を計算する音響心理
    部と、 各帯域の量子化ノイズをマスキング域値と比較しながら
    量子化する量子化部と、 を備えることを特徴とする請求項16に記載のビット率
    の調節可能なオーディオ符号化装置。
  18. 【請求項18】 階層的なビット率を有するように符号
    化されたオーディオデータを復号化する方法において、 階層的構造を有するデータストリームから前記階層の生
    成順序に応じて少なくともスケールファクター及び各帯
    域に適用される算術符号化モデル情報を含む付加情報及
    び量子化されたデータを復号化するが、前記データスト
    リームを構成しているビットの重要度を分析して重要度
    の高いビットから低いビット順に前記量子化されたデー
    タに対応する算術符号化モデルに基づいて復号化する段
    階と、 前記復号化されたスケールファクター及び量子化された
    データを元の大きさの信号に復元する段階と、 前記逆量子化された周波数領域のオーディオ信号を時間
    領域の信号に変換する段階と、 を備えることを特徴とするビット率の調節可能なオーデ
    ィオ復号化方法。
  19. 【請求項19】 前記ビットストリームを4次元ベクト
    ル単位に復号化し、前記4 次元ベクトルより4つのサン
    プルのビット分割情報を復号化することを特徴とする請
    求項18に記載のビット率の調節可能なオーディオ復号
    化方法。
  20. 【請求項20】 2つのサブベクトルを算術復号化し、
    各サンプルの符号化状態に応じて復号化された2つのサ
    ブベクトルから4次元ベクトルを復元することを特徴と
    する請求項19に記載のビット率の調節可能なオーディ
    オ復号化方法。
  21. 【請求項21】 前記算術復号化に使われる確率モデル
    は、 【表22】 【表23】 【表24】 【表25】 【表26】 【表27】 【表28】 【表29】 【表30】 【表31】 【表32】 【表33】 【表34】 表に示されるモデルであることを特徴とする請求項20
    に記載のビット率の調節可能なオーディオ復号化方法。
  22. 【請求項22】 ビットストリームからスケールファク
    ターに対する最大値を復号化し、各スケールファクター
    の差信号を算術復号化した後、最大値より差信号を引い
    てスケールファクターを復号化することを特徴とする請
    求項18に記載のビット率の調節可能なオーディオ復号
    化方法。
  23. 【請求項23】 前記算術復号化に使われる確率モデル
    は、 【表35】 【表36】 【表37】 【表38】 表に示されるモデルであることを特徴とする請求項22
    に記載のビット率の調節可能なオーディオ復号化方法。
  24. 【請求項24】 ビットストリームから先に算術符号化
    モデル指数に対する最小値を復号化し、各階層の付加情
    報から各算術符号化モデル指数の差信号を復号化した
    後、最小値と差信号とを合せて算術符号化モデル指数を
    復号化することを特徴とする請求項18に記載のビット
    率の調節可能なオーディオ復号化方法。
  25. 【請求項25】 前記算術復号化に使われる確率モデル
    は、 【表39】 【表40】 【表41】 【表42】 表に示されるモデルであることを特徴とする請求項24
    に記載のビット率の調節可能なオーディオ復号化方法。
  26. 【請求項26】 階層的な構造を有するビットストリー
    ムからビットストリームの形成順序に応じて少なくとも
    スケールファクター、算術符号化モデルを含む付加情報
    及び量子化されたデータを復号化するビットストリーム
    分析部と、 前記復号化されたスケールファクター及び量子化された
    データを元の大きさの信号に復元する逆量子化部と、 前記逆量子化された信号を周波数領域のオーディオ信号
    から時間領域の信号に変換する周波数/時間マッピング
    部と、 を備えることを特徴とするビット率の調節可能なオーデ
    ィオ復号化器。
  27. 【請求項27】 オーディオ信号を基盤階層及び少なく
    とも一つの上位階層よりなる階層的なデータストリーム
    に符号化するオーディオ符号化方法であって、 入力オーディオ信号を信号処理して所定の符号化帯域別
    に量子化する量子化処理段階と、 前記量子化処理されたデータをビットストリームにパッ
    キングするビットストリーム生成段階とを備え、 前記ビットストリームの生成段階は、 基盤階層に対応する量子化されたデータを符号化する基
    盤階層符号化段階と、前記符号化された階層の次の上位
    階層に属する量子化されたデータ及び前記符号化された
    階層に属しながら階層の大きさ制限により符号化されな
    く残っている量子化されたデータを符号化する階層符号
    化段階と、 前記階層符号化段階を全ての階層に対して行ってビット
    ストリームに形成する順次符号化段階とを有し、 前記基盤階層符号化段階、階層符号化段階及び順次符号
    化段階の符号化は、 符号化しようとする階層に対応する付加情報及び量子化
    されたデータを所定数のビットで表現して重要度の最も
    高いビットよりなる最上位ビットシーケンスから重要度
    の低いビットよりなるビットシーケンス順に所定の確率
    モデルを使用して算術符号化し、前記付加情報はスケー
    ルファクター及び算術符号化に使用される確率モデル情
    報を含むビット率の調節可能なオーディオ符号化方法を
    実行させるプログラムを記録していることを特徴とする
    コンピュータで読出可能な記録媒体。
  28. 【請求項28】 前記スケールファクターの符号化は、
    スケールファクター値のうち最大値を求める段階と、各
    スケールファクター及び前記最大値に対する差を求めて
    算術符号化する段階よりなることを特徴とする請求項2
    7に記載のコンピュータで読出可能な記録媒体。
  29. 【請求項29】 前記確率モデルに対する情報の符号化
    は、前記確率モデル情報のうち最小値を求め、前記最小
    値及び確率モデル情報の差を求めて、 【表43】 【表44】 【表45】 【表46】 表に示される確率モデルを使用して算術符号化すること
    を特徴とする請求項28に記載のコンピュータで読出可
    能な記録媒体。
  30. 【請求項30】 階層的なビット率を有するように符号
    化されたオーディオデータを復号化する方法において、 階層的な構造を有するデータストリームから前記階層の
    生成順序に応じて少なくともスケールファクター及び各
    帯域に適用される算術符号化モデル情報を含む付加情報
    及び量子化されたデータを復号化するが、前記データス
    トリームを構成しているビットの重要度を分析して重要
    度の高いビットから低いビット順に前記量子化されたデ
    ータに対応する算術符号化モデルに基づいて復号化する
    復号化段階と、 前記復号化されたスケールファクター及び量子化された
    データを元の大きさの信号に復元する段階と、 前記逆量子化された周波数領域のオーディオ信号を時間
    領域の信号に変換する段階とを含むビット率の調節可能
    なオーディオデータ復号化方法を実行させるためのプロ
    グラムを記録したことを特徴とするコンピュータで読出
    可能な記録媒体。
  31. 【請求項31】 前記ビットストリームを4 次元ベクト
    ル単位に復号化し、前記4 次元ベクトルから4つのサン
    プルのビット分割情報を復号化することを特徴とする請
    求項30に記載のコンピュータで読出可能な記録媒体。
  32. 【請求項32】 ビットストリームからスケールファク
    ターに対する最大値を復号化し、各スケールファクター
    の差信号を算術復号化した後、最大値から差信号を引い
    てスケールファクターを復号化することを特徴とする請
    求項30に記載のコンピュータで読出可能な記録媒体。
  33. 【請求項33】 ビットストリームから先に算術符号化
    モデル指数に対する最小値を復号化し、各階層の付加情
    報から各算術符号化モデル指数の差信号を復号化した
    後、最小値と差信号とを合せて算術符号化モデル指数を
    復号化することを特徴とする請求項30に記載のコンピ
    ュータで読出可能な記録媒体。
JP27582998A 1997-11-20 1998-09-29 ビット率の調節可能なオーディオ符号化/復号化方法及びその装置及びその方法を記録した記録媒体 Expired - Fee Related JP3412081B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 99108323 CN1123011C (zh) 1998-08-10 1999-06-07 电磁波屏蔽透明体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR97-61606 1997-11-20
KR1019970061606A KR100335609B1 (ko) 1997-11-20 1997-11-20 비트율조절이가능한오디오부호화/복호화방법및장치

Publications (2)

Publication Number Publication Date
JPH11186911A JPH11186911A (ja) 1999-07-09
JP3412081B2 true JP3412081B2 (ja) 2003-06-03

Family

ID=19525211

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27582998A Expired - Fee Related JP3412081B2 (ja) 1997-11-20 1998-09-29 ビット率の調節可能なオーディオ符号化/復号化方法及びその装置及びその方法を記録した記録媒体

Country Status (12)

Country Link
US (1) US6349284B1 (ja)
EP (1) EP0918401B1 (ja)
JP (1) JP3412081B2 (ja)
KR (1) KR100335609B1 (ja)
CN (1) CN1131598C (ja)
BR (1) BR9804457B1 (ja)
DE (1) DE69833834T2 (ja)
EG (1) EG21510A (ja)
ID (1) ID21288A (ja)
IL (1) IL124836A (ja)
MY (1) MY122265A (ja)
RU (1) RU2185024C2 (ja)

Families Citing this family (110)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
JP3784993B2 (ja) * 1998-06-26 2006-06-14 株式会社リコー 音響信号の符号化・量子化方法
FR2791167B1 (fr) * 1999-03-17 2003-01-10 Matra Nortel Communications Procedes de codage, de decodage et de transcodage audio
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
US6798838B1 (en) * 2000-03-02 2004-09-28 Koninklijke Philips Electronics N.V. System and method for improving video transmission over a wireless network
US6968564B1 (en) * 2000-04-06 2005-11-22 Nielsen Media Research, Inc. Multi-band spectral audio encoding
US6879652B1 (en) * 2000-07-14 2005-04-12 Nielsen Media Research, Inc. Method for encoding an input signal
EP1199711A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
JP2002196792A (ja) * 2000-12-25 2002-07-12 Matsushita Electric Ind Co Ltd 音声符号化方式、音声符号化方法およびそれを用いる音声符号化装置、記録媒体、ならびに音楽配信システム
DE10102155C2 (de) * 2001-01-18 2003-01-09 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms
DE10102154C2 (de) * 2001-01-18 2003-02-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkassenfunktion
DE10102159C2 (de) * 2001-01-18 2002-12-12 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen bzw. Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkasse, Codierer und skalierbarer Codierer
US20020133246A1 (en) * 2001-03-02 2002-09-19 Hong-Kee Kim Method of editing audio data and recording medium thereof and digital audio player
JP3469567B2 (ja) * 2001-09-03 2003-11-25 三菱電機株式会社 音響符号化装置、音響復号化装置、音響符号化方法及び音響復号化方法
ES2237706T3 (es) * 2001-11-29 2005-08-01 Coding Technologies Ab Reconstruccion de componentes de alta frecuencia.
AU2003213149A1 (en) * 2002-02-21 2003-09-09 The Regents Of The University Of California Scalable compression of audio and other signals
KR100433984B1 (ko) * 2002-03-05 2004-06-04 한국전자통신연구원 디지털 오디오 부호화/복호화 장치 및 방법
KR100908114B1 (ko) * 2002-03-09 2009-07-16 삼성전자주식회사 스케일러블 무손실 오디오 부호화/복호화 장치 및 그 방법
DE60214599T2 (de) * 2002-03-12 2007-09-13 Nokia Corp. Skalierbare audiokodierung
US20030215013A1 (en) * 2002-04-10 2003-11-20 Budnikov Dmitry N. Audio encoder with adaptive short window grouping
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
KR100908116B1 (ko) * 2002-12-12 2009-07-16 삼성전자주식회사 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
KR100528325B1 (ko) * 2002-12-18 2005-11-15 삼성전자주식회사 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치
TWI220753B (en) * 2003-01-20 2004-09-01 Mediatek Inc Method for determining quantization parameters
KR100917464B1 (ko) * 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
US7620545B2 (en) * 2003-07-08 2009-11-17 Industrial Technology Research Institute Scale factor based bit shifting in fine granularity scalability audio coding
AU2003302486A1 (en) 2003-09-15 2005-04-06 Zakrytoe Aktsionernoe Obschestvo Intel Method and apparatus for encoding audio
US7426462B2 (en) * 2003-09-29 2008-09-16 Sony Corporation Fast codebook selection method in audio encoding
US7325023B2 (en) * 2003-09-29 2008-01-29 Sony Corporation Method of making a window type decision based on MDCT data in audio encoding
US7283968B2 (en) * 2003-09-29 2007-10-16 Sony Corporation Method for grouping short windows in audio encoding
US7349842B2 (en) * 2003-09-29 2008-03-25 Sony Corporation Rate-distortion control scheme in audio encoding
KR100571824B1 (ko) * 2003-11-26 2006-04-17 삼성전자주식회사 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
WO2005057550A1 (ja) * 2003-12-15 2005-06-23 Matsushita Electric Industrial Co., Ltd. 音声圧縮伸張装置
KR100537517B1 (ko) * 2004-01-13 2005-12-19 삼성전자주식회사 오디오 데이타 변환 방법 및 장치
DE102004007184B3 (de) 2004-02-13 2005-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Quantisieren eines Informationssignals
DE102004007191B3 (de) 2004-02-13 2005-09-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
KR100629997B1 (ko) * 2004-02-26 2006-09-27 엘지전자 주식회사 오디오 신호의 인코딩 방법
KR20050087956A (ko) * 2004-02-27 2005-09-01 삼성전자주식회사 무손실 오디오 부호화/복호화 방법 및 장치
KR100561869B1 (ko) * 2004-03-10 2006-03-17 삼성전자주식회사 무손실 오디오 부호화/복호화 방법 및 장치
KR100668299B1 (ko) * 2004-05-12 2007-01-12 삼성전자주식회사 구간별 선형양자화를 이용한 디지털 신호 부호화/복호화방법 및 장치
JP4771674B2 (ja) * 2004-09-02 2011-09-14 パナソニック株式会社 音声符号化装置、音声復号化装置及びこれらの方法
DE102004043521A1 (de) * 2004-09-08 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
PL1810281T3 (pl) 2004-11-02 2020-07-27 Koninklijke Philips N.V. Kodowanie i dekodowanie sygnałów audio z wykorzystaniem banków filtrów o wartościach zespolonych
DE102004059979B4 (de) 2004-12-13 2007-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Berechnung einer Signalenergie eines Informationssignals
KR20070092240A (ko) * 2004-12-27 2007-09-12 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
WO2006075269A1 (en) * 2005-01-11 2006-07-20 Koninklijke Philips Electronics N.V. Scalable encoding/decoding of audio signals
KR101001746B1 (ko) 2005-01-12 2010-12-15 삼성전자주식회사 스케일러블 오디오 데이터 산술 복호화 방법 및 장치
KR100829558B1 (ko) * 2005-01-12 2008-05-14 삼성전자주식회사 스케일러블 오디오 데이터 산술 복호화 방법 및 장치와스케일러블 오디오 비트스트림 절단 방법
WO2006078125A1 (en) * 2005-01-21 2006-07-27 Samsung Electronics Co., Ltd. Video coding method and apparatus for efficiently predicting unsynchronized frame
KR100703746B1 (ko) * 2005-01-21 2007-04-05 삼성전자주식회사 비동기 프레임을 효율적으로 예측하는 비디오 코딩 방법 및장치
KR100707186B1 (ko) * 2005-03-24 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
KR100818268B1 (ko) * 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
US7974341B2 (en) * 2005-05-03 2011-07-05 Qualcomm, Incorporated Rate control for multi-layer video design
WO2006128144A2 (en) * 2005-05-26 2006-11-30 Groove Mobile, Inc. Systems and methods for high resolution signal analysis
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
US8270439B2 (en) * 2005-07-08 2012-09-18 Activevideo Networks, Inc. Video game system using pre-encoded digital audio mixing
US8074248B2 (en) 2005-07-26 2011-12-06 Activevideo Networks, Inc. System and method for providing video content associated with a source image to a television in a communication network
US7199735B1 (en) 2005-08-25 2007-04-03 Mobilygen Corporation Method and apparatus for entropy coding
KR100738077B1 (ko) * 2005-09-28 2007-07-12 삼성전자주식회사 계층적 오디오 부호화 및 복호화 장치와 방법
KR20070037945A (ko) * 2005-10-04 2007-04-09 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
KR20070038699A (ko) * 2005-10-06 2007-04-11 삼성전자주식회사 스케일러블 오디오 데이터 산술복호화 방법 및 장치
EP2555187B1 (en) * 2005-10-12 2016-12-07 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding audio data and extension data
KR100878766B1 (ko) * 2006-01-11 2009-01-14 삼성전자주식회사 오디오 데이터 부호화 및 복호화 방법과 장치
KR100793287B1 (ko) 2006-01-26 2008-01-10 주식회사 코아로직 비트율 조절이 가능한 오디오 복호화 장치 및 그 방법
CN101395661B (zh) * 2006-03-07 2013-02-06 艾利森电话股份有限公司 音频编码和解码的方法和设备
WO2007105586A1 (ja) * 2006-03-10 2007-09-20 Matsushita Electric Industrial Co., Ltd. 符号化装置および符号化方法
FR2898443A1 (fr) * 2006-03-13 2007-09-14 France Telecom Procede de codage d'un signal audio source, dispositif de codage, procede et dispositif de decodage, signal, produits programme d'ordinateur correspondants
CA2646961C (en) 2006-03-28 2013-09-03 Sascha Disch Enhanced method for signal shaping in multi-channel audio reconstruction
ATE527833T1 (de) 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
EP2105019A2 (en) * 2006-09-29 2009-09-30 Avinity Systems B.V. Method for streaming parallel user sessions, system and computer software
EP2084901B1 (en) 2006-10-12 2015-12-09 LG Electronics Inc. Apparatus for processing a mix signal and method thereof
WO2008088772A2 (en) * 2007-01-12 2008-07-24 Ictv, Inc. Mpeg objects and systems and methods for using mpeg objects
US9826197B2 (en) 2007-01-12 2017-11-21 Activevideo Networks, Inc. Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device
KR101049143B1 (ko) 2007-02-14 2011-07-15 엘지전자 주식회사 오브젝트 기반의 오디오 신호의 부호화/복호화 장치 및 방법
KR101149449B1 (ko) * 2007-03-20 2012-05-25 삼성전자주식회사 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치
EP2153608B1 (en) * 2007-06-01 2013-09-18 BlackBerry Limited Determination of compression state information for use in interactive compression
KR101531910B1 (ko) * 2007-07-02 2015-06-29 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
WO2009010674A1 (fr) * 2007-07-06 2009-01-22 France Telecom Codage hierarchique de signaux audionumeriques
CN100583649C (zh) * 2007-07-23 2010-01-20 华为技术有限公司 矢量编/解码方法、装置及流媒体播放器
CN101609679B (zh) * 2008-06-20 2012-10-17 华为技术有限公司 嵌入式编解码方法和装置
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
CN101771417B (zh) * 2008-12-30 2012-04-18 华为技术有限公司 信号编码、解码方法及装置、系统
EP2382625B1 (en) * 2009-01-28 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program
KR20100136890A (ko) * 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
US8194862B2 (en) * 2009-07-31 2012-06-05 Activevideo Networks, Inc. Video game system with mixing of independent pre-encoded digital audio bitstreams
EP2315358A1 (en) * 2009-10-09 2011-04-27 Thomson Licensing Method and device for arithmetic encoding or arithmetic decoding
KR101411780B1 (ko) 2009-10-20 2014-06-24 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 이전의 디코딩된 스펙트럼 값들의 그룹의 검출을 이용하는 오디오 인코더, 오디오 디코더, 오디오 정보를 인코딩하기 위한 방법, 오디오 정보를 디코딩하기 위한 방법 및 컴퓨터 프로그램
JP5773502B2 (ja) 2010-01-12 2015-09-02 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. オーディオ符号化器、オーディオ復号器、オーディオ情報を符号化するための方法、オーディオ情報を復号するための方法、および上位状態値と間隔境界との両方を示すハッシュテーブルを用いたコンピュータプログラム
CN102222505B (zh) * 2010-04-13 2012-12-19 中兴通讯股份有限公司 可分层音频编解码方法系统及瞬态信号可分层编解码方法
US8392201B2 (en) * 2010-07-30 2013-03-05 Deutsche Telekom Ag Method and system for distributed audio transcoding in peer-to-peer systems
WO2012051528A2 (en) 2010-10-14 2012-04-19 Activevideo Networks, Inc. Streaming digital video between video devices using a cable television system
EP2695388B1 (en) 2011-04-07 2017-06-07 ActiveVideo Networks, Inc. Reduction of latency in video distribution networks using adaptive bit rates
US8781023B2 (en) * 2011-11-01 2014-07-15 At&T Intellectual Property I, L.P. Method and apparatus for improving transmission of data on a bandwidth expanded channel
US8774308B2 (en) 2011-11-01 2014-07-08 At&T Intellectual Property I, L.P. Method and apparatus for improving transmission of data on a bandwidth mismatched channel
US10409445B2 (en) 2012-01-09 2019-09-10 Activevideo Networks, Inc. Rendering of an interactive lean-backward user interface on a television
CN110706715B (zh) * 2012-03-29 2022-05-24 华为技术有限公司 信号编码和解码的方法和设备
US9800945B2 (en) 2012-04-03 2017-10-24 Activevideo Networks, Inc. Class-based intelligent multiplexing over unmanaged networks
US9123084B2 (en) 2012-04-12 2015-09-01 Activevideo Networks, Inc. Graphical application integration with MPEG objects
CN104412512B (zh) * 2012-06-21 2017-05-24 三菱电机株式会社 编码装置、解码装置、编码方法以及解码方法
US10275128B2 (en) 2013-03-15 2019-04-30 Activevideo Networks, Inc. Multiple-mode system and method for providing user selectable video content
US9219922B2 (en) 2013-06-06 2015-12-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9294785B2 (en) 2013-06-06 2016-03-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9326047B2 (en) 2013-06-06 2016-04-26 Activevideo Networks, Inc. Overlay rendering of user interface onto source video
JP6321181B2 (ja) 2013-09-12 2018-05-09 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ・コーデックのシステム側面
CN111179946B (zh) 2013-09-13 2023-10-13 三星电子株式会社 无损编码方法和无损解码方法
US10468033B2 (en) 2013-09-13 2019-11-05 Samsung Electronics Co., Ltd. Energy lossless coding method and apparatus, signal coding method and apparatus, energy lossless decoding method and apparatus, and signal decoding method and apparatus
EP3040987B1 (en) 2013-12-02 2019-05-29 Huawei Technologies Co., Ltd. Encoding method and apparatus
US9788029B2 (en) 2014-04-25 2017-10-10 Activevideo Networks, Inc. Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks
WO2019091576A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS542050A (en) 1977-06-07 1979-01-09 Nec Corp Block coding and decoding system
DE3688980T2 (de) 1986-10-30 1994-04-21 Ibm Verfahren zur Multigeschwindigkeitskodierung von Signalen und Einrichtung zur Durchführung dieses Verfahrens.
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
KR100269213B1 (ko) * 1993-10-30 2000-10-16 윤종용 오디오신호의부호화방법
JP3301886B2 (ja) * 1995-05-11 2002-07-15 株式会社日立製作所 可変レート音声符号化方法及び装置
US5924064A (en) 1996-10-07 1999-07-13 Picturetel Corporation Variable length coding using a plurality of region bit allocation patterns
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치

Also Published As

Publication number Publication date
EG21510A (en) 2001-11-28
DE69833834D1 (de) 2006-05-11
EP0918401B1 (en) 2006-03-15
BR9804457B1 (pt) 2012-02-22
EP0918401A2 (en) 1999-05-26
EP0918401A3 (en) 2000-09-13
KR100335609B1 (ko) 2002-10-04
BR9804457A (pt) 1999-11-03
ID21288A (id) 1999-05-20
US6349284B1 (en) 2002-02-19
IL124836A0 (en) 1999-01-26
CN1218339A (zh) 1999-06-02
KR19990041073A (ko) 1999-06-15
JPH11186911A (ja) 1999-07-09
RU2185024C2 (ru) 2002-07-10
MY122265A (en) 2006-04-29
IL124836A (en) 2002-02-10
DE69833834T2 (de) 2006-11-23
CN1131598C (zh) 2003-12-17

Similar Documents

Publication Publication Date Title
JP3412081B2 (ja) ビット率の調節可能なオーディオ符号化/復号化方法及びその装置及びその方法を記録した記録媒体
JP3412082B2 (ja) ビット率の調節可能なステレオオーディオ符号化/復号化方法及び装置
JP3354864B2 (ja) ビット率の調節可能なオーディオ符号化/復号化方法及び装置
US6094636A (en) Scalable audio coding/decoding method and apparatus
JP3352406B2 (ja) オーディオ信号の符号化及び復号方法及び装置
US20020049586A1 (en) Audio encoder, audio decoder, and broadcasting system
KR100908117B1 (ko) 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
JP3964860B2 (ja) ステレオオーディオの符号化方法、ステレオオーディオ符号化装置、ステレオオーディオの復号化方法、ステレオオーディオ復号化装置及びコンピュータで読み取り可能な記録媒体
JP3353868B2 (ja) 音響信号変換符号化方法および復号化方法
RU2214047C2 (ru) Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов
KR100528327B1 (ko) 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
US6549147B1 (en) Methods, apparatuses and recorded medium for reversible encoding and decoding
KR100908116B1 (ko) 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080328

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090328

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100328

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120328

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130328

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130328

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140328

Year of fee payment: 11

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees