JP3354864B2 - ビット率の調節可能なオーディオ符号化/復号化方法及び装置 - Google Patents

ビット率の調節可能なオーディオ符号化/復号化方法及び装置

Info

Publication number
JP3354864B2
JP3354864B2 JP6445798A JP6445798A JP3354864B2 JP 3354864 B2 JP3354864 B2 JP 3354864B2 JP 6445798 A JP6445798 A JP 6445798A JP 6445798 A JP6445798 A JP 6445798A JP 3354864 B2 JP3354864 B2 JP 3354864B2
Authority
JP
Japan
Prior art keywords
encoding
data
bit
quantization
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP6445798A
Other languages
English (en)
Other versions
JPH10285043A (ja
Inventor
成煕 朴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JPH10285043A publication Critical patent/JPH10285043A/ja
Application granted granted Critical
Publication of JP3354864B2 publication Critical patent/JP3354864B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M1/00Analogue/digital conversion; Digital/analogue conversion
    • H03M1/12Analogue/digital converters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はオーディオ符号化/
復号化に係り、特に1つのビットストリーム内に基本階
層(Base Layer)に基づき多数の上位階層(Enhancement L
ayer)のデータを共に表現する階層構造のビットストリ
ームを符号化/復号化する、ビット率の調節可能なオー
ディオ符号化/復号化方法及び装置に関する。
【0002】
【従来の技術】本発明は既存の符号化方式のように決ま
ったビット率から最上の性能を示す符号化効率の側面を
強調する方式でないマルチメディア時代に適する符号化
方式であって、スケール調節の可能な(scalable)符号化
/復号化技法に関する。その符号化装置は基本階層のビ
ット率以上のビット率のうち使用者が指定したビット率
でビットストリームを製作し、その復号化装置は前記符
号化されたビット率内のビット率中の1つで復元しう
る。情報を含んでいる波形は元の振幅において連続的で
あり、時間上においても連続的なアナログ(Analog)信号
である。従って、波形を離散信号で表現するためにA/D
(Analog-to-デジタル)変換が必要である。A/D変換のた
めに2つの過程を必要とする。1つは時間上の連続信号
を離散信号に変える標本化(Sampling)過程であり、他の
1つは可能な振幅数を有限な値に制限するための振幅量
子化過程である。即ち、振幅の量子化は時間nで入力振
幅x(n)を可能な振幅の有限な集合中の1つの要素のy(n)
に変換する過程である。オーディオ信号の貯蔵/復元方
式も最近のデジタル信号処理技術の発達によりアナログ
信号を標本化と量子化過程を経てデジタル信号のPCM(Pu
lse Code Modulation)データに変換してCD(Compact Dis
c)とDAT(Digatal Audio Tape)のような記録/貯蔵媒体に
信号を貯蔵した後、使用者の必要時に貯蔵された信号を
再び再生して聞ける技術が開発されて一般人に普遍化さ
れて使われている。このようなデジタル方式による貯蔵
/復元方式は既存のアナログ方式に比べて音質の向上と
貯蔵期間にともなう劣化を克服したが、デジタルデータ
が多量の場合貯蔵及び伝送に問題があった。
【0003】データ量を減らすためにデジタル音声信号
を圧縮するためのDPCM(Differential Pulse Code Modul
aton)やADPCM(Adaptive Differential Pulse Code Modu
lation)等の方法が開発されたが信号の種類に応じて効
率性に大きな差を示す短所を示した。最近、ISO (Inter
national Standard Organization)により標準化作業が
成されたMPEG/audio(Moving Pictures Expert Group)技
法やドルビ(Dolby)により開発されたAC-2/AC-3技法で
は人間の聴覚心理モデル(Psychoacoustic Model)を用い
てデータの量を減らす方法を使用した。このような方法
は信号の特性に関係なく効率よくデータの量を減らすこ
とに大きく寄与した。MPEG-1/audio、MPEG-2/audioやAC
-2/AC-3のような既存のオーディオ信号圧縮技法では時
間領域の信号を一定の大きさのブロックに結び合せて周
波数領域の信号に変換する。そして、この変換された信
号を人間の聴覚心理モデル(Psychoacoustic Model)を用
いてスカラー量子化する。このような量子化技法は単純
であるが、入力サンプルが統計的に独立的であっても最
適ではない。勿論、入力サンプルが統計的に従属的であ
ればさらに不充分である。このような問題点のため、エ
ントロピ(Entropy)符号化のような無損失符号化や何れ
の種類の適応量子化を含んで符号化を行う。従って、単
純なPCMデータのみを保存した方式よりは相当複雑な過
程を経て、ビットストリームは量子化されたPCMデータ
だけでなく信号を圧縮するための付加的な情報で構成さ
れている。MPEG/audio標準やAC-2/AC-3方式は既存のデ
ジタル符号化に比べて1/6乃至1/8に減った64Kbps-384Kb
psのビット率であってコンパクトディスク(Compact Dis
c)の音質とほぼ同一な音質を提供する。このため、MPEG
/audio標準はDAB(DigitalAudio Broadcasting)、インタ
ーネットホン(internetphone)、AOD(Audio on Demand)
及びマルチメディアシステムのようなオーディオ信号の
貯蔵と伝送に重要な役割をするはずである。
【0004】このような既存の技法は符号化器から固定
されたビット率が与えられ、与えられたビット率に最適
の状態を探して量子化と符号化過程を経るために固定さ
れたビット率を使用する場合には好適な方案を提示す
る。ところが、マルチメディア時代の渡来と共に既存の
低ビット率符号化のみならず様々の機能性を有している
符号化器/復号化器に対した要求が多くなっている。そ
の要求の中の1つがビット率の大きさの調節の可能なオ
ーディオ符号化/復号化器である。ビット率の調節可能
なオーディオ符号化器は高ビット率で符号化されたビッ
トストリームを低ビット率のビットストリームで作れ、
その中の一部のビットストリームのみを持って復元可能
にする。こうしてネットワークで過負荷がかかったり復
号化器への性能のよくない場合、または使用者の要求に
よりビット率が低くなる場合にはビット率の低下分だけ
性能の劣化を示すがビットストリームの一部のみでもあ
る程度の性能に信号を復元しうる。既存のオーディオ符
号化技法等は符号化器に固定されたビット率が与えら
れ、前記与えられたビット率に対した最適の状態を探し
て量子化と符号化過程を経て与えられたビット率に合せ
てビットストリームを作り出す。従って、1個のビット
ストリーム内に1個のビット率に対した情報のみを含ん
でいる。即ち、ビットストリームヘッダー(header)にビ
ット率に対する情報を含めて固定的なビット率を使用す
る。このような方法の長所は固定された特定ビット率の
みを使用する場合に前記特定ビット率から示しうる最適
の方案が使用できるということである。例えば、1つの
ビットストリームが96Kbpsのビット率に符号化器で作ら
れた場合、前記96Kbpsのビット率を有する符号化器に相
応する復号化器で復元すると最上の音を復元しうる。
【0005】このような方式のビットストリーム構成は
他のビット率を考慮しなくビットストリームが構成され
ているためにビットストリームの順序に対した考慮より
は与えられたビット率に適合する大きさにビットストリ
ームが構成されている。実際に、このように構成された
ビットストリームがネットワークを通して伝送される場
合、このビットストリームはいくつかのスロット(slot)
に割って伝送されることになる。伝送線路に過負荷がか
かったり伝送線路の帯域幅が狭くて受信端に送信端から
送られたスロット全体が到着せずに一部のみ到着される
場合、正しいデータを再生出来ない。また、ビットスト
リームの順序が重要度に応じて構成されていないために
全体ビットストリームでない一部のビットストリームの
みを有して復元する場合、相当耳障りな音を再生するこ
とになる。1つの放送局でビットストリームを製作して
多数の使用者に伝送する場合を考慮してみる。各ビット
ストリームを受信する使用者毎に相異なるビット率を要
求したり、相異なる性能の復号化器を有している場合、
固定ビット率のみを支援するビットストリームのみを放
送局で送信するとしたら、このような要求事項を満たす
ために各使用者ごとにそれぞれのビットストリームを伝
送すべきである。よって、ビットストリームの伝送及び
製作に費用が相当かかり、かつ放送局では各使用者の要
求に合うビット率のビットストリームを製作したり、貯
蔵すべきなのでここにも費用が相当かかる。
【0006】しかし、オーディオのビットストリームが
多様な階層のビット率で構成されていたら、与えられた
環境や使用者の要求事項に対して適切に対処しうる。こ
のような構造を有するための最も単純な方法は図1のよ
うに低い階層に対する符号化を行なった後再び復号化し
て得た信号と元の信号との差を再び次の階層の符号化器
の入力として使用して処理する方式である。即ち、最初
に基本階層に対して符号化してビットストリームを生成
した後、元の信号と符号化された信号との差信号で再び
符号化して次の階層のビットストリームを生成する過程
を繰返す。従って、この方法は符号化器の複雑度が高ま
り、かつ復号化器においても同一な過程を逆に反復して
こそ復元された信号が得られるために復号化器の複雑性
も増加することになる。よって、階層の数が増加するほ
ど符号化器と復号化器との複雑性も比例して増加する。
【0007】
【発明が解決しようとする課題】本発明が解決しようと
する技術的課題は、様々な階層のビット率に対したデー
タを1つのビットストリーム内で表現することにより伝
送線路の状態、復号化器の性能または使用者の要求事項
に応じてビットストリームの大きさが流動的に変り、復
号化器の複雑性も変わりうる、ビット率の調節可能なオ
ーディオ符号化器/復号化器及びその方法を提供するこ
とにある。
【0008】
【課題を解決するための手段】前記の技術的課題を満た
すための本発明によるビット率の調節可能なオーディオ
符号化装置は、オーディオ信号を基本階層と所定数の向
上階層よりなる階層的なデータストリームで符号化する
方法において、入力オーディオ信号を信号処理して所定
の符号化帯域別に量子化する量子化処理段階と、前記基
本階層に相応する量子化されたデータを所定の階層サイ
ズ内で符号化する基本階層符号化段階と、前記符号化さ
れた階層の次の向上階層に属する量子化されたデータ及
び前記符号化された階層に属する符号化されなく残って
いる量子化されたデータを所定の階層サイズ内で符号化
する階層符号化段階と、前記階層符号化段階を全ての階
層に対して行う順次符号化段階とを含むことを特徴とす
る。前記基本階層符号化段階、階層符号化段階及び順次
符号化段階の符号化は符号化しようとする該当階層に相
応する量子化されたデータを所定の同数のディジットに
表現する第1段階と、前記同数のディジットに表現され
た量子化されたデータの重要度の最も高いディジットよ
りなる最上位ディジットシーケンスから重要度の低いデ
ィジットシーケンス順に所定の符号化方法で符号化する
第2段階よりなる。
【0009】第1段階及び第2段階は低周波数成分から高
周波数成分順に行うことが望ましい。前記基本階層符号
化段階、階層符号化段階及び順次符号化段階の符号化は
少なくともステップサイズ及び各帯域に割当てられた量
子化ビット数を含む付加情報を所定の符号化方法を使用
して符号化することが望ましい。前記第1段階及び第2段
階のディジットはビットであり、前記第2段階の符号化
は前記ビットシーケンスを構成しているビットを所定数
のビット単位に結合して符号化することが望ましい。前
記所定の符号化方法は無損失符号化であり、ハフマン符
号化または算術符号化であることが望ましい。
【0010】一方、前記量子化されたデータが符号デー
タとマグニチュードデータよりなる際、前記第2段階は
前記同数のディジットに表現された量子化されたデータ
のマグニチュードデータの重要度の最も高い最上位ディ
ジットよりなる最上位ディジットシーケンスを所定の符
号化方法により符号化する段階と、前記符号化された最
上位ディジットシーケンスのうち零でないデータに該当
する符号データを符号化する段階と、前記デジタルデー
タの符号化されないマグニチュードデータのうち重要度
の最も高いディジットシーケンスを所定の符号化方法に
より符号化するマグニチュード符号化段階と、前記第3
段階で符号化されたディジットシーケンスのうち零でな
いマグニチュードデータに該当する符号データのうち符
号化されていない符号データを符号化する符号符号化段
階と、前記マグニチュード符号化段階及び符号符号化段
階を前記デジタルデータの各ディジットに対して行う段
階とを含むことが望ましい。前記第1段階は前記デジタ
ルデータを同数のビットを有する2進データに表現する
段階であり、前記ディジットはビットであることが望ま
しい。前記符号化は前記マグニチュードデータ及び符号
データに対する各ビットシーケンスを構成しているビッ
トを所定数のビット単位に結合して符号化する。前記量
子化処理段階は、時間領域の入力オーディオ信号を周波
数領域の信号に変換する段階と、時間/周波数マッピン
グにより周波数成分に変換された入力オーディオ信号を
所定の帯域信号に結合し、前記各帯域におけるマスキン
グスレショルドを計算する段階と、各帯域の量子化ノイ
ズがマスキングスレショルドより小さくなるように所定
の符号化帯域別に前記信号を量子化する段階よりなるこ
とが望ましい。
【0011】前記技術的課題を達成するためのオーディ
オ信号を所定数の別のビット率よりなる階層的なビット
率を有するように符号化する装置は、入力オーディオ信
号を信号処理して所定の符号化帯域別に量子化する量子
化処理部と、基本階層に相応する付加情報及び量子化さ
れたデータを符号化し、前記基本階層に対する符号化が
終わるとその次の階層に対する付加情報及び量子化され
たデータを符号化し、これを全ての階層に対して行って
ビットストリームを形成するビットパッキング部を含む
ことを特徴とし、前記ビットパッキング部の各階層にお
ける量子化されたデータの符号化は前記量子化された各
データを所定の同数のビットよりなる2進データに表現
してビット単位に分け、前記分割されたビットから重要
度の最も高い最上位ビットよりなる最上位ビットシーケ
ンスから最下位ビットシーケンス順に所定の符号化方法
により符号化する。そして、前記デジタルデータが符号
データとマグニチュードデータよりなる際、前記ビット
パッキング部は、前記ビット分割されたデータのうち重
要度の同順位のビットに対するマグニチュードデータを
集めて符号化し、前記符号化されたマグニチュードデー
タのうち零でないマグニチュードデータに該当する符号
データのうち符号化されていない符号データを符号化す
るが、前記マグニチュードデータと符号データとの符号
化を最上位ビットから下位ビットに順次に行うことが望
ましい。前記ビットパッキング部は重要度によりビット
を集めて符号化する際、所定数のビット単位に結合して
符号化し、低周波数成分から高周波数成分順に行うこと
が望ましい。
【0012】前記技術的課題を達成するための本発明に
よる、階層的なビット率を有するように符号化されたオ
ーディオデータを復号化する方法は、階層的構造を有す
るデータストリームで前記階層の生成された順番に応じ
て少なくとも量子化ステップサイズ情報及び各帯域に割
当てられた量子化ビット情報を含む付加情報及び量子化
されたデータを復号化し、前記データストリームを構成
しているビットの重要度を分析して重要度の高いディジ
ットから低いディジット順に復号化する復号化段階と、
前記復号化された量子化ステップサイズと量子化された
データを元の大きさの信号に復元する段階と、前記逆量
子化された周波数領域のオーディオ信号を時間領域の信
号に変換する段階とを含むことが望ましい。前記復号化
段階のディジットはビットであり、前記復号化段階のデ
ータストリームはビットストリームであることが望まし
い。前記復号化段階の重要度による復号化は所定数のビ
ットよりなるベクトル単位で復号化することが望まし
い。
【0013】前記量子化されたデータが符号データ及び
マグニチュードデータよりなる際、前記復号化段階の復
号化は階層的な構造を有したデータストリームから前記
階層の生成された順番に応じて少なくとも量子化ステッ
プサイズ及び各帯域に割当てられた量子化ビット数を含
む付加情報及び量子化されたマグニチュードデータを復
号化し、前記データストリームを構成しているビットの
重要度を分析して重要度の高いディジットから重要度の
低いディジット順に復号化する段階と、前記量子化され
たデータの符号データを復号化し、これを前記復号化さ
れたマグニチュードデータと結合する段階よりなること
を特徴とする。前記復号化段階において復号化は算術復
号化方法またはハフマン復号化方法により復号化される
ことを特徴とする。前記他の技術的課題を解決するため
の階層的なビット率を有するように符号化されたオーデ
ィオデータを復号化する装置は、階層的な構造を有する
ビットストリームから前記階層の生成された順番に応じ
て少なくとも量子化ステップサイズ及び各帯域に割当て
られた量子化ビット数を含む付加情報及び量子化された
データを復号化し、前記ビットストリームを構成してい
るビットの重要度を分析して重要度の高いビットから重
要度の低いビット順に復号化するビットストリーム分析
部と、前記ビットストリーム分析部から復号化された量
子化ステップサイズと量子化されたデータを元の大きさ
の信号に復元する逆量子化部と、前記逆量子化部から逆
量子化された周波数領域のオーディオ信号を時間領域の
信号に変換する周波数/時間マッピング部とを含むこと
が望ましい。
【0014】
【発明の実施の形態】以下、添付された図面に基づき本
発明の望ましい一実施の形態を詳しく説明する。図2は
本発明によるビット率の調節可能なオーディオ符号化装
置の望ましい一実施の形態に対する構成を示したブロッ
ク図であって、量子化処理部230及びビットパッキング
部240よりなる。前記量子化処理部230は入力オーディオ
信号を信号処理して所定の符号化帯域別に量子化するブ
ロックであって、時間/周波数マッピング部200、聴覚心
理部210及び量子化部220よりなる。前記時間/周波数マ
ッピング部200は時間領域の入力オーディオ信号を周波
数領域の信号に変換する。時間上人間の認知する信号の
特性差はあまり大きくないが、このように変換された周
波数領域の信号は人間の聴覚心理モデルに応じて各帯域
において、人間に感じられる信号と感じられない信号と
の差が大きいため各周波数帯域による量子化ビットを別
に割当てることにより圧縮効率を高めうる。聴覚心理部
210は前記時間/周波数マッピング部200により周波数成
分に変換された入力オーディオ信号を所定の帯域(subba
nd)信号に結合し、各信号の相互作用により発生される
マスキング現象を用いて各帯域(subband)におけるマス
キングスレショルド(masking threshold)を計算する。
量子化部220は各帯域の量子化ノイズがマスキングスレ
ショルドより小さくなるように所定の符号化帯域別に量
子化する。即ち、人間が聞いても感じられないように各
帯域の量子化ノイズの大きさが前記マスキングスレショ
ルドより小さくなるように各帯域の周波数信号をスカラ
ー量子化する。聴覚心理部210で計算したマスキングス
レショルドと各帯域から発生するノイズ(noise)の比率
のNMR(Noise-to-Mask Ratio)を用いて全帯域のNMR値が0
dB以下になるように量子化する。NMR値が0dB以下という
ことは量子化ノイズに比べてマスキング値が高いことを
示し、これは量子化ノイズを人間が聞取れないという意
味である。前記ビットパッキング部240はビット率の最
低の基本階層に相応する付加情報(side information)及
び量子化されたデータを符号化し、前記基本階層に対す
る符号化が終わると、その次の階層に対する付加情報及
び量子化されたデータを符号化し、これを全ての階層に
対して行ってビットストリームを形成する。前記ビット
パッキング部240の各階層での量子化されたデータの符
号化は前記量子化された各データを所定の同数のビット
よりなる2進データに表現してビット単位に分け、前記
分割されたビットから重要度の最も高い最上位ビットよ
りなる最上位ビットシーケンスから最下位ビットシーケ
ンス順に所定の符号化方法により符号化する。そして、
前記量子化されたデータが符号データとマグニチュード
データよりなる時、前記ビットパッキング部240は前記
ビット分割されたデータのうち重要度の同一な同一順位
のビットに対するマグニチュードデータを集めて符号化
し、前記符号化されたマグニチュードデータのうち零で
ないマグニチュードデータに該当する符号データのうち
符号化されない符号データを符号化し、前記マグニチュ
ードデータと符号データとの符号化を最上位ビットから
下位ビット順に行う。
【0015】一方、前記符号化装置の動作を説明する。
一旦入力されたオーディオ信号は符号化されるとビット
ストリームに作られる。このため、まず入力信号は時間
/周波数マッピング部200でMDCT(Modified Discrete Cos
ine Transform)や帯域分割フィルター(subband filter)
により周波数領域の信号に変換される。そして、聴覚心
理部210は前記周波数信号を適当な帯域に結合してマス
キングスレショルドを求める。ここで使用される帯域は
主に量子化過程に使われるために量子化帯域とも称され
る。量子化部220では人間が聞いても感じられないよう
に各量子化帯域の量子化ノイズの大きさがマスキングス
レショルドより小さくなるようにスカラー量子化する。
このような条件を満たすように量子化過程を経ると、各
帯域に対する量子化ステップサイズ値と量子化された周
波数値が生成される。人間は聴覚心理学的な側面で低周
波数では細密な間隔の周波数成分でも容易に区分する。
しかし、周波数が高まるほど人間が区分しうる周波数間
隔は広くなる。それで表1のように低周波数の量子化帯
域は帯域幅(bandwidth)が狭く、高周波数の量子化帯域
は帯域幅が大きい。
【0016】
【表1】 しかし、符号化する時は符号化過程の容易性のために表
1に示されたような量子化帯域を使用しなく、帯域幅の
類似した符号化帯域を使用する。即ち、表1のように帯
域幅の小さい場合にはいくつかの量子化帯域を結合して
1つの符号化帯域となり、帯域幅の大きい場合には1個
の量子化帯域が符号化帯域となる。従って、全体的な符
号化帯域はその大きさが相互類似するように調節され
る。
【0017】1.データ重要度による符号化 まず、量子化された値の符号値を別に保管して絶対値を
とって全ての量子化値の符号を(+)にする。各符号化帯
域内の量子化された周波数値のうち最大絶対値を有する
値を探して各帯域別に信号を表現するために必要な量子
化ビット数を計算する。一般に最上位ビット(MSB、Most
Significant Bit) 1ビットの重要度は最下位ビット(LS
B、Least Significant Bit) 1ビットの重要度に比べて
余程高い。しかし、既存の方式で符号化する場合、この
ような重要度に関係なく符号化されるので、もし全体ビ
ットストリームのうち前から一部のビットストリームの
みを使用すべきであれば、後で使用できないビットスト
リームに含まれた情報に比べて重要度の足りない情報が
前のビットストリームに多く含まれることになる。従っ
て、本発明では各帯域の量子化された信号を最上位ビッ
トから最下位ビット順に符号化する方式を使用する。即
ち、各量子化された信号を2進数で表現して各周波数成
分の量子化された値をビット単位で低周波数成分から高
周波数成分順に処理することになる。まず、各周波数成
分の最上位ビットを求めて順次に1ビットずつ集めて符
号化した後、その次の上位ビットを符号化して順次に最
下位ビットまで処理する。このような方式でさらに重要
な情報が優先的に符号化されて前からビットストリーム
を形成させることである。もし、各々4ビットで8個の量
子化された値が次のように2進数で示されると仮定す
る。 LSB MSB 0:1001 1:1000 2:0101 3:0010 4:0000 5:1000 6:0000 7:0100 既存の方式のようにすると、まず最低周波数成分値の10
01を符号化し、次いで1000、0101、0010の順に符号化す
る。しかし、本発明の方法によれば、まず最低周波数成
分の最上位ビットの1と、次いで0100...などの最上位ビ
ット値を求めて順次に適当に多数のビットずつ結合して
処理する。例えば、4ビットずつ1単位に符号化をすれ
ば、1010を符号化し、次いで0000の順に符号化し、最上
位ビットの符号化が終わると、その次の上位ビット値を
求めて0001,0000...の順に符号化して最下位ビット
まで同じ方式で符号化する。この際、符号化する方法は
各場合に対した適当な確率分布を求めて各場合に対する
ハフマン符号化(huffman coding)や算術符号化(arithme
tic coding)等の無損失符号化方式を使用することによ
り効率よく圧縮して符号化しうる。
【0018】2.符号ビットを含む符号化 通常的に前記符号ビットは最上位ビットに位置する。従
って、最上位ビットから符号化すると符号ビットが最も
重要な情報と認識されて先に符号化される。この場合、
非効率的な符号化となる。即ち、最上位ビットから下位
ビット順に符号化する場合、初めて1が出る前までは量
子化された値は0と看做される。この場合には、符号値
が無意味である。例えば、量子化された値が2進数で000
11の5ビットに表現される時、前記5ビットのうち上位3
ビットのみ符号化されるとしたらこれを復元すれば0000
0の値に復元される。従って、この値は符号ビットがあ
っても全く不要な情報となる。しかし、4ビットが符号
化されると00010の値となることにより符号値ははじめ
て相当重要な意味を有することになる。上位ビットから
0が出てから初めて1が出たことは量子化された値が0で
ない何れの値で符号化されるという意味となるので符号
値が重要な意味を有することになる。各周波数成分を最
上位ビットから表現しながら初めて0でない1が出るとこ
の値の次には他の値を符号化する前に(+)か(-)かに符号
値を符号化すべきである。例えば、前の例において最上
位ビットを符号化するさい、まず1010を符号化してから
符号ビットの符号化が必要なのかに対して決定する。こ
の際、最初の周波数成分と3番目の周波数成分から0でな
い値が初めて符号化されたので、前記2つの周波数成分
に対する符号ビットを順次に符号化する。次いで、0000
を符号化する。もし、最下位ビット(LSB)を符号化する
時は1100を符号化してから符号ビットの要否を決定す
る。この場合、2つの1のうち最初の1は先に最上位ビッ
トから1が出たことがあるため既に符号ビットが符号化
された。従って、符号ビットを符号化する必要がなく、
2番目の1は上位ビットから1が出たことがないので符号
ビットを符号化する。前記符号ビットを符号化した後、
次の最下位ビットの0100を符号化することになる。
【0019】3.改善された符号化方法 前述した符号化方法を適用する場合、低ビット率の場合
には符号化順序を次のように変形させることが効果的で
ある。一般に、人の耳に敏感なのは各周波数成分に対す
る(+)、(-)輪郭である。ここで、提案する符号化方法は
符号ビットの符号化された周波数成分に対しては符号化
を後に延ばし、まだ符号ビットが符号化されなかったた
め0に復元される周波数成分に対してのみ符号化を進行
する。このようにして符号ビットに対する符号化が完了
されると、前記後に延ばしたデータを前述した方法によ
り符号化する。これを前記例に基づき具体的に説明すれ
ば、まず最上位ビットではまだ符号値の符号化された周
波数成分がないため全て符号化する。そして、その次の
上位ビットは0001、0000の順にビットが出るが0001から
1番目の0と3番目0は最上位ビットで符号ビットが符号化
されたため、一旦符号化を保留して2番目と4番目のビッ
トの01を符号化する。そして、ここから出た4番目のビ
ット1は上位ビットから1が出たことがないのでこの周波
数成分に対する符号ビットを符号化する。そして、次の
0000値を見ると上位ビットから符号ビットを符号化した
ことがないので0000を符号化することになる。このよう
に最下位ビットまでの符号ビットを符号化した後、残り
符号化されない情報を上位ビットから順次に前述した方
法を用いて符号化する。
【0020】4.スケール調節の可能な(scalable)ビッ
トストリームの構成 本発明ではオーディオ信号を基本階層と多数の向上階層
よりなる階層的なビットストリームに符号化する。前記
基本階層はビット率の最低階層であり、前記向上階層は
前記基本階層よりビット率が高く、前記向上階層が進行
されるほどビット率はさらに高まる。前記基本階層の前
部には最上位ビットのみ表現されることにより周波数成
分全体に対する輪郭のみが符号化されてから下位ビット
に行くほどさらに多くのビットが表現されることにより
さらに細密な情報を示すことになる。そして、ビット率
が増加しながら、即ち階層の進行に伴って細密なデータ
値に対して符号化されるので良質の音質を示しうる。こ
のように表現されたデータを用いてスケール調節の可能
なビットストリームを構成する方法は次の通りである。
まず、基本階層に使われる付加情報のうち各量子化帯域
の量子化ビット情報に対して符号化する。そして量子化
された値に対する情報を最上位ビットから最下位ビット
に、そして低周波数から高周波数順に符号化する。もち
ろん、現在符号化している量子化ビットより何れの帯域
の量子化ビットが小さい場合には符号化を略し、その量
子化帯域は量子化ビットがその帯域の量子化ビットと同
一になる時、ついに符号化する。そして、各階層の信号
を符号化する時何らの帯域制限がなければ、相当耳障り
な音を聞くことになる。これは最上位ビットから下位ビ
ット順に帯域に関係なく符号化する時、ビット率の低い
階層の信号を復元すると信号がオンーオフされる現象の
ためである。従って、ビット率に応じて適当に帯域を制
限して使用することが良い。基本階層に対する符号化が
終わると、その次の向上階層に対する付加情報とオーデ
ィオデータの量子化値を符号化する。このような方法で
全ての階層のデータを符号化する。このように符号化さ
れた全ての情報を集めてビットストリームを構成するこ
とになる。以上、前記符号化装置で作られたビットスト
リームは図3に示されたように下位階層のビットストリ
ームが上位階層のビットストリームに含まれている階層
構造となる。既存のビットストリームはまず付加情報を
符号化した後、残り情報を符号化してビットストリーム
を作るが本発明では図3のように各階層に必要な付加情
報は各々階層別に分けられて符号化される。また、既存
の符号化方式では量子化されたデータを全てサンプル単
位で順次に符号化したが、本発明では量子化されたデー
タを2進データで示し、2進データの最上位ビット(MSB)
から符号化して許容可能なビット量内でビットストリー
ムを構成する方式を使用する。
【0021】一方、前記符号化装置の動作を具体的な例
に基づき詳しく説明する。本発明は様々な階層のビット
率に対する情報を1つのビットストリームで図3のよう
に階層的な構造を以ってオーディオ信号を符号化するに
おいて重要な信号成分の順に表現する。従って、このよ
うに作られたビットストリームは使用者の要求または伝
送線路の状態に応じて最高ビット率のビットストリーム
に含まれた低ビット率のビットストリームを簡単に再構
成して低ビット率のビットストリームが作れる。即ち、
リアルタイムで符号化装置から作られたビットストリー
ムや何れの媒体に貯蔵されているビットストリームを使
用者の要求に応じて所望のビット率に対したビットスト
リームに作って伝送しうる。また、使用者が完全なビッ
トストリームを有していても使用者のハードウェアの性
能が劣ったり、使用者が復号化器の複雑性を低めようと
すれば、このビットストリーム中一部のみを以って復元
させることより、複雑性を低め、かつ複雑性の調節を可
能にしうる。
【0022】一例として、基本階層は16kbps、最上位階
層は64kbpsであり、各階層(向上階層)を8kbps間隔のビ
ット率を有するビットストリームを構成しうる。即ち、
16、24、32、40、48、56、64kbps7階層のスケール調節
の可能なビットストリームを構成する例である。従っ
て、符号化器で構成されるビットストリームは図3のよ
うな階層的構造で構成されるために最上位階層の64kbps
に対するビットストリーム内に各階層16、24、32、40、
48、56、64kbpsに対するビットストリームが含まれてい
る。もし、ある使用者が最上位階層に対するデータを要
求すればこのビットストリームを何等の加工もなく伝達
する。また、他の使用者が基本階層(16kbpsに該当する)
に対するデータを要求すれば単純に前部のビットストリ
ームのみを切取って伝達する。各階層は表2のようにビ
ット率に応じて帯域幅が制限されており、ビット率に応
じて最終量子化帯域が異なる。入力データは48kHzにサ
ンプリングされたPCMデータであり、1フレームの大きさ
は1024個である。64kbpsのビット率の場合に1フレーム
当り使えるビットの数は平均64000ビット/1秒×(1024/4
8000)=1365.3333ビットとなる。
【0023】
【表2】 同様に各ビット率に応じて1フレームに使えるビット数
を計算しうる。このように計算されたビットの大きさは
表3の通りである。
【表3】
【0024】量子化の前にまず入力データで聴覚心理モ
デル(Psychoaccoustic Model)を用いて現在処理されて
いるフレームのブロックタイプ(ロング、スタート、シ
ョート、ストップ)と各処理帯域(processing band)のS
MR(Signal-to-Masked Thrshold Ratio)値、ショートブ
ロックの場合領域情報、そして聴覚心理モデルと時間/
周波数との同期を合せるために時間遅延されたPCMデー
タなどを作って時間/周波数マッピング部に伝達する。
聴覚心理モデルを計算する方法はISO/IEC 11172-3のMod
el 2を使用する。聴覚心理モデルの出力のブロックタイ
プにより時間/周波数マッピング部ではMDCTを用いて時
間領域のデータを周波数領域のデータに変換する。この
際、ブロックの大きさはロング/スタート/ストップブロ
ックの場合2048であり、ショートブロックの場合の大き
さは256であるMDCTを8回する。ここまでの過程は既存の
MPEG-2NBC[13]で使われることと同じ方式を使用する。
【0025】周波数領域に変換されたデータは表1のよ
うな量子化帯域に周波数成分を結合して量子化帯域のSN
R(Siganl-to-Noise Ratio)値が聴覚心理モデルの出力値
のSMR値より小さくなるようにステップサイズを増加さ
せながら量子化する。量子化はスカラー量子化を使用
し、基本的な量子化ステップサイズの間隔は2 1/4 を使用
する。量子化はNMR値が0dB以下になるように行う。この
時、得られる出力は量子化されたデータと各処理帯域の
量子化ステップサイズに対する情報である。そして、こ
のように量子化された信号を符号化するため、まずこの
量子化された信号を符号化帯域別に最大絶対値を探して
符号化に必要な最大量子化ビットを計算する。ビットス
トリームの同期信号のために12ビットをビットストリー
ムに入れてビットストリームの開始に対する情報を作
る。それからまずビットストリーム全体に対する大きさ
を符号化する。ビットストリームの符号化された最高ビ
ット率に対した情報を符号化する。この情報があってこ
そ低ビット率のビットストリームに再び作り、このビッ
ト率より高いビット率を要求した時これ以上のビットを
送らないことができる。次いで、ブロックタイプを符号
化する。その次の符号化過程はブロックの形態に応じて
若干差がある。信号の特性に応じて1フレームの入力信
号を符号化するため大きなブロックの変換を行う場合
と、8個の短いブロックに分けて変換する場合とに大別
される。このようにブロックの大きさが変わるため符号
化過程で若干の差がある。
【0026】まず長いブロックの場合には基本階層の帯
域幅は4kHzなので処理帯域は12番目の量子化帯域までで
ある。まず12番目量子化帯域までの基本階層のビット割
当情報を符号化する。各帯域のビット割当情報から最大
量子化ビットを求め、この最大量子化ビット値から前述
した方法により符号化する。そして、順次に次の量子化
されたビットに対して符号化する。もちろん、現在符号
化している量子化ビットより何れの帯域の量子化ビット
が小さい場合何らの符号化も略し、その量子化帯域は量
子化ビットがその帯域の量子化ビットと同一になる時つ
いに符号化される。そして、この時初めに何れの帯域を
符号化する場合に量子化帯域に対したステップサイズ情
報を先に符号化してから量子化された周波数成分の値の
うちその量子化ビットに該当される値を抽出して符号化
することになる。最下位階層のビット率は16kbpsなので
許容可能な全体ビットは336ビットである。従って、使
用し続ける総ビット量を計算しているうちにビット量が
336ビット以上になると一旦符号化を中止することにな
る。量子化ビットや量子化ステップサイズの符号化方法
はまず量子化ビットや量子化ステップサイズの中から最
小値と最大値とを求め、この2つの値の差の大きさを求
めると必要なビット数が分かる。それで、実際にこの付
加情報を符号化する前にまず最小値とビット表現に必要
な大きさを算術符号化方式により先に符号化してビット
ストリームに貯蔵して置き、後に実際に符号化する時は
最小値との付加情報の差を符号化する方法を使用する。
【0027】同様に、短いブロックの場合には大きさが
長いブロックの1/8の8個のブロックに分けて時間/周波
数マッピングと量子化過程とを経た後、この量子化され
たデータに対して無損失符号化する。量子化過程は8個
のブロックのブロックごとに各々量子化することでな
く、聴覚心理部で8個のブロックを3箇所の領域に分離し
た情報を送るが、この領域内にある表4のような量子化
帯域を集めて長いブロックで1つの帯域のように処理す
る。
【0028】って、3箇所の領域の各帯域に対する量
子化ステップサイズ情報を求めることになる。基本階層
の帯域幅を長いブロックの場合と類似に合せるために帯
域を4番目の帯域までに制限する。この短いブロックの
場合には8個の小さなブロックがあるので表5のように1
個のブロックで4個のサンプル単位で符号化帯域に分
け、8個ブロックの符号化帯域を結合して32個の量子化
された信号の中から量子化ビット情報を求めて使用す
る。まず制限された帯域内の量子化ビット情報を符号化
する。帯域制限された成分内で最大量子化ビットを求め
て長いブロックのように前述した方法により符号化しう
る。もちろん、現在符号化している量子化ビットより何
れの帯域の量子化ビットが小さい場合、何らの符号化も
略し、その量子化帯域は量子化ビットがその帯域の量子
化ビットと同一になる時、ついに符号化する。この際、
このように初めて何れの帯域を符号化する場合に、量子
化帯域に対するステップサイズ情報を先に符号化してか
ら量子化された周波数成分の値のうち、その量子化ビッ
トに該当される値を抽出して符号化することになる。
【0029】
【表4】 基本階層(16kbps)に対する全てのビットストリームを作
った後、その次の階層(24kbps)に対してビットストリー
ムを作成する。24kbpsでの帯域幅は8kHzなので19番目の
帯域までの周波数成分を符号化する。19番目の帯域まで
の付加情報は既に記録されているので13番目から19番目
帯域までの付加情報のみを記録する。最下位階層で各帯
域のまだ符号化されなく残っている量子化ビットと新た
に追加された帯域の量子化ビットを比較して最大量子化
ビットを求め、この最大量子化ビットから基本階層での
ような方式で符号化しているうちに、使われた総ビット
量の大きさが24kbpsで使えるビット数より大きくなると
符号化過程を中止し、次の階層のビットストリームの作
成を用意する。このような方法で残り階層、即ち32、4
0、48、56、64kbpsに対するビットストリームを作成し
うる。このように構成されたビットストリームは図3の
ような構造で構成される。
【0030】一方、前記符号化装置により生成されたビ
ットストリームを復号化する復号化装置を詳しく説明す
る。図4は前記復号化装置の構成をブロック図で示した
ものであって、ビットストリーム分析部400、逆量子化
部410及び周波数/時間マッピング部420よりなる。前記
ビットストリーム分析部400は階層的構造を有したビッ
トストリームで前記階層の生成された順序により量子化
ステップの大きさ及び各帯域に割当てられた量子化ビッ
ト数を含む付加情報及び量子化されたデータを復号化
し、前記ビットストリームを構成しているビットの重要
度を分析して重要度の高いビットから低いビット順に前
記階層別に復号化する。前記逆量子化部410は復号化さ
れた量子化ステップの大きさと量子化されたデータを以
って元の大きさの信号に復元する。前記周波数/時間マ
ッピング部420は周波数領域のオーディオ信号を再び時
間領域の信号に変換して使用者が再生できるようにす
る。
【0031】前記復号化装置の動作を説明する。前述し
た符号化装置により生成されたビットストリームの復号
化過程は符号化過程の逆順を経ると良い。まず基本階層
に対する情報を復号化する。簡単にその過程を説明すれ
ば、まず基本階層の付加情報のうち各量子化帯域の量子
化ビット情報に対して復号化する。このように復号化さ
れた量子化ビットのうち最大値を求める。前述した符号
化順序のように重要度の最も高いビットから低いビット
順に、そして低周波数から高周波数順にビットストリー
ムで量子化された値を徐々に復号化する。もちろん、現
在復号化している量子化ビットより何れの帯域の量子化
ビットが小さい場合、何らの復号化過程も略し、その量
子化帯域は量子化ビットがその帯域の量子化ビットと同
一になる時、ついに復号化し始める。このように量子化
された値に対する復号化が進行するうちに、初めて何れ
の量子化帯域の信号を復号化する場合において量子化帯
域に対するステップサイズ情報がビットストリームに貯
蔵されているため、この情報を先に復号化した後、量子
化された値に対して復号化し続ける。基本階層に割当て
られた大きさのビットストリームに対する復号化が終わ
ると、その次の階層に対する付加情報とオーディオデー
タの量子化値を復号化する。このような方法で全ての階
層のデータを復号化しうる。このように復号化過程を経
て量子化されたデータは前の符号化と逆順で、図4に示
された逆量子化部410と周波数/時間マッピング部420を
経て復元された信号が作れる。
【0032】
【発明の効果】本発明は多様な使用者の要求に応じるた
めにビットストリームの構成を柔軟にする。即ち、使用
者の要求により様々な階層のビット率に対した情報を重
複無しに1つのビットストリームに結合させることによ
り良い音質のビットストリームを提供しうる。また、送
信端と受信端との間に何等の変換器も要らなく、伝送線
路の状態や使用者のいかなる要求でも収容しうる長所が
ある。そして、ビット率の調節可能な形のビットストリ
ームなので1つのビットストリームの中に多数のビット
率のビットストリームを含んでいる。従って、様々な階
層のビットストリームを簡単に生成でき、符号変換器(t
ranscoder)の複雑度が低い。また、本発明ではNMRが0d
B以下になるように1番量子化をしてからこれ以上のビッ
ト調節部がないため符号化器の複雑度が低い。そして、
各階層において前の階層で量子化された信号と元の信号
との差を再び処理して符号化しなく、量子化ビットの重
要度に応じて符号化するため符号化器の複雑度が低い。
そして、全体ビットストリームにおいて各帯域に対する
付加情報を一回のみ使用することにより、優秀な音質を
提供しうる。また、ビット率が低くなると帯域が制限さ
れているため、主に符号化/復号化において複雑性の大
部を占めるフィルターの複雑性が相当減少するためにビ
ット率に比例して符号化器/復号化器の実際の複雑性も
減少することになる。また、使用者の復号化器の性能、
伝送線路の帯域幅/混雑度または使用者の要求に応じて
ビット率や複雑性の調節が可能である。
【図面の簡単な説明】
【図1】 単純な概念のスケールの調節可能な符号化/
復号化装置の構成を示したブロック図である。
【図2】 本発明による符号化装置の構造を示したブロ
ック図である。
【図3】 本発明によるビットストリームの構造を示し
た図面である。
【図4】 本発明による復号化装置の構造を示したブロ
ック図である。
【符号の説明】
200 時間/周波数マッピング部 210 聴覚心理部 220 量子化部 230 量子化処理部 240 ビットパッキング部 400 ビットストリーム分析部 410 逆量子化部 420 周波数/時間マッピング部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) H03M 7/30 G10L 19/00

Claims (28)

    (57)【特許請求の範囲】
  1. 【請求項1】 オーディオ信号を基本階層と所定数の向
    上階層よりなる階層的なデータストリームに符号化する
    方法において、 (a) 入力オーディオ信号を信号処理して所定の符号化
    帯域別に量子化する量子化処理段階と、 (b) 前記基本階層に相応する量子化されたデータを所
    定の階層サイズ内で符号化する基本階層符号化段階と、 (c)前記符号化された階層の次の向上階層に属する量子
    化されたデータ及び前記符号化された階層に属する符号
    化されなく残っている量子化されたデータを所定の階層
    サイズ内で符号化する階層符号化段階と、 (d) 前記階層符号化段階を全ての階層に対して行う順
    次符号化段階とを含むことを特徴とし、 前記(b)段階、(c)段階及び(d)段階の符号化は、 (e) 符号化しようとする該当階層に相応する量子化さ
    れたデータを所定の同数のディジットに表現する段階
    と、 (f) 前記同数のディジットに表現された量子化された
    データの重要度の最も高いディジットよりなる最上位デ
    ィジットシーケンスから重要度の低いディジットシーケ
    ンス順に所定の符号化方法で符号化する段階よりなる、
    ビット率の調節可能なオーディオ符号化方法。
  2. 【請求項2】 前記(e)段階及び(f)段階は低周波数成分
    から高周波数成分順に行うことを特徴とする請求項1に
    記載のビット率の調節可能なオーディオ符号化方法。
  3. 【請求項3】 前記(b)段階、(c)段階及び(d)段階の符
    号化は少なくとも量子化ステップサイズ情報及び各帯域
    に割当てられた量子化ビット数を含む付加情報を所定の
    符号化方法を使用して符号化することを特徴とする請求
    項1に記載のビット率の調節可能なオーディオ符号化方
    法。
  4. 【請求項4】 前記(e)段階及び(f)段階のディジットは
    ビットであることを特徴とする請求項1または請求項3
    に記載のビット率の調節可能なオーディオ符号化方法。
  5. 【請求項5】 前記(f)段階の符号化は前記ビットシー
    ケンスを構成しているビットを所定数のビット単位に結
    合して符号化することを特徴とする請求項4に記載のビ
    ット率の調節可能なオーディオ符号化方法。
  6. 【請求項6】 前記所定の符号化方法は無損失符号化で
    あることを特徴とする請求項4に記載のビット率の調節
    可能なオーディオ符号化方法。
  7. 【請求項7】 前記所定の符号化方法は無損失符号化で
    あることを特徴とする請求項5に記載のビット率の調節
    可能なオーディオ符号化方法。
  8. 【請求項8】 前記無損失符号化はハフマン符号化であ
    ることを特徴とする請求項6または請求項7に記載のビ
    ット率の調節可能なオーディオ符号化方法。
  9. 【請求項9】 前記無損失符号化は算術符号化であるこ
    とを特徴とする請求項6または請求項7に記載のビット
    率の調節可能なオーディオ符号化方法。
  10. 【請求項10】 前記量子化されたデータが符号データ
    とマグニチュードデータよりなる際、前記(f)段階は、 i) 前記同数のディジットに表現された量子化されたデ
    ータのマグニチュードデータの重要度の最も高い最上位
    ディジットよりなる最上位ディジットシーケンスを所定
    の符号化方法により符号化する段階と、 ii) 前記符号化された最上位ディジットシーケンスの
    うち零でないデータに該当する符号データを符号化する
    段階と、 iii) 前記デジタルデータの符号化されないマグニチュ
    ードデータのうち重要度の最も高いディジットシーケン
    スを所定の符号化方法により符号化するマグニチュード
    符号化段階と、 iv) 前記第3段階で符号化されたディジットシーケンス
    のうち零でないマグニチュードデータに該当する符号デ
    ータのうち符号化されていない符号データを符号化する
    符号符号化段階と、 v) 前記iii)段階及びiv)段階を前記デジタルデータの
    各ディジットに対して行う段階とを含むことを特徴とす
    る請求項1に記載のビット率の調節可能なオーディオ符
    号化方法。
  11. 【請求項11】 前記(e)段階は前記デジタルデータを
    同数のビットを有する2進データで表現する段階であ
    り、 前記ディジットはビットであることを特徴とする請求項
    10に記載のビット率の調節可能なオーディオ符号化方
    法。
  12. 【請求項12】 前記符号化は前記マグニチュードデー
    タ及び符号データに対する各ビットシーケンスを構成し
    ているビットを所定数のビット単位に結合して符号化す
    ることを特徴とする請求項10に記載のビット率の調節
    可能なオーディオ符号化方法。
  13. 【請求項13】 前記所定の符号化方法は算術符号化で
    あることを特徴とする請求項11または請求項12に記
    載のビット率の調節可能なオーディオ符号化方法。
  14. 【請求項14】 前記(b)段階、(c)段階及び(d)段階の
    符号化は少なくともステップサイズ及び各帯域に割当て
    られた量子化ビット数を含む付加情報を所定の符号化方
    法を使用して符号化することを特徴とする請求項10に
    記載のビット率の調節可能なオーディオ符号化方法。
  15. 【請求項15】 前記量子化処理段階は、 時間領域の入力オーディオ信号を周波数領域の信号に変
    換する段階と、 時間/周波数マッピングにより周波数成分に変換された
    入力オーディオ信号を所定の帯域信号に結合し、前記各
    帯域におけるマスキングスレショルドを計算する段階
    と、 各帯域の量子化ノイズがマスキングスレショルドより小
    さくなるように所定の符号化帯域別に前記信号を量子化
    する段階よりなることを特徴とする請求項1または請求
    項10に記載のビット率の調節可能なオーディオ符号化
    方法。
  16. 【請求項16】 オーディオ信号を所定数の別のビット
    率よりなる階層的なビット率を有するように符号化する
    装置において、 入力オーディオ信号を信号処理して所定の符号化帯域別
    に量子化する量子化処理部と、 基本階層に相応する付加情報及び量子化されたデータを
    符号化し、前記基本階層に対する符号化が終わるとその
    次の階層に対する付加情報及び量子化されたデータを符
    号化し、これを全ての階層に対して行ってビットストリ
    ームを形成するビットパッキング部を含むことを特徴と
    し、 前記ビットパッキング部の各階層における量子化された
    データの符号化は、 前記量子化された各データを所定の同数のビットよりな
    る2進データに表現してビット単位に分け、前記分割さ
    れたビットから重要度の最も高い最上位ビットよりなる
    最上位ビットシーケンスから最下位ビットシーケンス順
    に所定の符号化方法により符号化するビット率の調節可
    能なオーディオ符号化装置。
  17. 【請求項17】 前記デジタルデータが符号データとマ
    グニチュードデータよりなる際、前記ビットパッキング
    部は、 前記ビット分割されたデータのうち重要度の同順位のビ
    ットに対するマグニチュードデータを集めて符号化し、
    前記符号化されたマグニチュードデータのうち零でない
    マグニチュードデータに該当する符号データのうち符号
    化されていない符号データを符号化し、前記マグニチュ
    ードデータと符号データとの符号化を最上位ビットから
    下位ビットに順次に行うことを特徴とする請求項16に
    記載のビット率の調節可能なオーディオ符号化装置。
  18. 【請求項18】 前記ビットパッキング部は重要度によ
    りビットを集めて符号化する際、所定数のビット単位に
    結合して符号化することを特徴とする請求項16または
    請求項17に記載のビット率の調節可能なオーディオ符
    号化装置。
  19. 【請求項19】 前記符号化方法はハフマン符号化及び
    算術符号化のうち何れか1つの方式により符号化するこ
    とを特徴とする請求項16または請求項17に記載のビ
    ット率の調節可能なオーディオ符号化装置。
  20. 【請求項20】 前記ビットパッキング部は低周波数成
    分から高周波数成分順に符号化することを特徴とする請
    求項18に記載のビット率の調節可能なオーディオ符号
    化装置。
  21. 【請求項21】 前記量子化処理部は、 時間領域の入力オーディオ信号を周波数領域の信号に変
    換する時間/周波数マッピング部と、 前記時間/周波数マッピングにより周波数成分に変換さ
    れた入力オーディオ信号を所定の帯域信号に結合し、前
    記各帯域におけるマスキングスレショルドを計算する聴
    覚心理部と、 各帯域の量子化ノイズがマスキングスレショルドより小
    さくなるように所定の符号化帯域別に量子化する量子化
    部を含むことを特徴とする請求項16または請求項17
    に記載のビット率の調節可能なオーディオ符号化装置。
  22. 【請求項22】 階層的なビット率を有するように符号
    化されたオーディオデータを復号化する方法において、 階層的構造を有したデータストリームで前記階層の生成
    された順番に応じて少なくとも量子化ステップサイズ情
    報及び各帯域に割当てられた量子化ビット情報を含む付
    加情報及び量子化されたデータを復号化し、前記データ
    ストリームを構成しているビットの重要度を分析して重
    要度の高いディジットから低いディジット順に復号化す
    る復号化段階と、 前記復号化された量子化ステップサイズと量子化された
    データを元の大きさの信号に復元する段階と、 前記逆量子化された周波数領域のオーディオ信号を時間
    領域の信号に変換する段階とを含むことを特徴とするビ
    ット率の調節可能なオーディオデータ復号化方法。
  23. 【請求項23】 前記復号化段階のディジットはビット
    であり、 前記復号化段階のデータストリームはビットストリーム
    であることを特徴とする請求項22に記載のビット率の
    調節可能なオーディオデータ復号化方法。
  24. 【請求項24】 前記復号化段階の重要度による復号化
    は所定数のビットよりなるベクトル単位で復号化するこ
    とを特徴とする請求項23に記載のビット率の調節可能
    なオーディオデータ復号化方法。
  25. 【請求項25】 前記量子化されたデータが符号データ
    及びマグニチュードデータよりなる際、前記復号化段階
    の復号化は、 階層的な構造を有したデータストリームから前記階層の
    生成された順番に応じて少なくとも量子化ステップサイ
    ズ及び各帯域に割当てられた量子化ビット数を含む付加
    情報及び量子化されたマグニチュードデータを復号化
    し、前記データストリームを構成しているビットの重要
    度を分析して重要度の高いディジットから重要度の低い
    ディジット順に復号化する段階と、 前記量子化されたデータの符号データを復号化し、これ
    を前記復号化されたマグニチュードデータと結合する段
    階よりなることを特徴とする請求項23または請求項2
    4に記載のビット率の調節可能なオーディオデータ復号
    化方法。
  26. 【請求項26】 前記復号化段階において復号化は算術
    復号化方法により復号化することを特徴とする請求項2
    3に記載のビット率の調節可能なオーディオデータ復号
    化方法。
  27. 【請求項27】 前記復号化段階において復号化はハフ
    マン復号化方法により復号化することを特徴とする請求
    項23に記載のビット率の調節可能なオーディオデータ
    復号化方法。
  28. 【請求項28】 階層的なビット率を有するように符号
    化されたオーディオデータを復号化する装置において、 階層的な構造を有するビットストリームから前記階層の
    生成された順番に応じて少なくとも量子化ステップサイ
    ズ及び各帯域に割当てられた量子化ビット数を含む付加
    情報及び量子化されたデータを復号化し、前記ビットス
    トリームを構成しているビットの重要度を分析して重要
    度の高いビットから重要度の低いビット順に復号化する
    ビットストリーム分析部と、 前記ビットストリーム分析部から復号化された量子化ス
    テップサイズと量子化されたデータを元の大きさの信号
    に復元する逆量子化部と、 前記逆量子化部から逆量子化された周波数領域のオーデ
    ィオ信号を時間領域の信号に変換する周波数/時間マッ
    ピング部とを含むことを特徴とするビット率の調節可能
    なオーディオデータ復号化装置。
JP6445798A 1997-04-02 1998-02-27 ビット率の調節可能なオーディオ符号化/復号化方法及び装置 Expired - Fee Related JP3354864B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR19970012232 1997-04-02
KR1019970061298A KR100261253B1 (ko) 1997-04-02 1997-11-19 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
KR199761298 1997-11-19
KR199712232 1997-11-19

Publications (2)

Publication Number Publication Date
JPH10285043A JPH10285043A (ja) 1998-10-23
JP3354864B2 true JP3354864B2 (ja) 2002-12-09

Family

ID=26632641

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6445798A Expired - Fee Related JP3354864B2 (ja) 1997-04-02 1998-02-27 ビット率の調節可能なオーディオ符号化/復号化方法及び装置

Country Status (10)

Country Link
US (3) US6122618A (ja)
EP (1) EP0884850A3 (ja)
JP (1) JP3354864B2 (ja)
KR (1) KR100261253B1 (ja)
CN (1) CN1110145C (ja)
BR (1) BR9705602A (ja)
ID (1) ID19830A (ja)
IL (3) IL158352A (ja)
MY (1) MY123835A (ja)
RU (1) RU2194361C2 (ja)

Families Citing this family (97)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000064963A (ko) * 1997-02-21 2000-11-06 엠. 제이. 엠. 반 캄 비디오 이미지를 기록 및 재생하는 방법 및 장치
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US6091773A (en) 1997-11-12 2000-07-18 Sydorenko; Mark R. Data compression method and apparatus
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
US6469239B1 (en) * 1998-02-19 2002-10-22 Sony Corporation Data storage apparatus and data storage method with quality degrading features
AUPP273298A0 (en) * 1998-03-31 1998-04-23 Lake Dsp Pty Limited Room impulse response compression
GB9909606D0 (en) * 1999-04-26 1999-06-23 Telemedia Systems Ltd Networked delivery of profiled media files to clients
US6446037B1 (en) 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
US6639943B1 (en) 1999-11-23 2003-10-28 Koninklijke Philips Electronics N.V. Hybrid temporal-SNR fine granular scalability video coding
US7792681B2 (en) * 1999-12-17 2010-09-07 Interval Licensing Llc Time-scale modification of data-compressed audio information
US6842735B1 (en) * 1999-12-17 2005-01-11 Interval Research Corporation Time-scale modification of data-compressed audio information
CA2312333A1 (en) * 2000-06-21 2001-12-21 Kimihiko E. Sato Multimedia compression, coding and transmission method and apparatus
JP4470304B2 (ja) * 2000-09-14 2010-06-02 ソニー株式会社 圧縮データ記録装置、記録方法、圧縮データ記録再生装置、記録再生方法および記録媒体
WO2002032147A1 (en) * 2000-10-11 2002-04-18 Koninklijke Philips Electronics N.V. Scalable coding of multi-media objects
JP4505701B2 (ja) * 2000-10-31 2010-07-21 ソニー株式会社 情報処理装置および情報処理方法、プログラム記録媒体
DE10102159C2 (de) * 2001-01-18 2002-12-12 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen bzw. Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkasse, Codierer und skalierbarer Codierer
DE10102154C2 (de) * 2001-01-18 2003-02-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkassenfunktion
DE10102155C2 (de) 2001-01-18 2003-01-09 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms
US20020133246A1 (en) * 2001-03-02 2002-09-19 Hong-Kee Kim Method of editing audio data and recording medium thereof and digital audio player
US6996522B2 (en) 2001-03-13 2006-02-07 Industrial Technology Research Institute Celp-Based speech coding for fine grain scalability by altering sub-frame pitch-pulse
US8391482B2 (en) * 2001-05-04 2013-03-05 Hewlett-Packard Development Company, L.P. Signal format that facilitates easy scalability of data streams
US7272555B2 (en) * 2001-09-13 2007-09-18 Industrial Technology Research Institute Fine granularity scalability speech coding for multi-pulses CELP-based algorithm
US7333929B1 (en) 2001-09-13 2008-02-19 Chmounk Dmitri V Modular scalable compressed audio data stream
CA2430923C (en) * 2001-11-14 2012-01-03 Matsushita Electric Industrial Co., Ltd. Encoding device, decoding device, and system thereof
CN100346392C (zh) * 2002-04-26 2007-10-31 松下电器产业株式会社 编码设备、解码设备、编码方法和解码方法
GB2388502A (en) * 2002-05-10 2003-11-12 Chris Dunn Compression of frequency domain audio signals
US20030236674A1 (en) * 2002-06-19 2003-12-25 Henry Raymond C. Methods and systems for compression of stored audio
KR100552169B1 (ko) * 2002-10-15 2006-02-13 에스케이 텔레콤주식회사 이동통신 시스템의 비디오 스트리밍 압축 장치
KR100908116B1 (ko) * 2002-12-12 2009-07-16 삼성전자주식회사 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
KR100908117B1 (ko) * 2002-12-16 2009-07-16 삼성전자주식회사 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
KR100528325B1 (ko) * 2002-12-18 2005-11-15 삼성전자주식회사 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치
KR100917464B1 (ko) * 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
KR100923300B1 (ko) * 2003-03-22 2009-10-23 삼성전자주식회사 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
KR100923301B1 (ko) * 2003-03-22 2009-10-23 삼성전자주식회사 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
US7640157B2 (en) * 2003-09-26 2009-12-29 Ittiam Systems (P) Ltd. Systems and methods for low bit rate audio coders
EP1683133B1 (en) * 2003-10-30 2007-02-14 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
KR100571824B1 (ko) * 2003-11-26 2006-04-17 삼성전자주식회사 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
KR100629997B1 (ko) * 2004-02-26 2006-09-27 엘지전자 주식회사 오디오 신호의 인코딩 방법
DE102004009955B3 (de) * 2004-03-01 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
ATE511178T1 (de) * 2004-03-25 2011-06-15 Dts Inc Skalierbarer verlustloser audio-codec und erstellungs-werkzeug
US7536302B2 (en) * 2004-07-13 2009-05-19 Industrial Technology Research Institute Method, process and device for coding audio signals
EP1780895B1 (en) * 2004-07-28 2020-07-01 III Holdings 12, LLC Signal decoding apparatus
KR100829558B1 (ko) * 2005-01-12 2008-05-14 삼성전자주식회사 스케일러블 오디오 데이터 산술 복호화 방법 및 장치와스케일러블 오디오 비트스트림 절단 방법
KR100707186B1 (ko) * 2005-03-24 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
US7991610B2 (en) * 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
US20060235683A1 (en) * 2005-04-13 2006-10-19 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Lossless encoding of information with guaranteed maximum bitrate
KR100818268B1 (ko) 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
KR100803205B1 (ko) 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US8036274B2 (en) 2005-08-12 2011-10-11 Microsoft Corporation SIMD lapped transform-based digital media encoding/decoding
KR100738077B1 (ko) * 2005-09-28 2007-07-12 삼성전자주식회사 계층적 오디오 부호화 및 복호화 장치와 방법
KR100754389B1 (ko) * 2005-09-29 2007-08-31 삼성전자주식회사 음성 및 오디오 신호 부호화 장치 및 방법
BRPI0616407B1 (pt) * 2005-10-12 2020-08-11 Interdigital Vc Holdings, Inc Codificação/decodificação de vídeo escalonável h.264 com região de interesse
US20070094035A1 (en) * 2005-10-21 2007-04-26 Nokia Corporation Audio coding
KR100888474B1 (ko) 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
KR100793287B1 (ko) * 2006-01-26 2008-01-10 주식회사 코아로직 비트율 조절이 가능한 오디오 복호화 장치 및 그 방법
CN101385079B (zh) * 2006-02-14 2012-08-29 法国电信公司 在音频编码/解码中用于知觉加权的设备
WO2007105586A1 (ja) * 2006-03-10 2007-09-20 Matsushita Electric Industrial Co., Ltd. 符号化装置および符号化方法
US8363675B2 (en) 2006-03-24 2013-01-29 Samsung Electronics Co., Ltd. Method and system for transmission of uncompressed video over wireless communication channels
KR101322392B1 (ko) * 2006-06-16 2013-10-29 삼성전자주식회사 스케일러블 코덱의 부호화 및 복호화 방법 및 장치
AU2007331763B2 (en) 2006-12-12 2011-06-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream
FR2910752B1 (fr) * 2006-12-22 2009-03-20 Commissariat Energie Atomique Procede de codage spatio-temporel pour systeme de communication multi-antenne de type uwb impulsionnel
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
KR100889750B1 (ko) * 2007-05-17 2009-03-24 한국전자통신연구원 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
US8369638B2 (en) 2008-05-27 2013-02-05 Microsoft Corporation Reducing DC leakage in HD photo transform
US8447591B2 (en) 2008-05-30 2013-05-21 Microsoft Corporation Factorization of overlapping tranforms into two block transforms
CN101609679B (zh) * 2008-06-20 2012-10-17 华为技术有限公司 嵌入式编解码方法和装置
PL2311033T3 (pl) 2008-07-11 2012-05-31 Fraunhofer Ges Forschung Dostarczanie sygnału aktywującego dopasowanie czasowe i kodowanie sygnału audio z jego użyciem
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
US8275209B2 (en) 2008-10-10 2012-09-25 Microsoft Corporation Reduced DC gain mismatch and DC leakage in overlap transform processing
CN101902283B (zh) * 2009-05-26 2014-06-18 鸿富锦精密工业(深圳)有限公司 编码调制方法及系统
KR20100136890A (ko) * 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
TWI491179B (zh) * 2009-06-24 2015-07-01 Hon Hai Prec Ind Co Ltd 編碼調制系統及方法
EP2535892B1 (en) * 2009-06-24 2014-08-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal decoder, method for decoding an audio signal and computer program using cascaded audio object processing stages
WO2011021238A1 (ja) * 2009-08-20 2011-02-24 トムソン ライセンシング レート制御装置、レート制御方法及びレート制御プログラム
UA102347C2 (ru) 2010-01-19 2013-06-25 Долби Интернешнл Аб Усовершенствованное гармоническое преобразование на основе блока поддиапазонов
CN102741831B (zh) 2010-11-12 2015-10-07 宝利通公司 多点环境中的可伸缩音频
FR2969360A1 (fr) * 2010-12-16 2012-06-22 France Telecom Codage perfectionne d'un etage d'amelioration dans un codeur hierarchique
US10199043B2 (en) * 2012-09-07 2019-02-05 Dts, Inc. Scalable code excited linear prediction bitstream repacked from a higher to a lower bitrate by discarding insignificant frame data
PL3457400T3 (pl) * 2012-12-13 2024-02-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie do kodowania głosowego audio, urządzenie do dekodowania głosowego audio, sposób kodowania głosowego audio i sposób dekodowania głosowego audio
EP2840811A1 (en) * 2013-07-22 2015-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for processing an audio signal; signal processing unit, binaural renderer, audio encoder and audio decoder
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
BR112019019702A2 (pt) * 2017-03-21 2020-04-14 Lg Electronics Inc método de transformada em sistema de codificação de imagem e aparelho para o mesmo
CN116095314A (zh) 2017-06-29 2023-05-09 杜比实验室特许公司 整合的图像整形和视频编码
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5367608A (en) * 1990-05-14 1994-11-22 U.S. Philips Corporation Transmitter, encoding system and method employing use of a bit allocation unit for subband coding a digital signal
US5632005A (en) * 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
US5442458A (en) * 1991-12-18 1995-08-15 Eastman Kodak Company Method and associated apparatus for encoding bitplanes for improved coding efficiency
CA2090052C (en) * 1992-03-02 1998-11-24 Anibal Joao De Sousa Ferreira Method and apparatus for the perceptual coding of audio signals
JP3259428B2 (ja) * 1993-03-24 2002-02-25 ソニー株式会社 ディジタル画像信号のコンシール装置及び方法
KR950008637B1 (ko) * 1993-04-08 1995-08-03 삼성전자주식회사 부밴드 코딩시스템의 신호처리장치
KR100269213B1 (ko) * 1993-10-30 2000-10-16 윤종용 오디오신호의부호화방법
JP2655063B2 (ja) * 1993-12-24 1997-09-17 日本電気株式会社 音声符号化装置
US5732391A (en) * 1994-03-09 1998-03-24 Motorola, Inc. Method and apparatus of reducing processing steps in an audio compression system using psychoacoustic parameters
JP3277677B2 (ja) * 1994-04-01 2002-04-22 ソニー株式会社 信号符号化方法及び装置、信号記録媒体、信号伝送方法、並びに信号復号化方法及び装置
JPH08328599A (ja) * 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US6016111A (en) * 1997-07-31 2000-01-18 Samsung Electronics Co., Ltd. Digital data coding/decoding method and apparatus
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치

Also Published As

Publication number Publication date
IL158102A (en) 2009-09-22
US6438525B1 (en) 2002-08-20
EP0884850A2 (en) 1998-12-16
EP0884850A3 (en) 2000-03-22
RU2194361C2 (ru) 2002-12-10
US6148288A (en) 2000-11-14
US6122618A (en) 2000-09-19
IL122711A0 (en) 1998-08-16
KR19980079475A (ko) 1998-11-25
CN1196611A (zh) 1998-10-21
MY123835A (en) 2006-06-30
KR100261253B1 (ko) 2000-07-01
IL158352A (en) 2009-02-11
BR9705602A (pt) 1999-03-16
ID19830A (id) 1998-08-06
IL158102A0 (en) 2005-11-20
JPH10285043A (ja) 1998-10-23
CN1110145C (zh) 2003-05-28

Similar Documents

Publication Publication Date Title
JP3354864B2 (ja) ビット率の調節可能なオーディオ符号化/復号化方法及び装置
KR100335609B1 (ko) 비트율조절이가능한오디오부호화/복호화방법및장치
JP3354863B2 (ja) ビット率の調節可能なオーディオデータ符号化/復号化方法及び装置
KR100335611B1 (ko) 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
KR100908117B1 (ko) 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
JP2006011456A (ja) 低ビット率符号化/復号化方法及び装置並びにコンピュータ可読媒体
RU97122037A (ru) Способ и устройство для масштабируемого кодирования/декодирования аудиосигнала
JP2000101436A (ja) オーディオ信号の符号化及び復号方法及び装置
KR20050051046A (ko) 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
Sinha et al. The perceptual audio coder (PAC)
JP3964860B2 (ja) ステレオオーディオの符号化方法、ステレオオーディオ符号化装置、ステレオオーディオの復号化方法、ステレオオーディオ復号化装置及びコンピュータで読み取り可能な記録媒体
JP3466080B2 (ja) デジタルデータの符号化/復号化方法及び装置
KR101015497B1 (ko) 디지털 데이터의 부호화/복호화 방법 및 장치
RU2214047C2 (ru) Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов
KR100923301B1 (ko) 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
WO1999044291A1 (fr) Dispositif et procede de codage, dispositif et procede de decodage, support d'enregistrement de programme et de donnees
KR20040051369A (ko) 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
Lu et al. An E cient, Low-Complexity Audio Coder Delivering Multiple Levels of Quality for Interactive Applications

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080927

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080927

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090927

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100927

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100927

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110927

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120927

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130927

Year of fee payment: 11

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees