JP2005157390A - 付加情報の挿入されたmpeg−4bsacオーディオビットストリームの符号化方法および復号化方法ならびに符号化装置および復号化装置 - Google Patents

付加情報の挿入されたmpeg−4bsacオーディオビットストリームの符号化方法および復号化方法ならびに符号化装置および復号化装置 Download PDF

Info

Publication number
JP2005157390A
JP2005157390A JP2004341556A JP2004341556A JP2005157390A JP 2005157390 A JP2005157390 A JP 2005157390A JP 2004341556 A JP2004341556 A JP 2004341556A JP 2004341556 A JP2004341556 A JP 2004341556A JP 2005157390 A JP2005157390 A JP 2005157390A
Authority
JP
Japan
Prior art keywords
additional information
audio
bitstream
mpeg
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004341556A
Other languages
English (en)
Inventor
Jung-Hoe Kim
重 會 金
Shi-Hwa Lee
時 和 李
Sang-Wook Kim
▲尚▼ ▲焜▼ 金
殷 美 ▲呉▼
Eun-Mi Oh
Dokyo Kin
度 亨 金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2005157390A publication Critical patent/JP2005157390A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0033Recording/reproducing or transmission of music for electrophonic musical instruments
    • G10H1/0041Recording/reproducing or transmission of music for electrophonic musical instruments in coded form
    • G10H1/0058Transmission between separate instruments or between individual components of a musical system
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】 付加情報の挿入されたMPEG−4オーディオBSAC符号化/復号化方法および装置を提供する。
【解決手段】 符号化装置では、時間領域のオーディオ信号を周波数領域信号に変えて量子化してデータビット数をカウントし、階層当りの可用ビット数を求め、付加情報の大きさを考慮して階層当りの可用ビット数を修正する。そして、階層単位で符号化し、ビットストリームに付加情報を追加する。また、復号装置においては、ヘッダを復号化し、ビットストリーム階層構造を求め、最上位階層までのデータサイズとフレームサイズとの差を付加情報の大きさに決め、付加情報の大きさだけ付加情報を抽出し、オーディオデータを復号化する。
【選択図】図7

Description

本発明はMPEGオーディオ符号化/復号(化)に係り、特に、付加情報の挿入されたMPEG−4BSAC(Bit Sliced Arithmetic Coding)オーディオビットストリームの符号化/復号化方法および装置に関する。
情報を含む信号の波形は、時間的に連続的な信号(連続時間信号)、すなわちアナログ信号である。したがって、その波形を離散(時間)信号で表現するためには、A/D(Analog-to-Digital)変換が必要である。A/D変換を行うために2種の過程を必要とする。1つは連続時間信号を離散時間信号に変えるサンプリング過程であり、他の1つはとり得る振幅の値の数を有限個に制限するための振幅量子化過程である。振幅量子化過程とは、時間nにおける入力振幅x(n)を振幅(そのとり得る値)の有限集合中の一つの元であるy(n)に変換する過程である。
オーディオ(音声)信号の保存/復元方式においても、最近のデジタル信号処理技術の発達により、典型的なアナログ信号である音声信号をサンプリングと量子化過程とを経てデジタル信号であるPCM(Pulse Code Modulation)データに変換してCD(Compact Disc)やDAT(Digital Audio Tape)のような記録/記憶媒体に保存しておき、ユーザが必要に応じて保存された信号を再生して聞くことができるようにする技術が開発され、一般化している。このようなデジタル方式による保存/復元方式は、かつて主流であったLP(Long-Playing Record)やカセットテープなどによるアナログ方式に比べて、音質の向上を達成し、経年劣化の問題を克服したが、大量のデジタルデータを保存するための記憶領域の確保および限られた帯域幅での転送速度に問題を残した。
このような問題を解決するために、デジタル音声信号を圧縮するために開発されたDPCM(Differential Pulse Code Modulation)やADPCM(Adaptive Differential Pulse Code Modulation)等の方法を使用してデータの量を減らそうとする努力はあったが、信号の種類によって効率性に大きく差が出てしまうという問題があった。最近ISO(International Standard Organization)により標準化作業がなされたMPEG(Moving Pictures Expert Group)/audio技法やドルビー研究所(Dolby Laboratories, Inc.)により開発されたAC−2/AC−3技法では、人間の音響心理モデル(Psychoacoustic Model)を用いてデータの量を減らす方法を採用している。これらの方法は信号の特性に関係なく効率よくデータの量を減らすのに大きく寄与した。
MPEG−1/audio、MPEG−2/audioやAC−2/AC−3のような既存のオーディオ信号圧縮技法では時間領域(time domain)の信号を一定した大きさのブロックに束ねて周波数領域(frequency domain)の信号に変換する。そして、その変換された信号を人間の音響心理モデルを用いてスカラー量子化を行う。このような量子化技法は単純ではあるが、入力サンプルが統計的に独立的であるとしても最適ではない。もちろん、入力サンプルが統計的に従属的であれば、さらに不十分である。このような問題に対処するためにエントロピー符号化などの無損失符号化やある種の適応量子化を含む符号化を行う。したがって、単純なPCMデータを保存するだけの方式に比べて相当複雑な過程を経て符号化されたビットストリームは、量子化されたPCMデータだけでなく、信号を圧縮するための付加的な情報を含むものとして構成されることになる。
MPEG/audio標準やAC−2/AC−3方式は既存のデジタル符号化に比べて1/6ないし1/8に減少させた64Kbps−384KbpsのビットレートでCD音質とほぼ同じ程度の音質を提供する。そのため、MPEG/audio標準は、DAB(Digital Audio Broadcasting)、インターネット・フォン(internet phone)、AOD(Audio On Demand)、マルチメディアシステムなどにおけるオーディオ信号の保存と転送に重要な役割をする。
このような既存の技法は、符号化器で一定のビットレートが与えられ、その与えられたビットレートに最適の状態を特定してそのための量子化と符号化のプロセスを実行するものなので、一定のビットレートを使用する場合には、相当良いソリューションを提供するものといえる。しかし、マルチメディア時代の到来につれて、従来の低いビットレートによる符号化を達成するだけでは十分ではなく、多様な機能性を有する符号化器/復号化器が求められるようになっている。その1つがビットレートの調節が可能なオーディオ符号化/復号化器である。ビットレートの調節が可能なオーディオ符号化器は、高いビットレートで符号化されたビットストリームを低いビットレートのビットストリームにすることもでき、その一部のビットストリームだけで復元できるよう構成される。したがって、ネットワークで過負荷がかかるような場合や、復号化器の性能がよくない場合や、ユーザの要求によりビットレートが低く設定された場合などには、ビットストリームの一部を利用して符号化するため、ビットレートの低くなった分だけ再生される音質の劣化を免れないものの、それでもある程度の音質を確保しつつ信号を復元しなければならない。
MPEG−2/4AAC(ISO/IEC 13818−7、ISO/IEC 14496−3)では、data_stream_element()、fill_element()などの付加情報の保存を可能にするシンタクス(syntax)が定義されている。MPEG−1 layer−III(mp3)では、"ancillary data"(「付加データ」)というものが定義されていてフレーム情報の中に付加情報を挿入することによって、オーディオに関する付加情報を保存することができる。ID3v1がその代表的な例である。図11に、ID3v1のビットストリーム構造を示す。
しかし、現在標準化されているMPEG−4BSAC(Bit Sliced Arithmetic Coding)オーディオフォーマットのシンタクスには、付加情報の提供を可能にするシンタクスが定義されていない。図12および図13に、BSACシンタクスのフレームヘッダに関する定義を示す。BSACでは、フレームヘッダにこのように付加情報の挿入を可能にするシンタクスが定義されていないために、標準規格によれば付加情報を挿入することが不可能であるということになる。
本発明が解決しようとする技術的課題は、現在標準化されているMPEG−4BSACオーディオフォーマットのビットストリームに付加情報を挿入してオーディオコンテンツに関するメタデータや音質を改善して差別化されたサービスを可能にする、付加情報の挿入されたMPEG−4オーディオBSAC符号化/復号化方法および装置を提供することである。
本発明が解決しようとする他の技術的課題は、MPEG−4BSACにより符号化されたオーディオデータに付加情報が挿入されているか否かの判別方法を提供することである。
前記技術的課題を達成するための本発明による付加情報の挿入されたMPEG−4BSACオーディオビットストリームの符号化方法は、MPEG−4オーディオBSAC符号化方法において、時間領域のオーディオ信号を周波数領域信号に変換して人間の音響心理モデルを用いて量子化する段階と、ビットレートの制御されたオーディオデータのビット数をカウントする段階と、前記カウントされたビット数と使用される(所定の)階層の数を用いて階層当りの可用ビット数を求める段階と、付加情報の大きさを求めて階層当りの利用可能なデータのビット数(以下、可用ビット数という)を修正する段階と、実際のオーディオデータを階層単位で符号化する段階と、符号化されたビットストリームに前記付加情報を追加する段階と、を含むことを特徴とする。前記付加情報は音質改善に関する情報であることが望ましい。また、前記付加情報は音楽の曲に関する情報であることが望ましい。また、前記付加情報は、マルチチャンネルデータに関する情報であることが望ましい。
前記技術的課題を達成するための本発明による付加情報の挿入されたMPEG−4BSACオーディオビットストリームの符号化装置は、MPEG−4オーディオBSAC符号化装置において、時間領域のオーディオ信号を周波数領域信号に変換して人間の音響心理モデルを用いて量子化する量子化処理部と、オーディオデータのビット数と階層数とを用いて階層当りの可用ビット数を求める可用ビット計算部と、付加情報の大きさを求めて前記可用ビット計算部で計算された階層当りの可用ビット数を修正する可用ビット修正部と、実際のオーディオデータを前記可用ビット修正部で修正された階層当りの可用ビット数によって階層単位で符号化し、該符号化されたビットストリームに前記付加情報を追加するビットパッキング部と、を含むことを特徴とする。前記可用ビット計算部は、ビットレートの制御されたオーディオデータのビット数をカウントするビットカウント部と、前記ビットカウント部でカウントされたオーディオデータのビット数と使用される(所定の)階層の数を用いて階層当りの可用ビット数を求める階層別可用ビット計算部と、を備えることが望ましい。
前記技術的課題を達成するための本発明による付加情報の挿入されたMPEG−4BSACオーディオビットストリームの復号化方法は、オーディオビットストリームのヘッダを復号化する段階と、前記ヘッダの情報からフレームサイズを求めてビットストリームの階層構造を計算する段階と、前記階層構造から最上位階層までのデータサイズと前記フレームサイズとを求めて前記最上位階層までのデータサイズと前記フレームサイズとの差を付加情報の大きさに決定する段階と、前記付加情報の大きさに相当するビット数だけ前記ビットストリームから付加情報を抽出する段階と、前記計算されたビットストリームの階層構造によって最上位階層までオーディオデータを復号化する段階と、を含むことを特徴とする。
前記技術的課題を達成するための本発明による付加情報の挿入されたMPEG−4BSACオーディオビットストリームの復号化方法は、ビットストリームのヘッダを復号化する段階と、前記ヘッダの情報からフレームサイズを求めてビットストリームの階層構造を計算する段階と、前記ビットストリームの階層構造から最上位階層までのオーディオデータのサイズに相当するオーディオデータを復号化する段階と、復号化されていない残りのビットストリームを付加情報として抽出して復号化する段階と、を含むことを特徴とする。
前記抽出された付加情報はオーディオ音質改善に関する情報であることが望ましい。前記抽出された付加情報はオーディオデータユーザのためのオーディオに関するメタデータであることが望ましい。
前記技術的課題を達成するための本発明によるMPEG−4BSACオーディオデータの付加情報挿入判別方法は、ビットストリームのヘッダを復号化する段階と、前記ヘッダの情報からフレームサイズを求めてビットストリームの階層構造を計算する段階と、前記階層構造から最上位階層のデータサイズと前記フレームサイズとを求めて前記最上位階層までのデータサイズと前記フレームサイズとの差により付加情報の有無を判別する段階と、を含むことを特徴とする。
前記技術的課題を達成するための本発明による付加情報の挿入されたMPEG−4BSACオーディオビットストリームの復号化装置は、オーディオビットストリームのヘッダを復号化するビットアンパッキング部と、前記ヘッダの情報からフレームサイズを求めてビットストリームの階層構造を計算する階層構造計算部と、前記階層構造から最上位階層までのデータサイズとフレームサイズとを求め、その差を付加情報の大きさに決定する付加情報計算部と、前記付加情報の大きさに相当するビット数だけ前記ビットストリームから付加情報を抽出する付加情報抽出部と、前記計算された前記ビットストリームの階層構造によって最上位階層までオーディオデータを復号化するオーディオ復号化部と、を含むことを特徴とする。
そして、本発明は、前述した方法を情報機器(コンピュータなど)で実行させるためのプログラム、およびそれを記録した情報機器可読記録媒体を提供する。
本発明による付加情報の挿入されたMPEG−4BSACオーディオビットストリームの符号化方法および装置によれば、BSACで符号化されたオーディオビットストリームに付加データ(付加情報)を挿入することによって、オーディオコンテンツに対するメタデータや音質を改善するための追加データを提供して差別化されたサービスが可能となる。
そして、MPEG−4BSACシンタクス上の不可能であった付加情報の挿入を可能にすることによって、オーディオメタデータを挿入してユーザが再生する時にメディアに関する情報を追加的に取得させることができる。
また、MPEG−4BSACシンタクス上の不可能であった付加情報の挿入を可能にすることによって、オーディオ後処理のための付加情報を挿入して低いビットレートで高音質を提供することができるようになる。
また、本発明によりオーディオビットストリームに付加情報を挿入して符号化した場合でも既存の復号化器を使用して復号が可能なので、既存の復号化器と相互に互換可能であり、付加情報を処理することによって付加情報による付加的ないし改善されたサービスが提供できる復号化器(復号化装置)は、そうでない既存の復号化器に比べて競争力が向上する。
以下、添付された図面を参照して、本発明による付加情報の挿入されたMPEG−4オーディオビットストリームのBSAC符号化/復号化方法および装置の実施例を詳細に説明する。
図1は、MPEG−4オーディオBSAC符号化装置の構成例を示すブロック図である。このMPEG−4オーディオBSAC符号化装置は、時間/周波数変換部100と、音響心理モデル部110と、量子化/ビットレート制御部120と、ビットパッキング部130と、を含んでなる。
前記時間/周波数変換部100は、時間領域の入力オーディオ信号(PCMデータ)を周波数領域の信号に変換する。時間上で人間が認知する信号の特性差はあまり大きくないが、このように変換された周波数領域の信号は、人間の音響心理モデルによれば各帯域で人間が感じられる信号と感じられない信号との差が大きいために、各周波数帯域によって異なる量子化ビットを割当てることができるので、圧縮の効率を高めることができる。
音響心理モデル部110は、前記時間/周波数変換部100により周波数成分に変換された入力オーディオ信号を所定の帯域信号単位に束ね、各帯域信号の相互作用により発生するマスキング効果を用いて各帯域でのマスキングスレショルド値(閾値)を計算する。
量子化/ビットレート制御部120は、各帯域の量子化ノイズがマスキングスレショルド値より小さくなるように所定の符号化帯域別に信号を量子化する。すなわち、人間が聞きとれないように各帯域の量子化ノイズの大きさが前記マスキングスレショルド値より小さくなるよう帯域の周波数信号に対してスカラー量子化を使用する。音響心理モデル部110で計算したマスキングスレショルド値と各帯域で発生するノイズの比率であるNMR(Noise-to-Mask Ratio)を用いて、全帯域のNMR値が0dB以下になるように量子化を行う。NMR値が0dBを下回ると、量子化ノイズに比べてマスキングスレショルド値が高いということになるが、これは量子化ノイズを人が聞きとる可能性がないという意味である。
前記ビットパッキング部130は、ビットレートの最も低い基本階層に対応する量子化されたデータを符号化し、前記基本階層に対する符号化が終了すれば、その一階層上の階層に対応する量子化されたデータを符号化し、これを順次あらゆる階層に対して行ってビットストリームを形成する。前記ビットパッキング部130における各階層での量子化されたデータの符号化は、前記量子化されたデータそれぞれを所定の同一数のビットよりなる2進データで表現してビット単位で分割し、前記分割されたビットから重要度の最も高い最上位ビットよりなる最上位ビットシーケンスから最下位ビットシーケンスへ順に符号化することによって実行される。
図2は、本発明の一実施例による付加情報の挿入されたMPEG−4BSACオーディオビットストリームの符号化装置の構成を示すブロック図である。この符号化装置は、量子化処理部200と、可用ビット計算部220と、可用ビット修正部240と、ビットパッキング部260と、を含んでなる。
前記量子化処理部200は、時間領域のオーディオ信号を周波数領域の信号に変換して人間の音響心理モデルを用いて量子化するものであり、時間/周波数変換部20と、音響心理モデル部22と、量子化/ビットレート制御部24とよりなる。前記時間/周波数変換部20、音響心理モデル部22および量子化/ビットレート制御部24は、前述した図1の時間/周波数変換部100、音響心理モデル部110および量子化/ビットレート制御部120に各々対応するものであってその機能は同一である。
前記可用ビット計算部220は、前記量子化されたオーディオデータのビット数と階層数を用いて階層当りの可用ビット数を求めるものであり、ビットカウント部26および階層別可用ビット計算部28よりなる。前記ビットカウント部26は、ビットレートの制御されたオーディオデータのビット数をカウントする。前記階層別可用ビット計算部28は、前記ビットカウント部26でカウントされたオーディオデータのビット数と使用される(所定の)階層の数とを用いて階層当りの可用ビット数を求める。
前記可用ビット修正部240は、挿入しようとする付加情報の大きさを求めて前記可用ビット計算部220で計算された階層当りの可用ビット数を修正する。
前記ビットパッキング部260は、実際のオーディオデータを前記可用ビット修正部240で修正された階層当りの可用ビット数によって階層単位で符号化し、MPEG−4BSACシンタクスを違反せずに符号化されたビットストリームに付加情報を追加する。
図3は、MPEG−4オーディオBSAC符号化装置の動作を示すフローチャートであって、入力されたオーディオ信号がすべて符号化されると、最終的にビットストリームに変換されてファイルとして保存される。このために、まず、入力信号は時間/周波数変換部100でMDCT(Modified Discrete Cosine Transform)や帯域分割フィルターなどにより周波数領域の信号に変換される。そして、音響心理モデル部110で前記周波数信号を適当な帯域で束ねてマスキングスレショルド値を求める。ここで、使われる帯域は主に量子化過程に使われるために量子化帯域とも呼ばれる。量子化/ビットレート制御部120では人間が聞きとれないように各量子化帯域の量子化ノイズの大きさをマスキングスレショルド値より小さくスカラー量子化する(300段階)。
前記量子化/ビットレート制御部120で量子化されたデータはビットパッキング部130により基本階層と複数のenhancement layerとよりなる階層的なビットストリームに符号化される。前記基本階層はビットレートの最も低い階層であり、前記enhancement layerは前記基本階層よりビットレートが高く、前記enhancement layerが進行する(enhanceされる)ほどビットレートは高くなる。このために、まず、BSACビット数をカウントし(310段階)、使用されるビット数を考慮して階層構造を計算して階層当りの可用ビット数を算出する(320段階)。オーディオデータの使用されるビット数をカウントするというのは、1フレーム当り割当てられるビット数を計算することを意味する。ここで、オーディオ信号の符号化はフレーム単位で行われる。ビットレート制御は1フレーム当り割当てられたビット数に合わせて量子化を制御することを言う。例えば、1フレームに1000ビットが割当てられれば、これに合わせて量子化レベルを決定すべきであり、1フレーム当り10000ビットが割当てられれば、量子化レベルをさらに細かく分けることができる。
このように階層構造が計算され、階層当りの可用ビット数が算出されると、前記階層構造に従って基本階層(Base layer)から最上位階層(Top layer)まで符号化した後(330段階)、符号化されたビットストリームをファイルとして保存する(340段階)。
図4は、本発明の一実施例による付加情報の挿入されたMPEG−4BSACオーディオビットストリームの符号化装置の動作を示すフローチャートであって、変換/量子化過程(400段階)、BSACビットカウント過程(410段階)、使われるビット数を考慮して階層構造を計算する階層当りの可用ビット数算出過程(420段階)および符号化されたビットストリームをファイルとして保存する段階(460段階)は、前述した図3の変換/量子化過程(300段階)、BSACビットカウント過程(310段階)、使われるビット数考慮して階層構造を計算する階層当りの可用ビット数算出過程(320段階)および符号化されたビットストリームをファイルとして保存する段階(340段階)と同一である。
従って、以下、本発明の一実施例による付加情報の挿入されたMPEG−4BSACオーディオビットストリームの符号化装置の特徴的な動作に焦点を絞って説明する。前記可用ビット計算部220のビットカウント部26によりビットレートの制御されたオーディオデータのBSACビット数をカウントした後(410段階)、階層別可用ビット計算部28により使われるビット数と階層数を用いて階層当りの可用ビット数を求める(420段階)。次いで、可用ビット修正部240により付加情報の大きさを求めて階層当りの可用ビット数を修正する(430段階)。これにより、前記計算された階層構造によってビットパッキング部260により基本階層から最上位階層まで符号化され(440段階)、符号化されたビットストリームの最後の部分に付加情報を追加する(450段階)。
前記付加情報は、音楽の曲に関する情報、例えば、音楽のタイトル、歌詞、作曲家、歌手名などID3v1の付加情報のようなユーザのためのメタデータとすることができる。そして、前記付加情報はマルチチャンネルデータに関する情報とすることができる。また、音質を向上させるためのオーディオ後処理情報とすることもできる。
図5は、MPEG−4オーディオBSAC復号化装置の構成を示すブロック図である。このMPEG−4オーディオBSAC復号化装置は、ビットアンパッキング部500と、逆量子化部510と、逆変換部520と、を含んでなる。
前記ビットアンパッキング部500は、階層的構造を有するビットストリームにおける階層が生成された順序で量子化されたデータを復号化する。すなわち、前記ビットストリームを構成しているビットの重要度を分析し、重要度の高いビットから重要度の低いビットへ(最上位階層から基本階層へ)順に前記階層別に復号化する。前記逆量子化部510は、復号化された量子化データを元の大きさの信号に復元する。前記逆変換部520は、周波数領域のオーディオ信号を再び時間領域の信号(PCMデータ)に変換してユーザがオーディオ信号を再生可能にする。
図6は、本発明の一実施例による付加情報の挿入されたMPEG−4BSACオーディオビットストリームの復号化装置の構成を示すブロック図である。この復号化装置は、ビットアンパッキング部600と、オーディオ復号化部610と、階層構造計算部630と、付加情報計算部640と、付加情報抽出部650と、を含んでなる。
前記ビットアンパッキング部600は、オーディオビットストリームのヘッダを復号化する。前記階層構造計算部630は、前記ヘッダ情報からフレームサイズを取得してビットストリームの階層構造を計算する。前記付加情報計算部640は、前記階層構造から前記最上位階層までのデータサイズとフレームサイズとを求め、その差を付加情報の大きさとして決定する。前記付加情報抽出部650は、前記付加情報の大きさに相当するビット数だけビットストリームから付加情報を抽出する。前記オーディオ復号化部610は、前記計算されたビットストリームの階層構造によって最上位階層までオーディオデータを復号化するものであり、逆量子化部60および逆変換部65よりなる。前記逆量子化部60および逆変換部65は前述した図5の逆量子化部510および逆変換部520と同じ機能を有する。
図7は、本発明の一実施例によるMPEG−4オーディオBSAC復号化装置の動作を示すフローチャートである。図7を参照して本発明の一実施例による付加情報の挿入されたMPEG−4BSACオーディオビットストリームの復号化方法を説明する。
ビットストリームの復号化過程は符号化過程の逆順である。まず、ビットストリームのヘッダ情報を復号化する(700段階)。前記ヘッダ情報からフレームサイズを求めて復号化に必要なオーディオデータの階層構造を計算する(710段階)。
前記フレームサイズを考慮して階層構造を計算するということは、フレームサイズが1000ビットであり、階層数が10という情報が転送されれば、1階層当り100ビットずつ割当てられることを意味する。前記階層構造から最上位階層のデータサイズとフレームサイズとを求めて前記最上位階層までのデータサイズとフレームサイズとの差を付加情報の大きさとして決定する(740段階)。また、前記700段階、710段階および740段階を行った後には、MPEG−4オーディオの付加情報が挿入されているか否かを判別することができる。すなわち、フレームサイズが最上位階層までのデータサイズより大きければ、付加情報が挿入されたと判断し、フレームサイズが最上位階層までのデータサイズより大きくなければ、付加情報が挿入されていないと判断することができる。
そして、前記740段階で最上位階層までのデータサイズとフレームサイズとの差を求めて付加情報の大きさを求めるということは、最上位階層までのビット数が710段階によって1階層当り100ビットずつ1000ビットであり、転送されたフレーム長情報が1050ビットであれば、付加情報は50ビットになるということを意味する。したがって、最後の50ビットを付加情報として抽出すればよい。
すなわち、前記付加情報の大きさに相当するビット数だけビットストリームから付加情報を抽出する(750段階)。
一方、前記計算されたビットストリームの階層構造によって最上位階層までオーディオデータを復号化する(720段階)。前記オーディオ信号の復号化は基本階層に関する情報を復号化する。基本階層に割当てられたデータサイズのビットストリームに対する復号化が終わると、その次の階層に対する付加情報とオーディオデータの量子化値を復号化する。このような方法ですべての階層のデータを復号化することができる。このように復号化過程を経て量子化されたデータは、図6に示す逆量子化部60と逆変換部65とを経て復元された信号を作ることができる。それから逆量子化および逆変換を経て復元された信号を生成する(730段階)。
一方、図8は本発明による前記付加情報の挿入されたMPEG−4BSACオーディオビットストリームの復号化のさらに他の方法を示すフローチャートであって、これを説明すれば次の通りである。まず、ビットストリームのヘッダを復号化し(800段階)、前記ヘッダ情報からフレームサイズを求めてビットストリームの階層構造を計算する(810段階)。次いで、前記ビットストリームの階層構造から最上位階層のオーディオデータのサイズに相当するオーディオデータを復号化する(820段階)。前記復号化されていない残りのビットストリームを付加情報として抽出して復号化する(830段階)。
MPEG−4BSACは階層構造を用いればFGS(Fine Grain Scalability)が可能である。階層構造に関する情報は、BSACシンタクスにより定義されて前記700段階で情報を抽出し、前記710段階でこの情報を用いて実際階層データを計算する。階層当りの可用ビット数を計算するためのpseudo codeは次の通りである。前記過程は復号化装置および符号化装置で同一に適用される。Pseudo codeに使われる変数名はISO/IEC 14496−3標準文書の4.5.2.6.2節に現れている。
Figure 2005157390
Figure 2005157390
Figure 2005157390
Figure 2005157390
Figure 2005157390
Figure 2005157390
Figure 2005157390
前述したように階層当りの使用可能なビット数に相当するlayer_bit_offsetを求めた後、これによりオーディオ情報を階層別に符号化する。
図9はBSACのビットストリーム構造であり、図10はBSACビットストリームに付加情報が挿入される位置を示す。
本発明は次のように使用することができる。第1は、MPEG−4BSACオーディオ符号化装置を用いて48kbpsの容量で圧縮する時、周波数帯域を0〜7kHzだけカバーするように符号化した後、7〜16kHzに関する情報はSBR(Spectral Band Replication)を用いてビットストリームを生成した後、付加情報としてSBRビットストリームを挿入し、ファイルとして保存する方法がある。かかる場合には、SBR付加情報を認識可能な復号化装置では0〜16kHzのサウンドを復号化でき、低いビットレートでも良い音質を提供できる。しかし、既存のMPEG−4BSAC復号化装置では、SBR情報抽出が不可能なので0〜7kHZの帯域のサウンドだけを聞け、SBRデータはダミーデータと見なすようになる。
第2は、MPEG−4BSACオーディオ符号化装置を用いて128kbpsの音楽を圧縮する時、歌詞を挿入しようとすれば、歌詞と音楽との時間情報を整列してその時間に合う歌詞情報をオーディオビットストリーム内に付加情報として符号化することによって、さらなる時間情報なしに歌詞を出力することができる。既存のMPEG−4BSACでは歌詞に関する情報を受けずにサウンドだけ復号化することができる。
本発明はコンピュータをはじめとする情報機器可読記録媒体にコンピュータをはじめとする情報機器可読(プログラム)コードとして具現することが可能である。コンピュータをはじめとする情報機器可読記録媒体は、コンピュータをはじめとする情報機器システムによって読取られるデータが保存されるあらゆる種類の記録装置を含む。コンピュータをはじめとする情報機器可読記録装置の例としては、ROM、RAM、CD−ROM、磁気テープ、フロッピーディスク、光データ記憶装置などがある。
本発明は図面に示された実施例に基づいて説明されたが、これは例示的なものに過ぎず、当業者ならばこれより多様な変形および均等な他の実施例が可能であるという点を理解できるであろう。したがって、本発明の真の技術的範囲は特許請求の範囲の技術的思想によって決まるべきである。
本発明はMPEGオーディオ符号化/復号化に有用に適用され、特に付加情報の挿入されたMPEG−4BSACオーディオビットストリームの符号化/復号化に有用である。
MPEG−4BSACオーディオ符号化装置の構成を示すブロック図である。 本発明の一実施例による付加情報の挿入されたMPEG−4BSACオーディオビットストリームの符号化装置の構成を示すブロック図である。 MPEG−4オーディオBSAC符号化装置の動作を示すフローチャートである。 本発明の一実施例による付加情報の挿入されたMPEG−4BSACオーディオビットストリームの符号化装置の動作を示すフローチャートである。 MPEG−4オーディオBSAC復号化装置の構成を示すブロック図である。 本発明の一実施例による付加情報の挿入されたMPEG−4BSACオーディオビットストリームの復号化装置の構成を示すブロック図である。 本発明の一実施例によるMPEG−4オーディオBSAC復号化装置の動作を示すフローチャートである。 本発明による前記付加情報の挿入されたMPEG−4BSACオーディオビットストリームの復号化の他の方法を示すフローチャートである。 BSACのビットストリーム構造を示す図面である。 BSACビットストリームに付加情報が挿入される位置を示す図面である。 ID3v1のビットストリーム構造を示す図面である。 MPEG−4BSACシンタクスのうちbsac_header()を示す図面である。 MPEG−4BSACシンタクスのうちgeneral_header()を示す図面である。

Claims (15)

  1. MPEG−4オーディオBSAC符号化方法において、
    時間領域のオーディオ信号を周波数領域信号に変換し、人間の音響心理モデルを用いて量子化する段階と、
    ビットレートの制御されたオーディオデータのビット数をカウントする段階と、
    前記カウントされたビット数と使用される階層の数を用いて階層当りの可用ビット数を求める段階と、
    付加情報の大きさを求めて階層当りの可用ビット数を修正する段階と、
    実際のオーディオデータを階層単位で符号化して、符号化されたビットストリームを生成する段階と、
    前記符号化されたビットストリームに前記付加情報を追加する段階と、
    を含むことを特徴とする付加情報の挿入されたMPEG−4BSACオーディオビットストリームの符号化方法。
  2. 前記付加情報は、
    音質改善に関する情報であることを特徴とする請求項1に記載の付加情報の挿入されたMPEG−4BSACオーディオビットストリームの符号化方法。
  3. 前記付加情報は、
    音楽の曲に関する情報であることを特徴とする請求項1に記載の付加情報の挿入されたMPEG−4BSACオーディオビットストリームの符号化方法。
  4. 前記付加情報は、
    マルチチャンネルデータに関する情報であることを特徴とする請求項1に記載の付加情報の挿入されたMPEG−4BSACオーディオビットストリームの符号化方法。
  5. MPEG−4オーディオBSAC符号化装置において、
    時間領域のオーディオ信号を周波数領域信号に変換し、人間の音響心理モデルを用いて量子化する量子化処理部と、
    オーディオデータのビット数と階層数とを用いて階層当りの可用ビット数を求める可用ビット計算部と、
    付加情報の大きさを求めて前記可用ビット計算部で計算された階層当りの可用ビット数を修正する可用ビット修正部と、
    実際のオーディオデータを前記可用ビット修正部で修正された階層当りの可用ビット数によって階層単位で符号化して符号化されたビットストリームを生成し、該符号化されたビットストリームに前記付加情報を追加するビットパッキング部と、を含むことを特徴とする付加情報の挿入されたMPEG−4BSACオーディオビットストリームの符号化装置。
  6. 前記可用ビット計算部は、
    ビットレートの制御されたオーディオデータのビット数をカウントするビットカウント部と、
    前記ビットカウント部でカウントされたオーディオデータのビット数と使用される階層の数を用いて階層当りの可用ビット数を求める階層別可用ビット計算部と、を備えることを特徴とする請求項5に記載の付加情報の挿入されたMPEG−4BSACオーディオビットストリームの符号化装置。
  7. オーディオビットストリームのヘッダを復号化する段階と、
    前記ヘッダの情報からフレームサイズを求めてビットストリームの階層構造を計算する段階と、
    前記階層構造から最上位階層までのデータサイズと前記フレームサイズとを求めて前記最上位階層までのデータサイズと前記フレームサイズとの差を付加情報の大きさに決定する段階と、
    前記付加情報の大きさに相当するビット数だけ前記ビットストリームから付加情報を抽出する段階と、
    前記計算されたビットストリームの階層構造によって最上位階層までオーディオデータを復号化する段階と、を含むことを特徴とする付加情報の挿入されたMPEG−4BSACオーディオビットストリームの復号化方法。
  8. 前記抽出された付加情報は、
    オーディオ音質改善に関する情報であることを特徴とする請求項7に記載の付加情報の挿入されたMPEG−4BSACオーディオビットストリームの復号化方法。
  9. 前記抽出された付加情報は、
    オーディオデータユーザのためのオーディオに関するメタデータであることを特徴とする請求項7に記載の付加情報の挿入されたMPEG−4BSACオーディオビットストリームの復号化方法。
  10. ビットストリームのヘッダを復号化する段階と、
    前記ヘッダ情報からフレームサイズを求めてビットストリームの階層構造を計算する段階と、
    前記ビットストリームの階層構造から最上位階層までのオーディオデータの大きさに相当するオーディオデータを復号化する段階と、
    復号化されていない残りのビットストリームを付加情報として抽出して復号化する段階と、を含むことを特徴とする付加情報の挿入されたMPEG−4BSACオーディオビットストリームの復号化方法。
  11. 前記抽出された付加情報は、
    オーディオ音質改善に関する情報であることを特徴とする請求項10に記載の付加情報の挿入されたMPEG−4BSACオーディオビットストリームの復号化方法。
  12. 前記抽出された付加情報は、
    オーディオデータユーザのためのオーディオに関するメタデータであることを特徴とする請求項10に記載の付加情報の挿入されたMPEG−4BSACオーディオビットストリームの復号化方法。
  13. ビットストリームのヘッダを復号化する段階と、
    前記ヘッダの情報からフレームサイズを求めてビットストリームの階層構造を計算する段階と、
    前記階層構造から最上位階層のサイズと前記フレームサイズとを求めて前記最上位階層までのデータサイズと前記フレームサイズとの差により付加情報の有無を判別する段階と、を含むことを特徴とするMPEG−4BSACオーディオデータの付加情報挿入判別方法。
  14. オーディオビットストリームのヘッダを復号化するビットアンパッキング部と、
    前記ヘッダの情報からフレームサイズを求めてビットストリームの階層構造を計算する階層構造計算部と、
    前記階層構造から最上位階層までのデータサイズとフレームサイズとを求め、その差を付加情報の大きさに決定する付加情報計算部と、
    前記付加情報の大きさに相当するビット数だけ前記ビットストリームから付加情報を抽出する付加情報抽出部と、
    前記計算されたビットストリームの階層構造によって前記最上位階層までオーディオデータを復号化するオーディオ復号化部と、を含むことを特徴とする付加情報の挿入されたMPEG−4BSACオーディオビットストリームの復号化装置。
  15. 請求項1ないし4、7ないし13のうち何れか1項に記載の方法を情報機器で実行させるためのプログラムを記録した情報機器可読記録媒体。
JP2004341556A 2003-11-26 2004-11-26 付加情報の挿入されたmpeg−4bsacオーディオビットストリームの符号化方法および復号化方法ならびに符号化装置および復号化装置 Pending JP2005157390A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030084731A KR100571824B1 (ko) 2003-11-26 2003-11-26 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치

Publications (1)

Publication Number Publication Date
JP2005157390A true JP2005157390A (ja) 2005-06-16

Family

ID=34464753

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004341556A Pending JP2005157390A (ja) 2003-11-26 2004-11-26 付加情報の挿入されたmpeg−4bsacオーディオビットストリームの符号化方法および復号化方法ならびに符号化装置および復号化装置

Country Status (5)

Country Link
US (1) US7974840B2 (ja)
EP (1) EP1536410A1 (ja)
JP (1) JP2005157390A (ja)
KR (1) KR100571824B1 (ja)
CN (1) CN100525457C (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007310087A (ja) * 2006-05-17 2007-11-29 Mitsubishi Electric Corp 音声符号化装置及び音声復号装置
JP2009516402A (ja) * 2005-09-14 2009-04-16 エルジー エレクトロニクス インコーポレイティド 符号化/復号化方法及び装置
JP2009527790A (ja) * 2006-02-23 2009-07-30 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2374309T3 (es) * 2005-07-14 2012-02-15 Koninklijke Philips Electronics N.V. Decodificación de audio.
KR20070038699A (ko) * 2005-10-06 2007-04-11 삼성전자주식회사 스케일러블 오디오 데이터 산술복호화 방법 및 장치
EP1949693B1 (en) 2005-10-12 2012-04-18 Samsung Electronics Co., Ltd. Method and apparatus for processing/transmitting bit-stream, and method and apparatus for receiving/processing bit-stream
KR100813269B1 (ko) 2005-10-12 2008-03-13 삼성전자주식회사 비트 스트림 처리/전송 방법 및 장치, 비트 스트림수신/처리 방법 및 장치
KR100851972B1 (ko) * 2005-10-12 2008-08-12 삼성전자주식회사 오디오 데이터 및 확장 데이터 부호화/복호화 방법 및 장치
KR100771620B1 (ko) * 2005-10-18 2007-10-30 엘지전자 주식회사 디지털 신호 전송 방법
KR101204513B1 (ko) * 2005-12-20 2012-11-26 삼성전자주식회사 디지털 멀티미디어 재생 장치 및 디지털 멀티미디어 재생장치에서 디지털 멀티미디어 방송을 제공하는 방법
KR100878766B1 (ko) 2006-01-11 2009-01-14 삼성전자주식회사 오디오 데이터 부호화 및 복호화 방법과 장치
KR101322392B1 (ko) * 2006-06-16 2013-10-29 삼성전자주식회사 스케일러블 코덱의 부호화 및 복호화 방법 및 장치
JP2008076847A (ja) * 2006-09-22 2008-04-03 Matsushita Electric Ind Co Ltd 復号器及び信号処理システム
GB2451419A (en) * 2007-05-11 2009-02-04 Audiosoft Ltd Processing audio data
US7987285B2 (en) * 2007-07-10 2011-07-26 Bytemobile, Inc. Adaptive bitrate management for streaming media over packet networks
KR100912826B1 (ko) * 2007-08-16 2009-08-18 한국전자통신연구원 G.711 코덱의 음질 향상을 위한 향상 계층 부호화 및복호화 장치와 그 방법
KR20100136890A (ko) * 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
US20110087494A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
JP2012010311A (ja) 2010-05-26 2012-01-12 Sony Corp 送信装置、送信方法、受信装置、受信方法および送受信システム
KR101425821B1 (ko) * 2010-11-02 2014-08-01 에스케이텔레콤 주식회사 오디오 신호에 기초한 음파 통신으로 디지털 미디어 방송정보의 전달 시스템 및 방법, 그리고 이에 적용되는 장치
WO2013058634A2 (ko) 2011-10-21 2013-04-25 삼성전자 주식회사 에너지 무손실 부호화방법 및 장치, 오디오 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 오디오 복호화방법 및 장치
CN103219009A (zh) * 2012-01-20 2013-07-24 旭扬半导体股份有限公司 音频数据处理装置及其方法
EP2873073A1 (en) 2012-07-12 2015-05-20 Dolby Laboratories Licensing Corporation Embedding data in stereo audio using saturation parameter modulation
US9559651B2 (en) * 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
KR101427756B1 (ko) * 2013-04-26 2014-08-08 주식회사 코아로직 멀티 채널의 오디오 신호 전송 방법 및 장치
US10140996B2 (en) 2014-10-10 2018-11-27 Qualcomm Incorporated Signaling layers for scalable coding of higher order ambisonic audio data
US9984693B2 (en) * 2014-10-10 2018-05-29 Qualcomm Incorporated Signaling channels for scalable coding of higher order ambisonic audio data
TW202242853A (zh) * 2015-03-13 2022-11-01 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
TWI807562B (zh) 2017-03-23 2023-07-01 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
CN114303189A (zh) * 2019-08-15 2022-04-08 杜比实验室特许公司 用于生成和处理经修改的比特流的方法和设备
US11250867B1 (en) * 2019-10-08 2022-02-15 Rockwell Collins, Inc. Incorporating data into a voice signal with zero overhead
CN110827838A (zh) * 2019-10-16 2020-02-21 云知声智能科技股份有限公司 一种基于opus的语音编码方法及装置
CN113272895A (zh) * 2019-12-16 2021-08-17 谷歌有限责任公司 音频编码中的与振幅无关的窗口大小
CN112735446B (zh) * 2020-12-30 2022-05-17 北京百瑞互联技术有限公司 在lc3音频码流中添加额外信息的方法、系统及介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07253796A (ja) * 1994-03-15 1995-10-03 Matsushita Electric Ind Co Ltd デジタル信号記録装置及びデジタル信号再生装置
JPH10233692A (ja) * 1997-01-16 1998-09-02 Sony Corp オーディオ信号符号化装置および符号化方法並びにオーディオ信号復号装置および復号方法
JPH11317672A (ja) * 1997-11-20 1999-11-16 Samsung Electronics Co Ltd ビット率の調節可能なステレオオーディオ符号化/復号化方法及び装置
JPH11339396A (ja) * 1998-05-29 1999-12-10 Hitachi Ltd 情報再生装置
JP2000175155A (ja) * 1998-12-08 2000-06-23 Canon Inc 放送受信装置およびその方法
JP2001242899A (ja) * 2000-02-29 2001-09-07 Toshiba Corp 音声符号化方法及び装置並びに及び音声復号方法及び装置
JP2002100994A (ja) * 2000-07-14 2002-04-05 Nokia Mobile Phones Ltd 媒体ストリームのスケーラブル符号化方法、スケーラブルエンコーダおよびマルチメディア端末
JP2002300504A (ja) * 2001-03-29 2002-10-11 Toshiba Corp マルチメディアコンテンツ配信の受信方法、受信装置及びマルチメディアコンテンツ配信装置
JP2002341900A (ja) * 2001-05-17 2002-11-29 Sony Corp 高能率符号化方法、高能率符号化装置、符号化データ復号方法、符号化データ復号装置、データ伝送方法、データ伝送装置、付加情報付加方法、付加情報付加装置および記録媒体

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US4949299A (en) * 1987-12-04 1990-08-14 Allen-Bradley Company, Inc. Industrial control communication network and method
AU653582B2 (en) * 1991-01-08 1994-10-06 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US5649029A (en) * 1991-03-15 1997-07-15 Galbi; David E. MPEG audio/video decoder
JP2785220B2 (ja) * 1992-09-22 1998-08-13 ソニー株式会社 データ符号化装置および方法、並びにデータ復号化装置および方法
US5657423A (en) * 1993-02-22 1997-08-12 Texas Instruments Incorporated Hardware filter circuit and address circuitry for MPEG encoded data
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
DE69427212T2 (de) * 1993-07-30 2001-11-15 Texas Instruments Inc Modulare Audiodaten-Verarbeitungsarchitektur
US5533052A (en) * 1993-10-15 1996-07-02 Comsat Corporation Adaptive predictive coding with transform domain quantization based on block size adaptation, backward adaptive power gain control, split bit-allocation and zero input response compensation
US5434913A (en) * 1993-11-24 1995-07-18 Intel Corporation Audio subsystem for computer-based conferencing system
US6125398A (en) * 1993-11-24 2000-09-26 Intel Corporation Communications subsystem for computer-based conferencing system using both ISDN B channels for transmission
US5764698A (en) * 1993-12-30 1998-06-09 International Business Machines Corporation Method and apparatus for efficient compression of high quality digital audio
US5761636A (en) * 1994-03-09 1998-06-02 Motorola, Inc. Bit allocation method for improved audio quality perception using psychoacoustic parameters
US5732391A (en) * 1994-03-09 1998-03-24 Motorola, Inc. Method and apparatus of reducing processing steps in an audio compression system using psychoacoustic parameters
JP3190204B2 (ja) * 1994-04-12 2001-07-23 ユナイテッド・モジュール・コーポレーション Mpeg規格の音声信号デコーダ
JPH0856356A (ja) * 1994-08-10 1996-02-27 Fujitsu Ltd 符号化装置および復号化装置
US5694332A (en) * 1994-12-13 1997-12-02 Lsi Logic Corporation MPEG audio decoding system with subframe input buffering
JP3614907B2 (ja) * 1994-12-28 2005-01-26 株式会社東芝 データ再送制御方法及びデータ再送制御システム
JP3046213B2 (ja) * 1995-02-02 2000-05-29 三菱電機株式会社 サブバンド・オーディオ信号合成装置
US6041295A (en) * 1995-04-10 2000-03-21 Corporate Computer Systems Comparing CODEC input/output to adjust psycho-acoustic parameters
JPH0917159A (ja) 1995-06-30 1997-01-17 Pioneer Electron Corp 情報記録装置及び情報再生装置並びに情報記録媒体
US7095871B2 (en) * 1995-07-27 2006-08-22 Digimarc Corporation Digital asset management and linking media signals with related data using watermarks
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US6138051A (en) * 1996-01-23 2000-10-24 Sarnoff Corporation Method and apparatus for evaluating an audio decoder
JPH09237752A (ja) * 1996-03-01 1997-09-09 Nikon Corp 投影光学系の調整方法及び該方法を使用する投影露光装置
GB0023099D0 (en) 1996-07-02 2000-11-01 Yamaha Corp Method and device for storing main information with associated additional information incorporated therein
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
US5893066A (en) * 1996-10-15 1999-04-06 Samsung Electronics Co. Ltd. Fast requantization apparatus and method for MPEG audio decoding
US5969764A (en) * 1997-02-14 1999-10-19 Mitsubishi Electric Information Technology Center America, Inc. Adaptive video coding method
JP2001511971A (ja) * 1997-02-17 2001-08-14 コミュニケイション アンド コントロール エレクトロニクス リミテッド ローカル通信システム
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
US5986200A (en) * 1997-12-15 1999-11-16 Lucent Technologies Inc. Solid state interactive music playback device
JP3504485B2 (ja) 1998-01-05 2004-03-08 シャープ株式会社 楽音符号化装置および楽音復号化装置および楽音符号化復号化装置およびプログラム記憶媒体
US6339760B1 (en) * 1998-04-28 2002-01-15 Hitachi, Ltd. Method and system for synchronization of decoded audio and video by adding dummy data to compressed audio data
US6061655A (en) * 1998-06-26 2000-05-09 Lsi Logic Corporation Method and apparatus for dual output interface control of audio decoder
US6098044A (en) * 1998-06-26 2000-08-01 Lsi Logic Corporation DVD audio decoder having efficient deadlock handling
US6119091A (en) * 1998-06-26 2000-09-12 Lsi Logic Corporation DVD audio decoder having a direct access PCM FIFO
US6208276B1 (en) * 1998-12-30 2001-03-27 At&T Corporation Method and apparatus for sample rate pre- and post-processing to achieve maximal coding gain for transform-based audio encoding and decoding
EP1059756A1 (en) * 1999-06-09 2000-12-13 Lucent Technologies Inc. Speech transmission over packet switched networks
US6879652B1 (en) * 2000-07-14 2005-04-12 Nielsen Media Research, Inc. Method for encoding an input signal
US7069208B2 (en) * 2001-01-24 2006-06-27 Nokia, Corp. System and method for concealment of data loss in digital audio transmission
US20020165720A1 (en) * 2001-03-02 2002-11-07 Johnson Timothy M. Methods and system for encoding and decoding a media sequence
EP1315148A1 (en) * 2001-11-17 2003-05-28 Deutsche Thomson-Brandt Gmbh Determination of the presence of ancillary data in an audio bitstream
US6950794B1 (en) * 2001-11-20 2005-09-27 Cirrus Logic, Inc. Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression
AU2003213439A1 (en) * 2002-03-08 2003-09-22 Nippon Telegraph And Telephone Corporation Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US20040181817A1 (en) * 2003-03-12 2004-09-16 Larner Joel B. Media control system and method
US7395346B2 (en) * 2003-04-22 2008-07-01 Scientific-Atlanta, Inc. Information frame modifier

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07253796A (ja) * 1994-03-15 1995-10-03 Matsushita Electric Ind Co Ltd デジタル信号記録装置及びデジタル信号再生装置
JPH10233692A (ja) * 1997-01-16 1998-09-02 Sony Corp オーディオ信号符号化装置および符号化方法並びにオーディオ信号復号装置および復号方法
JPH11317672A (ja) * 1997-11-20 1999-11-16 Samsung Electronics Co Ltd ビット率の調節可能なステレオオーディオ符号化/復号化方法及び装置
JPH11339396A (ja) * 1998-05-29 1999-12-10 Hitachi Ltd 情報再生装置
JP2000175155A (ja) * 1998-12-08 2000-06-23 Canon Inc 放送受信装置およびその方法
JP2001242899A (ja) * 2000-02-29 2001-09-07 Toshiba Corp 音声符号化方法及び装置並びに及び音声復号方法及び装置
JP2002100994A (ja) * 2000-07-14 2002-04-05 Nokia Mobile Phones Ltd 媒体ストリームのスケーラブル符号化方法、スケーラブルエンコーダおよびマルチメディア端末
JP2002300504A (ja) * 2001-03-29 2002-10-11 Toshiba Corp マルチメディアコンテンツ配信の受信方法、受信装置及びマルチメディアコンテンツ配信装置
JP2002341900A (ja) * 2001-05-17 2002-11-29 Sony Corp 高能率符号化方法、高能率符号化装置、符号化データ復号方法、符号化データ復号装置、データ伝送方法、データ伝送装置、付加情報付加方法、付加情報付加装置および記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009516402A (ja) * 2005-09-14 2009-04-16 エルジー エレクトロニクス インコーポレイティド 符号化/復号化方法及び装置
JP2009527790A (ja) * 2006-02-23 2009-07-30 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
JP2007310087A (ja) * 2006-05-17 2007-11-29 Mitsubishi Electric Corp 音声符号化装置及び音声復号装置

Also Published As

Publication number Publication date
US20050129109A1 (en) 2005-06-16
EP1536410A1 (en) 2005-06-01
KR100571824B1 (ko) 2006-04-17
KR20050051046A (ko) 2005-06-01
CN1684523A (zh) 2005-10-19
US7974840B2 (en) 2011-07-05
CN100525457C (zh) 2009-08-05

Similar Documents

Publication Publication Date Title
KR100571824B1 (ko) 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
JP3354863B2 (ja) ビット率の調節可能なオーディオデータ符号化/復号化方法及び装置
EP1715476B1 (en) Low-bitrate encoding/decoding method and system
KR101237413B1 (ko) 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치
KR100707177B1 (ko) 디지털 신호 부호화/복호화 방법 및 장치
KR20100089772A (ko) 오디오 신호의 부호화 및 복호화 방법 및 그 장치
KR20070037945A (ko) 오디오 신호의 부호화/복호화 방법 및 장치
JP2004199064A (ja) ビット率を調節できるオーディオ符号化方法、復号方法、符号化装置及び復号装置
WO2003063135A1 (en) Audio coding method and apparatus using harmonic extraction
JP3964860B2 (ja) ステレオオーディオの符号化方法、ステレオオーディオ符号化装置、ステレオオーディオの復号化方法、ステレオオーディオ復号化装置及びコンピュータで読み取り可能な記録媒体
JP5587599B2 (ja) 量子化方法、符号化方法、量子化装置、符号化装置、逆量子化方法、復号化方法、逆量子化装置、復号化装置、処理装置
US7983346B2 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
KR100707173B1 (ko) 저비트율 부호화/복호화방법 및 장치
JP2004184975A (ja) 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置
US20080133250A1 (en) Method and Related Device for Improving the Processing of MP3 Decoding and Encoding
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
KR100300887B1 (ko) 디지털 오디오 데이터의 역방향 디코딩 방법
KR100754389B1 (ko) 음성 및 오디오 신호 부호화 장치 및 방법
KR100928966B1 (ko) 저비트율 부호화/복호화방법 및 장치
KR100940532B1 (ko) 저비트율 복호화방법 및 장치
WO2009136872A1 (en) Method and device for encoding an audio signal, method and device for generating encoded audio data and method and device for determining a bit-rate of an encoded audio signal

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061026

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20061027

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100720

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100803

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101104

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101109

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101203

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110203

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110913