JP2012238034A - マルチチャンネルオーディオ信号復号化方法 - Google Patents

マルチチャンネルオーディオ信号復号化方法 Download PDF

Info

Publication number
JP2012238034A
JP2012238034A JP2012198966A JP2012198966A JP2012238034A JP 2012238034 A JP2012238034 A JP 2012238034A JP 2012198966 A JP2012198966 A JP 2012198966A JP 2012198966 A JP2012198966 A JP 2012198966A JP 2012238034 A JP2012238034 A JP 2012238034A
Authority
JP
Japan
Prior art keywords
channel
data
audio
audio data
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012198966A
Other languages
English (en)
Inventor
殷 美 ▲呉▼
Eun-Mi Oh
Mi Young Kim
美 英 金
Shoko Kim
▲尚▼ ▲煌▼ 金
Dokyo Kin
度 亨 金
Jung-Hoe Kim
重 會 金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2012238034A publication Critical patent/JP2012238034A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/50Constructional details
    • H04N23/55Optical parts specially adapted for electronic image sensors; Mounting thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B17/00Details of cameras or camera bodies; Accessories therefor
    • G03B17/02Bodies
    • G03B17/08Waterproof bodies or housings
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B17/00Details of cameras or camera bodies; Accessories therefor
    • G03B17/02Bodies
    • G03B17/12Bodies with means for supporting objectives, supplementary lenses, filters, masks, or turrets
    • G03B17/14Bodies with means for supporting objectives, supplementary lenses, filters, masks, or turrets interchangeably
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N25/00Circuitry of solid-state image sensors [SSIS]; Control thereof
    • H04N25/70SSIS architectures; Circuits associated therewith
    • H04N25/71Charge-coupled device [CCD] sensors; Charge-transfer registers specially adapted for CCD sensors

Abstract

【課題】 MPEG標準化に符合しつつ、多チャンネルBSACの性能を向上させる。
【解決手段】 オーディオデータを復号化する段階と、オーディオデータのペイロードの終結を示す識別コードを検出する段階と、拡張データのペイロードの開始を示す識別コードを検出する段階と、拡張データのタイプを検出する段階と、検出されたタイプが、オーディオデータのチャンネルをマルチチャンネルに拡張する拡張データを示しているか否かを判断する段階と、判断段階で示していると判断されれば、オーディオデータのチャンネルをマルチチャンネルに拡張する拡張データを復号化する段階と、を含み、拡張データは、少なくともオーディオチャンネルの構成を表し、チャンネルをスピーカにマッピングするときのチャンネルの数を規定するチャンネル構成インデックスで表現される拡張チャンネルのタイプ情報を含む。
【選択図】 図3

Description

本発明は、マルチチャンネルオーディオデータ符号化方法、マルチチャンネルオーディオデータ復号化方法、マルチチャンネルオーディオデータ符号化装置、マルチチャンネルオーディオデータ復号化装置、マルチチャンネルオーディオデータを符号化するためのプログラムを記録した媒体及びマルチチャンネルオーディオデータを復号化するためのプログラムを記録した記録媒体に関する。
地上波DMB(Digital Multimedia Broadcasting)では2003年オーディオコーデックとしてMPEG−4 BSAC(Bit Sliced Arithmatic Coding)を採択した。現在ではステレオのみをサービスしているが、今後はマルチチャンネルサービスに拡張することが予想される。MPEG−4 BSACは、圧縮効率に加えて、帯域幅拡大や空間的なオーディオなどを改良する必要がある。
既存のBSACマルチチャンネルでは、中央、前左右、後左右チャンネルなどのチャンネルが、一つの階層に交互にコード化される。図1は、既存のマルチチャンネルBSAC構造を示すものであって、各チャンネルがインターリーブされている。BSAC構造は、微細階層機能を提供する。すなわち、一つの階層に5チャンネルがそれぞれ存在して、最後の階層からそれぞれの階層のデータを断絶することができる。そして、チャンネルについてのツール付加情報が、ジェネラルヘッダ(general_header)に定義されている。チャンネルごとに信号特性を考慮した個別的な付加情報があって初めて、高性能圧縮が可能である。
図2は、従来のオーディオ符号化装置の機能モジュールを示すブロック図である。従来のオーディオ符号化装置は、心理音響モデル部200、時間/周波数マッピング部210、TNS(temporal noise shaping、時間領域ノイズ形象化)部220、強度(Intensity)ステレオ処理部230、知覚ノイズ代替部240、M/S(Mid/Side)ステレオ処理部250、量子化部260及びビットパッキング部270から構成される。
時間/周波数マッピング部210は、時間領域のオーディオ信号を周波数領域の信号に変換する役割を担う。時間に関しては人間が認知する信号の特性の差はそれほど大きくないが、そのように変換された周波数領域の信号は、人間の音響心理モデルによって、各帯域で人間が感じられる信号と感じられない信号との差が大きいため、各周波数帯域による割当てられるビット数を異ならせることで、圧縮の効率を向上させることが可能である。
心理音響モデル部200は、時間/周波数マッピング部210により、時間領域から周波数領域の成分に変換されたオーディオ信号を適当な帯域の信号に結合して、各信号の相互作用により発生するマスキング現象を利用して、各帯域でのマスキング閾値を計算する。TNS部220は、変換の各ウィンドウ内で量子化ノイズの時間的な模様を制御するために使われる。
周波数データをフィルタリングすることにより、時間領域ノイズの形成が可能である。TNS部220は、符号化器で使用するか否かを選択できる。強度ステレオ処理部230は、ステレオ信号を更に効率的に処理するためのもののうちの一つである。二つのチャンネルのうち、一つのチャンネルに対するスケールファクターバンド(scalefactor band)についての量子化された情報のみを符号化し、残りのチャンネルは、scalefactorのみを伝送する技法である。強度ステレオ処理部230は、必ずしも符号化器で使用しなければならない部分ではなく、符号化器で多様な事項を考慮して、各スケールファクターバンド単位で使用するか否かを判断できる。
知覚ノイズ代替部240は、現在フレームでノイズ特性の強い信号の場合、周波数係数値をコーディングせずに、スケールファクターバンドに該当する周波数成分のエネルギー値を符号化することで、使われるビット発生量を減らすことが可能である。知覚ノイズ代替部240は、スケールファクターバンド単位で使用するか否かを判断できる。M/Sステレオ処理部250は、ステレオ信号をさらに効率的に処理するためのもののうちの一つである。
M/Sステレオ処理部250における効率的な処理方法は、左側チャンネルの信号と右側チャンネルの信号とを、それぞれ足した信号と、引いた信号とに変換した後、この信号を処理する。M/Sステレオ処理部250も、必ずしも符号化器で使用しなければならない部分ではなく、符号化器で多様な事項を考慮して、各スケールファクターバンド単位で使用するか否かを判断できる。量子化部260では、人間が聞いても感じられないように、各帯域の量子化ノイズのサイズがマスキング閾値より小さくなるように、各帯域の周波数信号をスカラー量子化する。ビットパッキング部270は、符号化装置の各モジュールで作られた情報を集めて、スケーラブルコーデック(scalable codec)に適するように作られたシンタックス(syntax)によってビットストリームを構成する。
ところが、図1に示した既存のBSACマルチチャンネル構造は、M/S(Mid/Side)ステレオ使用ができない。なぜならば、既存の符号化及び復号化シンタックス上では、チャンネル数が2つ以上である場合には、M/Sステレオ機能を使用できないためである。したがって、コーディングの効率が低下する。また、window switching、PNS(Perceptual Noise Substitution)は、あらゆるチャンネルに同じ付加情報を使用せねばならないため、コーディングの効率が低下する。また、5つのチャンネルが何れもインターリーブされるため、モノタイプオーディオに比べて5倍のメモリが必要である。
本発明が達成しようとする技術的課題は、MPEG標準化に符合しつつ、多チャンネルBSACの性能を向上させることが可能なマルチチャンネルオーディオデータ符号化方法及びマルチチャンネルオーディオデータ符号化装置を提供するところにある。
本発明が達成しようとする技術的課題は、MPEG標準化に符合しつつ、多チャンネルBSACの性能を向上させることが可能なマルチチャンネルオーディオデータ復号化方法及びマルチチャンネルオーディオデータ復号化装置を提供するところにある。
本発明が達成しようとする技術的課題は、MPEG標準化に符合しつつ、多チャンネルBSACの性能を向上させることが可能なプログラムを記録した記録媒体を提供するところにある。
前記技術的課題を解決するための本発明によるマルチチャンネルオーディオ信号の符号化方法は、(a)モノオーディオデータまたはステレオオーディオデータを符号化するステップと、(b)前記モノオーディオデータ及び前記ステレオオーディオデータ以外のマルチチャンネルオーディオ拡張データを符号化するステップと、を含むことを特徴とする。前記モノオーディオデータ及び前記ステレオオーディオデータは、階層的なビット率を有することが好ましい。
前記マルチチャンネルオーディオ拡張データは、少なくともオーディオチャンネルの構成を表し、チャンネル構成インデックスで表現される拡張チャンネルのタイプ情報を含むことが好ましい。
前記(b)ステップは、前記マルチチャンネルオーディオ拡張データの開始を表す所定の開始コードを符号化するステップと、前記マルチチャンネル拡張オーディオデータをチャンネル別に符号化するステップと、を含むことが好ましい。前記開始コードは、32ビットの連続した0値からなるzero_codeと、8ビットの連続した1値からなるsyncwordと、から構成されることが好ましい。前記マルチチャンネル拡張オーディオデータをチャンネル別に符号化するステップは、オーディオチャンネルの構成を表す拡張チャンネルのタイプを符号化するステップと、マルチチャンネル拡張オーディオデータを符号化するステップと、を含むことが好ましい。
前記拡張チャンネルのタイプは、チャンネル構成インデックスからなることが好ましい。拡張データ長を符号化するステップと、付加情報を符号化するステップと、を更に含むことが好ましい。
前記拡張チャンネルオーディオデータを符号化するステップは、ビット率の最も低い基本階層を符号化するステップと、階層が複数である場合、前記基本階層のビット率より高く、かつ階層が高くなるほどビット率が高まる上位階層を符号化するステップと、を含むことが好ましい。
前記技術的課題を解決するための本発明によるマルチチャンネルオーディオ信号符号化装置は、モノオーディオデータまたはステレオオーディオデータを符号化するモノ/ステレオ符号化部と、前記モノオーディオデータ及び前記ステレオオーディオデータ以外のマルチチャンネルオーディオ拡張データを符号化する拡張データ符号化部と、を備えることを特徴とする。前記モノ/ステレオ符号化部は、階層的なビット率を有するモノオーディオデータまたはステレオオーディオデータを符号化することが好ましい。
前記マルチチャンネルオーディオ拡張データは、少なくともオーディオチャンネルの構成を表し、チャンネル構成インデックスで表現される拡張チャンネルのタイプ情報を含むことが好ましい。
前記拡張データ符号化部は、前記マルチチャンネルオーディオ拡張データの開始を表す所定の開始コードを符号化する開始コード符号化部と、拡張オーディオデータをチャンネル別に符号化するチャンネル符号化部と、を備えることが好ましい。
前記開始コードは、32ビットの連続した0値からなるzero_codeと、8ビットの連続した1値からなるsyncwordと、から構成されることが好ましい。
前記チャンネル符号化部は、オーディオチャンネルの構成を表す拡張チャンネルのタイプを符号化する拡張チャンネルタイプ符号化部と、拡張チャンネルオーディオデータを符号化する拡張オーディオ符号化部と、を備えることが好ましい。
前記拡張チャンネルのタイプは、チャンネル構成インデックスからなることが好ましい。前記チャンネル符号化部は、拡張データ長を符号化する拡張データ長符号化部と、付加情報を符号化する付加情報符号化部と、を更に備えることが好ましい。
前記拡張オーディオ符号化部は、ビット率の最も低い基本階層を符号化する基本階層符号化部と、階層が複数である場合、前記基本階層のビット率より高く、かつ階層が高くなるほどビット率が高まる上位階層を符号化する上位階層符号化部と、を備えることが好ましい。
前記他の技術的課題を解決するための本発明によるマルチチャンネルオーディオ信号の復号化方法は、(a)モノオーディオデータまたはステレオオーディオデータを復号化するステップと、(b)前記モノオーディオデータ及び前記ステレオオーディオデータ以外に復号化するマルチチャンネルオーディオ拡張データがあるかを検査するステップと、(c)復号化するマルチチャンネルオーディオ拡張データがある場合には、このマルチチャンネルオーディオ拡張データを復号化するステップと、を含むことが好ましい。
前記モノオーディオデータ及び前記ステレオオーディオデータは、階層的なビット率を有することが好ましい。前記マルチチャンネルオーディオ拡張データは、少なくともオーディオチャンネルの構成を表し、チャンネル構成インデックスで表現される拡張チャンネルのタイプ情報を含むことが好ましい。
前記(b)ステップは、マルチチャンネルオーディオ拡張データの開始を表す所定の開始コードの存在を検査して、この開始コードが存在する場合には、前記マルチチャンネルオーディオ拡張データが存在すると判断することが好ましい。前記開始コードは、32ビットの連続した0値からなるzero_codeと、8ビットの連続した1値からなるsyncwordと、から構成されることが好ましい。
前記(c)ステップは、復号化するマルチチャンネルオーディオ拡張データがある場合には、チャンネル別に前記マルチチャンネルオーディオ拡張データを復号化することが好ましい。前記チャンネル別のマルチチャンネルオーディオ拡張データの復号化は、オーディオチャンネルの構成を表す拡張チャンネルのタイプを復号化するステップと、マルチチャンネルオーディオ拡張データを復号化するステップと、を含むことが好ましい。
前記拡張チャンネルのタイプは、チャンネル構成インデックスからなることが好ましい。前記(c)ステップは、拡張データ長を復号化するステップと、付加情報を復号化するステップと、を含むことが好ましい。
前記拡張チャンネルオーディオデータを復号化するステップは、ビット率の最も低い基本階層を復号化するステップと、階層が複数である場合、前記基本階層のビット率より高く、かつ階層が高くなるほどビット率が高まる上位階層を復号化するステップと、を含むことが好ましい。
前記他の技術的課題を解決するための本発明によるマルチチャンネルオーディオ信号復号化装置は、モノオーディオデータまたはステレオオーディオデータを復号化するモノ/ステレオ復号化部と、前記モノオーディオデータ及び前記ステレオオーディオデータ以外に復号化するマルチチャンネルオーディオ拡張データがあるかを検査する拡張データ検査部と、復号化するマルチチャンネルオーディオ拡張データがある場合には、このマルチチャンネルオーディオ拡張データを復号化する拡張データ復号化部と、を備えることを特徴とする。
前記モノオーディオデー及び前記ステレオオーディオデータは、階層的なビット率を有することが好ましい。
前記拡張データ検査部は、前記マルチチャンネルオーディオ拡張データの開始を表す所定の開始コードの存在を検査して、前記開始コードが存在する場合には、このマルチチャンネルオーディオ拡張データが存在すると判断することが好ましい。
前記開始コードは、32ビットの連続した0値からなるzero_codeと、8ビットの連続した1値からなるsyncwordと、から構成されることが好ましい。
前記拡張データ復号化部は、復号化するマルチチャンネルオーディオ拡張データがある場合には、チャンネル別に前記マルチチャンネルオーディオ拡張データを復号化することが好ましい。
前記拡張データ復号化部は、オーディオチャンネルの構成を表す拡張チャンネルのタイプを復号化する拡張チャンネルタイプ復号化部と、マルチチャンネルオーディオ拡張データを復号化する拡張チャンネルオーディオ復号化部と、を備えることが好ましい。前記拡張チャンネルのタイプは、チャンネル構成インデックスからなることが好ましい。
前記拡張データ復号化部は、拡張データ長を復号化する拡張データ長復号化部と、付加情報を復号化する付加情報復号化部と、を更に備えることが好ましい。
前記拡張チャンネルオーディオ復号化部は、ビット率の最も低い基本階層を復号化する基本階層復号化部と、階層が複数である場合、前記基本階層のビット率より高く、かつ階層が高くなるほどビット率が高まる上位階層を復号化する上位階層復号化部と、を備えることが好ましい。
前記技術的課題を解決するための本発明によるマルチチャンネルオーディオ信号符号化方法は、(a)モノオーディオデータまたはステレオオーディオデータの基本階層を符号化するステップと、(b)前記モノオーディオデータまたは前記ステレオオーディオデータの上位階層を符号化するステップと、(c)前記モノオーディオデータ及び前記ステレオオーディオデータ以外のマルチチャンネルオーディオ拡張データの開始を表すzero_code及びsyncwordを符号化するステップと、(d)前記拡張マルチチャンネルオーディオデータを構成する少なくとも一つのチャンネルデータに対し、基本階層を符号化し、かつ上位階層を符号化するステップと、を含むことを特徴とする。
前記(d)ステップは、前記チャンネルデータの長さを符号化するステップと、前記チャンネルのタイプを表すチャンネル構成インデックスを符号化するステップと、bsacヘッダ、ジェネラルヘッダを符号化するステップと、前記基本階層のオーディオデータを符号化するステップと、を含むことが好ましい。
前記技術的課題を解決するための本発明によるマルチチャンネルオーディオ信号復号化方法は、(a)モノオーディオデータまたはステレオオーディオデータの基本階層を復号化するステップと、(b)前記モノオーディオデータまたは前記ステレオオーディオデータの上位階層を復号化するステップと、(c)前記モノオーディオデータ及び前記ステレオオーディオデータ以外に、復号化するマルチチャンネルオーディオ拡張データがあるか否かを検査するステップと、(d)復号化するマルチチャンネルオーディオ拡張データがある場合には、このマルチチャンネルオーディオ拡張データの開始を表すzero_code及びsyncwordを復号化するステップと、(e)前記マルチチャンネルオーディオ拡張オーディオデータを構成する少なくとも一つのチャンネルデータに対し、基本階層を復号化し、かつ上位階層を復号化するステップと、を含むことを特徴とする。
前記(d)ステップは、前記チャンネルデータの長さを復号化するステップと、前記チャンネルのタイプを表すチャンネル構成インデックスを復号化するステップと、bsacヘッダ、ジェネラルヘッダを復号化するステップと、前記基本階層のオーディオデータを復号化するステップと、を含むことが好ましい。
そして、前記方法をコンピュータに実行させるためのプログラムを記録したコンピュータで読み取り可能な記録を提供する。
本発明によれば、本発明による方式が、既存のBSAC方式を利用してマルチチャンネルデータをインターリーブすることより、メモリの容量を約20%少なくすることができる。これは、既存のマルチチャンネル方式では、マルチチャンネル全体についてのデータを何れもメモリにロードしなければならないことに対し、本発明によるマルチチャンネル方式を使用する場合、追加されるチャンネル要素が順に処理されるため、同時に使用するメモリの使用量が相対的に少ない。
本発明に係るマルチチャンネルオーディオ信号符号化方法、マルチチャンネルオーディオ信号復号化方法、マルチチャンネルオーディオ信号符号化装置及びマルチチャンネルオーディオ信号復号化装置を利用して音質測定を行った結果は、図17の通りである。聴き取り実験の条件は、次の通りである。ツールは、Window switching&M/Sstero toolが使われ、ビット量の割当て方式は、前方及び後方のチャンネル要素別にビット率を制御し、4人のオーディオ専門家を実験参加者とし、既存のBSACに対する相対的な音質(−2〜+2)を測定した。そして、テストの項目は、MPEG−2NBCに使われた総46個の項目の中で選定した。
従って、本発明に係るマルチチャンネルオーディオ信号符号化方法、マルチチャンネルオーディオ信号復号化方法、マルチチャンネルオーディオ信号符号化装置及びマルチチャンネルオーディオ信号復号化装置によれば、一つのビットストリームでユーザー環境によって、モノ、ステレオ、及びマルチチャンネルを提供できる。マルチチャンネルでも、ユーザーの端末及びネットワークの状態によって、FGS(Fine Grain Scalability)機能を提供する。また、マルチチャンネルBSACの性能の向上、例えば、高音質、低い複雑度、拡張性の確保を可能にする。特に、MPEG標準化のための多様な要求事項(既存のBSACとの互換性、FGS機能の維持、最小の修正)を満たすことが可能である。
そして、高現実感のデジタルマルチメディア放送、モバイル及びホームシアター基盤のサービスで有効に使用される。
既存のBSACマルチチャンネル構造を示す図面である。 既存方式のオーディオ符号化装置の機能モジュールを示すブロック図である。 本実施形態に係るマルチチャンネルオーディオデータ符号化装置の構成を示すブロック図である。 拡張データ符号化部の更に詳細な構成を示すブロック図である。 拡張オーディオ符号化部の細部構成を示すブロック図である。 本実施形態に係るマルチチャンネルオーディオデータ符号化についての基本的なデータ構造の一例を示す図面である。 本実施形態に係るマルチチャンネルオーディオデータ符号化方法を示すフローチャートである。 拡張チャンネルについてのオーディオデータ符号化を更に詳細に説明したフローチャートである。 マルチチャンネルオーディオ復号化装置の構成を示すブロック図である。 拡張データ復号化部940の構成を示すブロック図である。 拡張チャンネルオーディオ復号化部の構成を示すブロック図である。 本実施形態に係るマルチチャンネルオーディオデータ復号化方法を示すフローチャートである。 1230ステップの拡張チャンネルについてのオーディオデータ復号化を更に詳細に説明したフローチャートである。 1200ステップないし1240ステップの全過程についての一実施形態を示すBsac_raw_data_block()のsyntaxを示す図面である。 各拡張オーディオチャンネル復号化についての一実施形態を示すextended_bsac_raw_data_block()のsyntaxを示す図面である。 1100ステップについてのextended_bsac_base_element()の一例についてのsyntaxを示す図面である。 本発明に係るマルチチャンネルオーディオ信号符号化方法、マルチチャンネルオーディオ信号符号化装置、マルチチャンネルオーディオ信号復号化方法及びマルチチャンネルオーディオ信号復号化装置を利用して音質測定を行ったテスト結果を示す図面である。
以下、添付された図面を参照して、発明を実施するための最良の形態に係るマルチチャンネルオーディオ符号化装置、マルチチャンネルオーディオ復号化装置、マルチチャンネルオーディオ符号化方法及びマルチチャンネルオーディオ復号化方法について詳細に説明する。
まず、マルチチャンネルオーディオ符号化装置及びマルチチャンネルオーディオ復号化方法を説明する。図3は、本実施形態に係るマルチチャンネルオーディオデータ符号化装置の構成を示すブロック図である。本発明によるマルチチャンネルオーディオデータ符号化装置は、モノ/ステレオ符号化部300及び拡張データ符号化部350を備える。
モノ/ステレオ符号化部300は、モノオーディオデータまたはステレオオーディオデータを符号化する。モノ/ステレオ符号化部300は、階層的なビット率を有するモノオーディオデータまたはステレオオーディオデータを符号化することが好ましい。特に、モノオーディオデータまたはステレオオーディオデータは、ISO/IEC 14496−3によるBSAC方式で符号化されることが好ましい。BSAC方式のオーディオ符号化は、既に公知された技術であるため、ここではその説明を省略する。
拡張データ符号化部350は、モノオーディオデータ及びステレオオーディオデータ以外のマルチチャンネルオーディオ拡張データを符号化する。マルチチャンネルオーディオ拡張データは、少なくともオーディオチャンネルの構成を表す拡張チャンネルのタイプ情報を含み、拡張チャンネルタイプ情報は、チャンネル構成インデックス(channel_configuration_index)で表現されることが好ましい。チャンネル構成インデックスは、表2に示すように、オーディオ出力チャンネル構成を表す3ビットフィールドを有することが好ましい。チャンネル構成インデックスは、チャンネルをスピーカーにマッピングするとき、チャンネルの数を規定する。
図4は、拡張データ符号化部350の更に詳細な構成を示すブロック図である。拡張データ符号化部350は、開始コード符号化部400及びチャンネル符号化部450を備える。開始コード符号化部400は、マルチチャンネルオーディオ拡張データの開始を表す所定の開始コードを符号化する。開始コードは、zero_code及びsyncwordからなる。
Figure 2012238034
zero_codeは、ステレオオーディオデータの復号化が終わったことを知らせるための32ビットの連続した0値からなる。syncwordは、拡張されたマルチチャンネルオーディオデータの開始を表すために、8ビットの連続した1値からなる。ビットストリングは、1111 1111である。
チャンネル符号化部450は、拡張オーディオデータをチャンネル別に符号化するものであって、拡張チャンネル長符号化部452、拡張チャンネルタイプ符号化部454、付加情報符号化部456及び拡張オーディオ符号化部458を備える。
拡張チャンネル長符号化部452は、拡張データ長を符号化する。拡張データ長情報は、復号化するときに使われる。
拡張チャンネルタイプ符号化部454は、オーディオチャンネルの構成を表す拡張チャンネルのタイプを符号化する。付加情報符号化部456は、付加情報(bsac_header、general_header)を符号化する。付加情報(bsac_header、general_header)は、BSAC方式のモノオーディオデータまたはステレオオーディオデータを符号化するときに使用する付加情報と同じである。拡張オーディオ符号化部458は、拡張チャンネルオーディオデータを符号化する。
図5は、拡張オーディオ符号化部458の細部構成を示すブロック図である。拡張オーディオ符号化部458は、基本階層符号化部500及び上位階層符号化部550を備える。基本階層符号化部500は、ビット率の最も低い基本階層を符号化する。上位階層符号化部550は、基本階層のビット率より高く、階層が複数である場合、階層が高くなるほどビット率が高まる上位階層を符号化する。
本実施形態では、既存ステレオビットストリームにチャンネルを拡張する方式を使用している。各チャンネル要素にチャンネル構成インデックスを付与する。オーディオ符号化時に使用できる各ツールについての付加情報の修正可能性を表す。window、M/S、PNS情報は、ジェネラルヘッダ(genaral header)がチャンネル要素ごとにあるため、修正の必要なあらゆるツールを修正できる。
図6は、本実施形態に係るマルチチャンネルオーディオデータ符号化についての基本的なデータ構造を示す図面である。そして、図7は、本実施形態に係るマルチチャンネルオーディオデータ符号化方法を示すフローチャートである。図6及び図7を参照して、本実施形態に係るマルチチャンネルオーディオデータ符号化方法及びマルチチャンネルオーディオデータ符号化装置の動作を説明する。
まず、モノ/ステレオ符号化部300が、モノオーディオデータまたはステレオオーディオデータを符号化する(700ステップ)。その後、拡張データ符号化部350が、モノオーディオデータまたはステレオオーディオデータ以外のマルチチャンネルオーディオ拡張データを符号化する。モノオーディオデータまたはステレオオーディオデータは、上記したように、階層的なビット率を有することが好ましい。また、マルチチャンネルオーディオ拡張データは、少なくともオーディオチャンネルの構成を表し、チャンネル構成インデックスで表現される拡張チャンネルのタイプ情報を含む。
マルチチャンネルオーディオ拡張データの符号化を更に詳細に説明すれば、次の通りである。モノオーディオデータまたはステレオオーディオデータが符号化された後、拡張データ符号化部350が符号化するデータがあるかをチェックする(710ステップ)。
符号化するデータが存在すれば(710ステップで「はい」)、開始コード符号化部400がマルチチャンネルオーディオ拡張データの開始を表す所定の開始コード(zero_code、syncword)を符号化する(720ステップ)。開始コードは、前記した通りである。
その後、チャンネル符号化部450が、各チャンネルに対して拡張オーディオデータを符号化する。それは、まず、チャンネル符号化部450が、一つのチャンネルに対して拡張オーディオデータを符号化した後(730ステップ)、チャンネルに対する符号化が完了すれば、他のチャンネルに対する符号化するオーディオデータがあるかを検査する(740ステップ)。チャンネル符号化部450が他のチャンネルに対する符号化するオーディオデータが存在すれば(740ステップで「はい」)、チャンネル符号化部450が、チャンネルに対するオーディオデータを符号化する。前記過程をあらゆる拡張チャンネルに対して行って、あらゆる拡張チャンネルオーディオデータに対して符号化する。
図8は、前記730ステップの拡張チャンネルに対するオーディオデータ符号化を更に詳細に説明したフローチャートである。拡張チャンネル長符号化部452が、拡張データ長を符号化する(800ステップ)。
また、拡張チャンネルタイプ符号化部454が、オーディオチャンネルの構成を表す拡張チャンネルのタイプを符号化する(820ステップ)。付加情報符号化部456が、付加情報(bsacヘッダ、ジェネラルヘッダ)を符号化する(840ステップ)。その後、拡張オーディオ符号化部458が、拡張チャンネルオーディオデータを符号化する(860ステップ)。
860ステップにおける拡張チャンネルオーディオデータ符号化は、まず、基本階層符号化部500が、ビット率の最も低い基本階層のオーディオデータを符号化し、上位階層符号化部550が、上位階層のオーディオデータを符号化する。上位階層は、基本階層のビット率より高く、階層が複数である場合、階層が高くなるほどビット率が高まる。
次に、本実施形態に係るマルチチャンネルオーディオ復号化装置及びマルチチャンネルオーディオ復号化方法を説明する。基本的にマルチチャンネルオーディオ復号化は、マルチチャンネルオーディオ符号化とは逆の順序により行われる。
図9は、マルチチャンネルオーディオ復号化装置の構成を示すブロック図である。マルチチャンネルオーディオ復号化装置は、モノ/ステレオ復号化部900、拡張データ検査部920及び拡張データ復号化部940を備える。
モノ/ステレオ復号化部900は、モノオーディオデータまたはステレオオーディオデータを復号化する。モノオーディオデータまたはステレオオーディオデータは、階層的なビット率を有し、ISO/IEC 14496−3によるBSAC方式で復号化されることが好ましい。
拡張データ検査部920は、モノオーディオデータまたはステレオオーディオデータ以外に復号化するマルチチャンネルオーディオ拡張データがあるか否かを検査する。拡張データ検査部920は、マルチチャンネルオーディオ拡張データの開始を表す所定の開始コード(zero_code、syncword)の存在を検査して、開始コードが存在すれば、マルチチャンネルオーディオ拡張データが存在すると判断する。開始コードは、zero_code及びsyncwordからなる。zero_codeは、ステレオオーディオデータの復号化が終わったことを知らせるための32ビットの連続した0値からなる。syncwordは、拡張されたマルチチャンネルオーディオデータの開始を表すために、8ビットの連続した1値からなり、ビットストリングは、1111 1111である。
拡張データ復号化部940は、復号化するマルチチャンネルオーディオ拡張データがあれば、マルチチャンネルオーディオ拡張データを復号化する。また、拡張データ復号化部940は、復号化するときにチャンネル別にマルチチャンネルオーディオ拡張データを復号化することが好ましい。
図10は、拡張データ復号化部の構成を示すブロック図である。拡張データ復号化部940は、拡張データ長復号化部1000、拡張チャンネルタイプ復号化部1020、付加情報復号化部1040及び拡張チャンネルオーディオ復号化部1060を備える。
拡張データ長復号化部1000は、拡張データ長情報を復号化する。拡張チャンネルタイプ復号化部1020は、オーディオチャンネルの構成を表す拡張チャンネルのタイプを復号化する。拡張チャンネルタイプ情報は、チャンネル構成インデックス(channel_configuration_index)で表現されることが好ましい。チャンネル構成インデックスは、チャンネルをスピーカーにマッピングするときにチャンネルの数を規定し、表2に示したように、オーディオ出力チャンネル構成を表す3ビットフィールドを有する。
付加情報復号化部1040は、付加情報を復号化する。付加情報は、bsacヘッダやジェネラルヘッダなどのオーディオデータを復号化するときのオーディオデータ以外の必要な情報である。基本的に付加情報(bsac_header、general_header)は、BSAC方式のモノオーディオデータまたはステレオオーディオデータを復号化するときに必要な付加情報と同じである。
拡張チャンネルオーディオ復号化部1060は、拡張チャンネルオーディオデータを復号化する。図11は、拡張チャンネルオーディオ復号化部の構成を示すブロック図である。拡張チャンネルオーディオ復号化部1060は、基本階層復号化部1100及び上位階層復号化部1150を備える。基本階層復号化部1100は、ビット率の最も低い基本階層を復号化する。上位階層復号化部1150は、上位階層を復号化し、上位階層は、基本階層のビット率より高く、階層が複数である場合、階層が高くなるほどビット率が高まる。
そして、図12は、本実施形態に係るマルチチャンネルオーディオデータ復号化方法を示すフローチャートである。図12を参照して、本実施形態に係るマルチチャンネルオーディオデータ復号化方法及びマルチチャンネルオーディオデータ復号化装置の動作を説明する。
まず、モノ/ステレオ復号化部900が、モノオーディオデータまたはステレオオーディオデータを復号化する(1200ステップ)。その後、拡張データ検査部920が、モノオーディオデータ及びステレオオーディオデータ以外に復号化するマルチチャンネルオーディオ拡張データがあるかを検査する(1210ステップ)。
マルチチャンネルオーディオ拡張データの存否は、拡張データ検査部920が、マルチチャンネルオーディオ拡張データの開始を表す所定の開始コード(zero_code、syncword)を復号化して、開始コードの存在を検査して判断する(1220ステップ)。もし、開始コードが存在すれば、拡張データが存在すると判断する。すなわち、zero_codeが存在すれば、モノオーディオデータの復号化またはステレオオーディオデータの復号化が終了したことを知らせ、次いで、syncwordが存在すれば、復号化するマルチチャンネルオーディオデータが存在することを表す。
開始コードを通じて、復号化するマルチチャンネルオーディオ拡張データがあると判断されれば、拡張データ復号化部940がマルチチャンネルオーディオ拡張データを復号化する(1230ステップ)。1200〜1230ステップについての一例をsyntax(Bsac_raw_data_block())で表せば、図14の通りである。
図14で、Bsac_raw_data_block()は、符号化されたオーディオデータ、関連情報及び他のデータを含んでいるrawデータブロックであって、基本的にbsac_base_element()と、幾つかのbsac_layer_element()とから構成される。BSACビットストリームが拡張されたpartを有するかを決定するモジュールが存在する。
モノステレオオーディオデータまたはステレオオーディオデータは、上記したように、階層的なビット率を有することが好ましい。また、マルチチャンネルオーディオ拡張データは、少なくともオーディオチャンネルの構成を表し、チャンネル構成インデックスで表現される拡張チャンネルのタイプ情報を含む。
一つのチャンネルに対して拡張オーディオデータを復号化した後(1230ステップ)、チャンネルに対する復号化が完了すれば、拡張データ復号化部940が他のチャンネルに対する復号化するオーディオデータがあるかを検査する(1240ステップ)。他のチャンネルに対する復号化するオーディオデータが存在すれば、チャンネルに対するオーディオデータを復号化する。前記過程をあらゆる拡張チャンネルに対して行って、あらゆる拡張チャンネルオーディオデータに対して復号化する。
各拡張オーディオチャンネル復号化についての一例を表すsyntax(extended_bsac_raw_data_block())は、図15の通りである。
図15で、extended_bsac_raw_data_block()は、マルチチャンネルの拡張データに対するコーディングされたオーディオデータ、オーディオデータと関連した情報を含んでいるrawデータブロックである。extended_bsac_raw_data_block()は、基本的にextended_bsac_base_element()と、幾つかのbsac_layer_element()とから構成される。
図13は、1230ステップの拡張チャンネルに対するオーディオデータ復号化を更に詳細に説明したフローチャートである。拡張データ長復号化部1000が拡張データ長を復号化する(1300ステップ)。
また、拡張チャンネルタイプ復号化部1020が、オーディオチャンネルの構成を表す拡張チャンネルのタイプを復号化する(1320ステップ)。付加情報復号化部1040が付加情報(bsacヘッダ、ジェネラルヘッダ)を復号化する(1340ステップ)。1300〜1340ステップの復号化は、順序が変わってもよい。その後、拡張チャンネルオーディオ復号化部1060が拡張チャンネルオーディオデータを復号化する(1360ステップ)。
1360ステップの拡張チャンネルオーディオデータの復号化は、まず、基本階層復号化部1100が、ビット率の最も低い基本階層のオーディオデータを復号化し、上位階層復号化部1150が、上位階層のオーディオデータを復号化する。上位階層は、基本階層のビット率より高く、階層が複数である場合、階層が高くなるほどビット率が高まる。1230ステップに対するシンタックス(syntax extended_bsac_raw_data_block())の一例を挙げれば、図15の通りである。
図16におけるextended_bsac_base_element()は、BSACの拡張されたパートに対するコーディングされたオーディオデータ、オーディオデータと関連した情報を含んでいるbaselayerビットストリームの構文上の要素である。
また、マルチチャンネルオーディオ信号復号化方法は、モノオーディオデータまたはステレオオーディオデータの基本階層を復号化するステップと、モノオーディオデータまたはステレオオーディオデータの上位階層を復号化するステップと、モノオーディオデータ及びステレオオーディオデータ以外に、復号化するマルチチャンネルオーディオ拡張データがあるか否かを検査するステップと、復号化するマルチチャンネルオーディオ拡張データがある場合には、このマルチチャンネルオーディオ拡張データの開始を表すzero_code及びsyncwordを符号化するステップと、マルチチャンネルオーディオ拡張オーディオデータを構成する少なくとも一つのチャンネルデータに対し、基本階層を復号化し、かつ上位階層を符号化するステップと、からなっていても良い。
復号化するマルチチャンネルオーディオ拡張データがある場合には、このマルチチャンネルオーディオ拡張データの開始を表すzero_code及びsyncwordを符号化するステップは、チャンネルデータの長さを復号化するステップと、チャンネルのタイプを表すチャンネル構成インデックスを復号化するステップと、bsacヘッダ、ジェネラルヘッダを復号化するステップと、基本階層のオーディオデータを復号化するステップと、からなっていても良い。
また、マルチチャンネルオーディオ信号復号化方法は、モノオーディオデータまたはステレオオーディオデータの基本階層を復号化するステップと、モノオーディオデータまたはステレオオーディオデータの上位階層を復号化するステップと、モノオーディオデータ及びステレオオーディオデータ以外に、復号化するマルチチャンネルオーディオ拡張データがあるか否かを検査するステップと、復号化するマルチチャンネルオーディオ拡張データがある場合には、このマルチチャンネルオーディオ拡張データの開始を表すzero_code及びsyncwordを符号化するステップと、マルチチャンネルオーディオ拡張オーディオデータを構成する少なくとも一つのチャンネルデータに対し、基本階層を復号化し、かつ上位階層を符号化するステップと、からなっていても良い。
復号化するマルチチャンネルオーディオ拡張データがある場合には、このマルチチャンネルオーディオ拡張データの開始を表すzero_code及びsyncwordを符号化するステップは、チャンネルデータの長さを復号化するステップと、チャンネルのタイプを表すチャンネル構成インデックスを復号化するステップと、bsacヘッダ、ジェネラルヘッダを復号化するステップと、基本階層のオーディオデータを復号化するステップと、からなっていても良い。
本発明は、コンピュータで読み取り可能な記録媒体にコンピュータ(情報処理機能を有する装置を何れも含む)で読み取り可能なコードとして具現することが可能である。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取られ得るデータが保存されるあらゆる種類の記録装置を含む。コンピュータ可読記録装置の例としては、ROM(Read Only Memory)、RAM(Random Access Memory)、CD−ROM、磁気テープ、フレキシブルディスク、光データ保存装置などがある。
本発明は、実施形態を参考に説明したが、これは例示的なものに過ぎず、当業者ならば、これから多様な変形及び均等な他の実施形態が可能であるということが理解できるであろう。したがって、本発明の真の技術的範囲は、特許請求の範囲により決まらねばならない。
300 ステレオ符号化部
350 拡張データ符号化部
400 開始コード符号化部
450 チャンネル符号化部
452 拡張チャンネル長符号化部
454 拡張チャンネルタイプ符号化部
456 付加情報符号化部
458 拡張オーディオ符号化部
500 基本階層符号化部
550 上位階層符号化部
900 ステレオ復号化部
920 拡張データ検査部
940 拡張データ復号化部
1000 拡張データ長復号化部
1020 拡張チャンネルタイプ復号化部
1040 付加情報復号化部
1060 拡張チャンネルオーディオ復号化部
1100 基本階層復号化部
1150 上位階層復号化部

Claims (2)

  1. オーディオデータを復号化する段階と、
    前記オーディオデータのペイロードの終結を示す識別コードを検出する段階と、
    拡張データのペイロードの開始を示す識別コードを検出する段階と、
    拡張データのタイプを検出する段階と、
    前記検出されたタイプが、オーディオデータのチャンネルをマルチチャンネルに拡張する拡張データを示しているか否かを判断する段階と、
    前記判断段階で示していると判断されれば、前記オーディオデータのチャンネルをマルチチャンネルに拡張する拡張データを復号化する段階と、を含み、
    前記拡張データは、
    少なくともオーディオチャンネルの構成を表し、チャンネルをスピーカにマッピングするときのチャンネルの数を規定するチャンネル構成インデックスで表現される拡張チャンネルのタイプ情報を含むことを特徴とするマルチチャンネルオーディオ信号復号化方法。
  2. オーディオデータを復号化する段階と、
    まだ復号化されていないデータの有無を判断する段階と、
    もし、まだ復号化されていないデータがあると判断されれば、前記オーディオデータのペイロードの終結を示す識別コードを検出する段階と、
    拡張データのペイロードの開始を示す識別コードを検出する段階と、
    拡張データのタイプを検出する段階と、
    前記検出されたタイプがオーディオデータのチャンネルをマルチチャンネルに拡張する拡張データを示しているか否かを判断する段階と、
    前記判断段階で示していると判断されれば、前記オーディオデータのチャンネルをマルチチャンネルに拡張する拡張データを復号化する段階と、を含み、
    前記拡張データは、
    少なくともオーディオチャンネルの構成を表し、チャンネルをスピーカにマッピングするときのチャンネルの数を規定するチャンネル構成インデックスで表現される拡張チャンネルのタイプ情報を含むことを特徴とするマルチチャンネルオーディオ信号復号化方法。
JP2012198966A 2004-07-14 2012-09-10 マルチチャンネルオーディオ信号復号化方法 Pending JP2012238034A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US58762604P 2004-07-14 2004-07-14
US60/587,626 2004-07-14
KR1020050021840A KR100773539B1 (ko) 2004-07-14 2005-03-16 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
KR10-2005-0021840 2005-03-16

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2005205178A Division JP2006031012A (ja) 2004-07-14 2005-07-14 マルチチャンネルオーディオデータ符号化方法、マルチチャンネルオーディオデータ復号化方法、マルチチャンネルオーディオデータ符号化装置、マルチチャンネルオーディオデータ復号化装置、マルチチャンネルオーディオデータを符号化するためのプログラムを記録した媒体及びマルチチャンネルオーディオデータを復号化するためのプログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2012238034A true JP2012238034A (ja) 2012-12-06

Family

ID=36689093

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2005205178A Pending JP2006031012A (ja) 2004-07-14 2005-07-14 マルチチャンネルオーディオデータ符号化方法、マルチチャンネルオーディオデータ復号化方法、マルチチャンネルオーディオデータ符号化装置、マルチチャンネルオーディオデータ復号化装置、マルチチャンネルオーディオデータを符号化するためのプログラムを記録した媒体及びマルチチャンネルオーディオデータを復号化するためのプログラムを記録した記録媒体
JP2012198966A Pending JP2012238034A (ja) 2004-07-14 2012-09-10 マルチチャンネルオーディオ信号復号化方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2005205178A Pending JP2006031012A (ja) 2004-07-14 2005-07-14 マルチチャンネルオーディオデータ符号化方法、マルチチャンネルオーディオデータ復号化方法、マルチチャンネルオーディオデータ符号化装置、マルチチャンネルオーディオデータ復号化装置、マルチチャンネルオーディオデータを符号化するためのプログラムを記録した媒体及びマルチチャンネルオーディオデータを復号化するためのプログラムを記録した記録媒体

Country Status (5)

Country Link
US (1) US20060013405A1 (ja)
EP (2) EP2276022A3 (ja)
JP (2) JP2006031012A (ja)
KR (2) KR100773539B1 (ja)
CN (2) CN101789792B (ja)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126844A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US8032368B2 (en) * 2005-07-11 2011-10-04 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signals using hierarchical block swithcing and linear prediction coding
KR100755471B1 (ko) * 2005-07-19 2007-09-05 한국전자통신연구원 가상음원위치정보에 기반한 채널간 크기 차이 양자화 및역양자화 방법
KR100857106B1 (ko) 2005-09-14 2008-09-08 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
KR100813269B1 (ko) * 2005-10-12 2008-03-13 삼성전자주식회사 비트 스트림 처리/전송 방법 및 장치, 비트 스트림수신/처리 방법 및 장치
JP4801174B2 (ja) 2006-01-19 2011-10-26 エルジー エレクトロニクス インコーポレイティド メディア信号の処理方法及び装置
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
CN101385077B (zh) * 2006-02-07 2012-04-11 Lg电子株式会社 用于编码/解码信号的装置和方法
EP1982326A4 (en) 2006-02-07 2010-05-19 Lg Electronics Inc DEVICE AND METHOD FOR CODING / DECODING A SIGNAL
WO2007097550A1 (en) 2006-02-23 2007-08-30 Lg Electronics Inc. Method and apparatus for processing an audio signal
BRPI0706488A2 (pt) 2006-02-23 2011-03-29 Lg Electronics Inc método e aparelho para processar sinal de áudio
CN101361277B (zh) * 2006-02-23 2013-07-31 Lg电子株式会社 处理音频信号的方法和装置
KR101438387B1 (ko) 2006-07-12 2014-09-05 삼성전자주식회사 서라운드 확장 데이터 부호화 및 복호화 방법 및 장치
KR100763919B1 (ko) 2006-08-03 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2 채널의 바이노럴 신호로 복호화하는 방법 및 장치
US8571875B2 (en) * 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
CN101212845B (zh) * 2006-12-25 2011-05-04 上海乐金广电电子有限公司 家庭影院系统的扩音器声道的设定方法
KR101355376B1 (ko) * 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
CA2706445C (en) * 2007-11-28 2019-07-23 Irx Therapeutics, Inc. Production of apoptosis-resistant t-lymphocytes for use in cancer therapy
KR101435815B1 (ko) * 2007-11-28 2014-08-29 엘지전자 주식회사 방송 시스템 및 오디오 데이터 처리 방법
KR101235830B1 (ko) * 2007-12-06 2013-02-21 한국전자통신연구원 음성코덱의 품질향상장치 및 그 방법
CN101556799B (zh) * 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
KR101074010B1 (ko) 2009-09-04 2011-10-17 (주)이스트소프트 블록 단위 데이터 압축 및 복원 방법 및 그 장치
KR101016776B1 (ko) * 2009-09-21 2011-02-25 (주)이스트소프트 상위 호환성 보장형 압축 및 복원 방법 및 장치
WO2012176084A1 (en) 2011-06-24 2012-12-27 Koninklijke Philips Electronics N.V. Audio signal processor for processing encoded multi - channel audio signals and method therefor
KR102172279B1 (ko) * 2011-11-14 2020-10-30 한국전자통신연구원 스케일러블 다채널 오디오 신호를 지원하는 부호화 장치 및 복호화 장치, 상기 장치가 수행하는 방법
WO2013122387A1 (en) 2012-02-15 2013-08-22 Samsung Electronics Co., Ltd. Data transmitting apparatus, data receiving apparatus, data transceiving system, data transmitting method, and data receiving method
WO2013122385A1 (en) 2012-02-15 2013-08-22 Samsung Electronics Co., Ltd. Data transmitting apparatus, data receiving apparatus, data transreceiving system, data transmitting method, data receiving method and data transreceiving method
WO2013122386A1 (en) 2012-02-15 2013-08-22 Samsung Electronics Co., Ltd. Data transmitting apparatus, data receiving apparatus, data transreceiving system, data transmitting method, data receiving method and data transreceiving method
WO2013122388A1 (en) * 2012-02-15 2013-08-22 Samsung Electronics Co., Ltd. Data transmission apparatus, data receiving apparatus, data transceiving system, data transmission method and data receiving method
TWI505262B (zh) 2012-05-15 2015-10-21 Dolby Int Ab 具多重子流之多通道音頻信號的有效編碼與解碼
WO2014005327A1 (zh) * 2012-07-06 2014-01-09 深圳广晟信源技术有限公司 对多声道数字音频编码的方法
KR101454343B1 (ko) * 2013-04-23 2014-10-24 한국산업은행 직접 오디오 채널 데이터 및 간접 오디오 채널 데이터를 이용한 스케일러블 디지털 오디오 인코딩/디코딩 방법 및 장치
WO2014175617A1 (ko) * 2013-04-23 2014-10-30 ㈜ 소닉티어 직접 오디오 채널 데이터 및 간접 오디오 채널 데이터를 이용한 스케일러블 디지털 오디오 인코딩/디코딩 방법 및 장치
GB2524333A (en) * 2014-03-21 2015-09-23 Nokia Technologies Oy Audio signal payload
CN113035212A (zh) * 2015-05-20 2021-06-25 瑞典爱立信有限公司 多声道音频信号的编码
CN105895111A (zh) * 2015-12-15 2016-08-24 乐视致新电子科技(天津)有限公司 基于Android的音频内容处理方法及设备
CN109284080B (zh) * 2018-09-04 2021-01-05 Oppo广东移动通信有限公司 音效调整方法、装置、电子设备以及存储介质
CN110808054B (zh) * 2019-11-04 2022-05-06 思必驰科技股份有限公司 多路音频的压缩与解压缩方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0946799A (ja) * 1995-08-02 1997-02-14 Toshiba Corp オーディオ方式、その再生方法、並びにその記録媒体及びその記録媒体への記録方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5451942A (en) * 1994-02-04 1995-09-19 Digital Theater Systems, L.P. Method and apparatus for multiplexed encoding of digital audio information onto a digital audio storage medium
JP3342996B2 (ja) * 1995-08-21 2002-11-11 三星電子株式会社 多チャネルオーディオ符号化器及び符号化方法
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
JPH11282496A (ja) * 1998-03-30 1999-10-15 Matsushita Electric Ind Co Ltd 復号装置
US7266501B2 (en) * 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US7047201B2 (en) * 2001-05-04 2006-05-16 Ssi Corporation Real-time control of playback rates in presentations
CN100508026C (zh) * 2002-04-10 2009-07-01 皇家飞利浦电子股份有限公司 立体声信号编码
US8498422B2 (en) * 2002-04-22 2013-07-30 Koninklijke Philips N.V. Parametric multi-channel audio representation
JP4714416B2 (ja) * 2002-04-22 2011-06-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間的オーディオのパラメータ表示
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
EP1414273A1 (en) * 2002-10-22 2004-04-28 Koninklijke Philips Electronics N.V. Embedded data signaling
AU2003219430A1 (en) * 2003-03-04 2004-09-28 Nokia Corporation Support of a multichannel audio extension
KR100561867B1 (ko) * 2003-03-07 2006-03-17 삼성전자주식회사 오디오 신호 처리 장치와 방법 및 컴퓨터 프로그램을저장하는 컴퓨터로 읽을 수 있는 기록 매체
WO2004098105A1 (en) * 2003-04-30 2004-11-11 Nokia Corporation Support of a multichannel audio extension
EP1749296B1 (en) * 2004-05-28 2010-07-14 Nokia Corporation Multichannel audio extension
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0946799A (ja) * 1995-08-02 1997-02-14 Toshiba Corp オーディオ方式、その再生方法、並びにその記録媒体及びその記録媒体への記録方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN7011002320; 'ISO/IEC DIS 13818-3,N1312,"Draft International standard of 2nd Edition to ISO/IEC 13818-3' ISO/IEC , 19960711 *

Also Published As

Publication number Publication date
EP2276022A2 (en) 2011-01-19
CN101789792A (zh) 2010-07-28
US20060013405A1 (en) 2006-01-19
JP2006031012A (ja) 2006-02-02
KR100773539B1 (ko) 2007-11-05
CN1756086A (zh) 2006-04-05
CN1756086B (zh) 2010-05-05
CN101789792B (zh) 2012-03-28
KR20060043701A (ko) 2006-05-15
EP2276022A3 (en) 2011-10-05
KR100982427B1 (ko) 2010-09-15
KR20070077220A (ko) 2007-07-25
EP1617413A3 (en) 2006-07-26
EP1617413A2 (en) 2006-01-18

Similar Documents

Publication Publication Date Title
JP2012238034A (ja) マルチチャンネルオーディオ信号復号化方法
CN1527306B (zh) 使用带宽扩展技术编码和/或解码数字数据的方法和装置
KR100908117B1 (ko) 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
WO2007008004A2 (en) Apparatus and method of encoding and decoding audio signal
US7869891B2 (en) Method and apparatus for generating bitstream of audio signal and audio encoding/decoding method and apparatus thereof
JP3964860B2 (ja) ステレオオーディオの符号化方法、ステレオオーディオ符号化装置、ステレオオーディオの復号化方法、ステレオオーディオ復号化装置及びコンピュータで読み取り可能な記録媒体
EP1932239A4 (en) METHOD AND APPARATUS FOR ENCODING / DECODING
US7098814B2 (en) Method and apparatus for encoding and/or decoding digital data
TWI501220B (zh) 嵌入與擷取輔助資料
KR20060082618A (ko) 다채널 신호 부호화/복호화 방법 및 장치
JP5135205B2 (ja) 多チャンネル音響信号の音響圧縮符号化装置及び復号装置
KR100528327B1 (ko) 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
KR20080066537A (ko) 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치
JP2852862B2 (ja) Pcmオーディオ信号の変換方法と装置
JP3528260B2 (ja) 符号化装置及び方法、並びに復号化装置及び方法
CN1901042B (zh) 可伸缩地编解码音频数据的方法和装置
Noll Digital audio for multimedia

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121010

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130528

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130828

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130902

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140422

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140722

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140725

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140822

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150317

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150617

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150917

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160105