JP2010515099A - 情報ビットストリーム変換を含む多様なチャネルで構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びに方法 - Google Patents

情報ビットストリーム変換を含む多様なチャネルで構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びに方法 Download PDF

Info

Publication number
JP2010515099A
JP2010515099A JP2009543949A JP2009543949A JP2010515099A JP 2010515099 A JP2010515099 A JP 2010515099A JP 2009543949 A JP2009543949 A JP 2009543949A JP 2009543949 A JP2009543949 A JP 2009543949A JP 2010515099 A JP2010515099 A JP 2010515099A
Authority
JP
Japan
Prior art keywords
information
signal
audio
channel
rendering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009543949A
Other languages
English (en)
Other versions
JP5941610B2 (ja
JP2010515099A5 (ja
Inventor
バク、スン‐クウォン
ソ、ジョン‐イル
リー、テ‐ジン
リー、ヨン‐ジュ
ジャン、テ‐ヤン
ホン、ジン‐ウー
キム、ジン‐ウン
カン、キョン‐オク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Publication of JP2010515099A publication Critical patent/JP2010515099A/ja
Publication of JP2010515099A5 publication Critical patent/JP2010515099A5/ja
Application granted granted Critical
Publication of JP5941610B2 publication Critical patent/JP5941610B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Theoretical Computer Science (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmitters (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

多様なチャネルを有するマルチオブジェクトオーディオ信号を符号化および復号化し、従来のSACビットストリームとの下位互換性を提供する多様なチャネルで構成されたマルチオブジェクトオーディオ信号符号化および復号化装置、並びに方法を提供する。前記符号化装置に入力されるオーディオオブジェクト信号を空間キュー基盤で符号化し、前記符号化されたオーディオオブジェクト信号に対するレンダリング情報を生成するオーディオオブジェクト符号化手段を含み、前記レンダリング情報は、前記オーディオオブジェクト信号に対する空間キュー情報、前記オーディオオブジェクト信号のチャネル情報、および前記オーディオオブジェクト信号の識別情報を含む符号化装置を提供する。

Description

本発明は、多様なチャネルで構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びに方法に関し、より詳細には、付加情報ビットストリームを変換し、変換された付加情報ビットストリームを利用して所望の出力信号、すなわち多様なチャネルを有するマルチオブジェクトオーディオ信号を復元する付加情報ビットストリーム変換を含む多様なチャネルで構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びに方法に関する。
ここで、多様なチャネルを有するマルチオブジェクトオーディオ信号とは、マルチオブジェクトオーディオ信号であって、各々のオーディオオブジェクトが互いに異るチャネル(例えば、モノ、ステレオ、5.1チャネル)で構成されたオーディオを信号を意味する。
本発明は、情報通信部および情報通信研究振興院のIT次世代核心技術開発事業の一環として行われた研究から導出されたものである。[課題管理番号:2005−S−403−02、課題名:知能型統合情報放送(SmaRTV)技術(Development of Super−intelligent Multimedia Anytime−anywhere Realistic TV(SmarTV) Technology)]
従来のオーディオ符号化/復号化技術によれば、ユーザは、オーディオコンテンツを受動的に聴取するしかできなかった。従って、ユーザの必要に応じて互いに異るチャネルで構成された各オーディオオブジェクトを制御し、1つのオーディオコンテンツを多様な方法で組み合わせることによって、多様なオーディオオブジェクトを消費することができる多様なチャネルで構成された複数のオーディオオブジェクト別の符号化および復号化装置、並びに方法が要求される。
これと関連して、従来のSAC(Spatial Audio Coding)は、マルチチャネルオーディオ信号をダウンミックスされたモノまたはステレオ信号で表現、伝送および復元する技術であって、低いビット率でも高品質のマルチチャネルオーディオ信号を伝送することができる。
しかし、従来のSACはマルチチャネルの信号を、1つのオーディオオブジェクトに対してのみ符号化および復号化が可能な技術であるため、マルチチャネル及びマルチオブジェクトオーディオ信号、例えば、モノ、ステレオ、および5.1チャネルで構成された多様なオブジェクトのオーディオ信号を符号化/復号化することができないという問題がある。
また、従来のバイノーラルキューコーディング(Binaural Cue Coding、BCC)は、マルチオブジェクトオーディオ信号を符号化/復号化することができる。しかし、オーディオオブジェクトのチャネルは、モノチャネルに限定されることから、モノチャネルを含む多様なチャネルで構成されたマルチオブジェクトオーディオ信号を符号化/復号化することができない。
整理すれば、従来技術は、単一チャネルで構成されたマルチオブジェクトオーディオ信号またはマルチチャネルの単一オブジェクトオーディオ信号に対してのみ符号化/復号化を行なうことができるため、多様なチャネルで構成されたマルチオブジェクトオーディオ信号に対しては符号化/復号化を行なうことができない。したがって、従来のオーディオ符号化/復号化技術によれば、ユーザはオーディオコンテンツを受動的に聴取するほかなかった。
したがって、ユーザの必要に応じて、互いに異るチャネルで構成された複数のオーディオオブジェクト各々を制御し、1つのオーディオコンテンツを多様な方法で組み合わせることによって、多様なオーディオオブジェクトを消費できる多様なチャネルで構成された複数のオーディオオブジェクト別の符号化および復号化装置、並びに方法が要求される。
また、マルチオブジェクトオーディオ符号化器から生成された付加情報ビットストリームを、従来のSAC符号化/復号化器の付加情報ビットストリームと下位互換性を提供するために、マルチオブジェクトオーディオビットストリームと従来のSACビットストリームとの間を変換することができる変換装置および方法が要求される。
前述したように、互いに異るチャネルで構成された複数のオーディオオブジェクト各々を制御し、1つのオーディオコンテンツを多様な方法で組み合わせることのできる多様なチャネルのマルチオブジェクトオーディオ信号の符号化および復号化装置、並びに方法であって、前記マルチオブジェクトオーディオ符号化および復号化装置、並びに方法は、従来のSACビットストリームとの下位互換性を提供するためのビットストリーム変換が可能な多様なチャネルのマルチオブジェクトオーディオ信号の符号化および復号化装置、並びに方法が要求される。
本発明は前述した要求に応じるために提案されたものであって、その目的は、多様なチャネルを有するマルチオブジェクトオーディオ信号を符号化および復号化し、従来のSACビットストリームとの下位互換性を提供する多様なチャネルで構成されたマルチオブジェクトオーディオ信号符号化および復号化装置、並びに方法を提供することにある。
前述した目的を達成するための本発明は、マルチオブジェクトオーディオ信号の符号化装置であって、前記符号化装置に入力されるオーディオオブジェクト信号を空間キュー基盤で符号化し、前記符号化されたオーディオオブジェクト信号に対するレンダリング情報を生成するオーディオオブジェクト符号化手段を含み、前記レンダリング情報は、前記オーディオオブジェクト信号に対する空間キュー情報、前記オーディオオブジェクト信号のチャネル情報、および前記オーディオオブジェクト信号の識別情報を含む符号化装置を提供する。
また、前述した目的を達成するための本発明は、マルチオブジェクトオーディオ信号を復号化するためのレンダリング情報を生成するトランスコーディング装置であって、符号化されたオーディオオブジェクト信号に対するオブジェクト制御情報および再生情報に基づいて、前記符号化されたオーディオオブジェクト信号に対するパワー利得情報および出力位置情報を含むレンダリング情報を生成する第1行列手段と、前記第1行列手段によって生成されたレンダリング情報および符号化装置から入力される前記符号化されたオーディオオブジェクト信号に対するレンダリング情報に基づいて、復号化装置から出力されるオーディオ信号に対する空間キュー情報を生成するレンダリング手段と、を備えるトランスコーディング装置を提供する。
また、前述した目的を達成するための本発明は、マルチチャネルオーディオ信号およびマルチオブジェクトオーディオ信号を復号化するためのレンダリング情報を生成するトランスコーディング装置であって、符号化装置から入力される符号化されたオーディオ信号に対するレンダリング情報から符号化されたオーディオオブジェクト信号に対するレンダリング情報、およびマルチチャネルオーディオ信号に対するレンダリング情報を分離するパーシング手段と、符号化されたオーディオオブジェクト信号に対するオブジェクト制御情報および再生情報に基づいて、前記符号化されたオーディオオブジェクト信号に対するパワー利得情報および出力位置情報を含むレンダリング情報を生成する第1行列手段と、前記パーシング手段によって分離された符号化されたマルチチャネルオーディオ信号に対するレンダリング情報に基づいて、前記マルチチャネルオーディオ信号に対するチャネル別のパワー利得情報を含むレンダリング情報を生成する第2行列手段と、前記第1行列手段によって生成されたレンダリング情報、前記第2行列手段によって生成されたレンダリング情報、および前記パーシング手段によって分離された符号化されたオーディオオブジェクト信号に対するレンダリング情報に基づいて、復号化装置から出力されるオーディオ信号に対する空間キュー情報を生成するレンダリング手段と、を備えるトランスコーディング装置を提供する。
また、前述した目的を達成するための本発明は、マルチオブジェクトオーディオ信号の符号化方法であって、入力されるオーディオオブジェクト信号を空間キュー基盤で符号化し、前記符号化されたオーディオオブジェクト信号に対するレンダリング情報を生成するオーディオオブジェクト符号化ステップを含み、前記レンダリング情報は、前記オーディオオブジェクト信号に対する空間キュー情報、前記オーディオオブジェクト信号のチャネル情報、および前記オーディオオブジェクト信号の識別情報を含む符号化方法を提供する。
また、前述した目的を達成するための本発明は、マルチオブジェクトオーディオ信号を復号化するためのレンダリング情報を生成するトランスコーディング方法であって、符号化されたオーディオオブジェクト信号に対するオブジェクト制御情報および再生情報に基づいて、前記符号化されたオーディオオブジェクト信号に対するパワー利得情報および出力位置情報を含むレンダリング情報を生成する第1行列ステップと、前記第1行列ステップによって生成されたレンダリング情報および符号化ステップから入力される前記符号化されたオーディオオブジェクト信号に対するレンダリング情報に基づいて、復号化ステップから出力されるオーディオ信号に対する空間キュー情報を生成するレンダリングステップと、を含むトランスコーディング方法を提供する。
また、前述した目的を達成するための本発明は、マルチチャネルオーディオ信号およびマルチオブジェクトオーディオ信号を復号化するためのレンダリング情報を生成するトランスコーディング方法であって、符号化ステップから入力される符号化されたオーディオ信号に対するレンダリング情報から符号化されたオーディオオブジェクト信号に対するレンダリング情報、およびマルチチャネルオーディオ信号に対するレンダリング情報を分離するパーシングステップと、符号化されたオーディオオブジェクト信号に対するオブジェクト制御情報および再生情報に基づいて、前記符号化されたオーディオオブジェクト信号に対するパワー利得情報および出力位置情報を含むレンダリング情報を生成する第1行列ステップと、前記パーシングステップによって分離された符号化されたマルチチャネルオーディオ信号に対するレンダリング情報に基づいて、前記マルチチャネルオーディオ信号に対するチャネル別のパワー利得情報を含むレンダリング情報を生成する第2行列ステップと、前記第1行列ステップによって生成されたレンダリング情報、前記第2行列ステップによって生成されたレンダリング情報、および前記パーシングステップによって分離された符号化されたオーディオオブジェクト信号に対するレンダリング情報に基づいて、復号化ステップから出力されるオーディオ信号に対する空間キュー情報を生成するレンダリングステップと、を含むトランスコーディング方法を提供する。
本発明は、付加情報ビットストリームが可能な多様なチャネルを有するマルチオブジェクトオーディオ信号の符号化および復号化装置、並びに方法を提供することによって、多様なチャネルを有するマルチオブジェクトオーディオコンテンツを効率よく符号化および復号化し、ユーザの必要に応じて能動的にオーディオコンテンツを消費することができ、従来に利用されるビットストリームと下位互換性を提供することによって、従来における符号化および復号化装置との互換性を提供することができる。
本発明の実施形態に係るマルチオブジェクトオーディオ符号化器およびマルチオブジェクト復号化器を示すブロック図である。 本発明の実施形態に係るマルチオブジェクトオーディオ符号化器およびマルチオブジェクト復号化器を示すブロック図である。 本発明の実施形態に係る図2のトランスコーダ103を示すブロック図である。 本発明の実施形態に係る図2のビットストリームフォーマッタ205から生成される代表SAOC(spatial audio object coding)ビットストリームを示す図である。 本発明の他の実施形態に係る図2の代表SAOCビットストリームを示す図である。 本発明の他の実施形態に係る図2のトランスコーダ103を示すブロック図である。 図2におけるマルチオブジェクトオーディオ符号化器および復号化器にオーディオオブジェクト除去部701が追加的に備えられた場合を示すブロック図である。 図2におけるSACコーダ201およびSACデコーダ105をMPEGサラウンドコーダおよびデコーダに代替した場合を示すブロック図である。
前述した目的、特徴および長所は、添付の図面と関連した次の詳細な説明を介して更に明確になるのであろう。以下、添付の図面に基づいて本発明に係る好ましい一実施形態を詳細に説明する。
図1は、本発明に係るマルチオブジェクトオーディオ符号化器およびマルチオブジェクト復号化器を示すブロック図である。
図1に示すように、本発明は、SAOC(Spatial Audio Object Coding)コーダ101、トランスコーダ103、およびSAC(Spatial Audio Coding)デコーダ105を備える。
空間オーディオオブジェクトコーディング(SAOC:Spatial Audio Object Coding)方式によれば、コーダに入力される信号はオーディオオブジェクトとして符号化される。ここで、各オーディオオブジェクトは、デコーダによって復元され、独立的に再生されない。しかし、所望のオーディオ場面を構成するためにオーディオオブジェクトに対する情報がレンダリングされ、多様なチャネルを有するマルチオブジェクトオーディオ信号が出力される。したがって、SACデコーダは、所望のオーディオ場面を獲得するために入力されるオーディオオブジェクトに対する情報をレンダリングできる装置を要求する。
前記SAOCコーダ101は、空間キュー基盤のコーダであって、入力オーディオ信号をオーディオオブジェクトとして符号化する。ここで、前記SAOCコーダ101に入力されるオーディオオブジェクトはモノまたはステレオ信号である。
前記SAOCコーダ101は、入力される1つ以上のオーディオオブジェクトからダウンミックス信号を出力し、空間キューおよび付加情報(side information)を抽出することによりSAOCビットストリームを生成する。ここで、出力されるダウンミックス信号はモノまたはステレオ信号である。前記SAOCコーダ101は「異質なレイアウトSAOC」または「Faller」技法に基づいて入力されるオーディオオブジェクト信号を分析する。
前記抽出されたSAOCビットストリームは空間キューおよび付加情報を含み、前記付加情報は入力オーディオオブジェクトの空間情報を含む。前記空間キューは、一般的に周波数領域のサブバンド単位で分析されて抽出される。
ここで、空間キュー(spatial cue)とは、オーディオ信号を符号化および復号化する過程で利用される情報である。空間キューは、周波数領域から抽出され、入力される2つの信号の大きさの差、遅延差、相関性などの情報を含む。例えば、空間キューは、オーディオ信号のパワー利得情報を表すオーディオ信号間のレベル差(Channel Level Difference、CLD)、オーディオ信号間のエネルギー比(Inter−Channel Level Difference、ICLD)、オーディオ信号間の時間差(Inter Channel Time Difference、ICTD)、オーディオ信号間の相関性情報を表すオーディオ信号間の相関性(Inter Channel Correlation、ICC)、および仮想音源位置情報(Virtual Source Location Information)を含むが、これらの例に限定されない。
また、前記付加情報は、空間キューおよびオーディオ信号の復元、制御のための情報が含まれる。前記付加情報はヘッダー情報を含む。前記ヘッダー情報は、多様なチャネルで構成されたマルチオブジェクトオーディオ信号の復元および再生のための情報を含み、オーディオオブジェクトに対するチャネル情報および該当オーディオオブジェクトのIDを定義することによって、モノ、ステレオ、マルチチャネルのオーディオオブジェクトに対する復号化情報を提供することができる。例えば、符号化された特定オーディオオブジェクトがモノオーディオ信号であるかステレオオーディオ信号であるかを区分することができるよう各オブジェクトのIDおよび情報が定義され得る。前記ヘッダー情報は、一実施形態としてSAC(Spatial Audio Coding)ヘッダー情報、オーディオオブジェクト情報、およびプリセット(preset)情報を含むことができる。
前記トランスコーダ103は、SAOCコーダ101に入力されるオーディオオブジェクトに対するレンダリングを行い、外部から入力される制御信号、すなわちオブジェクト別の音響情報および再生環境情報を利用して前記SAOCコーダ101から抽出されたSAOCビットストリームをSACビットストリームに変換する。
すなわち、前記トランスコーダ103は、SAOCコーダ101に入力されるオーディオオブジェクトを多様なチャネルのマルチオブジェクトオーディオ信号に復元するために抽出されたSAOCビットストリームを利用してレンダリングする。付加情報を利用したレンダリングは、パラメータ領域で行なうことができる。
また、前記トランスコーダ103は、SAOCビットストリームをSACビットストリームに変換する。まず、前記トランスコーダ103は、SAOCビットストリームから入力オーディオオブジェクトの情報を獲得し、入力オーディオオブジェクトの情報を所望のオーディオ場面に対応されるようレンダリングする。
前記レンダリング過程において、前記トランスコーダ103は、所望のオーディオ場面に対応する空間情報を予測し、前記予測された空間情報を変換してSAC付加情報ビットストリームとして出力する。
前記トランスコーダ103に対しては、以下の図3で詳細に説明する。
前記SACデコーダ105は、空間キュー基盤のマルチチャネルオーディオデコーダであって、前記トランスコーダ103から出力されるSACビットストリームを利用し、前記SAOCコーダ101から出力されるダウンミックス信号をオブジェクト別のオーディオ信号に復元し、多様なチャネルのマルチオブジェクトオーディオ信号に復元する。前記SACデコーダ105は、MPEG(Moving Pcture Experts Group)サラウンド復号化器、BCC(binaural cue coding)復号化器などで代替され得る。
図2は、本発明に係るマルチオブジェクトオーディオ符号化器および復号化器を示す更なる一実施形態の構成図であって、入力信号が多様なチャネルを有するマルチオブジェクトオーディオ信号である場合を示す。
同図は、図1に示したように、本発明はSAOCコーダ101、トランスコーダ103、SACデコーダ105、SACコーダ201、プリセットASI(audio scene information)部203、およびビットストリームフォーマッタ205を備える。
前記SAOCコーダ101がモノまたはステレオのオーディオオブジェクトのみをサポートする場合、前記SACコーダ201は、入力されるマルチチャネルオーディオ信号から1つのオーディオオブジェクトを出力する。前記出力された1つのオーディオオブジェクトは、ダウンミックスされたモノまたはステレオ信号である。また前記SACコーダ201は、空間キューおよび付加情報を抽出してSACビットストリームを生成する。
前記SAOCコーダ101は、前記SACコーダ201から出力される1つのオーディオオブジェクトを備える1つ以上のオーディオオブジェクトから代表ダウンミックス信号を出力し、空間キューおよび付加情報を抽出してSAOCビットストリームを生成する。
前記プリセットASI部203は、外部から入力される制御信号、すなわちオブジェクト別の音響情報および再生環境情報をプリセット−ASI(Preset−Audio Scene Information)情報で構成し、前記プリセット−ASI情報を含むプリセットASIビットストリームを生成する。前記プリセット−ASI情報に対しては、以下図4で詳細に説明する。
前記ビットストリームフォーマッタ205は、前記SAOCコーダ101によって生成されたSAOCビットストリーム、前記SACコーダ201によって生成されたSACビットストリーム、および前記プリセットASI部203によって生成されたプリセットASIビットストリームを利用し、代表SAOCビットストリームを生成する。
前記トランスコーダ103は、SAOCコーダ101に入力されるオーディオオブジェクトに対するレンダリングを行い、外部から入力されるオブジェクト別の音響情報および再生環境情報を利用して前記ビットストリームフォーマッタ205によって生成された代表SAOCビットストリームを代表SACビットストリームに変換する。前記トランスコーダ103は、前記SACデコーダ105に含まれて前記のような役割を行なうことができる。
前記SACデコーダ105は、前記トランスコーダ103から出力されるSACビットストリームを利用し、前記SAOCコーダ101から出力されるダウンミックス信号を多様なチャネルのマルチオブジェクトオーディオ信号に復元する。前記SACデコーダ105は、MPEGサラウンド復号化器、BCC復号化器などで代替され得る。
図3は、図2におけるトランスコーダ103を示す一実施形態の詳細な構造図である。
同図に示すように、トランスコーダ103は、パーシング部301、レンダリング部303、第2行列部311、および第1行列部313を備え、代表SAOCビットストリームを代表SACビットストリームに変換する。
図1では、前記トランスコーダ103は、SAOCビットストリームをSACビットストリームに変換する。
前記パーシング部301は、前記ビットストリームフォーマッタ205から生成された代表SAOCビットストリーム、または図1のSAOCコーダ101から生成されたSAOCビットストリームをパーシングし、前記代表SAOCビットストリームに含まれたSAOCビットストリームおよびSACビットストリームを分離する。また、前記パーシング部301は、前記分離したSAOCビットストリームからSAOCコーダ101に入力されるオーディオオブジェクトの個数に対する情報を抽出する。ここで、図1のSAOCコーダ101から生成されたSAOCビットストリームをパーシングする場合、SACビットストリームが存在しないことから、分離する必要がない。
前記第2行列部311は、前記パーシング部301によって分離したSACビットストリームを利用して第2行列を生成する。前記第2行列は、SACコーダ201に入力されるマルチチャネルオーディオ信号に対する行列式である。もし、前記代表SAOCビットストリームにSACビットストリームが含まれていない場合、すなわち、図1のSAOCコーダ101から生成されたSAOCビットストリームをパーシングする場合、前記第2行列部311は不要である。
第2行列は、SACコーダ201に入力されるマルチチャネルオーディオ信号のパワー利得値に対するものであって、下記の数式1のとおりである。
Figure 2010515099
一般的に、1つのフレームをサブバンドに分割して解釈することがSACの基本分析過程である。
ここで、u SAC(k)はSACコーダ201から出力されるダウンミックス信号であって、kは周波数係数インデックスであり、bはサブバンドインデックスである。w ch−iは前記SACビットストリームから獲得できるマルチチャネル信号の空間キュー情報であって、i番目チャネル信号(1≦i≦M)の周波数情報を復元するために利用される。したがって、w ch−iは周波数係数の大きさ情報や位相情報として表現され得る。したがって、数式1の右側の項目を参照すれば、Y SAC(k)は数式1の結果であって、SACデコーダ105から出力されるマルチチャネルオーディオ信号を表す。
前記u SAC(k)およびw ch−iはベクトルであり、u SAC(k)の前置行列次元(Transpose Matrix Dimension)がw ch−iの次元となる。例えば、下記の数式2のように定義され得る。ここで、SACコーダ201から出力されるダウンミックス信号は、モノまたはステレオであるため、mは1または2である。
Figure 2010515099
前記のように、w ch−iはSACビットストリームに含まれた空間キュー情報である。
ch−iが各チャネルのサブバンドでのパワー利得を表す場合、w ch−iはチャネルレベル差空間キュー(Channel Level Difference、CLD)から予測されることができる。w ch−iが周波数係数の位相差を補償するための係数として利用される場合、w ch−iはチャネル時間差空間キュー(Channel Time Difference)または相関性空間キュー(Inter−Channel Coherence)から予測されることができる。
以下、例示的にw ch−iが周波数係数の位相差を補償するための係数として利用される場合を基準にして説明する。
SACコーダ201から出力されるダウンミックス信号との行列演算によって出力信号Y SAC(k)が生成されるよう、数式1の第2行列は、各チャネル別のパワー利得値を表現し、前記ダウンミックス信号のベクトルの次元に逆にならなければならない。
前記第2行列部311が数式1および数式2を満足する第2行列を生成すれば、前記レンダリング部303は、前記生成された第2行列を前記第1行列部313の出力と結合する。
前記第1行列部313は、制御信号(例えば、オブジェクト制御情報、再生システム情報)を利用し、前記SAOCコーダ101に入力される1つ以上のオーディオオブジェクトを所望の出力、すなわち多様なチャネルのマルチオブジェクトオーディオ信号でマッピングさせるための第1行列を生成する。
前記SAOCコーダ101に入力されたオーディオオブジェクトの個数がNの場合、SACコーダ201から出力されるダウンミックス信号も1つのオーディオオブジェクトとして見なされ、入力されるN個のオーディオオブジェクトに含まれる。このような場合、SACコーダ201から出力されるダウンミックス信号を除去した各オーディオオブジェクトは、第1行列を利用してSACデコーダ105から出力されるチャネルでマッピングされ得る。
SACデコーダ105から出力されるチャネルの個数をMとするとき、第1行列は下記の条件を満足することができる。
Figure 2010515099
ここで、w oj−iは、オーディオオブジェクトiのサブバンド信号(1≦i≦N−1)の情報を表すベクトルであって、前記SAOCビットストリームから獲得できる空間キュー情報である。もし、オーディオオブジェクトiがステレオであればw oj−iは2×1行列のベクトルである。P ijは、j番目オーディオオブジェクトがi番目出力チャネルにマッピングされるためのパワー利得情報または位相情報を表す第1行列の要素ベクトルであって、外部から入力されたり、初期値で設定された制御情報(例えば、オブジェクト制御情報、再生システム情報)から獲得できる。
前記数式3の条件に適合する第1行列は、前記レンダリング部303に伝送され、前記数式3は前記レンダリング部303で演算される。
数式3の演算子および演算過程は下記の数式4および数式5で詳細に説明する。
Figure 2010515099
Figure 2010515099
ここで、入力されるオーディオオブジェクトがモノおよびステレオである場合、mは2となる。
例えば、入力されるオーディオオブジェクトの個数がYであり、m=2であり、出力されるチャネルの個数がMの場合、第1行列の次元は、M×Yとなり、Y個のP i,jは2×1行列で構成される。ここで、SACコーダ201から出力されるオーディオオブジェクトが含まれる場合、Y=Y−1と見なされる。前記数式3の演算結果、出力されるチャネルのパワー利得ベクトルで構成された行列が表現されるべきである。前記表現されたベクトルの次元はM×2であって、出力されるチャネル個数Mおよび入力されるオーディオオブジェクトのレイアウトである2を反映する。
再度、図3の説明に戻って、前記レンダリング部303は、前記第1行列部313および第2行列部311から第1行列および第2行列が伝送される。前記レンダリング部303は、前記パーシング部301によって分離されたSAOCビットストリームから獲得される各オーディオオブジェクトの空間キュー情報w ch−jを獲得し、第1行列および第2行列を利用して算出された出力ベクトルを結合して所望の空間キュー情報を獲得し、前記所望の空間キュー情報を含む代表SACビットストリームを生成する。ここで、所望の空間キューとは、ユーザが前記SACデコーダ105からの出力を所望する出力マルチチャネルオーディオ信号と関連した空間キューを意味する。
前記第1行列および第2行列に基づいて、所望の空間キュー情報を獲得するための演算は下記の数式6のとおりである。
Figure 2010515099
ここで、Pは第1行列を生成するとき考慮しない事項であって、SACコーダ201から出力されるオーディオオブジェクトのパワーと、SAOCコーダ101に直接入力されるオーディオオブジェクトのパワーとの和の比を表す。
前記Pは数式7のように表すことができる。
Figure 2010515099
したがって、w ch−jが出力されるチャネルのパワーであれば、オーディオオブジェクトがレンダリングされた後、各チャネルのパワー比はW modifiedとして表す。W modifiedから所望の空間キューパラメータを新たに抽出することができる。例えば、ch_2とch_1との間のCLDパラメータを抽出すれば、下記の数式8のとおりである。
Figure 2010515099
もし、伝送されるダウンミックス信号がモノ信号であれば、CLDパラメータは下記の数式9のとおりである。
Figure 2010515099
出力されるチャネルのパワー比は、空間キューパラメータであるCLDで表現することができ、隣接したチャネル間の空間キューパラメータは与えられたW modified情報から多様な組合せの形態で示すことができる。前記レンダリング部303は、W modifiedから抽出された空間キュー(例えば、CLDパラメータ)をHuffmanコーディング方式などを利用してSACビットストリームを生成する。
前記レンダリング部303により生成されたSACビットストリームに含まれる空間キューは、デコーダの特性に応じて分析および抽出される方法が異なる。
例えば、BCCデコーダの場合、1つのチャネルを基準として前記数式8を利用してN−1個のCLDパラメータを抽出することができる。また、MPEGサラウンドデコーダの場合、MPEGサラウンドのチャネル別の比較順に応じてCLDパラメータを抽出することができる。
整理すれば、前記パーシング部301は、SACビットストリームおよびSAOCビットストリームを分離し、前記第2行列部311は、前記パーシング部301によって分離されたSACビットストリームおよびSACデコーダ105から出力されるマルチチャネルオーディオ信号を利用して下記の数式1に基づいて第2行列を生成し、前記第1行列部313は、制御信号に対応される第1行列を生成する。前記パーシング部301によって分離されたSAOCビットストリームは前記レンダリング部303に伝送され、前記レンダリング部303は、伝送されたSAOCビットストリームからオブジェクトの情報を獲得して第1行列と演算し、前記演算結果を第2行列と結合して前記W modifiedを生成し、生成されたW modifiedから空間キューを抽出して代表SACビットストリームを生成する。すなわち、 生成されたW modifiedから空間キューが所望の空間キューとなる。前記代表SACビットストリームは、MPEGサラウンドデコーダまたはBCCデコーダの特性に応じて適切に変換されたビットストリームであって、多様なチャネルを有するマルチオブジェクト信号に復元されることができる。
図4は、図2のビットストリームフォーマッタ205から生成される代表SAOCビットストリームを示す一実施形態の構造図である。
同図に示すように、ビットストリームフォーマッタ205によって生成された代表SAOCビットストリームは、前記SAOCコーダ101によって生成されたSAOCビットストリームと、前記SACコーダ201によって生成されたSACビットストリームとを結合して生成され、前記代表SAOCビットストリームは、前記プリセットASI部203によって生成されたプリセット−ASIビットストリームを含む。前記プリセット−ASIビットストリームは下記の図5で詳細に説明する。
前記SAOCビットストリームとSACビットストリームとを結合する方法は、第1に、各々のビットストリームを直接的にMUXさせて1つのビットストリームを生成する方法であって、代表SAOCビットストリームでSAOCビットストリームおよびSACビットストリームが直列的に接続する401。
第2に、SAOC補助データ(ancillary data)領域が存在する場合、前記補助領域にSACビットストリーム情報を含ませて1つのビットストリームを生成する方法であって、代表SAOCビットストリームでSAOCビットストリームおよび補助データ領域が直列的に接続され、前記補助データ領域はSACビットストリームを含む403。
第3に、前記SAOCビットストリームおよびSACビットストリームのうち、類似の空間キューを符号化した領域を同じビットストリームで表現する方法であって、例えば、代表SAOCビットストリームのヘッダー情報領域には、SAOCビットストリームヘッダー情報およびSACビットストリームヘッダー情報が含まれ、代表SAOCビットストリームの任意の領域各々には、特定のCLDと関連したSAOCビットストリームおよびSACビットストリームが含まれる405。
図5は、図2の代表SAOCビットストリームを示す更なる一実施形態の構成図であって、前記代表SAOCビットストリームが複数のプリセット−ASI情報を含む場合を示す。
同図に示すように、代表SAOCビットストリームは、プリセット−ASI領域を含む。前記プリセット−ASI領域は複数のプリセット−ASIを含み、前記プリセット−ASI情報は、オーディオオブジェクトの制御情報およびレイアウト情報などを含む。
前記トランスコーダ103を利用してオーディオオブジェクトをレンダリングする場合、各オーディオオブジェクトの位置情報および制御情報、出力される再生スピーカーレイアウト情報が入力されなければならない。前記制御情報および再生スピーカーレイアウト情報が入力されない場合、トランスコーダ103において各オーディオオブジェクトの制御情報およびレイアウト情報は基本値として設定される。
基本値として設定された制御情報およびレイアウト情報を利用したり、入力されたオーディオオブジェクト制御情報およびレイアウト情報は、代表SAOCビットストリームまたは代表SACビットストリームの付加情報またはヘッダー情報に含まれる。前記制御情報は2種類に表現され得る。第1に、各オーディオオブジェクトに対する制御情報(位置およびレベル)およびスピーカーのレイアウト情報を直接的に表現したり、第2に、制御情報およびスピーカーのレイアウト情報を第1行列の形態で表現し、前記第1行列部313の第1行列の代わりに利用され得る。
プリセット−ASI情報とは、オーディオオブジェクト制御情報およびスピーカーのレイアウト情報を表す。すなわち、スピーカーのレイアウト情報およびスピーカーのレイアウト情報に適合するオーディオ場面を構成するための各オーディオオブジェクトの位置およびレベル情報などを含む。
前記パーシング部301によって抽出されたプリセット−ASI情報を代表SACビットストリームに伝送するために、前記したように、前記プリセット−ASI情報は直接的に表現されたり、第1行列の形態で表現される。
プリセット−ASI情報が直接的に表現される場合、プリセット−ASI情報は、再生システムのレイアウト(モノ/ステレオ/マルチャネル)、オーディオオブジェクトID、オーディオオブジェクトレイアウト(モノまたはステレオ)、オーディオオブジェクト位置、方位(Azimuth、0 degree〜360 degree)、ステレオ再生時高低(Elevation、−50 degree〜90 degree)、オーディオオブジェクトレベル情報(−50dB〜50dB)を含むことができる。
プリセット−ASI情報が第1行列の形態で表現される場合、前記プリセット−ASI情報を反映した数式3のP行列を構成し、前記P行列をレンダリング部303に伝送する。前記P行列は、各オーディオオブジェクトが出力されるチャネルにマッピングされるためのパワー利得情報または位相情報を要素ベクトルとして含む。
前記プリセット−ASI情報は、入力される同一のオーディオオブジェクトに対して、所望の再生シナリオに対応される様々なオーディオ場面を定義することができる。例えば、ステレオまたはマルチチャネル(5.1、7.1)再生システムに要求されるプリセット−ASI情報がコンテンツ製作者および再生サービスの目的に適合するよう追加的に伝送され得る。
図6は、図2のトランスコーダ103を示す更なる一実施形態の構成図であって、外部から入力される制御信号がない場合を示す。
同図に示すように、トランスコーダ103は、パーシング部301およびレンダリング部303を備える。前記トランスコーダ103は、第2行列部311、第1行列部313、プリセット−ASI抽出部601、および行列判断部603からの助けを受け得る。
前記したように、トランスコーダ103に外部から入力される制御信号がない場合、プリセット−ASI情報を活用する場合である。
前記パーシング部301は、前記代表SAOCビットストリームに含まれたSAOCビットストリームとSACビットストリームとを分離し、前記代表SAOCビットストリームに含まれたプリセット−ASIビットストリームをパーシングしてプリセット−ASI抽出部601に伝送する。
前記プリセット−ASI抽出部601は、パーシングされたプリセット−ASIビットストリームからデフォルト(default)プリセット−ASIを出力するが、もし、プリセット−ASIに対する分離(selection)要請がある場合、分離要請されたプリセット−ASIを出力する。
前記行列判断部603は、前記プリセット−ASI抽出部601により出力されたプリセット−ASIが分離されたプリセット−ASIの場合、分離されたプリセット−ASIが第1行列の形態であるか判断する。分離したプリセット−ASIが情報を直接的に表現した場合、前記第1行列部313に伝送され、前記第1行列部313は、前記プリセット−ASI情報を利用して第1行列を生成する。分離したプリセット−ASIが第1行列である場合、レンダリング部303に直接入力される信号として利用される。
図7は、図2のマルチオブジェクトオーディオ符号化器および復号化器にオーディオオブジェクト除去部701が追加的に備えられた場合を示す一実施形態の構造図である。
同図に示すように、オーディオオブジェクト除去部701は、前記SAOCコーダ101によって生成された代表ダウンミックス信号から任意のオーディオオブジェクトを除去するために利用される。前記オーディオオブジェクト除去部701は、前記SAOCコーダ101によって生成された代表ダウンミックス信号および前記トランスコーダ103から代表SAOCビットストリーム情報を受信し、任意のオーディオオブジェクトを除去する。前記オーディオオブジェクト除去部701に伝送される代表SAOCビットストリーム情報は、例えばレンダリング部303により提供され得る。
例えば、前記SACコーダ201のダウンミックス信号であるオーディオオブジェクト(OBJECT#N)のみを前記SACデコーダ105の入力信号として利用しようとする場合を説明する。
前記SAOCコーダ101は、入力される各々のオーディオオブジェクトのパワー大きさをサブバンド別に抽出してCLD値で抽出し、前記CLD値を含むSAOCビットストリームを生成する。任意のサブバンドmに対するパワー情報は、次のように獲得することができる。
object#1、P object#2、・・・P object#N
ここで、P object#Nは、SAOCコーダ101によって出力される代表ダウンミックス信号のm番目バンドのパワー大きさである。したがって、オーディオオブジェクト除去部701に入力される代表ダウンミックス信号をu(n)とし、前記代表ダウンミックス信号を周波数領域に変換したものをU(f)とし、オーディオオブジェクト除去部701の出力信号、すなわち前記SACデコーダ105の入力信号をUmodified(f)とすれば、Umodified(f)は、前記SACコーダ201のダウンミックス信号のオーディオオブジェクト(OBJECT#N)と対応し、下記の数式10のように表すことができる。
Figure 2010515099
ここで、A(m)は、m番目のサブバンドの周波数領域で境界を示し、δは、レベルの大きさを調整するための任意の定数値であり、U(f)は、モノまたはステレオである。
以下、U(f)がモノである場合を説明する。ただ、U(f)がステレオである場合、U(f)が左/右チャネルに分離して処理されること以外はモノの場合と同一である。
前記Umodified(f)は、前記SACコーダ201のダウンミックス信号のオーディオオブジェクト(OBJECT#N)と同一に見られる。したがって、前記SACデコーダ105に入力される代表SACビットストリームは、前記代表SAOCビットストリームから前記SAOCビットストリームが除外されたビットストリームであって、SACコーダ201から出力されるSACビットストリームと同一に利用することができる。すなわち、前記SACデコーダ105は、OBJECT#Nを受信し、M個のマルチチャネル信号に復元できる。しかし、全体信号のレベルは、トランスコーダ103のレンダリング部303により調整されたり、または数式10に任意の定数値を乗算してOBJECT#Nの信号レベルを調整することによって調整できる。
一方、一実施形態において、前記SACコーダ201のダウンミックス信号のオーディオオブジェクト(OBJECT#N)のみを前記SACデコーダ105の入力信号から除去する場合について説明する。前記数式10は、下記の数式11のように示される。
Figure 2010515099
したがって、前記SACデコーダ105に入力される代表SACビットストリームは、前記代表SAOCビットストリームからSACコーダ201の前記SACビットストリームが除外されたビットストリームであって、レンダリング部303の第2行列に対する出力がないこととみられる。すなわち、前記トランスコーダ103は、代表SAOCビットストリーム部をパーシングし、OBJECT#Nに関する情報を除去した残りのオーディオオブジェクト情報のみをレンダリングして代表SACビットストリームを生成する。
したがって、OBJECT#Nに該当するパワー利得情報、相関性情報などを代表SACビットストリームに含まない。前記数式11は数式10と同様に、δはレベルの大きさを調整するための任意の定数値であって、全体の出力信号レベルを調整することができる。
前記オーディオオブジェクト除去部701は代表ダウンミックス信号からオーディオオブジェクトを除去し、除去命令はトランスコーダ103に入力される制御信号によって決定される。前記オーディオオブジェクト除去部701は、時間領域信号および周波数領域信号のすべてが適用可能である。また、前記代表ダウンミックス信号をサブバンドで分割するためにDFT(Discrete Fourier Transform)またはQMF(Quadrature Mirror Filterbank)を利用することができる。
トランスコーダ103のレンダリング部303は、SAOCビットストリームまたはSACビットストリームを除去してSACデコーダ105に伝送し、前記オーディオオブジェクト除去部701は、前記SACデコーダ105に伝送されるビットストリームに対応されるようオーディオオブジェクトを適切に除去する。
前記トランスコーダ103がSACデコーダ105に含まれる場合、前記トランスコーダ103から出力される代表SACビットストリームは、付加の変換過程なしでSACデコーダ105に伝送され得る。ここで、付加の変換過程とは、量子化やHuffmanコーディング方法のような一般的なコーディング過程を意味する。
また、SAOCコーダ101がSACコーダ201と接続しないものと見なし、SACコーダ201の出力オーディオオブジェクトを除去したSAOCコーダ101に入力されるオーディオオブジェクト、すなわちOBJECT#1〜OBJECT#N−1のみを制御して復元することができる。
図8は、図2のSACコーダ201およびSACデコーダ105をMPEGサラウンドコーダおよびデコーダに代替した場合を示す一実施形態の構造図である。
同図に示すように、SACコーダ201はMPEGサラウンドコーダ(MPSコーダ)801に、SACデコーダ105はMPEGサラウンドデコーダ(MPSデコーダ)805に代替される。また、前記SAOCコーダ101から出力される代表ダウンミックス信号がステレオである場合、追加的に信号処理部803が要求される。
前記MPSコーダ801は、図2のSACコーダ201と同一の役割を行なう。すなわち、前記MPSコーダ801は、入力されるマルチチャネルオーディオ信号から1つのオーディオオブジェクトを出力し、空間キューおよび付加情報を抽出してMPSビットストリームを生成する。前記出力された1つのオーディオオブジェクトは、ダウンミックスされたモノまたはステレオ信号である。
また、前記MPSデコーダ805は、図2のSACデコーダ805と同一の役割を行なう。すなわち、前記MPSデコーダ805は、前記トランスコーダ103から出力されるSACビットストリームを利用し、前記SAOCコーダ101から出力されるダウンミックス信号または信号処理部803から出力される代表再ダウンミックス信号を多様なチャネルのマルチオブジェクトオーディオ信号に復元する。
一方、前記信号処理部805は、前記SAOCコーダ101から出力されるダウンミックス信号がステレオである場合、すなわち前記MPSデコーダ805がステレオ信号を処理する場合、MPSデコーダ805がステレオ信号の左/右処理に制約されるために要求される。
前記数式2は、一般的なSACデコーダでダウンミックス信号がM個に一般化された場合を示す。ダウンミックス信号がステレオである場合、復元される出力チャネル1に対する数式2は下記の数式12のとおりである。
Figure 2010515099
ここで、出力チャネルのベクトルは、すべてのダウンミックス信号に対して適用可能すべきであるが、現在MPSデコーダ805では不可能である。前記MPSデコーダ805は、下記の数式13のように、行列値が0に制限されるためである。
Figure 2010515099
すなわち、出力チャネル1の復元において、u (k)要素が反映されないので、前記数式3、数式4、数式5によって生成されたW ch_2が適用されない。したがって、ステレオ以上のレイアウトを有する信号に対して流動的な位置選定(flexible positioning)が不可能である。すなわち、ステレオ信号の左側信号および右側信号の相互間に自由なレンダリングが不可能である。
しかし、前記信号処理部803を利用して前記SAOCコーダ101から出力される代表ダウンミックス信号を再度ダウンミックスし、代表再ダウンミックス信号として出力する。前記信号処理部803の処理過程は、下記の数式14のとおりである。
Figure 2010515099
前記SAOCコーダ101から出力される代表ダウンミックス信号がステレオである場合、前記信号処理部803の出力信号は、下記の数式15のとおりである。
Figure 2010515099
ここで、y ch_L(k)及びy ch_R(k)は、前記信号処理部803により出力される信号であって、前記MPSデコーダ805に入力される。y ch_L(k)およびy ch_R(k)は、数式15のように左側信号および右側信号のレンダリングがすべて反映された信号であるため、前記MPSデコーダ805が前記数式13のように制限されても、前記MPSデコーダ805は、左側信号および右側信号が自由にレンダリングされた信号を出力することができる。
例えば、前記W 、W がMPSデコーダ805により5チャネルに復元される場合、前記〔数14〕においてW 、W は次のように表現され得る。
Figure 2010515099
前記したように、MPEGサラウンドの制約によってMPSデコーダ805がステレオ信号の処理が困難な場合、前記信号処理部803は、前記トランスコーダ103から伝送されたオブジェクト位置情報を利用し、再度ダウンミックスして代表再ダウンミックス信号を出力する。前記信号処理部803に伝送されるオブジェクト位置情報は、例えばレンダリング部303により提供され得る。ここで、レンダリング部303は、前述で説明したものと類似した方式で前記代表SAOCビットストリームに基づいて前記SAOCコーダ101およびMPSコーダ801に入力されるオーディオ信号に対し、MPSデコーダ805により出力されるオーディオ信号の左側信号および右側信号の各々に対する空間キュー情報が含まれた代表MPSビットストリームを生成することができる。
前記MPSデコーダ805は、前記信号処理部805とともに動作することによって、図2のSACデコーダ205と同一の役割を行なうことができる。
前記MPSデコーダ805は、前記信号処理部803から出力された代表再ダウンミックス信号を所望の出力、すなわち多様なチャネルを有するマルチオブジェクト信号に復元する。
前記図2のSACデコーダ205または前記信号処理部805とともに動作する前記MPSデコーダ805の復号化方法は、マルチチャネルマルチオブジェクトダウンミックス信号およびマルチチャネルマルチオブジェクト付加情報(side information)信号を受信するステップと、前記マルチチャネルマルチオブジェクトダウンミックス信号をマルチチャネルダウンミックス信号に変換するステップと、前記マルチチャネルマルチオブジェクト付加情報信号をマルチチャネル付加情報信号に変換するステップと、前記変換されたマルチチャネルダウンミックス信号およびマルチチャネル付加情報信号を利用してオーディオ信号を合成するステップとを含む。
前記マルチチャネルダウンミックス信号の変換ステップは、前記マルチチャネルマルチオブジェクト付加情報信号から獲得されるオブジェクト関連情報を利用し、前記マルチチャネルマルチオブジェクトダウンミックス信号からオブジェクト情報を除去するステップを含む。前記マルチチャネルダウンミックス信号の変換ステップは、前記マルチチャネルマルチオブジェクト付加情報信号から獲得されるオブジェクト関連情報を利用し、前記マルチチャネルマルチオブジェクトダウンミックス信号からオブジェクト情報を制御するステップを含む。
ここで、前記マルチチャネルダウンミックス信号の変換ステップを含む復号化方法は、前記オブジェクト関連情報はオブジェクト制御情報によって制御され得る。ここで、前記オブジェクト関連情報は、復号化システム情報によって制御され得る。
以上で説明された本発明に係る符号化および復号化過程は装置の観点で説明したが、前記装置に備えられた各装置的な構成要素は、プロセス的構成要素に代替され得、この場合、本発明に係る符号化および復号化過程は、方法の観点で理解されることができることは自明である。
前述のような本発明の方法は、プログラムで具現され、コンピュータで読出し可能な形態で記録媒体(CD−ROM、 RAM 、 ROM、フロッピーディスク、ハードディスク、光磁気ディスクなど)に保存され得る。このような過程は、本発明が属する技術分野における通常の知識を有する者が容易に実施できるため、これ以上詳細に説明しない。
以上で説明した本発明は、前述した実施形態および添付の図面によって限定されるのでなく、本発明の技術的な思想から脱離しない範囲内で様々な置換、変形、および変更が可能であることが、本発明が属する技術分野における通常の知識を有する者にとって明白であろう。

Claims (23)

  1. マルチオブジェクトオーディオ信号の符号化装置であって、
    前記符号化装置に入力されるオーディオオブジェクト信号を空間キューに基づいて符号化し、前記符号化されたオーディオオブジェクト信号に対するレンダリング情報を生成するオーディオオブジェクト符号化手段を備え、
    前記レンダリング情報は、前記オーディオオブジェクト信号に対する空間キュー情報、前記オーディオオブジェクト信号のチャネル情報、および前記オーディオオブジェクト信号の識別情報を含むことを特徴とする符号化装置。
  2. 前記符号化装置に入力されるマルチチャネルオーディオ信号をオーディオオブジェクト信号に変換し、前記マルチチャネルオーディオ信号に対するレンダリング情報を生成するオーディオチャネル符号化手段と、
    前記符号化装置に入力される制御信号に基づいて、前記オーディオオブジェクト信号の音響情報および再生情報を含むプリセット情報を生成するプリセット音響場面生成手段と、
    前記オーディオオブジェクト符号化手段から出力されるレンダリング情報、前記オーディオチャネル符号化手段から出力されるレンダリング情報、および前記プリセット情報を含む代表ビットストリームを生成する代表ビットストリーム生成手段と、
    をさらに備え、
    前記オーディオチャネル符号化手段から出力されるレンダリング情報は、前記マルチチャネルオーディオ信号に対する空間キュー情報、前記マルチチャネルオーディオ信号のチャネル情報、および前記マルチチャネルオーディオ信号の識別情報を含むことを特徴とする請求項1に記載の符号化装置。
  3. 前記オーディオチャネル符号化手段は、MPEG(Moving Pcture Experts Group)サラウンドコーダであることを特徴とする請求項2に記載の符号化装置。
  4. マルチオブジェクトオーディオ信号を復号化するためのレンダリング情報を生成するトランスコーディング装置であって、
    符号化されたオーディオオブジェクト信号に対するオブジェクト制御情報および再生情報に基づいて、前記符号化されたオーディオオブジェクト信号に対するパワー利得情報および出力位置情報を含むレンダリング情報を生成する第1行列手段と、
    前記第1行列手段によって生成されたレンダリング情報および符号化装置から入力される前記符号化されたオーディオオブジェクト信号に対するレンダリング情報に基づいて、復号化装置から出力されるオーディオ信号に対する空間キュー情報を生成するレンダリング手段と、
    を備えることを特徴とするトランスコーディング装置。
  5. 前記レンダリング手段は、前記符号化されたオーディオオブジェクト信号のうちの所定オーディオオブジェクト信号に対する空間キュー情報を除いた、前記復号化装置から出力されるオーディオオブジェクト信号に対する空間キュー情報を生成し、
    前記トランスコーディング装置は、前記符号化されたオーディオ信号のうちから前記所定オーディオオブジェクト信号を除去するオーディオオブジェクト除去手段をさらに備えることを特徴とする請求項4に記載のトランスコーディング装置。
  6. マルチチャネルオーディオ信号およびマルチオブジェクトオーディオ信号を復号化するためのレンダリング情報を生成するトランスコーディング装置であって、
    符号化装置から入力される符号化されたオーディオ信号に対するレンダリング情報から符号化されたオーディオオブジェクト信号に対するレンダリング情報、およびマルチチャネルオーディオ信号に対するレンダリング情報を分離するパーシング手段と、
    符号化されたオーディオオブジェクト信号に対するオブジェクト制御情報および再生情報に基づいて、前記符号化されたオーディオオブジェクト信号に対するパワー利得情報および出力位置情報を含むレンダリング情報を生成する第1行列手段と、
    前記パーシング手段によって分離された符号化されたマルチチャネルオーディオ信号に対するレンダリング情報に基づいて、前記マルチチャネルオーディオ信号に対するチャネル別のパワー利得情報を含むレンダリング情報を生成する第2行列手段と、
    前記第1行列手段によって生成されたレンダリング情報、前記第2行列手段によって生成されたレンダリング情報、および前記パーシング手段によって分離された符号化されたオーディオオブジェクト信号に対するレンダリング情報に基づいて、復号化装置から出力されるオーディオ信号に対する空間キュー情報を生成するレンダリング手段と、
    を備えることを特徴とするトランスコーディング装置。
  7. 前記第1行列手段の符号化されたオーディオオブジェクト信号に対するオブジェクト制御情報および再生情報は、前記符号化装置から入力されるプリセット情報であって前記オーディオオブジェクト信号の音響情報および再生情報を含むプリセット情報であり、
    前記パーシング手段は、符号化装置から入力される符号化されたオーディオ信号に対するレンダリング情報から前記プリセット情報をさらに分離することを特徴とする請求項6に記載のトランスコーディング装置。
  8. 前記レンダリング手段は、前記符号化されたオーディオ信号のうちの所定オーディオ信号に対する空間キュー情報を除いた、前記復号化装置から出力されるオーディオ信号に対する空間キュー情報を生成し、
    前記トランスコーディング装置は、前記符号化されたオーディオ信号のうちから前記所定オーディオ信号に対するオーディオオブジェクト信号を除去するオーディオオブジェクト除去手段をさらに備えることを特徴とする請求項6に記載のトランスコーディング装置。
  9. 前記レンダリング手段は、前記復号化装置から出力されるオーディオ信号に対する空間キュー情報であって、MPEGサラウンドコーダを備える符号化装置によって符号化されたオーディオ信号の左側信号および右側信号の各々に対する空間キュー情報を生成し、
    前記トランスコーディング装置は、MPEG(Moving Pcture Experts Group)サラウンドコーダを備える符号化装置によって符号化されたオーディオ信号が左側信号情報および右側信号情報を含むよう前記符号化されたオーディオ信号を変換する信号処理手段をさらに含むことを特徴とする請求項6に記載のトランスコーディング装置。
  10. マルチオブジェクトオーディオ信号の符号化方法であって、
    入力されるオーディオオブジェクト信号を空間キューに基づいて符号化し、前記符号化されたオーディオオブジェクト信号に対するレンダリング情報を生成するステップを備え、
    前記レンダリング情報は、前記オーディオオブジェクト信号に対する空間キュー情報、前記オーディオオブジェクト信号のチャネル情報、および前記オーディオオブジェクト信号の識別情報を含むことを特徴とする符号化方法。
  11. 入力されるマルチチャネルオーディオ信号をオーディオオブジェクト信号に変換し、前記マルチチャネルオーディオ信号に対するレンダリング情報を生成するステップと、
    入力される制御信号に基づいて、前記オーディオオブジェクト信号の音響情報および再生情報を含むプリセット情報を生成するステップと、
    前記オーディオオブジェクト符号化ステップから出力されるレンダリング情報、前記オーディオチャネル符号化ステップから出力されるレンダリング情報、および前記プリセット情報を含む代表ビットストリームを生成するステップと、をさらに備え、
    前記オーディオチャネル符号化ステップから出力されるレンダリング情報は、
    前記マルチチャネルオーディオ信号に対する空間キュー情報、前記マルチチャネルオーディオ信号のチャネル情報、および前記マルチチャネルオーディオ信号の識別情報を含むことを特徴とする請求項10に記載の符号化方法。
  12. 前記入力されるマルチチャネルオーディオ信号をオーディオオブジェクト信号に変換し、前記マルチチャネルオーディオ信号に対するレンダリング情報を生成するステップは、MPEGサラウンドコーダで行われることを特徴とする請求項11に記載の符号化方法。
  13. マルチオブジェクトオーディオ信号を復号化するためのレンダリング情報を生成するトランスコーディング方法であって、
    符号化されたオーディオオブジェクト信号に対するオブジェクト制御情報および再生情報に基づいて、前記符号化されたオーディオオブジェクト信号に対するパワー利得情報および出力位置情報を含むレンダリング情報を生成するステップと、
    前記レンダリング情報生成ステップにおいて生成されたレンダリング情報および符号化後に入力される前記符号化されたオーディオオブジェクト信号に対するレンダリング情報に基づいて、復号化後に出力されるオーディオ信号に対する空間キュー情報を生成するステップと、
    を含むことを特徴とするトランスコーディング方法。
  14. 前記空間キュー情報を生成するステップにおいて、前記符号化されたオーディオオブジェクト信号のうちの所定オーディオオブジェクト信号に対する空間キュー情報を除外いた、前記復号化後に出力されるオーディオオブジェクト信号に対する空間キュー情報を生成し、
    前記トランスコーディング方法は、前記符号化されたオーディオ信号のうちから前記所定オーディオオブジェクト信号を除去するステップをさらに備えることを特徴とする請求項13に記載のトランスコーディング方法。
  15. マルチチャネルオーディオ信号およびマルチオブジェクトオーディオ信号を復号化するためのレンダリング情報を生成するトランスコーディング方法であって、
    符号化後に入力される符号化されたオーディオ信号に対するレンダリング情報から符号化されたオーディオオブジェクト信号に対するレンダリング情報、およびマルチチャネルオーディオ信号に対するレンダリング情報を分離するステップと、
    符号化されたオーディオオブジェクト信号に対するオブジェクト制御情報および再生情報に基づいて、前記符号化されたオーディオオブジェクト信号に対するパワー利得情報および出力位置情報を含むレンダリング情報を生成するステップと、
    前記レンダリング情報分離ステップにおいて分離された符号化されたマルチチャネルオーディオ信号に対するレンダリング情報に基づいて、前記マルチチャネルオーディオ信号に対するチャネル別のパワー利得情報を含むレンダリング情報を生成するステップと、
    前記レンダリング情報生成ステップにおいて生成されたレンダリング情報、前記マルチチャネルオーディオ信号に対するチャネル別のパワー利得情報を含むレンダリング情報を生成するステップにおいて生成されたレンダリング情報、および前記レンダリング情報分離ステップにおいて分離された符号化されたオーディオオブジェクト信号に対するレンダリング情報に基づいて、復号化後に出力されるオーディオ信号に対する空間キュー情報を生成するステップと、
    を含むことを特徴とするトランスコーディング方法。
  16. 前記前記符号化されたオーディオオブジェクト信号に対するパワー利得情報および出力位置情報を含むレンダリング情報を生成するステップでは、符号化されたオーディオオブジェクト信号に対するオブジェクト制御情報および再生情報は、前記符号化後に入力され、前記オーディオオブジェクト信号の音響情報および再生情報を含むプリセット情報であり、
    前記レンダリング情報分離ステップは、符号化後に入力される符号化されたオーディオ信号に対するレンダリング情報から前記プリセット情報を分離するステップをさらに備えることを特徴とする請求項15に記載のトランスコーディング方法。
  17. 前記空間キュー情報を生成するテップにおいて、前記符号化されたオーディオ信号のうちの所定オーディオ信号に対する空間キュー情報を除外いた、前記復号化ステップから出力されるオーディオ信号に対する空間キュー情報を生成し、
    前記トランスコーディング方法は、前記符号化されたオーディオ信号のうちから前記所定オーディオ信号に対するオーディオオブジェクト信号を除去するステップをさらに含むことを特徴とする請求項15に記載のトランスコーディング方法。
  18. 前記復号化後に出力されるオーディオ信号に対する空間キュー情報を生成するステップにおいて、MPEG(Moving Pcture Experts Group)サラウンドコーダを備える符号化されたオーディオ信号の左側信号および右側信号各々に対する空間キュー情報が、前記復号化後に出力されるオーディオ信号に対する空間キュー情報として生成され、
    前記トランスコーディング方法は、MPEGサラウンドコーダを含む符号化されたオーディオ信号が左側信号情報および右側信号情報を含むよう前記符号化されたオーディオ信号を変換するステップをさらに含むことを特徴とする請求項15に記載のトランスコーディング方法。
  19. マルチオブジェクトオーディオ信号の復号化方法であって、
    マルチチャネルマルチオブジェクトダウンミックス信号およびマルチチャネルマルチオブジェクト付加情報(side information)信号を受信するステップと、
    前記マルチチャネルマルチオブジェクトダウンミックス信号をマルチチャネルダウンミックス信号に変換するステップと、
    前記マルチチャネルマルチオブジェクト付加情報信号をマルチチャネル付加情報信号に変換するステップと、
    前記変換されたマルチチャネルダウンミックス信号およびマルチチャネル付加情報信号を利用してオーディオ信号を合成するステップと、
    を含むことを特徴とするマルチチャネルマルチオブジェクトオーディオの復号化方法。
  20. 前記マルチチャネルダウンミックス信号の変換ステップは、前記マルチチャネルマルチオブジェクト付加情報信号から獲得されるオブジェクト関連情報を利用し、前記マルチチャネルマルチオブジェクトダウンミックス信号からオブジェクト情報を除去するステップを含むことを特徴とする請求項19に記載のマルチチャネルマルチオブジェクトオーディオの復号化方法。
  21. 前記オブジェクト関連情報は、オブジェクト制御情報によって制御されることを特徴とする請求項20に記載のマルチチャネルマルチオブジェクトオーディオの復号化方法。
  22. 前記オブジェクト関連情報は、復号化システム情報によって制御されることを特徴とする請求項20に記載のマルチチャネルマルチオブジェクトオーディオの復号化方法。
  23. 前記マルチチャネルダウンミックス信号の変換ステップは、前記マルチチャネルマルチオブジェクト付加情報信号から獲得されるオブジェクト関連情報を利用し、前記マルチチャネルマルチオブジェクトダウンミックス信号からオブジェクト情報を制御するステップを含むことを特徴とする請求項19に記載のマルチチャネルマルチオブジェクトオーディオの復号化方法。
JP2009543949A 2006-12-27 2007-12-27 トランスコーディング装置 Active JP5941610B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
KR10-2006-0135400 2006-12-27
KR20060135400 2006-12-27
KR10-2007-0003897 2007-01-12
KR20070003897 2007-01-12
KR20070007724 2007-01-25
KR10-2007-0007724 2007-01-25
PCT/KR2007/006910 WO2008078973A1 (en) 2006-12-27 2007-12-27 Apparatus and method for coding and decoding multi-object audio signal with various channel including information bitstream conversion

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2012256586A Division JP5694279B2 (ja) 2006-12-27 2012-11-22 符号化装置

Publications (3)

Publication Number Publication Date
JP2010515099A true JP2010515099A (ja) 2010-05-06
JP2010515099A5 JP2010515099A5 (ja) 2011-02-17
JP5941610B2 JP5941610B2 (ja) 2016-06-29

Family

ID=39562714

Family Applications (8)

Application Number Title Priority Date Filing Date
JP2009543949A Active JP5941610B2 (ja) 2006-12-27 2007-12-27 トランスコーディング装置
JP2012256586A Active JP5694279B2 (ja) 2006-12-27 2012-11-22 符号化装置
JP2013011336A Active JP5674833B2 (ja) 2006-12-27 2013-01-24 符号化装置
JP2013011344A Pending JP2013101384A (ja) 2006-12-27 2013-01-24 トランスコーディング装置
JP2013011340A Active JP6027901B2 (ja) 2006-12-27 2013-01-24 トランスコーディング装置
JP2013011324A Active JP5752722B2 (ja) 2006-12-27 2013-01-24 トランスコーディング装置
JP2016127783A Active JP6446407B2 (ja) 2006-12-27 2016-06-28 トランスコーディング方法
JP2018226651A Pending JP2019074743A (ja) 2006-12-27 2018-12-03 トランスコーディング装置

Family Applications After (7)

Application Number Title Priority Date Filing Date
JP2012256586A Active JP5694279B2 (ja) 2006-12-27 2012-11-22 符号化装置
JP2013011336A Active JP5674833B2 (ja) 2006-12-27 2013-01-24 符号化装置
JP2013011344A Pending JP2013101384A (ja) 2006-12-27 2013-01-24 トランスコーディング装置
JP2013011340A Active JP6027901B2 (ja) 2006-12-27 2013-01-24 トランスコーディング装置
JP2013011324A Active JP5752722B2 (ja) 2006-12-27 2013-01-24 トランスコーディング装置
JP2016127783A Active JP6446407B2 (ja) 2006-12-27 2016-06-28 トランスコーディング方法
JP2018226651A Pending JP2019074743A (ja) 2006-12-27 2018-12-03 トランスコーディング装置

Country Status (6)

Country Link
US (2) US8370164B2 (ja)
EP (6) EP2595149A3 (ja)
JP (8) JP5941610B2 (ja)
KR (6) KR101086347B1 (ja)
CN (6) CN103137131A (ja)
WO (1) WO2008078973A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010525378A (ja) * 2007-03-30 2010-07-22 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート マルチチャネルで構成されたマルチオブジェクトオーディオ信号のエンコード、並びにデコード装置および方法
JP2011528446A (ja) * 2008-07-15 2011-11-17 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
JP2011530720A (ja) * 2008-08-13 2011-12-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 空間オーディオストリームをマージするための装置
JP5243527B2 (ja) * 2008-07-29 2013-07-24 パナソニック株式会社 音響符号化装置、音響復号化装置、音響符号化復号化装置および会議システム
WO2014192602A1 (ja) * 2013-05-31 2014-12-04 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP2018196133A (ja) * 2018-07-20 2018-12-06 パナソニック株式会社 サラウンドオーディオ信号処理のための装置及び方法

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2595149A3 (en) * 2006-12-27 2013-11-13 Electronics and Telecommunications Research Institute Apparatus for transcoding downmix signals
KR101461685B1 (ko) * 2008-03-31 2014-11-19 한국전자통신연구원 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
KR101596504B1 (ko) * 2008-04-23 2016-02-23 한국전자통신연구원 객체기반 오디오 컨텐츠의 생성/재생 방법 및 객체기반 오디오 서비스를 위한 파일 포맷 구조를 가진 데이터를 기록한 컴퓨터 판독 가능 기록 매체
KR101171314B1 (ko) * 2008-07-15 2012-08-10 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
KR101614160B1 (ko) * 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
KR101600352B1 (ko) * 2008-10-30 2016-03-07 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
KR101129974B1 (ko) * 2008-12-22 2012-03-28 (주)오디즌 객체 기반 오디오 컨텐츠 생성/재생 방법 및 그 장치
WO2010087631A2 (en) * 2009-01-28 2010-08-05 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
US20110054917A1 (en) * 2009-08-28 2011-03-03 Electronics And Telecommunications Research Institute Apparatus and method for structuring bitstream for object-based audio service, and apparatus for encoding the bitstream
CN102714038B (zh) * 2009-11-20 2014-11-05 弗兰霍菲尔运输应用研究公司 用以基于下混信号表示型态而提供上混信号表示型态的装置、用以提供表示多声道音频信号的位流的装置、方法
GB2485979A (en) * 2010-11-26 2012-06-06 Univ Surrey Spatial audio coding
RU2570359C2 (ru) * 2010-12-03 2015-12-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Прием звука посредством выделения геометрической информации из оценок направления его поступления
KR20120071072A (ko) * 2010-12-22 2012-07-02 한국전자통신연구원 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
CN103890841B (zh) 2011-11-01 2017-10-17 皇家飞利浦有限公司 音频对象编码和解码
WO2013192111A1 (en) 2012-06-19 2013-12-27 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
US9489954B2 (en) 2012-08-07 2016-11-08 Dolby Laboratories Licensing Corporation Encoding and rendering of object based audio indicative of game audio content
KR20140046980A (ko) * 2012-10-11 2014-04-21 한국전자통신연구원 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법
SG10201709574WA (en) 2012-12-04 2018-01-30 Samsung Electronics Co Ltd Audio providing apparatus and audio providing method
TWI530941B (zh) 2013-04-03 2016-04-21 杜比實驗室特許公司 用於基於物件音頻之互動成像的方法與系統
IL290275B2 (en) 2013-05-24 2023-02-01 Dolby Int Ab Encoding audio scenes
US9666198B2 (en) 2013-05-24 2017-05-30 Dolby International Ab Reconstruction of audio scenes from a downmix
US9858932B2 (en) 2013-07-08 2018-01-02 Dolby Laboratories Licensing Corporation Processing of time-varying metadata for lossless resampling
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830049A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient object metadata coding
EP2830050A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhanced spatial audio object coding
US9373320B1 (en) 2013-08-21 2016-06-21 Google Inc. Systems and methods facilitating selective removal of content from a mixed audio recording
KR102243395B1 (ko) * 2013-09-05 2021-04-22 한국전자통신연구원 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법, 오디오 재생 장치
KR101805630B1 (ko) * 2013-09-27 2017-12-07 삼성전자주식회사 멀티 디코딩 처리 방법 및 이를 수행하기 위한 멀티 디코더
WO2015094894A1 (en) * 2013-12-19 2015-06-25 Archer Daniels Midland Company Enhanced regio-selectivity in glycol acylation
WO2015142073A1 (ko) * 2014-03-19 2015-09-24 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
WO2015145782A1 (en) * 2014-03-26 2015-10-01 Panasonic Corporation Apparatus and method for surround audio signal processing
KR102302672B1 (ko) * 2014-04-11 2021-09-15 삼성전자주식회사 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
US9794712B2 (en) 2014-04-25 2017-10-17 Dolby Laboratories Licensing Corporation Matrix decomposition for rendering adaptive audio using high definition audio codecs
US9774974B2 (en) * 2014-09-24 2017-09-26 Electronics And Telecommunications Research Institute Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion
WO2016204580A1 (ko) * 2015-06-17 2016-12-22 삼성전자 주식회사 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
KR101754528B1 (ko) * 2016-03-23 2017-07-06 한국광기술원 건식 접착구조를 갖는 led 구조체 어레이의 전사체와 이를 이용한 led 구조체 어레이의 이송방법 및 led 구조체
US10535355B2 (en) 2016-11-18 2020-01-14 Microsoft Technology Licensing, Llc Frame coding for spatial audio data
CN108206021B (zh) * 2016-12-16 2020-12-18 南京青衿信息科技有限公司 一种后向兼容式三维声编码器、解码器及其编解码方法
CN110800048B (zh) * 2017-05-09 2023-07-28 杜比实验室特许公司 多通道空间音频格式输入信号的处理
US11595774B2 (en) * 2017-05-12 2023-02-28 Microsoft Technology Licensing, Llc Spatializing audio data based on analysis of incoming audio data
JP6772215B2 (ja) 2018-05-28 2020-10-21 三井金属アクト株式会社 ドアロック装置対
GB201909133D0 (en) 2019-06-25 2019-08-07 Nokia Technologies Oy Spatial audio representation and rendering
BR112022010737A2 (pt) * 2019-12-02 2022-08-23 Dolby Laboratories Licensing Corp Sistemas, métodos e aparelho para conversão de áudio com base em canal para áudio com base em objeto
KR102243889B1 (ko) 2019-12-13 2021-04-23 국방과학연구소 데이터 복호화 장치 및 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008039042A1 (en) * 2006-09-29 2008-04-03 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU653582B2 (en) * 1991-01-08 1994-10-06 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US5815689A (en) * 1997-04-04 1998-09-29 Microsoft Corporation Method and computer program product for synchronizing the processing of multiple data streams and matching disparate processing rates using a standardized clock mechanism
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
AU2002343151A1 (en) 2001-11-23 2003-06-10 Koninklijke Philips Electronics N.V. Perceptual noise substitution
US7797631B2 (en) * 2002-09-18 2010-09-14 Canon Kabushiki Kaisha Document printing control apparatus and method
ATE430360T1 (de) * 2004-03-01 2009-05-15 Dolby Lab Licensing Corp Mehrkanalige audiodekodierung
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402652D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
US8340306B2 (en) * 2004-11-30 2012-12-25 Agere Systems Llc Parametric coding of spatial audio with object-based side information
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
EP1859439B1 (en) * 2005-03-14 2013-10-30 Electronics and Telecommunications Research Institute Multichannel audio compression and decompression method using virtual source location information
EP1866911B1 (en) * 2005-03-30 2010-06-09 Koninklijke Philips Electronics N.V. Scalable multi-channel audio coding
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
US7751572B2 (en) 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
WO2006126859A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
WO2007091870A1 (en) 2006-02-09 2007-08-16 Lg Electronics Inc. Method for encoding and decoding object-based audio signal and apparatus thereof
ATE527833T1 (de) * 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US20080004729A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Direct encoding into a directional audio coding format
WO2008039038A1 (en) * 2006-09-29 2008-04-03 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
ATE539434T1 (de) * 2006-10-16 2012-01-15 Fraunhofer Ges Forschung Vorrichtung und verfahren für mehrkanalparameterumwandlung
CA2874454C (en) * 2006-10-16 2017-05-02 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
DE102006050068B4 (de) * 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
JP5394931B2 (ja) 2006-11-24 2014-01-22 エルジー エレクトロニクス インコーポレイティド オブジェクトベースオーディオ信号の復号化方法及びその装置
EP2595149A3 (en) * 2006-12-27 2013-11-13 Electronics and Telecommunications Research Institute Apparatus for transcoding downmix signals
KR101049143B1 (ko) * 2007-02-14 2011-07-15 엘지전자 주식회사 오브젝트 기반의 오디오 신호의 부호화/복호화 장치 및 방법
US8073125B2 (en) * 2007-09-25 2011-12-06 Microsoft Corporation Spatial audio conferencing
KR101461685B1 (ko) * 2008-03-31 2014-11-19 한국전자통신연구원 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
BRPI0905069A2 (pt) * 2008-07-29 2015-06-30 Panasonic Corp Aparelho de codificação de áudio, aparelho de decodificação de áudio, aparelho de codificação e de descodificação de áudio e sistema de teleconferência

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008039042A1 (en) * 2006-09-29 2008-04-03 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010525378A (ja) * 2007-03-30 2010-07-22 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート マルチチャネルで構成されたマルチオブジェクトオーディオ信号のエンコード、並びにデコード装置および方法
US8639498B2 (en) 2007-03-30 2014-01-28 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi object audio signal with multi channel
US9257128B2 (en) 2007-03-30 2016-02-09 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi object audio signal with multi channel
JP2011528446A (ja) * 2008-07-15 2011-11-17 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
JP5243527B2 (ja) * 2008-07-29 2013-07-24 パナソニック株式会社 音響符号化装置、音響復号化装置、音響符号化復号化装置および会議システム
JP2011530720A (ja) * 2008-08-13 2011-12-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 空間オーディオストリームをマージするための装置
WO2014192602A1 (ja) * 2013-05-31 2014-12-04 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JPWO2014192602A1 (ja) * 2013-05-31 2017-02-23 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9805729B2 (en) 2013-05-31 2017-10-31 Sony Corporation Encoding device and method, decoding device and method, and program
TWI615834B (zh) * 2013-05-31 2018-02-21 Sony Corp 編碼裝置及方法、解碼裝置及方法、以及程式
JP2018196133A (ja) * 2018-07-20 2018-12-06 パナソニック株式会社 サラウンドオーディオ信号処理のための装置及び方法

Also Published As

Publication number Publication date
JP5752722B2 (ja) 2015-07-22
CN101632118A (zh) 2010-01-20
US9257127B2 (en) 2016-02-09
JP5941610B2 (ja) 2016-06-29
EP2097895A1 (en) 2009-09-09
US8370164B2 (en) 2013-02-05
JP5694279B2 (ja) 2015-04-01
CN103137132A (zh) 2013-06-05
KR20080063155A (ko) 2008-07-03
KR20130007526A (ko) 2013-01-18
WO2008078973A1 (en) 2008-07-03
EP2595148A3 (en) 2013-11-13
EP2595148A2 (en) 2013-05-22
EP2595151A2 (en) 2013-05-22
CN103137130A (zh) 2013-06-05
EP2595152A2 (en) 2013-05-22
JP2013127634A (ja) 2013-06-27
KR101395254B1 (ko) 2014-05-15
KR20100045960A (ko) 2010-05-04
KR20130007527A (ko) 2013-01-18
CN103137130B (zh) 2016-08-17
EP2595150A2 (en) 2013-05-22
JP2013083986A (ja) 2013-05-09
EP2595151A3 (en) 2013-11-13
KR101086347B1 (ko) 2011-11-23
CN103137132B (zh) 2016-09-07
CN103137131A (zh) 2013-06-05
KR20110036023A (ko) 2011-04-06
EP2595149A2 (en) 2013-05-22
JP2013127635A (ja) 2013-06-27
KR101309672B1 (ko) 2013-09-23
US20130132098A1 (en) 2013-05-23
EP2097895A4 (en) 2013-11-13
JP2016200824A (ja) 2016-12-01
CN102883257B (zh) 2015-11-04
JP2019074743A (ja) 2019-05-16
EP2595149A3 (en) 2013-11-13
CN102883257A (zh) 2013-01-16
JP2013101384A (ja) 2013-05-23
JP6446407B2 (ja) 2018-12-26
CN102595303A (zh) 2012-07-18
KR101309673B1 (ko) 2013-09-23
JP5674833B2 (ja) 2015-02-25
JP6027901B2 (ja) 2016-11-16
CN102595303B (zh) 2015-12-16
KR101531239B1 (ko) 2015-07-06
KR20130007525A (ko) 2013-01-18
JP2013137550A (ja) 2013-07-11
US20100114582A1 (en) 2010-05-06
EP2595152A3 (en) 2013-11-13
KR101546744B1 (ko) 2015-08-24
EP2595150A3 (en) 2013-11-13
CN101632118B (zh) 2013-06-05

Similar Documents

Publication Publication Date Title
JP6446407B2 (ja) トランスコーディング方法
JP2010515099A5 (ja)
JP4685925B2 (ja) 適応残差オーディオ符号化
KR101422745B1 (ko) 다채널로 구성된 다객체 오디오 신호의 인코딩 및 디코딩장치 및 방법
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
JP6346278B2 (ja) ジョイント符号化残留信号を用いたオーディオエンコーダ、オーディオデコーダ、方法、およびコンピュータプログラム
JP2013506164A (ja) オーディオ信号デコーダ、オーディオ信号エンコーダ、アップミックス信号表現の生成方法、ダウンミックス信号表現の生成方法、コンピュータプログラム、及び共通するオブジェクト間相関パラメータ値を用いるビットストリーム
JP6133422B2 (ja) マルチチャネルをダウンミックス/アップミックスする場合のため一般化された空間オーディオオブジェクト符号化パラメトリック概念のデコーダおよび方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101224

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120522

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120822

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120829

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120924

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121001

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121022

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121029

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130524

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130826

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130902

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130924

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20131001

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131024

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20131031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140806

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150317

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20150325

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20150529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160318

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160523

R150 Certificate of patent or registration of utility model

Ref document number: 5941610

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250