JP2011528446A - オーディオ信号の処理方法及び装置 - Google Patents

オーディオ信号の処理方法及び装置 Download PDF

Info

Publication number
JP2011528446A
JP2011528446A JP2011518648A JP2011518648A JP2011528446A JP 2011528446 A JP2011528446 A JP 2011528446A JP 2011518648 A JP2011518648 A JP 2011518648A JP 2011518648 A JP2011518648 A JP 2011518648A JP 2011528446 A JP2011528446 A JP 2011528446A
Authority
JP
Japan
Prior art keywords
preset
information
external
rendering
external preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011518648A
Other languages
English (en)
Other versions
JP5258967B2 (ja
Inventor
オー,ヒェン−オ
ウォン ジュン,ヤン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Priority claimed from KR1020090064274A external-priority patent/KR101171314B1/ko
Publication of JP2011528446A publication Critical patent/JP2011528446A/ja
Application granted granted Critical
Publication of JP5258967B2 publication Critical patent/JP5258967B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/40Visual indication of stereophonic sound image
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Circuits Of Receivers In General (AREA)

Abstract

【課題】データ領域に個別の、または全ダウンミックス信号に同一の外部プリセット情報を選択することにより、オーディオ信号を効率的に復元することができるオーディオ信号処理装置を提供する。
【解決手段】ダウンミックス信号、オブジェクト情報、プリセット情報を受信する信号受信部、適用オブジェクト個数情報を含む外部プリセット情報を受信する外部プリセット情報受信部、オブジェクト個数情報と適用オブジェクト個数情報が一致するか否かを判断して、外部プリセット情報のダウンミックス信号への適用を決定する外部プリセット情報適用判断部、個数が一致する場合、外部プリセット情報を用いてレンダリングするレンダリング部を含み、外部プリセット情報は、ダウンミックス信号をレンダリングするための外部プリセットレンダリングパラメータ及び外部プリセットレンダリングパラメータの属性を表示するための外部プリセットメタデータを含む。
【選択図】図2

Description

本発明は、オーディオ信号の処理方法及び装置に係り、特に、デジタル媒体、放送信号などにより受信されたオーディオ信号を処理することができるオーディオ信号の処理方法及び装置に関するものである。
複数個のオブジェクトを含むオーディオ信号を、モノまたはステレオ信号にダウンミキシングしてダウンミックス信号を生成する過程において、オブジェクトからパラメータ(または情報)が抽出される。これらのパラメータ(または、情報)は、ダウンミキシングされた信号をデコーディングする過程で用いられ、オブジェクトの位置(position)及びゲイン(gain)はパラメータの他に、ユーザーの選択によってコントロールすることができる。
ダウンミックス信号に含まれているオブジェクトは、ユーザーの選択によって調節しなければならないが、ユーザーによってオブジェクトを制御する場合、直接全てのオブジェクト信号を制御しなければならないという面倒さがあり、専門家によって制御される場合に比べて、多数個のオブジェクトを含むオーディオ信号を最適の状態に再現し難いという問題があった。
従って、本発明は、オーディオ信号を処理するための装置とその方法に関するものであり、関連技術における制限と不利点による1つ以上の問題を実質的に取り除く。
本発明の目的は、上記問題点を解決するために創案されたもので、既に設定されたプリセットレンダリングパラメータ及びプリセットメタデータを含むプリセット情報を用いてオブジェクトのレベルと位置をコントロールできるオーディオ信号の処理方法及び装置を提供することにある。
本発明の他の目的は、ダウンミックス信号と別に入力されたビットストリームに含まれた外部プリセット情報を用いてオブジェクトのレベルと位置を調節できるオーディオ信号の処理方法及び装置を提供することにある。
本発明のさらに他の目的は、音源の特性によってダウンミックス信号と一緒に入力されたプリセット情報の属性を示すプリセット属性情報を用いて、ダウンミックス信号と別のビットストリームとして入力された外部プリセット情報をダウンミックス信号全体にまたはダウンミックス信号のデータ領域に適用することでダウンミックス信号に含まれたオブジェクトを調節できるオーディオ信号の処理方法及び装置を提供することにある。
本発明のさらに他の目的は、ユーザーの選択に基づいて画面に表示された外部プリセットメタデータのうち一つを選択し、これに対応する外部プリセットレンダリングパラメータを用いてオブジェクトのレベルと位置をコントロールできるオーディオ信号の処理方法及び装置を提供することにある。
本発明のさらに他の目的は、外部プリセットレンダリングパラメータが適用されて調節されたオブジェクト及び選択された外部プリセットメタデータを画面に表示することによってユーザーからフィードバック情報を受けることができるオーディオ信号の処理方法及び装置を提供することにある。
本発明は、下記のような効果及び利点を有する。
第一に、音源の特性によって前記プリセット情報をデータ領域(またはフレーム単位)に個別的に選択して適用したり、ダウンミックス信号全体に同一のプリセット情報を選択して適用することによって、オーディオ信号を効率的に復元することができる。
第二に、それぞれのオブジェクトに対するユーザーの設定なしに、既に設定されたプリセット情報の他に、複数個の外部プリセットレンダリングパラメータのうち一つを、複数個の外部プリセットメタデータを用いて選択することによって、容易にオブジェクトの出力チャンネルのレベルを調節することができる。
第三に、外部プリセット情報が適用されて調節されたオブジェクト及び選択されたプリセットメタデータを画面から確認することによってより適切な外部プリセット情報を選択し、オブジェクトの出力チャンネルのレベルまたは位置を調節することができる。
本発明の更なる理解を提供するために添付され、組み込まれ、及び本明細書の一部を構成する図面は、本発明の実施例を説明し、明細書と共に、本発明の原理を説明する。
本発明の一実施例によるプリセット属性情報によってプリセット情報を適用してダウンミックス信号に含まれたオブジェクトを調節する概念図である。 本発明の一実施例によるプリセット属性情報によってプリセット情報を適用してダウンミックス信号に含まれたオブジェクトを調節する概念図である。 本発明の一実施例による外部プリセット情報を用いてダウンミックス信号に含まれたオブジェクトを調節する概念図である。 ダウンミックス信号に含まれたオブジェクトに適用される外部プリセット情報の概念図である。 本発明の一実施例によるオーディオ信号の処理装置を示す図である。 本発明の一実施例による固定プリセット情報受信部、変動プリセット情報受信部及びレンダリング部の概略的な構成を示すブロック図である。 本発明の一実施例による固定プリセット情報受信部、変動プリセット情報受信部及びレンダリング部の概略的な構成を示すブロック図である。 本発明の一実施例による外部プリセット情報受信部及びレンダリング部の概略的な構成を示すブロック図である。 本発明の図5A乃至図6のプリセットレンダリングパラメータ受信部の概略的な構成を示すブロック図である。 本発明の一実施例によるオーディオ信号の処理装置を示す図である。 外部プリセット情報のビットストリーム構造を示す図である。 本発明の他の実施例によるプリセット情報と関連するシンタックス(syntax)を様々な方法で表現したものである。 本発明の他の実施例によるプリセット情報と関連するシンタックス(syntax)を様々な方法で表現したものである。 本発明の他の実施例によるプリセット情報と関連するシンタックス(syntax)を様々な方法で表現したものである。 本発明のさらに他の実施例によるオーディオ信号の処理装置を示すブロック図である。 本発明のさらに他の実施例によるオーディオ信号の処理装置のディスプレイ部の一例を示す図である。 本発明のさらに他の実施例によって外部プリセット情報が適用されたオブジェクトを表示する一つ以上の図形的オブジェクトを示す図である。 本発明のさらに他の実施例による外部プリセット情報受信部、外部プリセット情報適用判断部、固定プリセット情報受信部、変動プリセット情報受信部及びレンダリング部が具現された製品の概略的な構成を示す図である。 本発明のさらに他の実施例による外部プリセット情報受信部、外部プリセット情報適用判断部、固定プリセット情報受信部、変動プリセット情報受信部及びレンダリング部が具現された製品の関係を示す図である。 本発明のさらに他の実施例による外部プリセット情報受信部、外部プリセット情報適用判断部、固定プリセット情報受信部、変動プリセット情報受信部及びレンダリング部が具現された製品の関係を示す図である。 本発明のさらに他の実施例による外部プリセット情報受信部、外部プリセット情報適用判断部、固定プリセット情報受信部、変動プリセット情報受信部及びレンダリング部が具現された放送信号デコーディング装置の概略的な構成を示す図である。
本発明の更なる特徴及び利点は、以下の詳細な説明で記述され、部分的には、詳細な説明から明らかになるか、発明の実行から理解されるであろう。発明の目的及びその他の利点は、添付図面の他に、明細書及び請求項に特に記載された構成によって実現または獲得されるであろう。
前記のような目的を達成するために、本発明によるオーディオ信号の処理装置は、一つ以上のオブジェクトを含むダウンミックス信号、前記ダウンミックス信号に含まれた少なくとも一つのオブジェクトをレンダリングするための複数個のプリセット情報を受信する信号受信部;外部から入力され、レンダリングデータ及び前記レンダリングデータが適用されるダウンミックス信号に含まれたオブジェクトの個数を示す適用オブジェクト個数情報を含む複数個の外部プリセット情報を受信する外部プリセット情報受信部;前記適用オブジェクト個数情報に基づいて前記複数個の外部プリセット情報が前記ダウンミックス信号に適用されるか否かを判断する外部プリセット適用判断部;前記複数個の外部プリセット情報が選択された場合、前記複数個の外部プリセット情報のうち一つの外部プリセット情報を選択する外部プリセット情報選択部;及び、前記選択された外部プリセット情報を前記ダウンミックス信号の全てのデータ領域に適用することによって前記オブジェクトを調節するレンダリング部を含み、前記外部プリセット情報は、前記ダウンミックス信号をレンダリングするための外部プリセットレンダリングパラメータ、及び前記外部プリセットレンダリングパラメータの属性を表示するための外部プリセットメタデータを含むことができる。
前記外部プリセット情報適用判断部は、前記外部プリセット情報を前記ダウンミックス信号に適用するか否かを示す外部メタデータ情報をさらに用いることができる。
前記外部プリセット情報受信部は、外部プリセットレンダリングパラメータを受信する外部プリセットレンダリングパラメータ受信部、及び前記外部プリセットメタデータを受信する外部プリセットメタデータ受信部を含むことができる。
前記一つの外部プリセット情報を選択するために、前記複数個の外部プリセット情報に含まれた複数個の外部プリセットメタデータを表示するディスプレイ部;及び、前記複数個の外部プリセットメタデータのうち一つの外部プリセットメタデータを選択する選択信号が入力されるプリセット情報入力部をさらに含み、前記プリセット情報選択部は、前記選択信号に基づいて前記一つの外部プリセット情報を選択することができる。
前記ディスプレイ部は、前記選択信号に基づいて選択された前記一つの外部プリセットメタデータをさらに表示することができる。
前記ディスプレイ部は、前記オブジェクトのレベルまたは位置を示す一つ以上の図形要素(graphical element)を含むことができる。
前記図形要素は、前記オブジェクトのレベルまたは位置及び活性化を示すために変形されることができる。
前記ディスプレイ部は、前記外部プリセット選択部と連結されて動作する場合、前記複数個の外部プリセットメタデータを一回表示することができる。
前記オーディオ信号の処理装置は、前記調節されたオブジェクトを出力する出力部;及び、前記選択された一つの外部プリセット情報を格納する格納部をさらに含むことができる。
本発明の目的を達成するために、本発明の実施例に係るオーディオ信号の処理方法は、一つ以上のオブジェクトを含むダウンミックス信号、前記ダウンミックス信号に含まれた少なくとも一つのオブジェクトをレンダリングするための複数個のプリセット情報、外部から入力される複数個の外部プリセット情報、及び前記外部プリセット情報が適用されるオブジェクトの個数を示す適用オブジェクト個数情報を受信する段階;前記適用オブジェクト個数情報に基づいて前記複数個の外部プリセット情報が前記ダウンミックス信号に適用されるか否かを判断する段階;前記複数個の外部プリセット情報が選択された場合、前記複数個の外部プリセット情報のうち一つの外部プリセット情報を選択する段階;及び、前記選択された一つの外部プリセット情報を前記ダウンミックス信号の全てのデータ領域に適用することによって前記オブジェクトを調節する段階を含み、前記外部プリセット情報は、前記ダウンミックス信号をレンダリングするための外部プリセットレンダリングパラメータ、及び前記外部プリセットレンダリングパラメータの属性を表示するための外部プリセットメタデータを含むことができる。
好適には、前記判断する段階は、外部プリセット情報がダウンミックス信号に適用されるか否かを示す外部メタデータ情報をさらに使用する。
好適には、前記方法は、レンダリング後、オブジェクトの調整されたレベル、及び選択された外部プリセットメタデータを表示する段階をさらに含む。
好適には、前記方法は、レンダリング後、選択された外部プリセット情報を格納する段階をさらに含む。
当然のことであるが、前記の一般的な記載、及び以下の詳細な記載は、典型的なもの、及び説明のためのものであり、請求項に記載される本発明の更なる説明を提供することを目的としている。
以下、添付の図面を参照しつつ、本発明の好適な実施例について詳細に説明する。これに先立ち、本明細書及び請求の範囲で使われた用語や単語は、通常的または辞書的な意味に限定して解釈してはならず、発明者は自身の発明を最善の方法で説明するために用語の概念を適宜定義することができるという原則に立って、本発明の技術的思想に符合する意味と概念として解釈しならなければならない。したがって、本明細書に記載された実施例と図面に示された構成は、本発明の好適な一実施例に過ぎないもので、本発明の技術的思想を全部示すものではないので、本出願時点においてこれらに取って代わる様々な均等物及び変形例がありうるということを理解すべきである。
特に、本明細書でいう情報(information)は、値(values)、パラメータ(parameters)、係数(coefficients)、成分(elements)などを総称するもので、場合によってその意味は別々に解釈することができ、よって、これに本発明が限定されることはない。
図1A及び図1Bは、本発明の一実施例によるプリセット属性情報(preset attribute information)によってプリセット情報(preset information)を適用して、ダウンミックス信号に含まれたオブジェクトを調節する概念図である。本発明のオーディオ信号は、エンコーダでダウンミックス信号(downmix signal)及びオブジェクト情報(object information)にエンコーディングされ、これらは一つのビットストリームまたは別個のビットストリームの形態でデコーダに転送される。プリセット情報は、オブジェクト情報に含まれるもので、ダウンミックス信号に含まれたオブジェクトのレベルまたはパニングなどを調節するためにあらかじめ設定された情報を指す。プリセット情報は、様々なモードを含むことができ、実際にオブジェクトを調節するレンダリングパラメータと、モードの特性を示すメタデータを含むことができ、これについては図2及び図3を参照して詳細に後述する。
図1A及び図1Bを参照すると、ビットストリームに含まれたオブジェクト情報は、具体的に、構成情報領域(configuration information region)と複数個のデータ領域(データ領域1、データ領域2、…、データ領域n(data region 1、data region 2、…、data region n))とで構成される。構成情報領域は、オブジェクト情報のビットストリームにおいて前側に位置している領域で、オブジェクト情報の全てのデータ領域に共通して適用される情報を含む。例えば、ツリー構造などを含む構成情報(データ領域長さ情報(data region length information)及びオブジェクトの個数情報(object number information))などを含むことができる。
一方、データ領域は、構成情報領域に含まれたデータ領域長さ情報に基づいて、全体オーディオ信号の時間ドメインを分割したユニットであり、フレーム(frame)を含むことができる。オブジェクト情報のデータ領域は、ダウンミックス信号のデータ領域に対応し、対応するデータ領域のオブジェクトの属性に基づくオブジェクトレベル情報、オブジェクトゲイン情報などのオブジェクトデータ情報を含む。
まず、本発明の一実施例によるオーディオ信号の処理方法では、ビットストリームのオブジェクト情報からプリセット属性情報(preset_attribute_information)を読む。このプリセット属性情報は、プリセット情報がビットストリームにおいてどの領域に含まれているかを示すもので、詳細には、プリセット情報がオブジェクト情報の構成情報領域に含まれるか、または、データ領域に含まれるかを示す。その詳細な意味は、下記の表1の通りである。
Figure 2011528446
まず、図1Aを参照すると、プリセット属性情報が0であって、プリセット情報が構成情報領域に含まれる場合、構成情報領域から抽出されたプリセット情報は、ダウンミックス信号の全てのデータ領域に同一に適用されてレンダリングを行う。
一方、図1Bを参照すると、プリセット属性情報が1であって、プリセット情報がデータ領域に含まれる場合、データ領域から抽出されたプリセット情報は、対応するダウンミックス信号のデータ領域に適用されてレンダリングを行う。例えば、データ領域1から抽出されたプリセット情報は、ダウンミックス信号のデータ領域1に適用され、データ領域nから抽出されたプリセット情報は、ダウンミックス信号のデータ領域nに適用されることができる。
また、プリセット属性情報は、プリセット情報が変動であるかまたは固定であるかを示すことができる。プリセット属性情報が0であって、プリセット情報が構成情報領域に含まれる場合、プリセット情報は固定(static)であるとすることができる。このとき、プリセット情報は、全てのデータ領域に固定的に同一に適用される。
一方、プリセット属性情報が1であって、プリセット情報がデータ領域に含まれる場合、プリセット情報は変動(dynamic)であるとすることができる。このとき、プリセット情報は該当のデータ領域にのみ適用されて対応するデータ領域のダウンミックス信号をレンダリングするから、データ領域別に変動的に適用される。この場合、プリセット情報は、変動(dynamic)である場合は、データ領域の拡張領域(extension region)に存在することが好ましく、固定(static)である場合は、構成情報領域の拡張領域に存在することが好ましい。
したがって、本発明の一実施例によるオーディオ信号の処理方法は、プリセット属性情報に基づいて、音源の特性に応じてデータ領域別に適切なプリセット情報を用いたり、同一のプリセット情報を全体データ領域に用いたりして、ダウンミックス信号をレンダリングすることができる。
図2は、本発明の一実施例による外部プリセット情報を適用してダウンミックス信号に含まれたオブジェクトを調節する概念図である。
本発明のオーディオ信号は、エンコーダでダウンミックス信号(a downmix signal)及びオブジェクト情報(object information)にエンコーディングされ、これらは、図1A及び図1Bを参照して説明した通り、一つのビットストリームまたは別個のビットストリームの形態でデコーダに転送される。この時、転送されたビットストリームのオブジェクト情報は、プリセット属性情報、プリセット情報に加えて、ダウンミックス信号に含まれたオブジェクトの個数を示すオブジェクト個数情報(object numner information)を含むことができる。
一方、ダウンミックス信号をレンダリングするためにエンコーダから転送されるオブジェクト情報に含まれたプリセット情報の他に、外部プリセット情報(external preset information)が外部から外部ビットストリームの形態でデコーダに入力される(エンコーダから入力されるものではない。)。オブジェクトを調節するためにあらかじめ設定された情報の集合であって、エンコーダではなく外部から入力されたプリセット情報を、本明細書では外部プリセット情報(external preset information)と称する。外部ビットストリームに含まれた外部プリセット情報は、オブジェクトのゲイン及び/またはパニングを調節する外部プリセットレンダリングパラメータ及び外部プリセットレンダリングパラメータの属性を示す外部プリセットメタデータを含むことができる。また、外部ビットストリームは、この外部プリセット情報の他に、外部プリセット情報が適用されるダウンミックス信号に含まれるオブジェクトの個数を示す適用オブジェクト個数情報(applied object number information)及び外部プリセット情報が用いられるか否かを示す外部メタデータ情報をさらに含むことができる。
オブジェクト個数情報及び適用オブジェクト個数情報を用いて、外部プリセット情報またはプリセット情報を用いるか否かを決定することができ、これについては図4を参照して詳細に後述する。外部プリセット情報を用いると決定される場合、外部プリセット情報はダウンミックス信号の全てのデータ領域に固定的に同一に適用されてオブジェクトを調節することができる。
図3は、本発明の実施例によるダウンミックス信号に含まれたオブジェクトに適用される外部プリセット情報の概念図である。
外部プリセット情報は、オーディオ信号の特性または聴取環境に応じてユーザーが選択できる様々なモードを示すことができ、一つ以上を含むことができる。また、外部プリセット情報は、オブジェクトを調節するために適用される外部プリセットレンダリングパラメータ及びこの外部プリセットレンダリングパラメータの属性などを表現するためのメタデータである外部プリセットメタデータを含む。外部プリセットメタデータは、テキストの形態で表示することができ、外部プリセットレンダリングパラメータの属性(例えば、コンサートホールモード、カラオケモード、ニュースモード等)を示す他、外部プリセット情報の属性を示すこともできる。
また、外部プリセットメタデータは、外部プリセットレンダリングパラメータの作成者、作成日、外部プリセットレンダリングパラメータが適用されるオブジェクトの名称などを含む外部プリセットレンダリングパラメータを表現するための関連情報とプリセット情報のファイル形態を示すファイル拡張子情報などを含むことができる。一方、外部プリセットレンダリングパラメータは実質的にオブジェクトに適用されるデータで、外部プリセットメタデータと相互対応し、様々な形態、例えばマトリクス形態で表現されることができる。
図3を参照すると、外部プリセット情報1は、音楽信号をコンサートホールで聞くような音場感を提供するコンサートホールモード(concert hall mode)とすることができ、外部プリセット情報2は、オーディオ信号においてボーカル(vocal)オブジェクトのレベルを減少させたカラオケモード(karaoke mode)とすることができ、外部プリセット情報nは、音声オブジェクトのレベルを増加させたニュースモード(news mode)とすることができる。また、外部プリセット情報は、外部プリセットメタデータ及び外部プリセットレンダリングパラメータを含む。万一、ユーザーから外部プリセット情報2が選択された場合、外部プリセットメタデータ2であるカラオケモードがディスプレイ部に表示され、該外部プリセットメタデータ2に関連する外部プリセットレンダリングパラメータ2がオブジェクトに適用されてレベルを調節することができる。
この場合、外部プリセットレンダリングパラメータは、モノ外部プリセットレンダリングパラメータ(mono external preset rendering parameter)、ステレオ外部プリセットレンダリングパラメータ(stereo external preset rendering parameter)及びマルチチャンネル外部プリセットレンダリングパラメータ(multi−channel external preset rendering parameter)を含むことができる。この外部プリセットレンダリングパラメータは、オブジェクトの最終出力チャンネル(または、オブジェクトを含むダウンミックス信号の最終出力チャンネル)によって決定される。モノ外部プリセットレンダリングパラメータは、オブジェクトの出力チャンネルがモノである場合に適用される外部プリセットレンダリングパラメータであり、ステレオ外部プリセットレンダリングパラメータは、オブジェクトの出力チャンネルがステレオである場合に、マルチチャンネル外部プリセットレンダリングパラメータは、オブジェクトの出力チャンネルがマルチチャンネルである場合に適用される外部プリセットレンダリングパラメータである。オブジェクトの出力チャンネルが構成情報によって決定されると、これに基づいて外部プリセットレンダリングパラメータのタイプが決定され、該外部プリセットレンダリングパラメータを全てのデータ領域に適用して、ダウンミックス信号に含まれたオブジェクトを調節するようになる。
図4は、本発明の実施例によるオーディオ信号の処理装置400を示す図である。
図4を参照すると、オーディオ信号の処理装置400は、ダウンミキシング部410、プリセット情報生成部420、外部プリセット情報受信部430、外部プリセット情報適用判断部440、固定プリセット情報受信部450、変動プリセット情報受信部460及びレンダリング部470を含むことができる。
ダウンミキシング部410は、入力される少なくとも一つのオブジェクト(object 1,2,3,…,n)をダウンミキシングすることによってダウンミックス信号(a downmix signal)を生成する。ここで、オブジェクトは、音源(source)を指すもので、例えば、ボーカル(vocal)、ギター(guitar)、ピアノ(piano)などを含むことができる。ダウンミックス信号は、入力される信号に比べて少ない数のチャンネルを有し、当該オブジェクトを全て含むことができる。
プリセット情報生成部420は、オーディオ信号に含まれたオブジェクトをレンダリング時に調節するためのプリセット情報を生成し、プリセットレンダリングパラメータ、プリセット情報及び該プリセット情報の属性を示すプリセット属性情報を生成することができる。プリセット情報生成部420は、プリセット属性決定部、プリセットレンダリングパラメータ生成部及びプリセットメタデータ生成部を含むことができ、これは、図13を参照して後述する。
外部プリセット情報受信部430は、本発明の一実施例によるオーディオ信号の処理装置400の外部から入力された外部プリセット情報を受信する。外部プリセット情報は、複数個の外部プリセットレンダリングパラメータ及びこれに対応する複数個の外部プリセットメタデータを含み、外部プリセットレンダリングパラメータが適用されるオブジェクトの個数を示す適用オブジェクト個数情報を含むことができる。本発明の一実施例による外部プリセット情報のビットストリーム構造は、図9を参照して後述する。
外部プリセット情報適用判断部440は、プリセット情報生成部420から入力されたプリセット情報及び外部プリセット情報受信部430から入力された外部プリセット情報を受信してそれを適用するか否かを判断する。まず、外部プリセット情報受信部430に含まれた適用オブジェクト個数情報受信部431から、外部プリセット情報が適用されるオブジェクトの個数を示す適用オブジェクト個数情報(applied object number information)を受信する。この適用オブジェクト個数情報をプリセット情報に含まれたオブジェクト個数情報と比較し、両者が同一であると、外部プリセット情報を優先的に用いるものと判断することができる。
万一、適用オブジェクト個数情報がオブジェクト個数情報と異なると、プリセット情報生成部420から入力されたプリセット情報の属性を示すプリセット属性情報を抽出して、該プリセット情報がビットストリームの構成情報領域に含まれるかまたはデータ領域に含まれるか判断する。好ましくは、プリセット属性情報は、プリセット情報がビットストリームの構成情報領域の拡張領域またはデータ領域の拡張領域に含まれたか判断する(図示せず)。この場合、プリセット情報がビットストリームの構成情報領域に含まれていると判断すると、固定プリセット情報受信部450が活性化され、プリセット情報がビットストリームのデータ領域に含まれていると判断すると、変動プリセット情報受信部460が活性化される。
プリセット属性情報によって、固定プリセット情報受信部450が活性化される場合(表1のpreset_attribute_information=0の場合)、活性化された固定プリセット情報受信部450にプリセット情報が入力されて動作する。固定プリセット情報受信部450は、全てのデータ領域に対応するプリセットメタデータを受信する固定プリセットメタデータ受信部、及びプリセット情報を受信する固定プリセット情報受信部を含むことができ、これについての詳細は、図13を参照して後述する。
変動プリセット情報受信部460は、プリセット属性情報が、プリセット情報がデータ領域に含まれている旨を示す場合(表1のpreset_attribute_flag=1の場合)に動作する。変動プリセット情報受信部460は、該当のデータ領域に対応するプリセットメタデータを受信する変動プリセットメタデータ受信部、及びデータ領域別プリセット情報を受信する変動プリセット情報受信部を含むことができる。変動プリセットメタデータ受信部は、選択されたプリセットメタデータを受信して出力し、変動プリセット情報受信部はプリセット情報を受信する。これについての詳細は、図11を参照して後述する。
レンダリング部470は、複数個のオブジェクトを含むオーディオ信号をダウンミキシングして生成されたダウンミックス信号と、固定プリセット情報受信部450または変動プリセット情報受信部460から出力されたプリセットレンダリングパラメータとを受信する。一方、外部プリセット情報適用判断部440で外部プリセット情報が適用されると決定された場合、レンダリング部470は、外部プリセットレンダリングパラメータ受信部432から外部プリセットレンダリングパラメータを受信する。プリセット情報または外部プリセットレンダリングパラメータは、ダウンミックス信号に含まれたオブジェクトに適用されて、該オブジェクトのレベルを調節したりオブジェクトの位置を調節したりできる。
また、オーディオ信号の処理装置400がディスプレイ部(図示せず)を含む場合、変動プリセットメタデータ受信部から出力される選択されたプリセットメタデータ、固定プリセットメタデータ受信部で出力される選択されたプリセットメタデータ、または外部プリセットメタデータ受信部433から出力される選択された外部プリセットメタデータを、画面に表示することができる。
図5A及び図5Bは、本発明の実施例によるプリセット情報がレンダリング部に適用される方法を示すブロック図である。まず、図5Aは、固定プリセット情報受信部450から出力されたプリセット情報がレンダリング部570で適用される方法を示す図である。固定プリセット情報受信部450は、図4の固定プリセット情報受信部450と同一のもので、固定プリセットメタデータ受信部451及び固定プリセットレンダリングパラメータ受信部452を含む。
固定プリセットレンダリングパラメータ受信部452は、ダウンミックス信号の全てのデータ領域に適用されてオブジェクトを調節するためのプリセットレンダリングパラメータを受信する。プリセットレンダリングパラメータは、複数個のプリセット情報から選択された一つのプリセット情報に含まれたレンダリングパラメータとすることができる。一方、固定プリセットメタデータ受信部451は、一つのプリセットレンダリングパラメータに対応し、プリセットレンダリングパラメータの属性を示すプリセットメタデータを受信する。
固定プリセット情報受信部450は、全てのデータ領域に対応するプリセットメタデータ及びプリセットレンダリングパラメータを受信して出力し、レンダリング部570は、プリセットレンダリングパラメータを受信する。
レンダリング部570は、プリセットレンダリングパラメータの他に、ダウンミックス信号も受信し、データ領域別にレンダリングを行い、データ領域1レンダリング部571、データ領域2レンダリング部572、…、データ領域nレンダリング部57nを含む。この場合、レンダリング部570の全てのデータ領域レンダリング部57Xで受信したプリセットレンダリングパラメータをダウンミックス信号に同一に適用することによってレンダリングする。例えば、固定プリセットレンダリングパラメータ受信部452から出力されたプリセットレンダリングパラメータが、カラオケモードを示す外部リセットレンダリングパラメータ2の場合、1番目のデータ領域からn番目のデータ領域までの全データ領域にカラオケモードを適用することができる。
図5Bは、変動プリセット情報受信部460から出力されたプリセット情報がレンダリング部570で適用される方法を示す図である。変動プリセット情報受信部460は、図4の変動プリセット情報受信部460と同一のもので、変動プリセットメタデータ受信部461及び変動プリセットレンダリングパラメータ受信部462を含む。
変動プリセット情報受信部460は、データ領域ごとに変動プリセットレンダリングパラメータ受信部462でプリセットレンダリングパラメータを受信し、変動プリセットメタデータ受信部461でプリセットメタデータを受信して出力し、プリセットレンダリングパラメータはレンダリング部570に入力される。
レンダリング部570は、プリセットレンダリングパラメータの他に、ダウンミックス信号も受信して、データ領域別にレンダリングを行い、データ領域1レンダリング部571、データ領域2レンダリング部572、…、データ領域nレンダリング部57nを含む。この場合、レンダリング部570のそれぞれのデータ領域レンダリング部57Xはそれぞれデータ領域に対応するプリセットレンダリングパラメータを受信してダウンミックス信号に適用することによってレンダリングを行う。
例えば、1番目のデータ領域は、コンサートホールモードであるプリセット情報_1が適用され、2番目のデータ領域は、クラシックモードであるプリセット情報_3が適用され、6番目のデータ領域は、カラオケモードであるプリセット情報_2(ここで、プリセット情報_nのnは、外部プリセットモードのインデックスを表す。)が適用されることができる。この時、それぞれのプリセットレンダリングパラメータに対応するプリセットメタデータもデータ領域ごとに出力されることは勿論である。
図6は、本発明の実施例による外部プリセット情報がレンダリング部で適用される方法を示すブロック図である。外部プリセット情報受信部430は、図4の外部プリセット情報受信部430と同一のもので、外部プリセットメタデータ受信部433及び外部プリセットレンダリングパラメータ受信部432を含む。
外部プリセットレンダリングパラメータ受信部432は、ダウンミックス信号の全てのデータ領域に適用されてオブジェクトを調節するための外部プリセットレンダリングパラメータを受信する。この外部プリセットレンダリングパラメータは、複数個のプリセット情報から選択された一つの外部プリセット情報に含まれたレンダリングパラメータとすることができる。一方、外部プリセットメタデータ受信部433は、一つの外部プリセットレンダリングパラメータに対応し、該外部プリセットレンダリングパラメータの属性を示す外部プリセットメタデータを受信する。
外部プリセット情報受信部430は、全てのデータ領域に対応する外部プリセットメタデータ及び外部プリセットレンダリングパラメータを受信して出力し、該外部プリセットレンダリングパラメータはレンダリング部670に入力される。
レンダリング部670は、外部プリセットレンダリングパラメータの他に、ダウンミックス信号も受信し、データ領域別にレンダリングを行い、データ領域1レンダリング部671、データ領域2レンダリング部672、…、データ領域nレンダリング部67nを含む。この場合、レンダリング部670の全てのデータ領域レンダリング部67Xで受信した外部プリセットレンダリングパラメータをダウンミックス信号に同一に適用することによってレンダリングを行う。例えば、外部プリセットレンダリングパラメータ受信部432から出力された外部プリセットレンダリングパラメータが、クラシックモードを示す外部プリセットレンダリングパラメータ3の場合、1番目のデータ領域からn番目のデータ領域までの全データ領域にクラシックモードを適用することができる。
図7は、本発明のオーディオ信号の処理装置400の固定プリセット情報受信部450に含まれる固定プリセットレンダリングパラメータ受信部452、変動プリセット情報受信部460に含まれる変動プリセット情報受信部462、及び外部プリセット情報受信部430に含まれる外部プリセットレンダリングパラメータ受信部432の概略的な構成を示す図である。
変動、固定または外部プリセットレンダリングパラメータ受信部452,462,432は、出力チャンネル情報受信部452a,462a,432a及びプリセットレンダリングパラメータ決定部452b,462b,432bを含む。出力チャンネル情報受信部452a,462a,432aは、ダウンミックス信号に含まれたオブジェクトが再生される出力チャンネルの個数を示す出力チャンネル情報(output channel number information)を受信して出力する。出力チャンネル情報は、モノチャンネル、ステレオチャンネルまたはマルチチャンネル(5.1チャンネル)とすることができるが、これに限定されることはない。
プリセットレンダリングパラメータ決定部452b,462b,432bは、出力チャンネル情報受信部452a,462b,432bから入力された出力チャンネル情報に基づいて該当するプリセットレンダリングパラメータまたは外部プリセットレンダリングパラメータを受信して出力する。外部プリセットレンダリングパラメータは、モノ外部プリセットレンダリングパラメータ、ステレオ外部プリセットレンダリングパラメータまたはマルチチャンネル外部プリセットレンダリングパラメータのいずれかであり、プリセットレンダリングパラメータは、モノプリセットレンダリングパラメータ、ステレオプリセットレンダリングパラメータまたはマルチチャンネルプリセットレンダリングパラメータでありうる。プリセットレンダリングパラメータまたは外部プリセットレンダリングパラメータがマトリクスタイプの場合、それらの次元はオブジェクトの数及び出力チャンネルの数に基づいて決定することができ、プリセットマトリクスまたは外部プリセットマトリクスは、(オブジェクトの数)*(出力チャンネルの数)の形態を有することができる。例えば、ダウンミックス信号に含まれたオブジェクトがn個であり、出力チャンネル情報受信部452a,462a,432aから5.1チャンネル、すなわち、6個のチャンネルを示す出力チャンネル情報が出力される場合、プリセットレンダリングパラメータ決定部452b,462b,432bは、n*6の形態に具現されたマルチチャンネルプリセットレンダリングパラメータまたはマルチチャンネル外部プリセットレンダリングパラメータを出力することができる。ここで、マトリクスの成分(element)は、a番目のオブジェクトがi番目のチャンネルに含まれる度合を示すゲイン値である。
図8は、本発明の他の実施例によるオーディオ信号の処理装置800を示す図である。オーディオ信号の処理装置800は、主として、ダウンミキシング部810、オブジェクト情報生成部820、プリセット情報生成部830、ダウンミックス信号処理部840、情報処理部850及びマルチチャンネルデコーディング部860を含む。
複数個のオブジェクト(オブジェクト1、オブジェクト2、…オブジェクトn)は、ダウンミキシング部810に入力されてモノまたはステレオダウンミックス信号を生成する。また、これらのオブジェクトはオブジェクト情報生成部820に入力されて、オブジェクトのレベルを示すオブジェクトレベル情報(object level information)、ダウンミックス信号に含まれるオブジェクトのゲイン値及び/またはステレオダウンミックス信号の場合、ダウンミックスチャンネルに含まれるオブジェクトの度合を示すオブジェクトゲイン情報(object gain information)、オブジェクト間の相関有無を示すオブジェクト相関情報(object correlation information)を含むオブジェクト情報(object information)などを生成する。次に、ダウンミックス信号及びオブジェクト情報は、プリセット情報生成部830に入力されて、プリセット情報がビットストリームにおいてデータ領域に含まれるか、または、ビットストリームにおいて構成情報領域に含まれるかを示すプリセット属性情報、オブジェクトのレベルまたは位置を調節してレンダリングするためにあらかじめ設定されたプリセットレンダリングパラメータ、及びプリセットレンダリングパラメータを表現するためのプリセットメタデータを含むプリセット情報を生成する。このプリセット属性情報、プリセットレンダリングパラメータ及びプリセットメタデータが生成される過程は、図1乃至図4のオーディオ信号の処理装置及び方法において説明した通りであり、その詳細な説明は省略する。
また、プリセット情報生成部830は、プリセット情報がビットストリームに存在するか否かを示すプリセット存在情報(preset presence information)、プリセット情報の個数を示すプリセット個数情報(preset number information)及びプリセットメタデータの長さを示すプリセットメタデータ長さ情報(preset metadata length information)をさらに生成することができる。オブジェクト情報生成部820で生成されたオブジェクト情報とプリセット情報生成部830で生成されたプリセット属性情報、プリセット情報、プリセットメタデータ、プリセット存在情報、プリセット個数情報及びプリセットメタデータ長さ情報は、SAOCビットストリームに含まれて転送されることもでき、ダウンミックス信号も含まれた一つのビットストリームの形態として転送されることもできる。この場合、ダウンミックス信号及びプリセット関連情報を含むビットストリームは、デコーディング装置の信号受信部(図示せず)に入力されることができる。
情報処理部850は、オブジェクト情報処理部851、外部プリセット情報受信部852、外部プリセット情報適用判断部853、固定プリセット情報受信部854及び変動プリセット情報受信部855を含み、SAOCビットストリームを受信する。固定プリセット情報受信部854が活性化されるか、または、変動プリセット情報受信部855が活性化されるかは、図1乃至図7を参照して上述した通り、SAOCビットストリームに含まれたプリセット属性情報に基づいて決定される。
外部プリセット情報受信部852は、本発明の一実施例によるオーディオ信号の処理装置800の外部から入力される外部プリセット情報を受信し、外部プリセット情報適用判断部853でオブジェクトを調節するために外部プリセット情報を用いるか否かを決定する。
外部プリセット情報を用いる場合、外部プリセット情報受信部852から受信した外部プリセット情報がオブジェクト情報処理部851に直接入力される。一方、SAOCビットストリームに含まれたプリセット情報を用いる場合には、SAOCビットストリームに含まれたプリセット属性情報に基づいてプリセット情報が固定プリセット情報受信部854または変動プリセット情報受信部855に入力される。
固定プリセット情報受信部854及び変動プリセット情報受信部855は、SAOCビットストリームから上述のプリセット属性情報を受信し、外部プリセット情報受信部852は外部プリセット存在情報、外部プリセット個数情報、外部プリセットメタデータ、出力チャンネル情報及び外部プリセットレンダリングパラメータ(例えば、外部プリセットマトリクス)を受信し、その他図1乃至図7のオーディオ信号の処理方法及び装置で説明された様々な実施例による方法を用いる。
固定プリセット情報受信部854、変動プリセット情報受信部855または外部プリセット情報受信部852は、SAOCビットストリームから受信したプリセットメタデータとプリセットレンダリングデータまたは外部ビットストリームから受信した外部プリセットメタデータと外部プリセット情報を出力し、オブジェクト情報処理部851は、これらを受信して、SAOCビットストリームに含まれたオブジェクト情報と共に用いてダウンミックス信号を前処理(pre−processing)するためのダウンミックス処理情報(downmix processing information)とダウンミックス処理情報を用いて前処理されたダウンミックス信号をアップミキシングするためのマルチチャンネル情報(multi−channel information)を生成する。
この時、固定プリセット情報受信部854から出力されるプリセットレンダリングパラメータ及びプリセットメタデータと外部プリセット情報受信部852から出力される外部プリセットレンダリングパラメータ及び外部プリセットメタデータは、全体データ領域に対応するものであり、変動プリセット情報受信部855から出力されるプリセット情報及びプリセットメタデータは一つのデータ領域に対応するものである。
以降、ダウンミックス処理情報はダウンミックス信号処理部840に入力されて、ダウンミックス信号に含まれたオブジェクトが含まれるチャンネルを変動させることによってパニングを行うことができる。このように前処理されたダウンミックス信号は、情報処理部850から出力されたマルチチャンネル情報と共にマルチチャンネルデコーディング部860に入力されてアップミキシングされることで、マルチチャンネルオーディオ信号を生成することができる。
このように、本発明の他の実施例によるオーディオ信号の処理装置は、複数個のオブジェクトを含むダウンミックス信号を、マルチチャンネル情報を用いてマルチチャンネル信号にデコーディングする際に、外部から別のビットストリームとして入力された外部プリセットレンダリングパラメータ及び外部プリセットメタデータをさらに用いることによって容易にオブジェクトのレベルを調節することができる。
図9は、本発明の一実施例による外部プリセット情報のビットストリーム構造を示す図である。
図9を参照すると、SAOCビットストリームとの互換性のために、外部プリセット情報は、ファイルID 910、外部プリセットレンダリングパラメータ920及び外部プリセットメタデータ930を含む領域で構成される。
ファイルID 910は、外部プリセット情報がダウンミックス信号へと適用可能か否かを判断するための、すなわち、SAOCビットストリームとの同期化が可能か否かを判断するための外部プリセット情報が適用されるオブジェクトの個数を示すオブジェクト個数情報を含むことができる。また、別に定義された同期化のためのシンクワード(sync word)を含むことができ、外部プリセット情報の個数を示す外部プリセット個数情報をさらに含むことができ、適用オブジェクト個数にかかわらずに優先して外部プリセット情報を用いるように設定された識別子(identifier)を含むこともできる。
外部プリセットレンダリングパラメータ920は、SAOCビットストリームに含まれたプリセットレンダリングパラメータのような内容を含めることもでき、図3を参照して上述した様々な外部プリセットレンダリングパラメータを含むこともできる。また、マトリクス形態のレンダリングパラメータの他にも、ユーザー設定形態のレンダリングデータを含むこともでき、外部プリセット情報の個数及び出力チャンネルの個数を示す出力チャンネル情報をさらに含むことができる。
一方、外部プリセットメタデータ930は、外部プリセットレンダリングパラメータ920に対応するメタデータを含む。
図10乃至図12は、本発明の他の実施例によるプリセット情報と関連したシンタックス(syntax)を様々な方法で表現したものである。
図10を参照すると、プリセット情報は、構成情報の拡張領域に含まれるように構成されることができる。
ビットストリームの構成情報領域(SAOCSpecificConfig())は、拡張領域(SAOCExtensionConfig())を有し、プリセット情報が受信される場合は、SAOCExtensionConfig(9)形態のコンテナタイプで示すことができ、その意味は、下記の表2の通りである。図10を参照すると、SAOCExtensionConfig(9)の拡張領域は、プリセット情報(PresetConfig())を含む。
Figure 2011528446
このプリセット情報(PresetConfig())は、図10に示すように、プリセット情報の個数を示すプリセット個数情報(bsNumPresets)、プリセット情報の属性を示すメタデータであるプリセットメタデータを表現するバイトの個数を示すプリセットメタデータ長さ情報(bsNumCharPresetLabel[i])、プリセットメタデータ(bsPresetLabel[i][j])及びレンダリングデータを示すマトリクスタイプのプリセットレンダリングパラメータ(bsPresetMatrix)を含むことができる。
このようにビットストリームの構成情報領域に含まれたプリセット情報を用いてより便利にオーディオ信号をレンダリングして再生することができる。
一方、図11を参照すると、プリセット情報は、構成情報領域ではなくデータ領域の拡張領域に含まれることができる。データ領域(SAOCFrame())は拡張領域(SAOCExtensionFrame())を有し、このうち、プリセット情報のための拡張領域(SAOCExtensionFrame(9))は、図8のプリセット情報(PresetConfig())のようなプリセット情報を含むことができ、データ領域の拡張領域の意味は、下記表3の通りである。
万一、図1乃至図9を参照して上述した外部プリセット情報が用いられる場合、図10及び図11のプリセット情報(PresetConfig())の代わりに、外部プリセット情報に含まれた対応する情報を抽出して、ダウンミックス信号に含まれたオブジェクトを調節するために用いることができる。
Figure 2011528446
一方、図11のデータ領域の拡張領域は、SAOCExtensionFrame()シンタックスに表すようなプリセットレンダリングパラメータなど、データ領域ごとに更新(update)が必要な情報のみを含むことができる。この場合、実質的なレンダリングデータであるプリセットレンダリングパラメータ(PresetMatrixDate())は、プリセットレンダリングパラメータのタイプを示すレンダリングパラメータタイプ(bsPresetMatrixType)のような更新されない値を含む。
なお、図12では本発明のさらに他の実施例によるシンタックスを提案する。図12を参照すると、データ領域の拡張領域(SAOCExtensionFrame(9))は、プリセットレンダリングパラメータ(bsPresetMatrixElements[i][j])のみを含む。
このように、本発明の一実施例によるオーディオ信号の処理方法は、更新されない情報を構成情報領域に含めることによって、プリセット情報のために転送されるビットの数を減少させることができる。
図13は、本発明のさらに他の実施例によるオーディオ信号の処理装置を示すブロック図である。オーディオ信号の処理装置1300は、主に、プリセット情報生成部1310、プリセット属性受信部1315、外部プリセット情報受信部1320、外部プリセット適用可能判断部1325、適用プリセット入力部1330、適用プリセット選択部1335、プリセット情報入力部1340、プリセット情報選択部1345、固定プリセット情報受信部1350、変動プリセット情報受信部1355、レンダリング部1360及びディスプレイ部1365を含むことができる。
図13のプリセット属性受信部1315、外部プリセット情報受信部1320、固定プリセット情報受信部1350、変動プリセット情報受信部1355及びレンダリング部1360は、図4の外部プリセット情報受信部430、外部プリセット情報適用判断部440、固定プリセット情報受信部450、変動プリセット情報受信部460及びレンダリング部470と構成及び機能が同一なので、その詳細な説明は省略する。
図13を参照すると、プリセット情報生成部1310は、プリセット属性決定部1311、プリセットメタデータ生成部1312及びプリセットレンダリングパラメータ生成部1313を含む。
プリセット属性決定部1311は、上述した通り、プリセット情報を構成情報領域に含めて全てのデータ領域に適用するか、または、データ領域に含めてデータ領域別に適用するかを示すプリセット属性情報を決定する。以降、プリセット属性情報に基づいて、プリセットメタデータ生成部1312及びプリセットレンダリングパラメータ生成部1313は、一つのプリセットメタデータ及びプリセットレンダリングパラメータまたはデータ領域数だけのプリセットメタデータ及びプリセットレンダリングパラメータを生成することができる。
プリセットメタデータ生成部1312は、プリセットレンダリングパラメータを表現するテキスト情報を受信してプリセットメタデータを生成できる。一方、オブジェクトのレベルを調節するためのゲイン及び/またはオブジェクトの位置がプリセットレンダリングパラメータ生成部1313に入力される場合、該オブジェクトに適用されるプリセットレンダリングパラメータを生成することができる。このプリセットレンダリングパラメータは、オブジェクトごとに適用されるように生成されることができ、様々なタイプ、例えば、チャンネルレベル差(CLD:Channel Level Difference)パラメータ、マトリクス(matrix)などの形態に具現することができる。
また、プリセットレンダリングパラメータ生成部1313は、オブジェクトの出力チャンネルの個数を示す出力チャンネル情報をさらに生成することができる。プリセットメタデータ生成部1312で生成されたプリセットメタデータ及びプリセットレンダリングパラメータ生成部1313で生成されたプリセットレンダリングパラメータ、出力チャンネル情報などは、一つのビットストリームに含まれて転送されることができ、特に、ダウンミックス信号を含むビットストリームの補助領域(ancillary region)に含まれて転送されることもでき、ダウンミックス信号と別のビットストリームとして転送することもできる。
一方、プリセット情報生成部1310は、プリセットメタデータ、プリセットレンダリングパラメータ及び出力チャンネル情報がビットストリームに含まれたことを示すプリセット存在情報(preset presence information)をさらに生成することができる。このプリセット存在情報は、プリセット情報などがビットストリームのどの領域に含まれているかを示すコンテナタイプ(container type)にすることもでき、どの領域に含まれるかは示さず、単にビットストリームに含まれたか否かを示すフラグタイプ(flag type)にすることもできるが、これに限定されることはない。
プリセット情報生成部1310は、複数個のプリセット情報を生成することができ、それぞれのプリセット情報は、プリセットレンダリングパラメータ、プリセットメタデータ及び出力チャンネル情報を含む。このとき、プリセット情報生成部1310は、プリセット情報の個数を示すプリセット個数情報(preset number information)をさらに生成することができる。
このように、プリセット情報生成部1310は、プリセット属性情報、プリセットメタデータ及びプリセットレンダリングパラメータをビットストリームの形態で生成して出力することができる。
プリセット属性受信部1315は、プリセット情報生成部1310からプリセット属性情報を受信して出力する。このプリセット属性情報の意味は、上記の表1の通りである。
外部プリセット適用可能判断部1325は、外部プリセット情報受信部1320から外部プリセット情報を受信し、該外部プリセット情報に含まれたオブジェクト個数情報に基づいて外部プリセット情報がダウンミックス信号に適用されうるか否かを判断することができる。この外部プリセット情報は、図9のビットストリーム構造を有することができる。また、エンコーダから入力されたプリセット情報に含まれるプリセットレンダリングパラメータ、プリセットメタデータ、プリセット存在情報、プリセット個数情報、オブジェクト個数情報及び出力チャンネル情報と同じ構成及び機能を有し、エンコーダではなく外部から入力されるビットストリームに含まれた外部プリセットレンダリングパラメータ、外部プリセットメタデータ、外部プリセット存在情報、外部プリセット個数情報、オブジェクト個数情報及び出力チャンネル情報を含むことができる。
オブジェクト個数情報がダウンミックス信号に含まれたオブジェクトの個数と同一の場合に、外部プリセット情報をダウンミックス信号に適用することができる。万一、オブジェクト個数情報がダウンミックス信号に含まれたオブジェクトの個数と異なる場合には、外部プリセット情報は適用しない。
適用プリセット入力部1330は、外部プリセット適用可能判断部1325で外部プリセット情報が適用されると判断した場合、オブジェクトを調節するために外部プリセット情報を用いるかまたはプリセット情報を用いるかを決定するメタデータを表示し、適用される情報を選択する選択信号を受信することができる。本発明の他の実施例では、外部プリセット適用可能判断部1325で外部プリセット情報が利用可能なものと判断された場合、この段階を省いて、優先的に外部プリセット情報を用いることもできる。
適用プリセット選択部1335は、外部プリセット適用可能判断部1325で外部プリセット情報が利用可能なものと判断される場合、プリセット情報受信部1310からプリセット情報を、外部プリセット適用可能判断部1325から外部プリセット情報を受信する。また、適用プリセット入力部1330から入力された選択信号が示すプリセット情報または外部プリセット情報を選択して出力することができる。
適用プリセット選択部1335でプリセット情報が選択されると、プリセット属性受信部1315から出力されたプリセット属性情報に基づいて、プリセット情報が含まれている拡張領域と対応するダウンミックス信号のデータ領域または全体データ領域にプリセット情報が適用されてオブジェクトを調節することができる。一方、適用プリセット選択部1335で外部プリセット情報が選択される場合には、プリセット属性受信部1315から出力されたプリセット属性情報によらずに外部プリセット情報はダウンミックス信号の全てのデータ領域に同一に適用される。
適用プリセット選択部1335で適用プリセット入力部1330から入力された選択信号に基づいて外部プリセット情報が選択される場合、プリセット情報入力部1340は、外部プリセットメタデータ受信部1322から受信した複数個の外部プリセットメタデータをまずディスプレイ部1365の画面に表示し、これらのうち一つの外部プリセットメタデータを選択する選択信号を受信する。プリセット情報選択部1345は、当該選択信号によって選択された一つの外部プリセットメタデータと該外部プリセットメタデータに対応する外部プリセットレンダリングパラメータを選択する。
外部プリセット情報が用いられる場合、固定プリセット情報受信部1350のみが活性化される。プリセット情報選択部1345で選択された外部プリセットメタデータと該外部プリセットメタデータと対応する外部プリセットレンダリングパラメータを、固定プリセット情報受信部1350の固定プリセットメタデータ受信部1351及び固定プリセットレンダリングパラメータ受信部1352にそれぞれ入力する。この場合、ディスプレイ部1365、プリセット情報入力部1340及びプリセット情報選択部1345は1回のみ上記動作を行うことができる。
一方、適用プリセット選択部1335で、プリセット情報生成部1310から入力されたプリセット情報を用いると決定された場合は、プリセット属性受信部1315から受信したプリセット属性情報によって固定プリセット情報受信部1350または変動プリセット情報受信部1355が活性化される。
この時、プリセット属性決定部1311から受信するプリセット属性情報が、プリセット情報が構成情報領域の拡張領域に含まれることを示す場合、プリセット情報選択部1345で選択されたプリセットメタデータと該プリセットメタデータに対応するプリセットレンダリングパラメータを、固定プリセット情報受信部1350のプリセットメタデータ受信部1151及びプリセットレンダリングパラメータ受信部1152にそれぞれ入力する。
一方、プリセット属性決定部1311から受信するプリセット属性情報が、プリセット情報がデータ領域の拡張領域に含まれることを示す場合、プリセット情報選択部1345で選択されたプリセットメタデータと該プリセットメタデータに対応するプリセットレンダリングパラメータ情報を、変動プリセット情報受信部1355のプリセットメタデータ受信部1356及びプリセットレンダリングパラメータ受信部1357にそれぞれ入力する。この場合、ディスプレイ部1365、プリセット情報入力部1340及びプリセット情報選択部1345はデータ領域の数だけ繰り返して上記動作を行うことができる。
また、選択された外部プリセットレンダリングパラメータまたはプリセットレンダリングパラメータはレンダリング部1360に出力され、選択された外部プリセットメタデータまたはプリセットレンダリングパラメータはディスプレイ部1365に出力されて画面に表示される。ディスプレイ部1365は、プリセット情報入力部1340が選択信号を受信できるように複数個のプリセットメタデータまたは外部プリセットメタデータを表示するユニットと同一のユニットにしても良く、それぞれ異なるユニットにしても良い。ディスプレイ部1365とプリセット情報入力部1340のためにプリセットメタデータまたは外部プリセットメタデータを表示するディスプレイ部を同一のユニットとする場合、画面に表示される説明(例えば、プリセット情報を選択してください、プリセット情報Nが選択されました等)、視覚的オブジェクト、文字などを別に構成することによって、それぞれの動作を区別することができる。
図14は、オーディオ信号の処理装置1400のディスプレイ部1365の一例を示す図である。ディスプレイ部1365は、選択されたプリセットメタデータまたは外部プリセットメタデータの他に、該プリセットメタデータまたは外部プリセットメタデータに対応するプリセットレンダリングパラメータまたは外部プリセットレンダリングパラメータを用いて調節されたオブジェクトのレベルまたは位置を示す一つ以上の図形オブジェクトを含むことができる。図14を参照すると、まず、図13のディスプレイ部1365に表示された複数個のプリセットメタデータまたは外部プリセットメタデータ(例えば、競技場モード、洞窟モード、ニュースモード、ライブモード等)のうち、プリセット情報選択部1340によってニュースモードが選択された場合、ニュースモードに対応するプリセットレンダリングパラメータまたは外部プリセットレンダリングパラメータが、ダウンミックス信号に含まれた各オブジェクトに適用される。この場合、ボーカルのレベルは増加し、その他のオブジェクト(ギター、バイオリン、ドラム、…チェロ)のレベルは減少する。
ディスプレイ部1365に含まれた図形オブジェクトは、オブジェクトのレベルまたは位置の活性化または変化を示すために変形される。例えば、図14に示すように、ボーカルを示す図形オブジェクトのスイッチは右に移動し、他のオブジェクトを示す図形オブジェクトのスイッチは左に移動することができる。
この図形オブジェクトは、様々な方法でプリセットレンダリングパラメータまたは外部プリセットレンダリングパラメータを用いて調節されたオブジェクトのレベルまたは位置を示すことができる。各オブジェクトを示す図形オブジェクトは一つ以上とすることができ、この場合、第1図形オブジェクトは、プリセットレンダリングパラメータまたは外部プリセットレンダリングパラメータを適用する以前のオブジェクトのレベルまたは位置を示し、第2図形オブジェクトは、プリセットレンダリングパラメータまたは外部プリセットレンダリングパラメータを適用して調節されたオブジェクトのレベルまたは位置を示すことができる。こうすると、プリセットレンダリングパラメータまたは外部プリセットレンダリングパラメータを適用する前・後のオブジェクトのレベルまたは位置を容易に比較することができ、よって、プリセット情報または外部プリセット情報が各オブジェクトをどのように調節するかが容易にわかる。
図15は、プリセット情報または外部プリセット情報が適用されたオブジェクトを示す他の形状の一つ以上の図形オブジェクトを示す図である。図15を参照すると、第1図形オブジェクトは、バー(bar)形態であり、第2図形オブジェクトは、第1図形オブジェクトの内部に延びた線(extensive line)にすることができる。この場合、第1図形オブジェクトは、プリセット情報または外部プリセット情報を適用する前のオブジェクトのレベルまたは位置を示し、第2図形オブジェクトは、プリセット情報または外部プリセット情報を適用して調節されたオブジェクトのレベルまたは位置を示す。
図15に示すように、上端の図形オブジェクトは、プリセット情報または外部プリセット情報が適用される前のオブジェクトのレベルが、適用された後のオブジェクトのレベルと同じ場合を示す。中央の図形オブジェクトは、プリセット情報または外部プリセット情報が適用されて調節されたオブジェクトのレベルが、適用前に比べて大きい場合を示し、下端の図形オブジェクトは、プリセット情報または外部プリセット情報が適用されることによってオブジェクトのレベルが減少した場合を示す。
このように、プリセット情報または外部プリセット情報を適用する前と適用した後のオブジェクトのレベルまたは位置を示す一つ以上の図形オブジェクトを使用することによって、プリセット情報または外部プリセット情報が各オブジェクトをどのように調節するかを容易に確認できるようにする。また、プリセット情報または外部プリセット情報の特徴を容易に把握できるため、ユーザーは必要によって適切なプリセット情報または外部プリセット情報をより容易に選択することができる。
図16は、本発明の一実施例による外部プリセット情報受信部、外部プリセット情報適用判断部、固定プリセット情報受信部、変動プリセット情報受信部及びレンダリング部が具現された製品の概略的な構成を示す図であり、図17A及び図17Bは、本発明の実施例による外部プリセット情報受信部、外部プリセット情報適用判断部、固定プリセット情報受信部、変動プリセット情報受信及びレンダリング部が具現された製品間の関係を示す図である。
図16を参照すると、有無線通信部1610は、有無線通信方式を用いてビットストリームを受信する。具体的に、有無線通信部1610は、有線通信部1611、赤外線通信部1612、ブルートゥース部1613、無線LAN通信部1614のうち一つ以上を含むことができる。
ユーザー認証部1620は、ユーザー情報を受信してユーザー認証を行うもので、指紋認識部1621、虹彩認識部1622、顔認識部1623、及び音声認識部1624のうち一つ以上を含むことができ、それぞれ指紋、虹彩情報、顔の輪郭情報、音声情報を受信してユーザー情報に変換し、ユーザー情報及び既存に登録されているユーザーデータとが一致するか否かを判断することでユーザー認証を行うことができる。
入力部1630は、ユーザーが種々の命令を入力するための入力装置で、キーパッド部1631、タッチパッド部1632、リモコン部1633のうち一つ以上を含むことができるが、本発明はこれに限定されない。
一方、後述する外部プリセット情報受信部1641から入力された外部プリセット情報と有無線通信部1610から入力されたプリセット情報のうち、用いられる情報を選択するための情報がディスプレイ部1662で画面に表示される場合に、入力部1630を介してユーザーが選択信号を入力でき、選択された信号に基づいて選択された外部プリセット情報(または、プリセット情報)が制御部1650に入力される。また、 外部プリセット情報受信部1641から出力される複数個の外部プリセットレンダリングパラメータに対する外部プリセットメタデータがディスプレイ部1662で画面に表示される場合に、入力部1630を介してユーザーが外部プリセットメタデータを選択することができ、選択された外部プリセットメタデータに関する情報が制御部1650に入力される。
信号デコーディング部1640は、外部プリセット情報受信部1641、外部プリセット情報適用判断部1642、固定プリセット情報受信部1643、変動プリセット情報受信部1644及びレンダリング部1645を含み、これは、図4の外部プリセット情報受信部430、外部プリセット情報受信部440、固定プリセット情報受信部450及び変動プリセット情報受信部460と構成及び機能が同一なので、その詳細な説明を省略する。
制御部1650は、入力装置などから入力信号を受信し、信号デコーディング部1640と出力部1660のプロセス全般を制御する。上述した通り、入力部1630から制御部1650に、選択されたプリセットメタデータまたは外部プリセットメタデータに関する情報及び選択されたプリセット情報または外部プリセット情報の種類が選択信号の形態として入力され、有無線通信部1610からプリセット情報がビットストリームのどの領域に含まれるかを示すプリセット属性情報(preset_attribute_information)が入力される場合、固定プリセット情報受信部1643及び変動プリセット情報受信部1644は、プリセット属性情報及び選択信号に基づいて、選択されたプリセットメタデータに対応するプリセットレンダリングパラメータを受信し、これを用いてオーディオ信号をデコーディングする。
一方、外部プリセット情報を用いると決定された場合、プリセット属性情報によらず、選択信号に基づいて、選択された外部プリセットメタデータに対応する外部プリセットレンダリングパラメータを固定プリセット情報受信部1643に入力する。
出力部1660は、信号デコーディング部1640で生成された出力信号などが出力される構成要素として、スピーカー部1661及びディスプレイ部1662を含むことができる。出力信号がオーディオ信号であれば、出力信号はスピーカー部1661から出力され、ビデオ信号であれば、出力信号はディスプレイ部1662から出力される。また、制御部1650から選択されたプリセットメタデータまたは外部プリセットメタデータをディスプレイ部1662で画面に表示する。
図17A及び図17Bは、図16に示す製品に該当する端末と端末との関係及び端末とサーバーとの関係をそれぞれ示す図である。
図17Aを参照すると、第1端末1710及び第2端末1720が各端末の有無線通信部を介してデータやビットストリームを両方向で通信できることがわかる。有無線通信部を介して通信するデータまたはビットストリームは、本発明の図1A、図1B、図2及び図9のビットストリームの形態のものであっても良く、図1乃至図16を参照して説明した本発明のプリセット属性情報、プリセットレンダリングパラメータ、プリセットメタデータ、外部プリセットレンダリングパラメータ、外部プリセットメタデータなどを含むデータであっても良い。
図17Bを参照すると、サーバー1730及び第1端末1740も同様、互いに有無線通信を行うことができる。
図18は、本発明の一実施例によるプリセット属性判断部、外部プリセット情報受信部、固定または変動プリセット情報受信部及びレンダリング部を含むオーディオデコーダが具現されている放送信号デコーディング装置1800の概略的な構成を示す図である。
図18を参照すると、デマルチプレクサ1820は、チューナー1810からTV放送と関連したデータを受信する。これら受信したデータはデマルチプレクサ1820で分離及び選択され、データデコーダ1830でデコーディングされる。一方、デマルチプレクサ1820で選択されたデータは、HDDのような記憶媒体1850に格納されることができる。
デマルチプレクサ1820で選択されたデータは、オーディオデコーダ1841及びビデオデコーダ1842を含むデコーダ1840に入力されてオーディオ信号及びビデオ信号をデコーディングする。オーディオデコーダ1841は、本発明の一実施例による外部プリセット情報受信部1841a、外部プリセット情報適用判断部1841b、固定プリセット情報受信部1841c、変動プリセット情報受信部1841d及びレンダリング部1841eを含み、これらは、図4の外部プリセット情報受信部430、外部プリセット情報受信部440、固定プリセット情報受信部450及び変動プリセット情報受信部460の構成及び機能と同一なので、詳細な説明を省略する。
オーディオデコーダ1841は、受信したビットストリーム、プリセットメタデータ及びプリセットレンダリングパラメータまたは外部プリセットメタデータ及び外部プリセットレンダリングパラメータを用いて、オーディオ信号をデコーディングして出力信号を生成し、プリセットメタデータまたは外部プリセットメタデータをテキスト形態として出力する。
ディスプレイ部1870は、ビデオデコーダ1842から出力されたビデオ信号とオーディオデコーダ1841から出力された外部プリセットメタデータを画面に表示する。また、ディスプレイ部1870は、スピーカー部(図示せず)を含み、オーディオデコーダ1841から出力されるオブジェクトのレベルが外部プリセット情報を用いて調節されたオーディオ信号を、ディスプレイ部1870に含まれたスピーカー部から出力する。また、デコーダ1840でデコーディングされたデータは、HDDのような記憶媒体1850に格納することができる。
一方、信号デコーディング装置1800は、ユーザーから情報を受け取って、受信したデータを制御できるアプリケーションマネジャー1860をさらに含むことができる。アプリケーションマネジャー1860は、ユーザーインターフェースマネジャー1861及びサービスマネジャー1862を含み、ユーザーインターフェースマネジャー1861はユーザーから情報を受け取るためのインターフェース(interface)を制御する。例えば、ディスプレイ部1870に表示されるテキストの書体、画面の明るさ、メニュー構成などを制御することができる。一方、サービスマネジャー1862は、デコーダ1840及びディスプレイ部1870で放送信号をデコーディングして出力する場合、受信する放送信号を、ユーザーから入力される情報を用いて制御することができる。例えば、放送チャンネルの設定、アラーム機能設定、成人認証機能などを提供することができる。アプリケーションマネジャー1860から出力されるデータは、デコーダ1840の他に、ディスプレイ部1870にも送られて利用可能である。
本発明は、オーディオ信号のエンコーディング及びデコーディングに適用することができる。
以上では限定された実施例及び図面に基づいて本発明を説明してきたが、本発明は、それらの具体例に限定されず、本発明の技術思想及び添付の特許請求の範囲とその均等範囲内で様々な修正及び変形が可能であるということは、本発明の属する技術の分野における通常の知識を有する者にとっては明らかである。

Claims (14)

  1. 一つ以上のオブジェクトを含むダウンミックス信号、前記オブジェクトの属性を示し、オブジェクト個数情報を含むオブジェクト情報、前記ダウンミックス信号をレンダリングするためのプリセット情報、外部から入力され、外部プリセットレンダリングパラメータと外部プリセットメタデータを含む外部プリセット情報、及び前記外部プリセット情報が適用されるオブジェクトの個数を示す適用オブジェクト個数情報を受信する段階と、
    前記適用オブジェクト個数情報が前記オブジェクト個数情報と一致するか否かを判断する段階と、
    前記適用オブジェクト個数情報が前記オブジェクト個数情報と一致する場合、前記外部プリセット情報を用いて前記ダウンミックス信号をレンダリングする段階と、
    を含み、
    前記外部プリセットレンダリングパラメータは、前記ダウンミックス信号に含まれた前記オブジェクトをレンダリングし、前記外部プリセットメタデータは、前記外部プリセットレンダリングパラメータの属性を示すことを特徴とする、オーディオ信号の処理方法。
  2. 前記判断する段階は、前記外部プリセット情報が前記ダウンミックス信号に適用されるか否かを示す外部メタデータ情報をさらに用いることを特徴とする、請求項1に記載のオーディオ信号の処理方法。
  3. 前記外部プリセットレンダリングパラメータは、前記適用オブジェクト個数情報及び前記ダウンミックス信号の出力チャンネルの個数を示す出力チャンネル情報に基づく外部プリセットマトリクスを含むことを特徴とする、請求項1に記載のオーディオ信号の処理方法。
  4. 前記レンダリングする段階は、前記外部プリセットマトリクスを用いて前記オブジェクトの出力レベルを調節する段階をさらに含むことを特徴とする、請求項3に記載のオーディオ信号の処理方法。
  5. 前記外部プリセットレンダリングパラメータは、前記ダウンミックス信号の出力チャンネルの個数に従う、外部モノプリセットレンダリングパラメータ、外部ステレオプリセットレンダリングパラメータ及び外部マルチチャンネルプリセットレンダリングパラメータを含むことを特徴とする、請求項1に記載のオーディオ信号の処理方法。
  6. 前記オブジェクト情報及び前記外部プリセット情報を用いて、前記ダウンミックス信号のパニングまたはゲインを調節するダウンミックス処理情報、及び前記ダウンミックス信号をアップミキシングするためのマルチチャンネル情報を生成する段階と、
    前記ダウンミックス処理情報を用いて前記ダウンミックス信号を修正する段階と、
    をさらに含むことを特徴とする、請求項1に記載のオーディオ信号の処理方法。
  7. 一つ以上のオブジェクトを含むダウンミックス信号、前記オブジェクトの属性を示し、オブジェクト個数情報を含むオブジェクト情報、前記ダウンミックス信号をレンダリングするためのプリセット情報を受信する信号受信部と、
    外部から入力され、外部プリセット情報が適用されたオブジェクトの個数を示す適用オブジェクト個数情報が適用された該外部プリセット情報を受信する外部プリセット情報受信部と、
    前記適用オブジェクト個数情報が前記オブジェクト個数情報と一致するか否かを判断する外部プリセット情報適用判断部と、
    前記適用オブジェクト個数情報が前記オブジェクト個数情報と一致する場合、前記外部プリセット情報を用いて前記ダウンミックス信号をレンダリングするレンダリング部と、
    を含み、
    前記外部プリセット情報は、前記ダウンミックス信号に含まれる前記オブジェクトをレンダリングするための外部プリセットレンダリングパラメータ、及び前記外部プリセットレンダリングパラメータの属性を示す外部プリセットメタデータを含むことを特徴とする、オーディオ信号の処理装置。
  8. 前記外部プリセット情報適用判断部は、前記外部プリセット情報が前記ダウンミックス信号に適用されるか否かを示す外部メタデータ情報をさらに用いることを特徴とする、請求項7に記載のオーディオ信号の処理装置。
  9. 前記外部プリセットレンダリングパラメータは、前記適用オブジェクト個数情報及び前記ダウンミックス信号の出力チャンネルの個数を示す出力チャンネル情報に基づく外部プリセットマトリクスを含むことを特徴とする、請求項7に記載のオーディオ信号の処理装置。
  10. 前記外部プリセット情報受信部は、外部プリセットレンダリングパラメータを受信する外部プリセットレンダリングパラメータ受信部、及び前記外部プリセットメタデータを受信する外部プリセットメタデータ受信部を含むことを特徴とする、請求項7に記載のオーディオ信号の処理装置。
  11. 前記レンダリング部は、前記ダウンミックス信号のデータ領域をレンダリングする複数個のデータ領域レンダリング部を含むことを特徴とする、請求項7に記載のオーディオ信号の処理装置。
  12. 前記外部プリセットレンダリングパラメータが前記外部プリセット情報受信部から受信される場合、前記外部プリセットレンダリングパラメータが複数の前記データ領域レンダリング部に適用されることを特徴とする、請求項11に記載のオーディオ信号の処理装置。
  13. 一つ以上のオブジェクトをダウンミキシングしてダウンミックス信号を生成する段階と、
    前記オブジェクトをレンダリングするためのプリセットレンダリングパラメータを含み、前記オブジェクトを制御するために前記ダウンミックス信号に適用されるプリセット情報を生成する段階と、
    前記プリセットレンダリングパラメータに対応するプリセットメタデータを生成する段階と、
    前記プリセット情報の属性を示すプリセット属性情報を決定する段階と、
    を含むことを特徴とする、オーディオ信号の処理方法。
  14. 一つ以上のオブジェクトをダウンミキシングしてダウンミックス信号を生成するダウンミックス信号生成部と、
    前記オブジェクトの属性を示すオブジェクト情報を生成するオブジェクト情報生成部と、
    前記オブジェクトを調節するために前記ダウンミックス信号に適用され、前記オブジェクトをレンダリングするためのプリセットレンダリングパラメータを含むプリセット情報を生成するプリセット情報生成部と、
    前記プリセットレンダリングパラメータに対応するプリセットメタデータを生成するプリセットメタデータ生成部と、
    前記プリセット情報の属性を示すプリセット属性情報を決定するプリセット属性決定部と、
    を含むことを特徴とする、オーディオ信号の処理装置。
JP2011518648A 2008-07-15 2009-07-15 オーディオ信号の処理方法及び装置 Expired - Fee Related JP5258967B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US8069208P 2008-07-15 2008-07-15
US61/080,692 2008-07-15
PCT/KR2009/003889 WO2010008198A2 (en) 2008-07-15 2009-07-15 A method and an apparatus for processing an audio signal
KR1020090064274A KR101171314B1 (ko) 2008-07-15 2009-07-15 오디오 신호의 처리 방법 및 이의 장치
KR10-2009-0064274 2009-07-15

Publications (2)

Publication Number Publication Date
JP2011528446A true JP2011528446A (ja) 2011-11-17
JP5258967B2 JP5258967B2 (ja) 2013-08-07

Family

ID=41531009

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011518648A Expired - Fee Related JP5258967B2 (ja) 2008-07-15 2009-07-15 オーディオ信号の処理方法及び装置

Country Status (4)

Country Link
US (2) US8639368B2 (ja)
JP (1) JP5258967B2 (ja)
CN (1) CN102099854B (ja)
WO (1) WO2010008198A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016060101A1 (ja) * 2014-10-16 2016-04-21 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
JP2017526264A (ja) * 2014-07-31 2017-09-07 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ処理システムおよび方法

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2769826T3 (es) * 2012-04-03 2020-06-29 Hutchinson Sa Sistema de contención de líquido autosellante con un miembro de absorción de energía interna
US9860663B2 (en) 2013-01-15 2018-01-02 Koninklijke Philips N.V. Binaural audio processing
WO2014160717A1 (en) * 2013-03-28 2014-10-02 Dolby Laboratories Licensing Corporation Using single bitstream to produce tailored audio device mixes
TWI530941B (zh) * 2013-04-03 2016-04-21 杜比實驗室特許公司 用於基於物件音頻之互動成像的方法與系統
CN108806704B (zh) 2013-04-19 2023-06-06 韩国电子通信研究院 多信道音频信号处理装置及方法
CN104982042B (zh) 2013-04-19 2018-06-08 韩国电子通信研究院 多信道音频信号处理装置及方法
US9666198B2 (en) * 2013-05-24 2017-05-30 Dolby International Ab Reconstruction of audio scenes from a downmix
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
KR102160254B1 (ko) * 2014-01-10 2020-09-25 삼성전자주식회사 액티브다운 믹스 방식을 이용한 입체 음향 재생 방법 및 장치
EP2928216A1 (en) 2014-03-26 2015-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for screen related audio object remapping
EP3196876B1 (en) * 2014-09-04 2020-11-18 Sony Corporation Transmitting device, transmitting method, receiving device and receiving method
RU2701126C2 (ru) * 2014-09-12 2019-09-24 Сони Корпорейшн Устройство передачи, способ передачи, устройство приема и способ приема
TWI587286B (zh) * 2014-10-31 2017-06-11 杜比國際公司 音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體
CN107211227B (zh) * 2015-02-06 2020-07-07 杜比实验室特许公司 用于自适应音频的混合型基于优先度的渲染系统和方法
EP3258467B1 (en) * 2015-02-10 2019-09-18 Sony Corporation Transmission and reception of audio streams
CN106303897A (zh) 2015-06-01 2017-01-04 杜比实验室特许公司 处理基于对象的音频信号
US20180300100A1 (en) * 2017-04-17 2018-10-18 Facebook, Inc. Audio effects based on social networking data
US10887422B2 (en) 2017-06-02 2021-01-05 Facebook, Inc. Selectively enabling users to access media effects associated with events

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000209699A (ja) * 1999-01-14 2000-07-28 Nissan Motor Co Ltd 音声出力制御装置
WO2008039038A1 (en) * 2006-09-29 2008-04-03 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
WO2008039043A1 (en) * 2006-09-29 2008-04-03 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
WO2008078973A1 (en) * 2006-12-27 2008-07-03 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel including information bitstream conversion

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6122619A (en) * 1998-06-17 2000-09-19 Lsi Logic Corporation Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
TW540200B (en) 2000-11-09 2003-07-01 Interdigital Tech Corp Single user detection
US7471988B2 (en) * 2001-09-11 2008-12-30 Thomas Licensing Method and apparatus for automatic equalization mode activation
KR100517507B1 (ko) 2002-10-17 2005-09-28 삼성전자주식회사 마크업 문서의 버퍼링 상태를 제어하기 위한 제어 정보가기록된 정보저장매체, 그 재생 장치 및 재생 방법
EP1427252A1 (en) * 2002-12-02 2004-06-09 Deutsche Thomson-Brandt Gmbh Method and apparatus for processing audio signals from a bitstream
JP4165248B2 (ja) * 2003-02-19 2008-10-15 ヤマハ株式会社 音響信号処理装置及びパラメータ表示制御プログラム
CN1906664A (zh) * 2004-02-25 2007-01-31 松下电器产业株式会社 音频编码器和音频解码器
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
DE102004043521A1 (de) * 2004-09-08 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
CN101180674B (zh) 2005-05-26 2012-01-04 Lg电子株式会社 编码和解码音频信号的方法
TW200707197A (en) * 2005-08-01 2007-02-16 Asustek Comp Inc Multimedia apparatus and control method thereof capable of automatically selecting preset audio/video setting according to selected signal source
JP2007058930A (ja) * 2005-08-22 2007-03-08 Funai Electric Co Ltd ディスク再生装置
KR101562379B1 (ko) * 2005-09-13 2015-10-22 코닌클리케 필립스 엔.브이. 공간 디코더 유닛 및 한 쌍의 바이노럴 출력 채널들을 생성하기 위한 방법
US7696907B2 (en) * 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
JP5147727B2 (ja) 2006-01-19 2013-02-20 エルジー エレクトロニクス インコーポレイティド 信号デコーディング方法及び装置
ATE527833T1 (de) * 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
KR20080048175A (ko) * 2006-11-28 2008-06-02 삼성전자주식회사 휴대 단말기의 음원 재생 시스템 및 재생 방법
EP2102858A4 (en) 2006-12-07 2010-01-20 Lg Electronics Inc METHOD AND DEVICE FOR PROCESSING AN AUDIO SIGNAL
KR100868475B1 (ko) * 2007-02-16 2008-11-12 한국전자통신연구원 객체기반 오디오 서비스를 위한 다중객체 오디오 콘텐츠파일의 생성, 편집 및 재생 방법과, 오디오 프리셋 생성방법
KR20080082916A (ko) 2007-03-09 2008-09-12 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
WO2008120933A1 (en) * 2007-03-30 2008-10-09 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi object audio signal with multi channel
US20090055005A1 (en) * 2007-08-23 2009-02-26 Horizon Semiconductors Ltd. Audio Processor
US20090062944A1 (en) * 2007-09-04 2009-03-05 Apple Inc. Modifying media files
US8239210B2 (en) * 2007-12-19 2012-08-07 Dts, Inc. Lossless multi-channel audio codec
WO2009093867A2 (en) 2008-01-23 2009-07-30 Lg Electronics Inc. A method and an apparatus for processing audio signal
WO2009093866A2 (en) 2008-01-23 2009-07-30 Lg Electronics Inc. A method and an apparatus for processing an audio signal

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000209699A (ja) * 1999-01-14 2000-07-28 Nissan Motor Co Ltd 音声出力制御装置
WO2008039038A1 (en) * 2006-09-29 2008-04-03 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
WO2008039043A1 (en) * 2006-09-29 2008-04-03 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
JP2010505142A (ja) * 2006-09-29 2010-02-18 エルジー エレクトロニクス インコーポレイティド オブジェクトベースオーディオ信号のエンコーディング/デコーディング方法及びその装置
JP2010521002A (ja) * 2006-09-29 2010-06-17 韓國電子通信研究院 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法
WO2008078973A1 (en) * 2006-12-27 2008-07-03 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel including information bitstream conversion
JP2010515099A (ja) * 2006-12-27 2010-05-06 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート 情報ビットストリーム変換を含む多様なチャネルで構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びに方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017526264A (ja) * 2014-07-31 2017-09-07 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ処理システムおよび方法
WO2016060101A1 (ja) * 2014-10-16 2016-04-21 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
CN106796797A (zh) * 2014-10-16 2017-05-31 索尼公司 发送设备、发送方法、接收设备和接收方法
JPWO2016060101A1 (ja) * 2014-10-16 2017-07-27 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
US10142757B2 (en) 2014-10-16 2018-11-27 Sony Corporation Transmission device, transmission method, reception device, and reception method
CN106796797B (zh) * 2014-10-16 2021-04-16 索尼公司 发送设备、发送方法、接收设备和接收方法

Also Published As

Publication number Publication date
US8639368B2 (en) 2014-01-28
JP5258967B2 (ja) 2013-08-07
WO2010008198A2 (en) 2010-01-21
US9445187B2 (en) 2016-09-13
WO2010008198A3 (en) 2010-06-03
US20100017002A1 (en) 2010-01-21
CN102099854A (zh) 2011-06-15
CN102099854B (zh) 2012-11-28
US20140105422A1 (en) 2014-04-17

Similar Documents

Publication Publication Date Title
JP5258967B2 (ja) オーディオ信号の処理方法及び装置
KR101171314B1 (ko) 오디오 신호의 처리 방법 및 이의 장치
JP5249408B2 (ja) オーディオ信号の処理方法及び装置
JP5457430B2 (ja) オーディオ信号の処理方法及び装置
JP5319704B2 (ja) オーディオ信号の処理方法及び装置
KR101062351B1 (ko) 오디오 신호 처리 방법 및 이의 장치
JP5406276B2 (ja) オーディオ信号の処理方法及び装置
EP2111062B1 (en) A method and an apparatus for processing an audio signal

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130318

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130409

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130423

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160502

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5258967

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees