JP2010521013A - オーディオ信号の処理方法及び装置 - Google Patents

オーディオ信号の処理方法及び装置 Download PDF

Info

Publication number
JP2010521013A
JP2010521013A JP2009553514A JP2009553514A JP2010521013A JP 2010521013 A JP2010521013 A JP 2010521013A JP 2009553514 A JP2009553514 A JP 2009553514A JP 2009553514 A JP2009553514 A JP 2009553514A JP 2010521013 A JP2010521013 A JP 2010521013A
Authority
JP
Japan
Prior art keywords
information
audio signal
grouped
correlation
meta information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009553514A
Other languages
English (en)
Other versions
JP5541928B2 (ja
Inventor
オ オー,ヒェン
ウォン ジュン,ヤン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2010521013A publication Critical patent/JP2010521013A/ja
Application granted granted Critical
Publication of JP5541928B2 publication Critical patent/JP5541928B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuits Of Receivers In General (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

本発明は、オブジェクト情報を含むオーディオ信号を受信し、前記受信されたオーディオ信号から各オブジェクトがグルーピングされたか否かを表す相関情報を獲得し、前記相関情報に基づいてグルーピングされた各オブジェクトに関して共通した一つのメタ情報を獲得することを特徴とするオーディオ信号の処理方法を提供する。
【選択図】図2

Description

本発明は、オーディオ信号の処理方法及び装置に関し、より詳細には、デジタル媒体、放送信号などで受信されたオーディオ信号を処理することができるオーディオ信号の処理方法及び装置に関する。
オブジェクト基盤のオーディオ信号の処理において、一般的に入力信号を構成する一つのオブジェクトは独立的なオブジェクトとして処理される。このとき、各オブジェクト間には相関性が存在しうるので、このような相関性を用いてコーディングする場合、より効率的なコーディングが可能である。
したがって、本発明は、オーディオ信号の処理効率を高めることを目的とする。
本発明の目的は、オブジェクト基盤のオーディオ信号の処理において、各オブジェクト間の相関性を用いて信号を処理することができる方法を提供することにある。
本発明の他の目的は、相関性が存在する各オブジェクトをグルーピングすることができる方法を提供することにある。
本発明の他の目的は、グルーピングされた各オブジェクトの相関性を表す情報を獲得する方法を提供することにある。
本発明の他の目的は、オブジェクトに関するメタ情報を伝送する方法を提供することにある。
本発明は、オブジェクト情報を含むオーディオ信号を受信し、前記受信されたオーディオ信号から各オブジェクトがグルーピングされたか否かを表す相関情報を獲得し、前記相関情報に基づいてグルーピングされた各オブジェクトに関して共通した一つのメタ情報を獲得することを特徴とするオーディオ信号の処理方法を提供する。
本発明は、さらに、グルーピングされた各オブジェクトのうち少なくとも一つのオブジェクトに関するサブメタ情報を獲得し、前記サブメタ情報は、前記グルーピングされた各オブジェクトの個別的な属性を表すことを特徴とする。
本発明は、さらに、メタ情報及びサブメタ情報を用いて各オブジェクト固有のメタ情報を生成することを特徴とする。
本発明は、さらに、サブメタ情報を獲得するか否かを表すフラグ情報を獲得し、前記サブメタ情報は、前記フラグ情報に基づいて獲得されることを特徴とする。
本発明は、さらに、グルーピングされた各オブジェクトのうち少なくとも一つのオブジェクトに関するサブメタ情報を表す識別情報を獲得し、前記識別情報に基づいて前記グルーピングされた各オブジェクトのサブメタ情報を確認することを特徴とする。
本発明は、さらに、グルーピングされた各オブジェクトの種類を表すインデックス情報を獲得し、前記メタ情報は、前記インデックス情報に基づいて獲得されることを特徴とする。
本発明は、グルーピングされた各オブジェクトが左側のチャネルを表すオブジェクト及び右側のチャネルを表すオブジェクトを含む場合、前記左側のチャネルを表すオブジェクトのメタ情報のみを獲得することを特徴とする。
本発明は、さらに、メタ情報が伝送されたか否かを表すフラグ情報を獲得し、前記メタ情報は、前記フラグ情報に基づいて獲得されることを特徴とする。
本発明は、メタ情報がメタデータの文字数及び各文字情報を含むことを特徴とする。
本発明は、オブジェクト情報を含むオーディオ信号を受信し、前記受信されたオーディオ信号から各オブジェクト間に相関性があるか否かを表すオブジェクトタイプ情報を獲得し、前記オブジェクトタイプ情報に基づいて各オブジェクトがグルーピングされたか否かを表す相関情報を誘導し、前記相関情報に基づいてグルーピングされた各オブジェクトに関して共通した一つのメタ情報を獲得することを特徴とするオーディオ信号の処理方法を提供する。
本発明は、各オブジェクト信号間の相関関係によって相関情報を生成し、前記相関情報に基づいて、相関関係を有する各オブジェクトをグルーピングし、前記グルーピングされた各オブジェクトに関して共通した一つのメタ情報を生成することを特徴とするオーディオ信号の処理方法を提供する。
本発明は、オブジェクト情報を含むオーディオ信号から各オブジェクトがグルーピングされたか否かを表す相関情報を獲得する第1の情報生成ユニットと、前記相関情報に基づいてグルーピングされた各オブジェクトに関して共通した一つのメタ情報を獲得する第2の情報生成ユニットとを含むことを特徴とするオーディオ信号処理装置を提供する。
本発明は、互いに密接な相関性を有するオブジェクト信号の場合、一つのグループに束ねる方法を提供することによってオーディオ信号の処理効率を高めることができる。そして、グルーピングされた各オブジェクトに対して同一の情報を一回だけ伝送することによって、効率性をより高めることができる。また、各オブジェクトに関する具体的な属性情報を伝送することによって、ユーザの望むオブジェクトに対して直接的かつ細密なコントロールが可能である。
本発明の実施例による、オーディオ信号処理装置の構成図である。 本発明の実施例による、オブジェクトに関するメタ情報を伝送する方法を説明するための図である。 本発明の実施例による、グルーピングされた各オブジェクトの相関性を表す情報を獲得する方法に関するシンタックスを示す図である。 本発明の実施例による、グルーピングされた各オブジェクトの相関性を表す情報を獲得する方法に関するシンタックスを示す図である。 本発明の実施例による、グルーピングされた各オブジェクトの相関性を表す情報を獲得する方法に関するシンタックスを示す図である。 本発明の実施例による、オブジェクトに関するメタ情報を含むビットストリームの構造を示す図である。
以下、添付された図面を参照して、本発明の実施例の構成及びその作用を説明する。図面に基づいて説明される本発明の構成及び作用は、一つの実施例として説明されるものであり、これによって本発明の技術的思想、その核心構成及び作用が制限されることはない。
併せて、本発明では、可能な限り現在広く使用される一般的な用語を選択したが、特定の場合、出願人が任意に選定した用語を使用して説明する。その場合には、該当部分の詳細な説明でその意味を明確に記載しているので、本発明の説明で使用された用語の名称のみで単純に解釈してはならず、該当用語の意味まで把握して解釈しなければならない。
特に、本明細書において、情報は、値、パラメータ、係数、成分などを総称する用語で、場合によって異なる意味に解釈されることもあるが、本発明がこれに限定されることはない。
図1は、本発明の実施例による、オーディオ信号処理装置の構成図である。
図1を参照すると、まず、本発明の実施例に係るオーディオ信号処理装置100は、情報生成ユニット110、ダウンミックス処理ユニット120及びマルチチャネルデコーダ130を含むことができる。
情報生成ユニット110は、オブジェクト情報(object information;OI)などを含む付加情報を、オーディオ信号ビットストリームを介して受信し、ユーザインタフェースを介してミックス情報(mix information;MXI)を受信することができる。ここで、オブジェクト情報(OI)は、ダウンミックス信号内に含まれている各オブジェクトに関する情報で、オブジェクトレベル情報、オブジェクト相関情報、メタ情報などを含むことができる。前記オブジェクト情報(OI)のうちメタ情報を伝送する方法及び前記メタ情報を含むオーディオ信号のビットストリームの構造に関しては、図2〜図6を参照して詳細に説明する。
一方、ミックス情報(MXI)は、オブジェクト位置情報、オブジェクト利得情報及び再生環境情報などに基づいて生成された情報であり、オブジェクト位置情報は、ユーザが各オブジェクトの位置又はパニングを制御するために入力した情報で、オブジェクト利得情報は、ユーザが各オブジェクトの利得を制御するために入力した情報である。再生環境情報は、スピーカーの個数、スピーカーの位置、アンビエント情報(スピーカーの仮想位置)などを含む情報で、ユーザから入力を受けることもでき、予め保存されることもあり、他の装置から受信することもできる。
ダウンミックス処理ユニット120は、ダウンミックス情報(以下、ダウンミックス信号(DMX))を受信し、ダウンミックス処理情報(DPI)を用いてダウンミックス信号(DMX)を処理する。オブジェクトのパニング又は利得を調節するためにダウンミックス信号(DMX)を処理することができる。
マルチチャネルデコーダ130は、処理されたダウンミックスを受信し、マルチチャネル情報(MI)を用いて処理されたダウンミックス信号をアップミキシングすることによって、マルチチャネル信号を生成することができる。
以下、オブジェクト情報(OI)のうちメタ情報を伝送する方法及び前記メタ情報を含むオーディオ信号のビットストリームの構造に関して詳細に説明する。
図2は、本発明の実施例による、オブジェクトに関するメタ情報を伝送する方法を説明するための図である。
オブジェクト基盤のオーディオコーディングでは、オブジェクトに関するメタ情報の伝送を受けることができる。例えば、複数個のオブジェクトをモノ又はステレオ信号にダウンミックスする過程において、それぞれのオブジェクト信号からメタ情報が抽出される。そして、前記メタ情報は、ユーザの選択によってコントロールされる。
ここで、前記メタ情報は、メタデータを意味してもよい。メタデータは、データに関するデータで、情報資源の属性を記述するデータを意味する。すなわち、メタデータは、実際に保存しようとするデータ(例えば、ビデオ、オーディオなど)自体ではないが、このデータと直接的に又は間接的に関連した情報を提供するデータを意味する。このようなメタデータを使用すれば、ユーザの望むデータであるか否かを確認することができ、容易かつ迅速に所望のデータを見出すことができる。すなわち、データを所有している側面では管理の容易性が保障され、データを使用している側面では検索の容易性が保障される。
オブジェクト基盤のオーディオコーディングにおいて、前記メタ情報は、オブジェクトの属性を表す情報を意味してもよい。例えば、メタ情報は、音源を構成する複数個のオブジェクト信号のうちボーカルオブジェクトであるか、それともバックグラウンドオブジェクトであるかなどを表すことができる。また、前記ボーカルオブジェクトのうち左側のチャネルに関するオブジェクトであるか、それとも右側のチャネルに関するオブジェクトであるかを表すこともできる。また、前記バックグラウンドオブジェクトのうちピアノオブジェクトであるか、ドラムオブジェクトであるか、ギターオブジェクトであるか、その他の楽器オブジェクトであるかなどを表すことができる。
ところが、互いに密接な相関性を有するオブジェクト信号の場合、各オブジェクト信号に関して共通したメタ情報などを伝送することができる。したがって、これらを一つのグループに束ねて共通した情報を一回だけ伝送する場合、効率性をより高めることができる。例えば、ステレオ信号から得た2個のボーカルオブジェクト(左側のチャネルオブジェクトと右側のチャネルオブジェクト)があると仮定すると、前記左側のチャネルオブジェクトと前記右側のチャネルオブジェクトは、「ボーカルオブジェクト」という同一の属性を有するようになる。したがって、各オブジェクトごとに独立したメタ情報を伝送するよりも、共通した一つのメタ情報のみを伝送する方がより効率的である。したがって、互いに密接な相関性を有するオブジェクト信号をグルーピングし、グルーピングされたオブジェクトに対してはメタ情報を一回だけ伝送することができる。
例えば、図2を参照して、ボーカルオブジェクトA、ボーカルオブジェクトB、ピアノオブジェクト5、ピアノオブジェクト6、ギターオブジェクト7及びドラムオブジェクト8があると仮定すると、ボーカルオブジェクトAは、左側のチャネルオブジェクト(ボーカルAオブジェクト1)及び右側のチャネルオブジェクト(ボーカルAオブジェクト2)からなる。これと同様に、ボーカルオブジェクトBも、左側のチャネルオブジェクト(ボーカルBオブジェクト3)及び右側のチャネルオブジェクト(ボーカルBオブジェクト4)からなる。
この場合、互いに密接な相関性を有するオブジェクト信号をグルーピングすることができる。例えば、前記ボーカルオブジェクトAの左側のチャネルオブジェクト(ボーカルAオブジェクト1)と前記ボーカルオブジェクトAの右側のチャネルオブジェクト(ボーカルAオブジェクト2)とが互いに密接な相関性を有すると見ることができる。したがって、これらを一つのグループ(Group1)にグルーピングすることができる。これと同様に、前記ボーカルオブジェクトBの左側のチャネルオブジェクト(ボーカルBオブジェクト3)と前記ボーカルオブジェクトBの右側のチャネルオブジェクト(ボーカルBオブジェクト4)とが互いに密接な相関性を有すると見ることができ、これらを一つのグループ(Group2)にグルーピングすることができる。
また、ピアノオブジェクト5とピアノオブジェクト6とが互いに相関性を有するので、これらを一つのグループ(Group3)にグルーピングすることができる。このように、前記グルーピングされたオブジェクト(Group1、Group2、Group3)に対してはメタ情報を一回だけ伝送することができる。
また、複数個のオブジェクトのみならず、一つのオブジェクトに対しても一つのグループに設定することができる。例えば、ギターオブジェクト7とドラムオブジェクト8は、それぞれ一つのグループ(Group4、Group5)に設定することができる。
さらに、前記Group1とGroup2は、ボーカルオブジェクトという密接な相関性を有している。したがって、前記Group1とGroup2は、更に他のグループ(GroupA)にグルーピングすることもできる。また、ピアノオブジェクト5、ピアノオブジェクト6、ギターオブジェクト7及びドラムオブジェクト8は、バックグラウンドオブジェクト又は楽器オブジェクトという密接な相関性を有している。したがって、前記Group3、Group4、Group5は、更に他のグループ(GroupB)にグルーピングすることができる。このように、グルーピングされた各オブジェクト(GroupA、GroupB)に対してはメタ情報を一回だけ伝送することができる。このとき、前記Group1、Group2、Group3、Group4、Group5は、前記GroupA、GroupBに対して一種のサブグループと見ることができる。
本発明の他の実施例で、オブジェクト信号に関するサブメタ情報を獲得することができる。ここで、サブメタ情報は、グルーピングされた各オブジェクの個別的な属性を表すことができる。例えば、ボーカルオブジェクトの場合、左側のチャネルオブジェクトを表す情報と右側のチャネルオブジェクトを表す情報を別途抽出することができる。すなわち、前記オブジェクトに関する個別的な属性情報を通して現在抽出される情報がボーカルオブジェクトAの左側のチャネルオブジェクト(ボーカルAオブジェクト1)を表す情報であるか、それともボーカルオブジェクトAの右側のチャネルオブジェクト(ボーカルAオブジェクト2)を表す情報であるかを直接的に知ることができる。前記サブメタ情報はヘッダから抽出される。
また、前記メタ情報及び前記サブメタ情報を用いて各オブジェクトの固有のメタ情報を生成することができる。
他の実施例で、オブジェクト信号に関する具体的な属性情報を、フラグ情報を用いて定義することができる。例えば、ボーカルオブジェクトに関してフラグ情報が0である場合には、前記ボーカルオブジェクトの左側のチャネルオブジェクトであることを意味し、ボーカルオブジェクトに関してフラグ情報が1である場合には、右側のチャネルオブジェクトであることを意味してもよい。また、ボーカルオブジェクトの左側のチャネルオブジェクトをデフォルト値に設定し、その次の情報は、別途の情報なしで前記ボーカルオブジェクトの右側のチャネルオブジェクトに設定することができる。
本発明の他の実施例で、オブジェクトに関するメタ情報と一緒に、前記オブジェクトに関するインデックス情報を活用することができる。例えば、オブジェクトに関する属性情報にインデックスを割り当て、予めテーブルを定めることができる。ここで、前記インデックスが示すオブジェクトの属性情報は、メタ情報を意味してもよい。そして、前記インデックス情報は、オブジェクトの種類を表す情報である。0〜126には、それぞれのオブジェクトの属性情報(例えば、楽器の名前)を割り当てることができ、127は、テキストとして入力を受けることができる。具体的な例で、楽器オブジェクトの場合、楽器の名前及び楽器の演奏者(例えば、ギター:ジミー・ページ)に関する情報をメタ情報として伝送することができる。この場合、前記楽器の名前は、予め定められたテーブルにしたがってインデックス情報を用いて伝送し、メタ情報として前記楽器の演奏者に関する情報を伝送することができる。
図3〜図5は、本発明の実施例による、グルーピングされた各オブジェクトの相関性を表す情報を獲得する方法に関するシンタックスを示す。
オブジェクト基盤のオーディオ信号を処理する場合において、入力信号を構成する一つのオブジェクトは独立的なオブジェクトとして処理される。例えば、ボーカルを構成するステレオ信号がある場合、左側のチャネル信号及び右側のチャネル信号をそれぞれ一つのオブジェクトとして認識して処理することができる。このような方式でオブジェクト信号を構成する場合、信号の根源が同一の各オブジェクト間には相関性が存在することができ、このような相関性を用いてコーディングする場合、より効率的なコーディングが可能である。例えば、ボーカルを構成するステレオ信号の左側のチャネル信号で構成されたオブジェクトと、右側のチャネル信号で構成されたオブジェクトとの間には相関性があり、このような相関性に関する情報を伝送して用いることができる。
また、前記相関性が存在する各オブジェクトをグルーピングし、グルーピングされた各オブジェクトに対して共通した情報を一回だけ伝送することによって、より効率的なコーディングが可能である。
本発明の実施例で、前記相関性が存在する各オブジェクトをグルーピングし、相関性に関する情報を伝送するためのシンタックスを定義する必要がある。例えば、図3のようなシンタックスを定義することができる。
図3を参照すると、ボールド体は、ビットストリームから伝送される情報を意味してもよい(S310)。ここで、bsRelatedToは、一つのオブジェクトがステレオ又はマルチチャネルオブジェクトの一部分であるとき、他のオブジェクトが前記同一のステレオ又はマルチチャネルオブジェクトの一部分であるかを表す情報である。前記bsRelatedToは、1ビットの情報をビットストリームから得ることができる。例えば、前記bsRelatedTo[i][j]=1である場合、オブジェクトiとオブジェクトjは、同一のステレオ又はマルチチャネルオブジェクトのチャネルであることを意味してもよい。
前記bsRelatedTo値に基づいて各オブジェクトがグループをなしたか否かを確認することができる(S320)。そして、各オブジェクトごとに前記bsRelatedTo値を確認することによって、各オブジェクト間の相関性に関する情報を確認することができる(S330)。このように相関性が存在するグルーピングされた各オブジェクトに対しては、同一の情報(例えば、メタ情報)を一回だけ伝送することによって、より効率的なコーディングが可能である。
以下、図3のシンタックスの動作原理を説明する。例えば、7個のオブジェクトがあり、このうちオブジェクト3、4が互いに関連しており、オブジェクト5、6が互いに関連していると仮定する。すなわち、オブジェクト1、2、7はそれぞれモノ信号のオブジェクトと見ることができ、オブジェクト3、4とオブジェクト5、6はそれぞれステレオ信号のオブジェクトと見ることができる。この場合、擬似コードによって入力されるビットストリームは、次のように21ビットで表現される。
[0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0]
他の例で、7個のオブジェクトがあり、このうちオブジェクト1、3、5が互いに関連しており、オブジェクト2、6が互いに関連していると仮定する。すなわち、オブジェクト4、7はそれぞれモノ信号のオブジェクトと見ることができ、オブジェクト1、3、5とオブジェクト2、6はそれぞれマルチチャネル信号のオブジェクトと見ることができる。この場合、擬似コードによって入力されるビットストリームは、次のように14ビットで表現される。
[0 1 0 1 0 0 0 1 0 0 0 0 0 0]
これは、下記の表1の原理によって表現されたものである。
Figure 2010521013
前記表1で、NAは、情報が伝送されないことを意味し、0、1は情報の内容を意味してもよい。互いに相関性を有する各オブジェクト間には1の値が伝送される。これによるbsRelatedToは、下記の表2のように構成される。
Figure 2010521013
前記表2から分かるように、オブジェクト1、3、5が互いに相関性を有するので、値1が伝送され、オブジェクト1と相関性のないオブジェクト2、4、6、7は当然にオブジェクト3、5とも相関性がない。これと同様に、前記オブジェクト1に関する相関性情報は、当然に前記オブジェクト3、5と同一である。したがって、オブジェクト1と相関性を有する各オブジェクトに対しては同一の情報を伝送する必要がない。これと同様に、オブジェクト2と相関性を有するオブジェクト6に関する情報も伝送する必要がない。これに基づいて擬似コードによって入力されるビットストリームを、次のように10ビットで表現することができる。
[0 1 0 1 0 0 0 1 0 0]
このビットストリームは、下記の表3のように解釈される。
Figure 2010521013
前記表3のように伝送されたビットストリームを用いて、同一の方式でbsRelatedToを構成することができる。
本発明の他の実施例として、任意のオブジェクトに対して各オブジェクト間の相関性を知らせるためのシンタックスを定義することができる(S410)。例えば、図4を参照すると、各オブジェクト間の相関性を知らせるために、1ビットのbsObjectTypeを定義することができる。前記bsObjectType=0である場合、モノ信号のオブジェクトであることを意味し、前記bsObjectType=1である場合、ステレオ信号のオブジェクトであることを意味してもよい。このように、前記bsObjectType=1である場合、前記bsRelatedTo値に基づいて各オブジェクト間の相関性に関する情報を確認することができ、各オブジェクトがグループをなしたか否かも確認することができる(S420)。
これと同様に、図4において、ボールド体は、ビットストリームから伝送される情報を意味してもよい。以下、図4のシンタックスの動作原理を説明する。例えば、7個のオブジェクトがあり、このうちオブジェクト3、4が互いに関連しており、オブジェクト5、6が互いに関連していると仮定する。すなわち、オブジェクト1、2、7はそれぞれモノ信号のオブジェクトと見ることができ、前記bsObjectType=0になる。そして、オブジェクト3、4とオブジェクト5、6は、それぞれステレオ信号のオブジェクトと見ることができ、前記bsObjectType=1になる。したがって、擬似コードによって入力されるビットストリームは、次のように7ビットで表現される。
[0 0 1 1 1 1 0]
前記実施例の場合、次のような仮定が必要である。例えば、相関性を有するオブジェクトは互いに隣接して伝送される。そして、各オブジェクト間の相関性は、ステレオ信号の各チャネル信号をとる各オブジェクト間のみに存在することができる。
本発明の他の実施例で、ステレオ信号の場合、最初のチャネルには一定のビット数を割り当て、残りのチャネルにはビット数を割り当てない。例えば、前記例で、モノ信号の場合には0ビットを割り当て、ステレオ信号の場合には、最初のチャネルに1ビットを割り当て、残りのチャネルに0ビットを割り当てることによって、ビットストリームの大きさを減少させることができる。したがって、擬似コードによって入力されるビットストリームは、次のように5ビットで表現される。
[0 0 1 1 0]
前記実施例は、図5のようにシンタックスを定義することができる。
図5の実施例では、ビットストリームから最初に1が抽出されると(S510)、該当オブジェクトは、ステレオ信号の左側のチャネル信号を意味してもよく、その次に1が抽出されると、ステレオ信号の右側のチャネル信号を意味してもよい。また、図5の実施例のビットストリームから最初に1が抽出されると(S510)、該当オブジェクトは、ステレオ信号の左側のチャネル信号を意味してもよく、その次のものは、他のフラグ情報を抽出しなくても、ステレオ信号の右側のチャネル信号を意味してもよい。
図4を参照して説明したように、各オブジェクト間の相関性を知らせるために1ビットのbsObjectTypeを定義することができる(S520)。前記bsObjectType=0である場合、現在のオブジェクトは、モノ信号のオブジェクトであることを意味し、前記bsObjectType=1である場合、現在のオブジェクトは、ステレオ信号のオブジェクトであることを意味してもよい。前記bsObjectType=1である場合、各オブジェクトのタイプ(オブジェクトType)を確認することができる(S530)。このように、前記オブジェクトType=1である場合、前記bsRelatedTo値に基づいて各オブジェクト間の相関性に関する情報を確認することができ、各オブジェクトがグループをなしたか否かも確認することができる(S540)。
本発明の他の実施例で、ステレオ信号から獲得したオブジェクトに対して元のチャネルの情報を活用する方法を提案する。
オブジェクト基盤のオーディオコーディングでは、オブジェクトに関する情報を伝送し、これをデコーディングに活用することができる。前記オブジェクト情報には、オブジェクトレベル情報、オブジェクト相関情報、オブジェクト利得情報などを含むことができる。ここで、オブジェクト利得情報は、ユーザが各オブジェクトの利得を制御するために入力した情報である。すなわち、オブジェクト利得情報は、特定のオブジェクトがダウンミックス信号にどのように含まれているかを表すもので、下記の式1のように表現することができる。
[式1]
x_1=sum(a_i*s_i)
x_2=sum(b_i*s_i)
ここで、x_1、x_2はダウンミックス信号で、例えば、x_1はダウンミックス信号の左側のチャネル信号を意味し、x_2はダウンミックス信号の右側のチャネル信号を意味してもよい。そして、s_iはi番目のオブジェクト信号を意味し、a_i、b_iはi番目のオブジェクト信号の左側及び右側のチャネルに含まれる利得を表すオブジェクト利得情報を意味してもよい。
前記オブジェクト利得情報は、多様な方法でビットストリームに含ませることができる。例えば、a_iとb_iを直接含ませる方法、a_i、b_iの比率及びa_i、b_iのうち一つの値を含ませる方法、または、a_i、b_iの比率及びa_i、b_iのエネルギーの和を含ませる方法などがある。
また、s_iがステレオ信号で特定のチャネルの信号で構成されたオブジェクト信号であれば、前記オブジェクト信号は、ダウンミックス信号を作るとき、そのチャネルのみに含まれると仮定することができる。すなわち、前記s_iがステレオ信号の左側のチャネル信号で構成されたオブジェクトであれば、b_iは常に0であると仮定することができる。これと同様に、s_jがステレオ信号の右側のチャネル信号で構成されたオブジェクトであれば、a_jは常に0であることが分かる。
本発明では、オブジェクト信号がステレオ信号のオブジェクトである場合、何れのチャネルに該当するかによってオブジェクト利得情報の伝送量を減少させることができる。前記表2及び3の実施例を用いると、オブジェクト信号がステレオ信号のオブジェクトである場合、オブジェクト信号に該当するチャネルを知ることができる。この場合、ビットレートをより減少させることができる。
また、デコーダでは、伝送されたbsObjectType値を用いてオブジェクト信号ごとにチャネル情報があるかを判断し、前記オブジェクト信号がステレオ信号のオブジェクトである場合、オブジェクト利得情報の一つの値のみを受けるようになる。また、前記オブジェクト信号がステレオ信号のオブジェクトである場合、エンコーダで連続的に処理すると、前記オブジェクト利得情報を次のように構成して伝送することができる。例えば、a_i、b_i+1を伝送することができる。この場合、伝送されたオブジェクト利得情報からa_i、b_i+1を得ることができ、b_i=a_i+1=0にすることによって、ビットレートを減少させることができる。
オブジェクト基盤のオーディオコーディングでは、マルチチャネル信号を用いてオブジェクト信号を構成することができる。例えば、マルチチャネル信号は、MPEGサラウンドエンコーダを用いてステレオダウンミックス信号に作り変えられ、前記ステレオダウンミックス信号を用いて前記オブジェクト信号を生成することができる。上述した各実施例を同一に適用することができる。また、オブジェクト基盤のオーディオコーディングでマルチチャネルダウンミックス信号を用いる場合にも、同一の原理を適用することができる。
以下、このようなオブジェクト基盤のビットストリームの構造について詳細に説明する。
図6は、本発明の実施例による、オブジェクトに関するメタ情報を含むビットストリームの構造を示す。
ビットストリームは、パラメータやデータの束を意味してもよく、伝送又は保存のために圧縮された形態の一般的なビットストリームを意味してもよい。また、ビットストリームとして表現される前のパラメータの形態を意味するものとして、広い意味で解釈することも可能である。デコーディング装置は、前記オブジェクト基盤のビットストリームからオブジェクト情報を獲得することができる。以下、前記オブジェクト基盤のビットストリームに含まれる情報に関して説明する。
図6を参照すると、オブジェクト基盤のビットストリームはヘッダ及びデータを含むことができる。前記ヘッダ(ヘッダ1)は、メタ情報及びパラメータ情報などを含むことができる。前記メタ情報は、次のような情報を含むことができる。例えば、オブジェクト名、オブジェクトインデックス、オブジェクトの属性、オブジェクト数、メタデータの説明情報、文字数、単一文字、メタデータフラグ情報などがある。
ここで、オブジェクト名は、ボーカルオブジェクト、楽器オブジェクト、ギターオブジェクト、ピアノオブジェクトなどのオブジェクトの属性を表す情報を意味してもよい。オブジェクトインデックスは、オブジェクトの属性にインデックスを割り当てた情報を意味してもよい。例えば、楽器の名前ごとにインデックスを割り当て、予めテーブルを定めることができる。オブジェクトに関する具体的な属性情報は、下位オブジェクトの個別的な属性情報を意味してもよい。ここで、下位オブジェクトは、類似した各オブジェクトがグルーピングされて一つのグループオブジェクトをなしたとき、前記類似したオブジェクトをそれぞれ意味してもよい。例えば、ボーカルオブジェクトの場合、左側のチャネルオブジェクトを表す情報と、右側のチャネルオブジェクトを表す情報とを挙げることができる。
また、オブジェクト数に関する情報(オブジェクト数)は、オブジェクト基盤のオーディオ信号パラメータが伝送されたオブジェクトの個数を意味してもよい。メタ情報の説明情報(メタデータ説明情報)は、エンコーディングされたオブジェクトに関するメタデータの説明情報を意味してもよい。メタデータの文字数に関する情報(文字数)は、一つのオブジェクトのメタデータ説明のために用いられる文字の個数を意味してもよい。メタデータの文字情報(単一文字)は、一つのオブジェクトのメタデータの各文字を意味してもよい。メタデータのフラグ情報(メタデータフラグ情報)は、エンコーディングされた各オブジェクトのメタデータ情報が伝送されるか否かを知らせるフラグを意味してもよい。
一方、パラメータ情報は、サンプリング周波数、サブバンドの数、ソース信号の数、ソースタイプなどを含むことができる。また、パラメータ情報は、選択的にソース信号の再生環境情報などを含むことができる。
前記データは、一つ以上のフレームデータ(フレームデータ)を含むことができる。必要な場合、フレームデータと一緒にヘッダ(ヘッダ2)を含むことができる。前記ヘッダ2は、アップデートが必要な情報を含むことができる。
前記フレームデータは、各フレームに含まれるデータタイプに関する情報を含むことができる。例えば、最初のデータタイプ(Type0)である場合、前記フレームデータは最小の情報を含むことができる。具体的な例で、付加情報と関連したソースパワーのみを含むことができる。二番目のデータタイプ(Type1)である場合、前記フレームデータは、追加的にアップデートされる利得を含むことができる。三番目及び四番目のデータタイプである場合、前記フレームデータは、将来の使用のために保存領域に割り当てられる。前記ビットストリームが放送用に用いられる場合、前記保存領域は、放送信号のチューニングを合わせるために必要な情報(例えば、サンプリング周波数、サブバンド数など)を含むことができる。
以上説明したように、本発明が適用される信号処理装置は、DMB(Digital Multimedia Broadcasting)のようなマルチメディア放送送/受信装置に備わり、オーディオ信号及びデータ信号などを復号化するのに使用される。また、前記マルチメディア放送送/受信装置は移動通信端末機を含むことができる。
また、以上説明した本発明による信号処理方法は、コンピュータ読取可能コードとしてプログラム記録媒体に実装することができる。前記コンピュータ読取可能媒体は、コンピュータシステムによって読み取り可能なデータが保存される全ての種類の保存装置を含む。コンピュータ読取可能媒体の例としては、ROM、RAM、CD―ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などがあり、キャリアウェーブ(例えば、インターネットを介した伝送)の形態で具現化されるものも含む。また、前記信号処理方法によって生成されたビットストリームは、コンピュータ読取可能記録媒体に保存されたり、有/無線通信網を介して伝送される。
以上、上述した本発明の好適な実施例は、例示のために開示されたもので、当業者であれば、特許請求の範囲に開示された本発明の技術的思想及びその技術的範囲内で改良、変更、代替又は付加などを多様に行うことができる。

Claims (15)

  1. オブジェクト情報を含むオーディオ信号を受信し、
    前記受信されたオーディオ信号から各オブジェクトがグルーピングされたか否かを表す相関情報を獲得し、
    前記相関情報に基づいてグルーピングされた各オブジェクトに関して共通した一つのメタ情報を獲得することを特徴とするオーディオの信号処理方法。
  2. さらに、前記グルーピングされた各オブジェクトのうち少なくとも一つのオブジェクトに関するサブメタ情報を獲得し、
    前記サブメタ情報は、前記グルーピングされた各オブジェクトの個別的な属性を表す、請求項1に記載のオーディオの信号処理方法。
  3. 前記メタ情報及び前記サブメタ情報を用いて各オブジェクト固有のメタ情報を生成する、請求項2に記載のオーディオの信号処理方法。
  4. さらに、前記サブメタ情報を獲得するか否かを表すフラグ情報を獲得し、
    前記サブメタ情報は、前記フラグ情報に基づいて獲得される、請求項2に記載のオーディオの信号処理方法。
  5. さらに、前記グルーピングされた各オブジェクトのうち少なくとも一つのオブジェクトに関するサブメタ情報を表す識別情報を獲得し、
    前記識別情報に基づいて前記グルーピングされた各オブジェクトのサブメタ情報を確認する、請求項1に記載のオーディオの信号処理方法。
  6. さらに、前記グルーピングされた各オブジェクトの種類を表すインデックス情報を獲得し、
    前記メタ情報は、前記インデックス情報に基づいて獲得される、請求項1に記載のオーディオの信号処理方法。
  7. 前記グルーピングされた各オブジェクトが左側のチャネルを表すオブジェクト及び右側のチャネルを表すオブジェクトを含む場合、
    前記左側のチャネルを表すオブジェクトのメタ情報のみを獲得する、請求項1に記載のオーディオ信号の処理方法。
  8. さらに、前記メタ情報が伝送されたか否かを表すフラグ情報を獲得し、
    前記メタ情報は、前記フラグ情報に基づいて獲得される、請求項1に記載のオーディオ信号の処理方法。
  9. 前記メタ情報は、メタデータの文字数及び各文字情報を含む、請求項1に記載のオーディオ信号の処理方法。
  10. 前記オーディオ信号は、放送信号として受信されたものである、請求項1に記載のオーディオ信号の処理方法。
  11. 前記オーディオ信号は、デジタル媒体を介して受信されたものである、請求項1に記載のオーディオ信号の処理方法。
  12. 請求項1に記載の方法を実行させるためのプログラムを記録したコンピュータ読取可能媒体。
  13. オブジェクト情報を含むオーディオ信号を受信し、
    前記受信されたオーディオ信号から各オブジェクト間に相関性があるか否かを表すオブジェクトタイプ情報を獲得し、
    前記オブジェクトタイプ情報に基づいて各オブジェクトがグルーピングされたか否かを表す相関情報を誘導し、
    前記相関情報に基づいてグルーピングされた各オブジェクトに関して共通した一つのメタ情報を獲得することを特徴とするオーディオ信号の処理方法。
  14. 各オブジェクト信号間の相関関係によって相関情報を生成し、
    前記相関情報に基づいて、相関関係を有する各オブジェクトをグルーピングし、
    前記グルーピングされた各オブジェクトに関して共通した一つのメタ情報を生成することを特徴とするオーディオ信号の処理方法。
  15. オブジェクト情報を含むオーディオ信号から各オブジェクトがグルーピングされたか否かを表す相関情報を獲得する第1の情報生成ユニットと、
    前記相関情報に基づいてグルーピングされた各オブジェクトに関して共通した一つのメタ情報を獲得する第2の情報生成ユニットと、を含むことを特徴とするオーディオ信号の処理装置。
JP2009553514A 2007-03-09 2008-03-07 オーディオ信号の処理方法及び装置 Expired - Fee Related JP5541928B2 (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US89416207P 2007-03-09 2007-03-09
US60/894,162 2007-03-09
US94296707P 2007-06-08 2007-06-08
US60/942,967 2007-06-08
US1202207P 2007-12-06 2007-12-06
US61/012,022 2007-12-06
KR10-2008-0021381 2008-03-07
PCT/KR2008/001318 WO2008111773A1 (en) 2007-03-09 2008-03-07 A method and an apparatus for processing an audio signal
KR1020080021381A KR20080082924A (ko) 2007-03-09 2008-03-07 오디오 신호의 처리 방법 및 장치

Publications (2)

Publication Number Publication Date
JP2010521013A true JP2010521013A (ja) 2010-06-17
JP5541928B2 JP5541928B2 (ja) 2014-07-09

Family

ID=40022031

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009553514A Expired - Fee Related JP5541928B2 (ja) 2007-03-09 2008-03-07 オーディオ信号の処理方法及び装置

Country Status (8)

Country Link
US (1) US8463413B2 (ja)
EP (1) EP2137726B1 (ja)
JP (1) JP5541928B2 (ja)
KR (1) KR20080082924A (ja)
CN (1) CN101675472B (ja)
AT (1) ATE526663T1 (ja)
RU (1) RU2419168C1 (ja)
WO (1) WO2008111773A1 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011518353A (ja) * 2008-04-16 2011-06-23 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
WO2014115222A1 (en) * 2013-01-23 2014-07-31 Nippon Hoso Kyokai Sound signal description method, sound signal production equipment, and sound signal reproduction equipment
JP2014222853A (ja) * 2013-05-14 2014-11-27 日本放送協会 音響信号再生装置、音響信号作成装置
JP2016527558A (ja) * 2013-07-22 2016-09-08 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 3dオーディオコンテンツのsaocダウンミックスを実現する装置及び方法
US9743210B2 (en) 2013-07-22 2017-08-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for efficient object metadata coding
JP2017215595A (ja) * 2017-07-06 2017-12-07 日本放送協会 音響信号再生装置
US10249311B2 (en) 2013-07-22 2019-04-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for audio encoding and decoding for audio channels and audio objects
JP2019115055A (ja) * 2014-12-11 2019-07-11 ドルビー ラボラトリーズ ライセンシング コーポレイション メタデータ保存オーディオ・オブジェクト・クラスタリング
JP2021005876A (ja) * 2011-07-01 2021-01-14 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ信号処理システム及び方法

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8301443B2 (en) 2008-11-21 2012-10-30 International Business Machines Corporation Identifying and generating audio cohorts based on audio data input
US8749570B2 (en) 2008-12-11 2014-06-10 International Business Machines Corporation Identifying and generating color and texture video cohorts based on video input
US8190544B2 (en) 2008-12-12 2012-05-29 International Business Machines Corporation Identifying and generating biometric cohorts based on biometric sensor input
US8417035B2 (en) 2008-12-12 2013-04-09 International Business Machines Corporation Generating cohorts based on attributes of objects identified using video input
US8219554B2 (en) 2008-12-16 2012-07-10 International Business Machines Corporation Generating receptivity scores for cohorts
US8493216B2 (en) 2008-12-16 2013-07-23 International Business Machines Corporation Generating deportment and comportment cohorts
US11145393B2 (en) 2008-12-16 2021-10-12 International Business Machines Corporation Controlling equipment in a patient care facility based on never-event cohorts from patient care data
WO2010105695A1 (en) * 2009-03-20 2010-09-23 Nokia Corporation Multi channel audio coding
JP5635097B2 (ja) * 2009-08-14 2014-12-03 ディーティーエス・エルエルシーDts Llc オーディオオブジェクトを適応的にストリーミングするためのシステム
BR112012007138B1 (pt) 2009-09-29 2021-11-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Decodificador de sinal de áudio, codificador de sinal de áudio, método para prover uma representação de mescla ascendente de sinal, método para prover uma representação de mescla descendente de sinal e fluxo de bits usando um valor de parâmetro comum de correlação intra- objetos
US10318877B2 (en) 2010-10-19 2019-06-11 International Business Machines Corporation Cohort-based prediction of a future event
US9479886B2 (en) * 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
WO2014141577A1 (ja) 2013-03-13 2014-09-18 パナソニック株式会社 オーディオ再生装置およびオーディオ再生方法
US9559651B2 (en) * 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
CN117012210A (zh) 2013-05-24 2023-11-07 杜比国际公司 对音频场景进行解码的方法、装置及计算机可读介质
US9666198B2 (en) 2013-05-24 2017-05-30 Dolby International Ab Reconstruction of audio scenes from a downmix
CN104882145B (zh) 2014-02-28 2019-10-29 杜比实验室特许公司 使用音频对象的时间变化的音频对象聚类
WO2015150480A1 (en) 2014-04-02 2015-10-08 Dolby International Ab Exploiting metadata redundancy in immersive audio metadata
BR112016027506B1 (pt) * 2014-05-30 2023-04-11 Sony Corporation Aparelho e método de processamento de informação
US10878828B2 (en) * 2014-09-12 2020-12-29 Sony Corporation Transmission device, transmission method, reception device, and reception method
EP3731542A1 (en) * 2015-06-17 2020-10-28 Sony Corporation Transmitting device, transmitting method, receiving device, and receiving method
US11047162B1 (en) 2020-03-03 2021-06-29 Leonard Tennessee Torsion spring door closing apparatus
DE102021205545A1 (de) * 2021-05-31 2022-12-01 Kaetel Systems Gmbh Vorrichtung und Verfahren zum Erzeugen eines Ansteuersignals für einen Schallerzeuger oder zum Erzeugen eines erweiterten Mehrkanalaudiosignals unter Verwendung einer Ähnlichkeitsanalyse

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003263858A (ja) * 1997-11-28 2003-09-19 Victor Co Of Japan Ltd オーディオディスク及びオーディオ信号のデコード装置
JP2006003580A (ja) * 2004-06-17 2006-01-05 Matsushita Electric Ind Co Ltd オーディオ信号符号化装置及びオーディオ信号符号化方法
JP2010521002A (ja) * 2006-09-29 2010-06-17 韓國電子通信研究院 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3783192A (en) 1971-12-30 1974-01-01 Sansui Electric Co Decoder for use in matrix four-channel system
JPS5192101A (en) 1975-02-10 1976-08-12 Jidodochojushinki ni okeru shuhasuhojikairo
US4251688A (en) 1979-01-15 1981-02-17 Ana Maria Furner Audio-digital processing system for demultiplexing stereophonic/quadriphonic input audio signals into 4-to-72 output audio signals
JPH03163997A (ja) 1989-11-21 1991-07-15 Mitsubishi Electric Corp 多チャンネル音声信号再生装置
JP2766466B2 (ja) 1995-08-02 1998-06-18 株式会社東芝 オーディオ方式、その再生方法、並びにその記録媒体及びその記録媒体への記録方法
JP2993418B2 (ja) 1996-01-19 1999-12-20 ヤマハ株式会社 音場効果装置
DE19646055A1 (de) 1996-11-07 1998-05-14 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Abbildung von Schallquellen auf Lautsprecher
US6026168A (en) 1997-11-14 2000-02-15 Microtek Lab, Inc. Methods and apparatus for automatically synchronizing and regulating volume in audio component systems
EP1072036B1 (en) 1998-04-15 2004-09-22 STMicroelectronics Asia Pacific Pte Ltd. Fast frame optimisation in an audio encoder
US7103187B1 (en) 1999-03-30 2006-09-05 Lsi Logic Corporation Audio calibration system
US6662677B2 (en) * 1999-10-15 2003-12-16 Teleflex Incorporated Adjustable pedal assembly (banana rod)
EP1134724B1 (en) 2000-03-17 2008-07-23 Sony France S.A. Real time audio spatialisation system with high level control
WO2002007481A2 (en) 2000-07-19 2002-01-24 Koninklijke Philips Electronics N.V. Multi-channel stereo converter for deriving a stereo surround and/or audio centre signal
JP4775529B2 (ja) 2000-12-15 2011-09-21 オンキヨー株式会社 遊戯機
US7095455B2 (en) 2001-03-21 2006-08-22 Harman International Industries, Inc. Method for automatically adjusting the sound and visual parameters of a home theatre system
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
KR20040068194A (ko) 2001-12-05 2004-07-30 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 신호를 강화하기 위한 회로 및 방법
DE60317203T2 (de) 2002-07-12 2008-08-07 Koninklijke Philips Electronics N.V. Audio-kodierung
EP1427252A1 (en) 2002-12-02 2004-06-09 Deutsche Thomson-Brandt Gmbh Method and apparatus for processing audio signals from a bitstream
JP2004193877A (ja) 2002-12-10 2004-07-08 Sony Corp 音像定位信号処理装置および音像定位信号処理方法
CN1748443B (zh) * 2003-03-04 2010-09-22 诺基亚有限公司 多声道音频扩展支持
JP4124702B2 (ja) 2003-06-11 2008-07-23 日本放送協会 立体音響信号符号化装置、立体音響信号符号化方法および立体音響信号符号化プログラム
US7257372B2 (en) * 2003-09-30 2007-08-14 Sony Ericsson Mobile Communications Ab Bluetooth enabled hearing aid
US6937737B2 (en) 2003-10-27 2005-08-30 Britannia Investment Corporation Multi-channel audio surround sound from front located loudspeakers
JP2005286828A (ja) 2004-03-30 2005-10-13 Victor Co Of Japan Ltd オーディオ再生装置
US7490044B2 (en) 2004-06-08 2009-02-10 Bose Corporation Audio signal processing
JP4936894B2 (ja) 2004-08-27 2012-05-23 パナソニック株式会社 オーディオデコーダ、方法及びプログラム
US7787631B2 (en) 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US7903824B2 (en) 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
JP2006211206A (ja) 2005-01-27 2006-08-10 Yamaha Corp サラウンドシステム
JP4414905B2 (ja) 2005-02-03 2010-02-17 アルパイン株式会社 オーディオ装置
EP1691348A1 (en) 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
JP4935091B2 (ja) 2005-05-13 2012-05-23 ソニー株式会社 音響再生方法および音響再生システム
EP1905002B1 (en) 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
US8073702B2 (en) 2005-06-30 2011-12-06 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
KR100835730B1 (ko) 2005-07-29 2008-06-05 주식회사 아이원이노텍 볼타입 클러치장치 및 이를 이용한 자동복귀 힌지장치
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
JP2007058930A (ja) 2005-08-22 2007-03-08 Funai Electric Co Ltd ディスク再生装置
JP4402632B2 (ja) 2005-08-29 2010-01-20 アルパイン株式会社 オーディオ装置
WO2007027051A1 (en) * 2005-08-30 2007-03-08 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
WO2007034806A1 (ja) 2005-09-22 2007-03-29 Pioneer Corporation 信号処理装置、信号処理方法、信号処理プログラムおよびコンピュータに読み取り可能な記録媒体
KR100754220B1 (ko) 2006-03-07 2007-09-03 삼성전자주식회사 Mpeg 서라운드를 위한 바이노럴 디코더 및 그 디코딩방법
CN101529504B (zh) * 2006-10-16 2012-08-22 弗劳恩霍夫应用研究促进协会 多通道参数转换的装置和方法
CA2874451C (en) 2006-10-16 2016-09-06 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
KR101111520B1 (ko) 2006-12-07 2012-05-24 엘지전자 주식회사 오디오 처리 방법 및 장치
EP2191462A4 (en) 2007-09-06 2010-08-18 Lg Electronics Inc METHOD AND DEVICE FOR DECODING A SOUND SIGNAL
US8615088B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal using preset matrix for controlling gain or panning

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003263858A (ja) * 1997-11-28 2003-09-19 Victor Co Of Japan Ltd オーディオディスク及びオーディオ信号のデコード装置
JP2006003580A (ja) * 2004-06-17 2006-01-05 Matsushita Electric Ind Co Ltd オーディオ信号符号化装置及びオーディオ信号符号化方法
JP2010521002A (ja) * 2006-09-29 2010-06-17 韓國電子通信研究院 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011518353A (ja) * 2008-04-16 2011-06-23 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
US11962997B2 (en) 2011-07-01 2024-04-16 Dolby Laboratories Licensing Corporation System and method for adaptive audio signal generation, coding and rendering
US11412342B2 (en) 2011-07-01 2022-08-09 Dolby Laboratories Licensing Corporation System and method for adaptive audio signal generation, coding and rendering
US10904692B2 (en) 2011-07-01 2021-01-26 Dolby Laboratories Licensing Corporation System and method for adaptive audio signal generation, coding and rendering
JP2021005876A (ja) * 2011-07-01 2021-01-14 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ信号処理システム及び方法
WO2014115222A1 (en) * 2013-01-23 2014-07-31 Nippon Hoso Kyokai Sound signal description method, sound signal production equipment, and sound signal reproduction equipment
JP2014142475A (ja) * 2013-01-23 2014-08-07 Nippon Hoso Kyokai <Nhk> 音響信号記述法、音響信号作成装置、音響信号再生装置
KR20150093794A (ko) * 2013-01-23 2015-08-18 닛폰호소쿄카이 음향 신호 기술 방법, 음향 신호 생성 장치 및 음향 신호 재생 장치
KR101682323B1 (ko) * 2013-01-23 2016-12-02 닛폰호소쿄카이 음향 신호 기술 방법, 음향 신호 생성 장치 및 음향 신호 재생 장치
JP2014222853A (ja) * 2013-05-14 2014-11-27 日本放送協会 音響信号再生装置、音響信号作成装置
US10701504B2 (en) 2013-07-22 2020-06-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for realizing a SAOC downmix of 3D audio content
US9699584B2 (en) 2013-07-22 2017-07-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for realizing a SAOC downmix of 3D audio content
US10249311B2 (en) 2013-07-22 2019-04-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for audio encoding and decoding for audio channels and audio objects
US10277998B2 (en) 2013-07-22 2019-04-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for low delay object metadata coding
US11984131B2 (en) 2013-07-22 2024-05-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for audio encoding and decoding for audio channels and audio objects
US10659900B2 (en) 2013-07-22 2020-05-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for low delay object metadata coding
JP2016527558A (ja) * 2013-07-22 2016-09-08 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 3dオーディオコンテンツのsaocダウンミックスを実現する装置及び方法
US10715943B2 (en) 2013-07-22 2020-07-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for efficient object metadata coding
US11910176B2 (en) 2013-07-22 2024-02-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for low delay object metadata coding
US9788136B2 (en) 2013-07-22 2017-10-10 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for low delay object metadata coding
US9743210B2 (en) 2013-07-22 2017-08-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for efficient object metadata coding
US11227616B2 (en) 2013-07-22 2022-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for audio encoding and decoding for audio channels and audio objects
US11463831B2 (en) 2013-07-22 2022-10-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for efficient object metadata coding
US11330386B2 (en) 2013-07-22 2022-05-10 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for realizing a SAOC downmix of 3D audio content
US11337019B2 (en) 2013-07-22 2022-05-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for low delay object metadata coding
JP2018185526A (ja) * 2013-07-22 2018-11-22 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 1つのオーディオトランスポート信号から1つ以上のオーディオ出力チャネルを生成するための装置及び方法
JP2022087307A (ja) * 2014-12-11 2022-06-09 ドルビー ラボラトリーズ ライセンシング コーポレイション メタデータ保存オーディオ・オブジェクト・クラスタリング
JP7061162B2 (ja) 2014-12-11 2022-04-27 ドルビー ラボラトリーズ ライセンシング コーポレイション メタデータ保存オーディオ・オブジェクト・クラスタリング
JP7362826B2 (ja) 2014-12-11 2023-10-17 ドルビー ラボラトリーズ ライセンシング コーポレイション メタデータ保存オーディオ・オブジェクト・クラスタリング
JP2020182231A (ja) * 2014-12-11 2020-11-05 ドルビー ラボラトリーズ ライセンシング コーポレイション メタデータ保存オーディオ・オブジェクト・クラスタリング
US11937064B2 (en) 2014-12-11 2024-03-19 Dolby Laboratories Licensing Corporation Metadata-preserved audio object clustering
JP2019115055A (ja) * 2014-12-11 2019-07-11 ドルビー ラボラトリーズ ライセンシング コーポレイション メタデータ保存オーディオ・オブジェクト・クラスタリング
JP2017215595A (ja) * 2017-07-06 2017-12-07 日本放送協会 音響信号再生装置

Also Published As

Publication number Publication date
WO2008111773A1 (en) 2008-09-18
EP2137726A1 (en) 2009-12-30
US20100191354A1 (en) 2010-07-29
ATE526663T1 (de) 2011-10-15
KR20080082924A (ko) 2008-09-12
CN101675472B (zh) 2012-06-20
RU2419168C1 (ru) 2011-05-20
CN101675472A (zh) 2010-03-17
JP5541928B2 (ja) 2014-07-09
EP2137726B1 (en) 2011-09-28
EP2137726A4 (en) 2010-06-16
US8463413B2 (en) 2013-06-11

Similar Documents

Publication Publication Date Title
JP5541928B2 (ja) オーディオ信号の処理方法及び装置
CN101479786B (zh) 用于编码和解码基于对象的音频信号的方法和装置
KR101100221B1 (ko) 오디오 신호의 디코딩 방법 및 그 장치
JP5291096B2 (ja) オーディオ信号処理方法及び装置
JP5174027B2 (ja) ミックス信号処理装置及びミックス信号処理方法
CN101297353B (zh) 编码和解码多声道音频信号的方法及其装置
CN101911181A (zh) 用于处理音频信号的方法和装置
CN101911732A (zh) 用于处理音频信号的方法和装置
KR20090104674A (ko) 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
JP2011066868A (ja) オーディオ信号符号化方法、符号化装置、復号化方法及び復号化装置
CN107277691B (zh) 基于云的多声道音频播放方法、系统及音频网关装置
US20080288263A1 (en) Method and Apparatus for Encoding/Decoding
KR20140046980A (ko) 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법
US9373335B2 (en) Processing audio objects in principal and supplementary encoded audio signals
CN101361115A (zh) 解码信号的方法和装置
KR102370672B1 (ko) 오디오 데이터 제공 방법 및 장치, 오디오 메타데이터 제공 방법 및 장치, 오디오 데이터 재생 방법 및 장치
CN110022510B (zh) 一种声音振动文件的生成方法、解析方法以及相关装置
EP2658253A2 (en) Broadcast transmitting apparatus and broadcast transmitting method for providing an object-based audio, and broadcast playback apparatus and broadcast playback method
TW202123220A (zh) 使用方向性元資料之多通道音頻編碼及解碼
WO2015050001A1 (ja) ファイル生成装置および方法、並びにファイル再生装置および方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110307

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120831

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120925

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130723

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131003

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140408

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140502

R150 Certificate of patent or registration of utility model

Ref document number: 5541928

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees