JP2006503491A - 空間性が拡張された音源を有する3次元音響シーンの生成及び消費方法 - Google Patents

空間性が拡張された音源を有する3次元音響シーンの生成及び消費方法 Download PDF

Info

Publication number
JP2006503491A
JP2006503491A JP2004545046A JP2004545046A JP2006503491A JP 2006503491 A JP2006503491 A JP 2006503491A JP 2004545046 A JP2004545046 A JP 2004545046A JP 2004545046 A JP2004545046 A JP 2004545046A JP 2006503491 A JP2006503491 A JP 2006503491A
Authority
JP
Japan
Prior art keywords
sound source
sound
information
dimensional
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004545046A
Other languages
English (en)
Other versions
JP4578243B2 (ja
Inventor
ジョン イル ソ
デ ユン ジャン
キョン オク カン
キム ジン ウン
チェトゥク アン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020030071345A external-priority patent/KR100626661B1/ko
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Publication of JP2006503491A publication Critical patent/JP2006503491A/ja
Application granted granted Critical
Publication of JP4578243B2 publication Critical patent/JP4578243B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/13Application of wave-field synthesis in stereophonic audio systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

空間性が拡張された音源を有する3次元音響シーンの生成及び消費方法を提供すること。3次元音響シーンの生成及び消費方法は、音響オブジェクトを生成するステップ及び前記音響オブジェクトの音源属性を含む3D音響シーンの記述情報を生成するステップを含む。

Description

本発明は、空間性が拡張された音源を有する3次元音響シーンの生成及び消費方法に関し、さらに詳しくは、3次元音響シーンにおいて、音源が有する空間性を拡張させるための3次元音響シーンの生成及び消費方法に関する。
一般に、コンテンツ提供サーバは、所定の方式に従ってコンテンツを符号化(encoding)してコンテンツ消費端末に伝送し、コンテンツ消費端末は、所定の方式に従ってコンテンツを復号化(decoding)して伝送されたコンテンツを出力する。
従って、コンテンツ提供サーバは、コンテンツを符号化するための符号化部と、符号化されたコンテンツを送信するための送信部とを含む。コンテンツ消費端末は、送信されたコンテンツを受信する受信部、受信されたコンテンツを復号化する復号化部及び復号されたコンテンツをユーザに出力する出力部を含む。
今まで知られているオーディオ/ビデオ信号の符号化/復号化方式は非常に多様である。その中で、MPEG−4による符号化/復号化方式が最近に広く用いられている。 MPEG−4は、低い伝送率で動画を伝送するために、MPEG(Moving Picture Experts Group)が定義したデータ圧縮及び復元技術に関する標準である。
MPEG−4によれば、任意形状のオブジェクト(object)を符号化することができる。従って、コンテンツ消費端末は、複数のオブジェクトが合成されたシーンを消費できる。このため、 MPEG−4は、音響オブジェクトの表示方法と特性とを指定するためのシーン記述(Scene Description)言語としてAudioBIFS(Audio Binary Format for Scene)を定義している。
一方、映像物の発展と共に、ユーザはもっと実在感のある音質と画質のコンテンツを消費することを望む。上述したMPEG−4 AudioBIFS では、3次元音響シーンの空間感を表現するために、 AudioFXノード及びDirectiveSoundノードなどを使用する。このようなノードにおいて、音源のモデリングは点音源(point−source)に依存するが、点音源は、3次元音響空間で描写しやすく、具現することも容易である。
しかし、現実の音源は、点よりは2次元以上の次元を持っている場合がもっと多く、重要なことは、音源の形状が人間に認識されることができるという点である(特許文献1)。
例えば、直線に伸びている海岸線に当る波の音は点音源でない、1次元的な線音源として認識されることができる。
従って、AudioBIFSを用いて3次元音響シーンの現実感を一層向上させるためには、音源の大きさ(size)と形状(shape)とが表現されなければならず、そうでない場合は、3次元音響シーンにおいて、音響オブジェクトの現実感は深刻に毀損される。
即ち、3次元音響シーンに1次元以上の次元を有する音源を付与するためには、音源の空間性を記述できなければならない。
J.Baluert, Spatial Hearing, The MIT Press, Cambridge Mass, 1996 A.J. Berkhout, D. de Vries, and P.Vogel, “Acoustic control by wave field synthesis,” J. Aoust.Soc. Am. Vol.93, No.5.pp.2764−2778, May 1993
本発明は上述した問題を解決するためになされたものであって、その目的は、3次元音響シーン記述情報に音源の空間性拡張情報を含む音源特性情報を含むことにより、空間性が拡張された音源を有する3次元音響シーンの生成及び消費方法を提供することである。
前記のような目的を達成するための本発明は、空間性が拡張された音源を有する3次元音響シーン(3D audio scene)の生成方法であって、音響オブジェクトを生成するステップと、前記音響オブジェクトに対する音源特性情報を含む3次元音響シーン記述情報を生成するステップとを含み、前記音源特性情報は、3次元空間で表現される音源の大きさ及び形状情報である音源の空間性拡張情報を含む。
また、本発明は、空間性が拡張された音源を有する3次元音響シーンの消費方法(A method for consuming a 3D audio scene)であって、音響オブジェクト及び前記音響オブジェクトに対する音源特性情報を含む3次元音響シーン記述情報を受信するステップと、前記3次元音響シーン記述情報に基づいて前記音響オブジェクトを出力するステップとを含み、前記音源特性情報は、3次元空間で表現される音源の大きさ及び形状情報である音源の空間性拡張情報を含む。
本発明によれば、コンテンツ音源の空間性を拡張する装置及び方法を提示して、より効果的な3次元音響を作り出すことができる効果がある。
以下の内容は単に本発明の原理を例示する。従って、当業者は例え本明細書に明確に説明されたり、図示されてはいないが、本発明の原理を具現し、本発明の概念と範囲に含まれた多様な装置を発明できる。また、本明細書に列挙された全ての条件部用語及び実施例などは原則的に、本発明の概念が理解されるようにするための目的のみに明確に意図され、このように、特別に列挙された実施例及び状態に制限的でないものとして理解しなければならない。
また、本発明の原理、観点及び実施例だけでなく、特定の実施例を列挙する全ての詳細な説明は、このような事項の構造的及び機能的均等物を含むように意図されるものとして理解しなければならない。なお、このような均等物などは、現在公知された均等物だけでなく、将来に開発される均等物、即ち、構造と関係なく、同じ機能を行うように発明された全ての素子を含むものとして理解しなければならない。
従って、例えば、本明細書のブロック図は本発明の原理を具体化する例示的な回路の概念的な観点を表すものとして理解しなければならない。これと同様に、全てのフローチャート、状態変換図、擬似コードなどはコンピュータが読み取り可能な媒体に実質的に表すことができ、コンピュータまたはプロセッサが明確に示されているか否かに関わらず、コンピュータまたはプロセッサにより行われる多様なプロセスを表すものとして理解しなければならない。
プロセッサまたはこれと類似した概念として表示された機能ブロックを含む図面に示された多様な素子の機能は、専用ハードウェアだけでなく、適切なソフトウェアと関連してソフトウェアを実行する能力を有したハードウェアの使用に提供され得る。プロセッサにより提供される時、前記機能は単一専用プロセッサ、単一共有プロセッサ、或いは、複数の個別的プロセッサにより提供されることができ、これらのうち、一部は共有されることができる。
またプロセッサ、制御、またはこれと類似した概念として提示される用語の明確な使用は、ソフトウェアを実行する能力を有したハードウェアを排他的に引用して解析されてはいけないし、制限無しでデジタル信号プロセッサ(DSP)ハードウェア、ソフトウェアを格納するためのROM、RAM及び不揮発性メモリを暗示的に含むことと理解しなければならない。また、周知慣用の他のハードウェアも含まれることができる。
本明細書の請求の範囲において、詳細な説明に記載された機能を行うための手段として表現された構成要素は、例えば、前記機能を行う回路素子の組み合わせまたはファームウェア/マイクロコードなどを含む全ての形式のソフトウェアを含む機能を行う全ての方法を含むものとして意図され、上記の機能を行うように、上記ソフトウェアを実行するための適切な回路と組み合わせられる。このような請求の範囲により定義される本発明は、多様に列挙された手段により提供される機能などが結合され、請求項が要求する方式と結合されるため、上記の機能を提供できるいかなる手段も本明細書から把握されるものと均等なものとして理解しなければならない。
上述した目的、特徴及び長所などは、添付された図面と関連した次の詳細な説明を通してより明確になるだろう。まず、各図面の構成要素などに参照番号を付することにおいて、同じ構成要素などに限っては、例え、異なる図面上に表示されても、できるだけ同じ番号を持つようにしていることに留意しなければならない。また、本発明を説明するにおいて、関連した公知技術に対する具体的な説明が本発明の要旨を不必要にする恐れがあると判断される場合、その詳細な説明を省略する。以下、添付された図面を参照して本発明に係る好ましい実施例を詳細に説明する。
図1は多様な形状と大きさとを有することのできる音源を説明するための図面である。図1A乃至図1Dに示されているように、音源は点、連続した線、面及び体積を有した空間になることができる。音源は任意の形状と大きさとを有するため、このような音源を記述することは非常に複雑になる恐れがある。しかし、モデリングしようとする音源形状を調整すれば、音源をそれほど複雑でないように記述することができる。
本発明では、多様な形状と大きさとを有する音源を簡単にモデリングするために、点音源が仮想音源(virtual sound source)の次元に等しく分布することと仮定する。その結果、多様な形態の音源は点音源の連続した配列で表現されることができる。この時、仮想オブジェクト上の各点音源の位置は、3次元シーンで定義された音源のベクトル位置を用いて計算することができる。
複数の点音源で空間音源をモデリングすれば、空間音源はAudioBIFSで定義されたノードを用いて記述されなければならず、AudioFXノードを用いれば、いかなる効果でも3次元シーンに含ませることができる。従って、空間音源に対応する効果は、AudioFXノードを通してプログラミングされ、3次元シーンに挿入されることができる。
しかし、この場合、非常に複雑なDSP(Digital Signal Processing)アルゴリズムが要求され、音源の次元を調整することも極めて困難である。
また、AudioBIFSを用いてオブジェクトの有限次元に分布している点音源をグルーピングし、前記音源グループを変換して空間的な位置及び方向を変更することができる。まず、複数のDirectiveSoundノードを用いて点音源の特徴を記述する。点音源の位置はオブジェクト表面に均一に分布するように計算する。
次に、前記点音源を空間エイリアシング(spatial aliasing)を排除できる空間上の距離に位置させる(特許文献2)。グループノードを用いて前記点音源をグルーピングすることにより、空間音源は3次元音響シーンでベクトル化されることができる。
図2はAudioBIFSシーンの例示的な概略図であって、仮想音源の概念を示している。線音源の軸に沿って均一に分布している3個の点音源を用いて仮想の連続的な線音源がモデリングされている。
このような仮想音源の概念に従って点音源の位置は(xo−dx、yo−dy、zo−dz)(xo、yo、zo)及び(xo+dx、yo+dy、zo+dz)として設定される。ここで、dx、dy及びdzは、angleフィールド及びdirectionフィールドに定義されている聴取者と音源位置との間のベクトルと、音源の方向ベクトル間の角度とから計算することができる。
図2に示された例示的な概略図は、複数の点音源で空間音源を記述している。AudioBIFSは、このような特定のシーン記述を支援できるようにみえる。しかし、このような方法は、不必要な音響オブジェクト定義があまり多く要求される。1つのオブジェクトをモデリングするために、複数のオブジェクトが定義されるためである。MPEG−4のハイブリッド記述(hybrid description)の主な目的がより多いオブジェクト指向表現(object oriented representation)であるとすれば、一つの空間音源をモデリングするために用いられる点音源が結合されて一つのオブジェクトに再生産されることが好ましい。
本発明によれば、音源の形状及び大きさ属性を記述するために、AudioBIFSのDirectiveSoundノードに新しいフィールドが追加される。図3は本発明に係るDirectiveSoundノードの概略図であって、音源の空間性拡張情報が追加されたことを例示している。
図3に示されているように、「sourceDimensions」フィールド値に応じて対応される新しいレンダリング設計が「DirectiveSound」ノードに適用される。「sourceDimensions」フィールドは音源の形状情報もさらに含んでいる。もし、「sourceDimensions」フィールド値が「0、0、0」であれば、音源は1つの点になり、音源を拡張するための追加的な記述が「DirectiveSound」ノードに適用されない。
「sourceDimensions」フィールド値が「0、0、0」でない、ある値を有すれば、音源の次元は仮想的に拡張される。「DirectiveSound」ノードのlocationフィールド及びdirectionフィールドで音源の位置及び方向が各々定義される。「sourceDimensions」フィールド値に基づいて当該音源の次元は「direction」フィールドに定義されるベクトルに垂直な方向に拡張される。
「location」フィールドは、拡張された音源の幾何学的中央を定義し、「sourceDimension」フィールドの値は、音源の3次元的大きさ(size)を定義する。従って、Δx、Δy、Δzの値に応じて空間に拡張される音源の大きさが決められる。
図4は本発明に係る音源拡張過程を説明するための図である。図示されているように、「sourceDimension」フィールドの値は、(0、Δy、Δz)であり、(Δy≠0、Δz≠0)、これは、Δy×Δzの面積を有する面音源を示す。
図示された音源は、「sourceDimension」フィールド値(0、Δy、Δz)に基づいて、「direction」フィールドに定義されたベクトルに垂直な方向に拡張されて面音源をなす。このように、音源の次元と位置とが定義されると、点音源は拡張された音源の表面に位置する。本発明では、拡張された音源の表面に点音源が均等に分布するように点音源の位置を計算する。
図5A乃至図5Cは本発明によって多様な音源形状による点音源の分布を説明するための図である。
音源の次元と距離は自由変数であるため、ユーザが知覚できる音源の大きさは自由に構成することができる。
例えば、マイクロホンの配列を用いて録音されたマルチトラックオーディオ信号は図5Aのように点音源の線拡張により表現されることができる。この場合、「sourceDimension」フィールドの値は(0、0、Δz)である。
また、互いに異なる音響信号が拡散音源を生成するために、本発明に係る点音源の拡張として表現されることができる。
図5B及び5Cは、点音源の拡散により表現される面音源と体積を持つ空間音源を示す。図5Bの場合、「sourceDimension」フィールドの値は(0、Δy、Δz) であり、図5Cの場合、「sourceDimension」 フィールドの値は(Δx、Δy、Δz)である。
このように、空間音源の次元が定義されることにより、点音源の数(即ち、入力オーディオチャネル数)は拡張された音源での点音源密度を決める。
もし、「AudioSource」ノードが「source」フィールドで定義されると、「numChan」フィールドの値は使用される点音源の数を表すことができる。
そして、「DirectiveSound」ノードの「angle」、 「directivity」及び「frequency」フィールドで定義された方向性は、拡張された音源に含まれた全ての点音源に同一に適用されることができる。
なお、本発明は、上記の実施の形態に限定されるものではなく、本発明に係る技術的思想から逸脱しない範囲で様々な変更が可能であり、それらも本発明の技術的範囲に属する。
多様な形状を有することのできる音源を説明するための図である。 連続した点音源をグルーピングして空間音源を表現する方法を説明するための図である。 本発明に従ってAudioBIFSの「DirectiveSound」音源の空間性拡張情報が追加されたことを例示する図である。 本発明に係る音源拡張過程を説明するための図である。 本発明に従って多様な音源形状による点音源の分布を説明するための図である。

Claims (12)

  1. 空間性が拡張された音源を有する3次元音響シーン(3D audio scene)の生成方法であって、
    音響オブジェクトを生成するステップと、
    前記音響オブジェクトに対する音源特性情報を含む3次元音響シーン記述情報を生成するステップとを含み、
    前記音源特性情報は、
    3次元空間で表現される音源の大きさ及び形状情報である音源の空間性拡張情報を含むことを特徴とする3次元音響シーンの生成方法。
  2. 前記音源の空間性拡張情報は、
    3次元直角座標系のx成分、y成分、z成分として表現される音源次元情報を含むことを特徴とする請求項1に記載の3次元音響シーンの生成方法。
  3. 前記音源の空間性拡張情報は、
    前記音源次元情報の幾何中心位置情報をさらに含むことを特徴とする請求項2に記載の3次元音響シーンの生成方法。
  4. 前記音源の空間性拡張情報は、
    前記音源の方向情報をさらに含み、
    前記音源方向に垂直な方向に音源の空間性を拡張して3次元音響シーンを記述することを特徴とする請求項2に記載の3次元音響シーンの生成方法。
  5. 空間性が拡張された音源を有する3次元音響シーンの消費方法であって、
    音響オブジェクト及び前記音響オブジェクトに対する音源特性情報を含む3次元音響シーンの記述情報を受信するステップと、
    前記3次元音響シーンの記述情報に基づいて、前記音響オブジェクトを出力するステップとを含み、
    前記音源特性情報は、
    3次元空間に表現される音源の大きさ及び形状情報である音源の空間性拡張情報を含むことを特徴とする3次元音響シーンの消費方法。
  6. 前記音源の空間性拡張情報は、
    3次元直角座標系のx成分、y成分、z成分として表現される音源次元情報を含むことを特徴とする請求項5に記載の3次元音響シーンの消費方法。
  7. 前記音源の空間性拡張情報は、
    前記音源次元情報の幾何中心位置情報をさらに含むことを特徴とする請求項6に記載の3次元音響シーンの消費方法。
  8. 前記音源の空間性拡張情報は、
    前記音源の方向情報をさらに含み、
    前記音源方向に垂直な方向に音源の空間性を拡張して、3次元音響シーンを記述することを特徴とする請求項6に記載の3次元音響シーンの消費方法。
  9. 空間性が拡張された音源を有する3次元音響シーンデータストリーム音響オブジェクトと、
    前記音響オブジェクトに対する音源特性情報を含む3次元音響シーンの記述情報とを含み、
    前記音源特性情報は、
    3次元空間に表現される音源の大きさ及び形状情報である音源の空間性拡張情報を含むことを特徴とする3次元音響シーンデータストリーム。
  10. 前記音源の空間性拡張情報は、
    3次元直角座標系のx成分、y成分、z成分として表現される音源次元情報を含むことを特徴とする請求項9に記載の3次元音響シーンデータストリーム。
  11. 前記音源の空間性拡張情報は、
    前記音源次元情報の幾何中心位置情報をさらに含むことを特徴とする請求項9に記載の3次元音響シーンデータストリーム。
  12. 前記音源の空間性拡張情報は、
    前記音源の方向情報をさらに含み、
    前記音源方向に垂直な方向に音源の空間性を拡張して、3次元音響シーンを記述することを特徴とする請求項9に記載の3次元音響シーンデータストリーム。
JP2004545046A 2002-10-15 2003-10-15 空間性が拡張された音源を有する3次元音響シーンの生成及び消費方法 Expired - Lifetime JP4578243B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20020062962 2002-10-15
KR1020030071345A KR100626661B1 (ko) 2002-10-15 2003-10-14 공간성이 확장된 음원을 갖는 3차원 음향 장면 처리 방법
PCT/KR2003/002149 WO2004036955A1 (en) 2002-10-15 2003-10-15 Method for generating and consuming 3d audio scene with extended spatiality of sound source

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008052618A Division JP4499165B2 (ja) 2002-10-15 2008-03-03 空間性が拡張された音源を有する3次元音響シーンの生成及び消費方法

Publications (2)

Publication Number Publication Date
JP2006503491A true JP2006503491A (ja) 2006-01-26
JP4578243B2 JP4578243B2 (ja) 2010-11-10

Family

ID=36574228

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004545046A Expired - Lifetime JP4578243B2 (ja) 2002-10-15 2003-10-15 空間性が拡張された音源を有する3次元音響シーンの生成及び消費方法

Country Status (5)

Country Link
US (3) US20060120534A1 (ja)
EP (1) EP1552724A4 (ja)
JP (1) JP4578243B2 (ja)
AU (1) AU2003269551A1 (ja)
WO (1) WO2004036955A1 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008532374A (ja) * 2005-02-23 2008-08-14 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. オーディオオブジェクトを用いて波面合成レンダラ手段を制御するための装置および方法
JP2008532372A (ja) * 2005-02-23 2008-08-14 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 波面合成レンダリング手段を制御するための装置および方法
JP2010522345A (ja) * 2006-12-07 2010-07-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及びその装置
JP2012168552A (ja) * 2007-02-16 2012-09-06 Electronics & Telecommunications Research Inst オブジェクト基盤オーディオサービスのための多重オブジェクトオーディオコンテンツファイルの生成、編集、および再生方法と、オーディオプリセット生成方法
JP2014501945A (ja) * 2010-12-03 2014-01-23 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 幾何ベースの空間オーディオ符号化のための装置および方法
CN113316943A (zh) * 2018-12-19 2021-08-27 弗劳恩霍夫应用研究促进协会 再现空间扩展声源的设备与方法、或从空间扩展声源生成比特流的设备与方法
JP2023506700A (ja) * 2019-11-20 2023-02-20 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. パンニング済みオブジェクトスピーカーゲインとスプレッドオブジェクトスピーカーゲインとを使用する、オーディオオブジェクトレンダラー、スピーカーゲインを決定するための方法およびコンピュータプログラム

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005098583A1 (ja) * 2004-03-30 2005-10-20 Pioneer Corporation 音情報出力装置、音情報出力方法、および音情報出力プログラム
EP1691348A1 (en) 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
DE102005008369A1 (de) 2005-02-23 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Simulieren eines Wellenfeldsynthese-Systems
DE102005008342A1 (de) 2005-02-23 2006-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Speichern von Audiodateien
DE102005008343A1 (de) 2005-02-23 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Liefern von Daten in einem Multi-Renderer-System
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
EP1905002B1 (en) 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
EP1946295B1 (en) 2005-09-14 2013-11-06 LG Electronics Inc. Method and apparatus for decoding an audio signal
WO2007083958A1 (en) * 2006-01-19 2007-07-26 Lg Electronics Inc. Method and apparatus for decoding a signal
KR101366291B1 (ko) 2006-01-19 2014-02-21 엘지전자 주식회사 신호 디코딩 방법 및 장치
EP1974347B1 (en) 2006-01-19 2014-08-06 LG Electronics Inc. Method and apparatus for processing a media signal
CN102693727B (zh) 2006-02-03 2015-06-10 韩国电子通信研究院 用于控制音频信号的渲染的方法
WO2007091850A1 (en) 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
BRPI0706488A2 (pt) 2006-02-23 2011-03-29 Lg Electronics Inc método e aparelho para processar sinal de áudio
JP2009532712A (ja) 2006-03-30 2009-09-10 エルジー エレクトロニクス インコーポレイティド メディア信号処理方法及び装置
US20080235006A1 (en) 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
KR101396140B1 (ko) * 2006-09-18 2014-05-20 코닌클리케 필립스 엔.브이. 오디오 객체들의 인코딩과 디코딩
US7962756B2 (en) * 2006-10-31 2011-06-14 At&T Intellectual Property Ii, L.P. Method and apparatus for providing automatic generation of webpages
KR100934928B1 (ko) * 2008-03-20 2010-01-06 박승민 오브젝트중심의 입체음향 좌표표시를 갖는 디스플레이장치
KR101764175B1 (ko) 2010-05-04 2017-08-14 삼성전자주식회사 입체 음향 재생 방법 및 장치
KR101901908B1 (ko) 2011-07-29 2018-11-05 삼성전자주식회사 오디오 신호 처리 방법 및 그에 따른 오디오 신호 처리 장치
US10176644B2 (en) 2015-06-07 2019-01-08 Apple Inc. Automatic rendering of 3D sound
WO2017085562A2 (en) * 2015-11-20 2017-05-26 Dolby International Ab Improved rendering of immersive audio content
JP6786834B2 (ja) 2016-03-23 2020-11-18 ヤマハ株式会社 音響処理装置、プログラムおよび音響処理方法
US11341952B2 (en) 2019-08-06 2022-05-24 Insoundz, Ltd. System and method for generating audio featuring spatial representations of sound sources
KR20210072388A (ko) * 2019-12-09 2021-06-17 삼성전자주식회사 오디오 출력 장치 및 오디오 출력 장치의 제어 방법
WO2021118352A1 (en) * 2019-12-12 2021-06-17 Liquid Oxigen (Lox) B.V. Generating an audio signal associated with a virtual sound source
NL2024434B1 (en) * 2019-12-12 2021-09-01 Liquid Oxigen Lox B V Generating an audio signal associated with a virtual sound source
JP2023511862A (ja) * 2020-01-14 2023-03-23 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 空間的に拡張された音源(Spatially Extended Sound Source)を再生する装置及び方法、又は固定化情報を用いて空間的に拡張された音源に対する記述を生成する装置及び方法
CN112839165B (zh) * 2020-11-27 2022-07-29 深圳市捷视飞通科技股份有限公司 人脸跟踪摄像的实现方法、装置、计算机设备和存储介质
KR20230153470A (ko) * 2021-04-14 2023-11-06 텔레폰악티에볼라겟엘엠에릭슨(펍) 도출된 내부 표현을 갖는 공간적으로-바운드된 오디오 엘리먼트
KR20220150592A (ko) 2021-05-04 2022-11-11 한국전자통신연구원 볼륨 음원의 렌더링 방법 및 장치
WO2023061965A2 (en) * 2021-10-11 2023-04-20 Telefonaktiebolaget Lm Ericsson (Publ) Configuring virtual loudspeakers

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08242358A (ja) * 1995-03-06 1996-09-17 Toshiba Corp 画像処理装置
DE19721487A1 (de) * 1997-05-23 1998-11-26 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Fehlerverschleierung bei Mehrkanaltonsignalen
US6330486B1 (en) 1997-07-16 2001-12-11 Silicon Graphics, Inc. Acoustic perspective in a virtual three-dimensional environment
AU761202B2 (en) 1997-09-22 2003-05-29 Sony Corporation Generation of a bit stream containing binary image/audio data that is multiplexed with a code defining an object in ascii format
US6016473A (en) 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
JP2000092754A (ja) 1998-09-14 2000-03-31 Toshiba Corp 電気機器の電源回路
EP1018840A3 (en) * 1998-12-08 2005-12-21 Canon Kabushiki Kaisha Digital receiving apparatus and method
JP2000267675A (ja) * 1999-03-16 2000-09-29 Sega Enterp Ltd 音響信号処理装置
KR100339559B1 (ko) * 1999-09-22 2002-06-03 구자홍 공기 조화기용 열교환기 및 그 제조방법
US20010037386A1 (en) * 2000-03-06 2001-11-01 Susumu Takatsuka Communication system, entertainment apparatus, recording medium, and program
JP2001251698A (ja) 2000-03-07 2001-09-14 Canon Inc 音響処理システム及びその制御方法並びに記憶媒体
EP1297691A2 (en) * 2000-03-07 2003-04-02 Sarnoff Corporation Camera pose estimation
JP2002218599A (ja) 2001-01-16 2002-08-02 Sony Corp 音声信号処理装置、音声信号処理方法
GB0127776D0 (en) * 2001-11-20 2002-01-09 Hewlett Packard Co Audio user interface with multiple audio sub-fields
US7113610B1 (en) * 2002-09-10 2006-09-26 Microsoft Corporation Virtual sound source positioning

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008532372A (ja) * 2005-02-23 2008-08-14 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 波面合成レンダリング手段を制御するための装置および方法
JP2008532374A (ja) * 2005-02-23 2008-08-14 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. オーディオオブジェクトを用いて波面合成レンダラ手段を制御するための装置および方法
JP2014090509A (ja) * 2006-12-07 2014-05-15 Lg Electronics Inc オーディオ信号のデコーディング方法及びその装置
JP2010522345A (ja) * 2006-12-07 2010-07-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及びその装置
US9135953B2 (en) 2007-02-16 2015-09-15 Electronics And Telecommunications Research Institute Method for creating, editing, and reproducing multi-object audio contents files for object-based audio service, and method for creating audio presets
JP2012168552A (ja) * 2007-02-16 2012-09-06 Electronics & Telecommunications Research Inst オブジェクト基盤オーディオサービスのための多重オブジェクトオーディオコンテンツファイルの生成、編集、および再生方法と、オーディオプリセット生成方法
JP2014501945A (ja) * 2010-12-03 2014-01-23 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 幾何ベースの空間オーディオ符号化のための装置および方法
US9396731B2 (en) 2010-12-03 2016-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Sound acquisition via the extraction of geometrical information from direction of arrival estimates
US10109282B2 (en) 2010-12-03 2018-10-23 Friedrich-Alexander-Universitaet Erlangen-Nuernberg Apparatus and method for geometry-based spatial audio coding
CN113316943A (zh) * 2018-12-19 2021-08-27 弗劳恩霍夫应用研究促进协会 再现空间扩展声源的设备与方法、或从空间扩展声源生成比特流的设备与方法
JP2022515998A (ja) * 2018-12-19 2022-02-24 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 空間的に拡張された音源を再生するための装置および方法、または、空間的に拡張された音源からビットストリームを生成するための装置および方法
CN113316943B (zh) * 2018-12-19 2023-06-06 弗劳恩霍夫应用研究促进协会 再现空间扩展声源的设备与方法、或从空间扩展声源生成比特流的设备与方法
US11937068B2 (en) 2018-12-19 2024-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for reproducing a spatially extended sound source or apparatus and method for generating a bitstream from a spatially extended sound source
JP2023506700A (ja) * 2019-11-20 2023-02-20 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. パンニング済みオブジェクトスピーカーゲインとスプレッドオブジェクトスピーカーゲインとを使用する、オーディオオブジェクトレンダラー、スピーカーゲインを決定するための方法およびコンピュータプログラム

Also Published As

Publication number Publication date
WO2004036955A1 (en) 2004-04-29
AU2003269551A1 (en) 2004-05-04
US20070203598A1 (en) 2007-08-30
US20140010372A1 (en) 2014-01-09
EP1552724A1 (en) 2005-07-13
EP1552724A4 (en) 2010-10-20
JP4578243B2 (ja) 2010-11-10
US20060120534A1 (en) 2006-06-08
US8494666B2 (en) 2013-07-23

Similar Documents

Publication Publication Date Title
JP4578243B2 (ja) 空間性が拡張された音源を有する3次元音響シーンの生成及び消費方法
JP4499165B2 (ja) 空間性が拡張された音源を有する3次元音響シーンの生成及び消費方法
KR101004836B1 (ko) 오디오 신 내 사운드 소스의 와이드니스를 코딩 및디코딩하기 위한 방법
KR102659722B1 (ko) 공간 확장 음원을 재생하는 장치 및 방법 또는 공간 확장 음원으로부터 비트 스트림을 생성하는 장치 및 방법
CN115668985A (zh) 使用提示信息项合成空间扩展声源的设备和方法
KR20050084083A (ko) 오디오 신호의 구성 설명 방법
KR102654354B1 (ko) 객체-기반 공간 오디오 마스터링 디바이스 및 방법
CN114072792A (zh) 用于音频渲染的基于密码的授权
CN114630145A (zh) 一种多媒体数据合成方法、设备及存储介质
US20230007427A1 (en) Audio scene change signaling
JP2019514050A (ja) インタラクティブなオーディオメタデータの操作
CN110191745B (zh) 利用空间音频的游戏流式传输
RU2780536C1 (ru) Оборудование и способ для воспроизведения пространственно протяженного источника звука или оборудование и способ для формирования потока битов из пространственно протяженного источника звука
JP7399549B2 (ja) リモート端末向けの遠隔会議およびテレプレゼンスにおいてオーディオミキシングゲインをシグナリングする手法
CN109791770A (zh) 共享三维音频床
KR100626670B1 (ko) 잔향 처리를 위한 음향 장면 생성 및 소비 방법
Dantele et al. Implementation of mpeg-4 audio nodes in an interactive virtual 3d environment
KR20240096835A (ko) 공간 확장 음원을 사용하는 렌더러, 디코더, 인코더, 방법 및 비트스트림
KR20020039101A (ko) 멀티미디어 콘텐츠에서의 2차원 및 3차원 영상과 3차원음향의 영상/음향 실시간 처리 방법
JP2023066402A (ja) アコースティック環境間のオーディオ遷移のための方法および装置
KR20240096705A (ko) 분산 또는 공분산 데이터를 사용하여 공간 확장형 음원을 합성하는 장치, 방법 또는 컴퓨터 프로그램
KR20240091274A (ko) 기본 공간 섹터를 사용하여 공간 확장형 음원을 합성하는 장치, 방법 및 컴퓨터 프로그램
CN114128312A (zh) 用于低频效果的音频渲染
CN117981361A (zh) 信息处理设备、方法和程序
Schwark et al. Audiovisual Virtual Environments: Enabling Realtime Rendering of Early Reflections by Scene Graph Simplification

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070829

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071102

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20080201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080303

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080310

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20080627

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100414

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100419

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100514

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100519

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20100609

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100609

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100824

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130903

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4578243

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term