JP6360253B2 - サラウンドおよび/または高さスピーカーを含む再生環境におけるオーディオ・オブジェクトのレンダリング - Google Patents
サラウンドおよび/または高さスピーカーを含む再生環境におけるオーディオ・オブジェクトのレンダリング Download PDFInfo
- Publication number
- JP6360253B2 JP6360253B2 JP2017512352A JP2017512352A JP6360253B2 JP 6360253 B2 JP6360253 B2 JP 6360253B2 JP 2017512352 A JP2017512352 A JP 2017512352A JP 2017512352 A JP2017512352 A JP 2017512352A JP 6360253 B2 JP6360253 B2 JP 6360253B2
- Authority
- JP
- Japan
- Prior art keywords
- audio object
- speaker
- surround
- playback
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2400/00—Loudspeakers
- H04R2400/11—Aspects regarding the frame of loudspeaker transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/12—Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Stereophonic System (AREA)
Description
関連出願への相互参照
本願は2014年9月12日に出願されたスペイン国特許出願第P201431322号および2014年11月13日に出願された米国仮特許出願第62/079,265号の優先権を主張するものである。各出願の内容はここに参照によってその全体において組み込まれる。
本願は2014年9月12日に出願されたスペイン国特許出願第P201431322号および2014年11月13日に出願された米国仮特許出願第62/079,265号の優先権を主張するものである。各出願の内容はここに参照によってその全体において組み込まれる。
技術分野
本開示はオーディオ再生データのオーサリングおよびレンダリングに関する。特に、本開示は映画館サウンド再生システムのような再生環境のためのオーディオ再生データをオーサリングおよびレンダリングすることに関する。
本開示はオーディオ再生データのオーサリングおよびレンダリングに関する。特に、本開示は映画館サウンド再生システムのような再生環境のためのオーディオ再生データをオーサリングおよびレンダリングすることに関する。
1927年に映画に音声が導入されて以来、映画サウンドトラックの芸術的な意図を捉えてそれを映画館環境において再生するために使われる技術は着実に進歩を遂げてきた。1930年代にはディスク上の同期されたサウンドはフィルム上の可変領域サウンドに取って代わられ、それは1940年代にはさらに、劇場の音響の考察および改善されたスピーカー設計により改善された。それとともにマルチトラック録音および方向制御可能な再生(音を動かすために制御トーンを使う)の早期の導入があった。1950年代および1960年代には、フィルムの磁気ストライプにより劇場での多チャネル再生が可能になり、サラウンド・チャネル、高級なシアターでは5つのスクリーン・チャネルまでを導入した。
1970年代には、ドルビーは、ポストプロダクションおよびフィルム上の両方におけるノイズ削減を、3つのスクリーン・チャネルおよびモノのサラウンド・チャネルとの混合をエンコードおよび配布するコスト効率のよい手段とともに、導入した。映画館サウンドの品質は1980年代には、ドルビー・スペクトラル・レコーディング(SR: Spectral Recording)ノイズ削減およびTHXのような認証プログラムによってさらに改善された。ドルビーは1990年代に、離散的な左、中央および右スクリーン・チャネル、左および右のサラウンド・アレイおよび低域効果のためのサブウーファー・チャネルを与える5.1チャネル・フォーマットをもって映画館にデジタル・サウンドをもたらした。2010年に導入されたドルビー・サラウンド7.1は、既存の左および右サラウンド・チャネルを四つの「ゾーン」に分割することによって、サラウンド・チャネルの数を増やした。
チャネル数が増え、スピーカー・レイアウトが平面的な二次元(2D)アレイから高さを含む三次元(3D)アレイに遷移するにつれ、サウンドをオーサリングおよびレンダリングするタスクはますます複雑になってきている。改善された方法および装置が望ましいであろう
V. Pulkki、Compensating Displacement of Amplitude-Panned Virtual Sources、Audio Engineering Society (AES) International Conference on Virtual, Synthetic and Entertainment Audio
本開示に記載される主題のいくつかの側面は、いかなる特定の再生環境をも参照することなく生成されるオーディオ・オブジェクトを含むオーディオ再生データをレンダリングするためのツールにおいて実装されることができる。本稿での用法では、用語「オーディオ・オブジェクト」は、オーディオ・オブジェクト信号および関連するオーディオ・オブジェクト・メタデータのストリームを指してもよい。メタデータは、少なくともオーディオ・オブジェクトの位置を示してもよい。しかしながら、メタデータは、脱相関データ、レンダリング制約条件データ、コンテンツ型データ(たとえばダイアログ、効果など)、利得データ、軌跡データなども示してもよい。いくつかのオーディオ・オブジェクトは静的であってもよく、一方、他のオーディオ・オブジェクトは時間変化するメタデータを有していてもよい:そのようなオーディオ・オブジェクトは、動いてもよく、サイズを変えてもよく、および/または時間とともに変化する他の属性を有していてもよい。
オーディオ・オブジェクトが再生環境においてモニタリングまたは再生されるとき、オーディオ・オブジェクトは、少なくともオーディオ・オブジェクト位置データに従ってレンダリングされてもよい。レンダリング・プロセスは、出力チャネルの集合の各チャネルについての一組のオーディオ・オブジェクト利得値を計算することに関わっていてもよい。各出力チャネルは、再生環境の一つまたは複数の再生スピーカーに対応していてもよい。よって、レンダリング・プロセスは、少なくとも部分的にはオーディオ・オブジェクト・メタデータに基づいてオーディオ・オブジェクトを一つまたは複数のスピーカー・フィード信号にレンダリングすることに関わってもよい。スピーカー・フィード信号は、再生環境内の再生スピーカー位置に対応してもよい。
本稿で詳細に述べるように、いくつかの実装では、方法が、オーディオ・オブジェクトを含むオーディオ・データを受領することに関わってもよい。オーディオ・オブジェクトは、オーディオ・オブジェクト信号および関連するオーディオ・オブジェクト・メタデータを含んでいてもよい。オーディオ・オブジェクト・メタデータは、少なくとも、オーディオ・オブジェクト位置データを含んでいてもよい。本方法は、再生環境における再生スピーカー数の指示と、再生環境内の再生スピーカー位置の指示とを含んでいてもよい再生環境データを受領することに関わっていてもよい。本方法は、少なくとも部分的にはオーディオ・オブジェクト・メタデータに基づいて、オーディオ・オブジェクトを一つまたは複数のスピーカー・フィード信号にレンダリングすることに関わっていてもよい。各スピーカー・フィード信号は再生環境内の再生スピーカーのうちの少なくとも一つに対応してもよい。
レンダリングは、少なくとも部分的にはオーディオ・オブジェクトについてのオーディオ・オブジェクト位置データに基づいて、そのためにスピーカー・フィード信号がレンダリングされる複数の再生スピーカーを決定することに関わっていてもよい。レンダリングは、少なくとも部分的にはそのためにスピーカー・フィード信号がレンダリングされる前記複数の再生スピーカーのうちの少なくとも一つの再生スピーカーがサラウンド・スピーカーまたは高さスピーカーであるかどうかに基づいて、前記オーディオ・オブジェクトに対応するオーディオ・オブジェクト信号に適用する脱相関の量を決定することに関わっていてもよい。脱相関は、オーディオ信号と該オーディオ信号の脱相関されたバージョンとを混合することに関わっていてもよい。
いくつかの実装によれば、そのためにスピーカー・フィード信号がレンダリングされる前記複数の再生スピーカーのうちのどの再生スピーカーもサラウンド・スピーカーまたは高さスピーカーではない場合には、適用すべき脱相関の量を決定することは、脱相関が適用されないことを決定することに関わっていてもよい。いくつかの例では、適用すべき脱相関の量を決定することは、少なくとも部分的には、前記オーディオ・オブジェクトに対応するオーディオ・オブジェクト位置データに基づいていてもよい。
いくつかの実装では、前記オーディオ・オブジェクトの少なくともいくつかに関連する前記オーディオ・オブジェクト・メタデータは、適用すべき脱相関の前記量に関する情報を含んでいてもよい。代替的または追加的に、適用すべき脱相関の量を決定することは、少なくとも部分的には、ユーザー定義のパラメータに基づいていてもよい。
前記オーディオ・オブジェクトの少なくともいくつかは、静的なオーディオ・オブジェクトであってもよい。しかしながら、前記オーディオ・オブジェクトの少なくともいくつかは、時間変化する位置データのような時間変化するメタデータを有する動的なオーディオ・オブジェクトであってもよい。
いくつかの例では、前記再生環境は、映画館サウンド・システム環境またはホームシアター環境であってもよい。前記再生環境はたとえば、ドルビー・サラウンド5.1配位またはドルビー・サラウンド7.1配位を含んでいてもよい。前記再生環境がドルビー・サラウンド5.1配位を含むいくつかの実装では、適用すべき脱相関の量を決定することは、オーディオ・オブジェクトのレンダリングが左前方/左サラウンド・スピーカー対または右前方/右サラウンド・スピーカー対の間のパンに関わるかどうかを決定することに関わっていてもよい。前記再生環境がドルビー・サラウンド7.1配位を含むいくつかの実装では、適用すべき脱相関の量を決定することは、オーディオ・オブジェクトのレンダリングが左前方/左側方サラウンド・スピーカー対、左側方サラウンド/左後方サラウンド・スピーカー対、右前方/右側方サラウンド・スピーカー対または右側方サラウンド/右後方サラウンド・スピーカー対の間のパンに関わるかどうかを決定することに関わっていてもよい。
本開示の少なくともいくつかの側面は、インターフェース・システムおよび論理システムを含む装置において実装されてもよい。論理システムは、汎用単一チップもしくはマルチチップ・プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲート・アレイ(FPGA)または他のプログラム可能型論理デバイス、離散的なゲートもしくはトランジスタ論理または離散的なハードウェア・コンポーネントのうちの少なくとも一つを含んでいてもよい。インターフェース・システムはネットワーク・インターフェースを含んでいてもよい。いくつかの実装では、本装置はメモリ・システムを含んでいてもよい。インターフェース・システムは、論理システムとメモリ・システムの少なくとも一部(たとえば少なくとも一つのメモリ・デバイス)との間のインターフェースを含んでいてもよい。
論理システムは、インターフェース・システムを介して、オーディオ・オブジェクトを含むオーディオ・データを受領できてもよい。オーディオ・オブジェクトは、オーディオ・オブジェクト信号および関連するオーディオ・オブジェクト・メタデータを含んでいてもよい。オーディオ・オブジェクト・メタデータは、少なくとも、オーディオ・オブジェクト位置データを含んでいてもよい。
論理システムは、再生環境における再生スピーカー数の指示と、再生環境内の再生スピーカー位置の指示とを含む再生環境データを受領することができてもよい。論理システムは、少なくとも部分的にはオーディオ・オブジェクト・メタデータに基づいて、オーディオ・オブジェクトを一つまたは複数のスピーカー・フィード信号にレンダリングすることができてもよい。各スピーカー・フィード信号は再生環境内の再生スピーカーのうちの少なくとも一つに対応してもよい。
レンダリングは、少なくとも部分的にはオーディオ・オブジェクトについてのオーディオ・オブジェクト位置データに基づいて、そのためにスピーカー・フィード信号がレンダリングされる複数の再生スピーカーを決定することに関わっていてもよい。レンダリングは、少なくとも部分的にはそのためにスピーカー・フィード信号がレンダリングされる前記複数の再生スピーカーのうちの少なくとも一つの再生スピーカーがサラウンド・スピーカーまたは高さスピーカーであるかどうかに基づいて、前記オーディオ・オブジェクトに対応するオーディオ・オブジェクト信号に適用する脱相関の量を決定することに関わっていてもよい。
いくつかの実装では、そのためにスピーカー・フィード信号がレンダリングされる前記複数の再生スピーカーのうちのどの再生スピーカーもサラウンド・スピーカーまたは高さスピーカーではない場合には、適用すべき脱相関の量を決定することは、脱相関が適用されないことを決定することに関わっていてもよい。いくつかの例では、適用すべき脱相関の量を決定することは、少なくとも部分的には、前記オーディオ・オブジェクトに対応するオーディオ・オブジェクト位置データに基づいていてもよい。いくつかの実装では、前記オーディオ・オブジェクトの少なくともいくつかに関連する前記オーディオ・オブジェクト・メタデータは、適用すべき脱相関の前記量に関する情報を含んでいてもよい。代替的または追加的に、適用すべき脱相関の量を決定することは、少なくとも部分的には、ユーザー定義のパラメータに基づいていてもよい。脱相関は、オーディオ信号と該オーディオ信号の脱相関されたバージョンとを混合することに関わっていてもよい。
前記オーディオ・オブジェクトの少なくともいくつかは、静的なオーディオ・オブジェクトであってもよい。しかしながら、前記オーディオ・オブジェクトの少なくともいくつかは、時間変化する位置データのような時間変化するメタデータを有する動的なオーディオ・オブジェクトであってもよい。
いくつかの例では、前記再生環境は、映画館サウンド・システム環境またはホームシアター環境であってもよい。前記再生環境はドルビー・サラウンド5.1配位またはドルビー・サラウンド7.1配位を含んでいてもよい。前記再生環境がドルビー・サラウンド5.1配位を含むいくつかの実装では、適用すべき脱相関の量を決定することは、オーディオ・オブジェクトのレンダリングが左前方/左サラウンド・スピーカー対または右前方/右サラウンド・スピーカー対の間のパンに関わるかどうかを決定することに関わっていてもよい。前記再生環境がドルビー・サラウンド7.1配位を含むいくつかの実装では、適用すべき脱相関の量を決定することは、オーディオ・オブジェクトのレンダリングが左前方/左側方サラウンド・スピーカー対、左側方サラウンド/左後方サラウンド・スピーカー対、右前方/右側方サラウンド・スピーカー対または右側方サラウンド/右後方サラウンド・スピーカー対の間のパンに関わるかどうかを決定することに関わっていてもよい。
本稿に記載される方法の一部または全部は、非一時的媒体に記憶される命令(たとえばソフトウェア)に従って一つまたは複数の装置によって実行されてもよい。そのような非一時的媒体は、ランダム・アクセス・メモリ(RAM)デバイス、読み出し専用メモリ(ROM)デバイスなどを含むがそれに限られない、本稿に記載されるようなメモリ・デバイスを含んでいてもよい。たとえば、ソフトウェアは、一つまたは複数のオーディオ・オブジェクトを含むオーディオ・データを受領するよう一つまたは複数の装置を制御するための命令を含んでいてもよい。オーディオ・オブジェクトは、オーディオ・オブジェクト信号および関連するオーディオ・オブジェクト・メタデータを含んでいてもよい。オーディオ・オブジェクト・メタデータは、少なくとも、オーディオ・オブジェクト位置データを含んでいてもよい。
本ソフトウェアは、再生環境における再生スピーカー数の指示と、再生環境内の再生スピーカー位置の指示とを含む再生環境データを受領し、少なくとも部分的にはオーディオ・オブジェクト・メタデータに基づいて、オーディオ・オブジェクトを一つまたは複数のスピーカー・フィード信号にレンダリングするための命令を含んでいてもよい。ここで、各スピーカー・フィード信号は再生環境内の再生スピーカーのうちの少なくとも一つに対応する。レンダリングは、少なくとも部分的にはオーディオ・オブジェクトについてのオーディオ・オブジェクト位置データに基づいて、そのためにスピーカー・フィード信号がレンダリングされる複数の再生スピーカーを決定し、少なくとも部分的にはそのためにスピーカー・フィード信号がレンダリングされる前記複数の再生スピーカーのうちの少なくとも一つの再生スピーカーがサラウンド・スピーカーまたは高さスピーカーであるかどうかに基づいて、前記オーディオ・オブジェクトに対応するオーディオ・オブジェクト信号に適用する脱相関の量を決定することに関わっていてもよい。
そのためにスピーカー・フィード信号がレンダリングされる前記複数の再生スピーカーのうちのどの再生スピーカーもサラウンド・スピーカーまたは高さスピーカーではない場合には、適用すべき脱相関の量を決定することは、脱相関が適用されないことを決定することに関わっていてもよい。いくつかの例では、適用すべき脱相関の量を決定することは、少なくとも部分的には、前記オーディオ・オブジェクトに対応するオーディオ・オブジェクト位置データに基づいていてもよい。いくつかの実装では、前記オーディオ・オブジェクトの少なくともいくつかに関連する前記オーディオ・オブジェクト・メタデータは、適用すべき脱相関の前記量に関する情報を含んでいてもよい。代替的または追加的に、適用すべき脱相関の量を決定することは、少なくとも部分的には、ユーザー定義のパラメータに基づいていてもよい。脱相関は、オーディオ信号と該オーディオ信号の脱相関されたバージョンとを混合することに関わっていてもよい。
前記オーディオ・オブジェクトの少なくともいくつかは、静的なオーディオ・オブジェクトであってもよい。しかしながら、前記オーディオ・オブジェクトの少なくともいくつかは、時間変化する位置データのような時間変化するメタデータを有する動的なオーディオ・オブジェクトであってもよい。
いくつかの例では、前記再生環境は、映画館サウンド・システム環境またはホームシアター環境であってもよい。前記再生環境はたとえば、ドルビー・サラウンド5.1配位またはドルビー・サラウンド7.1配位を含んでいてもよい。前記再生環境がドルビー・サラウンド5.1配位を含むいくつかの実装では、適用すべき脱相関の量を決定することは、オーディオ・オブジェクトのレンダリングが左前方/左サラウンド・スピーカー対または右前方/右サラウンド・スピーカー対の間のパンに関わるかどうかを決定することに関わっていてもよい。前記再生環境がドルビー・サラウンド7.1配位を含むいくつかの実装では、適用すべき脱相関の量を決定することは、オーディオ・オブジェクトのレンダリングが左前方/左側方サラウンド・スピーカー対、左側方サラウンド/左後方サラウンド・スピーカー対、右前方/右側方サラウンド・スピーカー対または右側方サラウンド/右後方サラウンド・スピーカー対の間のパンに関わるかどうかを決定することに関わっていてもよい。
本明細書に記載される主題の一つまたは複数の実装の詳細は、付属の図面および以下の説明において記載される。他の特徴、側面および利点が該説明、図面および請求項から明白となるであろう。以下の図面の相対的な寸法は縮尺通りに描かれていないことがあることを注意しておく。
以下の記述は、本開示のいくつかの革新的な側面およびこれら革新的な側面が実装されうるコンテキストの例を記述する目的のためのある種の実装に向けられる。しかしながら、本稿の教示はさまざまな異なる仕方で適用されることができる。たとえば、さまざまな実装が具体的な再生環境を使って記述されているが、本稿の教示は他の既知の再生環境および将来導入されうる再生環境に広く適用可能である。さらに、記載される実装はさまざまなオーサリングおよび/またはレンダリング・ツールにおいて実装されてもよく、それらは多様なハードウェア、ソフトウェア、ファームウェア等で実装されてもよい。したがって、本開示の教示は、図面に示されるおよび/または本稿で記述される実装に限定されることは意図されておらず、むしろ広い適用可能性をもつものである。
図1は、ドルビー・サラウンド5.1配位をもつ再生環境の例を示している。ドルビー・サラウンド5.1は1990年代に開発されたが、この配位はいまだ広く映画館サウンド・システム環境に配備されている。プロジェクター105は、たとえば映画のためのビデオ画像をスクリーン150に投影するよう構成されていてもよい。オーディオ再生データは、該ビデオ画像と同期され、サウンド・プロセッサ110によって処理されてもよい。電力増幅器115はスピーカー・フィード信号を再生環境100のスピーカーに与えてもよい。
ドルビー・サラウンド5.1配位は、左サラウンド・アレイ120、右サラウンド・アレイ125を含み、そのそれぞれは単一チャネルによって集団駆動されるスピーカーの群を含む。ドルビー・サラウンド5.1配位は左スクリーン・チャネル130、中央スクリーン・チャネル135および右スクリーン・チャネル140についての別個のチャネルをも含む。サブウーファー145についての別個のチャネルが低域効果(LFE: low-frequency effects)のために提供される。
2010年に、ドルビーはドルビー・サラウンド7.1を導入することによってデジタル映画館サウンドに対する向上を提供した。図2は、ドルビー・サラウンド7.1配位をもつ再生環境の例を示している。デジタル・プロジェクター205はデジタル・ビデオ・データを受領し、ビデオ画像をスクリーン150上に投影するよう構成されていてもよい。オーディオ再生データは、サウンド・プロセッサ210によって処理されてもよい。電力増幅器215がスピーカー・フィード信号を再生環境200のスピーカーに提供してもよい。
ドルビー・サラウンド7.1配位は、左側方サラウンド・アレイ220および右側方サラウンド・アレイ225を含み、そのそれぞれは単一チャネルによって駆動されてもよい。ドルビー・サラウンド5.1と同様に、ドルビー・サラウンド7.1配位は左スクリーン・チャネル230、中央スクリーン・チャネル235、右スクリーン・チャネル240およびサブウーファー245のための別個のチャネルを含む。しかしながら、ドルビー・サラウンド7.1は、ドルビー・サラウンド5.1の左および右のサラウンド・チャネルを四つのゾーンに分割することによって、サラウンド・チャネルの数を増す。すなわち、左側方サラウンド・アレイ220および右側方サラウンド・アレイ225に加えて、左後方サラウンド・スピーカー224および右後方サラウンド・スピーカー226のために別個のチャネルが含まれる。再生環境200内のサラウンド・ゾーンの数を増すことは、音の定位を著しく改善できる。
より没入的な環境を生成しようとする努力において、いくつかの再生環境は、増加した数のチャネルによって駆動される増加した数のスピーカーをもって構成されることがある。さらに、いくつかの再生環境は、さまざまな高さに配備されるスピーカーを含むことがあり、そのような高さの一部は再生環境の座席領域より上方であることがある。
図3のAおよびBは、高さスピーカー配位を含むホームシアター再生環境の二つの例を示している。これらの例では、再生環境300aおよび300bは、左サラウンド・スピーカー322、右サラウンド・スピーカー327、左スピーカー332、右スピーカー342、中央スピーカー337およびサブウーファー145を含むドルビー・サラウンド5.1配位の主な特徴を含む。しかしながら、再生環境300は、高さスピーカーのためのドルビー・サラウンド5.1配位の拡張を含み、これはドルビー・サラウンド5.1.2配位と称されることがある。
図3のAは、ホームシアター再生環境の天井360に取り付けられた高さスピーカーをもつ再生環境の例を示している。この例では、再生環境300aは、左上中間(Ltm: left top middle)位置にある高さスピーカー352および右上中間(Rtm: right top middle)位置にある高さスピーカー357を含んでいる。図3のBに示される例では、左スピーカー332および右スピーカー342は、天井360から音を反射させるよう構成されたドルビー・エレベーション(Dolby Elevation)・スピーカーである。適正に構成されれば、反射音は、聴取者365によって、あたかも音源が天井360から発しているかのように知覚されうる。しかしながら、スピーカーの数および配位は単に例として与えられている。いくつかの現行のホームシアター実装は、34個までのスピーカー位置を提供しており、構想されているホームシアター実装はさらに多くのスピーカー位置を許容することがありうる。
よって、現在のトレンドは、より多くのスピーカーおよびより多くのチャネルを含めるだけでなく、異なる高さのスピーカーをも含めるものである。チャネルの数が増し、スピーカー・レイアウトが2Dアレイから3Dアレイに移行するにつれて、サウンドを位置決めし、レンダリングするタスクはますます難しくなる。よって、本願の被譲渡者は、3Dオーディオ・サウンド・システムのための機能を高めるおよび/またはオーサリング複雑さを軽減する、さまざまなツールおよび関連するユーザー・インターフェースを開発した。
図4Aは、仮想再生環境におけるさまざまな高さにあるスピーカー・ゾーンを描くグラフィカル・ユーザー・インターフェース(GUI)の例を示している。GUI 400はたとえば、論理システムからの命令に従って、ユーザー入力装置から受領される信号に従って、などにより表示装置上に表示されてもよい。いくつかのそのような装置は図9を参照して後述する。
仮想再生環境404のような仮想再生環境への言及に関する本稿での用法では、用語「スピーカー・ゾーン」は概括的に、実際の再生環境の再生スピーカーと一対一対応があってもなくてもよい論理的な構造体を指す。たとえば、「スピーカー・ゾーン位置」は、映画館再生環境の特定の再生スピーカー位置に対応してもしなくてもよい。その代わり、用語「スピーカー・ゾーン位置」は概括的に、仮想再生環境のゾーンを指してもよい。いくつかの実装では、仮想再生環境のスピーカー・ゾーンは、たとえば、二チャネル・ステレオ・ヘッドホンの組を使ってリアルタイムで仮想サラウンド・サウンド環境を生成するドルビー・ヘッドホン(商標)(時にモバイル・サラウンド(商標)と称される)のような仮想化技術の使用を通じて、仮想スピーカーに対応してもよい。GUI 400には、第一の高さに七つのスピーカー・ゾーン402aがあり、第二の高さに二つのスピーカー・ゾーン402bがあり、仮想再生環境404内のスピーカー・ゾーンは合計九つとなっている。この例では、スピーカー・ゾーン1〜3は仮想再生環境404の前方領域405にある。前方領域405はたとえば、映画館再生環境の、スクリーン150が位置する領域、家庭の、テレビジョン・スクリーンが位置する領域などに対応してもよい。
ここで、スピーカー・ゾーン4は概括的には左領域410のスピーカーに対応し、スピーカー・ゾーン5は仮想再生環境404の右領域415のスピーカーに対応する。スピーカー・ゾーン6は左後方領域412に対応し、スピーカー・ゾーン7は仮想再生環境404の右後方領域414に対応する。スピーカー・ゾーン8は上領域420aのスピーカーに対応し、スピーカー・ゾーン9は上領域420bのスピーカーに対応し、これは、図5Dおよび5Eに示される仮想天井520の領域のような仮想天井領域であってもよい。したがって、図4Aに示されるスピーカー・ゾーン1〜9の位置は実際の再生環境の再生スピーカーの位置に対応してもしなくてもよい。さらに、他の実装はより多数またはより少数のスピーカー・ゾーンおよび/または高さを含んでいてもよい。
さまざまな実装において、GUI 400のようなユーザー・インターフェースが、オーサリング・ツールおよび/またはレンダリング・ツールの一部として使用されてもよい。いくつかの実装では、オーサリング・ツールおよび/またはレンダリング・ツールは、一つまたは複数の非一時的な媒体上に記憶されるソフトウェアを介して実装されてもよい。オーサリング・ツールおよび/またはレンダリング・ツールは、(少なくとも部分的には)図9を参照して後述する論理システムおよび他の装置のようなハードウェア、ファームウェアなどによって実装されてもよい。いくつかのオーサリング実装では、関連するオーサリング・ツールが関連するオーディオ・データについてのメタデータを生成するために使用されてもよい。メタデータは、たとえば、三次元空間におけるオーディオ・オブジェクトの位置および/または軌跡を示すデータ、スピーカー・ゾーン制約条件データなどを含んでいてもよい。メタデータは、実際の再生環境の特定のスピーカー・レイアウトに関してではなく、仮想再生環境404のスピーカー・ゾーン402に関して生成されてもよい。レンダリング・ツールは、オーディオ・データおよび関連するメタデータを受領してもよく、再生環境のためのオーディオ利得およびスピーカー・フィード信号を計算してもよい。そのようなオーディオ利得およびスピーカー・フィード信号は、振幅パン・プロセスに従って計算されてもよい。振幅パン・プロセスは、音が再生環境中の位置Pから来ているような知覚を創り出すことができるものである。たとえば、スピーカー・フィード信号は、次式
xi(t)=gix(t) i=1,…,N (式1)
に従って再生環境の再生スピーカー1ないしNに与えられてもよい。
xi(t)=gix(t) i=1,…,N (式1)
に従って再生環境の再生スピーカー1ないしNに与えられてもよい。
式(1)において、xi(t)はスピーカーiに加えられるスピーカー・フィード信号を表し、giは対応するチャネルの利得因子を表し、x(t)はオーディオ信号を表し、tは時間を表す。利得因子はたとえばここに参照により組み込まれる非特許文献1のSection 2、pp.3-4に記載される振幅パン方法(amplitude panning methods)に従って決定されてもよい。いくつかの実装では、利得は周波数依存であってもよい。いくつかの実装では、x(t)をx(t−Δt)で置き換えることによって時間遅延が導入されてもよい。
いくつかのレンダリング実装では、スピーカー・ゾーン402を参照して生成されたオーディオ再生データは、ドルビー・サラウンド5.1配位、ドルビー・サラウンド7.1配位、浜崎22.2配位または他の配位であってもよい幅広い範囲の再生環境のスピーカー位置にマッピングされうる。たとえば、図2を参照するに、レンダリング・ツールは、スピーカー・ゾーン4および5についてのオーディオ再生データを、ドルビー・サラウンド7.1配位をもつ再生環境の左側方サラウンド・アレイ220および右側方サラウンド・アレイ225にマッピングしてもよい。スピーカー・ゾーン1、2および3についてのオーディオ再生データは、それぞれ左スクリーン・チャネル230、右スクリーン・チャネル240および中央スクリーン・チャネル235にマッピングされてもよい。スピーカー・ゾーン6および7についてのオーディオ再生データは、左後方サラウンド・スピーカー224および右後方サラウンド・スピーカー226にマッピングされてもよい。
図4Bは、別の再生環境の例を示している。いくつかの実装では、レンダリング・ツールは、スピーカー・ゾーン1、2および3についてのオーディオ再生データを再生環境450の対応するスクリーン・スピーカー455にマッピングしてもよい。レンダリング・ツールは、スピーカー・ゾーン4および5についてのオーディオ再生データを、左側方サラウンド・アレイ460および右側方サラウンド・アレイ465にマッピングしてもよく、スピーカー・ゾーン8および9についてのオーディオ再生データを、左頭上スピーカー470aおよび右頭上スピーカー470bにマッピングしてもよい。スピーカー・ゾーン6および7についてのオーディオ再生データは、左後方サラウンド・スピーカー480aおよび右後方サラウンド・スピーカー480bにマッピングされてもよい。
いくつかのオーサリング実装では、オーサリング・ツールは、オーディオ・オブジェクトについてのメタデータを生成するために使われてもよい。上記のように、用語「オーディオ・オブジェクト」は、オーディオ・データ信号および関連するメタデータのストリームを指してもよい。メタデータは、オーディオ・オブジェクトの3D位置、オーディオ・オブジェクトのみかけのサイズ、レンダリング制約条件およびコンテンツ型(たとえばダイアログ、効果)などを指示してもよい。実装に依存して、メタデータは、利得データ、軌跡データなどの他の型のデータを含んでいてもよい。いくつかのオーディオ・オブジェクトは静的であってもよく、一方、他のオーディオ・オブジェクトは動いてもよい。オーディオ・オブジェクトは、所与の時点における三次元空間内でのオーディオ・オブジェクトの位置などを示しうる関連するメタデータに従ってオーサリングまたはレンダリングされうる。オーディオ・オブジェクトが再生環境においてモニタリングまたは再生されるとき、オーディオ・オブジェクトは、位置およびサイズ・メタデータに従って、再生環境の再生スピーカー・レイアウトに応じてレンダリングされうる。
図5のAおよびBは、再生環境における左/右パンおよび前/後パンの例を示している。再生環境500内のスピーカーの位置、スピーカーの数などは単に例として示されている。本開示の他の図面と同様に、図5のAおよびBの要素は必ずしも縮尺通りに描かれていない。示されている要素間の相対的な距離、角度などは例示として示されている。
この例では、再生環境500は、左スピーカー505、右スピーカー510、左サラウンド・スピーカー515、右サラウンド・スピーカー520、左高さスピーカー525および右高さスピーカー530を含む。聴取者の頭535は再生環境500の前方領域のほうを向いている。代替的な諸実装は中央スピーカー501をも含んでいてもよい。
この例では、左スピーカー505、右スピーカー510、左サラウンド・スピーカー515および右サラウンド・スピーカー520はみなxy平面内に位置している。この例では、左スピーカー505および右スピーカー510はx軸に沿って位置され、一方、左スピーカー505および左サラウンド・スピーカー515はy軸に沿って位置されている。ここで、左高さスピーカー525および右高さスピーカー530は聴取者の頭535より上方、xy平面から高さzのところに位置されている。この例では、左高さスピーカー525および右高さスピーカー530は再生環境500の天井に取り付けられている。
図5のAに示した例では、左スピーカー505および右スピーカー510は、再生環境500における位置Pに位置されるオーディオ・オブジェクト545に対応する音を発している。この例では、位置Pは聴取者の頭535の前方の、やや右側にある。ここで、Pもx軸に沿って位置する。
たとえば、レンダリング・ツールは、オーディオ・データと、オーディオ・オブジェクト位置データを含むオーディオ・オブジェクト545についての関連するオーディオ・オブジェクト・メタデータとを受領していてもよく、オーディオ・オブジェクト545に対応する音源が位置Pにあるという知覚を作り出すために、左スピーカー505および右スピーカー510についてのオーディオ利得およびスピーカー・フィード信号を、振幅パン・プロセスに従って計算していてもよい。そのような音源は本稿では「ファントム像」または「ファントム源」と称されることがある。
数学的には、レンダリングまたはパン動作は次式によって記述できる:
si(t)=Σjgi,j(t)xj(t) (式2)
式(2)において、gi,j(t)は一組の時間変化するパン利得を表わし、x(t)は一組のオーディオ・オブジェクト信号を表わし、si(t)は結果として得られる一組のスピーカー・フィード信号を表わす。この定式化において、添え字iはスピーカーに対応し、添え字jはオーディオ・オブジェクト・インデックスである。いくつかの例では、パン利得gi,j(t)は次のように表現されうる:
gi,j(t)=F(P,Mj(t)) (式3)
式(3)において、Pはスピーカー位置Piをもつ一組のスピーカーを表わし、Mj(t)は時間変化するオーディオ・オブジェクト・メタデータを表わし、Fは、本稿でパン・アルゴリズムまたはパン方法とも称されるパン則を表わす。幅広い範囲のパン方法Fが当業者には知られており、正弦‐余弦パン則、正接パン則および正弦パン則NSを含むがそれに限られない。さらに、二次元および三次元パンについて、ベクトル・ベースの振幅パン(VBAP: vector-based amplitude panning)のようなマルチチャネル・パン則が提案されている。
si(t)=Σjgi,j(t)xj(t) (式2)
式(2)において、gi,j(t)は一組の時間変化するパン利得を表わし、x(t)は一組のオーディオ・オブジェクト信号を表わし、si(t)は結果として得られる一組のスピーカー・フィード信号を表わす。この定式化において、添え字iはスピーカーに対応し、添え字jはオーディオ・オブジェクト・インデックスである。いくつかの例では、パン利得gi,j(t)は次のように表現されうる:
gi,j(t)=F(P,Mj(t)) (式3)
式(3)において、Pはスピーカー位置Piをもつ一組のスピーカーを表わし、Mj(t)は時間変化するオーディオ・オブジェクト・メタデータを表わし、Fは、本稿でパン・アルゴリズムまたはパン方法とも称されるパン則を表わす。幅広い範囲のパン方法Fが当業者には知られており、正弦‐余弦パン則、正接パン則および正弦パン則NSを含むがそれに限られない。さらに、二次元および三次元パンについて、ベクトル・ベースの振幅パン(VBAP: vector-based amplitude panning)のようなマルチチャネル・パン則が提案されている。
聴取者の脳は、音源を定位するために、振幅の差ならびにスペクトルおよびタイミング手がかりを使うことができる。図5のAの例のように、音源の左/右位置を決定するために、聴取者の聴覚系は両耳間時間差(ITD: interaural time differences)および両耳間レベル差(ILD: interaural level difference)を解析してもよい。
ここで、たとえば、左スピーカー505から音は聴取者の左耳540aに、聴取者の右耳540bより先に到達する。聴取者の聴覚系および脳は低周波数(たとえば800Hz未満)での位相遅延および高周波数(たとえば1600Hz超)での群遅延からITDを評価しうる。一部の人は10マイクロ秒以下の両耳間時間差を認識できる。
頭の陰または音響的な陰は、音が頭によって妨害されることにより音の振幅が低減した領域である。音は、耳に到達するために、頭の中またはまわりを通ってきたことがありうる。図5のAに示される例では、右スピーカー510からの音は、少なくとも聴取者の頭535が聴取者の左耳540aを陰にしているため、聴取者の左耳540aにおけるよりも聴取者の右耳540bにおいて高いレベルをもつであろう。頭の陰によって引き起こされるILDは一般に周波数依存である。すなわち、ILD効果は典型的には周波数が増すと増大する。
頭の陰の効果は全体的な強度の有意な減衰を引き起こしうるだけでなく、フィルタリング効果をも引き起こすことがありうる。頭の陰になることによるこうしたフィルタリング効果は、音の定位の本質的な要素であることがある。聴取者の脳は、聴取者の左右の耳に聞こえる音の相対的な振幅、音色および位相を評価してもよく、そのような相違に従って音源のみかけの位置を決定しうる。一部の聴取者は、聴取者の前方にある音源について約1度の精度で音源のみかけの位置を決定できてもよい。パン・アルゴリズムは、聴取者の前方のオーディオ・オブジェクト位置のきわめて効果的なレンダリングを生じるために、たとえば再生環境500のx軸に沿ったオーディオ・オブジェクト位置および/または動きのために、上記の聴覚効果を活用できる。
しかしながら、聴取者は一般に、聴取者の側方に沿った音源についての音の定位については、ずっと低いレベルの精度をもつ。横の音源についての典型的な音の定位の精度は約15度の範囲内である。この、より低い精度は、少なくとも部分的には、ITDおよびILDのような両耳手がかりの相対的な少なさによって引き起こされる。したがって、聴取者の側方に位置される(または横の軌跡に沿って動いている)オーディオ・オブジェクトの成功裏のパンは、聴取者の前方に位置するオーディオ・オブジェクトをパンすることよりも、相対的により困難でありうる。たとえば、知覚されるファントム源位置は曖昧であることがあり、あるいは意図された音位置とは非常に異なることがありうる。
聴取者の横に位置されるオーディオ・オブジェクトをパンすることは、さらなる困難を呈することがある。図5のBを参照するに、左スピーカー505および左サラウンド・スピーカー515は、位置P'を有するオーディオ・オブジェクト545に対応する音をレンダリングしているものとして示されている。聴取者の頭535は位置AとBの間で動くものとして示されている。左スピーカー505および左サラウンド・スピーカー515からの実線の矢印は、聴取者の頭535が位置Aにあるときの聴取者の左耳540aに到達する音を表わし、一方、破線の矢印は、聴取者の頭535が位置Bにあるときの聴取者の左耳540aに到達する音を表わす。
この例では、位置Aは再生環境500の「スイートスポット」に対応し、ここでは左スピーカー505からの音波および左サラウンド・スピーカー515からの音波が両方とも聴取者の左耳540aまで実質的に同じ距離を進む。この距離は図5BではD1と表わされている。対応する音が左スピーカー505および左サラウンド・スピーカー515から聴取者の左耳540aまで進むために必要な時間は実質的に同じなので、聴取者の頭535がスイートスポットに位置されるときは、左スピーカー505および左サラウンド・スピーカー515は「遅延整列されて」おり、オーディオ・アーチファクトは生じない。
しかしながら、聴取者の頭535が位置Bに動くと、左スピーカー505からの音波は聴取者の左耳540aまで距離D2を進み、左サラウンド・スピーカー515からの音波は聴取者の左耳540aまで距離D3を進む。この例において、D2はD3より十分に大きく、位置Bにあるとき、聴取者の頭535はもはやスイートスポットにはない。聴取者の頭535が位置Bまたはスピーカーが遅延整列されない他の位置にあるとき、図5Bに示されるようなオーディオ・オブジェクトの前/後パンの間に、オーディオ信号の周波数内容における「櫛形」〔コーミング(combing)〕アーチファクト(本稿では櫛形フィルタ・ノッチおよびピークとも称される)が生じる。そのような櫛形アーチファクトは、位置P'におけるオーディオ・オブジェクト545に対応するもののようなファントム源の知覚される音色を損なうことがあるとともに、全体的なオーディオ・シーンの空間的広がり(spaciousness)のつぶれも引き起こすことがある。
再生環境における前/後パンについてのスイートスポットはしばしばきわめて小さい。よって、聴取者の頭の向きおよび位置の小さな変化でさえ、そのような櫛形フィルタ・ノッチおよびピークを周波数においてシフトさせることがある。たとえば、図5のBにおける聴取者がシートで前後に体をゆすっていたとすると、聴取者の頭535は位置AとBの間で動き、聴取者の頭535が位置Aにきたときは櫛形フィルタ・ノッチおよびピークが消失し、次いで聴取者の頭535が位置Bに、また位置Bから動く際に、周波数においてシフトしつつ再び現われる。
聴取者の頭が上下に動かされる場合にも同様の現象が起こりうる。図5のBを参照するに、オーディオ・オブジェクト545の位置P'が十分高い(この例では十分なz成分をもつ)場合、パン動作は左スピーカー505、左サラウンド・スピーカー515および左高さスピーカー525についてオーディオ利得およびスピーカー・フィード信号を計算することに関わっていてもよい。聴取者の頭535が上下に(たとえばz軸に沿ってまたは実質的にz軸に沿って)動かされたとしたら、櫛形フィルタ・ノッチおよびピークのようなオーディオ・アーチファクトが生じることがあり、周波数においてシフトすることがある。
本稿に記載されるいくつかの実装は、上述した問題への解決策を提供する。いくつかのそのような実装によれば、パン・プロセスの間にそのためにスピーカー・フィード信号が与えられるスピーカーがサラウンド・スピーカーであるかどうかに従って、選択的に脱相関が適用されてもよい。いくつかの実装では、脱相関は、そのようなスピーカーが高さスピーカーであるかどうかに従って選択的に適用されてもよい。いくつかの実装は、櫛形フィルタ・ノッチおよびピークのようなオーディオ・アーチファクトを低減あるいはさらには解消しうる。いくつかのそのような実装は、再生環境の「スイートスポット」のサイズを増大させることがある。
開示される実装は、追加的な潜在的恩恵をもつ。レンダリングされたコンテンツの(たとえばドルビー5.1からステレオへの)ダウンミックスは、前方およびサラウンド・スピーカーの間でパンされるオーディオ・オブジェクトの振幅または「レベル」における増大を引き起こすことがある。この効果は、パン・アルゴリズムが典型的にはエネルギー保存的であり、平方パン利得の和が1に等しいという事実から帰結する。本稿に開示されるいくつかの実装では、レンダリングされた信号をダウンミックスすることに関連する利得積み上がり(gain buildup)は、所与のオーディオ・オブジェクトについてのスピーカー信号の低減した相関のため、低減される。
ファントム源の知覚されるラウドネスはパン利得に依存し、よって知覚される位置に依存する。この位置依存性のラウドネスの理由は、たいていのパン・アルゴリズムはエネルギー保存的であるという事実のためでもある。しかしながら、特に低周波数での音響的な総和は、音響的な加算よりも電気的な加算のように振る舞う。複数のスピーカーの聴取者の耳までの遅延は実質的に同一であり、頭による陰にする効果はほとんどまたは全く起こらないからである。正味の結果は、スピーカー間でパンされるファントム像が一般に、同じ源が実際のスピーカーの一つにまたはその近くにパンされるときよりも大きいものと知覚されるということである。本稿に記載されるいくつかの実装では、動いているオブジェクトの知覚されるラウドネスは、空間的軌跡を通じてより一貫したものとなりうる。
図6は、本稿に記載されるさまざまな方法を実装することのできる装置のコンポーネントの例を与えるブロック図である。装置600はたとえば、劇場サウンド・システム、家庭サウンド・システムなど(またはその一部)であってもよい。いくつかの例では、本装置は別の装置のコンポーネントにおいて実装されてもよい。
この例では、装置600はインターフェース・システム605および論理システム610を含む。論理システム610は、汎用の単一チップまたは複数チップ・プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲート・アレイ(FPGA)または他のプログラム可能型論理デバイス、離散的なゲートもしくはトランジスタ論理および/または離散的なハードウェア・コンポーネントを含んでいてもよい。
この例では、装置600はメモリ・システム615を含む。メモリ・システム615は一つまたは複数の好適な型の非一時的な記憶媒体、たとえばフラッシュメモリ、ハードドライブなどを含んでいてもよい。インターフェース・システム605は、ネットワーク・インターフェース、論理システムとメモリ・システムとの間のインターフェース、および/または外部装置インターフェース(たとえばユニバーサル・シリアル・バス(USB)インターフェース)を含んでいてもよい。
この例では、論理システム160は、インターフェース・システム605を介してオーディオ・データおよび他の情報を受領することができる。いくつかの実装では、論理システム610は、レンダリング装置を含んでいてもよい(あるいは実装していてもよい)。よって、論理システム610は、本稿に記載される方法の一部または全部を実装できてもよい。
いくつかの実装では、論理システム610は、一つまたは複数の非一時的媒体に記憶されたソフトウェアに従って本稿に記載される方法の少なくとも一部を実行することができてもよい。非一時的媒体は、ランダム・アクセス・メモリ(RAM)および/または読み出し専用メモリ(ROM)のような、論理システム610に付随するメモリを含んでいてもよい。非一時的媒体は、メモリ・システム615のメモリを含んでいてもよい。
図7は、オーディオ処理動作の例を与える流れ図である。図7のブロック(および本稿で与える他の流れ図のブロック)はたとえば、図6の論理システム610によって、あるいは同様の装置によって実行されてもよい。本稿に記載される他の方法と同様に、図7で概説される方法は、示されるより多数または少数のブロックを含んでいてもよい。さらに、本稿に開示される方法のブロックは、必ずしも示される順序で実行されるのではない。
ここで、ブロック705は、オーディオ・オブジェクトを含むオーディオ・データを受領することに関わる。オーディオ・オブジェクトは、オーディオ・オブジェクト信号および関連するオーディオ・オブジェクト・メタデータを含んでいてもよい。オーディオ・オブジェクト・メタデータは、少なくとも、オーディオ・オブジェクト位置データを含んでいてもよい。ブロック705は、図6のインターフェース・システム605のようなインターフェース・システムを介してオーディオ・データを受領することに関わっていてもよい。よって、図7の諸ブロックは、図6の一つまたは複数の要素の実装を参照して記述されうる。
いくつかの例では、ブロック705において受領されるオーディオ・オブジェクトの少なくともいくつかは静的なオーディオ・オブジェクトであってもよい。しかしながら、オーディオ・オブジェクトの少なくともいくつかは、時間変化するオーディオ・オブジェクト・メタデータ、たとえば時間変化するオーディオ・オブジェクト位置データを示すオーディオ・オブジェクト・メタデータをもつ動的なオーディオ・オブジェクトであってもよい。
ブロック710は、再生環境における再生スピーカー数の指示と、再生環境内の再生スピーカー位置の指示とを含む再生環境データを受領することに関わっていてもよい。いくつかの例では、再生環境データはオーディオ・データと一緒に受領されてもよい。しかしながら、いくつかの実装では、再生環境データは別の仕方で受領されてもよい。たとえば、再生環境データは、図6のメモリ・システム615のメモリのようなメモリから取得されてもよい。
いくつかの事例では、再生スピーカー位置の指示は、再生環境における再生スピーカーの意図されたレイアウトに対応してもよい。いくつかの例では、再生環境は映画館サウンド・システム環境であってもよい。しかしながら、代替的な例では、再生環境はホームシアター環境または他の型の再生環境であってもよい。いくつかの実装では、再生環境は業界標準、たとえばドルビー規格の配位、浜崎配位などに従って構成されてもよい。たとえば、再生スピーカー位置の指示は、たとえばドルビー・サラウンド5.1配位、ドルビー・サラウンド5.1.2配位(図3のAおよびBを参照して上記で論じた高さスピーカーのためのドルビー・サラウンド5.1配位の拡張)、ドルビー・サラウンド7.1配位、ドルビー・サラウンド7.1.2配位または他の再生環境配位の、左、右、中央、サラウンドおよび/または高さスピーカー位置に対応してもよい。いくつかの実装では、再生スピーカー位置の指示は座標および/または他の位置情報を含んでいてもよい。
ブロック715は、レンダリング・プロセスに関わってもよい。この例では、ブロック715は、少なくとも部分的にはオーディオ・オブジェクト・メタデータに基づいて、オーディオ・オブジェクトを一つまたは複数のスピーカー・フィード信号にレンダリングすることに関わっていてもよい。各スピーカー・フィード信号は再生環境内の再生スピーカーのうちの少なくとも一つに対応してもよい。たとえば、いくつかの実装では、単一の再生スピーカー位置(たとえば「左サラウンド」)が再生環境の複数の再生スピーカーに対応してもよい。いくつかの例が図1および図2に示され、上記されている。
図7に示した例では、ブロック715のレンダリング・プロセスは、少なくとも部分的にはオーディオ・オブジェクトについてのオーディオ・オブジェクト位置データに基づいて、そのためにスピーカー・フィード信号がレンダリングされる複数の再生スピーカーを決定することに関わっていてもよい。この例では、ブロック715は、少なくとも部分的にはそのためにスピーカー・フィード信号がレンダリングされる前記複数の再生スピーカーのうちの少なくとも一つの再生スピーカーがサラウンド・スピーカーまたは高さスピーカーであるかどうかに基づいて、前記オーディオ・オブジェクトに対応するオーディオ・オブジェクト信号に適用する脱相関の量を決定することに関わっていてもよい。
脱相関プロセスは、いかなる好適な脱相関プロセスであってもよい。たとえば、いくつかの実装では、脱相関プロセスは、一つまたは複数のオーディオ信号に時間遅延、フィルタなどを適用することに関わっていてもよい。脱相関は、オーディオ信号と該オーディオ信号の脱相関されたバージョンとを混合することに関わっていてもよい。
ブロック715において、そのためにスピーカー・フィード信号がレンダリングされる前記複数の再生スピーカーのうちのどの再生スピーカーもサラウンド・スピーカーまたは高さスピーカーではない場合には、適用すべき脱相関の量を決定することは、脱相関が適用されないことを決定することに関わっていてもよい。たとえば、そのためにスピーカー・フィード信号が生成される再生スピーカーが左(前方)スピーカーおよび中央(前方)スピーカーであると判定される場合、いくつかの実装では、脱相関は適用されない(または実質的に適用されない)。
上記のように、左/右パンについては、頭の陰および他の聴覚効果が一般に、オーディオ・オブジェクトの位置の正確なレンダリングを許容する。したがって、いくつかのそのような実装では、左/右パンについては脱相関は適用されない(または実質的に適用されない)。その代わり、相関したスピーカー信号が再生スピーカーに与えられる。よって、そのような状況では、本稿に開示される改善されたレンダラーおよびレガシー・レンダラーは同じ(または実質的に同じ)スピーカー・フィード信号を生成しうる。
しかしながら、レンダリング・プロセスの間にそのためにスピーカー・フィード信号が生成される少なくとも一つの再生スピーカーがサラウンド・スピーカーまたは高さスピーカーであると判定される場合は、少なくともいくらかの脱相関がオーディオ・オブジェクト信号に適用される。たとえば、レンダリング・プロセスが左サラウンド・スピーカーについてのスピーカー・フィード信号を生成することに関わる場合、いくらかの脱相関が適用される。よって、いくつかのそのような実装では、前/後パンについて脱相関が適用される。脱相関されたスピーカー信号が再生スピーカーに与えられる。スピーカー信号を脱相関することは、遅延不整列に対する感度低下をもたらしうる。したがって、前方スピーカーとサラウンド・スピーカーとの間の到着時間差に起因する櫛形アーチファクトは低減され、あるいは完全に解消されうる。スイートスポットのサイズが増大されうる。いくつかの実装では、動いているオーディオ・オブジェクトの知覚されるラウドネスが、空間的な軌跡を通じてより一貫したものになりうる。
ブロック715においていくらかの脱相関が適用されることが決定される場合、脱相関の量は、少なくとも部分的には、前記オーディオ・オブジェクトに対応するオーディオ・オブジェクト位置データに基づいていてもよい。いくつかの実装によれば、たとえば、オーディオ・オブジェクト位置データが再生スピーカー位置のいずれかに一致する位置を示す場合、脱相関は適用されない(または実質的に適用されない)。いくつかの例では、オーディオ・オブジェクトは、該オーディオ・オブジェクトの位置と一致する位置をもつ再生スピーカーによってのみ再生される。結果として、そのような状況では、本稿に開示される改善されたレンダラーおよびレガシー・レンダラーは同じ(または実質的に同じ)スピーカー・フィード信号を生成しうる。
いくつかの実装では、適用すべき脱相関の量は他の要因に基づいていてもよい。たとえば、オーディオ・オブジェクトの少なくともいくつかに関連付けられたオーディオ・オブジェクト・メタデータが、適用すべき脱相関の量に関する情報を含んでいてもよい。いくつかの実装では、適用すべき脱相関の量は少なくとも部分的にはユーザーによって定義されたパラメータに基づいていてもよい。
図8は、再生環境においてスピーカー対に選択的に脱相関を適用する例を与えている。この例では、再生環境はドルビー・サラウンド7.1配位にある。ここで、レンダリング・プロセスに関わる場合にそのために脱相関されたスピーカー・フィード信号が与えられるスピーカー対のまわりに破線の楕円が示されている。よって、この例では、適用すべき脱相関の量を決定することは、オーディオ・オブジェクトのレンダリングが左前方/左側方サラウンド・スピーカー対、左側方サラウンド/左後方サラウンド・スピーカー対、右前方/右側方サラウンド・スピーカー対または右側方サラウンド/右後方サラウンド・スピーカー対の間のパンに関わるかどうかを決定することに関わっていてもよい。
代替的な例では、再生環境はドルビー・サラウンド5.1配位を有していてもよい。適用すべき脱相関の量を決定することは、オーディオ・オブジェクトのレンダリングが左前方/左サラウンド・スピーカー対または右前方/右サラウンド・スピーカー対の間のパンに関わるかどうかを決定することに関わっていてもよい。
いくつかの実装によれば、レンダリング・プロセスは公式
si(t)=Σjg'i,j(t)xj(t)+Σjhi,j(t)D(xj(t)) (式4)
に従って実行されてもよい。
si(t)=Σjg'i,j(t)xj(t)+Σjhi,j(t)D(xj(t)) (式4)
に従って実行されてもよい。
式(4)において、g'i,j(t)およびhi,j(t)は時間変化するパン利得の集合を表わし、x(t)はオーディオ・オブジェクト信号の集合を表わし、D(xj(t))は脱相関演算子を表わし、si(t)は結果として得られるスピーカー・フィード信号の集合を表わす。上記の式(2)と同様に、添え字iはスピーカーに対応し、添え字jはオーディオ・オブジェクト・インデックスである。D(xj(t))および/またはhi,j(t)が0に等しい場合には式(4)は式(2)と同じ結果を与えることが観察されうる。よって、そのような状況では、結果として得られるスピーカー・フィード信号は、この例におけるレガシー・パン・アルゴリズムのものと同じであろう。
いくつかの実装では、入力信号に対する脱相関演算子の効果y(t)=D(x(t))は次のように表現されてもよい。
<x(t)y(t)>=0 (式5)
<x2(t)>=<y2(t)> (式6)
式(5)および式(6)において、x(t)は入力信号を表わし、y(t)は対応する出力信号を表わし、カレット(<>)は囲まれている表式の期待値を示す。
<x2(t)>=<y2(t)> (式6)
式(5)および式(6)において、x(t)は入力信号を表わし、y(t)は対応する出力信号を表わし、カレット(<>)は囲まれている表式の期待値を示す。
いくつかのそのような実装によれば、脱相関プロセスを使って各スピーカーによって再生されるオブジェクトのエネルギーは、式(2)の「レガシー・パンナー」のエネルギーと同一または実質的に同一である。この条件は
gi,j 2=g'i,j 2+hi,j 2 (式7)
のように表現されうる。
gi,j 2=g'i,j 2+hi,j 2 (式7)
のように表現されうる。
さらに、いくつかの実装では、脱相関器の寄与は、それらのスピーカー信号がダウンミックスされるときに打ち消される。この条件は
0=Σihi,j (式8)
のように表現されうる。
0=Σihi,j (式8)
のように表現されうる。
いくつかの実装では、前/後方向のスピーカー対の間の相関(または脱相関)の量は制御可能であってもよい。たとえば、スピーカー対の間の相関(または脱相関)の量は、たとえば次のようにパラメータρに設定されてもよい。
信号x(t)の二つのスピーカーs1,s2の間の対ごとのパンを想定すると、利得g'およびhについて次の定式化を使うときに、すべての基準が満たされる。
装置900は論理システム910を含む。論理システム910は、汎用の単一チップまたは複数チップ・プロセッサのようなプロセッサを含んでいてもよい。論理システム910は、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲート・アレイ(FPGA)または他のプログラム可能型論理デバイス、離散的なゲートもしくはトランジスタ論理または離散的なハードウェア・コンポーネントまたはそれらの組み合わせを含んでいてもよい。論理システム910は、装置900の他のコンポーネントを制御するよう構成されていてもよい。図9には装置900のコンポーネント間のインターフェースは示されていないが、論理システム910は、他のコンポーネントとの通信のためのインターフェースをもって構成されていてもよい。それらの他のコンポーネントは、適宜互いとの通信のために構成されていてもいなくてもよい。
論理システム910は、本稿に記載される型のオーディオ・レンダリング機能を含むがそれに限られないオーディオ・オーサリングおよび/またはレンダリング機能を実行するよう構成されていてもよい。いくつかのそのような実装では、論理システム910は、(少なくとも部分的には)一つまたは複数の非一時的な媒体に記憶されているソフトウェアに従って動作するよう構成されていてもよい。非一時的媒体は、ランダム・アクセス・メモリ(RAM)および/または読み出し専用メモリ(ROM)のような、論理システム910に付随するメモリを含んでいてもよい。非一時的媒体は、メモリ・システム915のメモリを含んでいてもよい。メモリ・システム915は、フラッシュメモリ、ハードドライブなどといった一つまたは複数の好適な型の非一時的記憶媒体を含んでいてもよい。
表示システム930は、装置900の具現に依存して、一つまたは複数の好適な型のディスプレイを含んでいてもよい。たとえば、表示システム930は液晶ディスプレイ、プラズマ・ディスプレイ、双安定ディスプレイなどを含んでいてもよい。
ユーザー入力システム935は、ユーザーからの入力を受け入れるよう構成された一つまたは複数の装置を含んでいてもよい。いくつかの実装では、ユーザー入力システム935は、表示システム930のディスプレイにかぶさるタッチスクリーンを含んでいてもよい。ユーザー入力システム935はマウス、トラックボール、ジェスチャー検出システム、ジョイスティック、一つまたは複数のGUIおよび/または表示システム930上に呈示されるメニュー、ボタン、キーボード、スイッチなどを含んでいてもよい。いくつかの実装では、ユーザー入力システム935は、マイクロホン925を含んでいてもよい:ユーザーは、マイクロホン925を介して装置900についての音声コマンドを提供してもよい。論理システムは、音声認識のために、そしてそのような音声コマンドに従って装置900の少なくともいくつかの動作を制御するために構成されていてもよい。
電力システム940は、ニッケル‐カドミウム電池またはリチウム・イオン電池のような一つまたは複数の好適なエネルギー蓄積装置を含んでいてもよい。電力システム940は電気コンセントから電力を受領するよう構成されていてもよい。
本開示に記載される実装へのさまざまな修正が、当業者にはすぐに明白となりうる。本稿において定義される一般的な原理は、本開示の精神または範囲から外れることなく、他の実装に適用されてもよい。このように、特許請求の範囲は、本稿に示される実装に限定されることは意図されておらず、本開示、本稿に開示される原理および新規な特徴と整合する最も広い範囲を与えられるべきものである。
Claims (39)
- オーディオ・オブジェクトを含むオーディオ・データを受領する段階であって、前記オーディオ・オブジェクトは、オーディオ・オブジェクト信号および関連するオーディオ・オブジェクト・メタデータを含み、前記オーディオ・オブジェクト・メタデータは、少なくとも、オーディオ・オブジェクト位置データを含む、段階と;
再生環境における再生スピーカー数の指示と、再生環境内の再生スピーカー位置の指示とを含む再生環境データを受領する段階と;
少なくとも部分的には前記オーディオ・オブジェクト・メタデータに基づいて、前記オーディオ・オブジェクトを一つまたは複数のスピーカー・フィード信号にレンダリングする段階であって、各スピーカー・フィード信号は再生環境内の再生スピーカーのうちの少なくとも一つに対応する、段階とを含み、
前記レンダリングは:
少なくとも部分的には前記オーディオ・オブジェクトのうちのあるオーディオ・オブジェクトについてのオーディオ・オブジェクト位置データに基づいて、そのためにスピーカー・フィード信号がレンダリングされる複数の再生スピーカーを決定する段階と;
そのためにスピーカー・フィード信号がレンダリングされる前記複数の再生スピーカーのうちの少なくとも一つの再生スピーカーがサラウンド・スピーカーまたは高さスピーカーであるかどうかを判定する段階と;
少なくとも部分的にはそのためにスピーカー・フィード信号がレンダリングされる前記複数の再生スピーカーのうちの少なくとも一つの再生スピーカーがサラウンド・スピーカーまたは高さスピーカーであるかどうかに基づいて、前記オーディオ・オブジェクトに対応するオーディオ・オブジェクト信号に適用する脱相関の量を決定する段階と;
決定された量の脱相関を、前記オーディオ・オブジェクトに対応する前記オーディオ・オブジェクト信号に適用する脱相関プロセスを実行する段階とを含み、
前記脱相関プロセスは、各スピーカー・フィード信号について、前記オーディオ・オブジェクト信号と前記オーディオ・オブジェクト信号の脱相関されたバージョンとを、前記オーディオ・オブジェクト信号についての時間変化するパン利得および前記オーディオ・オブジェクト信号の前記脱相関されたバージョンについての時間変化するパン利得に従って混合することを含み、前記オーディオ・オブジェクト信号の前記脱相関されたバージョンは脱相関器によって得られ;
前記複数のスピーカー・フィード信号についての前記オーディオ・オブジェクト信号の前記脱相関されたバージョンについてのそれぞれの時間変化するパン利得は総和すると0になり、よって前記脱相関器の寄与は前記複数のスピーカー・フィード信号がダウンミックスされるときには打ち消される、
方法。 - そのためにスピーカー・フィード信号がレンダリングされる前記複数の再生スピーカーのうちのどの再生スピーカーもサラウンド・スピーカーでも高さスピーカーでもないと判定され、適用する脱相関の量を決定することは、脱相関が適用されないことを決定することを含む、請求項1記載の方法。
- 適用する脱相関の量を決定することは、少なくとも部分的には、前記オーディオ・オブジェクトに対応するオーディオ・オブジェクト位置データに基づく、請求項1または2記載の方法。
- 前記オーディオ・オブジェクトの少なくともいくつかに関連する前記オーディオ・オブジェクト・メタデータは、適用する脱相関の前記量に関する情報を含む、請求項1ないし3のうちいずれか一項記載の方法。
- 適用する脱相関の量を決定することは、少なくとも部分的には、ユーザー定義のパラメータに基づく、請求項1ないし4のうちいずれか一項記載の方法。
- 前記オーディオ・オブジェクトの少なくともいくつかは静的なオーディオ・オブジェクトである、請求項1ないし5のうちいずれか一項記載の方法。
- 前記オーディオ・オブジェクトの少なくともいくつかは、時間変化する位置をもつ動的なオーディオ・オブジェクトである、請求項1ないし6のうちいずれか一項記載の方法。
- 前記再生環境は、映画館サウンド・システム環境またはホームシアター環境である、請求項1ないし7のうちいずれか一項記載の方法。
- 前記再生環境がドルビー・サラウンド5.1配位またはドルビー・サラウンド7.1配位を有する、請求項1ないし8のうちいずれか一項記載の方法。
- 前記再生環境がドルビー・サラウンド5.1配位を有し、適用する脱相関の量を決定することは、前記オーディオ・オブジェクトのレンダリングが左前方/左サラウンド・スピーカー対または右前方/右サラウンド・スピーカー対の間のパンに関わるかどうかを判定することを含む、請求項9記載の方法。
- 前記再生環境がドルビー・サラウンド7.1配位を有し、適用する脱相関の量を決定することは、前記オーディオ・オブジェクトのレンダリングが左前方/左側方サラウンド・スピーカー対、左側方サラウンド/左後方サラウンド・スピーカー対、右前方/右側方サラウンド・スピーカー対または右側方サラウンド/右後方サラウンド・スピーカー対の間のパンに関わるかどうかを判定することを含む、請求項9記載の方法。
- インターフェース・システムおよび論理システムを有する装置であって、前記論理システムは:
前記インターフェース・システムを介して、オーディオ・オブジェクトを含むオーディオ・データを受領する段階であって、前記オーディオ・オブジェクトは、オーディオ・オブジェクト信号および関連するオーディオ・オブジェクト・メタデータを含み、前記オーディオ・オブジェクト・メタデータは、少なくとも、オーディオ・オブジェクト位置データを含む、段階と;
再生環境における再生スピーカー数の指示と、再生環境内の再生スピーカー位置の指示とを含む再生環境データを受領する段階と;
少なくとも部分的には前記オーディオ・オブジェクト・メタデータに基づいて、前記オーディオ・オブジェクトを一つまたは複数のスピーカー・フィード信号にレンダリングする段階であって、各スピーカー・フィード信号は再生環境内の再生スピーカーのうちの少なくとも一つに対応する、段階とを実行することができ、
前記レンダリングは:
少なくとも部分的には前記オーディオ・オブジェクトのうちのあるオーディオ・オブジェクトについてのオーディオ・オブジェクト位置データに基づいて、そのためにスピーカー・フィード信号がレンダリングされる複数の再生スピーカーを決定する段階と;
そのためにスピーカー・フィード信号がレンダリングされる前記複数の再生スピーカーのうちの少なくとも一つの再生スピーカーがサラウンド・スピーカーまたは高さスピーカーであるかどうかを判定する段階と;
少なくとも部分的にはそのためにスピーカー・フィード信号がレンダリングされる前記複数の再生スピーカーのうちの少なくとも一つの再生スピーカーがサラウンド・スピーカーまたは高さスピーカーであるかどうかに基づいて、前記オーディオ・オブジェクトに対応するオーディオ・オブジェクト信号に適用する脱相関の量を決定する段階と;
決定された量の脱相関を、前記オーディオ・オブジェクトに対応する前記オーディオ・オブジェクト信号に適用する脱相関プロセスを実行する段階とを含み、
前記脱相関プロセスは、各スピーカー・フィード信号について、前記オーディオ・オブジェクト信号と前記オーディオ・オブジェクト信号の脱相関されたバージョンとを、前記オーディオ・オブジェクト信号についての時間変化するパン利得および前記オーディオ・オブジェクト信号の前記脱相関されたバージョンについての時間変化するパン利得に従って混合することを含み、前記オーディオ・オブジェクト信号の前記脱相関されたバージョンは脱相関器によって得られ;
前記複数のスピーカー・フィード信号についての前記オーディオ・オブジェクト信号の前記脱相関されたバージョンについてのそれぞれの時間変化するパン利得は総和すると0になり、よって前記脱相関器の寄与は前記複数のスピーカー・フィード信号がダウンミックスされるときには打ち消される、
装置。 - そのためにスピーカー・フィード信号がレンダリングされる前記複数の再生スピーカーのうちのどの再生スピーカーもサラウンド・スピーカーでも高さスピーカーでもないと判定され、適用する脱相関の量を決定することは、脱相関が適用されないことを決定することを含む、請求項12記載の装置。
- 適用する脱相関の量を決定することは、少なくとも部分的には、前記オーディオ・オブジェクトに対応するオーディオ・オブジェクト位置データに基づく、請求項12または13記載の装置。
- 前記オーディオ・オブジェクトの少なくともいくつかに関連する前記オーディオ・オブジェクト・メタデータは、適用する脱相関の前記量に関する情報を含む、請求項12ないし14のうちいずれか一項記載の装置。
- 適用する脱相関の量を決定することは、少なくとも部分的には、ユーザー定義のパラメータに基づく、請求項12ないし15のうちいずれか一項記載の装置。
- 前記オーディオ・オブジェクトの少なくともいくつかは静的なオーディオ・オブジェクトである、請求項12ないし16のうちいずれか一項記載の装置。
- 前記オーディオ・オブジェクトの少なくともいくつかは、時間変化する位置をもつ動的なオーディオ・オブジェクトである、請求項12ないし17のうちいずれか一項記載の装置。
- 前記再生環境は、映画館サウンド・システム環境またはホームシアター環境を含む、請求項12ないし18のうちいずれか一項記載の装置。
- 前記再生環境はドルビー・サラウンド5.1配位またはドルビー・サラウンド7.1配位を有する、請求項12ないし19のうちいずれか一項記載の装置。
- 前記再生環境がドルビー・サラウンド5.1配位を有し、適用する脱相関の量を決定することが、前記オーディオ・オブジェクトのレンダリングが左前方/左サラウンド・スピーカー対または右前方/右サラウンド・スピーカー対の間のパンに関わるかどうかを判定することを含む、請求項20記載の装置。
- 前記再生環境がドルビー・サラウンド7.1配位を有し、適用する脱相関の量を決定することは、前記オーディオ・オブジェクトのレンダリングが左前方/左側方サラウンド・スピーカー対、左側方サラウンド/左後方サラウンド・スピーカー対、右前方/右側方サラウンド・スピーカー対または右側方サラウンド/右後方サラウンド・スピーカー対の間のパンに関わるかどうかを判定することを含む、請求項20記載の装置。
- 前記論理システムが、汎用単一チップもしくはマルチチップ・プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲート・アレイ(FPGA)または他のプログラム可能型論理デバイス、離散的なゲートもしくはトランジスタ論理または離散的なハードウェア・コンポーネントのうちの少なくとも一つを含む、請求項12ないし22のうちいずれか一項記載の装置。
- メモリ・システムをさらに有しており、前記インターフェース・システムは、前記論理システムと前記メモリ・システムの少なくとも一部との間のインターフェースを含む、請求項12ないし23のうちいずれか一項記載の装置。
- 前記インターフェース・システムがネットワーク・インターフェースを含む、請求項12ないし24のうちいずれか一項記載の装置。
- データ通信のためのインターフェース手段および論理手段を有する装置であって、前記論理手段は:
前記インターフェース手段を介して、オーディオ・オブジェクトを含むオーディオ・データを受領する段階であって、前記オーディオ・オブジェクトは、オーディオ・オブジェクト信号および関連するオーディオ・オブジェクト・メタデータを含み、前記オーディオ・オブジェクト・メタデータは、少なくとも、オーディオ・オブジェクト位置データを含む、段階と;
再生環境における再生スピーカー数の指示と、再生環境内の再生スピーカー位置の指示とを含む再生環境データを受領する段階と;
少なくとも部分的には前記オーディオ・オブジェクト・メタデータに基づいて、前記オーディオ・オブジェクトを一つまたは複数のスピーカー・フィード信号にレンダリングする段階であって、各スピーカー・フィード信号は再生環境内の再生スピーカーのうちの少なくとも一つに対応する、段階とを実行するためのものであり、
前記レンダリングは:
少なくとも部分的には前記オーディオ・オブジェクトのうちのあるオーディオ・オブジェクトについてのオーディオ・オブジェクト位置データに基づいて、そのためにスピーカー・フィード信号がレンダリングされる複数の再生スピーカーを決定する段階と;
そのためにスピーカー・フィード信号がレンダリングされる前記複数の再生スピーカーのうちの少なくとも一つの再生スピーカーがサラウンド・スピーカーまたは高さスピーカーであるかどうかを判定する段階と;
少なくとも部分的にはそのためにスピーカー・フィード信号がレンダリングされる前記複数の再生スピーカーのうちの少なくとも一つの再生スピーカーがサラウンド・スピーカーまたは高さスピーカーであるかどうかに基づいて、前記オーディオ・オブジェクトに対応するオーディオ・オブジェクト信号に適用する脱相関の量を決定する段階と;
決定された量の脱相関を、前記オーディオ・オブジェクトに対応する前記オーディオ・オブジェクト信号に適用する脱相関プロセスを実行する段階とを含み、
前記脱相関プロセスは、各スピーカー・フィード信号について、前記オーディオ・オブジェクト信号と前記オーディオ・オブジェクト信号の脱相関されたバージョンとを、前記オーディオ・オブジェクト信号についての時間変化するパン利得および前記オーディオ・オブジェクト信号の前記脱相関されたバージョンについての時間変化するパン利得に従って混合することを含み、前記オーディオ・オブジェクト信号の前記脱相関されたバージョンは脱相関器によって得られ;
前記複数のスピーカー・フィード信号についての前記オーディオ・オブジェクト信号の前記脱相関されたバージョンについてのそれぞれの時間変化するパン利得は総和すると0になり、よって前記脱相関器の寄与は前記複数のスピーカー・フィード信号がダウンミックスされるときに打ち消される、
装置。 - そのためにスピーカー・フィード信号がレンダリングされる前記複数の再生スピーカーのうちのどの再生スピーカーもサラウンド・スピーカーでも高さスピーカーでもないと判定され、適用する脱相関の量を決定することは、脱相関が適用されないことを決定することを含む、請求項26記載の装置。
- 適用する脱相関の量を決定することが、少なくとも部分的には、前記オーディオ・オブジェクトに対応するオーディオ・オブジェクト位置データに基づく、請求項26または27記載の装置。
- 命令を含む記憶している非一時的媒体であって、前記命令は、少なくとも一つの装置を制御して、以下の動作、すなわち:
オーディオ・オブジェクトを含むオーディオ・データを受領する段階であって、前記オーディオ・オブジェクトは、オーディオ・オブジェクト信号および関連するオーディオ・オブジェクト・メタデータを含み、前記オーディオ・オブジェクト・メタデータは、少なくとも、オーディオ・オブジェクト位置データを含む、段階と;
再生環境における再生スピーカー数の指示と、再生環境内の再生スピーカー位置の指示とを含む再生環境データを受領する段階と;
少なくとも部分的には前記オーディオ・オブジェクト・メタデータに基づいて、前記オーディオ・オブジェクトを一つまたは複数のスピーカー・フィード信号にレンダリングする段階であって、各スピーカー・フィード信号は再生環境内の再生スピーカーのうちの少なくとも一つに対応する、段階とを実行させるためのものであり、
前記レンダリングは:
少なくとも部分的には前記オーディオ・オブジェクトのうちのあるオーディオ・オブジェクトについてのオーディオ・オブジェクト位置データに基づいて、そのためにスピーカー・フィード信号がレンダリングされる複数の再生スピーカーを決定し;
そのためにスピーカー・フィード信号がレンダリングされる前記複数の再生スピーカーのうちの少なくとも一つの再生スピーカーがサラウンド・スピーカーまたは高さスピーカーであるかどうかを判定し;
少なくとも部分的にはそのためにスピーカー・フィード信号がレンダリングされる前記複数の再生スピーカーのうちの少なくとも一つの再生スピーカーがサラウンド・スピーカーまたは高さスピーカーであるかどうかに基づいて、前記オーディオ・オブジェクトに対応するオーディオ・オブジェクト信号に適用する脱相関の量を決定し;
決定された量の脱相関を、前記オーディオ・オブジェクトに対応する前記オーディオ・オブジェクト信号に適用する脱相関プロセスを実行することを含み、
前記脱相関プロセスは、各スピーカー・フィード信号について、前記オーディオ・オブジェクト信号と前記オーディオ・オブジェクト信号の脱相関されたバージョンとを、前記オーディオ・オブジェクト信号についての時間変化するパン利得および前記オーディオ・オブジェクト信号の前記脱相関されたバージョンについての時間変化するパン利得に従って混合することを含み、前記オーディオ・オブジェクト信号の前記脱相関されたバージョンは脱相関器によって得られ;
前記複数のスピーカー・フィード信号についての前記オーディオ・オブジェクト信号の前記脱相関されたバージョンについてのそれぞれの時間変化するパン利得は総和すると0になり、よって前記脱相関器の寄与は前記複数のスピーカー・フィード信号がダウンミックスされるときに打ち消される、
非一時的媒体。 - そのためにスピーカー・フィード信号がレンダリングされる前記複数の再生スピーカーのうちのどの再生スピーカーもサラウンド・スピーカーでも高さスピーカーでもないと判定され、適用する脱相関の量を決定することは、脱相関が適用されないことを決定することを含む、請求項29記載の非一時的媒体。
- 適用する脱相関の量を決定することが、少なくとも部分的には、前記オーディオ・オブジェクトに対応するオーディオ・オブジェクト位置データに基づく、請求項29または30記載の非一時的媒体。
- 前記オーディオ・オブジェクトの少なくともいくつかに関連する前記オーディオ・オブジェクト・メタデータは、適用する脱相関の前記量に関する情報を含む、請求項29ないし31のうちいずれか一項記載の非一時的媒体。
- 適用する脱相関の量を決定することは、少なくとも部分的には、ユーザー定義のパラメータに基づく、請求項29ないし32のうちいずれか一項記載の非一時的媒体。
- 前記オーディオ・オブジェクトの少なくともいくつかは静的なオーディオ・オブジェクトである、請求項29ないし33のうちいずれか一項記載の非一時的媒体。
- 前記オーディオ・オブジェクトの少なくともいくつかは、時間変化する位置をもつ動的なオーディオ・オブジェクトである、請求項29ないし34のうちいずれか一項記載の非一時的媒体。
- 前記再生環境は、映画館サウンド・システム環境またはホームシアター環境を含む、請求項29ないし35のうちいずれか一項記載の非一時的媒体。
- 前記再生環境はたとえば、ドルビー・サラウンド5.1配位またはドルビー・サラウンド7.1配位を有する、請求項29ないし36のうちいずれか一項記載の非一時的媒体。
- 前記再生環境がドルビー・サラウンド5.1配位を有し、適用する脱相関の量を決定することが、前記オーディオ・オブジェクトのレンダリングが左前方/左サラウンド・スピーカー対または右前方/右サラウンド・スピーカー対の間のパンに関わるかどうかを判定することを含む、請求項37記載の非一時的媒体。
- 前記再生環境がドルビー・サラウンド7.1配位を有し、適用する脱相関の量を決定することが、前記オーディオ・オブジェクトのレンダリングが左前方/左側方サラウンド・スピーカー対、左側方サラウンド/左後方サラウンド・スピーカー対、右前方/右側方サラウンド・スピーカー対または右側方サラウンド/右後方サラウンド・スピーカー対の間のパンに関わるかどうかを判定することを含む、請求項37記載の非一時的媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
ESP201431322 | 2014-09-12 | ||
ES201431322 | 2014-09-12 | ||
US201462079265P | 2014-11-13 | 2014-11-13 | |
US62/079,265 | 2014-11-13 | ||
PCT/US2015/049416 WO2016040623A1 (en) | 2014-09-12 | 2015-09-10 | Rendering audio objects in a reproduction environment that includes surround and/or height speakers |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017530619A JP2017530619A (ja) | 2017-10-12 |
JP6360253B2 true JP6360253B2 (ja) | 2018-07-18 |
Family
ID=55459570
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017512352A Expired - Fee Related JP6360253B2 (ja) | 2014-09-12 | 2015-09-10 | サラウンドおよび/または高さスピーカーを含む再生環境におけるオーディオ・オブジェクトのレンダリング |
Country Status (5)
Country | Link |
---|---|
US (1) | US20170289724A1 (ja) |
EP (1) | EP3192282A1 (ja) |
JP (1) | JP6360253B2 (ja) |
CN (1) | CN106688253A (ja) |
WO (1) | WO2016040623A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
HK1221372A2 (zh) * | 2016-03-29 | 2017-05-26 | 萬維數碼有限公司 | 種獲得空間音頻定向向量的方法、裝置及設備 |
EP3453190A4 (en) * | 2016-05-06 | 2020-01-15 | DTS, Inc. | SYSTEMS FOR IMMERSIVE AUDIO PLAYBACK |
RU2022100301A (ru) | 2017-12-18 | 2022-03-05 | Долби Интернешнл Аб | Способ и система для обработки глобальных переходов между положениями прослушивания в среде виртуальной реальности |
GB201800920D0 (en) * | 2018-01-19 | 2018-03-07 | Nokia Technologies Oy | Associated spatial audio playback |
US10499181B1 (en) * | 2018-07-27 | 2019-12-03 | Sony Corporation | Object audio reproduction using minimalistic moving speakers |
WO2020030303A1 (en) * | 2018-08-09 | 2020-02-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An audio processor and a method for providing loudspeaker signals |
CN112153538B (zh) * | 2020-09-24 | 2022-02-22 | 京东方科技集团股份有限公司 | 显示装置及其全景声实现方法、非易失性存储介质 |
KR20220146165A (ko) * | 2021-04-23 | 2022-11-01 | 삼성전자주식회사 | 오디오 신호 처리를 위한 전자 장치 및 그 동작 방법 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1683133B1 (en) * | 2003-10-30 | 2007-02-14 | Koninklijke Philips Electronics N.V. | Audio signal encoding or decoding |
US8345899B2 (en) * | 2006-05-17 | 2013-01-01 | Creative Technology Ltd | Phase-amplitude matrixed surround decoder |
EP2102858A4 (en) * | 2006-12-07 | 2010-01-20 | Lg Electronics Inc | METHOD AND DEVICE FOR PROCESSING AN AUDIO SIGNAL |
KR101512992B1 (ko) * | 2007-05-22 | 2015-04-17 | 코닌클리케 필립스 엔.브이. | 오디오 데이터를 처리하기 위한 디바이스 및 방법 |
CN103299363B (zh) * | 2007-06-08 | 2015-07-08 | Lg电子株式会社 | 用于处理音频信号的方法和装置 |
US8463414B2 (en) * | 2010-08-09 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus for estimating a parameter for low bit rate stereo transmission |
US9031268B2 (en) * | 2011-05-09 | 2015-05-12 | Dts, Inc. | Room characterization and correction for multi-channel audio |
TWI453451B (zh) * | 2011-06-15 | 2014-09-21 | Dolby Lab Licensing Corp | 擷取與播放源於多音源的聲音之方法 |
RU2554523C1 (ru) * | 2011-07-01 | 2015-06-27 | Долби Лабораторис Лайсэнзин Корпорейшн | Система и инструментальные средства для усовершенствованной авторской разработки и представления трехмерных аудиоданных |
WO2014087277A1 (en) * | 2012-12-06 | 2014-06-12 | Koninklijke Philips N.V. | Generating drive signals for audio transducers |
WO2015017584A1 (en) * | 2013-07-30 | 2015-02-05 | Dts, Inc. | Matrix decoder with constant-power pairwise panning |
-
2015
- 2015-09-10 WO PCT/US2015/049416 patent/WO2016040623A1/en active Application Filing
- 2015-09-10 US US15/510,213 patent/US20170289724A1/en not_active Abandoned
- 2015-09-10 CN CN201580048492.4A patent/CN106688253A/zh active Pending
- 2015-09-10 JP JP2017512352A patent/JP6360253B2/ja not_active Expired - Fee Related
- 2015-09-10 EP EP15767030.8A patent/EP3192282A1/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
JP2017530619A (ja) | 2017-10-12 |
US20170289724A1 (en) | 2017-10-05 |
EP3192282A1 (en) | 2017-07-19 |
CN106688253A (zh) | 2017-05-17 |
WO2016040623A1 (en) | 2016-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6607904B2 (ja) | 見かけのサイズをもつオーディオ・オブジェクトの任意のラウドスピーカー・レイアウトへのレンダリング | |
JP6360253B2 (ja) | サラウンドおよび/または高さスピーカーを含む再生環境におけるオーディオ・オブジェクトのレンダリング | |
JP6276402B2 (ja) | オーディオ・レンダリングのためのベース管理 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170802 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180529 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180621 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6360253 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |