JP2003525466A

JP2003525466A - デジタルオーディオ生成過程において１次コンテンツオーディオおよび２次コンテンツの残りのオーディオ性能を収容する方法および装置

Info

Publication number: JP2003525466A
Application number: JP2001563565A
Authority: JP
Inventors: ボードリー、マイケル・エー; ソーンダース、ウィリアム・アール
Original assignee: ヒアリングエンハンスメントカンパニー，リミティドライアビリティーカンパニー
Priority date: 2000-03-02
Filing date: 2001-03-02
Publication date: 2003-08-26
Also published as: AU2001243395A1; US6772127B2; KR20020073604A; RU2002126217A; US20020040295A1; EP1264300A2; BR0108904A; CN1211775C; CN1427987A; KR100799155B1; IL151546A0; WO2001065888A9; WO2001065888A3; MXPA02008573A; US6351733B1; CA2401798A1; WO2001065888A2

Abstract

(57)【要約】発明はオーディオ生成過程の異なった部分で音声と残りのオーディオ情報の包含を可能にする。特に、発明はAC3圧縮形式よりも等しいか、または大きい匹敵する正味の損失を被るどんなコーデックとも比較されるオーディオデータの、より少ない損失を被るオーディオ圧縮形式のそれらのクラスによりVRAのVRA可能なデジタル習得と収容の特別な技術を具体化する。発明は全体のデジタルオーディオシステムの多重部分の新しい構成に焦点をあてることによって、デジタルオーディオ媒体の再生上最終聴取者の音声対残りのオーディオ(VRA)調整を容易にし、それにより、音声プログラムの１次音声/会話コンテンツのそのプログラムの音声コンテンツの残りの部分に対する比率を制御したいと欲するオーディオエンドユーザ（最終聴取者）に、利益を与えることを意図した新しい技術を可能にする。

Description

【発明の詳細な説明】

【０００１】この出願は、２０００年３月２日に申請され、その全部を引用文献としてここ
に組み込まれた、“デジタルオーディオ生成過程において１次コンテンツ（純粋
な音声）オーディオおよび２次コンテンツの残りのオーディオ性能を収容する技
術”と題する仮出願番号６０/１８６，３５７の利益を請求する。

【０００２】発明の分野本発明はオーディオ信号処理に係り、なお特に個々の聴取者のためにオーディ
オ信号の所望な部分の増進に関する。

【０００３】発明の背景デジタルオーディオファイル記録保管、圧縮、コード化、伝送、復号、および
再生の最近の広範囲の編入はデジタルオーディオ処理の実際にはあらゆる段階で
新しい機会の可能性を導入した。それは音声対残りのオーディオ(VRA)の好まし
い比率が異なった人々についてかなり異なっており、かつ異なった型のメディア
プログラム(スポーツプログラム対音楽など)に関して異なることが最近示された
。Blum他によるHEC Technical Report No.1，January，2000の“A Study of Lis
tener Preferences Using Pre-Recorded Voice-to-Remaining Audio”参照。

【０００４】明確に、残りのオーディオボリュームの別々の調整の如何にかかわらず、別々
に音声(スピーチ)のボリュームを調整することによって、VRAはオーディオプロ
グラムの音声対残りのオーディオ比の個人化された調整について言及する。独自
にユーザ調整された音声オーディオ情報は、次に独自にユーザ調整された残りの
音声オーディオ情報に結合されて、さらに全体のボリューム調整が適用されるか
もしれない再生装置に送られる。この技術は、各個人の聞き取り能力がそれらの
視覚能力と同じくらい異なっており、その結果彼らがオーディオプログラムの音
声対バックグラウンドコンテンツを聞きたい(または、必要性さえある) 個々の
好みに導く発見によって動機づけられた。オーディオプログラムのVRA能力のた
めの必要性が各々およびすべての人に最適の視覚特性を提供するために広範囲な
指示レンズの必要性と同じくらい基本的であるということが結論である。

【０００５】発明の概要発明はオーディオ生成過程の異なった部分で音声と残りのオーディオ情報の包
含を可能にする。特に、発明はAC3圧縮形式に等しいか、またはそれより大きい
匹敵するネット損失を受けるどんなコーデックとも比較されるオーディオデータ
のより少ない損失を受けるオーディオ圧縮形式のそれらのクラスにより、VRA可
能なデジタル習得とVRAの収容の特別な技術を具体化する。

【０００６】発明は、全体のデジタルオーディオシステムの多重部分の新しい構成に焦点を
合わせることによって、その結果そのプログラムでオーディオコンテンツの残り
の部分に比例してオーディオプログラムの１次音声/対話コンテンツの比率を制
御したいオーディオエンドユーザ(最終聴取者)のためになるように意図された新
しい技術を可能にすることにより、デジタルオーディオメディア形式の再生上、
最終聴取者の音声対残りのオーディオ(VRA)調整を容易にする。ここに開示され
る特定の発明を動機づける問題は２つである。第１に、VRA調整を可能にする2つ
の信号の構造のためのオーディオプログラム生成経路において、最も良い位置に
ついて異なった意見があることが認められる。第２に、最適のオーディオ圧縮形
式、オーディオのファイル格納要求、オーディオの放送伝送ビットレート、オー
ディオのストリーミングビットレート、および最終聴取者に最終的に伝えられる
音声および残りのオーディオコンテンツの両方の知覚された聴取品質の間にはト
レードオフがある。VRAを最終聴取者に提供する究極の目的のために、それらの2
つの問題の様々な解決が新しい実施例を通してこの発明により提案され、その実
施例は新しいまたは既存のデジタル習得、オーディオ圧縮、コード化、ファイル
格納、伝送、および復号の技術を取り入れるかもしれない。

【０００７】さらに発明は、いわゆる純粋な音声のオーディオコンテンツおよび残りのオー
ディオコンテンツが格納および/または伝送のために容易に作られるように、オ
ーディオプログラムが生成されるかもしれない様々な方法に適応されてもよい。
この方法において、録音過程はオーディオ生成過程の不可欠の要素であると考え
られる。新しいオーディオコンテンツは、オーディオ信号のデジタル格納および
/または伝送で使用されるかもしれない特定のオーディオ圧縮アルゴリズムの如
何にかかわらず、明らかな方法で最終聴取者に引渡されるかもしれない。これは
実際にはどんなCODECでの音声および残りのオーディオ情報の包含も必要とする
だろう。したがって、この発明はユニークなデジタル習得の過程、および多くで
状況で使用される損失のないおよび最少損失の圧縮アルゴリズムで両立性のある
非圧縮格納方式を定義する。

【０００８】また、発明の実施例はVRAコード化とVRA復号の必要な特徴に焦点を合わせるか
もしれない。オーディオコーデックの中の共通点のために、以下に提供されるす
べての記述が放送メディア(テレビやウエブキャスチングなどの)、ストリーミン
グのオーディオ、CDオーディオ、またはDVDオーディオのために等しくVRA機能性
を供給するように考慮されることができる。また、発明はフィルム、ドキュメン
タリー、ビデオ、音楽、およびスポーツイベントを含むオーディオプログラムの
すべての形式のために意図されるかもしれない。

【０００９】発明のこれらのおよび他の利点および特徴は以下に明らかになり、発明の本質
は、発明の以下の詳細な記述、添付請求項およびここに添付される複数の図面を
参照することによりさらに明確に理解されるであろう。

【００１０】好ましい実施例の記述以下図面を参照して発明が記述される。

【００１１】 VRA調整は様々な形式の聴覚損傷の療法として使用されるかもしれない。聴覚
損傷のほとんどすべての形について最適な解決策は、バックグラウンド音の‘汚
染’なしに興味がある聴覚信号(通常音声)を聴覚損傷聴取者が受信することを許
容することであることを、聴覚学の専門家はすばやく指摘するだろう。したがっ
て、VRAの特徴は聴覚損傷個人の人生を高めることを期待することができる。し
かしながら、最近の調査は、集団の実際にはすべての区分で好ましい信号(例え
ば、スポーツアナウンサーの音声)と残りのオーディオ信号(例えば、群衆のバッ
クグラウンド雑音)の最適のミックスにおける重要な変化を確認した。オーディ
オ情報の‘聴取における多様性’のこの必要性の証拠は全地球上にいる何百万人
もの人間の総合的な多様性と一致している。

【００１２】デジタルオーディオの出現が、聴取者へのオーディオ制御情報(または、メタ
データ)と同様に多量の高品質のオーディオ情報を送ることを可能にしたとき、
この発見は到来する。あいにく、デジタルオーディオにおけるVRAの特徴の編入
はこれまでどんなメディアの形にも提供されていない。この領域での仕事は、AT
SC AC3デジタルオーディオ標準の任意の部分として構成されたいわゆる‘Herrin
g Impaired Associated Service’の言及に制限された。1995年 ATSCレポート“
A-54: A Guide to the Use of the AC3”参照。それは、AC3ビットストリーム
の一部として聴覚損傷ユーザが音声のコンテンツだけの特に準備された信号を受
信すること、およびATSCの指定されたビットストリームの一部として通常伝送さ
れる他のオーディオチャンネル(主なオーディオサービス)で、調整されたボリュ
ームでその音声コンテンツを混合することをいかに欲するかを記述する短いパラ
グラフを含む。A-54ドキュメントで言及されるAC3オーディオ方式がデジタルオ
ーディオの専門家によって‘知覚のコード化’圧縮形式と呼ばれたDolby Labs圧
縮アルゴリズムに基づくことは、周知のことである。知覚のコード化アルゴリズ
ムは、記録保管されたファイルの格納サイズ要件を減らすため、およびHDTVなど
のリアルタイムの放送で伝送されなければならない情報の量を減少するため、オ
リジナルのオーディオ信号コンテンツの何らかの割合を捨てるように設計される
。アルゴリズムは、耳がとにかく聞くことができなかったそれらのデータだけを
排除することを試みるので、捨てられたオーディオデータは聴取者により気づか
ないようになると思われる。あいにく、知覚のコード化アルゴリズムは、あるオ
ーディオコンテンツが捨てられた後に保持される究極の聴取品質について積年の
討論を受けることになった。

【００１３】どんなオーディオプログラムでもVRA能力を供給する基本的な理由の1つは、エ
ンドユーザのための理解と聴取満足感を高めることであり、エンドユーザは音声
と残りのオーディオの提供されたミックスダウン比を理解しかつ楽しむことを現
在強いて試みようとする。純粋な音声がAC3などのまさしくその損失のある圧縮
アルゴリズムを使用することで提供されるとき、音声の品質は必ず減少する。AC
3の知覚のコード化アルゴリズムはおよそ12:1の圧縮比で構成され、それはオリ
ジナルのオーディオコンテンツが情報の12オリジナルビット毎に1ビットだけを
保持したことを意味する。これは、VRAの特徴の包含のための第１の目的がその
ような損失のある圧縮アルゴリズムで構成されたオーディオ品質における知覚可
能な損失の範囲によって間違いなく覆えされることを意味する。

【００１４】したがって、エンドユーザがVRA調整で受け入れることを望んでいる音声品質
について、エンドユーザが最終的な決定を成すための１つであるような損失のな
い、または比較的損失の少ないデジタルオーディオコーデックにおけるVRA包含
技術の圧倒的な必要性がある。

【００１５】任意のデジタルオーディオ設定の消費者(最終聴取者としての)に対するVRA能
力のわかりやすい引渡しを確保する実施例の議論の前に、コンテンツプロバイダ
ーが標準化された方法で新しい‘純粋な音声’コンテンツをアクセスしやすくす
ることができる枠組みについて議論することは役に立つだろう。わかりやすい引
渡しはオーディオプログラムを最終聴取者の再生装置に格納するか、または伝送
するために使用される特定のオーディオ形式(例えば、MP3、DTS、Real Audioな
ど)にかかわらず、VRA能力を最終聴取者に提供する行為を示す。

【００１６】この枠組みは、オーディオプログラムを始めるすべてのパーティーによる芸術
的な長所の最少の損失で過程が起ることを確実にしようとする。パーティーは俳
優、ミュージシャン、スポーツブロードキャスター、ディレクター、およびフィ
ルムのオーディオコンテンツ、音楽録音、スポーツプログラム、ラジオ番組、お
よび他のもののプロデューサーを含むかもしれない。可能な枠組みを提供するた
めに、以前に議論された音声対残りのオーディオの記述をさらに明瞭かつ支持す
る新しい用語を導入することは役に立つであろう。

【００１７】このドキュメントの残りで使用される新しい用語が“純粋な音声”と“残りの
オーディオ”の前の名称を反駁または否定することを意図しない。代わりに新し
い名称は、様々なオーディオプログラムのプロデューサーがコード化、圧縮およ
び復号過程のために適切にこれらの信号を確認することができる枠組みを容易に
するために導入されている。さらに、この議論はプロデューサーまたは２次コン
テンツプロバイダーが“純粋な音声信号”および“残りのオーディオ信号” を
作るのに使用するかもしれないいくつかの可能性を明確にする。

【００１８】純粋な音声/残りのオーディオコンテンツの実施例の１つは、“１次コンテン
ツの純粋な音声オーディオ”と“２次コンテンツの残りのオーディオ”を含むよ
うに定義される。これらの２つのラベルの理由は、オーディオプログラムの創始
者が再生で最終の聴取者によって混合される2つの信号を作成する際に何らかの
芸術的な自由を保持する願望と同様に、最終聴取者のためのVRA機能の意図され
た使用に関連する。まず最初に、最終聴取者のVRA機能の意図された用途を考慮
する。彼らがよりよくプログラムを楽しみ、またはよりよくプログラムを理解す
るように、彼らはオーディオプログラムの不可欠の部分を調整することができる
ことを望む。いくつかの場合、調整は明白になるだろう。例えば、スポーツアナ
ウンサーの音声、またはレフリーの発声は非常に間違いなくスポーツプログラム
のオーディオコンテンツの不可欠な情報である。バックグラウンド、または残り
のオーディオはまたオーディオコンテンツに存在している群衆雑音である。いく
らかの聴取者はゲームによりかかわると感じるようにより高いレベルに群衆雑音
を調整することを願うかもしれないが、他のものは群衆雑音でいらいらするかも
しれない。したがって、１次コンテンツの純粋な音声のオーディオ情報がアナウ
ンサーまたはレフリーの音声であり、２次コンテンツの残りのオーディオ信号は
群衆雑音であると述べるのが率直に思える。

【００１９】１次コンテンツの純粋な音声と２次コンテンツの残りのオーディオ間の区別は
他の多数の状況を作ることを容易にしない。例えばフィルムサウンドトラックを
取ると、一度に数人が話しているフィルムに回数があるかもしれない。時々これ
が起こるとき、彼/彼女がただ1つの音声を聞いてさえ、視聴者は筋の完全な理解
と鑑賞で場面を通して感動することができるかもしれない。フィルムの筋の本質
を保持するために一度にすべての音声を聞くことが必須であるときに、得てして
、他の場面があるであろう。後者の場合では、視聴者がその場面中のフィルムの
全体の芸術を鑑賞するために、すべての音声の混合が１次コンテンツの純粋な音
声コンテンツであると考えられなければならないだろう。したがって、究極のVR
A調整のためにプログラムのどんな部分が聴取者に提供されるべきであるかを彼
らが決めるとき、オーディオプログラムを生成する人々によって保持された大き
い度合いの芸術的な自由があるだろう。

【００２０】非音声のオーディオがその時点でプログラムに不可欠であるとプロデューサー
/芸術家が感じるならば、１次コンテンツの純粋な音声信号が非音声のオーディ
オ音と共に構成されることは可能でさえある。例えば、アラームが鳴りだす音は
、俳優/女優がなぜ非常に突然領域を去っているかということを視聴者が理解す
るために不可欠であるかもしれない。したがって、１次コンテンツの純粋な音声
信号はオーディオプログラムのすべての瞬間に厳密に音声情報として解釈される
べきではないが、この信号はまた他の音の簡潔な部分を含むかもしれないことが
理解される。

【００２１】これは“1次コンテンツのオーディオ(PCA)”情報と呼ばれる第3の定義を動機
づける。これはまた伝送の目的のために重要である。一般的なオーディオに使用
されるより効率的である圧縮アルゴリズムを使用して、スピーチだけのオーディ
オコンテンツを圧縮することが可能であることは、技術に熟達した者によく知ら
れている。これはスピーチだけのオーディオコンテンツの帯域幅を減少すること
に関連する。したがってそれは、信号が‘1次コンテンツの純粋な音声（PCPV/PC
A）’または‘1次コンテンツの音声（PCA）’であるかをプロデューサ−が定義
するコード化の過程の効率及び品質に重要である。信号がPCPV/PCAであると定義
されるときスピーチだけのコード化を許容し、プログラムがPCAとしてフラグを
あげられるとき、これらの瞬間により一般的なエンコーダアルゴリズムに切換わ
ることを許容するように、これはオーディオプログラムが発展するとき変化する
パラメタとしてエンコーダへ供給することさえできる。

【００２２】 PCPV/PCA/SCRA信号生成の別の重要な特徴は、プログラムの様々な点でそれら
の信号のいずれかまたはすべてにおいて空間的な情報の潜在的必要性である。聴
取者が通常中心に置かれたフィルムの音声コンテンツに対して、取り囲まれた位
置から来る情報を聞くことが不可欠である場面があることはほぼ確実である。そ
の能力が提供されないならば、プログラムは何らかの芸術的な長所と、ことによ
ると筋の鑑賞を失う。何らかの不可欠な空間的な情報の包含が信号の多重チャン
ネル再生により収容されることができる。したがって、この発明はまた、1次コ
ンテンツの純粋な音声の多重チャンネルの格納、圧縮、および復号の必要がある
それらの状況を可能にする方法を説明しようとする。

【００２３】過去の15年間のデジタルオーディオ技術の開発は、“デジタル音”を基礎とす
る生成、コード化および復号化過程における多数の方法を導いた。デジタルオー
ディオ信号の多重チャンネルの作成、格納、処理、配送、および再生が現在、何
年間も実行されたことを指摘することが最も重要である。事実上、デジタルオー
ディオにおける最近の傾向は、再生装置に引渡すことができるオーディオチャン
ネルの数が絶えず増加する方向にある。例えば、最新のMPEG-4のデジタルオーデ
ィオ標準(ISO###) に織りこまれた主要な新しい特徴の1つはコード化、ビットス
トリームおよび復号化過程におけるデジタルオーディオの最大64チャンネルを収
容する能力であった。

【００２４】より大きい数のデジタルオーディオチャンネルに向かったこの圧力はこの発行
によって予想されなかった。実施例の非常に重要な部分の特徴は、広くさまざま
な聴取者が新しいVRA調整が提供されるために欲しい(聴覚損傷のない聴取者)、
または必要がある(聴覚損傷した聴取者)認識である。したがって、この認識は、
デジタルマスターの形式が全体のデジタルオーディオ生成の過程を通してPCPV/P
CAおよびSCRA信号の完全性を維持するように、プログラムされた新しいコード化
技術といかに両立性があるかの記述のための必要性を導いた。

【００２５】この完全性を維持することは、聴取者が結局2つの信号のみ、−音声と残りの
オーディオ−の再生の際に調整することができることを確実にするのに不可欠で
ある。PCPV/PCA/SCRA信号を構成するこの行為は、あるレベルで混合として見ら
れるかもしれない。しかしながら、発明は生成の過程の中でPCPV/PCA信号を維持
することを容易にし、その結果その信号単独で対話情報を理解する能力を聴取者
に与える。

【００２６】もう一方の等しく重要な観測は、デジタルオーディオ生成の過程を通して全て
の方法でPCPV/PCA/SCRA信号を得るために必要とした正確な可能な技術が現在存
在しないということである。したがって、以下で議論される最も重要な実施例の
幾つかはそれらの信号の完全性を維持する方法に関連づけられる。これは特別な
ヘッダーデータおよび補助データチャネルの使用によって達成され、それは、１
）入来信号がPCPV/PCA/SCRA情報(すなわち、VRA可能である)を有する任意のエン
コーダに“通知する”；２）PCPV/PCA/SCRAコンテンツが知られている方法でVRA
可能デジタルマスターテープ/ファイルからデコーダへ送られるように、ビット
ストリームをいかに開発するかをエンコーダに指令する；３）そして、再生装置
でPCPV/PCA/SCRA信号をいかに構成、再構成、および/または再生するかについて
デコーダに情報を供給する。

【００２７】発明の実施例について説明する前に、上に提供された新たに記述された用語を
使用するVRA調整の根源の意図をはっきりさせることも役に立つかもしれない。
この発明で提供される解決策の1つが純粋な音声と残りのオーディオ即ちPCPV/PC
A/SCRAのどちらかとして引用される、2つのユニークなオーディオ信号を作成す
ること、そしてそれぞれの信号のボリュームを独自に調整する最終聴取者に容易
に配送することであることを思い出すべきである。したがって、この発明は、結
局最終聴取者がそれらの2つの信号だけのボリューム調整へのアクセスを与えら
れる新しい生成の過程を定義しようとする。

【００２８】前の例から、PCPV/PCA信号が記録された情報の多数のチャンネル(主として、
排他的でないなら、音声コンテンツオーディオ)からオーディオコンテンツを一
緒に混合することによって構成されるとき、回数があることは明確である。しか
しながら、最終結果が2つの個々の信号−PCPV/PCA信号とSCRA信号−だけの作成
であることを評価することは読者にとって非常に重要である。このドキュメント
で後で示される実施例のように、それらの2つの信号が最終聴取者のために最終
的に構成される生成経路に様々な位置がある。例えば、プロデューサーは、それ
らが最初の習得テープであるように録音の過程の間それらを結合することを望む
かもしれない。

【００２９】別の方法は、プログラムの異なった歌手/俳優から多数の音声トラックを記録
して、次に記録後混合セッションの間にPCPV/PCA信号を作成するためにそれらを
結合するかもしれない。別の可能性は、多くのチャンネルでデジタルテープを作
成し、次に、プログラム再生中任意の瞬間にPCPV/PCAまたはSCRA信号を作成する
ために、いかにそれらのチャネルを任意のある混合にダウンミックスするかをデ
コーダに指示するデータチャンネルに沿って送ることである。しかし、これらの
すべての発明的な方法の最終結果は、最終聴取者がVRA調整を可能にする2つの信
号だけを与えられることである。

【００３０】したがって、オーディオプログラム音響技術者によって特定の方法で扱われる
べきPCPV/PCA/SCRA信号のために必要性があることが非常に明らかである。この
とき、VRA調整のためのエンドユーザに、同時になお完全に別々に、1次コンテン
ツ(純粋な音声)のオーディオおよび２次コンテンツの残りのオーディオの引渡し
を可能にするであろうデジタル習得、コード化アルゴリズム、または復号化アル
ゴリズムを組み入れる産業的に定義された方法はない。以下の実施例は、コンテ
ンツプロバイダー、２次プロバイダー、および最終聴取者が、録音とスピーカー
再生の間の任意の段階で利用されるオーディオコーデックの多数の人のために、
VRA調整の最大限の利点を得ることができることを確実にするために開発された
方法を説明する。VRAの過程を可能にする多数の記録保管形式がまた以下で詳細
に記述される。

【００３１】最終聴取者による究極のVRA調整を可能にする例示的実施例の記述が以下に与
えられる。これらの実施例をよりよく評価するため、テレビ、VCRプレーヤー、D
VDプレーヤー、CDプレーヤまたは他の任意のオーディオ再生装置であるか否かに
関係なく、最後の再生装置でPCPV/PCA/SCRA信号の明白な省略を示すためにデジ
タル・オーディオ引渡しの既存の状態を明白にすることが第１段階である。図式
的に、これは図１に示される。図はオーディオプログラムを作るべきである構成
要素プログラムソース110で始まる典型的なオーディオ生成の過程について表現
する。様々な要素は、通常DATレコーダー115で線形、非圧縮オーディオ形式を使
用して記録される。これは非圧縮、非混合デジタルマスターと呼ばれるであろう
。

【００３２】次に時には、ミキサー/エディタ120があり、テレビビューア130または映画ビ
ューア135あるいは他の多数のオーディオアプリケーションに引渡されるべきで
あるオーディオチャンネルを作成するために混合と編集の過程を実行する。例え
ば、そのオーディオコンテンツは左右のステレオチャンネル、L、R、C、LSおよ
びRSを含むいわゆる5.1チャンネル、または２つの付加的サラウンドスピーカー
を加える7.1チャンネルからなる。MPEG4などの最近の標準はさらに大きい数のオ
ーディオチャンネルの能力に備えるが、この時点で広範囲の実行において7.1以
上の他のアプリケーションはない。130と135の方式は混合された非圧縮デジタル
マスター125と呼ばれるであろう。

【００３３】次のステップはオーディオコーデック150に非圧縮オーディオを演じることで
あり、オーディオはおそらく圧縮のある量をとおして、次にビットストリームシ
ンタキシングへ行くであろう。この点で、圧縮され、混合されたデジタルマスタ
ー145を構成することが可能になるであろう。生成の過程は圧縮され、混合され
たデジタルマスター145のコピーを最も典型的に作り、図で示された他の2つのマ
スターテープバージョンに対してコピーのそのバージョンを分配するだろう。次
に、再生装置155がデコーダ150の設定によって、5.1、7.1チャネルなどのステレ
オを再生する。

【００３４】以下に提示されるこの発明の実施例を理解するために、現在の実行が任意のデ
ジタル習得テープ構成を使用するPCPV/PCA/SCRA信号の格納または作成のための
手段を提供しないことに注目することが重要である。したがって、以下のセクシ
ョンの実施例は究極のVRA目的に関するそれらの信号の生成を収容するデジタル
マスターを構成する様々な方法を提示する。

【００３５】 VRA可能なディジタル習得実施例オーディオプログラムのVRA可能なデジタルマスターテープまたはファイルの
異なったバージョンを作成するために必要である可能なステップは図2Aと2Bで示
される。“VRA可能”はPCPV/PCAおよびSCRA信号をはっきりと含み、またはそれ
らの信号の1つまたは両方がデジタルマスターからコピーされた補助データおと
び他のオーディオデータを使用してデコーダレベルで構成されるような十分な‘
VRA補助データ’を含むデジタルマスターテープまたはファイルを言う。図2Aを
参照すると、それらが音楽、フィルム、テレビ番組、映画、または他のものであ
るか否かに関係なく、全てのオーディオプログラムが、マイクロホンを利用して
すべての型のオーディオ情報をリアルタイムで電気信号(図2Aでは‘ライブ’と
して指示される)へ変換し、それはスピーカーに送られまたはアナログかDATレコ
ーダー205のどちらかのトラックとして格納されることがわかる。オーディオ情
報はまた、プログラム210の芸術家および/またはプロデューサーの計画にしたが
って、1次コンテンツのオーディオ信号(PCPV/PCA)212および２次コンテンツの残
りのオーディオ信号(SCRA)214を引出すために使用することができる。

【００３６】 “引出されたオーディオ”ラベルはハードウェアの構成要素と対照的に芸術的
な過程を含み、1つ、2つまたはそれ以上のオーディオトラック205を利用するか
もしれない。図2Aにおいて、これらの2つの信号は、オーディオプログラム215の
ために2チャンネルの、非混合、非圧縮、VRA可能なデジタルマスターを作成する
ためにDATレコーダーへ入力ノード217ですべてのオーディオソース(PCPV/PCAとS
CRA信号を引出すために使用されるそれらを含んでいる)から別々に利用可能なト
ラックのすべてを再結合される。入力ノード217は文字通り信号を一緒に合計し
ないが、デジタルマスターテープ215にそれらを単に結合することに注意を要す
る。デジタルマスター215は、望ましくは、オリジナルのオーディオ信号の品質
を保持するために、線形PCM形式または最適のPCM形式のような、しかしこれらの
特定の形式に限定されないが、非圧縮または比較的損失のない圧縮されたデジタ
ルオーディオ形式を使用して構成される。(線形PCM形式はデジタルオーディオフ
ァイルに使用される周知の非圧縮オーディオ形式である) 。

【００３７】 VRA目的のためのデジタル習得の不可欠の部分は、記録過程に関する一定の詳
細、各チャンネルのためのラベル、2つの信号のための空間的な再生指示、およ
び再生装置225および245でオーディオコーデック230および/またはデコーダによ
って必要とされる他の不可欠の情報を定義する、VRA可能かつ特別な補助データ
としてマスターテープを確認する特別な‘ヘッダー’情報の作成である。ヘッダ
ー情報、およびVRA補助データはこの実施例の寄与している特徴である。句‘オ
ーディオコーデック’は、デジタル情報の圧縮が起り、伝送のある方法がデコー
ダ(通常MPEGベースのISO標準)へビットストリーム過程を通して含まれ、最終的
な復号が圧縮された信号をオーディオスピーカーのためアナログ形式に戻すコー
ド化の過程を言う。ある実施例のために、VRAヘッダーと補助データ情報は、デ
ジタルマスターで作成しかつ格納するのと対照的に、圧縮コード化レベルで導入
された別々のビットストリームとして提供することができる。補助データおよび
ヘッダー情報の実施例は以下のセクションで非常に詳細に議論される。

【００３８】図2AのVRA可能なデジタルマスターの非圧縮バージョンが一度完全されると、
非圧縮デジタル形式のPCPV/PCA/SCRA信号をオーディオプログラムのために復号
することができるVRA可能なプレーヤー225で再生する前に、マスターテープのデ
ジタル情報は非圧縮オーディオファイル形式220として分配のためにコピーされ
ることができる。例えば、従来のCDオーディオは再生のために非圧縮、線形PCM
データファイルを使用する。これは、CDプレーヤがオーディオ情報がVRA可能か
否かを認識することを備えられ、かつPCPV/PCA/SCRA信号を収容することを備え
られることを必要とするかもしれない。

【００３９】第２の代替手段として、デジタルマスターファイルコンテンツは、最小スルー
プットレートおよび格納要件を使用される任意の数のオーディオコーデック230
を使用して圧縮することができる。オーディオコーデックのエンコーダ機能の出
力は、オーディオファイル235の圧縮されたバージョンが図2Aに示されるように2
40で記録保管され、多重コピーで再生成される中間的ステップで使用されるかも
しれないことに注意することが重要である。再び明快のため、VRA可能でないデ
ジタルマスターからこのような圧縮され記録保管されたファイルの現在の実施が
、スーパーCDやDVDオーディオのような周知のメディア形式に対応することを我
々は注意する。

【００４０】また、圧縮されたVRA可能なデジタルマスターの記録保管されたバージョンは
、CDメディアまたはDVDオーディオメディアにあるかもしれない。しかしながら
、VRA可能なデジタルマスターの記録保管されたバージョンにおけるPCPV/PCAお
よび/またはSCRAチャンネルの包含は、音声および残りのオーディオ信号の適切
な再生を確実にするために、この発明で記述される特徴を必要とする。明確に、
圧縮され、VRA可能な、記録保管されたファイル240は、PCPV/PCA/SCRAオーディ
オ信号を復号し、VRA調整を容易にする特定のVRA可能な再生装置245にアクセス
しやすく作られることができる。

【００４１】第２の代替手段は、コーデックのコード化の過程による圧縮の後に、コーデッ
クによって使用される特定の圧縮アルゴリズムに従ってVRA可能なデジタルオー
ディオ情報を復号するために構成した再生装置に、直接種々の放送手段に沿って
伝送される情報のためにある。例えば伝送は、両立性VRAアウエアデコーダがオ
ーディオ情報を受信し、VRA調整を容易にするPCモデムへのISDN伝送であるかも
しれない。

【００４２】図2BはVRA能力に必要であるオーディオの過程のわずかに異なった実施例であ
る。この構成の違いはデジタルマスター255がまだPCPV/PCAまたはSCRA信号260を
含んでいないということである。代わりに、デジタルマスター255は、録音産業
においてこの時点では普通である同様な方法で、‘n’記録され、非変更のオー
ディオトラックから成ることができる。PCPV/PCAおよびSCRA信号260を引渡され
た芸術家−プロデューサーが、芸術的な長所とオーディオプログラムのコンテン
ツによって定義される混合過程を通して、普通(即ちVRA可能でない)のデジタル
マスター255のダウンストリームを作成する。

【００４３】これらの信号の混合の実施は以下のセクションで議論するVRA可能コード化過
程を使用して実行されるだろう。この点において、デジタルマスター255およびP
CPV/PCA/SCRA信号260からの変更されないトラックは、VRA可能なオーディオコー
デック265によってコード化され、再生装置280は図2Aの実施例で議論されたのと
同じ方法でこれらの信号にアクセスを持つだろう。この実施例に関して、VRA可
能なデジタルマスターの非圧縮バージョンは決して存在していない。オーディオ
プログラムのプロデューサーがユニークなPCPV/PCA/SCRA信号を指定し、混合す
ることの追加のタスクを２次プロバイダーに渡したいと願うならば、このアプロ
ーチは好まれるかもしれない。

【００４４】第3の可能な実施例は、デジタルマスターに収納される非PCPV/PCAチャンネル
の何らかの組み合わせとして、SCRA信号のコンテンツを指定するのが望ましいか
もしれないという知識によって動機づけられる。これは図3で示される。このよ
うな場合、PCPV/PCA信号だけが非圧縮デジタルマスターの作成の前に作成され、
それは他のオーディオ情報に沿ってマスターに格納される。この実施例に関して
は、特別なVRA補助情報(データ)は、その情報がデジタルマスターに収納される
非PCPV/PCAオーディオチャンネルのある組み合わせからSCRAチャンネルをいかに
構成するかを指定するマスターにデジタル的に含まれるであろう。その情報はVR
A可能デコーダへ伝送のため任意のダウンストリームコード化過程に提供される
だろう。VRA可能デコーダは次に、補助データで指定されたダウンミックスパラ
メタを使用してリアルタイムにSCRAチャンネルの作成のため応答可能である。(S
CRAチャンネル生成を指定するさまざまな方法があり、これらは後でVRAエネイブ
リングオーディオコーデックの特徴について説明するセクションで議論されるで
あろう) 。図3の議論の結果として、非圧縮デジタルマスターオーディオコンテ
ンツ320は、‘1チャンネルのVRA可能な’デジタルマスターを作成する。

【００４５】一層の明確化のため、ダウンミックスする動作が明確に新しくなく、毎日オー
ディオ工学で使用されることが注意されるべきである。代わりに、ここに記述さ
れる革新は、容易な2信号VRA調整のために、さらにPCPV/PCV信号と結合されるた
めに、２次コンテンツの残りのオーディオの構成を可能にするVRA補助データの
作成と伝送に関連する。

【００４６】図3はVRA可能デジタルオーディオマスターテープまたはファイルの実施例の異
なる展望を示す。オーディオデータが同じテープ上のビデオデータと混合される
かもしれなく、したがって、VRA可能なデジタルオーディオマスターテープが必
ずオーディオだけのテープ形式としてに解される必要がないことに注意すべきで
ある。したがって、全体のデジタル習得議論はフィルム、予め記録されたテレビ
番組、または音楽の録音のためのデジタルマスターに等しくよく適用する。

【００４７】図3に示される実施例は、‘ポストミックス’VRA可能なデジタルマスターテー
プ315と呼ばれるだろう。この実施例に示されるように、PCPV/PCA信号は任意の
数のオーディオチャンネル（図においてアナログ信号として考慮される）からの
オーディオコンテンツを混合することにより作成され、SCRA信号は、信号が左、
右、左周囲、右周囲、中央、および低周波数効果チャンネルのために作られたオ
ーディオコンテンツと並んで、別々なチャンネルとしてディジタル化される前に
、‘残りのオーディオ’であるように考慮された幾つかの他のオーディオコンテ
ンツを混合することにより作成される。情報の8つのトラックが、デジタルテー
プに非圧縮オーディオ形式(例えば、線形PCMに制限されない)を使用して格納さ
れる。

【００４８】図3で示される別の実施例は、‘プレミックス’VRA可能デジタルマスターテー
プ320と呼ばれる。この構成では、VRA可能なデジタルマスターの生成は、デジタ
ル録音が習得される前にPCPV/PCAおよびSCRA信号が既に混合されることを必要と
するだけである。示されるように、現在、‘n’チャンネルがあり、ここに‘n’
はデジタルマスター上に存在するかもしれない任意に多数のオーディオチャンネ
ルを言う。この構成は、オーディオプログラムのためにステレオまたはサラウン
ドチャンネル音に使用されたダウンミックス過程で後に使用されなければならな
いある型のデジタルマスターに必要であるかもしれない。しかしながら、1次コ
ンテンツの純粋な音声と残りのオーディオはデジタルマスター上にそのようにあ
らかじめ混合されかつ収納される。

【００４９】図4A-Eに示されるように、VRA可能デジタルマスターテープ(ファイル)の多数
の実施例があることが明確である。VRA可能なデジタルマスターのすべてのバー
ジョンは、VRA可能としてマスターを確認する特別なヘッダーファイルを備える
であろう。次のセクションでヘッダー形式について議論する。プレミックスされ
た、非圧縮された、nチャンネルのVRA可能なデジタルマスターが図4Aに示される
。この場合、デジタルマスターは生成の間に記録されるオーディオの‘n’チャ
ンネルから成る。それらのnチャンネルの何らかの組み合わせによって、PCPV/PC
A信号とSCRA信号(図4Bと4C)の構造を指定することが可能であるだろう。

【００５０】これを達成するために、VRA補助データチャンネルが生成の復号終了でそれら
の指示を提供するマスター上に作成されかつ収納されることができる。したがっ
て、デジタルマスターは‘0チャンネル、非圧縮、プレミックスされたVRA可能な
デジタルマスター’であると考えることができる。用語の0チャンネルは、明ら
かにPCPV/PCAまたはSCRA信号を含むマスター上にどんなトラックもないという事
実を示す。ここに不可欠の点は、テープが、それらの信号が明らかに収納されて
いなくてさえ、再生装置の制御をしている究極の最終聴取者によりVRA調整を可
能にすることができる十分な情報を有することである。

【００５１】また、他の可能な実施例の一般的な図が図4A-Eで示される。最も明白な実施例
は図4Dと4Eに示される。デジタルマスターのこれらのバージョンは、それぞれ‘
1チャンネル、ポストミックス、非圧縮のVRA可能なデジタルマスター’ (図4E)
、および‘2チャンネル、ポストミックス、非圧縮のVRA可能なデジタルマスター
’ (図4D)であるように構成されることができる。ポストミックスバージョンに
おいて、我々は、5.1ミックスチャンネル、または7.1ミックスチャンネル、ある
いはPCPV/PCA信号だけ(1チャンネルのバージョン)かPCPV/PCA信号とSCRA信号の
両方のどちらかに加えて、大きい数の空間的なチャンネルの典型的なステレオ信
号を見出す。この状況において、VRA補助データチャンネルが、オーディオプロ
グラムが進歩しながら2つの信号のどちらかの空間的な位置決めを提供するよう
に使用されるべきである特別な再生特徴について、デコーダに指示するためにあ
るかもしれない。

【００５２】図4Dと4EはVRA補助データと共に収納されたPCPV/PCA信号だけを有する他の実
施例である。この場合、補助データはSCRA信号、PCPV/PCAおよびSCRA信号の再生
、および後で記述される他の機能をいかに構成するかを定義するだろう。

【００５３】このデジタル習得議論を結論づけるために、デジタルオーディオに熟練した者
が図2A、2B、3、および4A-Eで明らかに示されたものよりも他の実施例を確認す
ることは明確である。例えば、この発明で直接定義されるように上で記述された
実施例のすべての圧縮されたバージョンを考えることは簡単である。重要な区別
はまた、すべてのVRA可能デジタルマスターバージョンがVRA可能なマスターを確
認するある種のヘッダーを含み、それがPCPV/PCA/SCRA信号のためにある特性、
構成の技術、または再生の技術を定義する補助データ信号を含むことである。し
たがって図に示されたデジタルマスター方式は、この発明で意図されVRA可能な
デジタルマスター構成を可能にするのみと解釈されるべきでない。

【００５４】今までのところ、上の記述は、包括的なVRAエネイブリング過程が3つの異なっ
た領域と同様に、その全体的長所にしたがってデジタルオーディオ処理技術を改
良することを明らかにした。

【００５５】 1) 1次コンテンツの純粋な音声オーディオ信号が、プログラムの筋または叙
情的な意味の鑑賞における僅かなまたは損失のない、オーディオプログラムの音
声コンテンツの改良された明瞭さおよび/または楽しみを可能にする信号に供給
するために構成された過程であって、前記過程はまた、オーディオプログラムの
芸術的な長所および/または楽しみのための改良された鑑賞を可能にするが、プ
ログラムの筋または叙情的な意味の明瞭さまたは鑑賞における評価できる改良を
提供しない残りのオーディオ信号の２次コンテンツの構造を含む過程。

【００５６】 2）非圧縮または損失のない/比較的損失の少ない圧縮された形式を使用し、
前記形式が最適の音声品質、およびオーディオ品質を犠牲にする非常に圧縮され
たオーディオ形式(>8: 1)に基づいてVRA可能習得および/または伝送の際に低下
させる最適の残りのオーディオ品質を保持するために適用される、いわゆる0チ
ャンネル、1チャンネル、および2チャンネルの‘VRA可能なデジタル習得テープ
の創作。

【００５７】 3）デジタルオーディオ伝送および/または記憶保管のオーディオファイル格
納を発生させるために使用される任意の数の損失のないおよび比較的損失の少な
いオーディオコーデックにおける1次コンテンツの純粋な音声と２次コンテンツ
の残りのオーディオチャンネル、VRAヘッダー、および/またはVRA補助データを
収容すること。

【００５８】今デジタル習得の過程が定義され、以下に記述される特定の実施例は、AC3の
クラスにおけるコーデックに関連づけられる損失と比べて、損失のないおよび比
較的損失の少ないことが知られているあるオーディオコーデック操作(コード化/
圧縮と復号を含む)で、PCPV/PCAおよびSCRA信号の包含を可能にする特徴に焦点
をあてるであろう。

【００５９】 VRA可能なオーディオプログラムのためのディジタル習得特徴最終聴取者へのVRA調整能力を供給する願望は、プログラムのオーディオコン
テンツに関して芸術的な目標と理想的に両立すべきである。したがって、この発
明の1つの特徴は、両方の目標(VRA能力を供給し、芸術家がオーディオプログラ
ム上で芸術的なライセンスを保持するのを許容する)が両立される過程について
説明しようとする。芸術的な長所の保持は、プログラムが年代順に発展するとき
、あるオーディオ信号の様々な混合により続く1次および２次コンテンツのため
の計画の幾らかの程度をほぼ確実に必要とするだろう。カスタム設計された1次
コンテンツの純粋な音声チャンネルと２次コンテンツの残りのオーディオチャン
ネルの特定の混合と録音は、どんな型のオーディオプログラミングも前例がない
。

【００６０】したがって、発明のこのデジタル習得態様は、それがデジタルマスターのPCPV
/PCA/SCRA信号を含み、かつVRA可能なデジタルマスターのそのようなPCPV/PCAと
SCRAチャンネルに関する不可欠な情報(位置、サンプリング率、形式、再生パラ
メタなど)を記述する特別な‘ヘッダーファイル’および/または‘補助データ’
コンテンツの対応する習得である必要を含む状況に関係する。

【００６１】これまで、デジタルオーディオの到来は、増加する数のチャンネルを当てにす
る音の空間的な位置付けの新しい方向にほとんど関係された。デジタルオーディ
オのこの多重チャンネルのサラウンド音の使用は、過去の数年のより通常のステ
レオ伝送と比較して、増加する数のオーディオチャンネルの格納および伝送を導
いた。VRA可能なオーディオファイルと伝送は、PCPV/PCAとSCRA情報に必要であ
る余分なチャンネルのために格納と伝送要件をさらに高く押し上げるだろう。革
新的なVRA可能オーディオコーデックは、余分なスループットの繰り返しを最少
にするために定義されるだろう。さらに、デジタルマスターのVRA形式の存在は
、デジタル的に記録されたマスターから引渡される入来ビットストリームを圧縮
/伝送/復号するために使用される任意のオーディオコーデックにより、VRA可能
オーディオファイルとして‘確認’されることを必要とするであろう。デジタル
マスターがVRA可能としてフラグを揚げられなければならない2つの不可欠の理由
がある。まず最初に、PCPV/PCAチャンネルは特定のスピーカー位置で再生される
必要があり、したがってそのチャンネルは、正確な時間的/空間的な再生手順を
記述する補助データで時間整合されなくてはならない。第２に、図3に示される
ように、SCRAチャンネルはデコーダによって構成されることが必要であるかもし
れない。また、その信号を作成するための指示はVRA補助データにプログラムさ
れるだろう。我々はまた、それが復号過程に入るときにVRA補助データを収容す
るために発明的な方法があることに注目する。例えば、それはVRA可能オーディ
オのためのnチャンネルビットストリームの埋め込まれた情報として導入される
か、または全く別なチャンネルとして送られるかもしれない。

【００６２】オーディオコーデックのPCPV/PCAおよび/またはSCRA信号の収容以下で記述される実施例は、‘VRA可能’ デジタルマスターテープまたはファ
イルの前に定義されたオーディオ情報を使用して、1次コンテンツの純粋な音声
信号と２次コンテンツ残りのオーディオ信号が最終聴取者に到達することを可能
にする。前のセクションにおけるデジタル習得議論は、非圧縮か圧縮されたオー
ディオ形式のPCPV/PCAとSCRAチャンネルの格納とデジタル‘タグ付け’について
説明した。マスターに記憶されたオーディオの非圧縮形式と比較的損失の少ない
圧縮(圧縮比<8:1)は、オーディオ生成過程の習得終了で問題なく、オリジナルオ
ーディオ信号の忠実性を維持するために必要とされた。デジタルオーディオ圧縮
はオーディオデータのより効率的な格納および伝送を可能にする。オーディオ圧
縮技術の多くの形式は、エンコーダおよびデコーダの複雑さ、圧縮されたオーデ
ィオ品質、およびデータ圧縮の異なる量の範囲を提供する。今、発明のこの態様
は３つの部分：損失のない圧縮および比較的損失の少ない圧縮アルゴリズムに基
づいたコード化方法、VRA補助データにより供給される補助情報の使用、および
非圧縮のVRA可能なディジタルマスターに存在するヘッダーファイル（即ち、い
わゆる‘ディジタルタグ付け’）のコード化に関係する。ISO MPEG IIおよびMPE
G IV標準は比較的損失の少ない圧縮アルゴリズム（即ち、<8:1)に頼り、そのた
めMPEGオーディオ形式はVRAエンコーダおよびVRAデコーダを含むある特徴を示す
ように使用されるであろう。このセクションに記述された実施例が他のオーディ
オ形式にも適用可能であることが明白にされる。通常の技術が、この文書の前に
詳細に記述された、いわゆるPCPV/PCA、SCRAおよびVRA信号の存在および特別な
データの取扱いにより定義されたように、VRAコード化またはVRA復号化の使用を
教示しないことがまた注目される。

【００６３】圧縮されたVRA可能なディジタルオーディオの実施例は損失のない圧縮の一般
的場合として記述されるだろう。用語、損失のない圧縮は、受信された圧縮され
た信号を復号するとき、非圧縮デジタルオーディオマスター上にあったオリジナ
ルオーディオ信号を全くデータの損失なしで再作成することが可能であるという
事実を示す。従来の技術は、入来PCMデータストリームにおける、PCPV/PCAまた
はSCRA信号のどちらかの存在を認識するように設計されるオーディオコーデック
の存在を含んでおらず、音声だけの信号(すなわち、PCPV/PCA信号)の低帯域幅の
利点を取るオーディオコーデックも存在していない。

【００６４】したがって、以下の実施例に提供される記述は、多数のユニークな特徴を提供
し、それは：VRA可能な非圧縮デジタルオーディオファイルの自動認識によるコ
ーデックの使用; スピーチ信号のために特に設計されたオーディオ圧縮アルゴリ
ズムを使用しているPCPV/PCAチャンネルの他と全く別な処理、より一般的なオー
ディオ圧縮アルゴリズムおよびデコーダでの再混合を使用して圧縮される他のオ
ーディオトラックと同期された時間、損失のない圧縮アルゴリズムを使用するVR
A可能デジタルオーディオ情報の圧縮、AC3アルゴリズム(圧縮比8:1以下を意味す
るようにここで指定される) より多いディジタルデータを保持する損失のある圧
縮アルゴリズムを使用するVRA可能なデジタルオーディオの圧縮、VRA可能なデジ
タル1チャンネルのマスターの場合のSCRAチャンネルのための製作指示、特定の
スピーカへPCPV/PCAおよびSCRAチャンネル情報を割当るため、VRAデコーダによ
って使用される再生位置の仕様、PCPV/PCA信号の任意の必要な空間的な位置決め
の方法、および既に存在している種々のオーディオコーデックにPCPV/PCAとSCRA
チャンネルを組み込むVRA可能なエンコーダの特定の特徴を含む。

【００６５】図5は全般に損失のない圧縮アルゴリズムに基づいて発明のこの部分の主要な
概念を示す基本的なブロックダイアグラムを示す。(損失のない圧縮アルゴリズ
ムに関する1つの例がメリディアンロスレスパッキングMeridian Lossless Packi
ng(MLP)アルゴリズムである) 。この例に関しては、非圧縮VRA可能なデジタルマ
スター510がVRAオーディオコーデック520に入力されるように使用される。ここ
での区別は、コーデック520のコード化および復号化の終了で使用されるVRA可能
エンコーダ530とVRA可能デコーダ530がそれぞれなくてはならないということで
ある。VRA可能デコーダ535の出力、およびしたがって、オーディオコーデックの
出力は、最終聴取者により独自に調整することができる音声と残りのオーディオ
信号になるだろう。次に、オーディオコーデック520のVRA可能な構成要素につい
て議論する。

【００６６】 VRA可能なエンコーダ VRA可能なエンコーダの概念的な実施例が図6で示される。この図は1チャンネ
ル、n圧縮された、プレミックスVRA可能なデジタルマスター610の前の記述に依
存する。しかしながら、たとえVRA可能なデジタルマスターのどんな形式が入力
のときにオーディオコーデックに導入されても、記述の本質は同じままである。
図6のダイヤグラムは、プレミックスされたPCPV/PCA信号が他のオーディオ情報
の‘nチャンネル’と一緒にエンコーダの損失のない圧縮アルゴリズム630に送ら
れることを示すように意図される。また、VRAの補助データ620にある予め記録さ
れた情報がエンコーダに送られるかもしれない。また、ソフトウェアインタフェ
ースが、生成過程の混合/コード化/圧縮段階でVRA補助データ640のすべてまたは
付加的部分を作成するために使用されるかもしれない。この特徴はプロデューサ
ーがタスクを下請けするかもしれない２次プロバイダーにVRA創作タスクを回す
ことを許容するであろう。

【００６７】最終的に、圧縮され、ことによると混合されたオーディオおよび補助データは
圧縮形式で格納され、またはエンコーダの過程の一部として作成されたISOビッ
トストリームとしてデコーダに伝送される。それらがこの段階でプレミックスさ
れるならば、PCPV/PCA信号とSCRA信号は、現在デジタルオーディオの技術に熟練
した者のだれによっても実行される方法でMPEGベースのビットストリーム標準に
組立てられるだろう。図7は図6で示されたのと同様の図である(特徴の記述は繰
り返されない)。例外はデジタルマスターが2チャンネルのVRA可能形式であると
いうことである。コーデックへの入力におけるSCRA信号の存在を除いて、記述的
特徴は図6のためのそれらの議論と同じである。

【００６８】図8-11は以下の何らかの組み合わせに依存するVRA可能エンコーダのための4
つの異なった実施例の特別な構成：一般的なオーディオ信号の損失のないか比較
的損失の少ない圧縮のためのアルゴリズム、スピーチだけ圧縮のアルゴリズム、
VRAヘッダーと補助データ情報の正確な処理、およびVRA可能なデジタルマスター
の何らかの形式の入力である。これらの様々な特徴の様々な組み合わせがここに
言及することができないくらい多数であるが、この発明で概説される意図で総合
的なVRA可能オーディオ生成の過程とすべて一致していることが強調される。

【００６９】最初に図8を参照すると、2チャンネル、ポストミックス、非圧縮、VRA可能な
デジタルマスター810がVRA可能エンコーダへの入力としてに示される。左、右、
中央、左の周囲、右の周囲、SCRA、およびPCPV/PCA信号がデジタルマスターのこ
の形式のために既に混合され、‘一般的な’オーディオコーデックの圧縮アルゴ
リズム820によって圧縮される。アルゴリズム820は知覚ベース、または冗長ベー
ス、あるいは帯域幅に配慮することなく圧縮に導く他の技術であってもよい。

【００７０】 VRA補助データは、圧縮アルゴリズムによって作動され、次に標準ベースの手
順を用いてISO ビットストリームに配列される。例えば、MPEG-2 AAC(高度なオ
ーディオコーデック、ISO/IEC 13818-7)は、標準が支持する15の埋め込まれたデ
ータストリームの内の1つを通してVRA補助データを分配するように使用される。
補助データを整列する他の方法があり、それらの方法は技術に熟練した者に周知
のことである。コーデック800の出力は、2チャンネルマスターの圧縮されたバー
ジョンを格納するのに使用することができ、マスターは次に、分配のための再生
を作成するのに使用されるだろう。代わりに、ビットストリームは、PCのメディ
アプレーヤーのように再生装置のデコーダに直接伝送されることができる。

【００７１】図9によって意図される過程は、2つの区別を除いて図8の前のものと同様であ
る。まず最初に、PCPV/PCA信号は、他のオーディオ信号が一般的な圧縮アルゴリ
ズム820を使用することで圧縮されるが、スピーチだけコーデック920で圧縮され
る。スピーチコード化は、G.722コーデックや符号励起線形予測Code Excited Li
near Predictive(CELP)コーデックなどのいくつかの知られているスピーチコー
デックの任意の1つを使用して行うことができる。スピーチだけのコーデック920
を使用するPCPV/PCA信号の圧縮と一般的なコーデックを使用する他のオーディオ
信号の圧縮の間のこの区別は、VRA可能ビットストリームと格納要件のために必
要な帯域幅を減少させるのを助けるだろう。

【００７２】開示されたVRA可能エンコーダは、累積している情報(PCPV/PCA、SCRA、VRA補
助データ)が含まれるこの方法であり、その結果VRA可能オーディオ伝送のための
帯域幅要件を減少する2段圧縮アプローチと同様に、VRA可能なオーディオ形式を
作ることが注目されるべきである。この図の第２の重要な区別は付加的な‘nオ
ーディオチャンネル’の存在である。この実施例は、再生でPCPV/PCAまたはSCRA
信号を高める付加的オーディオチャンネルについて必要があるかもしれない状況
を収容する。それらの付加的な信号は一般的な圧縮アルゴリズムによって圧縮さ
れ、どんな特別な再生要件も補助データストリームによって定義されるだろう。

【００７３】図10と11は1チャンネル、非圧縮、混合されたVRA可能なデジタルマスターを圧
縮に導く2つのVRA可能エンコーダ構成を示す。前と同様、PCPV/PCA信号(図10参
照)のためのスピーチだけのコーデックを使用することが望ましく、エンコーダ
は、図11で示されるすべての信号について一般的なオーディオ圧縮アルゴリズム
を使用するために設定されることができる。

【００７４】図12はVRA可能コーデックのためのある概念的な構造の第２の表現を示す。こ
の表現の本質は、PCPV/PCA信号にある音声の情報がスピーチだけの圧縮アルゴリ
ズムを使用して圧縮され、SCRA信号がより一般的で、広い帯域幅のオーディオ圧
縮アルゴリズムを使用して圧縮される図9と10の実施例と似ている。図12を参照
すると、要素1210および1220は、圧縮前のそれぞれPCPV/PCAとSCRA信号のデジタ
ル表現であり、従来のLPCM形式と同様である。デジタル情報が指示されたような
WAVファイル、または非圧縮デジタルオーディオファイル他の幾つかの形式とし
て利用可能であるかもしれないことに注意すべきである。2つのオーディオスト
リームが、前のオーディオ圧縮構造上の重要な区別であるこの段階に並列である
ように考慮される。

【００７５】対照的に、従来のオーディオ圧縮の過程は、圧縮アルゴリズムに音声と非音声
の要素の両方を持っている直列の、単一チャンネルのオーディオストリームを与
えることであるだろう。直列のビットストリームが、1次音声または1次非音声で
あり、異なったサンプリング速度をもたらし、直列のビットストリームのコンテ
ンツとして恐らく異なった圧縮アルゴリズムさえ1次音声と非音声の間で異なる
ときに、認識することが可能である。

【００７６】したがって、従来の技術は図12で示される実施例よりも全く異なっている。図
12において、圧縮ユニット1250と1260の並列な配列によって示されるように、2
つの並列な流れが全ての時間に、2つの異なった圧縮アルゴリズムに供給される
。スピーチだけの圧縮ユニット1250は技術に熟練した者に知られているどんな圧
縮アルゴリズムも含んでいる。PCPV/PCA情報はその圧縮ユニット1250に入力され
、1220にあるSCRA信号は、圧縮ユニット1250の音声だけの圧縮と共にまさに並列
(PCPVとSCRAの間で時間的同期された)にある方法で一般的なオーディオ圧縮ユニ
ット1260に入力される。

【００７７】また、オーディオは、例えば主要な映画の対応するビデオおよびオーディオコ
ンテンツのように、時間的同期および関連するビデオコンテンツにビデオフレー
ム同期されることが考慮される。圧縮ユニット1250と1260の出力は、1285により
特別な方法で多重化され、その結果飛び越し走査されたVRAオーディオは、中間
ファイルとして記憶され、または何らかのデジタル媒体1295により伝送すること
ができる。逆多重化過程1290は、それぞれ逆圧縮(decompression)ユニット1270
と1280によりそれぞれ逆圧縮のため別々のPCPV/PCA情報とSCRA情報を開く。最終
的に、逆圧縮されたPCPVとSCRA情報が記録保管され、この段階で望ましい、また
はよりありそうなら、以下で議論する図13の記述と同様に、別々のボリウム制御
のため再生装置に直接送られるであろう。

【００７８】図12においてまた、VRAコーデックが作成され、それは実際に任意の他の既存
の音声だけまたは一般的なオーディオ圧縮と逆圧縮アルゴリズムと両立可能であ
る。我々は、PCPVとSCRA信号の並列な入力構造を収容するマルチプレクサ1285の
ユニークな操作により、圧縮ユニット1250と1260が音声だけおよび一般的なオー
ディオ圧縮のそれぞれのクラスにおいて、アルゴリズムを使用することができる
ことを強調する。さらに、マルチプレクサ1285は、これらの部分の安全な伝送を
提供するために、PCPV/PCA信号および/またはSCRA信号のどちらかのために暗号
ユニットまたはアルゴリズムを含むことができる。信号の暗号化は技術に熟練し
た者に知られているどんな技術によっても実行することができる。

【００７９】 VRAの補助データチャンネルの作成、コンテンツ、および機能性補助のチャンネル自体は1次コンテンツの純粋な音声(PCPV)オーディオ信号と
２次コンテンツの残りのオーディオ(SCRA)信号に関するさまざまな情報から成る
だろう。以下にそのデータを作成することができるそれらの特徴、それらの機能
性、および方法について議論する。

【００８０】 VRA可能なプログラムの存在−得てして、ヘッダーファイルの中に含まれるよ
うに、この情報はオンまたはオフを表示しているシングルビットとして表現する
ことができる。ビットが1であるならば、VRA可能なプログラムは、前に記述され
た(すなわち、PCPVとSCRAオーディオが存在している) VRAオーディオ形式を使用
して作成される。オーディオ技術者がVRA生成の技術を使用すると、このビット
は生成レベルにおけるソフトウェアかハードウェアスイッチによって設定される
だろう。別の方法で、オーディオプログラムは通常の混合習慣に基づくように考
慮される。

【００８１】 PCPVとSCRAチャンネルの数―この情報は、それぞれのチャンネルの１つより多
くの表示が存在しているフラグによって先行されることができる。それがそのよ
うに表示されるならば、さらなる情報がPCPVとSCRAプログラムの各々に利用可能
である空間的なチャンネルの数として提供される。ここにこの数に設定される特
別な制限はなく、再生ハードウェア(例えば５つのスピーカー=5つの利用可能な
チャンネル) に依存しているようである。これらの数は、いかに多くのオーディ
オチャンネル(例えば、3PCPVチャンネルと5.1SCRAチャンネル)が復号のために存
在するかをデコーダに伝える。オーディオ生成技術者は、各場面に与えられる芸
術的な解釈に基づいて、２つのオーディオプログラム(PCPVとSCRA)の各々を作成
するためにデコーダに要求されるチャンネルの数を指定するだろう。帯域幅を保
存するために、利用可能なオーディオチャネルの数がプログラム内またはプログ
ラム間で変化するなら、チャンネルのPCPVとSCRA数を含むデジタル語が時間の関
数として変化するかもしれない。

【００８２】生成ミックスデータ−PCPV/PCAおよびSCRA信号をいかにして構成するかに関す
る振幅と空間的な情報との両方がこのデータブロックの一部としてコード化され
ることができる。復号されたオーディオプログラムを有する再生と結合されたこ
の情報は、オリジナルの生成混合を再現するであろう。（この発明のための究極
の目的は最終聴取者がVRAを調整するのを許容することであるが、ユーザによる
調整が適用されるまえに提供されるなら名目上の再生指示が必要とされるであろ
う。他の方法で述べれば、エンドユーザによる任意の調整が出発点として生成混
合レベルに作動するであろう）。続いて、例として、前のデータ(PCPVとSCRAチ
ャンネルの数)が、２つのプログラムの各々の１つ(1つのPCPVチャンネルと１つ
のSCRAチャンネル)が利用可能であるデコーダに指示されるなら、生成ミックス
データは、両方の信号がセンタースピーカーの上でPCPVレベル1.0およびSCRAレ
ベル1.2(例えば)で再生されるべきであることを示すだろう。

【００８３】したがって、プロデューサーのオリジナルの意図は生成の過程の混合段階で実
行される実際のボリュームレベルとバランス調整の使用を通して実現される。代
わりに、この発明の結果として、最終の聴取者は今やオリジナルの生成混合を乗
り越えてかつオーディオのままで残る音声の彼自身の混合を作成する能力を受け
る。この生成ミックスデータ(すべてのPCPVとSCRAチャンネルのための振幅情報
だけではなく、同様にすべてのチャンネルのためのの空間的な情報も含むだろう
)を継ぎ目なく統合するために、空間位置制御と振幅制御のノブ位置を検出し、
時間の関数としてVRA補助データチャンネルに直接その情報を移すソフトウェア
アルゴリズムを設計することが可能である。

【００８４】前の例を続行して、プロデューサーはプログラムの時間中、SCRAがPCPVと比べ
て柔らかくあるべきであるとして、SCRAオーディオを低下するかもしれない。こ
の動きおよびその後の新しいレベルはアルゴリズムによって検出され、VRA補助
データファイル形式に変形されるデータファイルに記録される。また、振幅生成
ミックスデータはユーザにPCPVとSCRA信号の両方のために別々に異なるプログラ
ム中で自動的に一様性を確立させるだろう。これは音声を残りのオーディオ(こ
の情報が利用可能でないならば、音声をあいまいにすることができる)と同様に
商業およびプログラム間の一定のSPLに残すことを許容するだろう。

【００８５】また、プロデューサーがPCPVとSCRA信号(多重チャンネルまたはそうでない)を
作成し、その結果直線的に加算されるとき正確な生成混合が作成されるならば、
デコーダエンドに生成混合のレクリエーションのための増幅と空間的な位置情報
のすべてを伝える必要はないことに注意されるべきである。このデータがVRA補
助チャンネルに含まれていないなら、デコーダはオリジナルプログラムの正確な
生成混合再生をもたらす生成混合のために直線的組み合わせを自動的に不履行に
するであろう。

【００８６】 PCPVとSCRAの特定のメタデータ−二元プログラムオーディオ(PCPVとSCRA)と利
用可能な再生の特徴をさらに高めるために使用することができるさまざまなメタ
データがある。まず最初に、デコーダが再生中にPCPVとSCRA信号の両方のレベル
を調整するために、過渡現象の存在においてレベル情報が含まれるかもしれない
。これは単に、PCPVとSCRAの両方の実際のオーディオと時間同期しているデータ
ファイルにその出力を移す信号強度検出器を含むであろう。ある型のプログラム
過渡現象の間SCRAがPCPVをぼかさないように、互いに関して各信号ボリュームレ
ベルを自動的に制御するため、復号の過程がこのデータを利用することができる
。PCPVとSCRAチャンネルの両方の動的な範囲情報がまた、同様の過程でコード化
されることができる。これはユーザが再生上、2つの信号(SCRAとPCPV)の各々の
動的な範囲を別々に制御することを許容し、その結果、聞くに十分大きなささや
き(拡大)、または妨害しないほど十分に柔らかい爆音(圧縮) を許容するであろ
う。これに対するキーは両方の信号が独自に制御されることができることである
。プログラムプロバイダーが、生成中補助データビットストリームの一部として
この情報を入力しながら応答可能であるか、またはソフトウェア駆動アルゴリズ
ムが時間につれて信号強度を決定することができ、かつそのようなデータを自動
的に発生させることができる。

【００８７】標準のメタデータビットストリームにおけるVRA補助データチャンネルの包含上で詳細に議論した補助データビットストリームのコンテンツは任意の通常の
CODECにおけるメタデータの新しい部分として含まれるかもしれない。通常商業
上のCODECのものは、2つの型の情報：オーディオとメタデータ(オーディオに関
する情報)を伝送する。ここに議論する実施例では、VRA制御能力でそのオーディ
オを再生させるのに必要であるオーディオの形式とメタデータの形式は詳細に記
述される。

【００８８】 VRAの補助データを含むための方法はCODECに依存するだろう。文字通り無数の
CODECのものが存在しており、したがって、特定のCODECのメタデータ部分に補助
データを含むことができる無数の特定の方法がある。しかしながら、ほとんどの
メタデータ形式が付加的なデータのために位置をかたわらに設定させるので、VR
A補助データが格納されるところでそれは典型的である。したがって、これは、
デコーダが“VRAに気付く”ことが必要であり、オリジナルのCODECのメタデータ
の流れの予定された空の位置でVRA補助データを見出さねばなたないことを意味
する。したがって、VRAヘッダーデータの別の不可欠な特徴は、VRA補助データが
CODECのためにメタデータに置かれた方法の識別である。

【００８９】この際、VRA可能なオーディオコーデックのためのメタデータの唯一の違いは
、VRA補助データチャンネルに含まれる情報が2つの唯一望ましい別々の信号：PC
PVとSCRAの作成に関して教示することであることを強制することが重要である。
従来の技術は、Dolby Pro-Logic5.1などの従来技術オーディオ形式に従う全体の
オーディオプログラムのためのメタデータ(例えば、動的な範囲情報)を作成する
ことができるだけである。しかしながら、VRA可能オーディオ生成のために、従
来のメタデータ構造のある一定の態様を利用することは可能であるだろう。例え
ば、PCPVチャンネルおよびSCRAがチャネルの動的な範囲情報が伝送されることに
なっているならば、従来の技術のオーディオ形式に関連づけられる動的な範囲設
定のメタデータファイルの中にSCRAの動的な範囲が同じ位置に位置することを示
すフラグを含んでいるのは役に立つだろう。そのとき、PCPVの動的な範囲情報だ
けが、オリジナルのメタデータチャンネルの空のビット位置に固定される必要が
ある。

【００９０】 VRA可能オーディオコーデックの使用のための特定の圧縮アルゴリズム最小スループットと格納要件で圧縮アルゴリズムを実施することはデジタルオ
ーディオ技術者と会社によって広く行われている。より前に紹介されたVRA実施
例に関して、AC3形式より少ない損失の圧縮を提供する圧縮アルゴリズムを利用
することが必要であるかもしれないことは、既にそれについて議論した。より前
に紹介された実施例はDolby HI Associated Serviceよりも明瞭に異なっている
ことがまた議論された。明確化は以下に提供される。

【００９１】 Dolbyのデジタルコーデックへの特別なアプリケーションを有するVRA生成技術
と関連した一般的なCODECの使用ここに開示される第１の実施例はどんな特定のCODECの圧縮技術からも独立し
ている。例として、プロデューサーがサラウンドオーディオの２つのチャンネル
、前部オーディオの3個のチャンネル、およびより小さい帯域幅のサブウーファ
ーチャンネルを含む多重チャンネルサラウンドプログラムを発生させることがで
きると考える。これは5.1サラウンド音として知られているオーディオ方式であ
る。このプログラムは、Dolby Digital、DTS、MPEG、またはいかなる他のコード
化/復号化案をも含むかもしれない任意のCODECでコード化することができる。オ
ーディオ形式自体はコード化案から独立している。同様に、モノチャネルプログ
ラムはそのような任意のCODECによりコード化しかつ復号することができる。

【００９２】この発明の焦点はCODEC自身ではなく、オーディオ形式である。すべての先行
のオーディオ形式が単独で空間的な情報をエンドユーザに提供することに制限さ
れた。ここに提案されるオーディオ形式は、空間的な情報に加えてオーディオ形
式でコンテンツ情報を含むことによって多重チャンネルの残りのオーディオに多
重チャンネル音声の、比率、周波数コンテンツ、動的な範囲、標準化などを調整
する能力をユーザに提供する。

【００９３】 Dolby Digital(AC-3)CODECについて議論するテレビジョン標準のためのガイド
(Guide for Television Standard)で記述される既存の技術に2つの明確な違いが
ある。その標準の固有の部分として、単一のチャンネル音声が多重チャンネルの
残りのオーディオと関連して伝送されることが許可される。追加の実施例として
、2つのチャンネル音声および2つのチャンネルの残りのオーディオがまた許可さ
れる。実際にこれは、プロデューサーにとって非常に制限されていて、すべての
関連音声を単一のチャンネルへ位置付けることをオリジナルプログラムの再現に
必然的に要求する。加えて、この実施において、音声は単一のチャンネルに再生
することができるだけである。ほとんどの多重チャンネルプログラムは、多重チ
ャンネルプログラムにある2次コンテンツの残りのオーディオおよび1次コンテン
ツの純粋な音声の両方を必要とする(臨界的な音声と残りのオーディオ部分が単
一の空間的な位置に制限されないので)。したがって、既存の技術の見地から、
ここに開示される実施例が2つの別々な利点を持っていることが明白である。

【００９４】多重チャンネル能力−VRAオーディオ形式はユーザが必要な比率を選択するこ
とを今までどおり許容している間に、プロデューサーがすべての芸術的な許可の
必要性を習得することを許容している多重チャンネルPCPV および多重チャンネ
ルSCRAを可能にする。

【００９５】 CODECの独立−VRAオーディオ形式は、どんなCODEC詳細にもかかわらず作動す
るように設計され、その結果、どんなCODECと共にも使用することができる。テ
レビジョン標準のガイドにおける聴覚損傷の関連するサービスが、Dolby Digita
l仕様で広げられるように働くことができるだけである。

【００９６】したがって、このドキュメントで指定されるVRAオーディオ形式はCODECとして
WITH Dolby Digitalを使用されることができる。指定されたVRAオーディオ形式
はユーザの制御で多重チャンネルPCPVと多重チャンネルSCRAの再生のための必要
な補助データを含んでいる。この補助データは任意のオーディオのCODEC(Dolby
Digitalを含んでいるがそれに限定されない)のメタデータ部分に含まれることが
でき、そして、AC-3圧縮のための案がオーディオプログラムコンテンツに依存し
て大きい損失と高い圧縮比をもたらすかもしれないCODEC仕様自体に従って、PCP
VとSCRAのオーディオ情報が圧縮される、(またはされない)ことができる。

【００９７】 CODEC独立の特徴はソフトウェアプラットホームを横切って特徴を可能にするV
RAの支持の重要なものである。多重チャンネル設定において残りのオーディオに
対して音声を制御する能力をエンドユーザに提供することは重要である。AC-3が
この目標を達成するための単一のチャンネルメカニズムを含むのに対し、他のCO
DECは含まないまたはそうしないかもしれない。この発明はプロデューサーがと
もに働くCODECを選ぶとき“演奏分野をならす”ことを許容する。CODECは、VRA
を実行する能力よりむしろ圧縮または逆圧縮アルゴリズムの性能に基づいて選ぶ
ことができる。これはすべてCODECのものがVRAの機能性をエンドユーザに提供す
ることを許容する。

【００９８】したがって、VRA可能コーデックは実際にはどんな既存のオーディオ圧縮アル
ゴリズムとも両立可能に作ることができる。したがって、この発明は前もって必
要なVRA補助データ、PCPV/PCA信号、および可能なSCRA信号に基づいて多数のVRA
可能圧縮形式の作成を含んでいる。これに基づいて、以下のデジタルオーディオ
形式が、より前に記述された実施例を使用してVRA可能なバージョンの発生を支
持し、前述されたVRAオーディオコーデックの一部として使用されるように圧縮
アルゴリズムとして役立つかもしれないことは明確である： DTS-VRA可能な圧縮最適化されたPCM VRA可能な圧縮メリディアンロスレスパッキング VRA可能な圧縮スピーチだけのコーデック付属物を有するMP3圧縮 Dolby Digital、AC3−VRA可能な圧縮 MPEG-2のVRA可能な圧縮 MPEG-4のVRA可能な圧縮。

【００９９】 VRA可能コーデックで使用されるかもしれない他の多数の圧縮アルゴリズムが
あり、それらは技術に熟練した者によりよく知られている。それらのアルゴリズ
ムによるVRA能力の収容は、VRAチャンネルと補助データの特別な処理によって従
わされる入来VRA情報の識別に基づかなければならないだろう。標準化されたビ
ットストリーミングレベルでこれを達成する多数の方法があるが、それらの方法
はデジタルオーディオの標準に熟達しただれにとっても簡単である。それはここ
に開示された発明の多くの態様の1つであるこれらの圧縮アルゴリズムのどれか
によるPCPV/PCA/SCRA信号と補助データの包含である。

【０１００】 VRA可能デコーダ VRAオーディオ生成の過程の再生終了でVRA可能デコーダに必要である特徴を示
す多くの機能的な記述がある。それらの記述は以下に提供される。

【０１０１】 VRAヘッダー認識：デコーダはVRAヘッダーデータに使用した異なったビットパ
ターンを認識するために備えられるだろう。ヘッダーの特定の値は、デコーダが
いかに入来VRA可能ビットストリームを収容するかを決定するだろう。技術に熟
練した者により様々な方法でこの特徴は実行することができる。例えば、ビット
マスキング技術、論理演算、または入来ビットストリームのVRA能力を指示する
他の方法を使用することが可能である。

【０１０２】モードを切り換える：デコーダは、PCPV/PCAとSCRA信号が再生装置に取り付け
られたスピーカーに送られる再生信号を含むであろう多重チャンネルオーディオ
再生(例えば、5.1オーディオまたは7.1オーディオ)、またはVRA再生モードのた
めの従来の復号ソフトウェアの間で切換えるようにプログラムされるだろう。

【０１０３】信号ルート設定：デコーダは、PCPV/PCAとSCRA信号の適切な時空的な再生情報
を決定するためにVRA補助データの情報を利用するだろう。

【０１０４】逆の両立性：デコーダはまた非VRA可能なオーディオプログラムの再生も収容
することができるだろう。これは、より前に議論したVRAヘッダー認識機能の論
理出力を使用することによって達成されるだろう。

【０１０５】復号と再生の特徴に関するその他の詳細は以下で記述される。

【０１０６】再生位置におけるVRA補助データ、PCPVおよびSCRAチャンネルのエンドユーザ
制御と究極の機能性上で詳細に議論したように、VRA補助データはCODECを通して伝送されまたは記
録されるPCPVとSCRAチャンネルに関する様々な情報を含んでいる。補助データの
エンドユーザに引渡される情報に加えて、別々に引渡されるPCPVとSCRAチャンネ
ルを有する結果として、実行することができる(それは従来技術に存在していな
い)いくつかのデコーダの特別な機能がある。2つの型の機能(補助データ制御とP
CPV/SCRAデコーダ制御)は、デコーダ自体の操作を特に参照して以下の項で詳述
される。

【０１０７】 VRA補助チャンネル識別−VRA補助チャンネルヘッダーファイルの一部として存
在しているので、デコーダは、指定されたビットをポーリングすることによって
、VRA補助チャンネルの存在を認識するだろう。ビットがゼロ(オフ)であるなら
ば、デコーダは、VRA補助データがなくて別々のPCPVもSCRAチャンネルもないと
認識する。デコーダは、別のオーディオ方式(ステレオなどの)を復号することを
開始することができる。デコーダが、識別ビットが1(オン)であると認めるなら
ば、エンドユーザによって望まれるならば、デコーダは、本来データを記録また
は放送するために使用されるCODECによって提供された仕様に別々に従っているP
CPVとSCRAチャンネルを復号することができる。識別ビットは単に、入来データ
がVRA可能（即ちPCPVとSCRAの要素を含んでいる)、および任意のプログラミング
のために変化することができることをデコーダに気付かさせる。

【０１０８】生成/ユーザミックス−この特徴はVRA補助データチャンネル自体に含まれる一
片の情報よりもむしろユーザ入力を表す。ユーザは生成ミックスかユーザミック
スかを選ぶオプションを有する。ユーザミックスが選択されるならば、さまざま
なオーディオ制御機能が採用されることができる(次に議論される)。生成ミック
ス設定はほとんどのデコーダ設定で不履行設定として考慮されがちである。

【０１０９】生成ミックスが選択されると、デコーダは、CODECのメタデータ部分に埋め込
まれたVRA補助チャンネルのそれらの指定された位置から、各PCPVおよびSCRAの
増幅データと空間的な位置データを集めるだろう。この増幅と空間的な位置デー
タは、オーディオプログラム(そして、コード化の特徴部分で議論されたように
作成される)を作成する際にオーディオ生成技術者の本来の意図を表す。空間的
な情報の各チャンネルとそれぞれの2つの信号(PCPVとSCRA)に関しては、増幅デ
ータは乗法演算を通して適用される。

【０１１０】情報を置く空間が必要であるならば(例えば、1つのスピーカー位置からもう1
つの位置へ動くことができる単一の音声トラックがあるならば)、その情報は位
置を変える命令として適切なチャンネルに適用される。SCRAに関するPCPVの増幅
と位置が時間により変化するので(プロデューサーの活動によって)、デコーダは
いつも補助チャンネルデータをポールし、絶えずPCPVおよびSCRA信号のおのおの
、および関連するチャンネルに適用される設定を更新するだろう。

【０１１１】各PCPVとSCRA信号の中にそれぞれのチャンネルの簡単な付加が正確な生成ミッ
クスをもたらすように、PCPVとSCRAチャンネルが密に生成されるならば、VRA補
助データチャンネルに増幅または空間的な位置情報を伝送する必要がないことに
注意されるべきである。このデータが存在していないと、デコーダ(生成ミック
スモードにあるとき)は、生成ミックスを達成するために(それぞれのチャンネル
の)線形の組み合わせを不履行にするだろう。この機能のエンドユーザ制御は、
ソフトメニュー(スクリーン上のような)を通したソフトウェア駆動、または生成
とユーザミックス選択の間の位置を変化する簡単なトグルスイッチによって駆動
されるハードウェアであるかもしれない。

【０１１２】ユーザレベル/空間的なミックス−前記のユーザミックストグルが選択される
ならば、生成ミックスは不能になり、エンドユーザは今PCPVとSCRA信号の完全な
制御を有する。最も初歩的な調整(そして、恐らく最も役に立つ)はお互いの如何
にかかわらずPCPVおよびSCRA信号、および彼らの関連するチャンネルのレベルお
よび空間的な位置決めを制御する能力である。

【０１１３】オーディオ形式に依存して、各PCPVおよびSCRAチャンネルは空間的に依存する
チャンネルの多数を含むかもしれない。全ての空間的なチャンネルが独立してい
て、(VRAオーディオ形式において) PCPVとSCRA信号が独立しているので、ユーザ
は、それぞれの独立している信号の振幅(乗法による)と空間的な位置(再配置に
よる)を調整する能力を、デコーダのハードウェアおよび/またはソフトウェアを
通して提供されるであろう。この機能性をエンドユーザに提供することは、どん
な追加帯域幅も必要としないで、すなわち、どんな補助データも必要としないで
成される。振幅と空間的な位置決めは、２つの信号(PCPVとSCRA)上で、デコーダ
自身ではなく、PLAYBACKハードウェアかソフトウェア(ボリュームノブと位置調
整)の一部としてそれらの独立なチャンネルで実行される。このハードウェアが
単一のユニットとしてエンコーダを有して含まれてもよく、またはデコーダから
分離した付加的なユニットとして作動するかもしれない。

【０１１４】上の記述は、2つの信号(PCPVとSCRA)の各々の中に多重チャンネルの各々の全
体の空間的な位置と振幅を制御するために、それがあることを望むエンドユーザ
により作られる調整の最も一般的な設定を表す。しかしながら、最も一般的な調
整能力は、標準のユーザにとってはるかに複雑になり過ぎる傾向がある。この理
由のため、別の実施例が説明され、それは、どんなVRA可能な消費者エレクトロ
ニクス装置にも不可欠の部分とし利用可能にされる簡単な(ユーザフレンドリー
な) メカニズムを通して音声対残りのオーディオの比率をエンドユーザが調整す
ることを可能にする。

【０１１５】図13はデジタルビットストリームを受けて、信号をその2つのオーディオ部分
：PCPV 1320とSCRA 1330信号に復号するVRA形式デコーダ1310を示す。より前に
注意したように、それぞれのこれらの信号はエンドユーザ調整の後に全体のプロ
グラムを形成するために合計される多重チャンネルを含んでいる。前のパラグラ
フの実施例はそれらの多重チャンネルの各々のエンドユーザ調整について議論す
る。

【０１１６】代わりに、図13で示される実施例はすべてのPCPVチャンネルとすべてのSCRAチ
ャンネルの総合的なレベルを制御し、その結果、必要なVRA比に作用する単一の
調整メカニズム1340を示す。これは音声と残りオーディオの所望のレベルを表す
2つの電圧を発生させるように、バランス形アナログポテンショメータを最初に
使用することによりデジタル領域で行われる。

【０１１７】例えば、ノブが時計回りに回されるとき、左の可変抵抗器(ノブに接続される)
は供給電圧に向かって上方に動き、信号グラウンドから遠のく。これはワイパー
電圧を増加させる。アナログデジタル変換器1350は電圧を読んで、それへデジタ
ル値を割り当て、次に、それはPCPV信号(いくつが復号されたかにかかわらず)の
すべてに掛けられる。同様に、ポテンショメータが反時計回りに動かされるとき
、右の可変抵抗器はワイパーの電圧増加をもたらすために供給電圧(およびグラ
ンドから遠く)に向かって移動する。

【０１１８】この電圧はデジタル値に変換され、復号された残りのオーディオ(SCRA)信号の
すべてに掛けられる。単一のノブを使用しているこの配列は、ユーザに音声およ
び残りのオーディオを独立のレベルに簡単かつ容易に制御させ、それにより所望
の聴取比を達成させる。乗法の後に、PCPVチャンネルの各々は、多くのチャンネ
ルが復号されたのと同様に全体のオーディオプログラムを形成するために、SCRA
(中心が加えられ、左が加えられるなどのそれぞれの方法で)の各々に加えられる
。最終的に、さらなるレベル調整は、調整された全体のプログラムオーディオが
各空間的なチャンネルのためにデジタルアナログ変換器1360を通して増幅器とス
ピーカーに送られる前に、同様な方法で、しかし単一のポテンショメータ(主リ
ューム制御)のみを使用して、全体のオーディオ信号に適用されることができる
。

【０１１９】ユーザ均等化制御−PCPVとSCRA信号の一層のエンドユーザ調整を提供するより
高度な特徴は、別々にPCPVとSCRA信号の周波数の重み付けを調整する能力である
。これは高周波を減衰させる特定の型の聴覚損傷を有する人の役に立つかもしれ
ない。耳が低い周波数で飽和し始める前に、PCPV(音声)信号の簡単なレベル調整
は明瞭さの必要な増加を供給しないかもしれない。PCPV信号の周波数依存調整(
また、均等化として知られている)を許容することによって、改良された明瞭さ
はある型のプログラミングのために達成されるかもしれない。さらに、SCRA信号
(爆音などの)の非常に低い周波数情報はPCPVチャンネルのスピーチ形式をあいま
いにしているかもしれない。SCRA信号(PCPV信号から独立している) の周波数に
依存するレベル制御は、スピーチの明瞭さを改良している間、SCRAチャンネルで
重要な中間周波数のオーディオ成分を保持するかもしれない。再び、PCPVとSCRA
チャンネルがVRAオーディオ形式を使用してコード化されかつ復号される限り、
これは復号の過程から別々であるハードウェアで実行することができ、その結果
どんな余分な情報も補助のチャンネルで伝送されることを必要としない。

【０１２０】 PCPVとSCRAの特定のメタデータ−さらに二元的なプログラムオーディオ(PCPV
とSCRA)で利用可能な再生の特徴を高めるために使用することができるエンコー
ダ議論に含まれたさまざまなメタデータがある。上で議論したレベル、空間、お
よび均等化調整と異なって、これらの特徴は、コード化されたVRA補助データが
ビットストリームの一部としてメタデータに存在していることを必要とする。こ
れらの特徴は信号レベル、動的な範囲の圧縮、および標準化を含んでいる。

【０１２１】コード化の過程の一部として伝送された信号レベルは、独自にPCPVとSCRAチャ
ンネルのレベルに関して、および時間の関数としてデータ(復号位置で) を提供
する。このデータは、オーディオ過渡現象の存在でユーザの選択されたVRA比を
維持するため、独自かつ同時にPCPVとSCRAチャンネルのレベルを制御するために
使用することができる。例えば、SCRAチャンネルの信号レベルデータは、ある区
分中爆音がPCPV(音声)を圧倒することを指示するかもしれず、分割によりどれほ
ど多いかを指示するであろう。

【０１２２】したがって、復号の過程は、ユーザ選択のVRA比を保持するように、適切な量
により自動的にSCRAの信号レベルを調整するために再生ハードウェアでその情報
を使用することができる。これは、ユーザは全体のプログラムを通していつでも
相対的なレベルを調整することを妨げる。

【０１２３】次に、ビットストリームに存在している動的な範囲の情報は、ユーザがPCPVと
SCRA信号の両方のために異なった再生範囲を独自に選択することを許容するだろ
う。ユーザは、最大限の動的な範囲の100%の機能として所望の圧縮または拡大を
選択し、それはそれらの組み合わせの前に各信号に適用される。

【０１２４】最終的に、レベル情報とわずかに異なっている標準化情報が、RMSまたはプロ
グラムからプログラムへPCPVとSCRAの両方の信号強度ゲージを提供する。このデ
ータは補助データヘッダーファイルの一部として伝送されるだけであるかもしれ
ず、全体のプログラムに適用されるだろう。ユーザが選ぶならば、この情報は、
プログラムを横切るSCRA信号のレベルを標準化するのと同様にすべてのプログラ
ムを横切るPCPV信号を標準化するのに使用することができる。これは、A) １つ
のプログラムから次へ聞かれる対話(PCPV)が一定のレベル(SPL)で維持され、B)
１つのプログラムから次へ聞かれる爆音(SCRA)が一定のレベル(SPL)で維持され
るであろうことを確実にする。

【０１２５】 VRAオーディオ形式を使用してコード化されるとき、この機能性のすべてがPCP
VとSCRA信号のためだけに可能である。生成ミックスが完全に統合されかつ分離
できないPCPV(音声)とSCRA(残りのオーディオ)を含んでいるので、それらが単独
で生成ミックスに適用されるならば、同じ効果を実現されることができない。

【０１２６】記録保管の実施例以下で記述される実施例は、エンドユーザが最終的にVRA調整の利益を得るよ
うな方法でVRA情報を蓄えるのに使用することができる広範囲の記録保管の構成
を示すために導入される。ここに記載されたすべての記録保管の実施例の共通の
テーマは、PCPV/PCA信号、および/またはSCRA信号、および/またはVRAヘッダー
、および/またはVRA補助データの格納を現在収容しない記録保管されたデジタル
・オーディオメディアの形式を各々が表すということであるが、記載されている
メディアのすべてには、それらがVRA可能な記録保管デジタルオーディオメディ
アになることができるように修正のための可能性を有する。以下で記述される記
録保管メディアについて、‘VRA可能なサウンドトラック’ のラベルは、それら
の信号の1つまたは両方がより前に導入されたVRAデコーダの特徴を使用して組み
立てられかつ再生されることができるように、特定のチャンネルとして収納され
たPCPV/PCA/SCRA信号を有し、および/または十分なVRA補助データを有するサウ
ンドトラックを参照する。再び我々は、そのようなVRA可能サウンドトラックの
定義がそれ自身発明であり、前に記述された実現に必要である様々な実施例によ
り基礎とされることを注意する。

【０１２７】 -CD上の2つの別々なトラックのような、格納されたPCPV/PCAとSCRA信号のLPCM
バージョンを有するCD。この実施例がステレオ位置決めを犠牲にすることに注意
すべきである。

【０１２８】 -CDメディアに見出される通常のステレオ信号に加えて、格納されたPCPV/PCA
信号の最適化されたLPCMバージョンを有するCD。

【０１２９】 -DTS VRA可能なサウンドトラックを有するDVD映画。

【０１３０】 -LPCM VRA可能なサウンドトラックを有するDVD映画。

【０１３１】 -MLP VRA可能なサウンドトラックを有するDVD映画。

【０１３２】 -MPEG-4のVRA可能なサウンドトラックを有するDVD映画。

【０１３３】 -MPEG-2のVRA可能なサウンドトラックを有するDVD映画。

【０１３４】 -Dolby DigitalのVRA可能なサウンドトラックを有するDVD映画。

【０１３５】 -VRA可能な形式を有するDVDオーディオディスク。

【０１３６】 -VRA可能な形式を有するスーパーオーディオ CD。

【０１３７】 VRA可能なバージョンの生成のための既存のオーディオマスターテープの再創
作重要な音声のコンテンツを有する映画または他のオーディオプログラムのため
にVRA調整を提供する期待される利益の1つは、聴取者によるスピーチの明瞭さの
改良である。これは特に聴覚損傷された個人にとって本当になるだろう。この時
点で、アナログ形式対デジタル形式に存在する何千個ものフィルムが文字通りあ
る。また、これらのフィルムのいずれもVRA可能なように作成されなかったこと
も本当である。したがって、PCPV/PCA/SCRA信号が対応するVRA補助データと共に
発生されるように、これらのVRA可能でないアナログサウンドトラックを‘再創
作すること’が必要である。上に提示されたVRA可能なデジタルマスター形式の
いずれでもその新しい情報を格納することができる。この発明は聴覚損傷共同体
に利用可能なVRA可能なフィルムのより広範囲に結果をもたらすだろう。

【０１３８】ビデオ・オン・デマンドのVRA可能なサウンドトラック記録保管とデータベー
スデジタルオーディオおよびストリーミングビデオ/オーディオの到来は、‘ビ
デオ・オン・デマンド’と時に呼ばれることを可能にした。ビデオ・オン・デマン
ド(VOD)システムは、ユーザのデジタルテレビ(または、セットトップコンバータ
ボックスを有するアナログテレビを使用して)に1回の再生をするため、ISDN線ま
たはモデムを経て彼/彼女の選択した映画または他のプログラムをダウンロード
することをユーザに許容する。そのとき、VRA可能なサウンドトラックを有するV
ODデータベースの中にどんなフィルムもない。VRA調整ハードウェアが将来の消
費者エレクトロニクス装置に統合されるようになるので、VODユーザは、たぶんV
RA可能なサウンドトラックを注文することを好むだろう。したがって、これらの
実施例はその期待された必要性に合うように配慮された。最初の発明はそれがVR
A可能なサウンドトラックを有するフィルムを含むVODデータベースである。これ
らのVRA可能なビデオは、聴覚損傷聴取者またはVRA調整を使用して楽しむ視聴者
によりダウンロードされることができる。

【０１３９】発明の別の関連する態様は、対応するビデオ情報のないオーディオサウンドト
ラックの新しい記録保管の作成であり、そこでは、新しい記録保管がVRA可能な
サウンドトラックオーディオだけから成る。VRA可能な映画のオーディオだけの
部分の記録保管は、VODデータベースのための格納要求に膨大な節約を提供する
であろう。VRA可能なサウンドトラック(ビデオのない)は、他の1つの特徴に加え
て、VRA可能なシステムを可能にする実施例のために、より前の議論と同じ方法
で作成されるだろう。これらのVRA可能なサウンドトラックは、VRA可能でないサ
ウンドトラックが利用可能時間のマークを持たないなら、相互相関信号処理技術
および/または時間同期化方法を使用してオリジナルの映画またはプログラムの
オーディオコンテンツに時間同期されるであろう。両方の方法は、オリジナルの
フィルムにあるVRA可能でないオーディオ情報とVRA可能なオーディオ情報を相関
させるのに役立つだろう。相関関係が最適化された後に、フィルムはオリジナル
のサウンドトラックを無音にしてかつVRA可能サウンドトラックをオンにして使
うことができる。

【０１４０】 MP3 VRA可能な音楽記録保管 MPEG-2のLayer III(MP3)の使用は、記録保管されたデータベースからあるイン
ターネットメディア再生装置へ流される音楽録音のために非常にポピュラーにな
った。VRA可能なデジタルオーディオファイルを可能にするシステム構成要素の
前の定義は等しくよくMP3形式に適用する。したがって、この発明は聴取者によ
りダウンロードする(商業的または多の方法で)ための特別なデータベースの中に
あるVRA可能なMP3録音の作成に関係がある。

【０１４１】図14において、ブロックダイアグラムの上方の部分は、プロデューサーからユ
ーザへオーディオプログラミングを引渡すために技術の現状を示す。事前および
事後生成中、さまざまなオーディオ部分が、近くのマイクロホン録音、遠いマイ
クロホン音、音響効果、笑音トラック、および全体のオーディオプログラムを形
成するために入るかもしれないいかなる他の可能な音も含むかもしれない多トラ
ックの記録された形式1405で技術者に利用可能である。音響技術者は次に、既存
のオーディオ形式1415に従うために、これらの構成要素を加え、影響させ、空間
的に位置付け、および/または音の成分を結合する。これら既存のオーディオ形
式1415はモノタイプ、ステレオ、Pro-Logic，5.1、7.1または技術者が従ってい
るいかなる他のオーディオ形式も含むかもしれない。

【０１４２】プログラムが必要な形式でいったん生成されると、それはメタデータを含むか
もしれないコード化企画1420に通過される。いろいろなコード化企画が、非圧縮
、損失のない圧縮、または損失のある圧縮技術を含むかもしれないこの段階で採
用されるだろう。いくつかの共通のコード化企画は、Dolby Digital、MPEG-2のL
ayer 3(オーディオのための)、Meridian Lossless Packing、またはDTSを含んで
いる。そのような符号化器の出力は放送されるか、再生または放送のために記録
されるかのいずれかであるデジタルビットストリームである。デジタルビットス
トリームの受信のため、デコーダ1425は、オーディオおよび使用されるならばメ
タデータを発生させる。符号化器1420とデコーダ1425の組み合わせが文献に、お
よびCODEC(すなわち、符号化器、デコーダ)としてのこのドキュメントにしばし
ば引用されるのに注意すべきである。メタデータ 1430はオーディオデータに関
するデータであるとして考慮され、動的な範囲情報、利用可能な別々のチャンネ
ルの数、およびオーディオデータで使用される圧縮の型のような特徴を含むかも
しれない。

【０１４３】図14の下方の部分は、ここに議論する発明の実施例を示す。多重トラック記録
を始めると、VRA生成技術1435は、すべての前のものと明瞭に異なった新しいオ
ーディオ形式を形成するために利用される(ここに開示される仕様に従う)。VRA
形式自体はVRAオーディオデータコード1445として図に示されるそれ自身のメタ
データを有する。

【０１４４】さらに、前の形式はオーディオトラックからオーディオチャンネルを発生させ
るための特徴に焦点が向けられたが、この新しい形式は、生成レベルでマスター
オーディオトラックからCONTENTとSPATIALチャンネルの両方を発生させるところ
に焦点を合わせた。他の多くのものの中で、再生サイトの空間的な位置へのコン
テンツ部分の所望の生成ミックス(音の技術者により駆動される)は、VRA生成技
術を通して補助データストリームの作成により保持されかつ制御される。この点
で、補助データ、PCPV(1次コンテンツの純粋な音声)、およびSCRA(２次コンテン
ツの残りのオーディオ)は、通常の技術と同様に任意の標準のCODECによって使用
される。CODEC 1450、1455はメタデータに含まれるオーディオおよび/または情
報のコンテンツおよび形式に何の仕様も作らないが、むしろそれが受け取るどん
なデータもコード化し、再現位置で同様にそれを復号する。オーディオデータ(P
CPVとSCRA)と補助データ(CODEC メタデータを経て)がいったん受け取られて復号
されると、エンドユーザは補助のチャンネル識別1470と制御データ1465(それが
存在していて認識されるならば)を制御し、次に、PCPVとSCRAチャンネルはそれ
らのエンドユーザ調整1460により制御される。存在しかつオリジナルのCODECに
より要求されるなら、追加メタデータがさらにVRAオーディオ形式と関連する再
現の性能に影響しないで再生1480を制御するために使用されることができる。

【０１４５】様々な実施例がここに明確に示されかつ記述されたが、本発明の変更と変化が
上の教示により、そして発明の精神および意図された範囲から逸脱することなく
、添付請求の範囲内でカバーされることが評価されるだろう。特に発明は以下を
含むであろう。

【０１４６】 -VRA可能なコーデック、それは：PCPV/PCA信号およびSCRA信号の並列入力構成
を受け、任意のスピーチだけの圧縮アルゴリズムを使用してPCPV/PCA信号を圧縮
し、任意の一般的なオーディオ圧縮アルゴリズムを使用して、2つのオーディオ
信号と任意の付随するビデオの間のオリジナルの時間整列とビデオフレーム同期
化の損失なしに、SCRA信号を圧縮し、信号のために使用される特定の圧縮アルゴ
リズムおよびシンタキシング方法を定義する対応する関連データとともに、2つ
の圧縮されたビットストリームを多重化し、前記多重化されたビットストリーム
はVRA可能なファイルとして格納されるかPCPV/PCAとSCRA信号を分離するデマル
チプレクサに伝送され、それらを適当な逆圧縮アルゴリズムに発送し、2つの信
号を記憶媒体、または、最終聴取者のためにVRA調整を可能にする適切なボリュ
ーム制御および再生装置に送る。

【０１４７】 -特定の音声だけの圧縮およびPCPV/PCAとSCRA信号を圧縮するために使用され
る一般的なオーディオ圧縮アルゴリズムから独立しているVRAコーデック。

【０１４８】 -音声だけの圧縮と一般的なオーディオ圧縮を使用して、VRA可能なデジタルマ
スターまたはVRA可能な記録保管されたオーディオファイルのデータヘッダーを
認識し、自動的にPCPV/PCAとSCRA信号の並列な圧縮を進めるVRAコード化過程。

【０１４９】 -多数の利用可能な‘スピーチだけの’圧縮と‘一般的なオーディオ’圧縮ア
ルゴリズム。

【０１５０】 -データと関連された入来VRAマルチプレクサを認識し、逆多重化するように作
動し、VRA ビットストリームを別々なPCPVとPCA信号に逆圧縮するVRA可能なデコ
ーダ。

【０１５１】 -多重チャンネル再生の通常の復号ソフトウェアと、PCPV/PCAとSCRA信号が再
生装置に取り付けられたスピーカーに送られる再生信号を含むVRA再生モードと
の間で切り換えるようにプログラムされるVRA可能なデコーダ。

【０１５２】 -PCPV/PCAとSCRA信号の適切な時空的な再生情報を決定するためにVRA補助デー
タ情報を利用するVRA可能デコーダ。

【０１５３】 -入来オーディオがVRA可能（または可能でない）かを決定するために、識別ビ
ット（オンまたはオフ）を指定することによってVRA補助データの存在を認識す
るVRA可能なデコーダ。

【０１５４】 -PCPV/PCAとSCRA信号がオーディオ圧縮ステップの後に暗号化され、逆圧縮ス
テップの前に非暗号化される上で記述されたようなVRA可能なコーデック。

【０１５５】 -VRA補助データおよび/または補助データチャンネルを利用し、前記補助デー
タは補助データに特定のビットパターンを通してVRA可能としてコーデックを確
認するような方法で作成され、空間的なオーディオ再生構成で使用されることに
なっているPCPV/PCAとSCRAチャンネルの数を確認し、多重チャンネルの前記空間
的な再生はオーディオプログラムの異なったタイミングで異なった空間的な再生
を指示するように補助データの異なった位置で変化可能であり、最終聴取者によ
りVRA再生およびボリューム調整の過程を容易にするために生成ミックスデータ
を確認し、PCPV/PCAとSCRAの特定のメタデータを含むVRA可能なコーデック。

【０１５６】 -VRA補助データは、ここで定義されたVRA補助データの目的の特性の損失なし
に、任意の他のコーデックのメタデータの一部として導入されてもよい。

【０１５７】 -VRA可能なコーデックと関連して使用される特定の圧縮アルゴリズムと両立可
能なVRA補助データの作成。

【０１５８】 - PCPV信号の多重チャンネルおよび/または空間的に分配された再生、およびS
CRA信号の多重チャンネルおよび/または空間的に分配された再生を可能にするた
め、AC3テレビジョンオーディオ形式と関連したVRA補助データの使用。

【０１５９】 -サウンドトラックのVRA可能なバージョンを作成するために既存のフィルム、
映画、およびテレビジョンのサウンドトラックのオーディオマスターテープの再
創作。

【０１６０】 -PCPV信号がサウンドトラック記憶媒体に別々なオーディオ情報として存在す
るVRA可能な手段。

【０１６１】 -SCRA信号がサウンドトラック記憶媒体に別々なオーディオ情報として存在す
るVRA可能な手段。

【０１６２】 - VRA可能な再生装置によって後の調整のために1次コンテンツの純粋な音声の
トラックを作成するような方法で、オリジナルのサウンドトラックオーディオマ
スターテープに存在する1つ以上の音声トラックの何らかの芸術的な組み合わせ
を結合する再創作の手段。

【０１６３】 - VRA可能な再生装置によって後の調整のために２次コンテンツの残りのオー
ディオトラックを作成するような方法で、オリジナルのサウンドトラックオーデ
ィオマスターテープに存在する1つ以上の非音声トラックの何らかの芸術的な組
み合わせを結合する再創作の手段。

【０１６４】 -新たに作成されたPCPVとSCRA情報を取り、記録保管の請求項に開示されたよ
うな、VRA可能なデジタルマスターオーディオ記憶媒体を構成する再創作の手段
。

【０１６５】 - VRA可能な映画、フィルム、またはテレビ番組を衛星、インターネット、ま
たは他のデジタル伝送手段を通してVRA可能な再生装置に伝送する目的のためにV
RA可能なフィルムサウンドトラックを含むデジタルデータベースの作成、または
記録保管システム。

【０１６６】 -ビデオ・オン・デマンドフィルム、映画、ウェブ-テレビ、デジタルテレビ、
または他のプログラムを含むデジタルデータベース。

【０１６７】 -デジタルデータベースは、このドキュメントのほかの場所で開示された手段
を使用して、対応するサウンドトラックがVRA可能であるところで単一のフィル
ム実体から成るかもしれない。

【０１６８】 -デジタルデータベースは、VRA可能なサウンドトラックが代用のためオーディ
オ再生時点で選択されたサウンドトラックとしてオリジナルプログラムサウンド
トラックの如何にかかわらず送られることができるように、適切な時間同期とビ
デオフレーム同期でVRA可能なオーディオサウンドトラックだけから成るかもし
れない。

【０１６９】 -VRA可能な音楽オーディオ(例えばWAV、MP3、または他のもの)を含むデジタル
データベースの作成または記録保管システムであって、前記VRA可能な音楽オー
ディオは、1次コンテンツの純粋な音声オーディオとして指示された音声トラッ
クの何らかの混合、および２次コンテンツの残りのオーディオとして指示された
楽器の何らかの混合を作成する。

【０１７０】 -デジタルデータベースは、再生時点でPCPV音声の代用を容易にするために、
時間同期されたオリジナルの音楽録音またはデジタルファイルされた指定された
PCPVオーディオ情報だけから成るかもしれない。

【０１７１】 -記録媒体は上に議論された特徴のいくらかをその上に含みまたは記録される
。

【図面の簡単な説明】

【図１】従来のデジタル習得構成を示すダイヤグラムである。

【図２Ａ】 2チャンネルVRA可能デジタルマスターオーディオテープのためのプレミックス
実施例を示すダイヤグラムである。

【図２Ｂ】 2チャンネルVRA可能デジタルマスターオーディオテープのためのポストミック
ス実施例を示すダイヤグラムである。

【図３】 SCRAダウンミックスパラメタを有する１チャンネルVRA可能なデジタルマスタ
ーオーディオテープのためのプレミックス実施例を示すダイヤグラムである。

【図４Ａ】 VRA可能なデジタルマスターテープまたはファイルの実施例を示すダイヤグラ
ムである。

【図４Ｂ】 VRA可能なデジタルマスターテープまたはファイルの実施例を示すダイヤグラ
ムである。

【図４Ｃ】 VRA可能なデジタルマスターテープまたはファイルの実施例を示すダイヤグラ
ムである。

【図４Ｄ】 VRA可能なデジタルマスターテープまたはファイルの実施例を示すダイヤグラ
ムである。

【図４Ｅ】 VRA可能なデジタルマスターテープまたはファイルの実施例を示すダイヤグラ
ムである。

【図５】 VRAコーデックの例示的なダイヤグラムである。

【図６】 1チャンネルVRA可能、非圧縮デジタルマスターのためのVRAエンコーダの例示
的ダイヤグラムである。

【図７】 2チャンネルVRA可能、非圧縮デジタルマスターのためのVRAエンコーダの例示
的ダイヤグラムである。

【図８】 VRA可能なエンコーダの別の可能な実施例を示す例示的ダイヤグラムである。

【図９】 VRA可能なエンコーダの別の可能な実施例を示す例示的ダイヤグラムである。

【図１０】 VRA可能なエンコーダの別の可能な実施例を示す例示的ダイヤグラムである。

【図１１】 VRA可能なエンコーダの別の可能な実施例を示す例示的ダイヤグラムである。

【図１２】 VRA可能なエンコーダの別の可能な実施例を示す例示的ダイヤグラムである。

【図１３】デジタルビットストリームを受けて、信号を2つのオーディオ部分に復号するV
RA形式デコーダを示すダイヤグラムである。

【図１４】発明の例示的オーディオ信号処理システムのダイヤグラムである。

【符号の説明】

PCPV…１次コンテンツの純粋な音声 PCA …1次コンテンツのオーディオ SCR
A…２次コンテンツの残りのオーディオ VRA…音声対残りのオーディオ

───────────────────────────────────────────────────── フロントページの続き (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＣＹ，ＤＥ，ＤＫ，ＥＳ，ＦＩ，ＦＲ，ＧＢ，ＧＲ，ＩＥ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＰＴ，ＳＥ，ＴＲ)，ＯＡ(ＢＦ，ＢＪ，ＣＦ，ＣＧ，ＣＩ，ＣＭ，ＧＡ，ＧＮ，ＧＷ，ＭＬ，ＭＲ，ＮＥ，ＳＮ，ＴＤ，ＴＧ)，ＡＰ(ＧＨ，ＧＭ，ＫＥ，ＬＳ，ＭＷ，ＭＺ，ＳＤ，ＳＬ，ＳＺ，ＴＺ，ＵＧ，ＺＷ)，ＥＡ(ＡＭ，ＡＺ，ＢＹ，ＫＧ，ＫＺ，ＭＤ，ＲＵ，ＴＪ，ＴＭ)，ＡＥ，ＡＧ，ＡＬ，ＡＭ，ＡＴ，ＡＵ，ＡＺ，ＢＡ，ＢＢ，ＢＧ，ＢＲ，ＢＹ，ＣＡ，ＣＨ，ＣＮ，ＣＯ，ＣＲ，ＣＵ，ＣＺ，ＤＥ，ＤＫ，ＤＭ，ＤＺ，ＥＥ，ＥＳ，ＦＩ，ＧＢ，ＧＤ，ＧＥ，ＧＨ，ＧＭ，ＨＲ，ＨＵ，ＩＤ，ＩＬ，ＩＮ，ＩＳ，ＪＰ，ＫＥ，ＫＧ，ＫＰ，ＫＲ，ＫＺ，ＬＣ，ＬＫ，ＬＲ，ＬＳ，ＬＴ，ＬＵ，ＬＶ，ＭＡ，ＭＤ，ＭＧ，ＭＫ，ＭＮ，ＭＷ，ＭＸ，ＭＺ，ＮＯ，ＮＺ，ＰＬ，ＰＴ，ＲＯ，ＲＵ，ＳＤ，ＳＥ，ＳＧ，ＳＩ，ＳＫ，ＳＬ，ＴＪ，ＴＭ，ＴＲ，ＴＴ，ＴＺ，ＵＡ，ＵＧ，ＵＺ，ＶＮ，ＹＵ，ＺＡ，ＺＷ (72)発明者ソーンダース、ウィリアム・アールアメリカ合衆国、バージニア州 24060 ブラックスバーグ、プリマス・ストリート 2509 Ｆターム(参考） 5D045 DA20

Claims

【特許請求の範囲】

【請求項１】 1つ以上のPCPV/PCA信号および1つ以上のSCRA信号の並列入力
構成を受入れ、 PCPV/PCA信号およびSCRA信号を圧縮し、 PCPV/PCAおよびSCRA信号を処理するために使用される特定の圧縮アルゴリズム
およびシンタキシング方法を定義する対応している関連データとともに圧縮され
たPCPV/PCAおよびSCRA信号を多重化し、多重化された信号はVRA可能なファイル
として記憶され、またはPCPV/PCAおよびSCRA信号を分離する対応しているデマル
チプレククサに伝送され、それらを適切な逆圧縮アルゴリズムに発送し、記憶媒
体またはVRAボリウム調整可能な出力装置に信号を出力する、ことを含むVRA可能なコーデックシステムを操作する方法。
【請求項２】少なくとも1つのトラックを複数のオーディオトラック、１
次コンテンツの純粋な音声(PCPV)オーディオを含む1つのトラック、記憶媒体に
記憶された複数のオーディオトラック、および時間同期を有する複数のオーディ
オトラックに提供し；少なくとも1つのトラックからPCPV信号を発生させ；第1の圧縮比を有するデジタル圧縮形式を使用してPCPV信号を圧縮し；少なくとも1つの他のトラックを複数のオーディオトラックに提供し、少なく
とも1つの他のトラックは２次コンテンツの残りのオーディオ(SCRA)を含み；少なくとも1つの他のトラックからSCRA信号を発生させ；第2の圧縮比を有するデジタル圧縮形式を使用してSCRA信号を圧縮し；音声対残りのオーディオ(VRA) 補助データチャンネルを作成し、VRA補助デー
タチャンネルは： VRA可能としてVRA可能なデジタルマスターを確認し、そして PCPVおよびSCRA信号の再生パラメタを確認し； VRA可能なデジタルマスターに PCPV信号、 SCRA信号、および VRA補助データチャンネル; をデジタル的に記憶し、この記憶ステップが時間同期を維持する；ことを含むオーディオ生成方法。
【請求項３】複数のオーディオトラックが少なくとも１次音声のコンテン
ツとバックグラウンドコンテンツを有するオーディオプログラムと関係される請
求項2のオーディオ生成方法。
【請求項４】 PCPV信号は、オーディオプログラムの筋がPCPVオーディオを
聞くことにより聴取者に伝えられるような十分な１次音声のコンテンツを含む請
求項3のオーディオ生成方法。
【請求項５】 SCRA信号は、オーディオプログラムの芸術的な値がSCRA信号
をPCPV信号と混合することにより高められるように十分なバックグラウンドコン
テンツを含む請求項3のオーディオ生成方法。
【請求項６】 PCPV信号がモノタイプ信号、ステレオ信号、およびサラウン
ド音の信号の１つである請求項2のオーディオ生成方法。
【請求項７】サラウンド音の信号が5.1サラウンド音形式および7.1サラウ
ンド音形式の1つである請求項6のオーディオ生成方法。
【請求項８】 SCRA信号がモノタイプ信号、ステレオ信号、およびサラウン
ド音の信号の1つである請求項2のオーディオ生成方法。
【請求項９】サラウンド音の信号が5.1サラウンド音形式および7.1サラウ
ンド音形式の1つである請求項8のオーディオ生成方法。
【請求項１０】再生パラメタがPCPVおよびSCRA信号の各々のために互いに
関してボリュームレベルを含み、再生中にSCRA信号がPCPV信号を実質的にぼやか
さないように各信号のボリュームレベルを自動制御可能にする請求項2のオーデ
ィオ生成方法。
【請求項１１】第１の圧縮比が実質的に12:1よりも小さい比率である請求
項２のオーディオ生成方法。
【請求項１２】第１の圧縮比が実質的に8:1よりも小さい比率である請求
項２のオーディオ生成方法。
【請求項１３】第２の圧縮比が実質的に12:1よりも小さい比率である請求
項２のオーディオ生成方法。
【請求項１４】第２の圧縮比が実質的に8:1よりも小さい比率である請求
項２のオーディオ生成方法。
【請求項１５】 VRA可能なデジタルマスターに信号をデジタル的に記憶す
るための形式がゼロチャンネル形式、1チャンネルのプレミックス形式、1チャン
ネルのポストミックス形式、2チャンネルのプレミックス形式、および2チャンネ
ルのポストミックス形式の1つである請求項2のオーディオ生成方法。
【請求項１６】他のトラックが音楽トラックおよび効果トラックの１つで
ある請求項2のオーディオ生成方法。
【請求項１７】さらにVRA可能なデジタルマスターの再生上でPCPVおよびS
CRA信号の振幅の独自の調整を含む請求項2のオーディオ生成方法。
【請求項１８】さらに再生のために独自に調整されたPCPVおよびSCRA信号
の混合を含み、混合された独自に調整されたPCPVおよびSCRA信号は電気音響装置
と結合される請求項17のオーディオ生成方法。
【請求項１９】 PCPV信号、SCRA信号、およびVRA補助データチャンネルの
再生が同時に起こる請求項17のオーディオ生成方法。
【請求項２０】複数のオーディオトラックが時間整列およびビデオ信号と
のビデオフレーム同期をさらに含む請求2のオーディオ生成方法。
【請求項２１】記憶ステップがPCPV信号、SCRA信号、およびビデオ信号の
間に時間整列およびビデオフレーム同期の損失なしに起こる請求項20のオーディ
オ生成方法。
【請求項２２】 VRA可能なデジタルマスターが放送テレビジョン、ウエブ
キャスチングストリーミングオーディオ、コンパクトディスク(CD)オーディオ、
デジタルビデオディスク(DVD)オーディオ、映画オーディオ、およびビデオテー
プオーディオの１つについてオーディオプログラミングを記憶する請求項2のオ
ーディオ生成方法。
【請求項２３】１次音声のコンテンツオーディオ信号、バックグラウンド
コンテンツのオーディオ信号、および任意の付随するビデオ信号の間の時間整列
とビデオフレーム同期を有し、少なくとも１次音声のコンテンツオーディオ信号
、バックグラウンドコンテンツのオーディオ信号、および任意の付随するビデオ
信号を有するオーディオプログラムをコード化しかつ復号するためのコーデック
において、１次音声のコンテンツオーディオ信号およびバックグラウンドコンテンツのオ
ーディオ信号を受ける並列入力構成、１次音声のコンテンツオーディオ信号から第1の圧縮されたオーディオ信号を
発生させるスピーチだけの圧縮、バックグラウンドコンテンツのオーディオ信号から第２の圧縮されたオーディ
オ信号を発生させる全般的なオーディオの圧縮、１次音声のコンテンツおよびバックグラウンドコンテンツのオーディオ信号、
並びに任意の付随するビデオ間の時間整列とビデオフレーム同期の損失なく、１
次音声のコンテンツおよびバックグラウンドコンテンツのオーディオ信号を含ん
でいるスピーチだけのおよび全般的なオーディオの圧縮、第１および第２の圧縮されたオーディオ信号および関連するデータの多重化さ
れたビットストリームを発生させ、関連するデータは少なくともスピーチだけの
量および全般的なオーディオの圧縮並びに第１および第２の圧縮された信号を発
生させる際に使用されたビットストリームシンタキシング方法を含んでいるマル
チプレクサ、を含むコーデック。
【請求項２４】第１および第２の圧縮されたオーディオ信号を得るために
多重化されたビットストリームを逆多重化するデマルチプレクサ、第１および第２の圧縮されたオーディオ信号を第１および第２のオーディオ信
号に復号するデコーダをさらに含む請求項23のコーデック。
【請求項２５】第１および第２のオーディオ信号をボリューム制御および
再生装置に伝送し、再生装置は第１および第２のオーディオ信号の独自のボリュ
ーム調整を可能にすることをさらに含む請求項24のコーデック。
【請求項２６】形式を有する記憶媒体において、形式が、分離可能な1次コンテンツオーディオおよび2次コンテンツオーディオを含む構
成上のオーディオ情報部分、聴取者が分離可能な1次コンテンツオーディオおよび2次コンテンツオーディオ
の空間的方向を知覚することを可能にする空間的オーディオ情報を含む空間的オ
ーディオ情報部分、空間的方向を有する分離可能な1次コンテンツオーディオおよび2次コンテンツ
オーディオの１つの発生および再生を許容する情報を含む補助データ情報部分、を含む記憶媒体。
【請求項２７】 VRA形式を記憶し、形式がVRA補助データチャンネル、VRA
可能なコーデックにより作成されかつ解釈された記述の使用を通して、オーディ
オプログラムからの空間的オーディオ情報の同時解釈でオーディオプログラムか
らの構成上のオーディオ情報の解釈を収容している、音声対残りのオーディオ（
VRA）のオーディオ記憶媒体。
【請求項２８】オーディオプログラムがフイルムサウンドトラック、DVD
映画サウンドトラック、およびコンパクトディスクサウンドトラックの１つであ
る請求項27の記憶媒体。