JP2003525466A - デジタルオーディオ生成過程において1次コンテンツオーディオおよび2次コンテンツの残りのオーディオ性能を収容する方法および装置 - Google Patents

デジタルオーディオ生成過程において1次コンテンツオーディオおよび2次コンテンツの残りのオーディオ性能を収容する方法および装置

Info

Publication number
JP2003525466A
JP2003525466A JP2001563565A JP2001563565A JP2003525466A JP 2003525466 A JP2003525466 A JP 2003525466A JP 2001563565 A JP2001563565 A JP 2001563565A JP 2001563565 A JP2001563565 A JP 2001563565A JP 2003525466 A JP2003525466 A JP 2003525466A
Authority
JP
Japan
Prior art keywords
audio
vra
signal
pcpv
scra
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001563565A
Other languages
English (en)
Inventor
ボードリー、マイケル・エー
ソーンダース、ウィリアム・アール
Original Assignee
ヒアリング エンハンスメント カンパニー,リミティド ライアビリティー カンパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ヒアリング エンハンスメント カンパニー,リミティド ライアビリティー カンパニー filed Critical ヒアリング エンハンスメント カンパニー,リミティド ライアビリティー カンパニー
Publication of JP2003525466A publication Critical patent/JP2003525466A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Stereophonic System (AREA)

Abstract

(57)【要約】 発明はオーディオ生成過程の異なった部分で音声と残りのオーディオ情報の包含を可能にする。特に、発明はAC3圧縮形式よりも等しいか、または大きい匹敵する正味の損失を被るどんなコーデックとも比較されるオーディオデータの、より少ない損失を被るオーディオ圧縮形式のそれらのクラスによりVRAのVRA可能なデジタル習得と収容の特別な技術を具体化する。発明は全体のデジタルオーディオシステムの多重部分の新しい構成に焦点をあてることによって、デジタルオーディオ媒体の再生上最終聴取者の音声対残りのオーディオ(VRA)調整を容易にし、それにより、音声プログラムの1次音声/会話コンテンツのそのプログラムの音声コンテンツの残りの部分に対する比率を制御したいと欲するオーディオエンドユーザ(最終聴取者)に、利益を与えることを意図した新しい技術を可能にする。

Description

【発明の詳細な説明】
【0001】 この出願は、2000年3月2日に申請され、その全部を引用文献としてここ
に組み込まれた、“デジタルオーディオ生成過程において1次コンテンツ(純粋
な音声)オーディオおよび2次コンテンツの残りのオーディオ性能を収容する技
術”と題する仮出願番号60/186,357の利益を請求する。
【0002】 発明の分野 本発明はオーディオ信号処理に係り、なお特に個々の聴取者のためにオーディ
オ信号の所望な部分の増進に関する。
【0003】 発明の背景 デジタルオーディオファイル記録保管、圧縮、コード化、伝送、復号、および
再生の最近の広範囲の編入はデジタルオーディオ処理の実際にはあらゆる段階で
新しい機会の可能性を導入した。それは音声対残りのオーディオ(VRA)の好まし
い比率が異なった人々についてかなり異なっており、かつ異なった型のメディア
プログラム(スポーツプログラム対音楽など)に関して異なることが最近示された
。Blum他によるHEC Technical Report No.1,January,2000の“A Study of Lis
tener Preferences Using Pre-Recorded Voice-to-Remaining Audio”参照。
【0004】 明確に、残りのオーディオボリュームの別々の調整の如何にかかわらず、別々
に音声(スピーチ)のボリュームを調整することによって、VRAはオーディオプロ
グラムの音声対残りのオーディオ比の個人化された調整について言及する。独自
にユーザ調整された音声オーディオ情報は、次に独自にユーザ調整された残りの
音声オーディオ情報に結合されて、さらに全体のボリューム調整が適用されるか
もしれない再生装置に送られる。この技術は、各個人の聞き取り能力がそれらの
視覚能力と同じくらい異なっており、その結果彼らがオーディオプログラムの音
声対バックグラウンドコンテンツを聞きたい(または、必要性さえある) 個々の
好みに導く発見によって動機づけられた。オーディオプログラムのVRA能力のた
めの必要性が各々およびすべての人に最適の視覚特性を提供するために広範囲な
指示レンズの必要性と同じくらい基本的であるということが結論である。
【0005】 発明の概要 発明はオーディオ生成過程の異なった部分で音声と残りのオーディオ情報の包
含を可能にする。特に、発明はAC3圧縮形式に等しいか、またはそれより大きい
匹敵するネット損失を受けるどんなコーデックとも比較されるオーディオデータ
のより少ない損失を受けるオーディオ圧縮形式のそれらのクラスにより、VRA可
能なデジタル習得とVRAの収容の特別な技術を具体化する。
【0006】 発明は、全体のデジタルオーディオシステムの多重部分の新しい構成に焦点を
合わせることによって、その結果そのプログラムでオーディオコンテンツの残り
の部分に比例してオーディオプログラムの1次音声/対話コンテンツの比率を制
御したいオーディオエンドユーザ(最終聴取者)のためになるように意図された新
しい技術を可能にすることにより、デジタルオーディオメディア形式の再生上、
最終聴取者の音声対残りのオーディオ(VRA)調整を容易にする。ここに開示され
る特定の発明を動機づける問題は2つである。第1に、VRA調整を可能にする2つ
の信号の構造のためのオーディオプログラム生成経路において、最も良い位置に
ついて異なった意見があることが認められる。第2に、最適のオーディオ圧縮形
式、オーディオのファイル格納要求、オーディオの放送伝送ビットレート、オー
ディオのストリーミングビットレート、および最終聴取者に最終的に伝えられる
音声および残りのオーディオコンテンツの両方の知覚された聴取品質の間にはト
レードオフがある。VRAを最終聴取者に提供する究極の目的のために、それらの2
つの問題の様々な解決が新しい実施例を通してこの発明により提案され、その実
施例は新しいまたは既存のデジタル習得、オーディオ圧縮、コード化、ファイル
格納、伝送、および復号の技術を取り入れるかもしれない。
【0007】 さらに発明は、いわゆる純粋な音声のオーディオコンテンツおよび残りのオー
ディオコンテンツが格納および/または伝送のために容易に作られるように、オ
ーディオプログラムが生成されるかもしれない様々な方法に適応されてもよい。
この方法において、録音過程はオーディオ生成過程の不可欠の要素であると考え
られる。新しいオーディオコンテンツは、オーディオ信号のデジタル格納および
/または伝送で使用されるかもしれない特定のオーディオ圧縮アルゴリズムの如
何にかかわらず、明らかな方法で最終聴取者に引渡されるかもしれない。これは
実際にはどんなCODECでの音声および残りのオーディオ情報の包含も必要とする
だろう。したがって、この発明はユニークなデジタル習得の過程、および多くで
状況で使用される損失のないおよび最少損失の圧縮アルゴリズムで両立性のある
非圧縮格納方式を定義する。
【0008】 また、発明の実施例はVRAコード化とVRA復号の必要な特徴に焦点を合わせるか
もしれない。オーディオコーデックの中の共通点のために、以下に提供されるす
べての記述が放送メディア(テレビやウエブキャスチングなどの)、ストリーミン
グのオーディオ、CDオーディオ、またはDVDオーディオのために等しくVRA機能性
を供給するように考慮されることができる。また、発明はフィルム、ドキュメン
タリー、ビデオ、音楽、およびスポーツイベントを含むオーディオプログラムの
すべての形式のために意図されるかもしれない。
【0009】 発明のこれらのおよび他の利点および特徴は以下に明らかになり、発明の本質
は、発明の以下の詳細な記述、添付請求項およびここに添付される複数の図面を
参照することによりさらに明確に理解されるであろう。
【0010】 好ましい実施例の記述 以下図面を参照して発明が記述される。
【0011】 VRA調整は様々な形式の聴覚損傷の療法として使用されるかもしれない。聴覚
損傷のほとんどすべての形について最適な解決策は、バックグラウンド音の‘汚
染’なしに興味がある聴覚信号(通常音声)を聴覚損傷聴取者が受信することを許
容することであることを、聴覚学の専門家はすばやく指摘するだろう。したがっ
て、VRAの特徴は聴覚損傷個人の人生を高めることを期待することができる。し
かしながら、最近の調査は、集団の実際にはすべての区分で好ましい信号(例え
ば、スポーツアナウンサーの音声)と残りのオーディオ信号(例えば、群衆のバッ
クグラウンド雑音)の最適のミックスにおける重要な変化を確認した。オーディ
オ情報の‘聴取における多様性’のこの必要性の証拠は全地球上にいる何百万人
もの人間の総合的な多様性と一致している。
【0012】 デジタルオーディオの出現が、聴取者へのオーディオ制御情報(または、メタ
データ)と同様に多量の高品質のオーディオ情報を送ることを可能にしたとき、
この発見は到来する。あいにく、デジタルオーディオにおけるVRAの特徴の編入
はこれまでどんなメディアの形にも提供されていない。この領域での仕事は、AT
SC AC3デジタルオーディオ標準の任意の部分として構成されたいわゆる‘Herrin
g Impaired Associated Service’の言及に制限された。1995年 ATSCレポート“
A-54: A Guide to the Use of the AC3”参照。それは、AC3ビットストリーム
の一部として聴覚損傷ユーザが音声のコンテンツだけの特に準備された信号を受
信すること、およびATSCの指定されたビットストリームの一部として通常伝送さ
れる他のオーディオチャンネル(主なオーディオサービス)で、調整されたボリュ
ームでその音声コンテンツを混合することをいかに欲するかを記述する短いパラ
グラフを含む。A-54ドキュメントで言及されるAC3オーディオ方式がデジタルオ
ーディオの専門家によって‘知覚のコード化’圧縮形式と呼ばれたDolby Labs圧
縮アルゴリズムに基づくことは、周知のことである。知覚のコード化アルゴリズ
ムは、記録保管されたファイルの格納サイズ要件を減らすため、およびHDTVなど
のリアルタイムの放送で伝送されなければならない情報の量を減少するため、オ
リジナルのオーディオ信号コンテンツの何らかの割合を捨てるように設計される
。アルゴリズムは、耳がとにかく聞くことができなかったそれらのデータだけを
排除することを試みるので、捨てられたオーディオデータは聴取者により気づか
ないようになると思われる。あいにく、知覚のコード化アルゴリズムは、あるオ
ーディオコンテンツが捨てられた後に保持される究極の聴取品質について積年の
討論を受けることになった。
【0013】 どんなオーディオプログラムでもVRA能力を供給する基本的な理由の1つは、エ
ンドユーザのための理解と聴取満足感を高めることであり、エンドユーザは音声
と残りのオーディオの提供されたミックスダウン比を理解しかつ楽しむことを現
在強いて試みようとする。純粋な音声がAC3などのまさしくその損失のある圧縮
アルゴリズムを使用することで提供されるとき、音声の品質は必ず減少する。AC
3の知覚のコード化アルゴリズムはおよそ12:1の圧縮比で構成され、それはオリ
ジナルのオーディオコンテンツが情報の12オリジナルビット毎に1ビットだけを
保持したことを意味する。これは、VRAの特徴の包含のための第1の目的がその
ような損失のある圧縮アルゴリズムで構成されたオーディオ品質における知覚可
能な損失の範囲によって間違いなく覆えされることを意味する。
【0014】 したがって、エンドユーザがVRA調整で受け入れることを望んでいる音声品質
について、エンドユーザが最終的な決定を成すための1つであるような損失のな
い、または比較的損失の少ないデジタルオーディオコーデックにおけるVRA包含
技術の圧倒的な必要性がある。
【0015】 任意のデジタルオーディオ設定の消費者(最終聴取者としての)に対するVRA能
力のわかりやすい引渡しを確保する実施例の議論の前に、コンテンツプロバイダ
ーが標準化された方法で新しい‘純粋な音声’コンテンツをアクセスしやすくす
ることができる枠組みについて議論することは役に立つだろう。わかりやすい引
渡しはオーディオプログラムを最終聴取者の再生装置に格納するか、または伝送
するために使用される特定のオーディオ形式(例えば、MP3、DTS、Real Audioな
ど)にかかわらず、VRA能力を最終聴取者に提供する行為を示す。
【0016】 この枠組みは、オーディオプログラムを始めるすべてのパーティーによる芸術
的な長所の最少の損失で過程が起ることを確実にしようとする。パーティーは俳
優、ミュージシャン、スポーツブロードキャスター、ディレクター、およびフィ
ルムのオーディオコンテンツ、音楽録音、スポーツプログラム、ラジオ番組、お
よび他のもののプロデューサーを含むかもしれない。可能な枠組みを提供するた
めに、以前に議論された音声対残りのオーディオの記述をさらに明瞭かつ支持す
る新しい用語を導入することは役に立つであろう。
【0017】 このドキュメントの残りで使用される新しい用語が“純粋な音声”と“残りの
オーディオ”の前の名称を反駁または否定することを意図しない。代わりに新し
い名称は、様々なオーディオプログラムのプロデューサーがコード化、圧縮およ
び復号過程のために適切にこれらの信号を確認することができる枠組みを容易に
するために導入されている。さらに、この議論はプロデューサーまたは2次コン
テンツプロバイダーが“純粋な音声信号”および“残りのオーディオ信号” を
作るのに使用するかもしれないいくつかの可能性を明確にする。
【0018】 純粋な音声/残りのオーディオコンテンツの実施例の1つは、“1次コンテン
ツの純粋な音声オーディオ”と“2次コンテンツの残りのオーディオ”を含むよ
うに定義される。これらの2つのラベルの理由は、オーディオプログラムの創始
者が再生で最終の聴取者によって混合される2つの信号を作成する際に何らかの
芸術的な自由を保持する願望と同様に、最終聴取者のためのVRA機能の意図され
た使用に関連する。まず最初に、最終聴取者のVRA機能の意図された用途を考慮
する。彼らがよりよくプログラムを楽しみ、またはよりよくプログラムを理解す
るように、彼らはオーディオプログラムの不可欠の部分を調整することができる
ことを望む。いくつかの場合、調整は明白になるだろう。例えば、スポーツアナ
ウンサーの音声、またはレフリーの発声は非常に間違いなくスポーツプログラム
のオーディオコンテンツの不可欠な情報である。バックグラウンド、または残り
のオーディオはまたオーディオコンテンツに存在している群衆雑音である。いく
らかの聴取者はゲームによりかかわると感じるようにより高いレベルに群衆雑音
を調整することを願うかもしれないが、他のものは群衆雑音でいらいらするかも
しれない。したがって、1次コンテンツの純粋な音声のオーディオ情報がアナウ
ンサーまたはレフリーの音声であり、2次コンテンツの残りのオーディオ信号は
群衆雑音であると述べるのが率直に思える。
【0019】 1次コンテンツの純粋な音声と2次コンテンツの残りのオーディオ間の区別は
他の多数の状況を作ることを容易にしない。例えばフィルムサウンドトラックを
取ると、一度に数人が話しているフィルムに回数があるかもしれない。時々これ
が起こるとき、彼/彼女がただ1つの音声を聞いてさえ、視聴者は筋の完全な理解
と鑑賞で場面を通して感動することができるかもしれない。フィルムの筋の本質
を保持するために一度にすべての音声を聞くことが必須であるときに、得てして
、他の場面があるであろう。後者の場合では、視聴者がその場面中のフィルムの
全体の芸術を鑑賞するために、すべての音声の混合が1次コンテンツの純粋な音
声コンテンツであると考えられなければならないだろう。したがって、究極のVR
A調整のためにプログラムのどんな部分が聴取者に提供されるべきであるかを彼
らが決めるとき、オーディオプログラムを生成する人々によって保持された大き
い度合いの芸術的な自由があるだろう。
【0020】 非音声のオーディオがその時点でプログラムに不可欠であるとプロデューサー
/芸術家が感じるならば、1次コンテンツの純粋な音声信号が非音声のオーディ
オ音と共に構成されることは可能でさえある。例えば、アラームが鳴りだす音は
、俳優/女優がなぜ非常に突然領域を去っているかということを視聴者が理解す
るために不可欠であるかもしれない。したがって、1次コンテンツの純粋な音声
信号はオーディオプログラムのすべての瞬間に厳密に音声情報として解釈される
べきではないが、この信号はまた他の音の簡潔な部分を含むかもしれないことが
理解される。
【0021】 これは“1次コンテンツのオーディオ(PCA)”情報と呼ばれる第3の定義を動機
づける。これはまた伝送の目的のために重要である。一般的なオーディオに使用
されるより効率的である圧縮アルゴリズムを使用して、スピーチだけのオーディ
オコンテンツを圧縮することが可能であることは、技術に熟達した者によく知ら
れている。これはスピーチだけのオーディオコンテンツの帯域幅を減少すること
に関連する。したがってそれは、信号が‘1次コンテンツの純粋な音声(PCPV/PC
A)’または‘1次コンテンツの音声(PCA)’であるかをプロデューサ−が定義
するコード化の過程の効率及び品質に重要である。信号がPCPV/PCAであると定義
されるときスピーチだけのコード化を許容し、プログラムがPCAとしてフラグを
あげられるとき、これらの瞬間により一般的なエンコーダアルゴリズムに切換わ
ることを許容するように、これはオーディオプログラムが発展するとき変化する
パラメタとしてエンコーダへ供給することさえできる。
【0022】 PCPV/PCA/SCRA信号生成の別の重要な特徴は、プログラムの様々な点でそれら
の信号のいずれかまたはすべてにおいて空間的な情報の潜在的必要性である。聴
取者が通常中心に置かれたフィルムの音声コンテンツに対して、取り囲まれた位
置から来る情報を聞くことが不可欠である場面があることはほぼ確実である。そ
の能力が提供されないならば、プログラムは何らかの芸術的な長所と、ことによ
ると筋の鑑賞を失う。何らかの不可欠な空間的な情報の包含が信号の多重チャン
ネル再生により収容されることができる。したがって、この発明はまた、1次コ
ンテンツの純粋な音声の多重チャンネルの格納、圧縮、および復号の必要がある
それらの状況を可能にする方法を説明しようとする。
【0023】 過去の15年間のデジタルオーディオ技術の開発は、“デジタル音”を基礎とす
る生成、コード化および復号化過程における多数の方法を導いた。デジタルオー
ディオ信号の多重チャンネルの作成、格納、処理、配送、および再生が現在、何
年間も実行されたことを指摘することが最も重要である。事実上、デジタルオー
ディオにおける最近の傾向は、再生装置に引渡すことができるオーディオチャン
ネルの数が絶えず増加する方向にある。例えば、最新のMPEG-4のデジタルオーデ
ィオ標準(ISO###) に織りこまれた主要な新しい特徴の1つはコード化、ビットス
トリームおよび復号化過程におけるデジタルオーディオの最大64チャンネルを収
容する能力であった。
【0024】 より大きい数のデジタルオーディオチャンネルに向かったこの圧力はこの発行
によって予想されなかった。実施例の非常に重要な部分の特徴は、広くさまざま
な聴取者が新しいVRA調整が提供されるために欲しい(聴覚損傷のない聴取者)、
または必要がある(聴覚損傷した聴取者)認識である。したがって、この認識は、
デジタルマスターの形式が全体のデジタルオーディオ生成の過程を通してPCPV/P
CAおよびSCRA信号の完全性を維持するように、プログラムされた新しいコード化
技術といかに両立性があるかの記述のための必要性を導いた。
【0025】 この完全性を維持することは、聴取者が結局2つの信号のみ、−音声と残りの
オーディオ−の再生の際に調整することができることを確実にするのに不可欠で
ある。PCPV/PCA/SCRA信号を構成するこの行為は、あるレベルで混合として見ら
れるかもしれない。しかしながら、発明は生成の過程の中でPCPV/PCA信号を維持
することを容易にし、その結果その信号単独で対話情報を理解する能力を聴取者
に与える。
【0026】 もう一方の等しく重要な観測は、デジタルオーディオ生成の過程を通して全て
の方法でPCPV/PCA/SCRA信号を得るために必要とした正確な可能な技術が現在存
在しないということである。したがって、以下で議論される最も重要な実施例の
幾つかはそれらの信号の完全性を維持する方法に関連づけられる。これは特別な
ヘッダーデータおよび補助データチャネルの使用によって達成され、それは、1
)入来信号がPCPV/PCA/SCRA情報(すなわち、VRA可能である)を有する任意のエン
コーダに“通知する”;2)PCPV/PCA/SCRAコンテンツが知られている方法でVRA
可能デジタルマスターテープ/ファイルからデコーダへ送られるように、ビット
ストリームをいかに開発するかをエンコーダに指令する;3)そして、再生装置
でPCPV/PCA/SCRA信号をいかに構成、再構成、および/または再生するかについて
デコーダに情報を供給する。
【0027】 発明の実施例について説明する前に、上に提供された新たに記述された用語を
使用するVRA調整の根源の意図をはっきりさせることも役に立つかもしれない。
この発明で提供される解決策の1つが純粋な音声と残りのオーディオ即ちPCPV/PC
A/SCRAのどちらかとして引用される、2つのユニークなオーディオ信号を作成す
ること、そしてそれぞれの信号のボリュームを独自に調整する最終聴取者に容易
に配送することであることを思い出すべきである。したがって、この発明は、結
局最終聴取者がそれらの2つの信号だけのボリューム調整へのアクセスを与えら
れる新しい生成の過程を定義しようとする。
【0028】 前の例から、PCPV/PCA信号が記録された情報の多数のチャンネル(主として、
排他的でないなら、音声コンテンツオーディオ)からオーディオコンテンツを一
緒に混合することによって構成されるとき、回数があることは明確である。しか
しながら、最終結果が2つの個々の信号−PCPV/PCA信号とSCRA信号−だけの作成
であることを評価することは読者にとって非常に重要である。このドキュメント
で後で示される実施例のように、それらの2つの信号が最終聴取者のために最終
的に構成される生成経路に様々な位置がある。例えば、プロデューサーは、それ
らが最初の習得テープであるように録音の過程の間それらを結合することを望む
かもしれない。
【0029】 別の方法は、プログラムの異なった歌手/俳優から多数の音声トラックを記録
して、次に記録後混合セッションの間にPCPV/PCA信号を作成するためにそれらを
結合するかもしれない。別の可能性は、多くのチャンネルでデジタルテープを作
成し、次に、プログラム再生中任意の瞬間にPCPV/PCAまたはSCRA信号を作成する
ために、いかにそれらのチャネルを任意のある混合にダウンミックスするかをデ
コーダに指示するデータチャンネルに沿って送ることである。しかし、これらの
すべての発明的な方法の最終結果は、最終聴取者がVRA調整を可能にする2つの信
号だけを与えられることである。
【0030】 したがって、オーディオプログラム音響技術者によって特定の方法で扱われる
べきPCPV/PCA/SCRA信号のために必要性があることが非常に明らかである。この
とき、VRA調整のためのエンドユーザに、同時になお完全に別々に、1次コンテン
ツ(純粋な音声)のオーディオおよび2次コンテンツの残りのオーディオの引渡し
を可能にするであろうデジタル習得、コード化アルゴリズム、または復号化アル
ゴリズムを組み入れる産業的に定義された方法はない。以下の実施例は、コンテ
ンツプロバイダー、2次プロバイダー、および最終聴取者が、録音とスピーカー
再生の間の任意の段階で利用されるオーディオコーデックの多数の人のために、
VRA調整の最大限の利点を得ることができることを確実にするために開発された
方法を説明する。VRAの過程を可能にする多数の記録保管形式がまた以下で詳細
に記述される。
【0031】 最終聴取者による究極のVRA調整を可能にする例示的実施例の記述が以下に与
えられる。これらの実施例をよりよく評価するため、テレビ、VCRプレーヤー、D
VDプレーヤー、CDプレーヤまたは他の任意のオーディオ再生装置であるか否かに
関係なく、最後の再生装置でPCPV/PCA/SCRA信号の明白な省略を示すためにデジ
タル・オーディオ引渡しの既存の状態を明白にすることが第1段階である。図式
的に、これは図1に示される。図はオーディオプログラムを作るべきである構成
要素プログラムソース110で始まる典型的なオーディオ生成の過程について表現
する。様々な要素は、通常DATレコーダー115で線形、非圧縮オーディオ形式を使
用して記録される。これは非圧縮、非混合デジタルマスターと呼ばれるであろう
【0032】 次に時には、ミキサー/エディタ120があり、テレビビューア130または映画ビ
ューア135あるいは他の多数のオーディオアプリケーションに引渡されるべきで
あるオーディオチャンネルを作成するために混合と編集の過程を実行する。例え
ば、そのオーディオコンテンツは左右のステレオチャンネル、L、R、C、LSおよ
びRSを含むいわゆる5.1チャンネル、または2つの付加的サラウンドスピーカー
を加える7.1チャンネルからなる。MPEG4などの最近の標準はさらに大きい数のオ
ーディオチャンネルの能力に備えるが、この時点で広範囲の実行において7.1以
上の他のアプリケーションはない。130と135の方式は混合された非圧縮デジタル
マスター125と呼ばれるであろう。
【0033】 次のステップはオーディオコーデック150に非圧縮オーディオを演じることで
あり、オーディオはおそらく圧縮のある量をとおして、次にビットストリームシ
ンタキシングへ行くであろう。この点で、圧縮され、混合されたデジタルマスタ
ー145を構成することが可能になるであろう。生成の過程は圧縮され、混合され
たデジタルマスター145のコピーを最も典型的に作り、図で示された他の2つのマ
スターテープバージョンに対してコピーのそのバージョンを分配するだろう。次
に、再生装置155がデコーダ150の設定によって、5.1、7.1チャネルなどのステレ
オを再生する。
【0034】 以下に提示されるこの発明の実施例を理解するために、現在の実行が任意のデ
ジタル習得テープ構成を使用するPCPV/PCA/SCRA信号の格納または作成のための
手段を提供しないことに注目することが重要である。したがって、以下のセクシ
ョンの実施例は究極のVRA目的に関するそれらの信号の生成を収容するデジタル
マスターを構成する様々な方法を提示する。
【0035】 VRA可能なディジタル習得実施例 オーディオプログラムのVRA可能なデジタルマスターテープまたはファイルの
異なったバージョンを作成するために必要である可能なステップは図2Aと2Bで示
される。“VRA可能”はPCPV/PCAおよびSCRA信号をはっきりと含み、またはそれ
らの信号の1つまたは両方がデジタルマスターからコピーされた補助データおと
び他のオーディオデータを使用してデコーダレベルで構成されるような十分な‘
VRA補助データ’を含むデジタルマスターテープまたはファイルを言う。図2Aを
参照すると、それらが音楽、フィルム、テレビ番組、映画、または他のものであ
るか否かに関係なく、全てのオーディオプログラムが、マイクロホンを利用して
すべての型のオーディオ情報をリアルタイムで電気信号(図2Aでは‘ライブ’と
して指示される)へ変換し、それはスピーカーに送られまたはアナログかDATレコ
ーダー205のどちらかのトラックとして格納されることがわかる。オーディオ情
報はまた、プログラム210の芸術家および/またはプロデューサーの計画にしたが
って、1次コンテンツのオーディオ信号(PCPV/PCA)212および2次コンテンツの残
りのオーディオ信号(SCRA)214を引出すために使用することができる。
【0036】 “引出されたオーディオ”ラベルはハードウェアの構成要素と対照的に芸術的
な過程を含み、1つ、2つまたはそれ以上のオーディオトラック205を利用するか
もしれない。図2Aにおいて、これらの2つの信号は、オーディオプログラム215の
ために2チャンネルの、非混合、非圧縮、VRA可能なデジタルマスターを作成する
ためにDATレコーダーへ入力ノード217ですべてのオーディオソース(PCPV/PCAとS
CRA信号を引出すために使用されるそれらを含んでいる)から別々に利用可能なト
ラックのすべてを再結合される。入力ノード217は文字通り信号を一緒に合計し
ないが、デジタルマスターテープ215にそれらを単に結合することに注意を要す
る。デジタルマスター215は、望ましくは、オリジナルのオーディオ信号の品質
を保持するために、線形PCM形式または最適のPCM形式のような、しかしこれらの
特定の形式に限定されないが、非圧縮または比較的損失のない圧縮されたデジタ
ルオーディオ形式を使用して構成される。(線形PCM形式はデジタルオーディオフ
ァイルに使用される周知の非圧縮オーディオ形式である) 。
【0037】 VRA目的のためのデジタル習得の不可欠の部分は、記録過程に関する一定の詳
細、各チャンネルのためのラベル、2つの信号のための空間的な再生指示、およ
び再生装置225および245でオーディオコーデック230および/またはデコーダによ
って必要とされる他の不可欠の情報を定義する、VRA可能かつ特別な補助データ
としてマスターテープを確認する特別な‘ヘッダー’情報の作成である。ヘッダ
ー情報、およびVRA補助データはこの実施例の寄与している特徴である。句‘オ
ーディオコーデック’は、デジタル情報の圧縮が起り、伝送のある方法がデコー
ダ(通常MPEGベースのISO標準)へビットストリーム過程を通して含まれ、最終的
な復号が圧縮された信号をオーディオスピーカーのためアナログ形式に戻すコー
ド化の過程を言う。ある実施例のために、VRAヘッダーと補助データ情報は、デ
ジタルマスターで作成しかつ格納するのと対照的に、圧縮コード化レベルで導入
された別々のビットストリームとして提供することができる。補助データおよび
ヘッダー情報の実施例は以下のセクションで非常に詳細に議論される。
【0038】 図2AのVRA可能なデジタルマスターの非圧縮バージョンが一度完全されると、
非圧縮デジタル形式のPCPV/PCA/SCRA信号をオーディオプログラムのために復号
することができるVRA可能なプレーヤー225で再生する前に、マスターテープのデ
ジタル情報は非圧縮オーディオファイル形式220として分配のためにコピーされ
ることができる。例えば、従来のCDオーディオは再生のために非圧縮、線形PCM
データファイルを使用する。これは、CDプレーヤがオーディオ情報がVRA可能か
否かを認識することを備えられ、かつPCPV/PCA/SCRA信号を収容することを備え
られることを必要とするかもしれない。
【0039】 第2の代替手段として、デジタルマスターファイルコンテンツは、最小スルー
プットレートおよび格納要件を使用される任意の数のオーディオコーデック230
を使用して圧縮することができる。オーディオコーデックのエンコーダ機能の出
力は、オーディオファイル235の圧縮されたバージョンが図2Aに示されるように2
40で記録保管され、多重コピーで再生成される中間的ステップで使用されるかも
しれないことに注意することが重要である。再び明快のため、VRA可能でないデ
ジタルマスターからこのような圧縮され記録保管されたファイルの現在の実施が
、スーパーCDやDVDオーディオのような周知のメディア形式に対応することを我
々は注意する。
【0040】 また、圧縮されたVRA可能なデジタルマスターの記録保管されたバージョンは
、CDメディアまたはDVDオーディオメディアにあるかもしれない。しかしながら
、VRA可能なデジタルマスターの記録保管されたバージョンにおけるPCPV/PCAお
よび/またはSCRAチャンネルの包含は、音声および残りのオーディオ信号の適切
な再生を確実にするために、この発明で記述される特徴を必要とする。明確に、
圧縮され、VRA可能な、記録保管されたファイル240は、PCPV/PCA/SCRAオーディ
オ信号を復号し、VRA調整を容易にする特定のVRA可能な再生装置245にアクセス
しやすく作られることができる。
【0041】 第2の代替手段は、コーデックのコード化の過程による圧縮の後に、コーデッ
クによって使用される特定の圧縮アルゴリズムに従ってVRA可能なデジタルオー
ディオ情報を復号するために構成した再生装置に、直接種々の放送手段に沿って
伝送される情報のためにある。例えば伝送は、両立性VRAアウエアデコーダがオ
ーディオ情報を受信し、VRA調整を容易にするPCモデムへのISDN伝送であるかも
しれない。
【0042】 図2BはVRA能力に必要であるオーディオの過程のわずかに異なった実施例であ
る。この構成の違いはデジタルマスター255がまだPCPV/PCAまたはSCRA信号260を
含んでいないということである。代わりに、デジタルマスター255は、録音産業
においてこの時点では普通である同様な方法で、‘n’記録され、非変更のオー
ディオトラックから成ることができる。PCPV/PCAおよびSCRA信号260を引渡され
た芸術家−プロデューサーが、芸術的な長所とオーディオプログラムのコンテン
ツによって定義される混合過程を通して、普通(即ちVRA可能でない)のデジタル
マスター255のダウンストリームを作成する。
【0043】 これらの信号の混合の実施は以下のセクションで議論するVRA可能コード化過
程を使用して実行されるだろう。この点において、デジタルマスター255およびP
CPV/PCA/SCRA信号260からの変更されないトラックは、VRA可能なオーディオコー
デック265によってコード化され、再生装置280は図2Aの実施例で議論されたのと
同じ方法でこれらの信号にアクセスを持つだろう。この実施例に関して、VRA可
能なデジタルマスターの非圧縮バージョンは決して存在していない。オーディオ
プログラムのプロデューサーがユニークなPCPV/PCA/SCRA信号を指定し、混合す
ることの追加のタスクを2次プロバイダーに渡したいと願うならば、このアプロ
ーチは好まれるかもしれない。
【0044】 第3の可能な実施例は、デジタルマスターに収納される非PCPV/PCAチャンネル
の何らかの組み合わせとして、SCRA信号のコンテンツを指定するのが望ましいか
もしれないという知識によって動機づけられる。これは図3で示される。このよ
うな場合、PCPV/PCA信号だけが非圧縮デジタルマスターの作成の前に作成され、
それは他のオーディオ情報に沿ってマスターに格納される。この実施例に関して
は、特別なVRA補助情報(データ)は、その情報がデジタルマスターに収納される
非PCPV/PCAオーディオチャンネルのある組み合わせからSCRAチャンネルをいかに
構成するかを指定するマスターにデジタル的に含まれるであろう。その情報はVR
A可能デコーダへ伝送のため任意のダウンストリームコード化過程に提供される
だろう。VRA可能デコーダは次に、補助データで指定されたダウンミックスパラ
メタを使用してリアルタイムにSCRAチャンネルの作成のため応答可能である。(S
CRAチャンネル生成を指定するさまざまな方法があり、これらは後でVRAエネイブ
リングオーディオコーデックの特徴について説明するセクションで議論されるで
あろう) 。図3の議論の結果として、非圧縮デジタルマスターオーディオコンテ
ンツ320は、‘1チャンネルのVRA可能な’デジタルマスターを作成する。
【0045】 一層の明確化のため、ダウンミックスする動作が明確に新しくなく、毎日オー
ディオ工学で使用されることが注意されるべきである。代わりに、ここに記述さ
れる革新は、容易な2信号VRA調整のために、さらにPCPV/PCV信号と結合されるた
めに、2次コンテンツの残りのオーディオの構成を可能にするVRA補助データの
作成と伝送に関連する。
【0046】 図3はVRA可能デジタルオーディオマスターテープまたはファイルの実施例の異
なる展望を示す。オーディオデータが同じテープ上のビデオデータと混合される
かもしれなく、したがって、VRA可能なデジタルオーディオマスターテープが必
ずオーディオだけのテープ形式としてに解される必要がないことに注意すべきで
ある。したがって、全体のデジタル習得議論はフィルム、予め記録されたテレビ
番組、または音楽の録音のためのデジタルマスターに等しくよく適用する。
【0047】 図3に示される実施例は、‘ポストミックス’VRA可能なデジタルマスターテー
プ315と呼ばれるだろう。この実施例に示されるように、PCPV/PCA信号は任意の
数のオーディオチャンネル(図においてアナログ信号として考慮される)からの
オーディオコンテンツを混合することにより作成され、SCRA信号は、信号が左、
右、左周囲、右周囲、中央、および低周波数効果チャンネルのために作られたオ
ーディオコンテンツと並んで、別々なチャンネルとしてディジタル化される前に
、‘残りのオーディオ’であるように考慮された幾つかの他のオーディオコンテ
ンツを混合することにより作成される。情報の8つのトラックが、デジタルテー
プに非圧縮オーディオ形式(例えば、線形PCMに制限されない)を使用して格納さ
れる。
【0048】 図3で示される別の実施例は、‘プレミックス’VRA可能デジタルマスターテー
プ320と呼ばれる。この構成では、VRA可能なデジタルマスターの生成は、デジタ
ル録音が習得される前にPCPV/PCAおよびSCRA信号が既に混合されることを必要と
するだけである。示されるように、現在、‘n’チャンネルがあり、ここに‘n’
はデジタルマスター上に存在するかもしれない任意に多数のオーディオチャンネ
ルを言う。この構成は、オーディオプログラムのためにステレオまたはサラウン
ドチャンネル音に使用されたダウンミックス過程で後に使用されなければならな
いある型のデジタルマスターに必要であるかもしれない。しかしながら、1次コ
ンテンツの純粋な音声と残りのオーディオはデジタルマスター上にそのようにあ
らかじめ混合されかつ収納される。
【0049】 図4A-Eに示されるように、VRA可能デジタルマスターテープ(ファイル)の多数
の実施例があることが明確である。VRA可能なデジタルマスターのすべてのバー
ジョンは、VRA可能としてマスターを確認する特別なヘッダーファイルを備える
であろう。次のセクションでヘッダー形式について議論する。プレミックスされ
た、非圧縮された、nチャンネルのVRA可能なデジタルマスターが図4Aに示される
。この場合、デジタルマスターは生成の間に記録されるオーディオの‘n’チャ
ンネルから成る。それらのnチャンネルの何らかの組み合わせによって、PCPV/PC
A信号とSCRA信号(図4Bと4C)の構造を指定することが可能であるだろう。
【0050】 これを達成するために、VRA補助データチャンネルが生成の復号終了でそれら
の指示を提供するマスター上に作成されかつ収納されることができる。したがっ
て、デジタルマスターは‘0チャンネル、非圧縮、プレミックスされたVRA可能な
デジタルマスター’であると考えることができる。用語の0チャンネルは、明ら
かにPCPV/PCAまたはSCRA信号を含むマスター上にどんなトラックもないという事
実を示す。ここに不可欠の点は、テープが、それらの信号が明らかに収納されて
いなくてさえ、再生装置の制御をしている究極の最終聴取者によりVRA調整を可
能にすることができる十分な情報を有することである。
【0051】 また、他の可能な実施例の一般的な図が図4A-Eで示される。最も明白な実施例
は図4Dと4Eに示される。デジタルマスターのこれらのバージョンは、それぞれ‘
1チャンネル、ポストミックス、非圧縮のVRA可能なデジタルマスター’ (図4E)
、および‘2チャンネル、ポストミックス、非圧縮のVRA可能なデジタルマスター
’ (図4D)であるように構成されることができる。ポストミックスバージョンに
おいて、我々は、5.1ミックスチャンネル、または7.1ミックスチャンネル、ある
いはPCPV/PCA信号だけ(1チャンネルのバージョン)かPCPV/PCA信号とSCRA信号の
両方のどちらかに加えて、大きい数の空間的なチャンネルの典型的なステレオ信
号を見出す。この状況において、VRA補助データチャンネルが、オーディオプロ
グラムが進歩しながら2つの信号のどちらかの空間的な位置決めを提供するよう
に使用されるべきである特別な再生特徴について、デコーダに指示するためにあ
るかもしれない。
【0052】 図4Dと4EはVRA補助データと共に収納されたPCPV/PCA信号だけを有する他の実
施例である。この場合、補助データはSCRA信号、PCPV/PCAおよびSCRA信号の再生
、および後で記述される他の機能をいかに構成するかを定義するだろう。
【0053】 このデジタル習得議論を結論づけるために、デジタルオーディオに熟練した者
が図2A、2B、3、および4A-Eで明らかに示されたものよりも他の実施例を確認す
ることは明確である。例えば、この発明で直接定義されるように上で記述された
実施例のすべての圧縮されたバージョンを考えることは簡単である。重要な区別
はまた、すべてのVRA可能デジタルマスターバージョンがVRA可能なマスターを確
認するある種のヘッダーを含み、それがPCPV/PCA/SCRA信号のためにある特性、
構成の技術、または再生の技術を定義する補助データ信号を含むことである。し
たがって図に示されたデジタルマスター方式は、この発明で意図されVRA可能な
デジタルマスター構成を可能にするのみと解釈されるべきでない。
【0054】 今までのところ、上の記述は、包括的なVRAエネイブリング過程が3つの異なっ
た領域と同様に、その全体的長所にしたがってデジタルオーディオ処理技術を改
良することを明らかにした。
【0055】 1) 1次コンテンツの純粋な音声オーディオ信号が、プログラムの筋または叙
情的な意味の鑑賞における僅かなまたは損失のない、オーディオプログラムの音
声コンテンツの改良された明瞭さおよび/または楽しみを可能にする信号に供給
するために構成された過程であって、前記過程はまた、オーディオプログラムの
芸術的な長所および/または楽しみのための改良された鑑賞を可能にするが、プ
ログラムの筋または叙情的な意味の明瞭さまたは鑑賞における評価できる改良を
提供しない残りのオーディオ信号の2次コンテンツの構造を含む過程。
【0056】 2) 非圧縮または損失のない/比較的損失の少ない圧縮された形式を使用し、
前記形式が最適の音声品質、およびオーディオ品質を犠牲にする非常に圧縮され
たオーディオ形式(>8: 1)に基づいてVRA可能習得および/または伝送の際に低下
させる最適の残りのオーディオ品質を保持するために適用される、いわゆる0チ
ャンネル、1チャンネル、および2チャンネルの‘VRA可能なデジタル習得テープ
の創作。
【0057】 3) デジタルオーディオ伝送および/または記憶保管のオーディオファイル格
納を発生させるために使用される任意の数の損失のないおよび比較的損失の少な
いオーディオコーデックにおける1次コンテンツの純粋な音声と2次コンテンツ
の残りのオーディオチャンネル、VRAヘッダー、および/またはVRA補助データを
収容すること。
【0058】 今デジタル習得の過程が定義され、以下に記述される特定の実施例は、AC3の
クラスにおけるコーデックに関連づけられる損失と比べて、損失のないおよび比
較的損失の少ないことが知られているあるオーディオコーデック操作(コード化/
圧縮と復号を含む)で、PCPV/PCAおよびSCRA信号の包含を可能にする特徴に焦点
をあてるであろう。
【0059】 VRA可能なオーディオプログラムのためのディジタル習得特徴 最終聴取者へのVRA調整能力を供給する願望は、プログラムのオーディオコン
テンツに関して芸術的な目標と理想的に両立すべきである。したがって、この発
明の1つの特徴は、両方の目標(VRA能力を供給し、芸術家がオーディオプログラ
ム上で芸術的なライセンスを保持するのを許容する)が両立される過程について
説明しようとする。芸術的な長所の保持は、プログラムが年代順に発展するとき
、あるオーディオ信号の様々な混合により続く1次および2次コンテンツのため
の計画の幾らかの程度をほぼ確実に必要とするだろう。カスタム設計された1次
コンテンツの純粋な音声チャンネルと2次コンテンツの残りのオーディオチャン
ネルの特定の混合と録音は、どんな型のオーディオプログラミングも前例がない
【0060】 したがって、発明のこのデジタル習得態様は、それがデジタルマスターのPCPV
/PCA/SCRA信号を含み、かつVRA可能なデジタルマスターのそのようなPCPV/PCAと
SCRAチャンネルに関する不可欠な情報(位置、サンプリング率、形式、再生パラ
メタなど)を記述する特別な‘ヘッダーファイル’および/または‘補助データ’
コンテンツの対応する習得である必要を含む状況に関係する。
【0061】 これまで、デジタルオーディオの到来は、増加する数のチャンネルを当てにす
る音の空間的な位置付けの新しい方向にほとんど関係された。デジタルオーディ
オのこの多重チャンネルのサラウンド音の使用は、過去の数年のより通常のステ
レオ伝送と比較して、増加する数のオーディオチャンネルの格納および伝送を導
いた。VRA可能なオーディオファイルと伝送は、PCPV/PCAとSCRA情報に必要であ
る余分なチャンネルのために格納と伝送要件をさらに高く押し上げるだろう。革
新的なVRA可能オーディオコーデックは、余分なスループットの繰り返しを最少
にするために定義されるだろう。さらに、デジタルマスターのVRA形式の存在は
、デジタル的に記録されたマスターから引渡される入来ビットストリームを圧縮
/伝送/復号するために使用される任意のオーディオコーデックにより、VRA可能
オーディオファイルとして‘確認’されることを必要とするであろう。デジタル
マスターがVRA可能としてフラグを揚げられなければならない2つの不可欠の理由
がある。まず最初に、PCPV/PCAチャンネルは特定のスピーカー位置で再生される
必要があり、したがってそのチャンネルは、正確な時間的/空間的な再生手順を
記述する補助データで時間整合されなくてはならない。第2に、図3に示される
ように、SCRAチャンネルはデコーダによって構成されることが必要であるかもし
れない。また、その信号を作成するための指示はVRA補助データにプログラムさ
れるだろう。我々はまた、それが復号過程に入るときにVRA補助データを収容す
るために発明的な方法があることに注目する。例えば、それはVRA可能オーディ
オのためのnチャンネルビットストリームの埋め込まれた情報として導入される
か、または全く別なチャンネルとして送られるかもしれない。
【0062】 オーディオコーデックのPCPV/PCAおよび/またはSCRA信号の収容 以下で記述される実施例は、‘VRA可能’ デジタルマスターテープまたはファ
イルの前に定義されたオーディオ情報を使用して、1次コンテンツの純粋な音声
信号と2次コンテンツ残りのオーディオ信号が最終聴取者に到達することを可能
にする。前のセクションにおけるデジタル習得議論は、非圧縮か圧縮されたオー
ディオ形式のPCPV/PCAとSCRAチャンネルの格納とデジタル‘タグ付け’について
説明した。マスターに記憶されたオーディオの非圧縮形式と比較的損失の少ない
圧縮(圧縮比<8:1)は、オーディオ生成過程の習得終了で問題なく、オリジナルオ
ーディオ信号の忠実性を維持するために必要とされた。デジタルオーディオ圧縮
はオーディオデータのより効率的な格納および伝送を可能にする。オーディオ圧
縮技術の多くの形式は、エンコーダおよびデコーダの複雑さ、圧縮されたオーデ
ィオ品質、およびデータ圧縮の異なる量の範囲を提供する。今、発明のこの態様
は3つの部分:損失のない圧縮および比較的損失の少ない圧縮アルゴリズムに基
づいたコード化方法、VRA補助データにより供給される補助情報の使用、および
非圧縮のVRA可能なディジタルマスターに存在するヘッダーファイル(即ち、い
わゆる‘ディジタルタグ付け’)のコード化に関係する。ISO MPEG IIおよびMPE
G IV標準は比較的損失の少ない圧縮アルゴリズム(即ち、<8:1)に頼り、そのた
めMPEGオーディオ形式はVRAエンコーダおよびVRAデコーダを含むある特徴を示す
ように使用されるであろう。このセクションに記述された実施例が他のオーディ
オ形式にも適用可能であることが明白にされる。通常の技術が、この文書の前に
詳細に記述された、いわゆるPCPV/PCA、SCRAおよびVRA信号の存在および特別な
データの取扱いにより定義されたように、VRAコード化またはVRA復号化の使用を
教示しないことがまた注目される。
【0063】 圧縮されたVRA可能なディジタルオーディオの実施例は損失のない圧縮の一般
的場合として記述されるだろう。用語、損失のない圧縮は、受信された圧縮され
た信号を復号するとき、非圧縮デジタルオーディオマスター上にあったオリジナ
ルオーディオ信号を全くデータの損失なしで再作成することが可能であるという
事実を示す。従来の技術は、入来PCMデータストリームにおける、PCPV/PCAまた
はSCRA信号のどちらかの存在を認識するように設計されるオーディオコーデック
の存在を含んでおらず、音声だけの信号(すなわち、PCPV/PCA信号)の低帯域幅の
利点を取るオーディオコーデックも存在していない。
【0064】 したがって、以下の実施例に提供される記述は、多数のユニークな特徴を提供
し、それは:VRA可能な非圧縮デジタルオーディオファイルの自動認識によるコ
ーデックの使用; スピーチ信号のために特に設計されたオーディオ圧縮アルゴリ
ズムを使用しているPCPV/PCAチャンネルの他と全く別な処理、より一般的なオー
ディオ圧縮アルゴリズムおよびデコーダでの再混合を使用して圧縮される他のオ
ーディオトラックと同期された時間、損失のない圧縮アルゴリズムを使用するVR
A可能デジタルオーディオ情報の圧縮、AC3アルゴリズム(圧縮比8:1以下を意味す
るようにここで指定される) より多いディジタルデータを保持する損失のある圧
縮アルゴリズムを使用するVRA可能なデジタルオーディオの圧縮、VRA可能なデジ
タル1チャンネルのマスターの場合のSCRAチャンネルのための製作指示、特定の
スピーカへPCPV/PCAおよびSCRAチャンネル情報を割当るため、VRAデコーダによ
って使用される再生位置の仕様、PCPV/PCA信号の任意の必要な空間的な位置決め
の方法、および既に存在している種々のオーディオコーデックにPCPV/PCAとSCRA
チャンネルを組み込むVRA可能なエンコーダの特定の特徴を含む。
【0065】 図5は全般に損失のない圧縮アルゴリズムに基づいて発明のこの部分の主要な
概念を示す基本的なブロックダイアグラムを示す。(損失のない圧縮アルゴリズ
ムに関する1つの例がメリディアンロスレスパッキングMeridian Lossless Packi
ng(MLP)アルゴリズムである) 。この例に関しては、非圧縮VRA可能なデジタルマ
スター510がVRAオーディオコーデック520に入力されるように使用される。ここ
での区別は、コーデック520のコード化および復号化の終了で使用されるVRA可能
エンコーダ530とVRA可能デコーダ530がそれぞれなくてはならないということで
ある。VRA可能デコーダ535の出力、およびしたがって、オーディオコーデックの
出力は、最終聴取者により独自に調整することができる音声と残りのオーディオ
信号になるだろう。次に、オーディオコーデック520のVRA可能な構成要素につい
て議論する。
【0066】 VRA可能なエンコーダ VRA可能なエンコーダの概念的な実施例が図6で示される。この図は1チャンネ
ル、n圧縮された、プレミックスVRA可能なデジタルマスター610の前の記述に依
存する。しかしながら、たとえVRA可能なデジタルマスターのどんな形式が入力
のときにオーディオコーデックに導入されても、記述の本質は同じままである。
図6のダイヤグラムは、プレミックスされたPCPV/PCA信号が他のオーディオ情報
の‘nチャンネル’と一緒にエンコーダの損失のない圧縮アルゴリズム630に送ら
れることを示すように意図される。また、VRAの補助データ620にある予め記録さ
れた情報がエンコーダに送られるかもしれない。また、ソフトウェアインタフェ
ースが、生成過程の混合/コード化/圧縮段階でVRA補助データ640のすべてまたは
付加的部分を作成するために使用されるかもしれない。この特徴はプロデューサ
ーがタスクを下請けするかもしれない2次プロバイダーにVRA創作タスクを回す
ことを許容するであろう。
【0067】 最終的に、圧縮され、ことによると混合されたオーディオおよび補助データは
圧縮形式で格納され、またはエンコーダの過程の一部として作成されたISOビッ
トストリームとしてデコーダに伝送される。それらがこの段階でプレミックスさ
れるならば、PCPV/PCA信号とSCRA信号は、現在デジタルオーディオの技術に熟練
した者のだれによっても実行される方法でMPEGベースのビットストリーム標準に
組立てられるだろう。図7は図6で示されたのと同様の図である(特徴の記述は繰
り返されない)。例外はデジタルマスターが2チャンネルのVRA可能形式であると
いうことである。コーデックへの入力におけるSCRA信号の存在を除いて、記述的
特徴は図6のためのそれらの議論と同じである。
【0068】 図8-11は 以下の何らかの組み合わせに依存するVRA可能エンコーダのための4
つの異なった実施例の特別な構成:一般的なオーディオ信号の損失のないか比較
的損失の少ない圧縮のためのアルゴリズム、スピーチだけ圧縮のアルゴリズム、
VRAヘッダーと補助データ情報の正確な処理、およびVRA可能なデジタルマスター
の何らかの形式の入力である。これらの様々な特徴の様々な組み合わせがここに
言及することができないくらい多数であるが、この発明で概説される意図で総合
的なVRA可能オーディオ生成の過程とすべて一致していることが強調される。
【0069】 最初に図8を参照すると、2チャンネル、ポストミックス、非圧縮、VRA可能な
デジタルマスター810がVRA可能エンコーダへの入力としてに示される。左、右、
中央、左の周囲、右の周囲、SCRA、およびPCPV/PCA信号がデジタルマスターのこ
の形式のために既に混合され、‘一般的な’オーディオコーデックの圧縮アルゴ
リズム820によって圧縮される。アルゴリズム820は知覚ベース、または冗長ベー
ス、あるいは帯域幅に配慮することなく圧縮に導く他の技術であってもよい。
【0070】 VRA補助データは、圧縮アルゴリズムによって作動され、次に標準ベースの手
順を用いてISO ビットストリームに配列される。例えば、MPEG-2 AAC(高度なオ
ーディオコーデック、ISO/IEC 13818-7)は、標準が支持する15の埋め込まれたデ
ータストリームの内の1つを通してVRA補助データを分配するように使用される。
補助データを整列する他の方法があり、それらの方法は技術に熟練した者に周知
のことである。コーデック800の出力は、2チャンネルマスターの圧縮されたバー
ジョンを格納するのに使用することができ、マスターは次に、分配のための再生
を作成するのに使用されるだろう。代わりに、ビットストリームは、PCのメディ
アプレーヤーのように再生装置のデコーダに直接伝送されることができる。
【0071】 図9によって意図される過程は、2つの区別を除いて図8の前のものと同様であ
る。まず最初に、PCPV/PCA信号は、他のオーディオ信号が一般的な圧縮アルゴリ
ズム820を使用することで圧縮されるが、スピーチだけコーデック920で圧縮され
る。スピーチコード化は、G.722コーデックや符号励起線形予測Code Excited Li
near Predictive(CELP)コーデックなどのいくつかの知られているスピーチコー
デックの任意の1つを使用して行うことができる。スピーチだけのコーデック920
を使用するPCPV/PCA信号の圧縮と一般的なコーデックを使用する他のオーディオ
信号の圧縮の間のこの区別は、VRA可能ビットストリームと格納要件のために必
要な帯域幅を減少させるのを助けるだろう。
【0072】 開示されたVRA可能エンコーダは、累積している情報(PCPV/PCA、SCRA、VRA補
助データ)が含まれるこの方法であり、その結果VRA可能オーディオ伝送のための
帯域幅要件を減少する2段圧縮アプローチと同様に、VRA可能なオーディオ形式を
作ることが注目されるべきである。この図の第2の重要な区別は付加的な‘nオ
ーディオチャンネル’の存在である。この実施例は、再生でPCPV/PCAまたはSCRA
信号を高める付加的オーディオチャンネルについて必要があるかもしれない状況
を収容する。それらの付加的な信号は一般的な圧縮アルゴリズムによって圧縮さ
れ、どんな特別な再生要件も補助データストリームによって定義されるだろう。
【0073】 図10と11は1チャンネル、非圧縮、混合されたVRA可能なデジタルマスターを圧
縮に導く2つのVRA可能エンコーダ構成を示す。前と同様、PCPV/PCA信号(図10参
照)のためのスピーチだけのコーデックを使用することが望ましく、エンコーダ
は、図11で示されるすべての信号について一般的なオーディオ圧縮アルゴリズム
を使用するために設定されることができる。
【0074】 図12はVRA可能コーデックのためのある概念的な構造の第2の表現を示す。こ
の表現の本質は、PCPV/PCA信号にある音声の情報がスピーチだけの圧縮アルゴリ
ズムを使用して圧縮され、SCRA信号がより一般的で、広い帯域幅のオーディオ圧
縮アルゴリズムを使用して圧縮される図9と10の実施例と似ている。図12を参照
すると、要素1210および1220は、圧縮前のそれぞれPCPV/PCAとSCRA信号のデジタ
ル表現であり、従来のLPCM形式と同様である。デジタル情報が指示されたような
WAVファイル、または非圧縮デジタルオーディオファイル他の幾つかの形式とし
て利用可能であるかもしれないことに注意すべきである。2つのオーディオスト
リームが、前のオーディオ圧縮構造上の重要な区別であるこの段階に並列である
ように考慮される。
【0075】 対照的に、従来のオーディオ圧縮の過程は、圧縮アルゴリズムに音声と非音声
の要素の両方を持っている直列の、単一チャンネルのオーディオストリームを与
えることであるだろう。直列のビットストリームが、1次音声または1次非音声で
あり、異なったサンプリング速度をもたらし、直列のビットストリームのコンテ
ンツとして恐らく異なった圧縮アルゴリズムさえ1次音声と非音声の間で異なる
ときに、認識することが可能である。
【0076】 したがって、従来の技術は図12で示される実施例よりも全く異なっている。図
12において、圧縮ユニット1250と1260の並列な配列によって示されるように、2
つの並列な流れが全ての時間に、2つの異なった圧縮アルゴリズムに供給される
。スピーチだけの圧縮ユニット1250は技術に熟練した者に知られているどんな圧
縮アルゴリズムも含んでいる。PCPV/PCA情報はその圧縮ユニット1250に入力され
、1220にあるSCRA信号は、圧縮ユニット1250の音声だけの圧縮と共にまさに並列
(PCPVとSCRAの間で時間的同期された)にある方法で一般的なオーディオ圧縮ユニ
ット1260に入力される。
【0077】 また、オーディオは、例えば主要な映画の対応するビデオおよびオーディオコ
ンテンツのように、時間的同期および関連するビデオコンテンツにビデオフレー
ム同期されることが考慮される。圧縮ユニット1250と1260の出力は、1285により
特別な方法で多重化され、その結果飛び越し走査されたVRAオーディオは、中間
ファイルとして記憶され、または何らかのデジタル媒体1295により伝送すること
ができる。逆多重化過程1290は、それぞれ逆圧縮(decompression)ユニット1270
と1280によりそれぞれ逆圧縮のため別々のPCPV/PCA情報とSCRA情報を開く。最終
的に、逆圧縮されたPCPVとSCRA情報が記録保管され、この段階で望ましい、また
はよりありそうなら、以下で議論する図13の記述と同様に、別々のボリウム制御
のため再生装置に直接送られるであろう。
【0078】 図12においてまた、VRAコーデックが作成され、それは実際に任意の他の既存
の音声だけまたは一般的なオーディオ圧縮と逆圧縮アルゴリズムと両立可能であ
る。我々は、PCPVとSCRA信号の並列な入力構造を収容するマルチプレクサ1285の
ユニークな操作により、圧縮ユニット1250と1260が音声だけおよび一般的なオー
ディオ圧縮のそれぞれのクラスにおいて、アルゴリズムを使用することができる
ことを強調する。さらに、マルチプレクサ1285は、これらの部分の安全な伝送を
提供するために、PCPV/PCA信号および/またはSCRA信号のどちらかのために暗号
ユニットまたはアルゴリズムを含むことができる。信号の暗号化は技術に熟練し
た者に知られているどんな技術によっても実行することができる。
【0079】 VRAの補助データチャンネルの作成、コンテンツ、および機能性 補助のチャンネル自体は1次コンテンツの純粋な音声(PCPV)オーディオ信号と
2次コンテンツの残りのオーディオ(SCRA)信号に関するさまざまな情報から成る
だろう。以下にそのデータを作成することができるそれらの特徴、それらの機能
性、および方法について議論する。
【0080】 VRA可能なプログラムの存在−得てして、ヘッダーファイルの中に含まれるよ
うに、この情報はオンまたはオフを表示しているシングルビットとして表現する
ことができる。ビットが1であるならば、VRA可能なプログラムは、前に記述され
た(すなわち、PCPVとSCRAオーディオが存在している) VRAオーディオ形式を使用
して作成される。オーディオ技術者がVRA生成の技術を使用すると、このビット
は生成レベルにおけるソフトウェアかハードウェアスイッチによって設定される
だろう。別の方法で、オーディオプログラムは通常の混合習慣に基づくように考
慮される。
【0081】 PCPVとSCRAチャンネルの数―この情報は、それぞれのチャンネルの1つより多
くの表示が存在しているフラグによって先行されることができる。それがそのよ
うに表示されるならば、さらなる情報がPCPVとSCRAプログラムの各々に利用可能
である空間的なチャンネルの数として提供される。ここにこの数に設定される特
別な制限はなく、再生ハードウェア(例えば5つのスピーカー=5つの利用可能な
チャンネル) に依存しているようである。これらの数は、いかに多くのオーディ
オチャンネル(例えば、3PCPVチャンネルと5.1SCRAチャンネル)が復号のために存
在するかをデコーダに伝える。オーディオ生成技術者は、各場面に与えられる芸
術的な解釈に基づいて、2つのオーディオプログラム(PCPVとSCRA)の各々を作成
するためにデコーダに要求されるチャンネルの数を指定するだろう。帯域幅を保
存するために、利用可能なオーディオチャネルの数がプログラム内またはプログ
ラム間で変化するなら、チャンネルのPCPVとSCRA数を含むデジタル語が時間の関
数として変化するかもしれない。
【0082】 生成ミックスデータ−PCPV/PCAおよびSCRA信号をいかにして構成するかに関す
る振幅と空間的な情報との両方がこのデータブロックの一部としてコード化され
ることができる。復号されたオーディオプログラムを有する再生と結合されたこ
の情報は、オリジナルの生成混合を再現するであろう。(この発明のための究極
の目的は最終聴取者がVRAを調整するのを許容することであるが、ユーザによる
調整が適用されるまえに提供されるなら名目上の再生指示が必要とされるであろ
う。他の方法で述べれば、エンドユーザによる任意の調整が出発点として生成混
合レベルに作動するであろう)。続いて、例として、前のデータ(PCPVとSCRAチ
ャンネルの数)が、2つのプログラムの各々の1つ(1つのPCPVチャンネルと1つ
のSCRAチャンネル)が利用可能であるデコーダに指示されるなら、生成ミックス
データは、両方の信号がセンタースピーカーの上でPCPVレベル1.0およびSCRAレ
ベル1.2(例えば)で再生されるべきであることを示すだろう。
【0083】 したがって、プロデューサーのオリジナルの意図は生成の過程の混合段階で実
行される実際のボリュームレベルとバランス調整の使用を通して実現される。代
わりに、この発明の結果として、最終の聴取者は今やオリジナルの生成混合を乗
り越えてかつオーディオのままで残る音声の彼自身の混合を作成する能力を受け
る。この生成ミックスデータ(すべてのPCPVとSCRAチャンネルのための振幅情報
だけではなく、同様にすべてのチャンネルのためのの空間的な情報も含むだろう
)を継ぎ目なく統合するために、空間位置制御と振幅制御のノブ位置を検出し、
時間の関数としてVRA補助データチャンネルに直接その情報を移すソフトウェア
アルゴリズムを設計することが可能である。
【0084】 前の例を続行して、プロデューサーはプログラムの時間中、SCRAがPCPVと比べ
て柔らかくあるべきであるとして、SCRAオーディオを低下するかもしれない。こ
の動きおよびその後の新しいレベルはアルゴリズムによって検出され、VRA補助
データファイル形式に変形されるデータファイルに記録される。また、振幅生成
ミックスデータはユーザにPCPVとSCRA信号の両方のために別々に異なるプログラ
ム中で自動的に一様性を確立させるだろう。これは音声を残りのオーディオ(こ
の情報が利用可能でないならば、音声をあいまいにすることができる)と同様に
商業およびプログラム間の一定のSPLに残すことを許容するだろう。
【0085】 また、プロデューサーがPCPVとSCRA信号(多重チャンネルまたはそうでない)を
作成し、その結果直線的に加算されるとき正確な生成混合が作成されるならば、
デコーダエンドに生成混合のレクリエーションのための増幅と空間的な位置情報
のすべてを伝える必要はないことに注意されるべきである。このデータがVRA補
助チャンネルに含まれていないなら、デコーダはオリジナルプログラムの正確な
生成混合再生をもたらす生成混合のために直線的組み合わせを自動的に不履行に
するであろう。
【0086】 PCPVとSCRAの特定のメタデータ−二元プログラムオーディオ(PCPVとSCRA)と利
用可能な再生の特徴をさらに高めるために使用することができるさまざまなメタ
データがある。まず最初に、デコーダが再生中にPCPVとSCRA信号の両方のレベル
を調整するために、過渡現象の存在においてレベル情報が含まれるかもしれない
。これは単に、PCPVとSCRAの両方の実際のオーディオと時間同期しているデータ
ファイルにその出力を移す信号強度検出器を含むであろう。ある型のプログラム
過渡現象の間SCRAがPCPVをぼかさないように、互いに関して各信号ボリュームレ
ベルを自動的に制御するため、復号の過程がこのデータを利用することができる
。PCPVとSCRAチャンネルの両方の動的な範囲情報がまた、同様の過程でコード化
されることができる。これはユーザが再生上、2つの信号(SCRAとPCPV)の各々の
動的な範囲を別々に制御することを許容し、その結果、聞くに十分大きなささや
き(拡大)、または妨害しないほど十分に柔らかい爆音(圧縮) を許容するであろ
う。これに対するキーは両方の信号が独自に制御されることができることである
。プログラムプロバイダーが、生成中補助データビットストリームの一部として
この情報を入力しながら応答可能であるか、またはソフトウェア駆動アルゴリズ
ムが時間につれて信号強度を決定することができ、かつそのようなデータを自動
的に発生させることができる。
【0087】 標準のメタデータビットストリームにおけるVRA補助データチャンネルの包含 上で詳細に議論した補助データビットストリームのコンテンツは任意の通常の
CODECにおけるメタデータの新しい部分として含まれるかもしれない。通常商業
上のCODECのものは、2つの型の情報:オーディオとメタデータ(オーディオに関
する情報)を伝送する。ここに議論する実施例では、VRA制御能力でそのオーディ
オを再生させるのに必要であるオーディオの形式とメタデータの形式は詳細に記
述される。
【0088】 VRAの補助データを含むための方法はCODECに依存するだろう。文字通り無数の
CODECのものが存在しており、したがって、特定のCODECのメタデータ部分に補助
データを含むことができる無数の特定の方法がある。しかしながら、ほとんどの
メタデータ形式が付加的なデータのために位置をかたわらに設定させるので、VR
A補助データが格納されるところでそれは典型的である。したがって、これは、
デコーダが“VRAに気付く”ことが必要であり、オリジナルのCODECのメタデータ
の流れの予定された空の位置でVRA補助データを見出さねばなたないことを意味
する。したがって、VRAヘッダーデータの別の不可欠な特徴は、VRA補助データが
CODECのためにメタデータに置かれた方法の識別である。
【0089】 この際、VRA可能なオーディオコーデックのためのメタデータの唯一の違いは
、VRA補助データチャンネルに含まれる情報が2つの唯一望ましい別々の信号:PC
PVとSCRAの作成に関して教示することであることを強制することが重要である。
従来の技術は、Dolby Pro-Logic5.1などの従来技術オーディオ形式に従う全体の
オーディオプログラムのためのメタデータ(例えば、動的な範囲情報)を作成する
ことができるだけである。しかしながら、VRA可能オーディオ生成のために、従
来のメタデータ構造のある一定の態様を利用することは可能であるだろう。例え
ば、PCPVチャンネルおよびSCRAがチャネルの動的な範囲情報が伝送されることに
なっているならば、従来の技術のオーディオ形式に関連づけられる動的な範囲設
定のメタデータファイルの中にSCRAの動的な範囲が同じ位置に位置することを示
すフラグを含んでいるのは役に立つだろう。そのとき、PCPVの動的な範囲情報だ
けが、オリジナルのメタデータチャンネルの空のビット位置に固定される必要が
ある。
【0090】 VRA可能オーディオコーデックの使用のための特定の圧縮アルゴリズム 最小スループットと格納要件で圧縮アルゴリズムを実施することはデジタルオ
ーディオ技術者と会社によって広く行われている。より前に紹介されたVRA実施
例に関して、AC3形式より少ない損失の圧縮を提供する圧縮アルゴリズムを利用
することが必要であるかもしれないことは、既にそれについて議論した。より前
に紹介された実施例はDolby HI Associated Serviceよりも明瞭に異なっている
ことがまた議論された。明確化は以下に提供される。
【0091】 Dolbyのデジタルコーデックへの特別なアプリケーションを有するVRA生成技術
と関連した一般的なCODECの使用 ここに開示される第1の実施例はどんな特定のCODECの圧縮技術からも独立し
ている。例として、プロデューサーがサラウンドオーディオの2つのチャンネル
、前部オーディオの3個のチャンネル、およびより小さい帯域幅のサブウーファ
ーチャンネルを含む多重チャンネルサラウンドプログラムを発生させることがで
きると考える。これは5.1サラウンド音として知られているオーディオ方式であ
る。このプログラムは、Dolby Digital、DTS、MPEG、またはいかなる他のコード
化/復号化案をも含むかもしれない任意のCODECでコード化することができる。オ
ーディオ形式自体はコード化案から独立している。同様に、モノチャネルプログ
ラムはそのような任意のCODECによりコード化しかつ復号することができる。
【0092】 この発明の焦点はCODEC自身ではなく、オーディオ形式である。すべての先行
のオーディオ形式が単独で空間的な情報をエンドユーザに提供することに制限さ
れた。ここに提案されるオーディオ形式は、空間的な情報に加えてオーディオ形
式でコンテンツ情報を含むことによって多重チャンネルの残りのオーディオに多
重チャンネル音声の、比率、周波数コンテンツ、動的な範囲、標準化などを調整
する能力をユーザに提供する。
【0093】 Dolby Digital(AC-3)CODECについて議論するテレビジョン標準のためのガイド
(Guide for Television Standard)で記述される既存の技術に2つの明確な違いが
ある。その標準の固有の部分として、単一のチャンネル音声が多重チャンネルの
残りのオーディオと関連して伝送されることが許可される。追加の実施例として
、2つのチャンネル音声および2つのチャンネルの残りのオーディオがまた許可さ
れる。実際にこれは、プロデューサーにとって非常に制限されていて、すべての
関連音声を単一のチャンネルへ位置付けることをオリジナルプログラムの再現に
必然的に要求する。加えて、この実施において、音声は単一のチャンネルに再生
することができるだけである。ほとんどの多重チャンネルプログラムは、多重チ
ャンネルプログラムにある2次コンテンツの残りのオーディオおよび1次コンテン
ツの純粋な音声の両方を必要とする(臨界的な音声と残りのオーディオ部分が単
一の空間的な位置に制限されないので)。したがって、既存の技術の見地から、
ここに開示される実施例が2つの別々な利点を持っていることが明白である。
【0094】 多重チャンネル能力−VRAオーディオ形式はユーザが必要な比率を選択するこ
とを今までどおり許容している間に、プロデューサーがすべての芸術的な許可の
必要性を習得することを許容している多重チャンネルPCPV および多重チャンネ
ルSCRAを可能にする。
【0095】 CODECの独立−VRAオーディオ形式は、どんなCODEC詳細にもかかわらず作動す
るように設計され、その結果、どんなCODECと共にも使用することができる。テ
レビジョン標準のガイドにおける聴覚損傷の関連するサービスが、Dolby Digita
l仕様で広げられるように働くことができるだけである。
【0096】 したがって、このドキュメントで指定されるVRAオーディオ形式はCODECとして
WITH Dolby Digitalを使用されることができる。指定されたVRAオーディオ形式
はユーザの制御で多重チャンネルPCPVと多重チャンネルSCRAの再生のための必要
な補助データを含んでいる。この補助データは任意のオーディオのCODEC(Dolby
Digitalを含んでいるがそれに限定されない)のメタデータ部分に含まれることが
でき、そして、AC-3圧縮のための案がオーディオプログラムコンテンツに依存し
て大きい損失と高い圧縮比をもたらすかもしれないCODEC仕様自体に従って、PCP
VとSCRAのオーディオ情報が圧縮される、(またはされない)ことができる。
【0097】 CODEC独立の特徴はソフトウェアプラットホームを横切って特徴を可能にするV
RAの支持の重要なものである。多重チャンネル設定において残りのオーディオに
対して音声を制御する能力をエンドユーザに提供することは重要である。AC-3が
この目標を達成するための単一のチャンネルメカニズムを含むのに対し、他のCO
DECは含まないまたはそうしないかもしれない。この発明はプロデューサーがと
もに働くCODECを選ぶとき“演奏分野をならす”ことを許容する。CODECは、VRA
を実行する能力よりむしろ圧縮または逆圧縮アルゴリズムの性能に基づいて選ぶ
ことができる。これはすべてCODECのものがVRAの機能性をエンドユーザに提供す
ることを許容する。
【0098】 したがって、VRA可能コーデックは実際にはどんな既存のオーディオ圧縮アル
ゴリズムとも両立可能に作ることができる。したがって、この発明は前もって必
要なVRA補助データ、PCPV/PCA信号、および可能なSCRA信号に基づいて多数のVRA
可能圧縮形式の作成を含んでいる。これに基づいて、以下のデジタルオーディオ
形式が、より前に記述された実施例を使用してVRA可能なバージョンの発生を支
持し、前述されたVRAオーディオコーデックの一部として使用されるように圧縮
アルゴリズムとして役立つかもしれないことは明確である: DTS-VRA可能な圧縮 最適化されたPCM VRA可能な圧縮 メリディアンロスレスパッキング VRA可能な圧縮 スピーチだけのコーデック付属物を有するMP3圧縮 Dolby Digital、AC3−VRA可能な圧縮 MPEG-2のVRA可能な圧縮 MPEG-4のVRA可能な圧縮。
【0099】 VRA可能コーデックで使用されるかもしれない他の多数の圧縮アルゴリズムが
あり、それらは技術に熟練した者によりよく知られている。それらのアルゴリズ
ムによるVRA能力の収容は、VRAチャンネルと補助データの特別な処理によって従
わされる入来VRA情報の識別に基づかなければならないだろう。標準化されたビ
ットストリーミングレベルでこれを達成する多数の方法があるが、それらの方法
はデジタルオーディオの標準に熟達しただれにとっても簡単である。それはここ
に開示された発明の多くの態様の1つであるこれらの圧縮アルゴリズムのどれか
によるPCPV/PCA/SCRA信号と補助データの包含である。
【0100】 VRA可能デコーダ VRAオーディオ生成の過程の再生終了でVRA可能デコーダに必要である特徴を示
す多くの機能的な記述がある。それらの記述は以下に提供される。
【0101】 VRAヘッダー認識:デコーダはVRAヘッダーデータに使用した異なったビットパ
ターンを認識するために備えられるだろう。ヘッダーの特定の値は、デコーダが
いかに入来VRA可能ビットストリームを収容するかを決定するだろう。技術に熟
練した者により様々な方法でこの特徴は実行することができる。例えば、ビット
マスキング技術、論理演算、または入来ビットストリームのVRA能力を指示する
他の方法を使用することが可能である。
【0102】 モードを切り換える:デコーダは、PCPV/PCAとSCRA信号が再生装置に取り付け
られたスピーカーに送られる再生信号を含むであろう多重チャンネルオーディオ
再生(例えば、5.1オーディオまたは7.1オーディオ)、またはVRA再生モードのた
めの従来の復号ソフトウェアの間で切換えるようにプログラムされるだろう。
【0103】 信号ルート設定:デコーダは、PCPV/PCAとSCRA信号の適切な時空的な再生情報
を決定するためにVRA補助データの情報を利用するだろう。
【0104】 逆の両立性:デコーダはまた非VRA可能なオーディオプログラムの再生も収容
することができるだろう。これは、より前に議論したVRAヘッダー認識機能の論
理出力を使用することによって達成されるだろう。
【0105】 復号と再生の特徴に関するその他の詳細は以下で記述される。
【0106】 再生位置におけるVRA補助データ、PCPVおよびSCRAチャンネルのエンドユーザ
制御と究極の機能性 上で詳細に議論したように、VRA補助データはCODECを通して伝送されまたは記
録されるPCPVとSCRAチャンネルに関する様々な情報を含んでいる。補助データの
エンドユーザに引渡される情報に加えて、別々に引渡されるPCPVとSCRAチャンネ
ルを有する結果として、実行することができる(それは従来技術に存在していな
い)いくつかのデコーダの特別な機能がある。2つの型の機能(補助データ制御とP
CPV/SCRAデコーダ制御)は、デコーダ自体の操作を特に参照して以下の項で詳述
される。
【0107】 VRA補助チャンネル識別−VRA補助チャンネルヘッダーファイルの一部として存
在しているので、デコーダは、指定されたビットをポーリングすることによって
、VRA補助チャンネルの存在を認識するだろう。ビットがゼロ(オフ)であるなら
ば、デコーダは、VRA補助データがなくて別々のPCPVもSCRAチャンネルもないと
認識する。デコーダは、別のオーディオ方式(ステレオなどの)を復号することを
開始することができる。デコーダが、識別ビットが1(オン)であると認めるなら
ば、エンドユーザによって望まれるならば、デコーダは、本来データを記録また
は放送するために使用されるCODECによって提供された仕様に別々に従っているP
CPVとSCRAチャンネルを復号することができる。識別ビットは単に、入来データ
がVRA可能(即ちPCPVとSCRAの要素を含んでいる)、および任意のプログラミング
のために変化することができることをデコーダに気付かさせる。
【0108】 生成/ユーザミックス−この特徴はVRA補助データチャンネル自体に含まれる一
片の情報よりもむしろユーザ入力を表す。ユーザは生成ミックスかユーザミック
スかを選ぶオプションを有する。ユーザミックスが選択されるならば、さまざま
なオーディオ制御機能が採用されることができる(次に議論される)。生成ミック
ス設定はほとんどのデコーダ設定で不履行設定として考慮されがちである。
【0109】 生成ミックスが選択されると、デコーダは、CODECのメタデータ部分に埋め込
まれたVRA補助チャンネルのそれらの指定された位置から、各PCPVおよびSCRAの
増幅データと空間的な位置データを集めるだろう。この増幅と空間的な位置デー
タは、オーディオプログラム(そして、コード化の特徴部分で議論されたように
作成される)を作成する際にオーディオ生成技術者の本来の意図を表す。空間的
な情報の各チャンネルとそれぞれの2つの信号(PCPVとSCRA)に関しては、増幅デ
ータは乗法演算を通して適用される。
【0110】 情報を置く空間が必要であるならば(例えば、1つのスピーカー位置からもう1
つの位置へ動くことができる単一の音声トラックがあるならば)、その情報は位
置を変える命令として適切なチャンネルに適用される。SCRAに関するPCPVの増幅
と位置が時間により変化するので(プロデューサーの活動によって)、デコーダは
いつも補助チャンネルデータをポールし、絶えずPCPVおよびSCRA信号のおのおの
、および関連するチャンネルに適用される設定を更新するだろう。
【0111】 各PCPVとSCRA信号の中にそれぞれのチャンネルの簡単な付加が正確な生成ミッ
クスをもたらすように、PCPVとSCRAチャンネルが密に生成されるならば、VRA補
助データチャンネルに増幅または空間的な位置情報を伝送する必要がないことに
注意されるべきである。このデータが存在していないと、デコーダ(生成ミック
スモードにあるとき)は、生成ミックスを達成するために(それぞれのチャンネル
の)線形の組み合わせを不履行にするだろう。この機能のエンドユーザ制御は、
ソフトメニュー(スクリーン上のような)を通したソフトウェア駆動、または生成
とユーザミックス選択の間の位置を変化する簡単なトグルスイッチによって駆動
されるハードウェアであるかもしれない。
【0112】 ユーザレベル/空間的なミックス−前記のユーザミックストグルが選択される
ならば、生成ミックスは不能になり、エンドユーザは今PCPVとSCRA信号の完全な
制御を有する。最も初歩的な調整(そして、恐らく最も役に立つ)はお互いの如何
にかかわらずPCPVおよびSCRA信号、および彼らの関連するチャンネルのレベルお
よび空間的な位置決めを制御する能力である。
【0113】 オーディオ形式に依存して、各PCPVおよびSCRAチャンネルは空間的に依存する
チャンネルの多数を含むかもしれない。全ての空間的なチャンネルが独立してい
て、(VRAオーディオ形式において) PCPVとSCRA信号が独立しているので、ユーザ
は、それぞれの独立している信号の振幅(乗法による)と空間的な位置(再配置に
よる)を調整する能力を、デコーダのハードウェアおよび/またはソフトウェアを
通して提供されるであろう。この機能性をエンドユーザに提供することは、どん
な追加帯域幅も必要としないで、すなわち、どんな補助データも必要としないで
成される。振幅と空間的な位置決めは、2つの信号(PCPVとSCRA)上で、デコーダ
自身ではなく、PLAYBACKハードウェアかソフトウェア(ボリュームノブと位置調
整)の一部としてそれらの独立なチャンネルで実行される。このハードウェアが
単一のユニットとしてエンコーダを有して含まれてもよく、またはデコーダから
分離した付加的なユニットとして作動するかもしれない。
【0114】 上の記述は、2つの信号(PCPVとSCRA)の各々の中に多重チャンネルの各々の全
体の空間的な位置と振幅を制御するために、それがあることを望むエンドユーザ
により作られる調整の最も一般的な設定を表す。しかしながら、最も一般的な調
整能力は、標準のユーザにとってはるかに複雑になり過ぎる傾向がある。この理
由のため、別の実施例が説明され、それは、どんなVRA可能な消費者エレクトロ
ニクス装置にも不可欠の部分とし利用可能にされる簡単な(ユーザフレンドリー
な) メカニズムを通して音声対残りのオーディオの比率をエンドユーザが調整す
ることを可能にする。
【0115】 図13はデジタルビットストリームを受けて、信号をその2つのオーディオ部分
:PCPV 1320とSCRA 1330信号に復号するVRA形式デコーダ1310を示す。より前に
注意したように、それぞれのこれらの信号はエンドユーザ調整の後に全体のプロ
グラムを形成するために合計される多重チャンネルを含んでいる。前のパラグラ
フの実施例はそれらの多重チャンネルの各々のエンドユーザ調整について議論す
る。
【0116】 代わりに、図13で示される実施例はすべてのPCPVチャンネルとすべてのSCRAチ
ャンネルの総合的なレベルを制御し、その結果、必要なVRA比に作用する単一の
調整メカニズム1340を示す。これは音声と残りオーディオの所望のレベルを表す
2つの電圧を発生させるように、バランス形アナログポテンショメータを最初に
使用することによりデジタル領域で行われる。
【0117】 例えば、ノブが時計回りに回されるとき、左の可変抵抗器(ノブに接続される)
は供給電圧に向かって上方に動き、信号グラウンドから遠のく。これはワイパー
電圧を増加させる。アナログデジタル変換器1350は電圧を読んで、それへデジタ
ル値を割り当て、次に、それはPCPV信号(いくつが復号されたかにかかわらず)の
すべてに掛けられる。同様に、ポテンショメータが反時計回りに動かされるとき
、右の可変抵抗器はワイパーの電圧増加をもたらすために供給電圧(およびグラ
ンドから遠く)に向かって移動する。
【0118】 この電圧はデジタル値に変換され、復号された残りのオーディオ(SCRA)信号の
すべてに掛けられる。単一のノブを使用しているこの配列は、ユーザに音声およ
び残りのオーディオを独立のレベルに簡単かつ容易に制御させ、それにより所望
の聴取比を達成させる。乗法の後に、PCPVチャンネルの各々は、多くのチャンネ
ルが復号されたのと同様に全体のオーディオプログラムを形成するために、SCRA
(中心が加えられ、左が加えられるなどのそれぞれの方法で)の各々に加えられる
。最終的に、さらなるレベル調整は、調整された全体のプログラムオーディオが
各空間的なチャンネルのためにデジタルアナログ変換器1360を通して増幅器とス
ピーカーに送られる前に、同様な方法で、しかし単一のポテンショメータ(主リ
ューム制御)のみを使用して、全体のオーディオ信号に適用されることができる
【0119】 ユーザ均等化制御−PCPVとSCRA信号の一層のエンドユーザ調整を提供するより
高度な特徴は、別々にPCPVとSCRA信号の周波数の重み付けを調整する能力である
。これは高周波を減衰させる特定の型の聴覚損傷を有する人の役に立つかもしれ
ない。耳が低い周波数で飽和し始める前に、PCPV(音声)信号の簡単なレベル調整
は明瞭さの必要な増加を供給しないかもしれない。PCPV信号の周波数依存調整(
また、均等化として知られている)を許容することによって、改良された明瞭さ
はある型のプログラミングのために達成されるかもしれない。さらに、SCRA信号
(爆音などの)の非常に低い周波数情報はPCPVチャンネルのスピーチ形式をあいま
いにしているかもしれない。SCRA信号(PCPV信号から独立している) の周波数に
依存するレベル制御は、スピーチの明瞭さを改良している間、SCRAチャンネルで
重要な中間周波数のオーディオ成分を保持するかもしれない。再び、PCPVとSCRA
チャンネルがVRAオーディオ形式を使用してコード化されかつ復号される限り、
これは復号の過程から別々であるハードウェアで実行することができ、その結果
どんな余分な情報も補助のチャンネルで伝送されることを必要としない。
【0120】 PCPVとSCRAの特定のメタデータ−さらに二元的なプログラムオーディオ(PCPV
とSCRA)で利用可能な再生の特徴を高めるために使用することができるエンコー
ダ議論に含まれたさまざまなメタデータがある。上で議論したレベル、空間、お
よび均等化調整と異なって、これらの特徴は、コード化されたVRA補助データが
ビットストリームの一部としてメタデータに存在していることを必要とする。こ
れらの特徴は信号レベル、動的な範囲の圧縮、および標準化を含んでいる。
【0121】 コード化の過程の一部として伝送された信号レベルは、独自にPCPVとSCRAチャ
ンネルのレベルに関して、および時間の関数としてデータ(復号位置で) を提供
する。このデータは、オーディオ過渡現象の存在でユーザの選択されたVRA比を
維持するため、独自かつ同時にPCPVとSCRAチャンネルのレベルを制御するために
使用することができる。例えば、SCRAチャンネルの信号レベルデータは、ある区
分中爆音がPCPV(音声)を圧倒することを指示するかもしれず、分割によりどれほ
ど多いかを指示するであろう。
【0122】 したがって、復号の過程は、ユーザ選択のVRA比を保持するように、適切な量
により自動的にSCRAの信号レベルを調整するために再生ハードウェアでその情報
を使用することができる。これは、ユーザは全体のプログラムを通していつでも
相対的なレベルを調整することを妨げる。
【0123】 次に、ビットストリームに存在している動的な範囲の情報は、ユーザがPCPVと
SCRA信号の両方のために異なった再生範囲を独自に選択することを許容するだろ
う。ユーザは、最大限の動的な範囲の100%の機能として所望の圧縮または拡大を
選択し、それはそれらの組み合わせの前に各信号に適用される。
【0124】 最終的に、レベル情報とわずかに異なっている標準化情報が、RMSまたはプロ
グラムからプログラムへPCPVとSCRAの両方の信号強度ゲージを提供する。このデ
ータは補助データヘッダーファイルの一部として伝送されるだけであるかもしれ
ず、全体のプログラムに適用されるだろう。ユーザが選ぶならば、この情報は、
プログラムを横切るSCRA信号のレベルを標準化するのと同様にすべてのプログラ
ムを横切るPCPV信号を標準化するのに使用することができる。これは、A) 1つ
のプログラムから次へ聞かれる対話(PCPV)が一定のレベル(SPL)で維持され、B)
1つのプログラムから次へ聞かれる爆音(SCRA)が一定のレベル(SPL)で維持され
るであろうことを確実にする。
【0125】 VRAオーディオ形式を使用してコード化されるとき、この機能性のすべてがPCP
VとSCRA信号のためだけに可能である。生成ミックスが完全に統合されかつ分離
できないPCPV(音声)とSCRA(残りのオーディオ)を含んでいるので、それらが単独
で生成ミックスに適用されるならば、同じ効果を実現されることができない。
【0126】 記録保管の実施例 以下で記述される実施例は、エンドユーザが最終的にVRA調整の利益を得るよ
うな方法でVRA情報を蓄えるのに使用することができる広範囲の記録保管の構成
を示すために導入される。ここに記載されたすべての記録保管の実施例の共通の
テーマは、PCPV/PCA信号、および/またはSCRA信号、および/またはVRAヘッダー
、および/またはVRA補助データの格納を現在収容しない記録保管されたデジタル
・オーディオメディアの形式を各々が表すということであるが、記載されている
メディアのすべてには、それらがVRA可能な記録保管デジタルオーディオメディ
アになることができるように修正のための可能性を有する。以下で記述される記
録保管メディアについて、‘VRA可能なサウンドトラック’ のラベルは、それら
の信号の1つまたは両方がより前に導入されたVRAデコーダの特徴を使用して組み
立てられかつ再生されることができるように、特定のチャンネルとして収納され
たPCPV/PCA/SCRA信号を有し、および/または十分なVRA補助データを有するサウ
ンドトラックを参照する。再び我々は、そのようなVRA可能サウンドトラックの
定義がそれ自身発明であり、前に記述された実現に必要である様々な実施例によ
り基礎とされることを注意する。
【0127】 -CD上の2つの別々なトラックのような、格納されたPCPV/PCAとSCRA信号のLPCM
バージョンを有するCD。この実施例がステレオ位置決めを犠牲にすることに注意
すべきである。
【0128】 -CDメディアに見出される通常のステレオ信号に加えて、格納されたPCPV/PCA
信号の最適化されたLPCMバージョンを有するCD。
【0129】 -DTS VRA可能なサウンドトラックを有するDVD映画。
【0130】 -LPCM VRA可能なサウンドトラックを有するDVD映画。
【0131】 -MLP VRA可能なサウンドトラックを有するDVD映画。
【0132】 -MPEG-4のVRA可能なサウンドトラックを有するDVD映画。
【0133】 -MPEG-2のVRA可能なサウンドトラックを有するDVD映画。
【0134】 -Dolby DigitalのVRA可能なサウンドトラックを有するDVD映画。
【0135】 -VRA可能な形式を有するDVDオーディオディスク。
【0136】 -VRA可能な形式を有するスーパーオーディオ CD。
【0137】 VRA可能なバージョンの生成のための既存のオーディオマスターテープの再創
作 重要な音声のコンテンツを有する映画または他のオーディオプログラムのため
にVRA調整を提供する期待される利益の1つは、聴取者によるスピーチの明瞭さの
改良である。これは特に聴覚損傷された個人にとって本当になるだろう。この時
点で、アナログ形式対デジタル形式に存在する何千個ものフィルムが文字通りあ
る。また、これらのフィルムのいずれもVRA可能なように作成されなかったこと
も本当である。したがって、PCPV/PCA/SCRA信号が対応するVRA補助データと共に
発生されるように、これらのVRA可能でないアナログサウンドトラックを‘再創
作すること’が必要である。上に提示されたVRA可能なデジタルマスター形式の
いずれでもその新しい情報を格納することができる。この発明は聴覚損傷共同体
に利用可能なVRA可能なフィルムのより広範囲に結果をもたらすだろう。
【0138】 ビデオ・オン・デマンドのVRA可能なサウンドトラック記録保管とデータベー
ス デジタルオーディオおよびストリーミングビデオ/オーディオの到来は、‘ビ
デオ・オン・デマンド’と時に呼ばれることを可能にした。 ビデオ・オン・デマン
ド(VOD)システムは、ユーザのデジタルテレビ(または、セットトップコンバータ
ボックスを有するアナログテレビを使用して)に1回の再生をするため、ISDN線ま
たはモデムを経て彼/彼女の選択した映画または他のプログラムをダウンロード
することをユーザに許容する。そのとき、VRA可能なサウンドトラックを有するV
ODデータベースの中にどんなフィルムもない。VRA調整ハードウェアが将来の消
費者エレクトロニクス装置に統合されるようになるので、VODユーザは、たぶんV
RA可能なサウンドトラックを注文することを好むだろう。したがって、これらの
実施例はその期待された必要性に合うように配慮された。最初の発明はそれがVR
A可能なサウンドトラックを有するフィルムを含むVODデータベースである。これ
らのVRA可能なビデオは、聴覚損傷聴取者またはVRA調整を使用して楽しむ視聴者
によりダウンロードされることができる。
【0139】 発明の別の関連する態様は、対応するビデオ情報のないオーディオサウンドト
ラックの新しい記録保管の作成であり、そこでは、新しい記録保管がVRA可能な
サウンドトラックオーディオだけから成る。VRA可能な映画のオーディオだけの
部分の記録保管は、VODデータベースのための格納要求に膨大な節約を提供する
であろう。VRA可能なサウンドトラック(ビデオのない)は、他の1つの特徴に加え
て、VRA可能なシステムを可能にする実施例のために、より前の議論と同じ方法
で作成されるだろう。これらのVRA可能なサウンドトラックは、VRA可能でないサ
ウンドトラックが利用可能時間のマークを持たないなら、相互相関信号処理技術
および/または時間同期化方法を使用してオリジナルの映画またはプログラムの
オーディオコンテンツに時間同期されるであろう。両方の方法は、オリジナルの
フィルムにあるVRA可能でないオーディオ情報とVRA可能なオーディオ情報を相関
させるのに役立つだろう。相関関係が最適化された後に、フィルムはオリジナル
のサウンドトラックを無音にしてかつVRA可能サウンドトラックをオンにして使
うことができる。
【0140】 MP3 VRA可能な音楽記録保管 MPEG-2のLayer III(MP3)の使用は、記録保管されたデータベースからあるイン
ターネットメディア再生装置へ流される音楽録音のために非常にポピュラーにな
った。VRA可能なデジタルオーディオファイルを可能にするシステム構成要素の
前の定義は等しくよくMP3形式に適用する。したがって、この発明は聴取者によ
りダウンロードする(商業的または多の方法で)ための特別なデータベースの中に
あるVRA可能なMP3録音の作成に関係がある。
【0141】 図14において、ブロックダイアグラムの上方の部分は、プロデューサーからユ
ーザへオーディオプログラミングを引渡すために技術の現状を示す。事前および
事後生成中、さまざまなオーディオ部分が、近くのマイクロホン録音、遠いマイ
クロホン音、音響効果、笑音トラック、および全体のオーディオプログラムを形
成するために入るかもしれないいかなる他の可能な音も含むかもしれない多トラ
ックの記録された形式1405で技術者に利用可能である。音響技術者は次に、既存
のオーディオ形式1415に従うために、これらの構成要素を加え、影響させ、空間
的に位置付け、および/または音の成分を結合する。これら既存のオーディオ形
式1415はモノタイプ、ステレオ、Pro-Logic,5.1、7.1または技術者が従ってい
るいかなる他のオーディオ形式も含むかもしれない。
【0142】 プログラムが必要な形式でいったん生成されると、それはメタデータを含むか
もしれないコード化企画1420に通過される。いろいろなコード化企画が、非圧縮
、損失のない圧縮、または損失のある圧縮技術を含むかもしれないこの段階で採
用されるだろう。いくつかの共通のコード化企画は、Dolby Digital、MPEG-2のL
ayer 3(オーディオのための)、Meridian Lossless Packing、またはDTSを含んで
いる。そのような符号化器の出力は放送されるか、再生または放送のために記録
されるかのいずれかであるデジタルビットストリームである。デジタルビットス
トリームの受信のため、デコーダ1425は、オーディオおよび使用されるならばメ
タデータを発生させる。符号化器1420とデコーダ1425の組み合わせが文献に、お
よびCODEC(すなわち、符号化器、デコーダ)としてのこのドキュメントにしばし
ば引用されるのに注意すべきである。メタデータ 1430はオーディオデータに関
するデータであるとして考慮され、動的な範囲情報、利用可能な別々のチャンネ
ルの数、およびオーディオデータで使用される圧縮の型のような特徴を含むかも
しれない。
【0143】 図14の下方の部分は、ここに議論する発明の実施例を示す。多重トラック記録
を始めると、VRA生成技術1435は、すべての前のものと明瞭に異なった新しいオ
ーディオ形式を形成するために利用される(ここに開示される仕様に従う)。VRA
形式自体はVRAオーディオデータコード1445として図に示されるそれ自身のメタ
データを有する。
【0144】 さらに、前の形式はオーディオトラックからオーディオチャンネルを発生させ
るための特徴に焦点が向けられたが、この新しい形式は、生成レベルでマスター
オーディオトラックからCONTENTとSPATIALチャンネルの両方を発生させるところ
に焦点を合わせた。他の多くのものの中で、再生サイトの空間的な位置へのコン
テンツ部分の所望の生成ミックス(音の技術者により駆動される)は、VRA生成技
術を通して補助データストリームの作成により保持されかつ制御される。この点
で、補助データ、PCPV(1次コンテンツの純粋な音声)、およびSCRA(2次コンテン
ツの残りのオーディオ)は、通常の技術と同様に任意の標準のCODECによって使用
される。CODEC 1450、1455はメタデータに含まれるオーディオおよび/または情
報のコンテンツおよび形式に何の仕様も作らないが、むしろそれが受け取るどん
なデータもコード化し、再現位置で同様にそれを復号する。オーディオデータ(P
CPVとSCRA)と補助データ(CODEC メタデータを経て)がいったん受け取られて復号
されると、エンドユーザは補助のチャンネル識別1470と制御データ1465(それが
存在していて認識されるならば)を制御し、次に、PCPVとSCRAチャンネルはそれ
らのエンドユーザ調整1460により制御される。存在しかつオリジナルのCODECに
より要求されるなら、追加メタデータがさらにVRAオーディオ形式と関連する再
現の性能に影響しないで再生1480を制御するために使用されることができる。
【0145】 様々な実施例がここに明確に示されかつ記述されたが、本発明の変更と変化が
上の教示により、そして発明の精神および意図された範囲から逸脱することなく
、添付請求の範囲内でカバーされることが評価されるだろう。特に発明は以下を
含むであろう。
【0146】 -VRA可能なコーデック、それは:PCPV/PCA信号およびSCRA信号の並列入力構成
を受け、任意のスピーチだけの圧縮アルゴリズムを使用してPCPV/PCA信号を圧縮
し、任意の一般的なオーディオ圧縮アルゴリズムを使用して、2つのオーディオ
信号と任意の付随するビデオの間のオリジナルの時間整列とビデオフレーム同期
化の損失なしに、SCRA信号を圧縮し、信号のために使用される特定の圧縮アルゴ
リズムおよびシンタキシング方法を定義する対応する関連データとともに、2つ
の圧縮されたビットストリームを多重化し、前記多重化されたビットストリーム
はVRA可能なファイルとして格納されるかPCPV/PCAとSCRA信号を分離するデマル
チプレクサに伝送され、それらを適当な逆圧縮アルゴリズムに発送し、2つの信
号を記憶媒体、または、最終聴取者のためにVRA調整を可能にする適切なボリュ
ーム制御および再生装置に送る。
【0147】 -特定の音声だけの圧縮およびPCPV/PCAとSCRA信号を圧縮するために使用され
る一般的なオーディオ圧縮アルゴリズムから独立しているVRAコーデック。
【0148】 -音声だけの圧縮と一般的なオーディオ圧縮を使用して、VRA可能なデジタルマ
スターまたはVRA可能な記録保管されたオーディオファイルのデータヘッダーを
認識し、自動的にPCPV/PCAとSCRA信号の並列な圧縮を進めるVRAコード化過程。
【0149】 -多数の利用可能な‘スピーチだけの’圧縮と‘一般的なオーディオ’圧縮ア
ルゴリズム。
【0150】 -データと関連された入来VRAマルチプレクサを認識し、逆多重化するように作
動し、VRA ビットストリームを別々なPCPVとPCA信号に逆圧縮するVRA可能なデコ
ーダ。
【0151】 -多重チャンネル再生の通常の復号ソフトウェアと、PCPV/PCAとSCRA信号が再
生装置に取り付けられたスピーカーに送られる再生信号を含むVRA再生モードと
の間で切り換えるようにプログラムされるVRA可能なデコーダ。
【0152】 -PCPV/PCAとSCRA信号の適切な時空的な再生情報を決定するためにVRA補助デー
タ情報を利用するVRA可能デコーダ。
【0153】 -入来オーディオがVRA可能(または可能でない)かを決定するために、識別ビ
ット(オンまたはオフ)を指定することによってVRA補助データの存在を認識す
るVRA可能なデコーダ。
【0154】 -PCPV/PCAとSCRA信号がオーディオ圧縮ステップの後に暗号化され、逆圧縮ス
テップの前に非暗号化される上で記述されたようなVRA可能なコーデック。
【0155】 -VRA補助データおよび/または補助データチャンネルを利用し、前記補助デー
タは補助データに特定のビットパターンを通してVRA可能としてコーデックを確
認するような方法で作成され、空間的なオーディオ再生構成で使用されることに
なっているPCPV/PCAとSCRAチャンネルの数を確認し、多重チャンネルの前記空間
的な再生はオーディオプログラムの異なったタイミングで異なった空間的な再生
を指示するように補助データの異なった位置で変化可能であり、最終聴取者によ
りVRA再生およびボリューム調整の過程を容易にするために生成ミックスデータ
を確認し、PCPV/PCAとSCRAの特定のメタデータを含むVRA可能なコーデック。
【0156】 -VRA補助データは、ここで定義されたVRA補助データの目的の特性の損失なし
に、任意の他のコーデックのメタデータの一部として導入されてもよい。
【0157】 -VRA可能なコーデックと関連して使用される特定の圧縮アルゴリズムと両立可
能なVRA補助データの作成。
【0158】 - PCPV信号の多重チャンネルおよび/または空間的に分配された再生、およびS
CRA信号の多重チャンネルおよび/または空間的に分配された再生を可能にするた
め、AC3テレビジョンオーディオ形式と関連したVRA補助データの使用。
【0159】 -サウンドトラックのVRA可能なバージョンを作成するために既存のフィルム、
映画、およびテレビジョンのサウンドトラックのオーディオマスターテープの再
創作。
【0160】 -PCPV信号がサウンドトラック記憶媒体に別々なオーディオ情報として存在す
るVRA可能な手段。
【0161】 -SCRA信号がサウンドトラック記憶媒体に別々なオーディオ情報として存在す
るVRA可能な手段。
【0162】 - VRA可能な再生装置によって後の調整のために1次コンテンツの純粋な音声の
トラックを作成するような方法で、オリジナルのサウンドトラックオーディオマ
スターテープに存在する1つ以上の音声トラックの何らかの芸術的な組み合わせ
を結合する再創作の手段。
【0163】 - VRA可能な再生装置によって後の調整のために2次コンテンツの残りのオー
ディオトラックを作成するような方法で、オリジナルのサウンドトラックオーデ
ィオマスターテープに存在する1つ以上の非音声トラックの何らかの芸術的な組
み合わせを結合する再創作の手段。
【0164】 -新たに作成されたPCPVとSCRA情報を取り、記録保管の請求項に開示されたよ
うな、VRA可能なデジタルマスターオーディオ記憶媒体を構成する再創作の手段
【0165】 - VRA可能な映画、フィルム、またはテレビ番組を衛星、インターネット、ま
たは他のデジタル伝送手段を通してVRA可能な再生装置に伝送する目的のためにV
RA可能なフィルムサウンドトラックを含むデジタルデータベースの作成、または
記録保管システム。
【0166】 -ビデオ・オン・デマンドフィルム、映画、ウェブ-テレビ、デジタルテレビ、
または他のプログラムを含むデジタルデータベース。
【0167】 -デジタルデータベースは、このドキュメントのほかの場所で開示された手段
を使用して、対応するサウンドトラックがVRA可能であるところで単一のフィル
ム実体から成るかもしれない。
【0168】 -デジタルデータベースは、VRA可能なサウンドトラックが代用のためオーディ
オ再生時点で選択されたサウンドトラックとしてオリジナルプログラムサウンド
トラックの如何にかかわらず送られることができるように、適切な時間同期とビ
デオフレーム同期でVRA可能なオーディオサウンドトラックだけから成るかもし
れない。
【0169】 -VRA可能な音楽オーディオ(例えばWAV、MP3、または他のもの)を含むデジタル
データベースの作成または記録保管システムであって、前記VRA可能な音楽オー
ディオは、1次コンテンツの純粋な音声オーディオとして指示された音声トラッ
クの何らかの混合、および2次コンテンツの残りのオーディオとして指示された
楽器の何らかの混合を作成する。
【0170】 -デジタルデータベースは、再生時点でPCPV音声の代用を容易にするために、
時間同期されたオリジナルの音楽録音またはデジタルファイルされた指定された
PCPVオーディオ情報だけから成るかもしれない。
【0171】 -記録媒体は上に議論された特徴のいくらかをその上に含みまたは記録される
【図面の簡単な説明】
【図1】 従来のデジタル習得構成を示すダイヤグラムである。
【図2A】 2チャンネルVRA可能デジタルマスターオーディオテープのためのプレミックス
実施例を示すダイヤグラムである。
【図2B】 2チャンネルVRA可能デジタルマスターオーディオテープのためのポストミック
ス実施例を示すダイヤグラムである。
【図3】 SCRAダウンミックスパラメタを有する1チャンネルVRA可能なデジタルマスタ
ーオーディオテープのためのプレミックス実施例を示すダイヤグラムである。
【図4A】 VRA可能なデジタルマスターテープまたはファイルの実施例を示すダイヤグラ
ムである。
【図4B】 VRA可能なデジタルマスターテープまたはファイルの実施例を示すダイヤグラ
ムである。
【図4C】 VRA可能なデジタルマスターテープまたはファイルの実施例を示すダイヤグラ
ムである。
【図4D】 VRA可能なデジタルマスターテープまたはファイルの実施例を示すダイヤグラ
ムである。
【図4E】 VRA可能なデジタルマスターテープまたはファイルの実施例を示すダイヤグラ
ムである。
【図5】 VRAコーデックの例示的なダイヤグラムである。
【図6】 1チャンネルVRA可能、非圧縮デジタルマスターのためのVRAエンコーダの例示
的ダイヤグラムである。
【図7】 2チャンネルVRA可能、非圧縮デジタルマスターのためのVRAエンコーダの例示
的ダイヤグラムである。
【図8】 VRA可能なエンコーダの別の可能な実施例を示す例示的ダイヤグラムである。
【図9】 VRA可能なエンコーダの別の可能な実施例を示す例示的ダイヤグラムである。
【図10】 VRA可能なエンコーダの別の可能な実施例を示す例示的ダイヤグラムである。
【図11】 VRA可能なエンコーダの別の可能な実施例を示す例示的ダイヤグラムである。
【図12】 VRA可能なエンコーダの別の可能な実施例を示す例示的ダイヤグラムである。
【図13】 デジタルビットストリームを受けて、信号を2つのオーディオ部分に復号するV
RA形式デコーダを示すダイヤグラムである。
【図14】 発明の例示的オーディオ信号処理システムのダイヤグラムである。
【符号の説明】
PCPV…1次コンテンツの純粋な音声 PCA …1次コンテンツのオーディオ SCR
A…2次コンテンツの残りのオーディオ VRA…音声対残りのオーディオ
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE,TR),OA(BF ,BJ,CF,CG,CI,CM,GA,GN,GW, ML,MR,NE,SN,TD,TG),AP(GH,G M,KE,LS,MW,MZ,SD,SL,SZ,TZ ,UG,ZW),EA(AM,AZ,BY,KG,KZ, MD,RU,TJ,TM),AE,AG,AL,AM, AT,AU,AZ,BA,BB,BG,BR,BY,C A,CH,CN,CO,CR,CU,CZ,DE,DK ,DM,DZ,EE,ES,FI,GB,GD,GE, GH,GM,HR,HU,ID,IL,IN,IS,J P,KE,KG,KP,KR,KZ,LC,LK,LR ,LS,LT,LU,LV,MA,MD,MG,MK, MN,MW,MX,MZ,NO,NZ,PL,PT,R O,RU,SD,SE,SG,SI,SK,SL,TJ ,TM,TR,TT,TZ,UA,UG,UZ,VN, YU,ZA,ZW (72)発明者 ソーンダース、ウィリアム・アール アメリカ合衆国、バージニア州 24060 ブラックスバーグ、プリマス・ストリート 2509 Fターム(参考) 5D045 DA20

Claims (28)

    【特許請求の範囲】
  1. 【請求項1】 1つ以上のPCPV/PCA信号および1つ以上のSCRA信号の並列入力
    構成を受入れ、 PCPV/PCA信号およびSCRA信号を圧縮し、 PCPV/PCAおよびSCRA信号を処理するために使用される特定の圧縮アルゴリズム
    およびシンタキシング方法を定義する対応している関連データとともに圧縮され
    たPCPV/PCAおよびSCRA信号を多重化し、多重化された信号はVRA可能なファイル
    として記憶され、またはPCPV/PCAおよびSCRA信号を分離する対応しているデマル
    チプレククサに伝送され、それらを適切な逆圧縮アルゴリズムに発送し、記憶媒
    体またはVRAボリウム調整可能な出力装置に信号を出力する、 ことを含むVRA可能なコーデックシステムを操作する方法。
  2. 【請求項2】 少なくとも1つのトラックを複数のオーディオトラック、1
    次コンテンツの純粋な音声(PCPV)オーディオを含む1つのトラック、記憶媒体に
    記憶された複数のオーディオトラック、および時間同期を有する複数のオーディ
    オトラックに提供し; 少なくとも1つのトラックからPCPV信号を発生させ; 第1の圧縮比を有するデジタル圧縮形式を使用してPCPV信号を圧縮し; 少なくとも1つの他のトラックを複数のオーディオトラックに提供し、少なく
    とも1つの他のトラックは2次コンテンツの残りのオーディオ(SCRA)を含み; 少なくとも1つの他のトラックからSCRA信号を発生させ; 第2の圧縮比を有するデジタル圧縮形式を使用してSCRA信号を圧縮し; 音声対残りのオーディオ(VRA) 補助データチャンネルを作成し、VRA補助デー
    タチャンネルは: VRA可能としてVRA可能なデジタルマスターを確認し、そして PCPVおよびSCRA信号の再生パラメタを確認し; VRA可能なデジタルマスターに PCPV信号、 SCRA信号、および VRA補助データチャンネル; をデジタル的に記憶し、この記憶ステップが時間同期を維持する; ことを含むオーディオ生成方法。
  3. 【請求項3】 複数のオーディオトラックが少なくとも1次音声のコンテン
    ツとバックグラウンドコンテンツを有するオーディオプログラムと関係される請
    求項2のオーディオ生成方法。
  4. 【請求項4】 PCPV信号は、オーディオプログラムの筋がPCPVオーディオを
    聞くことにより聴取者に伝えられるような十分な1次音声のコンテンツを含む請
    求項3のオーディオ生成方法。
  5. 【請求項5】 SCRA信号は、オーディオプログラムの芸術的な値がSCRA信号
    をPCPV信号と混合することにより高められるように十分なバックグラウンドコン
    テンツを含む請求項3のオーディオ生成方法。
  6. 【請求項6】 PCPV信号がモノタイプ信号、ステレオ信号、およびサラウン
    ド音の信号の1つである請求項2のオーディオ生成方法。
  7. 【請求項7】 サラウンド音の信号が5.1サラウンド音形式および7.1サラウ
    ンド音形式の1つである請求項6のオーディオ生成方法。
  8. 【請求項8】 SCRA信号がモノタイプ信号、ステレオ信号、およびサラウン
    ド音の信号の1つである請求項2のオーディオ生成方法。
  9. 【請求項9】 サラウンド音の信号が5.1サラウンド音形式および7.1サラウ
    ンド音形式の1つである請求項8のオーディオ生成方法。
  10. 【請求項10】 再生パラメタがPCPVおよびSCRA信号の各々のために互いに
    関してボリュームレベルを含み、再生中にSCRA信号がPCPV信号を実質的にぼやか
    さないように各信号のボリュームレベルを自動制御可能にする請求項2のオーデ
    ィオ生成方法。
  11. 【請求項11】 第1の圧縮比が実質的に12:1よりも小さい比率である請求
    項2のオーディオ生成方法。
  12. 【請求項12】 第1の圧縮比が実質的に8:1よりも小さい比率である請求
    項2のオーディオ生成方法。
  13. 【請求項13】 第2の圧縮比が実質的に12:1よりも小さい比率である請求
    項2のオーディオ生成方法。
  14. 【請求項14】 第2の圧縮比が実質的に8:1よりも小さい比率である請求
    項2のオーディオ生成方法。
  15. 【請求項15】 VRA可能なデジタルマスターに信号をデジタル的に記憶す
    るための形式がゼロチャンネル形式、1チャンネルのプレミックス形式、1チャン
    ネルのポストミックス形式、2チャンネルのプレミックス形式、および2チャンネ
    ルのポストミックス形式の1つである請求項2のオーディオ生成方法。
  16. 【請求項16】 他のトラックが音楽トラックおよび効果トラックの1つで
    ある請求項2のオーディオ生成方法。
  17. 【請求項17】 さらにVRA可能なデジタルマスターの再生上でPCPVおよびS
    CRA信号の振幅の独自の調整を含む請求項2のオーディオ生成方法。
  18. 【請求項18】 さらに再生のために独自に調整されたPCPVおよびSCRA信号
    の混合を含み、混合された独自に調整されたPCPVおよびSCRA信号は電気音響装置
    と結合される請求項17のオーディオ生成方法。
  19. 【請求項19】 PCPV信号、SCRA信号、およびVRA補助データチャンネルの
    再生が同時に起こる請求項17のオーディオ生成方法。
  20. 【請求項20】 複数のオーディオトラックが時間整列およびビデオ信号と
    のビデオフレーム同期をさらに含む請求2のオーディオ生成方法。
  21. 【請求項21】 記憶ステップがPCPV信号、SCRA信号、およびビデオ信号の
    間に時間整列およびビデオフレーム同期の損失なしに起こる請求項20のオーディ
    オ生成方法。
  22. 【請求項22】 VRA可能なデジタルマスターが放送テレビジョン、ウエブ
    キャスチングストリーミングオーディオ、コンパクトディスク(CD)オーディオ、
    デジタルビデオディスク(DVD)オーディオ、映画オーディオ、およびビデオテー
    プオーディオの1つについてオーディオプログラミングを記憶する請求項2のオ
    ーディオ生成方法。
  23. 【請求項23】 1次音声のコンテンツオーディオ信号、バックグラウンド
    コンテンツのオーディオ信号、および任意の付随するビデオ信号の間の時間整列
    とビデオフレーム同期を有し、少なくとも1次音声のコンテンツオーディオ信号
    、バックグラウンドコンテンツのオーディオ信号、および任意の付随するビデオ
    信号を有するオーディオプログラムをコード化しかつ復号するためのコーデック
    において、 1次音声のコンテンツオーディオ信号およびバックグラウンドコンテンツのオ
    ーディオ信号を受ける並列入力構成、 1次音声のコンテンツオーディオ信号から第1の圧縮されたオーディオ信号を
    発生させるスピーチだけの圧縮、 バックグラウンドコンテンツのオーディオ信号から第2の圧縮されたオーディ
    オ信号を発生させる全般的なオーディオの圧縮、 1次音声のコンテンツおよびバックグラウンドコンテンツのオーディオ信号、
    並びに任意の付随するビデオ間の時間整列とビデオフレーム同期の損失なく、1
    次音声のコンテンツおよびバックグラウンドコンテンツのオーディオ信号を含ん
    でいるスピーチだけのおよび全般的なオーディオの圧縮、 第1および第2の圧縮されたオーディオ信号および関連するデータの多重化さ
    れたビットストリームを発生させ、関連するデータは少なくともスピーチだけの
    量および全般的なオーディオの圧縮並びに第1および第2の圧縮された信号を発
    生させる際に使用されたビットストリームシンタキシング方法を含んでいるマル
    チプレクサ、 を含むコーデック。
  24. 【請求項24】 第1および第2の圧縮されたオーディオ信号を得るために
    多重化されたビットストリームを逆多重化するデマルチプレクサ、 第1および第2の圧縮されたオーディオ信号を第1および第2のオーディオ信
    号に復号するデコーダ をさらに含む請求項23のコーデック。
  25. 【請求項25】 第1および第2のオーディオ信号をボリューム制御および
    再生装置に伝送し、再生装置は第1および第2のオーディオ信号の独自のボリュ
    ーム調整を可能にすることをさらに含む請求項24のコーデック。
  26. 【請求項26】 形式を有する記憶媒体において、形式が、 分離可能な1次コンテンツオーディオおよび2次コンテンツオーディオを含む構
    成上のオーディオ情報部分、 聴取者が分離可能な1次コンテンツオーディオおよび2次コンテンツオーディオ
    の空間的方向を知覚することを可能にする空間的オーディオ情報を含む空間的オ
    ーディオ情報部分、 空間的方向を有する分離可能な1次コンテンツオーディオおよび2次コンテンツ
    オーディオの1つの発生および再生を許容する情報を含む補助データ情報部分、 を含む記憶媒体。
  27. 【請求項27】 VRA形式を記憶し、形式がVRA補助データチャンネル、VRA
    可能なコーデックにより作成されかつ解釈された記述の使用を通して、オーディ
    オプログラムからの空間的オーディオ情報の同時解釈でオーディオプログラムか
    らの構成上のオーディオ情報の解釈を収容している、音声対残りのオーディオ(
    VRA)のオーディオ記憶媒体。
  28. 【請求項28】 オーディオプログラムがフイルムサウンドトラック、DVD
    映画サウンドトラック、およびコンパクトディスクサウンドトラックの1つであ
    る請求項27の記憶媒体。
JP2001563565A 2000-03-02 2001-03-02 デジタルオーディオ生成過程において1次コンテンツオーディオおよび2次コンテンツの残りのオーディオ性能を収容する方法および装置 Pending JP2003525466A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US18635700P 2000-03-02 2000-03-02
US60/186,357 2000-03-02
US09/580,205 2000-05-26
US09/580,205 US6351733B1 (en) 2000-03-02 2000-05-26 Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
PCT/US2001/006843 WO2001065888A2 (en) 2000-03-02 2001-03-02 A system for accommodating primary and secondary audio signal

Publications (1)

Publication Number Publication Date
JP2003525466A true JP2003525466A (ja) 2003-08-26

Family

ID=26882012

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001563565A Pending JP2003525466A (ja) 2000-03-02 2001-03-02 デジタルオーディオ生成過程において1次コンテンツオーディオおよび2次コンテンツの残りのオーディオ性能を収容する方法および装置

Country Status (12)

Country Link
US (2) US6351733B1 (ja)
EP (1) EP1264300A2 (ja)
JP (1) JP2003525466A (ja)
KR (1) KR100799155B1 (ja)
CN (1) CN1211775C (ja)
AU (1) AU2001243395A1 (ja)
BR (1) BR0108904A (ja)
CA (1) CA2401798A1 (ja)
IL (1) IL151546A0 (ja)
MX (1) MXPA02008573A (ja)
RU (1) RU2002126217A (ja)
WO (1) WO2001065888A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010518455A (ja) * 2007-02-12 2010-05-27 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 高齢又は聴覚障害聴取者のための非スピーチオーディオに対するスピーチオーディオの改善された比率
JP2012234192A (ja) * 2005-02-14 2012-11-29 Fraunhofer Ges オーディオソースのパラメトリックジョイント符号化
JP2020039181A (ja) * 2013-09-12 2020-03-12 ドルビー ラボラトリーズ ライセンシング コーポレイション 多様な再生環境のためのダイナミックレンジ制御

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020002039A1 (en) 1998-06-12 2002-01-03 Safi Qureshey Network-enabled audio device
US7266501B2 (en) * 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
WO2001086843A1 (en) * 2000-05-12 2001-11-15 Cohen Marc S Apparatus and method for triggering message insertion during digital music playing
US6782366B1 (en) * 2000-05-15 2004-08-24 Lsi Logic Corporation Method for independent dynamic range control
GB0016695D0 (en) * 2000-07-08 2000-08-23 Radioscape Ltd Digital transactions for the delivery of media files
US7840691B1 (en) 2000-09-07 2010-11-23 Zamora Radio, Llc Personal broadcast server system for providing a customized broadcast
US7848531B1 (en) * 2002-01-09 2010-12-07 Creative Technology Ltd. Method and apparatus for audio loudness and dynamics matching
AU2003224628A1 (en) * 2002-02-28 2003-09-16 Nikolay Shkolnik Liquid piston internal combustion power system
US20030182000A1 (en) * 2002-03-22 2003-09-25 Sound Id Alternative sound track for hearing-handicapped users and stressful environments
US7454331B2 (en) * 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
JP3879922B2 (ja) * 2002-09-12 2007-02-14 ソニー株式会社 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム
WO2004029935A1 (en) * 2002-09-24 2004-04-08 Rad Data Communications A system and method for low bit-rate compression of combined speech and music
US20040078104A1 (en) * 2002-10-22 2004-04-22 Hitachi, Ltd. Method and apparatus for an in-vehicle audio system
EP1427252A1 (en) * 2002-12-02 2004-06-09 Deutsche Thomson-Brandt Gmbh Method and apparatus for processing audio signals from a bitstream
US20040204944A1 (en) * 2003-04-14 2004-10-14 Castillo Michael J. System and method for mixing computer generated audio with television programming audio in a media center
US7251337B2 (en) * 2003-04-24 2007-07-31 Dolby Laboratories Licensing Corporation Volume control in movie theaters
US7551745B2 (en) * 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
JP4486646B2 (ja) * 2003-05-28 2010-06-23 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション オーディオ信号の感知音量を計算し調整する方法、装置及びコンピュータプログラム
GB2407006A (en) * 2003-10-08 2005-04-13 Sony Uk Ltd Communicating streamed payload data and packet based auxiliary data
US8718298B2 (en) * 2003-12-19 2014-05-06 Lear Corporation NVH dependent parallel compression processing for automotive audio systems
KR100541526B1 (ko) * 2004-01-30 2006-01-10 에스케이 텔레콤주식회사 멀티미디어 데이터의 전송품질 측정방법 및 장치
US8028323B2 (en) 2004-05-05 2011-09-27 Dryden Enterprises, Llc Method and system for employing a first device to direct a networked audio device to obtain a media item
US7624021B2 (en) * 2004-07-02 2009-11-24 Apple Inc. Universal container for audio data
US20060062407A1 (en) * 2004-09-22 2006-03-23 Kahan Joseph M Sound card having feedback calibration loop
US8090120B2 (en) * 2004-10-26 2012-01-03 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US20060203972A1 (en) * 2005-03-08 2006-09-14 Equity Online Marketing, Inc. Method and system for audio program creation and assembly
US7734364B2 (en) * 2005-03-08 2010-06-08 Lolo, Llc Mixing media files
US20060218253A1 (en) * 2005-03-08 2006-09-28 Equity On Line Marketing, Inc. Method and system for video program creation and assembly
US20070016930A1 (en) * 2005-03-08 2007-01-18 Podfitness, Inc. Creation and navigation of media content with chaptering elements
BRPI0622303B1 (pt) * 2005-04-18 2016-03-01 Basf Se copolímeros cp na forma de um polímero obtido por polimerização com radical de pelo menos três monômeros m diferentes monoetilenicamente insaturados
KR100640477B1 (ko) * 2005-06-29 2006-10-30 삼성전자주식회사 디지털 멀티미디어 방송 채널에 따른 오디오 신호 출력방법 및 장치
US7450705B1 (en) 2005-08-31 2008-11-11 At&T Corp. Method to test and compare voice teleconference systems
CN101410892B (zh) * 2006-04-04 2012-08-08 杜比实验室特许公司 改进的离散余弦变换域中的音频信号响度测量及修改
TWI517562B (zh) * 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
MY141426A (en) 2006-04-27 2010-04-30 Dolby Lab Licensing Corp Audio gain control using specific-loudness-based auditory event detection
US20080002839A1 (en) * 2006-06-28 2008-01-03 Microsoft Corporation Smart equalizer
WO2008002098A1 (en) * 2006-06-29 2008-01-03 Lg Electronics, Inc. Method and apparatus for an audio signal processing
EP2071564A4 (en) 2006-09-29 2009-09-02 Lg Electronics Inc METHOD AND DEVICES FOR CODING AND DECODING OBJECT-BASED AUDIO SIGNALS
US8849433B2 (en) 2006-10-20 2014-09-30 Dolby Laboratories Licensing Corporation Audio dynamics processing using a reset
US8521314B2 (en) * 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
EP2095365A4 (en) * 2006-11-24 2009-11-18 Lg Electronics Inc METHOD FOR ENCODING AND DECODING AUDIO SIGNALS BASED ON OBJECTS AND APPARATUS THEREOF
US20080201292A1 (en) * 2007-02-20 2008-08-21 Integrated Device Technology, Inc. Method and apparatus for preserving control information embedded in digital data
JP5530720B2 (ja) * 2007-02-26 2014-06-25 ドルビー ラボラトリーズ ライセンシング コーポレイション エンターテイメントオーディオにおける音声強調方法、装置、およびコンピュータ読取り可能な記録媒体
EP2003860A1 (en) * 2007-06-12 2008-12-17 Alcatel Lucent Configuration of a communication terminal by provisioning of DHCP realm identifier
JP5556175B2 (ja) * 2007-06-27 2014-07-23 日本電気株式会社 信号分析装置と、信号制御装置と、そのシステム、方法及びプログラム
BRPI0813723B1 (pt) * 2007-07-13 2020-02-04 Dolby Laboratories Licensing Corp método para controlar o nível de intensidade do som de eventos auditivos, memória legível por computador não transitória, sistema de computador e aparelho
US9996612B2 (en) * 2007-08-08 2018-06-12 Sony Corporation System and method for audio identification and metadata retrieval
JP2009076172A (ja) * 2007-09-25 2009-04-09 Hitachi Ltd データ伝送方法、光ディスク記録方法及び光ディスク記録装置
DE102007048973B4 (de) * 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
US8527282B2 (en) 2007-11-21 2013-09-03 Lg Electronics Inc. Method and an apparatus for processing a signal
US9015147B2 (en) 2007-12-20 2015-04-21 Porto Technology, Llc System and method for generating dynamically filtered content results, including for audio and/or video channels
US8316015B2 (en) 2007-12-21 2012-11-20 Lemi Technology, Llc Tunersphere
US8117193B2 (en) 2007-12-21 2012-02-14 Lemi Technology, Llc Tunersphere
KR101597375B1 (ko) 2007-12-21 2016-02-24 디티에스 엘엘씨 오디오 신호의 인지된 음량을 조절하기 위한 시스템
JP5341983B2 (ja) * 2008-04-18 2013-11-13 ドルビー ラボラトリーズ ライセンシング コーポレイション サラウンド体験に対する影響を最小限にしてマルチチャンネルオーディオにおけるスピーチの聴覚性を維持するための方法及び装置
KR101381513B1 (ko) 2008-07-14 2014-04-07 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
EP2154910A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for merging spatial audio streams
US8509315B1 (en) * 2008-09-23 2013-08-13 Viasat, Inc. Maintaining synchronization of compressed data and associated metadata
CN101715145B (zh) * 2008-10-06 2012-08-15 辉达公司 利用级联存储器评估处理能力的设备和方法
US8494899B2 (en) 2008-12-02 2013-07-23 Lemi Technology, Llc Dynamic talk radio program scheduling
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
WO2011048010A1 (en) * 2009-10-19 2011-04-28 Dolby International Ab Metadata time marking information for indicating a section of an audio object
CN102385864B (zh) * 2010-08-31 2013-07-10 Tcl集团股份有限公司 一种音频数据解码方法、装置及音频播放器
US9171549B2 (en) 2011-04-08 2015-10-27 Dolby Laboratories Licensing Corporation Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams
US20130054450A1 (en) * 2011-08-31 2013-02-28 Richard Lang Monetization of Atomized Content
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
TWI530941B (zh) * 2013-04-03 2016-04-21 杜比實驗室特許公司 用於基於物件音頻之互動成像的方法與系統
CN109712630B (zh) * 2013-05-24 2023-05-30 杜比国际公司 包括音频对象的音频场景的高效编码
US20150006369A1 (en) * 2013-06-27 2015-01-01 Little Engines Group, Inc. Method for internet-based commercial trade in collaboratively created secondary digital media programs
CN105493182B (zh) 2013-08-28 2020-01-21 杜比实验室特许公司 混合波形编码和参数编码语音增强
KR102170827B1 (ko) * 2013-11-22 2020-10-28 삼성전자주식회사 영상표시장치 및 영상표시장치의 구동방법, 음향출력장치 및 음향출력장치의 구동방법
CN106068651B (zh) * 2014-03-18 2020-10-16 皇家飞利浦有限公司 视听内容项数据流
US9462330B2 (en) 2014-09-04 2016-10-04 Transformative Engineering, Inc. Multimedia audio inserter
CN105723739A (zh) * 2016-01-23 2016-06-29 张阳 一种音箱设备的音量调整方法及系统
WO2017130210A1 (en) * 2016-01-27 2017-08-03 Indian Institute Of Technology Bombay Method and system for rendering audio streams
US10341762B2 (en) 2017-10-11 2019-07-02 Sony Corporation Dynamic generation and distribution of multi-channel audio from the perspective of a specific subject of interest
WO2021086624A1 (en) 2019-10-29 2021-05-06 Qsinx Management Llc Audio encoding with compressed ambience
CN114222224B (zh) * 2021-10-29 2023-12-26 成都中科信息技术有限公司 一种双通道通信链路的会议讨论系统及工作方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02174380A (ja) * 1988-12-27 1990-07-05 Marantz Japan Inc Ld等映像ソフト媒体の多言語化システム
JPH03236691A (ja) * 1990-02-14 1991-10-22 Hitachi Ltd テレビジョン受信機用音声回路
JPH0556007A (ja) * 1991-08-23 1993-03-05 Nippon Hoso Kyokai <Nhk> 混合音声信号伝送方式
JPH05342583A (ja) * 1992-06-12 1993-12-24 Matsushita Electric Ind Co Ltd ディスク記録装置及び再生装置
JPH1133228A (ja) * 1997-07-23 1999-02-09 Namco Ltd ゲーム装置及び情報記憶媒体

Family Cites Families (83)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2783677A (en) 1953-06-29 1957-03-05 Ampex Electric Corp Stereophonic sound system and method
US3046337A (en) 1957-08-05 1962-07-24 Hamner Electronics Company Inc Stereophonic sound
US3110769A (en) 1959-01-17 1963-11-12 Telefunken Gmbh Stereo sound control system
GB1522599A (en) 1974-11-16 1978-08-23 Dolby Laboratories Inc Centre channel derivation for stereophonic cinema sound
US4074084A (en) 1975-11-05 1978-02-14 Berg Johannes C M Van Den Method and apparatus for receiving sound intended for stereophonic reproduction
US4150253A (en) 1976-03-15 1979-04-17 Inter-Technology Exchange Ltd. Signal distortion circuit and method of use
US4051331A (en) 1976-03-29 1977-09-27 Brigham Young University Speech coding hearing aid system utilizing formant frequency transformation
US4052559A (en) 1976-12-20 1977-10-04 Rockwell International Corporation Noise filtering device
US4406001A (en) 1980-08-18 1983-09-20 The Variable Speech Control Company ("Vsc") Time compression/expansion with synchronized individual pitch correction of separate components
US4405831A (en) 1980-12-22 1983-09-20 The Regents Of The University Of California Apparatus for selective noise suppression for hearing aids
US4454609A (en) 1981-10-05 1984-06-12 Signatron, Inc. Speech intelligibility enhancement
US4516257A (en) 1982-11-15 1985-05-07 Cbs Inc. Triphonic sound system
US4484345A (en) 1983-02-28 1984-11-20 Stearns William P Prosthetic device for optimizing speech understanding through adjustable frequency spectrum responses
US4622440A (en) 1984-04-11 1986-11-11 In Tech Systems Corp. Differential hearing aid with programmable frequency response
US4776016A (en) 1985-11-21 1988-10-04 Position Orientation Systems, Inc. Voice control system
US4809337A (en) 1986-06-20 1989-02-28 Scholz Research & Development, Inc. Audio noise gate
US5138498A (en) 1986-10-22 1992-08-11 Fuji Photo Film Co., Ltd. Recording and reproduction method for a plurality of sound signals inputted simultaneously
US4816905A (en) 1987-04-30 1989-03-28 Gte Laboratories Incorporated & Gte Service Corporation Telecommunication system with video and audio frames
JPH06101664B2 (ja) 1987-08-20 1994-12-12 パイオニア株式会社 再生波形等化回路
DE3730763A1 (de) 1987-09-12 1989-03-30 Blaupunkt Werke Gmbh Schaltung zur stoergeraeuschkompensation
US4941179A (en) 1988-04-27 1990-07-10 Gn Davavox A/S Method for the regulation of a hearing aid, a hearing aid and the use thereof
JP3017744B2 (ja) 1989-03-09 2000-03-13 パイオニア株式会社 ボイスチェンジ回路
US5212764A (en) 1989-04-19 1993-05-18 Ricoh Company, Ltd. Noise eliminating apparatus and speech recognition apparatus using the same
US5450146A (en) 1989-05-24 1995-09-12 Digital Theater Systems, L.P. High fidelity reproduction device for cinema sound
US5003605A (en) 1989-08-14 1991-03-26 Cardiodyne, Inc. Electronically augmented stethoscope with timing sound
US5144454A (en) 1989-10-31 1992-09-01 Cury Brian L Method and apparatus for producing customized video recordings
JP2538668Y2 (ja) 1990-03-02 1997-06-18 ブラザー工業株式会社 メッセージ機能付き音楽再生装置
US5216718A (en) 1990-04-26 1993-06-01 Sanyo Electric Co., Ltd. Method and apparatus for processing audio signals
EP0459362B1 (en) 1990-05-28 1997-01-08 Matsushita Electric Industrial Co., Ltd. Voice signal processor
DE69131739T2 (de) 1990-05-28 2001-10-04 Matsushita Electric Ind Co Ltd Einrichtung zur Sprachsignalverarbeitung für die Bestimmung eines Sprachsignals in einem verrauschten Sprachsignal
JP3006059B2 (ja) 1990-09-17 2000-02-07 ソニー株式会社 音場拡大装置
US5155510A (en) 1990-11-29 1992-10-13 Digital Theater Systems Corporation Digital sound system for motion pictures with analog sound track emulation
US5146504A (en) 1990-12-07 1992-09-08 Motorola, Inc. Speech selective automatic gain control
US5408686A (en) 1991-02-19 1995-04-18 Mankovitz; Roy J. Apparatus and methods for music and lyrics broadcasting
JP3068226B2 (ja) 1991-02-27 2000-07-24 株式会社リコス バックコーラス合成装置
US5210366A (en) 1991-06-10 1993-05-11 Sykes Jr Richard O Method and device for detecting and separating voices in a complex musical composition
JPH0537478A (ja) 1991-07-31 1993-02-12 Fujitsu Ten Ltd 音場制御装置
DE69317802T2 (de) 1992-01-21 1998-10-22 Koninkl Philips Electronics Nv Verfahren und Vorrichtung für Tonverbesserung unter Verwendung von Hüllung von multibandpassfiltrierten Signalen in Kammfiltern
US5384599A (en) 1992-02-21 1995-01-24 General Electric Company Television image format conversion system including noise reduction apparatus
US5812688A (en) 1992-04-27 1998-09-22 Gibson; David A. Method and apparatus for using visual images to mix sound
JPH05342762A (ja) 1992-06-12 1993-12-24 Sanyo Electric Co Ltd 音声再生回路
JPH087524B2 (ja) 1992-07-17 1996-01-29 株式会社日本ビデオセンター カラオケ採点表示装置
US5319713A (en) 1992-11-12 1994-06-07 Rocktron Corporation Multi dimensional sound circuit
US5325423A (en) 1992-11-13 1994-06-28 Multimedia Systems Corporation Interactive multimedia communication system
US5341253A (en) 1992-11-28 1994-08-23 Tatung Co. Extended circuit of a HiFi KARAOKE video cassette recorder having a function of simultaneous singing and recording
US5400409A (en) 1992-12-23 1995-03-21 Daimler-Benz Ag Noise-reduction method for noise-affected voice channels
US5572591A (en) 1993-03-09 1996-11-05 Matsushita Electric Industrial Co., Ltd. Sound field controller
US5396560A (en) 1993-03-31 1995-03-07 Trw Inc. Hearing aid incorporating a novelty filter
US5434922A (en) 1993-04-08 1995-07-18 Miller; Thomas E. Method and apparatus for dynamic sound optimization
JP3206619B2 (ja) 1993-04-23 2001-09-10 ヤマハ株式会社 カラオケ装置
JP2951502B2 (ja) 1993-05-26 1999-09-20 パイオニア株式会社 カラオケ装置
US5619383A (en) 1993-05-26 1997-04-08 Gemstar Development Corporation Method and apparatus for reading and writing audio and digital data on a magnetic tape
JP3685812B2 (ja) 1993-06-29 2005-08-24 ソニー株式会社 音声信号送受信装置
US5644677A (en) 1993-09-13 1997-07-01 Motorola, Inc. Signal processing system for performing real-time pitch shifting and method therefor
US5485522A (en) 1993-09-29 1996-01-16 Ericsson Ge Mobile Communications, Inc. System for adaptively reducing noise in speech signals
BE1007617A3 (nl) 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5576843A (en) 1993-10-29 1996-11-19 Time Warner Entertainment Co., L.P. System and method for controlling play of multiple dialog audio tracks of a software carrier
US5469370A (en) 1993-10-29 1995-11-21 Time Warner Entertainment Co., L.P. System and method for controlling play of multiple audio tracks of a software carrier
US5569038A (en) 1993-11-08 1996-10-29 Tubman; Louis Acoustical prompt recording system and method
TW247390B (en) 1994-04-29 1995-05-11 Audio Products Int Corp Apparatus and method for adjusting levels between channels of a sound system
JP3568584B2 (ja) 1994-06-28 2004-09-22 ローム株式会社 オーディオ装置
US5706145A (en) 1994-08-25 1998-01-06 Hindman; Carl L. Apparatus and methods for audio tape indexing with data signals recorded in the guard band
US5668339A (en) * 1994-10-26 1997-09-16 Daewoo Electronics Co., Ltd. Apparatus for multiplexing an audio signal in a video-song playback system
JP2897659B2 (ja) 1994-10-31 1999-05-31 ヤマハ株式会社 カラオケ装置
US5751903A (en) 1994-12-19 1998-05-12 Hughes Electronics Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset
JP3239672B2 (ja) 1995-02-15 2001-12-17 ヤマハ株式会社 自動演奏装置
JP3319211B2 (ja) 1995-03-23 2002-08-26 ヤマハ株式会社 音声変換機能付カラオケ装置
KR0155811B1 (ko) 1995-03-28 1998-12-15 김광호 컴팩트 디스크 플레이어 일체형 텔레비젼 수상기
EP0738999B1 (en) * 1995-04-14 2002-06-26 Kabushiki Kaisha Toshiba Recording medium and reproducing system for playback data
US5684714A (en) 1995-05-08 1997-11-04 Kabushiki Kaisha Toshiba Method and system for a user to manually alter the quality of a previously encoded video sequence
KR100188089B1 (ko) 1995-07-10 1999-06-01 김광호 음성 강조 회로
US6118876A (en) * 1995-09-07 2000-09-12 Rep Investment Limited Liability Company Surround sound speaker system for improved spatial effects
US5872851A (en) 1995-09-18 1999-02-16 Harman Motive Incorporated Dynamic stereophonic enchancement signal processing system
US5852800A (en) 1995-10-20 1998-12-22 Liquid Audio, Inc. Method and apparatus for user controlled modulation and mixing of digitally stored compressed data
US5666350A (en) 1996-02-20 1997-09-09 Motorola, Inc. Apparatus and method for coding excitation parameters in a very low bit rate voice messaging system
US5809472A (en) 1996-04-03 1998-09-15 Command Audio Corporation Digital audio data transmission system based on the information content of an audio signal
US5822370A (en) 1996-04-16 1998-10-13 Aura Systems, Inc. Compression/decompression for preservation of high fidelity speech quality at low bandwidth
US5970152A (en) * 1996-04-30 1999-10-19 Srs Labs, Inc. Audio enhancement system for use in a surround sound environment
JPH09322078A (ja) 1996-05-24 1997-12-12 Toko Inc 画像伝送装置
JPH1063470A (ja) * 1996-06-12 1998-03-06 Nintendo Co Ltd 画像表示に連動する音響発生装置
US5912976A (en) 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
US6078669A (en) * 1997-07-14 2000-06-20 Euphonics, Incorporated Audio spatial localization apparatus and methods
US6067361A (en) * 1997-07-16 2000-05-23 Sony Corporation Method and apparatus for two channels of sound having directional cues

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02174380A (ja) * 1988-12-27 1990-07-05 Marantz Japan Inc Ld等映像ソフト媒体の多言語化システム
JPH03236691A (ja) * 1990-02-14 1991-10-22 Hitachi Ltd テレビジョン受信機用音声回路
JPH0556007A (ja) * 1991-08-23 1993-03-05 Nippon Hoso Kyokai <Nhk> 混合音声信号伝送方式
JPH05342583A (ja) * 1992-06-12 1993-12-24 Matsushita Electric Ind Co Ltd ディスク記録装置及び再生装置
JPH1133228A (ja) * 1997-07-23 1999-02-09 Namco Ltd ゲーム装置及び情報記憶媒体

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012234192A (ja) * 2005-02-14 2012-11-29 Fraunhofer Ges オーディオソースのパラメトリックジョイント符号化
US9668078B2 (en) 2005-02-14 2017-05-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Parametric joint-coding of audio sources
JP2010518455A (ja) * 2007-02-12 2010-05-27 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 高齢又は聴覚障害聴取者のための非スピーチオーディオに対するスピーチオーディオの改善された比率
JP2020039181A (ja) * 2013-09-12 2020-03-12 ドルビー ラボラトリーズ ライセンシング コーポレイション 多様な再生環境のためのダイナミックレンジ制御
US10956121B2 (en) 2013-09-12 2021-03-23 Dolby Laboratories Licensing Corporation Dynamic range control for a wide variety of playback environments
US11429341B2 (en) 2013-09-12 2022-08-30 Dolby International Ab Dynamic range control for a wide variety of playback environments
US11842122B2 (en) 2013-09-12 2023-12-12 Dolby Laboratories Licensing Corporation Dynamic range control for a wide variety of playback environments

Also Published As

Publication number Publication date
AU2001243395A1 (en) 2001-09-12
US6772127B2 (en) 2004-08-03
KR20020073604A (ko) 2002-09-27
RU2002126217A (ru) 2004-04-20
US20020040295A1 (en) 2002-04-04
EP1264300A2 (en) 2002-12-11
BR0108904A (pt) 2004-06-15
CN1211775C (zh) 2005-07-20
CN1427987A (zh) 2003-07-02
KR100799155B1 (ko) 2008-01-29
IL151546A0 (en) 2003-04-10
WO2001065888A9 (en) 2003-03-06
WO2001065888A3 (en) 2002-02-14
MXPA02008573A (es) 2003-02-24
US6351733B1 (en) 2002-02-26
CA2401798A1 (en) 2001-09-07
WO2001065888A2 (en) 2001-09-07

Similar Documents

Publication Publication Date Title
US6772127B2 (en) Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US8108220B2 (en) Techniques for accommodating primary content (pure voice) audio and secondary content remaining audio capability in the digital audio production process
US11501789B2 (en) Encoded audio metadata-based equalization
Bleidt et al. Development of the MPEG-H TV audio system for ATSC 3.0
Herre et al. MPEG-H audio—the new standard for universal spatial/3D audio coding
TWI543642B (zh) 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
US8705747B2 (en) Object-based 3-dimensional audio service system using preset audio scenes
TW201010450A (en) Apparatus and method for generating audio output signals using object based metadata
MXPA01012991A (es) Mezcla descendente del canal central interactivo de voz a audio remanente (vra).
JP2003524906A (ja) 聴覚障害および非聴覚障害リスナーの好みに合わせてユーザ調整能力を提供する方法および装置
KR100802179B1 (ko) 프리셋 오디오 장면을 이용한 객체기반 3차원 오디오서비스 시스템 및 그 방법
JP2009537876A (ja) プリセットオーディオシーンを用いたオブジェクトベースの3次元オーディオサービスシステム及びその方法
Riedmiller et al. Delivering scalable audio experiences using AC-4
Grewe et al. MPEG-H Audio System for SBTVD TV 3.0 Call for Proposals
Todd Loudness uniformity and dynamic range control for digital multichannel audio broadcasting
Proper et al. Surround+ immersive mastering
Fug et al. An Introduction to MPEG-H 3D Audio
Lyman et al. Dolby Digital Audio Delivery to the Consumer
Lyman Program Presentation Using ATSC Audio Systems

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080226

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20100421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100820

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101116

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101213