JP2003525466A - デジタルオーディオ生成過程において1次コンテンツオーディオおよび2次コンテンツの残りのオーディオ性能を収容する方法および装置 - Google Patents
デジタルオーディオ生成過程において1次コンテンツオーディオおよび2次コンテンツの残りのオーディオ性能を収容する方法および装置Info
- Publication number
- JP2003525466A JP2003525466A JP2001563565A JP2001563565A JP2003525466A JP 2003525466 A JP2003525466 A JP 2003525466A JP 2001563565 A JP2001563565 A JP 2001563565A JP 2001563565 A JP2001563565 A JP 2001563565A JP 2003525466 A JP2003525466 A JP 2003525466A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- vra
- signal
- pcpv
- scra
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Stereophonic System (AREA)
Abstract
Description
に組み込まれた、“デジタルオーディオ生成過程において1次コンテンツ(純粋
な音声)オーディオおよび2次コンテンツの残りのオーディオ性能を収容する技
術”と題する仮出願番号60/186,357の利益を請求する。
オ信号の所望な部分の増進に関する。
再生の最近の広範囲の編入はデジタルオーディオ処理の実際にはあらゆる段階で
新しい機会の可能性を導入した。それは音声対残りのオーディオ(VRA)の好まし
い比率が異なった人々についてかなり異なっており、かつ異なった型のメディア
プログラム(スポーツプログラム対音楽など)に関して異なることが最近示された
。Blum他によるHEC Technical Report No.1,January,2000の“A Study of Lis
tener Preferences Using Pre-Recorded Voice-to-Remaining Audio”参照。
に音声(スピーチ)のボリュームを調整することによって、VRAはオーディオプロ
グラムの音声対残りのオーディオ比の個人化された調整について言及する。独自
にユーザ調整された音声オーディオ情報は、次に独自にユーザ調整された残りの
音声オーディオ情報に結合されて、さらに全体のボリューム調整が適用されるか
もしれない再生装置に送られる。この技術は、各個人の聞き取り能力がそれらの
視覚能力と同じくらい異なっており、その結果彼らがオーディオプログラムの音
声対バックグラウンドコンテンツを聞きたい(または、必要性さえある) 個々の
好みに導く発見によって動機づけられた。オーディオプログラムのVRA能力のた
めの必要性が各々およびすべての人に最適の視覚特性を提供するために広範囲な
指示レンズの必要性と同じくらい基本的であるということが結論である。
含を可能にする。特に、発明はAC3圧縮形式に等しいか、またはそれより大きい
匹敵するネット損失を受けるどんなコーデックとも比較されるオーディオデータ
のより少ない損失を受けるオーディオ圧縮形式のそれらのクラスにより、VRA可
能なデジタル習得とVRAの収容の特別な技術を具体化する。
合わせることによって、その結果そのプログラムでオーディオコンテンツの残り
の部分に比例してオーディオプログラムの1次音声/対話コンテンツの比率を制
御したいオーディオエンドユーザ(最終聴取者)のためになるように意図された新
しい技術を可能にすることにより、デジタルオーディオメディア形式の再生上、
最終聴取者の音声対残りのオーディオ(VRA)調整を容易にする。ここに開示され
る特定の発明を動機づける問題は2つである。第1に、VRA調整を可能にする2つ
の信号の構造のためのオーディオプログラム生成経路において、最も良い位置に
ついて異なった意見があることが認められる。第2に、最適のオーディオ圧縮形
式、オーディオのファイル格納要求、オーディオの放送伝送ビットレート、オー
ディオのストリーミングビットレート、および最終聴取者に最終的に伝えられる
音声および残りのオーディオコンテンツの両方の知覚された聴取品質の間にはト
レードオフがある。VRAを最終聴取者に提供する究極の目的のために、それらの2
つの問題の様々な解決が新しい実施例を通してこの発明により提案され、その実
施例は新しいまたは既存のデジタル習得、オーディオ圧縮、コード化、ファイル
格納、伝送、および復号の技術を取り入れるかもしれない。
ディオコンテンツが格納および/または伝送のために容易に作られるように、オ
ーディオプログラムが生成されるかもしれない様々な方法に適応されてもよい。
この方法において、録音過程はオーディオ生成過程の不可欠の要素であると考え
られる。新しいオーディオコンテンツは、オーディオ信号のデジタル格納および
/または伝送で使用されるかもしれない特定のオーディオ圧縮アルゴリズムの如
何にかかわらず、明らかな方法で最終聴取者に引渡されるかもしれない。これは
実際にはどんなCODECでの音声および残りのオーディオ情報の包含も必要とする
だろう。したがって、この発明はユニークなデジタル習得の過程、および多くで
状況で使用される損失のないおよび最少損失の圧縮アルゴリズムで両立性のある
非圧縮格納方式を定義する。
もしれない。オーディオコーデックの中の共通点のために、以下に提供されるす
べての記述が放送メディア(テレビやウエブキャスチングなどの)、ストリーミン
グのオーディオ、CDオーディオ、またはDVDオーディオのために等しくVRA機能性
を供給するように考慮されることができる。また、発明はフィルム、ドキュメン
タリー、ビデオ、音楽、およびスポーツイベントを含むオーディオプログラムの
すべての形式のために意図されるかもしれない。
は、発明の以下の詳細な記述、添付請求項およびここに添付される複数の図面を
参照することによりさらに明確に理解されるであろう。
損傷のほとんどすべての形について最適な解決策は、バックグラウンド音の‘汚
染’なしに興味がある聴覚信号(通常音声)を聴覚損傷聴取者が受信することを許
容することであることを、聴覚学の専門家はすばやく指摘するだろう。したがっ
て、VRAの特徴は聴覚損傷個人の人生を高めることを期待することができる。し
かしながら、最近の調査は、集団の実際にはすべての区分で好ましい信号(例え
ば、スポーツアナウンサーの音声)と残りのオーディオ信号(例えば、群衆のバッ
クグラウンド雑音)の最適のミックスにおける重要な変化を確認した。オーディ
オ情報の‘聴取における多様性’のこの必要性の証拠は全地球上にいる何百万人
もの人間の総合的な多様性と一致している。
データ)と同様に多量の高品質のオーディオ情報を送ることを可能にしたとき、
この発見は到来する。あいにく、デジタルオーディオにおけるVRAの特徴の編入
はこれまでどんなメディアの形にも提供されていない。この領域での仕事は、AT
SC AC3デジタルオーディオ標準の任意の部分として構成されたいわゆる‘Herrin
g Impaired Associated Service’の言及に制限された。1995年 ATSCレポート“
A-54: A Guide to the Use of the AC3”参照。それは、AC3ビットストリーム
の一部として聴覚損傷ユーザが音声のコンテンツだけの特に準備された信号を受
信すること、およびATSCの指定されたビットストリームの一部として通常伝送さ
れる他のオーディオチャンネル(主なオーディオサービス)で、調整されたボリュ
ームでその音声コンテンツを混合することをいかに欲するかを記述する短いパラ
グラフを含む。A-54ドキュメントで言及されるAC3オーディオ方式がデジタルオ
ーディオの専門家によって‘知覚のコード化’圧縮形式と呼ばれたDolby Labs圧
縮アルゴリズムに基づくことは、周知のことである。知覚のコード化アルゴリズ
ムは、記録保管されたファイルの格納サイズ要件を減らすため、およびHDTVなど
のリアルタイムの放送で伝送されなければならない情報の量を減少するため、オ
リジナルのオーディオ信号コンテンツの何らかの割合を捨てるように設計される
。アルゴリズムは、耳がとにかく聞くことができなかったそれらのデータだけを
排除することを試みるので、捨てられたオーディオデータは聴取者により気づか
ないようになると思われる。あいにく、知覚のコード化アルゴリズムは、あるオ
ーディオコンテンツが捨てられた後に保持される究極の聴取品質について積年の
討論を受けることになった。
ンドユーザのための理解と聴取満足感を高めることであり、エンドユーザは音声
と残りのオーディオの提供されたミックスダウン比を理解しかつ楽しむことを現
在強いて試みようとする。純粋な音声がAC3などのまさしくその損失のある圧縮
アルゴリズムを使用することで提供されるとき、音声の品質は必ず減少する。AC
3の知覚のコード化アルゴリズムはおよそ12:1の圧縮比で構成され、それはオリ
ジナルのオーディオコンテンツが情報の12オリジナルビット毎に1ビットだけを
保持したことを意味する。これは、VRAの特徴の包含のための第1の目的がその
ような損失のある圧縮アルゴリズムで構成されたオーディオ品質における知覚可
能な損失の範囲によって間違いなく覆えされることを意味する。
について、エンドユーザが最終的な決定を成すための1つであるような損失のな
い、または比較的損失の少ないデジタルオーディオコーデックにおけるVRA包含
技術の圧倒的な必要性がある。
力のわかりやすい引渡しを確保する実施例の議論の前に、コンテンツプロバイダ
ーが標準化された方法で新しい‘純粋な音声’コンテンツをアクセスしやすくす
ることができる枠組みについて議論することは役に立つだろう。わかりやすい引
渡しはオーディオプログラムを最終聴取者の再生装置に格納するか、または伝送
するために使用される特定のオーディオ形式(例えば、MP3、DTS、Real Audioな
ど)にかかわらず、VRA能力を最終聴取者に提供する行為を示す。
的な長所の最少の損失で過程が起ることを確実にしようとする。パーティーは俳
優、ミュージシャン、スポーツブロードキャスター、ディレクター、およびフィ
ルムのオーディオコンテンツ、音楽録音、スポーツプログラム、ラジオ番組、お
よび他のもののプロデューサーを含むかもしれない。可能な枠組みを提供するた
めに、以前に議論された音声対残りのオーディオの記述をさらに明瞭かつ支持す
る新しい用語を導入することは役に立つであろう。
オーディオ”の前の名称を反駁または否定することを意図しない。代わりに新し
い名称は、様々なオーディオプログラムのプロデューサーがコード化、圧縮およ
び復号過程のために適切にこれらの信号を確認することができる枠組みを容易に
するために導入されている。さらに、この議論はプロデューサーまたは2次コン
テンツプロバイダーが“純粋な音声信号”および“残りのオーディオ信号” を
作るのに使用するかもしれないいくつかの可能性を明確にする。
ツの純粋な音声オーディオ”と“2次コンテンツの残りのオーディオ”を含むよ
うに定義される。これらの2つのラベルの理由は、オーディオプログラムの創始
者が再生で最終の聴取者によって混合される2つの信号を作成する際に何らかの
芸術的な自由を保持する願望と同様に、最終聴取者のためのVRA機能の意図され
た使用に関連する。まず最初に、最終聴取者のVRA機能の意図された用途を考慮
する。彼らがよりよくプログラムを楽しみ、またはよりよくプログラムを理解す
るように、彼らはオーディオプログラムの不可欠の部分を調整することができる
ことを望む。いくつかの場合、調整は明白になるだろう。例えば、スポーツアナ
ウンサーの音声、またはレフリーの発声は非常に間違いなくスポーツプログラム
のオーディオコンテンツの不可欠な情報である。バックグラウンド、または残り
のオーディオはまたオーディオコンテンツに存在している群衆雑音である。いく
らかの聴取者はゲームによりかかわると感じるようにより高いレベルに群衆雑音
を調整することを願うかもしれないが、他のものは群衆雑音でいらいらするかも
しれない。したがって、1次コンテンツの純粋な音声のオーディオ情報がアナウ
ンサーまたはレフリーの音声であり、2次コンテンツの残りのオーディオ信号は
群衆雑音であると述べるのが率直に思える。
他の多数の状況を作ることを容易にしない。例えばフィルムサウンドトラックを
取ると、一度に数人が話しているフィルムに回数があるかもしれない。時々これ
が起こるとき、彼/彼女がただ1つの音声を聞いてさえ、視聴者は筋の完全な理解
と鑑賞で場面を通して感動することができるかもしれない。フィルムの筋の本質
を保持するために一度にすべての音声を聞くことが必須であるときに、得てして
、他の場面があるであろう。後者の場合では、視聴者がその場面中のフィルムの
全体の芸術を鑑賞するために、すべての音声の混合が1次コンテンツの純粋な音
声コンテンツであると考えられなければならないだろう。したがって、究極のVR
A調整のためにプログラムのどんな部分が聴取者に提供されるべきであるかを彼
らが決めるとき、オーディオプログラムを生成する人々によって保持された大き
い度合いの芸術的な自由があるだろう。
/芸術家が感じるならば、1次コンテンツの純粋な音声信号が非音声のオーディ
オ音と共に構成されることは可能でさえある。例えば、アラームが鳴りだす音は
、俳優/女優がなぜ非常に突然領域を去っているかということを視聴者が理解す
るために不可欠であるかもしれない。したがって、1次コンテンツの純粋な音声
信号はオーディオプログラムのすべての瞬間に厳密に音声情報として解釈される
べきではないが、この信号はまた他の音の簡潔な部分を含むかもしれないことが
理解される。
づける。これはまた伝送の目的のために重要である。一般的なオーディオに使用
されるより効率的である圧縮アルゴリズムを使用して、スピーチだけのオーディ
オコンテンツを圧縮することが可能であることは、技術に熟達した者によく知ら
れている。これはスピーチだけのオーディオコンテンツの帯域幅を減少すること
に関連する。したがってそれは、信号が‘1次コンテンツの純粋な音声(PCPV/PC
A)’または‘1次コンテンツの音声(PCA)’であるかをプロデューサ−が定義
するコード化の過程の効率及び品質に重要である。信号がPCPV/PCAであると定義
されるときスピーチだけのコード化を許容し、プログラムがPCAとしてフラグを
あげられるとき、これらの瞬間により一般的なエンコーダアルゴリズムに切換わ
ることを許容するように、これはオーディオプログラムが発展するとき変化する
パラメタとしてエンコーダへ供給することさえできる。
の信号のいずれかまたはすべてにおいて空間的な情報の潜在的必要性である。聴
取者が通常中心に置かれたフィルムの音声コンテンツに対して、取り囲まれた位
置から来る情報を聞くことが不可欠である場面があることはほぼ確実である。そ
の能力が提供されないならば、プログラムは何らかの芸術的な長所と、ことによ
ると筋の鑑賞を失う。何らかの不可欠な空間的な情報の包含が信号の多重チャン
ネル再生により収容されることができる。したがって、この発明はまた、1次コ
ンテンツの純粋な音声の多重チャンネルの格納、圧縮、および復号の必要がある
それらの状況を可能にする方法を説明しようとする。
る生成、コード化および復号化過程における多数の方法を導いた。デジタルオー
ディオ信号の多重チャンネルの作成、格納、処理、配送、および再生が現在、何
年間も実行されたことを指摘することが最も重要である。事実上、デジタルオー
ディオにおける最近の傾向は、再生装置に引渡すことができるオーディオチャン
ネルの数が絶えず増加する方向にある。例えば、最新のMPEG-4のデジタルオーデ
ィオ標準(ISO###) に織りこまれた主要な新しい特徴の1つはコード化、ビットス
トリームおよび復号化過程におけるデジタルオーディオの最大64チャンネルを収
容する能力であった。
によって予想されなかった。実施例の非常に重要な部分の特徴は、広くさまざま
な聴取者が新しいVRA調整が提供されるために欲しい(聴覚損傷のない聴取者)、
または必要がある(聴覚損傷した聴取者)認識である。したがって、この認識は、
デジタルマスターの形式が全体のデジタルオーディオ生成の過程を通してPCPV/P
CAおよびSCRA信号の完全性を維持するように、プログラムされた新しいコード化
技術といかに両立性があるかの記述のための必要性を導いた。
オーディオ−の再生の際に調整することができることを確実にするのに不可欠で
ある。PCPV/PCA/SCRA信号を構成するこの行為は、あるレベルで混合として見ら
れるかもしれない。しかしながら、発明は生成の過程の中でPCPV/PCA信号を維持
することを容易にし、その結果その信号単独で対話情報を理解する能力を聴取者
に与える。
の方法でPCPV/PCA/SCRA信号を得るために必要とした正確な可能な技術が現在存
在しないということである。したがって、以下で議論される最も重要な実施例の
幾つかはそれらの信号の完全性を維持する方法に関連づけられる。これは特別な
ヘッダーデータおよび補助データチャネルの使用によって達成され、それは、1
)入来信号がPCPV/PCA/SCRA情報(すなわち、VRA可能である)を有する任意のエン
コーダに“通知する”;2)PCPV/PCA/SCRAコンテンツが知られている方法でVRA
可能デジタルマスターテープ/ファイルからデコーダへ送られるように、ビット
ストリームをいかに開発するかをエンコーダに指令する;3)そして、再生装置
でPCPV/PCA/SCRA信号をいかに構成、再構成、および/または再生するかについて
デコーダに情報を供給する。
使用するVRA調整の根源の意図をはっきりさせることも役に立つかもしれない。
この発明で提供される解決策の1つが純粋な音声と残りのオーディオ即ちPCPV/PC
A/SCRAのどちらかとして引用される、2つのユニークなオーディオ信号を作成す
ること、そしてそれぞれの信号のボリュームを独自に調整する最終聴取者に容易
に配送することであることを思い出すべきである。したがって、この発明は、結
局最終聴取者がそれらの2つの信号だけのボリューム調整へのアクセスを与えら
れる新しい生成の過程を定義しようとする。
排他的でないなら、音声コンテンツオーディオ)からオーディオコンテンツを一
緒に混合することによって構成されるとき、回数があることは明確である。しか
しながら、最終結果が2つの個々の信号−PCPV/PCA信号とSCRA信号−だけの作成
であることを評価することは読者にとって非常に重要である。このドキュメント
で後で示される実施例のように、それらの2つの信号が最終聴取者のために最終
的に構成される生成経路に様々な位置がある。例えば、プロデューサーは、それ
らが最初の習得テープであるように録音の過程の間それらを結合することを望む
かもしれない。
して、次に記録後混合セッションの間にPCPV/PCA信号を作成するためにそれらを
結合するかもしれない。別の可能性は、多くのチャンネルでデジタルテープを作
成し、次に、プログラム再生中任意の瞬間にPCPV/PCAまたはSCRA信号を作成する
ために、いかにそれらのチャネルを任意のある混合にダウンミックスするかをデ
コーダに指示するデータチャンネルに沿って送ることである。しかし、これらの
すべての発明的な方法の最終結果は、最終聴取者がVRA調整を可能にする2つの信
号だけを与えられることである。
べきPCPV/PCA/SCRA信号のために必要性があることが非常に明らかである。この
とき、VRA調整のためのエンドユーザに、同時になお完全に別々に、1次コンテン
ツ(純粋な音声)のオーディオおよび2次コンテンツの残りのオーディオの引渡し
を可能にするであろうデジタル習得、コード化アルゴリズム、または復号化アル
ゴリズムを組み入れる産業的に定義された方法はない。以下の実施例は、コンテ
ンツプロバイダー、2次プロバイダー、および最終聴取者が、録音とスピーカー
再生の間の任意の段階で利用されるオーディオコーデックの多数の人のために、
VRA調整の最大限の利点を得ることができることを確実にするために開発された
方法を説明する。VRAの過程を可能にする多数の記録保管形式がまた以下で詳細
に記述される。
えられる。これらの実施例をよりよく評価するため、テレビ、VCRプレーヤー、D
VDプレーヤー、CDプレーヤまたは他の任意のオーディオ再生装置であるか否かに
関係なく、最後の再生装置でPCPV/PCA/SCRA信号の明白な省略を示すためにデジ
タル・オーディオ引渡しの既存の状態を明白にすることが第1段階である。図式
的に、これは図1に示される。図はオーディオプログラムを作るべきである構成
要素プログラムソース110で始まる典型的なオーディオ生成の過程について表現
する。様々な要素は、通常DATレコーダー115で線形、非圧縮オーディオ形式を使
用して記録される。これは非圧縮、非混合デジタルマスターと呼ばれるであろう
。
ューア135あるいは他の多数のオーディオアプリケーションに引渡されるべきで
あるオーディオチャンネルを作成するために混合と編集の過程を実行する。例え
ば、そのオーディオコンテンツは左右のステレオチャンネル、L、R、C、LSおよ
びRSを含むいわゆる5.1チャンネル、または2つの付加的サラウンドスピーカー
を加える7.1チャンネルからなる。MPEG4などの最近の標準はさらに大きい数のオ
ーディオチャンネルの能力に備えるが、この時点で広範囲の実行において7.1以
上の他のアプリケーションはない。130と135の方式は混合された非圧縮デジタル
マスター125と呼ばれるであろう。
あり、オーディオはおそらく圧縮のある量をとおして、次にビットストリームシ
ンタキシングへ行くであろう。この点で、圧縮され、混合されたデジタルマスタ
ー145を構成することが可能になるであろう。生成の過程は圧縮され、混合され
たデジタルマスター145のコピーを最も典型的に作り、図で示された他の2つのマ
スターテープバージョンに対してコピーのそのバージョンを分配するだろう。次
に、再生装置155がデコーダ150の設定によって、5.1、7.1チャネルなどのステレ
オを再生する。
ジタル習得テープ構成を使用するPCPV/PCA/SCRA信号の格納または作成のための
手段を提供しないことに注目することが重要である。したがって、以下のセクシ
ョンの実施例は究極のVRA目的に関するそれらの信号の生成を収容するデジタル
マスターを構成する様々な方法を提示する。
異なったバージョンを作成するために必要である可能なステップは図2Aと2Bで示
される。“VRA可能”はPCPV/PCAおよびSCRA信号をはっきりと含み、またはそれ
らの信号の1つまたは両方がデジタルマスターからコピーされた補助データおと
び他のオーディオデータを使用してデコーダレベルで構成されるような十分な‘
VRA補助データ’を含むデジタルマスターテープまたはファイルを言う。図2Aを
参照すると、それらが音楽、フィルム、テレビ番組、映画、または他のものであ
るか否かに関係なく、全てのオーディオプログラムが、マイクロホンを利用して
すべての型のオーディオ情報をリアルタイムで電気信号(図2Aでは‘ライブ’と
して指示される)へ変換し、それはスピーカーに送られまたはアナログかDATレコ
ーダー205のどちらかのトラックとして格納されることがわかる。オーディオ情
報はまた、プログラム210の芸術家および/またはプロデューサーの計画にしたが
って、1次コンテンツのオーディオ信号(PCPV/PCA)212および2次コンテンツの残
りのオーディオ信号(SCRA)214を引出すために使用することができる。
な過程を含み、1つ、2つまたはそれ以上のオーディオトラック205を利用するか
もしれない。図2Aにおいて、これらの2つの信号は、オーディオプログラム215の
ために2チャンネルの、非混合、非圧縮、VRA可能なデジタルマスターを作成する
ためにDATレコーダーへ入力ノード217ですべてのオーディオソース(PCPV/PCAとS
CRA信号を引出すために使用されるそれらを含んでいる)から別々に利用可能なト
ラックのすべてを再結合される。入力ノード217は文字通り信号を一緒に合計し
ないが、デジタルマスターテープ215にそれらを単に結合することに注意を要す
る。デジタルマスター215は、望ましくは、オリジナルのオーディオ信号の品質
を保持するために、線形PCM形式または最適のPCM形式のような、しかしこれらの
特定の形式に限定されないが、非圧縮または比較的損失のない圧縮されたデジタ
ルオーディオ形式を使用して構成される。(線形PCM形式はデジタルオーディオフ
ァイルに使用される周知の非圧縮オーディオ形式である) 。
細、各チャンネルのためのラベル、2つの信号のための空間的な再生指示、およ
び再生装置225および245でオーディオコーデック230および/またはデコーダによ
って必要とされる他の不可欠の情報を定義する、VRA可能かつ特別な補助データ
としてマスターテープを確認する特別な‘ヘッダー’情報の作成である。ヘッダ
ー情報、およびVRA補助データはこの実施例の寄与している特徴である。句‘オ
ーディオコーデック’は、デジタル情報の圧縮が起り、伝送のある方法がデコー
ダ(通常MPEGベースのISO標準)へビットストリーム過程を通して含まれ、最終的
な復号が圧縮された信号をオーディオスピーカーのためアナログ形式に戻すコー
ド化の過程を言う。ある実施例のために、VRAヘッダーと補助データ情報は、デ
ジタルマスターで作成しかつ格納するのと対照的に、圧縮コード化レベルで導入
された別々のビットストリームとして提供することができる。補助データおよび
ヘッダー情報の実施例は以下のセクションで非常に詳細に議論される。
非圧縮デジタル形式のPCPV/PCA/SCRA信号をオーディオプログラムのために復号
することができるVRA可能なプレーヤー225で再生する前に、マスターテープのデ
ジタル情報は非圧縮オーディオファイル形式220として分配のためにコピーされ
ることができる。例えば、従来のCDオーディオは再生のために非圧縮、線形PCM
データファイルを使用する。これは、CDプレーヤがオーディオ情報がVRA可能か
否かを認識することを備えられ、かつPCPV/PCA/SCRA信号を収容することを備え
られることを必要とするかもしれない。
プットレートおよび格納要件を使用される任意の数のオーディオコーデック230
を使用して圧縮することができる。オーディオコーデックのエンコーダ機能の出
力は、オーディオファイル235の圧縮されたバージョンが図2Aに示されるように2
40で記録保管され、多重コピーで再生成される中間的ステップで使用されるかも
しれないことに注意することが重要である。再び明快のため、VRA可能でないデ
ジタルマスターからこのような圧縮され記録保管されたファイルの現在の実施が
、スーパーCDやDVDオーディオのような周知のメディア形式に対応することを我
々は注意する。
、CDメディアまたはDVDオーディオメディアにあるかもしれない。しかしながら
、VRA可能なデジタルマスターの記録保管されたバージョンにおけるPCPV/PCAお
よび/またはSCRAチャンネルの包含は、音声および残りのオーディオ信号の適切
な再生を確実にするために、この発明で記述される特徴を必要とする。明確に、
圧縮され、VRA可能な、記録保管されたファイル240は、PCPV/PCA/SCRAオーディ
オ信号を復号し、VRA調整を容易にする特定のVRA可能な再生装置245にアクセス
しやすく作られることができる。
クによって使用される特定の圧縮アルゴリズムに従ってVRA可能なデジタルオー
ディオ情報を復号するために構成した再生装置に、直接種々の放送手段に沿って
伝送される情報のためにある。例えば伝送は、両立性VRAアウエアデコーダがオ
ーディオ情報を受信し、VRA調整を容易にするPCモデムへのISDN伝送であるかも
しれない。
る。この構成の違いはデジタルマスター255がまだPCPV/PCAまたはSCRA信号260を
含んでいないということである。代わりに、デジタルマスター255は、録音産業
においてこの時点では普通である同様な方法で、‘n’記録され、非変更のオー
ディオトラックから成ることができる。PCPV/PCAおよびSCRA信号260を引渡され
た芸術家−プロデューサーが、芸術的な長所とオーディオプログラムのコンテン
ツによって定義される混合過程を通して、普通(即ちVRA可能でない)のデジタル
マスター255のダウンストリームを作成する。
程を使用して実行されるだろう。この点において、デジタルマスター255およびP
CPV/PCA/SCRA信号260からの変更されないトラックは、VRA可能なオーディオコー
デック265によってコード化され、再生装置280は図2Aの実施例で議論されたのと
同じ方法でこれらの信号にアクセスを持つだろう。この実施例に関して、VRA可
能なデジタルマスターの非圧縮バージョンは決して存在していない。オーディオ
プログラムのプロデューサーがユニークなPCPV/PCA/SCRA信号を指定し、混合す
ることの追加のタスクを2次プロバイダーに渡したいと願うならば、このアプロ
ーチは好まれるかもしれない。
の何らかの組み合わせとして、SCRA信号のコンテンツを指定するのが望ましいか
もしれないという知識によって動機づけられる。これは図3で示される。このよ
うな場合、PCPV/PCA信号だけが非圧縮デジタルマスターの作成の前に作成され、
それは他のオーディオ情報に沿ってマスターに格納される。この実施例に関して
は、特別なVRA補助情報(データ)は、その情報がデジタルマスターに収納される
非PCPV/PCAオーディオチャンネルのある組み合わせからSCRAチャンネルをいかに
構成するかを指定するマスターにデジタル的に含まれるであろう。その情報はVR
A可能デコーダへ伝送のため任意のダウンストリームコード化過程に提供される
だろう。VRA可能デコーダは次に、補助データで指定されたダウンミックスパラ
メタを使用してリアルタイムにSCRAチャンネルの作成のため応答可能である。(S
CRAチャンネル生成を指定するさまざまな方法があり、これらは後でVRAエネイブ
リングオーディオコーデックの特徴について説明するセクションで議論されるで
あろう) 。図3の議論の結果として、非圧縮デジタルマスターオーディオコンテ
ンツ320は、‘1チャンネルのVRA可能な’デジタルマスターを作成する。
ディオ工学で使用されることが注意されるべきである。代わりに、ここに記述さ
れる革新は、容易な2信号VRA調整のために、さらにPCPV/PCV信号と結合されるた
めに、2次コンテンツの残りのオーディオの構成を可能にするVRA補助データの
作成と伝送に関連する。
なる展望を示す。オーディオデータが同じテープ上のビデオデータと混合される
かもしれなく、したがって、VRA可能なデジタルオーディオマスターテープが必
ずオーディオだけのテープ形式としてに解される必要がないことに注意すべきで
ある。したがって、全体のデジタル習得議論はフィルム、予め記録されたテレビ
番組、または音楽の録音のためのデジタルマスターに等しくよく適用する。
プ315と呼ばれるだろう。この実施例に示されるように、PCPV/PCA信号は任意の
数のオーディオチャンネル(図においてアナログ信号として考慮される)からの
オーディオコンテンツを混合することにより作成され、SCRA信号は、信号が左、
右、左周囲、右周囲、中央、および低周波数効果チャンネルのために作られたオ
ーディオコンテンツと並んで、別々なチャンネルとしてディジタル化される前に
、‘残りのオーディオ’であるように考慮された幾つかの他のオーディオコンテ
ンツを混合することにより作成される。情報の8つのトラックが、デジタルテー
プに非圧縮オーディオ形式(例えば、線形PCMに制限されない)を使用して格納さ
れる。
プ320と呼ばれる。この構成では、VRA可能なデジタルマスターの生成は、デジタ
ル録音が習得される前にPCPV/PCAおよびSCRA信号が既に混合されることを必要と
するだけである。示されるように、現在、‘n’チャンネルがあり、ここに‘n’
はデジタルマスター上に存在するかもしれない任意に多数のオーディオチャンネ
ルを言う。この構成は、オーディオプログラムのためにステレオまたはサラウン
ドチャンネル音に使用されたダウンミックス過程で後に使用されなければならな
いある型のデジタルマスターに必要であるかもしれない。しかしながら、1次コ
ンテンツの純粋な音声と残りのオーディオはデジタルマスター上にそのようにあ
らかじめ混合されかつ収納される。
の実施例があることが明確である。VRA可能なデジタルマスターのすべてのバー
ジョンは、VRA可能としてマスターを確認する特別なヘッダーファイルを備える
であろう。次のセクションでヘッダー形式について議論する。プレミックスされ
た、非圧縮された、nチャンネルのVRA可能なデジタルマスターが図4Aに示される
。この場合、デジタルマスターは生成の間に記録されるオーディオの‘n’チャ
ンネルから成る。それらのnチャンネルの何らかの組み合わせによって、PCPV/PC
A信号とSCRA信号(図4Bと4C)の構造を指定することが可能であるだろう。
の指示を提供するマスター上に作成されかつ収納されることができる。したがっ
て、デジタルマスターは‘0チャンネル、非圧縮、プレミックスされたVRA可能な
デジタルマスター’であると考えることができる。用語の0チャンネルは、明ら
かにPCPV/PCAまたはSCRA信号を含むマスター上にどんなトラックもないという事
実を示す。ここに不可欠の点は、テープが、それらの信号が明らかに収納されて
いなくてさえ、再生装置の制御をしている究極の最終聴取者によりVRA調整を可
能にすることができる十分な情報を有することである。
は図4Dと4Eに示される。デジタルマスターのこれらのバージョンは、それぞれ‘
1チャンネル、ポストミックス、非圧縮のVRA可能なデジタルマスター’ (図4E)
、および‘2チャンネル、ポストミックス、非圧縮のVRA可能なデジタルマスター
’ (図4D)であるように構成されることができる。ポストミックスバージョンに
おいて、我々は、5.1ミックスチャンネル、または7.1ミックスチャンネル、ある
いはPCPV/PCA信号だけ(1チャンネルのバージョン)かPCPV/PCA信号とSCRA信号の
両方のどちらかに加えて、大きい数の空間的なチャンネルの典型的なステレオ信
号を見出す。この状況において、VRA補助データチャンネルが、オーディオプロ
グラムが進歩しながら2つの信号のどちらかの空間的な位置決めを提供するよう
に使用されるべきである特別な再生特徴について、デコーダに指示するためにあ
るかもしれない。
施例である。この場合、補助データはSCRA信号、PCPV/PCAおよびSCRA信号の再生
、および後で記述される他の機能をいかに構成するかを定義するだろう。
が図2A、2B、3、および4A-Eで明らかに示されたものよりも他の実施例を確認す
ることは明確である。例えば、この発明で直接定義されるように上で記述された
実施例のすべての圧縮されたバージョンを考えることは簡単である。重要な区別
はまた、すべてのVRA可能デジタルマスターバージョンがVRA可能なマスターを確
認するある種のヘッダーを含み、それがPCPV/PCA/SCRA信号のためにある特性、
構成の技術、または再生の技術を定義する補助データ信号を含むことである。し
たがって図に示されたデジタルマスター方式は、この発明で意図されVRA可能な
デジタルマスター構成を可能にするのみと解釈されるべきでない。
た領域と同様に、その全体的長所にしたがってデジタルオーディオ処理技術を改
良することを明らかにした。
情的な意味の鑑賞における僅かなまたは損失のない、オーディオプログラムの音
声コンテンツの改良された明瞭さおよび/または楽しみを可能にする信号に供給
するために構成された過程であって、前記過程はまた、オーディオプログラムの
芸術的な長所および/または楽しみのための改良された鑑賞を可能にするが、プ
ログラムの筋または叙情的な意味の明瞭さまたは鑑賞における評価できる改良を
提供しない残りのオーディオ信号の2次コンテンツの構造を含む過程。
前記形式が最適の音声品質、およびオーディオ品質を犠牲にする非常に圧縮され
たオーディオ形式(>8: 1)に基づいてVRA可能習得および/または伝送の際に低下
させる最適の残りのオーディオ品質を保持するために適用される、いわゆる0チ
ャンネル、1チャンネル、および2チャンネルの‘VRA可能なデジタル習得テープ
の創作。
納を発生させるために使用される任意の数の損失のないおよび比較的損失の少な
いオーディオコーデックにおける1次コンテンツの純粋な音声と2次コンテンツ
の残りのオーディオチャンネル、VRAヘッダー、および/またはVRA補助データを
収容すること。
クラスにおけるコーデックに関連づけられる損失と比べて、損失のないおよび比
較的損失の少ないことが知られているあるオーディオコーデック操作(コード化/
圧縮と復号を含む)で、PCPV/PCAおよびSCRA信号の包含を可能にする特徴に焦点
をあてるであろう。
テンツに関して芸術的な目標と理想的に両立すべきである。したがって、この発
明の1つの特徴は、両方の目標(VRA能力を供給し、芸術家がオーディオプログラ
ム上で芸術的なライセンスを保持するのを許容する)が両立される過程について
説明しようとする。芸術的な長所の保持は、プログラムが年代順に発展するとき
、あるオーディオ信号の様々な混合により続く1次および2次コンテンツのため
の計画の幾らかの程度をほぼ確実に必要とするだろう。カスタム設計された1次
コンテンツの純粋な音声チャンネルと2次コンテンツの残りのオーディオチャン
ネルの特定の混合と録音は、どんな型のオーディオプログラミングも前例がない
。
/PCA/SCRA信号を含み、かつVRA可能なデジタルマスターのそのようなPCPV/PCAと
SCRAチャンネルに関する不可欠な情報(位置、サンプリング率、形式、再生パラ
メタなど)を記述する特別な‘ヘッダーファイル’および/または‘補助データ’
コンテンツの対応する習得である必要を含む状況に関係する。
る音の空間的な位置付けの新しい方向にほとんど関係された。デジタルオーディ
オのこの多重チャンネルのサラウンド音の使用は、過去の数年のより通常のステ
レオ伝送と比較して、増加する数のオーディオチャンネルの格納および伝送を導
いた。VRA可能なオーディオファイルと伝送は、PCPV/PCAとSCRA情報に必要であ
る余分なチャンネルのために格納と伝送要件をさらに高く押し上げるだろう。革
新的なVRA可能オーディオコーデックは、余分なスループットの繰り返しを最少
にするために定義されるだろう。さらに、デジタルマスターのVRA形式の存在は
、デジタル的に記録されたマスターから引渡される入来ビットストリームを圧縮
/伝送/復号するために使用される任意のオーディオコーデックにより、VRA可能
オーディオファイルとして‘確認’されることを必要とするであろう。デジタル
マスターがVRA可能としてフラグを揚げられなければならない2つの不可欠の理由
がある。まず最初に、PCPV/PCAチャンネルは特定のスピーカー位置で再生される
必要があり、したがってそのチャンネルは、正確な時間的/空間的な再生手順を
記述する補助データで時間整合されなくてはならない。第2に、図3に示される
ように、SCRAチャンネルはデコーダによって構成されることが必要であるかもし
れない。また、その信号を作成するための指示はVRA補助データにプログラムさ
れるだろう。我々はまた、それが復号過程に入るときにVRA補助データを収容す
るために発明的な方法があることに注目する。例えば、それはVRA可能オーディ
オのためのnチャンネルビットストリームの埋め込まれた情報として導入される
か、または全く別なチャンネルとして送られるかもしれない。
イルの前に定義されたオーディオ情報を使用して、1次コンテンツの純粋な音声
信号と2次コンテンツ残りのオーディオ信号が最終聴取者に到達することを可能
にする。前のセクションにおけるデジタル習得議論は、非圧縮か圧縮されたオー
ディオ形式のPCPV/PCAとSCRAチャンネルの格納とデジタル‘タグ付け’について
説明した。マスターに記憶されたオーディオの非圧縮形式と比較的損失の少ない
圧縮(圧縮比<8:1)は、オーディオ生成過程の習得終了で問題なく、オリジナルオ
ーディオ信号の忠実性を維持するために必要とされた。デジタルオーディオ圧縮
はオーディオデータのより効率的な格納および伝送を可能にする。オーディオ圧
縮技術の多くの形式は、エンコーダおよびデコーダの複雑さ、圧縮されたオーデ
ィオ品質、およびデータ圧縮の異なる量の範囲を提供する。今、発明のこの態様
は3つの部分:損失のない圧縮および比較的損失の少ない圧縮アルゴリズムに基
づいたコード化方法、VRA補助データにより供給される補助情報の使用、および
非圧縮のVRA可能なディジタルマスターに存在するヘッダーファイル(即ち、い
わゆる‘ディジタルタグ付け’)のコード化に関係する。ISO MPEG IIおよびMPE
G IV標準は比較的損失の少ない圧縮アルゴリズム(即ち、<8:1)に頼り、そのた
めMPEGオーディオ形式はVRAエンコーダおよびVRAデコーダを含むある特徴を示す
ように使用されるであろう。このセクションに記述された実施例が他のオーディ
オ形式にも適用可能であることが明白にされる。通常の技術が、この文書の前に
詳細に記述された、いわゆるPCPV/PCA、SCRAおよびVRA信号の存在および特別な
データの取扱いにより定義されたように、VRAコード化またはVRA復号化の使用を
教示しないことがまた注目される。
的場合として記述されるだろう。用語、損失のない圧縮は、受信された圧縮され
た信号を復号するとき、非圧縮デジタルオーディオマスター上にあったオリジナ
ルオーディオ信号を全くデータの損失なしで再作成することが可能であるという
事実を示す。従来の技術は、入来PCMデータストリームにおける、PCPV/PCAまた
はSCRA信号のどちらかの存在を認識するように設計されるオーディオコーデック
の存在を含んでおらず、音声だけの信号(すなわち、PCPV/PCA信号)の低帯域幅の
利点を取るオーディオコーデックも存在していない。
し、それは:VRA可能な非圧縮デジタルオーディオファイルの自動認識によるコ
ーデックの使用; スピーチ信号のために特に設計されたオーディオ圧縮アルゴリ
ズムを使用しているPCPV/PCAチャンネルの他と全く別な処理、より一般的なオー
ディオ圧縮アルゴリズムおよびデコーダでの再混合を使用して圧縮される他のオ
ーディオトラックと同期された時間、損失のない圧縮アルゴリズムを使用するVR
A可能デジタルオーディオ情報の圧縮、AC3アルゴリズム(圧縮比8:1以下を意味す
るようにここで指定される) より多いディジタルデータを保持する損失のある圧
縮アルゴリズムを使用するVRA可能なデジタルオーディオの圧縮、VRA可能なデジ
タル1チャンネルのマスターの場合のSCRAチャンネルのための製作指示、特定の
スピーカへPCPV/PCAおよびSCRAチャンネル情報を割当るため、VRAデコーダによ
って使用される再生位置の仕様、PCPV/PCA信号の任意の必要な空間的な位置決め
の方法、および既に存在している種々のオーディオコーデックにPCPV/PCAとSCRA
チャンネルを組み込むVRA可能なエンコーダの特定の特徴を含む。
概念を示す基本的なブロックダイアグラムを示す。(損失のない圧縮アルゴリズ
ムに関する1つの例がメリディアンロスレスパッキングMeridian Lossless Packi
ng(MLP)アルゴリズムである) 。この例に関しては、非圧縮VRA可能なデジタルマ
スター510がVRAオーディオコーデック520に入力されるように使用される。ここ
での区別は、コーデック520のコード化および復号化の終了で使用されるVRA可能
エンコーダ530とVRA可能デコーダ530がそれぞれなくてはならないということで
ある。VRA可能デコーダ535の出力、およびしたがって、オーディオコーデックの
出力は、最終聴取者により独自に調整することができる音声と残りのオーディオ
信号になるだろう。次に、オーディオコーデック520のVRA可能な構成要素につい
て議論する。
ル、n圧縮された、プレミックスVRA可能なデジタルマスター610の前の記述に依
存する。しかしながら、たとえVRA可能なデジタルマスターのどんな形式が入力
のときにオーディオコーデックに導入されても、記述の本質は同じままである。
図6のダイヤグラムは、プレミックスされたPCPV/PCA信号が他のオーディオ情報
の‘nチャンネル’と一緒にエンコーダの損失のない圧縮アルゴリズム630に送ら
れることを示すように意図される。また、VRAの補助データ620にある予め記録さ
れた情報がエンコーダに送られるかもしれない。また、ソフトウェアインタフェ
ースが、生成過程の混合/コード化/圧縮段階でVRA補助データ640のすべてまたは
付加的部分を作成するために使用されるかもしれない。この特徴はプロデューサ
ーがタスクを下請けするかもしれない2次プロバイダーにVRA創作タスクを回す
ことを許容するであろう。
圧縮形式で格納され、またはエンコーダの過程の一部として作成されたISOビッ
トストリームとしてデコーダに伝送される。それらがこの段階でプレミックスさ
れるならば、PCPV/PCA信号とSCRA信号は、現在デジタルオーディオの技術に熟練
した者のだれによっても実行される方法でMPEGベースのビットストリーム標準に
組立てられるだろう。図7は図6で示されたのと同様の図である(特徴の記述は繰
り返されない)。例外はデジタルマスターが2チャンネルのVRA可能形式であると
いうことである。コーデックへの入力におけるSCRA信号の存在を除いて、記述的
特徴は図6のためのそれらの議論と同じである。
つの異なった実施例の特別な構成:一般的なオーディオ信号の損失のないか比較
的損失の少ない圧縮のためのアルゴリズム、スピーチだけ圧縮のアルゴリズム、
VRAヘッダーと補助データ情報の正確な処理、およびVRA可能なデジタルマスター
の何らかの形式の入力である。これらの様々な特徴の様々な組み合わせがここに
言及することができないくらい多数であるが、この発明で概説される意図で総合
的なVRA可能オーディオ生成の過程とすべて一致していることが強調される。
デジタルマスター810がVRA可能エンコーダへの入力としてに示される。左、右、
中央、左の周囲、右の周囲、SCRA、およびPCPV/PCA信号がデジタルマスターのこ
の形式のために既に混合され、‘一般的な’オーディオコーデックの圧縮アルゴ
リズム820によって圧縮される。アルゴリズム820は知覚ベース、または冗長ベー
ス、あるいは帯域幅に配慮することなく圧縮に導く他の技術であってもよい。
順を用いてISO ビットストリームに配列される。例えば、MPEG-2 AAC(高度なオ
ーディオコーデック、ISO/IEC 13818-7)は、標準が支持する15の埋め込まれたデ
ータストリームの内の1つを通してVRA補助データを分配するように使用される。
補助データを整列する他の方法があり、それらの方法は技術に熟練した者に周知
のことである。コーデック800の出力は、2チャンネルマスターの圧縮されたバー
ジョンを格納するのに使用することができ、マスターは次に、分配のための再生
を作成するのに使用されるだろう。代わりに、ビットストリームは、PCのメディ
アプレーヤーのように再生装置のデコーダに直接伝送されることができる。
る。まず最初に、PCPV/PCA信号は、他のオーディオ信号が一般的な圧縮アルゴリ
ズム820を使用することで圧縮されるが、スピーチだけコーデック920で圧縮され
る。スピーチコード化は、G.722コーデックや符号励起線形予測Code Excited Li
near Predictive(CELP)コーデックなどのいくつかの知られているスピーチコー
デックの任意の1つを使用して行うことができる。スピーチだけのコーデック920
を使用するPCPV/PCA信号の圧縮と一般的なコーデックを使用する他のオーディオ
信号の圧縮の間のこの区別は、VRA可能ビットストリームと格納要件のために必
要な帯域幅を減少させるのを助けるだろう。
助データ)が含まれるこの方法であり、その結果VRA可能オーディオ伝送のための
帯域幅要件を減少する2段圧縮アプローチと同様に、VRA可能なオーディオ形式を
作ることが注目されるべきである。この図の第2の重要な区別は付加的な‘nオ
ーディオチャンネル’の存在である。この実施例は、再生でPCPV/PCAまたはSCRA
信号を高める付加的オーディオチャンネルについて必要があるかもしれない状況
を収容する。それらの付加的な信号は一般的な圧縮アルゴリズムによって圧縮さ
れ、どんな特別な再生要件も補助データストリームによって定義されるだろう。
縮に導く2つのVRA可能エンコーダ構成を示す。前と同様、PCPV/PCA信号(図10参
照)のためのスピーチだけのコーデックを使用することが望ましく、エンコーダ
は、図11で示されるすべての信号について一般的なオーディオ圧縮アルゴリズム
を使用するために設定されることができる。
の表現の本質は、PCPV/PCA信号にある音声の情報がスピーチだけの圧縮アルゴリ
ズムを使用して圧縮され、SCRA信号がより一般的で、広い帯域幅のオーディオ圧
縮アルゴリズムを使用して圧縮される図9と10の実施例と似ている。図12を参照
すると、要素1210および1220は、圧縮前のそれぞれPCPV/PCAとSCRA信号のデジタ
ル表現であり、従来のLPCM形式と同様である。デジタル情報が指示されたような
WAVファイル、または非圧縮デジタルオーディオファイル他の幾つかの形式とし
て利用可能であるかもしれないことに注意すべきである。2つのオーディオスト
リームが、前のオーディオ圧縮構造上の重要な区別であるこの段階に並列である
ように考慮される。
の要素の両方を持っている直列の、単一チャンネルのオーディオストリームを与
えることであるだろう。直列のビットストリームが、1次音声または1次非音声で
あり、異なったサンプリング速度をもたらし、直列のビットストリームのコンテ
ンツとして恐らく異なった圧縮アルゴリズムさえ1次音声と非音声の間で異なる
ときに、認識することが可能である。
12において、圧縮ユニット1250と1260の並列な配列によって示されるように、2
つの並列な流れが全ての時間に、2つの異なった圧縮アルゴリズムに供給される
。スピーチだけの圧縮ユニット1250は技術に熟練した者に知られているどんな圧
縮アルゴリズムも含んでいる。PCPV/PCA情報はその圧縮ユニット1250に入力され
、1220にあるSCRA信号は、圧縮ユニット1250の音声だけの圧縮と共にまさに並列
(PCPVとSCRAの間で時間的同期された)にある方法で一般的なオーディオ圧縮ユニ
ット1260に入力される。
ンテンツのように、時間的同期および関連するビデオコンテンツにビデオフレー
ム同期されることが考慮される。圧縮ユニット1250と1260の出力は、1285により
特別な方法で多重化され、その結果飛び越し走査されたVRAオーディオは、中間
ファイルとして記憶され、または何らかのデジタル媒体1295により伝送すること
ができる。逆多重化過程1290は、それぞれ逆圧縮(decompression)ユニット1270
と1280によりそれぞれ逆圧縮のため別々のPCPV/PCA情報とSCRA情報を開く。最終
的に、逆圧縮されたPCPVとSCRA情報が記録保管され、この段階で望ましい、また
はよりありそうなら、以下で議論する図13の記述と同様に、別々のボリウム制御
のため再生装置に直接送られるであろう。
の音声だけまたは一般的なオーディオ圧縮と逆圧縮アルゴリズムと両立可能であ
る。我々は、PCPVとSCRA信号の並列な入力構造を収容するマルチプレクサ1285の
ユニークな操作により、圧縮ユニット1250と1260が音声だけおよび一般的なオー
ディオ圧縮のそれぞれのクラスにおいて、アルゴリズムを使用することができる
ことを強調する。さらに、マルチプレクサ1285は、これらの部分の安全な伝送を
提供するために、PCPV/PCA信号および/またはSCRA信号のどちらかのために暗号
ユニットまたはアルゴリズムを含むことができる。信号の暗号化は技術に熟練し
た者に知られているどんな技術によっても実行することができる。
2次コンテンツの残りのオーディオ(SCRA)信号に関するさまざまな情報から成る
だろう。以下にそのデータを作成することができるそれらの特徴、それらの機能
性、および方法について議論する。
うに、この情報はオンまたはオフを表示しているシングルビットとして表現する
ことができる。ビットが1であるならば、VRA可能なプログラムは、前に記述され
た(すなわち、PCPVとSCRAオーディオが存在している) VRAオーディオ形式を使用
して作成される。オーディオ技術者がVRA生成の技術を使用すると、このビット
は生成レベルにおけるソフトウェアかハードウェアスイッチによって設定される
だろう。別の方法で、オーディオプログラムは通常の混合習慣に基づくように考
慮される。
くの表示が存在しているフラグによって先行されることができる。それがそのよ
うに表示されるならば、さらなる情報がPCPVとSCRAプログラムの各々に利用可能
である空間的なチャンネルの数として提供される。ここにこの数に設定される特
別な制限はなく、再生ハードウェア(例えば5つのスピーカー=5つの利用可能な
チャンネル) に依存しているようである。これらの数は、いかに多くのオーディ
オチャンネル(例えば、3PCPVチャンネルと5.1SCRAチャンネル)が復号のために存
在するかをデコーダに伝える。オーディオ生成技術者は、各場面に与えられる芸
術的な解釈に基づいて、2つのオーディオプログラム(PCPVとSCRA)の各々を作成
するためにデコーダに要求されるチャンネルの数を指定するだろう。帯域幅を保
存するために、利用可能なオーディオチャネルの数がプログラム内またはプログ
ラム間で変化するなら、チャンネルのPCPVとSCRA数を含むデジタル語が時間の関
数として変化するかもしれない。
る振幅と空間的な情報との両方がこのデータブロックの一部としてコード化され
ることができる。復号されたオーディオプログラムを有する再生と結合されたこ
の情報は、オリジナルの生成混合を再現するであろう。(この発明のための究極
の目的は最終聴取者がVRAを調整するのを許容することであるが、ユーザによる
調整が適用されるまえに提供されるなら名目上の再生指示が必要とされるであろ
う。他の方法で述べれば、エンドユーザによる任意の調整が出発点として生成混
合レベルに作動するであろう)。続いて、例として、前のデータ(PCPVとSCRAチ
ャンネルの数)が、2つのプログラムの各々の1つ(1つのPCPVチャンネルと1つ
のSCRAチャンネル)が利用可能であるデコーダに指示されるなら、生成ミックス
データは、両方の信号がセンタースピーカーの上でPCPVレベル1.0およびSCRAレ
ベル1.2(例えば)で再生されるべきであることを示すだろう。
行される実際のボリュームレベルとバランス調整の使用を通して実現される。代
わりに、この発明の結果として、最終の聴取者は今やオリジナルの生成混合を乗
り越えてかつオーディオのままで残る音声の彼自身の混合を作成する能力を受け
る。この生成ミックスデータ(すべてのPCPVとSCRAチャンネルのための振幅情報
だけではなく、同様にすべてのチャンネルのためのの空間的な情報も含むだろう
)を継ぎ目なく統合するために、空間位置制御と振幅制御のノブ位置を検出し、
時間の関数としてVRA補助データチャンネルに直接その情報を移すソフトウェア
アルゴリズムを設計することが可能である。
て柔らかくあるべきであるとして、SCRAオーディオを低下するかもしれない。こ
の動きおよびその後の新しいレベルはアルゴリズムによって検出され、VRA補助
データファイル形式に変形されるデータファイルに記録される。また、振幅生成
ミックスデータはユーザにPCPVとSCRA信号の両方のために別々に異なるプログラ
ム中で自動的に一様性を確立させるだろう。これは音声を残りのオーディオ(こ
の情報が利用可能でないならば、音声をあいまいにすることができる)と同様に
商業およびプログラム間の一定のSPLに残すことを許容するだろう。
作成し、その結果直線的に加算されるとき正確な生成混合が作成されるならば、
デコーダエンドに生成混合のレクリエーションのための増幅と空間的な位置情報
のすべてを伝える必要はないことに注意されるべきである。このデータがVRA補
助チャンネルに含まれていないなら、デコーダはオリジナルプログラムの正確な
生成混合再生をもたらす生成混合のために直線的組み合わせを自動的に不履行に
するであろう。
用可能な再生の特徴をさらに高めるために使用することができるさまざまなメタ
データがある。まず最初に、デコーダが再生中にPCPVとSCRA信号の両方のレベル
を調整するために、過渡現象の存在においてレベル情報が含まれるかもしれない
。これは単に、PCPVとSCRAの両方の実際のオーディオと時間同期しているデータ
ファイルにその出力を移す信号強度検出器を含むであろう。ある型のプログラム
過渡現象の間SCRAがPCPVをぼかさないように、互いに関して各信号ボリュームレ
ベルを自動的に制御するため、復号の過程がこのデータを利用することができる
。PCPVとSCRAチャンネルの両方の動的な範囲情報がまた、同様の過程でコード化
されることができる。これはユーザが再生上、2つの信号(SCRAとPCPV)の各々の
動的な範囲を別々に制御することを許容し、その結果、聞くに十分大きなささや
き(拡大)、または妨害しないほど十分に柔らかい爆音(圧縮) を許容するであろ
う。これに対するキーは両方の信号が独自に制御されることができることである
。プログラムプロバイダーが、生成中補助データビットストリームの一部として
この情報を入力しながら応答可能であるか、またはソフトウェア駆動アルゴリズ
ムが時間につれて信号強度を決定することができ、かつそのようなデータを自動
的に発生させることができる。
CODECにおけるメタデータの新しい部分として含まれるかもしれない。通常商業
上のCODECのものは、2つの型の情報:オーディオとメタデータ(オーディオに関
する情報)を伝送する。ここに議論する実施例では、VRA制御能力でそのオーディ
オを再生させるのに必要であるオーディオの形式とメタデータの形式は詳細に記
述される。
CODECのものが存在しており、したがって、特定のCODECのメタデータ部分に補助
データを含むことができる無数の特定の方法がある。しかしながら、ほとんどの
メタデータ形式が付加的なデータのために位置をかたわらに設定させるので、VR
A補助データが格納されるところでそれは典型的である。したがって、これは、
デコーダが“VRAに気付く”ことが必要であり、オリジナルのCODECのメタデータ
の流れの予定された空の位置でVRA補助データを見出さねばなたないことを意味
する。したがって、VRAヘッダーデータの別の不可欠な特徴は、VRA補助データが
CODECのためにメタデータに置かれた方法の識別である。
、VRA補助データチャンネルに含まれる情報が2つの唯一望ましい別々の信号:PC
PVとSCRAの作成に関して教示することであることを強制することが重要である。
従来の技術は、Dolby Pro-Logic5.1などの従来技術オーディオ形式に従う全体の
オーディオプログラムのためのメタデータ(例えば、動的な範囲情報)を作成する
ことができるだけである。しかしながら、VRA可能オーディオ生成のために、従
来のメタデータ構造のある一定の態様を利用することは可能であるだろう。例え
ば、PCPVチャンネルおよびSCRAがチャネルの動的な範囲情報が伝送されることに
なっているならば、従来の技術のオーディオ形式に関連づけられる動的な範囲設
定のメタデータファイルの中にSCRAの動的な範囲が同じ位置に位置することを示
すフラグを含んでいるのは役に立つだろう。そのとき、PCPVの動的な範囲情報だ
けが、オリジナルのメタデータチャンネルの空のビット位置に固定される必要が
ある。
ーディオ技術者と会社によって広く行われている。より前に紹介されたVRA実施
例に関して、AC3形式より少ない損失の圧縮を提供する圧縮アルゴリズムを利用
することが必要であるかもしれないことは、既にそれについて議論した。より前
に紹介された実施例はDolby HI Associated Serviceよりも明瞭に異なっている
ことがまた議論された。明確化は以下に提供される。
と関連した一般的なCODECの使用 ここに開示される第1の実施例はどんな特定のCODECの圧縮技術からも独立し
ている。例として、プロデューサーがサラウンドオーディオの2つのチャンネル
、前部オーディオの3個のチャンネル、およびより小さい帯域幅のサブウーファ
ーチャンネルを含む多重チャンネルサラウンドプログラムを発生させることがで
きると考える。これは5.1サラウンド音として知られているオーディオ方式であ
る。このプログラムは、Dolby Digital、DTS、MPEG、またはいかなる他のコード
化/復号化案をも含むかもしれない任意のCODECでコード化することができる。オ
ーディオ形式自体はコード化案から独立している。同様に、モノチャネルプログ
ラムはそのような任意のCODECによりコード化しかつ復号することができる。
のオーディオ形式が単独で空間的な情報をエンドユーザに提供することに制限さ
れた。ここに提案されるオーディオ形式は、空間的な情報に加えてオーディオ形
式でコンテンツ情報を含むことによって多重チャンネルの残りのオーディオに多
重チャンネル音声の、比率、周波数コンテンツ、動的な範囲、標準化などを調整
する能力をユーザに提供する。
(Guide for Television Standard)で記述される既存の技術に2つの明確な違いが
ある。その標準の固有の部分として、単一のチャンネル音声が多重チャンネルの
残りのオーディオと関連して伝送されることが許可される。追加の実施例として
、2つのチャンネル音声および2つのチャンネルの残りのオーディオがまた許可さ
れる。実際にこれは、プロデューサーにとって非常に制限されていて、すべての
関連音声を単一のチャンネルへ位置付けることをオリジナルプログラムの再現に
必然的に要求する。加えて、この実施において、音声は単一のチャンネルに再生
することができるだけである。ほとんどの多重チャンネルプログラムは、多重チ
ャンネルプログラムにある2次コンテンツの残りのオーディオおよび1次コンテン
ツの純粋な音声の両方を必要とする(臨界的な音声と残りのオーディオ部分が単
一の空間的な位置に制限されないので)。したがって、既存の技術の見地から、
ここに開示される実施例が2つの別々な利点を持っていることが明白である。
とを今までどおり許容している間に、プロデューサーがすべての芸術的な許可の
必要性を習得することを許容している多重チャンネルPCPV および多重チャンネ
ルSCRAを可能にする。
るように設計され、その結果、どんなCODECと共にも使用することができる。テ
レビジョン標準のガイドにおける聴覚損傷の関連するサービスが、Dolby Digita
l仕様で広げられるように働くことができるだけである。
WITH Dolby Digitalを使用されることができる。指定されたVRAオーディオ形式
はユーザの制御で多重チャンネルPCPVと多重チャンネルSCRAの再生のための必要
な補助データを含んでいる。この補助データは任意のオーディオのCODEC(Dolby
Digitalを含んでいるがそれに限定されない)のメタデータ部分に含まれることが
でき、そして、AC-3圧縮のための案がオーディオプログラムコンテンツに依存し
て大きい損失と高い圧縮比をもたらすかもしれないCODEC仕様自体に従って、PCP
VとSCRAのオーディオ情報が圧縮される、(またはされない)ことができる。
RAの支持の重要なものである。多重チャンネル設定において残りのオーディオに
対して音声を制御する能力をエンドユーザに提供することは重要である。AC-3が
この目標を達成するための単一のチャンネルメカニズムを含むのに対し、他のCO
DECは含まないまたはそうしないかもしれない。この発明はプロデューサーがと
もに働くCODECを選ぶとき“演奏分野をならす”ことを許容する。CODECは、VRA
を実行する能力よりむしろ圧縮または逆圧縮アルゴリズムの性能に基づいて選ぶ
ことができる。これはすべてCODECのものがVRAの機能性をエンドユーザに提供す
ることを許容する。
ゴリズムとも両立可能に作ることができる。したがって、この発明は前もって必
要なVRA補助データ、PCPV/PCA信号、および可能なSCRA信号に基づいて多数のVRA
可能圧縮形式の作成を含んでいる。これに基づいて、以下のデジタルオーディオ
形式が、より前に記述された実施例を使用してVRA可能なバージョンの発生を支
持し、前述されたVRAオーディオコーデックの一部として使用されるように圧縮
アルゴリズムとして役立つかもしれないことは明確である: DTS-VRA可能な圧縮 最適化されたPCM VRA可能な圧縮 メリディアンロスレスパッキング VRA可能な圧縮 スピーチだけのコーデック付属物を有するMP3圧縮 Dolby Digital、AC3−VRA可能な圧縮 MPEG-2のVRA可能な圧縮 MPEG-4のVRA可能な圧縮。
あり、それらは技術に熟練した者によりよく知られている。それらのアルゴリズ
ムによるVRA能力の収容は、VRAチャンネルと補助データの特別な処理によって従
わされる入来VRA情報の識別に基づかなければならないだろう。標準化されたビ
ットストリーミングレベルでこれを達成する多数の方法があるが、それらの方法
はデジタルオーディオの標準に熟達しただれにとっても簡単である。それはここ
に開示された発明の多くの態様の1つであるこれらの圧縮アルゴリズムのどれか
によるPCPV/PCA/SCRA信号と補助データの包含である。
す多くの機能的な記述がある。それらの記述は以下に提供される。
ターンを認識するために備えられるだろう。ヘッダーの特定の値は、デコーダが
いかに入来VRA可能ビットストリームを収容するかを決定するだろう。技術に熟
練した者により様々な方法でこの特徴は実行することができる。例えば、ビット
マスキング技術、論理演算、または入来ビットストリームのVRA能力を指示する
他の方法を使用することが可能である。
られたスピーカーに送られる再生信号を含むであろう多重チャンネルオーディオ
再生(例えば、5.1オーディオまたは7.1オーディオ)、またはVRA再生モードのた
めの従来の復号ソフトウェアの間で切換えるようにプログラムされるだろう。
を決定するためにVRA補助データの情報を利用するだろう。
することができるだろう。これは、より前に議論したVRAヘッダー認識機能の論
理出力を使用することによって達成されるだろう。
制御と究極の機能性 上で詳細に議論したように、VRA補助データはCODECを通して伝送されまたは記
録されるPCPVとSCRAチャンネルに関する様々な情報を含んでいる。補助データの
エンドユーザに引渡される情報に加えて、別々に引渡されるPCPVとSCRAチャンネ
ルを有する結果として、実行することができる(それは従来技術に存在していな
い)いくつかのデコーダの特別な機能がある。2つの型の機能(補助データ制御とP
CPV/SCRAデコーダ制御)は、デコーダ自体の操作を特に参照して以下の項で詳述
される。
在しているので、デコーダは、指定されたビットをポーリングすることによって
、VRA補助チャンネルの存在を認識するだろう。ビットがゼロ(オフ)であるなら
ば、デコーダは、VRA補助データがなくて別々のPCPVもSCRAチャンネルもないと
認識する。デコーダは、別のオーディオ方式(ステレオなどの)を復号することを
開始することができる。デコーダが、識別ビットが1(オン)であると認めるなら
ば、エンドユーザによって望まれるならば、デコーダは、本来データを記録また
は放送するために使用されるCODECによって提供された仕様に別々に従っているP
CPVとSCRAチャンネルを復号することができる。識別ビットは単に、入来データ
がVRA可能(即ちPCPVとSCRAの要素を含んでいる)、および任意のプログラミング
のために変化することができることをデコーダに気付かさせる。
片の情報よりもむしろユーザ入力を表す。ユーザは生成ミックスかユーザミック
スかを選ぶオプションを有する。ユーザミックスが選択されるならば、さまざま
なオーディオ制御機能が採用されることができる(次に議論される)。生成ミック
ス設定はほとんどのデコーダ設定で不履行設定として考慮されがちである。
まれたVRA補助チャンネルのそれらの指定された位置から、各PCPVおよびSCRAの
増幅データと空間的な位置データを集めるだろう。この増幅と空間的な位置デー
タは、オーディオプログラム(そして、コード化の特徴部分で議論されたように
作成される)を作成する際にオーディオ生成技術者の本来の意図を表す。空間的
な情報の各チャンネルとそれぞれの2つの信号(PCPVとSCRA)に関しては、増幅デ
ータは乗法演算を通して適用される。
つの位置へ動くことができる単一の音声トラックがあるならば)、その情報は位
置を変える命令として適切なチャンネルに適用される。SCRAに関するPCPVの増幅
と位置が時間により変化するので(プロデューサーの活動によって)、デコーダは
いつも補助チャンネルデータをポールし、絶えずPCPVおよびSCRA信号のおのおの
、および関連するチャンネルに適用される設定を更新するだろう。
クスをもたらすように、PCPVとSCRAチャンネルが密に生成されるならば、VRA補
助データチャンネルに増幅または空間的な位置情報を伝送する必要がないことに
注意されるべきである。このデータが存在していないと、デコーダ(生成ミック
スモードにあるとき)は、生成ミックスを達成するために(それぞれのチャンネル
の)線形の組み合わせを不履行にするだろう。この機能のエンドユーザ制御は、
ソフトメニュー(スクリーン上のような)を通したソフトウェア駆動、または生成
とユーザミックス選択の間の位置を変化する簡単なトグルスイッチによって駆動
されるハードウェアであるかもしれない。
ならば、生成ミックスは不能になり、エンドユーザは今PCPVとSCRA信号の完全な
制御を有する。最も初歩的な調整(そして、恐らく最も役に立つ)はお互いの如何
にかかわらずPCPVおよびSCRA信号、および彼らの関連するチャンネルのレベルお
よび空間的な位置決めを制御する能力である。
チャンネルの多数を含むかもしれない。全ての空間的なチャンネルが独立してい
て、(VRAオーディオ形式において) PCPVとSCRA信号が独立しているので、ユーザ
は、それぞれの独立している信号の振幅(乗法による)と空間的な位置(再配置に
よる)を調整する能力を、デコーダのハードウェアおよび/またはソフトウェアを
通して提供されるであろう。この機能性をエンドユーザに提供することは、どん
な追加帯域幅も必要としないで、すなわち、どんな補助データも必要としないで
成される。振幅と空間的な位置決めは、2つの信号(PCPVとSCRA)上で、デコーダ
自身ではなく、PLAYBACKハードウェアかソフトウェア(ボリュームノブと位置調
整)の一部としてそれらの独立なチャンネルで実行される。このハードウェアが
単一のユニットとしてエンコーダを有して含まれてもよく、またはデコーダから
分離した付加的なユニットとして作動するかもしれない。
体の空間的な位置と振幅を制御するために、それがあることを望むエンドユーザ
により作られる調整の最も一般的な設定を表す。しかしながら、最も一般的な調
整能力は、標準のユーザにとってはるかに複雑になり過ぎる傾向がある。この理
由のため、別の実施例が説明され、それは、どんなVRA可能な消費者エレクトロ
ニクス装置にも不可欠の部分とし利用可能にされる簡単な(ユーザフレンドリー
な) メカニズムを通して音声対残りのオーディオの比率をエンドユーザが調整す
ることを可能にする。
:PCPV 1320とSCRA 1330信号に復号するVRA形式デコーダ1310を示す。より前に
注意したように、それぞれのこれらの信号はエンドユーザ調整の後に全体のプロ
グラムを形成するために合計される多重チャンネルを含んでいる。前のパラグラ
フの実施例はそれらの多重チャンネルの各々のエンドユーザ調整について議論す
る。
ャンネルの総合的なレベルを制御し、その結果、必要なVRA比に作用する単一の
調整メカニズム1340を示す。これは音声と残りオーディオの所望のレベルを表す
2つの電圧を発生させるように、バランス形アナログポテンショメータを最初に
使用することによりデジタル領域で行われる。
は供給電圧に向かって上方に動き、信号グラウンドから遠のく。これはワイパー
電圧を増加させる。アナログデジタル変換器1350は電圧を読んで、それへデジタ
ル値を割り当て、次に、それはPCPV信号(いくつが復号されたかにかかわらず)の
すべてに掛けられる。同様に、ポテンショメータが反時計回りに動かされるとき
、右の可変抵抗器はワイパーの電圧増加をもたらすために供給電圧(およびグラ
ンドから遠く)に向かって移動する。
すべてに掛けられる。単一のノブを使用しているこの配列は、ユーザに音声およ
び残りのオーディオを独立のレベルに簡単かつ容易に制御させ、それにより所望
の聴取比を達成させる。乗法の後に、PCPVチャンネルの各々は、多くのチャンネ
ルが復号されたのと同様に全体のオーディオプログラムを形成するために、SCRA
(中心が加えられ、左が加えられるなどのそれぞれの方法で)の各々に加えられる
。最終的に、さらなるレベル調整は、調整された全体のプログラムオーディオが
各空間的なチャンネルのためにデジタルアナログ変換器1360を通して増幅器とス
ピーカーに送られる前に、同様な方法で、しかし単一のポテンショメータ(主リ
ューム制御)のみを使用して、全体のオーディオ信号に適用されることができる
。
高度な特徴は、別々にPCPVとSCRA信号の周波数の重み付けを調整する能力である
。これは高周波を減衰させる特定の型の聴覚損傷を有する人の役に立つかもしれ
ない。耳が低い周波数で飽和し始める前に、PCPV(音声)信号の簡単なレベル調整
は明瞭さの必要な増加を供給しないかもしれない。PCPV信号の周波数依存調整(
また、均等化として知られている)を許容することによって、改良された明瞭さ
はある型のプログラミングのために達成されるかもしれない。さらに、SCRA信号
(爆音などの)の非常に低い周波数情報はPCPVチャンネルのスピーチ形式をあいま
いにしているかもしれない。SCRA信号(PCPV信号から独立している) の周波数に
依存するレベル制御は、スピーチの明瞭さを改良している間、SCRAチャンネルで
重要な中間周波数のオーディオ成分を保持するかもしれない。再び、PCPVとSCRA
チャンネルがVRAオーディオ形式を使用してコード化されかつ復号される限り、
これは復号の過程から別々であるハードウェアで実行することができ、その結果
どんな余分な情報も補助のチャンネルで伝送されることを必要としない。
とSCRA)で利用可能な再生の特徴を高めるために使用することができるエンコー
ダ議論に含まれたさまざまなメタデータがある。上で議論したレベル、空間、お
よび均等化調整と異なって、これらの特徴は、コード化されたVRA補助データが
ビットストリームの一部としてメタデータに存在していることを必要とする。こ
れらの特徴は信号レベル、動的な範囲の圧縮、および標準化を含んでいる。
ンネルのレベルに関して、および時間の関数としてデータ(復号位置で) を提供
する。このデータは、オーディオ過渡現象の存在でユーザの選択されたVRA比を
維持するため、独自かつ同時にPCPVとSCRAチャンネルのレベルを制御するために
使用することができる。例えば、SCRAチャンネルの信号レベルデータは、ある区
分中爆音がPCPV(音声)を圧倒することを指示するかもしれず、分割によりどれほ
ど多いかを指示するであろう。
により自動的にSCRAの信号レベルを調整するために再生ハードウェアでその情報
を使用することができる。これは、ユーザは全体のプログラムを通していつでも
相対的なレベルを調整することを妨げる。
SCRA信号の両方のために異なった再生範囲を独自に選択することを許容するだろ
う。ユーザは、最大限の動的な範囲の100%の機能として所望の圧縮または拡大を
選択し、それはそれらの組み合わせの前に各信号に適用される。
グラムからプログラムへPCPVとSCRAの両方の信号強度ゲージを提供する。このデ
ータは補助データヘッダーファイルの一部として伝送されるだけであるかもしれ
ず、全体のプログラムに適用されるだろう。ユーザが選ぶならば、この情報は、
プログラムを横切るSCRA信号のレベルを標準化するのと同様にすべてのプログラ
ムを横切るPCPV信号を標準化するのに使用することができる。これは、A) 1つ
のプログラムから次へ聞かれる対話(PCPV)が一定のレベル(SPL)で維持され、B)
1つのプログラムから次へ聞かれる爆音(SCRA)が一定のレベル(SPL)で維持され
るであろうことを確実にする。
VとSCRA信号のためだけに可能である。生成ミックスが完全に統合されかつ分離
できないPCPV(音声)とSCRA(残りのオーディオ)を含んでいるので、それらが単独
で生成ミックスに適用されるならば、同じ効果を実現されることができない。
うな方法でVRA情報を蓄えるのに使用することができる広範囲の記録保管の構成
を示すために導入される。ここに記載されたすべての記録保管の実施例の共通の
テーマは、PCPV/PCA信号、および/またはSCRA信号、および/またはVRAヘッダー
、および/またはVRA補助データの格納を現在収容しない記録保管されたデジタル
・オーディオメディアの形式を各々が表すということであるが、記載されている
メディアのすべてには、それらがVRA可能な記録保管デジタルオーディオメディ
アになることができるように修正のための可能性を有する。以下で記述される記
録保管メディアについて、‘VRA可能なサウンドトラック’ のラベルは、それら
の信号の1つまたは両方がより前に導入されたVRAデコーダの特徴を使用して組み
立てられかつ再生されることができるように、特定のチャンネルとして収納され
たPCPV/PCA/SCRA信号を有し、および/または十分なVRA補助データを有するサウ
ンドトラックを参照する。再び我々は、そのようなVRA可能サウンドトラックの
定義がそれ自身発明であり、前に記述された実現に必要である様々な実施例によ
り基礎とされることを注意する。
バージョンを有するCD。この実施例がステレオ位置決めを犠牲にすることに注意
すべきである。
信号の最適化されたLPCMバージョンを有するCD。
作 重要な音声のコンテンツを有する映画または他のオーディオプログラムのため
にVRA調整を提供する期待される利益の1つは、聴取者によるスピーチの明瞭さの
改良である。これは特に聴覚損傷された個人にとって本当になるだろう。この時
点で、アナログ形式対デジタル形式に存在する何千個ものフィルムが文字通りあ
る。また、これらのフィルムのいずれもVRA可能なように作成されなかったこと
も本当である。したがって、PCPV/PCA/SCRA信号が対応するVRA補助データと共に
発生されるように、これらのVRA可能でないアナログサウンドトラックを‘再創
作すること’が必要である。上に提示されたVRA可能なデジタルマスター形式の
いずれでもその新しい情報を格納することができる。この発明は聴覚損傷共同体
に利用可能なVRA可能なフィルムのより広範囲に結果をもたらすだろう。
ス デジタルオーディオおよびストリーミングビデオ/オーディオの到来は、‘ビ
デオ・オン・デマンド’と時に呼ばれることを可能にした。 ビデオ・オン・デマン
ド(VOD)システムは、ユーザのデジタルテレビ(または、セットトップコンバータ
ボックスを有するアナログテレビを使用して)に1回の再生をするため、ISDN線ま
たはモデムを経て彼/彼女の選択した映画または他のプログラムをダウンロード
することをユーザに許容する。そのとき、VRA可能なサウンドトラックを有するV
ODデータベースの中にどんなフィルムもない。VRA調整ハードウェアが将来の消
費者エレクトロニクス装置に統合されるようになるので、VODユーザは、たぶんV
RA可能なサウンドトラックを注文することを好むだろう。したがって、これらの
実施例はその期待された必要性に合うように配慮された。最初の発明はそれがVR
A可能なサウンドトラックを有するフィルムを含むVODデータベースである。これ
らのVRA可能なビデオは、聴覚損傷聴取者またはVRA調整を使用して楽しむ視聴者
によりダウンロードされることができる。
ラックの新しい記録保管の作成であり、そこでは、新しい記録保管がVRA可能な
サウンドトラックオーディオだけから成る。VRA可能な映画のオーディオだけの
部分の記録保管は、VODデータベースのための格納要求に膨大な節約を提供する
であろう。VRA可能なサウンドトラック(ビデオのない)は、他の1つの特徴に加え
て、VRA可能なシステムを可能にする実施例のために、より前の議論と同じ方法
で作成されるだろう。これらのVRA可能なサウンドトラックは、VRA可能でないサ
ウンドトラックが利用可能時間のマークを持たないなら、相互相関信号処理技術
および/または時間同期化方法を使用してオリジナルの映画またはプログラムの
オーディオコンテンツに時間同期されるであろう。両方の方法は、オリジナルの
フィルムにあるVRA可能でないオーディオ情報とVRA可能なオーディオ情報を相関
させるのに役立つだろう。相関関係が最適化された後に、フィルムはオリジナル
のサウンドトラックを無音にしてかつVRA可能サウンドトラックをオンにして使
うことができる。
ターネットメディア再生装置へ流される音楽録音のために非常にポピュラーにな
った。VRA可能なデジタルオーディオファイルを可能にするシステム構成要素の
前の定義は等しくよくMP3形式に適用する。したがって、この発明は聴取者によ
りダウンロードする(商業的または多の方法で)ための特別なデータベースの中に
あるVRA可能なMP3録音の作成に関係がある。
ーザへオーディオプログラミングを引渡すために技術の現状を示す。事前および
事後生成中、さまざまなオーディオ部分が、近くのマイクロホン録音、遠いマイ
クロホン音、音響効果、笑音トラック、および全体のオーディオプログラムを形
成するために入るかもしれないいかなる他の可能な音も含むかもしれない多トラ
ックの記録された形式1405で技術者に利用可能である。音響技術者は次に、既存
のオーディオ形式1415に従うために、これらの構成要素を加え、影響させ、空間
的に位置付け、および/または音の成分を結合する。これら既存のオーディオ形
式1415はモノタイプ、ステレオ、Pro-Logic,5.1、7.1または技術者が従ってい
るいかなる他のオーディオ形式も含むかもしれない。
もしれないコード化企画1420に通過される。いろいろなコード化企画が、非圧縮
、損失のない圧縮、または損失のある圧縮技術を含むかもしれないこの段階で採
用されるだろう。いくつかの共通のコード化企画は、Dolby Digital、MPEG-2のL
ayer 3(オーディオのための)、Meridian Lossless Packing、またはDTSを含んで
いる。そのような符号化器の出力は放送されるか、再生または放送のために記録
されるかのいずれかであるデジタルビットストリームである。デジタルビットス
トリームの受信のため、デコーダ1425は、オーディオおよび使用されるならばメ
タデータを発生させる。符号化器1420とデコーダ1425の組み合わせが文献に、お
よびCODEC(すなわち、符号化器、デコーダ)としてのこのドキュメントにしばし
ば引用されるのに注意すべきである。メタデータ 1430はオーディオデータに関
するデータであるとして考慮され、動的な範囲情報、利用可能な別々のチャンネ
ルの数、およびオーディオデータで使用される圧縮の型のような特徴を含むかも
しれない。
を始めると、VRA生成技術1435は、すべての前のものと明瞭に異なった新しいオ
ーディオ形式を形成するために利用される(ここに開示される仕様に従う)。VRA
形式自体はVRAオーディオデータコード1445として図に示されるそれ自身のメタ
データを有する。
るための特徴に焦点が向けられたが、この新しい形式は、生成レベルでマスター
オーディオトラックからCONTENTとSPATIALチャンネルの両方を発生させるところ
に焦点を合わせた。他の多くのものの中で、再生サイトの空間的な位置へのコン
テンツ部分の所望の生成ミックス(音の技術者により駆動される)は、VRA生成技
術を通して補助データストリームの作成により保持されかつ制御される。この点
で、補助データ、PCPV(1次コンテンツの純粋な音声)、およびSCRA(2次コンテン
ツの残りのオーディオ)は、通常の技術と同様に任意の標準のCODECによって使用
される。CODEC 1450、1455はメタデータに含まれるオーディオおよび/または情
報のコンテンツおよび形式に何の仕様も作らないが、むしろそれが受け取るどん
なデータもコード化し、再現位置で同様にそれを復号する。オーディオデータ(P
CPVとSCRA)と補助データ(CODEC メタデータを経て)がいったん受け取られて復号
されると、エンドユーザは補助のチャンネル識別1470と制御データ1465(それが
存在していて認識されるならば)を制御し、次に、PCPVとSCRAチャンネルはそれ
らのエンドユーザ調整1460により制御される。存在しかつオリジナルのCODECに
より要求されるなら、追加メタデータがさらにVRAオーディオ形式と関連する再
現の性能に影響しないで再生1480を制御するために使用されることができる。
上の教示により、そして発明の精神および意図された範囲から逸脱することなく
、添付請求の範囲内でカバーされることが評価されるだろう。特に発明は以下を
含むであろう。
を受け、任意のスピーチだけの圧縮アルゴリズムを使用してPCPV/PCA信号を圧縮
し、任意の一般的なオーディオ圧縮アルゴリズムを使用して、2つのオーディオ
信号と任意の付随するビデオの間のオリジナルの時間整列とビデオフレーム同期
化の損失なしに、SCRA信号を圧縮し、信号のために使用される特定の圧縮アルゴ
リズムおよびシンタキシング方法を定義する対応する関連データとともに、2つ
の圧縮されたビットストリームを多重化し、前記多重化されたビットストリーム
はVRA可能なファイルとして格納されるかPCPV/PCAとSCRA信号を分離するデマル
チプレクサに伝送され、それらを適当な逆圧縮アルゴリズムに発送し、2つの信
号を記憶媒体、または、最終聴取者のためにVRA調整を可能にする適切なボリュ
ーム制御および再生装置に送る。
る一般的なオーディオ圧縮アルゴリズムから独立しているVRAコーデック。
スターまたはVRA可能な記録保管されたオーディオファイルのデータヘッダーを
認識し、自動的にPCPV/PCAとSCRA信号の並列な圧縮を進めるVRAコード化過程。
ルゴリズム。
動し、VRA ビットストリームを別々なPCPVとPCA信号に逆圧縮するVRA可能なデコ
ーダ。
生装置に取り付けられたスピーカーに送られる再生信号を含むVRA再生モードと
の間で切り換えるようにプログラムされるVRA可能なデコーダ。
タ情報を利用するVRA可能デコーダ。
ット(オンまたはオフ)を指定することによってVRA補助データの存在を認識す
るVRA可能なデコーダ。
テップの前に非暗号化される上で記述されたようなVRA可能なコーデック。
タは補助データに特定のビットパターンを通してVRA可能としてコーデックを確
認するような方法で作成され、空間的なオーディオ再生構成で使用されることに
なっているPCPV/PCAとSCRAチャンネルの数を確認し、多重チャンネルの前記空間
的な再生はオーディオプログラムの異なったタイミングで異なった空間的な再生
を指示するように補助データの異なった位置で変化可能であり、最終聴取者によ
りVRA再生およびボリューム調整の過程を容易にするために生成ミックスデータ
を確認し、PCPV/PCAとSCRAの特定のメタデータを含むVRA可能なコーデック。
に、任意の他のコーデックのメタデータの一部として導入されてもよい。
能なVRA補助データの作成。
CRA信号の多重チャンネルおよび/または空間的に分配された再生を可能にするた
め、AC3テレビジョンオーディオ形式と関連したVRA補助データの使用。
映画、およびテレビジョンのサウンドトラックのオーディオマスターテープの再
創作。
るVRA可能な手段。
るVRA可能な手段。
トラックを作成するような方法で、オリジナルのサウンドトラックオーディオマ
スターテープに存在する1つ以上の音声トラックの何らかの芸術的な組み合わせ
を結合する再創作の手段。
ディオトラックを作成するような方法で、オリジナルのサウンドトラックオーデ
ィオマスターテープに存在する1つ以上の非音声トラックの何らかの芸術的な組
み合わせを結合する再創作の手段。
うな、VRA可能なデジタルマスターオーディオ記憶媒体を構成する再創作の手段
。
たは他のデジタル伝送手段を通してVRA可能な再生装置に伝送する目的のためにV
RA可能なフィルムサウンドトラックを含むデジタルデータベースの作成、または
記録保管システム。
または他のプログラムを含むデジタルデータベース。
を使用して、対応するサウンドトラックがVRA可能であるところで単一のフィル
ム実体から成るかもしれない。
オ再生時点で選択されたサウンドトラックとしてオリジナルプログラムサウンド
トラックの如何にかかわらず送られることができるように、適切な時間同期とビ
デオフレーム同期でVRA可能なオーディオサウンドトラックだけから成るかもし
れない。
データベースの作成または記録保管システムであって、前記VRA可能な音楽オー
ディオは、1次コンテンツの純粋な音声オーディオとして指示された音声トラッ
クの何らかの混合、および2次コンテンツの残りのオーディオとして指示された
楽器の何らかの混合を作成する。
時間同期されたオリジナルの音楽録音またはデジタルファイルされた指定された
PCPVオーディオ情報だけから成るかもしれない。
。
実施例を示すダイヤグラムである。
ス実施例を示すダイヤグラムである。
ーオーディオテープのためのプレミックス実施例を示すダイヤグラムである。
ムである。
ムである。
ムである。
ムである。
ムである。
的ダイヤグラムである。
的ダイヤグラムである。
RA形式デコーダを示すダイヤグラムである。
A…2次コンテンツの残りのオーディオ VRA…音声対残りのオーディオ
Claims (28)
- 【請求項1】 1つ以上のPCPV/PCA信号および1つ以上のSCRA信号の並列入力
構成を受入れ、 PCPV/PCA信号およびSCRA信号を圧縮し、 PCPV/PCAおよびSCRA信号を処理するために使用される特定の圧縮アルゴリズム
およびシンタキシング方法を定義する対応している関連データとともに圧縮され
たPCPV/PCAおよびSCRA信号を多重化し、多重化された信号はVRA可能なファイル
として記憶され、またはPCPV/PCAおよびSCRA信号を分離する対応しているデマル
チプレククサに伝送され、それらを適切な逆圧縮アルゴリズムに発送し、記憶媒
体またはVRAボリウム調整可能な出力装置に信号を出力する、 ことを含むVRA可能なコーデックシステムを操作する方法。 - 【請求項2】 少なくとも1つのトラックを複数のオーディオトラック、1
次コンテンツの純粋な音声(PCPV)オーディオを含む1つのトラック、記憶媒体に
記憶された複数のオーディオトラック、および時間同期を有する複数のオーディ
オトラックに提供し; 少なくとも1つのトラックからPCPV信号を発生させ; 第1の圧縮比を有するデジタル圧縮形式を使用してPCPV信号を圧縮し; 少なくとも1つの他のトラックを複数のオーディオトラックに提供し、少なく
とも1つの他のトラックは2次コンテンツの残りのオーディオ(SCRA)を含み; 少なくとも1つの他のトラックからSCRA信号を発生させ; 第2の圧縮比を有するデジタル圧縮形式を使用してSCRA信号を圧縮し; 音声対残りのオーディオ(VRA) 補助データチャンネルを作成し、VRA補助デー
タチャンネルは: VRA可能としてVRA可能なデジタルマスターを確認し、そして PCPVおよびSCRA信号の再生パラメタを確認し; VRA可能なデジタルマスターに PCPV信号、 SCRA信号、および VRA補助データチャンネル; をデジタル的に記憶し、この記憶ステップが時間同期を維持する; ことを含むオーディオ生成方法。 - 【請求項3】 複数のオーディオトラックが少なくとも1次音声のコンテン
ツとバックグラウンドコンテンツを有するオーディオプログラムと関係される請
求項2のオーディオ生成方法。 - 【請求項4】 PCPV信号は、オーディオプログラムの筋がPCPVオーディオを
聞くことにより聴取者に伝えられるような十分な1次音声のコンテンツを含む請
求項3のオーディオ生成方法。 - 【請求項5】 SCRA信号は、オーディオプログラムの芸術的な値がSCRA信号
をPCPV信号と混合することにより高められるように十分なバックグラウンドコン
テンツを含む請求項3のオーディオ生成方法。 - 【請求項6】 PCPV信号がモノタイプ信号、ステレオ信号、およびサラウン
ド音の信号の1つである請求項2のオーディオ生成方法。 - 【請求項7】 サラウンド音の信号が5.1サラウンド音形式および7.1サラウ
ンド音形式の1つである請求項6のオーディオ生成方法。 - 【請求項8】 SCRA信号がモノタイプ信号、ステレオ信号、およびサラウン
ド音の信号の1つである請求項2のオーディオ生成方法。 - 【請求項9】 サラウンド音の信号が5.1サラウンド音形式および7.1サラウ
ンド音形式の1つである請求項8のオーディオ生成方法。 - 【請求項10】 再生パラメタがPCPVおよびSCRA信号の各々のために互いに
関してボリュームレベルを含み、再生中にSCRA信号がPCPV信号を実質的にぼやか
さないように各信号のボリュームレベルを自動制御可能にする請求項2のオーデ
ィオ生成方法。 - 【請求項11】 第1の圧縮比が実質的に12:1よりも小さい比率である請求
項2のオーディオ生成方法。 - 【請求項12】 第1の圧縮比が実質的に8:1よりも小さい比率である請求
項2のオーディオ生成方法。 - 【請求項13】 第2の圧縮比が実質的に12:1よりも小さい比率である請求
項2のオーディオ生成方法。 - 【請求項14】 第2の圧縮比が実質的に8:1よりも小さい比率である請求
項2のオーディオ生成方法。 - 【請求項15】 VRA可能なデジタルマスターに信号をデジタル的に記憶す
るための形式がゼロチャンネル形式、1チャンネルのプレミックス形式、1チャン
ネルのポストミックス形式、2チャンネルのプレミックス形式、および2チャンネ
ルのポストミックス形式の1つである請求項2のオーディオ生成方法。 - 【請求項16】 他のトラックが音楽トラックおよび効果トラックの1つで
ある請求項2のオーディオ生成方法。 - 【請求項17】 さらにVRA可能なデジタルマスターの再生上でPCPVおよびS
CRA信号の振幅の独自の調整を含む請求項2のオーディオ生成方法。 - 【請求項18】 さらに再生のために独自に調整されたPCPVおよびSCRA信号
の混合を含み、混合された独自に調整されたPCPVおよびSCRA信号は電気音響装置
と結合される請求項17のオーディオ生成方法。 - 【請求項19】 PCPV信号、SCRA信号、およびVRA補助データチャンネルの
再生が同時に起こる請求項17のオーディオ生成方法。 - 【請求項20】 複数のオーディオトラックが時間整列およびビデオ信号と
のビデオフレーム同期をさらに含む請求2のオーディオ生成方法。 - 【請求項21】 記憶ステップがPCPV信号、SCRA信号、およびビデオ信号の
間に時間整列およびビデオフレーム同期の損失なしに起こる請求項20のオーディ
オ生成方法。 - 【請求項22】 VRA可能なデジタルマスターが放送テレビジョン、ウエブ
キャスチングストリーミングオーディオ、コンパクトディスク(CD)オーディオ、
デジタルビデオディスク(DVD)オーディオ、映画オーディオ、およびビデオテー
プオーディオの1つについてオーディオプログラミングを記憶する請求項2のオ
ーディオ生成方法。 - 【請求項23】 1次音声のコンテンツオーディオ信号、バックグラウンド
コンテンツのオーディオ信号、および任意の付随するビデオ信号の間の時間整列
とビデオフレーム同期を有し、少なくとも1次音声のコンテンツオーディオ信号
、バックグラウンドコンテンツのオーディオ信号、および任意の付随するビデオ
信号を有するオーディオプログラムをコード化しかつ復号するためのコーデック
において、 1次音声のコンテンツオーディオ信号およびバックグラウンドコンテンツのオ
ーディオ信号を受ける並列入力構成、 1次音声のコンテンツオーディオ信号から第1の圧縮されたオーディオ信号を
発生させるスピーチだけの圧縮、 バックグラウンドコンテンツのオーディオ信号から第2の圧縮されたオーディ
オ信号を発生させる全般的なオーディオの圧縮、 1次音声のコンテンツおよびバックグラウンドコンテンツのオーディオ信号、
並びに任意の付随するビデオ間の時間整列とビデオフレーム同期の損失なく、1
次音声のコンテンツおよびバックグラウンドコンテンツのオーディオ信号を含ん
でいるスピーチだけのおよび全般的なオーディオの圧縮、 第1および第2の圧縮されたオーディオ信号および関連するデータの多重化さ
れたビットストリームを発生させ、関連するデータは少なくともスピーチだけの
量および全般的なオーディオの圧縮並びに第1および第2の圧縮された信号を発
生させる際に使用されたビットストリームシンタキシング方法を含んでいるマル
チプレクサ、 を含むコーデック。 - 【請求項24】 第1および第2の圧縮されたオーディオ信号を得るために
多重化されたビットストリームを逆多重化するデマルチプレクサ、 第1および第2の圧縮されたオーディオ信号を第1および第2のオーディオ信
号に復号するデコーダ をさらに含む請求項23のコーデック。 - 【請求項25】 第1および第2のオーディオ信号をボリューム制御および
再生装置に伝送し、再生装置は第1および第2のオーディオ信号の独自のボリュ
ーム調整を可能にすることをさらに含む請求項24のコーデック。 - 【請求項26】 形式を有する記憶媒体において、形式が、 分離可能な1次コンテンツオーディオおよび2次コンテンツオーディオを含む構
成上のオーディオ情報部分、 聴取者が分離可能な1次コンテンツオーディオおよび2次コンテンツオーディオ
の空間的方向を知覚することを可能にする空間的オーディオ情報を含む空間的オ
ーディオ情報部分、 空間的方向を有する分離可能な1次コンテンツオーディオおよび2次コンテンツ
オーディオの1つの発生および再生を許容する情報を含む補助データ情報部分、 を含む記憶媒体。 - 【請求項27】 VRA形式を記憶し、形式がVRA補助データチャンネル、VRA
可能なコーデックにより作成されかつ解釈された記述の使用を通して、オーディ
オプログラムからの空間的オーディオ情報の同時解釈でオーディオプログラムか
らの構成上のオーディオ情報の解釈を収容している、音声対残りのオーディオ(
VRA)のオーディオ記憶媒体。 - 【請求項28】 オーディオプログラムがフイルムサウンドトラック、DVD
映画サウンドトラック、およびコンパクトディスクサウンドトラックの1つであ
る請求項27の記憶媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US18635700P | 2000-03-02 | 2000-03-02 | |
US60/186,357 | 2000-03-02 | ||
US09/580,205 | 2000-05-26 | ||
US09/580,205 US6351733B1 (en) | 2000-03-02 | 2000-05-26 | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
PCT/US2001/006843 WO2001065888A2 (en) | 2000-03-02 | 2001-03-02 | A system for accommodating primary and secondary audio signal |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003525466A true JP2003525466A (ja) | 2003-08-26 |
Family
ID=26882012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001563565A Pending JP2003525466A (ja) | 2000-03-02 | 2001-03-02 | デジタルオーディオ生成過程において1次コンテンツオーディオおよび2次コンテンツの残りのオーディオ性能を収容する方法および装置 |
Country Status (12)
Country | Link |
---|---|
US (2) | US6351733B1 (ja) |
EP (1) | EP1264300A2 (ja) |
JP (1) | JP2003525466A (ja) |
KR (1) | KR100799155B1 (ja) |
CN (1) | CN1211775C (ja) |
AU (1) | AU2001243395A1 (ja) |
BR (1) | BR0108904A (ja) |
CA (1) | CA2401798A1 (ja) |
IL (1) | IL151546A0 (ja) |
MX (1) | MXPA02008573A (ja) |
RU (1) | RU2002126217A (ja) |
WO (1) | WO2001065888A2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010518455A (ja) * | 2007-02-12 | 2010-05-27 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 高齢又は聴覚障害聴取者のための非スピーチオーディオに対するスピーチオーディオの改善された比率 |
JP2012234192A (ja) * | 2005-02-14 | 2012-11-29 | Fraunhofer Ges | オーディオソースのパラメトリックジョイント符号化 |
JP2020039181A (ja) * | 2013-09-12 | 2020-03-12 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 多様な再生環境のためのダイナミックレンジ制御 |
Families Citing this family (79)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020002039A1 (en) | 1998-06-12 | 2002-01-03 | Safi Qureshey | Network-enabled audio device |
US7266501B2 (en) * | 2000-03-02 | 2007-09-04 | Akiba Electronics Institute Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
WO2001086843A1 (en) * | 2000-05-12 | 2001-11-15 | Cohen Marc S | Apparatus and method for triggering message insertion during digital music playing |
US6782366B1 (en) * | 2000-05-15 | 2004-08-24 | Lsi Logic Corporation | Method for independent dynamic range control |
GB0016695D0 (en) * | 2000-07-08 | 2000-08-23 | Radioscape Ltd | Digital transactions for the delivery of media files |
US7840691B1 (en) | 2000-09-07 | 2010-11-23 | Zamora Radio, Llc | Personal broadcast server system for providing a customized broadcast |
US7848531B1 (en) * | 2002-01-09 | 2010-12-07 | Creative Technology Ltd. | Method and apparatus for audio loudness and dynamics matching |
AU2003224628A1 (en) * | 2002-02-28 | 2003-09-16 | Nikolay Shkolnik | Liquid piston internal combustion power system |
US20030182000A1 (en) * | 2002-03-22 | 2003-09-25 | Sound Id | Alternative sound track for hearing-handicapped users and stressful environments |
US7454331B2 (en) * | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
JP3879922B2 (ja) * | 2002-09-12 | 2007-02-14 | ソニー株式会社 | 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム |
WO2004029935A1 (en) * | 2002-09-24 | 2004-04-08 | Rad Data Communications | A system and method for low bit-rate compression of combined speech and music |
US20040078104A1 (en) * | 2002-10-22 | 2004-04-22 | Hitachi, Ltd. | Method and apparatus for an in-vehicle audio system |
EP1427252A1 (en) * | 2002-12-02 | 2004-06-09 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for processing audio signals from a bitstream |
US20040204944A1 (en) * | 2003-04-14 | 2004-10-14 | Castillo Michael J. | System and method for mixing computer generated audio with television programming audio in a media center |
US7251337B2 (en) * | 2003-04-24 | 2007-07-31 | Dolby Laboratories Licensing Corporation | Volume control in movie theaters |
US7551745B2 (en) * | 2003-04-24 | 2009-06-23 | Dolby Laboratories Licensing Corporation | Volume and compression control in movie theaters |
JP4486646B2 (ja) * | 2003-05-28 | 2010-06-23 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | オーディオ信号の感知音量を計算し調整する方法、装置及びコンピュータプログラム |
GB2407006A (en) * | 2003-10-08 | 2005-04-13 | Sony Uk Ltd | Communicating streamed payload data and packet based auxiliary data |
US8718298B2 (en) * | 2003-12-19 | 2014-05-06 | Lear Corporation | NVH dependent parallel compression processing for automotive audio systems |
KR100541526B1 (ko) * | 2004-01-30 | 2006-01-10 | 에스케이 텔레콤주식회사 | 멀티미디어 데이터의 전송품질 측정방법 및 장치 |
US8028323B2 (en) | 2004-05-05 | 2011-09-27 | Dryden Enterprises, Llc | Method and system for employing a first device to direct a networked audio device to obtain a media item |
US7624021B2 (en) * | 2004-07-02 | 2009-11-24 | Apple Inc. | Universal container for audio data |
US20060062407A1 (en) * | 2004-09-22 | 2006-03-23 | Kahan Joseph M | Sound card having feedback calibration loop |
US8090120B2 (en) * | 2004-10-26 | 2012-01-03 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
US8199933B2 (en) | 2004-10-26 | 2012-06-12 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
US20060203972A1 (en) * | 2005-03-08 | 2006-09-14 | Equity Online Marketing, Inc. | Method and system for audio program creation and assembly |
US7734364B2 (en) * | 2005-03-08 | 2010-06-08 | Lolo, Llc | Mixing media files |
US20060218253A1 (en) * | 2005-03-08 | 2006-09-28 | Equity On Line Marketing, Inc. | Method and system for video program creation and assembly |
US20070016930A1 (en) * | 2005-03-08 | 2007-01-18 | Podfitness, Inc. | Creation and navigation of media content with chaptering elements |
BRPI0622303B1 (pt) * | 2005-04-18 | 2016-03-01 | Basf Se | copolímeros cp na forma de um polímero obtido por polimerização com radical de pelo menos três monômeros m diferentes monoetilenicamente insaturados |
KR100640477B1 (ko) * | 2005-06-29 | 2006-10-30 | 삼성전자주식회사 | 디지털 멀티미디어 방송 채널에 따른 오디오 신호 출력방법 및 장치 |
US7450705B1 (en) | 2005-08-31 | 2008-11-11 | At&T Corp. | Method to test and compare voice teleconference systems |
CN101410892B (zh) * | 2006-04-04 | 2012-08-08 | 杜比实验室特许公司 | 改进的离散余弦变换域中的音频信号响度测量及修改 |
TWI517562B (zh) * | 2006-04-04 | 2016-01-11 | 杜比實驗室特許公司 | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 |
MY141426A (en) | 2006-04-27 | 2010-04-30 | Dolby Lab Licensing Corp | Audio gain control using specific-loudness-based auditory event detection |
US20080002839A1 (en) * | 2006-06-28 | 2008-01-03 | Microsoft Corporation | Smart equalizer |
WO2008002098A1 (en) * | 2006-06-29 | 2008-01-03 | Lg Electronics, Inc. | Method and apparatus for an audio signal processing |
EP2071564A4 (en) | 2006-09-29 | 2009-09-02 | Lg Electronics Inc | METHOD AND DEVICES FOR CODING AND DECODING OBJECT-BASED AUDIO SIGNALS |
US8849433B2 (en) | 2006-10-20 | 2014-09-30 | Dolby Laboratories Licensing Corporation | Audio dynamics processing using a reset |
US8521314B2 (en) * | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
EP2095365A4 (en) * | 2006-11-24 | 2009-11-18 | Lg Electronics Inc | METHOD FOR ENCODING AND DECODING AUDIO SIGNALS BASED ON OBJECTS AND APPARATUS THEREOF |
US20080201292A1 (en) * | 2007-02-20 | 2008-08-21 | Integrated Device Technology, Inc. | Method and apparatus for preserving control information embedded in digital data |
JP5530720B2 (ja) * | 2007-02-26 | 2014-06-25 | ドルビー ラボラトリーズ ライセンシング コーポレイション | エンターテイメントオーディオにおける音声強調方法、装置、およびコンピュータ読取り可能な記録媒体 |
EP2003860A1 (en) * | 2007-06-12 | 2008-12-17 | Alcatel Lucent | Configuration of a communication terminal by provisioning of DHCP realm identifier |
JP5556175B2 (ja) * | 2007-06-27 | 2014-07-23 | 日本電気株式会社 | 信号分析装置と、信号制御装置と、そのシステム、方法及びプログラム |
BRPI0813723B1 (pt) * | 2007-07-13 | 2020-02-04 | Dolby Laboratories Licensing Corp | método para controlar o nível de intensidade do som de eventos auditivos, memória legível por computador não transitória, sistema de computador e aparelho |
US9996612B2 (en) * | 2007-08-08 | 2018-06-12 | Sony Corporation | System and method for audio identification and metadata retrieval |
JP2009076172A (ja) * | 2007-09-25 | 2009-04-09 | Hitachi Ltd | データ伝送方法、光ディスク記録方法及び光ディスク記録装置 |
DE102007048973B4 (de) * | 2007-10-12 | 2010-11-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung |
US8527282B2 (en) | 2007-11-21 | 2013-09-03 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
US9015147B2 (en) | 2007-12-20 | 2015-04-21 | Porto Technology, Llc | System and method for generating dynamically filtered content results, including for audio and/or video channels |
US8316015B2 (en) | 2007-12-21 | 2012-11-20 | Lemi Technology, Llc | Tunersphere |
US8117193B2 (en) | 2007-12-21 | 2012-02-14 | Lemi Technology, Llc | Tunersphere |
KR101597375B1 (ko) | 2007-12-21 | 2016-02-24 | 디티에스 엘엘씨 | 오디오 신호의 인지된 음량을 조절하기 위한 시스템 |
JP5341983B2 (ja) * | 2008-04-18 | 2013-11-13 | ドルビー ラボラトリーズ ライセンシング コーポレイション | サラウンド体験に対する影響を最小限にしてマルチチャンネルオーディオにおけるスピーチの聴覚性を維持するための方法及び装置 |
KR101381513B1 (ko) | 2008-07-14 | 2014-04-07 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
EP2154910A1 (en) * | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for merging spatial audio streams |
US8509315B1 (en) * | 2008-09-23 | 2013-08-13 | Viasat, Inc. | Maintaining synchronization of compressed data and associated metadata |
CN101715145B (zh) * | 2008-10-06 | 2012-08-15 | 辉达公司 | 利用级联存储器评估处理能力的设备和方法 |
US8494899B2 (en) | 2008-12-02 | 2013-07-23 | Lemi Technology, Llc | Dynamic talk radio program scheduling |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
WO2011048010A1 (en) * | 2009-10-19 | 2011-04-28 | Dolby International Ab | Metadata time marking information for indicating a section of an audio object |
CN102385864B (zh) * | 2010-08-31 | 2013-07-10 | Tcl集团股份有限公司 | 一种音频数据解码方法、装置及音频播放器 |
US9171549B2 (en) | 2011-04-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams |
US20130054450A1 (en) * | 2011-08-31 | 2013-02-28 | Richard Lang | Monetization of Atomized Content |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
TWI530941B (zh) * | 2013-04-03 | 2016-04-21 | 杜比實驗室特許公司 | 用於基於物件音頻之互動成像的方法與系統 |
CN109712630B (zh) * | 2013-05-24 | 2023-05-30 | 杜比国际公司 | 包括音频对象的音频场景的高效编码 |
US20150006369A1 (en) * | 2013-06-27 | 2015-01-01 | Little Engines Group, Inc. | Method for internet-based commercial trade in collaboratively created secondary digital media programs |
CN105493182B (zh) | 2013-08-28 | 2020-01-21 | 杜比实验室特许公司 | 混合波形编码和参数编码语音增强 |
KR102170827B1 (ko) * | 2013-11-22 | 2020-10-28 | 삼성전자주식회사 | 영상표시장치 및 영상표시장치의 구동방법, 음향출력장치 및 음향출력장치의 구동방법 |
CN106068651B (zh) * | 2014-03-18 | 2020-10-16 | 皇家飞利浦有限公司 | 视听内容项数据流 |
US9462330B2 (en) | 2014-09-04 | 2016-10-04 | Transformative Engineering, Inc. | Multimedia audio inserter |
CN105723739A (zh) * | 2016-01-23 | 2016-06-29 | 张阳 | 一种音箱设备的音量调整方法及系统 |
WO2017130210A1 (en) * | 2016-01-27 | 2017-08-03 | Indian Institute Of Technology Bombay | Method and system for rendering audio streams |
US10341762B2 (en) | 2017-10-11 | 2019-07-02 | Sony Corporation | Dynamic generation and distribution of multi-channel audio from the perspective of a specific subject of interest |
WO2021086624A1 (en) | 2019-10-29 | 2021-05-06 | Qsinx Management Llc | Audio encoding with compressed ambience |
CN114222224B (zh) * | 2021-10-29 | 2023-12-26 | 成都中科信息技术有限公司 | 一种双通道通信链路的会议讨论系统及工作方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02174380A (ja) * | 1988-12-27 | 1990-07-05 | Marantz Japan Inc | Ld等映像ソフト媒体の多言語化システム |
JPH03236691A (ja) * | 1990-02-14 | 1991-10-22 | Hitachi Ltd | テレビジョン受信機用音声回路 |
JPH0556007A (ja) * | 1991-08-23 | 1993-03-05 | Nippon Hoso Kyokai <Nhk> | 混合音声信号伝送方式 |
JPH05342583A (ja) * | 1992-06-12 | 1993-12-24 | Matsushita Electric Ind Co Ltd | ディスク記録装置及び再生装置 |
JPH1133228A (ja) * | 1997-07-23 | 1999-02-09 | Namco Ltd | ゲーム装置及び情報記憶媒体 |
Family Cites Families (83)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2783677A (en) | 1953-06-29 | 1957-03-05 | Ampex Electric Corp | Stereophonic sound system and method |
US3046337A (en) | 1957-08-05 | 1962-07-24 | Hamner Electronics Company Inc | Stereophonic sound |
US3110769A (en) | 1959-01-17 | 1963-11-12 | Telefunken Gmbh | Stereo sound control system |
GB1522599A (en) | 1974-11-16 | 1978-08-23 | Dolby Laboratories Inc | Centre channel derivation for stereophonic cinema sound |
US4074084A (en) | 1975-11-05 | 1978-02-14 | Berg Johannes C M Van Den | Method and apparatus for receiving sound intended for stereophonic reproduction |
US4150253A (en) | 1976-03-15 | 1979-04-17 | Inter-Technology Exchange Ltd. | Signal distortion circuit and method of use |
US4051331A (en) | 1976-03-29 | 1977-09-27 | Brigham Young University | Speech coding hearing aid system utilizing formant frequency transformation |
US4052559A (en) | 1976-12-20 | 1977-10-04 | Rockwell International Corporation | Noise filtering device |
US4406001A (en) | 1980-08-18 | 1983-09-20 | The Variable Speech Control Company ("Vsc") | Time compression/expansion with synchronized individual pitch correction of separate components |
US4405831A (en) | 1980-12-22 | 1983-09-20 | The Regents Of The University Of California | Apparatus for selective noise suppression for hearing aids |
US4454609A (en) | 1981-10-05 | 1984-06-12 | Signatron, Inc. | Speech intelligibility enhancement |
US4516257A (en) | 1982-11-15 | 1985-05-07 | Cbs Inc. | Triphonic sound system |
US4484345A (en) | 1983-02-28 | 1984-11-20 | Stearns William P | Prosthetic device for optimizing speech understanding through adjustable frequency spectrum responses |
US4622440A (en) | 1984-04-11 | 1986-11-11 | In Tech Systems Corp. | Differential hearing aid with programmable frequency response |
US4776016A (en) | 1985-11-21 | 1988-10-04 | Position Orientation Systems, Inc. | Voice control system |
US4809337A (en) | 1986-06-20 | 1989-02-28 | Scholz Research & Development, Inc. | Audio noise gate |
US5138498A (en) | 1986-10-22 | 1992-08-11 | Fuji Photo Film Co., Ltd. | Recording and reproduction method for a plurality of sound signals inputted simultaneously |
US4816905A (en) | 1987-04-30 | 1989-03-28 | Gte Laboratories Incorporated & Gte Service Corporation | Telecommunication system with video and audio frames |
JPH06101664B2 (ja) | 1987-08-20 | 1994-12-12 | パイオニア株式会社 | 再生波形等化回路 |
DE3730763A1 (de) | 1987-09-12 | 1989-03-30 | Blaupunkt Werke Gmbh | Schaltung zur stoergeraeuschkompensation |
US4941179A (en) | 1988-04-27 | 1990-07-10 | Gn Davavox A/S | Method for the regulation of a hearing aid, a hearing aid and the use thereof |
JP3017744B2 (ja) | 1989-03-09 | 2000-03-13 | パイオニア株式会社 | ボイスチェンジ回路 |
US5212764A (en) | 1989-04-19 | 1993-05-18 | Ricoh Company, Ltd. | Noise eliminating apparatus and speech recognition apparatus using the same |
US5450146A (en) | 1989-05-24 | 1995-09-12 | Digital Theater Systems, L.P. | High fidelity reproduction device for cinema sound |
US5003605A (en) | 1989-08-14 | 1991-03-26 | Cardiodyne, Inc. | Electronically augmented stethoscope with timing sound |
US5144454A (en) | 1989-10-31 | 1992-09-01 | Cury Brian L | Method and apparatus for producing customized video recordings |
JP2538668Y2 (ja) | 1990-03-02 | 1997-06-18 | ブラザー工業株式会社 | メッセージ機能付き音楽再生装置 |
US5216718A (en) | 1990-04-26 | 1993-06-01 | Sanyo Electric Co., Ltd. | Method and apparatus for processing audio signals |
EP0459362B1 (en) | 1990-05-28 | 1997-01-08 | Matsushita Electric Industrial Co., Ltd. | Voice signal processor |
DE69131739T2 (de) | 1990-05-28 | 2001-10-04 | Matsushita Electric Ind Co Ltd | Einrichtung zur Sprachsignalverarbeitung für die Bestimmung eines Sprachsignals in einem verrauschten Sprachsignal |
JP3006059B2 (ja) | 1990-09-17 | 2000-02-07 | ソニー株式会社 | 音場拡大装置 |
US5155510A (en) | 1990-11-29 | 1992-10-13 | Digital Theater Systems Corporation | Digital sound system for motion pictures with analog sound track emulation |
US5146504A (en) | 1990-12-07 | 1992-09-08 | Motorola, Inc. | Speech selective automatic gain control |
US5408686A (en) | 1991-02-19 | 1995-04-18 | Mankovitz; Roy J. | Apparatus and methods for music and lyrics broadcasting |
JP3068226B2 (ja) | 1991-02-27 | 2000-07-24 | 株式会社リコス | バックコーラス合成装置 |
US5210366A (en) | 1991-06-10 | 1993-05-11 | Sykes Jr Richard O | Method and device for detecting and separating voices in a complex musical composition |
JPH0537478A (ja) | 1991-07-31 | 1993-02-12 | Fujitsu Ten Ltd | 音場制御装置 |
DE69317802T2 (de) | 1992-01-21 | 1998-10-22 | Koninkl Philips Electronics Nv | Verfahren und Vorrichtung für Tonverbesserung unter Verwendung von Hüllung von multibandpassfiltrierten Signalen in Kammfiltern |
US5384599A (en) | 1992-02-21 | 1995-01-24 | General Electric Company | Television image format conversion system including noise reduction apparatus |
US5812688A (en) | 1992-04-27 | 1998-09-22 | Gibson; David A. | Method and apparatus for using visual images to mix sound |
JPH05342762A (ja) | 1992-06-12 | 1993-12-24 | Sanyo Electric Co Ltd | 音声再生回路 |
JPH087524B2 (ja) | 1992-07-17 | 1996-01-29 | 株式会社日本ビデオセンター | カラオケ採点表示装置 |
US5319713A (en) | 1992-11-12 | 1994-06-07 | Rocktron Corporation | Multi dimensional sound circuit |
US5325423A (en) | 1992-11-13 | 1994-06-28 | Multimedia Systems Corporation | Interactive multimedia communication system |
US5341253A (en) | 1992-11-28 | 1994-08-23 | Tatung Co. | Extended circuit of a HiFi KARAOKE video cassette recorder having a function of simultaneous singing and recording |
US5400409A (en) | 1992-12-23 | 1995-03-21 | Daimler-Benz Ag | Noise-reduction method for noise-affected voice channels |
US5572591A (en) | 1993-03-09 | 1996-11-05 | Matsushita Electric Industrial Co., Ltd. | Sound field controller |
US5396560A (en) | 1993-03-31 | 1995-03-07 | Trw Inc. | Hearing aid incorporating a novelty filter |
US5434922A (en) | 1993-04-08 | 1995-07-18 | Miller; Thomas E. | Method and apparatus for dynamic sound optimization |
JP3206619B2 (ja) | 1993-04-23 | 2001-09-10 | ヤマハ株式会社 | カラオケ装置 |
JP2951502B2 (ja) | 1993-05-26 | 1999-09-20 | パイオニア株式会社 | カラオケ装置 |
US5619383A (en) | 1993-05-26 | 1997-04-08 | Gemstar Development Corporation | Method and apparatus for reading and writing audio and digital data on a magnetic tape |
JP3685812B2 (ja) | 1993-06-29 | 2005-08-24 | ソニー株式会社 | 音声信号送受信装置 |
US5644677A (en) | 1993-09-13 | 1997-07-01 | Motorola, Inc. | Signal processing system for performing real-time pitch shifting and method therefor |
US5485522A (en) | 1993-09-29 | 1996-01-16 | Ericsson Ge Mobile Communications, Inc. | System for adaptively reducing noise in speech signals |
BE1007617A3 (nl) | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
US5576843A (en) | 1993-10-29 | 1996-11-19 | Time Warner Entertainment Co., L.P. | System and method for controlling play of multiple dialog audio tracks of a software carrier |
US5469370A (en) | 1993-10-29 | 1995-11-21 | Time Warner Entertainment Co., L.P. | System and method for controlling play of multiple audio tracks of a software carrier |
US5569038A (en) | 1993-11-08 | 1996-10-29 | Tubman; Louis | Acoustical prompt recording system and method |
TW247390B (en) | 1994-04-29 | 1995-05-11 | Audio Products Int Corp | Apparatus and method for adjusting levels between channels of a sound system |
JP3568584B2 (ja) | 1994-06-28 | 2004-09-22 | ローム株式会社 | オーディオ装置 |
US5706145A (en) | 1994-08-25 | 1998-01-06 | Hindman; Carl L. | Apparatus and methods for audio tape indexing with data signals recorded in the guard band |
US5668339A (en) * | 1994-10-26 | 1997-09-16 | Daewoo Electronics Co., Ltd. | Apparatus for multiplexing an audio signal in a video-song playback system |
JP2897659B2 (ja) | 1994-10-31 | 1999-05-31 | ヤマハ株式会社 | カラオケ装置 |
US5751903A (en) | 1994-12-19 | 1998-05-12 | Hughes Electronics | Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset |
JP3239672B2 (ja) | 1995-02-15 | 2001-12-17 | ヤマハ株式会社 | 自動演奏装置 |
JP3319211B2 (ja) | 1995-03-23 | 2002-08-26 | ヤマハ株式会社 | 音声変換機能付カラオケ装置 |
KR0155811B1 (ko) | 1995-03-28 | 1998-12-15 | 김광호 | 컴팩트 디스크 플레이어 일체형 텔레비젼 수상기 |
EP0738999B1 (en) * | 1995-04-14 | 2002-06-26 | Kabushiki Kaisha Toshiba | Recording medium and reproducing system for playback data |
US5684714A (en) | 1995-05-08 | 1997-11-04 | Kabushiki Kaisha Toshiba | Method and system for a user to manually alter the quality of a previously encoded video sequence |
KR100188089B1 (ko) | 1995-07-10 | 1999-06-01 | 김광호 | 음성 강조 회로 |
US6118876A (en) * | 1995-09-07 | 2000-09-12 | Rep Investment Limited Liability Company | Surround sound speaker system for improved spatial effects |
US5872851A (en) | 1995-09-18 | 1999-02-16 | Harman Motive Incorporated | Dynamic stereophonic enchancement signal processing system |
US5852800A (en) | 1995-10-20 | 1998-12-22 | Liquid Audio, Inc. | Method and apparatus for user controlled modulation and mixing of digitally stored compressed data |
US5666350A (en) | 1996-02-20 | 1997-09-09 | Motorola, Inc. | Apparatus and method for coding excitation parameters in a very low bit rate voice messaging system |
US5809472A (en) | 1996-04-03 | 1998-09-15 | Command Audio Corporation | Digital audio data transmission system based on the information content of an audio signal |
US5822370A (en) | 1996-04-16 | 1998-10-13 | Aura Systems, Inc. | Compression/decompression for preservation of high fidelity speech quality at low bandwidth |
US5970152A (en) * | 1996-04-30 | 1999-10-19 | Srs Labs, Inc. | Audio enhancement system for use in a surround sound environment |
JPH09322078A (ja) | 1996-05-24 | 1997-12-12 | Toko Inc | 画像伝送装置 |
JPH1063470A (ja) * | 1996-06-12 | 1998-03-06 | Nintendo Co Ltd | 画像表示に連動する音響発生装置 |
US5912976A (en) | 1996-11-07 | 1999-06-15 | Srs Labs, Inc. | Multi-channel audio enhancement system for use in recording and playback and methods for providing same |
US6078669A (en) * | 1997-07-14 | 2000-06-20 | Euphonics, Incorporated | Audio spatial localization apparatus and methods |
US6067361A (en) * | 1997-07-16 | 2000-05-23 | Sony Corporation | Method and apparatus for two channels of sound having directional cues |
-
2000
- 2000-05-26 US US09/580,205 patent/US6351733B1/en not_active Expired - Lifetime
-
2001
- 2001-03-02 WO PCT/US2001/006843 patent/WO2001065888A2/en not_active Application Discontinuation
- 2001-03-02 CA CA002401798A patent/CA2401798A1/en not_active Abandoned
- 2001-03-02 CN CNB018090052A patent/CN1211775C/zh not_active Expired - Fee Related
- 2001-03-02 AU AU2001243395A patent/AU2001243395A1/en not_active Abandoned
- 2001-03-02 KR KR1020027011521A patent/KR100799155B1/ko not_active IP Right Cessation
- 2001-03-02 RU RU2002126217/28A patent/RU2002126217A/ru not_active Application Discontinuation
- 2001-03-02 BR BR0108904-8A patent/BR0108904A/pt not_active IP Right Cessation
- 2001-03-02 EP EP01916361A patent/EP1264300A2/en not_active Withdrawn
- 2001-03-02 IL IL15154601A patent/IL151546A0/xx unknown
- 2001-03-02 MX MXPA02008573A patent/MXPA02008573A/es unknown
- 2001-03-02 JP JP2001563565A patent/JP2003525466A/ja active Pending
- 2001-12-10 US US10/006,894 patent/US6772127B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02174380A (ja) * | 1988-12-27 | 1990-07-05 | Marantz Japan Inc | Ld等映像ソフト媒体の多言語化システム |
JPH03236691A (ja) * | 1990-02-14 | 1991-10-22 | Hitachi Ltd | テレビジョン受信機用音声回路 |
JPH0556007A (ja) * | 1991-08-23 | 1993-03-05 | Nippon Hoso Kyokai <Nhk> | 混合音声信号伝送方式 |
JPH05342583A (ja) * | 1992-06-12 | 1993-12-24 | Matsushita Electric Ind Co Ltd | ディスク記録装置及び再生装置 |
JPH1133228A (ja) * | 1997-07-23 | 1999-02-09 | Namco Ltd | ゲーム装置及び情報記憶媒体 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012234192A (ja) * | 2005-02-14 | 2012-11-29 | Fraunhofer Ges | オーディオソースのパラメトリックジョイント符号化 |
US9668078B2 (en) | 2005-02-14 | 2017-05-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Parametric joint-coding of audio sources |
JP2010518455A (ja) * | 2007-02-12 | 2010-05-27 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 高齢又は聴覚障害聴取者のための非スピーチオーディオに対するスピーチオーディオの改善された比率 |
JP2020039181A (ja) * | 2013-09-12 | 2020-03-12 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 多様な再生環境のためのダイナミックレンジ制御 |
US10956121B2 (en) | 2013-09-12 | 2021-03-23 | Dolby Laboratories Licensing Corporation | Dynamic range control for a wide variety of playback environments |
US11429341B2 (en) | 2013-09-12 | 2022-08-30 | Dolby International Ab | Dynamic range control for a wide variety of playback environments |
US11842122B2 (en) | 2013-09-12 | 2023-12-12 | Dolby Laboratories Licensing Corporation | Dynamic range control for a wide variety of playback environments |
Also Published As
Publication number | Publication date |
---|---|
AU2001243395A1 (en) | 2001-09-12 |
US6772127B2 (en) | 2004-08-03 |
KR20020073604A (ko) | 2002-09-27 |
RU2002126217A (ru) | 2004-04-20 |
US20020040295A1 (en) | 2002-04-04 |
EP1264300A2 (en) | 2002-12-11 |
BR0108904A (pt) | 2004-06-15 |
CN1211775C (zh) | 2005-07-20 |
CN1427987A (zh) | 2003-07-02 |
KR100799155B1 (ko) | 2008-01-29 |
IL151546A0 (en) | 2003-04-10 |
WO2001065888A9 (en) | 2003-03-06 |
WO2001065888A3 (en) | 2002-02-14 |
MXPA02008573A (es) | 2003-02-24 |
US6351733B1 (en) | 2002-02-26 |
CA2401798A1 (en) | 2001-09-07 |
WO2001065888A2 (en) | 2001-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6772127B2 (en) | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process | |
US8108220B2 (en) | Techniques for accommodating primary content (pure voice) audio and secondary content remaining audio capability in the digital audio production process | |
US11501789B2 (en) | Encoded audio metadata-based equalization | |
Bleidt et al. | Development of the MPEG-H TV audio system for ATSC 3.0 | |
Herre et al. | MPEG-H audio—the new standard for universal spatial/3D audio coding | |
TWI543642B (zh) | 用於適應性音頻信號的產生、譯碼與呈現之系統與方法 | |
US8705747B2 (en) | Object-based 3-dimensional audio service system using preset audio scenes | |
TW201010450A (en) | Apparatus and method for generating audio output signals using object based metadata | |
MXPA01012991A (es) | Mezcla descendente del canal central interactivo de voz a audio remanente (vra). | |
JP2003524906A (ja) | 聴覚障害および非聴覚障害リスナーの好みに合わせてユーザ調整能力を提供する方法および装置 | |
KR100802179B1 (ko) | 프리셋 오디오 장면을 이용한 객체기반 3차원 오디오서비스 시스템 및 그 방법 | |
JP2009537876A (ja) | プリセットオーディオシーンを用いたオブジェクトベースの3次元オーディオサービスシステム及びその方法 | |
Riedmiller et al. | Delivering scalable audio experiences using AC-4 | |
Grewe et al. | MPEG-H Audio System for SBTVD TV 3.0 Call for Proposals | |
Todd | Loudness uniformity and dynamic range control for digital multichannel audio broadcasting | |
Proper et al. | Surround+ immersive mastering | |
Fug et al. | An Introduction to MPEG-H 3D Audio | |
Lyman et al. | Dolby Digital Audio Delivery to the Consumer | |
Lyman | Program Presentation Using ATSC Audio Systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080226 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20100421 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100820 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101116 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101213 |