JP4874595B2 - マルチチャネルオーディオのパケット多重化方法、および、システム - Google Patents

マルチチャネルオーディオのパケット多重化方法、および、システム Download PDF

Info

Publication number
JP4874595B2
JP4874595B2 JP2005222020A JP2005222020A JP4874595B2 JP 4874595 B2 JP4874595 B2 JP 4874595B2 JP 2005222020 A JP2005222020 A JP 2005222020A JP 2005222020 A JP2005222020 A JP 2005222020A JP 4874595 B2 JP4874595 B2 JP 4874595B2
Authority
JP
Japan
Prior art keywords
stream
packet
streams
multiplexed
channel audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005222020A
Other languages
English (en)
Other versions
JP2006054039A (ja
Inventor
ウェイン ウォルターズ アンドリュー
バーマ アンカー
ロイド シュミト ブライアン
アレン ターディフ ジョン
サリム トピワラ サジド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2006054039A publication Critical patent/JP2006054039A/ja
Application granted granted Critical
Publication of JP4874595B2 publication Critical patent/JP4874595B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • G11B27/327Table of contents
    • G11B27/329Table of contents on a disc [VTOC]
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2562DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は一般に、コンピューティングデバイスの分野に関する。より詳細には、本発明は、復号することを目的として、マルチチャネルオーディオストリームをステレオストリームに分割し、ステレオストリームを擬似マルチチャネルストリームに多重化するシステムおよび方法に関する。
従来、マルチチャネルオーディオフォーマットは、映画の用途のために開発された。しかし近年は、Dolby DigitalやDTS(Digital Theater System)などのマルチチャネルオーディオがホームシアターシステムでも普及してきている。代表的なフォーマットには4.0および5.1が含まれ、より最近では7.1も含まれる。例えば、5.1Dolby Digitalフォーマットは、2つの前部スピーカと、2つの後部スピーカと、1つの中央スピーカと、1つの低周波効果音(LFE、low frequency effects)スピーカ(例えばサブウーファ)とを備える。これは、リスナにサラウンドサウンド体験を提供する。
マルチチャネルオーディオは改善されたリスナ体験を提供するが、マルチチャネルオーディオストリームは、従来のステレオストリームよりも、かなり多くの復号リソースを必要とする。これは、マルチチャネルストリームの情報内容がステレオストリームよりもずっと多いからである。追加の復号リソースはハードウェア要件およびコストを増加させ、これは望ましくない。
したがって、マルチチャネルオーディオストリームで使用するためのデコーダであって、従来のマルチチャネルオーディオデコーダのハードウェアコストを回避しながら、このようなストリームを復号することのできるデコーダが必要とされている。本発明はこのような解決法を提供する。
本発明は、より少ないリソースを復号プロセスに使用する、マルチチャネルオーディオを提供するためのシステムおよび方法を対象とする。本発明は、5.1チャネルオーディオストリームを3つのステレオストリームに分割し、次いで3つのステレオストリームからのパケットを多重化して擬似5.1チャネルオーディオストリームを作成する。次いで、擬似5.1チャネルオーディオストリームを復号し、出力において分離して、出力5.1チャネルオーディオサウンドを生み出す。したがって、デコーダリソースは1つのステレオストリームからのパケットを一度に復号するだけでよい。この技法は、7.1またはその他のマルチチャネルフォーマットにも等しく適用可能である。
本発明の一態様によれば、マルチチャネルオーディオデータを多重化済みオーディオストリームに符号化し、多重化済みオーディオストリームを復号するための方法およびシステムが提供される。第1の態様によれば、マルチチャネルオーディオデータを符号化する方法が提供される。この方法は、マルチチャネルオーディオデータをストリームに分割すること、各ストリームを符号化して符号化済みストリームを作成すること、符号化済みストリームを多重化して多重化済みオーディオストリームを作成することを含む。多重化済みオーディオストリームは、符号化済みストリームからのデータパケットを含む。
本発明の一特徴によれば、この方法は、多重化済みオーディオストリーム中で特定のストリームの次パケットがどこにあるかを示すスキップフィールドを、各パケット内に設けることを含むことができる。各パケットはいくつかのフレームを含むことができ、各フレームは、可変数のビットを含み、一定数のサンプルを表す。
その他の特徴によれば、デッドロックを補償する符号化方法を含めた符号化方法が提供される。符号化は、累積フレームまたは累積時間をカウントすることによって実施することができる。
本発明の別の態様によれば、多重化済みオーディオストリームを復号する方法が提供される。この方法は、多重化済みオーディオストリームを受け取ること、多重化済みオーディオストリームをデコーダに入力すること、複数のストリームを出力すること、複数のストリームをマルチチャネルオーディオ出力に多重化することを含む。
本発明の一特徴によれば、この方法は、多重化済みオーディオストリームを記憶媒体からフェッチすることを含むことができる。また、要求に応答して多重化済み擬似マルチチャネルオーディオストリーム内でシークする(seeking)方法も提供される。シークは、キュー(cue)ファイル、タイムスタンプ、または一定サイズの符号化済みファイルを使用して実施することができる。
本発明の別の特徴によれば、この方法は、多重化済み擬似マルチチャネルオーディオストリームを復号するための追加レイヤを有するオーディオコーデックを提供することを含む。
本発明の別の態様によれば、多重化済みオーディオストリームを復号するためのシステムが提供される。このシステムは、多重化済みオーディオストリームを受け取って複数のストリームを出力するデコーダと、複数のストリームをマルチチャネルオーディオ出力に多重化するマルチプレクサとを備える。コーデックを備えることもできる。
本発明の追加の特徴および利点は、添付の図面を参照しながら進める例示的な実施形態に関する以下の詳細な記述から明らかになるであろう。
前述の概要、ならびに好ましい実施形態に関する以下の詳細な記述は、添付の図面と共に読めばよりよく理解される。本発明を例示する目的で、図面には本発明の例示的な構造を示す。ただし本発明は、開示する特定の方法および手段に限定されない。
(例示的なコンピューティング環境)
図1に、本発明を実施することのできる適切なコンピューティングシステム環境の例100を示す。コンピューティングシステム環境100は、適切なコンピューティング環境の一例にすぎず、本発明の使用または機能の範囲についてどんな限定を意味するものでもない。またコンピューティング環境100は、この例示的な動作環境100に示すコンポーネントのいずれか1つまたは組合せに関してどんな依存や要件を有するものとも解釈すべきではない。
本発明は、その他多くの汎用または専用コンピューティングシステム環境または構成でも機能する。本発明で使用するのに適するであろう周知のコンピューティングシステム、環境、および/または構成の例には、限定しないがパーソナルコンピュータ、サーバコンピュータ、ハンドヘルドデバイスまたはラップトップデバイス、マルチプロセッサシステム、マイクロプロセッサベースのシステム、セットトップボックス、プログラム可能な民生用電子機器、ネットワークPC、ミニコンピュータ、メインフレームコンピュータや、これらのシステムまたはデバイスのいずれかを含む分散コンピューティング環境などが含まれる。
本発明は、プログラムモジュールなど、コンピュータによって実行されるコンピュータ実行可能命令の一般的文脈で述べることができる。一般に、プログラムモジュールは、特定のタスクを実施するか特定の抽象データ型を実現するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを含む。本発明は分散コンピューティング環境で実施することもでき、その場合、タスクは通信ネットワークまたはその他のデータ伝送媒体を介してリンクされたリモート処理デバイスによって実施される。分散コンピューティング環境では、プログラムモジュールおよびその他のデータは、メモリ記憶デバイスを含めたローカルとリモートの両方のコンピュータ記憶媒体に位置することができる。
図1を参照すると、本発明を実施するための例示的なシステムは、コンピュータ110の形の汎用コンピューティングデバイスを含む。コンピュータ110のコンポーネントには、限定しないが、処理ユニット120と、システムメモリ130と、システムメモリを含めた様々なシステムコンポーネントを処理ユニット120に結合するシステムバス121とを含めることができる。システムバス121は、様々なバスアーキテクチャのいずれかを用いた、メモリバスまたはメモリコントローラ、周辺バス、ローカルバスを含めて、いくつかのタイプのバス構造のいずれかとすることができる。限定ではなく例として、このようなアーキテクチャには、ISA(Industry Standard Architecture)バス、MCA(Micro Channel Architecture)バス、EISA(Enhanced ISA)バス、VESA(Video Electronics Standards Association)ローカルバス、PCI(Peripheral Component Interconnect)バス(メザニンバスとも呼ばれる)、PCI‐Express(Peripheral Component Interconnect Express)、SMBus(Systems Management Bus)が含まれる。
コンピュータ110は通常、様々なコンピュータ読み取り可能記憶媒体を備える。コンピュータ読み取り可能記憶媒体は、コンピュータ110からアクセスできる任意の利用可能な媒体とすることができ、揮発性と不揮発性の媒体、取外し可能と取外し不可能の媒体の両方がこれに含まれる。限定ではなく例として、コンピュータ読み取り可能記憶媒体には、コンピュータ記憶媒体および通信媒体を含めることができる。コンピュータ記憶媒体には、コンピュータ読み取り可能命令、データ構造、プログラムモジュール、その他のデータなどの情報を記憶するための任意の方法または技術で実現された、揮発性と不揮発性、取外し可能と取外し不可能の両方の媒体が含まれる。コンピュータ記憶媒体には、限定しないが、RAM、ROM、EEPROM、フラッシュメモリまたはその他のメモリ技術、CD−ROM、ディジタル多用途ディスク(DVD)、またはその他の光ディスク記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置、またはその他の磁気記憶デバイスが含まれ、あるいは、所望の情報を記憶するのに使用でき、コンピュータ110からアクセスできるその他の任意の媒体が含まれる。通信媒体は通常、コンピュータ読み取り可能命令、データ構造、プログラムモジュール、またはその他のデータを、搬送波やその他の搬送機構などの被変調データ信号に組み入れるものであり、任意の情報送達媒体がこれに含まれる。用語「被変調データ信号」は、信号中の情報が符号化される形で1つまたは複数の特性が設定または変更される信号を意味する。限定ではなく例として、通信媒体には、有線ネットワークや直接有線接続などの有線媒体と、音響、無線周波数、赤外線などの無線媒体およびその他の無線媒体とが含まれる。以上のいずれかの組合せもコンピュータ読み取り可能媒体の範囲に含めるべきである。
システムメモリ130は、ROM131やRAM132など、揮発性および/または不揮発性メモリの形のコンピュータ記憶媒体を含む。ROM131には通常、起動中などにコンピュータ110内の要素間で情報を転送するのを助ける基本ルーチンを含むBIOS(basic input/output system)133が記憶されている。RAM132は通常、処理ユニット120がすぐにアクセス可能な、および/または処理ユニット120によって現在実行されている、データおよび/またはプログラムモジュールを含む。限定ではなく例として、図1には、オペレーティングシステム134、アプリケーションプログラム135、その他のプログラムモジュール136、プログラムデータ137を示す。
コンピュータ110は、その他の取外し可能/取外し不可能、揮発性/不揮発性コンピュータ記憶媒体を備えることもできる。例にすぎないが図1には、取外し不可能な不揮発性の磁気媒体に対して読み書きするハードディスクドライブ141と、取外し可能な不揮発性の磁気ディスク152に対して読み書きする磁気ディスクドライブ151と、CD−ROMやその他の光媒体など取外し可能な不揮発性の光ディスク156に対して読み書きする光ディスクドライブ155を示す。この例示的な動作環境で使用できるその他の取外し可能/取外し不可能、揮発性/不揮発性コンピュータ記憶媒体には、限定しないが、磁気テープカセット、フラッシュメモリカード、ディジタル多用途ディスク、ディジタルビデオテープ、固体RAM、固体ROMなどが含まれる。ハードディスクドライブ141は通常、インタフェース140などの取外し不可能メモリインタフェースを介してシステムバス121に接続され、磁気ディスクドライブ151および光ディスクドライブ155は通常、インタフェース150などの取外し可能メモリインタフェースによって、システムバス121に接続される。
以上に論じ図1に示したドライブおよびそれらに関連するコンピュータ記憶媒体は、コンピュータ読み取り可能命令、データ構造、プログラムモジュール、その他のデータの記憶域をコンピュータ110に提供する。例えば図1には、ハードディスクドライブ141が、オペレーティングシステム144、アプリケーションプログラム145、その他のプログラムモジュール146、プログラムデータ147を記憶するように示されている。これらのコンポーネントは、オペレーティングシステム134、アプリケーションプログラム135、その他のプログラムモジュール136、プログラムデータ137と同じものとすることもでき、異なるものとすることもできることに留意されたい。ここでは、オペレーティングシステム144、アプリケーションプログラム145、その他のプログラムモジュール146、プログラムデータ147が少なくとも異なるコピーであることを示すために、異なる番号を付けてある。ユーザは、キーボード162、マウスやトラックボールやタッチパッドと一般に呼ばれるポインティングデバイス161などの入力デバイスを介して、コンピュータ110にコマンドおよび情報を入力することができる。その他の入力デバイス(図示せず)には、マイクロホン、ジョイスティック、ゲームパッド、衛星放送受信アンテナ、スキャナなどを含めることができる。これらおよび他の入力デバイスは、システムバス121に結合されたユーザ入力インタフェース160を介して処理ユニット120に接続されることが多いが、パラレルポート、ゲームポート、ユニバーサルシリアルバス(USB)など、その他のインタフェースおよびバス構造で接続されてもよい。モニタ191またはその他のタイプの表示デバイスも、ビデオインタフェース190などのインタフェースを介してシステムバス121に接続される。モニタに加えて、コンピュータは、スピーカ197やプリンタ196など、その他の周辺出力デバイスも備えることができ、これらは出力周辺インタフェース195を介して接続することができる。
コンピュータ110は、リモートコンピュータ180など1つまたは複数のリモートコンピュータへの論理接続を用いて、ネットワーク化された環境で動作することができる。リモートコンピュータ180は、パーソナルコンピュータ、サーバ、ルータ、ネットワークPC、ピアデバイス、またはその他の一般的なネットワークノードとすることができ、通常はコンピュータ110に関して上述した要素の多くまたはすべてを備えるが、図1にはメモリ記憶デバイス181だけが示してある。図1に示す論理接続は、ローカルエリアネットワーク(LAN)171およびワイドエリアネットワーク(WAN)173を含むが、その他のネットワークを含むこともできる。このようなネットワーキング環境は、オフィス、企業規模のコンピュータネットワーク、イントラネット、インターネットでよくみられる。
LANネットワーキング環境で使用されるときは、コンピュータ110は、ネットワークインタフェースまたはアダプタ170を介してLAN171に接続される。WANネットワーキング環境で使用されるときは、コンピュータ110は通常、インターネットなどのWAN173を介した通信を確立するためのモデム172またはその他の手段を備える。モデム172は内蔵でも外付けでもよく、ユーザ入力インタフェース160またはその他の適切な機構を介してシステムバス121に接続することができる。ネットワーク化された環境では、コンピュータ110に関して示したプログラムモジュールまたはその一部を、リモートのメモリ記憶デバイスに記憶することができる。限定ではなく例として、図1には、リモートアプリケーションプログラム185がメモリデバイス181上にあるのが示されている。図示されたネットワーク接続は例示的なものであり、コンピュータ間で通信リンクを確立するためのその他の手段を使用してもよいことは理解されるであろう。
(パケット多重化マルチチャネルオーディオの例示的な実施形態)
本発明は、5.1チャネルオーディオストリーム(またはその他のマルチチャネルオーディオストリーム)を、3つのステレオストリームに分割するためのシステムおよび方法を実現する。3つのステレオストリームそれぞれからのパケットを多重化して、擬似5.1チャネルオーディオストリームを作成する。その後、ステレオストリームからパケットを復号および多重化して、5.1チャネルオーディオストリームをレンダリングする。したがって、デコーダは、ステレオチャネルを多重化して元の5.1ストリームを再現する前に、1つのステレオストリームからのパケットを一度に復号するだけである。
次に図2を参照すると、本発明による符号化プロセスが示されている。図のように、オーディオデータが3つのステレオストリーム202、203、204に分割される。各ステレオストリームは、エンコーダ205、206、207によって符号化されて、符号化済みストリーム208、209、210が生み出される。符号化済みストリーム208、209、210は、単一のファイル211に多重化される。このインタリーブ形式ファイル中の所与のストリームの各パケットは、そのストリームの次パケットがどこにあるかを示す「パケットスキップ」フィールドを有する。各パケットはいくつかのフレームを含み、各フレームは、可変数のビットを含むが、一定数のサンプル(したがって一定の長さの時間)を表す。ストリームのビットレートが高いほど、それが含む1パケットあたりのフレームは少なく、ストリームのビットレートが低いほど、それが含む1パケットあたりのフレームは多い。ストリームを共に多重化することによって、本発明は有利にも、後述するように記憶媒体を1回シークするだけでマルチチャネルオーディオを提供する単一のファイル(ファイル211)を生み出す。
本発明によれば、デッドロック回避なしの第1の多重化アルゴリズムを使用して、パケットを多重化することができる。この第1の多重化アルゴリズムによれば、パケットのインタリーブはストリームのビットレートだけに基づく。第1のアルゴリズムでは、パケットスキップフィールドが有することのできる最大値に対する制限はない。
0からn−1までの番号の付いたn個のストリームをインタリーブするために、このアルゴリズムは以下のようにする。
1.初期化。0からn−1の順に、各ストリームから1パケットずつ挿入する。各ストリームの挿入済みフレーム累積数を追跡する。
2.それまでに挿入されたフレームの累積数が最も少ないいずれかのストリームからのパケットを1つ追加する。そのストリームの累積フレームカウントを更新する。すべてのストリームからのすべてのパケットが追加されるまで継続する。
2つのストリームが多重化される場合であって、ストリーム0(S0)が1パケットあたり6個のフレームを有し、ストリーム1(S1)が1パケットあたり10個のフレームを有する場合(ただし1パケットあたりのフレーム数はパケットごとに異なってもよいことに留意されたい)、アルゴリズムは以下のように動作する。
まずS0からのパケットを挿入し、次いでS1からのパケットを挿入する。累積フレームカウントをそれぞれ6および10に初期化する。次に、S0が最小フレームカウントを有するので、S0からのパケットを追加し、その累積フレームカウントを12に更新する。次いで、S1のカウントが10なので、S1からのパケットを追加する。累積フレームカウント付きのパケット順番は以下のように継続する。
S0(6) S1(10) S0(12) S1(20) S0(18) S0(24) S1(30) S0(30)(タイ(tie)) S0(36) S1(40)....
このアルゴリズムを使用すると、2つのストリームのビットレートが大きく異なる場合にデッドロックが生じる可能性がある。例えば、S0が1パケットあたり10個のフレームを有し、S1が1パケットあたり1個のフレームを有すると仮定する。この場合、アルゴリズムは以下のインタリーブ形式ストリームを生み出す。
S0 S1 S1 S1 S1 S1 S1 S1 S1 S1 S1 S0 S1....
S0とS1が同時に復号されるが、それぞれ3パケットずつの2つのバッファに、一度に6つのパケットしかバッファリングされないと仮定する。このことは、最初、第1のバッファはS0からの10個のフレーム(1パケット)およびS1からの2個のフレーム(2パケット)を保持し、第2のバッファはS0からのフレームを保持せずS1からの3個のフレーム(3パケット)を保持することを意味する。各ストリームからの5個のフレームが復号された後、ストリームS1のデータをさらに読み取る必要があり、これは第1の3パケットバッファがクリアされてリロードされることを意味する。しかし、第1のバッファはまだストリームS0のフレームをさらに5個含んでおり、したがって完全にクリアすることはできない。2つのインタリーブ形式ストリームを同時に復号し続ける唯一の方法は、バッファのサイズを増大することである。
この問題を回避するために、本発明によれば、デッドロック回避ありの第2のアルゴリズムを使用することができる。前述のような状況を回避するために、低ビットレートストリームのビットレートを増加させ、それにより、所与のストリームについてあるパケットから次のパケットに移動するためにスキップする必要のあるパケットの数を制約することができる。
いずれかの所与の地点でスキップするパケットの最大数がmであるという制約付きで、0からn−1までの番号の付いたn個のストリームをインタリーブするために、このアルゴリズムは以下のようにする。
1.初期化。0からn−1の順に、各ストリームから1パケットずつ挿入する。各ストリームの挿入済みフレーム累積数、ならびに各ストリームの現在スキップカウントを追跡する。初期化後、ストリーム0の現在スキップカウントはn−1である(すなわち、次のパケットがストリーム0から来る場合、ストリーム0の第1のパケットのパケットスキップはn−1となる)。ストリームn−1の現在スキップカウントは0である。
2.いずれかのストリームの現在スキップカウントが最大スキップカウントmに等しい場合は、ステップ3に飛ぶ。そうでない場合は、それまでに挿入されたフレームの累積数が最も少ないいずれかのストリームからのパケットを1つ追加する。このストリームの累積フレームカウントを更新し、このストリームの現在スキップカウントを0にリセットする。その他のすべてのストリームの現在スキップカウントをインクリメントする。ステップ2を、すべてのストリームからのすべてのパケットが追加されるまで継続する。
3.ストリームのうちの1つ(例えばストリームk)が最大スキップカウントに達した場合は、このストリームからのパケットを挿入するが、すべてのストリームの同期を維持するために、このストリームのビットレートを調整する必要がある。次に、それまでに挿入されたフレームの累積数が最も少ないのはどのストリームかを決定する。ストリームkである場合は、ビットレート調整は必要なく、したがってストリームkからのパケットを1つ追加し、その累積フレームカウントを更新し、そのスキップカウントを0にリセットし、その他のストリームの現在スキップカウントを更新する。処理はステップ2に戻り、そうでない場合はステップ4に進む。
4.ストリームkについてビットレート調整を行う必要がある。ストリームkの挿入済みフレーム累積数が、最も少ない挿入済みフレーム累積数を有するストリームのそれと等しくなるように、ストリームkについて挿入された前のパケットを切り捨てる。ステップ5に進む。
5.ストリームkのパケットを挿入する。このパケットの先頭は、前のパケットから切り捨てられたフレームからなる。次に、1つのパケットを読み込む。このパケットの最初の部分を使用して、挿入されたパケットの残りの部分を埋める。このパケットの残りはバッファに記憶し、ストリームkについて挿入されることになる後続のパケットの先頭として使用する。ストリームkの累積フレームカウントを更新し、そのスキップカウントを0にリセットし、他のストリームの現在スキップカウントをインクリメントする。処理はステップ2に戻る。
ストリームS0が1パケットあたり10個のフレームを有し、S1が1パケットあたり1個のフレームを有する例に戻るが、それぞれ3パケットずつの2つのバッファがある場合、最大パケットスキップを2として、各ストリームからの少なくとも1つのパケットが各バッファ中にあるようにすることが望ましい。これは、デッドロック状況が生じるのを防止することになる。
したがって、最初に初期化が行われ、これにより以下のストリームが生み出される(累積フレームカウントを括弧内に示す)。
S0(10) S1(1)
この時点で、S0の現在スキップカウントは1であり、S1の現在スキップカウントは0であり、これらは両方とも最大値2よりも小さい。したがって、S1が最小累積フレームカウントを有するので、以下のようにS1からのパケットを挿入する。
S0(10) S1(1) S1(2)
今やS0の現在スキップカウントは2であり、これは最大値である。S1はずっと遅れをとっているので、S1からのパケットを挿入するのが望ましいが、上述のアルゴリズムではS0からのパケットを挿入することが求められる。S0の10フレームパケットがもう1つ挿入されれば、すぐにS1よりもずっと先を行くことになり、デッドロックが生じるであろう。S0のビットレートを調整するのはこのためである。上述のアルゴリズムのステップ3に従うと、それまでに挿入されたフレーム数が最も少ないのはストリームS1である(すなわち2)。したがってステップ4で、S0がS1と同等になるように、S0について挿入された前のパケットを切り捨てて以下のようにする。
S0(2) S1(1) S1(2)
次にステップ5で、S0のパケットを挿入する。S0からの第1パケットから切り捨てられた8個のフレームを、読み込まれた次のパケットからの2個の追加フレームに付加して、10フレームのパケットを生成する。これにより8個のフレームが残り、これらはバッファに記憶される。
S0(2) S1(1) S1(2) S0(12)(S0バッファは8個のフレームを有する)
ステップ2に戻り、S1からさらに2つのパケットを挿入する。
S0(2) S1(1) S1(2) S0(12) S1(3) S1(4)(S0バッファは8個のフレームを有する)
再び、S0はその最大スキップカウントに達している。したがって、S0の前パケットからの8個のフレームを除去して、その累積フレームカウントをS1の累積フレームカウントまで減少させる。これらのフレームは、S0について挿入されることになるパケットの先頭を形成する。次に、次のパケット中にはあと2個のフレームのための空間があるが、バッファに8個入っているので、バッファから2個を取り、6個が残る。この場合、S0のパケットを読み込む必要はないことに留意されたい。これにより以下のストリームが得られる。
S0(2) S1(1) S1(2) S0(4) S1(3) S1(4) S0(14)(S0バッファは6個のフレームを有する)
このパターンが継続すると、S0のパケット数はS1の半分になる。しかし、S0が元々持っていたパケット数は10分の1だったので、S0のビットレートを意図的に増加させている。このアルゴリズムは、多くの可能なアルゴリズムのうちの1つに過ぎないことに留意されたい。その他のアルゴリズムも、ビットレートの点でより効率的なインタリーブ形式ストリームを生み出す場合がある。例えば、3つのパケットをそれぞれ有する2つのバッファ内で入念に整列させることにより、以下のインタリーブも機能するであろう。
S0(5) S1(1) S1(2) S1(3) S1(4) S1(5) S0(10) S1(6) S1(7) S1(8) S1(9) S1(10)...
ただしこれは、ストリームがDVDまたはその他の媒体から読み取られる場合にデコーダ効率を低下させる可能性のある、「デッドロックに近い」条件を生み出す。第1のバッファはS0からの1つのパケットおよびS1からの2つのパケットを含み、第2のバッファはS1からの3つのパケットを含む。2つのバッファは共に、各ストリームからの合計5個のフレームを含む。S0からの第5フレームが第1のバッファ中にあり、S1からの第5フレームが第2のバッファ中にあるので、両方のバッファは同時に枯渇する。このことは、2重バッファリングがレイテンシ隠蔽において有する利点が失われることを意味する。
次に、異なるサンプルレートのストリームを多重化する方法について述べる。前述のように、この多重化アルゴリズムの目標は、個々のストリームをできるだけ相互と同期した状態に近くなるよう維持することである。すべてのストリームが同じサンプリングレートを有する場合は、上で説明したようにフレームをカウントすれば十分である。しかし、ストリームが異なるサンプリングレートを有する場合は、時間についてカウントするのが好ましい。その他の点では、フレームをカウントするのも時間をカウントするのも、ほぼ同様に機能する。
例として、S0とS1が両方とも1パケットあたり10個のフレームを有すると仮定する。しかし、S0は32kHzでサンプリングされ、S1は44.1kHzでサンプリングされる。1フレームあたり512個のサンプルがある場合、32kHzのフレームは16ミリ秒の継続時間を有し、44.1kHzのフレームは11.6ミリ秒の継続時間を有する。したがって、S0からのパケットは160ミリ秒のオーディオを有し、S1からのパケットは116ミリ秒のオーディオを有する。フレームの代わりに時間を使用して前述の第1のアルゴリズムに従うと、以下のインタリーブが得られる(累積時間を括弧内に示す)。
S0(160) S1(116) S1(232) S0(320) S1(348) S0(480) S1(464) S1(580) S0(640)...
本発明によれば、このストリーム多重化機構は、より多くのチャネルに拡張可能である。これは、特定のストリームからのパケットのパケットヘッダが、そのストリームからの次のパケットに到達するために何個のパケットをスキップすべきかをデコーダに伝える「スキップ」数を含むからである。例えば、以下のように多重化されたステレオストリームS0、S1、S2がある。
S0 S1 S2 S1 S1 S2 S0 S2 S0 S2 S1...
ファイルヘッダはまた、何個のステレオストリームが最終的な擬似5.1ストリームに多重化されるかに関する情報も含む。この情報は、デコーダによって読み取られる8ビットフィールドに含めることができる。この例では、デコーダに情報を与えるために、ストリームの最初の3つのパケットは、各構成ストリームからの1パケットずつを含む。ここで、S0に属する第1のパケットのパケットヘッダは5に設定されることになる。というのは、S0からの次のパケットに到達するには5つのパケットをスキップしなければならないからである。同様に、S1に属する第1のパケットのパケットヘッダはスキップ1を有することになり、以下同様になる。
この機構は、4つのステレオストリームがある7.1の場合にも容易に拡張される。7.1ストリームの場合、ファイルヘッダは、4つのステレオストリームがあるという情報を含むことになり、最初の4つのパケットは4つの構成ストリームから来る(すなわち各ストリームから1つずつ)。本発明の機構は、モノラルとステレオのストリームの組合せ、さらにはより高次のストリーム(3つ以上のチャネルを有するストリーム)の組合せにも拡張することができる。
この機構を拡張する別の方法は、複数のストリームを多重化し、次いで分離操作でストリームのサブセットを選択し、それによりいくつかのストリームを混合し、それらに効果を適用することである。これは、例えば多重化済みストリームがある種のサウンド効果のすべてのバリエーションである場合に望ましいことがあり、ストリーム間で切り換え、混合比率を調整し、あるいは効果を改変することによって、元のサウンド効果において非常に幅広いバリエーションをその場で得ることができる。
次に図3を参照すると、本発明による復号プロセスが示されている。多重化済みファイル211がデコーダ213に入力され、デコーダ213は3つのステレオストリーム214、215、216を出力する。出力ストリーム214、215、216は、マルチプレクサ217によって6チャネルのオーディオデータ(例えば5.1ストリーム)に多重化され、これは例えばサラウンドサウンドシステムに出力される。本発明によれば、この手法に必要な復号リソースは、5.1ストリームの復号に必要なリソースよりもずっと少ない。しかし、個々のステレオストリームが同期した状態に維持されるようにしてパケット多重化が実施されるので、5.1構造は維持される。これは、デコーダがすべてのストリームから同じ時間的オーディオ部分をフェッチするのに役立つ。
さらに、ステレオストリームのパケットを多重化することにより、記憶媒体からの必要なフェッチはより少なくなる。これは、多くの時間クリティカルなシステムにとって重要な利益である。例えば、記憶媒体がDVDの場合、DVD上のファイルのある適切な部分までシークするのに150〜200ミリ秒かかる可能性があるので、データのフェッチに時間がかかる可能性がある。多くの(すなわち何百個もの)オーディオストリームが共に混合されて最終的な出力が生み出される場合、各5.1ストリームにつき3つのストリームを作成することでフェッチする必要のあるストリームの数が3倍になると、シークの問題はかなり悪化する。
本発明は、ストリーム内でのシークにも対応する。シークは、キューファイルやタイムスタンプを使用して、あるいは一定サイズのファイルを符号化することによって実施することができる。後者は、圧縮を犠牲にするが、既知のファイル長の中にどれだけ遠くシークすべきかを決定するのが容易である。キューファイルは、x秒進むのにどれだけ遠くファイル中にジャンプすべきかに関する情報を含む。パケットヘッダに埋め込まれたタイムスタンプを順方向検索アルゴリズムと共に使用して、各ストリームの第1の利用可能パケットを突き止めることができ、また復号済み出力データを正しく整列させることができる。両方の方法の組合せを使用することも可能である。
シークするための例示的なアルゴリズムは次のとおりとすることができる。意図されたファイル位置までシークし、第1のパケットを復号し、このパケットがどのストリームに属するかを記録する(ファイルヘッダ属性は、何個のストリームが予期され、どんなストリーム割当てであるか(すなわち左/右前部チャネルにはストリーム0、左/右サラウンドチャネルにはストリーム1など)を示す)。
次に、パケットヘッダ中のスキップフィールドを調べて、現在のストリームの次パケットがどこにあるかを知る。また、パケットヘッダ中のタイムスタンプも見て、現在のサンプルがどの時間のものかを知る。次いで、次のパケットヘッダを復号する。このようにして、すべてのストリームのパケットを復号する。次に、同じタイムスタンプを有するすべてのストリームの第1のパケットを使用して、有効としてマークする(すなわちハードウェア再生を開始する)。この時点から、復号プロセスは正常に進行する。
本発明は、ハードウェアとソフトウェアの組合せによって実施することができる。具体的には、ハードウェア中での後処理ステップと共に、モノラルやステレオなどのストリームをマルチチャネルストリームに再編成するためのレイヤをコーデック(WMA)に追加することができる。さらに、デコーダは、復号時にストリーム211を分離できることが必要になる。
本発明を様々な図の好ましい実施形態に関して述べたが、本発明を逸脱することなく、本発明と同じ機能を実施するために、その他の同様の実施形態を用いることもでき、上述した実施形態に修正および追加を行うこともできることを理解されたい。例えば、本出願で述べた本発明は、有線であれ無線であれ任意のコンピューティングデバイスまたは環境に適用することができ、また、通信ネットワークを介して接続され対話する任意の数のこのようなコンピューティングデバイスに適用することができることを、当業者なら理解するであろう。加えて、符号化機能と復号機能は、同じシステム上にある必要はない。さらに、特に無線ネットワークデバイスの数が急増し続けているため、ハンドヘルドデバイスオペレーティングシステムやその他のアプリケーション特有オペレーティングシステムを含めて、様々なコンピュータプラットフォームが企図されることも強調しておくべきである。さらに本発明は、複数の処理チップまたはデバイス中で、あるいはそれらにまたがって実施することができ、記憶も同様に複数のデバイスにまたがって達成することができる。したがって、本発明はいずれか1つの実施形態に限定されるべきではなく、添付の特許請求の範囲に従った広さおよび範囲で解釈されるべきである。
本発明の態様を実施することのできる例示的なコンピューティング環境を示すブロック図である。 本発明による符号化プロセスを示す図である。 本発明による復号プロセスを示す図である。

Claims (14)

  1. マルチチャネルオーディオデータを符号化する方法であって、
    前記マルチチャネルオーディオデータをストリームに分割すること、
    前記ストリームそれぞれを符号化して符号化済みストリームを作成すること、および、
    前記符号化済みストリームを多重化して多重化済みオーディオストリームを作成することであって、前記多重化済みオーディオストリームは前記符号化済みストリームからのデータパケットを含み、各パケットは、前記多重化済みオーディオストリーム中で特定のストリームの次パケットがどこにあるかを示すスキップフィールドを有すること、および、
    デッドロック回避アルゴリズムに基づいて、前記スキップフィールドの値を設定すること
    を備えることを特徴とする方法。
  2. 前記各パケットはいくつかのフレームを含み、各フレームは可変数のビットを含み一定数のサンプルを表すこと
    を特徴とする請求項1に記載の方法。
  3. (a)0からn−1までの番号の付いたストリームについて、0からn−1の順に各ストリームから1パケットずつ挿入することであって、スキップされるパケットの最大数がmであること、
    (b)各ストリームの挿入済みフレーム累積数、および各ストリームの現在スキップカウントを追跡すること、
    (c)第1のストリームの現在スキップカウントがmに等しいかどうか判定し、等しい場合はステップ(d)に飛び、そうでない場合は、それまでに挿入されたフレームの累積数が最も少ない第2のストリームからのパケットを1つ追加し、前記第2のストリームの累積フレームカウントを更新し現在スキップカウントをリセットし、その他のすべてのストリームの現在スキップカウントをインクリメントし、すべてのストリームからのすべてのパケットが追加されるまでステップ(c)を継続すること、
    (d)それまでに挿入されたフレームの累積数が最も少ないのはどのストリームかを判定することによって、前記第1のストリームのビットレートを調整してすべてのストリームの同期を維持する必要があるかどうか決定することであって、
    前記第1のストリームである場合は、ビットレート調整は必要なく、前記第1のストリームからのパケットを1つ追加し、前記第1のストリームの累積フレームカウントを更新し、前記第1のストリームのスキップカウントをリセットし、他のストリームのスキップカウントを更新し、ステップ(b)に戻り、あるいは、
    前記第1のストリームでない場合は、前記第1のストリームの挿入済みフレーム累積数が、最も少ない挿入済みフレーム累積数を有する第2のストリームの挿入済みフレーム累積数と等しくなるように、前記多重化済みオーディオストリームに挿入された前記第1のストリームの前パケットを切り捨てることによって、前記第1のストリームのビットレートを調整すること、および、
    (e)前記第1のストリームのパケットを初めに挿入することであって、前記第1のパケットの先頭は前パケットから切り捨てられたフレームを含み、次パケットを読み取り、前記次パケットの一部を使用して前記第1のパケットを完成させ、前記次パケットの残りをバッファに記憶し、前記第1のストリームの累積フレームカウントを更新し、前記第1のストリームのスキップカウントをリセットし、他のストリームの現在スキップカウントをインクリメントし、ステップ(b)に戻ること
    をさらに含むことを特徴とする請求項2に記載の方法。
  4. 累積フレームカウントではなく累積時間が追跡されることを特徴とする請求項に記載の方法。
  5. 何個のストリームが前記多重化済みストリームに多重化されるかに関する情報を提供することをさらに含むことを特徴とする請求項1に記載の方法。
  6. 請求項1に記載の方法によって符号化された多重化済みオーディオストリームを復号する方法であって、
    前記多重化済みオーディオストリームを受け取ること、
    前記多重化済みオーディオストリームをデコーダに入力すること、
    複数のストリームを出力すること、および、
    前記複数のストリームをマルチチャネルオーディオ出力に多重化すること
    を含むことを特徴とする方法。
  7. 前記多重化済みオーディオストリームを記憶媒体からフェッチすることをさらに含むことを特徴とする請求項に記載の方法。
  8. 要求に応答して前記多重化済み擬似マルチチャネルオーディオストリーム内でシークすることをさらに含むことを特徴とする請求項に記載の方法。
  9. キューファイルまたは一定サイズの符号化済みファイルを使用してシークが実施されることを特徴とする請求項に記載の方法。
  10. 前記多重化済み擬似マルチチャネルオーディオストリームを復号するための追加レイヤを有するオーディオコーデックを提供することをさらに含むことを特徴とする請求項に記載の方法。
  11. 請求項1に記載の方法によって符号化された多重化済みオーディオストリームを復号するシステムであって、
    前記多重化済みオーディオストリームを受け取って複数のストリームを出力するデコーダと、
    前記複数のストリームをマルチチャネルオーディオ出力に多重化するマルチプレクサと
    を備えることを特徴とするシステム。
  12. 前記多重化済み擬似マルチチャネルオーディオストリームは記憶媒体からフェッチされることを特徴とする請求項11に記載のシステム。
  13. 前記デコーダは、要求に応答して、キューファイルまたは一定サイズの符号化済みファイルを使用して前記多重化済みオーディオストリーム内でシークすることを特徴とする請求項12に記載のシステム。
  14. 前記多重化済み擬似マルチチャネルオーディオストリームを復号するための追加レイヤを有するオーディオコーデックをさらに備えることを特徴とする請求項11に記載のシステム。
JP2005222020A 2004-07-29 2005-07-29 マルチチャネルオーディオのパケット多重化方法、および、システム Active JP4874595B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/901,575 2004-07-29
US10/901,575 US7706415B2 (en) 2004-07-29 2004-07-29 Packet multiplexing multi-channel audio

Publications (2)

Publication Number Publication Date
JP2006054039A JP2006054039A (ja) 2006-02-23
JP4874595B2 true JP4874595B2 (ja) 2012-02-15

Family

ID=35414688

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005222020A Active JP4874595B2 (ja) 2004-07-29 2005-07-29 マルチチャネルオーディオのパケット多重化方法、および、システム

Country Status (5)

Country Link
US (1) US7706415B2 (ja)
EP (1) EP1624448B1 (ja)
JP (1) JP4874595B2 (ja)
AT (1) ATE456129T1 (ja)
DE (1) DE602005018999D1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7706415B2 (en) * 2004-07-29 2010-04-27 Microsoft Corporation Packet multiplexing multi-channel audio
US8284713B2 (en) * 2006-02-10 2012-10-09 Cisco Technology, Inc. Wireless audio systems and related methods
US8886823B2 (en) * 2006-09-20 2014-11-11 Orange Method of communicating between several terminals
US8209609B2 (en) * 2008-12-23 2012-06-26 Intel Corporation Audio-visual search and browse interface (AVSBI)
US8537724B2 (en) * 2009-03-17 2013-09-17 Motorola Mobility Llc Relay operation in a wireless communication system
KR101641684B1 (ko) * 2009-08-18 2016-07-21 삼성전자주식회사 디지털 멀티미디어 방송의 전송 장치 및 방법, 수신 장치 및 방법
KR20110115806A (ko) * 2010-04-16 2011-10-24 삼성전자주식회사 디스플레이 장치 및 3d 안경, 그리고 이를 포함하는 디스플레이 시스템
US8613038B2 (en) * 2010-10-22 2013-12-17 Stmicroelectronics International N.V. Methods and apparatus for decoding multiple independent audio streams using a single audio decoder
US8718806B2 (en) 2011-09-02 2014-05-06 Apple Inc. Slave mode transmit with zero delay for audio interface
WO2015134579A1 (en) 2014-03-04 2015-09-11 Interactive Intelligence Group, Inc. System and method to correct for packet loss in asr systems
US20150256587A1 (en) * 2014-03-10 2015-09-10 JamKazam, Inc. Network Connection Servers And Related Methods For Interactive Music Systems
US9628868B2 (en) 2014-07-16 2017-04-18 Crestron Electronics, Inc. Transmission of digital audio signals using an internet protocol
US10454982B1 (en) 2016-03-18 2019-10-22 Audio Fusion Systems, Inc. Monitor mixing system that distributes real-time multichannel audio over a wireless digital network
US10447430B2 (en) 2016-08-01 2019-10-15 Sony Interactive Entertainment LLC Forward error correction for streaming data
US10638192B2 (en) * 2017-06-19 2020-04-28 Wangsu Science & Technology Co., Ltd. Live streaming quick start method and system

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3264290B2 (ja) * 1992-09-22 2002-03-11 ソニー株式会社 復号方法および復号装置
US5451942A (en) * 1994-02-04 1995-09-19 Digital Theater Systems, L.P. Method and apparatus for multiplexed encoding of digital audio information onto a digital audio storage medium
US5680512A (en) * 1994-12-21 1997-10-21 Hughes Aircraft Company Personalized low bit rate audio encoder and decoder using special libraries
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US6222983B1 (en) * 1997-03-25 2001-04-24 Samsung Electronics Co., Ltd. DVD-audio disk, and apparatus and method for playing the same
US6094443A (en) * 1997-10-30 2000-07-25 Advanced Micro Devices, Inc. Apparatus and method for detecting a prescribed pattern in a data stream by selectively skipping groups of nonrelevant data bytes
US6738561B1 (en) * 1997-11-21 2004-05-18 Victor Company Of Japan, Ltd. Recording medium and signal processing apparatus
JP3407287B2 (ja) * 1997-12-22 2003-05-19 日本電気株式会社 符号化復号システム
US6405338B1 (en) * 1998-02-11 2002-06-11 Lucent Technologies Inc. Unequal error protection for perceptual audio coders
US6442329B1 (en) * 1998-02-28 2002-08-27 Michael L. Gough Method and apparatus for traversing a multiplexed data packet stream
JP3357288B2 (ja) * 1998-04-10 2002-12-16 パイオニア株式会社 情報記録媒体及び再生装置
GB9820655D0 (en) * 1998-09-22 1998-11-18 British Telecomm Packet transmission
US6463410B1 (en) * 1998-10-13 2002-10-08 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US6757659B1 (en) * 1998-11-16 2004-06-29 Victor Company Of Japan, Ltd. Audio signal processing apparatus
KR100915120B1 (ko) * 1999-04-07 2009-09-03 돌비 레버러토리즈 라이쎈싱 코오포레이션 다중-채널 오디오 신호들을 무손실 부호화 및 복호화하기 위한 장치 및 방법
US7302396B1 (en) * 1999-04-27 2007-11-27 Realnetworks, Inc. System and method for cross-fading between audio streams
US6598172B1 (en) * 1999-10-29 2003-07-22 Intel Corporation System and method for clock skew compensation between encoder and decoder clocks by calculating drift metric, and using it to modify time-stamps of data packets
GB9930787D0 (en) * 1999-12-30 2000-02-16 Koninkl Philips Electronics Nv Method and apparatus for convrerting data streams
US6763390B1 (en) * 2000-01-24 2004-07-13 Ati Technologies, Inc. Method and system for receiving and framing packetized data
JP3606455B2 (ja) * 2001-03-30 2005-01-05 日本ビクター株式会社 音声信号伝送方法及び音声復号方法
US7460629B2 (en) * 2001-06-29 2008-12-02 Agere Systems Inc. Method and apparatus for frame-based buffer control in a communication system
US7062429B2 (en) * 2001-09-07 2006-06-13 Agere Systems Inc. Distortion-based method and apparatus for buffer control in a communication system
JP4366912B2 (ja) * 2002-09-10 2009-11-18 ソニー株式会社 復号装置及び復号方法
US7039054B2 (en) * 2002-11-19 2006-05-02 Intel Corporation Method and apparatus for header splitting/splicing and automating recovery of transmit resources on a per-transmit granularity
US7706415B2 (en) * 2004-07-29 2010-04-27 Microsoft Corporation Packet multiplexing multi-channel audio

Also Published As

Publication number Publication date
US20060023706A1 (en) 2006-02-02
DE602005018999D1 (de) 2010-03-11
JP2006054039A (ja) 2006-02-23
EP1624448A2 (en) 2006-02-08
EP1624448A3 (en) 2008-04-02
ATE456129T1 (de) 2010-02-15
EP1624448B1 (en) 2010-01-20
US7706415B2 (en) 2010-04-27

Similar Documents

Publication Publication Date Title
JP4874595B2 (ja) マルチチャネルオーディオのパケット多重化方法、および、システム
US7130316B2 (en) System for frame based audio synchronization and method thereof
US7072726B2 (en) Converting M channels of digital audio data into N channels of digital audio data
RU2564681C2 (ru) Способы и системы синхронизации и переключения для системы адаптивного звука
EP2223230B1 (en) Chunk header incorporating binary flags and correlated variable-length fields
CN100505064C (zh) 声音再生装置
JP5006315B2 (ja) オーディオ信号のエンコーディング及びデコーディング方法及び装置
US6108584A (en) Multichannel digital audio decoding method and apparatus
JP4354455B2 (ja) 再生装置および再生方法
JP5197702B2 (ja) 情報保存媒体を再生する再生方法及び記録媒体
WO2012122397A1 (en) System for dynamically creating and rendering audio objects
JP2008538239A (ja) データストリームおよびマルチチャネル表現を生成するための装置および方法
US20120239409A1 (en) Bit-stream processing/transmitting and/or receiving/processing method, medium, and apparatus
EP1499047A2 (en) Method and apparatus for mixing audio stream, and information storage medium
KR20090037278A (ko) 객체기반 오디오 콘텐츠 송수신 방법 및 그 장치
US20090007208A1 (en) Program, data processing method, and system of same
KR20130112708A (ko) 재생에 선행하여 베이스 층 및 적어도 하나의 강화 층을 포함하는 층화된 계층적 비트 스트림을 검색하기 위한 방법 및 장치
KR20090115074A (ko) 슈퍼 프레임을 이용하여 멀티채널 오디오 신호를 송수신하는 방법 및 장치
US6718119B1 (en) Video/audio decoding apparatus and method
RU2383941C2 (ru) Способ и устройство для кодирования и декодирования аудиосигналов
KR100917844B1 (ko) 멀티채널 오디오 신호를 전송 또는 재생하는 장치 및 방법
US7664373B2 (en) Program, data processing method, and system of same
Terriberry et al. Ogg Encapsulation for the Opus Audio Codec
KR20080010980A (ko) 부호화/복호화 방법 및 장치.
Terriberry et al. RFC 7845: Ogg Encapsulation for the Opus Audio Codec

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080728

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110308

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110802

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111028

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111118

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111124

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141202

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4874595

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250