JP2002512456A

JP2002512456A - ネットワーク内でオーディオ・プロトコルをサポートするための方法および装置

Info

Publication number: JP2002512456A
Application number: JP2000545085A
Authority: JP
Inventors: ルバーグ，アラン・ティ
Original assignee: Sun Microsystems Inc
Current assignee: Sun Microsystems Inc
Priority date: 1998-04-20
Filing date: 1999-04-20
Publication date: 2002-04-23
Also published as: AU3655099A; EP1074135A2; WO1999054801A2; DE69927580D1; HK1035820A1; WO1999054801A3; CA2329414A1; ATE306167T1; US6675054B1; EP1074135B1; AU760909B2

Abstract

(57)【要約】ネットワーク環境内でオーディオ・プロトコルをサポートするための方法および装置。受信器に関連付けられたオーディオ処理およびハードウェア要件は、ネットワーク上の送信器と受信器との間のオーディオ・データ伝送用に単一のオーディオ・プロトコルを指定することによって最小限にされる。プロトコルは、高品質の音声を可能にし、受信器の複雑さをさらに最小限にする、サンプリング・レート、ビット解像度、および量子化方式を指定する。送信器には、必要に応じてオーディオ・データを指定されたプロトコルに変換するためのドライバが備えられる。ネットワークを介したオーディオ・ストリームの伝送に伴う問題を補償するために、指定されたプロトコルの態様が提供される。指定されたプロトコルは、パケット喪失によって連続的にオーディオ・データ・サンプルを紛失することにより結果的に生じるエラーを最小限にするために、データ・パケット内のオーディオ・サンプルをインターリーブする形式を指定する。受信器は、さらに補間によってオーディオ・データ・サンプルの喪失を補償することができる。指定されたプロトコルに従い、オーディオ・データがどのように処理されるかを管理するためにシーケンス・サイズが指定される。送信器は、オーディオ待ち時間を各オーディオ・アプリケーションについて指定された制限内で維持するために、シーケンス・サイズを適応的に制御する。指定されたプロトコルは、複数のオーディオ出力装置間で、複数のチャネルを備えたオーディオ・データがどのようにミキシングおよびルーティングされるかを指定するために、ミックス・モードおよびいくつかのチャネルも決定する。

Description

【発明の詳細な説明】

【０００１】（発明の背景）１．発明の分野本発明は、デジタル・オーディオの分野、より具体的に言えば、ネットワーク
環境内でのデジタル・オーディオ・アプリケーションに関する。

【０００２】Ｓｕｎ、ＳｕｎＭｉｃｒｏｓｙｓｔｅｍｓ、Ｓｕｎ社のロゴ、Ｓｐａｒｃ、
Ｊａｖａ、ならびにすべてのＪａｖａベースの商標およびロゴは、米国および他
の国でのＳｕｎＭｉｃｒｏｓｙｓｔｅｍｓ，Ｉｎｃ．の商標または登録商標で
ある。

【０００３】２．背景技術コンピュータおよびコンピュータ・ネットワークは、たとえばメディア、商取
引、および通信など、数多くの分野で情報を交換するために使用されている。一
般に交換される情報形式の１つがオーディオ・データ、すなわちデジタル化され
た音声または音声のシーケンスで表されるデータである。音声電話の伝送および
テレビ会議の供給が、オーディオ・データを含む通信情報の例である。他のオー
ディオ・データの例には、デジタル化された音楽、ラジオ、およびテレビのパフ
ォーマンスあるいはそれらの一部に関連付けられた、オーディオ・ストリームま
たはオーディオ・ファイルが含まれるが、オーディオ・データはどんなタイプの
音声波形にも関連付けることができる。また、所望の大きさおよび周波数特性を
備えるオーディオ・データを人工的に生成することによって、音声波形を合成す
ることもできる。

【０００４】ここでの考察では、ネットワーク上にあるコンピュータ間での情報交換は、「
送信器」として動作するコンピュータと「受信器」として動作するコンピュータ
との間で発生する。オーディオ・アプリケーションでは、情報にオーディオ・デ
ータが含まれ、送信器によって提供されるサービスは、オーディオ・データの処
理および伝送に関連付けられる。現在のネットワーク・システムに関する問題は
、送信器として動作している１台または複数のコンピュータにより提供される複
数のサービスが、異なるオーディオ・プロトコルを使用しているオーディオ・デ
ータを提供する可能性があるということである。そこで、異なるオーディオ・プ
ロトコルそれぞれに対処する必要があるため、必然的に受信器がより複雑なもの
になる。ネットワーク上でのオーディオ・データの伝送に伴う他の問題には、パ
ケット喪失によって引き起こされるオーディオ信号内のエラー、ならびにリアル
タイムないし時間厳密性（タイムクリティカルな）、テレビ会議などのオーディ
オ関連アプリケーションでの望ましくない待ち時間が含まれる。次に、ネットワ
ーク上でオーディオ・データを伝送することに伴う問題をよりよく理解するため
に、オーディオ技術およびネットワーク方式の一例について説明する。

【０００５】《一般的なオーディオ技術》オーディオ・データ技術は、音声の取込み、格納、伝送、および再生を可能に
するものである。音声をオーディオ・データとして電子的にどのように表すこと
ができるかを理解するためには、音声の一般的な性質を理解することが有用であ
る。音声とは、空気などの媒体を介して伝播される圧力波を意味する。この種の
圧力波は、たとえば人間が話したり歌ったりするときに喉にある声帯を振動させ
ることによって、あるいは衝突エネルギーの一部が圧力波として放散されるとき
に２つのオブジェクトの衝突によって、発生させることができる。それを介して
圧力波が伝播される媒体は、媒体の物理的特性すなわち「音響学的特性」に従っ
て徐々に圧力波を減衰させる。

【０００６】圧力波が人間の耳にある鼓膜に達すると、鼓膜はそれに応答して曲がったり振
動したりする。この鼓膜内の振動または変調が、脳によって音声として解釈され
る。マイクロフォンなどの電子的取込みメカニズムは、圧力波を検出し電子信号
に含まれる対応するオーディオ・データを生成するための、同様のメカニズムを
有する。マイクロフォン内の感知メカニズムは、圧力波によって物理的に変調さ
れ、この変調が電気機械式に電子信号に変換される。この電子信号は直接伝送ま
たは格納するか、現在典型的に実行されているように、第１にデジタル化（すな
わちサンプリングおよび量子化）することができる。音声は、たとえば適切な圧
力波を生成するために振動膜（メンブレン）を電気機械式に変調することによっ
て、電子信号が圧力波に変換し直されて、オーディオ・データから再生される。

【０００７】《音声波形およびデータ・サンプリング》取り込まれた音声に対応する電子信号は、図１Ａに示された音声波形１００な
どの音声波形によってグラフで表すことができる。図１Ａと図１Ｂおよび図１Ｃ
それぞれにおいて、縦軸は音声波形の振幅を表し、横軸は１ミリ秒の時間間隔を
表す。音声波形１００は、連続波形である。図１Ｂおよび１Ｃは、それぞれ２４
キロヘルツおよび８キロヘルツのサンプリング・レートで、音声波形１００をサ
ンプリングすることによって生成された、離散的サンプリング波形を示す図であ
る。

【０００８】サンプリング・レートは、１秒あたりのヘルツまたはサンプル数で表される。
２４キロヘルツのサンプリング・レートとは、１秒間に２４０００回サンプリン
グするか、または約４２マイクロ秒ごとに１回サンプリングするという意味であ
る。予測されるように、図１Ｃで８キロヘルツのサンプリング・レートでサンプ
リングされた波形のサンプル数は、図１Ｂでサンプリングされた波形のサンプル
数の３分の１である。

【０００９】一般に、サンプリング・レートが高くなるほど、多量のサンプルに関連付けら
れたデータを格納するためのストレージおよび伝送帯域幅要件に対応する資源コ
ストは、相応して必然的に高くなる。ただし、一般に、サンプリング・レートが
高くなるほど、音声波形の再生がより精密になる。１組のサンプリング・データ
から元の波形を再生する能力は、元の波形の周波数特性およびサンプリング・レ
ートのナイキスト制限によって決まる。あらゆる信号または波形は周波数特性を
持つ。比較的高速で変化する信号レベルは、高い周波数挙動に関連付けられてい
るのに対して、変化の遅い信号レベルは低い周波数挙動に関連付けられている。
ほとんどの信号は、広い周波数域にわたる周波数成分を含む。可聴信号に関連付
けられた周波数、すなわち音声波形は、一般に２０〜２０，０００キロヘルツの
範囲内にある。

【００１０】ナイキスト理論によれば、サンプリングされた信号に、元の波形にサンプリン
グ・レートの２分の１を超える周波数が含まれていなければ、サンプリングされ
たデータから元の波形を再構成することができる。すなわち、元の波形の帯域幅
が１０キロヘルツ未満に制限されている場合、サンプリング・レートが２０キロ
ヘルツ以上であれば、歪みなしで元の波形を十分再生することができる。比較的
低いサンプリング・レートが使用されている場合には、波形をプリ−フィルタ処
理して周波数の帯域幅を制限し、サンプリング・プロセスに起因する歪みを防止
ないしなくすと言うのが一般的である。しかし、音声波形のフィルタ処理すると
波形の高域周波数成分の減衰が生じるので、音声品質が低下する。

【００１１】オーディオ・プロトコルが異なると、オーディオ・データ用に異なるサンプリ
ング・レートが使用される場合がある。オーディオ・データから音声出力を生成
している受信器は、オーディオ・データ・サンプルからの音声波形の再構成中、
サンプル間の正しい時間間隔を維持するために、オーディオ・プロトコルにより
異なることあるサンプル・レートを処理できなければならない。

【００１２】《データ解像度および量子化方式》オーディオ・プロトコル間で異なるオーディオ・データの他の態様は、サンプ
リングされたオーディオ・データの振幅を量子化ないしデジタル化して、固定数
のビットで表すことができるデジタル値にするのに使用される、量子化方式であ
る。オーディオ・データの各サンプルを表すのに使用されるビット数は、所与の
オーディオ・プロトコルの解像度である。典型的には、解像度Ｍビットの場合、
サンプル量子化には２^Mの可能なデジタル値または量子化レベルが存在する。た
とえば、８ビットの解像度は、２⁸すなわち２５６の量子化レベルを提供する。
典型的には解像度が高くなるほど良い音声が再生され、音声サンプルはより精密
に表される。解像度が高くなると、より多くのビット数をサポートするために、
ストレージ資源および伝送帯域幅にもより多くのコストが必要となる。

【００１３】オーディオ・データに異なる解像度があるのと同じように、振幅範囲にわたる
量子化レベルの配分に関して異なっている量子化方式もある。図２Ａおよび２Ｂ
は、それぞれ線形および非線形の量子化関数の例を示す図である。図２Ａおよび
２Ｂの横軸は、それぞれ量子化する前のオーディオ・データのサンプル値を表す
。それぞれの図の縦軸は、量子化が実行された後のオーディオ・データの量子化
レベルを表す。階段状関数が実施され、横軸に沿った固定範囲内のすべてのサン
プル値が縦軸上の離散量子化レベルに割り当てられる。

【００１４】図２Ａの線形量子化関数では、量子化レベルは値の範囲にわたって均一に配分
される。その結果、１つの傾斜を有する直線に近い階段状関数となる。図２Ｂの
非線形量子化関数では、量子化レベルは、振幅がゼロに近づくと多くなり、振幅
が大きくなると少なくなるように配分される。その結果、放物曲線または関数曲
線に近い階段状関数となる。非線形量子化方式の利点は、ゼロ振幅近くで相対的
に解像度が得られ、信号対雑音比が向上することである。非線形量子化方式の欠
点は、線形方式よりも実施手段が複雑なことである。異なるオーディオ・データ
・プロトコルは、線形量子化方式または一般に使用されるいくつかの異なる非線
形量子化方式のうちの１つを指定することができる。

【００１５】《オーディオ・チャネル》以上、単一の音声波形に関するオーディオ・データについて述べてきた。複数
の声や楽器などの複数音声の場合、各音声に関連付けられた個々の音声波形を重
ね合わせることによって、単一の複合音声波形で表すことができる。したがって
複合波形には、すべての音声の音声情報が含まれる。複数の「チャネル」を使用
してオーディオ・データを送ることもできる。オーディオ・データの各チャネル
には、音声波形の音声情報（たとえばデジタル化されたサンプル）が含まれる。
各チャネルが異なるオーディオ出力装置（たとえばスピーカ）から出力される場
合、または単一のオーディオ出力装置から出力するために複数のチャネルが１つ
の複合音声波形に「ミックス」される場合がある。

【００１６】複数チャネルは、２チャネルのステレオ・オーディオまたは４チャネルのサラ
ウンド・サウンドなど、音声再生用の空間効果を提供するために使用されること
が多い。空間効果は、事前に配置されたスピーカから特定のオーディオ・チャネ
ルを出力することで作り出される。たとえばステレオ・オーディオは左チャネル
および右チャネルを指定するが、これはオーディオ・データの第１チャネルが聞
き手の左側に配置されたスピーカから再生され、オーディオ・データの第２チャ
ネルが聞き手の右側に配置されたスピーカから再生されるという意味である。よ
り複雑なシステムでは、より多数のチャネルおよび出力装置を使用することがで
きる。特定のチャネル配列は、オーディオ・プロトコルによって違う可能性があ
る。

【００１７】《オーディオ・データのネットワーク伝送》これまで述べたように、オーディオ・プロトコルはサンプリング・レート、ビ
ット解像度、量子化方式、およびチャネル配列によって変えることができる。こ
うした違いによって、多数の異なるオーディオ・プロトコルが可能になる。ネッ
トワーク上の受信器にとって、ネットワーク上でオーディオ・データ・ソースと
して動作している様々な送信器によって使用される可能性のあるすべての可能な
オーディオ・プロトコルを処理することが、問題になる。この複数のオーディオ
・プロトコルに伴う問題について、図３に示されたサンプル・ネットワーク・シ
ステムを参照しながら、以下に記述する。図３は、オーディオ・データをソーシ
ングするための複数の送信器３００Ａ〜３００Ｃと、宛先コンピュータとして動
作する単一の受信器３０３とを備えたサンプル・ネットワーク・システムを示す
図である。受信器３０３には、受信したオーディオ・データに関連付けられる音
声出力を提供するための、１つまたは複数のスピーカが備えられている。

【００１８】図３の例では、送信器３００Ａ、３００Ｂ、および３００Ｃ、ならびに受信器
３０３は、たとえばローカル・エリア・ネットワーク（ＬＡＮ）であってもよい
ネットワーク３０２を介して相互に結合されている。送信器３００Ａはオーディ
オ・プロトコルＡを使用し、ネットワーク接続３０１Ａに沿ってネットワーク３
０２へオーディオ・データを送信する。送信器３００Ｂはオーディオ・プロトコ
ルＢを使用し、ネットワーク接続３０１Ｂに沿ってネットワーク３０２へオーデ
ィオ・データを送信する。送信器３００Ｃはオーディオ・プロトコルＣを使用し
、ネットワーク接続３０１Ｃに沿ってネットワーク３０２へオーディオ・データ
を送信する。したがって、受信器３０３はネットワーク接続３０５を介して、オ
ーディオ・プロトコルＡ、Ｂ、またはＣの下で、あるいはネットワーク３０２に
接続された他の送信器が使用するかまたは送信器３００Ａ〜３００Ｃのうちの１
つで実施される複数のサービスが使用する、任意の他のプロトコルのいずれかの
下で、ネットワーク３０２からオーディオ・データを受信することができる。

【００１９】受信器３０３は、各オーディオ・プロトコルをサポートするために、オーディ
オ処理用の異なるハードウェアを備えることができるが、これによって受信器が
より複雑なものになり、新しいオーディオ・プロトコルが開発されるとハードウ
ェアをアップグレードしなければならない。受信器の処理およびハードウェア要
件を最小化することが目的であるシステムの場合、複数のプロトコルをサポート
するために複雑さが増すことは望ましいことではない。

【００２０】《待ち時間およびパケット喪失に伴う問題》複数のオーディオ・プロトコルに伴う問題に加えて、オーディオ・システムに
は待ち時間およびパケット喪失に伴う問題もある。待ち時間とは、受信器側での
オーディオ・データの受信と、受信器のオーディオ出力装置からの対応する圧力
波の出力との間にある時間遅延のことである。オーディオ待ち時間は、オーディ
オ出力がビデオ出力などの他のイベントと同期化されることを意図しているアプ
リケーションでは、特に問題である。たとえば、テレビ会議またはテレビ伝送の
オーディオ部分に待ち時間があると、登場人物の口の動きなどの画面上での目に
見えるキューと、口の動きに関連付けられたスピーチなどの関連するオーディオ
出力との間にタイミングのずれが生じることがある。このようなタイミングのず
れによって、結果的に不満足なオーディオ／ビジュアル・プレゼンテーションと
なることがある。

【００２１】パケット喪失は、多くのネットワーク接続上で一般的に発生し、多くのオーデ
ィオ・データ・サンプルの喪失を引き起こす可能性がある。オーディオ・データ
は、データ・パケット内に封入されたサンプルのグループとして、ネットワーク
を介して伝送される。受信器側でパケットが受信されると、パケットからサンプ
ルが抽出され、音声波形の再構成に使用される。パケット喪失が発生すると、オ
ーディオ・データの多くのサンプルが音声波形の再構成から取り残される。

【００２２】オーディオ・ストリーミングの場合、オーディオ・データはそのそれぞれのパ
ケットから抽出され、即時に出力用に処理される。典型的には、受信器が喪失し
たパケットの再送信を送信器に要求すること、ならびに受信器がオーディオ出力
を修正するのに十分な時間内に送信器が喪失したパケットで応じることは不可能
である。音声波形の対応する部分はすでに圧力波として出力装置外部で処理され
ている。パケット喪失を介したオーディオ・データの喪失の結果、具体的にはパ
ケット喪失が比較的頻繁に発生する不良ネットワーク接続によって、通常は無音
声の期間という出力音声品質の望ましくない低下が発生する場合がある。

【００２３】（発明の概要）ネットワーク環境内でオーディオ・プロトコルをサポートするための方法およ
び装置について記載する。本発明の一実施形態では、受信器に関連付けられたオ
ーディオ処理およびハードウェア要件は、ネットワーク上の送信器と受信器との
間のオーディオ・データ伝送用に単一のオーディオ・プロトコルを指定すること
によって最小限にされる。プロトコルは、高品質の音声を可能にし、受信器の複
雑さをさらに最小限にする、サンプリング・レート、ビット解像度、および量子
化方式を指定する。送信器には、必要に応じてオーディオ・データを指定された
プロトコルに変換するためのドライバが備えられる。

【００２４】ネットワークを介したオーディオ・ストリームの伝送に伴う問題を補償するた
めに、指定されたプロトコルの態様が提供される。指定されたプロトコルは、パ
ケット喪失によって連続的にオーディオ・データ・サンプルを紛失することによ
り結果的に生じるエラーを最小限にするために、データ・パケット内のオーディ
オ・サンプルをインターリーブするための形式を指定する。受信器は、さらに補
間を介したオーディオ・データ・サンプルの喪失を補償することができる。指定
されたプロトコルに従い、オーディオ・データがどのように処理されるかを管理
するためにシーケンス・サイズが指定される。送信器は、オーディオ待ち時間を
各オーディオ・アプリケーションに指定された制限内で維持するために、シーケ
ンス・サイズを適応的に制御する。指定されたプロトコルは、複数のオーディオ
出力装置間で、複数のチャネルを備えたオーディオ・データがどのようにミキシ
ングおよびルーティングされるかを指定するために、ミックス・モードおよびい
くつかのチャネルも決定する。

【００２５】（発明の詳細な説明）本発明は、ネットワーク環境内でオーディオ・プロトコルをサポートするため
の方法および装置である。以下の記述では、本発明の実施形態をさらに詳しく説
明するために、数多くの特定の詳細について述べる。ただし、当分野の技術者で
あれば、本発明がこれらの特定の詳細を使用せずに実施できるものであることは
明らかであろう。他の例では、本発明を不明瞭にしないために、よく知られた特
徴については詳細に説明していない。

【００２６】《ネットワーク化された伝送のための単一オーディオ・プロトコル》本発明の一実施形態では、「送信器」として働くコンピュータと「受信器」と
して働く他のコンピュータとの間でオーディオ・データを伝送するために、単一
のオーディオ・プロトコルが使用される。オーディオ・データのソースは、指定
されたプロトコルに従ってオーディオ・データを供給する役割を担う。たとえば
、送信器およびその内部オーディオ・サービスは、オーディオ・データを受信器
に送信する前に指定されたプロトコルに合致させるために、任意の必要なプロト
コル変換を実行するように構成される。受信器のハードウェアおよび処理要件は
、必要なオーディオ・プロトコルを１つだけ受信器側でサポートするように、最
小限にされる。

【００２７】この明細書では主に、送信器から受信器へ一方通行で伝送されるオーディオ・
データに適用されるように論じられるが、オーディオ・データは、指定されたプ
ロトコルを使用して、受信器から送信器へ伝送することもできる。その後送信器
は指定されたプロトコルの形式でオーディオ・データを処理するか、または送信
器は、オーディオ・データをさらに処理するために他のオーディオ・プロトコル
に変換することができる。

【００２８】指定されたプロトコルは、他のすべてのオーディオ・プロトコルを含むために
非常に高品質の音声を与えるように選択される。指定されたプロトコルの音声品
質が高ければ、送信器によってプロトコルを変換する必要があっても、元のオー
ディオ・データからの音声品質の損失は発生しない。高い音声品質を提供するプ
ロトコルの一例は、サンプリング・レートが４８キロヘルツ、解像度が１６ビッ
トの、線形量子化方式を指定するプロトコルである。人間の耳で検出可能な周波
数の可聴範囲は、２０ヘルツから２０キロヘルツ（２０〜２０，０００Ｈｚ）の
間である。４８キロヘルツのサンプリング・レートは、理論的には２４キロヘル
ツの音声波形を再構成するのに十分である。これによって、指定されたプロトコ
ルは、４キロヘルツの周波数帯域幅の余裕をもって、可聴範囲内でどんな音声波
形も再構成することができる。

【００２９】１６ビットのオーディオ・サンプル解像度であれば、６５，５３６の量子化レ
ベルが可能である。これは、ほとんどまたはすべての消費者音声プロトコルに等
しいかまたはこれよりも大きい解像度を提供するのに十分である。１６ビット・
サンプルが提供する高解像度によって、線形量子化方式を使用することが可能に
なり、さらに振幅の低い信号にも十分な高解像度を提供できる。線形量子化方式
を使用すると、デジタル・オーディオ・データから音声波形を再構成するのに必
要な処理およびハードウェアが簡略化される。たとえば、スピーカを駆動するの
にデジタル／アナログ変換器（ＤＡＣ）を使用すると、オーディオ・データを線
形化するために前処理をする必要がなく、ＤＡＣ自体の中で非線形変換関数を実
施する必要がない。

【００３０】送信器が指定されたプロトコルを使用してオーディオ・アプリケーションをサ
ポートするか、あるいはたとえば、サンプル・レート変換を実行するために多重
レートのデジタル・フィルタリング技法を使用するか、非線形に量子化されたデ
ータを線形に量子化されたデータに変換するために量子化テーブルを使用して、
ドライバを使用して他のオーディオ・プロトコルと指定されたプロトコルとを変
換するように、送信器を構成することができる。解像度変換は、一般に解像度の
低いオーディオ・データにさらに最下位ビット（ＬＳＢ）を埋め込むことで実行
できる。ＬＳＢの埋込みにはディザリング技法も使用できる。

【００３１】本発明の一実施形態では、コネクションレス型データグラム方式およびパケッ
ト・フォーマットを使用して、送信器と受信器との間でオーディオ・データ・サ
ンプルを伝送する際に、データ・パケットが使用される。データグラム方式は、
各データグラムが独立して処理され、データグラム間に重要な共用状態がないこ
とから、コネクションレスとみなされる。これによって、個々のデータグラムが
頻繁に失われる可能性のある信頼性のないネットワーク上で、より確実なシステ
ム性能が実現できる。

【００３２】パケット・フォーマットの範囲内で、オーディオ・データ・パケットには以下
の情報が含まれる。オーディオ・シーケンス番号・・・・オーディオ・ストリームが、一連のオ
ーディオ・データ・シーケンスとして処理される。オーディオ・シーケンス番号
は、現在のデータ・パケットを処理用の正しいオーディオ・データシーケンスに
関連付けることができる。シーケンス長・・・・・・・・・・・シーケンス長さは、オーディオ・デー
タ・サンプルに関して指定されるもので、本明細書で後述する待ち時間制御の一
要素である。パケット長・・・・・・・・・・・・パケット長さは、オーディオ・データ
・サンプルに関して指定されるもので、データ・パケットからインターリーブさ
れたデータを抽出するのに使用される。インターリーブ・サイズ・・・・・・インターリーブ・サイズは、現在のオ
ーディオ・シーケンスのインターリーブ間隔を指定するのに使用される。インターリーブ・オフセット・・・・インターリーブ・オフセットは、現在
のデータ・パケット内で第１のオーディオ・サンプルに対応するオーディオ・シ
ーケンスのオーディオ・サンプルと指定するのに使用される。シーケンス長さ、
パケット長さ、インターリーブ・サイズ、およびインターリーブ・オフセットは
、本明細書で後述するインターリーブされた処理操作で使用される。ミキサー・モード・・・・・・・・・ミキサー・モードは、現在のデータ・
パケットに含まれるオーディオ・チャネル用の特定のミキシングおよび出力配列
を指定する。ミキシング・モードおよびチャネル割当てについては、本明細書で
後述する。オーディオ・チャネル数・・・・・・オーディオ・チャネル数は、オーディ
オ・サンプル・データを適切なチャネル・データとして解析および処理するのに
使用される。オーディオ・データ・・・・・・・・オーディオ・データには、現在のデー
タ・パケットのすべてのオーディオ・データ・サンプルが含まれる（パケット長
さ^*オーディオ・チャネル数^*１６ビット）。

【００３３】《適応待ち時間制御》多くのオーディオ・アプリケーションは、待ち時間要件の対象となる。これは
、受信器がオーディオ・データを受信する時間から、オーディオ・データが圧力
波の形で受信器から出力される時間までの間で許される時間は、指定された遅延
量だけであるという意味である。指定量を超える場合またはこれを下回る場合の
どちらも、待ち時間は不適当とみなされる。たとえば、受信器内へのテレビジョ
ン・フィードは、テレビジョン・フィードに関連付けられたオーディオ出力が、
ビデオ出力内の適切なタイミング・ポイントからのオフセットである場合、不十
分に表されたものとみなされる。

【００３４】ＡＶ（オーディオ／ビジュアル）同期に関して、人間は、比較的瞬時にビジュ
アル情報を送達する光の速度と、オーディオ情報をイベントからの距離１フィー
ト当たり約１ミリ秒遅く伝達される音の速度との相違によって、イベントを見た
後でイベントを聞くことに馴れている。オーディオとビジュアルのイベントが乱
れて知覚されたときには、実質的に不調和を認識する。

【００３５】オーディオ待ち時間に寄与する要因には、以下に記載するように、受信器自体
に関連付けられた固定遅延、および音声波形を個々のシーケンスに分離すること
によって生成される遅延が含まれる。受信器の固定遅延は、デジタル・オーディ
オ・データを、スピーカなどの出力装置に適したドライブ信号に変換するための
バッファリング遅延およびハードウェア遅延、ならびに出力装置自体の中での任
意の伝播遅延に関連付けられる。この固定の受信器遅延は典型的には約２５ミリ
秒であるが、受信器のハードウェア構成によって異なる場合がある。

【００３６】音声波形は一般に個々のサンプル・シーケンスに分割される。オーディオ・デ
ータが再生されるとき、すなわち圧力波に再構成されるとき、シーケンスは、ま
ずパケットで送られるサンプルから構成され、そして、シーケンスが完成すると
、そのシーケンスがシステムで処理され出力装置へと送られる。次のシーケンス
は、第１のシーケンスの出力中に構成され、第１のシーケンスが終了するまでは
、その次のシーケンスの出力は開始できない。この順送りの（シーケンシャル）
処理が、シーケンス長に等しい全体の待ち時間に寄与する遅延の原因となる。た
とえば、オーディオ・データが１００ミリ秒シーケンスで処理されている場合、
オーディオ・システムの待ち時間は、シーケンシャル遅延に由来する１００ミリ
秒に、固定の受信器遅延を加えた値に等しくなる。本明細書の後半で論じるよう
に、データ・サンプルのインターリーブを可能にするには、シーケンス長を長く
することが望まれる。ただし、シーケンス長が長くなるほど待ち時間は増加する
。オーディオ待ち時間が所望の限界を超えない最大のシーケンス長を利用するこ
とで、性能を最適化することができる。

【００３７】本発明の一実施形態では、システムのオーディオ待ち時間を適応制御して、待
ち時間を所望の範囲内に抑制する。したがってオーディオ性能の向上が達成され
る。待ち時間制御を実行するために、所与のオーディオ・アプリケーションに許
容できる最大待ち時間が指定される。最大許容待ち時間は、オーディオ・アプリ
ケーションの時間厳密性の要求ないし時間的同期化性能の問題に基づいて決定す
ることができる。固定受信器遅延も指定される。最大許容待ち時間および固定受
信器遅延から、送信器は、待ち時間要件を満たすオーディオ・シーケンスの最大
長を決定することができる。その関係は、以下のとおりである。最大シーケンス長＝最大許容待ち時間−固定受信器遅延

【００３８】送信器は、上式で計算された最大シーケンス長に等しいかまたはこれよりも小
さいカレント（現在の）・シーケンス長を決定する。このカレント・シーケンス
長は、オーディオ・データと共に受信器に送信され、オーディオ・シーケンスの
処理がその指定されたカレント・シーケンス長に従って実行されるようにされる
。シーケンス長は、待ち時間要件の変化に伴って変更することができるので、最
適な性能が達成される。したがって、個々のオーディオ・アプリケーションの特
定待ち時間要件を、適応的な方法で満たすことができる。

【００３９】図４Ａおよび４Ｂは、音声波形の出力における待ち時間制御の効果を示す図で
ある。各図が、水平時間軸を基準にした入力および出力の波形を示す。図４Ａは
、受信器側で受信されるオーディオ・データ入力を表す波形４００を含む。波形
４００は、シーケンスＭ、シーケンスＭ＋１、およびシーケンスＭ＋２とラベル
表示された、１００ミリ秒シーケンスに分割される。図４Ａは、オーディオ出力
装置を介して受信器から出る、実際のオーディオ出力を表す波形４０１も含む。
波形４０１は、システムのオーディオ待ち時間によるタイミング・オフセットを
除いて、波形４００とほぼ同じである。波形４０１内でのシーケンスＭの始まり
は、波形４００内でのシーケンスＭの始まりよりも、Ｔ_LATENCY量だけ遅延して
いる。Ｔ_LATENCYは、シーケンスＭ、Ｔ_SEQ、および固定受信器遅延Ｔ_RCVRの合計
によって決定される。図４Ａの例では、Ｔ_SEQ＝１００ｍｓおよびＴ_RCVR＝２５
ｍｓで、合計待ち時間はＴ_LATENCY＝１２５ｍｓとなる。

【００４０】オーディオ・アプリケーションの中には、１２５ミリ秒の待ち時間では長すぎ
るものもある。図４Ｂは、所望の最大待ち時間６０ミリ秒を達成するために、波
形のシーケンス長を３５ミリ秒まで減らす効果を示す図である。図４Ｂには、受
信器側で受信されるオーディオ・データ入力を表す波形４００が示される。図４
Ｂでは、波形４００は、シーケンスＭ’、シーケンスＭ’＋１、およびシーケン
スＭ’＋２などとラベル表示された、３５ミリ秒のシーケンスに分割される。図
４Ｂには、受信器を出るオーディオ出力を表す波形４０２も含まれる。波形４０
２は、タイミング・オフセットＴ’_LATENCYを除いて、波形４００とほぼ同じで
ある。固定受信器遅延Ｔ_RCVRは同じままである。ただし、図４Ｂではシーケンス
長（Ｔ’_SEQ）が３５ミリ秒まで減らされているために、合計オーディオ待ち時
間はＴ’_LATENCY＝６０ｍｓまで減っている。図からわかるように、記載どおり
にオーディオ待ち時間を制御することによって、最大可能シーケンス長を維持し
ながら、オーディオ待ち時間を所望の制限内に制約することができる。

【００４１】《ミキシング・モードおよびチャネル割当て》本発明の一実施形態では、オーディオ・データは１つまたは複数のオーディオ
・データ・チャネルで構成することができる。複数チャネルの場合、各チャネル
のオーディオ・データは、他のチャネルのオーディオ・データによってインター
リーブされる。たとえば、３つのチャネル配列の場合、データ・パケットには以
下のようなシーケンシャル構成のオーディオ・サンプルが含まれる。データ・パケット： [channel0/sample0, channel1/sample0, channel2/sample0, channel0/sample1, channel1/sample1, channel2/sample1, channel0/sample2, channel1/sample2, channel2/sample2, etc.]

【００４２】本発明の一実施形態により、オーディオ伝送に使用されるオーディオ・プロト
コルは、オーディオ・データに関連付けるために２つのフィールドを指定するの
であって、第１のフィールドはチャネル数であり、第２のフィールドは所定のミ
キシング配列、すなわち「標準ミックス」に含めるためのチャネル数である。標
準ミックスに含めるチャネル数は、「ミックス・モード」とも呼ばれることがあ
る。どちらのフィールドも各フィールドに４ビットを付与することにより、単一
バイトで表すことができる。これにより最大１６チャネル、および１６ミックス
・モードで表すことができる。

【００４３】伝送されるチャネル数よりも少ないミックス・チャネルが指示されると、標準
ミックスに含まれない残りのチャネルは、これらのチャネルに対応するオーディ
オ出力に直接送られる。受信器のハードウェアが標準ミックスから外れたこれら
のチャネルに対するサポートを含まない場合、これらのチャネルはドロップされ
る。

【００４４】伝送されるチャネル数と同じかまたは多いミックス・チャネルが指定されると
、受信器はこれらのチャネルを再生するのに利用可能な任意の合成を自由に使用
することができる。たとえば、２つのチャネルが送られて標準ミックス内には６
つのチャネルが指定され、受信器には６つ以上の出力がある場合、受信器は６つ
のチャネルを与えるマトリクス方式を使用して、出力を再生することができる。

【００４５】「標準ミックス」の可能な配列の１例が以下の表１に示されており、縦のイン
デックスはミックス・モード、横のインデックスはチャネル数である。

【表１】凡例：番号付きチャネル直接出力（送られた場合）ＦＣ／ＦＬ／ＦＲ前中央／前左／前右ＲＣ／ＲＬ／ＲＲ後ろ中央／後ろ左／後ろ右ＳＷサブウーファ、下中央、または効果ＴＣ上中央ＣＬ中央左（ＦＬとＲＬの中央）ＣＲ中央右（ＦＲとＲＲの中央）

【００４６】１６番目のミックス・モードは、ミックス・モードによって１５のチャネルが
指定され、１６のチャネルが送られたときに定義される。２つ以上のチャネルに
同じ出力宛先が与えられた場合（たとえばＦＬ、ＦＲなど）、これらのチャネル
は指定された装置上の出力用の複合波形にミックスされる。

【００４７】《エラー隠閉のためにインターリーブされるオーディオ・データ》本発明の一実施形態では、パケット喪失によってオーディオ・データ内に生じ
る長いギャップまたはポップを防ぐために、データのインターリーブを利用する
。オーディオ・データをインターリーブすると、ネットワーク伝送時にパケット
が失われたときに紛失される、オーディオ・シーケンス内の連続するサンプル数
を最小限にし、紛失されたオーディオ・データ・サンプルを優良なオーディオ・
データ・サンプル間に隠閉することができる。オーディオ・データ内に残された
小さなギャップは、紛失したオーディオ・データの場所に近似のデータを挿入す
るデータ補間技法を使用して、さらに隠閉することができる。

【００４８】オーディオ・データは、送信器と受信器の間で、データ・パケット単位で封入
されたサンプル・グループとして伝送される。いくつかのデータ・パケットを各
オーディオ・シーケンスに関連付けることができる。データ・パケットが受信器
によって受信されると、特定のオーディオ・シーケンスが識別され、オーディオ
・データ・サンプルはパケットからバッファに転送される。

【００４９】本発明の一実施形態では、オーディオ・データをデータ・パケットにパッキン
グするためにインターリーブ・サイズが指定される。このインターリーブ・サイ
ズは、どの程度のデータ・パケット数が所与のシーケンスに使用されるか、およ
び各データ・パケット内に含めるためにどのようにオーディオ・データ・サンプ
ルを選択するかを指定するものである。たとえば、インターリーブ・サイズが３
であれば、所与のシーケンスにオーディオ・データを伝送するのに３つのデータ
・パケットが使用され、各データ・パケットには、シーケンス中の３つの連続し
たオーディオ・データ・サンプルのセットそれぞれから１つのオーディオ・デー
タ・サンプルを格納することを示す。ゼロから（インターリーブ・サイズ−１）
までの一意のインターリーブ・オフセットが各データ・パケットに割り当てられ
る。インターリーブ・オフセットは、所与のデータ・パケットに対して、開始オ
ーディオ・データ・サンプルを指定する。受信器側では、インターリーブ・サイ
ズおよびインターリーブ・オフセットを使用して、データ・パケットのオーディ
オ・データ・サンプルから音声波形が再構成される。

【００５０】ネットワークの中には、規則的な間隔でパケットが失われるという伝送上の問
題を伴うものがある。パケットの規則的な喪失と、その結果発生する定期的なサ
ンプル・エラーを途絶させるために、データ・パケットが伝送される順番をラン
ダムまたは擬似ランダム様式で実行することができる。これは、たとえば、第１
のパケットは必ずシーケンス内の第１のサンプルで始まり、第２のパケットは必
ず第２のサンプルで始まるなどというのではなく、各シーケンスのパケット間で
インターリーブ・オフセット割当てをランダムに行うことで、効率よく達成する
ことができる。

【００５１】インターリーブされたデータの一例として、３つのインターリーブ・サイズを
有する８つのサンプル・シーケンスについて考察してみよう。３つのデータ・パ
ケットはオーディオ・データの伝送に使用される。ゼロから（インターリーブ・
サイズ−１）までのインターリーブ・オフセットは、データ・パケットにランダ
ムに割り当てられる。各データ・パケットは、所与のパケット用に指定されたイ
ンターリーブ・オフセットに対応するサンプルで始まり、オーディオ・シーケン
スの終わりに達するまで、インターリーブ・サイズずつサンプルを増分しながら
、所与のシーケンスのオーディオ・データ・サンプルで満たされる。可能なパケ
ット割当ての一例は、次のとおりである。サンプル（０１２３４５６７）パケット１、オフセット＝１：１４７パケット２、オフセット＝０：０３６パケット３、オフセット＝２：２５

【００５２】このやり方でインターリーブすることによって、オーディオ・データ・シーケ
ンスの連続したサンプルの紛失数を、データ・パケットの喪失数よりも少ないか
または等しく抑えることができる。これは、インターリーブされないサンプル配
列の場合とは対照的である。インターリーブされないサンプル配列では、連続し
たサンプルの紛失数が、単一パケット中のサンプル数を下回ることはなく、パケ
ットの喪失数にパケット当たりのサンプル数を乗じて得た値まで多くなってしま
うことがある。

【００５３】図５は、オーディオ・シーケンス上でのインターリーブ効果を示す図である。
図５に示す例は、１２のオーディオ・データ・サンプルを含むシーケンスである
。オーディオ・データはそれぞれ３つのサンプルを含む４つのデータ・パケット
で伝送される。サンプリングされた波形５００は、すべてのオーディオ・サンプ
ルが損なわれていないシーケンスを表す。サンプリングされた波形５０１〜５０
３は、第２のデータ・パケットが失われ、その結果３つのサンプルが紛失した場
合のシーケンスを表す。

【００５４】サンプリングされた波形５０１の場合、データ・パケット・サンプルの割当て
は（パケット１：０，１，２；パケット２：３，４，５；パケット３：６，
７，８；およびパケット４：９，１０，１１）となる。サンプル３、４、お
よび５が波形５０１から紛失した結果、シーケンスの中程に３つのサンプル・ギ
ャップが生じる。その結果、連続するサンプルが紛失したところは平らな波形に
なる。したがって、再構成された波形は歪むことになる。波形５０１内のような
ギャップから発生する音声歪みは、データ・パケット当たりのサンプル数が増加
するにつれて大きくなる。

【００５５】サンプリングされた波形５０２は、前述のようにインターリーブされたデータ
・サンプルから構成される。データ・パケット・サンプルの割当ては（パケット
１：１，５，９；パケット２：２，６，１０；パケット３：０，４，８；
およびパケット４：３，７，１１）となる。第２のデータ・パケットが失われ
ることで、サンプル２、６、および１０が波形５０２から紛失する。その結果、
非インターリーブ波形５０１の大きなギャップよりもシーケンスの再構成に与え
る影響がかなり小さい、いくつかの１サンプル・ギャップが生じる。

【００５６】波形５０２内のギャップの影響は、波形５０３に示したような紛失サンプルの
補間を実行することによって、さらに小さくすることができる。音質を向上させ
るためには、どのような補間機能を使用しても良い。波形５０３に示された補間
機能は線形補間であり、紛失したサンプルによって形成されるギャップの両側に
ある２地点間にラインを構成し、紛失サンプルのサンプリングの瞬間にそのライ
ンの値を決定することによって紛失したサンプルが補われる。その結果、理想的
な波形５００にさらによく似た波形が形成される。補間水準が高いほど、結果も
良くなる。

【００５７】《自動レート変換》一般に、本発明の一実施形態では、送信器はオーディオ・ストリームを、伝送
用のオーディオ・プロトコルに指定されたサンプリング・レートに変換する役割
を担う。これには、プロトコルを収容するためのオーディオ・ストリームのレー
ト変換も含まれる場合がある。ただし、特定セットのサンプリング・レートの場
合、レート変換は、受信器側のインターリーブおよび補間メカニズムによって自
動的に実行される。特定セットのサンプリング・レートには、プロトコルによっ
て指定されたサンプリング・レートの整数因数である、サンプリング・レートが
含まれる。たとえば、４８キロヘルツのサンプリング・レートでは、整数因数と
しての資格がある適用可能なサンプリング・レートの中に、４、６、８、１２、
１６、および２４キロヘルツが含まれる。４キロヘルツより小さい他のサンプリ
ング・レートも整数因数としての資格を持つものもあるが、小さなサンプリング
・レートがオーディオ・アプリケーションで使用されることはあまりない。

【００５８】適切なインターリーブ・サイズを指定することにより、送信器は、レート変換
せずに、これら整数因数のサンプリング・レートでオーディオ・データを送達す
ることができる。適切なインターリーブ・サイズを決定するための単純なメカニ
ズムは、４８キロヘルツ（または他の指定されたプロトコル・サンプル・レート
）を問題のサンプル・レートで割ることである。この除算の結果を、オーディオ
・データを受信器に送達するデータ・パケットのインターリーブ・サイズとして
使用することができる。オーディオ・データの正しい位相を維持するためには、
一貫したインターリーブ・オフセットが使用される。たとえば、８キロヘルツの
オーディオ・データは、サイズ６のインターリーブ（４８／８＝６）および一定
のインターリーブ・オフセットで送信できる。このオーディオ・データは６つの
中で１つのデータ・パケットだけが首尾良く受信器に達するという仮定の下で、
４８キロヘルツ・データとして処理される。受信器側の補間機能は、８キロヘル
ツのオーディオ・データを４８キロヘルツに変換するために、「紛失した」サン
プルを自動的に補う。インターリーブ・サイズとインターリーブ・オフセットの
他の組み合わせは、同じ自動レート変換に影響を与えるために、同様に適用する
ことができる。たとえば、８キロヘルツのオーディオ・データは１２のインター
リーブ・サイズで、６つのサンプルが別個のインターリーブ・オフセットを一貫
して使用して（たとえば、（０，６）、（１，７）、（２，８）などのインター
リーブ・オフセットを一貫して使用して）、送達することができる。

【００５９】上記に例示した様式では、送信器はインターリーブ・サイズ値を使用して、４
８キロヘルツのサンプリング・シーケンスに関連付けられたサンプル位置を確立
する。インターリーブ・オフセット値は、正しい位相を維持するために、オーデ
ィオ・データ・サンプルを正しい４８キロヘルツのサンプル位置に配置するのに
使用される。したがって送信器は、レート変換を実行せずに、整数因数のサンプ
ル・レートでオーディオ・データ・サンプルの伝送に影響を与えることができる
。これは、送信器が提供するデータの帯域幅が低い場合に、低い帯域幅をネット
ワークに渡すことができるという意味でもある。受信器は伝送されたオーディオ
・データを４８キロヘルツ・データとして解釈し、それに応じてオーディオ・デ
ータを処理する。

【００６０】《オーディオ・プロトコルを実施する処理流れ》図６Ａは、本発明の一実施形態に従って、オーディオ・データを処理するため
に、送信器が実施するステップを示す流れ図である。ステップ６００では、送信
器が受信器に伝送するためのオーディオ・データを取得する。オーディオ・デー
タは、ハードウェア取込みボードを使用したオーディオ信号の取込み、オーディ
オ・サービスによるオーディオ・データの生成、またはマイクロフォンや電子楽
器などのオーディオ入力装置からのオーディオ・データの入力など、どのような
メカニズムでも取得することができる。オーディオ・データが取得されると、そ
のオーディオ・データは、オーディオ・データ伝送用に指定されたプロトコルに
適合させるために、必要に応じてステップ６０１で変換される。この変換には、
たとえば、サンプリング・レート変換、解像度変換、および量子化線形化のうち
の１つまたは複数が含まれることがある。ただし、サンプリング・レートの中に
は、本明細書で前述したように受信器によって自動的に変換されるものもある。

【００６１】ステップ６０２では、送信器が、オーディオ・データに関連付けられたオーデ
ィオ・アプリケーションに関する最大許容待ち時間を決定する。ステップ６０３
では、最大許容待ち時間および固定受信器遅延に基づいて、待ち時間要件を満た
すシーケンス長さが決定される。ステップ６０４では、送信器がオーディオ・デ
ータをデータ・パケットにインターリーブし、そのデータ・パケットを受信器に
伝送する。ステップ６０４を終了すると、プロセスはステップ６００に戻る。

【００６２】図６Ｂおよび６Ｃは、本発明の一実施形態に従ってオーディオ・データを処理
するための受信器プロセスを示す流れ図である。受信器は、主にネットワークか
らデータを受信し、インターリーブ解除（デインターリーブ）することでシーケ
ンスをアセンブルして標準ミックスを実行し、受信したデータ・レートをオーデ
ィオ出力ハードウェアのデータ・レートにリタイミングした後、データを出力ハ
ードウェアのデータ・バッファ内にミキシングするという役割を担い、ここで複
数の送信器からのオーディオをオーディオ出力から聞くことができる。このプロ
セスは、データを受信してインターリーブ介助する受信器スレッドと、完了した
シーケンスをハードウェア・バッファに出力する出力スレッドとの２つの実行ス
レッドを使用する、本発明の一実施形態で実行される。

【００６３】図６Ｂは、受信器スレッドの流れの一実施形態を示す図である。ステップ６０
５では、新しいデータ・パケットが受信される。ステップ６０６では、受信スレ
ッドがパケット・ヘッダを解析して、シーケンス番号を抽出する。このシーケン
ス番号が前に受信したパケットのシーケンス番号と一致すれば、プロセスはステ
ップ６１１までジャンプする。ただし、このシーケンス番号が前に受信したパケ
ットのシーケンス番号と異なる場合は、プロセスはステップ６０７に分かれ、出
力用に現在のシーケンスを処理して、新しいデータ・パケット内で識別された新
しいシーケンスに資源をセットアップする。

【００６４】ステップ６０７では、紛失サンプルを補償するためにカレント・シーケンス上
でエラー隠閉（たとえば補間）が実行される。ステップ６０８では、カレント・
シーケンスのサンプルがリタイミングされ、ステップ６０９では、カレント・シ
ーケンスがハードウェア出力バッファ内にミックスされる。受信器がシーケンス
をハードウェア出力バッファ内にミックスするこのステップは、新しいシーケン
スが到着することでカレント・シーケンスが出力バッファ内に「プッシュされる
」ので、「プッシュ」操作と呼ばれる。ステップ６１０では、新しいデータ・パ
ケットのヘッダ内に指定された長さを有する新しいシーケンス・バッファが、新
しいシーケンスに割り振られる。プロセスはステップ６１０からステップ６１１
へと続き、新しいデータ・パケットの内容処理を開始する。

【００６５】ステップ６１１では、パケット長、インターリーブ・サイズ、およびインター
リーブ・オフセットに従って、新しいデータ・パケットからオーディオ・データ
が抽出される。抽出が実行されている間、ステップ６１２に示したように、サン
プルは指定されたミックス・モードに従ってシーケンス・バッファ内にミックス
される。シーケンス・バッファのチャネル化は、オーディオ出力ハードウェアに
よってサポートされるチャネル数に依存する。プロセスは、新しいデータ・パケ
ットを受け取るために、ステップ６１２からステップ６０５に戻る。

【００６６】図６Ｃは、受信器の出力スレッドを示す流れ図である。通常、出力スレッドは
ハードウェア出力バッファからのデータを消費し、これをオーディオ出力ハード
ウェアにコピーする。出力スレッドがハードウェア出力バッファからのデータを
消費する際に、出力スレッドは各シーケンス・バッファをチェックして、いつ出
力されるスケジュールになっているかを確認する。出力スレッドがシーケンスに
追い付くと、スレッド受信プロセスについて上述したように、出力スレッドは部
分的に受信されたシーケンスを即時にミックスさせる。ネットワーク化された環
境では、この問題は、サンプル時間ベースのレート・エラーの場合には発生する
ことが少なく、シーケンスの完了を遅らせる原因となるネットワーク待ち時間ジ
ッタがある場合には発生することが多い。受信器スレッドは、新しいシーケンス
用のデータ・パケットが到着することでトリガされると、データのシーケンスを
出力バッファ内に「プッシュ」できるので、出力スレッドは、シーケンスが遅れ
たときにシーケンスのミキシングをトリガすることで、シーケンスを出力バッフ
ァ内に「プル」することができる。

【００６７】図６Ｃのステップ６１３では、関連するシーケンスがいつ出力されるようにス
ケジュールされているかを判定するために、出力スレッドがシーケンス・バッフ
ァをチェックする。ステップ６１４では、シーケンスがその出力スケジュールを
基準にして遅れていない場合、プロセスはステップ６１８に進む。ただし、ステ
ップ６１４で、シーケンスが遅れている、すなわちスケジュールよりも遅いと判
定されると、出力スレッドはステップ６１５でシーケンスのエラー隠閉を開始し
、ステップ６１６でシーケンスのリタイミング(retiming)を実行する。ステップ
６１７では、リタイミングされたシーケンスが出力バッファにミックスされる。
ステップ６１７はステップ６１８に続く。ステップ６１５〜６１７は、発生の可
能性がある不完全なシーケンスが、受信器の出力スケジュールと一致させるため
に出力バッファ内に「プルされる」ので、「プル」操作と呼ばれる。

【００６８】ステップ６１８では、出力スレッドが、カレント・出力バッファ内にミックス
する必要がある可能性のある他のシーケンスが進行中であるかどうかを判定する
。他のシーケンスがなければ、ステップ６１９で出力バッファがオーディオ・ハ
ードウェアに送られ、プロセスはステップ６１３に戻る。ステップ６１８で、カ
レント・出力バッファ内にミキシングする必要のある他のシーケンスがあれば、
プロセスはステップ６１３に戻って次のシーケンスをチェックする。

【００６９】以上、本発明の一実施形態に従って考察した図６Ｂおよび６Ｃに示されるよう
に、待ち時間テストは、シーケンスが予想よりも速いか遅いかを判定するために
実行される。待ち時間が変更されると、次いでデータは、オーディオ・ハードウ
ェアによってデータが消費されるよりも速くまたは遅く、送信器によって伝送さ
れる。これはおそらく、送信器が、受信器が使用するものには依存していない、
時間ベースを使用して動作しているためである。送信器の方が速い場合は、オー
ディオ・ハードウェアの出力生成が遅れ、バッファのオーバフローを引き起こす
。送信器の方が遅い場合は、バッファがアンダーフローして、受信器からのオー
ディオ出力が時折停止する。これを補償するために、出力ミキサーは、たとえば
「プッシュ」操作時に待ち時間の増加が検出された場合は、リタイミング・ステ
ップでシーケンス当たり少数のサンプルを削除し、たとえば「プル」操作時に待
ち時間の減少が検出された場合は、リタイミング・ステップ中にシーケンス当た
り少数のサンプルを追加する。本発明の一実施形態では、サンプルは適切に追加
または削除された後、補間方式を使用してフィルタリングされる。この「プッシ
ュ・プル」処理モデルは、サンプルのインターリーブおよびエラー隠閉方式によ
って可能となる。

【００７０】《オーディオ・プロトコルのネットワーク実施》図７は、本発明の一実施形態に従ったネットワーク環境を示す構成図である。
図７には、ネットワーク７０８、複数の送信器７００、１つまたは複数の一般オ
ーディオ・ソース７０６、および複数の受信器７１０が含まれる。

【００７１】送信器７００は、それぞれがネットワーク接続７０５を介してネットワーク７
０８に結合され、オーディオ・ソース７０６はそれぞれがネットワーク接続７０
７を介してネットワーク７０８に結合される。各送信器７００は、オーディオ・
データ取得メカニズム７０１、待ち時間制御メカニズム７０２、プロトコル変換
メカニズム７０３、およびインターリーブ操作メカニズム７０４を備える。一般
オーディオ・ソース７０６は、スタンドアロン型のオーディオ入力装置、または
指定されたプロトコルに合致しないためにいずれか１つの送信器７００を介して
オーディオ・データを受信器に送信する他のコンピュータなどの、ネットワーク
７０８に結合されたどのようなオーディオ・データ・ソースでもよい。

【００７２】受信器７１０は、それぞれがネットワーク接続７０９を介してネットワーク７
０８に結合される。各受信器７１０は、インターリーブ操作メカニズム７１１、
補間メカニズム７１２、ミックス・モード・メカニズム７１３、および１つまた
は複数のオーディオ出力装置７１４を備える。受信器７１０は、送信器７００の
１つに伝送するためにオーディオ・データを取得するための１つまたは複数のオ
ーディオ入力装置（図示せず）も備える。

【００７３】メカニズム７０１〜７０４および７１１〜７１３は、ソフトウェア・プロセス
またはハードウェア装置、あるいは所与の機能を提供するように構成されたソフ
トウェア・プロセスとハードウェア装置の組み合わせを含むことができる。デー
タ取得メカニズム７０１には、（たとえばビデオ信号または電話回線から）オー
ディオ・ストリームを取り込むメカニズム、格納されたオーディオ・データをメ
モリ装置から読み取るソフトウェア・アプリケーション、オーディオ・データを
合成するソフトウェア・アプリケーション、あるいは送信器７００に直接結合さ
れたオーディオ・ソース（図示せず）またはネットワーク７０８を介して送信器
７００に結合されたオーディオ・ソース７０６のいずれかからオーディオ・デー
タを受信する通信装置などの、オーディオ・データを提供する任意の装置を含む
ことができる。

【００７４】待ち時間制御メカニズム７０２は、待ち時間要件に合致するようシーケンス長
の設定をするよう構成されている。プロトコル変換メカニズム７０３は、オーデ
ィオ・データの任意の必要なサンプリング・レート（サンプリング・レートの中
には受信器によって自動的に変換できるものもあるので留意のこと）、解像度、
または量子化変換を提供するように構成される。インターリーブ操作メカニズム
７０４は、送信器７００と受信器７１０との間でのオーディオ・データの伝送を
容易にするために、インターリーブされたオーディオ・データ・サンプルを使用
してデータ・パケットをパックおよびパック解除（アンパック）するように構成
されている。送信器７００は、オーディオ・データ用のミックス・モードを指定
するようにも構成されている。

【００７５】インターリーブ操作メカニズム７１１は、インターリーブされたオーディオ・
データを使用してデータ・パケットをパックおよびパック解除するように構成さ
れている。ただし、インターリーブ操作メカニズム７１１は、補間操作メカニズ
ム７１２と共に動作して、パケット喪失がある場合にエラー隠閉を実行する。ミ
ックス・モード・メカニズム７１３は、指示されたミックス・モードに従って、
チャネル・データをミキシングし、１つまたは複数のオーディオ出力装置７１４
にオーディオ・データをルーティングするように構成されている。

【００７６】送信器７００およびオーディオ・ソース７０６は、概念的には送信器定義域の
要素であり、受信器７１０は概念的には受信器定義域の要素である。送信器定義
域内の要素間でのオーディオ・データ伝送は、どのようなプロトコルの下でも実
行可能である。ただし、送信器定義域内（たとえば送信器７００）の要素と、受
信器定義域内（たとえば受信器７１０）の要素との間でのオーディオ伝送は、単
一の指定されたオーディオ・プロトコル（図７ではプロトコルＡと図示）に従っ
て実行される。複数プロトコルのサポートが送信器７００に制限されているので
、受信器７１０の処理およびハードウェア要件は単純化されている。新しいプロ
トコル変換メカニズムなどの新しいプロトコルをサポートするのに必要な任意の
アップグレードは、送信器定義域に制限されているため、受信器７１０をサポー
トするためのコストおよび労力は削減される。

【００７７】《コンピュータ実行環境の実施形態（ハードウェア）》本発明の一実施形態は、図１０に示されたコンピュータ１０００などの汎用コ
ンピュータ上で実行されるコンピュータ読取り可能コード形式、またはそのよう
なコンピュータ上で実行されるＪａｖａ^TMのランタイム環境内で実行可能なバイ
トコード・クラス・ファイル形式の、コンピュータ・ソフトウェアとして実施す
ることができる。キーボード１１００およびマウス１１１０は、双方向システム
・バス１１８０に結合される。キーボードおよびマウスは、ユーザ入力をコンピ
ュータ・システムに導入し、そのユーザ入力をプロセッサ１１３０へ送るための
ものである。マウス１１１０およびキーボード１１００に加えて、あるいはこれ
らの代わりに、他の好適な入力装置を使用することができる。双方向システム・
バス１１８０に結合されたＩ／Ｏ（入力／出力）ユニット１１９０は、このよう
なＩ／Ｏ要素をプリンタ、Ａ／Ｖ（オーディオ／ビデオ）Ｉ／Ｏなどとして表し
ている。

【００７８】コンピュータ１０００は、ビデオ・メモリ１１４０、主メモリ１１５０、およ
び大容量記憶装置１１２０を備え、すべてキーボード１１００、マウス１１１０
、およびプロセッサ１１３０と共に、双方向システム・バス１１８０に結合され
ている。大容量記憶装置１１２０には、磁気、光、または磁気光の記憶システム
、あるいは任意の他の使用可能な大容量記憶装置などの、固定媒体および取外し
可能媒体の両方が含まれる。バス１１８０にはたとえば、ビデオ・メモリ１１４
０または主メモリ１１５０をアドレス指定するための３２アドレス・ラインを含
むことができる。システム・バス１１８０には、たとえばプロセッサ１１３０、
主メモリ１１５０、ビデオ・メモリ１１４０、および大容量記憶装置１１２０な
どの構成要素間でデータを転送するための、３２ビットのデータ・バスも含まれ
る。あるいは、別々のデータおよびアドレス・ラインではなく、多重データ／ア
ドレス・ラインを使用することもできる。

【００７９】本発明の一実施形態では、プロセッサ１１３０は、６８０×０プロセッサなど
のＭｏｔｏｒｏｌａ社が製造したマイクロプロセッサ、または８０×８６などの
Ｉｎｔｅｌ社が製造したマイクロプロセッサ、あるいはＰｅｎｔｉｕｍプロセッ
サ、またはＳｕｎＭｉｃｒｏｓｙｓｔｅｍｓ^TM，Ｉｎｃ．からのＳＰＡＲＣ^TM マイクロプロセッサである。ただし、任意の他の好適なマイクロプロセッサまた
はマイクロコンピュータも利用可能である。主メモリ１１５０は、ダイナミック
・ランダム・アクセス・メモリ（ＤＲＡＭ）からなる。ビデオ・メモリ１１４０
は、２重ポートのビデオ・ランダム・アクセス・メモリである。ビデオ・メモリ
１１４０の１つのポートはビデオ増幅器１１６０に結合される。ビデオ増幅器１
１６０は、陰極線管（ＣＲＴ）ラスタ・モニタ１１７０を駆動するのに使用され
る。ビデオ増幅器１１６０は当分野ではよく知られており、任意の好適な装置に
よって実施することができる。この回路構成は、ビデオ・メモリ１１４０内に格
納されたピクセル・データを、モニタ１１７０が使用するのに好適なラスタ信号
に変換する。モニタ１１７０は、グラフィック画像を表示するのに好適な一種の
モニタである。あるいは、ビデオ・メモリはフラット・パネルまたは液晶表示（
ＬＣＤ）、あるいは任意の他の好適なデータ表示装置を駆動するのに使用するこ
とができる。

【００８０】コンピュータ１０００は、バス１１８０に結合された通信インターフェース１
２００も備えることができる。通信インターフェース１２００は、ネットワーク
・リンク１２１０を介してローカル・ネットワーク１２２０に結合する、２方向
データ通信を提供する。たとえば、通信インターフェース１２００が統合サービ
ス・デジタル通信網（ＩＳＤＮ）カードまたはモデムの場合、通信インターフェ
ース１２００は、ネットワーク・リンク１２１０の一部を含む対応するタイプの
電話回線へのデータ通信接続を提供する。通信インターフェース１２００がロー
カル・エリア・ネットワーク（ＬＡＮ）カードの場合、通信インターフェース１
２００は、ネットワーク・リンク１２１０を介した互換ＬＡＮへのデータ通信接
続を提供する。通信インターフェース１２００は、ケーブル・モデムまたは無線
インターフェースであってもよい。これらのいずれを実施する場合でも、通信イ
ンターフェース１２００は、様々なタイプの情報を表すデジタル・データ・スト
リームを搬送する、電気信号、電磁信号、または光信号を送受信する。

【００８１】ネットワーク・リンク１２１０は、典型的には１つまたは複数のネットワーク
を介して他のデータ装置へのデータ通信を提供する。たとえば、ネットワーク・
リンク１２１０は、ローカル・ネットワーク１２２０を介したローカル・サーバ
・コンピュータ１２３０への、あるいはインターネット・サービス・プロバイダ
（ＩＳＰ）１２４０によって動作するデータ機器への接続を提供することができ
る。次にＩＳＰ１２４０は、現在では一般に「インターネット」１２５０と呼
ばれているワールド・ワイド・パケット・データ通信ネットワークを介して、デ
ータ通信サービスを提供する。ローカル・ネットワーク１２２０およびインター
ネット１２５０は、どちらも、デジタル・データ・ストリームを搬送する、電気
信号、電磁信号、または光信号を使用する。コンピュータ１０００との間でデジ
タル・データを相互に搬送する、様々なネットワークを介した信号ならびにネッ
トワーク・リンク１２１０上および通信インターフェース１２００を介した信号
は、例示的に情報を移送する搬送波の形式をとる。

【００８２】コンピュータ１０００は、ネットワーク、ネットワーク・リンク１２１０、お
よび通信インターフェース１２００を介して、メッセージを送信し、プログラム
・コードを含むデータを受信することができる。インターネットの例では、リモ
ート・サーバ・コンピュータ１２６０が、アプリケーション・プログラム用に要
求されたコードを、インターネット１２５０、ＩＳＰ１２４０、ローカル・ネ
ットワーク１２２０、および通信インターフェース１２００を介して伝送する場
合がある。

【００８３】受信されたコードは、受信されたままの状態でプロセッサ１１３０によって実
行されるか、後で実行するために大容量記憶装置１１２０または他の不揮発性記
憶装置内に格納され、あるいはその両方を実行することができる。この様式では
、コンピュータ１０００が搬送波の形式でアプリケーション・コードを取得する
ことができる。

【００８４】アプリケーション・コードは、いずれの形式のコンピュータ・プログラム製品
でも具体化することができる。コンピュータ・プログラム製品は、コンピュータ
読取り可能コードまたはデータを格納または移送するように構成された媒体を含
むか、あるいはその中にコンピュータ読取り可能コードまたはデータを組み込む
ことができる。コンピュータ・プログラム製品の例としては、ＣＤ−ＲＯＭディ
スク、ＲＯＭカード、フロッピィ・ディスク、磁気テープ、コンピュータ・ハー
ド・ドライブ、ネットワーク上のサーバおよび搬送波がある。

【００８５】《ヒューマン・インターフェース装置コンピュータ・システム》本発明は、データがネットワークを介して提供されるコンピュータ・システム
に適用される。このネットワークは、ローカル・エリア・ネットワーク、広域ネ
ットワーク、インターネット、ワールド・ワイド・ウェブ、あるいは任意の他の
好適なネットワーク構成が可能である。本発明の一実施形態は、本明細書ではヒ
ューマン・インターフェース装置コンピュータ・システムと呼ばれる、コンピュ
ータ・システム構成で使用される。

【００８６】このシステムでは、システムの機能性が表示および入力装置と、データソース
またはサービスとの間で区分される。表示および入力装置がヒューマン・インタ
ーフェース装置（ＨＩＤ）である。このシステムの区分は、ＨＩＤから状態関数
および計算関数が除去され、データ・ソースまたはサービス上に常駐するように
なっている。本発明の一実施形態では、１つまたは複数のサービスが１つまたは
複数のＨＩＤと、ネットワークのような何らかの相互接続組織を介して通信する
。このようなシステムの一例が図８に示されている。図８を参照すると、このシ
ステムは、相互接続組織８０１を介してＨＩＤ８０２と通信する、計算サービス
・プロバイダ８００からなる。

【００８７】計算サービス・プロバイダ − ＨＩＤシステムでは、計算機能および状態保
守は、サービス・プロバイダまたはサービスにある。サービスは特定のコンピュ
ータに結びつけられているのではなく、図１０に関連して述べたような１つまた
は複数の従来のデスクトップ・システムを介して、あるいは従来のサーバを使用
して分配することができる。１つのコンピュータが１つまたは複数のサービスを
有することが可能であり、あるいはサービスを１つまたは複数のコンピュータに
よって実施することが可能である。サービスは、計算、状態、およびデータをＨ
ＩＤに提供し、このサービスは、一般の権限または管理者の制御下にある。図８
では、サービスはコンピュータ８１０、８１１、８１２、８１３、および８１４
に見られる。本発明の一実施形態では、コンピュータ８１０〜８１４のいずれも
、送信器として実施可能である。

【００８８】サービスの例には、Ｘ１１／Ｕｎｉｘサービス、アーカイブ対象ビデオ・サー
ビス、ＷｉｎｄｏｗｓＮＴサービス、Ｊａｖａ^TMプログラム実行サービスなど
が含まれる。本明細書のサービスは、出力データを提供し、ユーザの要求および
入力に応答するプロセスである。

【００８９】相互接続組織 − 相互接続組織は、サービスとＨＩＤとの間でデータを搬送
するための、任意の複数の好適な通信パスである。一実施形態では、相互接続組
織は、イーサネット・ネットワークとして実施されるローカル・エリア・ネット
ワークである。任意の他のローカル・ネットワークも利用可能である。本発明で
は、広域ネットワーク、インターネット、ワールド・ワイド・ウェブなどの使用
も企図している。相互接続組織は、電線または光ファイバ・ケーブルなどの物理
的な媒体を使用して実施するか、または無線環境で実施することができる。

【００９０】ＨＩＤ − ＨＩＤは、ユーザがサービスによって提供される計算サービスに
アクセスする手段である。図８は、ＨＩＤ８２１、８２２、および８２３を示
す図である。ＨＩＤはディスプレイ８２６、キーボード８２４、マウス８２５、
およびオーディオ・スピーカ８２７からなる。ＨＩＤには、これらの装置を相互
接続組織にインターフェースし、サービスにデータを送信し、サービスからデー
タを受信するのに必要なエレクトロニクスが含まれる。本発明の一実施形態では
、ＨＩＤは受信器として実施される。

【００９１】ＨＩＤの構成図は図９に示されている。ＨＩＤの構成要素は、内部的にＰＣＩ
バス９１２に結合される。ネットワーク制御ブロック９０２は、ライン９１４を
介してイーサネットなどの相互接続組織と通信する。オーディオ・コーデック９
０３はインターフェース９１６上でオーディオ・データを受信するものであって
、ブロック９０２に結合される。ＵＳＢデータ通信は、ライン９１３上でＵＳＢ
制御装置９０１に提供される。

【００９２】組込型プロセッサ９０４は、たとえばフラッシュ・メモリ９０５およびＤＲＡ
Ｍ９０６に結合されたＳｐａｒｃ２ｅｐであってもよい。ＵＳＢ制御装置９０
１、ネットワーク制御装置９０２、および組込型プロセッサ９０４は、すべてＰ
ＣＩバス９１２に結合される。さらに、ビデオ制御装置９０９もＰＣＩ９１２
に結合される。ビデオ制御装置９０９は、たとえば、ライン９１５上でＳＶＧＡ
出力を提供する、ＡＴＩＲａｇｅＰｒｏ＋フレーム・バッファ制御装置であっ
てもよい。ＮＴＳＣデータは、それぞれビデオ復号器９１０およびビデオ符号器
９１１を介してビデオ制御装置内部および外部に提供される。スマートカード・
インターフェース９０８も、ビデオ制御装置９０９に結合されてもよい。

【００９３】上記のコンピュータ・システムは、例示目的でのみ述べたものである。本発明
の実施形態は、どのようなタイプのコンピュータ・システムあるいはプログラミ
ングまたは処理環境でも実施することができる。

【００９４】以上、ネットワーク環境でオーディオ・プロトコルをサポートするための方法
および装置について、１つまたは複数の特定の実施形態に関して述べてきた。本
発明は、特許請求の範囲およびそれらの均等物の全範囲によって定義されるもの
である。

【図面の簡単な説明】

【図１】Ａは時間に関するオーディオ波形を示す図であり、Ｂ及びＣは、
それぞれ２４キロヘルツおよび８キロヘルツのサンプリング・レートでサンプリ
ングされた波形を示す図である。

【図２】Ａは線形量子化関数の一例を示す図であり、Ｂは非線形量子化関
数の一例を示す図である。

【図３】単一の受信器および複数の送信器を備えた、ネットワーク・シス
テムの構成図である。

【図４】本発明の一実施形態に従い待ち時間制御のアプリケーションを示
した、入力および出力波形を示す図である。

【図５】本発明の一実施形態に従い、オーディオ・データのインターリー
ブおよび補間の効果を示した、一連の波形を示す図である。

【図６】本発明の一実施形態に従ってネットワーク化されたオーディオ・
データ処理の流れ図である。

【図７】本発明の一実施形態に従ったネットワーク環境の構成図である。

【図８】ヒューマン・インターフェース装置を含むコンピュータ・システ
ムを示す構成図である。

【図９】ヒューマン・インターフェース装置の一実施形態を示す構成図で
ある。

【図１０】コンピュータ実施環境を示す構成図である。

【手続補正書】

【提出日】平成１３年５月３１日（２００１．５．３１）

【手続補正２】

【補正対象書類名】明細書

【補正対象項目名】特許請求の範囲

【補正方法】変更

【補正内容】

【特許請求の範囲】

───────────────────────────────────────────────────── フロントページの続き (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＣＹ，ＤＥ，ＤＫ，ＥＳ，ＦＩ，ＦＲ，ＧＢ，ＧＲ，ＩＥ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＰＴ，ＳＥ)，ＯＡ(ＢＦ，ＢＪ，ＣＦ，ＣＧ，ＣＩ，ＣＭ，ＧＡ，ＧＮ，ＧＷ，ＭＬ，ＭＲ，ＮＥ，ＳＮ，ＴＤ，ＴＧ)，ＡＰ(ＧＨ，ＧＭ，ＫＥ，ＬＳ，ＭＷ，ＳＤ，ＳＬ，ＳＺ，ＵＧ，ＺＷ)，ＥＡ(ＡＭ，ＡＺ，ＢＹ，ＫＧ，ＫＺ，ＭＤ，ＲＵ，ＴＪ，ＴＭ)，ＡＥ，ＡＬ，ＡＭ，ＡＴ，ＡＵ，ＡＺ，ＢＡ，ＢＢ，ＢＧ，ＢＲ，ＢＹ，ＣＡ，ＣＨ，ＣＮ，ＣＵ，ＣＺ，ＤＥ，ＤＫ，ＥＥ，ＥＳ，ＦＩ，ＧＢ，ＧＤ，ＧＥ，ＧＨ，ＧＭ，ＨＲ，ＨＵ，ＩＤ，ＩＬ，ＩＮ，ＩＳ，ＪＰ，ＫＥ，ＫＧ，ＫＰ，ＫＲ，ＫＺ，ＬＣ，ＬＫ，ＬＲ，ＬＳ，ＬＴ，ＬＵ，ＬＶ，ＭＤ，ＭＧ，ＭＫ，ＭＮ，ＭＷ，ＭＸ，ＮＯ，ＮＺ，ＰＬ，ＰＴ，ＲＯ，ＲＵ，ＳＤ，ＳＥ，ＳＧ，ＳＩ，ＳＫ，ＳＬ，ＴＪ，ＴＭ，ＴＲ，ＴＴ，ＵＡ，ＵＧ，ＵＺ，ＶＮ，ＹＵ，ＺＡ，ＺＷ (71)出願人 901 ＳＡＮＡＮＴＯＮＩＯＲＯＡＤＰＡＬＯＡＬＴＯ，ＣＡ 94303，Ｕ．Ｓ．Ａ．Ｆターム(参考） 5D045 DA11 5K034 CC05 DD02 HH21 HH61 【要約の続き】に従い、オーディオ・データがどのように処理されるかを管理するためにシーケンス・サイズが指定される。送信器は、オーディオ待ち時間を各オーディオ・アプリケーションについて指定された制限内で維持するために、シーケンス・サイズを適応的に制御する。指定されたプロトコルは、複数のオーディオ出力装置間で、複数のチャネルを備えたオーディオ・データがどのようにミキシングおよびルーティングされるかを指定するために、ミックス・モードおよびいくつかのチャネルも決定する。

Claims

【特許請求の範囲】

【請求項１】複数のオーディオ・プロトコルに従ってオーディオ・データ
を提供する１つまたは複数のオーディオ・ソースを備え、単一のオーディオ・プロトコルをサポートするよう構成された受信器を備え、ネットワークを介して受信器に結合された送信器を備え、この送信器が前記１
つまたは複数のオーディオ・ソースからの前記オーディオ・データを、前記単一
のオーディオ・プロトコルに合致する変換済みのオーディオ・データに変換する
よう構成されていることを特徴とする装置。
【請求項２】前記送信器がオーディオ・データの取得を実行するように構
成された、請求項１に記載の装置。
【請求項３】前記送信器が待ち時間制御を実行するように構成された、請
求項１に記載の装置。
【請求項４】前記送信器が前記変換済みのオーディオ・データをインター
リーブするように構成された、請求項１に記載の装置。
【請求項５】前記受信器が前記変換済みのオーディオ・データをインター
リーブ解除するように構成された、請求項４に記載の装置。
【請求項６】前記受信器が補間済みのオーディオ・データを生成するよう
に構成された、請求項１に記載の装置。
【請求項７】前記受信器が、前記変換済みのオーディオ・データを、前記
送信器によって指定されたミックス・モードに従って１つまたは複数の出力装置
に出力するように構成された、請求項１に記載の装置。
【請求項８】前記受信器が、前記ミックス・モードに基づいて複数のオー
ディオ・チャネルをミックスするように構成された、請求項７に記載の装置。
【請求項９】前記送信器が、前記変換済みのオーディオ・データを前記受
信器に複数のパケット単位で送信するように構成された、請求項１に記載の装置
。
【請求項１０】前記送信器が、前記複数のパケットを擬似ランダムに送信
するように構成された、請求項９に記載の装置。
【請求項１１】前記複数のパケットのうち少なくとも１つがオーディオ・
シーケンス番号を含む、請求項９に記載の装置。
【請求項１２】前記複数のパケットのうち少なくとも１つがシーケンス長
を含む、請求項９に記載の装置。
【請求項１３】前記複数のパケットのうち少なくとも１つがパケット長を
含む、請求項９に記載の装置。
【請求項１４】前記複数のパケットのうち少なくとも１つが、現在のオー
ディオ・シーケンスのインターリーブ・サイズを含む、請求項９に記載の装置。
【請求項１５】前記複数のパケットのうち少なくとも１つがインターリー
ブ・オフセットを含む、請求項１４に記載の装置。
【請求項１６】前記複数のパケットのうち少なくとも１つが、１つまたは
複数のオーディオ・チャネルの出力配列を指定するミックス・モード・フィール
ドを含む、請求項９に記載の装置。
【請求項１７】前記複数のパケットのうち少なくとも１つが、カレント・
パケット中にあるオーディオ・チャネル数を指定するチャネル・フィールドを含
む、請求項９に記載の装置。
【請求項１８】コンピュータ・ネットワークを介してオーディオ・データ
を処理するための方法であって、送信器が１つまたは複数のオーディオ・ソースからオーディオ・データを取得
し、前記送信器が前記オーディオ・データをプロトコルに合致するように変換し、前記送信器が前記オーディオ・データを受信器に送信し、前記受信器が前記オーディオ・データを受信し、前記受信器が前記オーディオ・データを１つまたは複数の出力装置に送信する
ステップを含む方法。
【請求項１９】前記オーディオ・データを変換するステップに、サンプル
・レート変換、解像度変換、および量子化線形化のうちの少なくとも１つが含ま
れる、請求項１８に記載の方法。
【請求項２０】前記送信器が前記オーディオ・データを伝送用に複数のパ
ケットに書き込むことをさらに含む、請求項１８に記載の方法。
【請求項２１】前記送信器が最大待ち時間を決定することと、前記送信器が前記最大待ち時間に基づいてシーケンス長を指定することをさら
に含む、請求項２０に記載の方法。
【請求項２２】前記受信器が前記複数のパケットを前記指定されたシーケ
ンス長のバッファに書き込むことをさらに含む、請求項２１に記載の方法。
【請求項２３】前記受信器が前記バッファ内で不存在のオーディオ・サン
プルを補間することをさらに含む、請求項２２に記載の方法。
【請求項２４】前記受信器が前記バッファ内の複数のサンプルをリタイミ
ングすることをさらに含む、請求項２２に記載の方法。
【請求項２５】前記受信器が前記シーケンス・バッファを出力バッファ内
にミキシングすることをさらに含む、請求項２２に記載の方法。
【請求項２６】前記受信器が、遅延シーケンスを検出し、前記シーケンス
の前記出力バッファ内への前記ミキシングを強制することをさらに含む、請求項
２５に記載の方法。
【請求項２７】前記オーディオ・データの書込むことが、前記複数のパケ
ット間で前記オーディオ・データをインターリーブすることを含む、請求項２０
に記載の方法。
【請求項２８】前記受信器が前記オーディオ・データをインターリーブ解
除することをさらに含む、請求項２７に記載の方法。
【請求項２９】前記オーディオ・データの送信が、前記複数のパケットを
擬似ランダム順序で送信することを含む、請求項２０に記載の方法。
【請求項３０】コンピュータ・ネットワーク内のオーディオ・データを伝
送するために、コンピュータ読取り可能コードが組み込まれたコンピュータ使用
可能媒体を備えたコンピュータ・プログラム製品であって、送信器において：１つまたは複数のオーディオ・ソースからオーディオ・データを取得するス
テップと、前記オーディオ・データをプロトコルに合致するように変換するステップ
と、前記オーディオ・データを受信器に送信するステップとを実行させるように構成されたコンピュータ読取り可能コードと；受信器において：前記オーディオ・データを受信するステップと、前記オーディオ・データを１つまたは複数の出力装置に送信するステップと
を、実行させるように構成されたコンピュータ読取り可能コードとを含むコンピュータ・プログラム製品。
【請求項３１】前記オーディオ・データを変換するステップに、サンプル
・レート変換、解像度変換、および量子化線形化のうちの少なくとも１つが含ま
れる、請求項３０に記載のコンピュータ・プログラム製品。
【請求項３２】前記送信器において前記オーディオ・データを伝送用に複
数のパケットに書き込むステップを実行させるよう構成されたコンピュータ読取
り可能コードをさらに含む、請求項３０に記載のコンピュータ・プログラム製品
。
【請求項３３】前記送信器において最大待ち時間を決定するステップを実
行させるよう構成されたコンピュータ読取り可能コードと、前記送信器において前記最大待ち時間に基づいてシーケンス長を指定するステ
ップを実行させるよう構成されたコンピュータ読取り可能コードとをさらに含む
、請求項３２に記載のコンピュータ・プログラム製品。
【請求項３４】前記受信器において、前記複数のパケットを前記指定され
たシーケンス長のバッファに書き込むステップを実行させるよう構成されたコン
ピュータ読取り可能コードをさらに含む、請求項３３に記載のコンピュータ・プ
ログラム製品。
【請求項３５】前記受信器において、前記バッファ内で不存在のオーディ
オ・サンプルを補間するステップを実行させるよう構成されたコンピュータ読取
り可能コードをさらに含む、請求項３４に記載のコンピュータ・プログラム製品
。
【請求項３６】前記受信器において、前記バッファ中の複数のサンプルを
リタイミングさせるステップを実行するよう構成されたコンピュータ読取り可能
コードをさらに含む、請求項３４に記載のコンピュータ・プログラム製品。
【請求項３７】前記受信器において、前記シーケンス・バッファを出力バ
ッファ内にミキシングさせるステップを実行させるよう構成されたコンピュータ
読取り可能コードをさらに含む、請求項３４に記載のコンピュータ・プログラム
製品。
【請求項３８】前記受信器において、遅延シーケンスを検出し、前記シー
ケンスの前記出力バッファ内への前記ミキシングを開始させるステップを実行さ
せるよう構成されたコンピュータ読取り可能コードをさらに含む、請求項３７に
記載のコンピュータ・プログラム製品。
【請求項３９】前記オーディオ・データの書込みが、前記複数のパケット
間で前記オーディオ・データをインターリーブすることを含む、請求項３２に記
載のコンピュータ・プログラム製品。
【請求項４０】前記受信器において、前記オーディオ・データをインター
リーブ解除させるステップを実行するよう構成されたコンピュータ読取り可能コ
ードをさらに含む、請求項３９に記載のコンピュータ・プログラム製品。
【請求項４１】前記オーディオ・データの送信が、前記複数のパケットを
擬似ランダム順序で送信することを含む、請求項３２に記載のコンピュータ・プ
ログラム製品。
【請求項４２】コンピュータ・ネットワーク内のオーディオ・データを処
理するための装置であって、送信器内に：１つまたは複数のオーディオ・ソースからオーディオ・データを取得する手
段と、前記オーディオ・データをプロトコルに合致するように変換する手段と、前記オーディオ・データを受信器に送信する手段とを含んでおり；前記受信器内に：前記オーディオ・データを受信する手段と、前記オーディオ・データを１つまたは複数の出力装置に送信する手段とを含んでいることを特徴とする装置。