JP2007502579A - 異種コンピューティングプラットフォームにおける分散音声・ビデオキャプチャのための汎用適応同期方式 - Google Patents

異種コンピューティングプラットフォームにおける分散音声・ビデオキャプチャのための汎用適応同期方式 Download PDF

Info

Publication number
JP2007502579A
JP2007502579A JP2006523247A JP2006523247A JP2007502579A JP 2007502579 A JP2007502579 A JP 2007502579A JP 2006523247 A JP2006523247 A JP 2006523247A JP 2006523247 A JP2006523247 A JP 2006523247A JP 2007502579 A JP2007502579 A JP 2007502579A
Authority
JP
Japan
Prior art keywords
analog
signal
digital converter
coupled
synchronization signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006523247A
Other languages
English (en)
Other versions
JP4287880B2 (ja
Inventor
コジントセブ、イーガー
ラインハート、ライナー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of JP2007502579A publication Critical patent/JP2007502579A/ja
Application granted granted Critical
Publication of JP4287880B2 publication Critical patent/JP4287880B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/02Details
    • H04J3/06Synchronising arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/02Details
    • H04J3/06Synchronising arrangements
    • H04J3/0635Clock or time synchronisation in a network
    • H04J3/0638Clock or time synchronisation among nodes; Internode synchronisation
    • H04J3/0658Clock or time synchronisation among packet nodes
    • H04J3/0661Clock or time synchronisation among packet nodes using timestamps
    • H04J3/0667Bidirectional timestamps, e.g. NTP or PTP for compensation of clock drift and for compensation of propagation delays

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Synchronisation In Digital Transmission Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Time-Division Multiplex Systems (AREA)

Abstract

本発明の一実施形態によれば、新規な装置が開示される。本装置は、事前定義された同期信号と受信側クロックとを受け取るアナログ・デジタル変換器(406)と、アナログ・デジタル変換器に結合され、アナログ・デジタル変換器の出力を受け取り、連続的に現遅延推定値及びスキュー推定値を推定し信号を同期させるように適応させる補間モジュール(408)と、を有する。

Description

本発明は、包括的には、分散マルチメディア同期化の分野に関する。詳細には、本発明の一実施形態は、異種コンピューティングプラットフォームにおける分散音声・ビデオキャプチャのための汎用適応同期方式に関する。
本明細書には、著作権保護を受ける内容が含まれている。著作権所有者は、米国特許商標庁の特許ファイル又は記録にある通りの特許開示内容の何人によるファクシミリ複製にも異存はないが、それ以外の場合は著作権のいかなる権利もそのすべてを保有するものである。
計算能力を追加する一手法は、分散コンピュータ環境を利用することであった。この手法により、いくつかのコンピュータが、短縮された時間内に計算タスクを協働して実行することができる。一般に、かかる並列コンピューティング手法によって提供される分割統治法により、計算集約的なタスクを実行するために高性能のサーバベースのコンピュータシステムを購入するのではなく、使用可能なパーソナルコンピュータを利用することができる。
しかしながら、分散コンピューティングは、一般に、純粋な計算タスクを実行することに適用され、信号、特に音声/ビデオ信号(及びデータストリーム)の同期したキャプチャ及び/又は処理には適用されなかった。音声/ビデオ信号(及びデータストリーム)の信号処理は、一般に、サンプリングレートの非常にわずかな差(たとえばクロックスキュー)、ジッタの非常にわずかな差及び遅延の非常にわずかな差に対してさえも非常に影響を受けやすい。したがって、正確な同期化は、高品質入出力処理にとって、且つリアルタイム性能及び一般には頑強性及び信頼性問題にとって非常に重大である。しかしながら、現行のプラットフォームでは、正確なキャプチャ及び同期した入力は保証されていない。
たとえば、同じパーソナルコンピュータ(PC)プラットフォームにおいて、ビデオカメラ(複数可)及びマイクロフォン(複数可)から音声情報及び映像情報をキャプチャするためにいくつかの入出力(I/O)デバイスが使用される場合に、問題が起こる可能性がある。異なるI/Oデバイスが別々の発振器によってトリガされることになるという事実のために、結果として得られる音声サンプル及びビデオフレームが絶対時間軸上に位置合せされない(そのため幾分かの相対的なオフセットがもたらされる)ことになる。さらに、発振器の周波数の差により、音声データ及び/又は映像データが、時間の経過により複数のチャネル/ストリームにわたってドリフトする。発振器の周波数が不安定であることはまた、互いの間で完全には相関しない。
同様に、複数のPCプラットフォームの場合、音声及び映像I/Oデバイスは時間尺度において同期しなくなり、幾分かの相対的なオフセットがもたらされ、データサンプルが互いに対してドリフトする。既存のプラットフォームにおける相対的なオフセット、ドリフト及びジッタの大きさは、多くのハードウェアパラメータ及びソフトウェアパラメータによって決まり、非常に著しい場合があり、処理信号が(非同期入力ストリームから)全体的に劣化する場合がある。かかるドリフト、遅延及びジッタにより、たとえばアレイ信号処理アルゴリズムの性能が大幅に劣化する可能性がある。
たとえば、マイクロフォンの間に10cmの間隔がある音響ビームフォーマでは、わずか0.01%の時間の誤差により、ビーム方向において20度の誤差がもたらされる可能性がある。この事実により、音声アレイプロセスアルゴリズムの現行の実施態様は、複数のI/Oチャネルを同期させる専用回路に依存することがある。不都合なことに、既存のPCプラットフォームを用いてかかる手法を実施するには、PCプラットフォームが利用する現行のハードウェアの大規模なオーバーホールが必要である。したがって、上述した既存の技術における限界の1つ又は複数を克服する必要がある。
本発明を、同様の参照記号が同様の又は同一の要素を示す添付図面の図において、限定としてではなく例として示す。
本発明の以下の詳細な説明において、本発明が完全に理解されるために多数の特定の詳細を示す。しかしながら、当業者には、本発明をこれらの特定の詳細なしに実施してもよい、ということが理解されよう。場合によっては、本発明が不明確にならないために、既知の構造及びデバイスについては、詳細にではなくブロック図形態で示す。
明細書において「1つの実施形態」又は「一実施形態」と言及する場合、その実施形態に関連して説明する特定の特徴、構造又は特性が、本発明の少なくとも1つの実施形態に含まれることを意味する。本明細書中のさまざまな箇所で「一実施形態において」という句が現れるが、それは必ずしも全て同じ実施形態を指しているとは限らない。
本明細書では、以下のクロック関連の定義を使用する。
・「安定性」は、クロックがいかに一定の周波数を維持することができるかを示す。
・「正確度」は、クロックの時間がいかに国家標準に合うかを示す。
・「精度」は、クロックの内部分解能を指定する。
・「オフセット」は、2つのクロック間の時間差を指定する。
・「スキュー」は、2つのクロック間の周波数の差を特徴付け、周波数の比として定義される。
・「2つのクロックを同期させる」とは、周波数及び時間に関して2つのクロックを調和させる(すなわち、オフセットをゼロに修正しスキューを1に等しくする)プロセスを示す。
また、本明細書において「汎用コンピュータ」(GPC)という用語を使用する時、それは、分散音声/映像システムの一部であり得るラップトップ、PDA、タブレットPC、携帯電話及び同様のデバイスを示すことが意図されている。
図1は、本発明の一実施形態を実施してもよいコンピュータシステム100の例示的なブロック図を示す。コンピュータシステム100は、バス105に結合された中央処理装置(CPU)102を含む。一実施形態では、CPU102は、カリフォルニア州サンタクララのインテル・コーポレーション(Intel Corporation)が販売しているPentium(登録商標)IIプロセッサファミリ、Pentium(登録商標)IIIプロセッサ、Pentium(登録商標)IVプロセッサを含むPentium(登録商標)プロセッサファミリのプロセッサである。別法として、インテルのXScaleプロセッサ、インテルのPentium Mプロセッサ、英国ケンブリッジのARM Ltd.から販売されているARMプロセッサ、又はテキサス州ダラスのTexas Ins(登録商標)truments, Inc.から販売されているOMAPプロセッサ(拡張ARMベースプロセッサ)等、他のCPUを使用してもよい。
バス105にはチップセット107も結合されている。チップセット107は、メモリ制御ハブ(MCH)110を含む。MCH110は、メインシステムメモリ115に結合されたメモリコントローラ112を含んでもよい。メインシステムメモリ115は、CPU102又はシステム100に含まれる他の任意のデバイスが実行するデータ及び命令シーケンスを格納する。一実施形態では、メインシステムメモリ115は、ダイナミックランダムアクセスメモリ(DRAM)を含むが、メインシステムメモリ115を他のメモリタイプを使用して実施してもよい。複数のCPU及び/又は複数のシステムメモリ等、追加のデバイスをバス105に結合してもよい。
MCH110はまた、グラフィックスアクセラレータ130に結合されたグラフィックスインタフェース113を含んでもよい。一実施形態では、グラフィックスインタフェース113は、カリフォルニア州サンタクララのインテル・コーポレーションによって開発されたアクセラレーテッドグラフィックスポート(accelerated graphics port)(AGP)仕様改訂2.0インタフェースに従って動作するAGPを介してグラフィックスアクセラレータ130に結合される。本発明の一実施形態では、グラフィックスインタフェース113には、たとえば信号変換器を介してフラットパネルディスプレイを結合してもよく、信号変換器は、ビデオメモリ又はシステムメモリ等の記憶デバイスに格納された画像のデジタル表現を、フラットパネルスクリーンによって解釈され表示される表示信号に変換する。表示デバイスによって生成される表示信号が、フラットパネルディスプレイモニタによって解釈され後に表示される前にさまざまな制御デバイスを通過してもよい、ということが考えられる。表示デバイスは、液晶ディスプレイ(LCD)、フラットパネルディスプレイ、プラズマスクリーン、薄膜トランジスタ(TFT)ディスプレイ等であってもよい。
さらに、ハブインタフェースは、MCH110を、ハブインタフェースを介して入出力制御ハブ(ICH)140に結合する。ICH140は、コンピュータシステム100内の入出力(I/O)デバイスに対するインタフェースを提供する。本発明の一実施形態では、ICH140を、オレゴン州ポートランドの周辺コンポーネント相互接続(Peripheral Component Interconnect)(PCI)特別利益団体(SIG)によって開発された仕様改訂2.1バスに従うPCIバスに結合してもよい。このように、ICH140は、バス142に対するインタフェースを提供するバスブリッジ146を含む。本発明の一実施形態では、バス142はPCIバスである。さらに、バスブリッジ146は、CPU102と周辺デバイスとの間のデータパスを提供する。
バス142は、I/Oデバイス200(図2を参照してさらに論考する)と、ディスクドライブ155とを含む。しかしながら、当業者は、PCIバス142に他のデバイスを結合してもよい、ということを理解するであろう。さらに、当業者は、CPU102及びMCH110を結合して単一チップを形成してもよい、ということを認識するであろう。さらに、他の実施形態では、MCH110内にグラフィックスアクセラレータ130を含めてもよい。
さらに、本発明のさまざまな実施形態では、ICH140に他の周辺デバイスを結合してもよい。たとえば、かかる周辺デバイスには、統合ドライブエレクトロニクス(IDE)又は小型コンピュータシステムインタフェース(SCSI)ハードドライブ(複数可)、ユニバーサルシリアルバル(USB)ポート(複数可)、キーボード、マウス、パラレルポート(複数可)、シリアルポート(複数可)、フロッピー(登録商標)ディスクドライブ(複数可)、デジタル出力サポート(たとえば、デジタルビデオインタフェース(DVI))等が含まれてもよい。さらに、コンピュータシステム100は、動作するために以下のソースのうちの1つ又は複数から電力を受け取ることが考えられる。すなわち、電源(バッテリ、燃料電池等)、交流(AC)コンセント(たとえば変圧器及び/又はアダプタを介する)、自動車電源、航空機電源等である。
図2は、図1に示すようなコンピュータシステム100のI/Oデバイス200をさらに示す。図示するように、コンピュータシステム100は、モニタ等の表示デバイス212を含んでもよい。表示デバイス212は、フレームバッファ等の中間デバイスを含んでもよい。コンピュータデバイス100はまた、キーボード等の入力デバイス210と、マウス、トラックボール又はトラックパッド等のカーソル制御部208とを含む。表示デバイス212、入力デバイス210及びカーソル制御部208は、バス142に結合される。コンピュータシステム100は、ローカルエリアネットワーク(LAN)又はたとえばインターネット等の広域ネットワーク(WAN)の一部として接続され得るようにネットワークコネクタ206を含んでもよい。
さらに、コンピュータシステム100を、発話認識のために音声入力を記録するか又は音全般を記録するマイクロフォンに結合された音声デジタル化デバイス等の録音及び再生のためのデバイス230に結合することも可能である。コンピュータシステム100のI/Oデバイス200はまた、ビデオ画像のみをキャプチャするため又は録音デバイス230と協働してビデオ画像に関連する音声情報をキャプチャするために使用することができるビデオデジタル化デバイス220を含んでもよい。さらに、入力デバイス200はまた、ハードコピーデバイス204(プリンタ等)及びCD−ROMデバイス202を含んでもよい。入力デバイス200(202〜212)もまた、バス142に結合される。
したがって、図1に示すようなコンピュータシステム100を利用して、たとえば選択されたシーン、環境等からの音声データ及び/又はビデオデータを含むマルチメディアデータをキャプチャすることができる。現在、多くの人は、たとえば、コンピュータシステム100のポート(図示せず)、たとえばUSBポート又はファイヤワイヤポート(IEEE1394)等に結合されたカメラを通して、ライブ音声/ビデオデータ(マルチメディアシーンデータ)をキャプチャするために、図1に示すようなパーソナルコンピュータ(PC)を利用する。そして、このデータは、限定されないがMicrosoft(登録商標)アドバンスドストリーミングフォーマット(ASF)ファイル、モーションピクチャエキスパートグループ(MPEG)−1/2/4等のMPEG規格、並びにオーディオレイヤ3(MP3)ファイル、リアルオーディオ(Real Audio)G2ファイル、QDesign2ファイル等を含むストリーミングメディアフォーマット(マルチメディアストリームデータ)として提供される。
本発明の一実施形態では、コンピュータシステム100は、マイクロフォン等の音声キャプチャ装置を利用して、キャプチャされたマルチメディアシーンデータに関連する音声情報をキャプチャしてもよい。したがって、個人がたとえばライブ音声/ビデオデータをキャプチャするために自身のパーソナルコンピュータを利用しようとする際、一般に、音声/ビデオデータは、1つ又は複数のデータキャプチャ装置を利用して最も有効にキャプチャされるということが認識される。
図1及び図2を参照すると、I/Oデバイス(AGPディスプレイアダプタを除く)は、一般に、専用バス又は共有バスを介してICH(I/Oハブ)に接続される。PCIバスは、さまざまな音声、ビデオ及びネットワーキングデバイスをICHに接続する方法であり得る。これらのデバイスは、通常、自身の水晶発振器と、互いに且つCPUクロックと同期しないクロックとを有する。これは、たとえば、音声サンプル及びビデオサンプルが別々のI/Oカードを使用してキャプチャされる場合、時間が経過するに従いそれらが同期しなくなる可能性があることを意味する。
不都合なことに、データのブロックがI/Oデバイス、メインメモリ及びCPU間で移動するのにかかる時間は可変であり、CPU負荷、キャッシュ状態、バスを共有する他のI/Oデバイスの使用率及びオペレーティングシステム挙動のような多くの要因によって決まる。したがって、データを処理するアプリケーションは、データがI/Oデバイスに入るか又はI/Oデバイスから出る時を正確に知ることができない。伝播遅延は、上述した条件に応じてナノ秒からミリ秒までに及ぶ可能性がある。
既存のアプリケーションでは、複数のビデオストリーム及び音声ストリームは、通常、マルチチャネルアナログ・デジタル(A/D)又は音声/ビデオ(A/V)キャプチャカード等の単一I/Oデバイスを使用してキャプチャされる。単一PCプラットフォームにおいてさえも複数のI/Oデバイスを同時に使用するためには特別な方法が必要である。
別々のプラットフォームにおけるI/Oデバイスの同期化が望まれる場合、状況はより複雑になる。その場合、I/O・CPUレイテンシに加えて、ネットワーク接続によりさらなる遅延がもたらされ、この遅延は、既存の有線及び無線イーサネット(登録商標)で使用されるメディアアクセスプロトコルがベストエフォート(したがって可変伝送遅延)タイプであるために可変である。
図3は、本発明の一実施形態を実施するために利用してもよい例示的な同期分散マルチメディアデータキャプチャシステム300を示す。図3に示すように、データキャプチャシステム300は、複数のマルチメディアプラットフォーム(302及び304)を含んでもよい。しかしながら、図3は、限定的な意味で解釈されるべきではなく、本発明の一実施形態を例示するために提供される。
マルチメディアプラットフォーム302及びマルチメディアプラットフォーム304を、図1に示すようなコンピュータシステム100を利用して提供してもよい。図示するように、マルチメディアプラットフォーム302は、マイクロフォン310と共にビデオキャプチャ装置308を含んでもよい複数のI/Oカード306を含む。各音声/ビデオカードは、同期信号発生器316によって生成されるマルチメディア同期信号314を受け取るために使用される有線リンク入力312を含んでもよい。
本発明の一実施形態では、同期信号発生器316は、図1に示すようなコンピュータシステム100等のコンピュータシステムを利用して構成される。同期信号発生器316は、同期信号314を生成してもよい。本発明の一実施形態では、同期信号314を、音声同期信号を形成するように、一般に白色雑音から構成されるM系列(maximum length sequence)(MLS)信号として選択する。系列数をMLS信号上に変調してもよい。しかしながら、代替実施形態では、望ましい場合は特定の実施態様に基づいて異なるマルチメディア同期信号を選択してもよい。
同期信号314を、たとえば有線リンクを介してマルチメディアプラットフォーム302に提供してもよく、且つ/又は送信器318及び受信器320を介して無線によりマルチメディアプラットフォーム304に送信してもよい。無線送信器318及び受信器320の一例は、無線周波数(RF)ベースの送信器及び受信器である。本発明の一実施形態では、単一のマルチメディア同期信号が生成され、それが、有線リンク又は無線リンクを介してマルチメディアプラットフォームの各々に送信される。したがって、マルチメディアプラットフォーム304は、ビデオキャプチャ装置326及び音声キャプチャ装置324とのI/Oカード322を含む。
さらに、マルチメディアプラットフォーム304は、マルチメディアプラットフォーム302とは対照的に、受信マルチメディア同期信号をキャプチャするために使用してもよい無線受信器(Rx)320を含んでもよい。本発明の一実施形態では、送信器318は、マルチメディア信号(たとえば音声信号)上に同期信号314を変調し、その後そのマルチメディア信号は何らかの無線搬送波信号上に変調され、受信器320は、プラットフォーム304が使用するマルチメディア変調同期信号を生成するために受信信号を復調する。その後、マルチメディア変調同期信号(すなわち、マルチメディア信号上に変調された同期信号)は、キャプチャされた音声/映像シーンデータ328の同期化を可能にするためにビデオキャプチャ装置(複数可)及び/又は音声キャプチャ装置(複数可)に提供される。本発明の一実施形態では、たとえばU.S. Robotics社のSound Link Solutionを介した無線音声伝送を使用することにより、同期信号の無線伝送を提供してもよい。
本発明の一実施形態によれば、音声同期信号をマルチメディア同期信号として生成する。本発明の一実施形態では、同期信号発生器316は、特殊な同期信号を生成し、自身のクロック情報を使用してそれらを変調する。同期信号は、専用同期音声チャネルに対する有線メカニズム(302の場合)又は無線メカニズム(304の場合)を使用して音声入力デバイスに配信される。その結果、同期情報は、音声/ビデオストリームに別個の音声トラックとして埋め込まれることになり、アプリケーション層が処理するために使用することができる。
本発明の一実施形態によれば、生成されたマルチメディアストリームデータ内に誤りが確定されると、各マルチメディアプラットフォーム(たとえば302又は304)は、たとえば、各マルチメディアプラットフォームの各I/Oカードによって生成されたマルチメディアストリームデータを同期させるために、生成されたマルチメディアストリームデータを再サンプリングすることに関与する。したがって、生成されたマルチメディアストリームデータがすべて同期すると、キャプチャされたストリームデータを、アレイ信号処理コンピュータ(図示せず)に提供することができる。そして、アレイ信号処理コンピュータは、同期したマルチメディアストリームデータを利用して、たとえば、ビーム形成、ブラインド信号分離(BSS)、マルチモーダル認識等を実行してもよい。同様に、本発明の実施形態を、複数の入力チャネルを含んでもよい、たとえばカムコーダ、ビデオキャプチャ装置等を使用して、マルチメディアデータキャプチャシステム300内で実行してもよい。
図4Aは、本発明の一実施形態による例示的な適応フィルタリングシステム400を示す。本発明の一実施形態では、システム400は、帯域制限信号補間を利用して、連続的に現遅延推定値及びスキュー推定値を推定し且つ複数のデバイスから収集された音声/映像信号を同期させるように適応させることによって動作する。本発明の一実施形態では、図4Aのシステム400を、コンピュータシステム(図1のコンピュータシステム100)、デジタル信号プロセッサ(DSP)、コーダ・デコーダ(コーデック)モジュール、CPU等に組み込んでもよい。
システム400は、送信側(クロックマスタ)からのソース同期信号x(n)とソースクロックTとを受け取るデジタル・アナログ(D/A)変換器402を含む。デジタル・アナログ変換器402を送信側に設けてもよい。ソース同期信号は、音声信号又はビデオ信号等のマルチメディア信号であってもよい。そして、D/A変換器402は、その出力をチャネルフィルタ404に提供する。チャネルフィルタ404は、送信側と受信側とを結合する信号伝送環境又は媒体(たとえば銅線、RF媒体、周波数変調(FM)媒体、他の無線媒体等)の特徴を例示するということが考えられる。
システム400は、チャネルフィルタ404を通して伝送された信号をデジタル形式に変換するアナログ・デジタル(A/D)変換器406(たとえば受信側)をさらに含む。A/D変換器406はさらに、チャネルフィルタ404を通して伝送された信号をサンプリングするために受信側クロックT’を受け取る。本発明の一実施形態では、ソースクロックは、D/A変換器402の実際のサンプルレートに使用してもよく、同期信号x(n)は、マスタD/A変換器402とクライアントA/D変換器(複数可)406との間のサンプルレートの差を確定するために使用される信号である。本発明の一実施形態では、ソースクロックT及び受信側クロックT’を、DSP、コーデックモジュール、CPU等のデバイスによって提供する。
図4Aに示すように、A/D変換器406は、帯域制限補間モジュール408に結合され、帯域制限補間モジュール408は、ソース同期信号x(n)とA/D変換器406の再サンプリングされた出力との間の何らかのコスト関数を最大化することによって駆動され、システム400の出力信号(y^(t))を生成し且つスキュー(デルタ_f)値及びオフセット(デルタ_t)値を確定する。本発明の一実施形態では、406と同じクロックで駆動される何からのA/D変換器によってキャプチャされたすべてのマルチメディア信号は、それに従って再サンプリングされる。
同期信号の正確な形式は、領域知識であってもよく、そのため送信側とともにすべての受信側において既知である。サンプリングレートがF’=1/T’である受信側の実際に記録された信号y(nT’)と、サンプリングレートがF=1/Tで動作しているソース信号x(nT)との間の時間遅延及びサンプリングスキューの推定は、図4Aに示す適応フィルタリング手法に基づく。送信側において、同期信号x(nT)が、サンプリングレートFのD/A変換器402を通して送出される。この信号は、D/A変換器、送信チャネル(たとえば無線チャネル)及び最後に受信側におけるサンプルレートF’のA/D変換器によって形成されるフィルタを通過するものと想定される。
そして、離散時間信号の帯域制限補間に基づく適応フィルタ(408)を使用して、オフセットΔt及びスキューΔF=T’/T’’を推定する。推定されたオフセットΔt及びサンプリング周期T’’である帯域制限補間信号y^(t)は、以下によって与えられる。
Figure 2007502579
ここで、
Figure 2007502579
である。
本発明の一実施形態では、簡潔にするために、この公式化において実施態様で使用される窓関数(たとえばカイザー(Kaiser)窓)を省略する。サイズwの時間窓にわたる性能基準としての内積が与えられると、最適化基準は
Figure 2007502579
となる。ここで、tはt=nT’’+Δtで評価される。本発明の一実施形態によれば最適化のために勾配降下法を適用してもよい。
図4Aの適応時間遅延及びサンプリングスキュー推定器は、わずかな時間遅延及びわずかなサンプリングスキューを追跡することができるが、本発明の一実施形態では、それを、時間遅延Δt及びサンプリングスキューファクタΔF=T’/T’’に対する概算によって初期化してもよい。
本発明の一実施形態では、MLS時間オフセット推定の精度を向上させるために、MLSシンボル毎に2つ以上の音声サンプルを利用してもよい。したがって、MLS自己相関関数のメインローブ毎に3つ以上のサンプルがあることになり、自己相関ピークの位置を見つける精度が向上する。この位置を、自己相関メインローブに対応する曲線(又はその近似値)を、最高値を有するサンプルに当てはめることによって見つけてもよい。
本発明の一実施形態では、「スキューの自律的推定(Autonomous Estimation of Skew)」(自己監視/自己検知)に基づいて適応フィルタ手法のスキュー推定値を初期化する新規な方法について開示する。MLSベースのスキュー推定の代りとして(又はそれに加えて)、測定期間毎に観測されるサンプルの数を計数するダミー音声キャプチャプロセスを実行することにより個々の音声クロックを較正するために、ネットワーキングサービスを利用してもよい。本発明の一実施形態では、現行のプラットフォームが妥当な長期サンプリングクロック安定性を有し、ネットワークタイムプロトコル(NTP)が、1日当りのクロック誤差(CEPD)が数百ミリ秒であるシステムクロックを提供しているものと推定する。ここで、
T:観測期間(秒)
ΔT:観測間隔における不確実性(秒)
target:目標サンプリングレート(ヘルツ)
actual:実際のサンプリングレート(ヘルツ)
target:サンプルレートftargetで観測期間Tに生成されたサンプルの数
actual:サンプルレートfactualで観測期間Tに生成されたサンプルの数
measured:サンプルレートfactualで観測期間T±ΔTに生成されたサンプルの数とする。
各分散プラットフォームにおけるシステムクロックが正確であるとすと、プラットフォームの目標サンプリングレートと実際のサンプリングレートとの間のスキューを、以下のように確定することができる。
Figure 2007502579
しかしながら、現実の世界では、システムクロックは十分に完全又は正確ではない場合がある。観測期間Tに対して不確実性がΔTであるとすると、測定されるスキューを以下のように確定することができる。
Figure 2007502579
言い換えれば、推定されたスキューファクタの誤差は、1±ΔT/Tである。NTPのクロックの正確度が約250msであり観測期間が1日であるとすると、推定誤差は3・10−6未満である。このように、約44.1kHzのサンプルレートを、0.13サンプル/秒まで正確に確定することができる。
図4Bは、本発明の一実施形態による例示的な適応フィルタリングシステム450を示す。本発明の一実施形態では、システム450は、チャネルフィルタ404と、A/D変換器406と、帯域制限補間モジュール408と、スカラー積410とを含む。図4Bに示すように、アナログ領域においてアナログ同期信号x(t)(x(n)はデジタル同期信号を示し、x(t)は連続アナログ信号を示す)を生成してもよい。また、本発明の一実施形態ではx(t)のデジタル参照形式x(n)は既知であり得るということが考えられる。
図5は、本発明の一実施形態による例示的な適応フィルタリングシステム500を示す。本発明の一実施形態では、システム500は図4Aのシステム400を含む。システム500はまた、追加のチャネルに対し同期マルチメディア信号を提供する部分502を含む。たとえば、本発明の一実施形態では、追加の音声/映像シーン信号を、図3を参照して論考したような音声/映像シーン328から(たとえば図3のマルチメディアプラットフォーム302及び304により)収集してもよい。
図5に示すように、キャプチャされた信号を次に1つ又は複数のA/D変換器556(たとえば各チャネルに対して1つ)に提供してもよく、A/D変換器556はまた、受信側クロック(T’)を受信してもよい。A/D変換器556をそれぞれの帯域制限補間モジュール(558)に結合してもよい。帯域制限補間モジュール558は、たとえば帯域制限補間モジュール408から推定されたデルタ_t値及びデルタ_f値を受け取ることにより、これらの値を再計算する必要をなくしてもよい。したがって、本発明の一実施形態では、単一クロックが複数のチャネルを駆動することができる。
本発明の一実施形態では、(図5を参照して論考したような)同期化を実行するためにデバイス毎に1つの追加のチャネルを割り当ててもよいが、信号の大きさが知覚される歪みをもたらさないほど十分に小さく維持される場合、受信側におけるアナログ同期信号を、受信側においてA/D変換の前にアナログデータチャネルに混合することができる、ということが考えられる。かかる本発明の一実施形態を図6に示す。
図6は、本発明の一実施形態による例示的な適応フィルタリングシステム600を示す。本発明の一実施形態では、システム600は図4Aのシステム400を含む。システム600はまた、追加のチャネルに対し同期マルチメディア信号を提供する部分602も含む。たとえば、アナログ同期信号を、(たとえばA/D変換器406において)音声/映像シーン328からの追加のキャプチャされた音声/映像シーン信号に混合してもよい。そして、帯域制限補間モジュール408の出力が、追加のマルチメディアチャネルに対する同期化を行ってもよい。
本発明の一実施形態によれば、MLSベースの同期化は、MLS信号の大きさが、長さ1023の系列の場合に音声信号の大きさより最大2桁下回る場合であっても(より長いMLS系列の場合、この大きさはさらに小さくなる可能性がある)、自己相関ピークが確実に検出されることを示す、ということが考えられる。
当業者には、上述した説明を読めば本発明の多くの改変及び変更が恐らく明らかとなるであろうが、例示の目的で示し説明したいかなる特定の実施形態も限定するものとみなされることは全く意図されていないということが理解されるべきである。たとえば、本発明の実施形態を帯域制限補間モジュールに関して論考したが、他の補間技法を利用してもよいということが考えられる。したがって、さまざまな実施形態の詳細を言及することは、本発明に対して本質的であるとみなされる特徴のみを列挙する特許請求の範囲を限定するようには意図されていない。
本発明の一実施形態を実施してもよいコンピュータシステム100の例示的なブロック図である。 図1に示すようなコンピュータシステム100のI/Oデバイス200をさらに示す図である。 本発明の一実施形態を実施するために利用してもよい例示的な同期分散マルチメディアデータキャプチャシステム300を示す図である。 本発明の一実施形態による例示的な適応フィルタリングシステム400を示す図である。 本発明の別の実施形態による例示的な適応フィルタリングシステム450を示す図である。 本発明の一実施形態による例示的な適応フィルタリングシステム500を示す図である。 本発明の一実施形態による例示的な適応フィルタリングシステム600を示す図である。

Claims (30)

  1. 事前定義された同期信号と受信側クロックとを受け取るアナログ・デジタル変換器と、
    該アナログ・デジタル変換器に結合され、該アナログ・デジタル変換器の出力を受け取り、連続的に現遅延推定値及びスキュー推定値を推定し信号を同期させるように適応させる補間モジュールと、
    を具備する装置。
  2. 前記アナログ・デジタル変換器に結合され、前記同期信号とソースクロックとを受け取り、前記アナログ・デジタル変換器に出力を提供するデジタル・アナログ変換器をさらに含む、請求項1に記載の装置。
  3. 複数のデバイスによってキャプチャされる複数のマルチメディア信号を同期させるために利用される、請求項1に記載の装置。
  4. 前記同期信号は別の信号に埋め込まれる、請求項1に記載の装置。
  5. 前記信号は、音声信号及びビデオ信号を含む1つ又は複数の項目から選択されるデータを含む、請求項1に記載の装置。
  6. デジタル信号プロセッサ(DSP)、コーダ・デコーダ(コーデック)モジュール及びCPUを含むグループから選択されるデバイスに組み込まれる、請求項1に記載の装置。
  7. 前記ソースクロックは、DSP、コーデックモジュール及びCPUを含むグループから選択されるデバイスによって提供される、請求項2に記載の装置。
  8. 前記アナログ・デジタル変換器に結合されたチャネルフィルタであって、送信側と受信側とを結合する信号伝送環境を特徴付けるチャネルフィルタをさらに含む、請求項1に記載の装置。
  9. 前記伝送環境は、有線媒体及び無線媒体を含むグループから選択される、請求項8に記載の装置。
  10. 時間遅延及びサンプリングスキューファクタに対する概算によって初期化される、請求項1に記載の装置。
  11. 前記初期化は、スキューの自律的推定に基づく、請求項10に記載の装置。
  12. 前記信号を同期させるためにMLSを利用する、請求項1に記載の装置。
  13. 自己相関ピークの位置を見つける精度を向上させるように、MLSシンボル毎に少なくとも2つ以上の音声サンプルが利用される、請求項12に記載の装置。
  14. 前記位置を見つけるべく、自己相関メインローブに対応する曲線が、最高値を有する前記音声サンプルに当てはめられる、請求項12に記載の装置。
  15. 前記受信側クロックを較正するためにネットワーキングサービスが利用される、請求項1に記載の装置。
  16. 前記較正は、測定期間毎に観測されるサンプルの数を計数する音声キャプチャプロセスを実行することによって実行される、請求項15に記載の装置。
  17. 前記ネットワーキングサービスはネットワークタイムプロトコル(NTP)である、請求項15に記載の装置。
  18. 前記NTPは、1日当りのクロック誤差(CEPD)が約数百ミリ秒である、請求項17に記載の装置。
  19. 前記補間モジュールは帯域制限型である、請求項1に記載の装置。
  20. 事前定義された同期信号を提供すること、
    前記同期信号と受信側クロックとを受け取るアナログ・デジタル変換器を提供すること、及び
    前記アナログ・デジタル変換器に結合され、該アナログ・デジタル変換器の出力を受け取り、連続的に現遅延推定値及びスキュー推定値を推定し信号を同期させるように適応させる補間モジュールを提供すること
    を含む方法。
  21. 前記アナログ・デジタル変換器に結合され、前記同期信号とソースクロックとを受け取り、前記アナログ・デジタル変換器に出力を提供するデジタル・アナログ変換器を提供することをさらに含む、請求項20に記載の方法。
  22. 複数のソースから収集される複数のマルチメディア信号を同期させることをさらに含む、請求項20に記載の方法。
  23. 前記信号は、音声信号及びビデオ信号を含む1つ又は複数の項目から選択されるデータを含む、請求項20に記載の方法。
  24. 前記アナログ・デジタル変換器に結合されたチャネルフィルタであって、送信側と受信側とを結合する信号伝送環境を特徴付けるチャネルフィルタを提供することをさらに含む、請求項20に記載の方法。
  25. 前記伝送環境は、有線媒体及び無線媒体を含むグループから選択される、請求項20に記載の方法。
  26. 前記補間モジュールは帯域制限型である、請求項20に記載の方法。
  27. 命令を提供する機械可読媒体を具備する製品であって、該命令は、機械によって実行される場合、該機械に対し、
    事前定義された同期信号を提供すること、
    前記同期信号と受信側クロックとを受け取るアナログ・デジタル変換器を提供すること、及び
    前記アナログ・デジタル変換器に結合され、該アナログ・デジタル変換器の出力を受け取り、連続的に現遅延推定値及びスキュー推定値を推定し信号を同期させるように適応させる補間モジュールを提供すること
    を含む動作を実行させる、製品。
  28. 前記動作は、複数のソースから収集される複数のマルチメディア信号を同期させることをさらに含む、請求項27に記載の製品。
  29. 中央処理装置(CPU)と、
    該CPUに結合され画像を表示する表示デバイスと、
    該表示デバイスに結合され前記画像を格納するメモリと、
    事前定義された同期信号と受信側クロックとを受け取るアナログ・デジタル変換器と、
    該アナログ・デジタル変換器に結合され、該アナログ・デジタル変換器の出力を受け取り、連続的に現遅延推定値及びスキュー推定値を推定し信号を同期させるように適応させる補間モジュールと、
    を具備するコンピュータシステム。
  30. 前記表示デバイスは、LCD、フラットパネルディスプレイ、プラズマスクリーン及びTFTディスプレイを含むグループから選択される、請求項29に記載のコンピュータシステム。
JP2006523247A 2003-08-13 2004-08-06 異種コンピューティングプラットフォームにおける分散音声・ビデオキャプチャのための汎用適応同期方式 Expired - Fee Related JP4287880B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/640,108 US7702941B2 (en) 2003-08-13 2003-08-13 Universal adaptive synchronization scheme for distributed audio-video capture on heterogeneous computing platforms
PCT/US2004/025475 WO2005020487A1 (en) 2003-08-13 2004-08-06 Universal adaptive synchronization scheme for distributed audio-video capture on heterogeneous computing platforms

Publications (2)

Publication Number Publication Date
JP2007502579A true JP2007502579A (ja) 2007-02-08
JP4287880B2 JP4287880B2 (ja) 2009-07-01

Family

ID=34136022

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006523247A Expired - Fee Related JP4287880B2 (ja) 2003-08-13 2004-08-06 異種コンピューティングプラットフォームにおける分散音声・ビデオキャプチャのための汎用適応同期方式

Country Status (7)

Country Link
US (1) US7702941B2 (ja)
EP (1) EP1661277A1 (ja)
JP (1) JP4287880B2 (ja)
KR (1) KR100828216B1 (ja)
CN (1) CN1868155B (ja)
TW (1) TWI264889B (ja)
WO (1) WO2005020487A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007148621A (ja) * 2005-11-25 2007-06-14 Hitachi Ltd 計算機システム

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100415838B1 (ko) * 2003-09-19 2004-01-31 (주)유디피 캡쳐 불능 기간을 정확히 결정하여 캡쳐 효율을 향상시킨다채널 영상 신호 캡쳐 시스템 및 캡쳐 방법
TWI238638B (en) * 2004-04-22 2005-08-21 Benq Corp Method and device for multimedia processing
US7197436B2 (en) * 2004-06-28 2007-03-27 Microsoft Corporation System and method for measuring audio processing attributes in a computer system
US8108557B2 (en) * 2009-01-22 2012-01-31 Hewlett-Packard Development Company, L.P. System and method for measuring clock skew on a network
US10856018B2 (en) * 2015-09-30 2020-12-01 Apple Inc. Clock synchronization techniques including modification of sample rate conversion
JP6499602B2 (ja) * 2016-03-03 2019-04-10 アズビル株式会社 Ad変換結果読出回路
US10623292B2 (en) * 2016-03-10 2020-04-14 Mitsubishi Electric Corporation Receiver and event-detection-time-point estimation method
CN107782977A (zh) * 2017-08-31 2018-03-09 苏州知声声学科技有限公司 多个usb数据采集卡输入信号延时测量装置及测量方法
CN109428663B (zh) * 2017-08-31 2020-08-07 英飞凌科技股份有限公司 用于同步的系统和控制设备
CN107748729A (zh) * 2017-10-16 2018-03-02 深圳市合信自动化技术有限公司 一种绝对值编码器及对其输出信号进行处理的方法、装置
CN114097010B (zh) * 2019-07-18 2023-12-12 三菱电机株式会社 信息处理装置、计算机能读取的记录介质和信息处理方法
US11997330B2 (en) 2020-12-17 2024-05-28 That Corporation Audio sampling clock synchronization
CN112908289B (zh) * 2021-03-10 2023-11-07 百果园技术(新加坡)有限公司 节拍确定方法、装置、设备和存储介质
CN113009898B (zh) * 2021-03-22 2022-11-25 山东竹马文化科技有限公司 一种木偶剧场、表演控制方法及终端

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3149717B2 (ja) 1995-01-30 2001-03-26 松下電工株式会社 堀りごたつ
US6904110B2 (en) 1997-07-31 2005-06-07 Francois Trans Channel equalization system and method
DE19860720A1 (de) * 1998-12-23 2000-06-29 Siemens Ag Verfahren zum Synchronisieren von mehreren digitalen Eingangssignalen
EP1214807B1 (en) 1999-09-03 2007-06-06 Broadcom Corporation System and method for the synchronization and distribution of telephony timing information in a cable modem network
US20010055354A1 (en) * 2000-03-03 2001-12-27 Danny Fung Method & apparatus for data rate synchronization
US6888819B1 (en) 2000-10-04 2005-05-03 Yitran Communications Ltd. Media access control utilizing synchronization signaling
JP3419397B2 (ja) * 2001-01-18 2003-06-23 日本電気株式会社 クロック同期回路及びクロック同期方法
US6944188B2 (en) 2001-02-21 2005-09-13 Wi-Lan, Inc. Synchronizing clocks across a communication link
US7408683B2 (en) * 2002-07-15 2008-08-05 Brother Kogyo Kabushiki Kaisha Image sensor for reading image and image reading apparatus including the image sensor

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007148621A (ja) * 2005-11-25 2007-06-14 Hitachi Ltd 計算機システム
JP4660362B2 (ja) * 2005-11-25 2011-03-30 株式会社日立製作所 計算機システム

Also Published As

Publication number Publication date
TW200525935A (en) 2005-08-01
CN1868155B (zh) 2013-01-23
US7702941B2 (en) 2010-04-20
US20050039215A1 (en) 2005-02-17
KR100828216B1 (ko) 2008-05-07
TWI264889B (en) 2006-10-21
WO2005020487A1 (en) 2005-03-03
EP1661277A1 (en) 2006-05-31
JP4287880B2 (ja) 2009-07-01
CN1868155A (zh) 2006-11-22
KR20060052983A (ko) 2006-05-19

Similar Documents

Publication Publication Date Title
JP4287880B2 (ja) 異種コンピューティングプラットフォームにおける分散音声・ビデオキャプチャのための汎用適応同期方式
US7356618B2 (en) Method and system for synchronizing platform clocks in a distributed wireless platform
US7266713B2 (en) Apparatus and method for adaptation of time synchronization of a plurality of multimedia streams
KR102464293B1 (ko) 동시성 데이터 스트림들을 제어하기 위한 시스템들 및 방법들
CN101843082B (zh) 用于时钟漂移补偿的方法和系统
TWI547123B (zh) 使多個媒體流同步之方法、緩衝媒體流之方法、系統及路由器
US20040098633A1 (en) Apparatus and method for time synchronization of a plurality of multimedia streams
TWI640165B (zh) 感測器時鐘估計方法及其裝置
CN110636600B (zh) 一种无线设备音频同步播放的方法
EP3681171B1 (en) Information processing apparatus, time synchronization method, and time synchronization program
EP2163096B1 (en) Timestamp conversion
CN107239253B (zh) 同步播放速度的无线局域网播放器、系统及其方法
US7197658B2 (en) Synchronizing samples of a multimedia stream with a system clock
US10915490B2 (en) Audio streams over peripheral component interconnect (PCI) express (PCIE) links
JP2021190868A (ja) 映像同期装置、映像同期装置の制御方法及びプログラム
Lienhart et al. Universal synchronization scheme for distributed audio-video capture on heterogeneous computing platforms
US20170003386A1 (en) Measurement of distance between devices using audio signals
JP2004158925A (ja) ディジタルデータ処理装置およびディジタルデータ処理方法
US7440476B1 (en) Method and apparatus for video capture
JP2001144694A (ja) サンプリングレートコンバータ
Lienhart et al. Self-aware distributed AV sensor and actuator networks for improved media adaptation
Budnikov et al. Distributed array of synchronized sensors and actuators
CN113890959A (zh) 一种多模态图像同步采集系统及方法
JPH07202721A (ja) エラー検出装置及びエラー検出システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080619

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081028

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090303

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090327

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120403

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120403

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130403

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130403

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140403

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees