JP2009533920A - オーディオ/ビデオ同期遅延測定方法及び装置 - Google Patents

オーディオ/ビデオ同期遅延測定方法及び装置 Download PDF

Info

Publication number
JP2009533920A
JP2009533920A JP2009504802A JP2009504802A JP2009533920A JP 2009533920 A JP2009533920 A JP 2009533920A JP 2009504802 A JP2009504802 A JP 2009504802A JP 2009504802 A JP2009504802 A JP 2009504802A JP 2009533920 A JP2009533920 A JP 2009533920A
Authority
JP
Japan
Prior art keywords
audio
video
encoded
time
time stamp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009504802A
Other languages
English (en)
Other versions
JP5025722B2 (ja
Inventor
ボワーズ・マシュー・アラン
グリフィス・スコット
Original Assignee
テクトロニクス・インターナショナル・セールス・ゲーエムベーハー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テクトロニクス・インターナショナル・セールス・ゲーエムベーハー filed Critical テクトロニクス・インターナショナル・セールス・ゲーエムベーハー
Publication of JP2009533920A publication Critical patent/JP2009533920A/ja
Application granted granted Critical
Publication of JP5025722B2 publication Critical patent/JP5025722B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4341Demultiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2368Multiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8547Content authoring involving timestamps for synchronizing content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/004Diagnosis, testing or measuring for television systems or their details for digital television systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Television Receiver Circuits (AREA)
  • Television Signal Processing For Recording (AREA)
  • Synchronisation In Digital Transmission Systems (AREA)

Abstract

オーディオ及びビジュアル信号の間の遅延を求める方法であり、この方法は、視覚的に符号化された複数の一連のタイムスタンプを有するビデオ信号を供給し、対応し聴覚的に符号化された複数のタイムスタンプを有するオーディオ信号を供給し、オーディオ及びビデオの信号が互いに同期しており、オーディオ及びビデオの信号を符号化して、符号化されたオーディオ及びビデオのデータ・ストレージをデジタル的に発生し、符合されたビデオ及びオーディオのデータ・ストレージを分析して、聴覚的及び視覚的に符号化されたタイムスタンプを抽出し、対応するビデオ及びオーディオのタイムスタンプの受信時点の間の任意の遅延を測定する。

Description

発明の詳細な説明
オーディオ・ビジュアル・コンテンツの分野において、そのコンテンツをデジタル・データとして提供することは一般的である。一般的な条件は、例えばテレビジョン・プログラムの放送であるデジタル・オーディオ・ビジュアル・データの放送伝送の前に、デジタル・データを1つ以上の符号化処理に渡すことである。コード化処理は、データ圧縮と、オーディオ信号を処理のためにデジタル・オーディオ・フィルタの利用とを常習的に必要とする。符号化処理も、複数の別個のデータ・ストリームを互いにマルチプレクスすることを典型的に必要とする。これは、一般的に、オーディオ・データをビデオ・データと異なって処理する場合であり、符号化処理における異なる段階の各々がデジタル・データ信号に時間遅延を潜在的に導入するため、全体的な符号化処理は、オーディオ及びビデオのデータの間の同期を損なうことを潜在的に導入し、これが話文字のビデオ画面でのリップ・シンクの損失として最も顕著となる。人間の脳は、ビデオ及びオーディオのデータの間の非常にわずかな時間遅延であっても知覚することができ、オーディオ信号がビデオ信号よりも進んでいる状況が最も目立つ。この理由のため、適用可能な符号化及び伝送標準は、オーディオ及びビデオのデータの間の最大時間遅延を規定している。例えば、いくつかの標準によれば、オーディオ信号は、対応するビデオ信号よりも、40msより長い時間遅延に及んで進んではいけない。
したがって、任意所定の符号化システムがオーディオ・ビジュアル・プログラムのオーディオ及びビデオの信号の間に生じるかもしれない時間遅延の正確な量を予め測定できることが有利である。
本発明の第1の概念によれば、本発明は、オーディオ及びビジュアルの信号の間の遅延を測定する方法であって、
視覚的に符号化された複数の一連のタイムスタンプを有するビデオ信号を供給すると共に、聴覚的に符号化された対応する複数のタイムスタンプを有するオーディオ信号を供給し、上記オーディオ及びビデオ信号が互いに同期しており、
上記オーディオ及びビデオ信号を符号化して、デジタル的に符号化されたオーディオ及びビデオ・データ・ストリームを発生し、
上記符号化されたビデオ及びオーディオ・データ・ストリームを分析して、上記聴覚的及び視覚的に符号化されたタイムスタンプの各々を抽出し、
対応するビデオ及びオーディオのタイムスタンプの受信時点の間の遅延を測定することを具えている。
好適実施例において、オーディオ及びビデオのタイムスタンプは、2進コード、例えば、グレー・コードとして符号化される。
各視覚的に符号化されたタイムスタンプは、好ましくは、複数の表示セグメントを具えており、各セグメントの色又は影は、2進状態を表す。好ましくは、表示セグメントは、マクロ・ブロックの部分を具えている。
聴覚的に符号化された各タイムスタンプは、好ましくは、複数の所定周波数成分を有するオーディオ・トーンを具え、周波数成分の存在が2進状態を表す。
好ましくは、各符号化されたタイムスタンプは、フレーム・カウントを具える。
本発明の第2の概念によれば、本発明は、デジタル的に符号化されたオーディオ及びビデオの信号の間の遅延を測定する装置であって、上記ビデオ信号は、視覚的に符号化された複数の連続的なタイムスタンプを有し、上記オーディオ信号は、聴覚的に符号化された対応する複数のタイムスタンプを有し、上記オーディオ及びビデオの信号が互いに同期され、
上記符号化されたビデオ信号に符号化されたタイムスタンプの各々を検出し、上記タイムスタンプを復号化し、上記ビデオ・タイムスタンプの受信の実際の時間を表す第1時間信号を提供するように配置されたビデオ・タイムスタンプ検出器と、
上記符号化されたオーディオ信号に符号化された上記タイムスタンプの各々を検出し、上記タイムスタンプを復号化し、上記オーディオ・タイムスタンプの実際の時間を表す第2時間信号を提供するように配置されたオーディオ・タイムスタンプ検出器と、
上記第1及び第2の時間信号を受け、これらの受信時点の間の遅延を測定するように配置されたタイムスタンプ比較器とを具える。
例としてのみ示す添付図を参照して、本発明の実施例を以下に説明する。
本出願人による出願中の同じ名称の特許出願において詳述された時間分析スキームによれば、本来利用可能なオーディオ及びビデオのデータに対して実施された符号化処理に続くオーディオ及びビデオのデータの間の任意の時間遅延は、既存の時間特性を有する所定ビデオ・シーケンスを用いて測定する。非圧縮データ・フォーマット、又は、例えばMPEG−2ビデオ又はオーディオの如き標準符号化データ・フォーマットのいずれかにより、ビデオ/オーディオ・データ・シーケンスを提供する。所定のオーディオ/ビデオ・シーケンスは、所定の継続時間と、各フラッシュ間の時間間隔を有する一連の可視「フラッシュ」から成る。また、このシーケンスは、対応する数の可聴トーンも具え、その継続時間とトーン間の時間間隔とは、可視フラッシュの発生に正確に対応する。可視及び可聴の信号用の適切なタイミング図の例を図1に図的に示す。
図1において、上側の信号トレース2は、可視信号の二進レベルを示し、この信号は、可視の状態にて全体として黒又は全体として白のいずれかである。下側の信号トレース4は、可聴信号を表し、上側の信号レベルが可聴トーンの発生を示し、下側の信号レベルがトーンの不在を示す。図1から判る如く、可視フラッシュが発生せず、可聴トーンも発生しない期間である1単位の初期時間周期、例えば、1秒の後、1単位の継続時間の可視フラッシュ及び可聴トーンが続いて発生される。この後に、可視フラッシュも可聴トーンも生じない期間である更なる時間周期が続き、この第2時間周期が2単位の継続時間を有する。この後に、図1に示すシーケンスにおいて、2単位の継続時間の可視フラッシュ及び可聴トーンの発生が続き、3単位の非可視フラッシュ又は可聴トーンなどが続く。総合シーケンスは、可視フラッシュ及び可聴トーンが生じる期間の5周期を有し、各周期が前の周期よりも長い1時間単位だけ続き、可視フラッシュ又は可聴トーンが生じない期間の間に、対応して時間周期が増加する。よって、図示の例において、全体のシーケンスは、総合で30時間単位にわたって続くが、これは典型的には30秒である。全体のシーケンスは、好ましくは連続的に繰り返す。
この分析スキームの好適配置において、可視フラッシュは、少なくともマクロ・ブロック又は少なくともその整数倍内で生じるが、これは、表示スクリーンの左上隅に示される。好ましくは、4×4ブロック配列、即ち、32×32ピクセルを用いて、可視フラッシュを符号化する。当業者には理解できるように、表示されたイメージを発生する走査方法により、表示スクリーンのこの部分を表すデジタル・データが関連データ・ストリーム内に非常に早く生じ、その結果、実際には常に正確に符号化されるので、この位置が注意深く選択される。32×32ピクセル領域としての可視フラッシュの選択も、このビデオ・データの正確な符号化を確実にする傾向がある。同様に、可視フラッシュ用のクロック及び白の影のみを用いることは、ビデオ・データが正しく符号化される見込みを最大とする。これは、これらが、符号化処理で好ましくなく劣化する「基本」デジタル値であるためである。同様な様式において、オーディオ・トーンは、例えば、10KHz又はいくつかの他の単一周波数である単一周波数成分のみのトーンとして提供される。単一周波数成分のみをオーディオ・トーン用に用いるので、それを、被試験符号化システム内に含まれる任意のオーディオ・エンコーダにより忠実に符号化できる。
さらなるビジュアル・データ、例えば、可視フラッシュの大量のビジュアル表現を、例えば、一連の回転循環セグメントとして、ユーザに提供してもよく、各セグメントが単一の時間単位を表すので、完全なシーケンスには、多数のセグメントを通しての完全な「回転」が要求される。勿論、かかるビジュアル協調は、単に人間の操作者の便宜のためであり、本発明の必要部分ではないことが明らかである。
この分析スキームによれば、所定のオーディオ・ビジュアル・シーケンスは、被試験符号化システムを通過し、符号化されたデジタル・データ・ストリームがその後に分析される。この分析処理は、32×32ピクセル・マクロ・ブロック完全体が「黒」から「白」に、又はその逆に変化する符号化されたデータ・ストリーム内で、時間的なポイントを検出することにより、可視フラッシュの1つの開始及び終了の一方又は両方を検出することである。表示がフレーム毎にリフレッシュされるだけなので、これが生じた時点は、ビジュアル・データの1フレームの継続時間内で正確である。典型的なフレーム・レートは、1秒当たり25フレームである。よって、符号化されたオーディオ信号を分析して、オーディオ・トーンの開始及び終了の一方又は両方を求める。オーディオ・トーンの開始又は終了を検出する好ましい方法は、「トーン」から「トーンなし」又はその逆の各遷移が生じる程度に、との急激な立ち上がり又は立ち下がり振幅を検出することである。よって、分析処理は、ビデオ及びオーディオの「事象」(立ち上がり又は立ち下がりのオーディオ又はビデオ信号エッジである事象)の間の任意の時間遅延を求めることができる。好適実施例において、1つ以上の伝送標準により設定される如き所定組のパラメータの外となる任意所定の遅延により、警告が自動的に発生される。
符号化されたデータ・ストリーム内のビデオ/オーディオ同期が任意に損なわれたことを求める本願出願人による出願中の分析スキームによるシステムが図2に図的に示される。上述の如き符号されていない状態の所定ビデオ・ストリーム10は、ハードディスク12の如きデータ蓄積媒体に蓄積され、被試験符号化システム14に入力として供給される。この符号化システムは、分離されたビデオ16及びオーディオ18のストリームに分解できる符号化データ・ストリームを一般的に出力する。ビデオ及びオーディオのストリームの各々は、分析エンジン20の入力として、また、分離したビデオ及びオーディオの事象検出ユニット22、24の入力として供給される。これらビデオ及びオーディオのストリームが分析エンジンへの個別の入力として図2にビデオ及びオーディオのストリームとして示されるが、符号化システム14により供給された符号化データ・ストリームの分解は、分析エンジン内で、例えば、ラッパー・デマルチプレクサにより均等に達成されることが理解できよう。図1に関連して上述したように可視「フラッシュ」及びオーディオ・トーンの開始又は終了若しくは両方である、符号化されたテスト・データ・ストリームの関連するビデオ又はオーディオの「事象」を検出し、各事象が生じた時を示す出力信号を供給するように、各事象検出ユニットが配置されている。オーディオ及びビデオの事象検出ユニット22、24カラーの出力信号は、時間比較ユニット供給される。この時間比較ユニットは、事象検出ユニットからの出力信号の間に存在する任意の時間間隔と、オーディオ及びビデオの「事象」の発生の間で遅れているか又は進んでいる任意の時間間隔とを測定するように配置される。この時間間隔データは、時間比較ユニット26から出力インタフェース・ユニット28に供給され、この出力インタフェース・ユニットは、時間間隔データを適切なユーザ・インタフェースに供給されるように配置されている。好ましくは、出力インタフェース・ユニット28もオーディオ及びビデオの信号の間の任意の時間遅延を定義済み最大許容遅延と比較するように配置される。この定義済み最大許容遅延は、更なるデータ蓄積領域30に蓄積されてもよいし、又は、内部的に出力インタフェース・ユニットに蓄積されてもよい。検出された時間間隔が所定値を超えると、警告信号を供給するように出力インタフェース・ユニットを配置してもよい。
図1を参照して上述した如く、可視フラッシュ及び可聴トーンのシーケンスは、各「事象」の間の時間間隔が延びた「事象」を具えている。これは、ビデオ及びオーディオの信号の間の時間遅延をビデオ事象の1つに対して充分に長くして、オーディオ事象と確実に一致させ、分析エンジンに報告又は警告を発生させない「誤った」同期は、ビデオ及びオーディオの事象の次のアセンブリにて維持されない。これは、図3にて図的に示され、上側のトレース32は、ビデオ事象信号を表し、下側のトレース34は、オーディオ事象信号を表す。図3から判る如く、符号化処理により、オーディオ事象信号は、矢印Aで示すように、3時間単位、例えば、3秒の時間周期だけ、ビデオ信号に対して遅延される。よって、第2ビデオ事象36の開始は、第1オーディオ事象38の開始と同じ時点で生じる。これらが分析エンジンにより検出された第1ビデオ及びオーディオの事象ならば、オーディオ及びビデオのストリームの間の同期についての誤った報告がなされるかもしれない。しかし、事象が均等に相隔たっておらず一定時間間隔でないので、次のビデオ事象40の開始にて、オーディオ・ストリームが非同期であることがわかる。よって、分析エンジンは、実際に、ビデオ及びオーディオのストリームが同期していないかを判断できる。分析エンジンがビデオ及びオーディオの事象の開始及び終了の両方を検出すると、同期が損なわれることが直ぐに検出される。これは、両方の事象の開始が一致しても、第1オーディオ事象38の終了が第2ビデオ事象36の終了前に生じるためである。この場合、1時間単位、例えば1秒の間に、分析エンジンによりオーディオ及びビデオのストリームの間の同期が損なわれたことが検出される。
しかし、上述のスキームを用いることにより、同期が任意に損なわれたことを単に求めることができ、また、同期の全体が損なわれたことにより、ビデオ及びオーディオの事象の間に「ミス・マッチ」が生じると、オーディオ又はビデオの事象が生じるときが最良で且つ図3に関連して上述したように、遅延が測定され、同期が損なわれたかを判断するのに必要な時間を多数の時間単位にできることが理解できよう。オーディオ・ビジュアル・データの各2次が典型的にはデータの25フレームを具えているので、これは、システム資源の無駄である。すなわち、同じデータが1秒間に25回だけ処理される。本発明の実施例によれば、分析スキームを提供して、オーディオ及びビデオのデータ・ストリームの間の時間遅延を求めることが改良できる。各フレームの識別を可能にするオーディオ及びビジュアルのデータを含む被試験符号化システムにて復号化すべき所定のオーディオ・ビジュアル試験シーケンスを提供することにより、これを達成できる。
好適実施例において、2進コードを表す黒及び白のシーケンスのパターンを用いて、ビジュアル符号化を達成する。グレー・コードの既知の特性は、2進ワードのたった1つのビットが一度に変化するので、好適な2進コードはグレー・コードである。黒及び白の矩形の可能なシーケンスの例を図4に示す。ここでは、オーディオ・ビジュアル・データの3つの連続フレームに対する矩形にシーケンスが示されている。最初の5つの矩形シーケンスは、グレー・コード00101である10進法の7を表す。よって、これを用いて、フレーム番号7としてのフレームを識別する。第2及び第3シーケンスは、夫々10進法の8及び9である00100及び01100を表す。図4では、単に明瞭にするためだけの目的で、5ビット・ワードを示しており、試験シーケンスのフレームの数に応じて任意の長さのワードを選択できることが明らかであろう。上述のスキームと同様に、本発明の実施例において、個別の矩形が32×32ピクセルの32×32ブロックの如くマクロ・ブロックの完全な部分又は別々のブロックとして、個別のシーケンスが符号化されて、矩形のシーケンスの信頼性エラーのない符号化を容易にする。よって、符号化されたフレーム識別コードを、信頼性をもって維持する。
ビデオ信号のどのフレームかを識別するためのタイミング・シーケンスによりオーディオ信号も符号化され、オーディオ・データの特定部分と同期される。本発明の特定実施例において、これは、多くの分離した個別の周波数を作るオーディオ・トーンを含むことにより、成し遂げられる。データ・ワードの1ビットを、グレー・コードの単一ビットを表すビデオ・コードの各シーケンシャルを各周波数がアナログ方法にて表す。これにより、フーリエ分析技術を用いて、符号化されたトーンを分析して、個別の周波数成分及びトーンが表す2進コードが存在するかそうでないかを判断できる。かかる符号化されたトーンの周波数分析の例を図5に図的に示す。水平軸は、検出した周波数成分の周波数をKHzで表す一方、垂直軸は、その成分のパワーを表す。図5に示す例において、2つの周波数成分40は、9KHz及び12KHzで示される。選択されたコードが5ビット・コードで、3KHzを中心とする周波数成分が最上位ビットを表し、15KHzが最下位ビットならば、図5に示す周波数スペクトルは、グレー・コードで2進ワード00101、即ち、10進法の7を表す。符号化されたタイミング・ワードの個別ビットを表すために選択される周波数成分の選択においては、配慮が必要である。これは、オーディオ・エンコーダにとっては、人間の耳に聞こえる及び聞こえない周波数が何かの分析に基づいて信号のある周波数成分を捨てるということが一般的な方法のためである。したがって、タイミング・ワード用に選択された周波数成分は、かかる符号化技術により捨てられないものでなければならない。
本発明の他の実施例において、オーディオ・コードを所定時間間隔における一連の短いオーディオ・トーンとして符号化してもよく、この一連での各トーンがタイミング・ワード内のビットを表し、トーンが存在するか否かがビットの2進状態を表す。また例としては、一連の8つのオーディオ・トーンを用いて、8ビット2進ワードを表す。オーディオ・トーンの周波数は、予め選択されてこれらの検出を容易にする。
図6は、被試験符号化システムにより符号化した後に、本発明の実施例により上述のフォーマットの試験オーディオ・ビジュアル・データ・ストリームを分析する分析エンジンを図的に示している。基本的なコンポーネントは、図2に示すシステム用と同じである。個別のビデオ及びオーディオのデータ・ストリーム616、618は、各時間コード検出ユニット622、624への入力として供給される。各時間コード検出ユニットは、埋め込みビデオ及びオーディオの時間コードを識別し復号化するように配置されている。その結果、好適実施例において、コード化された黒及び白の矩形のシーケンスを探し、特定のシーケンスが表す2進コードを求め、個別のフレーム番号を識別するように、ビデオ時間コード検出ユニット622が配置される。各フレームが受信される時間的ポイントも求まる。同様に、埋め込みオーディオ時間コードの必要な周波数分析を行って、現在の周波数成分及びそれを表す2進コードを求めるように、オーディオ時間コード検出ユニット624を好適には配置する。時間コード検出ユニットからの関連した出力信号を時間比較ユニット626に供給する。この時間比較ユニットは、関連埋め込み時間コードが識別するように、データ・ストリームの対応部分の受信時点に基づいて、オーディオ及びビデオのデータ・ストリーム間の任意の時間遅延を求めるように配置されている。任意の時間遅延を報告及び/又は警告ユニット628への入力として供給する。このユニット628は、例えば、ローカル・データ・ストレージ630にルックアップ・テーブルとして蓄積されてもよいある所定パラメータを時間遅延が超えたかを判断するように配置されている。
符号化されたオーディオ・ビジュアル・データ・ストレージの各フレームは、その各埋め込み時間コードにより個別に識別されるので、本出願人の継続中の出願で説明したスキームによる場合のままで、
分析エンジンは、単一フレームのスペース内で分離したオーディオ及びビデオのデータ・ストリームの相対部分を求めることができると共に、各ビデオ/オーディオ「事象」のみのための遅延情報とは対照的に、各フレームのオーディオ/ビデオ時間遅延情報を提供できる。その結果、本発明の装置及び方法は、改善された速度で、遅延情報と、この遅延情報の改善された分解能とを提供できる。
図1は、可能な試験信号内に含まれるオーディオ及びビデオの事象のタイミング及び継続時間を図的に示す。 図2は、図1に示すオーディオ及びビデオの信号の間の時間遅延を測定する時間遅延分析システムを図的に示す。 図3は、図1に示す如きオーディオ及びビデオの信号の相対時間を図的に示し、オーディオ及びビデオの信号の間に遅延が存在する。 図4は、本発明の実施例によりタイムスタンプを視覚的に符号化する方法を図的に示す。 図5は、本発明の実施例によりタイムスタンプをオーディオ符号化する方法を図的に示す。 図6は、図4及び図5に示す種類の符号化されたタイムスタンプを有するオーディオ及びビデオの信号の間の時間遅延を測定する本発明の実施例による時間遅延分析システムを図的に示す。

Claims (9)

  1. オーディオ及びビジュアルの信号の間の遅延を測定する方法であって、
    視覚的に符号化された複数の一連のタイムスタンプを有するビデオ信号を供給すると共に、聴覚的に符号化された対応する複数のタイムスタンプを有するオーディオ信号を供給し、上記オーディオ及びビデオ信号が互いに同期しており、
    上記オーディオ及びビデオ信号を符号化して、デジタル的に符号化されたオーディオ及びビデオ・データ・ストリームを発生し、
    上記符号化されたビデオ及びオーディオ・データ・ストリームを分析して、上記聴覚的及び視覚的に符号化されたタイムスタンプの各々を抽出し、
    対応するビデオ及びオーディオのタイムスタンプの受信時点の間の遅延を測定することを具え、
    各視覚的符号化されたタイムスタンプは、複数の表示セグメントを具え、各セグメントの色又は影が2進状態で表されて、上記視覚的に符号化されたタイムスタンプが2進コードの視覚的表現を提供し、上記2進コードが上記ビデオ信号の各フレーム用のフレーム・カウントを具え、
    各聴覚的に符号化されたタイムスタンプは、複数の所定周波数成分を有するオーディオ・トーンを具え、周波数成分の存在が2進状態の表現であって、上記聴覚的に符号化されたタイムスタンプが2進コードのオーディオ表現を提供し、上記2進コードが上記ビデオ信号の各フレーム用のフレーム・カウントを具えることを特徴とする方法。
  2. 上記ビデオ及びオーディオのタイムスタンプの各々が異なる継続時間を有することを特徴とする請求項1の方法。
  3. 上記タイムスタンプの上記継続時間が上記シーケンスを通じて順次増加することを特徴とする請求項2の方法。
  4. 上記オーディオ及びビデオのタイムスタンプの各々が時間周期で分離された間隔であり、各夫々の時間周期が異なる継続時間を有することを特徴とする先行する任意の請求項の方法。
  5. タイムスタンプの間の上記時間周期が上記タイムスタンプのシーケンスを通じて順次増加することを特徴とする請求項4の方法。
  6. 各ビデオ・タイムスタンプは、所定の表示セクタを明るくすることを具えることを特徴とする先行する任意の請求項の方法。
  7. 各オーディオ・タイムスタンプが聴覚的なトーンを発生することを具えることを特徴とする先行する任意の請求項の方法。
  8. 上記表示セグメントが複数のマクロ・ブロックを具えることを特徴とする請求項6の方法。
  9. デジタル的に符号化されたオーディオ及びビデオの信号の間の遅延を測定する装置であって、上記ビデオ信号は、視覚的に符号化された複数の連続的なタイムスタンプを有し、上記オーディオ信号は、聴覚的に符号化された対応する複数のタイムスタンプを有し、上記オーディオ及びビデオの信号が互いに同期され、
    上記符号化されたビデオ信号に符号化されたタイムスタンプの各々を検出し、上記タイムスタンプを復号化し、上記ビデオ・タイムスタンプの受信の実際の時間を表す第1時間信号を提供するように配置されたビデオ・タイムスタンプ検出器と、
    上記符号化されたオーディオ信号に符号化された上記タイムスタンプの各々を検出し、上記タイムスタンプを復号化し、上記オーディオ・タイムスタンプの実際の時間を表す第2時間信号を提供するように配置されたオーディオ・タイムスタンプ検出器と、
    上記第1及び第2の時間信号を受け、これらの受信時点の間の遅延を測定するように配置されたタイムスタンプ比較器とを具え、
    各視覚的符号化されたタイムスタンプは、複数の表示セグメントを具え、各セグメントの色又は影が2進状態で表されて、上記視覚的に符号化されたタイムスタンプが2進コードの視覚的表現を提供し、上記2進コードが上記ビデオ信号の各フレーム用のフレーム・カウントを具え、
    各聴覚的に符号化されたタイムスタンプは、複数の所定周波数成分を有するオーディオ・トーンを具え、周波数成分の存在が2進状態の表現であって、上記聴覚的に符号化されたタイムスタンプが2進コードのオーディオ表現を提供し、上記2進コードが上記ビデオ信号の各フレーム用のフレーム・カウントを具えることを特徴とする装置。
JP2009504802A 2006-04-10 2007-03-30 オーディオ/ビデオ同期遅延測定方法及び装置 Active JP5025722B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0607215.1 2006-04-10
GB0607215A GB2437123B (en) 2006-04-10 2006-04-10 Method and apparatus for measuring audio/video sync delay
PCT/GB2007/001191 WO2007116205A1 (en) 2006-04-10 2007-03-30 Method and apparatus for measuring audio/video sync delay

Publications (2)

Publication Number Publication Date
JP2009533920A true JP2009533920A (ja) 2009-09-17
JP5025722B2 JP5025722B2 (ja) 2012-09-12

Family

ID=36539692

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009504802A Active JP5025722B2 (ja) 2006-04-10 2007-03-30 オーディオ/ビデオ同期遅延測定方法及び装置

Country Status (4)

Country Link
EP (1) EP2005762A1 (ja)
JP (1) JP5025722B2 (ja)
GB (1) GB2437123B (ja)
WO (1) WO2007116205A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011142625A (ja) * 2010-01-08 2011-07-21 Ixia テレフォニー帯域内周波トーンを用いる片道および往復遅延

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009115121A2 (en) * 2008-03-19 2009-09-24 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for measuring audio-video time skew and end-to-end delay
JP5160950B2 (ja) * 2008-04-25 2013-03-13 株式会社タイトー タイミング補正プログラム、携帯端末及び処理タイミング同期方法
CN103796006A (zh) * 2012-10-30 2014-05-14 中兴通讯股份有限公司 一种唇音同步测试的系统与方法
CN106358039B (zh) * 2016-09-07 2019-02-01 深圳Tcl数字技术有限公司 音画同步测试方法及装置
GB2586986B (en) * 2019-09-10 2023-05-24 Hitomi Ltd Signal variation measurement
CN112351273B (zh) * 2020-11-04 2022-03-01 新华三大数据技术有限公司 一种视频播放质量检测方法及装置
CN112601077B (zh) * 2020-12-11 2022-07-26 杭州当虹科技股份有限公司 一种基于音频的编码器延时的自动测量方法
CN112601078B (zh) * 2020-12-11 2022-07-26 杭州当虹科技股份有限公司 一种基于视频的编码器延时的自动测量方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05236513A (ja) * 1992-02-21 1993-09-10 Shibasoku Co Ltd テレビジョン映像信号と音声信号の伝送遅延時間差の測定方法
JP2004242130A (ja) * 2003-02-07 2004-08-26 Nippon Hoso Kyokai <Nhk> 映像・音声伝送時間差測定用の信号発生装置およびその方法、並びに信号解析装置およびその方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4326102A (en) * 1980-02-04 1982-04-20 Msi Data Corporation Audio data transmission device with coupling device
US6836295B1 (en) * 1995-12-07 2004-12-28 J. Carl Cooper Audio to video timing measurement for MPEG type television systems
US5818520A (en) * 1996-02-12 1998-10-06 Tektronix, Inc. Programmable instrument for automatic measurement of compressed video quality
EP0888019A1 (en) * 1997-06-23 1998-12-30 Hewlett-Packard Company Method and apparatus for measuring the quality of a video transmission
US6208745B1 (en) * 1997-12-30 2001-03-27 Sarnoff Corporation Method and apparatus for imbedding a watermark into a bitstream representation of a digital image sequence
GB9804071D0 (en) * 1998-02-27 1998-04-22 Ridgeway Systems And Software Audio-video telephony
US6414960B1 (en) * 1998-12-29 2002-07-02 International Business Machines Corp. Apparatus and method of in-service audio/video synchronization testing
JP2001298757A (ja) * 2000-04-11 2001-10-26 Nippon Hoso Kyokai <Nhk> 映像・音声遅延時間差測定装置
JP2003259314A (ja) * 2002-02-26 2003-09-12 Nippon Hoso Kyokai <Nhk> 映像音声同期方法及びそのシステム
JP2004158913A (ja) * 2002-11-01 2004-06-03 Canon Inc 音声画像処理装置
KR100499037B1 (ko) * 2003-07-01 2005-07-01 엘지전자 주식회사 디지털 텔레비젼 수신기의 립 싱크 테스트 방법 및 장치
EP1662793B1 (en) * 2003-09-02 2020-01-15 Sony Corporation Content reception device, video/audio output timing control method, and content providing system
US20050219366A1 (en) * 2004-03-31 2005-10-06 Hollowbush Richard R Digital audio-video differential delay and channel analyzer
CN100442858C (zh) * 2005-10-11 2008-12-10 华为技术有限公司 分组网络中多媒体实时传输的唇同步方法及其装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05236513A (ja) * 1992-02-21 1993-09-10 Shibasoku Co Ltd テレビジョン映像信号と音声信号の伝送遅延時間差の測定方法
JP2004242130A (ja) * 2003-02-07 2004-08-26 Nippon Hoso Kyokai <Nhk> 映像・音声伝送時間差測定用の信号発生装置およびその方法、並びに信号解析装置およびその方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011142625A (ja) * 2010-01-08 2011-07-21 Ixia テレフォニー帯域内周波トーンを用いる片道および往復遅延

Also Published As

Publication number Publication date
WO2007116205A9 (en) 2009-04-09
WO2007116205A1 (en) 2007-10-18
GB2437123A (en) 2007-10-17
GB2437123B (en) 2011-01-26
GB0607215D0 (en) 2006-05-17
JP5025722B2 (ja) 2012-09-12
EP2005762A1 (en) 2008-12-24

Similar Documents

Publication Publication Date Title
JP5025722B2 (ja) オーディオ/ビデオ同期遅延測定方法及び装置
KR100499037B1 (ko) 디지털 텔레비젼 수신기의 립 싱크 테스트 방법 및 장치
US9536545B2 (en) Audio visual signature, method of deriving a signature, and method of comparing audio-visual data background
KR102260946B1 (ko) 미디어 재생 에러들을 검출하기 위한 기술들
US20080037954A1 (en) Automatic Video Glitch Detection and Audio-Video Synchronization Assessment
US10219033B2 (en) Method and apparatus of managing visual content
EP3171593B1 (en) Testing system and method
US8433143B1 (en) Automated detection of video artifacts in an information signal
EP1874055B1 (en) Pulldown correction for progressive scan display of audiovisual recordings
EP2725578A1 (en) Loudness log for recovery of gated loudness measurements and associated analyzer
CN113055711A (zh) 一种音视频同步检测方法及其检测系统
GB2437122A (en) Method and apparatus for measuring audio/video sync delay
KR101721224B1 (ko) 실시간 영상 및 음성 왜곡 검출 방법 및 장치
JP5342229B2 (ja) 放送実績取得システム、情報埋め込み装置、情報検出装置及び放送実績取得方法
US20230231988A1 (en) Embedded timestamps for determining offset between test streams

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110908

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120223

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120522

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120619

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150629

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5025722

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250