JP5383520B2 - 映像フレーム及び音声フレームとの間の同期外れを補正する中継装置、プログラム、システム及び方法 - Google Patents

映像フレーム及び音声フレームとの間の同期外れを補正する中継装置、プログラム、システム及び方法 Download PDF

Info

Publication number
JP5383520B2
JP5383520B2 JP2010003978A JP2010003978A JP5383520B2 JP 5383520 B2 JP5383520 B2 JP 5383520B2 JP 2010003978 A JP2010003978 A JP 2010003978A JP 2010003978 A JP2010003978 A JP 2010003978A JP 5383520 B2 JP5383520 B2 JP 5383520B2
Authority
JP
Japan
Prior art keywords
frame
video
audio
video frame
synchronization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010003978A
Other languages
English (en)
Other versions
JP2011146783A (ja
Inventor
剛 村上
亮一 川田
信夫 長坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2010003978A priority Critical patent/JP5383520B2/ja
Publication of JP2011146783A publication Critical patent/JP2011146783A/ja
Application granted granted Critical
Publication of JP5383520B2 publication Critical patent/JP5383520B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Details Of Television Systems (AREA)

Description

本発明は、映像フレーム及び音声フレームとの間の同期外れを補正する通信装置の技術に関する。
映像伝送システムによれば、同期した映像フレーム及び音声フレームは各々独立して送受信される。そのために、中継伝送される途中で、映像フレームと音声フレームとの間での同期が外れていく場合がある。そのために、映像フレームと音声フレームとを同期させる「リップシンク(lip-sync)」の技術が必要となる。「リップシンク」とは、映像フレームと音声フレームとの間の同期外れを検知し、それを補正する技術をいう。
図1は、対象となるシステム構成図である。
図1のシステムによれば、送信装置2と受信装置3とは、1つ以上の中継装置1を備えた通信事業者ネットワークを介して接続されている。送信装置2は、時間的に同期した映像フレーム及び音声フレームを、受信装置3へ送信する。両フレームには、フレーム番号と再生タイムスタンプとが付加されている。
送信装置2から送信された両フレームは、ネットワークのエッジ装置としての中継装置1によって受信される。そして、両フレームは、ネットワーク内で中継装置1をホップしながら転送され、最終的に、相手側のエッジ装置から受信装置3へ送信される。
従来、送信装置側が、映像フレームと音声フレームとの同期外れを補正する技術がある(例えば特許文献1参照)。この技術によれば、送信装置側が、映像フレームのエンコード及びデコードの処理時間と、音声フレームのエンコード及びデコード処理時間との差分を算出する。その差分は、映像フレームと音声フレームとの間の同期外れとして検知される。送信装置側は、映像フレームと音声フレームとで処理時間が短い方を、処理時間の差分だけ遅延させることで同期外れを補正する。
これに対して、受信装置側が、映像フレームと音声フレームとの間の同期外れを客観的・定量的に検知し、補正する技術がある(例えば特許文献2、3参照)。送信装置側は、入力時刻を特定可能なマーカデータを、映像フレーム及び音声フレームに挿入する。受信装置側では、映像フレーム及び音声フレームのマーカデータを参照し、映像フレームと音声フレームとの間の同期外れを検知し、補正する。
また、主に放送局向けの映像伝送ネットワークにおける装置障害や伝送障害に起因するフリーズ、ブラック又はミュートのような現象を検知する技術がある(例えば非特許文献1参照)。この技術によれば、ネットワーク内の中継装置毎に算出されたメタデータが、映像フレーム及び音声フレームに挿入される。そのメタデータを用いて、映像フレーム及び音声フレームにおける障害を検知する。メタデータの履歴は、複数の中継装置によって保持され、各メタデータを比較することによって、伝送システム内の障害箇所が検知される。
特開2008−131591号公報 特開2007−312192号公報 特開2003−046901号公報
ARIB技術資料、「放送チェーンにおける映像・音声フレームの障害監視のためのメタデータ」、ARIB TR-B29 1.0版、[online]、[平成21年12月20日検索]、インターネット<URL:http://www.arib.or.jp/tyosakenkyu/kikaku_hoso/hoso_gijutsu_number.html>
しかしながら、特許文献1に記載された技術によれば、送信装置側のエンコーダと受信装置側のデコーダで発生する遅延時間のみを考慮するため、ネットワーク内で映像フレームと音声フレームとの同期外れが発生する場合は、対応できない。また、送信装置側で想定する受信装置側のデコーダの処理遅延時間が、実際の受信装置側のデコーダの処理遅延時間と異なる場合、送信装置側は、正確に同期外れを補正することができない。
また、特許文献2、3に記載された技術によれば、伝送システム内で発生する映像フレームと音声フレームとの間の同期外れを補正することができるが、受信装置に特別の機能を搭載する必要がある。
更に、非特許文献1に記載された技術によれば、画質劣化や音声劣化といった障害を検出するためのものであって、映像フレームと音声フレームとの同期外れを検知し且つ補正することについては全く考慮されていない。
そこで、本発明は、映像フレーム及び音声フレームの間のリップシンクの同期外れを中継ポイント毎に補正することによって、ネットワークを介したシステム全体として同期を確保することができる中継装置、プログラム、システム及び方法を提供することを目的とする。
本発明によれば、映像フレームと、該映像フレームに同期する音声フレームとを伝送する中継装置において、
他の装置から受信した映像フレームを一時的に蓄積する映像バッファ手段と、
他の装置から受信した音声フレームを一時的に蓄積する音声バッファ手段と、
映像バッファ手段及び音声バッファ手段から映像フレーム及び音声フレームを出力させるバッファ出力制御手段と、
映像フレームに、当該中継装置の現同期情報をメタデータとして含める映像メタデータ挿入手段と、
音声フレームに、当該中継装置の現同期情報をメタデータとして含める音声メタデータ挿入手段と、
映像フレームについて、現同期情報と、1つ前のホップで付加された前同期情報とを比較して、映像フレームの同期差分を検出する映像同期差分検知手段と、
音声フレームについて、現同期情報と、1つ前のホップで付加された前同期情報とを比較して、音声フレームの同期差分を検出する音声同期差分検知手段と、
映像フレーム/音声フレームの同期差分が音声フレーム/映像フレームの同期差分よりも大きい場合、音声フレーム/映像フレームを、映像フレーム/音声フレームと同期が一致するように遅延させるべくバッファ制御手段を制御する同期差分補正手段と
を有することを特徴とする。
本発明の中継装置における他の実施形態によれば、
現時刻を出力するタイマ手段を更に含んでおり、
同期情報は、時刻であり、
映像メタデータ挿入手段は、映像フレームのメタデータに、タイマ手段から出力された同一時刻に基づく現同期情報を含め、
音声メタデータ挿入手段は、音声フレームのメタデータに、タイマ手段から出力された同一時刻に基づく現同期情報を含める
ことも好ましい。
本発明の中継装置における他の実施形態によれば、
映像フレームから特徴量を検出する映像特徴量検出手段と、
音声フレームから特徴量を検出する音声特徴量検出手段と
を更に有し、
同期情報は、特徴量であり、
映像メタデータ挿入手段は、映像フレームのメタデータに、映像特徴量検出手段から出力された特徴量に基づく現同期情報を含め、
音声メタデータ挿入手段は、音声フレームのメタデータに、音声特徴量検出手段から出力された特徴量に基づく現同期情報を含める
ことも好ましい。
本発明の中継装置における他の実施形態によれば、
同期差分補正手段は、現時刻tにおける両フレームの同期差分を補正する際に、映像バッファ手段及び音声バッファ手段に蓄積された過去時刻t-nにおける両フレームを、現時刻tにおける映像フレーム又は音声フレームに対する遅延量よりも小さい遅延量で、両バッファ制御手段が両フレームを出力するべく制御することも好ましい。
本発明によれば、送信装置及び受信装置を有し、映像フレームと、映像フレームに同期する音声フレームとを伝送するシステムにおいて、
送信装置は、
映像フレームに、当該中継装置の現同期情報をメタデータとして含める映像メタデータ挿入手段と、
音声フレームに、当該中継装置の現同期情報をメタデータとして含める音声メタデータ挿入手段と、
映像バッファ手段及び音声バッファ手段から映像フレーム及び音声フレームを出力させるバッファ制御手段と
を有し、
受信装置は、
他の装置から受信した映像フレームを一時的に蓄積する映像バッファ手段と、
他の装置から受信した音声フレームを一時的に蓄積する音声バッファ手段と、
映像バッファ手段及び音声バッファ手段から映像フレーム及び音声フレームを出力させるバッファ制御手段と、
映像フレームについて、現同期情報と、1つ前のホップで付加された前同期情報とを比較して、映像フレームの同期差分を検出する映像同期差分検知手段と、
音声フレームについて、現同期情報と、1つ前のホップで付加された前同期情報とを比較して、音声フレームの同期差分を検出する音声同期差分検知手段と、
映像フレーム/音声フレームの同期差分が音声フレーム/映像フレームの同期差分よりも大きい場合、音声フレーム/映像フレームを、映像フレーム/音声フレームと同期が一致するように遅延させるべくバッファ制御手段を制御する同期差分補正手段と
を有することを特徴とする。
本発明のシステムにおける他の実施形態によれば、
送信装置は、送信装置又は中継装置であり、
受信装置は、中継装置又は受信装置であることも好ましい。
本発明によれば、送信装置と受信装置とを有するシステムであって、映像フレームと、映像フレームに同期する音声フレームとを伝送する伝送方法において、
送信装置が、映像フレームに、当該中継装置の現同期情報をメタデータとして含めると共に、音声フレームに、当該中継装置の現同期情報をメタデータとして含める第1のステップと、
送信装置が、同期する映像フレーム及び音声フレームを伝送する第2のステップと、
受信装置が、他の装置から受信した映像フレームを映像バッファ部に一時的に蓄積すると共に、他の装置から受信した音声フレームを音声バッファ部に一時的に蓄積する第3のステップと、
受信装置が、映像フレームについて、現同期情報と、1つ前のホップで付加された前同期情報とを比較して、映像フレームの同期差分を検出すると共に、音声フレームについて、現同期情報と、1つ前のホップで付加された前同期情報とを比較して、音声フレームの同期差分を検出する第4のステップと、
受信装置が、映像フレーム/音声フレームの同期差分が音声フレーム/映像フレームの同期差分よりも大きい場合、音声フレーム/映像フレームを、映像フレーム/音声フレームと同期が一致するように遅延させる第5のステップと、
受信装置が、映像バッファ部及び音声バッファ部から映像フレーム及び音声フレームを出力する第6のステップと
を有することを特徴とする。
本発明の中継装置、プログラム、システム及び方法によれば、映像フレーム及び音声フレームの間のリップシンクの同期外れを中継ポイント毎に補正することによって、ネットワークを介したシステム全体として同期を確保することができる。特に、本発明によれば、少なくとも受信装置に何らの特別な機能を搭載する必要がない。また、本発明に基づく中継装置を通信事業者ネットワーク内のみで用いることによって、ユーザ所持の送信装置及び受信装置に何らの特別な機能を搭載する必要がない。更に、ネットワーク内におけるいずれの中継ポイントで、リップシンクの同期外れを補正したかを特定することもできる。
対象となるシステム構成図である。 本発明におけるフレームの流れを表す説明図である。 本発明における中継装置の機能構成図である。 本発明におけるシステムの基本構成図である。 同期情報が時刻である場合に、同期差分の補正を表す説明図である。 同期情報が特徴量である場合に、同期差分の補正を表す説明図である。
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
図2は、本発明におけるフレームの流れを表す説明図である。
図2によれば、通信事業者ネットワーク4には、複数の中継装置1が備えられており、エッジ装置としての中継装置aは、送信装置2から映像フレーム及び音声フレームを受信する。映像フレーム及び音声フレームは、時間的に同期したものである。
図2(a)によれば、中継装置aは、映像フレーム及び音声フレームに、現同期情報を含むメタデータを挿入する。ここで、現同期情報とは、当該中継装置aに搭載されたタイマから得られる時刻であってもよい。また、フレーム内容に基づく特徴量であってもよい(例えば非特許文献1参照)。映像フレームにおける特徴量として、映像空間特徴量SI(Spatial Perceptual Information)及び/又は映像時間特徴量TI(Temporal Perceptual
Information)がある。また、音声フレームにおける特徴量として、音声同相情報AII(Audio In-phase Information)、音声逆相情報AOI(Audio Out-phase Information)及び/又は音声振幅情報AMI(Audio Magnitude Information)がある。中継装置aは、現同期情報のメタデータを挿入した映像フレーム及び音声フレームを、同期がとれた状態で、中継装置bへ送信する。
図2(b)によれば、中継装置bは、その映像フレーム及び音声フレームを、同期が外れた状態で受信している。音声フレームは時刻t2に受信されているのに対し、映像フレームは、その後の時刻t3に受信されている。映像フレームには、中継装置aに基づく前同期情報t1を含むメタデータが挿入されており、音声フレームにも、中継装置aに基づく前同期情報t1を含むメタデータが挿入されている。
図2(c)によれば、音声フレームのメタデータに、現同期情報t2を含むメタデータを挿入し、映像フレームのメタデータに、現同期情報t3を含むメタデータを挿入する。そして、中継装置bは、音声フレームについて、現同期情報t2と前同期情報t1との同期差分(t2−t1)を検出する。また、映像フレームについて、現同期情報t3と前同期情報t1との同期差分(t3−t1)を検出する。
図2(d)によれば、中継装置bは、映像フレーム又は音声フレームのうち、同期差分が小さい方のフレームを、同期差分が大きい方のフレームに同期させて、遅延させる。そして、両フレームは、現同期情報も同期させた状態(時刻t3に一致)で、次の中継装置又は受信装置へ送信される。即ち、図2(b)では、リップシンクが外れた状態で受信された両フレームは、リップシンクがとれた状態で次ホップの装置へ送信される。
図3は、本発明における中継装置の機能構成図である。
図3によれば、中継装置1は、通信インタフェースとして、入力インタフェース部100と、出力インタフェース部101とを有する。映像フレーム用に、映像バッファ部111と、映像特徴量検出部112と、映像メタデータ挿入部113と、映像同期差分検知部114とを有する。また、音声フレーム用に、音声バッファ部121と、音声特徴量検出部122と、音声メタデータ挿入部123と、音声同期差分検知部124とを有する。更に、タイマ部131と、同期差分補正部132と、バッファ出力制御部133とを有する。インタフェース部を除くこれら機能構成部は、中継装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。また、機能部における処理の流れによって、中継装置における中継伝送方法として実現される。
入力インタフェース部100は、映像フレームと、その映像フレームに同期する音声フレームとを受信する。映像フレームは映像バッファ部111へ出力され、音声フレームは音声バッファ部121へ出力される。
映像バッファ部111は、入力インタフェース部100から受信した映像フレームを一時的に蓄積する。映像バッファ部111は、FIFO(First In First Out)方式である。映像バッファ部111に蓄積された映像フレームは、映像特徴量検出部112から参照され、映像メタデータ挿入部113からメタデータが挿入される。そして、映像バッファ部111は、バッファ出力制御部133からの指示に応じて、映像フレームを出力インタフェース部101へ出力する。
映像特徴量検出部112は、映像バッファ部111に蓄積された映像フレームを参照し、その映像フレームにおける特徴量(例えば映像空間特徴量)を検出する。検出された特徴量は、映像メタデータ挿入部113へ出力される。
映像メタデータ挿入部113は、映像フレームのメタデータに、当該中継装置の現状態に基づく現同期情報を挿入する。現同期情報は、タイマ部131から出力された現時刻であってもよい。また、映像特徴量検出部112から出力された特徴量であってもよい。映像フレームのメタデータに含まれる前同期情報及び現同期情報は、映像同期差分検知部114へ出力される。
映像同期差分検知部114は、メタデータに含まれる現同期情報と、1つ前のホップでメタデータに付加された前同期情報とを比較して、映像フレームの同期差分を検出する。映像フレームについて、現同期情報t3及び前同期情報t1である場合、同期差分としてt3−t1が検出される。映像フレームの同期差分は、同期差分補正部132へ出力される。
音声バッファ部121は、入力インタフェース部100から受信した音声フレームを一時的に蓄積する。音声バッファ部121は、FIFO方式である。音声バッファ部121に蓄積された音声フレームは、音声特徴量検出部122から参照され、音声メタデータ挿入部123からメタデータが挿入される。そして、音声バッファ部121は、バッファ出力制御部133からの指示に応じて、音声フレームを出力インタフェース部101へ出力する。
音声特徴量検出部122は、音声バッファ部121に蓄積された音声フレームを参照し、その音声フレームにおける特徴量(例えば音声同相情報)を検出する。検出された特徴量は、音声メタデータ挿入部123へ出力される。
音声メタデータ挿入部123は、音声フレームのメタデータに、当該中継装置の現状態に基づく現同期情報を挿入する。現同期情報は、タイマ部131から出力された現時刻であってもよい。また、音声特徴量検出部122から出力された特徴量であってもよい。音声フレームのメタデータに含まれる前同期情報及び現同期情報は、音声同期差分検知部124へ出力される。
音声同期差分検知部124は、メタデータに含まれる現同期情報と、1つ前のホップでメタデータに付加された前同期情報とを比較して、音声フレームの同期差分を検出する。音声フレームについて、現同期情報t2及び前同期情報t1である場合、同期差分としてt2−t1が検出される。音声フレームの同期差分は、同期差分補正部132へ出力される。
タイマ部131は、現時刻を出力する。タイマ部131は、現時刻を、映像メタデータ挿入部113及び音声メタデータ挿入部123へ出力する。
同期差分補正部132は、映像フレームの同期差分と、音声フレームの同期差分とを入力する。映像フレーム/音声フレームの同期差分が音声フレーム/映像フレームの同期差分よりも大きい場合、同期差分補正部132は、音声フレーム/映像フレームを、映像フレーム/音声フレームと同期が一致するように遅延させるべくバッファ出力制御部133を制御する。「/」は、「又は」の意味であって、「映像フレーム/音声フレームを、音声フレーム/映像フレームと同期が一致する」とは、「映像フレームを、音声フレームと同期が一致する」又は「音声フレームを、映像フレームと同期が一致する」の2つ意味を有する。
また、同期差分補正部132は、現時刻tにおける両フレームの同期差分を補正する際に、映像バッファ部111及び音声バッファ部121に蓄積された過去時刻t-nにおける両フレームを、現時刻tにおける映像フレーム又は音声フレームに対する遅延量よりも小さい遅延量で、両バッファ部が両フレームを出力するべく制御する。この動作は、図5(d)で詳述する。
バッファ出力制御部133は、映像バッファ部111及び音声バッファ部121から映像フレーム及び音声フレームを同期させて出力させる。これによって、映像フレームが音声フレームよりも遅延している場合、その遅延差分だけ音声フレームを遅延させ、リップシンクの同期外れを補正する。また、音声フレームが映像フレームよりも遅延している場合、その遅延差分だけ映像フレームを遅延させ、リップシンク同期外れを補正する。尚、映像フレームと音声フレームとの間で遅延差分がない場合、リップシンク同期外れは発生していない、即ち、リップシンクがとれている状態であるので、映像フレーム又は音声フレームを遅延させる必要はない。
映像バッファ部111及び音声バッファ部121から取り出された映像フレーム及び音声フレームは、出力インタフェース部101を介して、次ホップの装置へ出力される。
図4は、本発明におけるシステムの基本構成図である。
図4によれば、本発明におけるシステムは、送信装置2と受信装置3とのみを有する。送信装置2は、映像フレーム及び音声フレームを同期がとれた状態で送信するが、受信装置3は、同期が外れた状態の映像フレーム及び音声フレームを受信する。送信装置2が、現同期情報を含むメタデータをフレームに挿入することよって、受信装置3は、映像フレーム及び音声フレームを同期させて出力することができる。
図4によれば、送信装置2は、少なくとも、映像バッファ部111と、映像特徴量検出部112と、映像メタデータ挿入部113と、音声バッファ部121と、音声特徴量検出部122と、音声メタデータ挿入部123と、タイマ部131とを有していればよい。一方で、受信装置3は、少なくとも、映像バッファ部111と、映像同期差分検知部114と、音声バッファ部121と、音声同期差分検知部124と、同期差分補正部132と、バッファ出力制御部133とを有していればよい。
図5は、同期情報が時刻である場合に、同期差分の補正を表す説明図である。
図5によれば、横方向は、フレーム番号の順に、同期情報としての時刻が並べられている。図5(a)は、映像フレームにおける1ホップ前の前同期情報と、当該中継装置の現同期情報とが表されている。映像フレーム毎に、前同期情報と現同期情報とを比較すると、一貫して33msの同期差分となっている。
図5(b)は、音声フレームにおける1ホップ前の前同期情報と、当該中継装置の現同期情報とが表されている。音声フレーム毎に、前同期情報と現同期情報とを比較すると、音声フレーム1〜2までは、映像フレームと同様に33msの同期差分である。しかし、音声フレーム3では、66msの同期差分が発生している。
図5(a)及び(b)を比較すると、映像フレーム1〜2の同期差分は33msであり、音声フレーム1〜2の同期差分は33msであり、両者は同一である。しかし、映像フレーム3の同期差分33msであるのに対し、音声フレーム3の同期差分は66msであり、同期外れの発生が検知される。
図5(c)は、本発明における同期外れの補正を表している。図5(a)によれば、映像フレーム番号3について、同期差分33msであるのに対し、図5(b)によれば、音声フレーム番号3について、同期差分66msである。このとき、映像フレーム番号3について、33ms(=66ms−33ms)だけ遅延させることによって、音声フレーム番号3と同期させることができる。映像フレームは、FIFO方式の映像バッファ部に蓄積されているので、映像フレーム番号3のみについて出力タイミングを遅延させることによって、その後の映像フレームは所定タイミングで継続して出力されていく。
尚、図5(c)の場合、映像フレームを音声フレームに合わせて遅延させることによって、映像フレーム番号2と3との間のみに、一時的に66msの時間的隔たりが生じてしまう。これは、受信装置がストリーミング形式で再生している場合、映像の途切れが生じる場合がある。
そこで、図5(d)は、映像フレーム番号3で同期外れを検出した場合、その前段にある映像フレーム及び音声フレーム(番号1及び2)も遅延させることによって、フレーム間に生じる一時的に長い時間的隔たりを、前方の任意のフレーム間に分散させることができる。例えば、図5(d)によれば、映像フレーム番号1と2及び音声フレーム番号1と2について、バッファ部からの出力を、33ms遅延させている。バッファ内全体で、フレーム間に生じる時間的隔たりを平準化することができる。これによって、受信装置における再生に伴う映像又は音声の途切れをできる限り回避することができる。
図6は、同期情報が特徴量である場合に、同期差分の補正を表す説明図である。
図6によれば、横軸に、時間経過に伴うフレーム番号が表され、縦軸に、フレーム内容に基づく特徴量が表されている。フレーム毎に、前同期情報としての特徴量(黒塗り)と、現同期情報としての特徴量(斜線)とが表されている。ここで、フレーム毎にこれら特徴量を統計的に記録することによって、前同期情報及び現同期情報との間の相関を取ることができる。図6によれば、4サンプル分の132msだけ遅延していることが理解できる。映像フレーム及び音声フレームのそれぞれについて遅延を導出することによって、同期差分を検知することできる。
以上、詳細に説明したように、本発明の中継装置、プログラム、システム及び方法によれば、映像フレーム及び音声フレームの間のリップシンクの同期外れを中継ポイント毎に補正することによって、ネットワークを介したシステム全体として同期を確保することができる。特に、本発明によれば、少なくとも受信装置に何らの特別な機能を搭載する必要がない。また、本発明に基づく中継装置を通信事業者ネットワーク内のみで用いることによって、ユーザ所持の送信装置及び受信装置に何らの特別な機能を搭載する必要がない。更に、ネットワーク内におけるいずれの中継ポイントで、リップシンクの同期外れを補正したかを特定することもできる。
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 中継装置
100 入力インタフェース部
101 出力インタフェース部
111 映像バッファ部
112 映像特徴量検出部
113 映像メタデータ挿入部
114 映像同期差分検知部
121 音声バッファ部
122 音声特徴量検出部
123 音声メタデータ挿入部
124 音声同期差分検知部
131 タイマ部
132 同期差分補正部
133 バッファ出力制御部
2 送信装置
3 受信装置

Claims (8)

  1. 映像フレームと、該映像フレームに同期する音声フレームとを伝送する中継装置において、
    他の装置から受信した映像フレームを一時的に蓄積する映像バッファ手段と、
    他の装置から受信した音声フレームを一時的に蓄積する音声バッファ手段と、
    前記映像バッファ手段及び前記音声バッファ手段から前記映像フレーム及び前記音声フレームを出力させるバッファ出力制御手段と、
    前記映像フレームに、当該中継装置の現同期情報をメタデータとして含める映像メタデータ挿入手段と、
    前記音声フレームに、当該中継装置の現同期情報をメタデータとして含める音声メタデータ挿入手段と、
    前記映像フレームについて、現同期情報と、1つ前のホップで付加された前同期情報とを比較して、映像フレームの同期差分を検出する映像同期差分検知手段と、
    前記音声フレームについて、現同期情報と、1つ前のホップで付加された前同期情報とを比較して、音声フレームの同期差分を検出する音声同期差分検知手段と、
    前記映像フレーム/音声フレームの同期差分が前記音声フレーム/映像フレームの同期差分よりも大きい場合、前記音声フレーム/映像フレームを、前記映像フレーム/音声フレームと同期が一致するように遅延させるべく前記バッファ制御手段を制御する同期差分補正手段と
    を有することを特徴とする中継装置。
  2. 現時刻を出力するタイマ手段を更に含んでおり、
    前記同期情報は、時刻であり、
    前記映像メタデータ挿入手段は、前記映像フレームのメタデータに、前記タイマ手段から出力された同一時刻に基づく現同期情報を含め、
    前記音声メタデータ挿入手段は、前記音声フレームのメタデータに、前記タイマ手段から出力された同一時刻に基づく現同期情報を含める
    ことを特徴とする請求項1に記載の中継装置。
  3. 映像フレームから特徴量を検出する映像特徴量検出手段と、
    音声フレームから特徴量を検出する音声特徴量検出手段と
    を更に有し、
    前記同期情報は、特徴量であり、
    前記映像メタデータ挿入手段は、前記映像フレームのメタデータに、前記映像特徴量検出手段から出力された特徴量に基づく現同期情報を含め、
    前記音声メタデータ挿入手段は、前記音声フレームのメタデータに、前記音声特徴量検出手段から出力された特徴量に基づく現同期情報を含める
    ことを特徴とする請求項1に記載の中継装置。
  4. 前記同期差分補正手段は、現時刻tにおける両フレームの同期差分を補正する際に、前記映像バッファ手段及び前記音声バッファ手段に蓄積された過去時刻t-nにおける両フレームを、現時刻tにおける前記映像フレーム又は前記音声フレームに対する遅延量よりも小さい遅延量で、前記両バッファ制御手段が両フレームを出力するべく制御することによって、フレーム間に生じる一時的に長い時間的隔たりを、前方の任意のフレーム間に分散させることを特徴とする請求項1から3のいずれか1項に記載の中継装置。
  5. 映像フレームと、該映像フレームに同期する音声フレームとを伝送する中継装置に搭載されたコンピュータを機能させるプログラムにおいて、
    他の装置から受信した映像フレームを一時的に蓄積する映像バッファ手段と、
    他の装置から受信した音声フレームを一時的に蓄積する音声バッファ手段と、
    前記映像バッファ手段及び前記音声バッファ手段から前記映像フレーム及び前記音声フレームを出力させるバッファ出力制御手段と、
    前記映像フレームに、当該中継装置の現同期情報をメタデータとして含める映像メタデータ挿入手段と、
    前記音声フレームに、当該中継装置の現同期情報をメタデータとして含める音声メタデータ挿入手段と、
    前記映像フレームについて、現同期情報と、1つ前のホップで付加された前同期情報とを比較して、映像フレームの同期差分を検出する映像同期差分検知手段と、
    前記音声フレームについて、現同期情報と、1つ前のホップで付加された前同期情報とを比較して、音声フレームの同期差分を検出する音声同期差分検知手段と、
    前記映像フレーム/音声フレームの同期差分が前記音声フレーム/映像フレームの同期差分よりも大きい場合、前記音声フレーム/映像フレームを、前記映像フレーム/音声フレームと同期が一致するように遅延させるべく前記バッファ制御手段を制御する同期差分補正手段と
    してコンピュータを機能させることを特徴とする中継装置用のプログラム。
  6. 送信装置及び受信装置を有し、映像フレームと、前記映像フレームに同期する音声フレームとを伝送するシステムにおいて、
    前記送信装置は、
    前記映像フレームに、当該中継装置の現同期情報をメタデータとして含める映像メタデータ挿入手段と、
    前記音声フレームに、当該中継装置の現同期情報をメタデータとして含める音声メタデータ挿入手段と、
    前記映像バッファ手段及び前記音声バッファ手段から前記映像フレーム及び前記音声フレームを出力させるバッファ制御手段と
    を有し、
    前記受信装置は、
    他の装置から受信した映像フレームを一時的に蓄積する映像バッファ手段と、
    他の装置から受信した音声フレームを一時的に蓄積する音声バッファ手段と、
    前記映像バッファ手段及び前記音声バッファ手段から前記映像フレーム及び前記音声フレームを出力させるバッファ制御手段と、
    前記映像フレームについて、現同期情報と、1つ前のホップで付加された前同期情報とを比較して、映像フレームの同期差分を検出する映像同期差分検知手段と、
    前記音声フレームについて、現同期情報と、1つ前のホップで付加された前同期情報とを比較して、音声フレームの同期差分を検出する音声同期差分検知手段と、
    前記映像フレーム/音声フレームの同期差分が前記音声フレーム/映像フレームの同期差分よりも大きい場合、前記音声フレーム/映像フレームを、前記映像フレーム/音声フレームと同期が一致するように遅延させるべく前記バッファ制御手段を制御する同期差分補正手段と
    を有することを特徴とするシステム。
  7. 前記送信装置は、送信装置又は中継装置であり、
    前記受信装置は、中継装置又は受信装置である
    ことを特徴とする請求項6に記載のシステム。
  8. 送信装置と受信装置とを有するシステムであって、映像フレームと、前記映像フレームに同期する音声フレームとを伝送する伝送方法において、
    前記送信装置が、前記映像フレームに、当該中継装置の現同期情報をメタデータとして含めると共に、前記音声フレームに、当該中継装置の現同期情報をメタデータとして含める第1のステップと、
    前記送信装置が、同期する映像フレーム及び音声フレームを伝送する第2のステップと、
    前記受信装置が、他の装置から受信した映像フレームを映像バッファ部に一時的に蓄積すると共に、他の装置から受信した音声フレームを音声バッファ部に一時的に蓄積する第3のステップと、
    前記受信装置が、前記映像フレームについて、現同期情報と、1つ前のホップで付加された前同期情報とを比較して、映像フレームの同期差分を検出すると共に、前記音声フレームについて、現同期情報と、1つ前のホップで付加された前同期情報とを比較して、音声フレームの同期差分を検出する第4のステップと、
    前記受信装置が、前記映像フレーム/音声フレームの同期差分が前記音声フレーム/映像フレームの同期差分よりも大きい場合、前記音声フレーム/映像フレームを、前記映像フレーム/音声フレームと同期が一致するように遅延させる第5のステップと、
    前記受信装置が、前記映像バッファ部及び前記音声バッファ部から前記映像フレーム及び前記音声フレームを出力する第6のステップと
    を有することを特徴とする伝送方法。
JP2010003978A 2010-01-12 2010-01-12 映像フレーム及び音声フレームとの間の同期外れを補正する中継装置、プログラム、システム及び方法 Expired - Fee Related JP5383520B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010003978A JP5383520B2 (ja) 2010-01-12 2010-01-12 映像フレーム及び音声フレームとの間の同期外れを補正する中継装置、プログラム、システム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010003978A JP5383520B2 (ja) 2010-01-12 2010-01-12 映像フレーム及び音声フレームとの間の同期外れを補正する中継装置、プログラム、システム及び方法

Publications (2)

Publication Number Publication Date
JP2011146783A JP2011146783A (ja) 2011-07-28
JP5383520B2 true JP5383520B2 (ja) 2014-01-08

Family

ID=44461278

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010003978A Expired - Fee Related JP5383520B2 (ja) 2010-01-12 2010-01-12 映像フレーム及び音声フレームとの間の同期外れを補正する中継装置、プログラム、システム及び方法

Country Status (1)

Country Link
JP (1) JP5383520B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11228799B2 (en) 2019-04-17 2022-01-18 Comcast Cable Communications, Llc Methods and systems for content synchronization

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012244413A (ja) * 2011-05-19 2012-12-10 Nippon Hoso Kyokai <Nhk> 信号監視装置およびプログラム、信号補正装置およびプログラム
DE112013005221T5 (de) * 2012-10-30 2015-08-20 Mitsubishi Electric Corporation Audio/Video-Reproduktionssystem, Video-Anzeigevorrichtung und Audio-Ausgabevorrichtung
CN111641858A (zh) * 2020-04-29 2020-09-08 上海推乐信息技术服务有限公司 一种音视频同步方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4059597B2 (ja) * 1999-07-06 2008-03-12 三洋電機株式会社 映像音声送受信装置
JP4313522B2 (ja) * 2001-07-30 2009-08-12 日本放送協会 リップシンク制御装置
JP2004242130A (ja) * 2003-02-07 2004-08-26 Nippon Hoso Kyokai <Nhk> 映像・音声伝送時間差測定用の信号発生装置およびその方法、並びに信号解析装置およびその方法
JP2007312192A (ja) * 2006-05-19 2007-11-29 Oki Electric Ind Co Ltd リップシンク評価装置、及びリップシンク調整装置
JP2008131591A (ja) * 2006-11-24 2008-06-05 Toshiba Corp リップシンク制御装置及びリップシンク制御方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11228799B2 (en) 2019-04-17 2022-01-18 Comcast Cable Communications, Llc Methods and systems for content synchronization

Also Published As

Publication number Publication date
JP2011146783A (ja) 2011-07-28

Similar Documents

Publication Publication Date Title
CN101827271B (zh) 音频视频同步方法、装置以及数据接收终端
JP4565011B2 (ja) デジタル放送多重装置
US8842218B2 (en) Video/audio data output device and method
US10491944B2 (en) Decoding device, reception device, transmission device, transmission/reception system, decoding method, and storage medium having decoding program stored therein
JP2008205979A (ja) 放送データ変換装置
JP2008271253A (ja) ストリーム再生装置
JP5383520B2 (ja) 映像フレーム及び音声フレームとの間の同期外れを補正する中継装置、プログラム、システム及び方法
US10523467B2 (en) Transmission device, transmission method, reception device and reception method
US11128911B2 (en) Decoding device, reception device, transmission device, transmission/reception system, decoding method, and storage medium having decoding program stored therein
JP2008236040A (ja) ストリーム再生装置
JP2008193151A (ja) ストリーム記録装置
KR100864009B1 (ko) 오디오/비디오 동기화 방법
JP6822407B2 (ja) 受信装置、データ処理方法、及び、プログラム
CA2915022A1 (en) Broadcasting transmission/reception apparatus and broadcasting transmission/reception method
JP4589355B2 (ja) ストリーム再生装置
KR100663565B1 (ko) Pcr 및 데이터 레이트의 보정 장치 및 보정 방법
JP6596363B2 (ja) 時刻マッピング情報生成装置、同期再生システム、時刻マッピング情報生成方法及び時刻マッピング情報生成プログラム
JP6684433B2 (ja) 送信装置、送信方法、並びに、プログラム
US10531136B2 (en) Data processing device, data processing method, and program
JP5433245B2 (ja) データ制御装置、データ制御システム、制御方法及びプログラム
KR101014575B1 (ko) 디지털 방송 수신장치 및 수신방법
JP2021005880A (ja) 受信装置、および通信システム
JP2008016905A (ja) コンテンツ送信装置、コンテンツ受信装置及びコンテンツ配信方法
JP2017112453A (ja) 多重化装置および多重化方法
JP2005223452A (ja) デジタル放送送信装置、デジタル放送受信装置、その方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120809

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130930

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131001

R150 Certificate of patent or registration of utility model

Ref document number: 5383520

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees