JP2003204492A - 映像音声同期装置 - Google Patents
映像音声同期装置Info
- Publication number
- JP2003204492A JP2003204492A JP2002314551A JP2002314551A JP2003204492A JP 2003204492 A JP2003204492 A JP 2003204492A JP 2002314551 A JP2002314551 A JP 2002314551A JP 2002314551 A JP2002314551 A JP 2002314551A JP 2003204492 A JP2003204492 A JP 2003204492A
- Authority
- JP
- Japan
- Prior art keywords
- data
- video
- audio
- synchronization
- resynchronization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Television Receiver Circuits (AREA)
- Television Systems (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
る。 【解決手段】 映像音声再生装置は、IPネットワーク
等を介して伝送される映像と音声の再同期に関する動作
制御を行う再同期制御部20を備え、映像遅延制御部2
1と音声遅延制御部22とによってそれぞれ映像データ
と音声データの遅延時間を制御して再同期を行う。この
とき再同期制御部20において、音声データの音声レベ
ル、映像データの符号化映像種類、データ伝送状態、ユ
ーザ操作などによって再同期のタイミングを判定すると
ともに、音声データの到着時間のゆらぎ、データ伝送状
態、映像データや音声データの内容、ユーザ操作などに
よって再同期を映像優先モードと音声優先モードのいず
れで行うか優先度を判定し、この再同期のタイミングで
所定の再同期アルゴリズムを実行して同期用の遅延量を
決定し、映像遅延制御部21及び音声遅延制御部22を
制御する。
Description
タイミングを同期させる映像音声同期装置に関する。
ジタル化した映像や音声の再生を行う映像音声再生装置
が用いられるようになった。例えば、ローカルエリアネ
ットワーク(LAN)やインターネット等のネットワー
クによって動画像データを伝送する動画配信システム
や、ネットワークを介して伝送される動画像データを再
生する動画再生装置などが実用化されている。
IP(Internet Protocol )によるデータ通信を行うI
Pネットワーク等において、パケット化された映像や音
声のデータを伝送する際に、データ伝送時間のずれ等に
よって映像と音声の再生タイミングがずれることがあ
り、このような場合に対応して映像と音声の同期を行う
ようにしている。映像と音声の同期を行うには、受信し
た映像や音声のデータに付加された時刻情報に基づいて
受信時刻のずれを検出するずれ検出手段と、映像と音声
の再生タイミングを一致させるための信号遅延を行う遅
延手段とを用いて、映像と音声の少なくとも一方を遅延
させてタイミングを調整し、同期をとるのが一般的であ
る。
すような手順が従来用いられている。(1)データパケ
ットの受信開始時に、ずれ検出手段により映像パケット
と音声パケットの受信時間差を求めて遅延量を決定す
る。(2)決定した遅延量を遅延手段に設定して、以後
受信したデータを遅延させながら再生を行うことで同期
をとる。(3)毎パケットごとあるいは一定間隔で遅延
量を再確認し、再同期を行う。
許文献1)には、映像成分と音声成分のそれぞれのタイ
ミング・リファレンス信号(PTS)を用い、このPT
Sの差に応じて映像と音声の同期を行う技術が開示され
ている。また、特開平9−214936号公報(特許文
献2)には、動画像データの復号処理がシステムの状況
に応じて遅延する場合、設定した処理遅延許容値までの
遅延を許容し、この処理遅延許容値を超えて増加した場
合は受信した未処理の動画像データをクリアしてリフレ
ッシュ処理データを要求し、リフレッシュ処理データを
処理することで再同期を行う技術が開示されている。
られていても、再生中にデータパケットの受信タイミン
グにゆらぎが生じることなどによって同期がずれること
があり、上記同期手順の(3)に述べたように所定間隔
ごとなどで再同期を行う必要がある。しかし、従来の同
期方法では、再同期のタイミングに対する工夫がなされ
ておらず、再同期を行う際に再生信号に不連続が生じて
映像や音声が途切れたりなど、映像や音声の乱れが生じ
ることがあり、このときに視聴者が不自然に感じること
があった。
で、その目的は、再同期時の映像や音声の乱れを軽減す
ることが可能な映像音声同期装置を提供することにあ
る。また、本発明は、復号部の特性に応じて同期用の遅
延基準値を可変設定することが可能な映像音声同期装置
を提供することにある。
ット化されて伝送される映像データと音声データの少な
くとも一方を含む複数のコンテンツデータを再生する際
の同期を行う映像音声同期装置であって、前記複数のコ
ンテンツデータの再同期を行うタイミングであるかを判
定する再同期判定手段と、前記判定された再同期のタイ
ミングで同期用の遅延量を決定する同期制御手段と、前
記遅延量に基づいて前記複数のコンテンツデータの少な
くとも一つを遅延するデータ遅延手段と、を備えたこと
を特徴とする。
析を行うデータ解析手段を備え、前記再同期判定手段
は、前記データ解析手段による解析結果に基づき、前記
コンテンツデータの一つが音声データであり、その音声
レベルが所定値以下で連続する場合及び音声でない音が
連続する場合の少なくともいずれか一方の場合に、再同
期のタイミングであると判定することを特徴とする。
析を行うデータ解析手段を備え、前記再同期判定手段
は、前記データ解析手段による解析結果に基づき、前記
コンテンツデータの一つが映像データであり、それがフ
レーム内符号化映像のデータである場合及び前フレーム
との差分が所定値以下である場合の少なくともいずれか
一方の場合に、再同期のタイミングであると判定するこ
とを特徴とする。
送状態を検出するデータ伝送状態検出手段を備え、前記
再同期判定手段は、前記データ伝送状態検出手段による
検出結果に基づき、前記コンテンツデータの伝送状態と
してパケットロス、パケットの非順序到着、パケットの
到着間隔が所定値以上のいずれかを含む伝送異常が生じ
た場合に、再同期のタイミングであると判定することを
特徴とする。
ザ操作検出手段を備え、前記再同期判定手段は、前記ユ
ーザ操作検出手段による検出結果に基づき、ユーザ操作
として再生される映像または音声に関する操作がなされ
たときに、再同期のタイミングであると判定することを
特徴とする。
ちのいずれを優先して同期を行うかを判定する優先度判
定手段を備えたことを特徴とする。
析を行うデータ解析手段を備え、前記優先度判定手段
は、前記データ解析手段による解析結果に基づき、前記
複数のコンテンツデータが音声データと映像データとの
組み合わせであり、前記音声データの到着時間のゆらぎ
がその音声データのパケット長よりも小さい場合に、前
記映像データを優先して同期を行うよう判定することを
特徴とする。
析を行うデータ解析手段を備え、前記優先度判定手段
は、前記データ解析手段による解析結果に基づき、前記
複数のコンテンツデータが音声データと映像データとの
組み合わせであり、前記音声データの到着時間のゆらぎ
がその音声データのパケット長よりも大きい場合に、前
記音声データを優先して同期を行うよう判定することを
特徴とする。
析を行うデータ解析手段を備え、前記優先度判定手段
は、前記データ解析手段による解析結果に基づき、前記
コンテンツデータの内容によって再同期時のデータの優
先度を判定することを特徴とする。
伝送状態を検出するデータ伝送状態検出手段を備え、前
記優先度判定手段は、前記データ伝送状態検出手段によ
る検出結果に基づき、前記コンテンツデータのパケット
の伝送状態に応じて再同期時のデータの優先度を判定す
ることを特徴とする。
ーザ操作検出手段を備え、前記優先度判定手段は、前記
ユーザ操作検出手段による検出結果に基づき、映像また
は音声に関するユーザ操作に応じて再同期時のデータの
優先度を判定することを特徴とする。
時に再同期に適当な所定のタイミングで再同期情報が付
加されるものであり、前記再同期判定手段は、前記再同
期情報によって再同期のタイミングを判定することを特
徴とする。
る復号手段の前段において測定用データを生成して前記
コンテンツデータに挿入する測定信号生成手段と、前記
復号手段の後段において前記測定用データを取り出して
前記同期制御手段に送る測定信号検出手段とを備え、前
記同期制御手段は、前記測定用データに基づいて同期用
の遅延基準値を決定することを特徴とする。
測定用データにおいてデータ識別子と測定開始時間とを
設定するものであり、前記測定信号検出手段は、前記デ
ータ識別子により測定用データを検出するものであり、
前記測定信号検出手段により取り出された復号処理後の
測定用データに測定終了時間を設定する測定データ設定
手段を備え、前記同期制御手段は、前記測定用データの
測定開始時間と測定終了時間とに基づいて復号処理時間
を得て前記同期用の遅延基準値を決定することを特徴と
する。
像データの符号化映像種類、データ伝送状態、ユーザ操
作などによって複数のコンテンツデータの再同期を行う
タイミングであるかを判定し、この再同期のタイミング
で同期用の遅延量を決定して、この遅延量に基づいて複
数のコンテンツデータの少なくとも一つを遅延すること
により、再同期を行う。またこのとき、音声データの到
着時間のゆらぎ、データ伝送状態、コンテンツデータの
内容、ユーザ操作などによって再同期をいずれのデータ
を優先して行うか優先度を判定する。あるいは、コンテ
ンツデータの伝送時に再同期に適当な所定のタイミング
でコンテンツデータに再同期情報が付加されるように
し、この再同期情報によって再同期のタイミングを判定
する。これにより、再同期を行う際に映像データの乱
れ、音声データの途切れなどのコンテンツデータの乱れ
が目立たないように軽減される。
において測定用データを生成してコンテンツデータに挿
入し、復号手段の後段においてコンテンツデータから測
定用データを取り出して同期制御手段に送り、同期制御
手段において、前記測定用データに基づいて復号処理時
間を得て同期用の遅延基準値を決定する。これにより、
復号部の方式や特性等を変更しても復号部の特性に応じ
て同期用の遅延基準値を可変設定することが可能とな
る。
施の形態を説明する。図1は本発明の第1実施形態に係
る映像音声同期装置を含む映像音声再生装置の構成を示
すブロック図である。本実施形態では、IPネットワー
ク等の通信回線を介して伝送されるパケット化された映
像及び音声のコンテンツデータを受信して再生を行う映
像音声再生装置における映像音声同期装置の構成例を示
してその動作を詳細に説明する。
ータとしての映像データ(映像パケット)を受信する映
像受信部11、第2のコンテンツデータとしての音声デ
ータ(音声パケット)を受信する音声受信部12、再生
時の映像と音声の同期を行う映像音声同期部13、映像
データの復号を行う映像復号部15、音声データの復号
を行う音声復号部16、復号した映像信号の表示を行う
映像表示部17、復号した音声信号の再生を行う音声再
生部18を備えて構成される。
たは複数のメディアデータ(音声データや映像データ)
を含むものである。複数のメディアデータからなるコン
テンツデータとは、例えば多重化された音声映像ストリ
ームや、音声・映像・静止画・テキストなどからなるマ
ルチメディア情報ストリームなどを示す。
作制御を行う再同期制御部20、映像データの遅延時間
を制御する映像遅延制御部(データ遅延手段)21、音
声データの遅延時間を制御する音声遅延制御部(データ
遅延手段)22を備えて構成される。
受信部12でそれぞれ受信した映像データと音声データ
に対して、映像音声同期部13において、再同期制御部
20の制御の元で映像遅延制御部21及び音声遅延制御
部22でそれぞれ遅延させて映像復号部15及び音声復
号部16への投入タイミングを調整することによって、
映像と音声の同期が行われる。ここで、再同期のときの
映像や音声の乱れを軽減するために、以下に示す4つの
いずれかのタイミングで再同期を実行するようにする。
定値以下が連続する場合、及び環境音などの音声でない
音が連続する場合に、再同期を行う。 (B)入力映像パケットがフレーム内符号化映像(Iフ
レーム映像)の場合、及び前フレームとの差分が小さい
場合に、再同期を行う。 (C)伝送状態(パケットロス、パケットの非順序到
着、パケットの到着間隔など)に合わせて再同期を行
う。 (D)ユーザ操作(ボリュームを下げる、映像表示中ウ
ィンドウの拡大など)に合わせて再同期を行う。
とによって、映像データや音声データに不連続が生じて
も再生出力される映像や音声の乱れを目立たなくするこ
とが可能である。例えば、音声の出力レベルが小さい場
合は、多少の途切れがあったりデータ補間の伸長処理等
を行っても目立たないため、映像及び音声の乱れを低減
して再同期を実行できる。また、フレーム内符号化映像
などの画質の良いフレーム映像において同期ずれが大き
いと、ユーザにとって違和感が大きくなってしまい、ま
たフレーム内符号化映像では以前のフレーム映像とは相
関性が低いので、このようなフレーム映像のタイミング
で映像及び音声の乱れが目立たないように再同期を実行
できる。さらに、フレーム間符号化映像であっても前フ
レームとの差分が小さければ、その入力映像パケットを
破棄しても映像の乱れが小さいため、このタイミングで
映像の乱れが目立たないように再同期を実行可能であ
る。また、パケットロスなどのデータ伝送時の不具合が
生じたり、ユーザ操作がなされた場合は、もともと出力
される映像及び音声に乱れが生じるため、この乱れが目
立たない間に再同期を実行できる。
詳細構成を示すブロック図である。この図2の例は、上
記(A)または(B)に示した再同期タイミングで再同
期を行う構成を示したものである。
同期判定部(再同期判定手段)31、優先度判定部(優
先度判定手段)32、同期制御部(同期制御手段)3
3、映像パケット解析部(データ解析手段)34、音声
パケット解析部(データ解析手段)35を有して構成さ
れる。再同期判定部31は、再同期のタイミングになっ
たかどうかを判定するものである。優先度判定部32
は、映像あるいは音声のどちらを優先して同期を行うか
を判定し決定するものである。同期制御部33は、映像
及び音声の再同期アルゴリズムを実行し、映像及び音声
の遅延量を決定するものである。
1で受信した映像パケットがフレーム内符号化映像(I
フレーム映像)であるかどうかを解析するものである。
音声パケット解析部35は、音声受信部12で受信した
音声パケットの音声レベルを判定する。
部34及び音声パケット解析部35での解析結果に基づ
き、再同期判定部31において再同期を行うタイミング
かどうかを判定するとともに、優先度判定部32におい
て再同期を行う場合に映像優先モードと音声優先モード
のどちらで同期を実行するかを決定する。ここでは、受
信した音声パケットの音声レベルが所定値以下の状態が
連続する場合と、受信した映像パケットがフレーム内符
号化映像である場合に再同期を行う。例えば、前記所定
値として、音声レベルが(静かな部屋の騒音レベルの目
安である)50dBを下回った場合、再同期を行う。な
お、所定値は上記値に限定されるものではなく、システ
ム構成や使用環境等に応じて適切な任意の値を用いれば
よい。
ムとの差分が所定値以下の場合に再同期を行うようにし
てもよい。この場合、例えば、映像符号化処理の単位と
なるマクロブロックごとに設定され、そのマクロブロッ
クがそのフレームに符号化情報を含んでいないことを示
すnot_codedフラグを利用することで、前フレームとの
差分の評価を行うことができる。本例では、解像度35
2×240ピクセルの画像を構成する330個のマクロ
ブロックのうち、70%にあたる231個以上のマクロ
ブロックにおいてnot_codedフラグが設定されていた場
合、前フレームとの差分が所定値以下であるものとし
て、再同期を行う。なお、所定値は上記値に限定される
ものではなく、システム構成やデータフォーマット等に
応じて適切な任意の値を用いればよい。
の到着時間のゆらぎが音声パケット長よりも小さい場合
は、音声データの伸長処理による音声の乱れが小さいの
で、映像優先モードで再同期を行う。映像優先モードで
は、映像復号部15への映像データの投入タイミングを
基準として、音声データを音声復号部16へ送出する。
ここで、再同期時の遅延した音声データの投入タイミン
グが遅くなり、そのままでは音声の途切れが発生する場
合には、途切れを無くすために音声データの伸長処理を
行う。
の到着時間のゆらぎが、音声パケット長よりも大きい場
合は、音声データの伸長処理による音声の乱れが大きく
なるため、音声優先モードで再同期を行う。音声優先モ
ードでは、音声復号部16への音声データの投入タイミ
ングを基準として、映像データを映像復号部15へ送出
する。この場合、音声の途切れが発生しないように、音
声データの投入タイミングを早めるようにする。また、
映像パケットの受信タイミングが音声に対して1フレー
ム分以上遅れた場合には、映像表示部17に対し映像の
表示を行わないように指示する。これにより、音声とず
れた映像の表示を防止し、映像の乱れを防ぐようにして
いる。
の例以外に、音声データや映像データの内容によって、
例えば音声レベルが小さいときは映像を優先したり、映
像がIフレーム映像のときは映像を優先したりしてもよ
い。
詳しく説明する。図3は映像データと音声データの各部
での入出力タイミングを示すタイムチャートである。通
常、映像データと音声データの受信タイミングは、ネッ
トワーク等の通信回線での伝送遅延差があるため、音声
受信部12での音声パケットの受信タイミングに対して
映像受信部11での映像パケットの受信タイミングの方
が遅れる。この伝送遅延差と、音声復号部16と映像復
号部15での復号処理時間差とを考慮して、これらの時
間差を加えたものを音声遅延時間とし、音声データの音
声復号部16への投入タイミングを遅延させるようにす
る。これにより、音声再生部18と映像表示部17での
出力内容のタイミングが一致し、映像と音声の同期をと
ることができる。
の映像データ及び音声データの各部での入出力タイミン
グを示すタイムチャートである。なお、以降では音声
n,n+1,n+2のデータと映像mのデータとを対応
させて再同期する場合を例示する。映像優先モードの場
合は、映像復号部15への映像データの投入タイミング
を基準として音声データの投入タイミングを合わせて音
声復号部16へ送出する。
部17での出力タイミングを一致させて同期をとるため
の音声遅延時間(遅延基準値)に対して、音声復号部1
6への音声データの投入開始タイミングが早く、音声デ
ータの時間ゆらぎTdaが生じている場合を示してい
る。この場合、映像データにタイミングを合わせて音声
データを遅延させると、音声が途切れてしまうため、こ
れを回避するために音声n′のように音声データを補間
する伸長処理を行って音声復号部16へ投入する。例え
ば、図4のように音声データの時間ゆらぎTdaの値が
音声1フレームを下回る場合であって、通常音声フレー
ムを20msec、ゆらぎTdaの値を10msecと
した場合、音声データ補間処理によって音声データn′
を30msec分のデータに伸長する。なお、上記例示
した値に限定されるものではなく、システム構成やデー
タフォーマット等に応じて適切な任意の値を用いればよ
い。このような動作処理により、映像の出力タイミング
に合わせて音声の再同期を行い、この再同期時の音声の
乱れを防止することが可能となる。
で映像データの時間ゆらぎが小さい場合の映像データ及
び音声データの各部での入出力タイミングを示すタイム
チャートである。音声優先モードの場合は、音声復号部
16への音声データの投入タイミングを基準として映像
データの投入タイミングを合わせて映像復号部15へ送
出する。
部17での出力タイミングを一致させるための音声遅延
時間及び映像遅延時間に対して、映像復号部15への映
像データの投入開始タイミングが遅く、映像データの時
間ゆらぎTdvが生じている場合を示している。この場
合、音声データに対して映像データを同期させるため
に、映像表示部17における映像データの出力時間、す
なわち映像の表示時間を短くする。例えば、図5のよう
に映像データの時間ゆらぎTdvの値が音声1フレーム
を下回る場合であって、通常音声フレームを20mse
c、ゆらぎTdvの値を10msecとした場合、映像
データの投入タイミングをゆらぎTdvの値10mse
cだけ遅らせて再同期をとる。この場合、映像及び音声
の乱れを防止するために、映像表示部17における映像
データmの出力時間をゆらぎTdvの値10msecだ
け短くする。なお、上記例示した値に限定されるもので
はなく、システム構成やデータフォーマット等に応じて
適切な任意の値を用いればよい。このような動作処理に
より、映像及び音声の乱れを防止しつつ、音声の出力タ
イミングに合わせて映像の再同期を行うことが可能とな
る。
で映像データの時間ゆらぎが大きい場合の映像データ及
び音声データの各部での入出力タイミングを示すタイム
チャートである。図6の例では、音声再生部18と映像
表示部17での出力タイミングを一致させるための音声
遅延時間及び映像遅延時間に対して、映像復号部15へ
の映像データの投入開始タイミングが音声に対して1フ
レーム分以上遅れ、映像データの時間ゆらぎTdvが大
きい場合を示している。この場合、映像mに対応する音
声n,n+1,n+2のデータはすでに出力された後で
あり、音声n+3は次の映像m+1に対応する音声であ
るので、映像表示部17において間に合っていない映像
mのデータを非表示とする。例えば、図6のように映像
データの時間ゆらぎTdvの値が音声1フレームを上回
る場合であって、通常音声フレームを20msec、ゆ
らぎTdvの値を60msecとした場合、映像表示部
17において大きく遅延した映像データmの再生を行わ
ないようにする。なお、上記例示した値に限定されるも
のではなく、システム構成やデータフォーマット等に応
じて適切な任意の値を用いればよい。
レーム内符号化映像(Iフレーム映像)は多少遅れて表
示しない場合でも映像データを廃棄しないようにする。
一方、フレーム間符号化映像(Pフレーム映像)は非表
示の場合は映像データを廃棄する。Iフレーム映像を廃
棄すると、後続のPフレーム映像における復号化時の情
報に矛盾が生じ、画質が低下するため、Iフレーム映像
については復号化等で使用可能なように保持しておく。
このような動作処理により、再同期時に遅れて音声に間
に合わなかった映像を表示しないようにして映像と音声
の乱れを防止することが可能となる。
詳細構成を示すブロック図である。この図7の例は、上
記(C)に示した再同期タイミングで再同期を行う構成
を示したものである。
同期判定部36、優先度判定部37、同期制御部33、
映像パケット伝送状態計測部(データ伝送状態検出手
段)38、音声パケット伝送状態計測部(データ伝送状
態検出手段)39を有して構成される。映像パケット伝
送状態計測部38は、映像受信部11で受信した映像パ
ケットの受信状態を計測するものである。音声パケット
伝送状態計測部39は、音声受信部12で受信した音声
パケットの受信状態を計測するものである。
計測部38及び音声パケット伝送状態計測部39でのパ
ケット伝送状態の計測結果に基づき、再同期判定部36
において再同期を行うタイミングかどうかを判定すると
ともに、優先度判定部37において再同期を行う場合に
映像優先モードと音声優先モードのどちらで同期を実行
するかを決定する。ここでは、映像パケットや音声パケ
ットの伝送時にパケットロスが生じたり、パケットの到
着順序が入れ替わったり、パケットの到着間隔が所定値
以上となった場合など、パケットの伝送異常が生じた伝
送状態のときに再同期を行う。例えば、前記所定値とし
て、音声フレームの長さが20msecの場合、その5
0%である10msecを所定値とし、音声パケットの
到着間隔が所定値10msecを上回った場合、再同期
を行う。なお、所定値は上記値に限定されるものではな
く、システム構成やデータフォーマット等に応じて適切
な任意の値を用いればよい。
パケットと音声パケットの受信タイミング等に応じて、
あるいは映像パケットと音声パケットとで伝送状態が正
常な方を優先して同期をとる。再同期の動作については
前述した第1実施形態と同様の手順によって実行するこ
とができる。
に映像または音声が乱れることになるので、このような
伝送状態のタイミングに合わせて再同期を行うことによ
り、再同期時の映像や音声の乱れを目立たなくすること
が可能となる。
置を含む映像音声再生装置の構成を示すブロック図、図
9は第3実施形態に係る再同期制御部の詳細構成を示す
ブロック図である。この図8及び図9の例は、上記
(D)に示した再同期タイミングで再同期を行う構成を
示したものである。
ザの操作を検出するユーザ操作検出部(ユーザ操作検出
手段)42を備えており、映像音声同期部41はこのユ
ーザ操作検出部42の検出結果を含めて映像と音声の同
期を行うようになっている。映像音声同期部41の再同
期制御部20cは、再同期判定部43、優先度判定部4
4、同期制御部33を有して構成される。
でのユーザ操作の検出結果に基づき、再同期判定部43
において再同期を行うタイミングかどうかを判定すると
ともに、優先度判定部44において再同期を行う場合に
映像優先モードと音声優先モードのどちらで同期を実行
するかを決定する。ここでは、ユーザがボリュームを下
げる、映像表示中ウィンドウの拡大などの再生される映
像または音声に関する操作を行ったときに再同期を行
う。なおこのとき、第1実施形態と同様に映像パケット
と音声パケットの受信タイミングに応じて、あるいは映
像と音声とでユーザ操作対象でない方を優先して同期を
とる。再同期の動作については前述した第1実施形態と
同様の手順によって実行することができる。
映像または音声に関する操作がなされたときに、ユーザ
操作に応じて音声や映像が変化するのに合わせて再同期
を行うことにより、再同期時の映像や音声の乱れを目立
たなくすることが可能となる。
データのパケットフォーマットの構成を示す説明図であ
る。
上などを伝送される映像データや音声データのパケット
フォーマットは、一般に、パケット生成時間51などの
ヘッダ情報を有するヘッダ部の後ろに、実際の映像や音
声のデータ52が設けられる構造となっている。第4実
施形態では、図10(B)に示すように、ヘッダ部のパ
ケット生成時間51の後ろなどに再同期情報53を付加
して設け、この再同期情報53によって再同期のタイミ
ングを制御する。
期情報を付加し、受信側装置で再同期情報の内容及びタ
イミングに合わせて映像と音声の再同期を行う。例え
ば、送信側装置では音声データの音声レベルが所定値以
下となると再同期情報を付加する。この再同期情報は、
再同期を行う場合は「1」、再同期を行わない場合は
「0」などのフラグを用いても良いし、再同期の優先度
付けを行って優先度を数値等で表したものを用いること
もできる。なお、映像データについても同様に再同期情
報を付加して再同期の制御に用いることも可能である。
ミングで音声データや映像データに再同期情報を付加し
て再同期を制御することにより、再同期時の映像や音声
の乱れを軽減することができる。またこの場合、受信側
の装置で音声データ及び映像データの解析等を行う必要
がなく、再同期制御に関する構成を簡略化することがで
きる。
音声同期装置を含む映像音声再生装置の構成を示すブロ
ック図、図12は第5実施形態に係る映像及び音声デー
タと測定用データのデータフォーマットの構成を示す説
明図である。
の第1実施形態の構成に加えて、映像音声同期部60の
映像復号部15及び音声復号部16の前段にそれぞれ測
定信号生成部(測定信号生成手段)61,62を備え、
映像復号部15及び音声復号部16の後段にそれぞれ測
定信号検出部(測定信号検出手段)63,64と測定デ
ータ設定部(測定データ設定手段)65,66を備えて
構成される。
間を設定した測定用データを生成し、映像データ及び音
声データにそれぞれ挿入するものである。測定信号検出
部63,64は、映像復号部15及び音声復号部16の
出力からそれぞれ測定用データを検出して取り出すもの
である。測定データ設定部65,66は、取り出された
測定用データに測定終了時間を設定し、再同期制御部2
0にフィードバックするものである。
ぞれ受信される映像データ及び音声データのデータフォ
ーマットは、図12(A)に示すように、「0」のデー
タ識別子70を有するヘッダ部の後ろに、実際の映像や
音声のデータ72が設けられる構造となっている。ま
た、測定用データは、図12(B)に示すように、
「1」のデータ識別子71を有するヘッダ部の後ろに、
測定開始時間73と測定終了時間74とが付加された構
造となっている。この測定開始時間73と測定終了時間
74とによって映像復号部15と音声復号部16のそれ
ぞれにおける実際の復号処理時間を得ることができる。
開始時間を設定して付加した測定用データが生成され、
映像データ及び音声データにそれぞれ挿入される。これ
らのデータは映像復号部15及び音声復号部16でそれ
ぞれ復号された後、測定信号検出部63,64でそれぞ
れ測定用データが検出されて取り出される。取り出され
た測定用データはそれぞれ測定データ設定部65,66
において測定終了時間が設定されて付加され、再同期制
御部20に送られる。再同期制御部20は、測定用デー
タに含まれる測定開始時間と測定終了時間とから、映像
復号部15と音声復号部16のそれぞれにおける復号処
理時間を求め、これらの復号処理時間差に基づいて遅延
基準値を決定して映像遅延制御部21及び音声遅延制御
部22を制御することによって再同期を行う。
復号部16における特性や復号方式が変更されたとき、
あるいは新たな復号部が追加されたときに、測定用デー
タを用いてその復号部の復号処理時間を測定し、音声遅
延時間(遅延基準値)を設定して再同期を行う。これに
より、映像復号部または音声復号部を切り替えた場合で
も、復号部の特性に応じて同期用の遅延基準値を可変設
定して再同期を行うことが可能となる。
を同期させる場合の構成を例示したが、映像と音声の組
み合わせだけでなく、映像と映像の組み合わせや音声と
音声の組み合わせなど、各種コンテンツデータの組み合
わせにおいても同様な構成を用いることができ、適切な
タイミングで支障なく再生データの再同期を実行でき
る。
同期時の映像や音声の乱れを軽減することが可能な映像
音声同期装置を提供できる。また、復号部の特性に応じ
て同期用の遅延基準値を可変設定することが可能な映像
音声同期装置を提供できる。
を含む映像音声再生装置の構成を示すブロック図であ
る。
示すブロック図である。
ミングを示すタイムチャートである。
タ及び音声データの各部での入出力タイミングを示すタ
イムチャートである。
タの時間ゆらぎが小さい場合の映像データ及び音声デー
タの各部での入出力タイミングを示すタイムチャートで
ある。
タの時間ゆらぎが大きい場合の映像データ及び音声デー
タの各部での入出力タイミングを示すタイムチャートで
ある。
示すブロック図である。
像音声再生装置の構成を示すブロック図である。
示すブロック図である。
ケットフォーマットの構成を示す説明図である。
置を含む映像音声再生装置の構成を示すブロック図であ
る。
定用データのデータフォーマットの構成を示す説明図で
ある。
Claims (14)
- 【請求項1】 パケット化されて伝送される映像データ
と音声データの少なくとも一方を含む複数のコンテンツ
データを再生する際の同期を行う映像音声同期装置であ
って、 前記複数のコンテンツデータの再同期を行うタイミング
であるかを判定する再同期判定手段と、 前記判定された再同期のタイミングで同期用の遅延量を
決定する同期制御手段と、 前記遅延量に基づいて前記複数のコンテンツデータの少
なくとも一つを遅延するデータ遅延手段と、 を備えたことを特徴とする映像音声同期装置。 - 【請求項2】 前記複数のコンテンツデータの解析を行
うデータ解析手段を備え、 前記再同期判定手段は、前記データ解析手段による解析
結果に基づき、前記コンテンツデータの一つが音声デー
タであり、その音声レベルが所定値以下で連続する場合
及び音声でない音が連続する場合の少なくともいずれか
一方の場合に、再同期のタイミングであると判定するこ
とを特徴とする請求項1に記載の映像音声同期装置。 - 【請求項3】 前記複数のコンテンツデータの解析を行
うデータ解析手段を備え、 前記再同期判定手段は、前記データ解析手段による解析
結果に基づき、前記コンテンツデータの一つが映像デー
タであり、それがフレーム内符号化映像のデータである
場合及び前フレームとの差分が所定値以下である場合の
少なくともいずれか一方の場合に、再同期のタイミング
であると判定することを特徴とする請求項1に記載の映
像音声同期装置。 - 【請求項4】 前記複数のコンテンツデータの伝送状態
を検出するデータ伝送状態検出手段を備え、 前記再同期判定手段は、前記データ伝送状態検出手段に
よる検出結果に基づき、前記コンテンツデータの伝送状
態としてパケットロス、パケットの非順序到着、パケッ
トの到着間隔が所定値以上のいずれかを含む伝送異常が
生じた場合に、再同期のタイミングであると判定するこ
とを特徴とする請求項1に記載の映像音声同期装置。 - 【請求項5】 ユーザによる操作を検出するユーザ操作
検出手段を備え、 前記再同期判定手段は、前記ユーザ操作検出手段による
検出結果に基づき、ユーザ操作として再生される映像ま
たは音声に関する操作がなされたときに、再同期のタイ
ミングであると判定することを特徴とする請求項1に記
載の映像音声同期装置。 - 【請求項6】 前記複数のコンテンツデータのうちのい
ずれを優先して同期を行うかを判定する優先度判定手段
を備えたことを特徴とする請求項1に記載の映像音声同
期装置。 - 【請求項7】 前記複数のコンテンツデータの解析を行
うデータ解析手段を備え、 前記優先度判定手段は、前記データ解析手段による解析
結果に基づき、前記複数のコンテンツデータが音声デー
タと映像データとの組み合わせであり、前記音声データ
の到着時間のゆらぎがその音声データのパケット長より
も小さい場合に、前記映像データを優先して同期を行う
よう判定することを特徴とする請求項6に記載の映像音
声同期装置。 - 【請求項8】 前記複数のコンテンツデータの解析を行
うデータ解析手段を備え、 前記優先度判定手段は、前記データ解析手段による解析
結果に基づき、前記複数のコンテンツデータが音声デー
タと映像データとの組み合わせであり、前記音声データ
の到着時間のゆらぎがその音声データのパケット長より
も大きい場合に、前記音声データを優先して同期を行う
よう判定することを特徴とする請求項6に記載の映像音
声同期装置。 - 【請求項9】 前記複数のコンテンツデータの解析を行
うデータ解析手段を備え、 前記優先度判定手段は、前記データ解析手段による解析
結果に基づき、前記コンテンツデータの内容によって再
同期時のデータの優先度を判定することを特徴とする請
求項6に記載の映像音声同期装置。 - 【請求項10】 前記複数のコンテンツデータの伝送状
態を検出するデータ伝送状態検出手段を備え、 前記優先度判定手段は、前記データ伝送状態検出手段に
よる検出結果に基づき、前記コンテンツデータのパケッ
トの伝送状態に応じて再同期時のデータの優先度を判定
することを特徴とする請求項6に記載の映像音声同期装
置。 - 【請求項11】 ユーザによる操作を検出するユーザ操
作検出手段を備え、 前記優先度判定手段は、前記ユーザ操作検出手段による
検出結果に基づき、映像または音声に関するユーザ操作
に応じて再同期時のデータの優先度を判定することを特
徴とする請求項6に記載の映像音声同期装置。 - 【請求項12】 前記コンテンツデータは、伝送時に再
同期に適当な所定のタイミングで再同期情報が付加され
るものであり、 前記再同期判定手段は、前記再同期情報によって再同期
のタイミングを判定することを特徴とする請求項1に記
載の映像音声同期装置。 - 【請求項13】 前記コンテンツデータを復号する復号
手段の前段において測定用データを生成して前記コンテ
ンツデータに挿入する測定信号生成手段と、 前記復号手段の後段において前記測定用データを取り出
して前記同期制御手段に送る測定信号検出手段とを備
え、 前記同期制御手段は、前記測定用データに基づいて同期
用の遅延基準値を決定することを特徴とする請求項1に
記載の映像音声同期装置。 - 【請求項14】 前記測定信号生成手段は、前記測定用
データにおいてデータ識別子と測定開始時間とを設定す
るものであり、 前記測定信号検出手段は、前記データ識別子により測定
用データを検出するものであり、 前記測定信号検出手段により取り出された復号処理後の
測定用データに測定終了時間を設定する測定データ設定
手段を備え、 前記同期制御手段は、前記測定用データの測定開始時間
と測定終了時間とに基づいて復号処理時間を得て前記同
期用の遅延基準値を決定することを特徴とする請求項1
3に記載の映像音声同期装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002314551A JP4298262B2 (ja) | 2001-10-29 | 2002-10-29 | 映像音声同期装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001330803 | 2001-10-29 | ||
JP2001-330803 | 2001-10-29 | ||
JP2002314551A JP4298262B2 (ja) | 2001-10-29 | 2002-10-29 | 映像音声同期装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003204492A true JP2003204492A (ja) | 2003-07-18 |
JP4298262B2 JP4298262B2 (ja) | 2009-07-15 |
Family
ID=27666597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002314551A Expired - Fee Related JP4298262B2 (ja) | 2001-10-29 | 2002-10-29 | 映像音声同期装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4298262B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006006230A1 (ja) * | 2004-07-12 | 2006-01-19 | Mitsubishi Denki Kabushiki Kaisha | パケット転送方法、無線アクセス局、基地局制御装置、および無線基地局 |
JP2009147620A (ja) * | 2007-12-13 | 2009-07-02 | Anritsu Corp | フレーム遅延発生装置 |
US8107538B2 (en) | 2005-08-19 | 2012-01-31 | Nec Viewtechnology, Ltd. | Moving image distribution system and moving image distribution server |
JP5517381B1 (ja) * | 2013-09-30 | 2014-06-11 | レゾネッツ合同会社 | 揺らぎ吸収装置、通信装置、及び制御プログラム |
KR20150098563A (ko) | 2014-02-20 | 2015-08-28 | 후지쯔 가부시끼가이샤 | 동화상 음성 동기 장치, 동화상 음성 동기 방법 및 동화상 음성 동기용 컴퓨터 프로그램 |
CN113330735A (zh) * | 2018-11-06 | 2021-08-31 | 索尼集团公司 | 信息处理装置和信息处理方法 |
WO2022269788A1 (ja) * | 2021-06-23 | 2022-12-29 | 日本電信電話株式会社 | 伝送システム、送信システム、受信システム及び伝送方法 |
-
2002
- 2002-10-29 JP JP2002314551A patent/JP4298262B2/ja not_active Expired - Fee Related
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006006230A1 (ja) * | 2004-07-12 | 2006-01-19 | Mitsubishi Denki Kabushiki Kaisha | パケット転送方法、無線アクセス局、基地局制御装置、および無線基地局 |
US8107538B2 (en) | 2005-08-19 | 2012-01-31 | Nec Viewtechnology, Ltd. | Moving image distribution system and moving image distribution server |
US9049474B2 (en) | 2005-08-19 | 2015-06-02 | Nec Display Solutions, Ltd. | Moving image distribution system and moving image distribution server |
JP2009147620A (ja) * | 2007-12-13 | 2009-07-02 | Anritsu Corp | フレーム遅延発生装置 |
JP5517381B1 (ja) * | 2013-09-30 | 2014-06-11 | レゾネッツ合同会社 | 揺らぎ吸収装置、通信装置、及び制御プログラム |
US9350783B2 (en) | 2013-09-30 | 2016-05-24 | Resonetz, Llc | Fluctuation absorbing device, communication device, and control program |
KR20150098563A (ko) | 2014-02-20 | 2015-08-28 | 후지쯔 가부시끼가이샤 | 동화상 음성 동기 장치, 동화상 음성 동기 방법 및 동화상 음성 동기용 컴퓨터 프로그램 |
US9489980B2 (en) | 2014-02-20 | 2016-11-08 | Fujitsu Limited | Video/audio synchronization apparatus and video/audio synchronization method |
CN113330735A (zh) * | 2018-11-06 | 2021-08-31 | 索尼集团公司 | 信息处理装置和信息处理方法 |
WO2022269788A1 (ja) * | 2021-06-23 | 2022-12-29 | 日本電信電話株式会社 | 伝送システム、送信システム、受信システム及び伝送方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4298262B2 (ja) | 2009-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7711244B2 (en) | Video/audio synchronizing apparatus | |
JP3698376B2 (ja) | 同期再生装置 | |
JP4001091B2 (ja) | 演奏システム及び楽音映像再生装置 | |
JP5068744B2 (ja) | ネットワーク機器用の同期的音声/映像復号化方法及び装置 | |
US8111327B2 (en) | Method and apparatus for audio/video synchronization | |
JP5026167B2 (ja) | ストリーム伝送サーバおよびストリーム伝送システム | |
JP4983923B2 (ja) | デコーダ装置、およびデコード方法 | |
WO2010068151A1 (en) | Device and method for synchronizing received audio data with video data | |
JP2006128997A (ja) | 映像送信装置、映像受信装置、映像送信方法及び映像伝送システム | |
JP2003204492A (ja) | 映像音声同期装置 | |
KR20070008069A (ko) | 음성/영상신호의 동기화 장치 및 방법 | |
JP4359024B2 (ja) | 同期制御方法と装置およびそれを用いた同期再生装置およびテレビジョン受信装置 | |
JP5186094B2 (ja) | 通信端末、マルチメディア再生制御方法、およびプログラム | |
US6947447B1 (en) | Image communication apparatus, image communication method and recording medium which stores the sound and image | |
US20070248170A1 (en) | Transmitting Apparatus, Receiving Apparatus, and Reproducing Apparatus | |
JPH10271482A (ja) | 符号化映像の同期再生制御方法およびシステム | |
JP2648095B2 (ja) | 画像符号化および復号化装置 | |
JP3392153B2 (ja) | 音声・動画像同期出力調整処理方法 | |
JPH10164556A (ja) | デコーダ、エンコーダ、およびビデオ・オン・デマンドシステム | |
JP2007318283A (ja) | パケット通信システム、データ受信機器 | |
JP2005159679A (ja) | 映像音声通信システム | |
JPH09284759A (ja) | タイミング制御回路 | |
JP2007036539A (ja) | デコード方法、デコード合成制御装置及び画像合成システム | |
JP2006109228A (ja) | データ通信装置及びそれを用いたデータ通信システム | |
JP2019125994A (ja) | 映像音声再生装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050627 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060324 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20071114 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20071121 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20071128 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20071205 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20071212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080702 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080819 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090317 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090415 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120424 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130424 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130424 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140424 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |