WO2004077825A1

WO2004077825A1 - データ処理装置および方法

Info

Publication number: WO2004077825A1
Application number: PCT/JP2004/002152
Authority: WO
Inventors: Kazuo Fujimoto; Shinji Kojima
Original assignee: Matsushita Electric Industrial Co. Ltd.
Priority date: 2003-02-27
Filing date: 2004-02-24
Publication date: 2004-09-10
Also published as: EP1603336A1; EP1603336B1; CN1723703B; US20060072399A1; JPWO2004077825A1; JP4536653B2; EP1603336A4; KR20050056211A; US8290353B2; KR100711328B1; CN1723703A

Abstract

　データ処理装置は、圧縮符号化されたビデオコンテンツに関する第１データ、第１データの再生時刻を規定する第１時刻情報、ビデオコンテンツと異なるコンテンツに関する第２データおよび第２データの再生時刻を規定する第２時刻情報を有するデータストリームを受け取る受信部と、データストリームから、第１データ、第１時刻情報、第２データおよび第２時刻情報を抽出する分離部と、第１データをデコードして、第１時刻情報に基づいて出力する第１デコード部と、第２時刻情報に基づいて第２データを出力する第２デコード部とを有している。データ処理装置は、さらに、第１時刻情報および第２時刻情報が第１データおよび第２データを同期して再生する時刻を規定している場合において、再生時刻の遅延量を規定する遅延情報を保持し、かつ、遅延情報に基づいて第２時刻情報を修正し、第２データの再生時刻を遅延させる遅延設定部を備えている。

Description

明細書データ処理装置おょぴ方法技衞分野

本発明は、圧縮符号化されたオーディォデータおよびビデオデ一夕を再生する際に、オーディオとビデオとを同期して再生する装置および方法に関する。 ' 背景技術

従来、圧縮符号化されて記録されたビデオ信号およびオーディォ信号を CD— R〇M、 DVD - ROM, ハードディスク等の記録媒体から読み出し、デコード（伸張）して出力するデータ再生装置が知られている。データ再生装置が伸張されたデータをその装置に接続されたモニタ、音響スピーカ等に送ることにより、ビデオおよびオーディォの再生が実現される。

圧縮符号化に関しては、多くの規格が規定されている。例えば M P E G (Motion Picture Experts Group) は、ビデオ信号およびオーディォ信号の両方を圧縮符号化する規格として知られている < MP E G規格では、ビデオ信号が表すビデオおよびオーディオ信号が表すオーディォが同期して再生されることを保証するために、ォ —ディォ信号およびビデオ信号のそれぞれに再生されるべき時刻を表す時刻情報が付加される。これにより、伸張時にはシステム機器が有するシステム時刻基準参照値に対し、これらの時刻情報を参照してオーディォ信号とビデオ信号とを同期させて再生することができる。

以下、従来の同期方法を説明する。例えば、日本国特開平 6— 2 3 3 2 6 9号公報に記載された技術によれば、まず、再生装置はォ一ディォおよびビデオのいずれか一方が伸張処理を終了したときの時刻と、他方の伸張処理が終了したときの時刻との差分を検出する _£ そして、検出された差分値に基づいて、再生装置は圧縮データの転送タイミング、伸張回路の起動タイミングおよびビデオの表示タイミングを変更し、オーディオとビデオを同期させて、モニタ、音響スピーカ等の外部機器に出力している。

しかし、上述の再生装置は、その内部でオーディオとビデオとを同期させて外部機器に出力しているため、外部機器においてビデオおよびォ一ディォの一方に処理を加えて遅延が発生すると他方と同期して再生できないという問題が生じていた。

例えば、テレビ等の映像表示機器が外部機器であるとき、映像表示機器においてィンターレ一ス/プログレッシブ変換、 N T S C / P A L変換等の変換処理や、ユーザからの指示によるビデオの拡大 ·縮小の画像処理を行うと、処理に時間を要するためオーディォ再生がビデオ再生よりも先行してしまう。例えば、出力画面を拡大する画像処理を想定すると、元の出力画面データから補間データを作成するために演算処理が必要である。そして.. なめらかな動画を作り出すために、時間的に前後する複数の出力フレームや出力フィ一ルド単位のフィルタ演算が必要になる。また、複数の入カストリームを独立して伸張できる回路等から出力された 2以上のビデオを合成する処理を想定すると、全てのビデオを同期させるために、特定のストリームのビデオ出力を遅延させなければならない場合がある。さらに、シアターシステム等のように、ビデオ信号を一旦光信号等に変換して伝送するときにも、ビデオ信号の変換に時間を要する場合もある。

上述の 1つまたは 2つ以上の演算処理等には、数ミリ秒から数十ミリ秒の時間を要する場合がある。オーディォ再生がビデオ再生よりも一定時間（概ね 3 0ミリ秒）以上先行すると、映像中の人物の口の動きと音声とのずれが目立ち、視聴者に違和感を与える。従来の再生装置は外部機器の処理に起因するビデオおよびオーディォの再生夕イミングのずれを想定していないため、外部機器においてさらに時間を要する処理を行うとさらにビデオおよびオーディォの再生夕イミングがずれてしまう。

なお、外部機器にオーディォ再生を遅延させるバッファを設け、オーディオと画像処理後のビデオとを同期して再生することは可能である。しかし、外部機器に出力されたビデオデータおよびオーディォデータには再生タイミングを指示する時刻情報は存在しないため、外部機器において出力タイミングを独自に決定することになつてしまい妥当ではない。また、バッファを設けるという手法はバッファを持たない現存の外部機器には適用できないため根本的な解決法とはいえない。本発明は、以上のような課題を解決するためになされたもので、その目的は、外部接続機器の差、処理種別等によってビデオの遅延量が異なる場合においても、当初意図されたとおりにオーディオとビデオとを同期して再生することである。発明の闘示

本発明によるデータ処理装置は、圧縮符号化されたビデオコンテンッに関する第 1データ、前記第 1データの再生時刻を規定する第 1時刻情報、前記ビデオコンテンツと異なるコンテンツに関する第 2データおよび前記第 2デ一夕の再生時刻を規定する第 2時刻情報を有するデータス卜リームを受け取る受信部と、前記データストリームから、前記第 1データ、前記第 1時刻情報、前記第 2データおよび前記第 2時刻情報を抽出する分離部と、前記第 1データをデコ一ドして、前記第 1時刻情報に基づいて出力する第 1デコード部と、前記第 2時刻情報に基づいて前記第 2データを出力する第 2デコード部とを有している。データ処理装置は、さらに、前記第 1時刻情報および前記第 2時刻情報が前記第 1データおよび前記第 2デー夕を同期して再生する時刻を規定している場合において、再生時刻の遅延量を規定する遅延情報を保持し、かつ、前記遅延情報に基づいて前記第 2時刻情報を修正し、前記第 2データの再生時刻を遅延させる遅延設定部を備えている。

前記第 2データのコンテンツは圧縮符号化されており、前記第 2 デコード部は前記第 2データを復号し、前記第 2デコード部は復号された前記第 2デ一夕を格納する内部バッファを有していてもよい _c 前記第 2データのコンテンツは圧縮符号化されており、前記デー夕処理装置は、圧縮符号化された前記第 2デ一夕を格納するデータバッファをさらに備え、前記データバッファは、修正後の第 2時刻情報によって規定される再生時刻の前に前記圧縮符号化された前記第 ₂データを取り出し、前記第 2デコード部に出力してもよい。

前記受信部は前記データストリームを継続的に受け取り、前記デ —タバッファは前記第 2デ一夕を順次格納する。前記デ一夕バッファの容量は、修正前の第 2時刻情報によって規定される再生時刻の到達前までに受け取る前記第 2データのデ一夕量と、前記再生時刻の遅延量に応じた時間の経過までに受け取る前記第 2データのデー夕量との和以上であってもよい。

前記データ処理装置は、前記第 2データが格納された前記データバッファ内の位置を示すァドレス情報と、前記第 2データに対応する修正前の第 2時刻情報との対応関係を規定するテーブルを管理する管理部をさらに備えていてもよい。

前記管理部は、一部の前記第 2データについて前記テーブルを管理してもよい。

前記受信部は、オーディォおよび字幕の少なくとも一方に関する前記第 2データを有するデータストリームを受け取ってもよい。

前記遅延設定部はュ一ザから前記遅延量を特定する値を受け取つて、前記遅延情報として保持してもよい。

前記遅延設定部は、予め定められた値を前記遅延情報として保持してもよい。

前記遅延設定部は、再生時刻の遅延量を 3 0ミリ秒以上の値として規定した遅延情報を保持してもよい。

前記データ処理装置は、接続先の機器に前記第 1データを送出するとともに、前記機器を特定することが可能な固有情報を前記機器から受け取るトランスミッタをさらに備えている。前記トランスミッ夕は、前記固有情報に基づいて前記機器において実行される前記第 1データに関するビデオ処理の所要時間を特定し、前記遅延設定部は、特定された前記所要時間の値を前記遅延量として遅延情報を保持してもよい。

前記第 1デコード部および前記第 2デコード部は、単一のデコード回路として実装されてもよい。

本発明によるデータ処理方法は、圧縮符号化されたビデオコンテンッに関する第 1デ一夕、前記第 1データの再生時刻を規定する第 1時刻情報、前記ビデオコンテンツと異なるコンテンツに関する第 2データおよび前記第 2データの再生時刻を規定する第 2時刻情報を有するデ一夕ストリームを受け取るステップと、前記データストリームから、前記第 1データ、前記第 1時刻情報、前記第 2データおよび前記第 2時刻情報を抽出するステツプと、前記第 1データをデコードして、前記第 1時刻情報に基づいて出力するステツプとを包含している。さらにデータ処理方法は、前記第 1時刻情報および前記第 2時刻情報が前記第 1データおよび前記第 2データを同期して再生する時刻を規定している場合において、再生時刻の遅延量を規定する遅延情報を保持するステツプと、前記遅延情報に基づいて前記第 2時刻情報を修正して前記第 2デ一夕の再生時刻を遅延させるステップと、前記第 2時刻情報に基づいて前記第 2データを出力するステツプとを包含する。

前記第 2デ一夕のコンテンツは圧縮符号化されており、前記第 2 データを出力するステップは、前記第 2データを復号し、復号された前記第 2データをデータバッファに格納した後に出力してもよい。前記第 2データのコンテンツは圧縮符号化されており、前記デー夕処理方法は、圧縮符号化された前記第 2デ一夕をデ一タパッファに格納するステップと、修正後の第 2時刻情報によって規定される再生時刻の前に、格納された前記第 2データを前記データバッファから取り出すステップとをさらに包含する。前記第 2データを出力するステップは、前記データバッファから取り出された前記第 2デ一夕を出力してもよい。

前記受信するステップは、前記データストリームを継続的に受信し、前記第 2データを格納するステップは前記第 2データを前記デ一夕バッファに順次格納する。前記データバッファの容量は、修正前の第 2時刻情報によって規定される再生時刻の到達前までに受け取る前記第 2データのデータ量と、前記再生時刻の遲延量に応じた時間の経過までに受け取る前記第 2データのデ一夕量との和以上であってもよい。

前記データ処理方法は、前記第 2データが格納された前記データバッファ内の位置を示すァドレス情報と、前記第 2データに対応する修正前の第 2時刻情報との対応関係を規定するテーブルを管理するステツプをさらに包含してもよい。

前記管理するステップは一部の前記第 2データについて、前記テ一プルを管理してもよい。

前記受信するステツプは、オーディォおよび字幕の少なくとも一方に関する前記第 2データを有するデータストリ一ムを受け取ってもよい。

前記遅延させるステツプは、ユーザから前記遅延量を特定する値を受け取って、前記遅延情報として保持してもよい。

前記遅延させるステップは、予め定められた値を前記遅延情報として保持してもよい。

前記遅延させるステップは、前記再生時刻の遅延量を 3 0ミリ秒以上に規定した遅延情報を保持してもよい。

前記データ処理方法は、接続先の機器に前記第 1データを送出するステップと、前記機器を特定することが可能な固有情報を前記機器から受け取るステップと、前記固有情報に基づいて、前記機器において実行される前記第 1データに関するビデオ処理の所要時間を特定するステツプとをさらに包含する。前記遅延させるステツプは. 特定された前記所要時間の値を遅延情報として保持してもよい。

本発明によるコンピュータプログラムは、データ処理装置のコンピュー夕において実行される。前記プロダラムにしたがってコンピユー夕が実行するデータ処理方法は、圧縮符号化されたビデオコンテンッに関する第 1データ、前記第 1データの再生時刻を規定する第 1時刻情報、前記ビデオコンテンツと異なるコンテンツに関する第 2データおよび前記第 2デ一夕の再生時刻を規定する第 2時刻情報を有するデータストリームを受け取るステップと、前記デ一タストリームから、前記第 1データ、前記第 1時刻情報、前記第 2データおよび前記第 2時刻情報を抽出するステップと、前記第 1デ一夕をデコードして、前記第 1時刻情報に基づいて出力するステツプとを包含している。さらに、このコンピュータが実行するデ一夕処理方法は、前記第 1時刻情報および前記第 2時刻情報が前記第 1デー夕および前記第 2データを同期して再生する時刻を規定している場合において、再生時刻の遅延量を規定する遅延情報を保持するステップと、前記遅延情報に基づいて前記第 2時刻情報を修正して前記第 2データの再生時刻を遅延させるステップと、前記第 2時刻情報に基づいて前記第 2データを出力するステツプとを包含する。図面の簡単な説明

図 1は、 M P E G 2プログラムストリーム 1 0のデータ構造を示す図である。

図 2は、オーディォパック 4 0のデータ構造を示す図である。図 3は、データ処理装置 1 0 0と、データ処理装置 1 0 0に接続された映像音響機器 1 2 0を示す図である。

図 4は、デコード部 6 0の詳細な機能ブロックの構成を示す図でめる。

図 5は、 P T Sを用いてビデオとオーディオとの同期再生を実現する再生タイミングを示す図である。

図 6は、本実施形態によるデコード部 6 0の処理手順を示すフロ一チャートである。

図 7 (a) は、オーディオ再生管理部 7において生成されるテーブルの構成を示す図である。

図 7 (b) は、ォ一ディォバッファ部 6に格納されたオーディォデータのデータ配置と、オーディオアドレス情報によって参照されるデータ位置の関係を示す図である。

図 8 (a) は、オーディオ遅延設定部 9の操作部の例を示す図である。

図 8 (b) は、遅延時間の設定画面の例を示す図である。

図 9は、オーディォバッファ部 6の構成の例を示す図である。図 1 0 ( a) は間引き前のオーディオ再生管理部 7のテーブル 7 aの構成を示す図である。

図 1 0 (b) は間引き後のオーディオ再生管理部 7のテーブル 7 bの構成を示す図である。

図 1 1は、ビデオ処理を行う処理回路を搭載したビデオ出力部 1

2の機能ブロックの構成を示す図である。

図 1 2は、データ処理装置 1 0 0と映像音響機器 1 2 0との接続およびそれらの間で授受されるデータの種類を示す図である図である。発明を実施するための最良の形態以下では、まずデータストリームのデータ構造を説明し、その後, そのデータストリームを利用して本発明の処理を行うデータ処理装置の構成および動作を説明する。

図 1は、 MP E G 2プログラムストリーム 1 0のデータ構造を示す。 MP E G 2プログラムストリーム 1 0 (以下「データストリーム 1 0」と称する) は、 DVDビデオ規格に準拠したデータ構造を有している。データストリーム 1 0は、ビデオのコンテンツに関するビデオデータと、オーディォのコンテンツに関するオーディォデ一夕とが含まれている。以下では、ビデオデータおよびオーディオデータが含まれているとして説明するが、これら以外にも、データストリーム 1 0には字幕デ一夕等が含まれていてもよい。

デ一タストリ一ム 1 0は、複数のビデオオブジェクトュニット (Video OBject； VOB) # 1、 # 2、 · · ·、 # kを含んでいる, 各 VOBは、複数の VOBュニット（Video OBject unit； VOB U) # 1、 # 2、 ■ · · 、 # nを含んでいる。各 VOBUは、映像の再生時間にして 0. 4秒から 1秒程度のデータを含むデータ単位である。以下、 VO B U # 1および # 2を例にして、 VOBUのデ一夕構造を説明する。なお、以下で用いられる「再生」という語は. 特に明示しない限り、ビデオコンテンツや字幕等のビデオに関しては表示機器 (テレビ等) に映し出されることをいい、オーディオに関しては出力機器（スピーカ等）から音として出力されることをいうとする。

V〇BU# 1は、複数のパックから構成されている。データストリーム 1 0内の各パックのデータ長（パック長）は一定（2キロバイト（2 048バイト） ) である。 VO B Uの先頭には、図 1に "N" で示されるナビゲーシヨンパック（ナビパック） 2 0が配置されている。ナビパック 2 0の後には、 "V" で示されるビデオパック (ビデオパック 3 0等）および "A" で示されるオーディオパック (オーディォパック 40等) が複数含まれている。

各パックは以下の情報を格納している。すなわち、ナビパック 2 0は、デ一タストリーム 1 0内のビデオ、オーディォ等の再生を制御するために用いられる情報、例えば VOBUの再生タイミングを示す情報等を格納している。ビデオパック 30は、 MP EG 2圧縮符号化されたビデオデータを格納している。オーディオパック 40 は、例えば MP E G 2一才一ディォ規格によって圧縮符号化されたオーディォデ一夕を格納している。近接するビデオパック 3 0およびオーディオパック 40には、例えば、同期して再生されるビデオデータおよびオーディオデータが格納されているが、それらの配置 (順序）は任意である。

V〇BU# 2もまた、複数のパックから構成されている。 VOB U# 2の先頭には、ナビパック 2 0が配置され、その後、ビデオパック 3 0およびオーディオパック 40等が複数配置されている。各パックに格納される情報の内容は VOBU# 1と同様である。次に図 2を参照しながらオーディオパック 4 0のデータ構造を説明する。図 2は、オーディオパック 4 0のデータ構造を示す。ォ —ディォパック 40は、オーディォバケツト 4 1およびパディングパケット 4 2を含む。なお、パディングパケット 4 2はデ一タパックのパック長を調整するために設けられたバケツトであるため .. パック長を調整する必要がないときは存在しない。このときは、ォ一ディォパック 4 0にはオーディォバケツト 4 1のみが含まれる。ォ一ディォパケット 4 1は、先頭から順に、 1 4バイトのパックヘッダ（Pack— H) 、 2 4バイトのシステムヘッダ（system— H) 、パケットヘッダ（Packet— H) 4 1 aおよびペイロードを有する。

パックヘッダには、パックの種類（ここではオーディオパケット）を特定する情報が記述される。パックの開始コードに続いて、基準時間情報である S C R (System Clock Reference；システム時刻基準参照値）が記述されている。 S C Rは、ストリームをデコ一ドする際に、復号器側の動作時刻の基準となる同期信号 S T C (System Time Clock；システム時刻基準）の値を符号器側が意図した値に設定し、または、その値に修正するための情報である。 S CRは基本的にどのパケットヘッダにも付加される。 S CRは、 9 0 k H zのクロックで計測した値であり、 3 3ピット長で表されている。システムヘッダは、 VOBUの先頭のパックに必ず付加される。パケットヘッダ 4 1 aは後に詳述する。ペイロードには、圧縮符号化されたビデオデータが記述される。

オーディオパック 4 0には、パック長を調整する目的で、パックヘッダ 4 2とパディングデ一夕 4 2 bとを有するパディングバケツト 4 2が設けられる。所定の条件のもとではパディングパケット 42を設けることに代えて、バケツトヘッダ 4 1 a内にスタッフィングバイトフィ一ルド 4 9が設けられる。両者は同一のパック内には共存しない。図 2に示す例では、オーディオパック 40にはパデイングパケット 42が存在しているためスタッフイングバイトフィ—ルド 49は 0バイトであり存在しない。

次に、オーディオパケット 4 1のパケットヘッダ 4 1 aのデータ構造を説明する。パケットヘッダ 4 l aは、パケット長フィールド 43、フラグフィールド 4およびへッダデータ長フィールド 4 5 を有する。さらに、パケットヘッダ 4 1 aには、時間フラグフィ一ルド 44 aおよび P E S拡張フラグフィールド 44 bの値に応じて. 追加のフィ一ルド 46が設けられることがある。

バケツト長フィールド 43には、そのフィ一ルド以降からそのォ —ディォパケット 4 1の最後までのパケット長（バイト長）が記述される。続いて、フラグフィールド 44は、時間フラグフィールド 44 a (PTS_DTS_f lag), P E S拡張フラグフィールド

(PES_extension_f lag) 44 b等を含む。時間フラグフィールド 4

4 aには、後述するプレゼンテーションタイムスタンプ（PTS) またはデコーディングタイムスタンプ（DT S) の有無を示すフラグが記述される。また、 P E S拡張フラグフィールド 44 bには、 P E S拡張フィ一ルド 48の有無を示すフラグが記述される。へッダデ一夕長フィールド 4 5には、追加のフィールド 46およびス夕ッフィングバイトフィールド 49のフィールド長の和が格納される次に、追加のフィールド 46を説明する。 MP E Gでは、ビデオおよびオーディォの同期再生を実現するために、ビデオとオーディォの各アクセスュニットと呼ばれるデコードの単位ごと（ビデオは

1フレーム. オーディォは 1オーディオフレーム) に、いつ再生すぺきかの時刻を管理するためのタイムスタンプ値が付加されているこのタイムスタンプ値は P T S (Presentation Time Stamp) と呼ばれ、オーディオ用はオーディオ P T S (以下「APT S」と記述する）およびビデオ用はビデオ P T S (以下 rvPTSj と記述する）が規定されている。

P T Sが上述のシステム時刻基準 S T Cに一致したときに、その P T Sが付加されたアクセスュニッ卜が再生のために出力される。 P T Sの精度は、 S CRと同様、 9 0 k H zのクロックで計測した値であり、 3 3ビット長で表されている。 9 0 kH zで計測する理由は、 NT S C、 PALの両方のビデオ方式のフレーム周波数の公倍数であることと、オーディオの 1サンプル周期よりも高い精度を得るためである。

一方、圧縮データをどのような順序でデコードすべきかを示すタィムスタンプ情報が付加されている。このタイムスタンプ値は、デコーディングタイムスタンプ（DTS) と呼ばれる。

フィールド 46に各 5バイトの P TSZDTSフィ一ルド 47が設けられているときは、時間フラグフィールド 44 aは P T Sおよび D T Sを有することを示している。時間フラグフィールド 44 a の値に応じて、いずれか一方のフィールドが設けられる。また、追加のフィ一ルド 46として PE S拡張フィ—ルド 4 8が設けられることもある。 PES拡張フィールド 48にはプログラムストリ一ム 1 0のデコードに必要な情報、例えばデコード用のデータバッファの容量等が記述される。

なお、図 2ではオーディオパックのデ一夕構造を示したが、ビデォパックのデータ構造も同様である。「オーディオパケット」を「ビデオパケット」に読み替え、ペイロードに格納される「オーディォデータ」を「ビデオデータ」に読み替えればよい。ビデオパケットにも、上述した P T Sおよび D T Sが同じデータ構造で記述されており、デコードタイミングおよび再生タイミングが規定される次に、図 3および図 4を参照しながら、本実施形態によるデータ処理装置 1 0 0の構成および動作を説明する。図 3は、データ処理装置 1 0 0と、データ処理装置 1 0 0に接続された映像音響機器 1 2 0を示す。データ処理装置 1 0 0は、 D V D— R O M等の光ディスク 1 1 0から光ピックアップを介してデ一タストリーム 1 0を読み出す。再生処理部 5 0は、アナログ波形として読み出されたデータストリーム 1 0に 2値化処理等を行って、デジタルデータス卜リームとして出力する。 M P E G 2— P Sデコード部.6 0 (以下「デコード部 6 0」と記述する）は、このストリームをビデオデータおよびオーディォデ一夕に分離し、各々をデコードして映像音響機器 1 2 0に出力する。

デ一夕処理装置 1 0 0は、 D V Dプレ一ャ、 D V Dレコーダ、 P

C等であるが、光ディスク 1 1 0に代えてハードディスクを用いたときはハードディスクレコーダである。または、アンテナ等を介してデジタル放送のデータストリ一ム 1 0を受け取るときには、デー夕処理装置 1 0 0はセットトップボックス、デジタル衛星放送受像機等として実現される。一方、映像音響機器 1 2 0は、例えば T V 等のモニタ出力機器、オーディオ出力アンプ、 A Vセレクタ機能を有する A Vアンプ等のィンタフエース機器である。図 3では 1つの映像音響機器 1 2 0が示されているが、映像を表示する機器、音声等を出力する機器等が複数存在していてもよい。

本実施形態によるデータ処理装置 1 0 0の特徴のひとつは、映像音響機器 1 2 0において行われる種々の演算処理等により、本来同期して再生すべきビデオおよびオーディォがずれて再生されてしまう場合に、先行する出力を遅延して出力することにある。例えば、映像音響機器 1 2 0においてビデオデータのインタ一レース/プログレツシブ変換を行うためにビデオデータの再生がオーディオの再生よりも遅延してしまう場合に、ビデオデータの再生時刻の遅延量相当時間だけ、先行するオーディオデータを遅延して出力する。これにより、ビデオデータとオーディオデータとの同期再生が可能になる。なお、オーディオデータの遅延出力は、オーディォデ一夕の再生時刻を規定する P T Sを修正することによって実現される。遅延量は、予想される時間、ユーザによって設定された時間、映像音響機器 1 2 0を特定して判断することができる映像音響機器 1 2 0 におけるビデオ処理の所要時間等に基づいて設定される。

上述のデータ処理装置 1 0 0の特徴は主としてデータ処理装置 1 0 0の-デコード部 6 0によって実現される。以下、デコード部 6 0を詳細に説明する。図 4は、デコード部 6 0の詳細な機能ブロックの構成を示す。デコード部 6 0は、システムデコード部 1と, ビデオバッファ部 2とビデオ再生管理部 3と、システム時刻基準参照部 4と- ビデオデコ一ド部 5と、オーディオバッファ部 6と、オーディォ再生管理部 7 と、オーディォデコード部 8と、オーディォ遅延設定部 9とを有する。

システムデコ一ド部 1は、デ一タス卜リーム 1 0から、デジタル圧縮符号化されたオーディォおよびビデオデ一夕を分離して抽出するとともに、ビデオパックに付加された P T Sをビデオ再生時刻情報として抽出し、オーディオパックに付加された P T Sをオーディォ再生時刻情報として抽出する。

まず、ビデオ処理に関する構成要素を説明する。ビデオバッファ部 2は、システムデコーダ部 1によって分離されたビデオデータを格納する。ビデオ再生管理部 3は、ビデオバッファ部 2に格納されたビデオデータとビデオ再生時刻情報を関連づけたテーブルを生成し、管理する。

ビデオデコード部 5は、圧縮符号化されたビデオデータの属性情報（ビデオヘッダ情報）を解析するとともに、ビデオバッファ部 2 に格納されているビデオデ一夕をビデオ再生時刻情報に従ってデコードする。ビデオデコ一ド部 5にはフレームバッファ部 1 1およびビデオ出力部 1 2が設けられている。フレームバッファ部 1 1は、デコードしたビデオデータを格納する。ビデオ出力部 1 2は-, デコード部 6 0からその外部へビデオデータを出力する。このビデオデ一夕は、さらにデ一夕処理装置 1 0 0に接続された映像音響機器 1 2 0に出力される。

次に、オーディオ処理に関する構成要素を説明する。オーディオバッファ部 6は、システムデコード部 1によって分離されたォ一ディォデータを格納することができる半導体メモリである。そのパッファサイズは、取り扱う符号化オーディォデータの圧縮率等によつて異なり、例えば数キロバイトから数十キロバイト程度である。ォ一ディォ再生管理部 7は、オーディォバッファ部 6に格納されたォ一ディォデ一夕とオーディォ再生時刻情報を関連づけるテーブルを生成し、管理する。このテーブルは後に図 7 ( a ) および（b ) を参照しながら詳述する。

オーディォ遅延設定部 9は、オーディォの再生時刻の遅延量を規定する遅延情報を保持し、かつ、遅延情報に基づいてオーディオの再生時刻情報を修正して、その再生時刻を遅延させる。オーディオ遅延設定部 9は、例えば遅延情報を保持するメモリ（図示せず）を有しており、映像音響機器 1 2 0の処理に鑑みて想定される時間が予め設定されている。そしてさらに、ユーザによって設定された数ミリ秒単位またはビデオフレーム単位の遅延時間に関する情報も保持できる。これにより、映像音響機器 1 2 0において発生する処理遅延に応じた微調整が可能になる。

ォ一ディォデコード部 8は、圧縮符号化されたオーディォデ一夕の属性情報（オーディオヘッダ情報）を解析するとともに、オーディォバッファ部 6に格納されているオーディォデータをオーディォ再生時刻情報に従ってデコードする。オーディォデコード部 8には P CMバッファ部 1 3およびオーディ才出力部 1 4が設けられている。 P CMバッファ部 1 3は、デコードしたオーディオデータを格納する。オーディォ出力部 1 4は、デコード部 6 0からその外部へオーディォデ一夕を出力する。このオーディォデータは、さらにデ一夕処理装置 1 0 0に接続された映像音響機器 1 2 0に出力される < なお、上述のビデオデコード部 5およびオーディォデコ一ド部 8 は、デコードする点において同じ機能を有する。したがって、それ. ぞれの機能を実現できる限り、 1つの半導体集積回路等として実装してもよい。例えば図 4は、ビデオデコード部 5およびオーディオデコード部 8を有するデコーダチップ 1 5を示している。

次に、ビデオ出力部 1 2およびオーディオ出力部 1 4から出力されるビデオデ一夕およびオーディォデ一夕を、同期して再生するための構成を説明する。デコード夕イミングおよび再生夕イミングは. システム時刻基準参照部 4によって実現される。システム時刻基準参照部 4は、 MP E Gシステムのデータ処理装置 1 0 0の内部においてシステム時刻基準 S T Cを生成する。データ処理装置 1 0 0側で S T Cを生成するためには、 DVDディスク等で使用されるプログラムストリ一ム (P S) に規定される S C Rの値を用いる。上述のように、 S C Rはパックへッダに記述されている。なお、入力されるデータストリームが B Sデジタル放送で使用されるトランスポ一トストリーム（T S) のときは、 P CR (Program Clock

Reference：プログラム時刻基準参照値）が用いられる。システム時刻基準参照部 4は、ビデオデータの最終バイトの到着時（再生処理部 5 0からのデータ受け取り時）に、 S CRの値と同じ値がシステム時刻基準 S T Cとして設定され S TCが基準時刻とされる。さらに、この S T Cの値と、 P L L (位相口ックループ）回路 (図示せず) とを組み合わせることにより、デコード部 6 0の基準時刻用システムクロックと完全に周波数が一致した S T C にすることができる。システム時刻基準 S T Cのシステムクロックの周波数は 2 7 MH zである。この S TCからカウンタ等により分周することにより、各 P T S (周波数： 9 0 kH z ) が参照される < データ処理装置 1 0 0が従来の処理を行う場合には、ビデオデコード部 5は、システム時刻基準 S T Cが V P T Sに一致したときその P T Sが付加されていたアクセスユニットを出力し再生させる。またオーディォデコ一ド部 8は、 S T Cが A PT Sに一致したときにその P T Sが付加されていたアクセスユニットを出力し再生させる。 P T Sの周波数は 9 0 kH zであるから、この精度の範囲内で. S T Cと V P T Sおよび A P T Sとの同期をとれるようにビデオデ一夕およびオーディォデータの各々をデコードする。これにより、ビデオおよびオーディォの同期再生を実現できる。

一方、本実施形態による処理によれば、映像音響機器 1 2 0におけるビデオ処理の遅延を考慮した上で、データ処理装置 1 0 0はビデォおよびオーディォの同期再生を実現する。以下、図 5を参照しながらその概略を説明し、その後、図 6を参照しながらその動作を実現するための処理の手順を説明する。図 5は、 P T Sを用いてビデオとオーディオとの同期再生を実現する再生タイミングを示す。再生時刻情報が示すタイミングが 4段に分けて記載されている。

1段目は、データストリーム 1 0に規定されていたビデオ再生時刻情報 ( V P T S ) の夕イミングを示す。データストリーム 1 0を生成したエンコーダ（図示せず）は、時刻 t _{v l}、 t _{v 2}、 · · · において、ビデオが再生されることを意図して圧縮符号化を行っている。時刻 t _v iと t _{v 2}との間隔は、例えば、 NT S C方式であれば 3 3ミリ秒の n倍（n ：自然数）（3 O H z ) 、 PAL方式であれば 40ミリ秒の n倍（n ：自然数）（ 2 5H z) である。

次に、 3段目はデータストリーム 1 0のオーディオの再生夕イミングを示す。オーディオについてもビデオと同様に、エンコーダ (図示せず）は、時刻 t _{A 1}、 t _A2、 ■ · ' において、オーディオが再生されることを意図して圧縮符号化を行っている。時刻 t _A1 と t _A2との間隔は、例えば、 AAC (Advanced Audio Coding) 方式では 2 1. 1 2ミリ秒の n倍（n ：自然数）である。

一方、図 5の 2段目は、映像音響機器 1 2 0におけるビデオ処理によって遅延したビデオの再生夕イミングを示す。例えば、最初に表示されるビデオについてみると、ビデオ処理に起因する遅延により、本来時刻 t _v で表示されるはずの映像が、時刻 t _{v l}より後の時刻 t _p！において再生されている。その時間差を Δ t とする。次に、 4段目は、本実施形態のオーディオ遅延設定部 9が元の再生時刻情報（APT S) を修正した後の、オーディオの再生夕イミングを示す。オーディオ遅延設定部 9は、時刻 t _{v l}において再生されるべきことを示すオーディオの再生時刻情報（APT S) をビデオが映像音響機器 1 2 0において遅延する時間（Δ ί ) だけずらした時刻情報 (NAPT S) に修正し、オーディォの再生時刻を遅延させている。この結果、ビデオデ一夕は 1段目のタイミング (時刻 t _{v l}、 t _{v 2}、 · · ·）においてビデオ出力部 1 2から出力され、 2段目のタイミング (時刻 t _{p l}、 t _{p 2}、 · · · ) において再生され、オーディォデータは 3段目のタイミングにおいてオーディォ出力部 1 4から出力され、 4段目のタイミング（時刻 T_NA1、 T_NA2、 · · ·）において再生される。ビデオの処理によって遅延した時間 Δ tだけオーディオの再生時間をずらすことにより、ェンコード時に想定されていた再生夕イミングでビデオおよびオーディォを再生できる。よって、同期再生が意図されていたビデオおよびオーディオに対しても、想定されていたとおりの同期再生を実現できる。

なお、ビデオおよびオーディオの「同期再生」とは、ビデオの再生タイミングがオーディォの再生夕イミングに対して、一定の時間範囲（例えば 5 0ミリ秒先行から 3 0ミリ秒遅延の間）に入っていることをいう。ビデオおよびオーディォの P T Sがー致している場合に限られるものではない。

ビデオとオーディオとが時間にして 3 0ミリ秒以上のずれると、視聴者に違和感を与える場合がある。したがって、 VPTSが N APT Sに対して 5 0ミリ秒先行（さらに厳密には 3 0ミリ秒先行）から、 3 0ミリ秒遅延までの間にあわせれば、実際の視聴において視聴者にとっては同期再生されているといえる。

図 6は、本実施形態によるデコード部 6 0の処理手順を示す。まずステップ S 1 0 1において、システムデコ一ド部 1は、符号化デ —タストリームを符号化ビデオデータおよび符号化オーディォデ一夕に分離し、ステップ S 1 0 2において、符号化データ (ビデオ/ オーディオ）から、符号化フレームデータおよび再生時刻情報 (V P T S/AP T S) を抽出する。ビデオおよびオーディオの各符号化フレームデータは、それぞれビデオバッファ部 2およびオーディォバッファ部 6に格納され、再生時刻情報（VP T S/AP T S) はビデオ再生管理部 3およびオーディォ再生管理部 7に送られる。図 7 ( a) は、オーディオ再生管理部 7において生成されるテーブルの構成を示す。このテーブルは、オーディオバッファ部 6に格納されたオーディォデ一夕とオーディォ再生時刻情報とを関連づける。まず、オーディオ再生管理部 7は、例えば AP T Sごとにスロットという単位に分割する。そして、各スロットとオーディオアドレス情報とを対応付ける。オーディオアドレス情報は、対応するスロットに再生される、オーディォバッファ部 6に格納されたオーディォデ一夕の先頭ァドレスを参照する。図 7 (b) は、オーディオバッファ部 6に格納されたオーディォデ一夕のデータ配置と、ォーディオアドレス情報によって参照されるデータ位置の関係を示す。再び図 6を参照する。ステップ S 1 0 3において、ビデオデコード部 5およびォ一ディォデコ一ド部 8は、 V P T S /A P T Sがシステム時刻基準 s T cに達する前に、ビデオ/オーディオの符号化フレームデ一夕をデコ一ドし、ステップ S 1 04において、デコードされたビデオ/オーディォデ一タをフレームバッファ部 1 1および P CMバッファ部 1 3に格納する。

次にステップ S 1 0 5において、オーディォ遅延設定部 9は, 予め設定された遅延時間に対応する P T S値 Δ tを AP T Sの値に加算し、新たなオーディォ再生時刻情報 N AF T S値を求める (N A P TS =AP T S + A t ) 。以上の処理によって、オーディオの再生時刻情報（AP T S) を修正した新たな再生時刻情報（NAP T S ) が得られる。

本実施形態では、遅延時間はユーザによって予め設定されているとする。図 8 (a) はオーディオ遅延設定部 9の操作部の例を示す _c ユーザが初期設定画面において図 8 ( a) に示す項目選択キーを操作すると、音声の遅延時間を設定できるモードに移行する。図 8 (b) は音声の遅延時間を設定する際の画面の例を示す。ユーザが操作部を介して画面上のハイライト 9 1を「手動」にあわせ、決定キーを押下すると、手動による遅延時間の設定モードに移行する。ユーザが遅延量の表示窓 9 3を見ながら図 8 ( a) の「設定 1」と示される上方向ポタンを押下すると画面上の増加ボタン 9 2 aがハイライトされ遅延量が増加する。逆に、「設定 2」と示される下方向ボタンを押下すると、画面上の減少ポタン 9 2 bがハイライトされ遅延量が減少する。図 8では、遅延させたい時間が "6 Om s " に設定されている。 P T S値 Δ tは設定された遅延時間に基づいて得ることができる。設定された時間が t (m s ) のとき、 P T S値

A t = 9 0. 9 tまたは 9 I t となる。

次にステップ S 1 0 6において、ビデオデコード部 5は、システム時刻基準 S TCが V P T Sに達したか否かを判断する。達していれば、ステップ S 1 0 7においてビデオ出力部 1 2はフレームバッファからビデオデータを出力する。達していなければ、達するまで待つ。次に、ステップ S 1 0 8において、オーディオデコード部 8 は、 S T Cが NA P T Sに達したか否かを判断する。「達した」とは、 S T Cが NA P T Sに一致したとき、または S TCが NAPT Sを超過したときを示す。達していれば、ステップ S 1 0 9において、オーディオ出力部 1 4は P CMバッファからビデオデータを出力する。達していなければ、達するまで待つ。

そして、ステップ S 1 1 0において、ビデオデコード部 5およびオーディォデコード部 8はデコードが終了したか否かを判断する。終了したときは処理を終了し、していなければステップ S 1 0 1に戻って処理を継続する。なお、ユーザから再生の停止が指示された場合にも処理は終了する。

以上、本実施形態によるデータ処理装置 1 0 0の動作（特にデコ

—ド部 6 0の動作）を説明した。

上述した説明では、圧縮符号化されたオーディオデータをデコードした後 P CMデ一夕をバッファするとした。しかしそれに代えて、デコード部 6 0がデコードする前のオーディォバッファ部 6に，オーディォデータをバッファすることも好ましい。デコ一ドされた P CMデータより、デコード前の圧縮符号化された状態のォ一ディォデータの方がデータ量が小さ < , オーディォバッファ部 6等のバッファサイズが少なくてすむからである。具体的にはオーディオの符号化フレームデータがオーディォバッファ部 6に格納された後，予め設定された遅延時間に対応する P T S値 Δ tをオーディォの再生時刻（AP T S) の値に加算して N A P T S値を求めればよい

(NAP T S =AP T S + A t )„ これは、図 6のステップ S 1 0 2の後、ステツプ S 1 0 3の前に、ステツプ S 1 0 5の処理を行うことに相当する。その他の処理は図 6に示すとおりである。

図 9は、オーディオバッファ部 6の構成の例を示す。オーディオバヅファ部 6には、オーディォ遅延がない場合において符号化ォーディォデ一夕が格納される標準バッファ 6 aと、オーディォ遅延がある場合において追加の符号化オーディォデータが格納される追加バッファ 6 bとが設けられる。追加バッファ 6 bが設けられる理由は、オーディオ遅延がある場合には、従来の処理によれば AP T S によって示された時刻に出力されているはずのオーディォデ一夕が. 本実施形態による処理では NAP T Sになるまで出力されないため. 時間にして A t (=NAPTS -APT S) の間に読み込まれたデ —夕をさらに格納するバッファ容量が必要になるからである。

よって、ォ一ディォバッファ部 6に必要なバッファ容量は、当初の AP T Sによって規定される再生時刻の到達前までに受け取る符号化オーディオデータのデータ量と、再生時刻の遅延量（A t ) に応じた時間の経過までに受け取る符号化オーディォデ一夕のデ一夕量との和以上である。前者は標準バッファ 6 aにより、後者は追加バッファ 6 bにより確保される。

例えば、追加バッファ 6 bに最大 1 0 0ミリ秒のデータを追加的に格納できる追加バッファ 6 bが必要である場合を考える。これは. 遅延時間が最大 1 0 0ミリ秒の場合に相当し、ビデオでは NTS C 方式出力のときのビデオ約 3フレームの表示時間に相当する。この場合に必要な追加バッファ 6 bの容量は、 B Sデジタル放送で使用されているオーディォ圧縮フォーマツトの A A C方式では約 2 2キ口バイトである（ 1チャンネルあたり 2 8 8キロビット秒として 6 チャンネル分のデータ量を算出した）。この容量は、デコード後の P CMデータを追加的に保存するときの容量の数分の 1である。

なお、オーディォバッファ部 6に格納される符号化ォ一ディオフレームデータのデータ量が増加するため、オーディォ再生管理部 7 のテーブルサイズを増加させなければならない点にも留意しなければならない。

ただし、オーディォ再生管理部 7に全てのオーディォの再生時刻情報（APT S) を格納せず、一部を間引いてテーブルを構成すれば、テーブルサイズの増加を防ぐことができる。図 1 0 (a) は間引き前のオーディオ再生管理部 7のテーブル 7 aの構成を示し、図 1 0 (b) は間引き後のオーディォ再生管理部 7のテーブル 7 bの構成を示す。テ一プル 7 bは、テーブル 7 aの奇数番目の再生時刻情報（APT S) を間引いて生成されている。オーディオ再生管理部 7がリアルタイムでテーブル 7 bを生成するときは、 1つおきにの再生時刻情報（APT S) およびその対応アドレス情報の関係を記述すればよい。これによりテーブル 7 bのデータ量はテーブル 7 aのデータ量の半分になる。換言すれば、同じテーブルサイズであれば、テーブル 7 bはテーブル 7 aの倍のオーディォデータを管理できる。なお、再生時刻情報（AP T S) およびその対応アドレス情報を間引くことにより、同期に必要な A P T S情報が減少するため、同期させる頻度は減少するが、管理すべきデータのデータ量が増加しても確実にビデオとオーディォの再生を同期させることができる。

本実施形態では、ビデオデコード部 5およびオーディオデコード部 8は、圧縮符号化されたビデオデータおよびオーディオデータをデコードして、フレームバッファ部 1 1および P CMバッファ部 1 3に保持しておくとした。しかし、例えば D VDにはリニア P CM データがオーディォデ一夕として含まれている場合には、デコード動作は不要である。リニア P CMデータは符号化はされているが圧縮はされていないからである。ただし、オーディオデータがリニア P CMデータであっても、ストリームに含まれる同期情報に従ってビデオと同期して再生されるため、先の説明をそのまま適用できるまた、データ処理装置 1 0 0が光出力端子からドルビーデジタル等の符号化ストリ一ムをそのまま出力する場合には、ストリームバッファ（図示せず）に一旦蓄えて、 S TCを参照し、 NAP T SがS T Cに達した時点で、オーディオ出力部 1 4から出力すればよい。次に、オーディォの遅延を発生させる映像音響機器 1 2 0のビデォ処理の具体例を説明する。想定されるビデオ処理は、

( 1 ) 毎秒 24フレームのフィルム素材から毎秒 3 0フレームのピデォ素材への変換処理、

(2) インターレース走査 · プログレッシブ走査間の変換処理、標準画質（Standard Definition; S D) の D 1規格信号 ·高精細画質

(High Def inition;HD) の D 3規格信号間の変換処理、 NT S C 方式 · PAL方式間の変換処理

(3) ユーザからの指示等に基づく映像の拡大、縮小、編集処理

(4) 複数の映像の合成処理

等である。上述の処理が不要な通常の再生時には、オーディオデータを遅延して出力する必要はない。しかし、ビデオ処理のオン Zォフによって遅延が発生しうるため、遅延量の設定およびその設定に基づくオーディォデータの遅延出力が必要になる。

そのようなときは、オーディオ遅延設定部 9に遅延時間が異なる複数の遅延情報を設け、行われる処理種別に応じて対応付けておくことが好ましい。例えば、映像音響機器 1 2 0で実行される画像処理の種別をユーザが入力すると、その種別応じて遅延時間を変えるようにデコード部 6 0を構成すればよい。

次に、オーディォデータの再生時間を遅延させる遅延時間を求めその時間をオーディォ遅延設定部 9において自動的に設定するための第 1〜第 3の設定手法を説明する。

まず第 1の手法は以下のとおりである。データ処理装置 1 0 0において、ビデオ信号にあらかじめ特定パターンの信号が含まれている同期検証用テストストリ一ム等をデコードし、映像音響機器 1 2 0に送る。そして、映像音響機器 1 2 0においてビデオ処理された後の表示された映像をキヤプチヤし-, その遅延時間を測定する。得られた遅延時間をオーディォ遅延設定部 9に設定することにより、遅延時間が設定できる。これらの処理を自動化することによりォーディォの再生遅延時間を自動的に設定できる。なお、遅延時間は、映像音響機器 1 2 0における各信号処理モードの各々について遅延時間を測定し、遅延時間を設定してもよい。テストストリームは、放送系から入力されてもよいし、テストディスクまたはデ一夕処理装置 1 0 0内のメモリ等から読み出されてもよい。なお、入力がテストストリームではなく、あらかじめデコードされたビデオデータを出力するようなテストパターンであってもよい。これは、デコードした後のビデオ処理での遅延を測定すればよいためである。

続いて、遅延時間を自動的に設定する第 2の手法を説明する。第 2の手法では、オーディオとの同期を阻害するビデオ処理の遅延原因（ 1 ) 〜（4 ) の処理を、映像音響機器 1 2 0ではなく、ビデオデコード部 5のビデオ出力部 1 2が行う。ビデオ出力部 1 2がそのようなビデオ処理を行うことにより、デコード部 6 0はビデオ処理に起因する遅延時間を把握することができ、その結果、オーディオ遅延設定部 9はリアルタイムで遅延量を変更できる。また、映像音響機器 1 2 0におけるビデオ処理も必要なくなるので、その負荷が軽減できる。

図 1 1は、ビデオ処理を行う処理回路を搭載したビデオ出力部 1 2の機能ブロックの構成を示す。ビデオ出力部 1 2は、フレームバッファ部 1 1からデコードされたフレームデ一夕を受け取り -. 所定のビデオ処理を行ったビデオデータを出力する。ビデオ出力部 1 2 は、 I P変換部 7 1と、フォーマット変換部 7 2と、拡大縮小部 7 3と、他画面合成部 7 4と、 GU I重畳部 7 5と、出力部 7 6とを有する。これらの構成要素に関連して、ビデオデコード部 5には外部映像入力部 7 7および GU Iデータ生成部 Ί 8とが別途設けられる。

I P変換部 7 1は、ィンタ一レース走查 · プログレッシブ走査間の変換処理を行う。フォーマット変換部 7 2は、 4 8 0 i ビデオ信号 · 1 0 8 0 i ビデオ信号間の変換処理および NT S C方式 · P A L方式間の変換処理を行う。拡大縮小部 7 3は、ユーザからの指示等に基づく映像の拡大、縮小、編集処理を行う。他画面合成部 7 4 は、デコードされたビデオと外部映像入力部 7 7から入力されるピデォとを合成する。 GU I重畳部 7 5は、これまでの処理によって得られたビデオに、 GU Iデータ生成部 7 8によって生成された G U Iデータを重畳する。そして出力部 7 6は、最終的に得られたビデォデ一夕を出力する。この出力は、映像音響機器 1 2 0に送られる。ビデオデコード部 5は、ビデオデータが得られたときの時刻を S T Cに基づいて取得し、そのビデオデータの V P T Sと比較することによって、遅延時間を特定することができる。

さらに、遅延時間を自動的に設定する第 3の手法を説明する。第 3の手法では、データ処理装置 1 0 0と映像音響機器 1 2 0とが互いに通信して、データ処理装置 1 0 0が映像音響機器 1 2 0において行われるビデオ処理の種別を特定する。これにより、データ処理装置 1 0 0のデコード部 6 0は、ビデオ処理に起因する遅延時間を予め特定できる。

以下、具体的に説明する。図 1 2は、デ一夕処理装置 1 0 0と映像音響機器 1 2 0との接続およびそれらの間で授受されるデータの種類を示す。図 1 2の例では、 HDM I規格に従ってデータが授受される。まず HDM I トランスミッタ 8 0は、映像音響機器 1 2 0 の HDM I レシーバ 1 3 0に対して、映像音響機器 1 2 0を特定する情報（機器固有情報）を求める制御コマンドを送信する。 HDM I レシーバ 1 3 0は、その制御コマンドに基づいて、自己の装置の機器 I Dを機器固有情報として H DM I トランスミッタ 8 0に送信する。機器 I Dは、例えば映像音響機器 1 2 0内の ROM 1 3 1にメーカ一固有情報（Vendor Specific Data). として格納されておりメーカー名、機種名等を特定することができる。

HDM I 卜ランスミッタ 8 0は、機器 I Dを受け取ってデコード部 6 0に出力する。デコード部 6 0は、機器 I Dを受け取ると、内部メモリまたは外部のメモリカード等に規定されたテーブルを参照する。テーブルには、機器 I Dと遅延設定との対応が記述されている。デコード部 6 0は、機器 I Dおよびそのテーブルに基づいて、映像音響機器 1 2 0が実行するビデオ処理に起因する遅延時間を得ることができる。これにより、その遅延時間をオーディオ遅延設定部 9に設定できる。なお、図 1 2は、 MP E G 2プログラムストリームをデコ一ドするデータ処理装置 1 0 0を利用する場合の例であるが、デコードの対象はこのストリームに限られない。例えば、受信され記録されたデジタル放送の MP E G 2 トランスポートストリームもデコードの対象になる。デコード部 6 0はストリームの種類に応じたデコードを行うように構成されればよい。

ここまでは、システム時刻基準参照値 S C Rを基準としてシステム時刻基準 S T Cを生成し、その S T Cに基づいて、ビデオの再生時間を規定する VP T Sおよび遅延させたオーディォの再生時間を規定する NAP T Sを生成し、ビデオおよびオーディォを同期して再生させるとして説明した。しかし、さらに VP TSに基づいてォ一ディォを再生することもできるし、 NAP TSに基づいてビデオを再生することもできる。

光ディスク 1 1 0に記録した符号化コンテンツを再生する場合、符号化コンテンツ等を編集し、編集点でのビデオを途切れなく再生する場合には、ビデオの再生時間を基準とした時間管理が有効である。これは、 VP T Sを基準として NAP T Sを管理することを意味する。本明細書では、 V P T Sを基準として N A P T Sを管理することをビデオマスターと呼ぶ。システム時刻基準参照部 4は、 S C Rに基づいて生成した S T Cではなく、 V P T Sに基づいて S T Cを生成し、かつ N A P T Sが規定精度以内におさまるようにォ一ディォデコードを実施する。そして、 NAP T Sによって規定される時刻が V P丁 Sによって規定される時刻を超えるまでのオーディォデータの再生をスキップすることによって、ビデオとオーディオとを同期して再生する。デコード部 6 0のシステム時刻基準参照部 4は V P T Sによって規定される再生時刻と N A P T Sによって規定される時刻とが一定の許容範囲内に入ったことを確認した後、ビデオマスタ一に基づいて時間を管理して再生すればシームレスな編集再生を実現することができる。

例えば、ビデオデータの一部を削除した後で削除部分の前後にわたってシ一ムレスに映像を再生したい場合には、削除位置直後のビデォデ一夕に基づいて映像を表示するとともに、削除位置直前のビデォデ一夕の V P T Sから生成した S T C値を、削除位置直後のビデォデ一夕の V P T Sから生成した S T C値に変更する。そして、オーディオ出力をミュートして再度、遅延量を変更したビデオおよびオーディォの再生同期を取り直すことによってオーディオデコードを再開する。これにより、編集点の前後でもビデオマスターとした S T C値の変更が行われ、編集点の再生時に再生された映像がフリーズする等の不自然な再生がなくなる。なおこの場合にも、ォーディォ遅延分のオーディオバッファ部 6の容量の増加、および、ォ一ディォ再生時刻情報管理部 7のテーブルサイズの増加は必要になる。

一方、光ディスク 1 1 0に記録した符号化コンテンツを再生するとさ、オーディオを途切れなく再生する場合には、オーディオの再生時間 N A P T Sを基準とした時間管理が有効である。これは N A P T Sを基準として V P T Sを同期させることを意味する。本明細書では、 N A P T Sを基準として V P T Sを管理することをォーディォマスターと呼ぶ。システム時刻基準参照部 4は、 S C Rに基づいて生成した S T Cではなく .. N A P T Sに基づいて S T Cを生成しかつ、 V P T Sが規定精度以内におさまるようにビデオデコードを実施する。そして、適当な出力映像のスキップまたは同じ画面の複数回出力によってオーディォをビデオと同期して再生する。オーディォの再生時間 N A P T Sによって規定される時刻をオーディォマスタ一としたときでも、オーディォ遅延を考慮して出力しているため、オーディォを遅延したビデオと同期して再生することができる。なおこの場合にも、オーディオ遅延分のオーディオバッファ部 6の容量の増加、および、オーディオ再生時刻情報管理部 7のテーブルサイズの増加は必要になる。

例えば、出力音声または音楽等を途切れることなく再生したいとき（早送りやコマ送り再生時）においてオーディオの連続性を保つためには、ビデオの再生が長すぎる、または短すぎる場合がある。その場合には、同じ画面を何度も繰り返し表示し、または、特定数フレームをスキップする等の処理を行う。

オーディォ遅延設定部 9において遅延時間の設定を変更する際には、一旦オーディォ出力をフェードアウトもしくはミュート設定して、音量を下げる。そして遅延設定を変更後、ミュート解除もしくは、フェードインを実行し、元の音量に復帰させればよい。

図 1に示すデータストリーム 1 0にはオーディォデータとビデオデータとが混在しており、図 4に示すシステムデコ一ド部 1においてそれらを分離するとして説明した。しかし、オーディオデ一夕およびビデオデータは独立した別個のストリームとして含まれていてもよい。例えば、ビデオカメラ等で撮影したオーディォデータおよびビデオデー夕を P Cで編集してビデオのエレメンタリストリ一ムとオーディォのエレメン夕リストリームとにわけてデータ処理装置 1 0 0に入力してもよい。ビデオデータの再生時刻情報およびォ一ディォデ一夕の再生時刻情報に基づいて、ビデオとオーディォが同期して再生されるのであれば、本発明は適用可能である。

本実施形態は、ビデオとオーディオとを同期して再生するとしたが、これは例である。例えば、 D V Dに設けられているサブピクチャに関して、そのビデオ処理に基づく再生遅延が発生する場合には. やはりオーディォの再生時刻情報 N A P T Sを生成して字幕とォ一ディォとを同期して再生することもできる。また衛星放送を受信し記録した場合のデータ放送の同期についても同様である。映像音響機器 1 2 0においてビデオとデータの内容との重ね合わせ処理等において処理遅延が発生する場合には、オーディオの再生時刻情報 N A P T Sを生成して、ビデオ、データの内容およびオーディオを同期して再生することができる。

本実施形態では、 A P T Sにオーディオ遅延 Δ tに相当する P T Sを加算して N A P T Sを求めるとしたが、 V P T Sから Δ t相当分を減算してもよい。ただし、 V P T Sから Δ tを減算するだけでなく、システム時刻基準参照値そのものを Δ t減算することで、同じ効果が得られる。具体的には、データ処理装置 1 0 0に、ビデオの再生時刻情報に任意の遅延用設定時間を減算する手段およびシステム時刻基準参照値に任意の遅延用設定時間を減算する手段を設ければよい。これにより、映像音響機器 1 2 0におけるビデオ処理の遅延を考慮して遅延用設定時間を減算したシステム時刻基準参照値に対して、遅延のために設定時間を減算されたビデオと、オーディォとを同期して再生できる。

また、本実施形態では、画像処理によってビデオがオーディォに遅れて再生されることを想定して説明した。しかし、これとは逆に、データ処理装置 1 0 0の出力後に行われる各種の音響効果等の処理に起因してオーディォの再生が遅延する場合もある。このときは、ビデオ再生が先行してしまうため、 V P T Sに遅延時間 Δ tに相当する P T Sを加算した新たなビデオ再生時刻情報 N V P T Sを求めて、ビデオとオーディオとの再生を同期させればよい。このときは、ビデオバッファ部 2およびビデオ再生管理部 3のテーブルサイズが増加することになる。

データ処理装置 1 0 0に設けられた種々のバッファは、その一部または全部が半導体メモリによって構成されていてもよいし、ハ一ドディスク等の記録媒体によって構成されていてもよい。

上述のデータ処理装置 1 0の機能、特にデコード部 6 0の機能は. ソフトウエアを実行することによって実現してもよい。例えば、 C P U (図示せず) がコンピュータプログラムを実行することによつて、各構成要素の動作を制御してもよい。コンピュータプログラムは、例えば図 6に示すフローチヤ一トにしたがつた処理をデータストリ一ム 1 0に実行させるように構成すればよい。コンピュータプログラムは、光ディスクに代表される光記録媒体.

S Dメモリ力一ド、 E E P R O Mに代表される半導体記録媒体、フレキシブルディスクに代表される磁気記録媒体等の記録媒体に記録することができる。なお、データ処理装置 1 0は、記録媒体を介してのみならず、ィン夕一ネット等の電気通信回線を介してもコンビュ一タプログラムを取得できる。産業上の利用可能性

本発明によれば、ビデオ、オーディオ等を同期して再生することができるデータ処理装置等が提供される。例えば、ビデオ処理に起因してビデオの再生が遅延する場合には、オーディォの再生時刻がビデオの遅延時間相当量だけ遅くなるようにオーディォの再生時刻情報を修正するので、ビデオとオーディオとを同期して再生することができる。

Claims

請求の範囲

1 . 圧縮符号化されたビデオコンテンツに関する第 1データ前記第 1デ一夕の再生時刻を規定する第 1時刻情報、前記ビデオコンテンッと異なるコンテンツに関する第 2データおよび前記第 2デ一夕の再生時刻を規定する第 2時刻情報を有するデ一タストリームを受け取る受信部と、

前記データストリームから、前記第 1データ、前記第 1時刻情報，前記第 2データおよび前記第 2時刻情報を抽出する分離部と、

前記第 1データをデコードして、前記第 1時刻情報に基づいて出力する第 1デコード部と、

前記第 2時刻情報に基づいて前記第 2デ一夕を出力する第 2デコ一ド部と

を有するデータ処理装置であって、

前記第 1時刻情報および前記第 2時刻情報が前記第 1データおよび前記第 2データを同期して再生する時刻を規定している場合において、再生時刻の遅延量を規定する遅延情報を保持し、かつ、前記遅延情報に基づいて前記第 2時刻情報を修正し、前記第 2データの再生時刻を遅延させる遅延設定部をさらに備えたデータ処理装置。

2 . 前記第 2デ一夕のコンテンツは圧縮符号化されており、

前記第 2デコード部は前記第 2データを復号し、前記第 2デコード部は復号された前記第 2データを格納する内部バッファを有する. 請求項 1に記載のデータ処理装置。

3 . 前記第 2データのコンテンツは圧縮符号化されており

圧縮符号化された前記第 2データを格納するデータバッファをさらに備え、

前記データパッファは、修正後の第 2時刻情報によって規定される再生時刻の前に前記圧縮符号化された前記第 2データを取り出し、前記第 2デコード部に出力する、請求項 2に記載のデータ処理装置

4 . 前記受信部は前記データストリームを継続的に受け取り、前記デ一タパッファは前記第 2データを順次格納し、

前記データバッファの容量は、修正前の第 2時刻情報によって規定される再生時刻の到達前までに受け取る前記第 2データのデータ量と、前記再生時刻の遅延量に応じた時間の経過までに受け取る前記第 2データのデータ量との和以上である、請求項 3に記載のデータ処理装置。

5 . 前記第 2デ一夕が格納された前記データバッファ内の位置を示すァドレス情報と、前記第 2データに対応する修正前の第 2時刻情報との対応関係を規定するテーブルを管理する管理部をさらに備えた、請求項 4に記載のデ一夕処理装置。

6 . 前記管理部は、一部の前記第 2データについて、前記テープルを管理する、請求項 5に記載のデータ処理装置。

7 . 前記受信部は、オーディオおよび字幕の少なくとも一方に関する前記第 2データを有するデータストリ一ムを受け取る、請求項 1に記載のデータ処理装置。

8 . 前記遅延設定部は、ユーザから前記遅延量を特定する値を受け取って、前記遅延情報として保持する、請求項 1に記載のデータ処理装置。

9 . 前記遅延設定部は、予め定められた値を前記遅延情報として保持する、請求項 1に記載のデータ処理装置。

1 0 . 前記遅延設定部は、再生時刻の遅延量を 3 0ミリ秒以上の値として規定した遅延情報を保持する、請求項 9に記載のデータ処

1 1 . 接続先の機器に前記第 1データを送出するとともに、前記機器を特定することが可能な固有情報を前記機器から受け取るトランスミッタをさらに備え、

前記卜ランスミッタは、前記固有情報に基づいて前記機器において実行される前記第 1データに関するビデオ処理の所要時間を特定し、前記遅延設定部は、特定された前記所要時間の値を前記遅延量として遅延情報を保持する、請求項 1に記載のデータ処理装置。

1 2 . 前記第 1デコード部および前記第 2デコード部は、単一のデコード回路として実装される、請求項 1に記載のデータ処理装置。

1 3 . 圧縮符号化されたビデオコンテンツに関する第 1データ、前記第 1データの再生時刻を規定する第 1時刻情報、前記ビデオコンテンッと異なるコンテンツに関する第 2デー夕および前記第 2デ一夕の再生時刻を規定する第 2時刻情報を有するデータストリームを受け取るステツプと、

前記データストリームから、前記第 1データ、前記第 1時刻情報、前記第 2データおよび前記第 2時刻情報を抽出するステップと、前記第 1データをデコードして、前記第 1時刻情報に基づいて出力するステップと

を包含するデータ処理方法であって、

前記第 1時刻情報および前記第 2時刻情報が前記第 1データおよび前記第 2データを同期して再生する時刻を規定している場合において、

再生時刻の遅延量を規定する遅延情報を保持するステツプと、前記遅延情報に基づいて前記第 2時刻情報を修正して前記第 2デ一夕の再生時刻を遅延させるステツプと.,

前記第 2時刻情報に基づいて前記第 2データを出力するステツプと

を包含する、データ処理方法。

1 4 . 前記第 2データのコンテンツは圧縮符号化されており、前記第 2データを出力するステップは、前記第 2デ一夕を復号し、復号された前記第 2デ一夕をデータバッファに格納した後に出力する、請求項 1 3に記載のデータ処理方法。

1 5 . 前記第 2データのコンテンツは圧縮符号化されており、圧縮符号化された前記第 2データをデータバッファに格納するステツプと、

修正後の第 2時刻情報によって規定される再生時刻の前に、格納された前記第 2デー夕を前記デ一夕バッファから取り出すステップとをさらに包含し、

前記第 2データを出力するステップは、前記データバッファから取り出された前記第 2データを出力する、請求項 1 4に記載のデ一夕処理方法。

1 6 . 前記受信するステツプは、前記データストリームを継続的に受信し、前記第 2デ一夕を格納するステップは前記第 2データを前記デ一タバッファに順次格納し、

前記デ一タパッファの容量は、修正前の第 2時刻情報によって規定される再生時刻の到達前までに受け取る前記第 2データのデータ量と、前記再生時刻の遅延量に応じた時間の経過までに受け取る前記第 2データのデータ量との和以上である請求項 1 5に記載のデ一夕処理方法。

1 7 . 前記第 2デ一夕が格納された前記データバッファ内の位置を示すァドレス情報と、前記第 2データに対応する修正前の第 2時刻情報との対応関係を規定するテーブルを管理するステップをさらに包含する、請求項 1 6に記載のデータ処理方法。

1 8 . 前記受信するステップは、オーディオおよび字幕の少なくとも一方に関する前記第 2データを有するデ一タス卜リームを受け取る、請求項 1 3に記載のデ一夕処理方法。

1 9 . 前記遅延させるステップは、ユーザから前記遅延量を特定する値を受け取って、前記遅延情報として保持する、請求項 1 3に記載のデータ処理方法。

2 0 . 前記遅延させるステップは、予め定められた値を前記遅延情報として保持する、請求項 1 3に記載のデータ処理方法。