WO2004080071A1

WO2004080071A1 - データ処理装置

Info

Publication number: WO2004080071A1
Application number: PCT/JP2004/002678
Authority: WO
Inventors: Masanori Itoh; Osamu Okauchi; Tadashi Nakamura
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2003-03-06
Filing date: 2004-03-03
Publication date: 2004-09-16
Also published as: JPWO2004080071A1; US7386553B2; US20060165387A1

Abstract

　データ処理装置は、映像信号および音声信号が入力される信号入力部と、映像信号および音声信号を圧縮符号化して、映像データおよび音声データを生成する圧縮部と、映像データおよび音声データを分割してパケットを複数生成し、映像データに関する映像パケットおよび音声データに関する音声パケットを多重化したデータ単位を複数生成し、複数のデータ単位を含むデータストリームを生成するストリーム組立部と、データストリームを記録媒体に記録する記録部とを有している。このストリーム組立部は、データ単位に含める映像パケットおよび音声パケットを少なくとも映像の再生時間に基づいて決定する。そして、所定のデータ単位に格納された映像データに対応する音声データの全部が所定のデータ単位に含まれない場合には、音声データのうち、少なくとも含まれない部分である部分音声データをコピーしたコピーデータをデータストリーム内に含める。

Description

データ処理装置

技術分野本発明は、映像および音声を含むコンテンツをリアルタイムで記明

録する方法および装置に関する。

細背景技術

映像（ビデオ）信号および音声（オーディオ）信号を低いビットレートで圧縮し符号化する種々のデータストリームが規格化されている。そのようなデータストリームの例として、 MP EG 2システム規格（IS0/IEC 13818- 1)のシステムストリームが知られている。システムストリームは、プログラムストリーム（P S) 、卜ランスポートストリーム（T S) 、および P E Sストリームの 3種類を包含する。

近年、磁気テープに代わって、相変化光ディスク、 MO等の光デイスクが、データストリームを記録するための記録媒体として注目を浴びてきている。現在、相変化光ディスク（例えば DVD) にコンテンッのデータストリームをリアルタイムで記録し、編集等を可能にする規格として、 D VDビデオレコーディング規格（以下、「V R規格」と称する）が規定されている（DVD Specifications for Re-wri table/Re- recordable Discs Part3 VIDEO RECORDING version 1.0 September 1999)。また、映画等の再生専用コンテンッのデータストリームを記録する、パッケージメディァ用の規格として、 DVDビデオ規格（以下、「ビデオ規格」と称する）が規定されている。

図 1は、 VR規格に準拠した MP E G 2プログラムストリーム 1

0のデータ構造を示す（以下、このストリームを「VR規格ストリーム 1 0」と記述する）。

VR規格ストリーム 1 0は、複数のビデオオブジェクト（Video OBject ； VOB) # 1、 # 2、' · · ·、 # kを含んでいる。例えば， VR規格ストリーム 1 0がカムコーダで撮影されたコンテンツとすると、各 V〇Bは、ユーザが録画を開始してから録画を停止するまでの 1回の録画動作によって生成された動画データが格納されている。

各 VOBは、複数の VOBュニット（Video OBject unit ； V O B U) # 1、 # 2、 · · · 、 # nを含んでいる。各 VOBUは、主として、映像の再生時間にして 0. 4秒から 1秒までの範囲内の映像データを含むデータ単位である。

以下、図 1において最初に配置された V〇BU# 1とその次に配置された VOBU# 2を例にして、 V〇 B Uのデ一夕構造を説明する。

V〇BU# 1は、 MP E Gプログラムストリ一ムの下位階層であるパックが複数集まって構成されている。 VR規格ストリーム 1 0 内の各パックのデータ長（パック長）は一定（ 2キロバイト（2 0 48バイト））である。 VOBUの先頭には、図 1に "R" で示されるリアルタイムインフォメーションパック（RD Iパック） 1 1 が配置されている。 RD Iパック 1 1の後には、 "V" で示されるビデオパック（ビデオパック 1 2等）および " A" で示されるォ一ディォパック（オーディオパック 1 3等）が複数含まれている。なお、各 VOBUのデータサイズは、再生時間が同じであっても映像データが可変ビットレートであれば最大記録再生レート以下の範囲で変動し、映像データが固定ビットレー卜であればほぼ一定である _t 各パックは以下の情報を格納している。例えば日本国特開 2 0 0 1一 1 9 74 1 7号公報に記載されているように、 RD Iパック 1 1は、 VR規格ストリーム 1 0の再生を制御するために用いられる情報、例えば VOBUの再生タイミングを示す情報や、 VR規格ス卜リーム 1 0のコピーを制御するための情報を格納している。ビデォパック 1 2は、 MP EG 2圧縮された映像デ一夕を格納している。オーディオパック 1 3は、例えば MP E G 2—オーディオ規格によつて圧縮された音声データを格納している。近接するビデオパック 1 2およびオーディオパック 1 3には、例えば、同期して再生される映像データおよび音声データが格納されている。

VOBU# 2もまた、複数のパックから構成されている。 VOB U# 2の先頭には、 RD Iパック 1 4が配置され、その後、ビデオパック 1 5およびオーディォパック 1 6等が複数配置されている。各パックに格納される情報の内容は V〇 BU # 1と同様である。

なお、 VOB内の各 VOBU先頭へ、 RD Iパックは記録されないこともある。このときは、 V〇 B U先頭には必ずビデオパックが記録される。

図 2は、ビデオパック内の映像データによって構成される映像ストリームと、オーディォパック内の音声データによって構成される音声ス卜リームとの関係を示す。

具体的には、 V〇B U # iでは、ビデオパック 2 1 aを含む 1以上のパックに格納された映像データによって、映像ストリームのピクチャ 2 1 bが構成される。次いで、ビデオパック 2 2を含む 1個以上のパックに格納された映像データによって、次のピクチャが構成され、さらに以降のビデオパックに格納された映像デ一夕によつてさらに次のピクチャが構成される。一方、オーディオパック 2 3 aに格納された音声デ一夕によって音声フレーム 2 3 bが構成される。その他のオーディオパックについても同様である。なお、 1つの音声フレームのデータは 2以上のオーディォパックに分割されて格納されていてもよい。また、ひとつのオーディオパック内に複数の音声フレームを含んでいてもよい。

また、 V O B Uに含まれる音声フレームのデ一夕は V〇 B U内で完結しているとする。すなわち、 V O B Uに含まれる音声フレームのデータは V〇 B U内に全て存在し、次の V O B Uには含まれないとする。

映像フレームおよび音声フレームは、各ビデオパックおよびォーディォパックのバケツ卜ヘッダに格納されている再生時刻を指定する情報（プレゼンテーションタイムスタンプ； P T S ) に基づいて再生される。図 2では、ビデオピクチャ 2 1 bと音声フレーム 2 3 bとがほぼ同時刻に再生される。すなわち、両者は同期して再生される。

V〇 B U # iのビデオパック 24 aおよび 24 bに注目する。ビデォパック 24 aからビデオパック 24 bまでのビデオパックに格納された映像データによって、 VOBU# iの最後のピクチャ 24 cが構成される。上述のように、各 VOBUは映像の再生時間等を基準として構築されており、音声を考慮して特に構築されているわけではない。そのため、音声フレーム 2 5 cのデータは、ビデオピクチャ 24 cと同期して再生されるように再生時刻情報（PT S) が付加されていても次の VO B U# ( i + 1 ) のオーディォパック 2 5 aおよび 2 5 b等に格納される。

このように、映像フレームと同期して再生される音声フレームの記録位置がずれる理由は、ビデオパックとオーディォパックの多重化ルールを規定しているシステムターゲットデコーダ ( P - S T D) 内において、ビデオデータ用のバッファのデータサイズ（例えば 2 24 kバイト）が、音声データ用のバッファのサイズ（例えば 4 kバイト）よりもかなり大きいためである。音声デ一夕は蓄積可能なデータ量が少ないので、再生タイミングの直前で読み込むように多重化される。

このようなプログラムストリームに対して、ユーザは、希望する VOBUの再生順序を「プレイリスト」として登録することができる。再生装置はプレイリストに基づいて、指定されたある VOBU のデータを取得して映像等を再生し、その後、指定された VOBU の先頭からデータを読み出して再生を継続する。

しかし、同期して再生すべき映像データおよび音声データが異なる VOBUに格納されている場合には、プレイリストに基づく再生中、音声が途切れるという問題が生じていた。その理由は、再生対象の VO B Uのデータは読み出されるが、その次に配置された非再生対象の VO BUに格納された音声デ一夕は読み出されないからである。この場合には、映像のみが再生され、それと同期して再生されるはずの音声は再生されない。

例えば、図 2において、プレイリストが VOBU# iの再生後に

V〇B U# k ( k≠ ( i + 1 )) の再生を指定しているとする。このとき、 VOBU# iのビデオピクチャ 24 cのデ一夕が読み出された後は、次の V〇BU# k内のデータが読み出される。よって、ビデオピクチャ 24 cに同期して再生されるべき、 VOBU# ( i + 1 ) に格納された音声フレーム 2 5 cのデータは読み出されず、音声は再生されない。その結果、ユーザには途中で音声が途切れて聞こえる。

また、 V〇BU# kにおいても、その先頭のビデオピクチャに対応する音声フレームが V〇BU# k内の途中のどこから格納されているのかは VOBU毎に異なる。どこから格納されているかは、 V 〇 B U # kとそれ以前の VO B U (VOBU# (k— 1)) との相対関係で決定される。具体的にはプログラムストリームのビット量とシステムターゲットデコーダ（P— S TD) のバッファサイズによって決定される。したがって、仮に V〇B U # i内に同期して再生されるべき音声フレームが全てあったとしても、 V O B U # kと同期して再生されるべき音声フレームが直ぐに格納されているとは限らない。この理由によっても、ユーザには途中で音声が途切れて聞える。

本発明の目的は、プレイリスト等に基づいて映像および音声を再生する場合であっても、音声が途切れる期間を著しく少なくする、または音声が途切れる期間がないようにすることである。発明の開示

本発明によるデータ処理装置は、映像信号および音声信号が入力される信号入力部と、前記映像信号および前記音声信号を圧縮符号化して、映像デ一夕および音声データを生成する圧縮部と、前記映像デ一夕および前記音声データを分割してバケツトを複数生成し、前記映像データに関する映像パケットおよび前記音声データに関する音声パケットを多重化したデータ単位を複数生成し、複数の前記データ単位を含むデータストリームを生成するストリーム組立部と，前記データストリームを記録媒体に記録する記録部とを有している, 前記ストリーム組立部は、前記データ単位に含める映像パケットぉよび音声バケツトを少なくとも映像の再生時間に基づいて決定し、所定のデータ単位に格納された映像デ一夕に対応する音声データの全部が前記所定のデータ単位に含まれない場合には、前記音声デー夕のうち、少なくとも含まれない部分である部分音声データをコピ —したコピーデータを前記データストリーム内に含める。

前記ストリーム組立部は、前記データ単位に対応する前記コピーデータを、後続のデータ卓位の最初に配置された映像パケット内に格納してもよい。

前記ストリーム組立部は、前記デ一夕単位内に、対応する前記コピーデータを格納してもよい。前記ストリーム組立部は、前記コピーデータを、前記データストリーム内の専用の音声ストリーム内に格納してもよい。

前記ストリーム組立部は、前記コピーデータを、前記データストリーム内の専用のプライべ一トデ一タストリ一ム内に格納してもよい前記ストリーム組立部は、前記映像データに対応する前記音声デ —夕のすべてをコピーしたコピーデータを、前記所定のデータ単位に含めてもよい。

前記ストリーム組立部は、前記コピ一データを、前記データストリーム内の専用のプライべ一トデータストリーム内に格納してもよい _c 前記ストリーム組立部は、前記映像データに同期する前記音声デ —夕のすべてをコピーしたコピーデ一夕を、前記データストリーム内の専用の音声ストリーム内に格納してもよい。

前記ストリーム組立部は、前記映像データに同期する前記音声デ —夕のすべてをコピーしたコピーデ一夕を、前記データストリーム内の専用の音声ストリーム内に格納し、さらに前記コピーデータの転送タイミングを示す転送夕イミング情報として、前記コピー元のデータ単位内の転送タイミングょりも所定の時間だけ早くシフトした転送タイミングを規定して記録してもよい。

前記ストリーム組立部は、前記複数のデータ単位を含む第 1ファィルおよび前記コピーデータを含む第 2ファイルとして、前記デー夕ストリームを生成し、前記記録部は、前記データ単位とコピーデ一夕とを前記記録媒体に連続的に記録してもよい。

前記ストリーム組立部は、前記映像データに対応する前記音声デ一夕のすべてをコピーしたコピーデ一夕によって前記第 2ファイルを生成してもよい。

前記音声データにはレート情報が付加され、前記音声データは前記レート情報に応じたデータ長を有しており、前記圧縮部は第 1 レ —卜で前記音声信号を圧縮符号化して前記音声データを生成し、前記ストリーム組立部は、前記所定のデータ単位に含まれる前記音声データに対して、前記レート情報として前記第 1レートよりも早い第 2レートの値を設定して前記音声データを生成し、前記第 2レートに対して規定される第 2データ長と、前記第 1 レー卜に対して規定される前記音声データの第 1データ長との差分に対応する空き領域に、前記コピーデータを格納してもよい。

本発明によるデータ処理方法は、映像信号および音声信号を受け取るステップと、前記映像信号および前記音声信号を圧縮符号化して、映像データおよび音声データを生成するステップと、前記映像データおよび前記音声データを分割してパケッ卜を複数生成するステツプし、前記映像データに関する映像バケツトおよび前記音声デ一夕に関する音声バケツトを多重化したデータ単位を複数生成し、複数の前記データ単位を含むデ一タストリームを生成するステップと、前記データストリームを記録媒体に記録するステップとを包含する。前記データストリームを生成するステップは、前記データ単位に含める映像バケツトおよび音声バケツトを少なくとも映像の再生時間に基づいて決定し、所定のデータ単位に格納された映像デー夕に対応する音声データの全部が前記所定のデータ単位に含まれない場合には、前記音声デ一夕のうち、少なくとも含まれない部分である部分音声デ一夕をコピーしたコピーデータを前記データストリ —ム内に含める。

前記デ一タストリームを生成するステップは、前記データ単位に対応する前記コピーデータを、後続のデータ単位の最初に配置された映像パケット内に格納してもよい。

前記データストリームを生成するステップは、前記映像データに対応する前記音声データのすべてをコピーしたコピーデ一タを、前記所定のデータ単位に含めてもよい。

前記データストリームを生成するステップは、前記複数のデータ単位を含む第 1ファイルおよび前記コピ一データを含む第 2フアイルに基づいて、前記デ一タストリームを生成してもよい。

前記デ一タストリームを生成するステップは、前記映像データに対応する前記音声データのすべてをコピーしたコピーデータによつて前記第 2ファイルを生成してもよい。

前記音声データにはレート情報が付加され、前記音声データは前記レート情報に応じたデータ長を有しており、前記音声データを生成するステップは、第 1 レートで前記音声信号を圧縮符号化して前記音声データを生成し、前記前記データストリームを生成するステップは、前記所定のデータ単位に含まれる前記音声データに対して、前記レート情報として前記第 1 レートよりも早い第 2レートの値を設定して前記音声データを生成し、前記第 2レートに対して規定される第 2データ長と、前記第 1レートに対して規定される前記音声データの第 1データ長との差分に対応する空き領域に、前記コピーデータを格納してもよい。

本発明の記録媒体には、複数のデータ単位を含むデ一タストリ一ムが記録されている。前記複数のデ一夕単位の各々は、映像データに関する映像パケットおよび前記音声データに関する音声パケットが多重化して構成されている。前記映像データおよび前記映像デー夕に対応する音声データの一部は所定のデータ単位内に格納され、前記映像デ一夕に対応する前記音声データの他の一部である部分音声データは前記所定のデータ単位内に格納されていない。前記データストリームは、さらに前記部分音声データをコピーしたコピーデ一夕を含んでいる。

本発明によるデータ処理装置は、上述のデータストリームを受け取ってデコードし、映像信号および音声信号を出力する。データ処理装置は、データストリームに含まれるデータのうち、再生の対象となるデータの読み出しを指示する再生制御部と、前記再生制御部の指示に基づいて、前記データストリームの前記所定のデータ単位から前記映像データおよび前記映像データに対応する音声データの一部を読み出す読み出し部と、前記映像データおよび前記音声デー夕の一部をデコードして映像信号および音声信号を同期して出力するデコード部とを有している。前記再生制御部は、前記指示の後に前記コピ一データの読み出しをさらに指示し、前記デコード部は前記音声データの一部をデコードした後に前記コピーデータをデコードして前記映像信号と同期して出力する。図面の簡単な説明

図 1は、 V R規格に準拠した M P E G 2プログラムストリ一ム 1 0のデータ構造を示す図である。

図 2は、ビデオパック内の映像データによって構成される映像ストリームと、オーディォパック内の音声データによって構成される音声ストリ一ムとの関係を示す図である。

図 3は、データ処理装置 3 0の機能ブロックの構成を示す図である。

図 4は、 V R規格ストリーム 1 0のデータ構造を示す図である。図 5は、 V R規格ストリーム 1 0と光ディスク 1 3 1の記録領域との関係を示す図である。

図 6は、記録された V R規格ストリーム 1 0および管理情報が光ディスク 1 3 1のファイルシステムにおいて管理されている状態を示す図である。

図 7は、実施形態 1による V O B Uと、映像ストリームおよび音声ストリームとの関係を示す図である。図 8は、データ処理装置 3 0の記録処理の手順を示すフローチヤ一卜である。

図 9は、実施形態 2による VOBUと、映像ストリームおよび音声ストリームとの関係を示す図である。

図 1 0は、実施形態 3による VOBUと、映像ストリームおよび音声ストリームとの関係を示す図である。

図 1 1は、実施形態 4による VOB Uと、映像ストリームおよび音声ストリームとの関係を示す図である。

図 1 2は、実施形態 5による VOBUと、映像ストリームおよび音声ストリームとの関係を示す図である。

図 1 3は、実施形態 5の変形例による VOBUと、映像ストリ一ムおよび音声ストリームとの関係を示す図である。

図 1 4は、実施形態 6による VOBUと、映像ストリームおよび音声ス卜リ一ムとの関係を示す図である。

図 1 5は、 AC— 3規格の音声フレームのデータ構造および付加情報の位置およびサイズを示す図である。

図 1 6 (a) および（b) は、音声データの種類に応じたサブストリーム I Dを有するオーディオパックのデータ構造を示す図である。

図 1 7は、 MP E G— 1オーディオ規格の音声フレームのデータ構造を示す。発明を実施するための最良の形態 (実施形態 1)

以下では、本実施形態によるデータ処理装置の構成を説明し、あわせて、データ処理装置の処理に関連するデータストリームのデー夕構造を説明する。その後、データ処理装置が行う記録動作および再生動作を説明する。なお、本明細書では、データストリームの例として DVDビデオレコーディング規格（VR規格）に準拠した M P EG 2プログラムストリーム（VR規格ストリーム）を例に挙げて説明する。

図 3は、データ処理装置 3 0の機能ブロックの構成を示す。デー夕処理装置 3 0は、 DVD— RAMディスク、 B l u— r a yディスク（BD) 等の相変化光ディスク 1 3 1に代表される記録媒体に、リアルタイムで VR規格ストリーム 1 0を記録する記録機能を有する。また、データ処理装置 3 0は、記録した VR規格ストリーム 1 0を読み出して復号し、再生する再生機能も有する。ただし、本発明による処理を行う上で、データ処理装置 3 0は必ずしも記録機能および再生機能の両方を設けていなくてもよい。データ処理装置 3 0は、例えば据え置き型の装置、カムコーダである。

以下、データ処理装置 3 0の記録機能に関する構成を説明する。データ処理装置 3 0は、映像信号入力部 1 0 0と、音声信号入力部 1 0 2と、 MP EG 2 P Sエンコーダ 1 7 0と、記録部 1 2 0と、連続データ領域検出部 1 6 0と、記録制御部 1 6 1と、論理ブロック管理部 1 6 3とを有する。

まず、データ処理装置 3 0の記録動作の概要を説明する。 VR規格ストリーム 1 0を生成して記録する際、 MP E G 2 P Sェンコ一ダ 1 7 0の P S組立部 1 04 (後述）は、データ単位であるビデオオブジェクトュニット（Video Object Unit ； VOB U) に含めるビデオパックおよびオーディオパックを、少なくとも映像の再生時間に基づいて決定して VOBUを生成する。そして、同一の VOB U内に、映像に対応する音声の全てのデータが含まれない場合には, 少なくとも含まれない音声データをコピーしたコピーデータを VR 規格ストリーム 1 0に含めて記録する。ここで、「映像に対応する音声」とは、「映像と同期して再生される音声」を意味する。

コピーデータは、後続の VOBU内（例えば最初のビデオパック内のユーザデータ領域）に格納され、または、 VR規格ストリーム 1 0のファイルとは別の音声ファイルに格納される。または、同期して再生される映像および音声が 1つの VOBU内に収まるように、音声データがプライべ一トストリームとして格納されてもよいし、付加情報として格納されてもよい。

さらに、映像に対応する音声のデータすベてを異なる音声ストリームとして同じ VOBU内にインターリーブしてもよい。また、 V R規格ストリーム 1 0のファイルとは別の音声ファイルに格納してもよい。または、映像に対応する音声のデータすベてを、プライべ —トストリームとして格納してもよい。

以下では、図 3〜 6を参照しながらデータ処理装置 30の記録機能に関する各構成要素の一般的な機能を説明し、その後、図 7、 8 等を参照しながらデータ処理装置 3 0のデータ処理装置 3 0の具体的な記録動作を説明する。

映像信号入力部 1 0 0は映像信号入力端子であり、映像データを表す映像信号を受け取る。音声信号入力部 1 0 2は音声信号入力端子であり、音声データを表す音声信号を受け取る。例えば、データ処理装置 3 0がビデオレコーダである場合には、映像信号入力部 1 0 0および音声信号入力部 1 0 2は、それぞれチューナ部（図示せず）の映像出力部および音声出力部と接続され、それぞれから映像信号および音声信号を受け取る。また、データ処理装置 3 0がムーピーレコーダ、カムコーダ等である場合には、映像信号入力部 1 0 0および音声信号入力部 1 0 2は、それぞれカメラの C CD (図示せず) およびマイクから出力された映像信号および音声信号を受け取る。

MP E G 2— P Sエンコーダ 1 7 0 (以下、「エンコーダ 1 7 0 J と記述する）は、映像信号および音声信号を受け取り、 VR規格に準拠した MP E G 2プログラムストリーム（P S) 、すなわち， VR規格ストリーム 1 0を生成する。エンコーダ 1 7 0は、映像圧縮部 1 0 1と、音声圧縮部 1 0 3と、 P S組立部 1 04とを有する ₍ 映像圧縮部 1 0 1および音声圧縮部 1 0 3は、それぞれ映像信号および音声信号から得られた映像データおよび音声データを MP E G 2規格に基づいて圧縮符号化する。 P S組立部 1 04は、圧縮符号化された映像データと音声データを、それぞれ 2キロバイト単位のビデオパック及びオーディォパックに分割し、これらのパックがーつの VOBUを構成するよう順番に並べるとともに、先頭に RD I パック 2 7を付加して VR規格ストリーム 1 0を生成する。

図 4は、 VR規格ストリーム 1 0のデータ構造を示す。 VR規格ストリーム 1 0は複数の V〇 B Uを含んでいる。図 4には 2つの V 〇 B Uが記載されているが、より多く含んでいてもよい。 VR規格ストリーム 1 0内の各 VOBUは、複数のパックから構成されている。これらのパックおよび各パックに含まれる情報は図 1を参照しながら説明したとおりであるので、ここでは省略する。

以下、ビデオパック 1 2— 1等のデータ構造を説明する。ビデオパック 1 2は、 MP E G 2圧縮された映像（ビデオ）データ 1 2 a を格納している。なお、ビデオパック 1 2はパックヘッダ 1 2 b、およびビデオパックであることを特定する P E Sパケットヘッダ 1 2 cが含まれる。さらに VOBUの最初のビデオパックであればパックヘッダ 1 2 bの中にシステムヘッダ（図示せず）も含まれる。図 4に示すビデオパック 1 2— 1の映像データ 1 2 aは、後続のビデオパック 1 2 - 2以後の映像データ 1 2 d等とともに I フレーム 44のデータを構成する。さらに I フレームに続く Bフレーム 4 5または Pフレームを構成するビデオパックが続けて記録される。また、映像データ 1 2 aは、シーケンスヘッダ 4 1、ユーザデ一夕 42および GOPヘッダ 43を含んでいる。 MP E G 2規格では. ビデオフレームを複数まとめた「グループ ' ォブ · ピクチャ」

(Group Of Picture； GOP) が規定されている。シーケンスへッダ 4 1は、複数の G〇Pで構成されたシーケンスの先頭を表す。一方、 GOPヘッダ 4 3は各 GOPの先頭を表す。 G〇Pの先頭フレ —ムは Iフレームである。これらのへッダについては周知であるため、その詳細な説明は省略する。ユーザデータ 42は、シーケンスヘッダ 4 1および GOPヘッダ 43の間に設けられ、任意のデータを記述することができる。

シーケンスヘッダ 4 1、ユーザデータ 42および GOPヘッダ 4

3の先頭には、その各々を識別するための開始コードが付加されている。例えば、シーケンスヘッダ 4 1には " 0 0 0 0 0 1 B 3 " 、ュ一ザデータ 42には " 0 0 0 0 0 1 B 5 " 、および G O Pヘッダ 43には " 0 0 0 0 0 1 B 8 " である（いずれも 1 6進数表記）。ユーザデータ 42の読み出しは、次の GOPヘッダ 43の開始コ一ドが検出されるまで継続し、 G〇 Pヘッダ 4 3の開始コードが検出されると、それまでに得られたデータのうち、ユーザデータ 42の先頭ヘッダ B 5を除いた部分がユーザデータとして得られる。

なお、各 VO B U内の全 GO Pの再生時間は、原則として 0. 4 秒以上かつ 1. 0秒以下の範囲に収まるように調整されており、例外的に最後の VOBUの再生時間は、 0秒以上かつ 1. 0秒以下の範囲で調整されている。 VR規格ストリーム 1 0はリアルタイムで記録されるため、 0. 4秒未満のタイミングで記録が停止され得るからである。これらの範囲内であれば、各 VOBUについてビデオの再生時間の変動が許容される。

記録部 1 2 0は、記録制御部 1 6 1の指示に基づいてピックアツプ 1 3 0を制御し、記録制御部 1 6 1によって指示された論理プロック番号の位置から VR規格ストリーム 1 0のビデオオブジェクトユニット（V O B U ) を記録する。このとき、記録部 1 2 0は、各〇8 11を 3 2 バィト単位に分割し、その単位で誤り訂正符号を付加して一つの論理ブロックとして光ディスク 1 3 1上に記録する _c 一つの論理ブロックの途中で一つの V O B Uの記録が終了した場合は、隙間を開けることなく次の V O B Uの記録を連続的に行う。

図 5は、 V R規格ストリーム 1 0と光ディスク 1 3 1の記録領域との関係を示す。 V R規格ストリーム 1 0の各 V〇 B Uは、光ディスク 1 3 1の連続データ領域に記録される。連続データ領域は物理的に連続する論理ブロックから構成されており、この領域には最大レートでの再生時間にして 1 7秒以上のデータが記録される。デー夕処理装置 3 0は、論理ブロックごとに誤り訂正符号を付与する。論理ブロックのデ一夕サイズは 3 2 kバイトである。各論理ブロックは、 2 Kバイトのセクタを 1 6個含む。

連続データ領域検出部 1 6 0は、論理ブロック管理部 1 6 3によつて管理される光ディスク 1 3 1のセクタの使用状況を調べ、上述の時間長に相当するデータを格納可能な、未使用の連続した空き論理ブロック領域を検出する。

なお、連続再生保証のために 1 7秒以上の連続した空き論理プロック領域を常に検出することなく、例えば、余分な再生データの蓄積量を計算してトレースしながら、連続した空き論理ブロックのデ一夕サイズを動的に決定してもよい。すなわち、記録中のある時点で 2 0秒分の連続データ領域を確保できたときには、その続きとしては 1 4秒分の連続データ領域を確保して、連続再生を保証してもよい。

記録制御部 1 6 1は、記録部 1 2 0の動作を制御する。記録制御部 1 6 1は、 VR規格ストリーム 1 0をデータファイル（例えばフアイル名" VR— MOVIE. VR0" ) として記録するように記録部 1 2 0に指示し、光ディスク 1 3 1に記録させる。また、記録部 1 2 0は記録制御部 1 6 1から受け取った VR規格ストリームに対する管理情報ファイル（ファイル名 VR— MANGR. I F O) も光ディスク 1 3 1へ記録する。管理情報には、例えば VOBU毎のデータサイズ、含まれる映像フィールド数、および先頭の I フレームのデータサイズが含まれる。

記録制御部 1 6 1のより具体的な制御動作は以下のとおりである _c すなわち、記録制御部 1 6 1は、予め連続データ領域検出部 1 6 0 に指示を出して、連続した空き論理プロック領域を検出させておく _c そして、記録制御部 1 6 1は、論理ブロック単位の書き込みが発生するたびに当該論理ブロック番号を記録部 1 2 0に通知し、論理ブロックが使用済みになった場合には論理ブロック管理部 1 6 3に通知する。なお、記録制御部 1 6 1は、連続データ領域検出部 1 6 0 に対して連続した空き論理ブロック領域のサイズを動的に検出させてもよい。連続データ領域検出部 1 6 0は、 1つの連続デ一夕領域の残りが最大記録再生レート換算で、例えば 3秒分を切った時点で，次の連続データ領域を再検出する。そして、 1つの連続データ領域がー杯になると、記録制御部 1 6 1は次の連続データ領域への書き込みを指示する。図 6は、記録された VR規格ス卜リーム 1 0および管理情報が光ディスク 1 3 1のファイルシステムにおいて管理されている状態を示す。例えば UD F (Universal Disk Format) 規格のファイルシステム、または I S O/ I E C 1 3 3 4 6 (Volume and file structure of write - once and rewritable media using non- sequent ial recording for information interchange) ファイレシステムが利用される。図 6では、連続して記録された VR規格ストリーム 1 0がファイル名 VR— M〇 V I E. VR〇として記録されている。また、管理情報はファイル名 VR— MANGR. I F Oとして記録されている。各ファイルは、ファイル名及びファイル · ェントリの位置が、 F I D (File Identifier Descriptor) で管理される。さらに、ファイル · エントリ内のアロケーション ·ディスクリプ夕（Allocation Descriptor) を使って、 1つのファイルとそのファイルを構成するデータ領域を関係付ける。アロケーション - ディスクリプタにはファイルを構成するファイル■ェントリの位置として先頭セクタ番号が設定される。 VR規格ストリームファイルのファイル ·エントリは、各連続デ一夕領域（C D A ： Contiguous Data Area) a〜 cを管理するァロケ一シヨン · ディスクリプ夕 a 〜 cを含む。 1つのファイルが複数の領域 a〜 cに分かれている理由は、領域 aの途中に不良論理ブロック、書き込みができない P C ファイル等が存在したからである。一方、管理情報ファイルのファィル · エントリは、管理情報を記録する領域を参照するァロケーシヨン ·ディスクリプタ dを保持する。論理ブロック管理部 1 6 3は、記録制御部 1 6 1から通知された使用済み論理プロック番号によって論理プロック番号ごとの使用状況を把握して管理を行う。すなわち、論理ブロック番号を構成する各セクタ単位の使用状況を、 UD Fまたは IS0/IEC 13346のフアイル構成で規定されているスペース · ビット · ディスクリプ夕領域を用いて、使用済みもしくは未使用であるかを記録して管理することになる。そして、記録処理の最終段階において、ファイル · アイデンティファイア（F I D) 及びファイル 'エントリをディスク上のファイル管理領域へ書き込む。

なお、 UD F規格は IS0/IEC 13346規格のサブセットに相当する, また、相変化光ディスクドライブを 1 3 94インタフェース及び S B P— 2 (Serial Bus Protocol-2) プロトコルを介して P Cへ接続することにより、 UDFに準拠した形態で書きこんだファィルが P Cからも 1つのファイルとして扱うことが可能である。

次に、本実施形態によるデータ処理装置 3 0の具体的な記録動作を説明する。以下の説明においては、「対応する」という語は、同期して再生されるべき映像および音声、または、それらに関する映像データおよび音声データを表すとする。

いま、 P S組立部 1 04が、対応する映像データおよび音声デー夕のすべてが 1つの VO B Uに含まれていない V R規格ストリーム 1 0を生成したとする。上述のように、 VOBUは映像の再生時間等に基づいて定められるため、音声データの一部が、対応する映像データとは異なる以降の VO B Uに格納されていると考えればよい, なお、映像データと同じ VOBUに含まれる音声データは、整数個の音声フレームを含む。

図 7は、本実施形態による VOBUと、映像ストリームおよび音声ストリームとの関係を示す。最上段に MP E Gファイルとして設けられる VR規格ストリーム 1 0を構成する VOBUの集合を示し、 2段目が各 VOBUに含まれる映像デ一夕の集合、 3段目が映像デ —夕の集合に対応する音声データの集合を表す。 VOBU# iに含まれる映像データを V ( i ) などと表す。映像データ V ( i.) に同期して再生される音声データは音声データ A_Q ( i ) などと表す。最上段に MP E G— 2プログラムストリームを構成する V〇 B Uを示す。第 2段に各 V〇 B Uに格納される映像フレームの集合を示す ₍ 第 3段にそれぞれの映像フレームの集合と同期して再生される音声デ一夕 Ao ( i ) の格納位置と VOBU境界との位置関係を縦の点線で示す（以降の図 9、 1 0、 1 1、 1 2、 1 3、 1 4も概ね同様である）。

上述した想定の下では、映像データ V ( i ) に同期して再生される音声データ A。（ i ) の格納位置は VOBU#iの途中から始まり. 末尾は VOBU ( i + 1 ) の先頭部分に格納されている。図 7では- V〇BU# ( i + 1 ) の先頭から音声データ A_Q ( i + 1) の前までに格納されているデータ Aが、映像データが格納されている VO BU# i とは異なる V〇BU# ( i + 1 ) に格納されることになつた音声データに相当する。この音声データを、以下「分離格納デ一夕」と称する。 P S組立部 1 04は、 V〇BU# iおよび V〇BU# ( i + 1 ) の生成時に、分離格納データと同じ内容を表すコピーデータを生成する。そして、そのコピーデータを、 VOBU# iの次の VOBU # ( i + 1 ) の先頭のビデオパック以降に格納する。具体的には、コピーデータを先頭のビデオパックのユーザデータ領域（例えば図 4のユーザデータ領域 4 2 ) に格納する。コピーデータをユーザデ一夕領域 42に格納することは、映像および音声の各データをすベて 1つの VR規格ストリーム 1 0 ( 1つのファイル）内に格納することを意味している。なお、コピーデ一夕とは、分離格納データの音声データそのもののコピーを意味する。

なお、このとき、エレメンタリーストリームのみをコピーしてもよいし、パック単位でコピーしてもよい。だだし、パック単位のコピ一を実施する場合、オーディオパックのパックヘッダの S CR値は、転送夕イミングとしての意味を持たせる必要はないのでコピー値のままでよい。また、パック内の P E Sパケットヘッダ内の P T S値はそのまま利用可能となる。

さらに、 P S組立部 1 04は、 V〇BU# ( i + 1 ) および # ( i + 2) の生成時にも、映像データ V ( i + 1 ) に対応する音声データ A。（ i + 1 ) のうち、 VOBU# ( i + 2) に格納される分離格納データと同じ内容を表すコピーデータを生成する。そしてそのコピーデ一夕を、 V〇BU# iの次の VOBU# ( i + 1) の先頭のビデオパックに格納する。

なお、 P S組立部 1 04は、映像のどのピクチャと音声のどのフレームとを同期して再生させるべきか把握して P T Sを付加する機能を有しているため、音声データ A。のうち、どの部分が分離格納デ一夕であるかを把握している。よって、分離格納データを特定することは容易である。

図 8は、データ処理装置 3 0の記録処理の手順を示すフローチヤートである。まずステップ S 8 1において、映像信号入力部 1 0 0 および音声信号入力部 1 0 2は、それぞれ映像信号および音声信号を受け取る。ステップ S 8 2において、映像圧縮部 1 0 1および音声圧縮部 1 0 3は、各信号から得られた映像データおよび音声デー夕を圧縮符号化する。

P S組立部 1 04は、次のステップ S 8 3において、映像の再生時間等に基づいて VOBU# iを生成する。なお、 VOBU# i内のビデオパック等の各パックの配置（順序）は、システムターゲットデコーダモデルの規定に従って決定される。例えば各パックの配置（順序）は、プログラムストリーム · システム · ターゲット ·デコーダ（P— S TD) モデルにおいて規定されたバッファ容量の規定を満たすように決定される。

次に、ステップ S 84において、対応する映像データおよび音声データが同一の VO BU内に格納されるか否かを判定する。同一の VOBU内に格納される場合には、生成した VOBUのデ一夕を順次記録部 1 2 0に送る。そして記録部 1 2 0はそのデータを光ディスク 1 3 1に記録する。その後、ステップ S 8 3からの処理が繰り返される。対応する映像データおよび音声データが同一の V〇 BU内に格納されない場合、すなわち、後続の VOBUに、映像データに対応する音声デ一夕の一部分のデータ Aを分離格納データとして格納することになつたときは、処理はステップ S 8 5に進む。ステップ S 8 5では、 P S組立部 1 04は、分離格納データ（図 7の部分データ A) を次の VOBU# ( i + 1 ) の先頭のビデオパックのユーザデ一夕領域に記述して記録部 1 2 0に出力する。記録部 1 2 0はそのデータを光ディスク 1 3 1に記録する。

その後、ステップ S 8 6において、 P S組立部 1 04は全ての映像データおよび音声デ一夕を処理したか否かを判定する。処理が終了していない場合にはステップ S 8 3からの処理を繰り返し、処理が終了した場合には、記録動作を終了する。

次に、再び図 3を参照しながら、データ処理装置 3 0の再生機能に関する各構成要素の機能を説明し、その後、データ処理装置 3 0 の再生動作を説明する。

データ処理装置 3 0は、映像表示部 1 1 0と、音声出力部 1 1 2 と、再生部 1 2 1と、変換部 1 4 1と、出力インターフェース部 1 40と、再生制御部 1 6 2と、プレイリスト再生制御部 1 64と、 MP EG 2 P Sデコーダ 1 7 1とを有する。

映像表示部 1 1 0は映像を出力するテレビ等の表示機器であり、音声出力部 1 1 2は映像および音声を出力するスピーカ等である。なお、映像表示部 1 1 0および音声出力部 1 1 2はデータ処理装置 3 0の必須の要素ではなく、外部機器として設けられていてもよい, 再生部 1 2 1は、再生制御部 1 6 2の指示に基づいて光ピックアツプ 1 3 0を介して光ディスク 1 3 1から読み出されたアナログ信号としての VR規格ストリ一ム 1 0を、デジタル信号として再生する _c 再生制御部 1 6 2は、再生の対象となる V〇 B Uおよびその VO B Uに含まれるデータを特定して、そのデータの読み出しを光ピックアップ 1 3 0に指示する。プレイリスト再生制御部 1 64は、ユーザが指定した順序で動画の各シーンを再生する。各シーンは、例えば VOB U単位で管理される。

MP E G 2—P Sデコーダ 1 7 1 (以下、「デコーダ 1 7 1」と記述する）は、プログラムストリーム分解部 1 1 4、映像伸長部 1 1 1および音声伸長部 1 1 3を有する。プログラムストリ一ム分解部 1 1 4 (以下「P S分解部 1 1 4」と記述する）は、 VR規格ス卜リーム 1 0から映像デ一夕および音声データを分離する。映像伸長部 1 1 1は、 MP E G 2規格に基づいて圧縮符号化された映像デ —夕をその規格にしたがってデコ一ドして映像信号として出力する < 音声伸長部 1 1 3も同様に、 MP E G 1—才一ディォ規格に基づいて圧縮符号化された音声デ一夕をその規格にしたがってデコードして音声信号として出力する。

まず、データ処理装置 3 0の一般的な再生動作を説明する。デー夕処理装置 3 0が記録された VR規格ストリーム 1 0を再生するときは、光ディスク 1 3 1からのデータの読み出しと読み出したデー夕のデコード（再生）を並列的に行う。このとき、デ一夕の最大再生レートよりもデータの読出レートの方が高速となるように制御して、再生すべきデータが不足しないように動作する。その結果、 V R規格ストリーム 1 0の再生を継続すると、単位時間あたり、デー夕最大再生レートとデータ読み出しレートとのレート差分だけ再生すべきデータを余分に確保できることになる。デ一夕処理装置 3 0 は、ピックアップ 1 3 0がデータを読み出しできない期間中（例えばシーク動作中）に余分に確保したデータを再生することにより、途切れのない VR規格ストリーム 1 0の再生を実現することができる。

例えば、再生部 1 2 1のデータ読み出しレートが 1 1. 0 '8 M b p s、 P S分解部 1 1 4のデ一タ最大再生レートが 1 0. 0 8 Mb p s、ピックアツプの最大移動時間が 1. 5秒とすると、途切れることなく VR規格ストリ一ム 1 0を再生するためには、ピックアツプ 1 3 0の移動中に 1 5. 1 2 Mビッ卜の余分なデータが必要になる。これだけのデータを確保するためには、 1 5. 1 2秒間の連続読み出しが必要になる。すなわち、 1 5. 1 2 Mビットを、デ一夕読み出しレート 1 1. 0 8 Mb p s とデータ最大記録再生レート 1 0. 0 8 Mb p sの差で除算した時間だけ連続読み出しする必要がある。したがって、 1 5. 1 2秒間の連続データ読み出しの間【こ最大 1 6 7. 5 3 Mビット分のデータ（すなわち 1 6. 6 2秒分の再生デ一夕）を読み出すことになるので、 1 6. 6 2秒（約 1 7秒）分以上の連続データ領域を確保することにより、連続的なデータ再生を保証することが可能となる。なお、連続デ一夕領域の途中には、数個の不良論理ブロックがあってもよい。ただし、この場合には、再生時にかかる不良論理プロックを読み込むのに必要な読み出し時間を見越して、連続データ領域を再生時間にして 1 6. 6 2秒分よりも若干多く確保する必要がある。

次に、データ処理装置 3 0の具体的な再生動作を説明する。まず、 VR規格ストリーム 1 0の先頭から順に映像および音声を再生する際のデータ処理装置 3 0の動作を説明する。

再生制御部 1 6 2は、再生の対象となる VO B Uを特定し、その最初から順次データを読み出すように光ピックアップ 1 3 0に指示する。 P S分解部 1 1 4は、ピックアップ 1 3 0および再生部 1 2 1を介して再生された VR規格ストリ一ム 1 0を映像デ一夕および音声データに分離する。映像伸長部 1 1 1および音声伸長部 1 1 3 は、それぞれ映像データおよび音声データをデコードし、その結果得られた映像信号に基づく映像を映像表示部 1 1 0において表示し、音声信号に基づく音声を音声出力部 1 1 2において出力する。

次に、ュ一ザが希望する VOBUの再生順序を規定した「プレイリスト」に基づいて、デ一夕処理装置 3 0が光ディスク 1 3 1に記録された VR規格ストリーム 1 0を再生する動作を説明する。

いま、プレイリストのある一部分が VOBU# iの再生後に VO BU# k (k≠ ( i + 1 ) ) の再生を指定しているとする。プレイリスト再生制御部 1 64は、まず VOBU# iの読み出しを光ピックアップ 1 3 0に指示する。 P S分解部 1 1 4は、光ピックアップ 1 3 0および再生部 1 2 1を介して再生された VOB U# i のデー夕を映像デ一夕および音声データに分離してデコードし出力する。このとき、 VOBU# iの最初に存在するビデオパックのユーザデ一夕領域にデータが記述されている場合には、そのデータは V〇 B U# iの映像に対応する音声のデータではないため無視する。

そして、 VOBU# iの最後までデータが読み出されると、プレィリスト再生制御部 1 64は、後続の VO B U # ( i + 1 ) の最初に存在するビデオパックのュ一ザデータ領域のデータを読み出すように光ピックアップ 1 3 0に指示する。このデータは、 V〇BU# i に含まれる映像に対応する音声に関する分離格納データであるから、音声伸長部 1 1 3は、 V〇BU# i内の音声デ一夕のデコード後にその分離格納データをデコードして音声として出力する。その後、プレイリスト再生制御部 1 64からの指示に基づいて次の再生対象である VO B U # kのデータが読み出され、 P S分解部 1 1 4 は、再生部 1 2 1を介して次の再生対象である V〇BU# kのデ一タを得て、デコードして出力する。

V〇 B Uの先頭には RD Iパックが配置され、その次にはビデオパックが配置されるので、後続の V O B Uの最初のビデオパック内の分離格納データを読み出すことは容易かつ迅速に実現できる。また、 VOBU先頭付近の複数のビデオパックに亘つて分離格納デー夕が記録される.場合も同様である。データ処理装置 3 0は再生時にその分離格納データをも読み出すことにより、 VOBUに含まれる映像に対応する音声のすべてのデータが得られるため、音声が途切れることなく再生される。なお、音声データ A o ( i ) 内の分離格納データを VOBU ( i + 1 ) の先頭ビデオパックのユーザデータ内に格納する代わりに、 V〇BU ( i ) 内のプライべ一トストリ一ム内に格納して多重してもよい。

なお、データ処理装置 3 0は、記録したデータを上述のようなストリームの分離およびデコードを介することなく出力することもできる。すなわち、変換部 1 4 1は読み出された VR規格ストリーム 1 0を所定のフォーマツト（例えば DVDビデオ規格のフォーマツト）に変換し、出力インタフェース部 1 4 0は変換後のストリームを出力する。このときも、読み出すべき VR規格ストリーム 1 0の VOB Uのデ一夕に加えて、後続の V〇 BUの最初に存在するビデォパックのユーザデータ領域のデータを読み出すことにより、出力先の機器においても音声の途切れがない再生が可能になる。なお、出力インタフェース部 1 4 0は、例えば I E E E 1 3 94規格に準拠したイン夕一フェースであり、外部機器からのデータの読み出しおよび外部機器からのデ一夕の書き込み処理を制御することが可能である。

続く実施形態 2以降の各実施形態は、本実施形態のデータ処理装置 3 0の記録 ·再生動作に関する種々のバリエーションである。実施形態 1で説明したデータ処理装置 3 0の各構成要素は、以下の実施形態においても、特に説明しない限り同じ機能を有するとする。

(実施形態 2)

実施形態 1では、 VR規格ストリーム 1 0には、対応する映像ストリームおよび音声ストリームがそれぞれ 1つずつ格納されているとし、音声データのうち、映像データと同じ VOBUに格納されないデータ（分離格納データ）のコピーを後続の V〇 B Uの映像デー夕内（ビデオパック内）に格納していた。

本実施形態では、対応する各 1つの映像ストリームおよび音声ストリームに加えて、その音声ストリームのデータをコピーした別の音声ストリームをさらに記録する。以下、本実施形態の記録動作を具体的に説明する。

図 9は、本実施形態による VOBUと、映像ストリームおよび音声ストリームとの関係を示す。この VR規格ストリーム 1 0は、実施形態 1と同様 1つの MP E Gファイルとして規定されているが、実施形態 1 と異なり 2つの音声ストリームが多重されている。いま、映像ストリームに対応する音声ストリームを「音声ストリーム # 0」とする。音声ストリーム # 0では、分離格納データが存在している。

P S組立部 1 0 4は、音声ストリーム # 0のデータのコピ一を、別の音声ストリーム # 1 として光ディスク 1 3 1に記録する。より具体的には、 P S組立部 1 04は、 V〇 BU# i に含まれる映像に対応する音声のストリーム # 0のデータをコピーして、音声ストリーム # 1のオーディオパックを生成する。そして、それらのオーディォパックを VR規格ストリーム 1 0の VOBU# i内に多重化する。音声ストリーム # 0および # 1は、それぞれ、各パックのパケットヘッダに記述されたストリーム I Dによって識別可能である。なお、コピーされるデータの容量は、プログラムストリームのシステム ■ ターゲッ卜 ·デコーダ（P— S TD) の音声パッファが許容する範囲内である等の制限を満たす必要がある。図 9では、音声ストリーム # 0を構成する音声データ A。（ i ) 、 A。（ i + 1 ) 、 A。（ i + 2 ) 等をコピーしたデ一夕が、 ( i ) 、 A ₁ ( i + 1 ) 、 A₁ ( i + 2) 等として格納される。

ただし、音声ストリーム # 1と音声ストリーム # 2のビットレ一トは同じであるものとしているので、 A o ( i ) のコピーデータが VOBU# i内に格納できるとは限らない。 V〇BU# i内の映像フレームの総再生時間と、 V〇BU# i のデータの総転送時間（V OBU# i先頭の S CR値と V〇BU# i + 1先頭の S C R値との差分）が等しい場合は A o ( i ) のコピーデータがちょうど格納可能となる。

ただし、映像に対応する音声を途切れることなく再生するためには、 VOBU# iの読み出しの終了に合わせて、その映像に対応する音声のデータを可能な限り多く取得する必要がある。そこで、 P S組立部 1 04は、音声ストリーム # 0に関するオーディオパックに付される MP E G規格の S C Rおよび PT Sを修正して、音声ストリ一ム # 1についての S CRおよび P T Sを生成する。すなわち、 P S組立部 1 0 4は、同じ音声を表すデ一夕を格納したパックに関してみたとき、音声ストリーム # 1のオーディオパックに付される S C Rおよび P T Sの値を、音声ストリーム # 0のパックに付される S C Rおよび P T Sの値よりも所定量だけ小さく設定する。 S C Rおよび P T Sがより小さくなると、そのパックは、 VR規格ストリーム 1 0内のパック配列上より早く読み出される位置に配置し得るからである。よって、実施形態 1における分離格納データに相当する VOBU# ( i + 1) 内のデ一夕を、 V〇BU# i内により多く格納できるようになる。

P S組立部 1 04は、 S C Rおよび P T Sを小さく設定した量を示す変化量データを、例えば VOBU# iの最初に配置されたビデォパックのユーザデータ領域 42に記述しておく。

次に、本実施形態によるデータ処理装置 3 0の再生動作を説明する。以下の説明はプレイリストに基づく再生時において特に有効であるため、その場合を例にして説明する。

プレイリスト再生制御部 1 64は、光ディスク 1 3 1に記録された VOBU# iの映像のデコードにあわせて、ストリーム # 0ではなく、ストリーム # 1をデコードする。 VOBU# i内に格納されている映像データに対応する音声データは、ストリーム # 0よりもストリーム # 1のデータのほうが多いからである。

ただし、複製データを持つ音声ストリーム # 1の音声ストリーム

# 0に対する時間シフト量を記録する必要がある。その理由は上述のように、ストリーム # 1の各オーディォパックの S C Rおよび P T Sはストリーム # 0よりも小さい値に設定されているため、そのままでは映像と同期して再生させることはできないからである。よつて、 P S分解部 1 1 4は、 VOBU# iの最初に配置されたビデォパックのユーザデータ領域 42から、再生タイミングのシフト量を読み出して、この値を P T Sに加算して、すなわち再生時間を遅らせて音声を再生する。これにより、映像と音声を同期して再生でさる。

例えば VOBU# iの先頭映像フレームと同期する音声ストリーム # 0の音声フレーム AF # 0の PT Sと、 AF # 0のコピーデー夕を含む音声フレームの P T Sとの差分値を、動画ストリームファィル " VR— MOV I E. VRO" に対する管理情報ファイル内に記録してもよい。また、差分値を各 VOBUの RD Iパック内のメ一力独自デ一夕領域へ記録してもよい。これにより、再生制御部は、 V〇BU# i を再生する場合に、 VO B U先頭の映像フレームの夕ィムスタンプ値から差分値を減算し、その減算結果以降の音声ストリーム # 1に含まれる音声フレームを再生すればよいことになる。また、 VOBU毎に RD Iパック内のメーカ独自データ領域の中に再生夕イミングのシフト量を記録してもよい。

なお、 P Cに接続された光ディスクドライブを介して P Cの再生アプリケーションソフトが記録済みの動画ファイルを再生する場合は、音声ストリーム # 0の方が再生される。すなわち、動画フアイルを一般的な MP E Gファイルとして再生される場合には音声ストリーム # 0が使われる。

各 VO B U内に対応する全ての音声のデータが含まれない場合であっても、音声ストリーム # 0に関して生じていた分離格納データのデータ量は相当程度小さくすることができるので、プレイリストに基づく再生において、音声のほぼシームレスな再生を実現できる < なお、音声ス卜リーム # 1の記録内容に関する情報を別途記録してもよい。例えば、音声ストリーム # 1内に音声ストリーム # 0の複製データが格納されていることを示すフラグを動画ストリームフアイル " VR— MO V I E. VRO" に対する管理情報ファイル内に記録してもよい。このフラグは少なくとも VOB単位で記録するのが望ましい。また、動画ストリーム VOB内、もしくは音声ストリーム # 1内等に記録してもよい。このフラグにより、音声ストリーム # 1内に音声ストリ一ム # 0とは別の音声が格納されているのか、音声ストリーム # 0のコピーが格納されているのかを区別可能になる。

(実施形態 3)

実施形態 1では、分離格納データはビデオパック内のユーザデー夕領域 42に格納されていた。

本実施形態では、データ処理装置 3 0は、 VR規格ストリーム 1 0を規定する MP E Gファイルとは別のファイルのデ一夕として分離格納デ一夕を記録する。

図 1 0は、本実施形態による V〇 B Uと、映像ストリームおよび音声ストリームとの関係を示す。 P S組立部 1 04は、 VOBU# i の生成時に、その VOBUに関連する分離格納データを特定すると、分離格納データをコピーした音声データ # i を生成する。そして、 P S組立部 1 04は、その音声データと VR規格ストリーム 1 0を構成する各 VOBUとを物理的に交互に記録する。各音声デー夕および各 V〇 B Uはそれぞれ、ひとつの音声ファイルおよびひとつの MP E Gファイルとして記録される。 P S組立部 1 04は、音声デ一タ # i を V〇BU# iの直後にィンターリーブする。一方、プレイリストに基づく再生時には、プレイリストが VOB U# i の再生後に V〇BU# k (k≠ ( i + 1 ) ) の再生を指定しているときであっても、ブレイリスト再生制御部 1 6 4は VOBU # iだけでなく後続の音声デ一タ# i までを読み出し、その後、次に再生すべき V〇BU# kのデータを読み出す。そして、 P S分解部 1 1 4において映像データと音声データとに分離した後、映像伸長部 1 1 1および音声伸長部 1 1 3は映像データおよび音声データをデコードして出力する。特に、音声伸長部 1 1 3は、 VOBU# i内に含まれていたオーディォパック内の音声データのデコ一ドぉよび再生した後、音声データファイルに含まれていた音声データ # i をデコードし再生する。

再生対象の VOB Uの次に分離格納デ一夕に関する音声データが格納されているので、その音声データを連続的に読み出すことは容易かつ迅速に実現できる。データ処理装置 3 0は再生時にその分離格納データをも読み出すことにより、 V〇 B Uに含まれる映像に対応する音声のデータがすべて得られるため、音声が途切れることなく再生される。

なお、本実施形態では対応する VOB Uの直後に分離格納データのコピーを記録したが、対応する VOBUの直前に記録してもよい _c (実施形態 4)

実施形態 3では、データ処理装置は、音声ストリームのうちの分離格納デ一夕のみに基づいて MP E Gファイルとは別の音声フアイルを生成し記録していた。また、例えば V〇BU# i に関連する音声データ # iは、 VOBU# iの直後に記録されていた。

一方、本実施形態によるデータ処理装置は、音声ストリームのすぺてのデータに対して、 MP EGファイルとは別の音声ファイルを生成し記録する。さらに、各 V〇BUに関連する音声データは、その VO B Uの前に記録される。

図 1 1は、本実施形態による VOBUと、映像ストリームおよび音声ストリームとの関係を示す。 P S組立部 1 04は、 V〇BU# i の生成時に、その VOBUに含まれる映像データ V ( i ) に対応する音声データ A_Q ( i ) を特定すると、音声データ A。（ i ) を構成するデータをコピーした音声データ # i を生成する。そして、 P S組立部 1 04は、その音声データと VR規格ストリ一ム 1 0を構成する各 VOB Uとを物理的に交互に記録する。各音声データおよび各 V〇 B Uはそれぞれ、ひとつの音声ファイルおよびひとつの MP E Gファイルとして記録される。 P S組立部 1 0 4は、音声デ —夕 # i を VOBU# iの直前にインターリーブする。

一方、プレイリストに基づく再生時には、プレイリスト再生制御部 1 64は、 V〇BU# i の読み出しの前に音声データ # iの読み出しを先に行うように指示する。すると、 V〇BU# iの読み出しが終了する前に、音声データ # iの読み出しが終了し、さらに、音声伸長部 1 1 3によるデコードが終了するので、 V〇BU# iの映像に同期して、すべての音声を再生できる。よって、後に VOBU # k ( k≠ ( i + 1 ) ) の再生を指定しているときであっても、音声のシ一ムレスな再生を実現できる。なお、本実施形態では VOBU# iの前に音声データ # i を記録するとして説明したが、実施形態 3と同様に、 VOBU# iの後に音声データ # iを記録してもよい。このときは、 V〇BU# iの再生後、他の V〇BUの読み出しを開始する前に、音声データ # i を読み出す必要がある。

上述の実施形態 3および 4では、音声ファイル内のデータの構造には特に言及していないが、音声のエレメンタリ一ストリームであつてもよいし、音声ストリームを含む MP E G 2プログラムストリームであってもよいし、音声ストリ一ムを含 MP 4ストリームであつてもよいし、その他のシステムストリームであってもよい。

(実施形態 5)

実施形態 1では、 VOBU# i に関連する分離格納データを、次の V〇 BU # ( i + 1 ) に格納するものとした。

一方、本実施形態では、 VOBU# i に関連する分離格納データをその VOBU# i に別のストリームとして格納する。

図 1 2は、本実施形態による VOBUと、映像ストリームおよび音声ストリームとの関係を示す。 P S組立部 1 04は、 VOBU# i に関連する分離格納データ Aをコピーして、 VOBU# i内に分離格納データ Aの部分専用のプライべ一トス卜リームとして多重化する。

VR規格ス卜リーム 1 0では、そのストリ一ムに含まれる映像ストリームおよび音声ストリ一ムを識別するために、ストリーム I D が付されている。ストリーム I Dは P E Sパケットヘッダに格納されており、例えば映像ストリームのストリーム I Dは、例えば O x E 0、音声ストリームのストリーム I Dは O x C Oまたはは O x B Dである。 O x BDは MP E G— 2システム規格でプライべ一トストリーム用に規定された値である。 VR規格において音声ストリームに 0 X B Dを使用する場合は、さらに P E Sパケットヘッダの直後の 1バイトによりその音声ストリームの圧縮符号を識別する。本実施形態において新たに設けるプライべ一トストリームのストリーム I Dとして、 O xBDが用いられる。

プレイリストに基づく再生時には、プレイリス卜が VOBU# i の再生後に VOBU# k (k≠ ( i + 1 ) ) の再生を指定しているときであっても、音声ストリーム # 0に続けてプライべ一トストリームとして含まれている分離格納データ Aを読み出して再生するので、音声を途切れなくすることが容易に実現可能になる。

なお、プライべ一トストリームに、分離格納データ Aのみでなく音声ストリームの全体のデ一夕をコピーして、 V〇BU# i内に分離格納データ Aの部分専用のプライべ一トストリームとして多重化することもできる。図 1 3は、本実施形態の変形例による VOB U と、映像ストリームおよび音声ストリームとの関係を示す。

P S組立部 1 04は、 VOBU# i に含まれる映像に対応する音声デ一夕のコピーを、 VO B U# i内の専用のプライべ一トストリーム 1 ( s t r e am— I D= 0 X B D) として記録する。このプライべ一トストリーム用のシステム · ターゲット ·デコーダのバッファサイズは少なくとも音声データ 2秒分を蓄積可能なサイズを有するとする。ここで「2秒」の意味は、 VOB Uに含まれる映像の最大の再生時間（ 1秒）とシステム · ターゲット ·デコーダの最大再生遅延時間（ 1秒）を加算した数値である。

プレイリストに基づく再生時には、プレイリストが VOBU# i の再生後に VOBU# k ( k Φ ( i + 1 ) ) の再生を指定しているときであっても、常にプライベートストリーム 1に格納された音声デ一夕 # 0のコピーの音声データを再生すれば音声を途切れなくすることが容易に実現できる。

本実施形態のように、音声ストリームをコピーしたデータをブラィペートストリームとして記録することにより、 MP E Gファイルの VO B U単位で編集する場合において、音声デ一夕を容易にシームレス再生することができる。その理由は、例えば、 2つの VOB Uを結合する編集処理を行ったときには、それらの V〇 B Uに含まれるプライベートストリームも結合され、結合された分離格納デー夕が得られるからである。

(実施形態 6)

実施形態 5の第 1の例では、 P S組立部 1 0 4は、 V〇B U# i に関連する分離格納データ Aを、 VOB U# i内のプライべ一トストリームとして格納した。

一方、本実施形態では、 V〇B U# i に関連する分離格納データ

Aのコピーを、 VO BU# iの音声フレーム内に付加データとして記録する。

図 1 4は、本実施形態による VOBUと、映像ストリームおよび音声ストリームとの関係を示す。 P S組立部 1 04は、 VOBU# iの音声ストリーム # 0に関連する分離格納データ Aを、 VOBU # iの音声フレーム内の付加デ一夕（AD)領域内にコピーして格納する。

図 1 5は、音声圧縮部 1 0 3が生成する AC— 3規格の音声フレ一ムのデ一夕構造を示す。 A C— 3の音声フレームは、同期情報 (S I ) 、ビットストリーム情報（B S I ) 、音声ブロック（AB nから AB n + 5) および付属情報（AD) から構成される。

同期情報（S I ) には、音声フレームのビットレートを示すレート情報が記録される。本実施形態では、音声フレームのビットレートは 448 k b p sであるとしている（フレームサイズコードが 4 4 8 k b p sを示す）。音声フレームは、同期情報（S I ) に規定されたビットレートの情報に応じたデータ長（図 1 5に示す 1 7 9 2バイト）を有している。ただし、音声圧縮部 1 0 3は、実際には同期情報、ビットストリーム情報、および音声ブロックの有効デー夕を 2 5 6 k b p s以下のビットレ一卜で記録し、付属情報領域は後から記録する分離格納データ Aのために空けておく。

これにより、 448 k b p sのデ一夕レートに対応する 1フレーム分のデータ長（ 1 7 9 2バイト）と、 2 5 6 k b p sのデータレートに対応する 1フレーム分のデータ長（ 1 0 24バイト）との差分、 1 9 2 k b p s分のデータ長（ 7 6 8バイ卜）の付属情報領域が確保されることになる。 P S組立部 1 04は、その付属情報領域内に図 1 4に示す分離格納データ Aのコピーデータを格納する。分離格納データ Aに対応する音声の平均ビットレ一トは、 44 8 k b p sのデータと 2 5 6 k b p s との差分以下である、 1 9 2 k b p sであるものとする。 '

以上のように当初から記録される音声ストリ一ムの各音声フレーム内に空き領域を設け、その空き領域に分離格納データをコピーすることにより、 VOBU内に格納されなかった音声データ（分離格納データ）を実質的に格納できる。

プレイリストに基づく再生時には、 V〇 B Uのデータの読み出しが終わると、 P S分解部 1 14がデータストリームを解析することにより、音声伸長部 1 1 3は従来のデータ構造では得ることができない分離格納データ Aのコピーデータを得ることができる。これにより、通常では音声が途切れる映像の場面においても、映像に同期して音声がシームレスに再生できる。

同期情報（S I ) において規定しているビットレートの半分のビットレートを実際のビットレートに充て、残り半分を分離格納デ一夕のビットレートに充ててもよい。例えば、 AC— 3の音声ストリ —ムは 448 k b p sで、実際のビットストリ一ムが 2 24 k b p s、分離格納デー夕のピットストリームも 2 2 4 k b p s としてもよい。音声フレームをこのように構成することにより、音声ストリーム # 0の音声データを全て付属情報領域へ格納することができる ₍ なお、分離格納データのコピーである音声ストリームは、 AC— 3 規格に準拠した音声フレームが連続した形態であってもよく、さらに、分離格納データ Aの 1個の音声フレームが、 2個の AC— 3規格の音声フレームに亘つて付属情報内に記録されてもよい。また、分離格納データのデ一夕構造は、音声のエレメンタリーストリームを含む MP E G 2プログラムストリームであってもよいし、その他のシステムストリームであってもよい。

なお、本実施形態では分理格納データのみが付属情報領域内に格納されるものとしたが、記録スペースを確保可能であれば音声ストリーム # 0を全て格納してもよい。

(実施形態 7)

実施形態 6では、分離格納データ Aを AC— 3規格の音声フレームの付加情報（AD) 領域へ格納した。本実施形態では、 MP E G 一 1 オーディォ規格の音声フレーム内の付加データ (ancillary_data) 領域へ分離格納データ Aを格納する。他の構成は実施形態 6と同様である。

図 1 7は本実施形態における MP E G— 1オーディォ規格の音声フレームのデータ構造を示す。 MP E G— 1オーディオ規格の音声フレームは、ヘッダ、エラーチェック、音声データおよび付加デー夕（ancillary_data)を有しており、音声圧縮部 1 0 3は、図 1 7に示すデータ構造を有する音声フレームを生成する

へッダには音声フレームのビットレート、サンプリング周波数、およびレイヤを示す情報が記録される。本実施形態では、それぞれ 3 84 k b p s、 4 8 kH z、およびレイヤ 2であるとしている。このとき、各音声フレームは、ヘッダに規定されたビットレートの情報に応じたデータ長を有している。ただし、音声圧縮部 1 0 3は、実際にはヘッダ、エラーチェック、および音声データの合計が 2 5 6 k b p s相当以下となるように記録し、付加データ領域は後から記録する分離格納データ Aのコピーのために空けておく。

これにより、 3 84 k b p sのデ一夕レ一トに対応する 1フレ一ム分のデータ長（ 1 1 5 2バイト）と、 2 5 6 k b p sのデータレートに対応する 1フレーム分のデータ長（ 7 6 8パイト）との差分. すなわち 1 2 8 k b p s分のデータ長（ 3 84バイト）の付加デ一夕領域が確保されることになる。 P S組立部 1 04はこのデータ領域内に、図 1 4に示す分離格納データ Aのコピーデータを格納する分離格納デ一夕 Aのコピーとして格納される音声のビットレートは平均 1 2 8 k b p s以下であるとする。

以上のように当初から記録される音声ストリームの各音声フレーム内に空き領域を設け、その空き領域に分離格納データをコピーすることにより、 VOBU内に格納されなかった音声データ（分離格納データ）を実質的に格納できる。

プレイリストに基づく再生時には、 VOBUのデータの読み出しが終わると、 P S分解部 1 1 4がデ一タストリ一ムを解析することにより、音声伸長部 1 1 3は従来のデータ構造では得ることができない分離格納データ Aのコピーデータを得ることができる。これにより、通常では音声が途切れる映像の場面においても、映像に同期して音声がシ一ムレスに再生できる。

なお、本実施の形態では分理格納データのみが付属情報領域内に格納されるとしたが、記録スペースを確保可能であれば音声ストリーム # 0を全て格納してもよい。

なお、分離格納データのコピーである音声ストリームは、 MP E G— 1オーディォ規格に準拠した音声フレームが連続した形態であつてもよく、さらに、分離格納デ一夕 Aの 1個の音声フレームが、 2個の MP E G— 1オーディォ規格の音声フレーム内の付加データ領域に亘つて記録されてもよい。また、分離格納データのデータ構造は、音声のエレメンタリーストリ一ムを含む MP E G 2プロダラムストリームであってもよいし、その他のシステムストリームであつてもよい。

これまで説明した実施形態では、分離格納デ一夕のコピーまたは音声ストリーム # 0全体のコピーデータを、どのような態様で記録し、かつ再生するかを問題としていた。しかし、記録時には特段の処理を行わず、再生時に分離格納データ自身を直接読み出すようデ一夕処理装置 3 0を動作させてもよい。具体的には、プレイリストが V〇BU# i の再生後に VOBU# k (k≠ ( i + 1 ) ) の再生を指定しているとき、プレイリスト再生制御部 1 64は、 VOBU # iのデータを読み出した後、必ず分離格納データを読み出し、その後、 V〇BU# kの読み出しを開始すればよい。これによれば、分離格納データの冗長な記録が不要になるとともに、音声をシームレスに再生することも可能になる。ただし、 MP E G 2規格上は最長 1秒分のプログラムストリームを読み出す必要があるため、映像のシームレス再生が困難になるおそれがある。したがって、この場合プログラムストリーム生成時に、できるだけ分離格納データが少なくなるよう生成にすることが望ましい。

分離格納データが存在しないように圧縮符号化して VOBUを構成するためには、例えば映像伸長部 1 1 1は各 VOBUの映像フレームサイズが「映像のビットレート Z 1秒間のフレーム数」以下になるように各フレームを生成すればよい。これにより、音声に関して分離格納データが生成されることはなくなる。その理由は、 1フレーム期間では毎回 1フレーム分の音声データを伝送できるからである。なお、 I ( I n t r a) フレームのデータサイズが制限されて画質が低下するおそれが生じる点に留意が必要である。

または、分離格納データが所定のフレーム数（例えば 4フレーム）以内の音声データを含むという制限をつけて、音声伸長部 1 1 3が音声データを圧縮符号化してもよい。

本明細書では、プログラムストリームである VR規格ストリ一ムを例にしたが、 M P E G 1のシステムストリームまたは MP E G 2 のトランスポートストリームを利用することもできる。なお、トランスポ一トストリ一ムは、トランスポートストリームを用いたデジタルテレビ放送規格に準拠した形式であってもよい。また、さらにトランスポートストリームを用いたデジタルデータ放送に準拠した形式であってもよい。卜ランスポー卜ストリームの利用においては、トランスポートストリームパケットが利用される。なお、「パック」とはバケツトの 1つの例示的な形態として知られている。

また、プログラムストリームである VR規格ストリ一ムを例にしたが、 I S OZ I E C 1 449 6— 1 2で規定される I S 0 B a s e M e d i a F i l e F o rma tをべ一スにしたデー夕ストリームであってもよい。

また、記録媒体は相変化光ディスクであるとしたが、例えば B 1 u— r a yディスク、 DVD— RAM、 DVD-R, D VD -RW- DVD + RW, M〇、 CD-R, C D— R W等の光ディスクや、ハ一ドディスク等の他のディスク形状の記録媒体も利用できる。また- フラッシュメモリ等の半導体メモリであってもよい。これに関連して、読み書きヘッドは光ディスク用のピックアップとしたが、例えば、記録媒体が M 0の場合にはピックアップ及び磁気ヘッドとなり, またハードディスクの場合は磁気へッドとなる。

なお、本明細書では、プレイリスト再生時に音声が途切れなく再生できる技術を説明した。しかし、厳密には音声 1フレーム分以下の間だけ音声データが存在しないケースがある。これは V〇 BU# i の次に VOBU# k (k≠ ( i + 1 ) ) を読み出す際に、映像フレーム周期と音声のフレーム周期が若干異なり、完全には同期できないからである。この 1フレーム以下の音声データの欠落を防ぐには、分離格納データに加えて、このデータに続く 1音声フレームのデータを余分に含めればよい（実施形態 1、 3、 4および 5) 。そして、これにより余分な音声データを含むことになるが、余分な部分は再生しないようにすればよい。

なお、実施の形態 1から 5までは音声の圧縮方式として、 MP E G— 1オーディオもしくは MP E G— 2オーディオ、 AA (：、 AC — 3等を一般に使用することができる。なお、 AC— 3の場合は、図 1 6 (a) に示すように音声データは VOBU内に格納される際にプライべ一トストリ一ム 1 ( s t r e a m一 I D = 0 x B D) として格納される場合がある。このときは、例えば実施形態 5における、分離格納データを格納するプライべ一トストリ一ムのような、別のプライベートストリーム 1を使用する他のストリームと区別する必要がある。そこで P S組立部 1 0 4は、サブストリーム I D (0 x 8 0) を P E Sパケットヘッダの次に 1バイトだけに設けて識別可能にする。図 1 6 ( a ) は、サブストリーム I D ( 0 x 8 0) を有し、 AC— 3データを含むオーディオパックのデータ構造を示す。

実施形態 5において説明したプライべ一卜ス卜リームと AC _ 3 用のプライベートストリームを区別して識別するために、異なる数値のサブストリーム I Dを用いてもよい。図 1 6 (b) は、サブストリ一ム I D ( 0 X F F) を有し、データを含むオーディオパックのデータ構造を示す。この数値は、 D VD— V i d e o規格において規定されている値（O x F F) である。

なお、実施の形態 5から 7までにおいて分離格納データはエレメンタリーストリームのみか、または、 P E Sパケットヘッダまでがコピーされていてもよい。上述の説明では、 2つの VOBUの境界における音声フレームがいずれの VO B Uと同期して再生されるべきかについては言及していないが、例えば映像フレームの P T S以降の音声フレームが同じ VO BUに対応すると考えればよい。なお，本実施形態では、ビデオデータとして MP E G— 2ビデオストリームを挙げて説明したが、 MP E G— 4ビデオストリームや MP E G - 4 AVCビデオストリーム等の他の圧縮符号化形式を用いることもできる。産業上の利用可能性

本発明によれば、同一のデータ単位（例えば VOBU) 内に映像に対応する音声の全てのデータが含まれない場合であっても、少なくとも含まれない音声デ一夕をコピーしたコピーデータを、例えばそのデータ単位へのアクセスの際に容易にアクセスできる位置（例えば、次の VOBUの先頭部分、その VOBUの直前または直後）に記録する記録装置を得ることができる。

これにより、特にプレイリストに基づいて映像および音声を同期して再生する場合には、映像データを含むデ一夕単位へのアクセスとともに、同期して再生されるべき全ての音声データが得られる。よって、シーンをまたぐ際の音声の途切れを大幅に低減でき、ユーザの視聴環境の向上に供することができる再生装置を得ることがでさる。

Claims

請求の範囲

1 . 映像信号および音声信号が入力される信号入力部と、

前記映像信号および前記音声信号を圧縮符号化して、映像データおよび音声データを生成する圧縮部と、

前記映像データおよび前記音声データを分割してバケツトを複数生成し、前記映像データに関する映像バケツトおよび前記音声デ一夕に関する音声バケツトを多重化したデータ単位を複数生成し、複数の前記データ単位を含むデータストリームを生成するストリ一ム組立部と、

前記データストリームを記録媒体に記録する記録部と

を有し、前記ストリーム組立部は、前記デ一夕単位に含める映像バケツトおよび音声パケットを少なくとも映像の再生時間に基づいて決定し、所定のデータ単位に格納された映像データに対応する音声データの全部が前記所定のデータ単位に含まれない場合には、前記音声データのうち、少なくとも含まれない部分である部分音声デ —夕をコピーしたコピーデータを前記デ一タストリーム内に含める、データ処理装置。

2 . 前記ストリーム組立部は、前記データ単位に対応する前記コピ—データを、後続のデータ単位の少なくとも最初に配置された映像パケット内に格納する、請求項 1に記載のデータ処理装置。

3 . 前記ストリーム組立部は、前記データ単位内に、対応する前記コピーデ一夕を格納する、請求項 1に記載.のデータ処理装置。

4 . 前記ストリーム組立部は、前記コピーデータを、前記データストリーム内の専用の音声ストリーム内に格納する、請求項 1に記載のデータ処理装置。

5 . 前記ストリーム組立部は、前記コピーデータを、前記データストリーム内の専用のプライべ一トデータストリーム内に格納する、請求項 1に記載のデータ処理装置。

6 . 前記ストリーム組立部は、前記映像データに同期する前記音声データのすべてをコピーしたコピーデータを、前記所定のデータ単位に含める、請求項 1に記載のデータ処理装置。

7 . 前記ストリーム組立部は、前記コピーデータを、前記データストリーム内の専用のプライべ一トデ一夕ストリーム内に格納する、請求項 6に記載のデータ処理装置。

8 . 前記ストリーム組立部は、前記映像データに同期する前記音声データのすべてをコピーしたコピーデータを、前記データストリーム内の専用の音声ストリーム内に格納する、請求項 1に記載のデ一夕処理装置。

9 . 前記ストリーム組立部は、前記映像データに同期する前記音声データのすべてをコピーしたコピーデータを、前記データストリーム内の専用の音声ストリーム内に格納し、さらに前記コピーデー夕の転送タイミングを示す転送タイミング情報として、前記コピー元のデータ単位内の転送タイミングよりも所定の時間だけ早くシフトした転送夕イミングを規定して記録する、請求項 1に記載のデー夕処理装置。

1 0 . 前記ストリーム組立部は、前記複数のデータ単位を含む第 1ファイルおよび前記コピーデ一夕を含む第 2ファイルとして、前記データストリームを生成し、

前記記録部は、前記データ単位とコピーデータとを前記記録媒体に連続的に記録する、請求項 1に記載のデータ処理装置。

1 1 . 前記ストリーム組立部は、前記映像データに対応する前記音声データのすべてをコピーしたコピーデータによって前記第 2フアイルを生成する、請求項 1 0に記載のデータ処理装置。

1 2 . 前記音声データは第 1 レートに応じたデータ長を有しており、

前記圧縮部は前記第 1レートよりも小さい第 2のレートにより前記音声信号を圧縮符号化して前記音声データに格納し、前記ストリーム組立部は、前記第 2レートに対して規定される第 ₂データ長と、前記第 1レートに対して規定される前記音声デ一タの第 1データ長との差分に対応する空き領域に、前記コピーデ一タを格納する、請求項 1に記載のデータ処理装置。

1 3 . 映像信号および音声信号を受け取るステップと、

前記映像信号および前記音声信号を圧縮符号化して、映像データおよび音声デ一夕を生成するステツプと、

前記映像データおよび前記音声データを分割してバケツトを複数生成するステップし、前記映像データに関する映像バケツトおよび前記音声データに関する音声バケツトを多重化したデータ単位を複数生成し、複数の前記デ一タ単位を含むデータストリームを生成するステップと、

前記データストリームを記録媒体に記録するステップとを包含し、前記デ一タストリームを生成するステップは、前記データ単位に含める映像バケツトおよび音声バケツトを少なくとも映像の再生時間に基づいて決定し、所定のデータ単位に格納された映像データに対応する音声データの全部が前記所定のデータ単位に含まれない場合には、前記音声データのうち、少なくとも含まれない部分である部分音声データをコピーしたコピーデータを前記データストリーム内に含める、データ処理方法。

1 4 . 前記データストリームを生成するステップは、前記データ単位に対応する前記コピーデータを、後続のデータ単位の最初に配置された映像バケツト内に格納する、請求項 1 3に記載のデータ処理方法。

1 5 . 前記データストリームを生成するステップは、前記映像デ一夕に対応する前記音声データのすべてをコピーしたコピーデータを、前記所定のデータ単位に含める、請求項 1 3に記載のデータ処理方法。

1 6 . 前記データストリームを生成するステップは、前記複数のデ一夕単位を含む第 1ファイルおよび前記コピーデータを含む第 2 ファイルとして、前記データストリームを生成し、

前記記録するステップは、前記デー夕単位と前記コピーデータとを前記記録媒体に連続的に記録する、請求項 1 3に記載のデータ処理方法。

1 7 . 前記データストリームを生成するステップは、前記映像デ一夕に対応する前記音声データのすべてをコピーしたコピーデータによって前記第 2ファイルを生成する、請求項 1 6に記載のデータ処理方法。

1 8 . 前記音声データは第 1レートに応じたデータ長を有しており、前記音声データを生成するステップは、第 1レートで前記音声信号を圧縮符号化して前記音声データを生成し、

前記前記データストリームを生成するステップは、前記所定のデ一夕単位に含まれる前記音声データに対して、前記レート情報として前記第 1レートよりも早い第 2レートの値を設定して前記音声デ —夕を生成し、前記第 2レ一卜に対して規定される第 2データ長と，前記第 1レートに対して規定される前記音声データの第 1データ長との差分に対応する空き領域に、前記コピーデータを格納する、請求項 1 3に記載のデータ処理方法。