JP5158225B2

JP5158225B2 - 再生装置、再生方法および再生プログラム

Info

Publication number: JP5158225B2
Application number: JP2011092052A
Authority: JP
Inventors: 幸一内村
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2011-04-18
Filing date: 2011-04-18
Publication date: 2013-03-06
Anticipated expiration: 2026-02-22
Also published as: JP2011151851A

Description

この発明は、ブルーレイディスク(Blu-ray Disc：登録商標)といった大容量の記録媒体に記録されたプログラムにおける字幕表示を、ユーザのインタラクティブな操作に対して適切に行うことができるようにした再生装置、再生方法および再生プログラムに関する。

近年、記録可能で記録再生装置から取り外し可能なディスク型記録媒体の規格として、Ｂｌｕ−ｒａｙＤｉｓｃ（ブルーレイディスク）規格が提案されている。Ｂｌｕ−ｒａｙＤｉｓｃ規格では、記録媒体として直径１２ｃｍ、カバー層０．１ｍｍのディスクを用い、光学系として波長４０５ｎｍの青紫色レーザ、開口数０．８５の対物レンズを用いて、最大で２７ＧＢ（ギガバイト）の記録容量を実現している。これにより、日本のＢＳディジタルハイビジョン放送を、画質を劣化させることなく２時間以上記録することが可能である。

この記録可能光ディスクに記録するＡＶ(Audio/Video)信号のソース（供給源）としては、従来からの、例えばアナログテレビジョン放送によるアナログ信号によるものと、例えばＢＳディジタル放送をはじめとするディジタルテレビジョン放送によるディジタル信号によるものとが想定されている。Ｂｌｕ−ｒａｙＤｉｓｃ規格では、これらの放送によるＡＶ信号を記録する方法を定めた規格は、既に作られている。

一方で、現状のＢｌｕ−ｒａｙＤｉｓｃの派生規格として、映画や音楽などが予め記録された、再生専用の記録媒体の開発が進んでいる。映画や音楽を記録するためのディスク状記録媒体としては、既にＤＶＤ(Digital Versatile Disc)が広く普及しているが、このＢｌｕ−ｒａｙＤｉｓｃの規格に基づいた再生専用光ディスクは、Ｂｌｕ−ｒａｙＤｉｓｃの大容量および高速な転送速度などを活かし、ハイビジョン映像を高画質なままで２時間以上収録できる点が、既存のＤＶＤとは大きく異なり、優位である。

このＢｌｕ−ｒａｙＤｉｓｃにおける再生専用の記録媒体の規格を、以下では、ＢＤ−ＲＯＭ規格(Blu-ray Disc Read-Only Format)と呼ぶ。

再生専用の記録媒体に記録するコンテンツに不可欠の要素として、字幕がある。ＢＤ−ＲＯＭ規格においては、字幕は、動画像が表示されるプレーンとは別のプレーンに表示され、字幕が表示されるプレーンと動画像が表示されるプレーンとを合成することで、字幕と動画像とが重ね合わされて表示されるようにされている。例えば、字幕を表示する字幕プレーンを動画像を表示する動画像プレーンの前面に配置し、字幕プレーンにおいて字幕以外の部分に透明の属性を持たせることで、動画像上に字幕が表示された１枚の画像データが構成できる。

特許文献１には、記録再生規格であるＢｌｕ−ｒａｙＤｉｓｃ規格(Blu-ray Disc Rewritable Format Ver1.0)を元に、動画像および字幕を表示するプレーンをそれぞれ設け、ビデオデータによる動画像と字幕画像データによる字幕とを１画面上に表示する技術が記載されている。
特開２００４−３０４７６７号公報

ＢＤ−ＲＯＭ規格において、字幕を表示する字幕データは、テキストデータとして記録媒体に記録され提供される場合と、ビットマップデータからなるグラフィクスデータとして記録媒体に記録され提供される場合とが定義されている。

字幕がテキストデータとして供給される場合は、例えばディスクの再生開始時などにディスクから字幕データが予め読み込まれ、プレーヤの内蔵メモリなどに保持される。画面への表示は、ディスク内に記録されたフォントファイルを読み込み、読み込まれたフォントファイルに格納されるフォントを用いて行ってもよいし、プレーヤに予め内蔵されるフォントを用いて行ってもよい。

一方、字幕がグラフィクスデータとして供給される場合、字幕を表示するグラフィクスデータ（以下、字幕画像データと呼ぶ）は、表示時刻を指示する情報が埋め込まれてビデオデータなどと共にストリームデータとしてディスクに記録される。字幕画像データは、ビデオデータの再生に伴いディスクから再生され、プレーヤに内蔵されるバッファに所定単位で順次、溜め込まれる。当該字幕画像データに埋め込まれた表示時刻情報に基づき、指示された表示時刻になったら、バッファから所定単位毎に読み出されて表示される。

字幕画像データの単位は、例えば制作者側で任意に決めることができる。例えば、１文を単位とすることもできるし、１文字を１単位として順次、表示されるようにしてもよい。また、字幕画像データは、文字を表示するデータに限られない。

また、バッファに溜め込まれた字幕画像データは、バッファから読み出される際にバッファ上から破棄されるようになっている。すなわち、プレーヤ側では、何時どの程度の分量の字幕画像データが供給されるかを予め知ることができない。そのため、バッファの空き領域を確保するために、表示のために読み出された字幕画像データをバッファ上から破棄するようにしている。

ところで、ＢＤ−ＲＯＭ規格では、再生中に字幕表示のＯＮ／ＯＦＦをユーザオペレーションまたはインタラクティブボタンで切り換えることができるようにされている。字幕表示ＯＦＦが指示された場合、字幕プレーンの字幕表示部分のデータを透明属性のデータに置き換えることで、字幕表示が消去される。ユーザオペレーションは、例えばユーザのリモートコントロールコマンダによる操作である。

ところが、上述したように、字幕画像データは、表示のためにバッファから読み出される際にバッファから破棄されてしまうため、現在表示されている字幕に対して字幕表示ＯＦＦを指示してしまうと、再び字幕表示ＯＮを指示しても、直ぐには字幕表示が再開されないことがあるという問題点があった。

これは、上述のように、字幕画像データは、表示のタイミングでバッファから破棄されてしまうので、字幕表示ＯＦＦの指示後に再び字幕表示ＯＮを指示しても、バッファには表示すべき字幕画像データが存在しないことになるからである。この場合、次の字幕表示のタイミングまで、字幕が全く表示されないことになる。字幕表示ＯＦＦを指示した字幕が当該動画像に対する最後の字幕であった場合は、当該動画像の再生が終了するまで、何の字幕も表示されないことになる。

図３２を用いて、より具体的に説明する。図３２Ａは、字幕画像データ＃Ｎの表示タイミングを示す。図３２Ｂは、バッファ内の字幕画像データ＃Ｎの状態を示す。図３２Ｃは、表示タイミングに対応して表示される字幕画像データ＃Ｎを示し、図３２Ｄは、ユーザオペレーションにより字幕表示ＯＮ／ＯＦＦが指示された場合に実際に表示される字幕画像データ＃Ｎを示す。バッファに溜め込まれる字幕画像データは、それぞれの表示タイミングで表示されると共にバッファから破棄される（図３２Ａ〜図３２Ｃ参照）。

図３２Ｄに示されるように、字幕表示ＯＦＦの指示により字幕が消去された後に、ユーザオペレーションにより再び字幕表示ＯＮが指示された時点では、字幕表示ＯＮの指示時に表示すべき字幕画像データ＃３は、既にバッファから破棄されている（図３２Ｂ参照）。したがって、字幕表示ＯＮの指示のタイミングから次の字幕画像データ＃４の表示タイミングまで、字幕表示がなされないことになる。

一方、ディスクのオーサリング状況によっては、字幕表示のＯＮ／ＯＦＦをユーザオペレーションで切り換えられたくないようなオーサリングを行う場合も考えられる。そのため、ＢＤ−ＲＯＭ規格においては、字幕表示のＯＮ／ＯＦＦのユーザオペレーションの如何に関わらず、強制的に字幕表示を行わせるような制御が定義されている。

また、ＢＤ−ＲＯＭ規格においては、１の画面に対して複数、例えば２の字幕をそれぞれ独立的に表示できるようにされている。例えば、１画面に対して、２種類の言語による字幕をそれぞれ表示することができる。上述の、強制的に字幕表示を行わせるか否かの制御は、２の字幕のそれぞれに対して独立的に適用させることができる。一例として、画面に表示される一方の字幕は、ユーザ操作による字幕表示のＯＮ／ＯＦＦが可能とされ、他方の字幕は、ユーザ操作の如何に関わらず、強制的に字幕が表示される。

ここで、図３３Ａに一例が示されるように、画面２００に対し、ユーザオペレーションによらず強制的に字幕表示がなされる強制表示設定による字幕＃１と、ユーザオペレーションに応じて字幕表示のＯＮ／ＯＦＦが切り換えられる非強制表示設定による字幕＃２とが同時に表示されている場合について考える。この図３３Ａに示される状態において、ユーザオペレーション、例えばユーザによるリモートコントロールコマンダに対する操作により、字幕表示ＯＮを指示した場合、字幕＃１および字幕＃２が共に表示される。

ここで、ユーザオペレーションにより、字幕ＯＦＦを指示すると、画面２００の表示は、図３３Ｂに一例が示されるように、強制表示設定とされた字幕＃１はそのまま表示され、非強制表示設定とされた字幕＃２の表示が消えた状態となる。

次に、この図３３Ｂの状態からさらに、ユーザオペレーションにより字幕表示ＯＮを指示することを考える。ユーザは、字幕表示ＯＮを指示することで、画面２００の表示が、字幕＃１と字幕＃２とが共に表示される図３３Ａに示される表示に戻ることを期待している。

しかしながら、字幕＃１および字幕＃２に係るオーサリング状況によっては、図３３Ｂの状態において字幕表示ＯＮを指示しても字幕＃２が表示されず、画面２００の表示が図３３Ｂに示されるのと同一の、字幕＃１のみが表示される状態となってしまう可能性があるという問題点があった。

したがって、この発明の目的は、ユーザオペレーションにより字幕表示のＯＮ／ＯＦＦを切り換えた際に、適切に字幕が表示されるようにした再生装置、再生方法および再生プログラムを提供することにある。

上述した課題を解決するために、第１の発明は、字幕の基本情報が格納される第１のセグメントと、字幕の色情報が格納される第２のセグメントと、字幕の形状情報が格納される第３のセグメントとを含み、再生時刻が定義されるグラフィクスデータが入力される入力部と、第１、第２および第３のセグメントを記憶する第１の記憶部と、第１のセグメントおよび第３のセグメントに基づいて第１のデータを生成し、第２のセグメントに基づいて第２のデータを生成する制御部と、第１のデータおよび第２のデータに基づいて字幕画像データを生成し、生成した字幕画像データを出力する字幕画像データ処理部と、第１のデータを記憶する第２の記憶部と、第２のデータを記憶する第３の記憶部とを有し、制御部は、第１の記憶部に記憶された第１、第２および第３のセグメントを再生時刻で読み出し、第１のセグメントおよび第３のセグメントに基づいて第１のデータを生成し、第２のセグメントに基づいて第２のデータを生成し、生成した第１のデータを第２の記憶部に記憶し、生成した第２のデータを第３の記憶部に記憶し、第１の記憶部に記憶される第１のセグメントを破棄し、第１および第２のデータを、第１のデータおよび第２のデータに対応する第１のセグメントの、次の第１のセグメントに定義される再生時刻まで、または、１または複数のグラフィクスデータから構成されるエポックが更新されるまで第２および第３の記憶部にそれぞれ記憶させ、字幕画像が非表示である期間に字幕画像の表示の指示がなされると、第２の記憶部に記憶されている第１のデータおよび第３の記憶部に記憶されている第２のデータを字幕画像データ処理部に供給し、字幕画像データ処理部は、制御部から供給される、第１のデータおよび第２のデータに基づいて字幕画像データを生成し、生成した字幕画像データを出力する再生装置である。

また、第２の発明は、字幕の基本情報が格納される第１のセグメントと、字幕の色情報が格納される第２のセグメントと、字幕の形状情報が格納される第３のセグメントとを含み、再生時刻が定義されるグラフィクスデータが入力され、第１、第２および第３のセグメントを第１の記憶部に記憶し、第１の記憶部に記憶された第１、第２および第３のセグメントを再生時刻で読み出し、第１のセグメントおよび第３のセグメントに基づいて第１のデータを生成し、第２のセグメントに基づいて第２のデータを生成し、生成した第１のデータを第２の記憶部に記憶し、生成した第２のデータを第３の記憶部に記憶し、第１の記憶部に記憶される第１のセグメントを破棄し、第１および第２のデータを、第１のデータおよび第２のデータに対応する第１のセグメントの、次の第１のセグメントに定義される再生時刻まで、または、１または複数のグラフィクスデータから構成されるエポックが更新されるまで第２および第３の記憶部にそれぞれ記憶させ、字幕画像が非表示である期間に字幕画像の表示の指示がなされると、第２の記憶部に記憶されている第１のデータおよび第３の記憶部に記憶されている第２のデータを読み出し、読み出された第１のデータおよび第２のデータに基づいて字幕画像データを生成し、生成した字幕画像データを出力する再生装置における再生方法である。

また、第３の発明は、字幕の基本情報が格納される第１のセグメントと、字幕の色情報が格納される第２のセグメントと、字幕の形状情報が格納される第３のセグメントとを含み、再生時刻が定義されるグラフィクスデータが入力され、第１、第２および第３のセグメントを第１の記憶部に記憶し、第１の記憶部に記憶された第１、第２および第３のセグメントを再生時刻で読み出し、第１のセグメントおよび第３のセグメントに基づいて第１のデータを生成し、第２のセグメントに基づいて第２のデータを生成し、生成した第１のデータを第２の記憶部に記憶し、生成した第２のデータを第３の記憶部に記憶し、第１の記憶部に記憶される第１のセグメントを破棄し、第１および第２のデータを、第１のデータおよび第２のデータに対応する第１のセグメントの、次の第１のセグメントに定義される再生時刻まで、または、１または複数のグラフィクスデータから構成されるエポックが更新されるまで第２および第３の記憶部にそれぞれ記憶させ、字幕画像が非表示である期間に字幕画像の表示の指示がなされると、第２の記憶部に記憶されている第１のデータおよび第３の記憶部に記憶されている第２のデータを読み出し、読み出された第１のデータおよび第２のデータに基づいて字幕画像データを生成し、生成した字幕画像データを出力する再生方法を、コンピュータに実行させる再生プログラムである。

上述したように、第１、第２および第３の発明は、字幕の基本情報が格納される第１のセグメントと、字幕の色情報が格納される第２のセグメントと、字幕の形状情報が格納される第３のセグメントとを含み、再生時刻が定義されるグラフィクスデータが入力される入力部と、第１、第２および第３のセグメントを記憶する第１の記憶部と、第１のセグメントおよび第３のセグメントに基づいて第１のデータを生成し、第２のセグメントに基づいて第２のデータを生成する制御部と、第１のデータおよび第２のデータに基づいて字幕画像データを生成し、生成した字幕画像データを出力する字幕画像データ処理部と、第１のデータを記憶する第２の記憶部と、第２のデータを記憶する第３の記憶部と、を有し、制御部は、第１の記憶部に記憶された第１、第２および第３のセグメントを再生時刻で読み出し、第１のセグメントおよび第３のセグメントに基づいて第１のデータを生成し、第２のセグメントに基づいて第２のデータを生成し、生成した第１のデータを第２の記憶部に記憶し、生成した第２のデータを第３の記憶部に記憶し、第１の記憶部に記憶される第１のセグメントを破棄し、第１および第２のデータを、第１のデータおよび第２のデータに対応する第１のセグメントの、次の第１のセグメントに定義される再生時刻まで、または、１または複数のグラフィクスデータから構成されるエポックが更新されるまで第２および第３の記憶部にそれぞれ記憶させ、字幕画像が非表示である期間に字幕画像の表示の指示がなされると、第２の記憶部に記憶されている第１のデータおよび第３の記憶部に記憶されている第２のデータを字幕画像データ処理部に供給し、字幕画像データ処理部は、制御部から供給される、第１のデータおよび第２のデータに基づいて字幕画像データを生成し、生成した字幕画像データを出力するようにしている。

ユーザオペレーションにより画像の非表示が指示された後に画像の表示が指示された際に、そのときに表示されるべきグラフィクスデータに基づく画像を即座に表示することができる効果がある。

ＢＤ−ＲＯＭのデータモデルを概略的に示す。インデックステーブルを説明するための略線図である。クリップＡＶストリーム、クリップ情報、クリップ、プレイアイテムおよびプレイリストの関係を示すＵＭＬ図である。複数のプレイリストから同一のクリップを参照する方法を説明するための略線図である。サブパスについて説明するための略線図である。記録媒体に記録されるファイルの管理構造を説明するための略線図である。ＢＤ仮想プレーヤの動作を概略的に示す略線図である。ＢＤ仮想プレーヤの動作を概略的に示す略線図である。この発明の実施の形態で画像の表示系として用いられるプレーン構造の一例を示す略線図である。動画プレーン、字幕プレーンおよびグラフィクスプレーンの一例の解像度および表示可能色を示す略線図である。動画プレーン、字幕プレーンおよびグラフィクスプレーンを合成する一例の構成を示すブロック図である。パレットの入出力データの一例を示す略線図である。パレットに格納される一例のパレットテーブルを示す略線図である。プレゼンテーショングラフィクスストリームについて説明するための略線図である。ディスプレイセットの構成を概略的に示す略線図である。ディスプレイセットに関する論理的な構造を概略的に示す略線図である。ディスプレイセットの一例の格納形式を示す略線図である。ＰＣＳの一例の構造を表すシンタクスを示す略線図である。ブロックcomposition_object()の一例の構造を表すシンタクスを示す略線図である。ＷＤＳの一例の構造を表すシンタクスを示す略線図である。ブロックwindow()の一例の構造を表すシンタクスを示す略線図である。現時点のＢＤ−ＲＯＭ規格に定義されるプレゼンテーショングラフィクスデータのデコーダモデルの一例の構成を示すブロック図である。プレゼンテーショングラフィクスデコーダにおけるディスプレイセット単位での一例の処理を示すフローチャートである。発明の実施の第１の形態による一例のプレゼンテーショングラフィクスデータのデコーダモデルを示すブロック図である。発明の実施の第１の形態によるグラフィクスコントローラにおける一例の処理を示すフローチャートである。字幕画像表示に伴うセグメントの推移を概略的に示す略線図である。ユーザオペレーションにより字幕表示ＯＮが指示された場合の一例の処理を示すフローチャートである。発明の実施の第２の形態による一例のプレゼンテーショングラフィクスデータのデコーダモデルの一例の構成を示すブロック図である。発明の実施の第２の形態によるグラフィクスコントローラの一例の処理を示すフローチャートである。ユーザオペレーションにより字幕表示ＯＮが指示された場合の一例の処理を示すフローチャートである。発明の実施の第１の形態および第２の形態に共通して適用可能な再生装置の一例の構成を示すブロック図である。従来技術による字幕表示を説明するための略線図である。画面に２種類の字幕画像を表示する場合の処理について説明するための略線図である。

以下、この発明の実施の形態を、図面を参照しながら説明する。先ず、理解を容易とするために、Ｂｌｕ−ｒａｙＤｉｓｃに関し、"Blu-ray Disc Read-Only Format Ver1.0 part3 Audio Visual Specifications"で規定されている、読み出し専用タイプのＢｌｕ−ｒａｙＤｉｓｃであるＢＤ−ＲＯＭに記録されたコンテンツすなわちＡＶ(Audio/Video)データの管理構造について説明する。以下では、このＢＤ−ＲＯＭにおける管理構造をＢＤＭＶフォーマットと称する。

例えばＭＰＥＧ(Moving Pictures Experts Group)ビデオやＭＰＥＧオーディオなどの符号化方式で符号化され、ＭＰＥＧ２システムに従い多重化されたビットストリームは、クリップＡＶストリーム（またはＡＶストリーム）と称される。クリップＡＶストリームは、Ｂｌｕ−ｒａｙＤｉｓｃに関する規格の一つである"Blu-ray Disc Read-Only Format part2"で定義されたファイルシステムにより、ファイルとしてディスクに記録される。このファイルを、クリップＡＶストリームファイル（またはＡＶストリームファイル）と称する。

クリップＡＶストリームファイルは、ファイルシステム上での管理単位であり、ユーザにとって必ずしも分かりやすい管理単位であるとは限らない。ユーザの利便性を考えた場合、複数のクリップＡＶストリームファイルに分割された映像コンテンツを一つにまとめて再生する仕組みや、クリップＡＶストリームファイルの一部だけを再生する仕組み、さらには、特殊再生や頭出し再生を滑らかに行うための情報などをデータベースとしてディスクに記録しておく必要がある。Ｂｌｕ−ｒａｙＤｉｓｃに関する規格の一つである"Blu-ray Disc Read-Only Format part3"で、このデータベースが規定される。

図１は、ＢＤ−ＲＯＭのデータモデルを概略的に示す。ＢＤ−ＲＯＭのデータ構造は、図１に示されるように４層のレイヤよりなる。最も最下層のレイヤは、クリップＡＶストリームが配置されるレイヤである（便宜上、クリップレイヤと呼ぶ）。その上のレイヤは、クリップＡＶストリームに対する再生箇所を指定するための、ムービープレイリスト(Movie PlayList)と、プレイアイテム(PlayItem)とが配置されるレイヤである（便宜上、プレイリストレイヤと呼ぶ）。さらにその上のレイヤは、ムービープレイリストに対して再生順などを指定するコマンドからなるムービーオブジェクト(Movie Object)などが配置されるレイヤである（便宜上、オブジェクトレイヤと呼ぶ）。最上層のレイヤは、このＢＤ−ＲＯＭに格納されるタイトルなどを管理するインデックステーブルが配置される（便宜上、インデックスレイヤと呼ぶ）。

クリップレイヤについて説明する。クリップＡＶストリームは、ビデオデータやオーディオデータがＭＰＥＧ２ＴＳ（トランスポートストリーム）の形式などに多重化されたビットストリームである。このクリップＡＶストリームに関する情報がクリップ情報(Clip Information)としてファイルに記録される。

また、クリップＡＶストリームには、字幕を表示するグラフィクスストリームであるプレゼンテーショングラフィクス（ＰＧ）ストリームや、メニュー表示などに用いられるデータをストリームにしたインタラクティブグラフィクス（ＩＧ）ストリームも多重化される。

クリップＡＶストリームファイルと、対応するクリップ情報が記録されたクリップ情報ファイルとをひとまとまりのオブジェクトと見なし、クリップ(Clip)と称する。すなわち、クリップは、クリップＡＶストリームとクリップ情報とから構成される、一つのオブジェクトである。

ファイルは、一般的に、バイト列として扱われる。クリップＡＶストリームファイルのコンテンツは、時間軸上に展開され、クリップ中のエントリーポイントは、主に時間ベースで指定される。所定のクリップへのアクセスポイントのタイムスタンプが与えられた場合、クリップＡＶストリームファイルの中でデータの読み出しを開始すべきアドレス情報を見つけるために、クリップ情報ファイルを用いることができる。

プレイリストレイヤについて説明する。ムービープレイリストは、再生するＡＶストリームファイルの指定と、指定されたＡＶストリームファイルの再生箇所を指定する再生開始点（ＩＮ点）と再生終了点（ＯＵＴ点）の集まりとから構成される。この再生開始点と再生終了点の情報を一組としたものは、プレイアイテム(PlayItem)と称される。ムービープレイリストは、プレイアイテムの集合で構成される。プレイアイテムを再生するということは、そのプレイアイテムに参照されるＡＶストリームファイルの一部分を再生するということになる。すなわち、プレイアイテム中のＩＮ点およびＯＵＴ点情報に基づき、クリップ中の対応する区間が再生される。

オブジェクトレイヤについて説明する。ムービーオブジェクトは、ＨＤＭＶナビゲーションコマンドプログラム（ＨＤＭＶプログラム）と、ムービーオブジェクトとを連携するターミナルインフォメーションを含む。ＨＤＭＶプログラムは、プレイリストの再生を制御するためのコマンドである。ターミナルインフォメーションは、ユーザのＢＤ−ＲＯＭプレーヤに対するインタラクティブな操作を許可するための情報を含んでいる。このターミナルインフォメーションに基づき、メニュー画面の呼び出しや、タイトルサーチといったユーザオペレーションが制御される。

ＢＤ−Ｊオブジェクトは、Ｊａｖａプログラム（Ｊａｖａは登録商標）によるオブジェクトからなる。ＢＤ−Ｊオブジェクトは、この発明と関わりが薄いので、詳細な説明を省略する。

インデックスレイヤについて説明する。インデックスレイヤは、インデックステーブルからなる。インデックステーブルは、ＢＤ−ＲＯＭディスクのタイトルを定義する、トップレベルのテーブルである。インデックステーブルに格納されているタイトル情報に基づき、ＢＤ−ＲＯＭ常駐システムソフトウェア中のモジュールマネージャによりＢＤ−ＲＯＭディスクの再生が制御される。

すなわち、図２に概略的に示されるように、インデックステーブル中の任意のエントリは、タイトルと称され、インデックステーブルにエントリされるファーストプレイバック(First Playback)、トップメニュー(Top Menu)およびタイトル(Title)＃１、＃２、・・・は、全てタイトルである。各タイトルは、ムービーオブジェクトあるいはＢＤ−Ｊオブジェクトに対するリンクを示し、各タイトルは、ＨＤＭＶタイトルあるいはＢＤ−Ｊタイトルの何れかを示す。

例えば、ファーストプレイバックは、当該ＢＤ−ＲＯＭに格納されるコンテンツが映画であれば、映画本編に先立って映出される映画会社の宣伝用映像（トレーラ）である。トップメニューは、例えばコンテンツが映画である場合、本編再生、チャプタサーチ、字幕や言語設定、特典映像再生などを選択するためのメニュー画面である。また、タイトルは、トップメニューから選択される各映像である。タイトルがさらにメニュー画面であるような構成も可能である。

図３は、上述のようなクリップＡＶストリーム、クリップ情報(Stream Attributes)、クリップ、プレイアイテムおよびプレイリストの関係を示すＵＭＬ(Unified Modeling Language)図である。プレイリストは、１または複数のプレイアイテムに対応付けられ、プレイアイテムは、１のクリップに対応付けられる。１のクリップに対して、それぞれ開始点および／または終了点が異なる複数のプレイアイテムを対応付けることができる。１のクリップから１のクリップＡＶストリームファイルが参照される。同様に、１のクリップから１のクリップ情報ファイルが参照される。また、クリップＡＶストリームファイルとクリップ情報ファイルとは、１対１の対応関係を有する。このような構造を定義することにより、クリップＡＶストリームファイルを変更することなく、任意の部分だけを再生する、非破壊の再生順序指定を行うことが可能となる。

また、図４のように、複数のプレイリストから同一のクリップを参照することもできる。また、１のプレイリストから複数のクリップを指定することもできる。クリップは、プレイリスト中のプレイアイテムに示されるＩＮ点およびＯＵＴ点により、参照される。図４の例では、クリップ３００は、プレイリスト３１０のプレイアイテム３２０から参照されると共に、プレイリスト３１１を構成するプレイアイテム３２１および３２２のうちプレイアイテム３２１から、ＩＮ点およびＯＵＴ点で示される区間が参照される。また、クリップ３０１は、プレイリスト３１１のプレイアイテム３２２からＩＮ点およびＯＵＴ点で示される区間が参照されると共に、プレイリスト３１２のプレイアイテム３２３および３２４のうち、プレイアイテム３２３のＩＮ点およびＯＵＴ点で示される区間が参照される。

なお、プレイリストは、図５に一例が示されるように、主として再生されるプレイアイテムに対応するメインパスに対して、サブプレイアイテムに対応するサブパスを持つことができる。サブプレイアイテムは、例えば、このプレイリストに付けられているアフレコオーディオ用のプレイアイテムである。詳細は省略するが、プレイリストは、所定の条件を満たす場合にだけ、サブプレイアイテムを持つことができる。

次に、"Blu-ray Disc Read-Only Format part3"で規定された、ＢＤ−ＲＯＭに記録されるファイルの管理構造について、図６を用いて説明する。ファイルは、ディレクトリ構造により階層的に管理される。記録媒体上には、先ず、１つのディレクトリ（図６の例ではルート(root)ディレクトリ）が作成される。このディレクトリの下が、１つの記録再生システムで管理される範囲とする。

ルートディレクトリの下に、ディレクトリ"BDMV"およびディレクトリ"CERTIFICATE"が置かれる。ディレクトリ"CERTIFICATE"は、著作権に関する情報が格納される。ディレクトリ"BDMV"に、図１を用いて説明したデータ構造が格納される。

ディレクトリ"BDMV"の直下には、ファイルは、ファイル"index.bdmv"およびファイル"MovieObject.bdmv"の２つのみを置くことができる。また、ディレクトリ"BDMV"の下に、ディレクトリ"PLAYLIST"、ディレクトリ"CLIPINF"、ディレクトリ"STREAM"、ディレクトリ"AUXDATA"、ディレクトリ"META"、ディレクトリ"BDJO"、ディレクトリ"JAR"、およびディレクトリ"BACKUP"が置かれる。

ファイル"index.bdmv"は、ディレクトリBDMVの内容について記述される。すなわち、このファイル"index.bdmv"が上述した最上層のレイヤであるインデックスレイヤにおけるインデックステーブルに対応する。また、ファイルMovieObject.bdmvは、１つ以上のムービーオブジェクトの情報が格納される。すなわち、このファイル"MovieObject.bdmv"が上述したオブジェクトレイヤに対応する。

ディレクトリ"PLAYLIST"は、プレイリストのデータベースが置かれるディレクトリである。すなわち、ディレクトリ"PLAYLIST"は、ムービープレイリストに関するファイルであるファイル"xxxxx.mpls"を含む。ファイル"xxxxx.mpls"は、ムービープレイリストのそれぞれに対して作成されるファイルである。ファイル名において、"."（ピリオド）の前の"xxxxx"は、５桁の数字とされ、ピリオドの後ろの"mpls"は、このタイプのファイルに固定的とされた拡張子である。

ディレクトリ"CLIPINF"は、クリップのデータベースが置かれるディレクトリである。すなわち、ディレクトリCLIPINF"は、クリップＡＶストリームファイルのそれぞれに対するクリップインフォメーションファイルであるファイル"zzzzz.clpi"を含む。ファイル名において、"."（ピリオド）の前の"zzzzz"は、５桁の数字とされ、ピリオドの後ろの"clpi"は、このタイプのファイルに固定的とされた拡張子である。

ディレクトリ"STREAM"は、実体としてのＡＶストリームファイルが置かれるディレクトリである。すなわち、ディレクトリ"STREAM"は、クリップインフォメーションファイルのそれぞれに対応するクリップＡＶストリームファイルを含む。クリップＡＶストリームファイルは、ＭＰＥＧ２(Moving Pictures Experts Group 2)のトランスポートストリーム（以下、ＭＰＥＧ２ＴＳと略称する）からなり、ファイル名が"zzzzz.m2ts"とされる。ファイル名において、ピリオドの前の"zzzzz"は、対応するクリップインフォメーションファイルと同一することで、クリップインフォメーションファイルとこのクリップＡＶストリームファイルとの対応関係を容易に把握することができる。

ディレクトリ"AUXDATA"は、メニュー表示などに用いられる、サウンドファイル、フォントファイル、フォントインデックスファイルおよびビットマップファイルなどが置かれる。ファイル"sound.bdmv"は、ＨＤＭＶのインタラクティブなグラフィクスストリームのアプリケーションに関連したサウンドデータが格納される。ファイル名は、"sound.bdmv"に固定的とされる。ファイル"aaaaa.otf"は、字幕表示や上述したＢＤ−Ｊアプリケーションなどで用いられるフォントデータが格納される。ファイル名において、ピリオドの前の"aaaaa"は、５桁の数字とされ、ピリオドの後ろの"otf"は、このタイプのファイルに固定的とされた拡張子である。ファイル"bdmv.fontindex"は、フォントのインデックスファイルである。

ディレクトリ"META"は、メタデータファイルが格納される。ディレクトリ"BDJO"およびディレクトリ"JAR"は、上述のＢＤ−Ｊオブジェクトに関連するファイルが格納される。また、ディレクトリ"BACKUP"は、上述までの各ディレクトリおよびファイルのバックアップが格納される。これらディレクトリ"META"、ディレクトリ"BDJO"、ディレクトリ"JAR"およびディレクトリ"BACKUP"は、この発明の主旨と直接的な関わりがないので、詳細な説明を省略する。

上述したようなデータ構造を有するディスクがプレーヤに装填されると、プレーヤは、ディスクから読み出されたムービーオブジェクトなどに記述されたコマンドを、プレーヤ内部のハードウェアを制御するための固有のコマンドに変換する必要がある。プレーヤは、このような変換を行うためのソフトウェアを、プレーヤに内蔵されるＲＯＭ(Read Only Memory)にあらかじめ記憶している。このソフトウェアは、ディスクとプレーヤを仲介してプレーヤにＢＤ−ＲＯＭの規格に従った動作をさせることから、ＢＤ仮想プレーヤと称される。

図７は、このＢＤ仮想プレーヤの動作を概略的に示す。図７Ａは、ディスクのローディング時の動作の例を示す。ディスクがプレーヤに装填されディスクに対するイニシャルアクセスがなされると（ステップＳ３０）、１のディスクにおいて共有的に用いられる共有パラメータが記憶されるレジスタが初期化される（ステップＳ３１）。そして、次のステップＳ３２で、プログラムがディスクから読み込まれて実行される。なお、イニシャルアクセスは、ディスク装填時のように、ディスクの再生が初めて行われることをいう。

図７Ｂは、プレーヤが停止状態からユーザにより例えばプレイキーが押下され再生が指示された場合の動作の例を示す。最初の停止状態（ステップＳ４０）に対して、ユーザにより、例えばリモートコントロールコマンダなどを用いて再生が指示される（ＵＯ：User Operation）。再生が指示されると、先ず、レジスタすなわち共通パラメータが初期化され（ステップＳ４１）、次のステップＳ４２で、プレイリストの再生フェイズに移行する。なお、この場合にレジスタがリセットされない実装としてもよい。

ムービーオブジェクトの実行フェイズにおけるプレイリストの再生について、図８を用いて説明する。ＵＯなどにより、タイトル番号＃１のコンテンツを再生開始する指示があった場合について考える。プレーヤは、コンテンツの再生開始指示に応じて、上述した図２に示されるインデックステーブル(Index Table)を参照し、タイトル＃１のコンテンツ再生に対応するオブジェクトの番号を取得する。例えばタイトル＃１のコンテンツ再生を実現するオブジェクトの番号が＃１であったとすると、プレーヤは、ムービーオブジェクト＃１の実行を開始する。

この図８の例では、ムービーオブジェクト＃１に記述されたプログラムは２行からなり、１行目のコマンドが"Play PlayList(1)"であるとすると、プレーヤは、プレイリスト＃１の再生を開始する。プレイリスト＃１は、１以上のプレイアイテムから構成され、プレイアイテムが順次再生される。プレイリスト＃１中のプレイアイテムの再生が終了すると、ムービーオブジェクト＃１の実行に戻り、２行目のコマンドが実行される。図８の例では、２行目のコマンドが"jump TopMenu"であって、このコマンドが実行されインデックステーブルに記述されたトップメニュー(Top Menu)を実現するムービーオブジェクトの実行が開始される。

次に、この発明の実施の形態に適用可能な画像の表示系について説明する。この発明の実施の形態では、画像の表示系について、図９に一例が示されるようなプレーン構成を取る。動画プレーン１０は、最も後ろ側（ボトム）に表示され、プレイリストで指定された画像（主に動画データ）が扱われる。字幕プレーン１１は、動画プレーン１０の上に表示され、動画再生中に表示される字幕データが扱われる。インタラクティブグラフィクスプレーン１２は、最も前面に表示され、メニュー画面を表示するための文字データや、ボタン画像用のビットマップデータなどのグラフィクスデータが扱われる。１つの表示画面は、これら３つのプレーンが合成されて表示される。

なお、以下では、グラフィクスプレーン１２をインタラクティブグラフィクスプレーン１２と称する。

動画プレーン１０、字幕プレーン１１およびインタラクティブグラフィクスプレーン１２は、それぞれ独立して表示が可能とされ、例えば、図１０に一例が示されるような解像度および表示可能色を有する。動画プレーン１０は、解像度が１９２０画素×１０８０ラインで１画素当たりに換算したデータ長が１６ビットであって、輝度信号Ｙ、色差信号Ｃｂ、Ｃｒが４：２：２のシステム（以下、ＹＣｂＣｒ（４：２：２））とされる。なお、ＹＣｂＣｒ（４：２：２）は、各画素当たり輝度信号Ｙが８ビット、色差信号Ｃｂ、Ｃｒがそれぞれ８ビットで、色差信号Ｃｂ、Ｃｒが水平２画素で一つの色データを構成すると見なすカラーシステムである。インタラクティブグラフィクスプレーン１２および字幕プレーン１１は、１９２０画素×１０８０ラインで各画素のサンプリング深さが８ビットとされ、カラーシステムは、２５６色のパレットを用いた８ビットカラーマップアドレスとされる。

インタラクティブグラフィクスプレーン１２および字幕プレーン１１は、２５６段階のアルファブレンディングが可能とされており、他のプレーンとの合成の際に、不透明度を２５６段階で設定することが可能とされている。不透明度の設定は、画素毎に行うことができる。以下では、不透明度αが（０≦α≦１）の範囲で表され、不透明度α＝０で完全に透明、不透明度α＝１で完全に不透明であるものとする。

字幕プレーン１１では、例えばＰＮＧ(Portable Network Graphics)形式の画像データが扱われる。また、インタラクティブグラフィクスプレーン１２でも、例えばＰＮＧ形式の画像データを扱うことができる。ＰＮＧ形式は、１画素のサンプリング深さが１ビット〜１６ビットとされ、サンプリング深さが８ビットまたは１６ビットの場合に、アルファチャンネル、すなわち、それぞれの画素成分の不透明度情報（アルファデータと称する）を付加することができる。サンプリング深さが８ビットの場合には、２５６段階で不透明度を指定することができる。このアルファチャンネルによる不透明度情報を用いてアルファブレンディングが行われる。また、２５６色までのパレットイメージを用いることができ、予め用意されたパレットの何番目の要素（インデックス）であるかがインデックス番号により表現される。

なお、字幕プレーン１１およびインタラクティブグラフィクスプレーン１２で扱われる画像データは、ＰＮＧ形式に限定されない。ＪＰＥＧ方式など他の圧縮符号化方式で圧縮符号化された画像データや、ランレングス圧縮された画像データ、圧縮符号化がなされていないビットマップデータなどを扱うようにしてもよい。

図１１は、上述の図９および図１０に従い３つのプレーンを合成するグラフィクス処理部の一例の構成を示す。動画プレーン１０の動画データが４２２／４４４変換回路２０に供給される。動画データは、４２２／４４４変換回路２０でカラーシステムがＹＣｂＣｒ（４：２：２）からＹＣｂＣｒ（４：４：４）に変換され、乗算器２１に入力される。

字幕プレーン１１の画像データがパレット２２Ａに入力され、ＲＧＢ（４：４：４）の画像データとして出力される。この画像データに対してアルファブレンディングによる不透明度が指定されている場合には、指定された不透明度α１（０≦α１≦１）がパレット２２Ａから出力される。

図１２は、パレット２２Ａの入出力データの一例を示す。パレット２２Ａは、例えばＰＮＧ形式のファイルに対応したパレット情報がテーブルとして格納される。パレット２２Ａは、入力された８ビットの画素データをアドレスとして、インデックス番号が参照される。このインデックス番号に基づき、それぞれ８ビットのデータからなるＲＧＢ（４：４：４）のデータが出力される。それと共に、パレット２２Ａでは、不透明度を表すアルファチャンネルのデータαが取り出される。

図１３は、パレット２２Ａに格納される一例のパレットテーブルを示す。２５６個のカラーインデックス値〔０ｘ００〕〜〔０ｘＦＦ〕（〔０ｘ〕は１６進表記であることを示す）のそれぞれに対して、各々８ビットで表現される三原色の値Ｒ、ＧおよびＢと、不透明度αとが割り当てられる。パレット２２Ａは、入力されたＰＮＧ形式の画像データに基づきパレットテーブルが参照され、画像データにより指定されたインデックス値に対応する、それぞれ８ビットのデータからなるＲ、ＧおよびＢ各色のデータ（ＲＧＢデータ）と、不透明度αとを画素毎に出力する。

パレット２２Ａから出力されたＲＧＢデータは、ＲＧＢ／ＹＣｂＣｒ変換回路２２Ｂに供給され、各データ長が８ビットの輝度信号Ｙと色信号Ｃｂ、Ｃｒのデータに変換される（以下、まとめてＹＣｂＣｒデータと称する）。これは、以降のプレーン間合成を共通のデータ形式で行う必要があるためで、動画データのデータ形式であるＹＣｂＣｒデータに統一している。

ＲＧＢ／ＹＣｂＣｒ変換回路２２Ｂから出力されたＹＣｂＣｒデータと不透明度データα１とがそれぞれ乗算器２３に入力される。乗算器２３では、入力されたＹＣｂＣｒデータに不透明度データα１が乗ぜられる。乗算結果は、加算器２４の一方の入力端に入力される。なお、乗算器２３では、ＹＣｂＣｒデータにおける輝度信号Ｙ、色差信号Ｃｂ、Ｃｒのそれぞれについて、不透明度データα１との乗算が行われる。また、不透明度データα１の補数（１−α１）が乗算器２１に供給される。

乗算器２１では、４２２／４４４変換回路２０から入力された動画データに不透明度データα１の補数（１−α１）が乗ぜられる。乗算結果は、加算器２４の他方の入力端に入力される。加算器２４において、乗算器２１および２３の乗算結果が加算される。これにより、動画プレーン１０と字幕プレーン１１とが合成される。加算器２４の加算結果が乗算器２５に入力される。

インタラクティブグラフィクスプレーン１２の画像データがパレット２６Ａに入力され、ＲＧＢ（４：４：４）の画像データとして出力される。この画像データに対してアルファブレンディングによる不透明度が指定されている場合には、指定された不透明度α２（０≦α２≦１）がパレット２６Ａから出力される。パレット２６Ａから出力されたＲＧＢデータは、ＲＧＢ／ＹＣｂＣｒ変換回路２６Ｂに供給されてＹＣｂＣｒデータに変換され、動画データのデータ形式であるＹＣｂＣｒデータに統一される。ＲＧＢ／ＹＣｂＣｒ変換回路２６Ｂから出力されたＹＣｂＣｒデータが乗算器２７に入力される。

インタラクティブグラフィクスプレーン１２’で用いられる画像データがＰＮＧ形式である場合には、画像データ中に、画素毎に不透明度データα２（０≦α２≦１）を設定することができる。不透明度データα２は、乗算器２７に供給される。乗算器２７では、ＲＧＢ／ＹＣｂＣｒ変換回路２６から入力されたＹＣｂＣｒデータに対し、輝度信号Ｙ、色差信号Ｃｂ、Ｃｒのそれぞれについて、不透明度データα２との乗算が行われる。乗算器２７による乗算結果が加算器２８の一方の入力端に入力される。また、不透明度データα２の補数（１−α２）が乗算器２５に供給される。

乗算器２５では、加算器２４の加算結果に対して不透明度データα２の補数（１−α２）が乗ぜられる。乗算器２５の乗算結果は、加算器２８の他方の入力端に入力され、上述した乗算器２７による乗算結果と加算される。これにより、動画プレーン１０と字幕プレーン１１との合成結果に対して、さらに、インタラクティブグラフィクスプレーン１２が合成される。

字幕プレーン１１およびインタラクティブグラフィクスプレーン１２において、例えば、表示すべき画像の無い領域の不透明度α＝０と設定することで、そのプレーンの下に表示されるプレーンを透過表示させることができ、例えば動画プレーン１０に表示されている動画データを、字幕プレーン１１やインタラクティブグラフィクスプレーン１２の背景として表示することができる。

なお、この図１１に示される構成は、ハードウェアおよびソフトウェアの何れでも実現可能なものである。

次に、図１４を用いて、プレゼンテーショングラフィクス（ＰＧ）ストリームについて説明する。上述したように、ＰＧストリームは、字幕を表示させるための字幕画像データによるストリームである。ＰＧストリームは、クリップＡＶストリームに含まれ、１または複数のディスプレイセット(DisplaySet)からなるエポック(epoch)を単位として構成される。ディスプレイセットおよびエポックは、ＭＰＥＧ２(Moving Pictures Experts Group 2)で定義されるピクチャおよびＧＯＰ(Group Of Picture)にそれぞれ例えることができる。

すなわち、ディスプレイセットは、字幕表示上の最小単位であって、１枚の字幕画像に対応する。１または複数のディスプレイセットによりエポックが構成される。エポックは、一般的には、プレイアイテムに対応した単位で構成される。すなわち、あるプレイアイテムの再生中に表示される字幕を表示するためのディスプレイセットによりエポックが構成される。ＰＧストリームをデコードするＰＧデコーダは、字幕プレーン１１および各種のバッファをエポックの単位でクリアする。

実際には、エポックは、プレイアイテム単位に限らず、オーサリング側で任意に構成することができる。例えば、映画などにおいて一連の台詞に対応する複数の字幕のそれぞれを表示する複数のディスプレイセットによりエポックが構成される。また例えば、１つの台詞を文字毎に分解し、分解された文字それぞれを字幕として表示する複数のディスプレイセットによりエポックを構成することもできる。換言すれば、エポックは、オーサリング側の都合により定義される単位であって、技術的な根拠に基づき定義された単位ではないといえる。

図１５は、ディスプレイセットの構成を概略的に示す。ディスプレイセットは、図１５に示されるように、ＰＣＳ(Presentation Composition Segment)、ＷＤＳ(Window Definision Segment)、ＰＤＳ(Palette Definition Segment)およびＯＤＳ(Object Definition Segment)の４種類のセグメントから構成される。すなわち、１枚の字幕を表示するためには、これら４種類のセグメントが必要とされる。詳細は後述するが、ＰＣＳは、字幕の基本情報が格納される。ＷＤＳは、ウィンドウと呼ばれる字幕を表示する表示枠を定義する。ＷＤＳは、エポック内で変化しない。ＰＤＳは、字幕の色情報を定義するもので、例えばインデックス化された色情報テーブルを内包する。また、ＯＤＳは、字幕の形状情報を保持するもので、例えば字幕を表示するためのビットマップデータが、ランレングス圧縮など所定の圧縮符号化方式で圧縮符号化されて格納される。

図１６は、ディスプレイセットに関する論理的な構造を概略的に示す。図１６Ａおよび図１６Ｂに例示されるように、ＰＣＳ、ＷＤＳ、ＰＤＳおよびＯＤＳの４種類のセグメントが集まって、１つのディスプレイセットを構成する。１つのディスプレイセットは、ＰＣＳ、ＷＤＳ、ＰＤＳおよびＯＤＳから構成される。ＰＣＳは、ディスプレイセット中に必ず１だけ存在する。ＷＤＳは、殆どの場合、ディスプレイセット中に１つだけ存在する。但し、後述するＰＣＳ中に定義されるフラグpalette_up_date_flagの値が"１"の場合は、ＷＤＳは、オプションである。ＰＤＳおよびＯＤＳは、オプションであって、ディスプレイセット中に存在しない場合もあり得る。

図１６Ｃに例示されるように、１または複数のディスプレイセットから、エポックが構成される。ここで、詳細は後述するが、ＰＣＳのフィールドcomposition_stateには、エポックスタートディスプレイセット(Epoch Start DisplaySet)を定義することができる。エポックは、エポックスタートディスプレイセットがＰＣＳに定義されるディスプレイセットから、次のエポックスタートディスプレイセットがＰＣＳに定義されるディスプレイセットの１つ前のディスプレイセットまでのディスプレイセットが集まったものである。図１６Ｄに例示されるように、プレゼンテーショングラフィクスストリーム（ＰＧストリーム）は、１または複数のエポックが含まれる。

図１７は、上述したようなディスプレイセットの一例の格納形式を示す。既に説明したように、字幕を表示するためのディスプレイセットは、プレゼンテーショングラフィクスストリームとして、クリップＡＶストリームに多重化される。ディスプレイセットは、ＰＣＳ、ＷＤＳ、ＰＤＳおよびＯＤＳである４種類のセグメントから構成される（図１７Ａ）。

ディスプレイセットを構成する４種類のセグメントは、図１７Ｂに一例が示されるように、それぞれヘッダ情報により区別されてＰＥＳ(Packetized Elementary Stream)パケットのペイロードに格納される。４種類の各セグメントは、基本的に、それぞれ１個のＰＥＳパケットに格納される。ＰＥＳパケットのそれぞれには、ペイロードに格納されたデータがＰＣＳ、ＷＤＳ、ＰＤＳおよびＯＤＳのうち何れであるかの情報や、パケット毎の順番などを示す識別情報がＰＥＳヘッダに格納される。

また、ＰＥＳヘッダには、このＰＥＳパケットのデコード時刻を指定するＤＴＳ(Decoding Time Stamp)と、デコードされたデータが出力される時刻を指定するＰＴＳ(Presantation Time Stamp)とが格納される。すなわち、ＰＥＳパケットのペイロードに格納されたデータは、ＭＰＥＧシステムズにより規定される基準復号器内部のＳＴＣ(System Time Clock)がＤＴＳに一致したときに、デコードが開始され、ＳＴＣがＰＴＳに一致したときに、デコードされたデータが出力される。ＰＴＳおよびＤＴＳは、そのＰＥＳパケットのペイロードに所定のアクセスユニットの先頭が含まれている場合に、ＰＥＳヘッダに付加される。

ＰＥＳパケットのそれぞれは、さらに所定に分割され、ＭＰＥＧＴＳ（トランスポートストリーム）によるトランスポートパケットに詰め込まれる（図１７Ｃ）。トランスポートパケット毎の順序や、トランスポートパケットに格納されたデータを識別する識別情報などがＰＩＤ(Packet Identification)に格納される。

図１８は、ＰＣＳの一例の構造を表すシンタクスを示す。ここでは、シンタクスをコンピュータ装置などのプログラムの記述言語として用いられるＣ言語の記述法に基づき示す。これは、他のシンタクスを表す図において、同様である。

ブロックsegment_descriptor()は、フィールドsegment_typeおよびフィールドsegment_lengthからなる（図示しない）。フィールドsegment_typeは、このセグメントの種類を示す。フィールドsegment_typeの値が「０ｘ１６」で、このセグメントがＰＣＳであることが示される。なお、値の記述において「０ｘ」は、１６進表記であることを示す。フィールドsegment_lengthは、このフィールドsegment_length以降のこのセグメントの長さを示す。

ブロックvideo_descriptor()は、フィールドvideo_width、フィールドvideo_heightおよびフィールドframe_rateからなる（図示しない）。フィールドvideo_widthおよびフィールドvideo_heightは、このＰＣＳが含まれるディスプレイセットにより表示される字幕と同時に再生される動画像の画枠を示す。また、フィールドframe_rateは、当該動画像のフレームレートを示す。

ブロックcomposition_descriptor()は、フィールドcomposition_numberおよびフィールドcomposition_stateからなる（図示しない）。フィールドcomposition_numberは、このＰＣＳのエポック内での順番を示す。フィールドcomposition_stateは、このＰＣＳが含まれるディスプレイセットの種類を示す。

ディスプレイセットの種類について、概略的に説明する。ディスプレイセットは、エポックスタートディスプレイセット(Epoch Start DisplaySet)、エポックコンティニューディスプレイセット(Epoch Continue DisplaySet)、アキュジションポイントディスプレイセット(Acquisition Point DisplaySet)およびノーマルケースディスプレイセット(Normal Case DisplaySet)の４種類が定義される。

エポックスタートディスプレイセットは、エポックの先頭のディスプレイセットである。エポックコンティニューディスプレイセットは、エポックがプレイアイテムを跨ぐ場合に用いられるもので、例えばエポックがプレイアイテム＃１と次のプレイアイテム＃２とに跨っている場合に、プレイアイテム＃２の先頭にエポックコンティニューディスプレイセットが設けられる。

アキュジションポイントディスプレイセットは、字幕のデコードに関し、安全なデコード開始点を意味する。すなわち、プレーヤにおいて、ランダムアクセスが行われた場合、アクセス先がエポックの途中になる可能性が高い。そこで、プレーヤは、ランダムアクセス後、ストリームをデコードし再生していく中で、アキュジションポイントディスプレイセットを発見すると、そこから字幕のデコードを開始し字幕表示を行う。

ノーマルケースディスプレイセットは、字幕のデコードに関し、安全なデコード開始点ではないディプレイセットを意味する。例えば、他のディスプレイセットにより表示中の字幕の色や形状を変更したい場合に、変更の内容を記述したディスプレイセットをノーマルケースディスプレイセットに設定する。プレーヤは、字幕のデコードおよび再生中にこのノーマルケースディスプレイセットを発見すると、その内容に従い、現在表示中の字幕の色や形状などを変更する。

ＰＣＳのシンタクスの説明に戻り、フィールドpalette_update_flagは、パレットの更新が行われるか否かを示すフラグである。フィールドpalette_id_refは、このディスプレイセットにより表示される字幕１画面が参照するパレットのＩＤを示す。すなわち、このフィールドpalette_id_refにより、ＰＧストリームにおけるＰＤＳ中の色情報が参照される。

フィールドnumber_of_composition_objectsは、このディスプレイセットにより表示される字幕１画面上に存在するオブジェクトの数を示す。このフィールドnumber_of_composition_objectsで示される回数だけ、次のfor文によるループが繰り返され、ブロックcomposition_object()により、このディスプレイセットにより表示されるオブジェクト毎の定義がなされる。

図１９は、ブロックcomposition_object()の一例の構造を表すシンタクスを示す。フィールドobject_id_refは、このブロックcomposition_object()による字幕表示に用いるＯＤＳに対する参照を示す。フィールドwindow_id_refは、このブロックcomposition_object()による字幕表示に用いるオブジェクトが表示されるウィンドウのＩＤを示す。

フィールドobject_cropped_flagは、このブロックcomposition_object()による字幕表示に用いるオブジェクトがクロップされるか否かを示すフラグである。すなわち、字幕表示は、ＯＤＳに保持されるサイズから所定サイズを切り出して表示することができる。フラグobject_cropped_flagがクロップすることを示していれば、後述するクロップサイズを示す情報に基づき切り取られた字幕が表示される。

フィールドforced_on_flagは、このブロックcomposition_object()による字幕表示が、ユーザオペレーションによる字幕表示ＯＮ／ＯＦＦの指示に関わらず強制的に表示されるか否かを示す。

フィールドcomposition_object_horizontal_positionおよびフィールドcomposition_object_vertical_positionは、それぞれこのブロックcomposition_object()による字幕表示の画面上の水平位置および垂直位置を示す。この水平位置および垂直位置は、例えば後述するＷＤＳに示されるウィンドウの位置情報に対する相対位置で示される。

上述のフィールドobject_cropped_flagに示されるフラグの値がオブジェクトがクロップされることを示す値であれば、次のif(object_cropped_flag==1b)以下の記述がなされ、字幕を切り出す位置やサイズが指定される。すなわち、ブロックcropping_rectangle()内のフィールドobject_cropping_horizontal_positionおよびフィールドobject_cropping_vertical_positionにより、切り出す原点の水平位置および垂直位置が示され、フィールドobject_cropping_widthおよびフィールドobject_cropping_heightにより切り出す幅および高さが示される。

図２０は、ＷＤＳの一例の構造を表すシンタクスを示す。ブロックsegment_descriptor()は、フィールドsegment_typeとフィールドsegment_lenghtとからなる（図示しない）。フィールドsegment_typeは、このセグメントの種類を示す。フィールドsegment_typeの値が「０ｘ１７」で、このセグメントがＷＤＳであることが示される。フィールドsegment_lengthは、このフィールドsegment_length以降のこのセグメントの長さを示す。

フィールドnumber_of_windowsは、このＷＤＳが含まれるディスプレイセットにより表示される字幕１画面に存在するウィンドウの数を示す。このフィールドnumber_of_windowsで示される数だけ、次のfor文によるループが繰り返され、ブロックwindow()によりウィンドウ毎の定義がなされる。

図２１は、ブロックwindow()の一例の構造を表すシンタクスを示す。フィールドwindow_idは、このウィンドウのＩＤを示す。フィールドwindow_horizontal_positionおよびフィールドwindow_vertical_positionは、このウィンドウの画面の原点に対する水平位置および垂直位置を示す。フィールドwindow_widthおよびフィールドwindow_heigthは、このウィンドウの幅および高さを示す。

次に、図２２を用いて、現時点のＢＤ−ＲＯＭ規格に定義されるプレゼンテーショングラフィクスデータのデコーダモデルについて説明する。このデコーダモデルにおいて、プレゼンテーショングラフィクスストリームは、ＴＳパケットの形態で供給される。ＴＳパケットは、ＰＩＤフィルタ１００に供給されてＰＩＤが解析され、プレゼンテーショングラフィクスデータを格納するＴＳパケットが選択されて、トランスポートバッファ（ＴＢ）１０１に溜め込まれる。そして、ＴＢ１０１上でＴＳパケットのペイロードに格納されているデータが取り出され、ＰＩＤに基づきＰＥＳパケットが再構築される。すなわち、この段階で、ＴＳパケットに分割されていた各セグメントＰＣＳ、ＷＤＳ、ＰＤＳおよびＯＤＳがそれぞれ統合されることになる。

各セグメントによるＰＥＳパケットは、プレゼンテーショングラフィクスデコーダ（以下、ＰＧデコーダ）１０２に供給され、ＣＤＢ(Coded Data Buffer)１１０に一旦格納される。そして、ＳＴＣに基づきＰＥＳパケット内で定義されるＤＴＳに達したら、ＣＤＢ１１０から読み出されてストリームグラフィックプロセッサ１１１に転送され、それぞれデコードされる。このストリームグラフィックプロセッサ１１１におけるデコードは、ＰＥＳパケットに格納されたセグメントのそれぞれが利用可能な状態になることを意味する。例えば、ストリームグラフィックプロセッサ１１１は、ＰＥＳパケットを展開し、ペイロードに格納されている各セグメントＰＣＳ、ＷＤＳ、ＰＤＳおよびＯＤＳをそれぞれ取り出す。

ストリームグラフィックプロセッサ１１１は、デコードが完了したセグメントを、ＤＢ(Decoded Object Buffer)１１２またはＣＢ(Composition Buffer)１１３に所定に格納する。すなわち、ストリームグラフィックプロセッサ１１１は、１エポック中のＯＤＳからデコードされる字幕の形状情報（オブジェクトと称する）を、ＤＴＳのタイミングでＤＢ１１２に格納する。また、ストリームグラフィックプロセッサ１１１は、デコードが完了したＰＣＳおよびＷＤＳを、ＤＴＳのタイミングでＣＢ１１３に格納する。また、ＰＤＳは、ＰＴＳのみが定義されるため、デコードが完了したＰＤＳをＰＴＳのタイミングでＣＢ１１３に格納する。

ここで、ＣＢ１１３には、有効(valid)な状態のＰＣＳおよびＰＤＳをそれぞれ所定数、例えば８個まで、保持することができる。ＰＣＳおよびＰＤＳは、それぞれに定義されたＤＴＳからＰＴＳまでが有効な状態とされる。有効な状態ではなくなったＰＣＳは、例えば次に供給されるＰＣＳに備えて、ＣＢ１１３から破棄される。破棄は、例えば当該ＰＣＳをＣＢ１１３から消去してなされる。これに限らず、当該ＰＣＳを読み出し不可な状態にして次のデータを上書きするようにしてもよい。

ＣＢ１１３に格納されたＰＣＳは、当該ＰＣＳに定義されたＰＴＳのタイミングで、１つずつＣＢ１１３から排出される。なお、有効状態にあるＰＣＳが参照するＰＤＳおよびＯＤＳは、他のＰＤＳやＯＤＳと交換できない。ここで、ＣＢ１１３から排出されたセグメントの供給先は、ＢＤ−ＲＯＭ規格では規定されていない。

グラフィクスコントローラ１１４は、プレゼンテーショングラフィクスデータのセグメントを制御する。例えば、グラフィクスコントローラ１１４は、ＣＢ１１３からＰＣＳを、当該ＰＣＳに定義されるＰＴＳのタイミングで読み出すと共に、当該ＰＣＳにより参照されるＷＤＳおよびＰＤＳを読み出す。また、グラフィクスコントローラ１１４は、当該ＰＣＳから参照されるＯＤＳをＤＢ１１２から読み出す。そして、読み出されたＰＣＳおよびＷＤＳ、ならびに、ＯＤＳをそれぞれデコードし、字幕を表示するためのデータを形成し、グラフィクスプレーン１０３に書き込む。ＣＢ１１３から読み出されたＰＣＳは、ＣＢ１１３上から破棄される。

なお、上述の、ＰＣＳおよびＷＤＳ、ならびに、ＯＤＳをそれぞれデコードして形成される、字幕を表示するためのデータは、例えば座標情報を持つビットマップデータである。以下では、この字幕を表示するためのデータを、字幕画像イメージと呼ぶ。字幕画像イメージは、形状情報および位置情報を持ち、色情報を持たないデータである。

また、グラフィクスコントローラ１１４は、ＣＢ１１３から読み出されたＰＤＳをデコードして、例えば図１３を用いて説明したようなカラーパレットテーブルを形成し、ＣＬＵＴ１０４に書き込む。

グラフィクスプレーン１０３に書き込まれた字幕画像イメージは、所定のタイミング、例えばフレームタイミングで読み出され、ＣＬＵＴ１０４のカラーパレットテーブルが参照されて色情報が付加されて出力字幕画像データが構成され、この出力字幕画像データが出力される。プレーヤの仕様によっては、グラフィクスプレーン１０３から読み出されたデータに対してＣＬＵＴ１０４のカラーパレットテーブルに基づく色情報を付加した字幕画像データを、さらにフレームメモリに書き込む場合も考えられる。

なお、エポックの更新に伴い各種バッファやプレーンがクリアされる。ＣＤＢ１１０から読み出されてデコードされたＰＣＳにおけるブロックcomposition_descriptor()中のフィールドcomposition_stateの記述が、このディスプレイセットがエポックスタートディスプレイセットであることを示していれば、例えば、グラフィクスコントローラ１１４によりＤＢ１１２、ＣＢ１１３、グラフィクスプレーン１０３およびＣＬＵＴ１０４がクリアされる。

図２３は、プレゼンテーショングラフィクスデコーダ１０２におけるディスプレイセット単位での一例の処理を示すフローチャートである。ステップＳ１０で、ＰＩＤフィルタ１００によりＴＳパケットからＰＩＤに基づきプレゼンテーショングラフィクスデータが格納されたパケットが取得され、ＴＢ１０１に溜め込まれる。次のステップＳ１１で、ＴＢ１０１からＣＤＢ１１０にＴＳパケットが転送され、ＰＩＤに基づきＴＳパケットのペイロードからデータが取り出され、ＰＥＳパケットが再構築される。

ＰＥＳパケットは、ストリームグラフィックプロセッサ１１１においてセグメントに展開される。そして、次のステップＳ１３〜ステップＳ１７までで、展開されたセグメントがＰＣＳ、ＷＤＳ、ＰＤＳおよびＯＤＳの何れであるか、若しくは、ＥＮＤセグメントであるか否かが判別され、判別結果に応じた処理が行われる。セグメントの種類は、上述の図１８や図２０などを用いて説明したように、シンタクスの先頭のブロックsegment_description()における最初のフィールドsegment_typeに基づき判別できる。なお、図示しないが、ＷＤＳおよびＯＤＳも、同様の方法でセグメントの種類を判別可能である。

ステップＳ１３で、セグメントがＰＣＳであるか否かが判別される。若し、セグメントがＰＣＳであると判別されれば、処理はステップＳ１９に移行され、図１８を用いて説明したＰＣＳのシンタクスにおけるブロックcomposition_descriptor()内のフィールドcomposition_stateに基づき、このＰＣＳが含まれるディスプレイセットがエポックスタートディスプレイセットであるか否かが判断される。

若し、当該ディスプレイセットがエポックスタートディスプレイセットであると判断されれば、処理はステップＳ２０に移行され、字幕表示に関わるバッファのクリアがなされる。例えば、ＤＢ１１２およびＣＢ１１３がステップＳ２０でクリアされる。そして、次のステップＳ２１で、クリアされ空になったＣＢ１１３に、ＤＴＳのタイミングでＰＣＳが書き込まれる。ＣＢ１１３へのＰＣＳの書き込みが終了すると、処理はステップＳ１０に戻され、パケットの取得が継続される。

一方、ステップＳ１９で、ＰＣＳがエポックスタートディスプレイセットではないと判断されれば、処理はステップＳ２２に移行され、ＰＣＳがＣＢ１１３にＤＴＳのタイミングで書き込まれる。このとき、ＰＣＳは、ＣＢ１１３の空き領域に所定に書き込まれる。

上述のステップＳ１３で、セグメントがＰＣＳではないと判別されれば、処理はステップＳ１４に移行され、セグメントがＷＤＳであるか否かが判別される。若し、セグメントがＷＤＳであると判別されれば、処理はステップＳ２３に移行され、ＷＤＳがＣＢ１１３にＤＴＳのタイミングで書き込まれる。ＣＢ１１３へのＷＤＳの書き込みが終了すると、処理はステップＳ１０に戻され、パケットの取得が継続される。ステップＳ１４でセグメントがＷＤＳではないと判別されれば、処理はステップＳ１５に移行される。

ステップＳ１５では、セグメントがＰＤＳであるか否かが判別される。若し、セグメントがＰＤＳであると判別されれば、処理はステップＳ２４に移行され、ＰＤＳが即座にＣＢ１１３に書き込まれる。これは、ＰＤＳは、ＰＴＳしか定義されず、ＤＴＳを持たないので、ＰＤＳであると判別された時点で、即座にＣＢ１１３に書き込まれる。ＣＢ１１３へのＷＤＳの書き込みが終了すると、処理はステップＳ１０に戻され、パケットの取得が継続される。ステップＳ１５でセグメントがＰＤＳではないと判別されれば、処理はステップＳ１６に移行される。

ステップＳ１６では、セグメントがＯＤＳであるか否かが判別される。若し、セグメントがＯＤＳであると判別されれば、処理はステップＳ２５に移行され、ＯＤＳに格納された、ランレングス処理されたビットマップデータがＤＴＳのタイミングでデコードされ、ＤＢ１１２に書き込まれる。ＤＢ１１２へのＯＤＳの書き込みが終了すると、処理はステップＳ１０に戻され、パケットの取得が継続される。ステップＳ１６でセグメントがＯＤＳではないと判別されれば、処理はステップＳ１７に移行される。

ステップＳ１７では、セグメントがディスプレイセットの最後尾を示すＥＮＤセグメントであるか否かが判断される。若し、セグメントがＥＮＤセグメントであると判別されれば、このディスプレイセットに関する一連の処理が終了される。

一方、ステップＳ１７で、セグメントがＥＮＤセグメントではないと判別されれば、処理はステップＳ１８に移行される。すなわち、この場合には、何らかのエラーが発生したものと判断でき、所定にエラー処理がなされる。

上述したような構成の場合、ＰＣＳに定義されるＰＴＳのタイミングで、字幕を表示するために用いるＰＣＳがＣＢ１１３から排出され字幕が表示されると共に、当該ＰＣＳがＣＢ１１３上から破棄されてしまう。そのため、ユーザオペレーションにより字幕表示ＯＦＦが指示され字幕が消去されてしまうと、次に字幕表示ＯＮを指示して字幕を再び表示させようとしても、字幕表示ＯＮの指示後の、ＰＣＳに定義されたＰＴＳに到達するまで字幕表示を行うことができない。

次に、この発明の実施の第１の形態について説明する。この実施の第１の形態では、ＤＢ１１２とは別に設けられたバッファに対して、現在アクティブなＯＤＳを保持すると共に、ＣＢ１１３とは別に設けられたバッファに対して、現在アクティブなＰＣＳおよびＰＤＳを保持する。字幕表示ＯＮが指示されると、これらＤＢ１１２やＣＢ１１３とは別に設けられたバッファに保持されたＯＤＳ、ＰＣＳおよびＰＤＳを用いて、字幕画像イメージおよびカラーパレットテーブルを形成し、グラフィクスプレーン１０３およびＣＬＵＴ１０４に対してそれぞれ書き込む。

なお、アクティブとは、ＰＴＳにより表示が指示された状態を指し、より具体的には、あるＰＣＳにおいて、自身に定義されたＰＴＳから次の字幕表示に用いられるＰＣＳに定義されたＰＴＳまでの期間がアクティブとされる。

すなわち、グラフィクスコントローラ１１４は、ＰＣＳ毎に定義されたＰＴＳのタイミングでＣＢ１１３から排出されるＰＣＳを、上述のようにしてグラフィクスプレーン１０３およびＣＬＵＴ１０４にそれぞれ供給すると共に、ＣＢ１１３とは別に設けられたバッファに対し、次のＰＣＳに定義されたＰＴＳのタイミングまで保持するようにしている。ＯＤＳについても同様に、ＤＢ１１２からＰＴＳのタイミングで排出されるＯＤＳをグラフィクスプレーン１０３に供給すると共に、ＤＢ１１２とは別に設けられたバッファに対し、次のＰＣＳに定義されたＰＴＳのタイミングまで保持する。

このように構成することで、ユーザオペレーションによる字幕表示ＯＦＦの指示に応じて字幕が消去された後に、字幕表示ＯＮを指示した場合に、字幕表示ＯＮのタイミングに応じて即座に、字幕の表示を再開できるようになる。

すなわち、字幕表示ＯＦＦが指示された後に字幕表示ＯＮが指示されると、ＣＢ１１３とは別に設けられたバッファからＰＣＳを読み出すと共に、ＤＢ１１２とは別に設けられたバッファからＯＤＳを読み出し、これら読み出されたＰＣＳおよびＯＤＳを用いて字幕画像イメージを形成する。形成されたこの字幕画像イメージは、グラフィクスプレーン１０３に書き込まれる。ＰＤＳについても同様に、字幕表示ＯＮの指示のタイミングでＣＢ１１３とは別に設けられたバッファからＰＤＳを読み出し、読み出されたＰＤＳを用いてカラーパレットテーブルを形成する。形成されたカラーパレットテーブルは、ＣＬＵＴ１０４に書き込まれる。

図２４は、この発明の実施の第１の形態による一例のプレゼンテーショングラフィクスデータのデコーダモデルを示す。この実施の第１の形態によるデコーダモデルは、上述した図２２の構成に対し、アクティブＤＢ(Decoded Buffer)１２０とアクティブＣＢ(Composition Buffer)１２１とが追加された構成となっている。なお、図２４において、上述の図２２と共通する部分には同一の符号を付し、詳細な説明を省略する。また、ＰＧデコーダ１０２’におけるディスプレイセット毎の処理は、上述した実施の第１の形態で図２３のフローチャートを用いて説明したのと同様にして行われる。

この実施の第１の形態によるＰＧデコーダ１０２’においても、上述したように、グラフィクスコントローラ１１４は、ＣＢ１１３からＰＣＳを、当該ＰＣＳに定義されているＰＴＳのタイミングで読み出すと共に、当該ＰＣＳから参照されているＷＤＳおよびＰＤＳをＣＢ１１３から読み出す。ＣＢ１１３から読み出されたＰＣＳは、ＣＢ１１３上から破棄される。それと共に、当該ＰＣＳから参照されているＯＤＳを、ＤＢ１１２から読み出す。グラフィクスコントローラ１１４は、ＰＣＳに定義されるＰＴＳのタイミングで読み出されたこれらのセグメントに基づき、グラフィクスプレーン１０３に対して字幕の画像イメージを形成すると共に、ＣＬＵＴ１０４に対してカラーパレットテーブルを供給する。

ここで、グラフィクスコントローラ１１４は、ＣＢ１１３からＰＣＳを読み出した際に、読み出したＰＣＳをアクティブＣＢ１２１に格納すると共に、当該ＰＣＳに参照されるＰＤＳもアクティブＣＢ１２１に格納する。同様に、グラフィクスコントローラ１１４は、ＢＤ１１２からＯＤＳを読み出すと、読み出したＯＤＳをアクティブＤＢ１２０に格納する。

アクティブＣＢ１２１およびアクティブＤＢ１２０に格納されたＰＣＳおよびＰＤＳ、ならびに、ＯＤＳは、アクティブＣＢ１２１に格納されたＰＣＳの次に用いられるＰＣＳに定義されるＰＴＳのタイミングまで、あるいは、エポックが更新されるまで保持される。

グラフィクスコントローラ１１４は、ユーザオペレーションにより字幕表示ＯＮの指示がなされると、アクティブＣＢ１２１に格納されたＰＣＳとアクティブＤＢ１２０に格納されたＯＤＳとを用いて字幕画像を形成し、グラフィクスプレーン１０３に書き込むと共に、アクティブＣＢ１２１に格納されたＰＤＳを読み出してＣＬＵＴ１０４に供給する。

これにより、画面には、アクティブＣＢ１２１に格納されたＰＣＳおよびＰＤＳ、ならびに、アクティブＤＢ１２０に格納されたＯＤＳに基づく字幕表示がなされる。したがって、あるＰＣＳによる字幕を表示中に、ユーザオペレーションにより当該字幕に対して字幕表示ＯＦＦが指示された後に字幕表示ＯＮが指示された場合に、字幕表示ＯＮのタイミングに応じて即座に、字幕表示を再開することができる。

なお、図２４では、アクティブＤＢ１２０およびアクティブＣＢ１２１が互いに独立したバッファとして表示されているが、これはこの例に限らず、アクティブＤＢ１２０およびアクティブＣＢ１２１を１つのバッファの異なる領域としてもよい。

図２５〜図２７を用いて、この発明の実施の第１の形態による字幕画像の表示処理について、より詳細に説明する。図２５は、この発明の実施の第１の形態によるグラフィクスコントローラ１１４における一例の処理を示す。グラフィクスコントローラ１１４は、時刻情報（ＳＴＣ）に基づき、ＣＢ１１３に格納されているＰＣＳのうち、時刻が定義されたＰＴＳに達したＰＣＳがあるか否か判断する（ステップＳ３０）。時刻がＰＴＳに達したＰＣＳがあると判断されれば、処理はステップＳ３１に移行される。

ステップＳ３１では、これから表示する字幕に用いられるＰＣＳ、すなわち、ステップＳ３０で時刻がＰＴＳに達したＰＣＳと、当該ＰＣＳから参照されるＰＤＳとがアクティブＣＢ１２１に格納される。さらに次のステップＳ３２で、これから表示する字幕画像に用いられるＯＤＳ、すなわち、ステップＳ３１でアクティブＣＢ１２１に格納されたＰＣＳから参照されるＯＤＳがアクティブＤＢ１２０に格納される。

ＰＣＳ、ＰＤＳおよびＯＤＳのアクティブＣＢ１２１およびアクティブＤＢ１２０への格納がなされたら、処理は次のステップＳ３３に移行され、字幕画像の表示処理が行われる。このステップＳ３３では、ＣＢ１１３に格納されているＰＣＳおよびＰＤＳ、ならびに、ＤＢ１１２に格納されているＯＤＳにより字幕画像イメージが形成され、表示される。字幕画像の表示処理後、処理がステップＳ３０に戻され、次のＰＣＳに定義されるＰＴＳにおいて、ステップＳ３０〜ステップＳ３３の処理が行われる。

図２６を用いて、より具体的に説明する。図２６は、字幕画像表示に伴うセグメントの推移を概略的に示す。なお、図２６においては、ディスプレイセットを構成するセグメントとして、ＰＣＳが代表して表示されている。図２６Ａは、ＳＴＣを示し、図２６Ｂは、ＣＢ１１３に格納されているＰＣＳを示す。図２６Ｃは、アクティブＣＢ１２１に格納されるＰＣＳを示す。アクティブＤＢ１２０には、アクティブＣＢ１２１に格納されるＰＣＳに参照されるＯＤＳが格納されることになる。図２６Ｄは、グラフィクスプレーン１０３に書き込まれる字幕画像イメージおよびＣＬＵＴ１０４に供給されるＰＤＳに対応するＰＣＳを示し、図２６Ｅは、実際の字幕表示に対応するＰＣＳを示す。

図２６Ａおよび図２６Ｂに示されるように、ＰＣＳ＃１、ＰＣＳ＃２、ＰＣＳ＃３およびＰＣＳ＃４は、ＰＴＳとしてＰＴＳ＃１、ＰＴＳ＃２、ＰＴＳ＃３およびＰＴＳ＃４がそれぞれ定義されているものとする。ＣＢ１１３に格納されたＰＣＳ＃１、ＰＣＳ＃２、ＰＣＳ＃３およびＰＣＳ＃４は、それぞれに定義されたＰＴＳに従いグラフィクスコントローラ１１４に読み出される。

例えば、ＳＴＣに基づき時刻がＰＴＳ＃２に達したら（ステップＳ３０）、ＰＴＳ＃２がＰＴＳとして定義されているＰＣＳ＃２と、当該ＰＣＳ＃２に参照されるＰＤＳとがグラフィクスコントローラ１１４によりＣＢ１１３から読み出され（図２６Ｂ）、ステップＳ３１に従いアクティブＣＢ１２１に格納される（図２６Ｃ）。また、ステップＳ３２に従い、ＰＣＳ＃２に参照されるＯＤＳがＤＢ１１２から読み出され、アクティブＤＢ１２０に格納される。

次のステップＳ３３の字幕表示処理において、グラフィクスコントローラ１１４によりＣＢ１１３から読み出されたＰＣＳ＃２およびＤＢ１１２から読み出されたＯＤＳに基づき字幕画像イメージが形成され、グラフィクスプレーン１０３に書き込まれる。ＣＢ１１３から読み出されたＰＣＳ＃２は、ＣＢ１１３から破棄される。また、ＣＢ１１３から読み出されたＰＤＳがＣＬＵＴ１０４に供給され、カラーパレットテーブルが形成される（図２６Ｄ）。グラフィクスプレーン１０３に書き込まれた字幕画像イメージと、ＣＬＵＴ１０４に供給されたＰＤＳとに基づき、ＰＣＳ＃２に基づく字幕画像が表示される（図２６Ｅ）。

なお、アクティブＤＢ１２０およびアクティブＣＢ１２１の内容は、次の字幕画像表示に用いられるＰＣＳ、ＰＤＳおよびＯＤＳで順次、書き換えられる。

次に、ユーザオペレーションにより字幕表示ＯＮが指示された場合の処理について説明する。図２７に一例が示されるように、ユーザオペレーションにより字幕表示ＯＮが指示されると（ステップＳ４０）、ステップＳ４１で、アクティブＣＢ１２１に格納されているＰＣＳおよびアクティブＤＢ１２０に格納されているＯＤＳがグラフィクスコントローラ１１４により読み出される。読み出されたＰＣＳおよびＯＤＳは、所定にデコードされて字幕画像イメージとされ、グラフィクスプレーン１０３に書き込まれる。それと共に、アクティブＣＢ１２１からＰＤＳが読み出され、カラーパレットテーブルが形成され、ＣＬＵＴ１０４に供給される。

上述した図２６を用いてより具体的に説明する。例えばＰＴＳ＃３のタイミングで、ＰＴＳにＰＴＳ＃３が定義されているＰＣＳ＃３がアクティブＣＢ１２１に格納される（図２６Ｃ）と共に、ＰＣＳ＃３に基づく字幕画像が表示される（図２６Ｄおよび図２６Ｅ）。それと共に、ＰＣＳ＃３がＣＢ１１３から破棄される。

この状態で、ユーザオペレーションにより字幕表示ＯＦＦが指示されると（図２６の「表示ＯＦＦ」）、ＰＣＳ＃３に基づく字幕が消去される。例えば、ＷＤＳに基づき字幕画像が表示されている領域が透明属性を持つデータで書き換えられることで、字幕が消去される。このとき、消去された字幕に対応するＰＣＳ＃３は、既にＣＢ１１３上から破棄されている。

次にユーザオペレーションにより字幕表示ＯＮが指示されると（図２６の「表示ＯＮ」）、グラフィクスコントローラ１１４は、アクティブＣＢ１２１に格納されているＰＣＳ（この図２６の例ではＰＣＳ＃３）および当該ＰＣＳに参照されるＰＤＳを読み出し、読み出されたＰＣＳに基づき字幕画像イメージを再形成してグラフィクスプレーン１０３に書き込むと共に、ＰＤＳをＣＬＵＴ１０４に供給する。これにより、ユーザオペレーションに従い字幕表示を再開することが可能になる。

なお、図２６の例では、ユーザオペレーションにより字幕表示ＯＦＦが指示されてから、次のＰＣＳによる字幕表示が開始される前に、字幕表示ＯＮが指示されているが、勿論、字幕表示ＯＦＦが指示されてから複数のＰＣＳによるＰＴＳを経てから字幕表示ＯＮが指示された場合についても、同様にして字幕表示を再開させることができる。

すなわち、字幕表示ＯＦＦが指示された後も、ＰＴＳのタイミングでのＣＢ１１３からのＰＣＳおよびＰＤＳの読み出し、ならびに、ＤＢ１１２からのＯＤＳの読み出しや、ＣＢ１１３から読み出されたＰＣＳおよびＰＤＳのアクティブＣＢ１２１に対する格納、ならびに、ＤＢ１１２から読み出されたＯＤＳのアクティブＤＢ１２０に対する格納は、継続的に行われる。したがって、ユーザオペレーションによる字幕表示ＯＮの指示があったときに、アクティブＣＢ１２１に格納されたＰＣＳおよびＰＤＳ、ならびに、アクティブＤＢ１２０に格納されたＯＤＳを用いて、字幕表示ＯＮのタイミングで表示されるべき字幕を表示させることができる。

また、上述では、ユーザオペレーションによる字幕表示ＯＦＦの指示の後に字幕表示ＯＮの指示があった場合に、アクティブＣＢ１２１に格納されたＰＣＳおよびＰＤＳ、ならびに、アクティブＤＢ１２０に格納されたＯＤＳを用いた字幕画像表示処理を行っているが、これはこの例に限られない。すなわち、実際の処理としては、字幕表示ＯＮの指示に対してのみ、処理が定義されていればよい。

さらに、上述では、アクティブＤＢ１２０およびアクティブＣＢ１２１には、ＤＢ１１２から読み出されたＯＤＳ、ならびに、ＣＢ１１３から読み出されたＰＣＳおよびＰＤＳが、ユーザオペレーションによる字幕表示ＯＮ／ＯＦＦ指示の有無に関わらず、常に書き込まれ保持されているように説明したが、これはこの例に限定されない。例えば、ユーザオペレーションにより字幕表示ＯＦＦが指示されたときにのみ、アクティブＤＢ１２０およびアクティブＣＢ１２１に対するデータの書き込みおよび保持を行うようにしてもよい。但しこの場合、字幕表示ＯＦＦが指示された後、次のＰＣＳに定義されたＰＴＳ以前に字幕表示ＯＮが指示された場合には、当該次のＰＣＳに定義されたＰＴＳに達するまで字幕が表示されないことになる。

次に、この発明の実施の第２の形態について説明する。上述の実施の第１の形態では、字幕画像を形成する前段階のＰＣＳ、ＰＤＳおよびＯＤＳをバッファに保持したが、この実施の第２の形態では、グラフィクスプレーン１０３およびＣＬＵＴ１０４の内容をそれぞれバッファに保持するようにしている。ユーザオペレーションにより字幕表示ＯＮが指示された際に、バッファに保持されたデータをグラフィクスプレーン１０３およびＣＬＵＴ１０４にそれぞれ書き込むようにする。これにより、ユーザオペレーションによる字幕表示ＯＦＦの指示の後に字幕表示ＯＮが指示された場合に、字幕表示ＯＮのタイミングで表示されるべき字幕を即座に、表示させることができる。

図２８は、この発明の実施の第２の形態による一例のプレゼンテーショングラフィクスデータのデコーダモデルを示す。この実施の第２の形態によるデコーダモデルは、上述した図２２の構成に対し、アクティブグラフィクスプレーン（ＧＰ）バッファ１２３とアクティブＣＬＵＴバッファ１２４とが追加された構成となっている。なお、図２８において、上述の図２２と共通する部分には同一の符号を付し、詳細な説明を省略する。また、ＰＧデコーダ１０２”におけるディスプレイセット毎の処理は、上述した実施の第１の形態で図２３のフローチャートを用いて説明したのと同様にして行われる。

この図２８に示される構成の場合、グラフィクスプレーン１０３に書き込まれるデータは、ＰＧデコーダ１０２”におけるグラフィクスコントローラ１１４の制御に基づき、アクティブＧＰバッファ１２３にも書き込まれる。同様に、ＣＬＵＴ１０４のカラーパレットテーブルは、グラフィクスコントローラ１１４の制御に基づきアクティブＣＬＵＴバッファ１２４にも書き込まれる。そして、グラフィクスコントローラ１１４は、ユーザオペレーションにより字幕表示ＯＮが指示されると、アクティブＧＰバッファ１２３に書き込まれたデータをグラフィクスプレーン１０３に対して書き込むと共に、アクティブＣＬＵＴバッファ１２４に書き込まれたデータをＣＬＵＴ１０４に書き込む。

なお、図２８では、アクティブＧＰバッファ１２３およびアクティブＣＬＵＴバッファ１２４がそれぞれ独立的なバッファとして表示されているが、これはこの例に限られず、アクティブＧＰバッファ１２３およびアクティブＣＬＵＴバッファ１２４を１つのバッファの異なる領域としてもよい。

アクティブＧＰバッファ１２３に格納されたデータおよびアクティブＣＬＵＴバッファ１２４に格納されたカラーパレットテーブルは、現在表示されるＰＣＳ（すなわち、当該データおよびカラーパレットテーブルに対応するＰＣＳ）の次に用いられるＰＣＳに定義されるＰＴＳのタイミングまで、あるいは、エポックが更新されるまで保持される。

図２９は、この発明の実施の第２の形態によるグラフィクスコントローラ１１４の一例の処理を示す。グラフィクスコントローラ１１４は、時刻情報（ＳＴＣ）に基づき、ＣＢ１１３に格納されているＰＣＳのうち、時刻が定義されたＰＴＳに達したＰＣＳがあるか否か判断する（ステップＳ５０）。時刻がＰＴＳに達したＰＣＳがあると判断されれば、処理はステップＳ５１に移行される。

ステップＳ５１では、字幕画像の表示処理が行われる。すなわち、ＣＢ１１３およびＤＢ１１２からＰＣＳおよびＯＤＳが読み出されてそれぞれデコードされ、字幕画像イメージが形成され、グラフィクスプレーン１０３に書き込まれる。また、ＣＢ１１３に格納されているＰＤＳがデコードされてカラーパレットテーブルが形成され、ＣＬＵＴ１０４に書き込まれる。

次のステップＳ５２では、アクティブＧＰバッファ１２３に対して、グラフィクスプレーン１０３上のこれから表示されるデータが書き込まれる。すなわち、ステップＳ５１でグラフィクスプレーン１０３に書き込まれた字幕画像イメージがアクティブＧＰバッファ１２３に書き込まれる。

また、ステップＳ５３で、アクティブＣＬＵＴバッファ１２４に対して、ＣＬＵＴ１０４におけるこれから表示に用いるカラーパレットテーブルが書き込まれる。すなわち、ステップＳ５１でＣＬＵＴ１０４に書き込まれたカラーパレットテーブルがアクティブＣＬＵＴバッファ１２４に書き込まれる。

グラフィクスプレーン１０３のデータのアクティブＧＰバッファ１２３への書き込み、ならびに、ＣＬＵＴ１０４のデータのアクティブＣＬＵＴバッファ１２４への書き込みがなされたら、処理はステップＳ５０に戻され、次のＰＣＳに定義されるＰＴＳにおいて、ステップＳ５０〜ステップＳ５３の処理が行われる。

次に、ユーザオペレーションにより字幕表示ＯＮが指示された場合の処理について説明する。図３０に一例が示されるように、ユーザオペレーションにより字幕表示ＯＮが指示されると（ステップＳ６０）、ステップＳ６１で、アクティブＧＰバッファ１２３およびアクティブＣＬＵＴバッファ１２４に格納されるデータに基づく表示がなされる。例えば、ステップＳ６１では、アクティブＧＰバッファ１２３に格納された字幕画像イメージがグラフィクスプレーン１０３に対して書き込まれると共に、アクティブＣＬＵＴバッファ１２４に格納されたカラーパレットテーブルがＣＬＵＴ１０４に書き込まれる。

この実施の第２の形態によれば、デコード後のデータをバッファに保持するようにしているため、上述の実施の第１形態のデコード前のデータを保持する方法に比べ、処理が容易であるという利点がある。

一方、この実施の第２の形態では、デコード後のデータをバッファに保持するために、上述の実施の第１の形態に比べ、バッファの容量が多く必要になる。例えば、上述の実施の第１の形態では、アクティブＤＢ１２０およびアクティブＣＢ１２１は、少なくとも、それぞれ最大６４ｋＢ（キロバイト）のデータ量であるセグメントが４個分格納されるだけの、２５６ｋＢの容量があれば足りる。これに対して、実施の第２の形態によるアクティブＧＰバッファ１２３は、字幕画像のイメージが格納されるため、２ＭＢ（メガバイト）程度の容量が必要となる。

次に、上述した実施の第１の形態および実施の第２の形態に共通して適用可能な再生装置について説明する。図３１は、この発明の実施の第１の形態および第２の形態に共通して適用可能な再生装置１の一例の構成を示す。再生装置１は、ストレージドライブ５０、スイッチ回路５１、ＡＶデコーダ部５２およびコントローラ部５３を有する。ストレージドライブ５０は、例えば、上述したＢＤ−ＲＯＭを装填して再生可能とされているものとする。

コントローラ部５３は、例えばＣＰＵ(Central Processing Unit)と、ＣＰＵ上で動作されるプログラムが予め格納されたＲＯＭ(Read Only Memory)、ＣＰＵによりプログラムの実行時にワークメモリとして用いられるＲＡＭ(Random Access Memory)などからなり、この再生装置１の全体的な動作を制御する。

また、図示は省略するが、再生装置１には、ユーザに対して所定の制御情報を提供すると共に、ユーザオペレーションに応じた制御信号を出力するようにされたユーザインターフェイスが設けられる。例えば、赤外線通信など所定の無線通信手段を介して再生装置１と遠隔的に通信を行うリモートコントロールコマンダがユーザインターフェイスとして用いられる。リモートコントロールコマンダ上には、上下左右方向をそれぞれ指示可能な十字キーといった方向キーや、数字キー、各種機能が予め割り当てられた機能キーなど、複数の入力手段が設けられる。

リモートコントロールコマンダは、これらの入力手段に対してなされた操作に応じた制御信号を生成し、生成された制御信号を例えば赤外線信号に変調して送信する。再生装置１は、図示されない赤外線受信部においてこの赤外線信号を受信し、赤外線信号を電気信号に変換して復調し、元の制御信号を復元する。この制御信号がコントローラ部５３に供給される。コントローラ部５３は、この制御信号に応じて、プログラムに従い、再生装置１の動作を制御する。

ユーザインターフェイスは、リモートコントロールコマンダに限らず、例えば再生装置１の操作パネルに設けられたスイッチ群により構成することができる。また、再生装置１に、ＬＡＮ(Local Area Network)などを介して通信を行う通信手段を設け、この通信手段を介して外部のコンピュータ装置などから供給された信号を、ユーザインターフェイスによる制御信号としてコントローラ部５３に供給することも可能である。

また、当該再生装置１の言語設定の初期情報が、再生装置１が有する不揮発性メモリなどに記憶される。この言語設定の初期情報は、例えば再生装置１の電源投入時などにメモリから読み出され、コントローラ部５３に供給される。

ストレージドライブ５０にディスクが装填されると、コントローラ部５３は、ストレージドライブ５０を介してディスク上のファイルindex.bdmvやファイルMovieObject.bdmvを読み出し、読み出されたファイルの記述に基づきディレクトリ"PLAYLIST"内のプレイリストファイルを読み出す。コントローラ部５３は、プレイリストファイルに含まれるプレイアイテムが参照するクリップＡＶストリームを、ディスクからストレージドライブ５０を介して読み出す。また、コントローラ部５３は、プレイリストがサブプレイアイテムを含む場合は、サブプレイアイテムにより参照されるクリップＡＶストリームやサブタイトルデータも、ディスクからストレージドライブ５０を介して読み出す。

なお、以下では、サブプレイアイテムに対応するクリップＡＶストリームを、サブクリップＡＶストリームと呼び、サブプレイアイテムに対する主たるプレイアイテムに対応するクリップＡＶストリームを、メインクリップＡＶストリームと呼ぶ。

ストレージドライブ５０から出力されたデータは、図示されない復調部およびエラー訂正部により復調処理およびエラー訂正処理を所定に施され、多重化ストリームが復元される。ここでの多重化ストリームは、ＰＩＤによりデータの種類や並び順などが識別され、所定サイズに分割され時分割多重されたトランスポートストリームである。この多重化ストリームは、スイッチ回路５１に供給される。コントローラ部５３は、例えばＰＩＤに基づきスイッチ回路５１を所定に制御してデータを種類毎に分類し、メインクリップＡＶストリームのパケットをバッファ６０に供給し、サブクリップＡＶストリームのパケットをバッファ６１に供給し、サウンドデータのパケットをバッファ６２に供給し、テキストデータのパケットをバッファ６３に供給する。

バッファ６０に溜め込まれたメインクリップＡＶストリームのパケットは、コントローラ部５３の制御に基づきバッファ６０からパケット毎に読み出され、ＰＩＤフィルタ６４に供給される。ＰＩＤフィルタ６４は、供給されたパケットのＰＩＤに基づき、パケットを、ビデオストリームによるパケット、プレゼンテーショングラフィクスストリーム（以下、ＰＧストリーム）によるパケット、インタラクティブグラフィクスストリーム（以下、ＩＧストリーム）によるパケットおよびオーディオストリームによるパケットに振り分ける。

一方、バッファ６１に溜め込まれたサブクリップＡＶストリームのパケットは、コントローラ部５３の制御に基づきバッファ６１からパケット毎に読み出され、ＰＩＤフィルタ９０に供給される。ＰＩＤフィルタ９０は、供給されたパケットのＰＩＤに基づき、パケットを、ビデオストリームによるパケット、ＰＧストリームによるパケット、ＩＧストリームによるパケットおよびオーディオストリームによるパケットに振り分ける。

ＰＩＤフィルタ６４により振り分けられたビデオストリームによるパケットと、ＰＩＤフィルタ９０により振り分けられたビデオストリームによるパケットは、それぞれＰＩＤフィルタ６５に供給され、ＰＩＤに応じて振り分けられる。すなわち、ＰＩＤフィルタ６５は、ＰＩＤフィルタ６４から供給された、メインクリップＡＶストリームによるパケットを１ｓｔビデオデコーダ６９に、ＰＩＤフィルタ９０から供給された、サブクリップＡＶストリームによるパケットを２ｎｄビデオデコーダ７２に、それぞれ供給するように、パケットを振り分ける。

１ｓｔビデオデコーダ６９は、供給されたパケットのペイロードからビデオストリームを所定に取り出し、取り出されたビデオストリームのＭＰＥＧ２方式による圧縮符号を復号化する。１ｓｔビデオデコーダ６９の出力は、１ｓｔビデオプレーン生成部７０に供給され、ビデオプレーンが生成される。ビデオプレーンの生成は、例えばベースバンドのディジタルビデオデータの１フレームがフレームメモリに書き込まれることで生成される。１ｓｔビデオプレーン生成部７０で生成されたビデオプレーンは、ビデオデータ処理部７１に供給される。

２ｎｄビデオデコーダ７２および２ｎｄビデオプレーン生成部７３において、上述の１ｓｔビデオデコーダ６９および１ｓｔビデオプレーン生成部７０と略同様の処理がなされ、ビデオストリームが復号化されビデオプレーンが生成される。２ｎｄビデオプレーン生成部７３で生成されたビデオプレーンは、ビデオデータ処理部７１に供給される。

ビデオデータ処理部７１は、１ｓｔビデオプレーン生成部７０で生成されたビデオプレーンと、２ｎｄビデオプレーン生成部７３で生成されたビデオプレーンとを、１つのフレームに例えば所定に嵌め込んで１枚のビデオプレーンを生成することができる。１ｓｔビデオプレーン生成部７０で生成されたビデオプレーンと、２ｎｄビデオプレーン生成部７３で生成されたビデオプレーンとを、選択的に用いてビデオプレーンを生成してもよい。このビデオプレーンは、例えば上述の図９に例示した動画プレーン１０に対応する。

ＰＩＤフィルタ６４により振り分けられたＰＧストリームによるパケットと、ＰＩＤフィルタ９０により振り分けられたＰＧストリームによるパケットは、それぞれスイッチ回路６６に供給されて一方が所定に選択され、プレゼンテーショングラフィクスデコーダ７４に供給される。

プレゼンテーショングラフィクスデコーダ７４は、上述した実施の第１の形態におけるＰＧデコーダ１０２’（図２４参照）、あるいは、上述した実施の第２の形態におけるＰＧデコーダ１０２”（図２８参照）に対応する。このとき、図２４または図２８に示されるＰＩＤフィルタ１００およびＴＢ１０１は、例えばスイッチ回路６４および図示されないバッファに対応する。これに限らず、ＰＧデコーダ１０２’またはＰＧデコーダ１０２”にＰＩＤフィルタ１００およびＴＢ１０１を含んでもよい。

プレゼンテーショングラフィクスデコーダ７４は、供給されたパケットのペイロードからＰＧストリームを所定に取り出してデコードして字幕を表示するグラフィクスデータを生成し、スイッチ回路７５に供給する。すなわち、プレゼンテーショングラフィクスデコーダ７４は、供給されたパケットのペイロードからデータを取り出して、ＰＩＤの情報に基づきＰＥＳパケットを再構築する。そして、再構築されたＰＥＳパケットをデコードして、ＰＣＳ、ＷＤＳ、ＰＤＳおよびＯＤＳを形成する。これらＰＣＳ、ＷＤＳ、ＰＤＳおよびＯＤＳは、ＰＣＳに定義されたＰＴＳのタイミングでプレゼンテーショングラフィクスデコーダ７４から出力され、スイッチ回路７５に供給される。

スイッチ回路７５は、このグラフィクスデータと、後述するテキストデータによる字幕データとを所定に選択し、プレゼンテーショングラフィクスプレーン生成部７６に供給する。プレゼンテーショングラフィクスプレーン生成部７６は、供給されたデータに基づきプレゼンテーショングラフィクスプレーンを生成し、ビデオデータ処理部７１に供給する。このプレゼンテーショングラフィクスプレーンは、例えば上述の図９に例示した字幕プレーン１１に対応し、図２４および図２８で説明したグラフィクスプレーン１０３に格納される字幕画像イメージに対応する。

ＰＩＤフィルタ６４により振り分けられたＩＧストリームによるパケットと、ＰＩＤフィルタ９０により振り分けられたＩＧストリームによるパケットは、それぞれスイッチ回路６７に供給されて一方が所定に選択され、インタラクティブグラフィクスデコーダ７７に供給される。インタラクティブグラフィクスデコーダ７７は、供給されたＩＧストリームによるパケットからＩＧストリームを構成する各セグメントを所定に取り出してデコードする。デコードされたセグメントは、プリロードバッファ７８に一旦格納される。

プリロードバッファ７８から読み出されたＩＧストリームのデータは、インタラクティブグラフィクスプレーン生成部７９に供給され、インタラクティブグラフィクスプレーンが生成される。このインタラクティブグラフィクスプレーンは、例えば上述の図９に例示したインタラクティブグラフィクスプレーン１２に対応する。

ビデオデータ処理部７１は、例えば図１１を用いて説明したグラフィクス処理部を含み、供給されたビデオプレーン（図１１における動画プレーン１０）、プレゼンテーショングラフィクスプレーン（図１１における字幕プレーン１１）およびインタラクティブグラフィクスプレーン（図１１におけるインタラクティブグラフィクスプレーン１２）を、所定に合成して１枚の画像データとし、ビデオ信号にして出力する。

例えば、図１１を参照し、プレゼンテーショングラフィクスプレーン（すなわち字幕画像イメージ）に関して、パレットテーブル２２Ａ、ＲＧＢ／ＹＣｂＣｒ変換部２２Ｂおよび乗算器２３は、図２４および図２９で説明したＣＬＵＴ１０４に対応し、パレットテーブル２２ＡおよびＲＧＢ／ＹＣｂＣｒ変換部２２Ｂで色情報が付加されると共に、乗算器２３で透明属性を付加され、さらに、加算器２４および加算器２９で、ビデオプレーンおよびインタラクティブグラフィクスプレーンと合成され、１枚の画像データとされて出力される。

ＰＩＤフィルタ６４により振り分けられたオーディオストリームと、ＰＩＤフィルタ９０により振り分けられたオーディオストリームは、それぞれスイッチ回路６８に供給される。スイッチ回路６８は、供給された２つのオーディオストリームのうち一方を１ｓｔオーディオデコーダ８０に、他方を２ｎｄオーディオデコーダ８１に供給するように、所定に選択する。１ｓｔオーディオデコーダ８０および２ｎｄオーディオデコーダ８１でそれぞれデコードされたオーディオストリームは、加算器８２で合成され、さらに加算器８３で、バッファ６２から読み出されたサウンドデータと合成され、出力される。

バッファ６３から読み出されたテキストデータは、Ｔｅｘｔ−ＳＴコンポジション部で所定に処理され、スイッチ回路７５に供給される。

上述では、再生装置１の各部がハードウェアで構成されるように説明したが、これはこの例に限られない。例えば、再生装置１をソフトウェア上の処理として実現することも可能である。この場合、再生装置１をコンピュータ装置上で動作させることができる。また、再生装置１をハードウェアおよびソフトウェアが混合された構成で実現することもできる。例えば、再生装置１における各デコーダ、特に、１ｓｔビデオデコーダ６９、２ｎｄビデオデコーダ７２など処理の負荷が他と比べて大きな部分をハードウェアで構成し、その他をソフトウェアで構成することが考えられる。

また、上述では、ビデオデータ、オーディオデータ、プレゼンテーショングラフィクスストリームおよびインタラクティブグラフィクスストリームを、光ディスクなどのディスク状記録媒体から読み出す構成として説明したが、これはこの例に限定されない。例えば、これらのデータの一部または全部を再生装置が有するハードディスクドライブや半導体メモリといった、光ディスク以外の記録媒体に保持し、当該記録媒体からこれらのデータを読み出すことも考えられる。

再生装置１をソフトウェアのみ、または、ハードウェアおよびソフトウェアの混合により構成し、コンピュータ装置で実行させるためのプログラムは、例えばＣＤ−ＲＯＭ(Compact Disc-Read Only Memory)やＤＶＤ−ＲＯＭ(Digital Versatile Disc Read Only Memory)といった記録媒体に記録されて提供される。この記録媒体をコンピュータ装置のドライブに装填し、記録媒体上に記録されたプログラムを所定にコンピュータ装置にインストールすることで、上述の処理をコンピュータ装置上で実行可能な状態とすることができる。プログラムをＢＤ−ＲＯＭに記録することも考えられる。なお、コンピュータ装置の構成は、極めて周知であるため、説明は省略する。

１０動画プレーン
１１字幕プレーン
１２グラフィクスプレーン
７４プレゼンテーショングラフィクスデコーダ
７５プレゼンテーショングラフィクスプレーン生成部
１００ＰＩＤフィルタ
１０２，１０２’，１０２” プレゼンテーショングラフィクスデコーダ
１０３グラフィクスプレーン
１０４ＣＬＵＴ
１１０ＣＤＢ
１１１ストリームグラフィクスプロセッサ
１１２ＤＢ
１１３ＣＢ
１１４グラフィクスコントローラ
１２０アクティブＤＢ
１２１アクティブＣＢ
１２３アクティブＧＰバッファ
１２４アクティブＣＬＵＴバッファ

Claims

字幕の基本情報が格納される第１のセグメントと、字幕の色情報が格納される第２のセグメントと、字幕の形状情報が格納される第３のセグメントとを含み、再生時刻が定義されるグラフィクスデータが入力される入力部と、
上記第１、第２および第３のセグメントを記憶する第１の記憶部と、
上記第１のセグメントおよび上記第３のセグメントに基づいて第１のデータを生成し、上記第２のセグメントに基づいて第２のデータを生成する制御部と、
上記第１のデータおよび上記第２のデータに基づいて字幕画像データを生成し、該生成した字幕画像データを出力する字幕画像データ処理部と、
上記第１のデータを記憶する第２の記憶部と、
上記第２のデータを記憶する第３の記憶部と
を有し、
上記制御部は、
上記第１の記憶部に記憶される上記第１、第２および第３のセグメントを上記再生時刻で読み出し、上記第１のセグメントおよび上記第３のセグメントに基づいて上記第１のデータを生成し、上記第２のセグメントに基づいて上記第２のデータを生成し、
上記生成した上記第１のデータを上記第２の記憶部に記憶し、上記生成した上記第２のデータを上記第３の記憶部に記憶し、
上記第１の記憶部に記憶される上記第１のセグメントを破棄し、
上記第１および上記第２のデータを、該第１のデータおよび該第２のデータに対応する上記第１のセグメントの、次の上記第１のセグメントに定義される上記再生時刻まで、または、１または複数の上記グラフィクスデータから構成されるエポックが更新されるまで上記第２および上記第３の記憶部にそれぞれ記憶させ、
字幕画像が非表示である期間に上記字幕画像の表示の指示がなされると、上記第２の記憶部に記憶されている上記第１のデータおよび上記第３の記憶部に記憶されている上記第２のデータを上記字幕画像データ処理部に供給し、
上記字幕画像データ処理部は、
上記制御部から供給される、上記第１のデータおよび上記第２のデータに基づいて字幕画像データを生成し、該生成した字幕画像データを出力する再生装置。
上記第２の記憶部と、上記第３の記憶部とが同一の記憶部として構成される請求項１に記載の再生装置。
字幕の基本情報が格納される第１のセグメントと、字幕の色情報が格納される第２のセグメントと、字幕の形状情報が格納される第３のセグメントとを含み、再生時刻が定義されるグラフィクスデータが入力され、
上記第１、第２および第３のセグメントを第１の記憶部に記憶し、
上記第１の記憶部に記憶される上記第１、第２および第３のセグメントを上記再生時刻で読み出し、上記第１のセグメントおよび上記第３のセグメントに基づいて第１のデータを生成し、上記第２のセグメントに基づいて第２のデータを生成し、
上記生成した上記第１のデータを第２の記憶部に記憶し、上記生成した上記第２のデータを第３の記憶部に記憶し、
上記第１の記憶部に記憶される上記第１のセグメントを破棄し、
上記第１および上記第２のデータを、該第１のデータおよび該第２のデータに対応する上記第１のセグメントの、次の上記第１のセグメントに定義される上記再生時刻まで、または、１または複数の上記グラフィクスデータから構成されるエポックが更新されるまで上記第２および上記第３の記憶部にそれぞれ記憶させ、
字幕画像が非表示である期間に上記字幕画像の表示の指示がなされると、上記第２の記憶部に記憶されている上記第１のデータおよび上記第３の記憶部に記憶されている上記第２のデータを読み出し、
上記読み出された上記第１のデータおよび上記第２のデータに基づいて字幕画像データを生成し、該生成した字幕画像データを出力する再生装置における再生方法。
上記第２の記憶部と、上記第３の記憶部とが同一の記憶部として構成される請求項３に記載の再生方法。
字幕の基本情報が格納される第１のセグメントと、字幕の色情報が格納される第２のセグメントと、字幕の形状情報が格納される第３のセグメントとを含み、再生時刻が定義されるグラフィクスデータが入力され、
上記第１、第２および第３のセグメントを第１の記憶部に記憶し、
上記第１の記憶部に記憶された上記第１、第２および第３のセグメントを上記再生時刻で読み出し、上記第１のセグメントおよび上記第３のセグメントに基づいて第１のデータを生成し、上記第２のセグメントに基づいて第２のデータを生成し、
上記生成した上記第１のデータを第２の記憶部に記憶し、上記生成した上記第２のデータを第３の記憶部に記憶し、
上記第１の記憶部に記憶される上記第１のセグメントを破棄し、
上記第１および上記第２のデータを、該第１のデータおよび該第２のデータに対応する上記第１のセグメントの、次の上記第１のセグメントに定義される上記再生時刻まで、または、１または複数の上記グラフィクスデータから構成されるエポックが更新されるまで上記第２および上記第３の記憶部にそれぞれ記憶させ、
字幕画像が非表示である期間に上記字幕画像の表示の指示がなされると、上記第２の記憶部に記憶されている上記第１のデータおよび上記第３の記憶部に記憶されている上記第２のデータを読み出し、
上記読み出された上記第１のデータおよび上記第２のデータに基づいて字幕画像データを生成し、該生成した字幕画像データを出力する再生方法を、コンピュータに実行させる再生プログラム。
上記第２の記憶部と、上記第３の記憶部とが同一の記憶部として構成される請求項５に記載の再生プログラム。