以下、本発明の好適な実施の形態を詳細に後述し、これらの実施の形態は、添付図面に示す。できる限り、同じ参照符号は同一又は類似する部分を言及するために図面の全体に亘って使用される。
詳細な説明において、メインデータは、制作者によって光ディスクに記録されたタイトル(例えば、ムービータイトル)を含むオーディオ/ビデオ(AV)データを表す。通常、AVデータは、MPEG2フォーマットで記録され、AVストリーム又はメインAVストリームと呼ばれる。また、補助データは、メインデータの再生時に必要な他の全てのデータを表し、例えば、テキスト・サブタイトル・ストリーム、インタラクティブ・グラフィック・ストリーム、プレゼンテーション・グラフィック・ストリーム、補助オーディオ・ストリーム(例えば、ブラウザブル・スライドショー用)等が挙げられる。これらの補助データは、MPEG2フォーマットで記録されるか、或いは、他のデータフォーマットで記録される。これらは、AVストリームとともに多重化されるか、又は、光ディスク内の独立したデータファイルとして存在し得る。
サブタイトルは、再生されるビデオ(又はイメージ)に対応する字幕情報を表し、それは、所定の言語により表される。例えば、ユーザが表示スクリーン上でイメージを視聴する間に複数の言語で表された複数のサブタイトルの1つを視聴するためのオプションを選択するとき、選択されたサブタイトルに対応する字幕情報は、表示スクリーンの所定の部分に表示される。表示された字幕情報がテキストデータ(例えば、文字)の場合、選択されたサブタイトルは、テキスト・サブタイトルと称される。本発明の一態様によれば、MPEG2フォーマットの複数のテキスト・サブタイトル・ストリームは光ディスクに記録され、それらは、複数の独立したストリーム・ファイルとして存在する。各テキスト・サブタイトル・ストリーム・ファイルは、テキスト・サブタイトルのテキストデータと、テキストデータを再生するために必要な再生制御データを含む。さらに、本発明の他の態様によれば、単一のテキスト・サブタイトル・ストリームのみをMPEG2フォーマットで光ディスクに記録することができる。
図1は、本発明による、光ディスク、例えばブルーレイディスク(BD)に記録されたデータファイルの構造を示す図である。図1を参照すれば、少なくとも1つのBDディレクトリ(BDMV)は、ルートディレクトリ(root)に含まれる。各BDディレクトリは、1又は複数のユーザとのインタラクトのために用いられるインデックス・ファイル(index.bdmv)とオブジェクト・ファイル(MovieObject.bdmv)を含む。例えば、インデックス・ファイルは、インデックス・テーブルを表すデータを含み、インデックス・テーブルは、選択可能な複数のメニューとムービータイトルを有する。各BDディレクトリは、再生されるオーディオ/ビデオ(AV)データとAVデータの再生に必要な各種データを含む4つのファイル・ディレクトリをさらに含む。
各BDディレクトリに含まれるファイル・ディレクトリとしては、ストリーム・ディレクトリ(STREAM)、クリップ・インフォメーション・ディレクトリ(CLIPINF)、プレイリスト・ディレクトリ(PLAYLIST)、補助データ・ディレクトリ(AUX DATA)が挙げられる。先ず、ストリーム・ディレクトリ(STREAM)は、特定のデータフォーマットのオーディオ/ビデオ(AV)ストリーム・ファイルを含む。例えば、AVストリーム・ファイルは、MPEG2トランスポート・パケットの形式であり、図1に示すように、「*.m2ts」と称される。ストリーム・ディレクトリは、1又は複数のテキスト・サブタイトル・ストリーム・ファイルをさらに含むことができ、各テキスト・サブタイトル・ストリーム・ファイルは、特定の言語により表されたテキスト・サブタイトルのテキストデータ(例えば、文字)とテキストデータの再生制御情報を含む。テキスト・サブタイトル・ストリーム・ファイルは、ストリーム・ディレクトリ内に独立したストリーム・ファイルとして存在し、図1に示すように、「*.m2ts」或いは「*.txtst」と称される。ストリーム・ディレクトリに含まれるAVストリーム・ファイル又はテキスト・サブタイトル・ストリーム・ファイルは、クリップ・ストリーム・ファイルと称される。
次いで、クリップ・インフォーメーション・ディレクトリ(CLIPINF)は、ストリーム・ディレクトリに含まれるストリーム・ファイル(AV又はテキスト・サブタイトル)に各々対応するクリップ・インフォメーション・ファイルを含む。各クリップ・インフォメーション・ファイルは、対応するストリーム・ファイルのプロパティ情報と再生タイミング情報を含む。例えば、クリップ・インフォメーション・ファイルは、マッピング情報を含み、マッピング情報においては、プレゼンテーション・タイム・スタンプ(PTS)とソース・パケット・ナンバー(SPN)が、エントリポイントマップ(EPM)によって一対一で対応づけられる。マッピング情報を用いて、プレイアイテム又はサブ・プレイアイテムにより提供されるタイミング情報(In−Time、Out−Time)から、ストリーム・ファイルの特定の位置が決められるが、これに関しては、後述する。規格においては、ストリーム・ファイルとそれに対応するクリップ・インフォメーション・ファイルの各ペアは、クリップとして指定される。例えば、CLIPINFに含まれる01000.clpiは、STREAMに含まれる01000.m2tsのプロパティ情報及びタイミング情報を含み、01000.clpiと01000.m2tsは、1つのクリップを形成する。
再び図1を参照すると、プレイリスト・ディレクトリ(PLAYLIST)は、1又は複数のプレイリスト・ファイル(*.mpls)を含み、各プレイリスト・ファイルは、少なくとも1つのメインAVクリップとメインAVクリップの再生時間を指定する少なくとも1つのプレイアイテムを含む。さらに詳しくは、プレイアイテムは、In−TimeとOut−Timeを指定する情報を含む。In−TimeとOut−Timeは、プレイアイテム内のClip_Information_File_nameによって指定されるメインAVクリップの再生開始時間と再生終了時間を表す。このため、プレイリスト・ファイルは、1又は複数のメインAVクリップの基本的な再生制御情報を表す。さらに、プレイリスト・ファイルは、サブ・プレイアイテムを含み、サブ・プレイアイテムは、テキスト・サブタイトル・ストリーム・ファイルの基本的な再生制御情報を表す。サブ・プレイアイテムが1又は複数のテキスト・サブタイトル・ストリーム・ファイルを再生するためにプレイリスト・ファイルに含まれる場合、サブ・プレイアイテムは、プレイアイテムと同期する。これに対し、サブ・プレイアイテムがブラウザブル・スライドショーを再生するために用いられる場合、サブ・プレイアイテムはプレイアイテムと同期しない。本発明によると、サブ・プレイアイテムの主な機能は、1又は複数のテキスト・サブタイトル・ストリーム・ファイルの再生を制御することにある。
最後に、補助データ・ディレクトリ(AUX DATA)は、補助データストリーム・ファイルを含む。補助データストリーム・ファイルの例としては、フォントファイル(例えば、*.font又は*.otf)、ポップアップ・メニュー・ファイル(図示せず)、クリックサウンドを生成するためのサウンド・ファイル(例えば、sound.bdmv)が挙げられる。上述したテキスト・サブタイトル・ストリーム・ファイルは、ストリーム・ディレクトリではなく、補助データ・ディレクトリに含まれる。
図2は、本発明による、光ディスクのデータストレージ領域を示す。図2を参照すると、光ディスクは、ディスクボリュームの最内周を占めるファイルシステム情報領域と、ディスクボリュームの最外周を占めるストリーム領域と、ファイルシステム情報領域とストリーム領域との間を占めるデータベース領域を含む。ファイルシステム情報領域には、図1に示すように、全データファイルを管理するためのシステム情報が格納される。AVストリーム及び1又は複数のテキスト・サブタイトル・ストリームは、ストリーム領域に格納される。図1に示すジェネラル・ファイル、プレイリスト・ファイル及びクリップ・インフォメーション・ファイルは、ディスクボリュームのデータベース領域に格納される。上述したように、ジェネラル・ファイルは、インデックス・ファイルとオブジェクト・ファイルを含み、プレイリスト・ファイルとクリップ・インフォメーション・ファイルは、ストリーム領域に格納されたAVストリームとテキスト・サブタイトル・ストリームを再生するために必要な情報を含む。データベース領域及び/又はストリーム領域に格納された情報を用いて、ユーザは、特定の再生モードを選択し、選択された再生モードでメインAVストリーム及びテキスト・サブタイトル・ストリームを再生することができる。
図3は、テキスト・サブタイトル・ストリームとメインAVストリームが再生されるときにディスプレイ画面に表示されたテキスト・サブタイトルとメインイメージを示す。メインAVストリームと、対応するテキスト・サブタイトル・ストリームが同期して再生される場合、ディスプレイ画面にメインイメージとテキスト・サブタイトルが同時に表示される。
図4は、プレイリストによるメインAVクリップとテキスト・サブタイトル・クリップの再生制御を示す概略図である。図4によれば、プレイリスト・ファイルは、少なくとも1つのAVクリップを再生制御する少なくとも1つのプレイアイテムと、複数のテキスト・サブタイトル・クリップを再生制御する1つのサブ・プレイアイテムを含む。図4に示すように、英語と韓国語のテキスト・サブタイトルのためのテキスト・サブタイトル・クリップ1とテキスト・サブタイトル・クリップ2の1つは、メインAVクリップと同期する。それにより、メインイメージと、対応するテキスト・サブタイトルは、特定のプレゼンテーション・タイムに同時にディスプレイ画面に表示される。ディスプレイ画面にテキスト・サブタイトルを表示するためには、図5A〜図5Cに示すように、ディスプレイ制御情報(例えば、位置情報及びサイズ情報)とプレゼンテーション・タイム情報が必要である。
図5Aは、本発明による、ディスプレイ画面に提示されるダイアログを示す。ダイアログは、所与のプレゼンテーション・タイム内にディスプレイ画面に表示される全てのテキスト・サブタイトル・データを表す。通常、ダイアログのプレゼンテーション・タイムは、プレゼンテーション・タイム・スタンプ(PTS)で表わされる。例えば、図5Aに示すダイアログのプレゼンテーションは、PTS(k)で始まってPTS(k+1)で終わる。このため、図5Aに示すダイアログは、PTS(k)とPTS(k+1)との間にディスプレイ画面に表示される全てのテキスト・サブタイトル・データを表す。ダイアログは、少なくとも1つのサブタイトル・テキスト(文字)・ラインを含む。1つのダイアログに2以上のサブタイトル・テキスト・ラインが存在する場合、全テキストデータは、ダイアログのために定義されたスタイルにしたがって表示される。1つのダイアログに含まれる最大の文字数は約100個に制限される。
さらに、図5Bは、本発明によるダイアログの領域を示す。領域は、所与のプレゼンテーション・タイム内にディスプレイ画面に表示されるテキスト・サブタイトル・データ(ダイアログ)を分割したものの一部である。すなわち、1つのダイアログは少なくとも1つの領域を含み、各領域は少なくとも1つのサブタイトル・テキスト・ラインを含む。領域を表す全テキスト・サブタイトル・データは、領域に割り当てられた領域スタイル(グローバルスタイル)にしたがってディスプレイ画面に表示される。1つのダイアログに含まれる領域の最大数は、サブタイトル・データの所望のデコーディング・レートに基づいて決定する必要がある。その理由は、領域の数が多くなるとデコーディング・レートが低くなるからである。例えば、好ましい高効率のデコーディング・レートを達成するには、1つのダイアログのための領域の最大数を2に制限する必要がある。しかしながら、最大数は、他の目的のために、2より大きくしてもよい。
図5Cは、本発明による、ダイアログ領域のスタイル情報を示す。スタイル情報は、ダイアログに含まれる少なくとも一部の領域を表示するのに要するプロパティを定義する情報を表す。スタイル情報の例として、位置、領域サイズ、背景色、テキスト配列、テキストフロー情報及びその他の各種の情報がある。スタイル情報は、領域スタイル情報(グローバル・スタイル情報)とインライン・スタイル情報(ローカル・スタイル情報)に分類される。
領域スタイル情報は、ダイアログ内の1つの全体領域に適用される領域スタイル(グローバル・スタイル)を定義する。例えば、領域スタイル情報は、領域位置、領域サイズ、フォント色、背景色、テキストフロー、テキスト配列、ラインスペース、フォント名、フォントスタイル、及び領域のフォントサイズのうち少なくとも1つを含む。図5Cに示すように、例えば、2つの異なる領域スタイルが領域1と領域2に適用される。位置1、サイズ1及び青い背景色を有する領域スタイルが領域1に適用され、位置2、サイズ2及び赤い背景色を有する異なる領域スタイルが領域2に適用される。
これに対して、インライン・スタイル情報は、1つの領域に含まれるテキスト・ストリングの特定の部分に適用されるインライン・スタイル(ローカル・スタイル)を定義する。例えば、インライン・スタイル情報は、フォントタイプ、フォントサイズ、フォントスタイル及びフォント色のうち少なくとも1つを含む。テキスト・ストリングの特定の部分は、1つの領域内の全テキストラインか、テキストラインの特定の部分である。図5Cによれば、特定のインライン・スタイルは、領域1に含まれるテキスト部「mountain」に適用される。すなわち、テキスト・ストリングの特定の一部のフォントタイプ、ファンとサイズ、フォントスタイル及びフォント色のうち少なくとも1つは、領域1内のテキスト・ストリングの残りの部分とは異なる。
図6Aは、プレゼンテーション・タイム・スタンプ(PTS)区間にディスプレイ画面にテキスト・サブタイトル・ダイアログをプレゼンテーションされること示す。PTS1〜PTS6の間には表示されるダイアログが4つある。さらに詳しくは、ダイアログ#1は、1つの領域を有し、テキスト#1は、PTS1〜PTS2の間にこの領域内に表示される。次いで、ダイアログ#2は、領域1と領域2を有し、テキスト#1とテキスト#2は、PTS2〜PTS3の間に、領域1と領域2内に各々表示される。さらに、ダイアログ#3は、1つの領域を有し、テキスト#2は、PTS3〜PTS4間に、この領域内に表示される。PTS4〜PTS5間には、提示するダイアログが存在しない。テキスト#3は、PTS5〜PTS6間に、ダイアログ#4の1つの領域に表示される。ダイアログを定義する情報は、ダイアログ・プレゼンテーション・タイム情報と、ダイアログ・テキストデータを含む。ダイアログ・テキストデータは、スタイル情報と、ダイアログの各領域内に表示されるテキスト・ストリングを含む。プレゼンテーション・タイム情報は、開始PTS及び終了PTSのセットである。スタイル情報は、上述した領域(グローバル)スタイル情報及びインライン(ローカル)・スタイル情報を含む。図6Aに示すように、異なるスタイル情報のセットがダイアログに適用される。
図6Bは、PTS区間でディスプレイ画面に提示されるテキスト・サブタイトル・ダイアログの連続性を示す。図6Bによれば、ダイアログ#1のプレゼンテーション終了時間は、ダイアログ#2のプレゼンテーション開始時間と同じである。このため、ダイアログ#1とダイアログ#2との間には連続性が存在する。ダイアログ#1の領域内のテキスト#1の表示は、ダイアログ#2の領域1内のテキスト#1の表示と連続する。すなわち、2つのダイアログのPTS区間が連続し、2つの領域内のテキスト#1を提示するときに同じスタイル情報(領域とインライン)が用いられる。同様に、ダイアログ#2とダイアログ#3との間に他の連続性が存在する。その理由は、ダイアログ#2の領域2内のテキスト#2の表示がダイアログ#3の領域内のテキスト#2の表示と連続するためである。同じサブタイトル・テキストを表示する2つの連続的なダイアログ間の連続性を保証するために、ダイアログのプレゼンテーション・タイム(PTS区間)が連続する必要がある。併せて、領域内の同じテキストを提示するとき同じ領域スタイル情報とインライン・スタイル情報を使用する必要がある。再び図6Bを参照すると、ダイアログ#3とダイアログ#4との間には連続性が存在しない。その理由は、それらのPTS区間が連続的ではないためである。現在のダイアログのプレゼンテーション情報内に、ダイアログが前のダイアログと連続しているかどうかを示すインジケータ(例えば、continuous_presentation_flag)を含めることができる。
図7Aは、本発明による、テキスト・サブタイトル・ストリーム・ファイル(例えば、図1に示された10001.m2ts)を示す。テキスト・サブタイトル・ストリーム・ファイルは、複数のトランスポートパケット(TP)を含むMPEG2トランスポート・ストリームを形成し、全てのトランスポートパケット(TP)は、同じパケット識別子(例えば、PID=0x18xx)を有する。ディスクプレーヤが特定のテキスト・サブタイトル・ストリームを含む多くの入力ストリームを入力すると、それらのPIDを利用してテキスト・サブタイトル・ストリームに属する全てのトランスポート・パケットを見つける。図7Aによれば、トランスポート・パケットの各サブセットは、パケット・エレメンタリー・ストリーム(PES)を形成する。図7Aに示すように、PESパケットのうち1つは、領域スタイルのグループを定義するダイアログ・スタイル・ユニット(DSU)に対応する。DSUは、ダイアログ・スタイル・セグメント(DSS)と称される。残りの全てのPESパケットは、ダイアログ・プレゼンテーション・ユニット(DPUs)に対応し、各DPUは、少なくとも1つの領域を有する1つのダイアログのプレゼンテーション情報と、領域スタイルインジケータ、インライン・スタイル情報及び各領域についてのテキスト・ストリングを含むダイアログ・テキストを含む。同様に、DPUは、ダイアログ・プレゼンテーション・セグメント(DPS)と称される。
図7Bは、本発明による、テキスト・サブタイトル・ストリームに含まれるDPUとDSU内に含まれる特定の情報を示す。DSUは、領域スタイルのグループを定義する情報セットを含み、各領域スタイルのグループは、対応するダイアログの領域に適用される。さらに、DPUは、ダイアログのためのダイアログ・テキストデータとダイアログ・プレゼンテーション情報を含む。ダイアログ・テキストデータは、ダイアログの各領域内に含まれるテキスト・ストリングと、テキスト・ストリングの特定の部分に適用されるインライン・スタイル情報と、各ダイアログ領域に適用される領域スタイルを指示する領域スタイル識別子を含む。領域スタイル識別子は、DSU内に定義された領域スタイルのグループのうちの1つを識別する。これに対し、ダイアログ・プレゼンテーション情報は、ダイアログのためのプレゼンテーション・タイム情報及びパレット(色)更新情報を含む。プレゼンテーション・タイム情報は、ディスプレイ画面上にダイアログを提示するためのプレゼンテーション開始時間(例えば、PTS_start)とプレゼンテーション終了時間(例えば、PTS_end)を含む。パレット更新情報は、ダイアログの表示色を更新するか否かを指示するインジケータ(例えば、palette_update_flag)と、表示色が更新される場合に適用されるパレット情報(例えば、Palette for update)を含む。
テキスト・サブタイトル・ストリームに含まれる全てのデータは、それぞれの基本的な機能に基づいて3種類のデータに分類することができる。例えば、図7Bに示すように、データは、ダイアログ・テキストデータ、コンポジション情報及びレンダリング情報に分類できる。ダイアログ・テキストデータは、ダイアログの各領域に対して、テキスト・ストリング、インライン・スタイル情報及び領域スタイル識別子を含む。コンポジション情報は、プレゼンテーション・タイム情報を含む。プレゼンテーション・タイム情報は、例えば、プレゼンテーション開始時間及びプレゼンテーション終了時間、ダイアログ領域のための位置情報、及びダイアログのためのパレット更新情報である。最後に、レンダリング情報は、プレゼンテーションのためにテキスト・ストリングをグラフィックデータにレンダリングするために必要な情報を含む。
図7Bによれば、DSUに含まれている各領域の水平位置及び垂直位置は、コンポジション情報の一部である。DSUに含まれている領域幅、領域の高さ、フォント色、背景色、テキストフロー、テキスト配列、ラインスペース、フォント名、フォントスタイル及びフォントサイズは、レンダリング情報を表す。
DSUは、制作者により定義された限られた数の領域スタイルを定義する領域スタイル情報のセット(ダイアログ・スタイル・セット)を含む。例えば、DSUに定義された最大領域スタイルの数は60個に制限され、領域スタイルは、領域スタイル識別情報(region_style_id)により識別される。このため、制作者は、光ディスク内に、限られた数の領域スタイルの定義するDSUを格納する。領域スタイルは、光ディスクに記録されたテキスト・サブタイトル・ストリームを再生するときにディスクプレーヤにより使用される。あるいは、ディスクプレーヤは、他のソースから提供されるスタイル情報の追加セットにより定義された他の領域スタイルを使用することができる。ソースの例として、ディスクプレーヤ内のローカルデータ・ストレージが挙げられる。その結果、光ディスクに記録されたテキスト・サブタイトル・ストリームから再生されるサブタイトル領域は、各種の領域スタイルを有することが可能である。
図8は、本発明による、テキスト・サブタイトル・ストリーム(Text_subtitle_stream())のシンタックスを示す。上述したように、テキスト・サブタイトル・ストリーム・シンタックスは、領域スタイルのセットを定義する情報のセットを含むダイアログ・スタイル・ユニット(dialog_style_unit())のシンタックスと、複数のダイアログ・プレゼンテーション・ユニット(dialog_presentation_unit())のシンタックスを含む。各DPUシンタックスは、ダイアログ・プレゼンテーション情報と、少なくとも1つのダイアログ・テキスト領域を含む。各ダイアログ・テキスト領域は、領域スタイル識別子、1又は複数のテキスト・ストリング及びインライン・スタイル情報を含む。領域スタイル識別子は、DSUシンタックスに定義された領域スタイルのセットのうち1つを識別する。
図9Aは、図8に示すようなテキスト・サブタイトル・ストリームに含まれたダイアログ・スタイル・ユニット(dialog_style_unit())のシンタックスを示す。ダイアログ・スタイル・ユニット・シンタックスは、制作者により定義された領域スタイルのセットが定義されているダイアログ・スタイル・セット(dialog_styleset())のシンタックスを含む。図9Bは、図9Aに示されるダイアログ・スタイル・ユニット・シンタックスに含まれるダイアログ・スタイル・セット(dialog_styleset())のシンタックスを示す。ダイアログ・スタイル・セット・シンタックスは、領域スタイル(region_style())のセットを定義する領域スタイル情報のセットを含み、region_style()内に定義された制作者により定義されたスタイルのセットに加えて、データフィールド又はテキスト・サブタイトルの独自のスタイル(プレーヤスタイル)のセットを生成することをプレーヤに許可するか否かを示すフラグ(player_style_flag)を含む。ダイアログ・スタイル・セット・シンタックスは、ユーザ制御スタイルのセットを定義するユーザ変更可能なスタイル・セット(user_changeable_styleset()」のシンタックスをさらに含む。
図9Bによれば、領域スタイル識別情報(region_style_id)は、領域スタイルのセット(region_style())に割り当てられ、各領域スタイル情報は、ダイアログ・テキスト領域の全体に適用されるグローバル・スタイル情報を表す。各領域のDPUに含まれている領域スタイル識別子は、領域スタイル識別情報のうち1つを含む。このため、各DPU内に含まれている少なくとも1つのダイアログ・テキスト領域を再生するときに、領域スタイル識別子に対応する領域スタイルが適用される。
以下に、各領域スタイル(region_style())に定義されている特定の領域プレゼンテーション・プロパティを詳述する。領域水平位置(region_horizontal_position)は、グラフィック・プレーン内の領域の左上ピクセルの水平アドレスを指定し、領域垂直位置(region_vertical_position)は、グラフィック・プレーン内の領域の左上ピクセルの垂直アドレスを指定する。さらに、領域幅(region_width)は、領域水平位置から四角形の領域の水平長を指定し、領域高さ(region_height)は、領域垂直位置から四角形の領域の垂直長を指定する。領域背景色インデックス(region_bg_color_index)は、領域の背景色を指示するインデックス値を指定する。
さらに、テキスト水平位置(text_horizontal_position)は、領域内のテキストの始点の水平アドレスを指定し、テキスト垂直位置(text_vertical_position)は、領域内テキストの始点の垂直アドレスを指定する。テキストフロー(text_flow)は、領域内における文字の進行方向(左→右、あるいは、右→左)及びラインの進行方向(上→下、あるいは、下→上)を指定する。テキスト配列(text_alignment)は、領域内にレンダリングされたテキストの配列(左側、中央、右側)を指定する。ダイアログが複数の領域を有する場合、視聴者の混乱を防ぐために、同じテキストフローが全ての領域に適用される。再び図9Bを参照すると、ラインスペース(line_space)は、領域内の隣り合う2ライン間の距離を指定する。フォント識別情報(font_id)は、クリップ・インフォメーション・ファイル内で指定されるフォント識別情報を指定する。フォントスタイル(font_style)は、領域内テキストのフォントスタイル、例えば、普通体、太字体、斜体及び太字体−斜体などを指定する。フォントサイズ(font_size)は、領域内のテキストのフォントサイズ、例えば、ピクセル単位での文字の垂直サイズを指定する。最後にフォントカラー・インデックス(font_color_index)は、領域内のテキストカラーを指定するインデックス値を指定する。
図9Bに示すプレーヤ・スタイル・フラグ(player_style_flag)は、制作者がディスクプレーヤにプレーヤ独自のスタイル(プレーヤスタイル)のセットの生成及び/又は利用を許可したか否かを示す。スタイル・セットは、テキスト・サブタイトルのために光ディスク内に定義された、制作者により定義された領域スタイルに加えて、ディスクプレーヤのローカルデータ・ストレージ内に予め格納されている場合がある。例えば、プレーヤ・スタイル・フラグの値に1bが設定される場合、制作者は、プレーヤにプレーヤ独自のスタイル・セットの生成及び/又は利用を許可する。これに対し、プレーヤ・スタイル・フラグの値に0bが設定される場合、制作者はプレーヤにプレーヤ・スタイルのセットの生成及び/又は利用を禁止する。
図9Cは、図9Bに示されるダイアログ・スタイル・セット・シンタックスに含まれたユーザ変更可能なスタイル・セット(user_changeable_styleset())のシンタックスを示す。user_changeable_styleset()は、ユーザ制御スタイル(user_control_style())のセットを定義するユーザ制御スタイル情報のセットを含む。各ユーザ制御スタイルは、対応する領域スタイルにより指定された領域プレゼンテーション・プロパティのうち少なくとも1つを変更するように構成される。ユーザ制御スタイル・セットのうち1つを選択することにより、ユーザは、各領域の領域スタイルを簡単な方式により変更することができる。しかしながら、領域スタイルにより指定された全てのプロパティがユーザによって変更可能である場合、ユーザによるダイアログの表示制御が極めて困難になる。したがって、ユーザ制御スタイルによって変更可能な領域プレゼンテーション・プロパティは、領域水平位置、領域垂直位置、フォントサイズ、テキストの水平位置、テキストの垂直位置及びラインスペースのうち少なくとも1つに制限される。
図9B及び図9Cによれば、ユーザ制御スタイルのセットは、領域スタイルIDを有する各領域スタイルのために定義され、ユーザスタイルID(user_style_id)がユーザ制御スタイルのセットに割り当てられる。各領域スタイルに対して定義されるユーザ制御スタイルの最大数を、25に制限することができる。ダイアログ・スタイル・セットに定義された領域スタイルの最大数が60であるため、1つのDPUに対して定義されるユーザ変更可能なスタイルの総数は、1500以下になる。
図9Cによれば、領域の水平位置を変更するために、ユーザ制御スタイルは、領域水平位置の水平動作の方向を指定する領域水平位置方向(region_horizontal_position_direction」」と、ピクセル単位で水平移動量を指定する領域水平位置デルタ(region_horizontal_position_delta」を含む。例えば、水平位置方向が0に設定されている場合、水平移動は右方向に行われ、1に設定されている場合、水平移動は左方向に行われる。領域の垂直位置を変更するために、ユーザ制御スタイルは、領域垂直位置の垂直動作の方向を指定する領域垂直位置方向(region_vertical_position_direction)と、ピクセル単位で垂直移動量を指定する領域垂直位置デルタ(region_vertical_position_delta)を含む。例えば、垂直位置方向が0に設定されている場合、垂直移動は下方向に行われ、「1」が設定されている場合、垂直移動は上方向に行われる。さらに、領域スタイルIDを有する領域スタイルにより定義されたフォントサイズを変更するためには、ユーザ制御スタイルは、フォントサイズの変更方向を指定するフォントサイズ変更方向(font_size_inc_dec)と、ピクセル単位でフォントサイズの変更量を指定するフォントサイズデルタ(font_size_delta)を含む。例えば、font_size_inc_decに0が設定されている場合、フォントサイズは増加し、1が設定されている場合、フォントサイズは減少する。
本発明による、ユーザ変更可能スタイル・セットの特徴は、以下のとおりである。第一に、ユーザ制御スタイル・セットは、ダイアログ・スタイル・ユニットに定義された各領域スタイルのセットに対して定義され、ユーザ制御スタイルのセットの数は固定である。このため、2つの異なる領域スタイルに対して定義されたユーザ制御スタイルの数は同じである。すなわち、各ダイアログ・テキスト領域を再生するときに用いられるユーザ制御スタイル・セットの数は、固定である。第二に、各ユーザ制御スタイル・セットは、異なるユーザスタイルIDにより識別される。第三に、領域プレゼンテーション・プロパティ内の全ての変更は、1つのユーザ制御スタイルと組み合わせて定義される。例えば、領域水平位置とフォントサイズは、2つの異なるユーザ制御スタイルによって別々に定義されることはなく、それらは、ユーザ制御スタイルと共に変更される。第四に、所定のプロパティの変更は、実際のプロパティ値ではなく、移動方向あるいは変更量で表される。実際のプロパティ値は、領域スタイルに定義された元のプロパティ値に変更量(デルタ)及び変更方向を適用することによって求められる。
結論的には、制作者は、光ディスクにメインAVストリームを記録するとき、少なくとも1のテキスト・サブタイトル・ストリームを記録する。各テキスト・サブタイトル・ストリームは、ダイアログ・スタイルのセットを定義するDSUと複数のDPUを含む。領域スタイルのセットは、それぞれ異なる領域スタイルIDを有する。DSUは、各領域スタイルに対するユーザ制御スタイルのセットをさらに定義する。ユーザ制御スタイルは、それぞれ異なるユーザスタイルIDを有する。各ユーザ制御スタイルは、対応する領域スタイルによって指定される、制作者により定義された領域プレゼンテーション・プロパティのうち少なくとも1つを変更するように構成される。さらに、ダイアログ・スタイル・セットはプレーヤ・スタイル・フラグを含み、プレーヤ・スタイル・フラグは、制作者により定義されたスタイル・セットに加えて、テキスト・サブタイトルに対する独自のプレーヤ・スタイル・セットを生成及び/又は使用をプレーヤに許可するか否かを示す。
以下、図10を参照し、本発明のメインAVストリーム及びテキスト・サブタイトル・ストリームをデコードする装置を説明する。本装置は、パケット識別子に基づいて、入力ストリームをビデオストリーム、オーディオ・ストリーム、グラフィック・ストリーム、テキスト・サブタイトル・ストリームに分離するパケット識別子(PID)フィルター5と、ビデオストリームをデコードするビデオ・デコード手段20と、オーディオ・ストリームをデコードするオーディオ・デコード手段10と、グラフィック・ストリームをデコードするグラフィック・デコード手段30と、テキスト・サブタイトル・ストリームをデコードするテキスト・サブタイトル・デコード手段40を含む。
図10に示すように、テキスト・サブタイトル・ストリームは、光ディスクから又は付加的な外部ソースから得られる。したがって、本装置は、入力データソースを選択するスイッチ6をさらに含む。このため、テキスト・サブタイトル・ストリームが光ディスクから得られた場合、スイッチ6は、PIDフィルター5に接続されたデータ信号Aを選択する。これに対して、テキスト・サブタイトルが外部入力ソースから得られた場合、スイッチ6は、外部入力ソースに接続されたデータ信号Bを選択する。
再び図10を参照すると、オーディオ・デコード手段10、ビデオ・デコード手段20、グラフィック・デコード手段30は、デコードするストリーム・データを格納するトランスポート・バッファ11、21、31を含む。デコードされた信号を表示可能なビデオ及びグラフィックイメージに変換するビデオ・プレーン(VP)23とグラフィック・プレーン33は、ビデオ・デコード手段20とグラフィック・デコード手段30に含まれる。グラフィック・デコード手段30は、表示可能なグラフィックイメージの色及び透明度を制御するカラー・ルックアップ・テーブル(CLUT)34を含む。
テキスト・サブタイトル・デコード手段40は、スイッチ6から1つの言語をサポートするテキスト・サブタイトル・ストリームを入力すると、テキスト・サブタイトルの全体は、一度に、サブタイトル・プレローディング・バッファ(SPB)41にプレロードされる。又は、複数言語をサポートするテキスト・サブタイトル・ストリームが複数ある場合、全てのテキスト・サブタイトル・ストリームは、一度に、SPB41にプレロードされる。このため、SPB41のサイズは、スイッチ6から入力されたテキスト・サブタイトル・ストリームの総数に基づいて決定される必要がある。例えば、SPB41のサイズは、0.5Mバイトのテキスト・サブタイトル・ストリーム・ファイルをプレロードするために0.5Mバイト以上である必要がある。さらに、ユーザが2つの0.5Mバイトのテキスト・サブタイトル・ストリーム・ファイルのうち何れかを選択する場合にテキスト・サブタイトルのシームレス・プレゼンテーションを保証するためには、SPB41のサイズは、1Mバイト以上でなければならない。SPB41のサイズは、必要な全てのテキスト・サブタイトル・ストリーム・ファイルを一度にプレロードするのに十分なサイズである必要がある。
図10に示されるテキスト・サブタイトル・デコード手段40は、図1に示される補助データ・ディレクトリに含まれる関連する全てのフォントファイルを格納するフォント・プレローディング・バッファ(FPB)410をさらに含む。同様に、FPB410のサイズは、1又は複数の言語をサポートするテキスト・サブタイトルのシームレス・プレゼンテーションを保証するために、必要とする全てのフォントファイルを1度にプレロードするのに十分なサイズである必要がある。全ての有効なテキスト・サブタイトル・ストリーム・ファイルと、関連するフォントファイルがプレロードされるため、プレロードデータの抽出又は使用は単純な方式で行われる。したがって、SPB41とFPB410の制御も単純になる。テキスト・サブタイトル・デコード手段40は、SPB41に格納された各テキスト・サブタイトルをデコードするテキスト・サブタイトル・デコーダ42と、デコードされたサブタイトル・データを表示可能なサブタイトル・イメージとして合成するグラフィック・プレーン43と、変換されたサブタイトル・イメージのカラー及び透明度のうち少なくとも1つを制御するカラー・ルックアップ・テーブル(CLUT)44を含む。
テキスト・サブタイトル・デコード手段40は、SPB41にプレロードされたテキスト・サブタイトル・ストリームを再生するときに選択的に用いられるプレーヤ・スタイル・セットを定義するプレーヤ・スタイル・セットを格納するローカルデータ・ストレージ45をさらに含む。さらに、ローカルデータ・ストレージ45は、テキスト・サブタイトル・ストリームを再生するときに選択的に用いられるユーザ制御スタイルのセットを指定するユーザ変更可能なセットをさらに格納することができる。このユーザ変更可能セットは、図9Cに示されるようにDSU内に含まれているユーザ変更可能セットと類似する。
本発明の第1の態様によれば、各プレーヤ・スタイルは、ダイアログ・テキスト領域のための領域プレゼンテーション・プロパティの完全なセットを指定する領域スタイルを表す。プレーヤ・スタイルは、例えば、領域の水平位置、領域の垂直位置、領域幅、領域の高さ、領域の背景色のインデックス、テキストの水平位置、テキストの垂直位置、テキストフロー、テキスト配列、ラインスペース、フォント識別情報、フォントスタイル、フォントサイズ、及びフォントカラー・インデックスである。この場合、ローカルデータ・ストレージ45に格納されているプレーヤ・スタイルのセットは、DSU内に定義されている領域スタイル・セットとは独立して用いられる。
本発明の第2の態様によれば、各プレーヤ・スタイルは、DSU内に定義された領域スタイルにより最初に定義された領域プレゼンテーション・プロパティのうち少なくとも1つを再定義するように構成される。例えば、DSUに定義された領域スタイルがフォント識別情報を含む領域プレゼンテーション・プロパティの完全なセットを定義し、プレーヤ・スタイルがフォント識別情報を再定義する場合、再定義されているフォント識別情報と、領域スタイルにより指定された他の全てのプロパティは、組み合わせて用いられる。
本発明の第3の態様によれば、各プレーヤ・スタイルは、DSUに定義された領域スタイルにより最初に定義された領域プレゼンテーション・プロパティのうち少なくとも1つを変更するように構成される。例えば、プレーヤ・スタイルは、領域スタイルに定義された領域水平位置の変更方向及び変更量を指定することができる。この場合、プレーヤ・スタイル・セットは、図9Cに示すように、ユーザ変更可能なセットと類似する。
図11は、本発明の例による、光ディスクに記録されたテキスト・サブタイトル・ストリームをデコードする方法を示す。テキスト・サブタイトル・デコーダ42がSPB41にプレロードされたテキスト・サブタイトル・ストリームの再生を始めると、テキスト・サブタイトル・デコーダ42は、初めに、DSUに含まれているplayer_style_flagを読みこみ、ローカルデータ・ストレージ45に格納されたプレーヤ・スタイル・セットの使用が許可されているか否かを判定する(S110)。例えば、player_style_flagに0bが設定されていれば、プレーヤ・スタイル・セットの使用が許可されない。この場合、テキスト・サブタイトル・デコーダ42は、光ディスクに記録された制作者により定義された領域スタイルを使用しなければならない。これに対し、player_style_flagに1bが設定されている場合、テキスト・サブタイトル・デコーダ42は、ローカルデータ・ストレージ45に格納されているプレーヤ・スタイル・セットの使用が許可される。次いで、テキスト・サブタイトル・デコーダ42は、プレーヤ・スタイル・セットに定義されたプレーヤ・スタイルのセットのいずれか1つを使用するかどうかを独自に判断する(S112)。例えば、テキスト・サブタイトル・デコーダ42は、プレーヤ・スタイルとテキスト・サブタイトル・ストリームに定義された領域スタイルを比較し、その比較結果をステップS112の判断のために用いる。ステップS112においてプレーヤ・スタイルのセットを用いないと判断された場合、光ディスク内に記録されている領域スタイルが用いられる(S111)。これに対して、ステップS112において、プレーヤ・スタイルのセットを用いると判断されると、テキスト・サブタイトル・デコーダ42は、プレーヤ・スタイル・セットを独立して用いるか、あるいは、光ディスクに記録されている領域スタイル・セットと組み合せて用いる。
さらに、テキスト・サブタイトル・デコーダ42がDPUをデコードするとき、DPUに含まれた領域スタイル識別子により識別された領域スタイルを用いる。ユーザがこの領域スタイルの変更を希望するとき、ユーザは、領域スタイル変更のためのコマンドを入力する。DSUに定義されたユーザ変更可能なスタイルとして定義されたユーザ制御スタイルのセットのうち1つを選択することにより、領域の水平位置、領域の垂直位置及びフォントサイズのうち少なくとも1つが変更される。
図10に示す装置は、ビデオ・デコード手段20、グラフィック・デコード手段30及びテキスト・サブタイトル・デコード手段40から出力されるイメージを重畳するイメージ重畳手段50をさらに含む。図3に示すように、ディスプレイ画面上には、合成されたイメージが表示される。通常、ビデオ・デコード手段20のVP23から出力されるビデオイメージがディスプレイ画面の背景として表示され、グラフィック・デコード手段30及び/又はテキスト・サブタイトル・デコード手段40から出力されるイメージが所定の順序でビデオイメージ上に重畳される。例えば、グラフィック・デコード手段30の出力イメージがプレゼンテーション・グラフィック・イメージであれば、これらのイメージは、最初に第1の加算手段52によりビデオイメージ上に重畳され、次いで、テキスト・サブタイトル・デコード手段40から出力されるテキスト・サブタイトル・イメージが第2の加算手段53によりビデオイメージ上に重畳される。しかしながら、グラフィック・デコード手段30の出力イメージがインタラクティブ・グラフィック・イメージであれば、テキスト・サブタイトル・デコード手段40から出力されるテキスト・サブタイトル・イメージが最初に第1の加算手段52によりビデオイメージ上に重畳される。次いで、インタラクティブ・グラフィック・イメージが第2の加算手段53によりサブタイトルが重畳されているイメージ上にさらに重畳される。
最後に、図10に示す装置は、入力トランスポート・ストリーム(例えば、MPEGトランスポート・ストリーム)をデコードするシステム・デコーダ4と、上述した装置内の全ての構成要素の動作を制御するマイクロプロセッサ3を含む。
以上述べたように、本発明の実施の形態は、当業者であれば、特許請求の範囲に開示された本発明の技術的な思想とその技術範囲内において各種の実施例を改良、変更、代替又は付加などが可能なことは自明である。よって、本発明は、特許請求の範囲及びそれと均等の範囲内における本発明の改良及び変更事項を含むということは言うまでもない
本発明によれば、テキスト・サブタイトル・ストリームは、制作者により定義されたスタイルのセットを定義するダイアログ・スタイル・セグメントと、少なくとも1つのダイアログ・プレゼンテーション・セグメントを含み、各セグメントは、ダイアログ・テキストの少なくとも1つの領域を含む。ダイアログ・スタイル・セグメントは、プレーヤが独自のプレーヤ・セットを生成及び/又は使用することが許可されているか否かを示すプレーヤ・スタイル・フラグを含む。したがって、プレーヤは、許可されているならば、制作者により定義された領域スタイルのセットに加えて、プレーヤ・スタイル・セットを使用することができる。プレゼンテーションのためにデコードされたダイアログ・テキストの各領域は、各種の領域スタイルを有する。