JP2010154546A - テキストデータとダウンロードフォントとを利用した多国語支援用サブタイトルデータが記録された情報保存媒体に保存されたデータ再生方法及び再生装置 - Google Patents

テキストデータとダウンロードフォントとを利用した多国語支援用サブタイトルデータが記録された情報保存媒体に保存されたデータ再生方法及び再生装置 Download PDF

Info

Publication number
JP2010154546A
JP2010154546A JP2010028240A JP2010028240A JP2010154546A JP 2010154546 A JP2010154546 A JP 2010154546A JP 2010028240 A JP2010028240 A JP 2010028240A JP 2010028240 A JP2010028240 A JP 2010028240A JP 2010154546 A JP2010154546 A JP 2010154546A
Authority
JP
Japan
Prior art keywords
data
subtitle
text
language
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010028240A
Other languages
English (en)
Inventor
Giru-Su Jon
ジョン,ギル−ス
Son-Jin Mun
ムン,ソン−ジン
Jung-Wan Ko
コ,ジョン−ウァン
Sung-Wook Park
パク,ソン−ウック
Hyun-Kwon Chung
ジョン,ヒョン−グォン
Jung-Kwon Heo
ホー,ジョン−グォン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2010154546A publication Critical patent/JP2010154546A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8233Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being a character code signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2562DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction

Abstract

【課題】 動画データの符号化時、サブピクチャーデータが占めるビット発生量をあらかじめ考慮する必要のないデータ構造としてサブピクチャーデータが記録された情報保存媒体に保存されたデータ再生方法及び再生装置を提供すること。
【解決手段】 AVデータとテキストデータとを読む段階と、前記テキストデータからサブタイトルイメージデータをレンダリングする段階と、前記AVデータをデコーディングし、デコーディングされたAVデータを出力する段階と、前記サブタイトルイメージデータと前記デコーディングされたAVデータをブレンディングする段階とを含む。
【選択図】 図10

Description

本発明は、テキストデータとダウンロードフォントとを利用した多国語支援のためのサブタイトルが記録された情報保存媒体に保存されたデータ再生方法及び再生装置に関する。
従来のDVDは、サブタイトルとしてビットマップイメージを使用する。ビットマップイメージのサブタイトルデータは、無損失符号化されて最大32個までDVDに記録されている。
従来のマルチメディア情報保存媒体の一つであるDVDビデオのデータ構造を説明すれば、次の通りである。
図1は、DVDのデータ構造図である。図1を参照するに、マルチメディア保存媒体であるDVDは、ディスクをVMG領域と複数個のVTS領域とに分け、タイトル情報及びタイトルメニューについての情報をVMG領域に、タイトルについての情報を複数個のVTS領域に保存する。VMG領域は、2〜3個のファイルより構成されており、各VTS領域は、3〜12個のファイルより構成されている。
図2は、VMG領域の詳細構造図である。図2を参照するに、VMG領域には、VMGについての付加情報を保存するVMGI領域とメニューについての動画情報を保存するVOBS領域、そして、VMGIのバックアップ領域がある。これらは、一つのファイルに存在するが、このうちVOBS領域の存在は選択的である。
VTS領域には、再生単位のタイトルについての情報と動画データであるVOBSが保存されている。一つのVTSには、少なくとも一つのタイトルが記録される。
図3は、VTS領域の詳細構造図である。図3を参照するに、VTS領域は、ビデオタイトルセット情報VTSI(Video Title Set Information)、メニュー画面用動画データであるVOBS、ビデオタイトルセットの動画データであるVOBS、及びVTSIのバックアップデータを含む。メニュー画面を表示するためのVOBSの存否は選択的である。各VOBSは、再び記録単位であるVOBとCELLとに区分される。一つのVOBは、複数個のCELLより構成される。本発明で言及される最下位記録単位は、CELLである。
図4は、動画データであるVOBSの詳細構造図である。図4を参照するに、一つのVOBSは、複数個のVOBより構成され、一つのVOBは、複数個のCELLより構成される。CELLは、再び複数個のVOBUより構成される。VOBUは、DVDで使用する動画符号化方法であるMPEGによって符号化されたデータである。MPEGによれば、画像を時空間圧縮符号化するため、ある画像を復号化するためには、以前あるいは以後画像が必要である。したがって、任意の地点で再生を開始するランダムアクセス機能を支援するために、以前あるいは以後画像が不要なイントラ符号化を一定画像ごとに行っている。これを、MPEGでは、イントラピクチャーあるいはIピクチャーと称し、このIピクチャーと次のIピクチャーとの間をGOP(Group Of Picture)と称す。通常、GOPは、12〜15個の画像よりなる。
MPEGは、ビデオデータとオーディオデータとを一つのビットストリームに結び出すためのシステム符号化(ISO/IEC13818−1)も規定している。システム符号化には、一つのプログラムを作って情報保存媒体に保存するために最適化されたPS(プログラムストリーム)多重化方法と複数のプログラムを作って伝送するために適したTS(トランスポートストリーム)多重化方法との2つの多重化方法を規定している。DVDでは、そのうち、PS符号化方法を採用している。PS符号化方法によれば、ビデオデータあるいはオーディオデータをそれぞれパック(PCK)という単位で分割した後、これを時分割して多重化する。MPEGで定義したビデオ及びオーディオデータ以外のデータは、PSと名付けて、やはりPCKに込めてビデオデータ、オーディオデータと共に多重化しうる。
VOBUは、複数個のPCKより構成される。複数個のPCKのうち、第1PCKは、ナビゲーションパック(NV_PCK)である。次いで、ビデオパック(V_PCK)、オーディオパック(A_PCK)、そしてサブピクチャーパック(SP_PCK)より構成される。ビデオパックに込まれたビデオデータは、複数のGOPよりなる。
SP_PCKは、2次元グラフィックデータ及び字幕データのためのものである。すなわち、DVDでは、ビデオ画像にオーバーラップされて現れる字幕データを2次元グラフィックデータと同じ方法で符号化する。すなわち、DVDの場合、多国語支援のための別途の符号化方法は採用せず、各字幕データをグラフィックデータに変換した後、一つの符号化方法で処理して記録する。字幕のためのグラフィックデータをサブピクチャーと称す。サブピクチャーは、サブピクチャーユニット(SPU)より構成される。SPUは、一枚のグラフィックデータに該当する。
図5は、SPUとSP_PCKとの関係図である。図5を参照するに、一つのSPUは、SPUヘッダ(SPUH)、ピクセルデータ(PXD)、そしてサブピクチャーディスプレイコントロールシーケンステーブル(SP_DCSQT)より構成される。これらは、順に2048バイトサイズのSP_PCKに分割されて記録される。このとき、SPUの最後のデータが一つのSP_PCKを完全に満たせない時には、最後のSP_PCKの残りの空間は、パッディングされて残りのSP_PCKと同じサイズに作られる。すなわち、一つのSPUは、複数のSP_PCKより構成される。
SPUHには、全体SPUのサイズとSPU内でSP_DCSQTデータが開始される位置とが記録されている。PXDデータは、サブピクチャーを符号化した符号化データである。サブピクチャーを構成するピクセルデータは、4種類の値を有しうる。バックグラウンド、パターンピクセル、エンファシスピクセル−1、エンファシスピクセル−2がそれらであって、2ビット値で表すことができ、それぞれ2進数で00、01、10、11値を有する。したがって、サブピクチャーは、複数のラインより構成された前記4つのピクセル値を有するデータの集合と言える。符号化は、各ライン別に実施される。
図6は、サブピクチャーが符号化された時のデータ構造図である。図6に示されたように、SPUは、ランレングス符号化されている。すなわち、特定のピクセルデータが1〜3個連続される時には、2ビットで連続したピクセル数(No_P)を表し、その後に2ビットのピクセルデータ値(PD)を記録する。4〜15個連続される時には、最初の2ビットを0と記録し、4ビットでNo_Pを記録し、2ビットでPDを記録する。16〜63個連続される時には、最初の4ビットを0と記録し、6ビットでNo_Pを記録し、2ビットでPDを記録する。64〜255個連続される時には、最初の6ビットを0と記録し、8ビットでNo_Pを記録し、2ビットでPDを記録する。ラインの端部まで同じピクセルが続く時には、最初の14ビットを0と記録し、2ビットでPDを記録する。このように、1ラインの符号化が終わった時、バイト単位で整列されていなければ、4ビットの0を記録する。1ラインの符号化データは、1440ビットを超えられない。
図7は、SP_DCSQTのデータ構造を示す図である。図7を参照するに、SP_DCSQTは、前記PXDデータを出力させるためのディスプレイコントロール情報を含んでいる。SP_DCSQTは、複数のサブピクチャーディスプレイコントロールシーケンス(SP_DCSQ)より構成される。一つのSP_DCSQは、一つの時間に行われるディスプレイコントロールコマンド(SP_DCCMD)の集合であって、開始時間を表すSP_DCSQ_STM、次のSP_DCSQの位置情報を含んでいるSP_NXT_DCSQ_SA及び複数のSP_DCCMDより構成されている。
SP_DCCMDは、前記PXD(ピクセルデータ)がビデオ画像とどのように合わせられて出力されるかについての制御情報であって、ピクセルデータの色相情報、ビデオデータとのコントラスト情報、出力時間及び終了時間についての情報を含んでいる。
図8は、サブピクチャーデータが考慮された出力時の状況を示す図である。図8を参照するに、ピクセルデータ自体は、PXDであって無損失符号化されており、ビデオ画像の領域であるビデオディスプレイ領域内のサブピクチャーがディスプレイされる位置であるサブピクチャーディスプレイ領域であるSPディスプレイ領域についての情報及び出力開始、終了時間についての情報は、SP_DCSQTに含まれている。
DVDでは、最大32ヶ国語の字幕データのためのサブピクチャーデータが動画データと共に多重化されて記録されうる。このように、各言語の区別は、MPEGシステム符号化で提供するストリームIDとDVDで定義したサブストリームIDとに区分される。したがって、ユーザが一つの言語を選択すれば、当該ストリームIDとサブストリームIDとを有するSP_PCKのみを対象としてSPUを抽出した後、復号化して字幕データを抽出し、ディスプレイ制御コマンドによって出力を制御する。
前述したように、字幕データが動画データに共に多重化されていて色々な問題点が発生する。
第一に、動画データの符号化時、サブピクチャーデータが占めるビット発生量をあらかじめ考慮せねばならないという点である。すなわち、字幕データがグラフィックデータに変換されて処理されることによって各言語別に発生するデータ量が異なり、その量も膨大である。通常、動画符号化は、一回のみ実施した後、その出力に加えて、各言語別のサブピクチャーデータを再び多重化して、各地域に適するDVDを製作する。しかし、言語によっては、サブピクチャーデータ量が膨大で動画データとの多重化時に総ビット発生量が最大限界を超えるものが生じる。また、サブピクチャーデータが動画データの間に多重化されることによって、各VOBUの開始位置も地域別に変わる。DVDでは、VOBUの開始位置が別途に管理されるため、多重化過程を新たに開始する度に、これら情報も更新されねばならない。
第二に、各サブピクチャーの内容を分からないため、2つの言語を同時に出力するか、または動画鑑賞ではない字幕データのみを出力して言語習得に利用する別途の目的のために使用できない。
本発明の目的は、動画データの符号化時、サブピクチャーデータが占めるビット発生量をあらかじめ考慮する必要のないデータ構造としてサブピクチャーデータが記録された情報保存媒体及びその装置を提供することである。
本発明の他の目的は、字幕以外の用途にも使用可能なデータ構造としてサブピクチャーデータが記録された情報保存媒体に保存されたデータ再生方法及び再生装置を提供することである。
前記目的は、本発明によって動画データが記録された情報保存媒体において、前記動画データが保存された記録単位の複数個のクリップと、前記クリップと別個に記録されており、前記動画データに基づいた画像上にグラフィックでオーバーラップされて出力されるサブタイトル用のテキストデータとを含み、前記サブタイトル用のテキストデータは、少なくとも一つの言語よりなるデータを含むことを特徴とする情報保存媒体によって達成される。
前記目的は、本発明によって動画データが記録された情報保存媒体において、前記動画データが保存された記録単位である複数個のクリップと、前記複数個のクリップと別個に記録されており、前記動画データに基づいた画像上にグラフィックでオーバーラップされて出力されうるサブタイトル用のテキストデータとを含み、前記サブタイトル用のテキストデータは、少なくとも一つの言語のサブタイトルを提供するためのデータを含むことを特徴とする情報保存媒体によって達成される。
前記情報保存媒体は、前記複数のクリップと別個に記録され、前記テキストデータのグラフィック表現のために前記サブタイトル用のテキストデータで使用されうる文字のフォントデータをさらに含みうる。
前記サブタイトル用のテキストデータは、複数の言語データである場合、各言語別に別途の空間に記録されうる。前記サブタイトル用のテキストデータは、グラフィックデータに変換されて出力される文字データと共に前記動画データとの出力同期化情報を含みうる。前記サブタイトル用のテキストデータは、グラフィックデータに変換されて出力される文字データと、このグラフィックデータが前記動画データに基づいた画像とオーバーラップされる時にどの位置に出力されるかを表す出力位置情報とを含みうる。前記サブタイトル用のテキストデータは、グラフィックデータに変換されて出力される文字データと、このグラフィックデータが動画とオーバーラップされる時に一つ以上の複数のサイズでグラフィックデータの出力を表示するための情報とを含みうる。
前記動画データは、連続的に再生されうる単位に区分されており、前記一つの単位に該当する前記サブタイトル用のテキストデータは、全体サイズが制限されうる。前記動画データは、連続的に再生されうる再生単位に区分されており、前記再生単位一つに該当する前記サブタイトル用のテキストデータは、複数の言語セットに区分され、前記一つの言語セットを構成するサブタイトル用のテキストデータは、全体サイズが制限されうる。
前記サブタイトル用のテキストデータを構成するテキストデータは、多国語文字セットを支援するためのユニコードで表現されて記録されうる。
前記サブタイトル用のテキストデータは、基本英文字セットであるASCII、そして、ラテン語拡張文字セットであるISO8859−1に該当する文字でのみ構成された場合、一つの文字を複数の8ビット単位で符号化するUTF−8を使用して符号化されて記録されうる。
前記サブタイトル用のテキストデータは、ユニコード上で2バイトサイズのコードポイント値を有する文字が含まれた場合、一つの文字を複数の16ビット単位で符号化するUTF−16を使用して符号化されて記録されうる。
前記情報保存媒体は、着脱式でありうる。前記情報保存媒体は、その再生装置の光学装置を利用してデータを読出せる光ディスクでありうる。
一方、本発明の他の分野によれば、前記目的は、動画データが記録された情報保存媒体を再生する再生装置において、前記情報保存媒体には、動画データが符号化されて記録単位であるクリップに区分されて、複数個のクリップで記録されており、前記動画データに基づいた画像上にグラフィックデータでオーバーラップされて出力されるサブタイトル用のテキストデータが前記クリップと別個に記録されており、前記サブタイトル用のテキストデータは、一つ以上の複数言語のデータで構成され、前記再生装置は、前記情報保存媒体からデータを読出すためのデータ再生器と、前記符号化動画データの復号器と、前記字幕用テキストデータをグラフィックデータに変換するためのレンダラーと、前記動画データと前記グラフィックデータとをオーバーレイして一つの画像に作るためのブレンダと、前記動画データを一時保存するバッファと、前記サブタイトル用のテキストデータを保存するバッファとを含むことを特徴とする再生装置によっても達成される。
前記情報保存媒体には、前記テキストデータのグラフィック表現のために前記サブタイトル用のテキストデータで使われた文字のフォントデータが別途の空間に分離されて記録されており、前記再生装置には、前記フォントデータを一時保存するバッファが備えられており、前記レンダラーは、前記サブタイトル用のテキストデータのテキストデータを前記フォントデータを利用してグラフィックデータに変換する機能を備えうる。
前記情報保存媒体には、前記サブタイトル用のテキストデータが複数の言語データである場合、各言語別に別途の空間に記録されており、前記再生装置は、ユーザの選択や前記再生装置に初期再生言語で指定された言語用の前記サブタイトル用のテキストデータを前記バッファに臨時保存し、前記サブタイトル用のテキストデータをグラフィックデータに変換させるためのフォントデータを前記フォント用バッファに臨時保存し、動画データの再生と同時に前記サブタイトル用のテキストデータをグラフィックデータに変換して出力する機能を備えうる。
前記再生装置は、前記サブタイトル用のテキストデータの出力開始時間と終了時間とを同期化情報を使用して制御する制御器をさらに含み、前記情報保存媒体には、前記サブタイトル用のテキストデータをグラフィックデータに変換して前記動画データに基づいた画像とオーバーラップして出力する前記同期化情報が記録されうる。
前記再生装置は、前記サブタイトル用のテキストデータの前記動画データに基づいた画像とのオーバーラップ位置を前記出力位置情報によって制御する制御器をさらに含み、前記情報保存媒体には、前記サブタイトル用のテキストデータがグラフィックデータに変換されて出力される文字データと、このグラフィックデータが前記動画データに基づいた画像とオーバーラップされる時にどの位置に出力されるかを表す出力位置情報と、を含んで記録できる。
前記情報保存媒体に記録された前記動画データは、連続的に再生されうる再生単位に区分されており、前記再生単位に該当する前記サブタイトル用のテキストデータは、全体サイズが制限されて記録されており、前記再生装置は、前記連続的に再生されうる単位を再生する前に前記サイズ制限されたサブタイトル用のテキストデータをいずれも前記バッファに保存し、再生中に言語変更が発生した場合、前記バッファに保存された当該言語用字幕データを出力する機能を備えうる。
前記情報保存媒体に記録された前記動画データは、連続的に再生されうる単位に区分されており、前記一つの単位に該当する前記サブタイトル用のテキストデータは、複数の言語セットに区分され、前記一つの言語セットを構成するサブタイトル用のテキストデータは、全体サイズが制限されて記録されており、前記再生装置は、前記連続的に再生されうる単位を再生する前に、動画データと同時に出力されねばならない言語用字幕データが属する前記言語セットに該当するサブタイトル用のテキストデータをいずれも前記バッファに保存し、再生中に言語変更が発生した場合、当該言語用の前記サブタイトル用のテキストデータがバッファにある場合、当該言語用の前記サブタイトル用のテキストデータを出力し、ない場合、当該言語用の前記サブタイトル用のテキストデータが属する前記言語セットに該当するサブタイトル用のテキストデータをいずれも前記バッファに保存し、当該言語用の前記サブタイトル用のテキストデータを出力する機能を備えうる。
前記情報保存媒体には、前記サブタイトル用のテキストデータがグラフィックデータに変換される文字データと、このグラフィックデータが前記動画データに基づいた画像とオーバーラップされる時に複数個のグラフィックデータの出力を表示するための情報とを含んで記録されうる。
前記情報保存媒体には、前記サブタイトル用のテキストデータを構成するテキストデータが多国語文字セットを支援するためのユニコードで表現されて記録されており、前記レンダラーは、ユニコードで表現された文字をグラフィックデータに変換するものでありうる。
前記情報保存媒体には、前記サブタイトル用のテキストデータが基本英文字セットであるASCIIあるいはラテン語拡張文字セットであるISO8859−1に該当する文字でのみ構成された場合、一つの文字を複数の8ビット単位で符号化するUTF−8を使用して符号化されて記録されており、前記レンダラーは、前記UTF−8で表現された文字をグラフィックデータに変換できる。
前記情報保存媒体には、前記サブタイトル用のテキストデータがユニコード上で2バイトサイズのコードポイント値を有する文字が含まれた場合、一つの文字を複数の16ビット単位で符号化するUTF−16を使用して符号化されて記録されており、前記レンダラーは、前記UTF−16で表現された文字をグラフィックデータに変換するものでありうる。
前記情報保存媒体は、その再生装置への挿入と離脱とが容易な着脱式であり、前記再生装置は、前記着脱式情報保存媒体を読込んで再生できる。
前記情報保存媒体は、その再生装置の光学装置を利用して、データを読出せる光ディスクであり、前記再生装置は、前記光ディスクに記録されたデータを読込んで再生できる。
前記再生装置は、前記情報保存媒体に記録された動画データを再生せずに出力できる
前記サブタイトルデータは、一つまたはそれ以上の言語用字幕データをさらに含み、前記レンダラーは、前記一つまたはそれ以上の言語用テキストデータをグラフィックデータに変換できる。
前記サブタイトルデータは、動画と同期されてオーバーラップされて出力されうる。
一方、本発明の他の分野によれば、前記目的は、動画データを情報保存媒体に記録する記録装置において、前記情報保存媒体にデータを記録するデータ出力器、前記データ出力器から出力された前記動画データを符号化する符号化器、前記動画データに付加されて出力される字幕データを作る字幕データ発生器、中央処理装置、固定式保存装置、バッファを含み、前記動画符号化器は、動画を記録単位であるクリップに区分して圧縮符号化した後、前記固定式保存装置に保存し、前記字幕データ発生器は、前記動画データに基づいた画像と同時に再生されうる一つ以上の複数言語用字幕データをテキスト状に作って前記固定式保存装置に保存し、前記バッファは、前記固定式保存装置に保存されたデータを一時保存し、前記データ出力器は、前記バッファに一時保存された動画符号化データ、字幕データを情報保存媒体に記録し、前記中央処理装置は、前記動画データの符号化過程、前記字幕データ発生過程、及び前記符号化された動画データ、前記サブタイトル用のテキストデータがそれぞれ情報保存媒体の別個の領域に記録されるように制御することを特徴とする記録装置によっても達成される。
前記記録装置は、前記サブタイトル用のテキストデータをグラフィックデータに変換するためのフォントデータを生成するためのフォントデータ発生器をさらに備え、前記フォントデータ発生器は、前記サブタイトル用のテキストデータをグラフィック状に変換するために必要なフォントデータを作って前記固定式保存装置に保存し、前記バッファは、前記固定式保存装置に保存されたフォントデータを一時保存し、前記データ出力器は、前記バッファに一時保存されたフォントデータを情報保存媒体に記録し、前記中央処理装置は、前記フォントデータ発生過程を制御し、フォントデータが前記情報保存媒体の別個の領域に記録されるように制御できる。
前記中央処理装置は、前記サブタイトル用のテキストデータが複数の言語データである場合、各言語別に別途の空間に記録されるように制御するものでありうる。
前記字幕データ発生器は、グラフィックデータに変換されて出力される文字データと共に、前記動画再生との出力同期化情報を含めて前記字幕用データを作りうる。前記字幕データ発生器は、グラフィックデータに変換されうる文字データと、このグラフィックデータが前記動画データに基づいた画像とオーバーラップされる時にどの位置に出力されるかを表す出力位置情報を含めて前記サブタイトル用のテキストデータを作りうる。
前記字幕データ発生器は、グラフィックデータに変換されうる文字データと、このグラフィックデータが前記動画データに基づいた画像とオーバーラップされる時に一つ以上の複数のサイズでグラフィックデータの出力を表示するための情報を含めて前記字幕用データを作りうる。
前記動画符号化データは、連続的に再生されうる再生単位に区分されており、前記字幕データ発生器は、前記再生単位に該当する前記字幕データの全体サイズが制限されるように前記サブタイトル用のテキストデータを作りうる。
前記動画符号化データは、連続的に再生されうる再生単位に区分されており、前記字幕データ発生器は、前記再生単位に該当する前記サブタイトル用のテキストデータを複数の言語セットに区分し、前記一つの言語セットを構成する字幕データは、全体サイズが制限されるように前記サブタイトル用のテキストデータを作りうる。
前記字幕データ発生器は、前記サブタイトル用のテキストデータを構成するテキストデータを多国語文字セットを支援するためのユニコードで表現するものでありうる。
前記エンコーダは、前記サブタイトル用のテキストデータが基本英文字セットであるASCII、そしてラテン語拡張文字セットであるISO8859−1に該当する文字でのみ構成された場合、一つの文字を複数の8ビット単位で符号化するUTF−8を使用して符号化するものでありうる。
前記エンコーダは、前記サブタイトル用のテキストデータがユニコード上で2バイトサイズのコードポイント値を有する文字が含まれた場合、一つの文字を複数の16ビット単位で符号化するUTF−16を使用して符号化するものでありうる。
前記情報保存媒体は、着脱式でありうる。前記情報保存媒体は、光学ディスクでありうる。
一方、本発明の他の分野によれば、前記目的は、AV(オーディオ/ビデオ)データとテキストデータとを読む段階と、前記テキストデータからサブタイトルイメージデータをレンダリングする段階と、前記AVデータをデコーディングし、デコーディングされたAVデータを出力する段階と、前記サブタイトルイメージデータと前記デコーディングされたAVデータをブレンディングする段階と、を含むことを特徴とする情報保存媒体に保存されたデータを再生する方法によっても達成される。
一方、本発明の他の分野によれば、前記目的は、AVデータ、テキストデータ及びフォントデータを読出す読出部と、前記AVデータをデコーディングして動画データを出力するデコーダ部と、前記テキストデータからサブタイトルイメージデータをレンダリングするレンダリング部と、前記動画を前記サブタイトルイメージデータと同期させるブレンダと、を含むことを特徴とする再生装置によっても達成される。
一方、本発明の他の分野によれば、前記目的は、テキストデータとフォントデータとを読出す読出部と、前記テキストデータからサブタイトルイメージデータをレンダリングするレンダリング部と、前記サブタイトルイメージデータを出力する出力部と、前記サブタイトルデータの出力時間を制御するために、次のラインに対するサブタイトルデータの入力を受信する入力受信部と、を含むことを特徴とする再生装置によっても達成される。
一方、本発明の他の分野によれば、前記目的は、保存部と、AVデータを符号化し、符号化されたAVデータを出力するエンコーダと、レンダリングされうるテキストデータを生成するサブタイトル生成部と、前記符号化されたAVデータと前記レンダリングされうるテキストデータを前記保存部に記録するデータ記録部と、前記符号化されたAVデータと前記レンダリングされうるテキストデータとを読出す読出部と、前記符号化されたAVデータをデコーディングして動画に作って出力するためのデコーダ部と、前記レンダリングされうるテキストデータからサブタイトルイメージデータをレンダリングするレンダリング部と、ブレンディングされた動画を出力するために、前記動画データを前記サブタイトルイメージデータと同期化させるブレンダ部と、を含むことを特徴とするデータ記録及び/または再生装置によっても達成される。
前記目的を達成するために、本発明による情報保存媒体には、各サブタイトルデータをAVデータ内に共に符号化せず、別途のテキストデータ状に記録空間に分離して記録されている。また、前記情報保存媒体には、テキスト状になっているサブタイトルデータをレンダリングするために必要な別途のフォントデータが記録されている。さらに、復号化過程が終わったAV動画と連動するための同期化情報及び画面出力のための出力情報が記録されている。サブタイトルデータは、従来のDVDにおいて、サブピクチャーデータに対応する。
すなわち、本発明による情報保存媒体には、次のような構成要素が記録されている。
1)動画情報が圧縮符号化されたAVデータ(クリップ)
2)多国語サブタイトル用のテキストデータ
3)テキストデータのレンダリングのためのフォントデータ
字幕以外の用途にも使用可能なデータ構造としてサブピクチャーデータが記録された情報保存に保存されたデータ再生方法及び再生装置を提供することができる。
DVDのデータ構造図である。 VMG領域の詳細構造図である。 VTS領域の詳細構造図である。 動画データであるVOBSの詳細構造図である。 SPUとSP_PCKとの関係図である。 サブピクチャーが符号化された時のデータ構造図である。 SP_DCSQTのデータ構造図である。 サブピクチャーデータが考慮された出力時の状況を示す参考図である。 本発明の望ましい実施例による再生装置のブロック図である。 本発明による情報保存媒体に保存されるテキストデータ(例、サブタイトルデータ)の構造図である。 本発明によるサブタイトル用のテキストデータの望ましい実施例である。 図11の言語とは異なる言語のためのテキストデータの構造図である。 本発明で使用しているテキストファイルの一例である。 スタイルが異なって適用された字幕の一例である。 図11で具現した韓国語字幕用テキストデータが実際画面に表示された一例である。 特定言語の字幕再生中にユーザが言語変更を実施した場合の一例である。 複数の多国語用字幕データ及びフォントデータの言語セットの例である。 PlayList、PlayItem、Clip Information、クリップの相関関係図である。 本発明によるディレクトリ構造の一例である。 再生装置が字幕用データのみを出力する場合の例である。 再生装置が一つ以上の言語用字幕データを同時に出力する場合の例である。 字幕データのみを再生し、当該字幕ラインデータに該当する動画データから正常的に動画データの再生を開始する例である。 本発明による記録装置のブロック図である。
以下、添付された図面を参照して本発明をさらに詳細に説明する。
図9は、本発明の望ましい実施例による再生装置のブロック図である。図9を参照するに、再生装置は、情報保存媒体に保存されたAVデータ、サブタイトル用のテキストデータ、ダウンロードフォントデータを読込むリーダブロックと、AVデータをデコーディングするためのデコーダブロックと、テキストファイルをレンダリングするレンダラーブロックと、デコーダブロックから出る動画とレンダラーブロックから出る字幕データとを合成するブレンダブロックとを含む。
それと共に、再生装置は、リーダブロックとデコーダブロック、レンダラーブロック間でデータの緩衝役割を担当する一方、決定されたフォントデータを保存するためのバッファブロックをさらに含み、デフォルトとしてあらかじめ保存されているレジデントフォントデータ保存ブロックを備えることもある。
本発明で、レンダリングとは、字幕用テキストデータをディスプレイ装置に表現するためのグラフィックデータに変換させることに関連した全ての必要な行為を称す。すなわち、テキストデータで、1文字ごとのキャラクタコードとマッチングされるフォントを情報保存媒体から読込んだダウンロードフォントデータあるいはレジデントフォントデータから探してグラフィックに変える過程を反復して、字幕画像を構成するためのグラフィックデータを作り出し、色相を指定または変換させ、文字のサイズを指定または変換させ、横書きあるいは縦書きによって適切にグラフィックデータを作り出すものなどが含まれる。特に、使用するフォントデータがアウトラインフォントである場合は、フォントデータは、各文字の形態を曲線式で規定している。このような場合、レンダリングは、このような曲線式を処理してグラフィックデータを作り出すラスタライジング過程も含む。
図10は、本発明による情報保存媒体に保存されるテキストデータ(例、サブタイトルデータ)の構造図である。図10を参照するに、テキストデータは、AVストリームとは別途に記録される。テキストデータは、字幕用として出力される文字データに加えてレンダリングした後、AVストリームデータで復号化された動画情報と同期とを合わせるための同期化情報、レンダリングされた字幕データが画面に表示される位置を指定するディスプレイ領域情報、レンダリングされた字幕データの文字サイズ、横書きあるいは縦書き、ディスプレイ領域内での整列、色相、コントラストなどのディスプレイスタイルボックス情報を有している。また、複数の言語別に各テキストデータが作成されねばならないため、言語を表すための情報も含まれる。このような多国語データは、それぞれ別途の空間に別途に保存されることもあり、言語に関係なく出力される時間順序別に多重化されて一つの空間に保存されることもある。
図11は、本発明によるサブタイトル用のテキストデータの望ましい実施例を示す図である。図11を参照するに、本実施例では、サブタイトル用のテキストデータとしてマークアップ言語を使用する。サブタイトル用として使われるマークアップ言語は、使われる用途が字幕であるということを考慮して、最小限のタグあるいはエレメントを使用するようにし、前述したように、同期化及び画面表示のためのタグあるいは属性を有しうる。ここでは、subtitle、head、meta、body、pエレメントを例示した。本実施例では、属性で情報を表示した。例で使われた属性は、次の通りである:
−start:共に再生されねばならない動画再生の開始時間を0とした時、当該字幕データが出力されねばならない時間として時間(HH):分(MM):秒(SS):フレーム(FF)の形態でサブタイトルが表示される時刻を表す。1000分の1秒単位でも表せる。または、動画データがMPEGビデオである場合、当該サブタイトルがオーバーレイされて表示されるビデオ画像のPTS(Presentation Time Stamp)値を有することもある。通常、PTS値は、27MHzあるいは90KHzで動作されるカウンター値である。このようにPTS値を使用すれば、ビデオデータと正確に一致させて動作させうる。
−end:startのような形態の属性値を有し、表示された字幕が消える時刻を表示する。
−position:字幕データが表示されるディスプレイ領域のビデオ領域内での上位左側頂点の座標を表す。
−direction:表示される字幕データの方向を表す。
−size:字幕データが表示されるディスプレイ領域の幅あるいは高さを表す。もし、"direction"の属性値が"horizontal"であれば、字幕データボックスの固定された幅値を表し、"vertical"であれば、字幕データボックスの固定された高さ値を表す。
使われたエレメントの場合、subtitleエレメントでテキストデータのルートを表し、headエレメントを使用して全体テキストデータに必要な情報を取り扱っているmetaエレメント、あるいは、図11の例では現れないstyleエレメントを含むようにし、metaエレメントは、name、contentの属性を使用して、当該テキストデータについての必要情報を記述可能にした。本実施レイの場合、metaエレメントを使用して、当該テキストデータの題目及び表す言語を表示した。すなわち、多国語選択時にテキストデータ内のmeta情報を利用して、便利に当該言語テキストファイルを選択できる。もちろん、テキストファイル名で言語を区別することもあり、あるいは、ディレクトリ構造で各言語テキストファイル別にディレクトリを別途に設けてディレクトリ名で区分することもある。
このように保存された字幕データは、動画再生前に再生装置のバッファにローディングされて動画再生とレンダブロックによってグラフィックデータに変換されてビデオ画像にオーバーラップされて正確な時間に所定のディスプレイ領域に表現される。したがって、前記字幕データは、例えば、韓国語は正確な時間に再生空間にディスプレイされる。前記説明したように、テキストデータは、字幕用文字データだけでなく、制御情報も一定の形式あるいは文法によって作成されうる。したがって、レンダラーブロックの場合、保存されるテキストファイルが所定の文法によって作成されたかを検証するパーザの機能を備えることが望ましく、また、テキストファイル内に含まれた同期化情報を利用してデコーダブロックによって復号化された動画と同期を合わせるために、デコーダブロックとは違って再生時間情報及びデコーダブロックの再生状況を知らせるか、または指定するイベント交換がなされるチャンネルが存在することが望ましい。
図12は、図11の言語とは異なる言語のためのテキストデータの構造図である。図12を参照するに、このように動画データとテキストデータとをそれぞれ別途の領域に記録する場合には、動画データを字幕データとは別途に符号化した後、符号化された動画データにそれぞれ異なる言語のテキストデータを簡単に追加することによって多国語支援を達成できる。また、情報保存媒体に動画データと共に保存されていない字幕データ及びフォントデータを、今後ネットワークを通じてダウンロードするか、または追加情報保存媒体を通じて再生装置にローディングする場合、容易に支援する字幕データを拡張できる。
このように多国語を支援する場合、テキストデータに使われる文字コードが問題になる。本発明では、望ましい実施例としてユニコードを使用する。ユニコードは、65000字以上の全世界言語を表現するために作られた文字コードである。これによれば、各文字は、ユニコード内で占めるコードポイントで表現される。各言語を表すための文字は、一定に連続した値を有するコードポイントの集合である。このようなコードポイントの連続した空間を有する文字をコードチャートという。また、ユニコードでは、前記文字データ、すなわちコードポイントを実際に保存または伝送するための符号化形態としてUTF−8、UTF−16、UTF−32を支援するが、これはそれぞれ8ビット、16ビット、32ビットのデータを複数個使用して一つの文字を表すための方法である。
英文字を表すASCIIコードとラテン語とを拡張してヨーロッパ各国の言語を表現するための拡張文字であるISO8859−1コードは、ユニコードで0x00から0xFFまでのコードポイント値を有する。日本語のひらがな文字は、0x3040から0x309F値を有し、現代韓国語を表現するための11172字の文字は、0xAC00から0xD7AFまでの値を有する。ここで、0xとは、コードポイント値が16進数で表現されたということを意味する。
もし、字幕データが英文字よりなっていれば、UTF−8を使用して符号化することが望ましい。韓国語は、日本語用字幕データならば、UTF−8を使用すれば、一つの文字が3バイトで表現されうる。UTF−16を使用すれば、2バイトで表現されるが、このとき、字幕データに含まれる英文字も2バイトで表現されうる。
各国では、ユニコードと異なって自体の文字コードを有している。例えば、韓国語文字コードであるKSC5601文字セットは、韓国語文字は、2バイトコードポイント値を有し、英文字は、1バイトコードポイント値を有する。前記字幕データがユニコードを使用せずに各国の文字セットを利用して作成されれば、各再生装置は、このような文字セットをいずれも理解せねばならないため、その具現のための負担が増える。
字幕データをテキストデータで処理するためには、フォントデータが必要である。また、多国語支援のためには、このようなフォントデータが多国語を支援せねばならない。しかし、このような多国語支援用フォントをいずれも再生装置にあらかじめ有していることは実質的に難しい。これにより、本発明では、情報保存媒体に使われた文字のみを対象とするフォントデータを前記字幕データのように情報保存媒体に記録し、再生装置でこのフォントデータを動画再生前にバッファにロードして使用させる。すなわち、再生装置は、各字幕用テキストデータとフォントデータとを連結して再生する。字幕用テキストデータとフォントデータとの連結情報は、字幕用テキストデータ内に記録されるか、または別途の領域に記録される。ユーザが再生中に言語変更する場合を考慮して、再生装置は、連続再生が保証されねばならない当該字幕データと当該フォントデータとをいずれも再生前に再生装置内のバッファにロードして使用する。ここで、連続再生とは、動画データの画像及びオーディオ出力に連続的に再生することを意味する。通常、再生装置は、ビデオ及びオーディオ用バッファにデータを一定量保存して再生を実施するところ、再生装置に備えられたバッファのアンダーフローを防止すれば、連続再生が可能になる。再生中に字幕変更のために当該字幕あるいはフォントデータをリーダブロックを通じて再び読まなきゃならない場合、この時間に前記ビデオ及びオーディオデータは、アンダーフローが発生せねば、あらかじめローディングせずとも良い。
図13は、本発明で使用しているテキストファイルの一例である。図13を参照するに、本実施例では、テキストファイルを具現するマークアップ言語にスタイル適用としてCSSファイル形式を使用するために、ヘッドエレメント内にスタイルエレメントを使用する。CSSを使用することによって、字幕データは、多様なフォント、サイズ及び色相を使用可能になる。
あるアプリケーションまたはあるユーザには、デフォルトとして設定された字幕スタイルが見るに不便な場合がありうる。例えば、視覚障害者の場合、字幕テキストのフォントサイズが小さくて不便さを感じることがある。したがって、スタイルを適用する時、同じテキストファイルでも一般ユーザあるいは視覚障害者に適するように、どのようにスタイルを適用して表示するかということは重要な問題のうち一つである。したがって、ユーザが最初再生装置を通じて情報保存媒体を再生する時、メニューを通じてフォントサイズのようなスタイルを定めることができるようにすることによって、ユーザの設定によるスタイルを適用するためのユーザの選択可能な複数のオプションを有するスタイルシートが使用されうる。
本発明では、ユーザによる字幕スタイルを設定できる@ユーザルールを説明しようとする。ユーザタイプは、CSS属性の集合から見た例では、ユーザタイプの種類、すなわち、視覚障害の程度を詳細に区分するのは関連事項ではないので、次のように2つの場合のみを例として挙げる:
−small:視力が正常であるユーザのためのスタイル、
−large:視力が悪いユーザのためのスタイル
図14は、スタイルが異なって適用された字幕の一例である。図14に示されたように、@ユーザルールを使用して再生装置にあらかじめ設定されるか、またはメニューあるいはユーザ入力装置を通じて視力が良いユーザあるいは悪いユーザのために、スタイルが異なって適用された字幕を表示できる。
そして、再生装置が字幕データによって所定の位置と所定のサイズのフォントとを使用せず、ユーザの選好度によって位置とサイズとを異なって出力することも可能である。
図15は、図11で具現した韓国語字幕用テキストデータが実際画面に表示された一例を示す図である。図15を参照するに、第2<p>エレメントによって表示された画面で"size"属性によって字幕データディスプレイ領域の幅値が520と固定されたので、1行で表示できない字幕データを改行して表示した。さらに他の実施例としては、字幕データは、ディスプレイ領域内でのみ出力させ、改行エレメント(br)を使用して強制に改行を指定させることもある。
第3<p>エレメントは、"direction"属性によって字幕データの表示が垂直に表示された例である。
図16は、特定言語の字幕再生中にユーザが言語変更を実施した場合を示す。図16を参照するに、再生装置は、このような言語変更が必要である時、再生中である(例えば、韓国語)字幕テキストデータを変更し、当該フォントデータを連結して変更された言語(例えば、英語)のデータをレンダリングして出力する。このための字幕用データ及びフォントデータがいずれもバッファにローディングされていれば、動画データの連続再生が容易に可能である。もし、変更しようとするテキストデータやフォントデータがバッファにローディングされていなければ、当該データを再びバッファにローディングせねばならない。このとき、動画データの再生が一時停止、停止またはインタラプトが発生する恐れがある。
動画再生の一時停止、停止またはインタラプトのない多国語変換をしようとすれば、字幕用データ及びフォントデータのサイズを各バッファのサイズ以下に制限されうる。しかし、この場合は、支援可能な言語の数が制限される。したがって、本発明では、言語セットという単位を作ってこれを解決する。
図17は、複数個の多国語用字幕データとフォントデータとの言語セットを示す。図17を参照するに、一つの動画に付加されている複数の多国語用字幕データとフォントデータとを複数の言語セットに区分する。一つの言語セットに該当する字幕データとフォントデータとは、前記バッファのサイズ以下に制限されている。動画再生開始前にユーザが選択するか、再生装置によってデフォルトと選択された言語の字幕データが属する言語セットが前記バッファにローディングされた後、動画再生を開始する。ユーザが言語変更を実施する場合、この言語セットに属する字幕データは、既にバッファにローディングされているので、動画再生を停止せずに言語変更が可能である。しかし、もし、この言語セットに属していない言語への変更がなされる場合、再生装置は、当該言語セットの字幕データとフォントデータとをバッファに再びローディングする。この場合、既存の言語セットのデータはいずれも消失される。このとき、動画再生には一時停止、停止またはインタラプトが発生する恐れがある。以後、言語変更がなされる場合は、再び当該言語とバッファにローディングされた言語セットとの関係によって言語変更動作を行う。このような言語セットについての情報は、情報保存媒体に記録され、再生装置が情報保存媒体に保存されているデータと再生装置内のバッファのサイズとを考慮して、再生装置が再生時に任意に定めることもある。
動画データの再生に必要な情報及びデータと字幕データとの関係を望ましい実施例として説明すれば、次の通りである。動画データの記録単位として、Clip、再生単位としてPlayList及びPlayItemという用語を使用する。
本発明による情報保存媒体には、AVストリームがClip単位に区分されて記録されている。通常の場合、Clipは、連続的な空間に記録される。AVストリームは、容量を減らすために圧縮して記録される。したがって、圧縮されたAVストリームを再生するためには、圧縮された動画データの特性情報を知らねばならない必要がある。これにより、各ClipのClip
Informationが記録される。Clip Informationには、各ClipのAV属性及び一定の区間単位にランダムアクセスが可能なEntry Pointの位置情報を記録したEntry
Point Mapが記録されている。動画圧縮技術で広く使われるMPEGの場合、このEntry Pointは、イントラ画像の圧縮を行うIピクチャーの位置となり、このEntry
Point Mapは、再生開始後にある程度の時間が経過した地点を探す時間サーチに主に利用される。
PlayListは、再生の基本単位である。情報保存媒体には、複数のPlayListが保存されている。一つのPlayListは、複数のPlayItemの連結を含む。PlayItemは、Clipの一部分に該当し、具体的には、Clip内での再生開始時間と終了時間とを指定する形態で使われ、したがって、Clip Informationを利用して実際クリップ内の当該部分位置を探し出す。
図18は、PlayList、PlayItem、Clip Information、Clipの相関関係図である。図18を参照するに、PlayList、PlayItem、Clip Information、Clipと共に、本発明では、各クリップに複数の字幕用テキストデータがクリップと別途の空間に記録されている。一つのクリップに複数の字幕用データが連結され、このような連結情報は、Clip Informationに記録されうる。どんなクリップは、複数の字幕用データが連結されるが、どんなクリップは、字幕用データがないか、または一つのみでありうる。PlayListが再生される場合、当該PlayListに属するPlayItemが順次に再生され、結果的に、各PlayItemに連結されたクリップ及び当該クリップに連結された複数の字幕用データのうち何れか一つがレンダリングされて出力される。通常、PlayList間には、連続再生を保証していないので、当該PlayList再生前に連結された全ての字幕用テキストデータをバッファにローディングしうる。図18には、フォントデータを別途に表示していない。フォントデータは、通常、言語別に製作される。したがって、フォントデータは、各言語別に別途の空間に記録される。
図19は、本発明によるディレクトリ構造の一例である。図19を参照するに、ディレクトリは、クリップ、Clip Information、PlayList、字幕用テキストデータ、フォントデータがファイル状に保存されており、各種類別に別途のディレクトリに区分されている。図示されたように、サブタイトル用のテキストファイルとフォントファイルとは、動画データとは別途のディレクトリに備えられうる。
本発明による情報保存媒体は、再生装置に固定されず、再生時にのみ挿入して使用できる着脱式情報保存媒体であることが望ましい。ハードディスクのような大容量の固定式情報保存媒体とは異なって、着脱式情報保存媒体は、容量に限界を有する。また、これを再生する再生装置も限定されたサイズのバッファと限定された性能の下位機能ブロックとを有する場合が多い。したがって、着脱式情報保存媒体に記録されている動画データと共に、字幕データ及び字幕データに使われたフォントデータのみを情報保存媒体に記録し、これを再生装置で再生時に使用することによって、字幕データの出力のためにあらかじめ備えなければならないデータを最小化しうる。このような着脱式記録媒体としては、光ディスクが代表的である。
本発明による情報保存媒体に動画データが字幕用テキストデータと別途の空間に保存されており、この字幕用テキストデータが複数の多国語のためのデータでありつつ、字幕データの出力のためのフォントデータを備える場合、再生装置には、字幕データ及びフォントデータのみをバッファにローディングした後、動画を再生しつつ字幕データをビデオ画像にオーバーラップして出力させる。
図20は、再生装置が字幕用データのみを出力する場合の例を示す。図20を参照するに、再生装置は、字幕用データのみを出力する機能を有しうる。すなわち、再生特殊技能のうち一つであって、前記動画データを再生せずに前記動画データのようにオーバーラップされて出力される字幕データのみをグラフィックデータに変換して出力する。このような場合は、字幕データを利用して外国語を習得するための目的で使われる。この場合、動画がオーバーラップされず、字幕データのみが出力され、前記同期化情報や位置情報は、いずれも無視されるか、または含まれず、再生装置が全体画像上に各字幕データを含む複数ラインデータを出力し、ユーザの入力を待つ。ユーザは、出力された字幕データをいずれも鑑賞した後、次のラインの字幕データ出力のための信号を再生装置に伝達して字幕データの出力時点を制御する。
図21は、再生装置が一つ以上の言語用字幕データを同時に出力する場合を示す。図21を参照するに、再生装置は、一例として、前記字幕データが複数言語を含む場合、一つ以上の言語用字幕データを同時に出力する機能を有しうる。このとき、各言語用字幕データの同期化情報を利用して、画面に出力される字幕データを選定する。すなわち、出力開始時間順序別に字幕データを出力し、出力時点が全く同じである場合には、言語別に区分して出力する。
このように字幕データのみを再生しつつ、当該字幕ラインデータに該当する動画データから正常的に動画データの再生を開始する機能も備えうる。
図22は、字幕データのみを再生しつつ、当該字幕ラインデータに該当する動画データから正常的に動画データの再生を開始する例を示す。図22に示されたように、ユーザが一つの字幕ラインデータを選択した場合、当該ラインデータに該当する再生時間を再指定し、その時間に該当する動画データを正常的に再生する。
本発明での記録装置は、動画データと本発明による字幕データとを情報保存媒体に記録する装置である。
図23は、本発明による記録装置のブロック図である。図23を参照するに、記録装置は、中央処理装置(CPU)、固定式大容量保存装置、動画符号化器、字幕データ発生器、フォント発生器、データ出力器及びバッファを含む。
動画符号化器、字幕データ発生器、フォント発生器は、CPU上にソフトウェア形態で構成されることもある。
それ以外に、リアルタイムで動画を入力されるための動画入力器も備えられうる。
前記保存装置は、符号化対象となる動画あるいは動画符号化器によって符号化された動画データを保存する。それと共に、動画に付加された台詞、大容量フォントデータも保存する。字幕データ発生器は、前記動画符号化器から字幕ラインデータの出力時間のための情報を受け、前記台詞データから字幕ラインデータを受けて、前記字幕用サブタイトルデータを作って固定式保存装置に保存する。フォントデータ発生器は、前記字幕用サブタイトルデータに使われた文字を含むフォントデータを固定装置に保存された大容量フォントデータから作って固定式保存装置に保存する。すなわち、情報保存媒体に保存されるフォントデータは、固定式保存装置に保存されている大容量フォントデータの一部分である。このように、情報保存媒体に保存する形態のデータを作り出す過程をオーソリングと言う。
オーソリング過程が終了すれば、固定式保存装置に保存された動画符号化データを記録単位であるクリップに分割して情報保存媒体に記録し、前記クリップに属する動画データに付加された字幕用サブタイトルデータを別途の領域に記録する。それと共に、前記字幕データをグラフィックデータに変換するために必要なフォントデータを別途の領域に記録する。
前記動画データは、連続的に再生されうる再生単位に分割されるが、通常、この再生単位は、複数のクリップを含む。一実施例であって、一つの再生単位に属する動画とオーバーラップされて出力されねばならない字幕用データは、複数の言語用データをいずれも合わせて一定のサイズ以下に制限される。他の実施例であって、一つの再生単位に属する動画とオーバーラップされて出力されねばならない字幕用データは、言語変更時、動画再生に連続的に言語変更がなされなければならない言語セットに区分され、一つの再生単位に属する字幕用データは、複数の言語セットを含み、一つの言語セットに属する字幕用データは、複数の言語用データをいずれも合わせて一定のサイズ以下に制限される。
前記字幕用データは、ユニコードを使用する文字コードを含み、実際記録されるデータの形態は、前記UTF−8やUTF−16で符号化されうる。
固定式保存装置に記録された動画データ、字幕用サブタイトルデータ、フォントデータは、バッファに一時保存されてデータ出力器によって情報保存媒体上に記録される。CPUは、このような機能を順次に行うように各装置を制御するソフトウェアを行う。
本発明によれば、多国語字幕用テキストデータをテキスト化した後、AVストリームと別途に記録することによって、ユーザにさらに多様な字幕効果を提供できると同時に、容易な記録空間の配置を可能にする。
一方、これに必要なフォントデータは、前記字幕用テキストに必要な文字のみを集めて最小限のサイズとして情報保存媒体に別途に保存して利用する。

Claims (8)

  1. AVデータとテキストデータとを読む段階と、
    前記テキストデータからサブタイトルイメージデータをレンダリングする段階と、
    前記AVデータをデコーディングし、デコーディングされたAVデータを出力する段階と、
    前記サブタイトルイメージデータと前記デコーディングされたAVデータをブレンディングする段階とを含むことを特徴とする情報保存媒体に保存されたデータ再生方法。
  2. 前記デコーディングされたAVデータに含まれた同期化情報を利用して、前記サブタイトルイメージデータとビデオ情報とを同期化する段階をさらに含むことを特徴とする請求項1に記載の方法。
  3. 前記テキストデータは、ディスプレイ領域情報、ディスプレイスタイルボックス情報及び言語を表す情報を含むことを特徴とする請求項1に記載の方法。
  4. 前記ディスプレイ領域情報は、レンダリングされたサブタイトルイメージデータがスクリーン上でディスプレイされる領域を指示することを特徴とする請求項3に記載の方法。
  5. 前記ディスプレイスタイルボックス情報は、ディスプレイされる文字のサイズ、レンダリングされたサブタイトルイメージデータの水平ライン及び/または垂直ライン書込み、整列、色、そして前記ディスプレイ領域の明暗(コントラスト)のうち少なくとも何れか一つについての情報を含むことを特徴とする請求項3に記載の方法。
  6. 前記方法は、前記サブタイトルデータをバッファにローディングする段階をさらに含むことを特徴とする請求項1に記載の方法。
  7. 前記AVデータ、前記テキストデータ及び前記フォントデータは、前記読出段階によって読出される情報保存媒体に保存されていることを特徴とする請求項1に記載の方法。
  8. 前記ブレンディングする段階を経て、その上にディスプレイされるサブタイトルを有するビデオイメージが出力されることを特徴とする請求項1に記載の方法。
JP2010028240A 2002-10-15 2010-02-10 テキストデータとダウンロードフォントとを利用した多国語支援用サブタイトルデータが記録された情報保存媒体に保存されたデータ再生方法及び再生装置 Pending JP2010154546A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20020062632 2002-10-15
US45254403P 2003-03-07 2003-03-07

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2005501359A Division JP4823688B2 (ja) 2002-10-15 2003-10-14 テキストデータとダウンロードフォントとを利用した多国語支援用サブタイトルデータが記録された情報保存媒体及びその装置

Publications (1)

Publication Number Publication Date
JP2010154546A true JP2010154546A (ja) 2010-07-08

Family

ID=32109555

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2010028239A Expired - Fee Related JP5620116B2 (ja) 2002-10-15 2010-02-10 テキストデータとダウンロードフォントとを利用した多国語支援用サブタイトルデータが記録された情報保存媒体に保存されたデータを再生する再生装置及びデータ記録及び/または再生装置その装置
JP2010028240A Pending JP2010154546A (ja) 2002-10-15 2010-02-10 テキストデータとダウンロードフォントとを利用した多国語支援用サブタイトルデータが記録された情報保存媒体に保存されたデータ再生方法及び再生装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2010028239A Expired - Fee Related JP5620116B2 (ja) 2002-10-15 2010-02-10 テキストデータとダウンロードフォントとを利用した多国語支援用サブタイトルデータが記録された情報保存媒体に保存されたデータを再生する再生装置及びデータ記録及び/または再生装置その装置

Country Status (7)

Country Link
EP (1) EP1552515A4 (ja)
JP (2) JP5620116B2 (ja)
AU (1) AU2003269536A1 (ja)
HK (3) HK1113853A1 (ja)
PL (1) PL375781A1 (ja)
TW (1) TWI246036B (ja)
WO (1) WO2004036574A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4177880A1 (en) * 2021-11-03 2023-05-10 Accenture Global Solutions Limited Disability-oriented font generator

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0409251B1 (pt) 2003-04-09 2017-02-21 Lg Electronics Inc meio de gravação tendo uma estrutura de dados para gerenciar reprodução de dados de subtítulo de texto e métodos e aparelhos de gravação e reprodução
KR101061414B1 (ko) 2003-07-24 2011-09-01 엘지전자 주식회사 기록된 텍스트 서브타이틀 데이터의 재생 관리를 위한데이터 구조를 갖는 기록매체, 그리고 기록/재생 방법 및장치
KR20050012328A (ko) 2003-07-25 2005-02-02 엘지전자 주식회사 고밀도 광디스크의 프레젠테이션 그래픽 데이터 관리 및재생방법과 그에 따른 고밀도 광디스크
KR100667751B1 (ko) 2003-10-01 2007-01-11 삼성전자주식회사 텍스트 기반의 자막 정보를 포함하는 저장 매체, 재생장치 및 그 재생 방법
KR100739682B1 (ko) 2003-10-04 2007-07-13 삼성전자주식회사 텍스트 기반의 서브 타이틀 정보를 기록한 정보저장매체,그 처리장치 및 방법
PL1978522T3 (pl) * 2003-10-04 2012-09-28 Samsung Electronics Co Ltd Sposób odtwarzania opartego na tekście podtytułu z nośnika informacji przy użyciu informacji o wybieralnym stylu
KR20050035678A (ko) 2003-10-14 2005-04-19 엘지전자 주식회사 광디스크 장치의 부가 데이터 재생방법 및 장치와, 이를위한 광디스크
KR20050036277A (ko) * 2003-10-15 2005-04-20 엘지전자 주식회사 고밀도 광디스크의 네비게이션 정보 관리방법
KR100788655B1 (ko) 2003-11-10 2007-12-26 삼성전자주식회사 스타일 정보를 포함하는 텍스트 기반의 서브 타이틀데이터가 기록된 저장 매체, 재생 장치 및 그 재생 방법
KR100619053B1 (ko) * 2003-11-10 2006-08-31 삼성전자주식회사 서브 타이틀을 기록한 정보저장매체 및 그 처리장치
KR20050072255A (ko) 2004-01-06 2005-07-11 엘지전자 주식회사 고밀도 광디스크의 서브타이틀 구성방법 및 재생방법과기록재생장치
KR20050078907A (ko) 2004-02-03 2005-08-08 엘지전자 주식회사 고밀도 광디스크의 서브타이틀 재생방법과 기록재생장치
BRPI0507596A (pt) 2004-02-10 2007-07-03 Lg Electronics Inc meio fìsico de gravação, método e aparelho para decodificar um fluxo de subtìtulo de texto
RU2377669C2 (ru) * 2004-02-10 2009-12-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Носитель записи, имеющий структуру данных для управления различными данными, и способ и устройство записи и воспроизведения
WO2005076601A1 (en) 2004-02-10 2005-08-18 Lg Electronic Inc. Text subtitle decoder and method for decoding text subtitle streams
KR20060129067A (ko) 2004-02-26 2006-12-14 엘지전자 주식회사 기록매체 및 텍스트 서브타이틀 스트림 기록 재생 방법과장치
ATE453191T1 (de) 2004-03-18 2010-01-15 Lg Electronics Inc Aufzeichungsmedium und verfahren und vorrichtung zur wiedergabe eines auf dem aufzeichnungsmedium aufgezeichneten textuntertitelstroms
ATE479988T1 (de) 2004-03-26 2010-09-15 Lg Electronics Inc Aufzeichnungsmedium und verfahren und vorrichtung zum wiedergeben und aufzeichnen von textuntertitelströmen
JP4724710B2 (ja) 2004-05-03 2011-07-13 エルジー エレクトロニクス インコーポレイティド テキストサブタイトルデータを再生管理するためのデータ構造を有する記録媒体及びこれと関連する方法及び装置
US7778526B2 (en) * 2004-06-01 2010-08-17 Nero Ag System and method for maintaining DVD-subpicture streams upon conversion to higher compressed data format
US7519278B2 (en) 2004-06-18 2009-04-14 Panasonic Corporation Playback apparatus, program, playback method
KR100599118B1 (ko) * 2004-07-20 2006-07-12 삼성전자주식회사 자막신호표시상태를 변경하는 데이터재생장치 및 그 방법
KR20060025100A (ko) * 2004-09-15 2006-03-20 삼성전자주식회사 다국어를 지원하는 메타 데이터를 기록한 정보저장매체 및메타 데이터 처리방법
US8473475B2 (en) 2004-09-15 2013-06-25 Samsung Electronics Co., Ltd. Information storage medium for storing metadata supporting multiple languages, and systems and methods of processing metadata
JP4715278B2 (ja) 2005-04-11 2011-07-06 ソニー株式会社 情報処理装置および情報処理方法、プログラム格納媒体、プログラム、並びに提供装置
WO2008050279A1 (en) * 2006-10-25 2008-05-02 Koninklijke Philips Electronics N.V. Playback of video and corresponding subtitle data
JP5339002B2 (ja) * 2013-05-20 2013-11-13 ソニー株式会社 情報処理装置、再生方法、および記録媒体

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10304304A (ja) * 1997-04-30 1998-11-13 Sony Corp 編集装置及びデータ編集方法
JPH10327381A (ja) * 1997-03-21 1998-12-08 Toshiba Corp 映像情報の再生表示方法及び映像情報を記録した記録媒体

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5497241A (en) * 1993-10-29 1996-03-05 Time Warner Entertainment Co., L.P. System and method for controlling display of motion picture subtitles in a selected language during play of a software carrier
JPH08102148A (ja) * 1994-09-30 1996-04-16 Sanyo Electric Co Ltd 記録媒体
US6345147B1 (en) * 1995-11-24 2002-02-05 Kabushiki Kaisha Toshiba Multi-language recording medium and reproducing device for the same
KR100218434B1 (ko) * 1996-06-21 1999-09-01 구자홍 디브이디 재생기의 문자 표시 장치 및 방법
US6046778A (en) * 1997-10-29 2000-04-04 Matsushita Electric Industrial Co., Ltd. Apparatus for generating sub-picture units for subtitles and storage medium storing sub-picture unit generation program
JP3376303B2 (ja) * 1998-12-16 2003-02-10 株式会社東芝 光ディスクと光ディスク記録装置と光ディスク再生装置
DE19950490A1 (de) * 1999-10-20 2001-04-26 Thomson Brandt Gmbh Verfahren zur Kodierung einer Bildsequenz sowie Teilbilddateneinheit zur Verwendung in einem elektronischen Gerät und Datenträger
US7117231B2 (en) * 2000-12-07 2006-10-03 International Business Machines Corporation Method and system for the automatic generation of multi-lingual synchronized sub-titles for audiovisual data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10327381A (ja) * 1997-03-21 1998-12-08 Toshiba Corp 映像情報の再生表示方法及び映像情報を記録した記録媒体
JPH10304304A (ja) * 1997-04-30 1998-11-13 Sony Corp 編集装置及びデータ編集方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4177880A1 (en) * 2021-11-03 2023-05-10 Accenture Global Solutions Limited Disability-oriented font generator

Also Published As

Publication number Publication date
TW200407812A (en) 2004-05-16
HK1113851A1 (en) 2008-10-17
JP5620116B2 (ja) 2014-11-05
TWI246036B (en) 2005-12-21
EP1552515A4 (en) 2007-11-07
AU2003269536A1 (en) 2004-05-04
WO2004036574A1 (en) 2004-04-29
PL375781A1 (en) 2005-12-12
EP1552515A1 (en) 2005-07-13
JP2010154545A (ja) 2010-07-08
HK1082111A1 (en) 2006-05-26
HK1113853A1 (en) 2008-10-17

Similar Documents

Publication Publication Date Title
JP5620116B2 (ja) テキストデータとダウンロードフォントとを利用した多国語支援用サブタイトルデータが記録された情報保存媒体に保存されたデータを再生する再生装置及びデータ記録及び/または再生装置その装置
KR100970735B1 (ko) 동영상 데이터가 기록된 정보저장매체를 재생하는 재생 방법 및 기록 장치
US20110206347A1 (en) Information storage medium containing subtitle data for multiple languages using text data and downloadable fonts and apparatus therefor
KR101119116B1 (ko) 텍스트 서브타이틀 디코더 및 텍스트 서브타이틀 스트림디코딩 방법
KR100667751B1 (ko) 텍스트 기반의 자막 정보를 포함하는 저장 매체, 재생장치 및 그 재생 방법
JP3376303B2 (ja) 光ディスクと光ディスク記録装置と光ディスク再生装置
CN106104689B (zh) 记录介质、再现装置以及再现方法
JP2007501562A (ja) 字幕データとビデオマッピングデータ情報を記録する情報記録媒体、その再生装置及び方法
JP2005217816A (ja) 映像再生装置および記録媒体
CN111899770B (zh) 非暂时性计算机可读介质、再现装置以及再现方法
JP2005020351A (ja) サムネイル画像作成機能付きビデオ再生装置及びサムネイル画像記録媒体
JP3376370B2 (ja) 光ディスクと光ディスク記録装置と光ディスク再生装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120511

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120515

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120814

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130326

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130726

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130805

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20130823