JP4634410B2 - 映像再生装置,映像再生方法および字幕重畳装置 - Google Patents

映像再生装置,映像再生方法および字幕重畳装置 Download PDF

Info

Publication number
JP4634410B2
JP4634410B2 JP2007067704A JP2007067704A JP4634410B2 JP 4634410 B2 JP4634410 B2 JP 4634410B2 JP 2007067704 A JP2007067704 A JP 2007067704A JP 2007067704 A JP2007067704 A JP 2007067704A JP 4634410 B2 JP4634410 B2 JP 4634410B2
Authority
JP
Japan
Prior art keywords
subtitle
image data
data
caption
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007067704A
Other languages
English (en)
Other versions
JP2008228242A (ja
Inventor
充 野村
高弘 山口
正義 鍋島
之治 金山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007067704A priority Critical patent/JP4634410B2/ja
Publication of JP2008228242A publication Critical patent/JP2008228242A/ja
Application granted granted Critical
Publication of JP4634410B2 publication Critical patent/JP4634410B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Studio Circuits (AREA)
  • Television Signal Processing For Recording (AREA)

Description

本発明は,字幕重畳機能を有する映像再生装置,映像再生方法および字幕重畳装置に関し,特に高速広帯域な映像信号に対する高機能な字幕描画のための回路を少ないハードウェアで実現することができるようにした技術に関する。
動画像に対して,字幕文字データをリアルタイムに重畳する技術が広く用いられている。字幕重畳においては,字幕の文字コードから描画される文字の画像データを生成し,これを動画像データと合成する必要がある。文字コードを文字画像データに変換するには,装置内部に,あらかじめ描画対象となる全文字コードに対する文字画像データを準備しておく方法,装置内部においてソフトウエアにより,リアルタイムに文字の描画を行う方法等が用いられる。ビデオ信号にリアルタイムに字幕を重畳する装置は,通常,ビデオテロッパーと呼ばれるが,一般に処理できる画像信号のサイズや描画できる領域の大きさ,描画できる文字の種別等に制約がある。
一方,デジタルシネマに代表される劇場用の映像再生装置においても,字幕重畳の機能が要求される。デジタルシネマにおいては,最大4K(4096×2160画素,ハイビジョンの約4倍)の画像フォーマットが規定されており,従来のビデオ信号と比較して画素数が大きく,高速な映像信号に対して字幕の重畳処理を行う必要がある。このため,従来用いられてきた字幕重畳回路,字幕重畳ソフトウエアでは,十分な処理速度が得られなかった。また,画面面積がHDTVの4倍と非常に大きくなるため,外付けメモリを利用した大容量のバッファを用いることが必要であった。
図13は,従来技術による字幕重畳回路の構成例を示している。図13の構成例では,字幕を重畳するための3面構成の字幕データを格納する字幕フレームメモリ50,字幕の描画および字幕重畳回路の制御を行うための字幕描画用CPU51,字幕フレームメモリ50へのデータの入出力を制御するメモリ選択スイッチ52,2組の字幕合成回路60,61によって構成されている。字幕合成回路60,61は,アルファ値αに「透明度設定」の値Tを乗算する乗算回路53,55と,字幕の透明度を加味した字幕データと映像の画像データとを合成する合成回路54,56とを備える。ここで,字幕合成回路が2組あるのは,通常の字幕のデータにおいて2つの字幕トラックが定義できるためである。
次に,図13における回路の動作を説明する。選択された2面の字幕フレームメモリ50から読み出された字幕データは,縦続接続された字幕合成回路60,61により,入力された画像信号に重畳される。字幕合成回路60,61は,字幕の時間的な透明度の制御を行う「透明度設定」の値Tと字幕データの透明度を指定するアルファ値αとを乗算し,その割合で字幕データ値Xと画像データ値Yとを合成する処理を行う合成回路54,56によって構成されており,入力されたデータと字幕データの重み付け加算を行う。
(αT×X+(1−αT)×Y)
「透明度設定」の値Tは,字幕のフェードイン/フェードアウトの際に用いられるもので,設定値を毎フレーム一定の割合で増減することにより,重畳される字幕の透明度を時間的に変化させる。図13の例においては,この設定値は,字幕描画用CPU51により画像信号のブランキング期間に変更を行うものとしている。
3組ある字幕フレームメモリ50のうち,最大2組のメモリが同時に字幕重畳に用いられるが,もう1つの字幕フレームメモリは,字幕描画用CPU51により次の字幕を描画するために利用される。字幕重畳に選択されるフレームメモリは,字幕の切り換えタイミングで,メモリ選択スイッチ52を制御することにより切り換える。
ここで,図13の回路では,字幕描画用CPU51と,複数の字幕フレームメモリ50,および,メモリの接続を切り換えるためのメモリ選択スイッチ52が必要である。特に,描画された圧縮されていない字幕画像データは,非常に大きなサイズとなるため,大容量の外付けメモリによって実現する必要があり,装置内部にメモリ制御のための回路を実装する必要が生じる。
下記の非特許文献1は,HDTV用に開発されたLSIチップセットに関して説明しているが,この非特許文献1の技術では,字幕および静止画像を合成する機能を,専用のLSIにより実装している。
また,デジタルシネマにおいては,
・コンテンツにより指定されたフォントを用いて字幕の合成を行う必要があるため,コンテンツごとにフォント情報を変更する必要があること,
・複数のフォントを利用する場合があること,
・文字描画に字詰めやアンチエリアジング処理など,より高品質な描画処理が要求されること,
・文字の重畳位置がコンテンツにより厳密に指定されるため,自由な位置に文字を重畳できる必要があること,
・画面の複数箇所にオーバーラップしたタイミングで字幕を表示する必要があり,さらに透明度およびフェードイン/フェードアウトのサポートが必要とされること,
といった通常の字幕合成装置より高い字幕重畳機能が要求される。
以上のような要求条件を満足する字幕重畳機能を実現するためには,大規模な作業用メモリ,高速かつ複雑な機能を持つ重畳回路を映像再生装置に実装する必要があった。
田中他,「デジタルTVバックエンド用LSIチップセット」,SANYO Technical Review,Vol.34,No.1,Jun. 2002
本発明の第一の課題は,デジタルシネマに代表される高速広帯域な映像信号に対して,コンテンツに指定されたフォントおよび位置決め情報に基づき,アンチエリアジング処理,字詰め処理を含む高品質な字幕文字の重畳処理をリアルタイムに行うことである。
第二の課題は,第一の課題を実現する上で必要となる字幕重畳回路の作業用メモリおよび重畳回路の規模を最小化するとともに,字幕データを字幕重畳回路にロードするために必要となるデータ帯域を最小化することである。
第三の課題は,タイミングの異なる複数の字幕データの重畳,およびそれぞれの字幕データにおける透過度およびフェードイン/フェードアウト処理を,最小限の字幕重畳回路でサポートすることである。
すなわち,本発明は,動画像に対して字幕を重畳する機能を有する映像再生装置において,字幕の重畳に必要となる回路を最小化することを主目的とする。
上記課題を解決するための本発明の第1の特徴は,動画像に対して字幕を重畳する機能を有する映像再生装置において,コンテンツを映像再生装置にロードする際の前処理として,字幕の文字データの描画を事前にオフラインで行い,ビットマップ画像の画像データに変換して蓄積しておき,映像データの再生時に,画像データとして蓄積された字幕データをリアルタイムに映像データに重畳する手段を備えることである。
また,本発明の第2の特徴は,前記ビットマップ画像を蓄積装置に蓄積する際に,そのビットマップ画像を圧縮画像データに変換して蓄積することであり,圧縮画像データの圧縮形式は,データ伸張の際にビットマップ画像の画像データをラスタスキャン順序で読み出し可能な形式になっていることである。
また,本発明の第3の特徴は,前記ビットマップ画像の画像データ内に,映像データに字幕データを重畳する字幕重畳回路に対する制御コマンドを埋め込むことである。
以上のように,本発明の映像再生装置の字幕重畳機能では,映像データを装置内に転送,蓄積する際に,字幕データをビットマップ画像に変換して蓄積する手段が設けられる。字幕データの文字の描画処理は,ロードの際にオフラインで処理することが可能であり,高速な描画回路を必要としない。また,ソフトウエアによる描画が可能であるため,フォントの切り換え,アンチエリアジング処理,字詰め処理などの高度な描画機能を簡単に実現することができる。したがって,上記第一の課題が解決される。
また,本発明では,前記ビットマップ画像を圧縮画像データに変換して蓄積する手段が設けられ,さらに,圧縮手段として,字幕ビットマップ画像をラスタスキャン順序で読み出せる手段が用いられる。これらの手段により,字幕重畳回路の作業用メモリおよび重畳回路の規模を最小化するとともに,字幕データを字幕重畳回路にロードするために必要となるデータ帯域を最小化することが可能となる。したがって,上記第二の課題が解決される。
また,本発明では,前記ビットマップ画像の画像データに,字幕重畳回路に対する制御コマンド,すなわち字幕重畳回路を制御する描画命令を埋め込む手段が設けられる。この手段により,字幕重畳回路の設定パラメータを画像データの重畳処理にタイミングを合わせて切り換えることが可能となり,パラメータの変更のタイミングを設定するために別の制御手段を用いる必要がなく,字幕重畳回路の構成を単純化することができる。したがって,第三の課題が解決される。
具体的には,本発明は,映像データと,字幕文字列情報を含む字幕データとを入力し,字幕が重畳された映像信号をリアルタイムに再生する映像再生装置において,字幕の重畳対象となる映像データとは別に,前記字幕文字列情報を含む字幕データを入力する手段と,前記入力した字幕データに基づき,あらかじめ字幕画像データを生成する手段と,前記入力した字幕データ内の表示開始および表示終了の時間情報を含む字幕制御データに基づき,あらかじめ,前記字幕画像データに字幕の重畳を制御するための制御コマンドを埋め込むコマンド埋め込み手段と,前記制御コマンドが埋め込まれた前記字幕画像データを記憶装置に蓄積する字幕データ蓄積手段と,映像データの再生時に,再生対象の映像データから得られた画像データと前記記憶装置に蓄積された記字幕画像データとを入力し,前記字幕画像データに埋め込まれた前記制御コマンドに従ってリアルタイムに重畳する字幕重畳手段とを備え,前記字幕重畳手段は,入力した前記字幕画像データを格納するバッファと,入力した前記字幕画像データに埋め込まれた前記制御コマンドに従って,前記バッファ内のデータのクリア,または前記バッファへのデータの書き込み,または前記バッファ内のデータの保持を制御するデコード回路と,前記字幕画像データの入力と,再生対象の映像の画像データの入力との同期を制御するフレームカウント制御回路と,前記制御コマンドにより設定または選択された透明度と前記字幕画像データ内のアルファ値とを乗算する乗算回路と,入力した再生対象の映像の画像データと,前記バッファに格納された前記字幕画像データとを,前記乗算回路による乗算結果に基づいて合成する合成回路とを備えることを特徴とする。
また,本発明は,上記構成において,前記字幕画像データを生成する手段は,前記字幕画像データとして,前記入力した字幕データに基づき生成したビットマップ形式の画像データをラスタスキャン順序で読み出すことができる形式の圧縮方式により圧縮した字幕画像データを生成する字幕データ圧縮手段を備え,前記字幕重畳手段は,前記バッファに格納された前記字幕画像データをラスタスキャン順序で圧縮前のビットマップ形式の画像データに復元するデータ伸張手段を備えることを特徴とする。
また,本発明は,上記構成において,前記制御コマンドは,前記字幕重畳手段のバッファに格納された前記字幕画像データのクリアを指示する字幕クリアコマンド,前記字幕重畳手段のバッファに前記字幕画像データをロードすることを指示するロードコマンド,前記字幕重畳手段のバッファに格納された前記字幕画像データを保持することを指示する保持コマンド,重畳する字幕の透明度の設定を指示する透明度設定コマンドまたは設定された透明度の中から字幕の重畳に用いる透明度を指定する透明度選択コマンドを含み,前記字幕重畳手段は,前記各制御コマンドで指示された制御を行う回路を備えることを特徴とする。
また,本発明は,映像データと,字幕文字列情報を含む字幕データとを入力し,字幕が重畳された映像信号をリアルタイムに再生する映像再生方法において,字幕の重畳対象となる映像データとは別に,前記字幕文字列情報を含む字幕データを入力するステップと,前記入力した字幕データに基づき,あらかじめ字幕画像データを生成するステップと,前記入力した字幕データ内の表示開始および表示終了の時間情報を含む字幕制御データに基づき,あらかじめ,前記字幕画像データに字幕の重畳を制御するための制御コマンドを埋め込むコマンド埋め込みステップと,前記制御コマンドが埋め込まれた前記字幕画像データを記憶装置に蓄積する字幕データ蓄積ステップと,映像データの再生時に,再生対象の映像データから得られた画像データと前記記憶装置に蓄積された前記字幕画像データとを入力し,前記字幕画像データに埋め込まれた前記制御コマンドに従ってリアルタイムに重畳する字幕重畳ステップとを備え,前記字幕重畳ステップは,入力した前記字幕画像データをバッファに格納するステップと,入力した前記字幕画像データに埋め込まれた前記制御コマンドに従って,前記バッファ内のデータのクリア,または前記バッファへのデータの書き込み,または前記バッファ内のデータの保持を制御するステップと,前記字幕画像データの入力と,再生対象の映像の画像データの入力との同期を制御するステップと,前記制御コマンドにより設定または選択された透明度と前記字幕画像データ内のアルファ値とを乗算するステップと,入力した再生対象の映像の画像データと,前記バッファに格納された前記字幕画像データとを,前記乗算回路による乗算結果に基づいて合成するステップとを備えることを特徴とする。
さらに,本発明は,前記映像再生方法において,前記字幕画像データを生成するステップは,前記字幕画像データとして,前記入力した字幕データに基づき生成したビットマップ形式の画像データをラスタスキャン順序で読み出すことができる形式の圧縮方式により圧縮した字幕画像データを生成する字幕データ圧縮ステップを備え,前記字幕重畳ステップは,前記バッファに格納された前記字幕画像データをラスタスキャン順序で圧縮前のビットマップ形式の画像データに復元するデータ伸張ステップを備えるように構成することができる。
また,本発明は,フレーム単位で再生対象の映像の画像データを入力するとともに,あらかじめ字幕文字列情報を含む字幕データから所定のフォーマットに従って生成された字幕画像データを入力し,映像に字幕を重畳して出力する字幕重畳装置であって,前記字幕画像データの入力と,前記再生対象の映像の画像データの入力との同期を制御するフレームカウント制御回路と,前記字幕画像データを格納するバッファと,前記字幕画像データを重畳する際の透明度を記憶する透明度記憶手段と,入力した前記字幕画像データから,該字幕画像データにあらかじめ埋め込まれた制御コマンドを分離し,分離した制御コマンドに従って,前記バッファ内のデータのクリア,または前記バッファへのデータの書き込み,または前記バッファ内のデータの保持,または前記透明度記憶手段への透明度の設定を制御するデコード回路と,前記透明度記憶手段に記憶された透明度と前記字幕画像データ内のアルファ値とを乗算する乗算回路と,入力した再生対象の映像の画像データと,前記バッファから読み出した字幕画像データとを,前記乗算回路による乗算結果に基づいて合成する合成回路とを備えることを特徴とする。
さらに,本発明は,前記字幕重畳装置において,前記バッファに格納された字幕画像データは,ラスタスキャン順序で読み出すことができる形式の圧縮方式により圧縮された字幕画像データであり,前記バッファから読み出された字幕画像データを,前記乗算回路および前記合成回路に出力する際に圧縮前のビットマップ形式の画像データに復元するデータ伸張回路を備えるように構成することができる。
以上説明したとおり,本発明による映像再生装置では,高速広帯域な映像信号に対し,高機能な字幕描画機能を最小限のハードウェアで実現することが可能である。
図1は,本発明の実施の形態に係る映像再生装置の全体構成を示している。映像再生装置1は,字幕データを入力する字幕データ入力部10,字幕(文字)データをビットマップ画像に展開し,ビットマップ字幕データを生成する字幕描画部11,ビットマップ字幕データを圧縮して圧縮字幕データを生成する字幕データ圧縮部12,圧縮字幕データに字幕重畳回路に対する制御コマンド(描画コマンドともいう)を埋め込む描画コマンド埋め込み部13,描画コマンドが埋め込まれた圧縮字幕データを蓄積するための字幕データ蓄積部14を備える。
また,映像データを入力する映像データ入力部15,入力した映像データを蓄積するための映像データ蓄積部16,蓄積された映像データを映像信号に変換する映像復号部17,復号された映像信号に対して字幕データを重畳する字幕重畳部18を備える。字幕重畳部18は,字幕重畳回路19により構成される。
なお,本発明は,図1に示す映像再生装置1において字幕データ圧縮部12または描画コマンド埋め込み部13を省略した構成で実施することもできる。描画コマンド埋め込み部13を省略した構成で本発明を実施する場合,字幕データ入力部10が入力した字幕データのうち字幕重畳部18を制御するための字幕制御データを,ビットマップ字幕データまたは圧縮字幕データとは別に字幕データ蓄積部14に蓄積しておき,映像フレームとの同期をとって,字幕重畳部18に入力させる。
図2は,字幕データを映像再生装置1内に取り込むときの処理を説明する図である。本実施の形態に係る映像再生装置1は,字幕データを装置内にロードするときに,入力した字幕データから,字幕描画部11が字幕のビットマップ画像データ(ビットマップ字幕データという)25を生成する。
この例では,字幕データ入力部10が入力する字幕データ20は,フォントファイル21と,字幕リストファイル22からなり,字幕リストファイル22は,字幕文字列,フォント指定,テキスト表示位置,テキスト文字サイズ,文字色,テキスト文字修飾指定(イタリック表示等)等の情報を含む字幕文字データ23と,表示開始時間,表示終了時間,フェードイン設定,フェードアウト設定等の情報を含む字幕制御データ24によって構成される。
字幕描画部11は,字幕リストファイル22に指定された字幕文字列を,フォント設定,テキスト表示位置,テキスト文字サイズ,文字色,テキスト文字修飾指定(イタリック表示等)に従い,フォントファイル21を参照しながら文字列の画像データに変換する処理を行う。このようにして変換されたビットマップ字幕データ25は,字幕データ蓄積部14にそのまま記録してもよいが,本実施の形態では,さらに字幕データ圧縮部12が,ビットマップ字幕データ25を圧縮して圧縮字幕データ26に変換し,データサイズを小さくする処理を行う。
図3は,字幕データ圧縮部12が行うビットマップ字幕データ25の圧縮を説明する図である。まず,ビットマップ字幕データ25をラスタスキャン順序で走査し,アルファ値αの部分を検出し,その値をラン長符号を用いて符号化する。図3の例においては,ラン長に応じ「ランが0の場合」「ランが1以上,255以下」「ランが256以上,4095以下」「ランがそれ以上」という場合分けを行い,ラン長を可変ビット長でエンコードしている。それぞれ,「文字の描画領域内」「文字間」「文字の描画範囲から次の走査線の文字領域まで」「複数の走査線にまたがる無効領域」に相当し,簡単な可変ビット長制御で大きな効果が得られる。
ラン長を出力した後,アルファ値αと画像の輝度値を出力する。画像の輝度値は,モノクロであるかどうかを判定し,モノクロの場合には一色の値のみを出力する。図3に示した構成例は,最も単純な圧縮方法の例であり,輝度値を出力する際に,画像値自体ではなく,連続した画素において,前の画素との差分値を算出し,その値を可変ビット長で符号化されたものを出力するといった方法により圧縮効率を上げることも可能である。さらに,ラン長や輝度の差分値をハフマン符号化等のエントロピー符号化によって圧縮することが考えられる。
本実施の形態で用いる圧縮方法の特徴は,圧縮字幕データ26を順次読み出したときに,ラスタスキャン順序で元のビットマップ字幕データ25に伸張できることである。この伸張回路の詳細については,後に図10を用いて説明する。
図4は,図3に示した圧縮方法により一般的な字幕データを描画した画面のデータを圧縮した場合に,どの程度の圧縮率が得られるかを示している。画像サイズは,デジタルシネマ規格で規定された4096×2160画素とし,字幕データをRGBα各8ビット精度とした。圧縮が最適化されたPNG方式と比較するとデータ量は1.5倍程度となっているが,非圧縮のデータを用いた場合と比較すると1/100程度となっており,非常に単純な方法で大きな効果が得られていることがわかる。
図5は,圧縮字幕データ26への描画コマンド(字幕重畳回路19に対する制御コマンド)の埋め込みを説明する図である。前述のように字幕リストファイル22には,字幕文字データ23の他に,字幕制御データ24として,表示開始時間,表示終了時間,フェードイン設定,フェードアウト設定のタイミング情報が含まれる。本実施の形態においては,前記タイミング情報を字幕重畳回路19に対するコマンド(命令)に変換し,そのコマンドを圧縮字幕データ26内に埋め込むことにより,字幕重畳回路19における字幕表示のタイミングの制御を可能にする。
この例では,表示時間を制御するために,字幕表示を行わない「字幕クリア」コマンド,ある圧縮字幕データ26をロードして字幕の重畳を開始する「ロード(更新)」コマンド,ロードされた同じ圧縮字幕データ26を繰り返し重畳する「保持」コマンドが設けられ,各圧縮字幕データ26の先頭部に付加される。また,フェードイン,フェードアウトを実現するための「透明度設定」コマンドが前記コマンドに追加される。この「透明度設定」は,字幕のフェードイン/フェードアウトの際に,設定値を毎フレーム一定の割合で増減することにより,重畳される字幕の透明度を時間的に変化させるために用いられる。複数の字幕文字列が異なったタイミングでフェードイン/フェードアウトすることを可能とするために,1つのフレームに対し複数の透明度設定情報を設定することができる。さらに,描画される文字列ごとに「透明度設定」を切り換えるため,圧縮字幕データ26の内部に複数の「透明度設定」のうちいずれかを選択する「透明度選択」コマンドが設けられる。
図6は,描画コマンドが埋め込まれた圧縮字幕データの構成例を示す図である。図6(a)は,圧縮字幕データを字幕重畳回路19内のデータバッファに書き込むコマンドの場合の例を示しており,図6(b)は,それ以外の透明度設定等のパラメータ変更のみを行うコマンドの場合の例を示している。
データの先頭部分の「フレームカウント」の値は,映像データの中で字幕の重畳やコマンドの実行を開始するタイミングを指定する。コマンドが実行されないフレームに関しては,そのままの状態で字幕の表示が維持される。
「設定コマンド」の部分には,字幕重畳回路19内のデータバッファへの圧縮字幕データのロード,字幕クリア,透明度テーブルへの値のセットといったコマンドが指定されるが,字幕をバッファに設定するコマンドの場合にのみ,その後に実際の圧縮字幕データが挿入される。それ以外のコマンドは,図6(b)のように設定コマンドで使用するパラメータのみが指定される。
なお,前述した「透明度選択」コマンド等は,圧縮字幕データの中に埋め込まれるコマンドであるが,これは,可変長符号化処理の一部としてコードの中に埋め込まれる。字幕重畳回路19内のデータバッファから読み出した圧縮字幕データ中に,ある可変長データが出てきた場合,字幕の画像データではなく,コマンドであると解釈される。圧縮字幕データに埋め込まれたコマンドは,字幕重畳回路19内のデータバッファのデータが選択されている間は,毎フレーム一定のタイミングで実行される。
図7は,本実施の形態において字幕重畳部18を実現する字幕重畳回路19の構成例を示す図である。
デコード回路30は,字幕データ蓄積部14から読み出された圧縮字幕データから,圧縮字幕データ内に埋め込まれた描画コマンドを分離し,フレームカウント制御部31により,映像復号部17からの画像データ入力に同期して,コマンドの実行およびそれに伴う圧縮字幕データの圧縮字幕データバッファ32への書き込みを行う。圧縮字幕データバッファ32には,1つの画面に重畳する字幕の圧縮字幕データが格納され,この圧縮字幕データバッファ32の内容の更新は,「字幕クリア」コマンド,「ロード」コマンド,「保持」コマンドにより,字幕の内容の切り換えタイミングに従って制御される。
圧縮字幕データバッファ32に格納された圧縮字幕データは,伸張回路33によって字幕画像データに変換され,合成回路36によって入力画像データと合成される。
透明度テーブル34には,「透明度設定」コマンドによりいくつかの透明度設定の値T(以下,透明度Tという)が設定され,この中から「透明度選択」コマンドの設定に従って,合成に使用する透明度Tが選択される。乗算回路35は,選択された透明度とアルファ値αとを乗算する。
合成回路36は,乗算回路35の出力αTと,字幕データ値Xと,画像データ値Yとを入力し,αTに従って字幕データ値Xと画像データ値Yとの重み付け加算を行い,字幕データと映像の画像データとを合成した画像データ(αT×X+(1−αT)×Y)を出力する。
図8は,デコード回路30の動作フローを示している。ステップS1では,フレームカウント制御部31からフレームカウントを読み出す。フレームカウント制御部31は,字幕重畳回路19が入力する画像データのフレーム数をカウントするフレームカウンターを備えている。ステップS2では,フレームカウントの値をチェックし,圧縮字幕データ中のフレームカウントとの同期をとり,必要に応じて実行待ち合わせを行う。
同期がとれた場合,ステップS3では,圧縮字幕データ中のコマンドを読み出す。コマンドが透明度設定等のパラメータ変更のみを行うコマンド(図6(b)参照)の場合には,ステップS4においてパラメータを読み出し,続くステップS5において,そのコマンドを実行する。一方,圧縮字幕データバッファ32へのデータの設定を行うコマンド(図6(a)参照)の場合には,ステップS6においてデータ長をチェックし,ステップS7において圧縮字幕データバッファ32への圧縮字幕データの書き込みを行う。
例えば,このデコード回路30は,FPGA(Field Programmable Gate Array) 等によって実現することができる。
図9は,コマンドの実行タイミングを説明する図である。コマンドには,フレーム単位で指定されるコマンドと,圧縮字幕データ中に挿入されたフレーム内の実行コマンドとがある。フレーム単位で指定されるコマンドに関しては,フレームの切り換えの際に実行し,次のフレームから有効となる。一方,フレーム内の実行コマンドに関しては,字幕の画像データの中に挿入されているのでそのタイミングで同期をとる。
例えば圧縮字幕データの一部が,図9に示されるようなデータ列であったとすると,画像データ画像値Aを表示し,画像データラン長Bで指定された透明部分の画素を出力した後,コマンドを実行して,画像データ画像値Cを出力する。
図10は,字幕重畳回路19における伸張回路33の構成例を示している。伸張回路33は,図3に示した圧縮方法により圧縮されたデータを伸張し,圧縮前のビットマップ字幕データを復元する。
圧縮字幕データバッファ32から読み出されたデータは,まず,シフトレジスタ40に格納される。ラン長/輝度レベル判定部41により,図3の判定条件に従って,まずシフトレジスタ40内のデータからラン長が取り出され,ラン長カウンタ42に設定される。次に,アルファ値αおよび輝度レベルが読み出され,α値/輝度レベルレジスタ43に設定される。シフトレジスタ40の内容は,処理を行ったビット数に応じてシフトされ,空きが発生すると,圧縮字幕データバッファ32から新たなデータがシフトレジスタ40内に読み出される。
一方,伸張回路33の出力としては,ラン長カウンタ42に設定された個数分の無効画素が,無効画素出力部44から出力され,その後にα値/輝度レベルレジスタ43の内容が出力される。出力の切り換えは,セレクタ45によって行われる。本回路は非常に単純な回路であり,少ないハード規模で実現可能である。さらに映像信号速度でリアルタイムに復号処理を行うことが可能である。また,出力信号はラスタスキャン順序となっているため,字幕画像データの出力信号に対してデータの並べ換えなどを必要としない。
図11は,透明度テーブルの構成例とその利用のし方を説明する図である。図11(a)は,画面に表示される画像データを示しており,サイズは画面の大きさに対応している。画面には,ある時点において文字表示領域Aと文字表示領域Bの2つの領域に字幕が表示されているとする。
ここで,字幕データは,画面内の文字表示領域Aと文字表示領域Bに表示される字幕の画像データ(文字が表示されている部分以外は透明)であるが,この字幕データを圧縮したデータの中に,文字表示領域A,Bの表示が行われる前に透明度の設定を切り換える透明度選択コマンドが埋め込まれることになる。
1つの走査線内で2つの文字領域がある場合には,そのたびに選択を切り換える必要があるが,図11(a)に示す例のような場合であると,2回の切り換えだけでそれぞれの表示領域の透明度を切り換えることができる。
透明度テーブル34は,図11(b)のように,各文字表示領域の透明度を記憶するテーブルである。この透明度テーブル34は,字幕の表示領域を変更するときに更新されるが,フェードイン,フェードアウトの場合には,透明度テーブル34の透明度の値を変更するコマンドだけを毎フレーム実行する。
図12は,字幕の重畳と描画コマンド埋め込み部13が生成するコマンドの関係を説明する図である。ここでは,図12に示すように,2つの字幕A,Bが重なったタイミングで表示され,字幕Bにはフェードイン,フェードアウトが設定されている場合の例を説明する。図12において,横軸は時間の経過を示している。
(1)字幕Aが重畳される前のタイミングで,圧縮字幕データバッファ32に字幕Aのデータをロードする。
(2)字幕Aの重畳が開始されるタイミングで,ロードした圧縮字幕データバッファ32を選択する。
(3)字幕Bが重畳される前のタイミングで,別の圧縮字幕データバッファ32に字幕A+Bのデータをロードする。
(4)字幕Bが表示されるタイミングで,読み出す圧縮字幕データバッファ32を切り換える。
(5)フェードインの間,透明度設定を変更するコマンドを毎フレーム実行する。
(6)字幕Aの重畳が終了する前に,字幕Bのデータを圧縮字幕データバッファ32にロードする。
(7)字幕Aの重畳が終了するタイミングで,読み出す圧縮字幕データバッファ32を切り換える。
(8)字幕Bのフェードアウトを実行している間,透明度設定を変更するコマンドを毎フレーム実行する。
(9)字幕Bの重畳が終了した時点で,圧縮字幕データバッファ32をクリアする(実際は,アルファ値αが0のデータが出力される状態にする)。
図1に示す映像再生装置1の字幕重畳回路19を除く各処理部は,コンピュータとソフトウェアプログラムとによっても実現することができ,そのプログラムをコンピュータ読み取り可能な記録媒体に記録して提供することも,ネットワークを通して提供することも可能である。
次に,本実施の形態における字幕重畳回路19と,図13に示した従来の字幕重畳回路とを比較し,本発明の有効性を明らかにする。
第一のポイントは,本発明による字幕重畳回路19では,字幕描画を行うための専用CPU(図13の字幕描画用CPU51)が不要であることである。本発明による字幕重畳回路19では,字幕の描画はあらかじめ映像再生装置1のホストCPUによって行われるため,字幕重畳回路19に描画用の専用CPUを設ける必要がない。
第二のポイントは,本発明による字幕重畳回路19では,データバッファ部(図7の圧縮字幕データバッファ32)には字幕画像データが蓄積されている点であり,従来構成と比較するとバッファの容量が1/100程度の容量で済むということである。本実施例では,例えばFPGA(Field Programmabole Gate Array)等を用いて字幕重畳回路19を実現した場合にも,データバッファをチップ内メモリによって実現することが可能であり,外付けメモリを必要としない。本発明における回路的なオーバーヘッドとして圧縮した字幕の伸張回路33が必要な点があげられるが,図10に示したように,この機能は非常に単純な回路によって実現することが可能である。
第三のポイントは,本発明では,字幕重畳回路19の制御のためのコマンド(命令)が字幕データに組み込まれていることであり,例えば,字幕画像データに複数の字幕文字列が含まれており,それらの透明度を個別に制御したい場合に,本発明では字幕データに「透明度選択」コマンドを埋め込めばよく,また,各字幕文字列のフェードイン/フェードアウトを個別に制御したい場合には,「透明度設定」コマンドにより「透明度テーブル」の個々の設定値を個別に書き換えればよい。従って,図13の従来回路の構成例に示したように,複数の字幕データを重畳するために多段の字幕合成回路60,61を用いる必要がなく,さらに,透明度設定等の切り換えや更新のために外部からの制御を必要としない。
本発明の実施の形態に係る映像再生装置の全体構成を示す図である。 字幕データを映像再生装置内に取り込むときの処理を説明する図である。 ビットマップ字幕データの圧縮を説明する図である。 本実施の形態による字幕データの圧縮効率の例を示す図である。 圧縮字幕データへの描画コマンドの埋め込みを説明する図である。 描画コマンドが埋め込まれた圧縮字幕データの構成例を示す図である。 字幕重畳回路の構成例を示す図である。 デコード回路の動作フローを示す図である。 コマンドの実行タイミングを説明する図である。 字幕重畳回路における伸張回路の構成例を示す図である。 透明度テーブルの構成例とその利用のし方を説明する図である。 字幕の重畳と描画コマンド埋め込み部が生成するコマンドの関係を説明する図である。 従来技術による字幕重畳回路の構成例を示す図である。
符号の説明
1 映像再生装置
10 字幕データ入力部
11 字幕描画部
12 字幕データ圧縮部
13 描画コマンド埋め込み部
14 字幕データ蓄積部
15 映像データ入力部
16 映像データ蓄積部
17 映像復号部
18 字幕重畳部
19 字幕重畳回路

Claims (7)

  1. 映像データと,字幕文字列情報を含む字幕データとを入力し,字幕が重畳された映像信号をリアルタイムに再生する映像再生装置において,
    字幕の重畳対象となる映像データとは別に,前記字幕文字列情報を含む字幕データを入力する手段と,
    前記入力した字幕データに基づき,あらかじめ字幕画像データを生成する手段と,
    前記入力した字幕データ内の表示開始および表示終了の時間情報を含む字幕制御データに基づき,あらかじめ,前記字幕画像データに字幕の重畳を制御するための制御コマンドを埋め込むコマンド埋め込み手段と,
    前記制御コマンドが埋め込まれた前記字幕画像データを記憶装置に蓄積する字幕データ蓄積手段と,
    映像データの再生時に,再生対象の映像データから得られた画像データと前記記憶装置に蓄積された記字幕画像データとを入力し,前記字幕画像データに埋め込まれた前記制御コマンドに従ってリアルタイムに重畳する字幕重畳手段とを備え
    前記字幕重畳手段は,
    入力した前記字幕画像データを格納するバッファと,
    入力した前記字幕画像データに埋め込まれた前記制御コマンドに従って,前記バッファ内のデータのクリア,または前記バッファへのデータの書き込み,または前記バッファ内のデータの保持を制御するデコード回路と,
    前記字幕画像データの入力と,再生対象の映像の画像データの入力との同期を制御するフレームカウント制御回路と,
    前記制御コマンドにより設定または選択された透明度と前記字幕画像データ内のアルファ値とを乗算する乗算回路と,
    入力した再生対象の映像の画像データと,前記バッファに格納された前記字幕画像データとを,前記乗算回路による乗算結果に基づいて合成する合成回路とを備える
    ことを特徴とする映像再生装置。
  2. 前記字幕画像データを生成する手段は,前記字幕画像データとして,前記入力した字幕データに基づき生成したビットマップ形式の画像データをラスタスキャン順序で読み出すことができる形式の圧縮方式により圧縮した字幕画像データを生成する字幕データ圧縮手段を備え
    記字幕重畳手段は,前記バッファに格納された前記字幕画像データをラスタスキャン順序で圧縮前のビットマップ形式の画像データに復元するデータ伸張手段を備える
    ことを特徴とする請求項1に記載の映像再生装置。
  3. 前記制御コマンドは,前記字幕重畳手段のバッファに格納された前記字幕画像データのクリアを指示する字幕クリアコマンド,前記字幕重畳手段のバッファに前記字幕画像データをロードすることを指示するロードコマンド,前記字幕重畳手段のバッファに格納された前記字幕画像データを保持することを指示する保持コマンド,重畳する字幕の透明度の設定を指示する透明度設定コマンドまたは設定された透明度の中から字幕の重畳に用いる透明度を指定する透明度選択コマンドを含み,
    前記字幕重畳手段は,前記各制御コマンドで指示された制御を行う回路を備える
    ことを特徴とする請求項1または請求項2に記載の映像再生装置。
  4. 映像データと,字幕文字列情報を含む字幕データとを入力し,字幕が重畳された映像信号をリアルタイムに再生する映像再生方法において,
    字幕の重畳対象となる映像データとは別に,前記字幕文字列情報を含む字幕データを入力するステップと,
    前記入力した字幕データに基づき,あらかじめ字幕画像データを生成するステップと,
    前記入力した字幕データ内の表示開始および表示終了の時間情報を含む字幕制御データに基づき,あらかじめ,前記字幕画像データに字幕の重畳を制御するための制御コマンドを埋め込むコマンド埋め込みステップと,
    前記制御コマンドが埋め込まれた前記字幕画像データを記憶装置に蓄積する字幕データ蓄積ステップと,
    映像データの再生時に,再生対象の映像データから得られた画像データと前記記憶装置に蓄積された前記字幕画像データとを入力し,前記字幕画像データに埋め込まれた前記制御コマンドに従ってリアルタイムに重畳する字幕重畳ステップとを備え,
    前記字幕重畳ステップは,
    入力した前記字幕画像データをバッファに格納するステップと,
    入力した前記字幕画像データに埋め込まれた前記制御コマンドに従って,前記バッファ内のデータのクリア,または前記バッファへのデータの書き込み,または前記バッファ内のデータの保持を制御するステップと,
    前記字幕画像データの入力と,再生対象の映像の画像データの入力との同期を制御するステップと,
    前記制御コマンドにより設定または選択された透明度と前記字幕画像データ内のアルファ値とを乗算するステップと,
    入力した再生対象の映像の画像データと,前記バッファに格納された前記字幕画像データとを,前記乗算回路による乗算結果に基づいて合成するステップとを備える
    ことを特徴とする映像再生方法。
  5. 前記字幕画像データを生成するステップは,前記字幕画像データとして,前記入力した字幕データに基づき生成したビットマップ形式の画像データをラスタスキャン順序で読み出すことができる形式の圧縮方式により圧縮した字幕画像データを生成する字幕データ圧縮ステップを備え,
    前記字幕重畳ステップは,前記バッファに格納された前記字幕画像データをラスタスキャン順序で圧縮前のビットマップ形式の画像データに復元するデータ伸張ステップを備える
    ことを特徴とする請求項4に記載の映像再生方法。
  6. フレーム単位で再生対象の映像の画像データを入力するとともに,あらかじめ字幕文字列情報を含む字幕データから所定のフォーマットに従って生成された字幕画像データを入力し,映像に字幕を重畳して出力する字幕重畳装置であって,
    前記字幕画像データの入力と,前記再生対象の映像の画像データの入力との同期を制御するフレームカウント制御回路と,
    前記字幕画像データを格納するバッファと,
    前記字幕画像データを重畳する際の透明度を記憶する透明度記憶手段と,
    入力した前記字幕画像データから,該字幕画像データにあらかじめ埋め込まれた制御コマンドを分離し,分離した制御コマンドに従って,前記バッファ内のデータのクリア,または前記バッファへのデータの書き込み,または前記バッファ内のデータの保持,または前記透明度記憶手段への透明度の設定を制御するデコード回路と,
    前記透明度記憶手段に記憶された透明度と前記字幕画像データ内のアルファ値とを乗算する乗算回路と,
    入力した再生対象の映像の画像データと,前記バッファから読み出した字幕画像データとを,前記乗算回路による乗算結果に基づいて合成する合成回路とを備える
    ことを特徴とする字幕重畳装置。
  7. 前記バッファに格納された字幕画像データは,ラスタスキャン順序で読み出すことができる形式の圧縮方式により圧縮された字幕画像データであり,
    前記バッファから読み出された字幕画像データを,前記乗算回路および前記合成回路に出力する際に圧縮前のビットマップ形式の画像データに復元するデータ伸張回路を備える ことを特徴とする請求項6に記載の字幕重畳装置。
JP2007067704A 2007-03-16 2007-03-16 映像再生装置,映像再生方法および字幕重畳装置 Active JP4634410B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007067704A JP4634410B2 (ja) 2007-03-16 2007-03-16 映像再生装置,映像再生方法および字幕重畳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007067704A JP4634410B2 (ja) 2007-03-16 2007-03-16 映像再生装置,映像再生方法および字幕重畳装置

Publications (2)

Publication Number Publication Date
JP2008228242A JP2008228242A (ja) 2008-09-25
JP4634410B2 true JP4634410B2 (ja) 2011-02-16

Family

ID=39846262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007067704A Active JP4634410B2 (ja) 2007-03-16 2007-03-16 映像再生装置,映像再生方法および字幕重畳装置

Country Status (1)

Country Link
JP (1) JP4634410B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108028966A (zh) * 2015-07-16 2018-05-11 纳宝商务平台株式会社 视频提供装置、视频提供方法及计算机程序

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106804011B (zh) * 2017-02-10 2021-03-30 深圳创维数字技术有限公司 一种播放视频时加载字幕文件的方法及系统
CN112235521B (zh) * 2020-09-29 2023-03-10 东软集团股份有限公司 一种实现字幕转换的方法、装置及设备
CN117241068B (zh) * 2023-11-15 2024-01-19 北京医百科技有限公司 一种视频字幕生成方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004023332A (ja) * 2002-06-14 2004-01-22 Hitachi Ltd 画像データ処理回路及びディジタル放送受信装置
JP2004201100A (ja) * 2002-12-19 2004-07-15 Nec Corp 付加情報挿入装置及びその方法
JP2006180209A (ja) * 2004-12-22 2006-07-06 Sony Corp 記録装置および方法、再生装置および方法、プログラム記録媒体、並びにプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11252518A (ja) * 1997-10-29 1999-09-17 Matsushita Electric Ind Co Ltd 字幕用副映像ユニット作成装置および記憶媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004023332A (ja) * 2002-06-14 2004-01-22 Hitachi Ltd 画像データ処理回路及びディジタル放送受信装置
JP2004201100A (ja) * 2002-12-19 2004-07-15 Nec Corp 付加情報挿入装置及びその方法
JP2006180209A (ja) * 2004-12-22 2006-07-06 Sony Corp 記録装置および方法、再生装置および方法、プログラム記録媒体、並びにプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108028966A (zh) * 2015-07-16 2018-05-11 纳宝商务平台株式会社 视频提供装置、视频提供方法及计算机程序
CN108028966B (zh) * 2015-07-16 2021-06-08 纳宝商务平台株式会社 视频提供装置、视频提供方法及计算机程序

Also Published As

Publication number Publication date
JP2008228242A (ja) 2008-09-25

Similar Documents

Publication Publication Date Title
US7659934B2 (en) Recording/reproduction apparatus, and recording/reproduction method as well as stereoscopic images visual effects confirmation apparatus and stereoscopic image visual effects confirmation method
US7280158B2 (en) Video synthesizing apparatus
JP4634410B2 (ja) 映像再生装置,映像再生方法および字幕重畳装置
JP2001177802A (ja) 画像シーケンス符号化方法、電子機器で使用するサブピクチャユニット、及び、データ記憶媒体
JPH11284948A (ja) サムネイル作成方法及びサムネイル表示方法
JP2008193263A (ja) 画像処理方法、画像処理装置、画像処理プログラム、および、記録媒体
JP2007259193A (ja) 映像出力装置、及び方法
JP5520890B2 (ja) 画像処理装置、画像データ生成装置、画像処理方法、画像データ生成方法、および画像ファイルのデータ構造
JP3109817B2 (ja) 画像処理装置
JP2004080587A (ja) テレビジョン信号記録再生装置およびテレビジョン信号記録再生方法
JP3595563B2 (ja) 動画像処理方法および装置
JP4122456B2 (ja) 画像データ圧縮方法
JP2007129455A (ja) 画像符号化装置、画像符号化方法、画像符号化プログラムおよび画像符号化プログラムを記録したコンピュータ読み取り可能な記録媒体
JPWO2005101819A1 (ja) 表示装置
KR100474916B1 (ko) 썸네일 영상 생성 장치 및 그 방법
JP2018117308A (ja) 再生装置及びその制御方法
JP4672561B2 (ja) 画像処理装置、受信装置、放送システム、画像処理方法、画像処理プログラム、および記録媒体
JP2004282305A (ja) 画像処理システム
JP2009288588A (ja) 画像表示装置
JP2001144934A (ja) 画像合成方法および画像合成装置
JP3587376B2 (ja) 画像情報再生装置
JP3278149B2 (ja) 画像処理装置
JP3062507B2 (ja) 画像符号化装置及び画像復号装置
JP2005269283A (ja) ディジタル画像の再生方法及び再生装置
JP5355176B2 (ja) 動画保存装置及びその制御方法

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100331

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101029

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101116

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101118

R150 Certificate of patent or registration of utility model

Ref document number: 4634410

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131126

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350