JPWO2006048963A1 - 字幕付き静止画コンテンツ作成装置、字幕付き静止画コンテンツ作成プログラム及び字幕付き静止画コンテンツ作成システム - Google Patents

字幕付き静止画コンテンツ作成装置、字幕付き静止画コンテンツ作成プログラム及び字幕付き静止画コンテンツ作成システム Download PDF

Info

Publication number
JPWO2006048963A1
JPWO2006048963A1 JP2006542249A JP2006542249A JPWO2006048963A1 JP WO2006048963 A1 JPWO2006048963 A1 JP WO2006048963A1 JP 2006542249 A JP2006542249 A JP 2006542249A JP 2006542249 A JP2006542249 A JP 2006542249A JP WO2006048963 A1 JPWO2006048963 A1 JP WO2006048963A1
Authority
JP
Japan
Prior art keywords
caption
still image
signal
subtitle
video signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006542249A
Other languages
English (en)
Other versions
JP4616274B2 (ja
Inventor
静男 村上
静男 村上
耕一 大河原
耕一 大河原
田中 隆
隆 田中
渡辺 秀夫
秀夫 渡辺
Original Assignee
株式会社テレビ朝日データビジョン
エル・エス・アイ ジャパン株式会社
エル・エス・アイ ジャパン株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社テレビ朝日データビジョン, エル・エス・アイ ジャパン株式会社, エル・エス・アイ ジャパン株式会社 filed Critical 株式会社テレビ朝日データビジョン
Publication of JPWO2006048963A1 publication Critical patent/JPWO2006048963A1/ja
Application granted granted Critical
Publication of JP4616274B2 publication Critical patent/JP4616274B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/08Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/278Subtitling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/445Receiver circuitry for the reception of television signals according to analogue transmission standards for displaying additional information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/08Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division
    • H04N7/087Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only
    • H04N7/088Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital
    • H04N7/0884Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital for the transmission of additional display-information, e.g. menu for programme or channel selection
    • H04N7/0885Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital for the transmission of additional display-information, e.g. menu for programme or channel selection for the transmission of subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles

Abstract

クローズド・キャプションである字幕放送コンテンツをオープン化して、テレビ映像から得た静止画に合成し、新たな字幕付き静止画コンテンツを自動作成することが可能な字幕付き静止画コンテンツの作成技術を提供する。字幕付き静止画コンテンツ作成システムでは、字幕付き映像信号生成装置は字幕付き映像信号を生成し、静止画コンテンツ作成装置は当該字幕付き映像信号から字幕付き静止画コンテンツを作成する。字幕付き映像信号生成装置は、元になる映像信号及び字幕信号を受信し、当該字幕がリアルタイム字幕であるか否かに応じて、制御信号を生成する。そして、前記字幕信号と前記映像信号とを合成し、前記制御信号を所定位置に挿入して字幕付き映像信号を生成する。一方、静止画コンテンツ作成装置は、字幕付き映像信号から字幕信号及び制御信号を抽出し、制御信号に基づいて映像信号中の画像をキャプチャーして静止画を生成するとともに、字幕信号から字幕画像を生成する。そして、静止画と字幕画像とを合成して字幕付き静止画コンテンツを作成する。

Description

本発明は、字幕放送などの字幕付き映像信号から、字幕付きの静止画コンテンツを作成する技術に関する。
テレビ放送の字幕は、音声を聞かなくてもテレビ番組の内容がよく理解できるように注意深く作られている。テレビ字幕放送は、その放送の使命が聴覚障害者への情報伝達手段であることから、番組内の出演者の言葉や効果音など音声情報を文字情報化している。また、画面内の複数人物の対話なども、話者を区別した表現で文字情報化している。よって、テレビ放送中の字幕は、ユーザが音声を聞かなくても内容を理解できる質の高い情報となっている。
なお、字幕を含む映像から、字幕コードをきっかけとして代表画像を切り出す映像情報蓄積装置が提案されている(特許文献1参照)。
特開平10−327386号公報
技術的面の特徴として、字幕信号はテレビ映像信号のフレームに同期している(物理的な同期)。一方、字幕データとしての観点では情報として番組内容のシーンにも同期している(意味的な同期)。この特徴はデジタル放送でも同様である。
これらの特徴から、字幕信号を利用して、当該番組のテレビジョン映像信号(動画シーン)から、意味的同期で1枚の静止画を得ることが出来る。つまり、字幕信号を『意味のある静止画』キャプチャーのトリガー(きっかけ)として利用することにより、質の高い情報を活かした、新たな字幕付き静止画コンテンツに編成することが可能である。
字幕放送は「クローズド・キャプション」と呼ばれる。これに対して、通常にテレビ放送にスーパーインポーズされるものを「オープン・キャプション」と呼ぶ。本発明は、クローズド・キャプションである字幕放送コンテンツをオープン化して、テレビ映像から得た静止画に合成し、新たなコンテンツを自動作成する技術を提供するものである。
字幕放送の伝送規格は、OSIモデル(Open Systems Interconnection)に準拠してデータ構造が構成されている。なお、OSIはISO(国際標準化機構)が国際標準化した、7階層からなる開放型システム間相互接続参照モデルを意味する。文字放送は、この階層モデルに準じた次の定義を用いている。
(階層7) (適用なし)
(階層6) 提示 文字・図形・付加音の表出を行う。文字放送専用の
外字も使われ、人名などの特殊文字はビットパターンの
伝送(DJCS)で表示される。
(階層5) 番組 番組管理データ、ページデータ(PACIやデータ
ユニットを含む)から成る。
(階層4) データグループ データブロックの集合である。
(階層3) データパケット プリフィクスと22バイトのデータブロック
から成る。
(階層2) データライン パケット同期部とデータパケットから成る
(階層1) 伝送路 電気物理的信号である。
本発明では、映像と字幕の合成タイミングを正確にするために、及び、処理システムをコンパクトにするために「OSIレイヤー」の物理層に近い部分「階層(レイヤー)2から5」で制御処理する方法を考案した。具体的には、NTSC方式を例にすると、テレビ映像信号をデジタイズ後に、字幕部分のパケットデータとデジタル化した映像データをバイナリーデータでメモリなどに一時記憶しておき、レイヤー5までの定義判定処理を行うことで実現する。また、字幕放送規格で扱う文字には、外字や再定義文字などがあり、バイナリーデータを文字コードにデコード後の処理方式では(上位のレイヤー6以上、例えば、漢字文字コードを認識するような方式)システム動作を曖昧にしてしまう恐れがある。この方式の大きな利点として、これを防止できることが挙げられる。
また、デジタル放送方式の場合でも、PESからバイナリーデータとして抽出後は、同じ処理で行える。
本発明の1つの観点では、字幕付き静止画コンテンツ作成装置は、字幕付き映像信号を受信する受信部と、前記字幕付き映像信号から、字幕信号及びコンテンツ作成のための制御信号を抽出する抽出部と、前記制御信号に基づいて、前記映像信号中の画像をキャプチャーする静止画キャプチャー部と、前記字幕信号に基づいて字幕画像を生成する字幕画像生成部と、前記字幕画像と前記静止画とを合成し、字幕付静止画コンテンツを作成する作成部と、を備える。
「制御信号」としては、字幕パケット構成規格にある、PACI内の「字幕フラグ」と、字幕パケットのページバイナリデータにより、キャプチャーと合成タイミング制御信号を生成する方法が、最も簡易な手法である。この場合も、「OSIレイヤー」の物理層に近い「レイヤー2から5」部分で制御処理する方法であるので、物理的なタイミングは正確である。一方、コンテンツ制作を考慮すると、制作側の意図をより詳細に反映する目的で、タイミング制御信号を付加する方法がより優れたコンテンツを提供可能となる。
上記の字幕付き静止画コンテンツ作成装置は、字幕付き映像信号から、字幕付き静止画コンテンツを作成する。字幕付き映像信号としては、例えば放送局から放送される字幕放送番組の映像信号などが含まれる。テレビ等の番組は、事前にVTRなどに収録したパッケージ番組とニュースなどの様に生放送の番組に大別される。これらの番組に字幕を付与する場合、パッケージ番組では、映像信号などと字幕信号を一緒にVTRなどに記録し放送する方法と、映像信号などをVTRなどに記録し、放送時に字幕信号を付加する方法があり、それらは共にパッケージ字幕番組(以下、「パッケージ字幕放送番組」と呼ぶ。)である。また、ニュース番組など生放送の放送時に、リアルタイムで字幕を付加するリアルタイム字幕(「生字幕」とも呼ばれる。)放送番組(以下、「リアルタイム字幕放送番組」と呼ぶ。)がある。
なお、字幕付き映像信号は、アナログ映像信号であってもデジタル映像信号であってもよく、また、パッケージ字幕放送番組の映像信号であっても、リアルタイム字幕放送番組の映像信号であってもよい。
受信部により受信された字幕付き映像信号からは、字幕信号及びコンテンツ作成のための制御信号が抽出される。コンテンツ作成のための制御信号は、映像信号中の特定の画像のキャプチャータイミングなどを示す制御信号を含むことができ、その制御信号に基づいて映像信号中の画像が静止画としてキャプチャーされる。一方、抽出された字幕信号に基づいて、字幕の文字に対応する字幕画像が生成される。そして、字幕画像と、キャプチャーされた静止画とが合成され、字幕付き静止画コンテンツが作成される。
この字幕付き静止画コンテンツは、映像信号に含まれる字幕と、その字幕に対応する画像の静止画とが合成されたものである。通常、字幕放送の内容は当該番組の主要な情報を提供するように構成されているので、字幕と、それに対応する画像とが合成された静止画を閲覧することにより、ユーザは当該字幕放送番組を実際に視聴した場合と比べてそれほど遜色のない情報を短時間に取得することができる。
上記の字幕付き静止画コンテンツ作成装置の一態様では、前記静止画キャプチャー部は、各字幕信号に対応する前記映像信号中の静止画をキャプチャーする。これにより、字幕付き静止画コンテンツに含まれる静止画の内容と、字幕とを内容的、意味的に整合させることが可能となる。
上記の字幕付き静止画コンテンツ作成装置の好適な例では、前記映像信号はパッケージ字幕放送番組の映像信号であり、前記抽出部は前記映像信号中の字幕信号を含むフレームから当該字幕信号及び前記制御信号を抽出し、前記静止画キャプチャー部は、当該フレームの画像をキャプチャーする。パッケージ字幕放送番組の映像信号においては、字幕が挿入されている位置は映像信号が示す画像の内容と時間的、内容的に整合がとれている。即ち、字幕は、その字幕の内容と対応する画像上に挿入されるように字幕付き映像信号が予め構成されている。よって、字幕信号が含まれるフレームから字幕信号を抽出し、そのフレーム画像の静止画と合成することにより、内容的に字幕と画像との整合がとれた字幕付き静止画コンテンツを作成することができる。
上記の字幕付き静止画コンテンツ作成装置の他の好適な例では、前記映像信号はリアルタイム字幕放送の映像信号であり、前記抽出部は前記映像信号中の字幕信号を含むフレームから当該字幕信号及び前記制御信号を抽出し、前記静止画キャプチャー部は、当該フレームより時間的に後方に位置するフレームの画像をキャプチャーする。リアルタイム字幕放送番組では、映像とともに生放送される音声に基づいてリアルタイムで字幕信号が生成され、映像信号に付加されるので、字幕信号はそれに対応する画像よりも時間的に遅れた位置に付加されることになる。よって、通常、リアルタイム字幕放送番組では、対応する画像に対して遅れて字幕が表示される。そこで、リアルタイム字幕放送番組の場合には、字幕信号が含まれるフレームから字幕信号及び制御信号を抽出するとともに、それより時間的に後方に位置するフレームから、当該字幕に対応するフレーム画像をキャプチャーして静止画を生成する。そして、その字幕と静止画とを合成する。これにより、リアルタイム字幕放送番組からも、字幕と静止画とが内容的に整合された字幕付き静止画コンテンツを作成することができる。
上記の字幕付き静止画コンテンツ作成装置の一例では、前記映像信号をアナログテレビジョン信号とし、前記抽出部は前記アナログテレビジョン信号中の字幕信号を含むフレームの垂直帰線期間内から前記制御信号を抽出することができる。また、他の例では、前記映像信号をデジタルテレビジョン信号とし、前記抽出部は前記デジタルテレビジョン信号中の字幕信号を含むPES中のプライベートデータ内から前記制御信号を抽出することができる。
本発明の他の観点では、字幕付き静止画コンテンツ作成プログラムは、コンピュータ端末により実行されることにより、前記コンピュータ端末を、字幕付き映像信号を受信する受信部、前記字幕付き映像信号から字幕信号及びコンテンツ作成のための制御信号を抽出する抽出部、前記制御信号に基づいて、前記映像信号中の画像をキャプチャーする静止画キャプチャー部、前記字幕信号に基づいて字幕画像を生成する字幕画像生成部、及び、前記字幕画像と前記静止画とを合成し、字幕付静止画コンテンツを作成する作成部として機能させる。上記の字幕付き静止画コンテンツ作成プログラムを、PCその他のコンピュータ端末上で実行することにより、上述の字幕付き静止画コンテンツ作成装置を実現することができる。
本発明のさらに他の観点では、字幕付静止画コンテンツ作成システムは、字幕付き映像信号生成装置と、静止画コンテンツ作成装置とを備える。ここで、字幕付き映像信号生成装置は、映像信号及び字幕信号を受信する受信部と、前記字幕がリアルタイム字幕であるか否かに応じて制御信号を生成する制御信号生成部と、前記字幕信号と前記映像信号とを合成し、前記制御信号を所定位置に挿入して字幕付き映像信号を生成する信号生成部と、を備える。また、静止画コンテンツ作成装置は、前記字幕付き映像信号を受信する受信部と、前記字幕付き映像信号から前記字幕信号及び前記制御信号を抽出する抽出部と、前記制御信号に基づいて、前記映像信号中の画像をキャプチャーする静止画キャプチャー部と、前記字幕信号に基づいて字幕画像を生成する字幕画像生成部と、前記字幕画像と前記静止画とを合成し、字幕付き静止画コンテンツを作成する作成部と、を備える。
上記の字幕付き静止画コンテンツ作成システムによれば、字幕付き映像信号生成装置は字幕付き映像信号を生成し、静止画コンテンツ作成装置は当該字幕付き映像信号から字幕付き静止画コンテンツを作成する。
字幕付き映像信号生成装置は、元になる映像信号及び字幕信号を受信し、当該字幕がリアルタイム字幕であるか否かに応じて、制御信号を生成する。そして、前記字幕信号と前記映像信号とを合成し、前記制御信号を所定位置に挿入して字幕付き映像信号を生成する。一方、静止画コンテンツ作成装置は、字幕付き映像信号から字幕信号及び制御信号を抽出し、制御信号に基づいて映像信号中の画像をキャプチャーして静止画を生成するとともに、字幕信号から字幕画像を生成する。そして、静止画と字幕画像とを合成して字幕付き静止画コンテンツを作成する。
この字幕付き静止画コンテンツは、映像信号に含まれる字幕と、その字幕に対応する画像の静止画とが合成されたものであるので、その合成画を閲覧することにより、ユーザは当該字幕放送番組を実際に視聴した場合と比べてそれほど遜色のない情報を短時間に取得することができる。
上記の字幕付き静止画コンテンツ作成システムの一態様では、前記制御信号生成部は、前記字幕がリアルタイム字幕でない場合には、前記字幕信号及び前記制御信号が抽出されたフレーム画像を前記静止画キャプチャー部によりキャプチャーすべき画像に指定する制御信号を生成し、前記字幕がリアルタイム字幕である場合には、前記字幕信号及び前記制御信号が抽出されたフレーム画像より時間的に後方のフレーム画像を前記静止画キャプチャー部によりキャプチャーすべき画像に指定する制御信号を生成する。これにより、パッケージ字幕放送番組の場合でも、リアルタイム字幕放送番組の場合でも、内容的に字幕と静止画の内容が整合した字幕付き静止画コンテンツを作成することができる。
本発明に係る字幕付き静止画コンテンツ作成システムを適用した環境の例を示す。 一般的な字幕放送用映像信号と、本発明による字幕付き静止画コンテンツの表示画像例を示す。 字幕付き映像信号と、それに対応する画像と、字幕付きTV映像信号から字幕付き静止画コンテンツを作成する処理の概要とを模式的に示す。 字幕付き映像信号中における制御情報の位置及び内容を示す。 字幕付き映像信号中における制御情報の位置及び内容を示す。 パッケージ放送番組における字幕付き静止画コンテンツの作成の様子、及び、リアルタイム字幕放送における字幕送出の遅れを模式的に示す。 リアルタイム字幕放送番組における字幕付き静止画コンテンツの作成の様子を模式的に示す。 放送局内のシステム構成を示すブロック図である。 字幕付き静止画コンテンツ作成装置の主要構成を示す。 字幕付き静止画コンテンツ作成装置の実施例の構成を示す。 デジタルTV映像信号の場合の制御フラグの設定例を示す。 本発明に係る字幕付き静止画コンテンツ作成システムを適用した環境の例を示す。
符号の説明
10 放送局
20 字幕放送送出システム
30 字幕付き静止画コンテンツ作成装置
40 放送波
42 字幕付き静止画コンテンツ
50 ユーザ環境
52 TV受信機
54 端末装置
以下、図面を参照して本発明の好適な実施形態について説明する。
[第1実施形態]
(字幕付き静止画コンテンツ作成システム)
図1に、本発明に係る字幕付き静止画コンテンツ作成システムを適用した環境の例を示す。図1では、放送局10がユーザ環境50に対して字幕テレビ放送を行っている。放送局10内では、字幕放送送出システム20が字幕放送用の映像信号を作成し、これを放送波40に乗せて送出する。ユーザ環境50では字幕チューナを備えるTV受信機52により放送波40を受信し、字幕放送番組を見ることができる。
これに加え、本発明では、字幕放送送出システム20は通常の字幕放送用の映像信号に対して、字幕付き静止画コンテンツ作成時に使用する制御情報を付加した映像信号(以下、「字幕付き映像信号」と呼ぶ。)を作成し、字幕付き静止画コンテンツ作成装置30へ供給する。即ち、本発明による字幕付き静止画コンテンツ作成システムは、字幕放送送出システム20及び字幕付き静止画コンテンツ作成装置30により構成される。
字幕付き静止画コンテンツ作成装置30は、字幕放送送出システム20から供給された字幕付き映像信号を使用して、字幕付き静止画コンテンツ42を作成する。字幕付き静止画コンテンツ42は、字幕が合成された静止画コンテンツであり、放送、インターネットその他によるデータ通信、記憶媒体による頒布など、各種の伝達方法によりユーザに提供される。ユーザは、PC、PDA、携帯電話、電子ブックその他の端末装置54により、字幕付き静止画コンテンツ42を閲覧することができる。
字幕付き静止画コンテンツは、字幕放送番組を構成する静止画に、当該字幕放送中に表示される字幕が合成されたコンテンツである。前述のように、字幕放送番組中の字幕は、音声を聞かなくても番組内容を十分に理解できるように作成された質の高い情報であるため、ユーザは字幕付き静止画コンテンツを閲覧することにより、当該字幕放送番組を視聴した場合と比べても遜色ない情報を得ることができる。
(字幕付き静止画コンテンツ)
次に、字幕付き静止画コンテンツの概略について説明する。図2に、一般的な字幕放送用映像信号と、本発明による字幕付き静止画コンテンツの表示画像例を示す。図2の上段に示すように、字幕放送中のフレーム画像1〜5において、フレーム画像1及び2中に字幕1が表示され、フレーム画像3中に字幕2が表示され、フレーム画像4及び5中に字幕3が表示されるように字幕放送用映像信号が構成されているとする。この場合、本発明の字幕付き静止画コンテンツとしては、図2の下段に示すように、フレーム画像1に字幕1が合成された静止画と、フレーム画像3に字幕2が合成された静止画と、フレーム画像4に字幕3が合成された静止画とが作成される。このように、本発明では、字幕を基準として、その字幕に対応するフレーム画像をキャプチャーし、キャプチャーしたフレーム画像に字幕を合成することにより字幕付き静止画を作成する。これにより、元になる字幕放送用映像信号中に含まれる字幕は全て字幕付き静止画コンテンツ中に含められることになる。即ち、字幕放送において重要な情報である字幕を漏らさず静止画コンテンツ中に取り込むことができるので、作成された字幕付き静止画コンテンツを閲覧することにより、ユーザは元になる字幕放送を視聴した場合とほぼ同等の情報を得ることができる。
また、字幕付き静止画コンテンツは時系列に配列された静止画の集合であるので、ユーザは通常、PC、PDA、携帯電話、電子ブックなどの端末装置を使用してその順序に従って再生、閲覧することになる。
(字幕付き静止画コンテンツ作成方法の概要)
次に、字幕付き静止画コンテンツの作成方法の概要について説明する。図3は、字幕付き映像信号と、それに対応する画像と、字幕付きTV映像信号から字幕付き静止画コンテンツを作成する処理の概要とを模式的に示す。この例では、図3の最上段に示すように、字幕付きTV映像信号中の画像はフレーム画像3〜5を有し、フレーム画像3には字幕はなく、フレーム画像4及び5には字幕3が含まれている。即ち、図3の中段に示すように、字幕付きTV映像信号は、フレーム画像3には字幕信号が含まれておらず、フレーム画像4及び5には字幕3の字幕信号が含まれている。
この場合、字幕付き静止画コンテンツの作成処理は、まずフレーム画像中の字幕信号を検出する。本例では、字幕信号が含まれるフレーム画像、即ちフレーム画像4を検出し、その字幕信号を含む字幕パケットを抽出する(ステップS1)。字幕パケットには後述する制御情報が含まれている。制御情報には字幕付きTV映像信号のフレーム画像をキャプチャーするタイミングを示す情報が含まれているので、字幕付き静止画コンテンツの作成処理は、当該制御信号を抽出し、その内容に応じてTV映像信号のフレーム画像をキャプチャーするタイミングを示すキャプチャートリガを生成し、それに基づいて対応するフレーム画像をキャプチャーする(ステップS2)。キャプチャーされたフレーム画像はJPEG圧縮され、静止画データ11が作成される(ステップS3)。
一方、ステップS1で抽出された字幕パケットからは字幕3の字幕データが抽出され、その字幕に対応する字幕画像12が生成される。そして、フレーム画像4に対応する静止画データ11と、字幕3に対応する字幕画像12とが合成され、字幕付き静止画コンテンツ13が作成される。
このように、字幕付き静止画コンテンツの作成処理では、字幕付きTV映像信号中のフレーム画像のうち、字幕を含む映像信号から字幕パケットを抽出し、その中に含まれる制御信号に基づいて、静止画としてキャプチャーすべきフレーム画像を決定する。そして、制御信号に従ってキャプチャーされた静止画と、字幕パケットに含まれる字幕データに対応する字幕画像とを合成して字幕付き静止画コンテンツが作成される。
(制御信号)
次に、字幕付き静止画コンテンツの作成に用いられる制御信号について詳しく説明する。図4及び5に、字幕付き映像信号中における制御情報の位置及び内容を示す。本例では、字幕付き映像信号は文字放送規格に従ったアナログTV映像信号であるものとする。アナログ字幕付き映像信号では、字幕データ及び字幕に関する情報はTV映像信号の垂直帰線期間(VBI)中に挿入される。本例では、特に制御信号は文字放送規格のうち、ページデータヘッダ(PACI)の「ページ提示デバイス(DB15)のうちのビット番号b5〜b8に設定されるものとする。
図4に文字放送のページデータヘッダの構成を示す。文字放送データのうち、図4の最下段に示すデータグループ0〜3にはそれぞれヘッダ(H)21と、データグループデータ22と、CRCなどの情報23が含まれる。このうち、データグループ0中のデータグループデータ22は番組管理データに対応し、番組管理データは番組データヘッダ24及びデータユニット25を含む。一方、データグループ1及び2中のデータグループデータ22はページデータ中のページデータヘッダ26及びデータユニット27にそれぞれ対応する。
ページデータ中のページデータヘッダ26は、データヘッダ識別31、データヘッダデータ長32及びデータヘッダデータ32を含む。データヘッダ識別31は情報分離符号DB8及びデータヘッダパラメータDB9を含む。一方、データヘッダデータ33は、図4の最上段に示すように、番組番号及びマガジン番号DB11〜ラスタ色及びヘッダラスタ色DB19の各種情報を含み、その中にページ提示デバイスDB15が含まれている。
図5に、ページデータヘッダ26及びページ提示デバイスDB15の構成、並びに、制御フラグの例を示す。図示のように、ページ提示デバイスDB15はb1〜b8の8ビットを有し、b5〜b8の4ビットが本発明による制御信号を設定するための制御ビットとして使用される。また、これらの制御ビットは、ページデータヘッダ中の番組形態DB14の制御ビット「b4」、「b3」がともに“1”(オン)である場合、つまり「“11”=字幕」である場合に有効となる。
図5の最下段に制御ビットb5〜b8に設定される制御フラグの意味を示す。図5の中段に例示するように、例えば制御タイプがCbである場合、制御ビットb8〜b5がそれぞれ“0”、“0”、“0”、“1”に設定され、制御フラグ「0001」となる。なお、制御タイプCa〜Cgなどは、制御の種類を区別するために説明の便宜上付けたものである。
これらの制御フラグは、放送局内で、前述の字幕放送送出システム20が字幕付き映像信号を生成する際に設定される。即ち、字幕放送送出システム20が出力する字幕付き映像信号にはこれら制御情報が既に含まれている。
パッケージ字幕放送番組では、既にVTR収録されたTV映像信号に対して字幕を挿入するので、TV画像と字幕を時間的、内容的に正しく対応させることができる。即ち、TV画像中の適切なフレーム画像に対して字幕が挿入されている。よって、パッケージ字幕放送番組から字幕付き静止画コンテンツを生成する場合は、字幕を含むフレーム画像を検出し、そのフレーム画像の静止画と、そのフレーム画像の映像信号に含まれている字幕とを合成させればよい。
このため、パッケージ字幕放送番組の字幕付き映像信号には、制御タイプCdの制御フラグ「0011」が設定される。制御フラグ「0011」はフレーム内のベース映像のキャプチャー、字幕データの保存、及び、字幕の文字レンダリングの指示に対応する。よって、制御フラグ「0011」が検出されると、そのフレームのフレーム画像をキャプチャーして静止画を作成し、作成された静止画にそのフレーム内の字幕が抽出されてレンダリング(画像生成)されて合成される。
図6(a)に、パッケージ放送番組における字幕付き静止画コンテンツの作成の様子を模式的に示す。パッケージ字幕放送番組のフレーム画像41は、ベース映像となるフレーム画像43と字幕データ44を含み、さらにVBI42内に制御フラグ「0011」が挿入されている。字幕付き静止画コンテンツ作成装置30は、制御フラグ「0011」を検出すると、キャプチャー機能31により当該フレーム画像41をキャプチャーするとともに、当該フレームに含まれる字幕データ44を抽出し、文字レンダリング機能32により文字レンダリングを行う。そして、キャプチャーした静止画とレンダリングした文字とを合成して字幕付き静止画コンテンツ45を作成する。
一方、リアルタイム字幕放送番組の場合は、TV映像の生放送中に、リアルタイムで字幕を生成し、TV映像に挿入して放送するため、字幕はTV映像の放送に対して時間的に遅れて表示されることになる。以下、リアルタイム字幕放送における字幕送出の遅延について簡単に説明する。ニュースなどの生のテレビ番組で聴覚障害者向けサービスとして字幕を放送することが増えている。このリアルタイム(生)字幕放送では、時として映像に対して字幕が数秒〜数十秒遅れて放送されることがあり、この遅延が大きいと視聴者が違和感を覚えることがある。
アナログ放送では、映像の垂直帰線消去期間(VBI)に字幕データを映像に合わせて重畳している。パッケージ字幕放送番組ではあらかじめ字幕を制作しておき、映像と完全に合ったタイミングで字幕データをページ単位で送出できるが、リアルタイム字幕番組では、図6(b)に示すように字幕の重畳タイミングがリアルタイムでなく、若干遅れたタイミングで行われる。これは、放送局の字幕入力者が、放送される映像を見ながら字幕文をキー入力し、漢字変換、誤変換訂正などを行ったのちに始めて字幕データを重畳するため、字幕データの送出が映像より遅れるのである。なお、図6(b)において、字幕の入力開始タイミングと、対応する字幕データが重畳されるタイミングとのずれ、即ち字幕送出の遅延時間がΔtで示されている。
よって、例えばニュース番組の場合、アナウンサーがニュース記事を読んだときに、その内容を音声認識などにより取得して字幕を生成し、これをTV映像に付加するので、実際にはそのニュース項目に対応する映像及びアナウンサーの音声が終了し、次のニュース項目に移った頃に字幕が挿入されるということもある。なお、リアルタイム字幕の生成方法としては、アナウンサーの発声に基づいて音声認識を用いる音声認識方式や、放送音声を入力オペレータがキー入力することにより字幕を生成するキーボード方式などが知られている。
このため、リアルタイム字幕放送番組の字幕付き映像信号中では、映像(フレーム画像)の内容と字幕とが時間的に一致していない。即ち、ある映像に対応する字幕は、当該映像から時間的に数フレームから数百フレーム程度遅れたフレーム画像の信号中に含まれていることになる。よって、リアルタイム字幕放送番組から字幕付き静止画コンテンツを作成する場合には、静止画のキャプチャータイミングと、字幕の抽出タイミングとを異ならせる必要がある。
そこで、リアルタイム字幕放送番組の字幕付き映像信号には、制御タイプCb及びCcの2つの制御タイプが使用される。制御タイプCbの制御フラグ「0001」はベース映像のキャプチャー指示であり、制御タイプCcの制御フラグ「0010」は字幕データの保存及び字幕の文字レンダリングの指示である。通常、リアルタイム字幕放送番組の字幕付き映像信号中では、ベース映像のキャプチャー指示に対応する制御フラグ「0001」が登場し、その数フレーム後に文字データの保存及びレンダリングに対応する制御フラグ「0010」が登場することになる。
なお、遅延して送出されるリアルタイム字幕に映像・音声情報を合致させる手段としては、上述の制御ビットを使用する方法のほかに、字幕入力を開始したタイミングを受信機に通知するための透明字幕頁を送出する方法も可能である。
図7に、リアルタイム字幕放送番組における字幕付き静止画コンテンツの作成の様子を模式的に示す。リアルタイム字幕放送番組のフレーム画像51は、ベース映像となるフレーム画像53を含み、さらにVBI52内に制御フラグ「0001」が挿入されている。但し、前述のようにリアルタイム字幕放送では、ある映像(フレーム画像)に対して、それに対応する字幕は数フレーム遅れたフレームに含まれている。図7の例では、フレームNのVBI52には制御フラグ「0001」が含まれているが字幕データは含まれておらず、そこからmフレーム後のフレーム(N+m)のVBI52に字幕データ54及び制御フラグ「0010」が含まれている。
字幕付き静止画コンテンツ作成装置30は、まずフレームNの制御フラグ「0001」を検出すると、その制御内容(図5参照)に従い、キャプチャー機能31により当該フレーム画像53をキャプチャーする。次に、フレーム(N+m)の制御フラグ「0010」を検出すると、当該フレームに含まれる字幕データ54を抽出し、文字レンダリング機能32により文字レンダリングを行う。そして、キャプチャーした静止画57とレンダリングにより得た文字画像58とを合成して字幕付き静止画コンテンツ55を作成する。
このように、本発明では、パッケージ字幕放送番組とリアルタイム字幕放送番組に対して、異なる制御信号を設定することにより、いずれの字幕放送番組からも字幕付き静止画コンテンツを作成することが可能である。特に、リアルタイム字幕放送番組をTV受信機などで視聴しているときには、字幕は対応する映像に対して遅れて表示されることになるので、その遅れが大きいときには内容を理解しにくい場合もある。この点、本発明により作成された字幕付き静止画コンテンツでは、その遅れが補正されて映像と字幕の整合がとられ、字幕は対応する映像上に表示されるので、内容を容易に理解することが可能となる。
また、図5に示す制御フラグとしては、上記の他にベース映像のキャプチャーを行わないことを示すキャプチャー無し指示(制御タイプCa)も用意されている。制御タイプCaは4ビットのフラグを全て立てない場合に用い、制作装置の初期設定も制御タイプCaである。また、番組毎のサービスの体裁を整えるため、必要に応じて制御タイプCe〜Cgを設定している。具体的には、番組の本編タイトル部分(番組開始部分)及び番組終了部分に対応するフレームを透明字幕ページ(表示する文字の表示色と背景色をラスター色と同じにして目に見えないようにしたページ)とし、制御タイプCeを設定する。これにより、番組の開始時及び終了時のフレーム画像にもともと字幕が挿入されていない場合でも、それらのフレーム画像を静止画としてキャプチャーすることができる。これにより、ある番組の字幕付き静止画コンテンツファイルのフロントページ及び終了ページの静止画を作成することができる。また、同様に、サブタイトルやドラマなどの「第2話」などの表示を含むフレーム画像に字幕が含まれていない場合でも、それらのフレーム画像をキャプチャーするために、透明字幕ページとして制御タイプCfが設定される。
(放送局内システム)
次に、図1に示す放送局内のシステムについて詳しく説明する。図8は、放送局10内のシステム構成を示すブロック図である。放送局10は、字幕放送送出システム20と、字幕付き静止画コンテンツ作成装置30と、キャプチャーフラグ消去部70と、TV送信機71とを備える。
字幕放送送出システム20は、前述の制御フラグを含む字幕付き映像信号S1を生成し、字幕付き静止画コンテンツ作成装置30及び制御フラグ消去部70へ供給する。字幕付き静止画コンテンツ作成装置30は、先に概略的に説明したように、字幕付き映像信号から字幕付き静止画コンテンツを作成する。
制御フラグ消去部70は、字幕放送送出システム20が作成した字幕付き映像信号から、前述の制御フラグを消去する。制御フラグは、字幕付き静止画コンテンツ作成装置30が字幕付き静止画コンテンツを作成する際に必要となるが、放送局10から視聴者宅へ放送する際には、ユーザ側における悪用やユーザ側システムにおける誤動作などを防止する観点から消去することが好ましい。そこで、制御フラグ消去部70は字幕付き映像信号から前述の制御フラグを消去し、TV送信機71は制御フラグを含まない通常の字幕放送用映像信号を放送する。
(字幕放送送出システム)
次に、字幕放送送出システムについて説明する。図示のように、字幕放送送出システム20は、リアルタイム字幕放送番組とパッケージ字幕放送番組の字幕付き映像信号を生成する。リアルタイム字幕放送番組については、リアルタイム字幕システム61は映像信号S11をリアルタイム字幕OA−TAKEシステム62に供給するとともに、字幕信号S21を映像フレームキャプチャーフラグ設定部67へ供給する。
映像フレームキャプチャーフラグ設定部67は、映像信号中の字幕を付すべきフレーム画像に制御タイプCbの制御フラグ「0001」を設定し、その字幕信号S22を出力する。なお、制御フラグ「0001」の設定は、リアルタイム字幕が音声認識方式である場合などには、話者(アナウンサー又はリスピーカ)の発音検知やカフキーをトリガとして設定することができる。一方、リアルタイム字幕がキーボード方式である場合には、システムで定める所定のトリガに基づいてシステムが自動的に設定することができる。
リアルタイム字幕OA−TAKEシステム62は、映像信号S12を字幕信号合成装置69へ出力するとともに、字幕信号S23を字幕データキャプチャーフラグ設定部64へ出力する。字幕データキャプチャーフラグ設定部64は、字幕信号S23中の、字幕データをキャプチャーすべきフレーム画像に制御タイプCdの制御フラグ「0010」を設定し、その字幕信号S24を出力する。なお、制御フラグ「0010」の設定は、例えばディレクターなどのテイク(TAKE)指示に応じて行うことができる。
VBIキャプチャーフラグ設定部68は、制御フラグ「0001」及び「0010」が設定された字幕信号S22及びS24を受け取り、それらの制御フラグをともにVBI中の前述の位置(図5参照)に含む字幕信号S25を字幕信号合成装置69へ出力する。字幕信号合成装置69は、上記の2つの制御フラグが設定された字幕信号S25と、映像信号S12とを合成して字幕付き映像信号S1を生成し、字幕付き静止画コンテンツ作成装置30及び制御フラグ消去部30へ供給する。こうして、リアルタイム字幕放送番組の字幕付き映像信号が生成される。
一方、パッケージ字幕放送番組の場合、パッケージ番組字幕制作機65は映像信号S13をパッケージ番組OAサーバー66に供給し、パッケージ番組OAサーバー66は映像信号S12を字幕信号合成装置69へ出力する。また、パッケージ番組字幕制作機65は、字幕を含むフレームに制御タイプCdの制御フラグ「0011」を設定し、字幕信号S24をパッケージ番組字幕サーバー67へ出力する。パッケージ番組字幕サーバー67は、その字幕信号S24をVBIキャプチャーフラグ設定部68に送る。VBIキャプチャーフラグ設定部68はその制御フラグ「0011」をVBI中の前述の位置(図5参照)に含めた字幕信号S25を字幕信号合成装置69へ送る。字幕信号合成装置69は、上記の制御フラグが設定された字幕信号S25と、映像信号S12とを合成して字幕付き映像信号S1を静止し、字幕付き静止画コンテンツ作成装置30及び制御フラグ消去部30へ供給する。こうして、パッケージ字幕放送番組の字幕付き映像信号が生成される。
(字幕付き静止画コンテンツ作成装置)
次に、字幕付き静止画コンテンツ作成装置について説明する。図9に、字幕付き静止画コンテンツ作成装置30の主要構成を示す。図9において、字幕付き映像信号受信部81は、前述の字幕放送送出システム20から字幕付き映像信号を受信し、映像信号S31をVBI抽出部82及び映像信号キャプチャー部85へ供給する。VBI抽出部82は、字幕付き映像信号S31のVBIから前述の制御フラグS32を抽出して制御タイミング発生部83へ送る。制御タイミング発生部83は、制御フラグS32に応じて映像信号フレーム画像をキャプチャーするタイミングを示すタイミング信号S35を生成して映像信号キャプチャー部85へ送る。映像信号キャプチャー部85は、タイミング信号S35に従って映像信号S31中の特定のフレーム画像をキャプチャーし、静止画信号S37として静止画/字幕合成部86へ送る。
一方、制御タイミング発生部83は、制御フラグS32に従って字幕信号から字幕データS33を抽出し、字幕文字フォント生成部84へ送る。字幕文字フォント生成部84は、字幕データS33に基づいて、字幕の文字フォントS36を生成し、静止画/字幕合成部86へ送る。
静止画/字幕合成部86は、字幕の文字フォントS36と静止画信号S37とを合成して、字幕付き静止画S38を作成し、字幕付き静止画コンテンツ蓄積部87に送る。字幕付き静止画コンテンツ蓄積部87は、複数の字幕付き静止画を時系列に配列し、字幕付き静止画コンテンツとして保存する。即ち、字幕付き静止画コンテンツは、複数の字幕付き静止画が時系列に配列されたコンテンツであり、複数の字幕付き静止画とそれらの順序を示す時間情報又は順序情報とを含む。
次に、字幕付き静止画コンテンツ作成装置の実施例について説明する。図10は、字幕付き静止画コンテンツ作成装置の実施例の構成を示す。図10において、字幕放送送出システム20から供給された字幕付き映像信号S51はトランスコーダー101へ入力される。字幕付き映像信号S51はNTSC信号(D2信号)として入力され、トランスコーダー101はそれをVBI分離部103へ出力するとともに、RGB信号(D1)に変換し、信号S56としてRGBインタフェース102へ供給する。VBI分離部103は映像信号からVBIを分離し、VBI信号S52として、VBIパケットキャプチャー部104及び映像キャプチャーフラグ検出部105へ供給する。VBIパケットキャプチャー部104は、VBI信号S52から字幕データS53を抽出し、字幕データデコード/文字レンダリング制御部110へ供給する。字幕データデコード/文字レンダリング制御部110は、字幕データS53をデコードして字幕の文字を取得し、ROMなどにより構成される字幕フォントDB111から対応する文字フォントを取得して文字レンダリングを行い、生成された文字画像S54を映像/字幕合成・圧縮部112へ送る。
一方、映像キャプチャーフラグ検出部105は、VBI信号S52から前述の制御フラグを抽出して映像キャプチャータイミング発生部106へ送る。映像キャプチャータイミング発生部106は、制御フラグの内容に基づいて映像信号中の特定のフレーム画像のキャプチャータイミング信号S55を生成し、フレーム遅延カウンター107及びフレームメモリ108へ送る。フレーム遅延カウンター107にはRGBインタフェース102から映像信号S56が送られており、映像信号S56中のキャプチャータイミング信号が示すフレーム画像を特定し、キャプチャーして静止画としてフレームメモリ108に一時的に記憶させる。なお、フレーム遅延カウンター107は必要に応じて、静止画としてキャプチャーすべきフレーム画像を数フレームの範囲内で前後のフレーム画像に変更することも可能である。フレームメモリ108に記憶された静止画は、キャプチャーされた静止画S57として映像/字幕合成・圧縮部112へ送られる。
映像/字幕合成・圧縮部112は、インターレス/フリッカ除去空間フィルタリングなどの所定の処理を行った後、字幕の文字画像S54と静止画S57を合成し、合成後の静止画をたとえばJPEG圧縮して字幕付き静止画120として出力する。こうして作成された複数の字幕付き静止画120は、メモリなどに一旦記憶され、それらの順序を示す情報が付加された状態で字幕付き静止画コンテンツとして完成する。
[他の実施形態]
上記の実施形態は、字幕付き映像信号がアナログTV映像信号である場合を示したが、字幕付き映像信号がデジタルTV映像信号である場合にも本発明を適用することができる。
図11に、デジタルTV映像信号の場合の制御フラグの設定方法について説明する。ARIB標準規格では、字幕の伝送方法として、まずページ単位の字幕データを収容した字幕データユニットをデータグループとして構成し、これをデータバイトに収容したPES(Packetized Elementary Stream)としてTS(Transport Stream)に乗せて放送すると規定している。本発明の趣旨から、制御フラグは字幕ページ単位で伝送する必要があるが、1枚の字幕ページについて少なくとも1個のPESが生成されるので、制御フラグはPES内のどこかに収容するのが適当である。
データグループからPESまでの階層構造と制御フラグの収容場所を図11に示す。図示のように、データグループ内には制御フラグの収容に適する場所が無いため、1つの方法では、PESヘッダ中の128バイトのプライベートデータ領域内に前述の4ビットの制御ビットを確保し、制御フラグを設定する。この領域は事業者が使用できるので最も好ましいと考えられる。
また、他の方法としては、ページ単位のPES、データグループ、字幕文データなどの既存データ構造の一部に新たにフィールドを追加して制御フラグを収容する方法が考えられる。但し、この場合はARIBの標準規格外となるため、関連装置の互換性を考慮することが必要となる。また、制御フラグが設定された信号は放送局内に限定して使用することとし、放送前に消去することが必要である。
さらに他の方法としては、字幕データ、字幕PESなどとは別に、制御フラグの生成機器から字幕付き静止画コンテンツ作成装置30へ独立のデータ伝送路を設け、その伝送路を使用して制御フラグを字幕付き静止画コンテンツ作成装置30へ供給することとしてもよい。この場合、そのような別個の伝送路が必要となるが、映像信号中に制御フラグを挿入しないので、放送前にそれらを消去するなどの作業は不要となる。
デジタルTV映像信号の場合、字幕放送送出システム20や字幕付き静止画コンテンツ作成装置30の構成は、字幕データの抽出や静止画のキャプチャーその他の各処理がデジタルTV映像信号に対して行われる点で構成上相違があるものの、処理自体としてはアナログTV映像信号の場合と同様の処理が実行される。
以上、日本のアナログ放送およびデジタル放送のテレテキストサービスにおける字幕データ伝送形式に基づいて制御フラグを伝送し字幕付き静止画のキャプチャリングを制御する実施例を示した。本発明の静止画コンテンツ作成方法は、世界各国の多様なテレテキスト方式においても制御フラグの伝送路を適切に選ぶことによって適用できることはいうまでもない。
たとえばアメリカ合衆国のテレテキストサービスにおけるクローズドキャプションの場合、アナログ放送ではCEA-608-B規格(Line 21 Data Services)に基づき、キャプションページを伝送するテレテキスト・レコードのレコードヘッダ内に拡張できるオプショナル・ヘッダ・エキステンションフィールドを利用し、このフィールド内でフラグを伝送することも可能である。またデジタル放送の場合はCEA-708-B規格(Digital Television (DTV) Closed Captioning)に基づき、MPEG-2ビットストリームのVIDEOユーザーズビットにより伝送されるキャプショニング・データ内で同様なフラグを伝送しキャプチャーを制御することが可能である。
[変形例]
上記の実施形態では、図1に示すように、字幕付き静止画コンテンツ作成装置30が放送局10内に設置され、放送局10内で字幕付き静止画コンテンツ42が作成される。この場合、放送局10からの放送波40においては、字幕放送送出システム20が設定した制御フラグを制御フラグ消去部70(図8)により消去されている。
これに対し、放送局10からの放送波40に含まれる字幕付き映像信号中に制御フラグを含めて放送可能な場合には、図12に示すように、字幕付き静止画コンテンツ作成装置56をユーザ環境内に設けることにより、ユーザ自身が字幕付き静止画コンテンツを作成することが可能となる。
この場合、字幕付き静止画コンテンツ作成装置56は、基本的に放送局10に設けられるものと同様とすればよい。その場合、字幕付き静止画コンテンツ作成装置は、その機能をTV番組などを録画するハードディスクレコーダやDVDレコーダなどの内部に搭載することも可能である。また、字幕付き静止画コンテンツ作成装置を専用装置として構成するのではなく、PCなどのコンピュータ上で動作可能なソフトウェア(即ち、字幕付き静止画コンテンツ作成プログラム)として構成し、ユーザ所有のPCなどにインストールして動作させるようにすることもできる。
別の変形例として、携帯電話機のテレビ受信機能を利用して字幕データ付き静止画コンテンツの生成、記録、表示を行うことも可能である。これは図12のユーザ環境50における端末装置54の中に、TV受信機52、字幕付静止画コンテンツ作成装置56、字幕付静止画コンテンツ42などがすべて含まれるような構成に相当する。
移動体向けの1セグメント地上デジタル放送は、データ放送として簡易動画、音声のほかにオプションであるが字幕も放送される。図11に関連して前に述べたデジタル放送におけるキャプチャー制御フラグの伝送がこの場合にも適用される。
携帯電話機にこの1セグメントデジタルTV放送受信機能を付加するとともに、携帯電話機に付加されるカードメモリなどのデータ蓄積機能を用い、専用のアプリケーションプログラムにより、簡易動画を字幕表示のタイミングごとに1枚の静止画として自動的にキャプチャーするとともに字幕データと組み合わせてメモリに蓄積する。1セグメント地上デジタルの字幕放送では、採用された放送規格の関係上、放送局が意図する画面内の場所に字幕が表示される通常の字幕放送と異なり、字幕の表示形式や位置はある程度メーカーの裁量にまかされ自由度がある。したがって字幕付静止画を記録する際に、静止画と字幕をスーパーした上で記録する方法も実施可能であるが、静止画データと字幕データを頁単位で1組のものとして蓄積する方が表示機能の自由度を活用できることになる。
メモリ内に蓄積された静止画と字幕データは、携帯電話が備えるインターネット表示用HTMLブラウザあるいはデータ放送表示用BMLブラウザなどを利用して表示することができる。
以上説明したように、本発明による字幕付き静止画コンテンツは、字幕放送番組を構成する静止画に、当該字幕放送中に表示される字幕が合成されたコンテンツである。前述のように、字幕放送番組中の字幕は、音声を聞かなくても番組内容を十分に理解できるように作成された質の高い情報であるため、ユーザは字幕付き静止画コンテンツを閲覧することにより、当該字幕放送番組を視聴した場合と比べても遜色ない情報を得ることができる。また、本発明による字幕付き静止画コンテンツは、聴覚障害者のみならず、一般のユーザが、例えば電車の中や公共の場所など、音声出力のあまりふさわしくない環境にて使用する場合にも優れている。
本発明は、字幕放送などの字幕付き映像信号から、字幕付きの静止画コンテンツを作成する装置及びプログラムを提供する。そのコンテンツ作成装置は、放送局内に設置される専用装置とすることができ、家庭に設置されるDVDレコーダー、HDDレコーダーなどの記録/再生装置に内蔵することもできる。また、家庭に設置されるパーソナルコンピュータにおいて実行されるプログラムとして記録メディアや通信回線を通じて提供することができる。

Claims (9)

  1. 字幕付き映像信号を受信する受信部と、
    前記字幕付き映像信号から、字幕信号及びコンテンツ作成のための制御信号を抽出する抽出部と、
    前記制御信号に基づいて、前記映像信号中の画像をキャプチャーする静止画キャプチャー部と、
    前記字幕信号に基づいて字幕画像を生成する字幕画像生成部と、
    前記字幕画像と前記静止画とを合成し、字幕付静止画コンテンツを作成する作成部と、を備えることを特徴とする字幕付き静止画コンテンツ作成装置。
  2. 前記静止画キャプチャー部は、各字幕信号に対応する前記映像信号中の静止画をキャプチャーすることを特徴とする請求の範囲第1項に記載の字幕付き静止画コンテンツ作成装置。
  3. 前記映像信号は録画された字幕放送の映像信号であり、
    前記抽出部は前記映像信号中の字幕信号を含むフレームから当該字幕信号及び前記制御信号を抽出し、
    前記静止画キャプチャー部は、当該フレームの画像をキャプチャーすることを特徴とする請求の範囲第1項に記載の字幕付き静止画コンテンツ作成装置。
  4. 前記映像信号はリアルタイム字幕放送の映像信号であり、
    前記抽出部は前記映像信号中の字幕信号を含むフレームから当該字幕信号及び前記制御信号を抽出し、
    前記静止画キャプチャー部は、当該フレームより時間的に後方に位置するフレームの画像をキャプチャーすることを特徴とする請求の範囲第1項に記載の字幕付き静止画コンテンツ作成装置。
  5. 前記映像信号はアナログテレビジョン信号であり、前記抽出部は前記アナログテレビジョン信号中の字幕信号を含むフレームの垂直帰線期間内から前記制御信号を抽出することを特徴とする請求の範囲第1項に記載の字幕付き静止画コンテンツ作成装置。
  6. 前記映像信号はデジタルテレビジョン信号であり、前記抽出部は前記デジタルテレビジョン信号中の字幕信号を含むPES中のプライベートデータ内から前記制御信号を抽出することを特徴とする請求の範囲第1項に記載の字幕付き静止画コンテンツ作成装置。
  7. コンピュータ端末により実行されることにより、前記コンピュータ端末を、
    字幕付き映像信号を受信する受信部、
    前記字幕付き映像信号から字幕信号及びコンテンツ作成のための制御信号を抽出する抽出部、
    前記制御信号に基づいて、前記映像信号中の画像をキャプチャーする静止画キャプチャー部、
    前記字幕信号に基づいて字幕画像を生成する字幕画像生成部、及び、
    前記字幕画像と前記静止画とを合成し、字幕付静止画コンテンツを作成する作成部として機能させることを特徴とする字幕付き静止画コンテンツ作成プログラム。
  8. 字幕付き映像信号生成装置と、静止画コンテンツ作成装置とを備える字幕付コンテンツ作成システムであって、
    前記字幕付き映像信号生成装置は、
    映像信号及び字幕信号を受信する受信部と、
    字幕がリアルタイム字幕であるか否かに応じて制御信号を生成する制御信号生成部と、
    前記字幕信号と前記映像信号とを合成し、前記制御信号を所定位置に挿入して字幕付き映像信号を生成する信号生成部と、を備え、
    前記静止画コンテンツ作成装置は、
    前記字幕付き映像信号を受信する受信部と、
    前記字幕付き映像信号から前記字幕信号及び前記制御信号を抽出する抽出部と、
    前記制御信号に基づいて、前記映像信号中の画像をキャプチャーする静止画キャプチャー部と、
    前記字幕信号に基づいて字幕画像を生成する字幕画像生成部と、
    前記字幕画像と前記静止画とを合成し、字幕付き静止画コンテンツを作成する作成部と、を備えることを特徴とする字幕付き静止画コンテンツ作成システム。
  9. 前記制御信号生成部は、前記字幕がリアルタイム字幕でない場合には、前記字幕信号及び前記制御信号が抽出されたフレーム画像を前記静止画キャプチャー部によりキャプチャーすべき画像に指定する制御信号を生成し、前記字幕がリアルタイム字幕である場合には、前記字幕信号及び前記制御信号が抽出されたフレーム画像より時間的に後方のフレーム画像を前記静止画キャプチャー部によりキャプチャーすべき画像に指定する制御信号を生成することを特徴とする請求の範囲第8項に記載の字幕付き静止画コンテンツ作成システム。

JP2006542249A 2004-11-02 2005-07-22 字幕付き静止画コンテンツ作成装置、字幕付き静止画コンテンツ作成プログラム及び字幕付き静止画コンテンツ作成システム Expired - Fee Related JP4616274B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2004319389 2004-11-02
JP2004319389 2004-11-02
PCT/JP2005/013503 WO2006048963A1 (ja) 2004-11-02 2005-07-22 字幕付き静止画コンテンツ作成装置、字幕付き静止画コンテンツ作成プログラム及び字幕付き静止画コンテンツ作成システム

Publications (2)

Publication Number Publication Date
JPWO2006048963A1 true JPWO2006048963A1 (ja) 2008-05-22
JP4616274B2 JP4616274B2 (ja) 2011-01-19

Family

ID=36318980

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006542249A Expired - Fee Related JP4616274B2 (ja) 2004-11-02 2005-07-22 字幕付き静止画コンテンツ作成装置、字幕付き静止画コンテンツ作成プログラム及び字幕付き静止画コンテンツ作成システム

Country Status (5)

Country Link
US (1) US20090009661A1 (ja)
EP (1) EP1809028A4 (ja)
JP (1) JP4616274B2 (ja)
KR (1) KR100965471B1 (ja)
WO (1) WO2006048963A1 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4544166B2 (ja) * 2006-01-30 2010-09-15 ダイキン工業株式会社 放送画像生成方法、放送画像生成プログラム及び放送画像生成装置
JP2007324872A (ja) * 2006-05-31 2007-12-13 Tv Asahi Data Vision Corp 字幕付き映像信号の遅延制御装置及び遅延制御プログラム
KR20080057847A (ko) * 2006-12-21 2008-06-25 삼성전자주식회사 방송수신장치 및 이의 오픈 캡션 정보 저장 방법
US9426479B2 (en) * 2007-08-09 2016-08-23 Cisco Technology, Inc. Preserving captioning through video transcoding
JP5173337B2 (ja) 2007-09-18 2013-04-03 Kddi株式会社 要約コンテンツ生成装置およびコンピュータプログラム
AU2009200990A1 (en) 2008-03-13 2009-10-01 Aristocrat Technologies Australia Pty Limited Method and system of distributing progressive gaming related information
US8249423B2 (en) * 2008-05-08 2012-08-21 Sony Ericsson Mobile Communications Ab Electronic devices and methods that insert addressable chapter marks relative to advertising content in video streams
US9077933B2 (en) 2008-05-14 2015-07-07 At&T Intellectual Property I, L.P. Methods and apparatus to generate relevance rankings for use by a program selector of a media presentation system
US9202460B2 (en) * 2008-05-14 2015-12-01 At&T Intellectual Property I, Lp Methods and apparatus to generate a speech recognition library
US9021522B2 (en) 2008-12-10 2015-04-28 Microsoft Technology Licensing, Llc Concurrent interactive television for network connected devices
US8813164B2 (en) * 2009-11-30 2014-08-19 Sony Corporation Data tunneling via closed captioning
US8532469B2 (en) 2011-06-10 2013-09-10 Morgan Fiumi Distributed digital video processing system
US8749618B2 (en) 2011-06-10 2014-06-10 Morgan Fiumi Distributed three-dimensional video conversion system
US9026446B2 (en) * 2011-06-10 2015-05-05 Morgan Fiumi System for generating captions for live video broadcasts
US9554175B2 (en) * 2011-07-20 2017-01-24 Sony Corporation Method, computer program, reception apparatus, and information providing apparatus for trigger compaction
ES2370900B1 (es) * 2011-08-12 2012-10-30 Universidad Carlos Iii De Madrid Método de difusión.
JP2012019538A (ja) * 2011-09-05 2012-01-26 Nec Casio Mobile Communications Ltd 映像記録装置及びプログラム
WO2013077060A1 (ja) * 2011-11-22 2013-05-30 日本放送協会 受信機、プログラム及び受信方法
WO2013191976A1 (en) 2012-06-19 2013-12-27 Sony Corporation Extensions to trigger parameters table for interactive television
JP6301616B2 (ja) * 2013-09-06 2018-03-28 株式会社東芝 電子機器、電子機器の制御方法、及びシーン制御プログラム
CN103634605B (zh) 2013-12-04 2017-02-15 百度在线网络技术(北京)有限公司 视频画面的处理方法及装置
US9906820B2 (en) * 2015-07-06 2018-02-27 Korea Advanced Institute Of Science And Technology Method and system for providing video content based on image
US10769731B2 (en) * 2016-01-26 2020-09-08 Facebook, Inc. Adding paid links to media captions in a social networking system
JP2018029290A (ja) * 2016-08-18 2018-02-22 株式会社東芝 動画再生装置、動画再生システム、および動画再生方法
US10750644B2 (en) 2018-01-05 2020-08-18 Quanta Computer Inc. Rear side swappable fan array module design
US11906651B2 (en) 2021-02-25 2024-02-20 Nxp B.V. Radar-based detection using sparse array processing
US11927664B2 (en) 2021-02-25 2024-03-12 Nxp B.V. Radar-based detection using angle of arrival estimation based on sparse array processing

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08322046A (ja) * 1995-03-20 1996-12-03 Sony Corp データ符号化/復号化方法および装置、および符号化データ記録媒体
JPH09244849A (ja) * 1995-12-28 1997-09-19 Internatl Business Mach Corp <Ibm> ビデオ・データ・オブジェクトのブラウジング・システム及び方法
JPH10234016A (ja) * 1997-02-21 1998-09-02 Hitachi Ltd 映像信号処理装置及びそれを備えた映像表示装置及び記録再生装置
JP2003500946A (ja) * 1999-05-20 2003-01-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 符号化された画像を送信及び受信する方法及び装置
JP2003288096A (ja) * 2002-03-27 2003-10-10 Nippon Telegr & Teleph Corp <Ntt> コンテンツ情報配信方法、コンテンツ情報配信装置、コンテンツ情報配信プログラム
US20040054964A1 (en) * 1999-03-18 2004-03-18 Xerox Corporation. Methods and systems for real-time storyboarding with a web page and graphical user interface for automatic video parsing and browsing
JP2004128872A (ja) * 2002-10-02 2004-04-22 Canon Inc 画像処理装置及びその方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5845088A (en) * 1992-11-16 1998-12-01 Multimedia Systems Corporation Method for the production and transmission of enhanced interactive multimedia information
US6473778B1 (en) * 1998-12-24 2002-10-29 At&T Corporation Generating hypermedia documents from transcriptions of television programs using parallel text alignment
US7738706B2 (en) * 2000-09-22 2010-06-15 Sri International Method and apparatus for recognition of symbols in images of three-dimensional scenes
US7031553B2 (en) * 2000-09-22 2006-04-18 Sri International Method and apparatus for recognizing text in an image sequence of scene imagery
JP2003134064A (ja) * 2001-10-26 2003-05-09 Hitachi Ltd デジタル放送補完方法およびデジタル放送受信システム
US7250983B2 (en) * 2004-08-04 2007-07-31 Trident Technologies, Inc. System and method for overlaying images from multiple video sources on a display device

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08322046A (ja) * 1995-03-20 1996-12-03 Sony Corp データ符号化/復号化方法および装置、および符号化データ記録媒体
JPH09244849A (ja) * 1995-12-28 1997-09-19 Internatl Business Mach Corp <Ibm> ビデオ・データ・オブジェクトのブラウジング・システム及び方法
JPH10234016A (ja) * 1997-02-21 1998-09-02 Hitachi Ltd 映像信号処理装置及びそれを備えた映像表示装置及び記録再生装置
US20040054964A1 (en) * 1999-03-18 2004-03-18 Xerox Corporation. Methods and systems for real-time storyboarding with a web page and graphical user interface for automatic video parsing and browsing
JP2003500946A (ja) * 1999-05-20 2003-01-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 符号化された画像を送信及び受信する方法及び装置
JP2003288096A (ja) * 2002-03-27 2003-10-10 Nippon Telegr & Teleph Corp <Ntt> コンテンツ情報配信方法、コンテンツ情報配信装置、コンテンツ情報配信プログラム
JP2004128872A (ja) * 2002-10-02 2004-04-22 Canon Inc 画像処理装置及びその方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体

Also Published As

Publication number Publication date
WO2006048963A1 (ja) 2006-05-11
KR100965471B1 (ko) 2010-06-24
US20090009661A1 (en) 2009-01-08
KR20070084471A (ko) 2007-08-24
EP1809028A1 (en) 2007-07-18
JP4616274B2 (ja) 2011-01-19
EP1809028A4 (en) 2009-10-28

Similar Documents

Publication Publication Date Title
JP4616274B2 (ja) 字幕付き静止画コンテンツ作成装置、字幕付き静止画コンテンツ作成プログラム及び字幕付き静止画コンテンツ作成システム
JP5173337B2 (ja) 要約コンテンツ生成装置およびコンピュータプログラム
CN100477757C (zh) 数字广播接收设备及其控制方法
JP4448477B2 (ja) 字幕付き映像信号の遅延制御装置及び遅延制御プログラム
US8914820B2 (en) Systems and methods for memorializing a viewers viewing experience with captured viewer images
JP3953886B2 (ja) 字幕抽出装置
EP2356654B1 (en) Method and process for text-based assistive program descriptions for television
US11812100B2 (en) Apparatus, systems and methods for accessing information based on an image presented on a display
KR20050050588A (ko) 컨텐츠 시청 지원 장치 및 컨텐츠 시청 지원 방법, 및컴퓨터·프로그램
JP2004080476A (ja) ディジタル映像再生装置
JP2007324872A (ja) 字幕付き映像信号の遅延制御装置及び遅延制御プログラム
JP2003500946A (ja) 符号化された画像を送信及び受信する方法及び装置
JP5649769B2 (ja) 放送受信装置
JP5110978B2 (ja) 送信装置、受信装置及び再生装置
JP2008098793A (ja) 受信装置
US20020154245A1 (en) Digital broadcast receiving apparatus and control method therefor
JP4664173B2 (ja) 字幕隠蔽放送に係る送信装置、再生装置、それらの方法
JP2010161544A (ja) テキスト再生装置、テキスト記録再生装置、テキスト再生方法、制御プログラム、および記録媒体
JP2002077872A (ja) データ多重放送を利用する取引方法
JP4181835B2 (ja) 情報再生装置及び情報再生方法
KR20010096362A (ko) 실시간 캡션 처리를 사용한 동영상 서비스방법 및 이를이용한 인터넷 방송시스템
KR100728929B1 (ko) 디지털 캡션을 이용한 개인적인 데이터 삽입 장치 및 그방법
JP2006033562A (ja) 擬声語受信装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070412

AA64 Notification of invalidation of claim of internal priority (with term)

Free format text: JAPANESE INTERMEDIATE CODE: A241764

Effective date: 20070626

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070705

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100803

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100907

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101005

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101021

R150 Certificate of patent or registration of utility model

Ref document number: 4616274

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131029

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131029

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131029

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees