JP6796376B2 - 分割装置および解析装置、ならびにプログラム - Google Patents

分割装置および解析装置、ならびにプログラム Download PDF

Info

Publication number
JP6796376B2
JP6796376B2 JP2015230099A JP2015230099A JP6796376B2 JP 6796376 B2 JP6796376 B2 JP 6796376B2 JP 2015230099 A JP2015230099 A JP 2015230099A JP 2015230099 A JP2015230099 A JP 2015230099A JP 6796376 B2 JP6796376 B2 JP 6796376B2
Authority
JP
Japan
Prior art keywords
information
text
fragment
text document
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015230099A
Other languages
English (en)
Other versions
JP2016110645A (ja
Inventor
馬場 秋継
秋継 馬場
悠樹 広中
悠樹 広中
藤澤 和也
和也 藤澤
謙二郎 加井
謙二郎 加井
洋一 所
洋一 所
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Publication of JP2016110645A publication Critical patent/JP2016110645A/ja
Application granted granted Critical
Publication of JP6796376B2 publication Critical patent/JP6796376B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、データを分割するための分割装置および解析装置、ならびにプログラムに関する。
テレビ放送における字幕テキストを伝送し、表示するために、タイムドテキストの技術が用いられる。タイムドテキストとは、時刻情報を伴うテキストデータを構造化したものである。字幕テキストに関しては、時刻情報として提示時刻が付加される。放送局側から、映像や音声のコンテンツと共にタイムドテキストを送信し、受信機側では、付加された提示時刻に基づいて、そのテキストを、映像や音声と共に提示する。
非特許文献1には、標準化された規格であるタイムドテキストマークアップ言語(TTML)によるデータの記述方法が記載されている。
また、非特許文献2には、非特許文献1のTTMLをベースとして、テキストに加え、画像、音声、WEBフォントによる非組込フォントの提示にも対応したタイムドテキストマークアップ言語(ARIB−TTML)によるデータの記述方法が記載されている。
さらに、非特許文献3の、例えば図9−2(p.114)には、ARIB−TTML文書ファイルを含む一連のファイルを伝送する方式の概要が記載されている。
World Wide Web Consortium(W3C,ワールド・ワイド・ウェブ・コンソーシアム),「Timed Text Markup Language 1 (TTML1) (Second Edition)」,西暦2013年(平成25年)9月24日,[平成26年11月9日検索],インターネット<URL:http://www.w3.org/TR/ttaf1-dfxp/> 「標準規格 ARIB STD−B62 1.0版 デジタル放送におけるマルチメディア符号化方式(第2世代)」,「第一編第3部第3章 字幕・文字スーパーの記述言語」,p.63−78,平成26年7月31日,一般社団法人電波産業会 「標準規格 ARIB STD−B60 1.0版 デジタル放送におけるMMTによるメディアトランスポート方式」,「第9章 字幕・文字スーパーの伝送」,p.114−121,平成26年7月31日,一般社団法人電波産業会
従来の技術では、テレビ番組等、映像コンテンツの字幕テキストは、番組全体を単位として一つのTTML文書ファイルとして構成されている。DVDやブルーレイディスクなどの記録媒体に映像コンテンツを記録して販売する場合も同様である。また、ビデオオンデマンドのサービス(要求に応じてインターネット等の通信回線を用いてコンテンツを配信するサービス)においても、ひとつのまとまった番組の全体の字幕テキストを一度に送信する形態がとられる。
しかしながら、例えば、30分ないしは数時間におよぶ映像コンテンツの字幕テキストのデータ量は膨大であり、これを短時間内に放送波にのせて伝送することは困難である。また、受信機側では、視聴者は任意のタイミングで、受信機の電源をオンにしたり、放送サービス(放送チャンネル)を切り替えたりする。このため、視聴者があるタイミングで特定の放送番組の視聴を開始したときに、そのタイミングにおいて必要な字幕テキストをすばやく伝送する必要がある。番組の全体の字幕テキストを一度に送信する形態の場合、データ量が膨大であるため、すばやく伝送する事が困難であることに加え、番組が放送中の間に、繰り返し全体の字幕テキストを送信する必要があるため、放送の伝送帯域の多くを消費してしまう。
したがって、放送局側の設備として、一番組全体の分がまとまったTTML文書ファイル(字幕テキスト等)を、適切なサイズの断片に分割したり、分割された断片を単位として放送信号に載せて送出したりすることが求められる。
また、放送時にリアルタイムで字幕テキストを送出するためには、TTML文書ファイルの分割処理の負荷を軽減することが求められる。
本発明は、上記の課題認識に基づいて行なわれたものであり、例えば放送用の一番組全体の字幕テキスト等のタイムドテキストを、断片に分割するための、分割装置および解析装置、ならびにプログラムを提供するものである。
[1]上記の課題を解決するため、本発明の一態様による解析装置は、時刻情報が付加された複数のテキスト文を含むテキスト文書データを取得する取得部と、前記時刻情報に基づいて前記テキスト文書データを、前記テキスト文を含む複数のグループに断片化するための断片化情報を生成する時刻解析部と、前記断片化された前記テキスト文のグループである断片ごとに、前記断片から参照される前記テキスト文書のヘッダ記述の情報を解析し、前記断片と前記断片から参照される前記ヘッダ記述との関係を表す参照関係情報を生成する参照関係解析部と、前記断片化情報と前記参照関係情報とを含んだ断片化テキスト文書送出情報を生成する送出情報生成部と、を具備することを特徴とする。
[2]また、本発明の一態様は、上記の解析装置において、前記断片を放送により伝送する際の、前記断片に含まれる前記テキスト文から参照される画像ファイルや音声ファイルや非組込フォントファイルのロケーション情報と、前記画像ファイルや前記音声ファイルや前記非組込フォントファイルの前記ロケーション情報が前記テキスト文書データのどの部分に記述されているかを示すロケーション情報記述位置指定情報と、前記画像ファイルや前記音声ファイルや前記非組込フォントファイルを前記断片と共に放送により伝送する際の放送信号中のリソースの取得位置を特定するための放送の名前空間による放送ロケーション情報と、を含んだ放送ロケーション変換情報を生成する変換情報解析部、をさらに具備し、前記送出情報生成部は、前記放送ロケーション変換情報をも含んだ断片化テキスト文書送出情報を生成する、ことを特徴とする。
[3]また、本発明の一態様は、上記[1]の解析装置において、前記送出情報生成部は、前記取得部によって取得された前記テキスト文書データに前記断片化情報と前記参照関係情報とを含んだ前記断片化テキスト文書送出情報を付加して、情報付加済テキスト文書データとして出力する、ことを特徴とする。
[4]また、本発明の一態様は、上記[2]の解析装置において、前記送出情報生成部は、前記取得部によって取得された前記テキスト文書データに前記断片化情報と前記参照関係情報と前記放送ロケーション変換情報とを含んだ前記断片化テキスト文書送出情報を付加して、情報付加済テキスト文書データとして出力する、ことを特徴とする。
[5]また、本発明の一態様は、上記の解析装置において、前記断片化情報に含まれる個々の断片に関する情報は、当該断片に含まれる前記テキスト文のグループを特定するための、
(1)前記断片に含まれる、前記テキスト文に付加されていた前記テキスト文を識別するIDのリスト、
(2)前記断片に含まれる前記テキスト文のうち一番時間順が早い前記テキスト文に付加されていた開始時刻の情報、
(3)前記断片に含まれる前記テキスト文のうち一番時間順が早い前記テキスト文に付加されていた開始時刻および一番時間順が遅い前記テキスト文に付加されていた終了時刻の情報、
の少なくともいずれかを含むものであり、前記参照関係情報は、前記断片の提示に必要な前記テキスト文書のヘッダ記述として、非組込フォントの情報と、埋め込み画像の情報、テキストのスタイルの情報と、テキスト提示の領域の情報との、少なくともいずれかを含むものである、ことを特徴とする。
[6]上記の課題を解決するため、本発明の一態様による分割装置は、時刻情報が付加された複数のテキスト文を含むテキスト文書データに加え、前記時刻情報に基づいて前記テキスト文書データを前記テキスト文の複数のグループに断片化するための断片化情報と、前記断片化された前記テキスト文のグループである断片ごとに、前記断片から参照される前記テキスト文書のヘッダ記述との関係を表す参照関係情報とを含んだ断片化テキスト文書送出情報を読み込み、前記断片化情報に基づいて前記テキスト文書データを前記テキスト文の複数のグループに分割するとともに、前記参照関係情報に基づいて、分割された断片である前記テキスト文のグループに、前記断片から参照される前記テキスト文書のヘッダ記述の情報を付加する分割部と、前記分割部によって分割された前記テキスト文の断片から参照されるリソースファイルを取得するリソースファイルデータ取得部と、前記分割部によって分割された前記テキスト文と、前記リソースファイルデータ取得部によって取得された前記リソースファイルとを含むデータを出力する出力部と、を具備することを特徴とする。
[7]また、本発明の一態様は、上記の分割装置において、前記分割部は、前記断片を放送により伝送する際の、前記断片に含まれる前記テキスト文から参照される画像ファイルや音声ファイルや非組込フォントファイルのロケーション情報と、前記画像ファイルや前記音声ファイルや前記非組込フォントファイルの前記ロケーション情報が前記テキスト文書データのどの部分に記述されているかを示すロケーション情報記述位置指定情報と、前記画像ファイルや前記音声ファイルや前記非組込フォントファイルを前記断片と共に放送により伝送する際の放送信号中のリソースの取得位置を特定するための放送の名前空間による放送ロケーション情報と、を含んだ放送ロケーション変換情報を更に含む、前記断片化テキスト文書送出情報を読み込み、前記放送ロケーション変換情報に基づいて、前記断片に含まれる前記画像ファイルや前記音声ファイルや前記非組込フォントファイルのロケーション情報を、放送の名前空間によるロケーション情報に書き換えて前記断片に分割する、ことを特徴とする。
[8]また、本発明の一態様は、上記の分割装置において、前記分割部は、時刻情報が付加されたテキストを含むテキスト文書データに、前記断片化テキスト文書送出情報が付加されている情報付加済テキスト文書データを読み込み、前記断片化テキスト文書送出情報に含まれる前記断片化情報に基づいて前記テキスト文書データを、テキスト文の複数のグループに分割するとともに、前記参照関係情報に基づいて分割された断片である前記テキスト文のグループに、前記断片から参照される前記テキスト文書のヘッダ記述の情報を付加し、また、前記分割部は、前記断片化テキスト文書情報に前記放送ロケーション変換情報が含まれる場合は、前記放送ロケーション変換情報に基づいて、前記断片に含まれる前記リソースファイルのロケーション情報を、放送の名前空間によるロケーション情報に書き換える、ことを特徴とする。
[9]また、本発明の一態様による分割装置は、時刻情報が付加された複数のテキスト文を含むテキスト文書データを取得する取得部と、前記時刻情報に基づいて前記テキスト文書データを、前記テキスト文を含む複数のグループに断片化するための断片化情報を生成する時刻解析部と、前記断片化された前記テキスト文のグループである断片ごとに、前記断片から参照される前記テキスト文書のヘッダ記述の情報を解析し、前記断片と前記断片から参照される前記ヘッダ記述との関係を表す参照関係情報を生成する参照関係解析部と、前記テキスト文書データに加え、前記断片化情報と前記参照関係情報とを含んだ断片化テキスト文書送出情報を読み込み、前記断片化情報に基づいて前記テキスト文書データを前記テキスト文の複数のグループに分割するとともに、前記参照関係情報に基づいて分割された断片である前記テキスト文のグループに前記断片から参照される前記テキスト文書のヘッダ記述の情報を付加する分割部と、前記分割部によって分割された前記テキスト文の断片から参照されるリソースファイルを取得するリソースファイルデータ取得部と、前記分割部によって分割された前記テキスト文と、前記リソースファイルデータ取得部によって取得されたリソースファイルとを含むデータを出力する出力部と、を具備することを特徴とする。
[10]また、本発明の一態様は、上記の分割装置において、前記出力部は、前記断片に含まれる前記テキスト文に付加された前記提示時刻情報のうち、一番早い提示開始時刻にしたがって、分割された前記テキスト文と、前記リソースファイルとを含むデータを順次出力する、ことを特徴とする。
[11]また、本発明の一態様は、上記の分割装置において、前記断片化情報に含まれる個々の断片に関する情報は、当該断片に含まれる前記テキスト文のグループを特定するための、
(1)前記断片に含まれる、前記テキスト文に付加されていた前記テキスト文を識別するIDのリスト、
(2)前記断片に含まれる前記テキスト文のうち一番時間順が早い前記テキスト文に付加されていた開始時刻の情報、
(3)前記断片に含まれる前記テキスト文のうち一番時間順が早い前記テキスト文に付加されていた開始時刻および一番時間順が遅い前記テキスト文に付加されていた終了時刻の情報、
の少なくともいずれかを含むものであり、前記参照関係情報は、前記断片の提示に必要な前記テキスト文書のヘッダ記述として、非組込フォントの情報と、埋め込み画像の情報、テキストのスタイルの情報と、テキスト提示の領域の情報との、少なくともいずれかを含むものである、ことを特徴とする。
[12]また、本発明の一態様は、上記の分割装置において、前記参照関係情報は、前記断片の提示に必要な前記テキスト文書のヘッダ記述として、非組込フォントの情報と、埋め込み画像の情報、テキストのスタイルの情報と、テキスト提示の領域の情報との、少なくともいずれかを含むものである、ことを特徴とする。
[13]また、本発明の一態様は、上記の解析装置としてコンピューターを機能させるためのプログラムである。
[14]また、本発明の一態様は、上記の分割装置としてコンピューターを機能させるためのプログラムである。
本発明によれば、時刻情報が付加されたテキスト情報を、放送等の伝送に適した形に分割して、出力することができる。
また、本発明による字幕情報が付加されたテキスト情報は、一番組全体のテキスト情報として記述、管理できるため、インターネットでのビデオオンデマンドサービスにおいて一般的に用いられる一番組全体のテキスト情報を一括して送信することにも対応でき、インターネットでの字幕テキストの提供に適した形式でも出力することができる。
本発明の第1実施形態による分割装置(送出装置)の概略機能構成を示すブロック図である。 同実施形態による分割装置が取得するテキスト文書データの構成を示す概略図である。 同実施形態による分割装置によって解析される情報を示す概略図である。 同実施形態による分割装置の処理の手順を示すフローチャートである。 本発明の第2実施形態による装置構成を示す概略ブロック図である。 同実施形態による解析装置の概略機能構成を示すブロック図である。 同実施形態による分割装置の概略機能構成を示すブロック図である。 同実施形態による解析装置の処理の手順を示すフローチャートである。 同実施形態による分割装置の処理の手順を示すフローチャートである。 第1実施形態および第2実施形態における解析結果の情報を付加したテキスト文書データの例を示す概略図(1/6)である。 第1実施形態および第2実施形態における解析結果の情報を付加したテキスト文書データの例を示す概略図(2/6)である。 第1実施形態および第2実施形態における解析結果の情報を付加したテキスト文書データの例を示す概略図(3/6)である。 第1実施形態および第2実施形態における解析結果の情報を付加したテキスト文書データの例を示す概略図(4/6)である。 第1実施形態および第2実施形態における解析結果の情報を付加したテキスト文書データの例を示す概略図(5/6)である。 第1実施形態および第2実施形態における解析結果の情報を付加したテキスト文書データの例を示す概略図(6/6)である。 第1実施形態および第2実施形態において出力される断片化テキスト文書データの例を示す概略図である。 第1実施形態および第2実施形態において出力される、パッケージ化した字幕データの構造の例を示す概略図である。
次に、図面を参照しながら、本発明の実施形態について説明する。
[第1実施形態]
図1は、第1実施形態による分割装置(送出装置)の概略機能構成を示すブロック図である。図示するように、分割装置1は、取得部11と、時刻解析部12と、変換情報解析部13と、参照関係解析部14と、分割部15と、出力部17と、リソースファイルデータ取得部18とを含んで構成される。また、図示するテキスト文書データ81と断片化字幕データ85とは、適宜、記録媒体等に記録された形態で保持される。具体的には、データ記憶手段としては、磁気ハードディスク装置や、半導体メモリ等が用いられる。
取得部11は、時刻情報が付加されたテキストを含むテキスト文書データ81を外部から取得する。テキスト文書データ81は、このテキスト文書データ81の詳細については後述する。
時刻解析部12は、テキスト文書データ81に含まれる時刻情報に基づいて、テキスト文書データ81を断片化するための断片化情報を生成する。ここで、断片化とは、時間軸にしたがって、テキスト文書データ81を、より短い適切な時間範囲を有する複数のグループに分割することである。なお、断片化によって分割された各グループは、1個または複数個のテキスト文を含む。また、時刻解析部12によって分割されたテキスト(所定の時間の範囲内のテキスト文)を、以後、断片(フラグメント)と呼ぶ場合がある。適切な時間範囲とは、例えば、テレビ放送の字幕としての伝送用に適した時間範囲である。
時刻解析部12は、生成した断片化情報を分割部15に渡す。
参照関係解析部14は、断片化されたテキスト文のグループである断片ごとに、その断片から参照されるテキスト文書のヘッダ記述の情報を解析し、その断片と、その断片から参照されるヘッダ記述との関係を表す参照関係情報を生成する。
参照関係解析部14は、生成した参照関係情報を分割部15に渡す。
なお、ヘッダ記述とは、テキスト文から参照されるテキスト文書データのヘッダ部に記述されているフォントの情報や埋め込み画像の情報やスタイル定義情報や字幕提示の領域情報などである。ヘッダ記述の詳細については後述する。
変換情報解析部13は、断片化された字幕テキストのグループに含まれるリソースファイルを参照するためのロケーション情報を解析する。そして、変換情報解析部13は、元のロケーション情報の記述を放送の名前空間によるロケーション情報へ書き換えるための、放送ロケーション変換情報を生成する。
変換情報解析部13は、生成した放送ロケーション変換情報を分割部15に渡す。
分割部15は、テキスト文書データ81と、時刻解析部12から渡される断片化情報と、参照関係解析部14から渡される参照関係情報とを取得する。そして、分割部15は、断片化情報に基づいてテキスト文書データ81を、テキスト文を含んだ複数のグループに分割するとともに、分割された断片であるテキスト文のグループに、その断片から参照されるテキスト文書のヘッダ記述の情報を付加する。
出力部17は、分割部15によって分割されたテキスト文のグループである断片と、その断片から参照されるリソースファイルのデータとを、放送等で利用される伝送フォーマットにて出力する。このとき、出力部17は、断片に含まれるテキスト文に付加された時刻情報のうち一番早い開始時間にしたがって、分割されたテキスト文のグループである断片化テキスト文書データと、関連付けられたリソースのデータを放送等で利用される伝送フォーマットにて順次出力する。なお、出力部17は、リソースファイルのデータを、リソースファイルデータ取得部18から受け取る。
リソースファイルデータ取得部18は、テキスト文書データ81から参照されている外部のリソースファイル87を取得して、上記の出力部17に渡す。
図2は、分割装置1が取得するテキスト文書データ81の概略構成を示す概略図である。同図に示すテキスト文書データ81は、テレビ放送の字幕のデータであり、TTML(Timed Text Markup Language,タイムドテキストマークアップ言語)の形式によるものである。TTMLは、例えば「標準規格 ARIB STD−B62 1.0版 デジタル放送におけるマルチメディア符号化方式(第2世代)」,「第一編第3部第3章 字幕・文字スーパーの記述言語」(p.63−78,平成26年7月31日,一般社団法人電波産業会)で規定されたARIB−TTMLにしたがう。TTML文書は、時刻情報が付加された複数のテキスト文を保持することができる。本実施形態におけるTTML文書は、テレビ放送の字幕テキストおよびそのテキストの提示時刻(presentation time)の情報を含む。TTML文書は、XML(Extensible Markup Language)文書の一種であり、時刻情報以外にも種々の情報を含んでいる。
図示するように、テキスト文書データ81は、ヘッダ部(head要素)に、埋め込みイメージ情報や、非組込フォント情報や、スタイル情報や、字幕提示の領域情報を含む。
具体的には、テキスト文書データ81は、メタデータ(metadata要素)の一部として、埋め込みイメージ情報を持っている。埋め込みイメージ情報は、smpte:image要素として保持されるものであり、バイナリー形式のイメージを適宜コード化して文字としてテキスト文書データ81内に含まれる。
また、テキスト文書データ81は、スタイリング情報(styling要素)の一部として、非組込フォント情報(arib−tt:font−face要素)を持っている。非組込フォント情報には、TTML文書とともに表示可能な非組込フォントのリソースフィルのロケーション情報等を記述する。
また、テキスト文書データ81は、スタイリング情報の一部として、スタイル情報(style要素)を持っている。このスタイル情報は、文字色や、フォントファミリーや、フォントサイズや、文字の配置(アラインメント指定)などの情報を含む。後続のbody要素内に記述される字幕本文から、ここで定義したスタイル情報を参照して利用できる。
また、テキスト文書データ81は、レイアウト情報(layout要素)の一部として、字幕提示の領域情報(region要素)を含む。この領域情報は、テキストを表示する領域(座標範囲)に関する情報である。後続のbody要素内に記述される字幕本文から、ここで定義した領域情報を参照して利用できる。
また、テキスト文書データ81は、ボディ部(body要素)に字幕本文のテキストの情報を保持する。字幕本文は、p要素や、div要素として、テキスト文書データ81内に含まれる。なお、字幕本文を保持するp要素やdiv要素は、上記のヘッダ部内の各情報(埋め込みイメージ情報、非組込フォント情報、スタイル情報、字幕提示の領域情報)を参照する。
分割装置1の入力となるテキスト文書データ81は、例えば放送番組の単位でひとまとまりのファイルである。番組の長さは、多くの場合、数分から数時間の範囲内のものである。このテキスト文書データ81は、例えば、DVDやブルーレイディスク等の記録媒体に記録されたパッケージの一部として組み込まれる場合には特段の不都合はないが、そのままでは、放送等のように逐次伝送される形態のコンテンツには向かない。
分割装置1は、そのようなテキスト文書データ81を入力し、この文書に含まれるテキスト文をより短い時間帯ごとに分割して、放送用字幕用の複数のフラグメント(断片)のTTMLファイルとして出力する。分割装置によって分割された後のフラグメントのTTMLファイルは、各時間帯のテキスト文のグループの情報(1つまたは複数のp要素やdiv要素の情報)に、それらのp要素やdiv要素から参照されるテキスト文書データ81のヘッダ部に記述されている、埋め込みイメージ情報、非組込フォント情報、スタイル情報、字幕提示の領域情報を追加したTTMLの記述方式に従った文書である。なお、分割装置1は、入力する文書ファイルの中から、分割後のファイルに必要な要素のみを適宜選択して出力する。
つまり、分割装置1の時刻解析部12は、入力されたテキスト文書データ81に含まれる各テキスト文に付加された時刻情報(提示時刻の情報)に基づいて、テキスト文のグループへの断片化を行う。そして、時刻解析部12は、入力されたデータに、時刻解析の結果の情報を付加する。時刻解析の結果とは、入力されたデータを時間軸に沿っていかに断片化するかを表す情報である。つまり、時刻解析部12によって付加される断片化情報とは、各断片の開始時刻(および必要に応じて終了時刻)を表す情報である。TTMLにおいては、字幕本文の各時間帯のテキスト文(p要素やdiv要素)に開始時刻等を表す情報が記述されているため、p要素やdiv要素の属性値として記述されているid情報を指定することで、上記の各断片の開始時刻(および必要に応じて終了時刻)を特定でき、各断片に含まれるテキスト文のid情報を、いかに断片化するかを表す断片化情報とすることもできる。複数のテキスト文をまたがった時間を指定する場合には、複数のテキスト文のid値のリストを指定することもできる。
また、参照関係解析部14は、入力されたテキスト文書データ81を分割するために、テキスト文書データ81に含まれる時間帯(時間軸で区切った断片)ごとの、テキスト文書データ81のヘッダ部のうち必要な部分の記述への参照の状況を解析する。そして、参照関係解析部14は、解析した結果である参照関係情報を、入力データに付加する。分割部15は、これらの、解析結果が付加されたデータを受け取り、それに基づいて分割されたファイルを生成する。
また、変換情報解析部13は、断片化された字幕テキストのグループに含まれるリソースファイルの参照のためのロケーション情報を解析し、元のロケーション情報の記述を放送の名前空間によるロケーション情報へ書き換えるための、放送ロケーション変換情報を生成する。
図3は、分割装置1の時刻解析部12と参照関係解析部14と変換情報解析部13とによってそれぞれ解析された結果として付加される、データを時間軸に沿っていかに断片化するかをTTML文書内に記述するためのXMLの構造を示す概略図である。この付加情報を含むデータが、分割部15に渡される。同図は、便宜上、XML形式のデータの階層構造を表として表した形である。なお、同図における横方向のインデントの位置は、階層の深さに対応している。但し、分割部15が受け取るデータ(解析結果を付加したデータ)は、XML形式に限らず、同等の他の形式のデータであっても良い。また、この例ではTTML文書に中のmetadata要素としてデータを付加する例を示したが、字幕用のTTML文書とは別に、付加情報のファイルとして別のファイルを生成し、管理するようにしても良い。図示するように、図3は、TTML文書ファイル内の階層構成のタグ情報およびパラメーターの種類と、同ファイル内に含まれる各要素の出現回数を示している。
なお、同図においては、各要素および各属性の出現回数の情報をも示している。出現回数の欄に「1」と示す属性は、共通の上位要素に属する同一レベルのものとしては1回出現する。出現回数の欄に「0..1」と示す属性は、共通の上位要素に属する同一レベルのものとしては0回ないしは1回出現する。出現回数の欄に「0..n」と示す属性は、共通の上位要素に属する同一レベルのものとしては0回ないしはn回(nは自然数)出現する。
以下、各々の要素および属性について説明する。
tt要素は、TTML文書ファイルにおける最上位の要素である。
head要素は、TTML文書ファイルにおけるヘッダ部(head要素)である。
metadata要素は、ヘッダ部の中に含まれているメタデータである。TTMLにおいては、TTML文書に関する任意の情報meadata要素下に記述することができる。
captionExchangeInformation要素は、メタデータの一部として含まれている、字幕キャプションの交換に関する情報である。
transmissionInformation要素は、captionExchangeInformationの一部として含まれている、伝送に関する情報である。
transmissionUnits要素は、放送における伝送単位である「unit」を格納するための親要素である。
unit要素は、放送で伝送される字幕データの伝送単位を示す要素である。
@xml:id属性は、unitの属性であり、字幕テキストの伝送単位の識別子を示す。この識別子により、伝送単位ごとの字幕データを番号等で管理することができる。なお、unitを識別するために、連番等を値として持つ@number要素を用いるようにしても良い。
@timecode属性は、unitの属性であり、提示時刻を示す。提示時刻は、当該伝送単位として伝送される字幕データを提示する時刻であり、例えば番組開始時点からの相対時刻で表される。提示時刻を表す形式は、例えば、「hh:mm:ss:nnn」(時−分−秒−ミリ秒)である。放送局側の送出装置(本実施形態における分割装置1)は、この提示時刻に基づき、字幕データを送出する。なお、提示時刻よりも所定時間(伝送や処理等に要するオーバーヘッド時間)前に、送出装置は、字幕データを送出する。なお、@timecode属性の値としての提示時刻には、当該伝送単位に含まれる各字幕テキストの提示開始時刻のうち、一番早い開始時間の値を用いる。これにより、放送信号を受信する受信機側での提示に間に合うように、断片化字幕データ85を送出することができる。
resource要素は、字幕データの伝送単位に含まれる各リソース(resource要素)に対応する要素である。resource要素は、そのリソースを構成するために必要な情報やデータを指し示すための情報を属性として含む。resource要素のdatatype属性(下記)に応じて、記述可能な他の属性を切り替える。具体的には、datatype=「0000」の場合と、datatype≠「0000」との場合で切り替える。
@datatype属性は、resourceの属性であり、データタイプを表す。例えば、ARIB標準規格である「デジタル放送におけるMMTによるメディアトランスポート方式」(ARIB STD-B60 1.0版,2004年7月31日策定)の第117ページには、表9−1として、伝送時のデータタイプの一覧が示されている。ここでのdatatype属性は、上記規格に準ずるものとして考えることができる。具体的には、datatypeの値が「0000」であることは、当該リソースが字幕テキストそのもの(ARIB−TTML文書ファイル)であることを示す。また、datatypeの値が「0000」以外であることは、TTML文書ファイル以外の外部リソースであることを示す。例えば、datatypeの値が「0001」であるとき、そのリソースはPNG形式の画像ファイルである。また、datatypeの値が「0010」であるとき、そのリソースはSVG形式の画像ファイルである。また、datatypeの値が「0110」であるとき、そのリソースはSVG形式のフォントファイルである。また、datatypeの値が「0111」であるとき、そのリソースはWOFF形式のフォントファイルである。
datatypeに後続する属性の種類は、@datasize属性を除き、上記のdatatypeの値に応じて異なる。datatypeの値が「0000」の場合は、後続する属性として、@font−face、@style、@region、@subtitleが用いられる。datatypeの値が「0000」以外の場合は、後続する属性として、@idref、@srcpath、@srcvalue、@replacetoが用いられる。datatypeの値が「0000」以外の場合のこれらの属性情報は、外部リソースファイルのパスの情報や、放送伝送の名前空間への書き換えに関する情報を含むものである。
図中では、datatype=「0000」の場合と、datatype≠「0000」との場合とのそれぞれに、異なるハッチングパターンを付して示している。
@datasize属性は、当該リソースのデータサイズを示すものである。この属性は、datatypeの値によらず記述することができる。
次に挙げる@image属性、@font−face属性、@style属性、@region属性、@subtitle属性は、いずれも、datatypeの値が「0000」の場合(TTML文書を表す)に記述されるものである。また、これらの@image属性、@font−face属性、@style属性、@region属性、@subtitle属性の値は、本unit要素で伝送する字幕データを伝送するため、番組単位のTTML文書を分割する際に、抽出すべき要素を指定している。つまり、分割後のTTML文書に含まれるテキスト文と、それらのテキスト文から参照するヘッダ部に記述された情報の参照関係を予め解析しておき、その解析結果(参照される要素の識別子の情報)を伝送情報(transmissionInformation)の一部として含めておく。言い換えれば、伝送単位(unit)ごとに、含まれるテキスト文の識別子と、参照先のヘッダ部内の情報の識別子の情報を保持しておくようにする。識別子はTTML文書内のimage要素、font−face要素、style要素、region要素、字幕本文のdiv要素やp要素のxml:id属性として指定された識別子を利用する。@image属性、@font−face属性、@style属性、@region属性、@subtitle属性には、それぞれ複数の識別子を記述することができ、複数の属性値を記述した場合は、複数の要素を分割後のTTML文書に含めることを意味する。なお、datatypeの値が「0000」であるresource要素は必ず1つのみ存在する。
resource要素の@subtitle属性は、TTML文書中のtt/body/div/div要素もしくはtt/body/div/p要素(これらはいずれも、字幕テキスト)における識別子を規定する。なお、tt/body/div/div要素およびtt/body/div/p要素においては、xml:id属性によってその字幕テキストの識別子を規定する。@subtitle属性に記述する情報は、番組単位の字幕テキスト文のうち、当該伝送単位(unit)にどのテキスト文を含めるかの情報であり、時刻解析部12が生成する断片化情報に該当する。
resource要素の@image属性は、TTML文書中の、tt/head/metadata/smpte:image要素(イメージ)における識別子を指定する。なお、tt/head/metadata/smpte:image要素においては、@xml:id属性によってそのイメージの識別子を規定する。
resource要素の@font−face属性は、TTML文書中のtt/head/styling/arib−tt:font−face要素(フォント)における識別子を指定する。なお、tt/head/styling/arib−tt:font−face要素においては、id属性によってそのフォントフェースの識別子を規定する。
resource要素の@style属性は、TTML文書中のtt/head/styling/style要素(様々な表示スタイルの規定)における識別子を指定する。なお、tt/head/styling/style要素においては、xml:id属性によってそのスタイルの識別子を規定する。
resource要素の@region属性は、TTML文書中のtt/head/layout/region要素(表示の領域)における識別子を規定する。なお、tt/head/layout/region要素においては、xml:id属性によってその領域の識別子を規定する。
なお、上記@image属性、@font−face属性、@style属性、@region属性に記述する情報は、参照関係解析部14が生成する各断片から参照されるテキスト文書のヘッダ記述の情報であり、それぞれ埋め込み画像の情報、非組込フォントの情報、スタイルの情報、字幕提示の領域情報などの参照関係情報に該当する。
resource要素のdatatypeの値が「0000」以外の場合は、前述のとおり、リソースがARIB−TTML文書以外であることを示し、resource要素には、当該伝送単位に含まれるが外部参照するリソースに関する情報を、リソース毎に記述する。つまり、datatypeの値が「0000」以外のresource要素が、unit要素にi個記述されている場合は、ARIB−TTML文書以外に、i個のリソースを伝送単位として送出する事を意味する。
resource要素の@idref属性は、伝送単位として一緒に送出するARIB−TTML文書において、外部リソースの参照を行っている要素を指定するものである。具体的には、@idref属性は、外部リソースを行っている要素の識別子(xml:id属性)を用いる。
resource要素の@srcpath属性(ソースパス)は、上記のidref属性で指定した要素を起点とした、リソースファイルのロケーションを指定する属性へのパスをxpath(http://www.w3.org/TR/xpath/)により指定するものである。
resource要素の@srcvalue属性(ソースバリュー)は、上記のsrcpath属性で示した属性の値(リソースファイルのロケーション情報)である。
resource要素の@replaceto属性(リプレース・トゥ)は、当該リソースを放送で伝送した場合に、受信機が当該リソースを放送信号中から取得できるようにするため、放送の名前空間によるリソースのロケーションを指定するものである。つまり、replaceto属性は、放送として伝送されるときには、ファイルの元の名(srcvalue属性で指定される値)を、このreplaceto属性で指定される名に置き換えることを指定するものである。
resource要素の@idref属性、@srcpath属性、@srcvalue属性、@replaceto属性の一連の属性によって、unit属性で指定した字幕の伝送単位において、ARIB−TTML文書から参照するリソースファイルの存在と、リソースファイルのロケーション情報を置き換えに必要な情報を指定することができる。つまり、これらの情報は、変換情報解析部13が生成する、放送ロケーション変換情報に該当する。
なお、上記の、resource要素の@srcvalue属性は、断片に含まれるテキスト文から参照されるリソースファイル(画像ファイルや音声ファイルや非組込フォントファイル等)のロケーション情報である。
また、上記の、resource要素の@srcpath属性は、前記リソースファイル(画像ファイルや音声ファイルや非組込フォントファイル等)のロケーション情報がテキスト文書データのどの部分に記述されているかを示すロケーション情報記述位置指定情報である。
また、上記の、resource要素の@replaceto属性は、前記リソースファイル(画像ファイルや音声ファイルや非組込フォントファイル等を断片と共に放送により伝送する際の放送信号中のリソースの取得位置を特定するための放送の名前空間による放送ロケーション情報である。
ここで述べたロケーション情報と、ロケーション情報記述位置指定情報と、放送の名前空間による放送ロケーション情報とを含むものが、放送ロケーション変換情報である。
次に、本実施形態における処理手順について説明する。
図4は、分割装置1による処理の手順を示すフローチャートである。
同図に示すように、まずステップS11において、取得部11は、テキスト文書データ81を取得し、取得したテキスト文書データ81に含まれる各要素にID(識別子)を付与済みであるか否かを判断する。この判断は、テキスト文書データ81の各要素に関してIDが付与済みである場合には、それらの付与済みのIDを利用することによって、再付与の処理をスキップするためのものである。そして、IDが付与済みである場合(ステップS11:YES)には、ステップS13に飛ぶ。また、IDが付与されていない場合(ステップS11:NO)には、次のステップS12に進む。
次にステップS12に進んだ場合、取得部11は、テキスト文書データ81に含まれている各要素の適宜IDを付与する。なお、ここで付与するIDは、要素を識別できるものであれば充分である。具体的に、本ステップにおいてIDが付与される要素は、TTML文書データにおける、次の6種類の要素である。即ち;
− tt/head/metadata/smpte:image
− tt/head/styling/arib−tt/font−face
− tt/head/styling/style
− tt/head/layout/region
− tt/head/div/div
− tt/head/div/p
ここで、要素の種類を容易に区別できるようなIDの付与のしかたをしても良い。例えば、次の通りである。
tt/head/metadata/smpte:imageの要素に対しては、「SMPTE」で始まるIDを付与する。一例としては、「SMPTE_logo16」などといったIDを付与する。
tt/head/styling/arib−tt/font−faceの要素に対しては、「f」で始まり、その後に連続番号を伴うIDを付与する。一例としては、「f01」、「f02」、・・・などといったIDを付与する。
tt/head/styling/styleの要素やtt/head/layout/regionの要素に対しては、「s」で始まり、その後に連続番号を伴うIDを付与する。一例としては、「s1」、「s2」、・・・などといったIDを付与する。
tt/head/div/divやtt/head/div/pの要素に対しては、「c」で始まり、その後に連続番号を伴うIDを付与する。一例としては、「c001」、「c002」、・・・などといったIDを付与する。
このように各要素にIDを付与することにより、以後の処理において、そのIDによってそれぞれの要素を参照することができる。
次にステップS13において、時刻解析部12は、テキスト文書データ81に含まれる全ての字幕文テキストに付与されている提示時刻の解析を行い、そして各々が字幕文テキストを有する複数のグループに断片化する断片化情報を生成する。時刻解析部12による断片化の方法は、任意である。通常は、放送番組において特定の字幕テキストが表示されている時間(提示開始時刻から提示終了時刻まで)は、数秒から、せいぜい十数秒の範囲内に収まることが多い。また、番組の途中から視聴を開始する視聴者がいることを考慮すると、1つの伝送単位があまり長い時間(例えば10秒、あるいはそれ以上)に渡ることは好ましくない。一例として、時刻解析部12は、所定の時間(数秒程度)を超えるごとに伝送単位を区切る。また、他の例として、時刻解析部12は、字幕テキストに対応する1つのdiv要素あるいはp要素ごとに、伝送単位を区切る。その他、伝送容量を考慮して、時刻解析部12による伝送単位の区切り方を決めても良い。伝送単位の区切り方の詳細は、一種の設計事項である。
いずれの方法を取るにせよ、時刻解析部12は、断片化した結果の時刻の区切りに含まれる字幕テキスト文(tt/head/div/div要素やtt/head/div/p要素)のIDのリストの情報である断片化情報を生成して、参照関係解析部14および分割部15に渡す。
次にステップS14において、参照関係解析部14は、断片化情報をもとに断片化された字幕テキストのグループからの、テキスト文書データ81のヘッダ部に記述された情報への参照関係を解析し、参照関係情報を生成する。ここで、参照関係の解析の対象となるヘッダ部内の情報は、次の通りである。即ち、スタイル(style要素)や、字幕提示の領域(region要素)や、埋め込みイメージ(smpte:image要素)や、非組込フォント(arib−t:font−face要素)などである。
そして、参照関係解析部14は、断片化情報に参照関係に関する情報を付加して、変換情報解析部13および分割部15に渡す。
次にステップS15において、変換情報解析部13は、断片化された字幕テキストのグループに含まれるリソースファイルの参照のためのロケーション情報を解析し、放送ロケーション変換情報を生成し分割部15に渡す。なお、変換情報解析部13が生成する放送ロケーション変換情報は、具体的には、resource要素における@srcpath属性と、@srcvalue属性と、@replaceto属性の、それぞれの値である。なお、放送ロケーション変換情報に含まれるこれらの属性については、図3を参照しながら説明した通りである。
なお、時刻解析部12、参照関係解析部14、変換情報解析部13による解析結果の情報生成(付加)の一例は、後で、図10,図11,図12,図13,図14,図15を参照しながら説明する。
次にステップS16において、分割部15は、ステップS13において生成した断片化の情報とステップS14において生成した参照関係の情報と、ステップS15において生成した放送ロケーション情報への変換に関する情報に基づいて、入力されたテキスト文書データ81を分割し、断片化された複数のテキスト文書データを生成する。
次にステップS17において、出力部17は、分割部15によって生成された断片化テキスト文書データが、外部イメージファイル、外部オーディオファイル、外部非組込フォントファイルなどを参照する場合は、断片化テキスト文書データと、リソースファイルデータ取得部18によって取得した外部のリソースファイル87を結合し、放送等で提供するフォーマットにしたがいパッケージ化した断片化字幕データ85を生成する。この断片化字幕データ85は、断片化によって区切られた時間帯の字幕テキストデータと、参照リソースファイルのデータとを含む。
そして、出力部17は、複数の断片化字幕データ85のそれぞれを、各断片に含まれる字幕テキストのうち一番早い提示開始時刻に合わせて(受信機側での提示に間に合うようなタイミングで)、出力(送出)する。
なお、分割部15によるファイル分割、および出力部17によるデータの送出の詳細な処理手順は、第2実施形態において説明する図9の手順と同様のものとしても良い。
以上で、本フローチャート全体の処理を終了する。
[第2実施形態]
次に、第2実施形態について説明する。なお、上述した実施形態と共通の事項については記載を省略し、本実施形態に特有の事項を中心に以下の説明を行う。
図5は、本実施形態による装置構成を示す概略ブロック図である。図示するように、本実施形態によるテキスト(字幕等)の分割・送出システムは、テキスト文書データ81と、解析装置5と、情報付加済テキスト文書データ83と、分割装置2(送出装置)と、断片化字幕データ85とを含んで構成される。なお、テキスト文書データ81と、情報付加済テキスト文書データ83と、断片化字幕データ85とは、適宜、記録媒体等に記録された形態で保持される。具体的には、データ記憶手段としては、磁気ハードディスク装置や、半導体メモリ等が用いられる。
同図に示す解析装置5は、テキスト文書データ81を読み込み、断片化のための解析を行い、解析結果を付加して、情報付加済テキスト文書データ83を出力する。解析装置5が行う解析には、断片化するための提示時刻の解析と、断片化した結果のテキスト文からのテキスト文書データ81のヘッダ部の情報への参照の解析と、断片化した結果のテキスト文がリソースファイルを参照する場合の、リソースファイルのロケーション情報の解析の結果を含む。
また、分割装置2は、上記の情報付加済テキスト文書データ83を読み込み、各断片の字幕テキストに対応した複数の断片化テキスト文書データを生成し、生成された断片化テキスト文書データが、外部イメージファイル、外部オーディオファイル、外部非組込フォントファイルなどを参照する場合は、断片化テキスト文書データと、リソースファイルデータ取得部によって取得した外部ファイルデータを結合し、放送等で提供するフォーマットにしたがいパッケージ化した断片化字幕データ85を生成する。断片化字幕データ85は、入力された字幕テキストを、所定の提示時刻の範囲で区切って独立のまとまった単位のファイルとして構成されるものである。
図6は、本実施形態による解析装置5の概略機能構成を示すブロック図である。図示するように、解析装置5は、取得部31と、時刻解析部32と、変換情報解析部33と、参照関係解析部34と、付加部36(送出情報生成部)とを含んで構成される。
取得部31は、時刻情報が付加されたテキストを含むテキスト文書データ81を外部から取得する。
時刻解析部32は、テキスト文書データ81に含まれる各テキスト文に付加された時刻情報に基づいて、テキスト文書データ81を複数のテキスト文のグループに断片化するための断片化情報を生成する。なお、断片化された後の各グループは、元のテキスト文書データ81に含まれるテキスト文の時間範囲よりも、短い時間範囲のテキスト文を含むものである。
なお、時刻解析部32は、生成した断片化情報を参照関係解析部34および付加部36に渡す。
参照関係解析部34は、断片化されたテキスト文のグループである断片ごとに、その断片に含まれるテキスト文から参照されるテキスト文書データ81のヘッダ部の情報を解析し、その断片と、参照される前記ヘッダ部の情報(ヘッダ記述)との関係を表す参照関係情報を生成する。
参照関係解析部34は、断片化情報と生成した参照関係情報を変換情報解析部および付加部36に渡す。
変換情報解析部33は、断片化されたテキスト文のグループに含まれるリソースファイルの参照のためのロケーション情報を解析し、元のロケーション情報の記述を放送の名前空間によるロケーション情報へ書き換えるための、放送ロケーション変換情報を生成する。
変換情報解析部33は、生成した放送ロケーション変換情報を付加部36に渡す。
付加部36は、取得部31によって取得されたテキスト文書データ81に、時刻解析部32から渡された断片化情報と参照関係解析部34から渡された参照関係情報と変換解析部33から渡された放送ロケーション変換情報を付加して、情報付加済テキスト文書データ83として出力する。
図7は、本実施形態による分割装置2の概略機能構成を示すブロック図である。図示するように、分割装置2は、分割部35と、出力部37と、リソースファイルデータ取得部38とを含んで構成される。
分割部35は、情報付加済テキスト文書データ83を読み込み、情報付加済テキスト文書データ83に含まれる断片化情報に基づいて情報付加済テキスト文書データ83に含まれるテキスト文書を分割し断片化テキストデータを生成する。
なお、分割部35が読み込む情報付加済テキスト文書データ83は、前述の通り、時刻情報が付加された複数のテキスト文を含むテキスト文書データ81に、時刻情報に基づいてテキスト文の複数のグループに断片化するための断片化情報を付加し、さらに断片化されたテキスト文の各グループごとに、その断片から参照されるテキスト文書データ81のヘッダ部の情報との関係を表す参照関係情報を付加し、さらに断片化されたテキスト文の各グループがリソースファイルを参照する場合に、リソースァイルの参照のためのロケーション情報を元のロケーション情報の記述から放送の名前空間によるロケーション情報へ書き換えるための放送ロケーション変換情報を付加してなるものである。
出力部37は、分割部35によって分割されたテキストに加え、分割されたテキスト文書が、外部イメージファイル、外部オーディオファイル、外部非組込フォントファイルなどを参照する場合は、分割されたテキストと、リソースファイルデータ取得部によって取得した外部リソースファイルデータを結合し、放送等で提供するフォーマットにしたがいパッケージ化した断片化字幕データ85を生成し出力する。断片化字幕データ85は、入力された字幕テキストを、所定の提示時刻の範囲で区切って独立のまとまった単位のファイルとして構成されるものである。このとき、出力部37は、各断片に含まれる字幕テキストのうち一番早い提示時刻情報に合わせて、分割されたテキスト含む断片化字幕データを順次出力する。
リソースファイルデータ取得部38は、情報付加済テキスト文書データ83から参照されているリソースファイル87を取得し、上記の出力部37に渡す。
次に、本実施形態における処理手順について説明する。
図8は、解析装置5による処理の手順を示すフローチャートである。
同図に示すように、まずステップS31において、取得部31は、テキスト文書データ81を取得し、取得したテキスト文書データ81に含まれる各要素にID(識別子)を付与済みであるか否かを判断する。この判断は、テキスト文書データ81の各要素に関してIDが付与済みである場合には、それらの付与済みのIDを利用することによって、再付与の処理をスキップするためのものである。そして、IDが付与済みである場合(ステップS31:YES)には、ステップS33に飛ぶ。また、IDが付与されていない場合(ステップS31:NO)には、次のステップS32に進む。
次にステップS32に進んだ場合、取得部31は、テキスト文書データ81に含まれている各要素の適宜IDを付与する。なお、本ステップにおける処理は、第1実施形態でのステップS12における処理と同様である。よって、ここでは詳細な説明を省略する。
次にステップS33において、時刻解析部32は、テキスト文書データ81に含まれる全ての字幕文テキストに付与されている提示時刻の解析を行い、そして複数の字幕文テキストのグループに断片化する断片化情報を生成する。なお、本ステップにおける処理は、第1実施形態でのステップS13における処理と同様である。よって、ここでは詳細な説明を省略する。
次にステップS34において、参照関係解析部34は、断片化情報をもとに断片化された字幕テキストのグループからの、テキスト文書データ81のヘッダ部に記述された情報への参照関係を解析し、参照関係情報を付加する。なお、本ステップにおける処理は、第1実施形態でのステップS14における処理と同様である。よって、ここでは詳細な説明を省略する。
次にステップS35において、変換情報解析部33は、断片化された字幕テキストのグループに含まれるリソースファイルの参照のためのロケーション情報を解析し、放送ロケーション変換情報を生成し、分割部に渡す。なお、本ステップにおける処理は、第1実施形態でのステップS15における処理と同様である。よって、ここでは詳細な説明を省略する。
次にステップS36において、付加部36は、テキスト文書データ81を適切に分割するために必要な情報を付加する。ここで付加部36が付加する情報は、大きく、ステップS33において生成された断片化情報と、ステップS34において生成された参照関係情報と、ステップS35において生成された放送ロケーション変換情報である。付加部36は、TTML文書データとしてのテキスト文書データ81におけるヘッダ部(head要素)の中の、メタデータ(metadata要素)の部分に上記の付加情報を格納し、情報付加済テキスト文書データ83として出力する。
なお、本実施形態においても、テキスト文書データ81におけるヘッダ部に上記の付加情報を格納することによって情報付加済テキスト文書データ83を出力する代わりに、付加情報を例えば別ファイルの形態として生成し、分割装置2に渡すようにしても良い。
次に、分割装置2の処理手順について説明する。
図9は、分割装置2による処理の手順を示すフローチャートである。
同図に示すように、まずステップS41において、分割部35は、付加情報を含むテキスト文書データである情報付加済テキスト文書データ83を読み込む。この情報付加済テキスト文書データ83はXML文書データの一種であり、分割部35は読み込んだXMLデータをパージングすることにより、DOM(ドキュメントオブジェクトモデル,Document Object Model)を作成する。これにより、分割部35は、読み込んだ情報付加済テキスト文書データ83の構成をツリー構造で把握する。
次のステップS42からS45までの処理は、ステップS41で読み込んだデータのメタデータ内に含まれる伝送単位(unit要素)ごとに繰り返す。
ステップS42において、分割部35は、ユニット(伝送単位、unit要素)内の1つ目のリソース(resource要素)を読み込み、出力要素を追加する。ここで、出力要素とは、埋め込み画像(image属性により指定)と、非組込フォントフォント(font−face属性により指定)と、スタイル(style属性により指定)と、字幕提示の領域(region属性により指定)と、字幕テキスト文(subtitle属性により指定)のための要素(p要素やdiv要素)を追加する。なお、あるユニット内の最初のリソースに関して、データタイプ(datatype属性)の値は、必ず「0000」である。
なお、ステップS42における処理の詳細は次の通りである。
分割部35は、ユニット内の1つ目のリソースを読み込み、そのリソース(resource要素)の属性ごとに、下記の(1)から(5)までの処理を行うことによって、空のTTML文書に要素を追加する。なお、空のTTML文書とは、「<tt></tt>」(tt要素の開始と終了)のみからなる文書である。なお、下の説明において、IDリストとは、単数または複数のID(識別子)を持ち得るリストの表現である。具体的な例として、IDリストが複数のIDを含む場合には、それら複数のIDを空白文字で区切って並べた文字列が、IDリストである。
(1)1つ目のresource要素のimage属性に指定されたIDリストを基に、入力側のTTML文書(情報付加済テキスト文書データ83のこと。以下においても、同様。)中のtt/head/metadata/smpte:image要素であって上記IDリストと同一のIDを持つ要素を、出力側のTTML文書(断片化テキスト文書データのこと。以下においても、同様。)中にコピーする。
(2)1つ目のresource要素のfont−face属性に指定されたIDリストを基に、入力側のTTML文書中のtt/head/styling/arib−tt:font−face要素であって同一のIDを持つ要素を、出力側のTTML文書中にコピーする。
(3)1つ目のresource要素のstyle属性に指定されたIDリストを基に、入力側のTTML文書中のtt/head/syling/style要素であって同一のIDを持つ要素を、出力側のTTML文書中にコピーする。
(4)1つ目のresource要素のregion属性に指定されたIDリストを基に、入力側のTTML文書中のtt/head/layout/region要素であって同一のIDを持つ要素を、出力側のTTML文書中にコピーする。
(5)1つ目のresource要素のsubtitle属性に指定されたIDリストを基に、入力側のTTML文書中のtt/body/div要素の下の、div要素またはp要素であって、同一のIDを持つ要素を、出力側のTTML文書中にコピーする。
次のステップS43の処理は、現在のunit要素内の2つ目以後のresource要素の各々について、繰り返して実行する。なお、2つ目以後のresource要素においては、datatype属性の値は「0000」以外である。
ステップS43において、分割部35は、unit要素内の2つ目以後のリソース要素を読み込み、下記の(1)、(2)の処理を行う。
(1)出力側の文書中のidref要素で指定されたIDを持つ要素を起点に、srcpath要素に記述されているxpathによって指定された要素または属性の値を、replaceto要素で指定さえた値に置き換える。
(2)srcvalue属性で指定された外部リソースファイルを、放送伝送用のデータ形式に変換する。なお、具体的な変換方法は、伝送方式によって異なる。例えばTS(トランスポートストリーム)方式の場合には、カルーセル伝送用のデータに変換する。また、MMT(MPEGメディアトランスポート)方式の場合には、MMTのMFU(メディアフラグメントユニット)に変換する。
当該unit要素内のすべてのresource要素についてのステップS43の処理が終了すると、次のステップS44の処理に移る。
ステップS44において、出力部37は、伝送単位に応じて生成されたTTML文書(断片化テキスト文書データの1つ)を、放送として送出伝送するためのデータ形式に変換する。なお、具体的な変換方法は、伝送方式によって異なる。例えばTS(トランスポートストリーム)方式の場合には、カルーセル伝送用のデータに変換する。また、MMT(MPEGメディアトランスポート)方式の場合には、MMTのMFU(メディアフラグメントユニット)に変換する。
次にステップS45において、出力部37は、生成されたTTML文書(断片化テキスト文書データの1つ)とリソースファイル用のデータを、放送として送出伝送するためのデータ形式にパッケージ化し、timecode要素(タイムコード)で指定された提示時刻での受信機側での提示に間に合うように、放送に多重するようにして送出する。具体的には、出力部37は、指定された提示時刻と、伝送に要する時間と、送出装置側および受信機側のそれぞれの側での処理のオーバーヘッドとして必要な時間とに基づいて、間に合うようにデータの送出を行う。例えば、MMT方式により伝送する場合は、MFU(メディアフラグメントユニット)をMPU(メディアプロセッシングユニット)にパッケージ化して送出する。なお、パッケージ化した字幕データの構造の例については、後で、図17を参照しながら説明する。
すべての伝送ユニット(unit要素)に関して、以上のS41からS45までの処理が終了すると、分割装置2は、このフローチャート全体の処理を終了する。
次に、実際のデータ例について説明する。図10、図11、図12、図13、図14、図15は、図5において示した情報付加済テキスト文書データ83の一例を示す概略図である。
この図10、図11、図12、図13、図14、図15を順に連結したデータが、1件の情報付加済テキスト文書データ83に当たる。なお、情報付加済テキスト文書データ83は、一種のXMLデータである。これらの図の中において、便宜上、ファイル内の行番号を示している。これらの行番号自体は、ファイル内に含まれているものではない。以下では、これらの図および行番号を参照しながら、情報付加済テキスト文書データ83の例について説明する。
なお、第1実施形態では分割装置1の分割部15が、情報付加済テキスト文書データ83と同等のデータを受け取る。ここで、情報付加済テキスト文書データ83と同等のデータとは、テキスト文書データをどう分割するかを表す情報と、分割後のテキスト文書データからテキスト文書データのヘッダ部に記述された情報を参照するための参照関係を示す情報と、分割後のテキスト文書がリソースファイルを参照する場合にリソースファイルのロケーション情報を放送の名前空間に対応するようにテキスト文章データ中のロケーション情報をどう書き換えるかを表す情報であり、分割装置1の内部的な情報の形式は任意である。
また、第2実施形態では分割装置2の分割部35が、解析装置5から渡される情報付加済テキスト文書データ83を読み込む。
第2行目から第105行目までは、tt要素である。
第10行目から第85行目までは、ヘッダ部(head要素)である。
第86行目から第104行目までは、ボディ部(body要素)である。
ヘッダ部内において、第12行目から第48行目までは、メタデータ(metadata要素)である。このメタデータは、字幕交換情報(captionExchangeInformation要素)と、埋め込みイメージ(smpte:image要素)とを含む。
第13行目から第42行目までがキャプション交換情報である。
キャプション交換情報は、伝送情報(transmissionInformation要素)を含む。
第14行目から第41行目までが伝送情報である。
また、第45行目から第47行目までが、埋め込みイメージである。
伝送情報は、複数の伝送単位のまとまり(transmissionUnits要素)を含んでいる。第15行目から第40行目までがtransmissionUnits要素である。
このtransmissionUnits要素は、個々に番号付けされた複数の伝送単位(unit要素)を有している。
個々の伝送単位(unit要素)は、時刻解析部(12または32)によって解析された結果として断片化された、断片に対応している。個々の伝送単位は、提示時刻(timecode属性)を有している。提示時刻は、番組開始時点をゼロとする相対時刻であり、「hh:mm:ss.nnn」(時−分−秒−ミリ秒)の形式の文字列として表現される。なお、@timecode属性の提示時刻は当該伝送単位に含まれる字幕テキストの提示開始時刻のうち、一番早い開始時間の値である。
本例においては、6個の伝送単位(unit要素)が存在し、それらのそれぞれがxml:id属性として「1」から「6」までの値をもっている。xml:id属性が「1」である伝送単位は、第16行目から第19行目までである。xml:id属性が「2」である伝送単位は、第20行目から第24行目までである。xml:id属性が「3」である伝送単位は、第25行目から第28行目までである。xml:id属性が「4」である伝送単位は、第28行目から第32行目までである。xml:id属性が「5」である伝送単位は、第34行目から第36行目までである。xml:id属性が「6」である伝送単位は、第37行目から第39行目までである。
各伝送単位の情報は、その伝送単位に含まれる字幕テキストの断片と、参照されるリソースとの関係を含んでいる。なお、字幕テキストの断片そのものもリソースの一種である。参照関係解析部(14または34)によって解析された結果、各伝送単位において必要とされるリソースの参照関係情報のみが、unit要素の中に含まれる。これにより、後で実際に断片化ファイルを生成する際に、余分な情報を参照したり解析したりする必要がなく、直接必要な情報のみを取り出しやすい。
xml:id属性が「1」である伝送単位は、2つのリソース(resource要素)を含んでいる。
その第1のリソースのデータタイプ(datatype属性)は「0000」であり、これは字幕テキストそのものに対応している。このリソースは、非組込フォント(font−face属性)、スタイル(style属性)、字幕提示の領域(region属性)、字幕テキスト文(subtitle属性)を有している。各属性の値は、参照のためのIDである。なお、subtitle属性の値は「C001」である。なお、このリソース(resource要素)において、font−face属性や、style属性や、region属性が、参照関係情報の例である。また、このリソースにおいて、subtitle属性が、断片化情報の例であり、「C001」という値によってテキスト文の断片(グループ)を参照している。これらの参照関係情報や断片化情報は、以下のリソース(データタイプが「0000」)においても同様である。
また、第2のリソースのデータタイプは「0110」であり、これはリソースがフォントであることを表す。このリソースは、idref属性を有し、その値は「f05」である。これは、参照のために用いられるIDである。また、srcpath属性は、リソースファイルのロケーション記述へのパス(idref属性を有する要素を起点としたリソースファイルのロケーション情報の記述へのXPATH情報)を示す。また、srcvalue属性は、リソースファイルのロケーション情報を指定するものである。また、replaeto属性は、放送として送出される際の放送の名前空間によるロケーション情報の値を示す。なお、このリソース(resource要素)において、srcpath属性や、srcvalue属性や、replaceto属性が、放送ロケーション変換情報の例である。放送ロケーション変換情報については、以下のリソース(データタイプが「0000」ではない)においても同様である。
xml:id属性が「2」である伝送単位は、3つのリソース(resource要素)を含んでいる。
第1のリソースのデータタイプ(datatype属性)は「0000」であり、字幕テキストそのものを示す。このリソースにおけるfonto−face属性は、「f03」および「f04」という2つのIDを示すものであり、これら両者を空白で連結したものを属性値としている。なお、subtitle属性の値は「C002」である。
第2および第3のリソースのデータタイプは「0110」であり、これはフォントに対応する。フォントであるリソースの属性については、既に述べたとおりである。
xml:id属性が「3」である伝送単位は、2つのリソース(resource要素)を含んでいる。
第1のリソースのデータタイプ(datatype属性)は「0000」であり、字幕テキストそのものを示す。なお、subtitle属性の値は「C003」である。
第2のリソースのデータタイプは「0001」であり、これは画像に対応する。このリソースは、外部の画像に対応する。
xml:id属性が「4」である伝送単位は、3つのリソース(resource要素)を含んでいる。
第1のリソースのデータタイプ(datatype属性)は「0000」であり、字幕テキストそのものを示す。なお、subtitle属性の値は「C004」および「C005」(両者を空白で連結)である。
第2および第3のリソースおデータタイプは「0001」であり、これは画像に対応する。これらのリソースは、それぞれ、外部の画像に対応する。
xml:id属性が「5」である伝送単位は、1つのリソース(resource要素)を含んでいる。そのリソースのデータタイプの値は「0000」である。また、このリソースは、埋め込み画像に関する情報を含むものであり、image属性として「SMPTE_logo16」という値を有する。この「SMPTE_logo16」は、埋め込み画像を参照するためのIDである。なお、このリソースのsubtitle属性の値は、「C006」である。
xml:id属性が「6」である伝送単位は、1つのリソース(resource要素)を含んでいる。
第1のリソースのデータタイプの値は「0000」である。このリソースのsubtitle属性の値は、「C007」である。
第45行目から第47行目までは、埋め込み画像(smpte:image要素)である。xml:id属性はこの埋め込み画像のIDを示すものであり、その値は「SMPTE_logo16」である。imageType属性は、画像ファイルの形式を表しており、その値は「PNG」である。また、encoding属性は、バイナリーデータを文字データとして表現する際の符号化の方式を表しており、その値は「BASE64」である。また、「iVBORw・・・」という文字列が、画像そのものを表すものである。
ヘッダ部内における、メタデータ(metadata要素)の次の、第49行目から第74行目までは、スタイリング(styling要素)である。
本例におけるこのstyling要素は、5個のフォント(arib−tt:font−face要素)と、1個のスタイル(style要素)とを持つ。
第51行目から第65行目までが、5個の非組込フォントの情報である。第1から第5までのフォントのid要素の値は、それぞれ、「f01」、「f02」、「f03」、「f04」、「f05」であり、これらは参照のためのIDである。
また、第66行目から第73行目までが1個のスタイルである。このスタイルのxml:id属性の値は「s1」である。また、このスタイルは、色(tts:color属性)と、フォント(tts:fontFamily属性)と、フォントサイズ(fontSize属性)と、テキスト位置揃えの調整(tts:textAlign属性)と、領域の背景色がいつ提示されるかの指定(tts:showBackground)とを有する。
ヘッダ部内における、スタイリング(styling要素)の次の、第75行目から第84行目までは、レイアウト(layout要素)である。このレイアウトは、領域(region要素)を含む。本例において、第76行目から第83行目までが、ひとつの領域を表すものである。この領域のxml:id属性の値は「all」である。つまり、この領域は、ID「all」を用いて参照される。また、この領域は、スタイル(style属性)と、その領域の原点(tts:origin属性)と、その領域の最大座標点(tts:extent属性)と、縦方向および横方向のパディングサイズ(tts:padding属性)と、提示する位置揃えの指定(tts:displayAlign属性)と、領域の背景色がいつ提示されるかの指定(tts:showBackground)とを有する。
なお、この領域における第77行目で指定しているスタイルのIDは「s1」である。これは、即ち、第66行目から始まるスタイルを参照している。
ヘッダ部の説明は以上である。次にボディ部について説明する。
ボディ部は、領域(region属性)を指定した1個のdiv要素を有する。このdiv要素は、第87行目から第103行目に記述されている。
上記のdiv要素(body要素の直下のdiv要素)は、その下のレベルに、7個の要素を有する。
第1の要素は、第88行目に記述されているパラグラフ(段落、p要素)であり、そのxml:id属性の値は「C001」である。
第2の要素は、第89行目に記述されているパラグラフ(p要素)であり、そのxml:id属性の値は「C002」である。
第3の要素は、第90行目から第92行目に記述されているdiv要素であり、そのxml:id属性の値は「C003」である。
第4の要素は、第93行目から第95行目に記述されているdiv要素であり、そのxml:id属性の値は「C004」である。
第5の要素は、第96行目から第98行目に記述されているdiv要素であり、そのxml:id属性の値は「C005」である。
第6の要素は、第99行目から第101行目に記述されているdiv要素であり、そのxml:id属性の値は「C006」である。
第7の要素は、第102行目に記述されているパラグラフ(p要素)であり、そのxml:id属性の値は「C007」である。
以上説明したように、分割部15(第1実施形態)または分割部35(第2実施形態)が受け取るデータは、予め解析された結果として、内部で論理的に伝送単位の断片に分けられているデータである。また、同データは、各断片から参照されるデータとの関係を、情報としてすぐに取り出せる形で含んでいる。よって、断片化テキスト文書データ、および断片化テキスト文書データとリソースファイルのデータを含む断片化字幕データ85を素早く生成し、リアルタイムな放送信号の伝送に間に合うように出力することができるようになる。
図16は、断片化字幕データ85に含まれる断片化テキスト文書データの例を示す概略図である。第1実施形態においては、断片化テキスト文書データを含む断片化字幕データ85は、分割装置1の出力部17から出力される。第2実施形態においては、断片化テキスト文書データを含む断片化字幕データ85は、分割装置2の出力部37から出力される。なお、断片化テキスト文書データもまた、TTML文書データであり、一種のXMLデータである。同図において、便宜上、ファイル内の行番号を示している。これらの行番号自体は、ファイル内に含まれているものではない。以下では、これらの図および行番号を参照しながら、断片化テキスト文書データの例について説明する。
同図に示す断片化テキスト文書データは、図10の第16行目から第19行目において記述されているunit要素(xml:id属性は「1」)の内容と、それに対応する図14の第88行目に記述されているp要素とに基づく。これらの両者は、ID「C001」によって相互に関連付いている。断片化テキスト文書データは、このように、分割装置1(第1実施形態の場合)あるいは解析装置5(第2実施形態の場合)による解析結果の情報に基づいて生成されるものである。
図16において、第2行目から第22行目までが、tt要素である。
そして、第3行目から第14行目までは、ヘッダ部(head要素)である。
また、第15行目から第21行目までは、ボディ部(body要素)である。
ヘッダ部内において、第5行目から第10行目までは、スタイリング(styling要素)である。また、第11行目から第13行目までは、レイアウト(layout要素)である。
上記のスタイリングには、フォント(arib−tt:font−face要素)と、スタイル(style要素)とが含まれる。
図16内のこのフォント(arib−tt:font−face要素)におけるid属性の値は「f05」である。これは、図10における第17行目のリソース(データタイプは「0000」)が、「f05」というIDを用いて、図10における第18行目のリソース(フォントのリソース)を参照していることに対応する。また、図16内のフォントにおけるfont−family属性の値は「FA 丸ゴシックM」である。これは、図12における第63行目におけるfont−familyの定義に対応している。また、図16内のフォントにおけるunicode−range属性の値は「U+F002−F003」である。これは、図12における第63行目におけるunicode−rangeの定義に対応している。
また、図16の第7行目のarib−tt:src要素は、url属性を有している。このurl属性の値は、「subt://1」であり、放送名前空間におけるフォントの所在を示している。これは、図10の第18行目の定義におけるreplaceto属性にしたがって置き換えられた後の名前である。
図16内の上記のスタイル(第9行目、style要素)では、xml:id属性の値は「s1」である。これは、図10の第17行目における、style属性の値「s1」に対応するものである。また、このスタイルは、ID「s1」によって図13の第66行目から第73行目に記述されているスタイルに関連付けられている。したがって、図16の第9行目におけるスタイル(style要素)の属性は、図13の第66行目から記述されているスタイルを引き継いでいる。即ち、具体的には、tts:color属性の値が「white」であり、tts:font−family属性の値が「FA丸ゴシック M」であり、tts:font−sizeの値が「80px」(80ピクセル)であり、tts:textAlign属性の値が「left」(左揃え)であり、tts:showBackground属性の値が「whenActive」(アクティブなとき)である。
図16の第11行目から第13行目までのレイアウト(layout要素)は、直下のレベルに領域(region要素)を含む。この領域は、 図16の第12行目に記述されている。この領域のxml:id属性の値は「all」である。これは、図10の第17目においてregion属性の値としてID「all」が指定されていることに対応する。図16の第12行目に記述されている領域(region要素)の属性は、図13の第76行目から第83行目に記述されている属性を引き継いでいるものである。即ち、具体的には、style属性の値は「all」である。また、tts:origin属性(領域の開始点のx−y座標値(百分率))は「0% 0%」である。また、tts:extent属性(領域の終点のx−y座標値(百分率))は「100% 100%」である。また、tts:padding属性(領域内における表示位置のための外周隙間のx方向およびy方向)は「0px 0px」(縦横共に0ピクセル)である。また、tts:textAlign属性の値は「left」(左揃え)である。また、tts:showBackground属性の値は「whenActive」(アクティブなとき)である。
図16に示すボディ部(body要素)には、div要素が含まれており、その直下のレベルにp要素が含まれている。
図16の第17行目に記述されている、p要素のxml:id属性の値は「C001」である。これは、図10の第17行目のsubtitle属性の値「C001」に対応している。
また、図16の第17行目に記述されている通り、p要素のregion属性の値は「all」である。これは、図10の第17行目のresource要素におけるregion属性の値を引き継いでいる。
また、図16の第17行目に記述されているp要素の全体を、図14の第88行目に記述されているp要素から引き継いでいる。
以上のように分割部15(第1実施形態)または分割部35(第2実施形態)は、簡単な処理で素早く断片化テキスト、および断片化テキストを含む断片化字幕データを生成し、送出することができる。
図17は、パッケージ化した字幕データの構造の例を示す図である。第1実施形態においては、分割装置1の出力部17がこの字幕データを出力する。また、第2実施形態においては、分割装置2の出力部37がこの字幕データを出力する。同図に示す例は、MMTによる伝送を行う場合のものである。図示する1つのMPU(メディアプロセッシングユニット,Media Processing Unit)が、1つの断片に相当する。MPUは、複数のMFU(メディアフラグメントユニット,Media Fragment Unit)を含む。MPU中の1つのMFUは、TTML文書を格納している。そのMFUは、ヘッダとTTML文書そのものを含んで構成される。他のMFUは、TTML文書から参照されるリソースを格納している。同図に示すMPUは、参照リソース1,2,・・・,nを含む。参照リソースは、画像や非組込フォントなどである。これらの各MFUもまた、ヘッダと参照リソースそのものを含んで構成される。このように分割装置1(第1実施形態)や分割装置2(第2実施形態)は、字幕の断片と、関連する参照リソースとを、パッケージとして送出する。
なお、上述した実施形態における解析装置や分析装置の機能をコンピューターで実現するようにしても良い。その場合、これらの機能を実現するためのプログラムをコンピューター読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピューターシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピューターシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピューター読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピューターシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピューター読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバーやクライアントとなるコンピューターシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピューターシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
以上、複数の実施形態を説明したが、本発明はさらに次のような変形例でも実施することが可能である。
例えば、放送だけでなく、ビデオオンデマンドのサービスにおいて利用者からの要求に応じて特定のコンテンツを通信等で配信する場合に、本発明を適用しても良い。これにより、一時に大量の字幕テキストを送信するためにまとまった時間を必要とすることを、解消することができる。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
本発明は、例えば放送事業やビデオオンデマンドサービス事業など、映像コンテンツを提供するしくみの一部などとして利用可能である。
1,2 分割装置(送出装置)
5 解析装置
11 取得部
12 時刻解析部
13 変換情報解析部
14 参照関係解析部
15 分割部
17 出力部
18 リソースファイルデータ取得部
31 取得部
32 時刻解析部
33 変換情報解析部
34 参照関係解析部
35 分割部
36 付加部(送出情報生成部)
37 出力部
38 リソースファイルデータ取得部

Claims (11)

  1. 時刻情報が付加された複数のテキスト文を含むテキスト文書データを取得する取得部と、
    前記テキスト文書データを、時間軸にしたがって、
    所定時間を超えるごとに区切り、または、
    テキストに対応する1つのdiv要素あるいはp要素ごとに区切り、または、
    伝送容量に基づいて区切り、
    前記テキスト文を含む複数のグループである断片に断片化するための断片化情報であって、各断片の開始時刻を表す断片化情報または各断片に含まれる前記テキスト文のID情報として指定される断片化情報、を生成する時刻解析部と、
    前記断片化された前記テキスト文のグループである断片ごとに、前記断片内の前記テキスト文から参照される前記テキスト文書データのヘッダ部に記述されているヘッダ記述情報を解析し、前記断片と前記断片内の前記テキスト文から参照される前記ヘッダ記述情報との関係を表す参照関係情報を生成する参照関係解析部と、
    前記断片化情報と前記参照関係情報とを含んだ断片化テキスト文書送出情報を生成し、前記取得部によって取得された前記テキスト文書データに前記断片化テキスト文書送出情報を付加して、情報付加済テキスト文書データとして出力する送出情報生成部と、
    を具備することを特徴とする解析装置。
  2. 前記ヘッダ記述情報は、フォントの情報と、埋め込み画像の情報とスタイル定義情報と、字幕提示の領域情報と、の少なくともいずれかを含む、
    請求項1に記載の解析装置。
  3. 断片化された字幕テキストのグループに含まれるリソースファイルの参照のためのロケーション情報を解析し、前記断片を放送により伝送する際の、前記断片に含まれる前記テキスト文から参照されるリソースファイルのロケーション情報と、前記リソースファイルの前記ロケーション情報が前記テキスト文書データのどの部分に記述されているかを示すロケーション情報記述位置指定情報と、前記リソースファイルを前記断片と共に放送により伝送する際の放送信号中のリソースの取得位置を特定するための放送の名前空間による放送ロケーション情報と、を含んだ放送ロケーション変換情報を生成する変換情報生成部、
    をさらに具備し、
    前記変換情報生成部は、前記リソースファイルごとに、前記リソースファイルへの参照を行っている要素を指定するidref属性を指定し、前記ロケーション情報記述位置指定情報として前記idref属性で指定した要素を起点とした前記リソースファイルを指定する属性へのパスをsrcpath属性で指定し、前記ロケーション情報として前記srcpath属性で指定した属性の値をsrcvalue属性で指定し、前記放送の名前空間による放送ロケーション情報として前記リソースファイルを放送で伝送した場合に当該リソースファイルを放送信号中から取得できるようにするための放送の名前空間によるリソースのロケーションをreplaceto属性で指定するものであり、
    前記送出情報生成部は、前記放送ロケーション変換情報をも含んだ断片化テキスト文書送出情報を生成し、前記取得部によって取得された前記テキスト文書データに前記放送ロケーション変換情報をも含んだ前記断片化テキスト文書送出情報を付加して、情報付加済テキスト文書データとして出力する、
    ことを特徴とする請求項1または2に記載の解析装置。
  4. 前記リソースファイルは、画像ファイルと、音声ファイルと、非組込フォントファイルと、のいずれかを含む、
    請求項3に記載の解析装置。
  5. 時刻情報が付加された複数のテキスト文を含むテキスト文書データに加え、前記時刻情報に基づいて前記テキスト文書データを前記テキスト文の複数のグループに断片化するための断片化情報であって、各断片の開始時刻を表す断片化情報または各断片に含まれる前記テキスト文のID情報として指定される断片化情報、と、前記断片化された前記テキスト文のグループである断片ごとに、前記断片内の前記テキスト文から参照される前記テキスト文書のヘッダ記述との関係を表す参照関係情報とを含んだ断片化テキスト文書送出情報を読み込み、前記断片化情報に基づいて前記テキスト文書データを前記テキスト文の複数のグループに分割するとともに、前記参照関係情報に基づいて、分割された断片である前記テキスト文のグループに、前記断片内の前記テキスト文から参照される前記テキスト文書のヘッダ記述の情報を付加する分割部と、
    前記分割部によって分割された前記断片に含まれる前記テキスト文から参照されるリソースファイルを取得するリソースファイルデータ取得部と、
    前記分割部によって分割された前記断片と、前記リソースファイルデータ取得部によって取得された前記リソースファイルとを含むデータを出力する出力部と、
    を具備し、
    前記分割部は、前記断片を放送により伝送する際の、前記断片に含まれる前記テキスト文から参照されるリソースファイルのロケーション情報と、前記リソースファイルの前記ロケーション情報が前記テキスト文書データのどの部分に記述されているかを示すロケーション情報記述位置指定情報と、前記リソースファイルを前記断片と共に放送により伝送する際の放送信号中のリソースの取得位置を特定するための放送の名前空間による放送ロケーション情報と、を含んだ放送ロケーション変換情報を更に含む、前記断片化テキスト文書送出情報を読み込み、前記放送ロケーション変換情報に基づいて、前記断片に含まれる前記テキスト文から参照される前記リソースファイルのロケーション情報を、放送の名前空間によるロケーション情報に書き換えて前記断片に分割する、
    分割装置。
  6. 前記リソースファイルは、画像ファイルと、音声ファイルと、非組込フォントファイルと、のいずれかを含む、
    請求項5に記載の分割装置。
  7. 前記分割部は、時刻情報が付加されたテキストを含むテキスト文書データに、前記断片化テキスト文書送出情報が付加されている情報付加済テキスト文書データを読み込み、前記断片化テキスト文書送出情報に含まれる前記断片化情報に基づいて前記テキスト文書データを、テキスト文の複数のグループに分割するとともに、前記参照関係情報に基づいて分割された断片である前記テキスト文のグループに、前記断片内の前記テキスト文から参照される前記テキスト文書のヘッダ記述の情報を付加し、
    また、前記分割部は、前記断片化テキスト文書情報に前記放送ロケーション変換情報が含まれる場合は、前記放送ロケーション変換情報に基づいて、前記断片に含まれる前記テキスト文から参照される前記リソースファイルのロケーション情報を、放送の名前空間によるロケーション情報に書き換える、
    ことを特徴とする請求項5または6に記載の分割装置。
  8. 時刻情報が付加された複数のテキスト文を含むテキスト文書データを取得する取得部と、
    前記テキスト文書データを、時間軸にしたがって、
    所定時間を超えるごとに区切り、または、
    テキストに対応する1つのdiv要素あるいはp要素ごとに区切り、または、
    伝送容量に基づいて区切り、
    前記テキスト文を含む複数のグループである断片に断片化するための断片化情報であって、各断片の開始時刻を表す断片化情報または各断片に含まれる前記テキスト文のID情報として指定される断片化情報、を生成する時刻解析部と、
    前記断片化された前記テキスト文のグループである断片ごとに、前記断片に含まれるテキスト文から参照される前記テキスト文書のヘッダ記述の情報を解析し、前記断片と前記断片に含まれるテキスト文から参照される前記ヘッダ記述との関係を表す参照関係情報を生成する参照関係解析部と、
    前記テキスト文書データに加え、前記断片化情報と前記参照関係情報とを含んだ断片化テキスト文書送出情報を読み込み、前記断片化情報に基づいて前記テキスト文書データを前記テキスト文の複数のグループに分割するとともに、前記参照関係情報に基づいて分割
    された断片である前記テキスト文のグループに前記断片に含まれるテキスト文から参照される前記テキスト文書のヘッダ記述の情報を付加する分割部と、
    前記分割部によって分割された前記断片に含まれるテキスト文から参照されるリソースファイルを取得するリソースファイルデータ取得部と、
    前記分割部によって分割された前記断片と、前記リソースファイルデータ取得部によって取得されたリソースファイルとを含むデータを出力する出力部と、
    を具備することを特徴とする分割装置。
  9. 前記出力部は、前記断片に含まれる前記テキスト文に付加された前記時刻情報のうち、一番早い提示開始時刻にしたがって、分割された前記テキスト文と、前記リソースファイルとを含むデータを順次出力する、
    ことを特徴とする請求項5から8までのいずれか一項に記載の分割装置。
  10. 請求項1から4までのいずれか一項に記載の解析装置としてコンピューターを機能させるためのプログラム。
  11. 請求項5から9までのいずれか一項に記載の分割装置としてコンピューターを機能させるためのプログラム。
JP2015230099A 2014-11-28 2015-11-25 分割装置および解析装置、ならびにプログラム Active JP6796376B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014241172 2014-11-28
JP2014241172 2014-11-28

Publications (2)

Publication Number Publication Date
JP2016110645A JP2016110645A (ja) 2016-06-20
JP6796376B2 true JP6796376B2 (ja) 2020-12-09

Family

ID=56124495

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015230099A Active JP6796376B2 (ja) 2014-11-28 2015-11-25 分割装置および解析装置、ならびにプログラム

Country Status (1)

Country Link
JP (1) JP6796376B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017126509A1 (ja) * 2016-01-19 2017-07-27 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
CN109479154B (zh) * 2016-07-26 2021-11-05 索尼公司 发送装置、发送方法、接收装置和接收方法
KR102067446B1 (ko) * 2018-06-04 2020-01-17 주식회사 엔씨소프트 자막 생성 방법 및 시스템
JP7201656B2 (ja) * 2020-12-22 2023-01-10 株式会社Play 字幕生成装置及び字幕生成プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4099973B2 (ja) * 2001-10-30 2008-06-11 松下電器産業株式会社 映像データ送信方法及び映像データ受信方法、並びに映像監視システム
JP3990671B2 (ja) * 2004-01-06 2007-10-17 富士通株式会社 情報管理装置および情報管理方法
JP2006238147A (ja) * 2005-02-25 2006-09-07 Toshiba Corp コンテンツ再生装置、字幕再生方法及びプログラム
JP4899476B2 (ja) * 2005-12-28 2012-03-21 富士通株式会社 分割プログラム、連結プログラム、情報処理方法

Also Published As

Publication number Publication date
JP2016110645A (ja) 2016-06-20

Similar Documents

Publication Publication Date Title
US9769526B2 (en) Transmission and reception apparatuses, methods, and systems for filtering content
JP3880517B2 (ja) 文書処理方法
JP6796376B2 (ja) 分割装置および解析装置、ならびにプログラム
US20080147823A1 (en) Structured data receiving apparatus, receiving method, reviving program, transmitting apparatus, and transmitting method
JP6444016B1 (ja) 送信装置および受信装置、ならびにプログラム
JP5414792B2 (ja) リッチメディアサービスを提供する方法及び装置
US20120301110A1 (en) Image processing apparatus method and computer program product
EP1244309A1 (en) A method and microprocessor system for forming an output data stream comprising metadata
US20140181882A1 (en) Method for transmitting metadata documents associated with a video
JP3932120B2 (ja) 構造化データの受信プログラム、構造化データの受信装置、及び構造化データの受信方法
JP3932121B2 (ja) 構造化データの受信プログラム、構造化データの受信装置、及び構造化データの受信方法
JP3932123B2 (ja) 構造化データの受信プログラム、構造化データの受信装置、及び構造化データの受信方法
JP2005063453A (ja) 構造化データの送信装置
KR20050015070A (ko) 내용 기반 검색을 위한 방송 프로그램 송수신 장치 및 방법
AU2001268839A1 (en) Delivering multimedia descriptions
JP2005011374A (ja) 構造化データの送信装置
JP2005044374A (ja) 構造化データの送信装置
JP2005063452A (ja) 構造化データの送信装置
JP2005063451A (ja) 構造化データの送信装置
JP2005038441A (ja) 構造化データの送信装置
KR20090026707A (ko) 엠피이쥐-2 티에스를 이용한 메타 데이터 전송방법 및인코더, 디코더
JP2004318795A (ja) 構造化データの受信方法
JP2004318796A (ja) 構造化データの受信方法
JP2004318797A (ja) 構造化データの受信方法
JP2004318771A (ja) 構造化データの受信装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181001

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20181026

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190719

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191001

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200407

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200612

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201020

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201116

R150 Certificate of patent or registration of utility model

Ref document number: 6796376

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250