JP6796376B2 - 分割装置および解析装置、ならびにプログラム - Google Patents
分割装置および解析装置、ならびにプログラム Download PDFInfo
- Publication number
- JP6796376B2 JP6796376B2 JP2015230099A JP2015230099A JP6796376B2 JP 6796376 B2 JP6796376 B2 JP 6796376B2 JP 2015230099 A JP2015230099 A JP 2015230099A JP 2015230099 A JP2015230099 A JP 2015230099A JP 6796376 B2 JP6796376 B2 JP 6796376B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- text
- fragment
- text document
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000012634 fragment Substances 0.000 claims description 126
- 230000005540 biological transmission Effects 0.000 claims description 104
- 238000006243 chemical reaction Methods 0.000 claims description 55
- 238000013467 fragmentation Methods 0.000 claims description 51
- 238000006062 fragmentation reaction Methods 0.000 claims description 51
- 238000000034 method Methods 0.000 description 54
- 230000008569 process Effects 0.000 description 24
- 238000012545 processing Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 18
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 108091027981 Response element Proteins 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Images
Description
また、非特許文献2には、非特許文献1のTTMLをベースとして、テキストに加え、画像、音声、WEBフォントによる非組込フォントの提示にも対応したタイムドテキストマークアップ言語(ARIB−TTML)によるデータの記述方法が記載されている。
さらに、非特許文献3の、例えば図9−2(p.114)には、ARIB−TTML文書ファイルを含む一連のファイルを伝送する方式の概要が記載されている。
また、放送時にリアルタイムで字幕テキストを送出するためには、TTML文書ファイルの分割処理の負荷を軽減することが求められる。
[4]また、本発明の一態様は、上記[2]の解析装置において、前記送出情報生成部は、前記取得部によって取得された前記テキスト文書データに前記断片化情報と前記参照関係情報と前記放送ロケーション変換情報とを含んだ前記断片化テキスト文書送出情報を付加して、情報付加済テキスト文書データとして出力する、ことを特徴とする。
(1)前記断片に含まれる、前記テキスト文に付加されていた前記テキスト文を識別するIDのリスト、
(2)前記断片に含まれる前記テキスト文のうち一番時間順が早い前記テキスト文に付加されていた開始時刻の情報、
(3)前記断片に含まれる前記テキスト文のうち一番時間順が早い前記テキスト文に付加されていた開始時刻および一番時間順が遅い前記テキスト文に付加されていた終了時刻の情報、
の少なくともいずれかを含むものであり、前記参照関係情報は、前記断片の提示に必要な前記テキスト文書のヘッダ記述として、非組込フォントの情報と、埋め込み画像の情報、テキストのスタイルの情報と、テキスト提示の領域の情報との、少なくともいずれかを含むものである、ことを特徴とする。
(1)前記断片に含まれる、前記テキスト文に付加されていた前記テキスト文を識別するIDのリスト、
(2)前記断片に含まれる前記テキスト文のうち一番時間順が早い前記テキスト文に付加されていた開始時刻の情報、
(3)前記断片に含まれる前記テキスト文のうち一番時間順が早い前記テキスト文に付加されていた開始時刻および一番時間順が遅い前記テキスト文に付加されていた終了時刻の情報、
の少なくともいずれかを含むものであり、前記参照関係情報は、前記断片の提示に必要な前記テキスト文書のヘッダ記述として、非組込フォントの情報と、埋め込み画像の情報、テキストのスタイルの情報と、テキスト提示の領域の情報との、少なくともいずれかを含むものである、ことを特徴とする。
また、本発明による字幕情報が付加されたテキスト情報は、一番組全体のテキスト情報として記述、管理できるため、インターネットでのビデオオンデマンドサービスにおいて一般的に用いられる一番組全体のテキスト情報を一括して送信することにも対応でき、インターネットでの字幕テキストの提供に適した形式でも出力することができる。
[第1実施形態]
図1は、第1実施形態による分割装置(送出装置)の概略機能構成を示すブロック図である。図示するように、分割装置1は、取得部11と、時刻解析部12と、変換情報解析部13と、参照関係解析部14と、分割部15と、出力部17と、リソースファイルデータ取得部18とを含んで構成される。また、図示するテキスト文書データ81と断片化字幕データ85とは、適宜、記録媒体等に記録された形態で保持される。具体的には、データ記憶手段としては、磁気ハードディスク装置や、半導体メモリ等が用いられる。
時刻解析部12は、テキスト文書データ81に含まれる時刻情報に基づいて、テキスト文書データ81を断片化するための断片化情報を生成する。ここで、断片化とは、時間軸にしたがって、テキスト文書データ81を、より短い適切な時間範囲を有する複数のグループに分割することである。なお、断片化によって分割された各グループは、1個または複数個のテキスト文を含む。また、時刻解析部12によって分割されたテキスト(所定の時間の範囲内のテキスト文)を、以後、断片(フラグメント)と呼ぶ場合がある。適切な時間範囲とは、例えば、テレビ放送の字幕としての伝送用に適した時間範囲である。
時刻解析部12は、生成した断片化情報を分割部15に渡す。
参照関係解析部14は、生成した参照関係情報を分割部15に渡す。
なお、ヘッダ記述とは、テキスト文から参照されるテキスト文書データのヘッダ部に記述されているフォントの情報や埋め込み画像の情報やスタイル定義情報や字幕提示の領域情報などである。ヘッダ記述の詳細については後述する。
変換情報解析部13は、生成した放送ロケーション変換情報を分割部15に渡す。
出力部17は、分割部15によって分割されたテキスト文のグループである断片と、その断片から参照されるリソースファイルのデータとを、放送等で利用される伝送フォーマットにて出力する。このとき、出力部17は、断片に含まれるテキスト文に付加された時刻情報のうち一番早い開始時間にしたがって、分割されたテキスト文のグループである断片化テキスト文書データと、関連付けられたリソースのデータを放送等で利用される伝送フォーマットにて順次出力する。なお、出力部17は、リソースファイルのデータを、リソースファイルデータ取得部18から受け取る。
リソースファイルデータ取得部18は、テキスト文書データ81から参照されている外部のリソースファイル87を取得して、上記の出力部17に渡す。
具体的には、テキスト文書データ81は、メタデータ(metadata要素)の一部として、埋め込みイメージ情報を持っている。埋め込みイメージ情報は、smpte:image要素として保持されるものであり、バイナリー形式のイメージを適宜コード化して文字としてテキスト文書データ81内に含まれる。
また、テキスト文書データ81は、スタイリング情報(styling要素)の一部として、非組込フォント情報(arib−tt:font−face要素)を持っている。非組込フォント情報には、TTML文書とともに表示可能な非組込フォントのリソースフィルのロケーション情報等を記述する。
また、テキスト文書データ81は、スタイリング情報の一部として、スタイル情報(style要素)を持っている。このスタイル情報は、文字色や、フォントファミリーや、フォントサイズや、文字の配置(アラインメント指定)などの情報を含む。後続のbody要素内に記述される字幕本文から、ここで定義したスタイル情報を参照して利用できる。
また、テキスト文書データ81は、レイアウト情報(layout要素)の一部として、字幕提示の領域情報(region要素)を含む。この領域情報は、テキストを表示する領域(座標範囲)に関する情報である。後続のbody要素内に記述される字幕本文から、ここで定義した領域情報を参照して利用できる。
また、変換情報解析部13は、断片化された字幕テキストのグループに含まれるリソースファイルの参照のためのロケーション情報を解析し、元のロケーション情報の記述を放送の名前空間によるロケーション情報へ書き換えるための、放送ロケーション変換情報を生成する。
tt要素は、TTML文書ファイルにおける最上位の要素である。
head要素は、TTML文書ファイルにおけるヘッダ部(head要素)である。
metadata要素は、ヘッダ部の中に含まれているメタデータである。TTMLにおいては、TTML文書に関する任意の情報をmetadata要素下に記述することができる。
captionExchangeInformation要素は、メタデータの一部として含まれている、字幕キャプションの交換に関する情報である。
transmissionInformation要素は、captionExchangeInformationの一部として含まれている、伝送に関する情報である。
transmissionUnits要素は、放送における伝送単位である「unit」を格納するための親要素である。
@xml:id属性は、unitの属性であり、字幕テキストの伝送単位の識別子を示す。この識別子により、伝送単位ごとの字幕データを番号等で管理することができる。なお、unitを識別するために、連番等を値として持つ@number要素を用いるようにしても良い。
@timecode属性は、unitの属性であり、提示時刻を示す。提示時刻は、当該伝送単位として伝送される字幕データを提示する時刻であり、例えば番組開始時点からの相対時刻で表される。提示時刻を表す形式は、例えば、「hh:mm:ss:nnn」(時−分−秒−ミリ秒)である。放送局側の送出装置(本実施形態における分割装置1)は、この提示時刻に基づき、字幕データを送出する。なお、提示時刻よりも所定時間(伝送や処理等に要するオーバーヘッド時間)前に、送出装置は、字幕データを送出する。なお、@timecode属性の値としての提示時刻には、当該伝送単位に含まれる各字幕テキストの提示開始時刻のうち、一番早い開始時間の値を用いる。これにより、放送信号を受信する受信機側での提示に間に合うように、断片化字幕データ85を送出することができる。
図中では、datatype=「0000」の場合と、datatype≠「0000」との場合とのそれぞれに、異なるハッチングパターンを付して示している。
resource要素の@idref属性は、伝送単位として一緒に送出するARIB−TTML文書において、外部リソースの参照を行っている要素を指定するものである。具体的には、@idref属性は、外部リソースを行っている要素の識別子(xml:id属性)を用いる。
resource要素の@srcpath属性(ソースパス)は、上記のidref属性で指定した要素を起点とした、リソースファイルのロケーションを指定する属性へのパスをxpath(http://www.w3.org/TR/xpath/)により指定するものである。
resource要素の@srcvalue属性(ソースバリュー)は、上記のsrcpath属性で示した属性の値(リソースファイルのロケーション情報)である。
resource要素の@replaceto属性(リプレース・トゥ)は、当該リソースを放送で伝送した場合に、受信機が当該リソースを放送信号中から取得できるようにするため、放送の名前空間によるリソースのロケーションを指定するものである。つまり、replaceto属性は、放送として伝送されるときには、ファイルの元の名(srcvalue属性で指定される値)を、このreplaceto属性で指定される名に置き換えることを指定するものである。
resource要素の@idref属性、@srcpath属性、@srcvalue属性、@replaceto属性の一連の属性によって、unit属性で指定した字幕の伝送単位において、ARIB−TTML文書から参照するリソースファイルの存在と、リソースファイルのロケーション情報を置き換えに必要な情報を指定することができる。つまり、これらの情報は、変換情報解析部13が生成する、放送ロケーション変換情報に該当する。
また、上記の、resource要素の@srcpath属性は、前記リソースファイル(画像ファイルや音声ファイルや非組込フォントファイル等)のロケーション情報がテキスト文書データのどの部分に記述されているかを示すロケーション情報記述位置指定情報である。
また、上記の、resource要素の@replaceto属性は、前記リソースファイル(画像ファイルや音声ファイルや非組込フォントファイル等を断片と共に放送により伝送する際の放送信号中のリソースの取得位置を特定するための放送の名前空間による放送ロケーション情報である。
ここで述べたロケーション情報と、ロケーション情報記述位置指定情報と、放送の名前空間による放送ロケーション情報とを含むものが、放送ロケーション変換情報である。
図4は、分割装置1による処理の手順を示すフローチャートである。
同図に示すように、まずステップS11において、取得部11は、テキスト文書データ81を取得し、取得したテキスト文書データ81に含まれる各要素にID(識別子)を付与済みであるか否かを判断する。この判断は、テキスト文書データ81の各要素に関してIDが付与済みである場合には、それらの付与済みのIDを利用することによって、再付与の処理をスキップするためのものである。そして、IDが付与済みである場合(ステップS11:YES)には、ステップS13に飛ぶ。また、IDが付与されていない場合(ステップS11:NO)には、次のステップS12に進む。
− tt/head/metadata/smpte:image
− tt/head/styling/arib−tt/font−face
− tt/head/styling/style
− tt/head/layout/region
− tt/head/div/div
− tt/head/div/p
tt/head/metadata/smpte:imageの要素に対しては、「SMPTE」で始まるIDを付与する。一例としては、「SMPTE_logo16」などといったIDを付与する。
tt/head/styling/arib−tt/font−faceの要素に対しては、「f」で始まり、その後に連続番号を伴うIDを付与する。一例としては、「f01」、「f02」、・・・などといったIDを付与する。
tt/head/styling/styleの要素やtt/head/layout/regionの要素に対しては、「s」で始まり、その後に連続番号を伴うIDを付与する。一例としては、「s1」、「s2」、・・・などといったIDを付与する。
tt/head/div/divやtt/head/div/pの要素に対しては、「c」で始まり、その後に連続番号を伴うIDを付与する。一例としては、「c001」、「c002」、・・・などといったIDを付与する。
このように各要素にIDを付与することにより、以後の処理において、そのIDによってそれぞれの要素を参照することができる。
いずれの方法を取るにせよ、時刻解析部12は、断片化した結果の時刻の区切りに含まれる字幕テキスト文(tt/head/div/div要素やtt/head/div/p要素)のIDのリストの情報である断片化情報を生成して、参照関係解析部14および分割部15に渡す。
そして、参照関係解析部14は、断片化情報に参照関係に関する情報を付加して、変換情報解析部13および分割部15に渡す。
そして、出力部17は、複数の断片化字幕データ85のそれぞれを、各断片に含まれる字幕テキストのうち一番早い提示開始時刻に合わせて(受信機側での提示に間に合うようなタイミングで)、出力(送出)する。
なお、分割部15によるファイル分割、および出力部17によるデータの送出の詳細な処理手順は、第2実施形態において説明する図9の手順と同様のものとしても良い。
以上で、本フローチャート全体の処理を終了する。
次に、第2実施形態について説明する。なお、上述した実施形態と共通の事項については記載を省略し、本実施形態に特有の事項を中心に以下の説明を行う。
図5は、本実施形態による装置構成を示す概略ブロック図である。図示するように、本実施形態によるテキスト(字幕等)の分割・送出システムは、テキスト文書データ81と、解析装置5と、情報付加済テキスト文書データ83と、分割装置2(送出装置)と、断片化字幕データ85とを含んで構成される。なお、テキスト文書データ81と、情報付加済テキスト文書データ83と、断片化字幕データ85とは、適宜、記録媒体等に記録された形態で保持される。具体的には、データ記憶手段としては、磁気ハードディスク装置や、半導体メモリ等が用いられる。
また、分割装置2は、上記の情報付加済テキスト文書データ83を読み込み、各断片の字幕テキストに対応した複数の断片化テキスト文書データを生成し、生成された断片化テキスト文書データが、外部イメージファイル、外部オーディオファイル、外部非組込フォントファイルなどを参照する場合は、断片化テキスト文書データと、リソースファイルデータ取得部によって取得した外部ファイルデータを結合し、放送等で提供するフォーマットにしたがいパッケージ化した断片化字幕データ85を生成する。断片化字幕データ85は、入力された字幕テキストを、所定の提示時刻の範囲で区切って独立のまとまった単位のファイルとして構成されるものである。
時刻解析部32は、テキスト文書データ81に含まれる各テキスト文に付加された時刻情報に基づいて、テキスト文書データ81を複数のテキスト文のグループに断片化するための断片化情報を生成する。なお、断片化された後の各グループは、元のテキスト文書データ81に含まれるテキスト文の時間範囲よりも、短い時間範囲のテキスト文を含むものである。
なお、時刻解析部32は、生成した断片化情報を参照関係解析部34および付加部36に渡す。
参照関係解析部34は、断片化されたテキスト文のグループである断片ごとに、その断片に含まれるテキスト文から参照されるテキスト文書データ81のヘッダ部の情報を解析し、その断片と、参照される前記ヘッダ部の情報(ヘッダ記述)との関係を表す参照関係情報を生成する。
参照関係解析部34は、断片化情報と生成した参照関係情報を変換情報解析部および付加部36に渡す。
変換情報解析部33は、断片化されたテキスト文のグループに含まれるリソースファイルの参照のためのロケーション情報を解析し、元のロケーション情報の記述を放送の名前空間によるロケーション情報へ書き換えるための、放送ロケーション変換情報を生成する。
変換情報解析部33は、生成した放送ロケーション変換情報を付加部36に渡す。
付加部36は、取得部31によって取得されたテキスト文書データ81に、時刻解析部32から渡された断片化情報と参照関係解析部34から渡された参照関係情報と変換解析部33から渡された放送ロケーション変換情報を付加して、情報付加済テキスト文書データ83として出力する。
なお、分割部35が読み込む情報付加済テキスト文書データ83は、前述の通り、時刻情報が付加された複数のテキスト文を含むテキスト文書データ81に、時刻情報に基づいてテキスト文の複数のグループに断片化するための断片化情報を付加し、さらに断片化されたテキスト文の各グループごとに、その断片から参照されるテキスト文書データ81のヘッダ部の情報との関係を表す参照関係情報を付加し、さらに断片化されたテキスト文の各グループがリソースファイルを参照する場合に、リソースァイルの参照のためのロケーション情報を元のロケーション情報の記述から放送の名前空間によるロケーション情報へ書き換えるための放送ロケーション変換情報を付加してなるものである。
リソースファイルデータ取得部38は、情報付加済テキスト文書データ83から参照されているリソースファイル87を取得し、上記の出力部37に渡す。
図8は、解析装置5による処理の手順を示すフローチャートである。
同図に示すように、まずステップS31において、取得部31は、テキスト文書データ81を取得し、取得したテキスト文書データ81に含まれる各要素にID(識別子)を付与済みであるか否かを判断する。この判断は、テキスト文書データ81の各要素に関してIDが付与済みである場合には、それらの付与済みのIDを利用することによって、再付与の処理をスキップするためのものである。そして、IDが付与済みである場合(ステップS31:YES)には、ステップS33に飛ぶ。また、IDが付与されていない場合(ステップS31:NO)には、次のステップS32に進む。
図9は、分割装置2による処理の手順を示すフローチャートである。
同図に示すように、まずステップS41において、分割部35は、付加情報を含むテキスト文書データである情報付加済テキスト文書データ83を読み込む。この情報付加済テキスト文書データ83はXML文書データの一種であり、分割部35は読み込んだXMLデータをパージングすることにより、DOM(ドキュメントオブジェクトモデル,Document Object Model)を作成する。これにより、分割部35は、読み込んだ情報付加済テキスト文書データ83の構成をツリー構造で把握する。
分割部35は、ユニット内の1つ目のリソースを読み込み、そのリソース(resource要素)の属性ごとに、下記の(1)から(5)までの処理を行うことによって、空のTTML文書に要素を追加する。なお、空のTTML文書とは、「<tt></tt>」(tt要素の開始と終了)のみからなる文書である。なお、下の説明において、IDリストとは、単数または複数のID(識別子)を持ち得るリストの表現である。具体的な例として、IDリストが複数のIDを含む場合には、それら複数のIDを空白文字で区切って並べた文字列が、IDリストである。
(2)1つ目のresource要素のfont−face属性に指定されたIDリストを基に、入力側のTTML文書中のtt/head/styling/arib−tt:font−face要素であって同一のIDを持つ要素を、出力側のTTML文書中にコピーする。
(3)1つ目のresource要素のstyle属性に指定されたIDリストを基に、入力側のTTML文書中のtt/head/syling/style要素であって同一のIDを持つ要素を、出力側のTTML文書中にコピーする。
(4)1つ目のresource要素のregion属性に指定されたIDリストを基に、入力側のTTML文書中のtt/head/layout/region要素であって同一のIDを持つ要素を、出力側のTTML文書中にコピーする。
(5)1つ目のresource要素のsubtitle属性に指定されたIDリストを基に、入力側のTTML文書中のtt/body/div要素の下の、div要素またはp要素であって、同一のIDを持つ要素を、出力側のTTML文書中にコピーする。
ステップS43において、分割部35は、unit要素内の2つ目以後のリソース要素を読み込み、下記の(1)、(2)の処理を行う。
(1)出力側の文書中のidref要素で指定されたIDを持つ要素を起点に、srcpath要素に記述されているxpathによって指定された要素または属性の値を、replaceto要素で指定さえた値に置き換える。
(2)srcvalue属性で指定された外部リソースファイルを、放送伝送用のデータ形式に変換する。なお、具体的な変換方法は、伝送方式によって異なる。例えばTS(トランスポートストリーム)方式の場合には、カルーセル伝送用のデータに変換する。また、MMT(MPEGメディアトランスポート)方式の場合には、MMTのMFU(メディアフラグメントユニット)に変換する。
ステップS44において、出力部37は、伝送単位に応じて生成されたTTML文書(断片化テキスト文書データの1つ)を、放送として送出伝送するためのデータ形式に変換する。なお、具体的な変換方法は、伝送方式によって異なる。例えばTS(トランスポートストリーム)方式の場合には、カルーセル伝送用のデータに変換する。また、MMT(MPEGメディアトランスポート)方式の場合には、MMTのMFU(メディアフラグメントユニット)に変換する。
この図10、図11、図12、図13、図14、図15を順に連結したデータが、1件の情報付加済テキスト文書データ83に当たる。なお、情報付加済テキスト文書データ83は、一種のXMLデータである。これらの図の中において、便宜上、ファイル内の行番号を示している。これらの行番号自体は、ファイル内に含まれているものではない。以下では、これらの図および行番号を参照しながら、情報付加済テキスト文書データ83の例について説明する。
また、第2実施形態では分割装置2の分割部35が、解析装置5から渡される情報付加済テキスト文書データ83を読み込む。
第10行目から第85行目までは、ヘッダ部(head要素)である。
第86行目から第104行目までは、ボディ部(body要素)である。
第13行目から第42行目までがキャプション交換情報である。
キャプション交換情報は、伝送情報(transmissionInformation要素)を含む。
第14行目から第41行目までが伝送情報である。
また、第45行目から第47行目までが、埋め込みイメージである。
伝送情報は、複数の伝送単位のまとまり(transmissionUnits要素)を含んでいる。第15行目から第40行目までがtransmissionUnits要素である。
このtransmissionUnits要素は、個々に番号付けされた複数の伝送単位(unit要素)を有している。
本例においては、6個の伝送単位(unit要素)が存在し、それらのそれぞれがxml:id属性として「1」から「6」までの値をもっている。xml:id属性が「1」である伝送単位は、第16行目から第19行目までである。xml:id属性が「2」である伝送単位は、第20行目から第24行目までである。xml:id属性が「3」である伝送単位は、第25行目から第28行目までである。xml:id属性が「4」である伝送単位は、第28行目から第32行目までである。xml:id属性が「5」である伝送単位は、第34行目から第36行目までである。xml:id属性が「6」である伝送単位は、第37行目から第39行目までである。
その第1のリソースのデータタイプ(datatype属性)は「0000」であり、これは字幕テキストそのものに対応している。このリソースは、非組込フォント(font−face属性)、スタイル(style属性)、字幕提示の領域(region属性)、字幕テキスト文(subtitle属性)を有している。各属性の値は、参照のためのIDである。なお、subtitle属性の値は「C001」である。なお、このリソース(resource要素)において、font−face属性や、style属性や、region属性が、参照関係情報の例である。また、このリソースにおいて、subtitle属性が、断片化情報の例であり、「C001」という値によってテキスト文の断片(グループ)を参照している。これらの参照関係情報や断片化情報は、以下のリソース(データタイプが「0000」)においても同様である。
また、第2のリソースのデータタイプは「0110」であり、これはリソースがフォントであることを表す。このリソースは、idref属性を有し、その値は「f05」である。これは、参照のために用いられるIDである。また、srcpath属性は、リソースファイルのロケーション記述へのパス(idref属性を有する要素を起点としたリソースファイルのロケーション情報の記述へのXPATH情報)を示す。また、srcvalue属性は、リソースファイルのロケーション情報を指定するものである。また、replaeto属性は、放送として送出される際の放送の名前空間によるロケーション情報の値を示す。なお、このリソース(resource要素)において、srcpath属性や、srcvalue属性や、replaceto属性が、放送ロケーション変換情報の例である。放送ロケーション変換情報については、以下のリソース(データタイプが「0000」ではない)においても同様である。
第1のリソースのデータタイプ(datatype属性)は「0000」であり、字幕テキストそのものを示す。このリソースにおけるfonto−face属性は、「f03」および「f04」という2つのIDを示すものであり、これら両者を空白で連結したものを属性値としている。なお、subtitle属性の値は「C002」である。
第2および第3のリソースのデータタイプは「0110」であり、これはフォントに対応する。フォントであるリソースの属性については、既に述べたとおりである。
第1のリソースのデータタイプ(datatype属性)は「0000」であり、字幕テキストそのものを示す。なお、subtitle属性の値は「C003」である。
第2のリソースのデータタイプは「0001」であり、これは画像に対応する。このリソースは、外部の画像に対応する。
第1のリソースのデータタイプ(datatype属性)は「0000」であり、字幕テキストそのものを示す。なお、subtitle属性の値は「C004」および「C005」(両者を空白で連結)である。
第2および第3のリソースおデータタイプは「0001」であり、これは画像に対応する。これらのリソースは、それぞれ、外部の画像に対応する。
第1のリソースのデータタイプの値は「0000」である。このリソースのsubtitle属性の値は、「C007」である。
本例におけるこのstyling要素は、5個のフォント(arib−tt:font−face要素)と、1個のスタイル(style要素)とを持つ。
第51行目から第65行目までが、5個の非組込フォントの情報である。第1から第5までのフォントのid要素の値は、それぞれ、「f01」、「f02」、「f03」、「f04」、「f05」であり、これらは参照のためのIDである。
また、第66行目から第73行目までが1個のスタイルである。このスタイルのxml:id属性の値は「s1」である。また、このスタイルは、色(tts:color属性)と、フォント(tts:fontFamily属性)と、フォントサイズ(fontSize属性)と、テキスト位置揃えの調整(tts:textAlign属性)と、領域の背景色がいつ提示されるかの指定(tts:showBackground)とを有する。
なお、この領域における第77行目で指定しているスタイルのIDは「s1」である。これは、即ち、第66行目から始まるスタイルを参照している。
第1の要素は、第88行目に記述されているパラグラフ(段落、p要素)であり、そのxml:id属性の値は「C001」である。
第2の要素は、第89行目に記述されているパラグラフ(p要素)であり、そのxml:id属性の値は「C002」である。
第3の要素は、第90行目から第92行目に記述されているdiv要素であり、そのxml:id属性の値は「C003」である。
第4の要素は、第93行目から第95行目に記述されているdiv要素であり、そのxml:id属性の値は「C004」である。
第5の要素は、第96行目から第98行目に記述されているdiv要素であり、そのxml:id属性の値は「C005」である。
第6の要素は、第99行目から第101行目に記述されているdiv要素であり、そのxml:id属性の値は「C006」である。
第7の要素は、第102行目に記述されているパラグラフ(p要素)であり、そのxml:id属性の値は「C007」である。
そして、第3行目から第14行目までは、ヘッダ部(head要素)である。
また、第15行目から第21行目までは、ボディ部(body要素)である。
上記のスタイリングには、フォント(arib−tt:font−face要素)と、スタイル(style要素)とが含まれる。
また、図16の第7行目のarib−tt:src要素は、url属性を有している。このurl属性の値は、「subt://1」であり、放送名前空間におけるフォントの所在を示している。これは、図10の第18行目の定義におけるreplaceto属性にしたがって置き換えられた後の名前である。
図16の第17行目に記述されている、p要素のxml:id属性の値は「C001」である。これは、図10の第17行目のsubtitle属性の値「C001」に対応している。
また、図16の第17行目に記述されている通り、p要素のregion属性の値は「all」である。これは、図10の第17行目のresource要素におけるregion属性の値を引き継いでいる。
また、図16の第17行目に記述されているp要素の全体を、図14の第88行目に記述されているp要素から引き継いでいる。
例えば、放送だけでなく、ビデオオンデマンドのサービスにおいて利用者からの要求に応じて特定のコンテンツを通信等で配信する場合に、本発明を適用しても良い。これにより、一時に大量の字幕テキストを送信するためにまとまった時間を必要とすることを、解消することができる。
5 解析装置
11 取得部
12 時刻解析部
13 変換情報解析部
14 参照関係解析部
15 分割部
17 出力部
18 リソースファイルデータ取得部
31 取得部
32 時刻解析部
33 変換情報解析部
34 参照関係解析部
35 分割部
36 付加部(送出情報生成部)
37 出力部
38 リソースファイルデータ取得部
Claims (11)
- 時刻情報が付加された複数のテキスト文を含むテキスト文書データを取得する取得部と、
前記テキスト文書データを、時間軸にしたがって、
所定時間を超えるごとに区切り、または、
テキストに対応する1つのdiv要素あるいはp要素ごとに区切り、または、
伝送容量に基づいて区切り、
前記テキスト文を含む複数のグループである断片に断片化するための断片化情報であって、各断片の開始時刻を表す断片化情報または各断片に含まれる前記テキスト文のID情報として指定される断片化情報、を生成する時刻解析部と、
前記断片化された前記テキスト文のグループである断片ごとに、前記断片内の前記テキスト文から参照される前記テキスト文書データのヘッダ部に記述されているヘッダ記述情報を解析し、前記断片と前記断片内の前記テキスト文から参照される前記ヘッダ記述情報との関係を表す参照関係情報を生成する参照関係解析部と、
前記断片化情報と前記参照関係情報とを含んだ断片化テキスト文書送出情報を生成し、前記取得部によって取得された前記テキスト文書データに前記断片化テキスト文書送出情報を付加して、情報付加済テキスト文書データとして出力する送出情報生成部と、
を具備することを特徴とする解析装置。 - 前記ヘッダ記述情報は、フォントの情報と、埋め込み画像の情報とスタイル定義情報と、字幕提示の領域情報と、の少なくともいずれかを含む、
請求項1に記載の解析装置。 - 断片化された字幕テキストのグループに含まれるリソースファイルの参照のためのロケーション情報を解析し、前記断片を放送により伝送する際の、前記断片に含まれる前記テキスト文から参照されるリソースファイルのロケーション情報と、前記リソースファイルの前記ロケーション情報が前記テキスト文書データのどの部分に記述されているかを示すロケーション情報記述位置指定情報と、前記リソースファイルを前記断片と共に放送により伝送する際の放送信号中のリソースの取得位置を特定するための放送の名前空間による放送ロケーション情報と、を含んだ放送ロケーション変換情報を生成する変換情報生成部、
をさらに具備し、
前記変換情報生成部は、前記リソースファイルごとに、前記リソースファイルへの参照を行っている要素を指定するidref属性を指定し、前記ロケーション情報記述位置指定情報として前記idref属性で指定した要素を起点とした前記リソースファイルを指定する属性へのパスをsrcpath属性で指定し、前記ロケーション情報として前記srcpath属性で指定した属性の値をsrcvalue属性で指定し、前記放送の名前空間による放送ロケーション情報として前記リソースファイルを放送で伝送した場合に当該リソースファイルを放送信号中から取得できるようにするための放送の名前空間によるリソースのロケーションをreplaceto属性で指定するものであり、
前記送出情報生成部は、前記放送ロケーション変換情報をも含んだ断片化テキスト文書送出情報を生成し、前記取得部によって取得された前記テキスト文書データに前記放送ロケーション変換情報をも含んだ前記断片化テキスト文書送出情報を付加して、情報付加済テキスト文書データとして出力する、
ことを特徴とする請求項1または2に記載の解析装置。 - 前記リソースファイルは、画像ファイルと、音声ファイルと、非組込フォントファイルと、のいずれかを含む、
請求項3に記載の解析装置。 - 時刻情報が付加された複数のテキスト文を含むテキスト文書データに加え、前記時刻情報に基づいて前記テキスト文書データを前記テキスト文の複数のグループに断片化するための断片化情報であって、各断片の開始時刻を表す断片化情報または各断片に含まれる前記テキスト文のID情報として指定される断片化情報、と、前記断片化された前記テキスト文のグループである断片ごとに、前記断片内の前記テキスト文から参照される前記テキスト文書のヘッダ記述との関係を表す参照関係情報とを含んだ断片化テキスト文書送出情報を読み込み、前記断片化情報に基づいて前記テキスト文書データを前記テキスト文の複数のグループに分割するとともに、前記参照関係情報に基づいて、分割された断片である前記テキスト文のグループに、前記断片内の前記テキスト文から参照される前記テキスト文書のヘッダ記述の情報を付加する分割部と、
前記分割部によって分割された前記断片に含まれる前記テキスト文から参照されるリソースファイルを取得するリソースファイルデータ取得部と、
前記分割部によって分割された前記断片と、前記リソースファイルデータ取得部によって取得された前記リソースファイルとを含むデータを出力する出力部と、
を具備し、
前記分割部は、前記断片を放送により伝送する際の、前記断片に含まれる前記テキスト文から参照されるリソースファイルのロケーション情報と、前記リソースファイルの前記ロケーション情報が前記テキスト文書データのどの部分に記述されているかを示すロケーション情報記述位置指定情報と、前記リソースファイルを前記断片と共に放送により伝送する際の放送信号中のリソースの取得位置を特定するための放送の名前空間による放送ロケーション情報と、を含んだ放送ロケーション変換情報を更に含む、前記断片化テキスト文書送出情報を読み込み、前記放送ロケーション変換情報に基づいて、前記断片に含まれる前記テキスト文から参照される前記リソースファイルのロケーション情報を、放送の名前空間によるロケーション情報に書き換えて前記断片に分割する、
分割装置。 - 前記リソースファイルは、画像ファイルと、音声ファイルと、非組込フォントファイルと、のいずれかを含む、
請求項5に記載の分割装置。 - 前記分割部は、時刻情報が付加されたテキストを含むテキスト文書データに、前記断片化テキスト文書送出情報が付加されている情報付加済テキスト文書データを読み込み、前記断片化テキスト文書送出情報に含まれる前記断片化情報に基づいて前記テキスト文書データを、テキスト文の複数のグループに分割するとともに、前記参照関係情報に基づいて分割された断片である前記テキスト文のグループに、前記断片内の前記テキスト文から参照される前記テキスト文書のヘッダ記述の情報を付加し、
また、前記分割部は、前記断片化テキスト文書情報に前記放送ロケーション変換情報が含まれる場合は、前記放送ロケーション変換情報に基づいて、前記断片に含まれる前記テキスト文から参照される前記リソースファイルのロケーション情報を、放送の名前空間によるロケーション情報に書き換える、
ことを特徴とする請求項5または6に記載の分割装置。 - 時刻情報が付加された複数のテキスト文を含むテキスト文書データを取得する取得部と、
前記テキスト文書データを、時間軸にしたがって、
所定時間を超えるごとに区切り、または、
テキストに対応する1つのdiv要素あるいはp要素ごとに区切り、または、
伝送容量に基づいて区切り、
前記テキスト文を含む複数のグループである断片に断片化するための断片化情報であって、各断片の開始時刻を表す断片化情報または各断片に含まれる前記テキスト文のID情報として指定される断片化情報、を生成する時刻解析部と、
前記断片化された前記テキスト文のグループである断片ごとに、前記断片に含まれるテキスト文から参照される前記テキスト文書のヘッダ記述の情報を解析し、前記断片と前記断片に含まれるテキスト文から参照される前記ヘッダ記述との関係を表す参照関係情報を生成する参照関係解析部と、
前記テキスト文書データに加え、前記断片化情報と前記参照関係情報とを含んだ断片化テキスト文書送出情報を読み込み、前記断片化情報に基づいて前記テキスト文書データを前記テキスト文の複数のグループに分割するとともに、前記参照関係情報に基づいて分割
された断片である前記テキスト文のグループに前記断片に含まれるテキスト文から参照される前記テキスト文書のヘッダ記述の情報を付加する分割部と、
前記分割部によって分割された前記断片に含まれるテキスト文から参照されるリソースファイルを取得するリソースファイルデータ取得部と、
前記分割部によって分割された前記断片と、前記リソースファイルデータ取得部によって取得されたリソースファイルとを含むデータを出力する出力部と、
を具備することを特徴とする分割装置。 - 前記出力部は、前記断片に含まれる前記テキスト文に付加された前記時刻情報のうち、一番早い提示開始時刻にしたがって、分割された前記テキスト文と、前記リソースファイルとを含むデータを順次出力する、
ことを特徴とする請求項5から8までのいずれか一項に記載の分割装置。 - 請求項1から4までのいずれか一項に記載の解析装置としてコンピューターを機能させるためのプログラム。
- 請求項5から9までのいずれか一項に記載の分割装置としてコンピューターを機能させるためのプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014241172 | 2014-11-28 | ||
JP2014241172 | 2014-11-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016110645A JP2016110645A (ja) | 2016-06-20 |
JP6796376B2 true JP6796376B2 (ja) | 2020-12-09 |
Family
ID=56124495
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015230099A Active JP6796376B2 (ja) | 2014-11-28 | 2015-11-25 | 分割装置および解析装置、ならびにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6796376B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017126509A1 (ja) * | 2016-01-19 | 2017-07-27 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
CN109479154B (zh) * | 2016-07-26 | 2021-11-05 | 索尼公司 | 发送装置、发送方法、接收装置和接收方法 |
KR102067446B1 (ko) * | 2018-06-04 | 2020-01-17 | 주식회사 엔씨소프트 | 자막 생성 방법 및 시스템 |
JP7201656B2 (ja) * | 2020-12-22 | 2023-01-10 | 株式会社Play | 字幕生成装置及び字幕生成プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4099973B2 (ja) * | 2001-10-30 | 2008-06-11 | 松下電器産業株式会社 | 映像データ送信方法及び映像データ受信方法、並びに映像監視システム |
JP3990671B2 (ja) * | 2004-01-06 | 2007-10-17 | 富士通株式会社 | 情報管理装置および情報管理方法 |
JP2006238147A (ja) * | 2005-02-25 | 2006-09-07 | Toshiba Corp | コンテンツ再生装置、字幕再生方法及びプログラム |
JP4899476B2 (ja) * | 2005-12-28 | 2012-03-21 | 富士通株式会社 | 分割プログラム、連結プログラム、情報処理方法 |
-
2015
- 2015-11-25 JP JP2015230099A patent/JP6796376B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016110645A (ja) | 2016-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9769526B2 (en) | Transmission and reception apparatuses, methods, and systems for filtering content | |
JP3880517B2 (ja) | 文書処理方法 | |
JP6796376B2 (ja) | 分割装置および解析装置、ならびにプログラム | |
US20080147823A1 (en) | Structured data receiving apparatus, receiving method, reviving program, transmitting apparatus, and transmitting method | |
JP6444016B1 (ja) | 送信装置および受信装置、ならびにプログラム | |
JP5414792B2 (ja) | リッチメディアサービスを提供する方法及び装置 | |
US20120301110A1 (en) | Image processing apparatus method and computer program product | |
EP1244309A1 (en) | A method and microprocessor system for forming an output data stream comprising metadata | |
US20140181882A1 (en) | Method for transmitting metadata documents associated with a video | |
JP3932120B2 (ja) | 構造化データの受信プログラム、構造化データの受信装置、及び構造化データの受信方法 | |
JP3932121B2 (ja) | 構造化データの受信プログラム、構造化データの受信装置、及び構造化データの受信方法 | |
JP3932123B2 (ja) | 構造化データの受信プログラム、構造化データの受信装置、及び構造化データの受信方法 | |
JP2005063453A (ja) | 構造化データの送信装置 | |
KR20050015070A (ko) | 내용 기반 검색을 위한 방송 프로그램 송수신 장치 및 방법 | |
AU2001268839A1 (en) | Delivering multimedia descriptions | |
JP2005011374A (ja) | 構造化データの送信装置 | |
JP2005044374A (ja) | 構造化データの送信装置 | |
JP2005063452A (ja) | 構造化データの送信装置 | |
JP2005063451A (ja) | 構造化データの送信装置 | |
JP2005038441A (ja) | 構造化データの送信装置 | |
KR20090026707A (ko) | 엠피이쥐-2 티에스를 이용한 메타 데이터 전송방법 및인코더, 디코더 | |
JP2004318795A (ja) | 構造化データの受信方法 | |
JP2004318796A (ja) | 構造化データの受信方法 | |
JP2004318797A (ja) | 構造化データの受信方法 | |
JP2004318771A (ja) | 構造化データの受信装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181001 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20181026 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190719 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191001 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200407 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200525 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200612 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201020 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201116 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6796376 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |