JP5713140B1 - 受信装置、およびデータ処理方法 - Google Patents

受信装置、およびデータ処理方法 Download PDF

Info

Publication number
JP5713140B1
JP5713140B1 JP2014246864A JP2014246864A JP5713140B1 JP 5713140 B1 JP5713140 B1 JP 5713140B1 JP 2014246864 A JP2014246864 A JP 2014246864A JP 2014246864 A JP2014246864 A JP 2014246864A JP 5713140 B1 JP5713140 B1 JP 5713140B1
Authority
JP
Japan
Prior art keywords
data
ttml
subtitle
information
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014246864A
Other languages
English (en)
Other versions
JP2015216621A (ja
Inventor
北里 直久
直久 北里
淳 北原
淳 北原
義治 出葉
義治 出葉
山岸 靖明
靖明 山岸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2014246864A priority Critical patent/JP5713140B1/ja
Application granted granted Critical
Publication of JP5713140B1 publication Critical patent/JP5713140B1/ja
Publication of JP2015216621A publication Critical patent/JP2015216621A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】TTML字幕データの確実な表示制御を実現する装置、方法を提供する。【解決手段】TTML字幕データをMMTフォーマットにおいて規定されるMMTパケットのペイロードとして格納したTTML字幕データ格納パケットと、TTML字幕データに対応する字幕対応情報をシグナリング・メッセージとして送信装置から受信装置に送信する。シグナリング・メッセージは、字幕表示タイミングの制御モードであるタイムモード(TMD)や、字幕の即時表示やTTML記述に従った表示等を選択的に実行させる動作モード(OPM)を規定しており、受信装置はモード指定に応じた表示制御が可能となる。【選択図】図24

Description

本開示は、受信装置、およびデータ処理方法に関する。さらに詳細には例えば放送波を介したデータの送信または受信を実行する受信装置、およびデータ処理方法に関する。
映像に対して字幕を重畳して表示する方式には様々な方式があるが、表示領域や表示タイミング等の制御を可能としたXML(Extensible Markup Language)形式の字幕データであるTTML(Timed Text Markup Language)の利用が多くなってきている。
TTMLは、HTML5等のwebアプリケーションとの連携も可能であり、また文字符号だけでなくビットマップも利用可能であるという特徴を持つ。
なお、TTMLについては、例えば特許文献1(特開2012−169885号公報)に記載がある。
特開2012−169885号公報
上記の字幕データであるTTML字幕データは、例えばVODなどにおいて利用されているが、例えばテレビ放送でTTML字幕データを配信する具体的な手法については、まだ明確な提案がなされていない。
本開示は、TTML字幕データを、放送波を介して送受信し、受信側においてTTML字幕データに基づく様々な字幕表示制御を行うことを可能とした受信装置、およびデータ処理方法を提供することを目的とする。
本開示の第1の側面は、
TTML(Timed Text Markup Language)字幕データをMMT(MPEG Media Transport)フォーマットにおいて規定されるMMTパケットのペイロードとして格納したTTML字幕データ格納パケットと、
前記TTML字幕データに対応する字幕対応情報をシグナリング・メッセージとして受信する通信部と、
前記TTML字幕データと、前記シグナリング・メッセージを適用した字幕表示制御を実行するデータ処理部を有し、
前記シグナリング・メッセージは、MMTフォーマットにおいて規定されるMPT(MMTパッケージテーブル)に字幕対応情報を記録したメッセージであり、
前記MPTは、字幕表示タイミングを規定したタイムモード(TMD)の設定情報を含み、
前記データ処理部は、前記MPTに記録されたタイムモード(TMD)の設定モードに応じた字幕表示タイミングの制御を実行する受信装置にある。
さらに、本開示の第2の側面は、
受信装置において実行するデータ処理方法であり、
通信部が、TTML(Timed Text Markup Language)字幕データをMMT(MPEG Media Transport)フォーマットにおいて規定されるMMTパケットのペイロードとして格納したTTML字幕データ格納パケットと、
前記TTML字幕データに対応する字幕対応情報をシグナリング・メッセージとして受信し、
データ処理部が、前記TTML字幕データと、前記シグナリング・メッセージを適用した字幕表示制御を実行し、
前記シグナリング・メッセージは、MMTフォーマットにおいて規定されるMPT(MMTパッケージテーブル)に字幕対応情報を記録したメッセージであり、
前記MPTは、字幕表示タイミングを規定したタイムモード(TMD)の設定情報を含み、
前記データ処理部は、前記MPTに記録されたタイムモード(TMD)の設定モードに応じた字幕表示タイミングの制御を実行するデータ処理方法にある。
本開示のさらに他の目的、特徴や利点は、後述する本開示の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。
本開示の一実施例の構成によれば、TTML字幕データの確実な表示制御を実現する装置、方法が実現される。
具体的には、TTML字幕データをMMTフォーマットにおいて規定されるMMTパケットのペイロードとして格納したTTML字幕データ格納パケットと、TTML字幕データに対応する字幕対応情報をシグナリング・メッセージとして送信装置から受信装置に送信する。シグナリング・メッセージは、字幕表示タイミングの制御モードであるタイムモード(TMD)や、字幕の即時表示やTTML記述に従った表示等を選択的に実行させる動作モード(OPM)を規定しており、受信装置はモード指定に応じた表示制御が可能となる。
本構成により、TTML字幕データの確実な表示制御を実現する装置、方法が実現される。
なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また付加的な効果があってもよい。
本開示の処理を実行する通信システムの一構成例について説明する図である。 MMTフォーマットのスタック・モデルを示す図である。 送信装置の構成例について説明する図である。 受信装置の構成例について説明する図である。 MMTパケットの構成について説明する図である。 MMTパケットの構成について説明する図である。 MMTフォーマットに従ったデータ伝送について説明する図である。 MMTフォーマットに従ったデータ伝送について説明する図である。 PAメッセージについて説明する図である。 MPT(MMTパッケージテーブル)について説明する図である。 MPT(MMTパッケージテーブル)について説明する図である。 MPT(MMTパッケージテーブル)について説明する図である。 送信装置から受信装置に対して送信するデータについて説明する図である。 送信装置から受信装置に対して送信する字幕関連データについて説明する図である。 TTML字幕データの構成と利用例について説明する図である。 MPTに記録される字幕関連情報について説明する図である。 MPTに記録される字幕タイプについて説明する図である。 MPTに記録されるタイムモードについて説明する図である。 MPTに記録される表示モードについて説明する図である。 MPTに記録される動作モードについて説明する図である。 MPTに記録される表示書式について説明する図である。 MPTに記録される圧縮モードについて説明する図である。 MH−EIT(Event Information Table)の構造について説明する図である。 TMD=1:TTML記述+EIT starttimeのモード設定時の処理について説明する図である。 UTC−NPT−reference/EMTのデータ構造について説明する図である。 TMD=2:TTML記述+NPTのモード設定時の処理について説明する図である。 TMD=3:TTML記述+絶対時刻のモード設定時の処理について説明する図である。 TMD=4:TTML記述+reference starttimeのモード設定時の処理について説明する図である。 TMD=4:TTML記述+reference starttimeのモード設定時の処理について説明する図である。 MPUタイムスタンプ記述子について説明する図である。 TMD=5:TTML記述+MPU_time stampのモード設定時の処理について説明する図である。 TMD=8:MPU_time stampのモード設定時の処理について説明する図である。 TMD=15:時刻制御なしのモード設定時の処理について説明する図である。 OPM=0:ライブモードのモード設定時の処理について説明する図である。 OPM=1:セグメンテーションモードのモード設定時の処理について説明する図である。 OPM=2:プログラムモードのモード設定時の処理について説明する図である。 送信装置の実行する処理シーケンスについて説明するフローチャートを示す図である。 受信装置の実行する処理シーケンスについて説明するフローチャートを示す図である。 通信装置である送信装置と受信装置のハードウェア構成例について説明する図である。
以下、図面を参照しながら本開示の受信装置、および送信装置、並びにデータ処理方法の詳細について説明する。なお、説明は以下の項目に従って行なう。
1.通信システムの構成例について
2.送信装置、受信装置の構成と、MMT(MPEG Media Transport)について
3.MMTフォーマットの詳細について
4.MPT(MMTパッケージテーブル)について
5.送信装置から受信装置に送信されるデータとTTML字幕データの概要について
6.MPT(MMTパッケージテーブル)に記録される字幕対応情報について
7.タイムモード(TMD)の各モード対応の具体的処理について
7−1.TMD=1:TTML記述+EIT starttimeのモード設定時の処理について
7−2.TMD=2:TTML記述+NPTのモード設定時の処理について
7−3.TMD=3:TTML記述+絶対時刻のモード設定時の処理について
7−4a.TMD=4:TTML記述+reference starttimeのモード設定時の処理について(例1)
7−4b.TMD=4:TTML記述+reference starttimeのモード設定時の処理について(例2)
7−5.TMD=5:TTML記述+MPU timestampのモード設定時の処理について
7−6.TMD=8:MPU timestampのモード設定時の処理について
7−7.TMD=15:時刻制御なしのモード設定時の処理について
8.動作モード(OPM)の各モード対応の具体的処理について
8−1.OPM=0:ライブモードのモード設定時の処理について
8−2.OPM=1:セグメンテーションモードのモード設定時の処理について
8−3.OPM=2:プログラムモードのモード設定時の処理について
9.送信装置と受信装置の実行する処理の処理シーケンスについて
10.送信装置と受信装置の構成例について
11.本開示の構成のまとめ
[1.通信システムの構成例について]
まず、図1を参照して本開示の処理を実行する通信システムの一構成例について説明する。
図1に示すように、通信システム10は、画像データや音声データ、さらに字幕データ、さらに各種の制御情報等のデータを送信する通信装置である送信装置20と、送信装置20の送信するデータを受信する通信装置である受信装置30を有する。
送信装置20は、具体的には、例えば放送局21等、様々な番組等のコンテンツを提供する側の装置である。
一方、受信装置30は、一般ユーザのクライアント装置であり、具体的には、例えばテレビ31、PC32、携帯端末33等によって構成される。
送信装置20と受信装置30間のデータ通信は、放送波による一方向通信として行われる。
送信装置20から受信装置30に対するデータ送信は、主にMMT(MPEG Media Transport)フォーマットに従って実行される。
MMTフォーマットは、画像(Video)、音声(Audio)、字幕(Subtitle)等、コンテンツ構成データである符号化データを放送波やネットワークを介して伝送する際のデータ転送方式(トランンスポートフォーマット)を規定したものである。
送信装置20は、コンテンツデータを符号化し、符号化データおよび符号化データのメタデータを含むデータファイルを生成し、生成した符号化データをMMTにおいて規定されるMMTパケットに格納して放送波、またはネットワークを介して送信する。
送信装置20が受信装置30に提供するデータは、画像、音声、字幕等の再生対象データの他、番組ガイド等の案内情報や通知情報、制御情報等によって構成される。
[2.送信装置、受信装置の構成と、MMT(MPEG Media Transport)について]
上述したように、送信装置20から受信装置30に対するデータ送信は、主にMMT(MPEG Media Transport)フォーマットに従って実行される。
図2以下を参照して、送信装置、受信装置の構成と、MMT(MPEG Media Transport)についてMMTフォーマットを利用したデータ送受信処理の詳細について説明する。
図2は、MMTフォーマットのスタック・モデルを示す図である。
図2に示すMMTスタック・モデルにおいて、最下層には、物理レイヤ(PHY)がある。物理レイヤは、放送系の処理を行なうブロードキャスト(Broadcasting)レイヤと、ネットワーク系の処理を行なうブロードバンド(Broadband)レイヤに分割されている。
MMTは放送系、ネットワーク系の2つの通信網を利用した処理を可能としている。
放送系の処理を行なうブロードキャスト(Broadcasting)レイヤの上位レイヤとして、TLV(Type Length Value)レイヤがある。TLVはIPパケットの多重化方式を規定したフォーマット規定レイヤである。複数のIPパケットが多重化されてTLVパケットとして送信される。TLV−SIは、TLVフォーマットに従ったシグナリング・メッセージの伝送レイヤである。
シグナリング・メッセージは、受信装置30側においてコンテンツ(番組)を受信するために必要となる設定情報や、番組ガイド等の案内情報や通知情報、制御情報等によって構成される。
TLBレイヤで処理が生成されるTLVパケットに格納されるシグナリング・メッセージがTLV−SIであり、MMTパケットに格納されるシグナリング・メッセージは最上位レイヤに示すMMT−SIである。
TLVレイヤ上には、UDP/IPレイヤが設定される。
UDP/IPレイヤは、詳細にはIPレイヤとUDPレイヤに分割可能であるが、IPパケットのペイロードにUDPパケットを格納する伝送を規定するレイヤである。
UDP/IPレイヤ上にMMTレイヤ、およびFile delivary methodレイヤ が設定される。
MMTパケットをIPパケットに格納して送信する場合と、MMTパケットを用いないデータ伝送方式であるFile delivary methodを利用してIPパケットとしてデータ送信する方式が併用可能な設定となっている。
MMTレイヤ上には、以下のレイヤが設定される。
画像コーデックとしてのHEVC、その上位に画像(Video)データ、
音声コーデックとしてのAAC、その上位に音声(Audio)データ、
MMTパケットを利用して送信されるシグナリング・メッセージ(MMT−SI)、
字幕(Subtitle)データ、
番組情報であるEPG(Electronic Program Guide)。
これらの各データがMMTパケットに格納されて送信される。
なお、Time(NTP:Network Time Protocol)は絶対時刻情報であり、UDPパケットに直接格納され送信される。
その他のデータ配信を行うデータサービス(Data service)、コンテンツダウンロード等(Contentdownload,etc.)がMMTと異なるファイル配信メソッド(File delivary method)を利用して配信可能な構成を有している。
図3は、図1に示した送信装置20の構成例を示している。
図3に示すように、送信装置20は、コンテンツ提供部51、情報処理部52、クロック信号生成部(NTP)53、画像データ処理部54、音声データ処理部55、字幕データ処理部56、主にMMTパケット格納のシグナリング・メッセージに対する処理を行なうシグナリング・メッセージ処理部57、TLVパケット格納のシグナリング・メッセージに対する処理を行なうTLVシグナリング・メッセージ処理部58、IPサービスマルチプレクサ(MUX)59、TLVマルチプレクサ(MUX)60、通信部(変調・送信部)61を有する。
コンテンツ提供部51は、例えば番組コンテンツを格納した記憶部によって構成される。その他、生中継(Live)等の場合には、テレビカメラ、マイク等のデータ取得部によって構成される場合もある。あるいはコンテンツを供給する外部サーバ等との通信部として構成される場合もある。
コンテンツ提供部51は、画像、音声、字幕等のコンテンツをそれぞれ画像データ処理部54、音声データ処理部55、字幕データ処理部56に出力する。
なお、字幕データは、情報処理部52において生成される場合もある。
情報処理部52は、コンテンツ提供部51の提供するコンテンツに関する字幕の生成や、制御情報の生成、案内情報の生成等、コンテンツ提供部51の提供するコンテンツを受信装置30において確実に受信し、再生するために必要となる情報(シグナリング・メッセージ)等を生成する。
情報処理部52の生成した字幕データは字幕データ処理部56に提供される。シグナリング・メッセージは、シグナリング・メッセージ処理部57、TLVシグナリング・メッセージ処理部58に提供される。
クロック信号生成部53は、絶対時刻情報を送信するNTPサーバ(図示せず)から取得した時刻情報に同期した時刻情報を生成し、この時刻情報を含むIPパケットをIPサービスマルチプレクサ59に送る。
さらに、クロック信号生成部53の生成したクロック信号は、画像データ処理部54、音声データ処理部55、字幕データ処理部56にも出力され、画像データ処理部54、音声データ処理部55、字幕データ処理部56では、クロック情報を設定したIPパケットを生成する。
画像データ処理部54は、コンテンツ提供部51から送出される画像信号を符号化し、さらにパケット化して、画像データを格納したMMTパケットを含むIPパケットをIPサービスマルチプレクサ59に送る。また、音声データ処理部54は、コンテンツ提供部51から送出される音声信号を符号化し、さらにパケット化して、オーディオのMMTパケットを含むIPパケットをIPサービスマルチプレクサ59に送る。
また、字幕データ処理部56は、コンテンツ提供部51、または情報処理部52から送出される字幕データを符号化し、さらにパケット化して、字幕のMMTパケットを含むIPパケットをIPサービスマルチプレクサ59に送る。
なお、本開示の構成では、字幕データは表示領域や表示タイミング等の制御を可能としたXML(Extensible Markup Language)形式の字幕データであるTTML(Timed Text Markup Language)を用いる。
TTML字幕データの詳細については後段で説明する。
シグナリング・メッセージ処理部57は、情報処理部52から送出される情報に基づいてシグナリング・メッセージを生成し、ペイロード部にこのシグナリング・メッセージが配置されたMMTパケットを含むIPパケットを生成してIPサービスマルチプレクサ59に送る。
TLVシグナリング・メッセージ処理部58は、情報処理部52から送出される情報に基づいてシグナリング・メッセージを生成し、ペイロード部にこのシグナリング・メッセージが配置されたTLVパケットを生成してTLVマルチプレクサ60に送る。
送信装置20は、送出するチャンネル(放送チャンネル)毎にIPサービスマルチプレクサ59を装備する。1つのチャンネルのIPサービスマルチプレクサ59は、各データ処理部54〜57から送られてくるビデオ、オーディオ、字幕、シグナリング・メッセージの各々を含むIPパケットを生成して、TLVマルチプレクサ60に送る。
TLVマルチプレクサ60は、IPサービスマルチプレクサ59から出力されるIPパケット、およびTLVシグナリング・メッセージ処理部58から出力されるTLVシグナリング・メッセージの多重化処理を行ない、これらのデータを含むTLVパケットを生成して通信部61に出力する。
通信部61は、TLVマルチプレクサ60で生成されたTLVパケットに対してRF変調処理等を行なって放送波として出力する。
図4は、図1に示した受信装置30の構成例を示している。図4に示す受信装置30は、通信部71、デマルチプレクサ72、デマルチプレクサ72の構成要素であるTLV処理部73、UDP/IP処理部74、MMT処理部75、MMT−SIフィルタ76、TLV−SIフィルタ77を有する。
さらに、クロック信号生成部78、画像データ処理部79、音声データ処理部80、字幕データ処理部81、制御部82、重畳部83を有する。
通信部(チューナー・復調部)71は、RF変調信号を受信して、復調処理を行なって、放送ストリームを得る。デマルチプレクサ72は、この放送ストリームに対して、デマルチプレクス処理およびでパケット分離処理を行なう。
デマルチプレクサ72の構成要素であるTLV処理部73、UDP/IP処理部74、MMT処理部75、MMT−SIフィルタ76、TLV−SIフィルタ77、これらの各要素の処理によって、例えば以下の各MMTパケット、シグナリング・メッセージを得て、それぞれの処理部に出力する。
(1)IPバケットに格納されたNTP時刻情報をクロック信号生成部78に出力する。
(2)MMTパケットに格納された画像データを画像データ処理部79に出力する。
(3)MMTパケットに格納された音声データを音声データ処理部80に出力する。
(4)MMTパケットに格納された字幕データを字幕データ処理部81に出力する。
(5)MMTパケットまたはTLVパケットに格納されたシグナリング・メッセージを制御部82に出力する。
なお、MMT−SIフィルタ76は、MMTパケットに格納されたMMTシグナリング・メッセージを選択し、TLV−SIフィルタ77はTLVパケットに格納されたTLVシグナリング・メッセージを選択して出力する。
シグナリング・メッセージは、繰り返し、同じメッセージが送信されるので、各フィルタは、パケットに設定されたバージョンを確認して、既に取得済みのものは取得せず、新規のバージョンのシグナリング・メッセージを選択取得して制御部82に出力する。
制御部82は、デマルチプレクサ72で得られるシグナリング・メッセージや、ユーザ操作部(図示せず)を介したユーザからの操作情報などに基づいて、受信装置30の各部の動作を制御する。
制御部82が取得したシグナリング・メッセージは、画像データ処理部79、音声データ処理部80、字幕データ処理部81のそれぞれに入力され、各データ処理部における処理に適用される。
クロック信号生成部78は、デマルチプレクサ72で得られるNTP時刻情報に基づいて、この時刻情報に同期した時刻情報を生成する。
なお、クロック信号生成部78の生成したクロック信号は、画像データ処理部79、音声データ処理部80、字幕データ処理部81のそれぞれに入力され、各データ処理部の生成データの同期出力が可能となる。
画像データ処理部79は、デマルチプレクサ72で得られる符号化画像信号のデコード処理等を実行して、出力画像信号を生成する。また、音声データ処理部405は、デマルチプレクサ72で得られる符号化音声信号のデコード処理等を実行して出力音声信号を生成する。また、字幕データ処理部81は、デマルチプレクサ72で得られる符号化字幕信号をデコードして、字幕の表示信号を得る。
なお、字幕データ処理部81は、字幕の表示タイミングや表示領域等を決定する字幕出力制御を行い、決定した表示タイミングで字幕を重畳部83に出力する。
この表示制御処理の詳細については後段で説明する。
クロック信号生成部78の生成したクロック信号は、画像データ処理部79、音声データ処理部80、字幕データ処理部81のそれぞれに入力され、各データ処理部の生成データは同期して出力される。
重畳部83は、画像データ処理部76の生成した画像信号に対して、字幕データ処理部81の生成した字幕データを重畳して出力する処理を行なう。
なお、前述したように、本開示の構成では、字幕データは表示領域や表示タイミング等の制御を可能としたXML(Extensible Markup Language)形式の字幕データであるTTML(Timed Text Markup Language)を用いる。
TTML字幕データの詳細については後段で説明する。
[3.MMTフォーマットの詳細について]
図1に示した通信システム10では、送信装置20から受信装置30へ放送信号を伝送する際のトランスポート方式として、主にMMTを適用することを想定している。
トランスポート方式としてMMTを利用する場合、データはMMTパケットに格納して送信することになる。
MMTパケットの構成について、図5以下を参照して説明する。
MMTパケットは、MMTプロトコルを用いて伝送されるようにフォーマットされたメディア・データのユニットである。
図5(a)はMMTパケットの全体構成を示す図である。
パケット・カウンタ・フラグ「C」に1が代入されていると、Cからの矢印として示すパケット・カウンタのフィールドがこのMMTパケット内に存在することが表される。パケット・カウンタは、MMTパケットをカウントした整数値を書き込む32ビット長のフィールドであり、MMTパケットを送信する度に1ずつインクリメントされる。
拡張フラグ「X」に1が代入されていると、矢印で示す拡張ヘッダが存在することが表される。図5(b)には、拡張ヘッダの構成例を示している。拡張ヘッダは、16ビット長のtypeフィールドと、lengthフィールドと、header_extensin_valueフィールドで構成される。lengthフィールドには、header_extensin_valueフィールドのバイト長が書き込まれる。header_extensin_valueフィールドには、MMTの仕様から外れた拡張情報を書き込むことができる。
typeフィールドには、当該MMTパケットのペイロード・データのタイプを表すタイプ値が書き込まれる。タイプ値の定義は以下の通りである。
0x00:MPU
0x01 Generic object
0x02:signaling message
0x00:repair symbol
type=0x00の場合のペイロードは、メディアプレゼンテーションユニット(MPU:Media presentation unit)である。MPUは、例えば画像、音声、字幕等の1つの単位として設定されるユニットである。例えば、画像の場合、1ピクチャが1MPUとなる。字幕の場合、1つのTTMLファイルを1MPUとして設定する。
なお、1MPUは、必要に応じて複数のメディアフラグメントユニット(MFU:Media Fragment unit)に分割されてMMTパケットに格納される。
type=0x02の場合のペイロードは、シグナリング・メッセージ(signzling message)である。これは受信装置側の設定情報、通知情報、案内情報、あるいは送信データ(画像、音声、字幕)に関する属性情報、制御情報等から構成される。
その他のタイプについては本開示の処理とは、直接関係しないので説明を省略する。
RAP(Random Access Point)フラグに1が代入されていると、当該MMTパケットのペイロードが当該データ・タイプのデータ・ストリームへのRandom Access Pointを含んでいることを表す。
16ビット長のpacket_idフィールドには、アセットを区別するための整数値が書き込まれる。このフィールドの値は、当該MMTパケットが属するアセットのasset_idに由来する。
パケット識別子(packet_id)と、アセット識別子(asset_id)のマッピングは、シグナリング・メッセージの一部であるMPT(MMTパッケージテーブル)で示されている。
MPTの詳細については後段で説明する。
なお、アセットは、信号系列に対応して設定されるデータ単位である。画像データ、音声データ、字幕データ、それぞれが異なるアセットとして設定される。さらに、画像データの中に複数の異なる画像データ、例えば多視点画像等を送信する場合、カメラ1の撮影画像をアセット1、カメラ2の撮影画像をアセット2等のように異なるアセットとして設定される。
字幕データの場合、字幕の種類に応じた個別のアセットが設定される。
なお、字幕の種類とは、日本語や英語等の言語種類のみならず、字幕タイプや、字幕の表示タイミングを規定したタイムモード等、様々な要素によって区別され、これら各要素が同一要素からなるTTML字幕データを1つのアセットとする。
32ビット長のtimestampフィールドには、MMTパケットの送信時間が、NTPプロトコルで規定されているshort−formatで記載される。
32ビット長のpacket_sequence_numberフィールドには、同一のpacket_idを持つパケットを識別するための整数値(MMT伝送路上でのシーケンス番号)が記載される。
32ビット長のpacket_counterフィールドには、MMTパケットの通し番号が記載される。
図6(c)には、画像、音声、字幕等の1単位ユニットであるMPU、あるいはその分割データであるMFUを格納したMMTパケットのペイロード構成例を示している。MPU、あるいはその分割データであるMFUを格納したMMTパケットをMPUモードのMMTパケットと呼ぶ。これは、MMTヘッダのtypeフィールドに「0x00」が書き込まれている場合である。MPUモードのMMTパケットは、画像、音声、字幕等のデータ伝送に使用される。
MPU Fragment Type(FT)フィールドには、フラグメントのタイプが4ビットの値で示される。FT値の定義は、以下の通りである。
0:MPUメタデータ
1:ムービーフラグメントメタデータ
2:MFU
Timed(T)フラグに1が記入されているときには、タイムド・メディアを伝送するMPUがフラグメントされていることを示し、0が記入されているときには、ノンタイムド・メディアを伝送するMPUがフラグメントされていることを示す。
MMTパケットを利用したデータ伝送では、ストリーム・メディアである映像や音声などのタイムド・メディア(Timed media)と、ファイルのようなノンタイムド・メディア(Non timed media)の両方を伝送することが可能である。
Timed(T)フラグは、MPUがタイムド・メディアであるかノンタイムド・メディアであるかを識別するフラグである。
Fragmentation Identifier(f_i)フィールドは、ペイロード内のデータ・ユニットのフラグメンテーションに関する情報を、2ビットで表す。f_iの4つの値の定義は以下の通りである。
0: 整数個のデータユニット(MPU)を格納している。
1:データユニット(MPU)の最初のフラグメント(MFU)を格納している。
2:データユニット(MPU)の中間のフラグメント(MFU)を格納している。
3:データユニット(MPU)の最後のフラグメント(MFU)を格納している。
8ビット長のfragment_counterフィールドには、当該MMTペイロードが続く同じデータ・ユニットのフラグメントを含んでいるペイロードの数が記載される。
16ビット長のDU_lengthフィールドには、当該フィールドに続くデータ(DU:Data Unit)の長さが記載される。但し、Aフラグが0のときは、DU_lengthフィールドはない。
DU_Headerは、データ・ユニットのヘッダである。但し、FT値が0または1のとき(言い換えれば、MFUでないとき)には、DU_Headerはない。MFUは、タイムド・メディアのサンプル若しくはサブサンプル、または、ノンタイムド・メディアのアイテムを含んでいる。
DU_payloadには、MPUやその分割データであるMFUが格納される。具体的には、画像や音声、字幕等の符号化データである。字幕データの場合、本開示の構成では、TTML(Timed Text Markup Language)を用いる。TTML字幕データの詳細については後段で説明する。
図6(d)には、ペイロードにタイムド・メディアを配置したMFUのDU_Headerの構成例を示している。また、図6(e)には、ペイロードにノンタイムド・メディアを配置したMFUのDU_Headerの構成例を示している。図6(e)に示すように、ノンタイムド・メディアの場合のDU_Headerは、当該MFUの一部として伝送されるアイテムの識別子である32ビット長のitem_IDで構成される。アイテムは、HTML文書データや、HTML文書から参照されるモノメディア・データなどの、アプリケーションを構成するリソースである。asset_idで指定されたMMT伝送路上では、上述したMMTパケットのヘッダ内のpacket_idおよび拡張ヘッダ内のdownload_idと、DUヘッダ内のitem_IDの組み合わせで、アイテムを一意に特定することができる。
前述したように、図5に示すMMTパケットのヘッダに設定されるtypeは、ペイロードが画像、音声、字幕等によって構成されるMPUであるか、シグナリング・メッセージであるかを識別可能なタイプ情報である。
type=0x00の場合のペイロードは、画像、音声、字幕等によって構成されるメディアプレゼンテーションユニット(MPU:Media presentation unit)である。
type=0x02の場合のペイロードは、シグナリング・メッセージ(signzling message)である。
図7は、MPUを格納したパケットの構成と、シグナリング・メッセージを格納したパケット構成例を説明する図である。
(A)画像データ(MPU)
(B)字幕データ(MPU)
(C)シグナリンクデータ
これらのパケット構成例を示している。
(A),(B)には画像、字幕のMPUの例を示しているが、MPUは、例えば画像、音声、字幕等の1つの単位として設定されるユニットである。例えば、画像の場合、1ピクチャが1MPUとなる。字幕の場合、1つのTTMLファイルを1MPUとして設定する。
1つのMPUは、必要に応じて複数のメディアフラグメントユニット(MFU:Media Fragment unit)に分割されてMMTパケットに格納される。
MMTパケットはUDPパケットに格納され、さらに、UDPパケットはIPパケットに格納される。
さらに、図示していないがIPパケットは、TLVパケットに格納されて送信される。
一方、type=0x02の場合のペイロードは、(C)シグナリング・メッセージ(signzling message)である。これは受信装置側の設定情報、通知情報、案内情報、あるいは送信データ(画像、音声、字幕)に関する属性情報、制御情報等から構成される。
シグナリング・メッセージは、MPU/MFUといったユニット設定とはならず、例えばシーケンス番号等によって順番が規定されてMMTパケットに格納される。
MMTパケットはUDPパケットに格納され、さらに、UDPパケットはIPパケットに格納される。
さらに、図示していないがIPパケットは、TLVパケットに格納されて送信される。
なお、本開示の構成では、字幕データはTTML(Timed Text Markup Language)を用いる。
TTMLファイルは、画像データに比較するとデータ量が小さいため、分割(フラグメント)する必要がない場合が多い。したがって、例えば図8に示すように、TTML字幕データを含む1つのTTMLファイルを1MPUとして、このMPUをそのままMMTパケットに格納して送信することが多い、
[4.MPT(MMTパッケージテーブル)について]
本開示において、MMTパケットを適用して送信する字幕データは、TTMLと字幕データであり、この字幕データに対する表示制御等の制御情報をシグナリング・メッセージとして送信する。
字幕データに対する制御情報を含むシグナリング・メッセージとしてMPT(MMTパッケージテーブル)がある。
以下、MPT(MMTパッケージテーブル)について説明する。
MMTプロトコルで使用されるシグナリング・メッセージは、データの伝送制御や受信装置側でのデータ復号、再生処理等に必要な情報を含む。
MMTのシグナリング・メッセージは、3つの共通するフィールドと、シグナリング・メッセージ・タイプ毎の特定の1つのフィールドと、メッセージ・ペイロードからなる一般的なフォーマットを使用する。メッセージ・ペイロードは、シグナリング情報を伝送する。
図9を参照して、字幕データに対する制御情報を含むシグナリング・メッセージであるMPT(MMTパッケージテーブル)を含むPAメッセージについて説明する。
PA(Packege Access)メッセージは、受信装置30側におけるデータ受信および、符号、再生処理等に必要な様々な情報を持つPAテーブルを伝送する。PAテーブルには、複数のテーブルが含まれ、その1つとしてMPT(MMTパッケージテーブル)が含まれる。
図9の右側に示すPAメッセージのデータ構造について説明する。
message_idは、各種シグナリング情報において、PAメッセージを識別する16ビットの固定値である。
versionは、PAメッセージのバージョンを示す、8ビットの整数値のパラメーターである。例えばMPTを構成する一部のパラメーターでも更新した場合には、versionは+1だけインクリメントされる。lengthは、このフィールドの直後からカウントされる、当該PAメッセージのサイズをバイト単位で示す、32ビット長のパラメーターである。
extensionフィールドには、payloadのフィールドに配置される各テーブルのインデックス情報が配置される。このフィールドには、8ビットのtable_idと、8ビットのtable_versionと、16ビットのtable_lengthが配置される。
PAメッセージのpayloadフィールドには、各テーブルの詳細情報が記録される。
MPT(MMTパッケージテーブル)の詳細情報もここに記録される。
次に、図10〜図13を参照してMPT(MMTパッケージテーブル)のデータ構造について説明する。
MPT(MMTパッケージテーブル)の構成は、前段部、中段部、後段部の3つに分割し、各々を図10〜図12に分けて示している。
MPT先頭部分の構成について、図10を参照して説明する。
table_idは、各種シグナリング情報においてMPTであることを識別する8ビットの固定値である。
versionは、MPTのバージョンを示す8ビットの整数値である。例えば、MPTを構成する一部のパラメーターでも更新した場合には、versionは+1だけインクリメントされる。lengthは、このフィールドの直後からカウントされる、MPTのサイズをバイト単位で示す、32ビット長のパラメーターである。
MMT_package_idは、放送信号で伝送されるすべての信号(ビデオ、オーディオ、字幕)、並びにファイルなどのアセットを構成要素とする全体のパッケージとしての識別情報である。この識別情報は、テキスト情報である。
MMT_package_id_lengthは、そのテキスト情報のサイズをバイト単位で示す。
MP_table_descriptorsのフィールドは、パッケージ全体に関わる記述子の格納領域である。
MPT_table_descriptor_lengthは、そのフィールドのサイズN2をバイト単位で示す、16ビット長のパラメーターである。そして、MP_table_descriptorは、様々な目的の記述子を規定した上で、N2バイト分(1つ又は複数配置)することを想定している。
次に、図11を参照してMPTの中間部分の構成について説明する。
number_of_assetsは、パッケージを構成する要素としてのアセット(信号、ファイル)の数を示す、8ビットのパラメーターである。number_of_assetの数分(N3)だけ、以下のループ(Asset loop)が配置される。
1つのAsset loop内には、個々のアセットの情報としてのasset_id_len、asset_id、gen_loc_info、asset_dsc_len、asset_descriptorの各パラメーターが配置される。
asset_idは、アセットをユニークに識別するテキスト情報である。
asset_id_lenは、asset_idのサイズをバイト単位で示す。
asset_clock_relation_flagは、アセットが利用するクロック、例えばアセットがTTML字幕データである場合、字幕の表示タイミングの際に参照するクロック情報等を記述する。
asset_timescaleは、アセットの参照するクロクッIDを記録する。
次に、図12を参照してMPTの後半部分の構成について説明する。
MMT_general_loc_infoは、アセットの取得先のロケーションを示す情報である。本実施形態では、アセットの取得先となる伝送路上のpacket idの形式で記述される。したがって、MPT上でasset_idを引いて、MMT伝送路上の該当するpacket IDを取り出すことができる。
asset_descriptorのフィールドは、アセットに関わる記述子の格納領域である。asset_dsc_lenは、asset_descriptorフィールドのサイズN5をバイト単位で示す。そして、asset_descriptorは、さまざまな目的の記述子を規定した上で、N5個(1つ又は複数)配置することを想定している。
ここに、アセット対応の制御情報が記録される。
アセットがTTML字幕データである場合、TTML字幕データの表示制御情報が記述される。
なお、字幕データに対応するアセットは、字幕データの種類ごとに設定される。
字幕の種類とは、日本語や英語等の言語種類のみならず、字幕タイプや、字幕の表示タイミングを規定したタイムモード等、様々な要素によって区別され、これら各要素が同一要素からなるTTML字幕データを1つのアセットとする。
PMTに記録される字幕対応の制御情報と、その利用態様については、後段で詳細に説明する。
[5.送信装置から受信装置に送信されるデータとTTML字幕データの概要について]
次に、図1に示す送信装置20から受信装置30に対して送信されるデータとTTML字幕データの概要について図13以下を参照して説明する。
図13は、送信装置20の送信データの例について説明する図である。
図13には、送信装置20が受信装置30に対して送信するデータの種類を示している。送信装置20が受信装置30に対して送信するデータには以下のデータがある。
(a)画像(Video)MPU91
(b)音声(Audio)MPU92
(c)字幕(Subtitle)MPU93〜95
(d)シグナリング・メッセージ96
これらの各データはいずれもMMTフォーマットで規定されるMMTパケットのペイロードとしてMMTパケットに格納して送信する。
(a)画像(Video)MPU91、(b)音声(Audio)MPU92、(c)字幕(Subtitle)MPU93〜95は、いずれもメディアプレゼンテーションユニット(MPU)単位のタイムド・メディアとして送信される。
字幕データはTTML字幕データであり、アセット単位で送信される。図に示す#1〜#3はアセット識別子に相当する。
アセットは前述したように字幕の種類ごとに設定され、例えば日本語、英語等の言語種別や、通常字幕や難聴者向け等の種類に応じた異なるデータ態様の字幕ごとに設定される。
シグナリング・メッセージ96は、先に説明した字幕制御用のMPT等を含む。なお、シグナリング・メッセージ96には、MPTの他、番組ガイド等の案内情報や通知情報、制御情報等によって構成される。
字幕データは、画像データに重畳して表示するデータであり、表示位置や表示タイミングの制御が必要となる。
以下、図14以下を参照して字幕データに関する処理について説明する。
図14は、図13を参照して説明した送信装置20から受信装置30に対して送信する字幕データ本体と、字幕データの制御に適用する情報を示す図である。
送信装置20から受信装置30に対して送信する字幕関連データには以下のデータがある。
字幕データ本体であるTTML字幕データを含む字幕MPU93、
TTML字幕データに対応する制御情報等を格納したシグナリング・メッセージ96、
これらのデータが、受信装置30側で字幕を表示する際に必要となるデータを含んでいる。
本開示の送信装置20は、XML(Extensible Markup Language)形式の字幕データであるTTML(Timed Text Markup Language)データをMPUとして送信する。
なお、1つのTTML字幕ファイルを1つのMPU(メディアプレゼンテーションユニット)として設定するが、このMPUを複数に分割したMFUを生成してMFU単位でMMTパケットに格納して送信する場合もある。
シグナリング・メッセージ96にはTTML字幕データの表示制御に適用する制御情報を格納したMPT、すなわち先に図9〜図12を参照して説明したMPTや、その他の情報(MH−EIT)等が含まれる。
MH−EIT(Event Information Table)は、コンテンツ(番組)のタイトル、放送日時、放送の内容などの情報を記録したテーブルである。
シグナリング・メッセージ96には、これらのデータの他、受信装置30において利用可能な様々な通知データ等が含まれる。
図15は、MPUとしてMMTパケットに格納されるXML形式のTTML字幕データの構成例を示す図である。
例えば図13、図14を参照して説明した(A)字幕MPU71には、図15(B)に示すようにTTML字幕データが格納されている。
TTML字幕データは、例えば、図15(C)に示すようなXML形式のデータであり、実際に表示される文字列の他、表示領域、表示タイミング等の情報を記述可能なとした構成を持つ。
受信装置30は、このようなTTML字幕データを解釈して、図15(D)に示すような表示データ、すなわち、他のMMTパケットから取得して復号した画像データに字幕を重畳した表示データを生成して表示部に表示する処理を行う。
[6.MPT(MMTパッケージテーブル)に記録される字幕対応情報について]
次に、MPT(MMTパッケージテーブル)に記録される字幕対応情報について説明する。
MPT(MMTパッケージテーブル)は、先に、図9〜図12を参照して説明したように、シグナリング・メッセージの1つであるPAメッセージを構成する1つのテーブルである。
このMPT(MMTパッケージテーブル)には、MPUとしてMMTパケットで送信されるTTML字幕データについてのアセット単位の属性情報や制御情報が記録される。
図16は、MPTに記録される字幕情報記述子(suntitle dexcroptor)を示している。すなわちMPUとして設定されたTTML字幕データに対応する属性情報や制御情報である。
この図16に示すデータは、先に説明した図12のシグナリングデータであるMPT(MMTパッケージテーブル)中の、
asset_descriptor_byte
以下のフィールドに記録されるアセット単位の情報である。
図16に示すように、字幕情報記述子(subtitle descriptor)記録フィールドには、以下の記述子が記録される。
(1)言語コード(ISO_639_language_code)
(2)字幕タイプ(Type)
(3)タイムモード(TMD)
(4)表示モード(DMF)
(5)動作モード(OPM)
(6)表示書式(Format)
(7)圧縮モード(Compression_mode)
以下、これらの情報の詳細について、順次、説明する。
(1)言語コード(ISO_639_language_code)
言語コード(ISO_639_language_code)は、言語種類をISO639−2で規定される言語コードとして示したデータである。
例えば日本語の場合は、
jpn(01101010 01110000 01101110)
となる。
(2)字幕タイプ(Type)
字幕タイプ(Type)は、字幕のタイプを示す情報である。
図17に具体例を示す。
00=字幕基本情報
01=字幕拡張情報
10=文字スーパー
これらの字幕タイプを識別する情報を記録する。
なお、字幕基本情報は、基本的な字幕データであることを示す。字幕拡張情報は、文字の表示形式を変更したリッチな表現を行う場合などに用いられる。ただし、受信装置側で理科できる場合にのみ利用される。文字スーパーは、ニュース速報等の文字であることなどを識別させるためのデータである。
(3)タイムモード(TMD)
タイムモード(TMD)は、字幕の表示タイミングの制御に用いる時刻制御モードを示す。具体的には、図18に示すように、以下の各モードのいずれかが記録される。
0001=TTML記述+EIT starttime
0010=TTML記述+NPT
0011=TTML記述+絶対時刻
0100=TTML記述+reference starttime
0101=TTML記述+MPU timestamp
1000=MPU timestamp
1111=提示制御なし(受信時、即時表示等)
「TTML記述」とは、例えば先に図15(c)を参照して説明したTTML字幕データに記録された表示タイミングに関する記述である。
図15(c)に示すTTML字幕データには、以下の表示タイミング制御情報が記録されている。
<p begin "427s"dur="1s">
このTTML記述は、番組開始から427秒の時点から1秒間「こんにちは」という文字を表させるための表示タイミングに関する記述である。
しかし、実際の番組表示に際しては、例えばコマーシャルの挿入や、臨時ニュースなどにより、必ずしもこのTTML字幕データの記述のみに依存した表示タイミング制御が行えない場合がある。
MPTに記録されたタイムモード(TMD)は、どのような場合でも、確実に映像に合わせた表示タイミングで字幕の表示を可能とするために用いられるデータである。
なお、タイムモード(TMD)に記録可能な4つのモードの具体的な処理態様については、後段で説明する。
(4)表示モード(DMF)
表示モード(DMF)は、
字幕の表示モードを示す情報である。具体例を図19に示す。
表示モード(DMF)は4ビット構成であり、
上位2ビット(Bit3〜2)が受信時処理態様、
下位2ビット(Bit1〜0)が記録再生時処理態様、
を示す。
上位2ビットの受信時処理態様は、TTML字幕データを格納したMPUを受信した際の処理を規定したものであり、
00=受信時自動表示、
01=受信時自動非表示、
10=受信時選択表示
これらの各表示モードの何れかを規定する。
00=受信時自動表示は、TTMLを格納したMPUの受信時に受信したTTML字幕データとMPTの制御情報に従って字幕を表示することを規定したモードである。
01=受信時自動非表示は、TTMLを格納したMPUの受信時に受信したTTML字幕データに記録された字幕は非表示とすることを規定したモードである。
10=受信時選択表示は、例えばユーザによるリモコン設定などにより、TTMLを格納したMPUの受信時に受信したTTML字幕データの字幕を表示または非表示とすることを可能としたモードである。
下位2ビットの記録再生時処理態様は、番組等をハードディスクなどのメディアに記録した後、再生する場合の処理を規定したものであり、
00=記録再生時自動表示、
01=記録再生時自動非表示、
10=記録再生時選択表示
これらの各表示モードの何れかを規定する。
00=記録再生時自動表示は、TTMLを格納したMPUを含むコンテンツの再生時にTTML字幕データとMPTの制御情報に従って字幕を表示することを規定したモードである。
01=記録再生時自動非表示は、TTMLを格納したMPUを含むコンテンツの再生時にTTML字幕データに記録された字幕は非表示とすることを規定したモードである。
10=記録再生時選択表示は、コンテンツ再生時に例えばユーザによるリモコン設定などにより、TTML字幕データの字幕を表示または非表示とすることを可能としたモードである。
(5)動作モード(OPM)
動作モード(OPM)は、字幕の表示制御に適用する動作モード規定情報である。具体例を図20に示す。動作モード(OPM)としては以下の各モードの設定が可能である。
00=ライブモード(Live mode)
01=セグメンテーションモード(Segmentation mode)
10=プログラムモード(Program mode)
00=ライブモード(Live mode)は、例えば、受信したTTML字幕データを、受信時に即時表示させるモードである。例えば同時通訳等の字幕データの表示などの際に利用される設定するモードである。
01=セグメンテーションモード(Segmentation mode)は、映画コンテンツのように、予め字幕データが準備されたコンテンツに適用されるモードであり、MPTとTTML字幕データの制御情報に規定された表示タイミングに従った表示を実行させる場合のモードである。
10=プログラムモード(Program mode)は、例えば1つの番組単位の字幕の全てを記録したTTMLファイルを準備して、送信装置から受信装置に送信し、受信装置が1つのTTMLファイルを利用して1番組の字幕表示を実行するモードである。
なお、動作モード(OPM)の各モード設定時の処理の具体例については、後段で詳細に説明する。
(6)表示書式(Format)
表示書式(Format)は、字幕データを表示する表示画面の表示書式を規定する記述子である。具体的には、図21に示すように、以下の各書式の設定がなされる。
0000=1920×1080(HD)
0001=3840×2160(4K)
0010=7860×4320(8K)
例えば、これらの表示画面に対応する字幕データであることを示す。
(8)圧縮モード(Compression_mode)
圧縮モード(Compression_mode)は、TTML字幕データの圧縮モードを示す記述子である。具体的には、図22に示すように以下の各アッシュクモードのいずれかが設定される。
000=圧縮なし
001=EXIによる圧縮
010=BIMによる圧縮
011=ZIPによる圧縮
例えば、TTML字幕データが上記のいずれの圧縮処理がなされたデータであるかを示す情報を設定する。
[7.タイムモード(TMD)の各モード対応の具体的処理について]
次に、MPTに記録される字幕情報記述子(Subtitle descriptot)の1つであるタイムモード(TMD)の各モード対応の具体的処理について説明する。
図18を参照して説明したように、タイムモード(TMD)は、字幕の表示タイミングの制御に用いる時刻制御モードを示す。具体的には、図18に示すように、以下の各モードのいずれかが記録される。
0001=TTML記述+EIT starttime
0010=TTML記述+NPT
0011=TTML記述+絶対時刻
0100=TTML記述+reference starttime
0101=TTML記述+MPU timestamp
1000=MPU timestamp
1111=提示制御なし(受信時、即時表示等)
以下、これら7つのタイムモード設定に対応した受信装置側の字幕表示制御の具体例について説明する。
[7−1.TMD=1:TTML記述+EIT starttimeのモード設定時の処理について]
まず、タイムモード(TMD)が、TMD=1、すなわち、
0001=TTML記述+EIT starttime
上記設定である場合の字幕表示制御について図23、図24を参照して説明する。
このTMD=1のモード設定は、受信装置30に、TTMLに記述された字幕表示時間と、MH−EIT(Event Information Table)の記録情報を適用して表示タイミングを制御させるモードである。
MH−EIT(Event Information Table)は、先に図14を参照して説明したように、シグナリング・メッセージ96の構成情報であり、コンテンツ(番組)のタイトル、放送日時、放送の内容、出演者などの情報を記録したテーブルである。
MH−EITの具体的構成例を図23に示す。
図23に示すようにMH−EITには、以下の各データが記録される。
(a)番組のID(event_id)
(b)番組開始時刻(start_time)
(c)番組時間長(duration)
例えばこれらの情報が含まれる。
受信装置30は、このMH−EITに記録された、
(b)番組開始時刻(start_time)
を用いてTTML字幕データの字幕表示タイミングを決定する。
受信装置30の実行するTTML字幕データの表示タイミング制御処理について図24を参照して説明する。
図24には、
(a)MH−EIT
(b)MPT
(c)MPUのTTML
(d)字幕の表示された画像例
これらの各データを示している。
また、図に示す字幕アセット(MPU/MFU)と、シグナリングは、送信装置20から受信装置30に対して送信されるMMTパケットに格納されたMPU/MFU、およびシグナリング・メッセージの各チャンネルを示している。
受信装置30は、MPTと、MH−EITをシグナリング・メッセージの送信チャンネルから取得し、TTML字幕データを含むMPUは字幕アセットチャンネルから取得する。
さらに、図24の最上段には、時間軸(t)を示している。
(a)MH−EITには、番組開始時刻情報として、
start_time=t0
上記情報が記録されている。
これは、番組が開始される絶対時刻を示す情報である。
(b)MPTには、タイムモードとして、
TMD=1(=0001)
上記データが記録されている。
これは、先に図18を参照して説明したように、
TMD=0001=TTML記述+EIT starttime
この設定であり、TTML記述とEITのスタートタイム記述に従って字幕の表示タイミングを決定する処理を実行するコンテンツであることを示している。
(c)MPUのTTMLには、字幕表示タイミング情報として
<p begin="427s" dur="1s">
上記データがある。
これは、番組開始時間から427秒後にTTMLに記録された字幕データ「こんにちは」を1秒間表示することを行わせるための記述データである。
なお、
<div region="r1">
このデータは、字幕「こんにちは」の表示領域の指定情報である。
まず、受信装置30は、MPTを参照して、コンテンツに適用するTTML字幕データの表示タイミング制御が、
TMD=0001=TTML記述+EIT starttime
この設定であることを確認する。
すなわち、TTML記述とEITのスタートタイム記述に従って字幕の表示タイミングを決定する処理を実行するコンテンツであることを確認する。
次に、受信装置30は、TTMLと、EITの両データに記録された字幕の表示タイミング情報を参照する。
MPUのTTMLには、字幕表示タイミング情報として
<p begin="427s" dur="1s">
上記データが記録されている。
EITには、番組開始時刻情報として、
start_time=t0
上記情報が記録されている。
受信装置30は、
EITに番組開始時刻情報として記録された、
start_time=t0
この番組開始の絶対時刻情報を確認し、この絶対時刻t0から、受信装置30の保持する時計に基づいて、
MPUのTTMLの字幕表示タイミング情報、
<p begin="427s" dur="1s">
上記情報に記録された427秒をカウントする。
番組開始時刻(t0)から427秒経過した時点(t1)で、TTML字幕データに記録された「こんにちは」を表示する。
この表示結果が図24(d)に示す表示データである。
[7−2.TMD=2:TTML記述+NPTのモード設定時の処理について]
次に、タイムモード(TMD)が、TMD=2、すなわち、
0002=TTML記述+NPT
上記設定である場合の字幕表示制御について図25、図26を参照して説明する。
このTMD=2のモード設定は、受信装置30に、TTMLに記述された字幕表示時間と、NPT参照情報[NPT(Normal Play Time)−reference/EMT]の記録情報を適用して表示タイミングを制御させるモードである。
NPT参照情報[NPT(Normal Play Time)−reference/EMT]は、シグナリング・メッセージ96の構成情報であり、
UTC(コーディネィテッド・ユニバーサルタイム)の時間情報(st)と、
NPT(ノーマルプレイタイム)の時間情報(nt)と、
これら2つの時間情報の対応データを持つ。UTCは絶対時刻情報である。
このNPTは、送信装置20から
受信装置30に順次、更新データが送信される。
NPT−reference/EMTの具体的構成例を図25に示す。
図25に示すようにNPT−reference/EMTには、以下の各データが記録される。
(a)UTC時間情報(UTC_Reference)
(b)NPT時間情報(NPT_Reference)
例えばこれらの情報が含まれる。
(a)UTC時間情報(UTC_Reference)は、絶対時刻相当の時間情報であり、送信装置、受信装置双方で同期した時間情報である。
NPTは、番組開始からの時間情報であり、例えばCM等、番組が中断した時点で停止され、番組の進行に従ってカウントされる時間情報である。
すなわち、UTC時間情報(UTC_Reference)は、常時、進行するが、NPT時間情報(NPT_Reference)は、番組が進行している時間のみ進行し、CM等の中断時には進行しない。
図25に示すNPT−reference/EMTは、遂次、送信装置20において更新されて受信装置30に送信される。
(a)UTC時間情報(UTC_Reference)は、時間の経過と同じ経過を示すデータに更新されるが、
(b)NPT時間情報(NPT_Reference)は、番組が中断している場合は更新されず、放送された番組時間に相当する時間のみを示す時間情報となる。
番組開始時間においては、
(a)UTC時間情報(UTC_Reference)=t0
(b)NPT時間情報(NPT_Reference)=0
上記のように、
NPT時間のカウントが開始されるが、その後の時間情報の増加は等しく進む。
なお、上記2つの時間情報は64ビットのNTPフォーマットで記述され、秒以下が32ビットで表現されるが、現実の運用では秒以下16ビット程度の精度で用いられることも想定される。その場合には下位16ビットは0を代入して利用する。
しかし、番組開始後、CM等の番組中断事由が発生すると、上記2つの時間情報の増加はずれたものとなる。
すなわち、
(a)UTC時間情報(UTC_Reference)=u1
(b)NPT時間情報(NPT_Reference)=n1
受信装置30は、このNPTに記録された、
(a)UTC時間情報(UTC_Reference)=u1
(b)NPT時間情報(NPT_Reference)=n1
これらの2つの時間の対応情報を用いてTTML字幕データの字幕表示タイミングを決定する。
受信装置30の実行するTTML字幕データの表示タイミング制御処理について図26を参照して説明する。
図26には、
(a)MPT
(b)MPUのTTML
(c)NPT−reference/EMT
(d)字幕の表示された画像例
これらの各データを示している。
また、図に示す字幕アセット(MPU/MFU)と、シグナリングは、送信装置20から受信装置30に対して送信されるMMTパケットに格納されたMPU/MFU、およびシグナリング・メッセージの各チャンネルを示している。
受信装置30は、MPTと、NPT−reference/EMTをシグナリング・メッセージの送信チャンネルから取得し、TTML字幕データを含むMPUは字幕アセットチャンネルから取得する。
さらに、図23の最上段には、NPTとUTC対応の時間軸(t)を示している。
(a)MPTには、タイムモードとして、
TMD=2(=0010)
上記データが記録されている。
これは、先に図18を参照して説明したように、
TMD=0010=TTML記述+NPT
この設定であり、TTML記述とNPT記述に従って字幕の表示タイミングを決定する処理を実行するコンテンツであることを示している。
(b)MPUのTTMLには、字幕表示タイミング情報として
<p begin="276392t" dur="1s">
上記データがある。
さらに、
<tt ttp:tickrate="65536">
上記データがある。
<tt ttp:tickrate="65536">は、1秒を65536で割った単位で時間をカウントすることを意味する。これはNTPフォーマットの時間表現において下位16ビットに0を代入した上でその上のビットで表現される値に相当する。よって <p begin="276392t" dur="1s">はNTPフォーマットで下位16ビットに0を代入した上でその上のビットが276392となる時間表現により字幕表示開始時刻を示す。つまり276392(10進数)=437A8(16進数)なので、NTPフォーマットでは0000000437A80000(16進数)ということになる。
図21を参照して説明したTTMLでは秒(s)単位のデータとして字幕の表示タイミングを記述していたが、この図26に示す例では、NTPフォーマットで示している。
番組開始時間からNTPフォーマットの時間表現で0000000437A80000(16進数)に達した時点でTTMLに記録された字幕データ「こんにちは」を1秒間、表示することを行わせるための記述データである。
なお、
<div region="r1">
このデータは、字幕「こんにちは」の表示領域の指定情報である。
(c)NPT−reference/EMTには、
(a)UTC時間情報(UTC_Reference)=ux
(b)NPT時間情報(NPT_Reference)=nx
これらの2つの時間の対応情報が記録されている。
なお、NPT−reference/EMTは逐次更新されており、受信装置30は最も新しいNPT−reference/EMTを利用する。
まず、受信装置30は、MPTを参照して、コンテンツに適用するTTML字幕データの表示タイミング制御が、
TMD=0010=TTML記述+NPT
この設定であることを確認する。
すなわち、TTML記述とNPT−reference/EMTの記述に従って字幕の表示タイミングを決定する処理を実行するコンテンツであることを確認する。
次に、受信装置30は、TTMLと、最新のNPT−reference/EMTの両データに記録された字幕の表示タイミング情報を参照する。
MPUのTTMLには、字幕表示タイミング情報として
<p begin="276392t" dur="1s">
NPT−reference/EMTには、
(a)UTC時間情報(UTC_Reference)=u1
(b)NPT時間情報(NPT_Reference)=n1
これらの2つの時間の対応情報が記録されている。
なお、NPTは逐次更新されており、受信装置30は最も新しいNPT−reference/EMTを利用する。
例えば、TTMLに記録された字幕表示時刻になる直前に取得したNPT−reference/EMTを取得して、UTCとNPTの対応データを取得する。
例えばNTPで示される絶対時刻がC84F3804230A0000(16進数)の時刻にNPT参照情報を取得したとする。
取得したNPT参照情報には、例えば、以下の2つの時間情報の対尾合うデータが記録されている。
(a)UTC時間情報(UTC_Reference)=u1=C84F380314260000(16進数)
(b)NPT時間情報(NPT_Reference)=n1=0000000122370000(16進数)
NPT時間情報(n1)は、番組の実放送時間をカウントした値であり、CMが挿入された場合等ではUTC時間情報(s1)より進みが遅くなる。
受信装置30は、これら2つの時間情報の対応データに基づいて、TTML字幕データに記録された字幕の時間情報、すなわち、
<p begin="276392t" dur="1s">
上記字幕表示開始時刻であるNPT時間値276392tを絶対時刻ut1に換算する。
すなわち、最新のNPT参照情報におけるNPTの差分をNTPフォーマットの絶対時刻に加算して、字幕表示タイミングとなる修正STCの値を算出する。
例えば最新のNPT−reference/EMTが、
(a)UTC時間情報(UTC_Reference)=u1=
C84F380314260000(16進数)
(b)NPT時間情報(NPT_Reference)=n1=
0000000122370000(16進数)
この設定である場合、字幕表示開始時刻ut1=C84F380314260000+(0000000437A80000―0000000122370000)=C84F38062997(16進数)となり、受信装置のNTPに基づく時計がこの値になったタイミングで字幕表示を開始する。
この表示結果が図26(d)に示す表示データである。
[7−3.TMD=3:TTML記述+絶対時刻のモード設定時の処理について]
次に、タイムモード(TMD)が、TMD=3、すなわち、
0011=TTML記述+絶対時刻
上記設定である場合の字幕表示制御について図27を参照して説明する。
このTMD=3のモード設定は、受信装置30に、TTMLに記述された字幕表示時間と、絶対時刻を適用して表示タイミングを制御させるモードである。
絶対時刻は受信装置で保持する時計において計測できる時間情報となる。
受信装置30の実行するTTML字幕データの表示タイミング制御処理について図27を参照して説明する。
図27には、
(a)MPT
(b)MPUのTTML
(c)字幕の表示された画像例
これらの各データを示している。
また、図に示す字幕アセット(MPU/MFU)と、シグナリングは、送信装置20から受信装置30に対して送信されるMMTパケットに格納されたMPU/MFU、およびシグナリング・メッセージの各チャンネルを示している。
受信装置30は、MPTをシグナリング・メッセージの送信チャンネルから取得し、TTML字幕データを含むMPUは字幕アセットチャンネルから取得する。
さらに、図27の最上段には、時間軸(t)を示している。
(a)MPTには、タイムモードとして、
TMD=3(=0011)
上記データが記録されている。
これは、先に図18を参照して説明したように、
TMD=0011=TTML記述+絶対時刻
この設定であり、TTML記述と絶対時刻に従って字幕の表示タイミングを決定する処理を実行するコンテンツであることを示している。
(b)MPUのTTMLには、字幕表示タイミング情報として
<p begin="13:40:11" dur="1s">
上記データがある。
これは、絶対時刻=13:40:11にTTMLに記録された字幕データ「こんにちは」を1秒間表示することを行わせるための記述データである。
なお、
<div region="r1">
このデータは、字幕「こんにちは」の表示領域の指定情報である。
まず、受信装置30は、MPTを参照して、コンテンツに適用するTTML字幕データの表示タイミング制御が、
TMD=0001=TTML記述+絶対時刻
この設定であることを確認する。
すなわち、TTML記述と絶対時刻に従って字幕の表示タイミングを決定する処理を実行するコンテンツであることを確認する。
次に、受信装置30は、TTMLに記録された字幕の表示タイミング情報を参照する。
MPUのTTMLには、字幕表示タイミング情報として
<p begin="13:40:11s" dur="1s">
上記データが記録されている。
受信装置30は、内部の時計に従って絶対時刻情報を算出する。なお、受信装置内部の時計は、外部から受信する絶対時刻情報によって遂次修正され、受信装置30は、正しい絶対時刻情報を取得することができる。
受信装置30は、絶対時刻が、TTML字幕データに記述された時刻13:40:11となった時点(t1)で、TTML字幕データに記録された「こんにちは」を表示する。
この表示結果が図27(c)に示す表示データである。
[7−4a.TMD=4:TTML記述+reference starttimeのモード設定時の処理について(例1)]
次に、タイムモード(TMD)が、TMD=4、すなわち、
0100=TTML記述+reference starttime
上記設定である場合の字幕表示制御について図28を参照して説明する。
このTMD=4のモード設定は、受信装置30に、TTMLに記述された字幕表示時間と、MH−EIT(Event Information Table)の記録情報である参照スタートタイム(reference starttime)を適用して表示タイミングを制御させるモードである。
MH−EIT(Event Information Table)は、先に図14を参照して説明したように、シグナリング・メッセージ96の構成情報であり、コンテンツ(番組)のタイトル、放送日時、放送の内容、出演者などの情報を記録したテーブルである。
本実施例では、このMH−EIT(Event Information Table)に、さらに精度の高い例えばms単位の時間情報として番組開始時間を示すprecice starttimeを記録する。
受信装置30は、このMH−EITに記録された高精度のms単位の時間情報=reference starttimeを起点(t0)として、MPU(TTML)に記録された表示時間情報に従った時間計測を行う。
受信装置30の実行するTTML字幕データの表示タイミング制御処理について図28を参照して説明する。
図28には、
(a)MH−EIT
(b)MPT
(c)MPUのTTML
(d)字幕の表示された画像例
これらの各データを示している。
また、図に示す字幕アセット(MPU/MFU)と、シグナリングは、送信装置20から受信装置30に対して送信されるMMTパケットに格納されたMPU/MFU、およびシグナリング・メッセージの各チャンネルを示している。
受信装置30は、MPTと、MH−EITをシグナリング・メッセージの送信チャンネルから取得し、TTML字幕データを含むMPUは字幕アセットチャンネルから取得する。
さらに、図28の最上段には、時間軸(t)を示している。
(a)MH−EITには、番組開始時刻情報として、
start_time=t0、
さらに、
precice_starttime=t0
上記情報が記録されている。
これは、番組が開始される絶対時刻を示す情報である。
本例では、精度の高い例えばms単位の時間情報としてprecice starttimeが記録されている。
(b)MPTには、タイムモードとして、
TMD=4(=0100)
上記データが記録されている。
これは、先に図18を参照して説明したように、
TMD=0100=TTML記述+reference starttime
この設定であり、TTML記述とEITの高精度のprecice starttime記述に従って字幕の表示タイミングを決定する処理を実行するコンテンツであることを示している。
(c)MPUのTTMLには、字幕表示タイミング情報として
<p begin="427153ms" dur="1s">
上記データがある。
これは、番組開始時間から427153ミリ秒(ms)後にTTMLに記録された字幕データ「こんにちは」を1秒間表示することを行わせるための記述データである。
なお、
<div region="r1">
このデータは、字幕「こんにちは」の表示領域の指定情報である。
まず、受信装置30は、MPTを参照して、コンテンツに適用するTTML字幕データの表示タイミング制御が、
TMD=0001=TTML記述+reference starttime
この設定であることを確認する。
すなわち、TTML記述とEITのスタートタイム記述(precice starttime)に従って字幕の表示タイミングを決定する処理を実行するコンテンツであることを確認する。
次に、受信装置30は、TTMLと、EITの両データに記録された字幕の表示タイミング情報を参照する。
MPUのTTMLには、字幕表示タイミング情報として
<p begin="427153ms" dur="1s">
上記データが記録されている。
これはms単位の高精度な時間情報である。
EITには、番組開始時刻情報として、
precice starttime=t0
上記情報が記録されている。
これもms単位の高精度な時間情報である
受信装置30は、
EITに、番組開始時刻情報として記録された、
precice starttime=t0(ms)
この番組開始の絶対時刻情報を確認し、この絶対時刻t0(ms)から、受信装置30の保持するシステムクロックのクロックカウントに基づいて、
MPUのTTMLの字幕表示タイミング情報、
<p begin="427153s" dur="1s">
上記情報に記録された427153ミリ秒(ms)をカウントする。
番組開始時刻(t0)から427153ミリ秒経過した時点(t1)で、TTML字幕データに記録された「こんにちは」を表示する。
この表示結果が図28(d)に示す表示データである。
本例では、先に図24を参照して説明したTMD=1の例と同様MH−EITを利用しているが、このTMD=4の構成では、MH−EHTの時間情報と、TTMLの時間情報がいずれもミリ秒(ms)単位の高精度な時間情報であり、より精度の高い字幕表示制御が可能となる。
[7−4b.TMD=4:TTML記述+reference starttimeのモード設定時の処理について(例2)]
次に、タイムモード(TMD)が、TMD=4、すなわち、
0100=TTML記述+reference starttime
上記設定である場合の字幕表示制御のもう1つの例(例2)について図29を参照して説明する。
このTMD=4のモード設定(例2)では、MH−EIT(Event Information Table)を用いず、MPTにreference starttimeを記録してMPTとTTML記述に従って表示タイミングを制御させる。
本例では、このMPTに、精度の高い例えばms単位の時間情報としてprecice starttimeを記録する。
受信装置30は、このMPTに記録された高精度のms単位の時間情報=reference starttimeを起点(t0)として、MPU(TTML)に記録された表示時間情報に従った時間計測を行う。
受信装置30の実行するTTML字幕データの表示タイミング制御処理について図29を参照して説明する。
図29には、
(a)MPT
(b)MPUのTTML
(c)字幕の表示された画像例
これらの各データを示している。
また、図に示す字幕アセット(MPU/MFU)と、シグナリングは、送信装置20から受信装置30に対して送信されるMMTパケットに格納されたMPU/MFU、およびシグナリング・メッセージの各チャンネルを示している。
受信装置30は、MPTをシグナリング・メッセージの送信チャンネルから取得し、TTML字幕データを含むMPUは字幕アセットチャンネルから取得する。
さらに、図29の最上段には、時間軸(t)を示している。
(a)MPTには、タイムモードとして、
TMD=4(=0100)
上記データが記録されている。
これは、先に図18を参照して説明したように、
TMD=0100=TTML記述+reference starttime
この設定であり、TTML記述とEITの高精度のprecice starttime記述に従って字幕の表示タイミングを決定する処理を実行するコンテンツであることを示している。
さらに、MPTには、番組開始時刻情報として、
precice_starttime=t0
上記情報が記録されている。
これは、番組が開始される絶対時刻を示す情報である。
本例では、精度の高い例えばms単位の時間情報としてprecice starttimeが記録されている。
(b)MPUのTTMLには、字幕表示タイミング情報として
<p begin="427153ms" dur="1s">
上記データがある。
これは、番組開始時間から427153ミリ秒(ms)後にTTMLに記録された字幕データ「こんにちは」を1秒間表示することを行わせるための記述データである。
なお、
<div region="r1">
このデータは、字幕「こんにちは」の表示領域の指定情報である。
まず、受信装置30は、MPTを参照して、コンテンツに適用するTTML字幕データの表示タイミング制御が、
TMD=0001=TTML記述+reference starttime
この設定であることを確認する。
すなわち、TTML記述とMPTのスタートタイム記述(precice starttime)に従って字幕の表示タイミングを決定する処理を実行するコンテンツであることを確認する。
次に、受信装置30は、TTMLと、MPTの両データに記録された字幕の表示タイミング情報を参照する。
MPUのTTMLには、字幕表示タイミング情報として
<p begin="427153ms" dur="1s">
上記データが記録されている。
これはms単位の高精度な時間情報である。
MPTには、番組開始時刻情報として、
precice starttime=t0
上記情報が記録されている。
これもms単位の高精度な時間情報である
受信装置30は、
MPTに、番組開始時刻情報として記録された、
precice starttime=t0(ms)
この番組開始の絶対時刻情報を確認し、この絶対時刻t0(ms)から、受信装置30の保持するシステムクロックのクロックカウントに基づいて、
MPUのTTMLの字幕表示タイミング情報、
<p begin="427153s" dur="1s">
上記情報に記録された427153ミリ秒(ms)をカウントする。
番組開始時刻(t0)から427153ミリ秒経過した時点(t1)で、TTML字幕データに記録された「こんにちは」を表示する。
この表示結果が図29(c)に示す表示データである。
本例でも、先に図28を参照して説明したTMD=4(例1)の場合と同様、MPTの時間情報と、TTMLの時間情報がいずれもミリ秒(ms)単位の高精度な時間情報であり、より精度の高い字幕表示制御が可能となる。
[7−5.TMD=5:TTML記述+MPU timestampのモード設定時の処理について]
次に、タイムモード(TMD)が、TMD=5、すなわち、
0100=TTML記述+MPU timestamp
上記設定である場合の字幕表示制御例について図30、図31を参照して説明する。
このTMD=5のモード設定では、MPTに記録されたMPUタイムスタンプを用いて、このMPUタイムスタンプとTTML記述に従って表示タイミングを制御させる。
MPTには、アセット制御情報の1つのデータとしてMPUとして設定されたアセット(本例では字幕データ)の処理開始時間に相当するタイムスタンプを記録することができる。
このタイムスタンプは、精度の高い例えばms単位の時間情報として記録される。
図30に、MPTに記録されるMPUタイムスタンプ記述子のデータ構造を示す。
MPTに記録されるMPUタイムスタンプ記述子には、図に示すように、このタイムスタンプの適用されるMPUを示すMPUシーケンスナンバート、そのシーケンスナンバーに対応するMPUに対応する時間情報としてのMPU対応タイムスタンプ(MPU_presentation_timestamp)が記録される。
このタイムスタンプは、精度の高い例えばms単位の時間情報である。
受信装置30は、このMPTに記録された高精度のms単位のタイムスタンプ(MPU_presentation_timestamp)を起点(t0)として、MPU(TTML)に記録された表示時間情報に従った時間計測を行う。
受信装置30の実行するTTML字幕データの表示タイミング制御処理について図31を参照して説明する。
図31には、
(a)MPT
(b)MPUのTTML
(c)字幕の表示された画像例
これらの各データを示している。
また、図に示す字幕アセット(MPU/MFU)と、シグナリングは、送信装置20から受信装置30に対して送信されるMMTパケットに格納されたMPU/MFU、およびシグナリング・メッセージの各チャンネルを示している。
受信装置30は、MPTをシグナリング・メッセージの送信チャンネルから取得し、TTML字幕データを含むMPUは字幕アセットチャンネルから取得する。
さらに、図31の最上段には、時間軸(t)を示している。
(a)MPTには、タイムモードとして、
TMD=5(=0101)
上記データが記録されている。
これは、先に図18を参照して説明したように、
TMD=0101=TTML記述+MPU timestamp
この設定であり、TTML記述とMPTに記録されたMPUタイムスタンプに従って字幕の表示タイミングを決定する処理を実行するコンテンツであることを示している。
図31(a)MPTに示すように、MPTには、MPU対応のタイムスタンプとして、
mpu_presentation_timestamp=t0
上記情報が記録されている。
これは、処理対象となるTTMLに相当するMPUに対応して設定されたMPUの処理時間等を示す時間情報である。
このタイムスタンプは、精度の高い例えばms単位の時間情報として記録されている。
(b)MPUのTTMLには、字幕表示タイミング情報として
<p begin="120234ms">
上記データがある。
これは、タイムスタンプによって指定される起点時間(t0)から120243ミリ秒(ms)後にTTMLに記録された字幕データ「こんにちは」を表示することを行わせるための記述データである。
なお、
<div region="r1">
このデータは、字幕「こんにちは」の表示領域の指定情報である。
まず、受信装置30は、MPTを参照して、コンテンツに適用するTTML字幕データの表示タイミング制御が、
TMD=0101=TTML記述+MPU timestamp
この設定であることを確認する。
すなわち、TTML記述とMPTに記録されたMPUタイムスタンプに従って字幕の表示タイミングを決定する処理を実行するコンテンツであることを確認する。
次に、受信装置30は、TTMLと、MPTの両データに記録された字幕の表示タイミング情報を参照する。
MPUのTTMLには、字幕表示タイミング情報として
<p begin="120234ms">
上記データが記録されている。
これはms単位の高精度な時間情報である。
MPTには、起点時間情報として、
MPUタイムスタンプ(mpu_presentation_timestamp)=t0
上記情報が記録されている。
これもms単位の高精度な時間情報である
受信装置30は、
MPTに、起点時間情報として記録された、
MPUタイムスタンプ=t0(ms)
この起点時間情報を確認し、この時刻t0(ms)から、受信装置30の保持するシステムクロックのクロックカウントに基づいて、
MPUのTTMLの字幕表示タイミング情報、
<p begin="120234s">
上記情報に記録された120234ミリ秒(ms)をカウントする。
起点時間(t0)から120234ミリ秒経過した時点(t1)で、TTML字幕データに記録された「こんにちは」を表示する。
この表示結果が図31(c)に示す表示データである。
本例でも、先に図28、図29を参照して説明したTMD=4の場合と同様、MPTの時間情報と、TTMLの時間情報がいずれもミリ秒(ms)単位の高精度な時間情報であり、より精度の高い字幕表示制御が可能となる。
[7−6.TMD=8:MPU timestampのモード設定時の処理について]
次に、タイムモード(TMD)が、TMD=8、すなわち、
1000=MPU timestamp
上記設定である場合の字幕表示制御例について図32を参照して説明する。
このTMD=6のモード設定では、MPTに記録されたMPUタイムスタンプのみを用いて、このMPUタイムスタンプに従って表示タイミングを制御させる。
先に図30を参照して説明したように、MPTには、アセット制御情報の1つのデータとしてMPUとして設定されたアセット(本例では字幕データ)の処理開始時間に相当するタイムスタンプを記録することができる。
このタイムスタンプは、精度の高い例えばms単位の時間情報として記録される。
受信装置30は、このMPTに記録された高精度のms単位のタイムスタンプ(MPU_presentation_timestamp)を、そのままTTML字幕データの表示タイミングとして用いて、TTMLに記録された字幕データを表示する。
受信装置30の実行するTTML字幕データの表示タイミング制御処理について図32を参照して説明する。
図32には、
(a)MPT
(b)MPUのTTML
(c)字幕の表示された画像例
これらの各データを示している。
また、図に示す字幕アセット(MPU/MFU)と、シグナリングは、送信装置20から受信装置30に対して送信されるMMTパケットに格納されたMPU/MFU、およびシグナリング・メッセージの各チャンネルを示している。
受信装置30は、MPTをシグナリング・メッセージの送信チャンネルから取得し、TTML字幕データを含むMPUは字幕アセットチャンネルから取得する。
さらに、図32の最上段には、時間軸(t)を示している。
(a)MPTには、タイムモードとして、
TMD=8(=1000)
上記データが記録されている。
これは、先に図18を参照して説明したように、
TMD=1000=MPU timestamp
この設定であり、MPTに記録されたMPUタイムスタンプに従って字幕の表示タイミングを決定する処理を実行するコンテンツであることを示している。
図32(a)MPTに示すように、MPTには、MPU対応のタイムスタンプとして、
mpu_presentation_timestamp=t0
上記情報が記録されている。
これは、処理対象となるTTMLに相当するMPUに対応して設定されたMPUの処理時間等を示す時間情報である。
このタイムスタンプは、精度の高い例えばms単位の時間情報として記録されている。
(b)MPUのTTMLには、字幕表示タイミング情報は記録されていない。
TMD=8のモードでは、MPTに記録されたタイムスタンプによって指定される時間(t1)をそのまま、TTMLに記録された字幕データ「こんにちは」の表示時間として利用した字幕データ表示処理を実行させる。
なお、TTML字幕データに記録された、
<div region="r1">
このデータは、字幕「こんにちは」の表示領域の指定情報である。
まず、受信装置30は、MPTを参照して、コンテンツに適用するTTML字幕データの表示タイミング制御が、
TMD=1000=MPU timestamp
この設定であることを確認する。
すなわち、MPTに記録されたMPUタイムスタンプに従って字幕の表示タイミングを決定する処理を実行するコンテンツであることを確認する。
次に、受信装置30は、MPTに記録された字幕の表示タイミング情報を参照する。
MPTには、字幕表示時刻情報として、
MPUタイムスタンプ(mpu_presentation_timestamp)=t1
上記情報が記録されている。
これはms単位の高精度な時間情報である。
受信装置30は、
MPTに記録された、
MPUタイムスタンプ=t1(ms)
この時間情報を確認し、この時刻t1(ms)において、TTML字幕データに記録された「こんにちは」を表示する。
この表示結果が図32(c)に示す表示データである。
本例でも、MPTの時間情報(タイムスタンプ)はミリ秒(ms)単位の高精度な時間情報であり、より精度の高い字幕表示制御が可能となる。
[7−7.TMD=15:時刻制御なしのモード設定時の処理について]
次に、タイムモード(TMD)が、TMD=15、すなわち、
1111=時刻制御なし
上記設定である場合の字幕表示制御について図33を参照して説明する。
このTMD=15のモード設定は、受信装置30に、時刻制御なしで字幕を表示させるモードである。例えばTTML字幕データを格納したMPUの受信後、速やかに表示を行う。例えば、ライブの字幕翻訳データの表示や、ニュース速報の表示などにおいて適用される。
受信装置30の実行するTTML字幕データの表示タイミング制御処理について図33を参照して説明する。
図33には、
(a)MPT
(b)MPUのTTML
(c)字幕の表示された画像例
これらの各データを示している。
また、図に示す字幕アセット(MPU/MFU)と、シグナリングは、送信装置20から受信装置30に対して送信されるMMTパケットに格納されたMPU/MFU、およびシグナリング・メッセージの各チャンネルを示している。
受信装置30は、MPTをシグナリング・メッセージの送信チャンネルから取得し、TTML字幕データを含むMPUは字幕アセットチャンネルから取得する。
さらに、図33の最上段には、時間軸(t)を示している。
(a)MPTには、タイムモードとして、
TMD=15(=1111)
上記データが記録されている。
これは、先に図18を参照して説明したように、
TMD=1111=時刻制御なし
この設定であり、字幕の表示タイミングの制御情報がないコンテンツであることを示している。
(b)MPUのTTMLには、字幕表示タイミング情報についての記述が含まれない。
なお、
<div region="r1">
このデータは、字幕「こんにちは」の表示領域の指定情報である。
まず、受信装置30は、MPTを参照して、コンテンツに適用するTTML字幕データの表示タイミング制御が、
TMD=1111=時刻制御なし
この設定であることを確認する。
すなわち、字幕の表示タイミングの制御のないコンテンツであることを確認する。
次に、受信装置30は、TTMLに記録された字幕の表示タイミング情報を参照する。
MPUのTTMLには、字幕表示タイミング情報が記録されていない。
受信装置30は、TTML字幕データを含むMPUを受信すると、即座に、TTML字幕データに記録された「こんにちは」を表示する。
この表示結果が図33(c)に示す表示データである。これは、例えば同時通訳の翻訳文の字幕表示などである。
[8.動作モード(OPM)の各モード対応の具体的処理について]
次に、MPTに記録される字幕情報記述子(Subtitle descriptot)の1つである動作モード(OPM)の各モード対応の具体的処理について説明する。
図20を参照して説明したように、動作モード(OPM)は、字幕の表示制御に適用する動作モード規定情報である。図20に示したように動作モード(OPM)としては以下の各モードの設定が可能である。
00=ライブモード(Live mode)
01=セグメンテーションモード(Segmentation mode)
10=プログラムモード(Program mode)
00=ライブモード(Live mode)は、例えば、受信したTTML字幕データを、受信時に即時表示させるモードである。例えば同時通訳等の字幕データの表示などの際に利用されるモードである。
01=セグメンテーションモード(Segmentation mode)は、映画コンテンツのように、予め字幕データが準備されたコンテンツに適用されるモードであり、MPTとTTML字幕データの制御情報に規定された表示タイミングに従った表示を実行させる場合のモードである。
10=プログラムモード(Program mode)は、例えば1つの番組単位の字幕の全てを記録したTTMLファイルを準備して、送信装置から受信装置に送信し、受信装置が1つのTTMLファイルを利用して1番組の字幕表示を実行するモードである。
以下、これら3つの動作モード設定に対応した受信装置側の字幕表示制御の具体例について説明する。
[8−1.OPM=0:ライブモードのモード設定時の処理について]
まず、動作モード(OPM)が、OPM=0、すなわち、
OPM=00=ライブモード
上記設定である場合の字幕表示制御について図34を参照して説明する。
このOPM=0のモード設定は、受信装置30に、受信したTTML字幕データを、受信時に即時表示させるモードである。例えば同時通訳等の字幕データの表示などの際に利用されるモードである。
図34には、
(a)MPT
(b)〜(e)TTML字幕データを格納したMPU
これらの各データを示している。
また、図に示す字幕アセット(MPU/MFU)と、シグナリングは、送信装置20から受信装置30に対して送信されるMMTパケットに格納されたMPU/MFU、およびシグナリング・メッセージの各チャンネルを示している。
受信装置30は、MPTをシグナリング・メッセージの送信チャンネルから取得し、TTML字幕データを含むMPUは字幕アセットチャンネルから取得する。
さらに、図34の下段には、時間軸(t)と、時間経過に従って適用されるTTML字幕データと字幕表示例を示している。
(a)MPTには、
OPM=0(=00)
上記データが記録されている。
これは、先に図20を参照して説明したように、
OPM=00=ライブモード
この設定であり、受信したTTML字幕データを、受信時に即時表示させるモードであることを示している。
(b)〜(e)MPU各々のTTMLには、いずれも字幕表示タイミング情報についての記述が含まれない。
なお、
<div region="r1">
<div region="r2">
<div region="r3">
これらのデータは、各TTML字幕データに含まれる字幕の表示領域の指定情報である。r1,r2,r3は異なる領域の指定情報である。
まず、受信装置30は、MPTを参照して、動作モードの確認を行う。
OPM=00=ライブモード
この設定であることを確認する。
すなわち、字幕の表示を、TTML字幕データの受信時に即時実行するモードであることを確認する。
次に、受信装置30は、TTML字幕データを格納したMPUを順次、受信する。
受信装置30は、受信したMPUからTTML字幕データを取り出してTTML字幕データに記録された表示制御情報(表示領域指定のみ)に従って、字幕データを表示する。
この表示処理結果が、図34の下段に示す4枚の画像となる。
受信装置は、まず、(b)MPU(TTML1)を受信し、このMPUに格納されたTTML1に従った字幕表示を行う。
画像(p)は、(b)MPU(TTML1)に格納されたTTML1に従って表示される字幕重畳画像である。
TTML1に格納された字幕データ「ありがとう」を、TTML1に記録された領域指定情報の指定領域(r1)に表示する。表示タイミングは時間(t1)となる。この時間(t1)は、受信装置30がTTML1を格納したMPUを受信して必要な処理を実行後、表示可能な最短のタイミングである。
受信装置は、次に(c)MPU(TTML2)を受信し、このMPUに格納されたTTML2に従った字幕表示を行う。
画像(q)は、(c)MPU(TTML2)に格納されたTTML2に従って表示される字幕重畳画像である。
TTML2に格納された字幕データ「どういたしまして」を、TTML2に記録された領域指定情報の指定領域(r2)に表示する。表示タイミングは時間(t2)となる。この時間(t2)は、受信装置30がTTML2を格納したMPUを受信して必要な処理を実行後、表示可能な最短のタイミングである。
受信装置は、次に(d)MPU(TTML3)を受信し、このMPUに格納されたTTML3に従った字幕表示を行う。
画像(r)は、(d)MPU(TTML3)に格納されたTTML3に従って表示される字幕重畳画像である。
TTML3に格納された字幕データ「例の件ですが」を、TTML3に記録された領域指定情報の指定領域(r2)に表示する。表示タイミングは時間(t3)となる。この時間(t3)は、受信装置30がTTML3を格納したMPUを受信して必要な処理を実行後、表示可能な最短のタイミングである。
受信装置は、次に(e)MPU(TTML4)を受信し、このMPUに格納されたTTML4に従った字幕表示を行う。
画像(s)は、(e)MPU(TTML4)に格納されたTTML4に従って表示される字幕重畳画像である。
TTML4に格納された字幕データ「○△×*・・・」を、TTML4に記録された領域指定情報の指定領域(r2)に表示する。
さらに、TTML4に格納されたもう1つの字幕データ「(バタン ドアの音)」を、TTML4に記録された領域指定情報の指定領域(r3)に表示する。ここで、TTML2、TTML3、TTML4における指定領域r2は同一の領域を示す。本例では示していないがいわゆるロールアップモードの指定がある場合にはTTML3においても、TTML2の指定領域r2で指定された文字列の後半を残してTTML3の指定領域r2で指定された文字列を加えて表示することが想定される。そのようなケースを想定するとライブモードの場合、各TTMLを独立して処理することはできない。
このように、動作モード(OPM)=0のライブモード設定時には、受信装置30は、受信したMPUに格納されたTTML字幕データの字幕の表示を即時、実行する。
この処理により、例えば生中継の会話における翻訳文の表示などを遅滞なく実行することが可能となる。またこの動作モードの場合には以前のTTML字幕データとの依存関係が発生しうる。
[8−2.OPM=1:セグメンテーションモードのモード設定時の処理について]
次に、動作モード(OPM)が、OPM=1、すなわち、
OPM=01=セグメンテーションモード
上記設定である場合の字幕表示制御について図35を参照して説明する。
このOPM=1のモード設定は、映画コンテンツのように、予め字幕データが準備されたコンテンツに適用されるモードであり、受信装置30に、MPTとTTML字幕データの制御情報に規定された表示タイミングに従った表示を実行させるモードである。
図35には、
(a)MPT
(b)〜(c)TTML字幕データを格納したMPU
これらの各データを示している。
また、図に示す字幕アセット(MPU/MFU)と、シグナリングは、送信装置20から受信装置30に対して送信されるMMTパケットに格納されたMPU/MFU、およびシグナリング・メッセージの各チャンネルを示している。
受信装置30は、MPTをシグナリング・メッセージの送信チャンネルから取得し、TTML字幕データを含むMPUは字幕アセットチャンネルから取得する。
さらに、図35の下段には、時間軸(t)と、時間経過に従って適用されるTTML字幕データと字幕表示例を示している。
(a)MPTには、
OPM=1(=01)
上記データが記録されている。
これは、先に図20を参照して説明したように、
OPM=01=セグメンテーションモード
この設定であり、受信したTTML字幕データを、MPTとTTML字幕データの制御情報に規定された表示タイミングに従った表示を実行させるモードであることを示している。
(b)〜(c)MPU各々のTTMLには、いずれも字幕表示タイミング情報についての記述が含まれる。
(b)MPU(TTML1)には、
<p begin="156s" duration="5s">
上記字幕表示タイミング情報が記録されている。
また、(c)MPU(TTML2)には、
<p begin="170s">
上記字幕表示タイミング情報が、字幕「どういたしまして」に対応付けて記録されている。
さらに、
<p begin="175s">
上記字幕表示タイミング情報が、字幕「例の件ですが」・・・「○△×*」・・に対応付けて記録されている。
これらはいずれも表示領域(r2)に対応する字幕データの表示タイミング情報として記録されている。
さらに、(c)MPU(TTML2)には、
<p begin="180s">
上記字幕表示タイミング情報が、字幕「バタン ドアの音」に対応付けて記録されている。
これは表示領域(r3)に対応する字幕データの表示タイミング情報として記録されている。
なお、(c)MPU(TTML2)には、表示期間情報(duration)が記述されていない。これは、その後の字幕データの表示により、前の字幕表示を自動的に消去する場合の設定である。
また、
<div region="r1">
<div region="r2">
<div region="r3">
これらのデータは、各TTML字幕データに含まれる字幕の表示領域の指定情報である。r1,r2,r3は異なる領域の指定情報である。
なお、TTML字幕データ中に指定された字幕データが、1つの指定領域に表示できない場合、時間経過に伴い、表示字幕を順次、切り替えて表示する処理を行なう。あるいは、ロールアップ表示、すなわち、字幕表示を複数行で行い、順次新しい字幕を下側の行に表示して、新しい字幕表示に伴い、上側の古い字幕を順次消していく処理を行なう。
図35に示すOPM=1の場合の受信装置30の処理について説明する。
まず、受信装置30は、MPTを参照して、動作モードの確認を行う。
OPM=01=セグメンテーションモード
この設定であることを確認する。
すなわち、字幕表示を、MPTとTTML字幕データの制御情報に規定された表示タイミングに従って表示するモードであることを確認する。
次に、受信装置30は、TTML字幕データを格納したMPUを順次、受信する。
受信装置30は、受信したMPUからTTML字幕データを取り出してTTML字幕データに記録された表示制御情報に従って、字幕データを表示する。
この表示処理結果が、図35の下段に示す4枚の画像となる。
受信装置は、まず、(b)MPU(TTML1)を受信し、このMPUに格納されたTTML1に従った字幕表示を行う。
画像(p)は、(b)MPU(TTML1)に格納されたTTML1に従って表示される字幕重畳画像である。
TTML1に格納された字幕データ「ありがとう」を、TTML1に記録された領域指定情報の指定領域(r1)に表示する。表示タイミングは時間(t1)となる。
この時間(t1)は、TTML1に記録された字幕表示時間情報、すなわち、
<p begin="156s" duration="5s">
上記字幕表示タイミング情報に対応する時間である。
受信装置は、次に(c)MPU(TTML2)を受信し、このMPUに格納されたTTML2に従った字幕表示を行う。
画像(q)〜(s)は、(c)MPU(TTML2)に格納されたTTML2に従って表示される字幕重畳画像である。
まず、TTML2に格納された字幕データ「どういたしまして」を、TTML2に記録された領域指定情報の指定領域(r2)に表示する。
この画像が画像(q)となる。
表示タイミングは時間(t2)となる。この時間(t2)は、TTML2に記録された「どういたしまして」に対応する字幕表示時間情報、すなわち、
<p begin="170s">
上記字幕表示タイミング情報に対応する時間である。
次に、TTML2に格納された字幕データ「例の件ですが」を、TTML2に記録された領域指定情報の指定領域(r2)に表示する。
この画像が画像(r)となる。
表示タイミングは時間(t3)となる。この時間(t3)は、TTML2に記録された「例の件ですが」に対応する字幕表示時間情報、すなわち、
<p begin="175s">
上記字幕表示タイミング情報に対応する時間である。
次に、TTML2に格納された字幕データ「○△×*・・・」を、TTML2に記録された領域指定情報の指定領域(r2)に表示する。
この画像が画像(s)となる。
表示タイミングは時間(t3)となる。
この字幕データ「○△×*・・・」については、TTML2に記録された「例の件ですが」に続く字幕であり、指定領域(r2)に入りきらないため、古い字幕を消去して上書きして表示される。したがって表示タイミングが指定時間(t2)からずれて表示される。なお、前述したようにロールアップ表示を行う構成としてもよい。
さらに、受信装置は、TTML2に格納された字幕データ「(バタン ドアの音)」を、TTML2に記録された領域指定情報の指定領域(r3)に表示する。
この画像が画像(s)となる。
表示タイミングは時間(t3)となる。この時間(t3)は、TTML2に記録された「(バタン ドアの音)」に対応する字幕表示時間情報、すなわち、
<p begin="180s">
上記字幕表示タイミング情報に対応する時間である。
このように動作モード(OPM)=1のセグメンテーションモード設定時には、受信装置30は、受信したMPUに格納されたTTML字幕データの字幕表示をTTML字幕データの制御情報に規定された表示タイミングに従って実行する。
この処理により、例えば映画等のコンテンツの画像のシーンと同期した字幕表示を実行することが可能となる。またこの動作モードの場合には各TTML字幕データの処理を独立して行うことができる。よって新たなTTML字幕データの処理を行う場合には以前のTTML字幕データの影響なく処理することが可能である。
[8−3.OPM=2:プログラムモードのモード設定時の処理について]
次に、動作モード(OPM)が、OPM=2、すなわち、
OPM=10=プログラムモード
上記設定である場合の字幕表示制御について図36を参照して説明する。
このOPM=2のモード設定は、例えば1つの番組単位の字幕の全てを記録したTTMLファイルを準備して、送信装置から受信装置に繰り返し送信し、受信装置が1つのTTMLファイルを利用して1番組の字幕表示を実行するモードである。
図36には、
(a)MPT
(b)MPUから抽出したTTML字幕データ(TTML1)
(c)MPT
これらの各データを示している。
また、図に示す字幕アセット(MPU/MFU)と、シグナリングは、送信装置20から受信装置30に対して送信されるMMTパケットに格納されたMPU/MFU、およびシグナリング・メッセージの各チャンネルを示している。
受信装置30は、MPTをシグナリング・メッセージの送信チャンネルから取得し、TTML字幕データを含むMPUまたはMFUは字幕アセットチャンネルから取得する。
さらに、図36の下段には、時間軸(t)と、時間経過に従って適用されるTTML字幕データと字幕表示例を示している。
(a)MPTには、
OPM=2(=10)
上記データが記録されている。
これは、先に図20を参照して説明したように、
OPM=10=プログラムモード
この設定であり、例えば1つの番組単位の字幕の全てを記録したTTMLファイルを利用して1つの番組の字幕表示を実行するモードである。
(b)MPUまたはMFUから抽出したTTML字幕データ(TTML1)は、1つの番組に関する字幕データをすべて含む。
なお、MPUを1回伝送するだけでは伝送した後にこの放送サービスを選局した場合に字幕表示ができないので、本モードにおいては同じTTML字幕データファイルのMPUを繰り返し送信する。
この(b)TTML1には複数の字幕データ各々について、表示タイミングと表示領域を規定した制御情報の記述が含まれる。
字幕「ありがとう」に対して、
<p begin="156s" duration="5s">
上記字幕表示タイミング情報が記録され、
<div region="r1">
上記表示領域情報が記録されている。
さらに、字幕「どういたしまして」に対して、
<p begin="170s">
上記字幕表示タイミング情報が記録され、
<div region="r2">
上記表示領域情報が記録されている。
さらに、上記表示領域情報<div region="r2">を適用した字幕として、「例の件ですが」、「○△×*・・」各々に対して、
<p begin="175s">
上記字幕表示タイミング情報が記録されている。
さらに、字幕「バタン ドアの音」に対応付けて、
<p begin="180s">
上記字幕表示タイミング情報が記録され、
<div region="r3">
上記表示領域情報が記録されている。
なお、先に、図35を参照して説明したように、TTML字幕データ中に指定された字幕データが、1つの指定領域に表示できない場合、時間経過に伴い、表示字幕を順次、切り替えて表示する処理を行なう。あるいは、ロールアップ表示、すなわち、字幕表示を複数行で行い、順次新しい字幕を下側の行に表示して、新しい字幕表示に伴い、上側の古い字幕を順次消していく処理を行なう。
図36に示すOPM=2の場合の受信装置30の処理について説明する。
まず、受信装置30は、MPTを参照して、動作モードの確認を行う。
OPM=10=プログラムモード
この設定であることを確認する。
すなわち、字幕表示を、1つの番組対応の字幕をすべて記録したTTML字幕データファイルに従って表示するモードであることを確認する。
次に、受信装置30は、1つの番組対応のTTML字幕データ全体を格納したMPUを一度、受信したら、繰り返し伝送されるMPUを受信する必要はない。
受信装置30は、番組対応のTTML字幕データを取り出してTTML字幕データに記録された表示制御情報に従って、字幕データを表示する。
この表示処理結果が、図36の下段に示す4枚の画像となる。
受信装置は、再構築したTTML1に従った字幕表示を行う。
画像(p)は、TTML1に従って表示される字幕重畳画像である。
TTML1に格納された字幕データ「ありがとう」を、TTML1に記録された領域指定情報の指定領域(r1)に表示する。表示タイミングは時間(t1)となる。
この時間(t1)は、TTML1に記録された字幕表示時間情報、すなわち、
<p begin="156s" duration="5s">
上記字幕表示タイミング情報に対応する時間である。
受信装置は、同じTTML1を用いて、順次、字幕表示を行う。
画像(q)〜(s)は、TTML1に従って表示される字幕重畳画像である。
TTML1に格納された字幕データ「どういたしまして」を、TTML1に記録された領域指定情報の指定領域(r2)に表示する。
この画像が画像(q)となる。
表示タイミングは時間(t2)となる。この時間(t2)は、TTML1に記録された「どういたしまして」に対応する字幕表示時間情報、すなわち、
<p begin="170s">
上記字幕表示タイミング情報に対応する時間である。
次に、TTML1に格納された字幕データ「例の件ですが」を、TTML1に記録された領域指定情報の指定領域(r2)に表示する。
この画像が画像(r)となる。
表示タイミングは時間(t3)となる。この時間(t3)は、TTML1に記録された「例の件ですが」に対応する字幕表示時間情報、すなわち、
<p begin="175s">
上記字幕表示タイミング情報に対応する時間である。
次に、TTML1に格納された字幕データ「○△×*・・・」を、TTML1に記録された領域指定情報の指定領域(r2)に表示する。
この画像が画像(s)となる。
表示タイミングは時間(t3)となる。
この字幕データ「○△×*・・・」については、TTML1に記録された「例の件ですが」に続く字幕であり、指定領域(r2)に入りきらないため、古い字幕を消去して上書きして表示される。したがって表示タイミングが指定時間(t2)からずれて表示される。なお、前述したようにロールアップ表示を行う構成としてもよい。
さらに、受信装置は、TTML1に格納された字幕データ「(バタン ドアの音)」を、TTML1に記録された領域指定情報の指定領域(r3)に表示する。
この画像が画像(s)となる。
表示タイミングは時間(t3)となる。この時間(t3)は、TTML1に記録された「(バタン ドアの音)」に対応する字幕表示時間情報、すなわち、
<p begin="180s">
上記字幕表示タイミング情報に対応する時間である。
このように動作モード(OPM)=2のプログラムモード設定時には、受信装置30は、1つの番組対応のTTML字幕データファイルを一度だけ受信し、繰り返し伝送されるデータは無視する処理を行う。
この処理により、例えば映画等のコンテンツについて、コンテンツ表示期間内にMPUの受信、解析処理を並列に実行する必要がなくなり、受信装置の処理負荷を軽減することが可能となる。またこの動作モードの場合にも各TTML字幕データの処理を独立して行うことができる。よって新たなTTML字幕データの処理を行う場合には以前のTTML字幕データの影響なく処理することが可能である。
図34〜図36を参照して動作モード(OPM)の各モード対応の受信装置30の処理について説明した。
先に説明したように、MPTに記録される動作モード(OPM)は、
00=ライブモード(Live mode)
01=セグメンテーションモード(Segmentation mode)
10=プログラムモード(Program mode)
これらのモード設定が可能な構成となっている。
00=ライブモード(Live mode)は、受信したTTML字幕データを、受信時に即時表示させるモードである。例えば同時通訳等の字幕データの表示などの際に利用されるモードである。
01=セグメンテーションモード(Segmentation mode)は、映画コンテンツのように、予め字幕データが準備されたコンテンツに適用されるモードであり、MPTとTTML字幕データの制御情報に規定された表示タイミングに従った表示を実行させる場合のモードである。
10=プログラムモード(Program mode)は、例えば1つの番組単位の字幕の全てを記録したTTMLファイルを準備して、送信装置から受信装置に送信し、受信装置が1つのTTMLファイルを利用して1番組の字幕表示を実行するモードである。
ライブモード(OPM=00)とセグメンテーションモード(OPM=1)との差異は、
OPM=00=受信TTMLに従った字幕の即時表示を行う、
OPM=01=受信TTMLに記録されたタイミングに基づいて字幕表示を行う、
これらの差異である。
上述した実施例では、図34を参照したOPM=00の処理例では、受信TTMLに字幕の表示タイミングの記述が含まれない。
従って、受信TTMLに字幕の表示タイミングの記述が含まれない場合は即時表示を行うというルールに従う設定とした場合、すべてOPM=01とすることも可能である。
ただし、前述した通りOPM=00の場合には、以前受信したTTML字幕データと独立して処理できないケースが存在する。一方でOPM=01の場合には各TTML字幕データは独立して処理することが可能である。受信装置における処理としては、新たに受信したTTML字幕データを直前のTTML字幕データ表示用データ格納用メモリ領域に上書きしてよいか、あるいは一旦別の領域に格納して関係性を確認すべきか判断する情報が必要である。つまり先行受信したTTML字幕データに基づく字幕表示と独立処理の可否を示すフラグ(独立処理可否フラグ)を、MPTに設定する構成としてもよい。
また、OPM=2の設定は、1つの番組対応のTTML字幕データを用いた処理を実行させるモードであるが、同様の意味を持つフラグとして、繰り返し同じTTML字幕データを伝送するか否かを示すフラグ(リピートフラグ)をMPTに設定する構成としてもよい。
[9.送信装置と受信装置の実行する処理の処理シーケンスについて]
次に、図37、図38に示すフローチャートを参照して、送信装置と受信装置の実行する処理シーケンスについて説明する。
まず、図37に示すフローチャートを参照して送信装置20の実行する処理について説明する。図37に示すフローに従った処理は、送信装置20のデータ処理部において実行される。例えばデータ処理部内のプログラム実行機能を有するCPUの制御の下、記憶部に格納されたプログラムに従って実行される。
なお、図37に示すフローは、字幕に対する処理を中心として説明するフローである。
送信装置は、ステップS101において、TTML字幕データを格納した1つ以上のMPUを生成する。また、必要に応じてMPUの分割データであるMFUを生成する。
MPUは、TTML字幕データを格納した字幕種類に応じたアセット対応のユニットである。MPUは、字幕種類ごとに規定されるアセット単位のデータとして生成する。
字幕種類とは、言語の種類のみならず、字幕チャンネルタグや、字幕タイプ等によっても区別される。
MPTには、アセット単位で制御情報や属性情報が記録され、同一アセットに属するTTML文字データは、同一の制御がなされることになる。
次に、ステップS102において、ステップS101で生成したMPUに対応する制御情報を格納したMPTを生成する。
MPTは、先に図9〜図12、図16〜図22を参照して説明した複数の字幕関連の制御情報や属性情報を格納したテーブルである。
前述したようにMPTの字幕情報記述子[subtitle descriptor]記録フィールドには、以下の記述子が記録される。
(1)言語コード(ISO_639_language_code)
(2)字幕タイプ(Type)
(3)タイムモード(TMD)
(4)表示モード(DMF)
(5)動作モード(OPM)
(6)表示書式(Format)
(7)圧縮モード(Compression_mode)
これらの字幕対応の制御情報、属性情報は、アセット単位の情報であり、同一アセットに属するTTML文字データに対しては、そのアセット単位の制御情報に従った制御、例えば表示タイミング制御が実行される。
次に、ステップS103において、MPTまたはMFU、さらにMPT、その他のシグナリング・メッセージを格納したパケットを生成する。
送信装置20は、ステップS105において、MPU/MFU,MPT等の情報を格納したパケットを送信する。
なお、送信装置20は、この他、画像、音声を格納したパケットや、その他の制御情報を格納したパケットも生成して送信する。
次に、図30に示すフローを参照して受信装置30の実行する処理シーケンスについて説明する。図30に示すフローに従った処理は、受信装置30のデータ処理部において実行される。例えばデータ処理部内のプログラム実行機能を有するCPUの制御の下、記憶部に格納されたプログラムに従って実行される。
なお、図30に示すフローは、字幕に対する処理を中心として説明するフローである。
受信装置は、ステップS201において、送信装置20から送信されるパケットを受信する。
ステップS202において、受信パケットのアセット識別子(MMTパケットのパケットID)に基づいて、データ種類ごと(画像、音声、字幕等)のパケットに分類する。
受信装置30は、次に、ステップS203において、MMTパケットのペイロードとして格納されたTTML字幕データを格納したMPUまたはMFU、さらにMPU対応の制御情報を格納したMPTを取得する。
次に、ステップS204において、MPUまたはMFUに記録されたTTML字幕データ、MPU対応の制御情報を格納したMPTの各記録情報、さらにそのたの時間情報等のシグナリング・メッセージを利用して字幕データの表示制御を実行する。
[10.送信装置と受信装置の構成例について]
図39は、送信装置20、受信装置30として適用可能な通信装置のハードウェア構成例を示している。
CPU(Central Processing Unit)401は、ROM(Read Only Memory)402、または記憶部408に記憶されているプログラムに従って各種の処理を実行するデータ処理部として機能する。例えば、上述した実施例において説明したシーケンスに従った処理を実行する。RAM(Random Access Memory)403には、CPU401が実行するプログラムやデータなどが記憶される。これらのCPU401、ROM402、およびRAM403は、バス404により相互に接続されている。
CPU401はバス404を介して入出力インタフェース405に接続され、入出力インタフェース405には、各種スイッチ、キーボード、マウス、マイクロホンなどよりなる入力部406、ディスプレイ、スピーカなどよりなる出力部407が接続されている。CPU401は、入力部406から入力される指令に対応して各種の処理を実行し、処理結果を例えば出力部407に出力する。
入出力インタフェース405に接続されている記憶部408は、例えばハードディスク等からなり、CPU401が実行するプログラムや各種のデータを記憶する。通信部409は、インターネットやローカルエリアネットワークなどのネットワークを介したデータ通信の送受信部、さらに放送波の送受信部として機能し、外部の装置と通信する。
入出力インタフェース405に接続されているドライブ410は、磁気ディスク、光ディスク、光磁気ディスク、あるいはメモリカード等の半導体メモリなどのリムーバブルメディア411を駆動し、データの記録あるいは読み取りを実行する。
なお、データの符号化あるいは復号は、データ処理部としてのCPU401の処理として実行可能であるが、符号化処理あるいは復号処理を実行するための専用ハードウェアとしてのコーデックを備えた構成としてもよい。
[11.本開示の構成のまとめ]
以上、特定の実施例を参照しながら、本開示の実施例について詳解してきた。しかしながら、本開示の要旨を逸脱しない範囲で当業者が実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本開示の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。
なお、本明細書において開示した技術は、以下のような構成をとることができる。
(1) TTML(Timed Text Markup Language)字幕データをMMT(MPEG Media Transport)フォーマットにおいて規定されるMMTパケットのペイロードとして格納したTTML字幕データ格納パケットと、
前記TTML字幕データに対応する字幕対応情報をシグナリング・メッセージとして受信する通信部と、
前記TTML字幕データと、前記シグナリング・メッセージを適用した字幕表示制御を実行するデータ処理部を有し、
前記シグナリング・メッセージは、MMTフォーマットにおいて規定されるMPT(MMTパッケージテーブル)に字幕対応情報を記録したメッセージであり、
前記MPTは、字幕表示タイミングを規定したタイムモード(TMD)の設定情報を含み、
前記データ処理部は、前記MPTに記録されたタイムモード(TMD)の設定モードに応じた字幕表示タイミングの制御を実行する受信装置。
(2)前記TTML字幕データ格納パケットは、1つのTTML字幕データファイルを、MMTフォーマットにおいて規定されるMPU(Media presentation unit)として設定したMMTパケットである前記(1)に記載の受信装置。
(3)前記MPTは、字幕種類単位で設定されるアセット単位の字幕表示制御情報を含み、前記データ処理部は、前記MPTに記録されたアセット単位の字幕表示制御情報に従って字幕表示制御を行う前記(1)または(2)に記載の受信装置。
(4) 受信装置において実行するデータ処理方法であり、
通信部が、TTML(Timed Text Markup Language)字幕データをMMT(MPEG Media Transport)フォーマットにおいて規定されるMMTパケットのペイロードとして格納したTTML字幕データ格納パケットと、
前記TTML字幕データに対応する字幕対応情報をシグナリング・メッセージとして受信し、
データ処理部が、前記TTML字幕データと、前記シグナリング・メッセージを適用した字幕表示制御を実行し、
前記シグナリング・メッセージは、MMTフォーマットにおいて規定されるMPT(MMTパッケージテーブル)に字幕対応情報を記録したメッセージであり、
前記MPTは、字幕表示タイミングを規定したタイムモード(TMD)の設定情報を含み、
前記データ処理部は、前記MPTに記録されたタイムモード(TMD)の設定モードに応じた字幕表示タイミングの制御を実行するデータ処理方法。
また、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。例えば、プログラムは記録媒体に予め記録しておくことができる。記録媒体からコンピュータにインストールする他、LAN(Local Area Network)、インターネットといったネットワークを介してプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。
なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。
以上、説明したように、本開示の一実施例の構成によれば、TTML字幕データの確実な表示制御を実現する装置、方法が実現される。
具体的には、TTML字幕データをMMTフォーマットにおいて規定されるMMTパケットのペイロードとして格納したTTML字幕データ格納パケットと、TTML字幕データに対応する字幕対応情報をシグナリング・メッセージとして送信装置から受信装置に送信する。シグナリング・メッセージは、字幕表示タイミングの制御モードであるタイムモード(TMD)や、字幕の即時表示やTTML記述に従った表示等を選択的に実行させる動作モード(OPM)を規定しており、受信装置はモード指定に応じた表示制御が可能となる。
本構成により、TTML字幕データの確実な表示制御を実現する装置、方法が実現される。
10 通信システム
20 送信装置
21 放送局
30 受信装置
31 TV
32 PC
33 携帯端末
51 コンテンツ提供部
52 情報処理部
53 クロック信号生成部
54 画像データ処理部
55 音声データ処理部
56 字幕データ処理部
57 シグナリングデータ処理部
58 TLVシグナリングデータ処理部
59 IPサービスマルチプレクサ
60 TLVマルチプレクサ
61 通信部
71 通信部
72 デマルチフレクサ
73 TLV処理部
74 UDP/IP処理部
75 MMT処理部
76 MMT−SIフィルタ
77 TLV=SIフィルタ
78 クロック信号生成部
79 画像データ処理部
80 音声データ処理部
81 字幕データ処理部
82 制御部
83 重畳部
91 画像MPU
92 音声MPU
93〜95 字幕MPU
96 シグナリング・メッセージ
401 CPU
402 ROM
403 RAM
404 バス
405 入出力インタフェース
406 入力部
407 出力部
408 記憶部
409 通信部
410 ドライブ
411 リムーバブルメディア

Claims (4)

  1. TTML(Timed Text Markup Language)字幕データをMMT(MPEG Media Transport)フォーマットにおいて規定されるMMTパケットのペイロードとして格納したTTML字幕データ格納パケットと、
    前記TTML字幕データに対応する字幕表示制御情報をシグナリング・メッセージとして受信する通信部と、
    前記TTML字幕データと、前記シグナリング・メッセージを適用した字幕表示制御を実行するデータ処理部を有し、
    前記シグナリング・メッセージは、MMTフォーマットにおいて規定されるMPT(MMTパッケージテーブル)に字幕表示制御情報を記録したメッセージであり、
    前記字幕表示制御情報は、タイムモード(TMD)識別子を含み、
    前記タイムモード識別子は、
    前記TTML字幕データの記述データを用いて字幕表示タイミングを決定するモードと、前記TTML字幕データの記述データを用いずに字幕表示タイミングを決定するモードを識別可能な識別子であり、
    前記データ処理部は、前記MPTに記録されたタイムモード識別子に応じて、前記TTML字幕データの記述データを用いた字幕表示タイミング制御、または前記TTML字幕データの記述データを用いない字幕表示タイミング制御のいずれかを選択して実行する受信装置。
  2. 前記TTML字幕データ格納パケットは、1つのTTML字幕データファイルを、MMTフォーマットにおいて規定されるMPU(Media presentation unit)として設定したMMTパケットである請求項1に記載の受信装置。
  3. 前記MPTは、字幕種類単位で設定されるアセット単位の字幕表示制御情報を含み、
    前記データ処理部は、
    前記MPTに記録されたアセット単位の字幕表示制御情報に従って字幕表示制御を行う請求項1に記載の受信装置。
  4. 受信装置において実行するデータ処理方法であり、
    通信部が、TTML(Timed Text Markup Language)字幕データをMMT(MPEG Media Transport)フォーマットにおいて規定されるMMTパケットのペイロードとして格納したTTML字幕データ格納パケットと、
    前記TTML字幕データに対応する字幕表示制御情報をシグナリング・メッセージとして受信し、
    データ処理部が、前記TTML字幕データと、前記シグナリング・メッセージを適用した字幕表示制御を実行し、
    前記シグナリング・メッセージは、MMTフォーマットにおいて規定されるMPT(MMTパッケージテーブル)に字幕表示制御情報を記録したメッセージであり、
    前記字幕表示制御情報は、タイムモード(TMD)識別子を含み、
    前記タイムモード識別子は、
    前記TTML字幕データの記述データを用いて字幕表示タイミングを決定するモードと、前記TTML字幕データの記述データを用いずに字幕表示タイミングを決定するモードを識別可能な識別子であり、
    前記データ処理部は、前記MPTに記録されたタイムモード識別子に応じて、前記TTML字幕データの記述データを用いた字幕表示タイミング制御、または前記TTML字幕データの記述データを用いない字幕表示タイミング制御のいずれかを選択して実行するデータ処理方法。
JP2014246864A 2014-12-05 2014-12-05 受信装置、およびデータ処理方法 Active JP5713140B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014246864A JP5713140B1 (ja) 2014-12-05 2014-12-05 受信装置、およびデータ処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014246864A JP5713140B1 (ja) 2014-12-05 2014-12-05 受信装置、およびデータ処理方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2014098664A Division JP6331670B2 (ja) 2014-05-12 2014-05-12 受信装置、および送信装置、並びにデータ処理方法

Publications (2)

Publication Number Publication Date
JP5713140B1 true JP5713140B1 (ja) 2015-05-07
JP2015216621A JP2015216621A (ja) 2015-12-03

Family

ID=53277261

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014246864A Active JP5713140B1 (ja) 2014-12-05 2014-12-05 受信装置、およびデータ処理方法

Country Status (1)

Country Link
JP (1) JP5713140B1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105100869A (zh) * 2015-07-13 2015-11-25 腾讯科技(深圳)有限公司 弹幕显示方法及装置
WO2017022461A1 (ja) * 2015-07-31 2017-02-09 ソニー株式会社 受信装置、送信装置、及び、データ処理方法
JP2021168520A (ja) * 2020-07-07 2021-10-21 マクセル株式会社 放送受信装置における映像と音声の再生同期方法
JP2021168521A (ja) * 2020-07-07 2021-10-21 マクセル株式会社 放送受信装置における映像、音声及び字幕の再生同期方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110463209B (zh) * 2017-03-29 2022-04-19 三星电子株式会社 用于在多媒体系统中发送和接收信号的设备和方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003284010A (ja) * 2002-03-26 2003-10-03 Mitsubishi Electric Corp 符号化装置及びメディアデータ同期方法
JP5409082B2 (ja) * 2009-04-01 2014-02-05 キヤノン株式会社 映像処理装置およびその制御方法
JP5685969B2 (ja) * 2011-02-15 2015-03-18 ソニー株式会社 表示制御方法、表示制御装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105100869A (zh) * 2015-07-13 2015-11-25 腾讯科技(深圳)有限公司 弹幕显示方法及装置
WO2017022461A1 (ja) * 2015-07-31 2017-02-09 ソニー株式会社 受信装置、送信装置、及び、データ処理方法
JP2021168520A (ja) * 2020-07-07 2021-10-21 マクセル株式会社 放送受信装置における映像と音声の再生同期方法
JP2021168521A (ja) * 2020-07-07 2021-10-21 マクセル株式会社 放送受信装置における映像、音声及び字幕の再生同期方法

Also Published As

Publication number Publication date
JP2015216621A (ja) 2015-12-03

Similar Documents

Publication Publication Date Title
JP6331670B2 (ja) 受信装置、および送信装置、並びにデータ処理方法
KR101828639B1 (ko) 멀티미디어 흐름을 동기화시키기 위한 방법 및 대응하는 장치
JP5713140B1 (ja) 受信装置、およびデータ処理方法
KR101946861B1 (ko) 멀티미디어 방송 서비스의 미디어 데이터 동기화 방법 및 장치
JP6323536B2 (ja) 受信装置および受信方法
WO2015050175A1 (ja) 受信装置および受信方法
JP2018182677A (ja) 情報処理装置、情報処理方法、プログラム、および記録媒体製造方法
JP5713142B1 (ja) 受信装置、およびデータ処理方法
JP2018182617A (ja) 情報処理装置、情報処理方法、プログラム、および記録媒体製造方法
JP5713141B1 (ja) 受信装置、およびデータ処理方法
JP5874870B1 (ja) 受信装置、および送信装置、並びにデータ処理方法
JP5674590B2 (ja) 送出装置、コンテンツ提供システム及びプログラム
JP6303969B2 (ja) 受信装置並びに受信方法
JP6551558B2 (ja) 受信装置並びに受信方法
JP6988974B2 (ja) 送信方法及び送信装置
JP2022019878A (ja) 受信方法及び受信装置
JP2001094907A (ja) 蓄積型デジタル放送における映像音声の部分再生方法及び受信装置
JP2019161677A (ja) 受信装置及び受信方法、並びに送信方法
KR20190125967A (ko) 멀티미디어 시스템에서 신호를 송신 및 수신하는 장치 및 방법
JP2001094945A (ja) デジタル放送における映像音声の部分再生方法及び受信装置
JPWO2018066385A1 (ja) 情報処理装置、情報処理方法、およびプログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150223

R151 Written notification of patent or utility model registration

Ref document number: 5713140

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250