JP6461638B2 - Receiving machine - Google Patents

Receiving machine Download PDF

Info

Publication number
JP6461638B2
JP6461638B2 JP2015031545A JP2015031545A JP6461638B2 JP 6461638 B2 JP6461638 B2 JP 6461638B2 JP 2015031545 A JP2015031545 A JP 2015031545A JP 2015031545 A JP2015031545 A JP 2015031545A JP 6461638 B2 JP6461638 B2 JP 6461638B2
Authority
JP
Japan
Prior art keywords
information
subtitle
caption
unit
merged
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015031545A
Other languages
Japanese (ja)
Other versions
JP2015173443A (en
Inventor
馬場 秋継
秋継 馬場
俊二 砂崎
俊二 砂崎
洋一 所
洋一 所
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2015031545A priority Critical patent/JP6461638B2/en
Publication of JP2015173443A publication Critical patent/JP2015173443A/en
Application granted granted Critical
Publication of JP6461638B2 publication Critical patent/JP6461638B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、映像コンテンツに重畳して表示させる字幕文字列を扱う受信機に関する。   The present invention relates to a receiver that handles subtitle character strings that are displayed superimposed on video content.

近年、デジタルテレビ放送において字幕サービス(クローズドキャプション)が提供されており、従来の映像コンテンツに文字列を重畳することで、聴覚障碍者もテレビ放送を楽しむことができる。非特許文献1には、字幕情報をPES(Packetized Elementary Stream)に収容して伝送する技術が開示されている。また、字幕情報をMMT(MPEG Media Transport)のMFU(Media
Fragment Unit)やMPU(Media Processing Unit)に収容して伝送する方式が検討されている。字幕情報に含まれる字幕文字列は、字幕情報で定義される時刻制御モードに応じて、番組または時刻に同期して表示されたり、同期せずに受信後に即時表示されたりする。非特許文献1に記載の字幕情報には、映像コンテンツのうち当該字幕情報と同時に伝送される部分が表示されるタイミングで、当該部分に重畳して表示される字幕文字列が格納される。そのため、受信機は、受信した字幕情報を順次表示させることで、映像コンテンツに対応する字幕文字列を表示させることができる。
In recent years, captioning services (closed captions) have been provided in digital television broadcasting, and by providing a character string superimposed on conventional video content, a hearing-impaired person can also enjoy television broadcasting. Non-Patent Document 1 discloses a technique for transmitting subtitle information in a PES (Packetized Elementary Stream). Also, subtitle information is converted to MMT (MPEG Media Transport) MFU (Media).
A method of accommodating and transmitting in a Fragment Unit) or MPU (Media Processing Unit) has been studied. The subtitle character string included in the subtitle information is displayed in synchronism with the program or time according to the time control mode defined by the subtitle information, or is displayed immediately after reception without being synchronized. The subtitle information described in Non-Patent Document 1 stores a subtitle character string that is displayed superimposed on the portion of the video content that is displayed at the timing at which the portion transmitted simultaneously with the subtitle information is displayed. Therefore, the receiver can display the subtitle character string corresponding to the video content by sequentially displaying the received subtitle information.

「デジタル放送におけるデータ放送符号化方式と伝送方式 標準規格」、ARIB STD−B24、5.4版、社団法人電波産業会、平成21年12月16日“Data Broadcast Coding and Transmission Standards for Digital Broadcasting”, ARIB STD-B24, 5.4 edition, Japan Radio Industry Association, December 16, 2009

近年、Hybridcast(登録商標)など、HTML5に準拠して記述されたアプリケーションを実行する受信機が提案されている。このような受信機が実行するアプリケーションに、字幕情報を利用させることが求められている。HTML5に準拠して記述されたアプリケーションを用いて字幕文字列を表示させるにあたり、字幕情報としてXML(Extensible Markup Language)をベースにした情報を用いることが検討されている。しかしながら、XMLをベースにした情報は、テキストファイルであるためにデータ量が多く、放送波の帯域を圧迫することが懸念される。他方、データ量を減らすためにテキストファイルを圧縮したバイナリファイルを用いた場合、ファイルの伸長に時間を要するため、即時性を要する情報の通知が遅れることが懸念される。
本発明の目的は、上述した課題を解決する受信機を提供することにある。
In recent years, a receiver that executes an application written in conformity with HTML5, such as Hybridcast (registered trademark), has been proposed. Subtitle information is required to be used by an application executed by such a receiver. In order to display a subtitle character string using an application described in conformity with HTML5, it is considered to use information based on XML (Extensible Markup Language) as subtitle information. However, since the information based on XML is a text file, the amount of data is large, and there is a concern that the band of the broadcast wave may be compressed. On the other hand, when a binary file obtained by compressing a text file is used to reduce the amount of data, it takes time to decompress the file, and there is a concern that notification of information that requires immediacy may be delayed.
The objective of this invention is providing the receiver which solves the subject mentioned above.

第1の態様は、映像ストリームを受信するストリーム受信部と、前記受信した映像ストリームから、映像コンテンツに重畳して表示させる字幕文字列を含む字幕情報を復号する字幕復号部と、前記受信した映像ストリームから、少なくとも前記字幕情報が圧縮されているか否かを示す圧縮情報を含む字幕情報テーブルを復号するテーブル復号部と、前記字幕復号部が復号した字幕情報のうち、前記字幕情報テーブルによって圧縮されていることが示されているものを伸長する字幕伸長部とを備え、前記字幕伸長部は、前記テーブル復号部が復号した字幕情報テーブルに前記字幕情報のXMLスキーマを指定する情報が含まれる場合に、当該情報によって指定されるXMLスキーマに基づいて前記字幕情報を伸長する受信機である。 The first aspect includes a stream reception unit that receives a video stream from the video stream received; and subtitles decoding unit for decoding the caption information including subtitle text to be displayed superimposed on the video content, the video said received from the stream, and a table decoder for decoding the caption information table including compression information indicating whether at least the subtitle information is compressed, among the caption information the subtitle decoder is decoded is compressed by the subtitle information table A subtitle decompression unit that decompresses what is shown to be, and the subtitle decompression unit includes information specifying the XML schema of the subtitle information in the subtitle information table decoded by the table decoding unit And a receiver that expands the caption information based on an XML schema specified by the information .

上記態様のうち少なくとも1つの態様によれば、受信機は、字幕情報テーブルに基づいて字幕情報の圧縮の有無を判断し、字幕情報の伸長を行うか否かを決定する。これにより、放送事業者は、即時性を要しない情報については字幕情報を圧縮して伝送し、即時性を要する情報については字幕情報を圧縮せずに伝送することで、即時性を要する情報を迅速に通知できるようにしつつ、放送波の帯域を節約することができる。   According to at least one of the above aspects, the receiver determines whether or not caption information is compressed based on the caption information table, and determines whether or not to expand the caption information. As a result, the broadcaster compresses subtitle information for information that does not require immediacy and transmits it without compressing subtitle information for information that requires immediacy. It is possible to save the broadcast wave band while enabling prompt notification.

第1の実施形態による放送システム1の構成を示す概略ブロック図である。It is a schematic block diagram which shows the structure of the broadcast system 1 by 1st Embodiment. 字幕情報の一例を示す図である。It is a figure which shows an example of caption information. 第1の実施形態に係る字幕文字列の表示方法を示すフローチャートである。It is a flowchart which shows the display method of the subtitle character string which concerns on 1st Embodiment. 第2の実施形態による放送システム1の構成を示す概略ブロック図である。It is a schematic block diagram which shows the structure of the broadcast system 1 by 2nd Embodiment. 併合字幕情報の例を示す図である。It is a figure which shows the example of merge subtitle information. 映像コンテンツ及び字幕情報を取得するHTML5アプリケーションの例を示す図である。It is a figure which shows the example of the HTML5 application which acquires video content and subtitle information. 併合字幕情報の生成方法を示す図である。It is a figure which shows the production | generation method of merged subtitle information.

《第1の実施形態》
以下、図面を参照しながら第1の実施形態について詳しく説明する。
図1は、第1の実施形態による放送システム1の構成を示す概略ブロック図である。
放送システム1は、放送送出装置100と受信機300を備えるシステムである。なお、放送送出装置100は放送事業者が所有するものであり、受信機300は利用者が所有するものである。
<< First Embodiment >>
Hereinafter, the first embodiment will be described in detail with reference to the drawings.
FIG. 1 is a schematic block diagram showing a configuration of a broadcasting system 1 according to the first embodiment.
The broadcast system 1 is a system that includes a broadcast transmission device 100 and a receiver 300. The broadcast sending device 100 is owned by the broadcaster, and the receiver 300 is owned by the user.

放送送出装置100は、映像パケット生成部101と字幕パケット生成部102と放送部103とを備える。
映像パケット生成部101は、映像コンテンツをMPU(Media Processing Unit)データに格納する。
字幕パケット生成部102は、字幕情報をMPUデータに格納する。字幕情報は、TTML(Timed Text Markup Language)の形式で記述された情報または、TTMLをEXIで圧縮したデータである。また、字幕情報には、一の時刻に画面に表示される字幕文字列が含まれる。つまり、字幕情報は、経時的に変化する映像コンテンツの内容に合わせて逐次変化する。
The broadcast transmission apparatus 100 includes a video packet generation unit 101, a caption packet generation unit 102, and a broadcast unit 103.
The video packet generator 101 stores video content in MPU (Media Processing Unit) data.
The caption packet generation unit 102 stores the caption information in the MPU data. The caption information is information described in a TTML (Timed Text Markup Language) format or data obtained by compressing TTML with EXI. The caption information includes a caption character string displayed on the screen at one time. That is, subtitle information changes sequentially according to the content of video content that changes over time.

図2は、字幕情報の一例を示す図である。
字幕情報は、図2に示すように、一の時刻に画面に表示される字幕文字列を格納するTTML形式のデータである。図2に示す例では、00:00:11:06から00:00:12:14までの時刻に表示される字幕文字列が字幕情報に格納されている。このように、字幕情報に一の時刻に画面に表示される字幕文字列を格納することで、字幕情報のデータサイズが小さくなり、放送送出装置100は、字幕情報を短時間で確実に送出することができる。また、字幕情報には、字幕文字列ごとに異なるIDが割り振られる。
FIG. 2 is a diagram illustrating an example of caption information.
As shown in FIG. 2, the caption information is data in TTML format that stores a caption character string displayed on the screen at one time. In the example illustrated in FIG. 2, a caption character string displayed at a time from 00: 00: 11: 06 to 00: 00: 12: 14 is stored in the caption information. Thus, by storing the subtitle character string displayed on the screen at one time in the subtitle information, the data size of the subtitle information is reduced, and the broadcast transmission apparatus 100 reliably transmits the subtitle information in a short time. be able to. Further, different IDs are assigned to the caption information for each caption character string.

また、字幕パケット生成部102は、字幕情報に関するメタデータを格納する字幕情報テーブルをMPUデータに格納する。字幕情報テーブルは、当該アセットで伝送中の全ての字幕情報ついての字幕モード及びスキーマURLと、伝送中の複数言語の字幕それぞれについての字幕ID、言語コード、表示モード、及び圧縮モードとを格納するテーブルである。字幕モードとは、当該字幕情報が、表示すべき字幕文字列を都度フラグメントで伝送する基本字幕情報であるか、番組において表示すべき字幕文字列を一括で伝送する字幕情報や、字幕文字列に加えて当該字幕文字列の装飾方法などを含む字幕情報などの拡張字幕情報であるかを示す情報である。スキーマURLは、XMLにより記述された字幕が圧縮されている場合に、当該字幕情報の伸長に利用する字幕のXMLスキーマを取得するためのURLを示す情報である。字幕IDとは、当該アセットで伝送する複数言語の字幕情報の、それぞれの言語の字幕情報を指し示すためのIDである。例えば、ある字幕IDを指定することで、受信機300が日本語の字幕を表示できるようにするものである。表示モードとは、受信機300における字幕文字列の表示を自動表示にするか、自動非表示にするか、選択表示にするか、特定条件で表示・非表示を切り替えるかを示す情報である。
圧縮モードとは、当該字幕情報が圧縮されているか否かを示す情報である。具体的には、字幕情報が圧縮されている場合に圧縮モードの値は「1」を示し、字幕情報が圧縮されていない場合に圧縮モードの値は「0」を示す。本実施形態において圧縮モードは圧縮情報の一例である。
Also, the caption packet generation unit 102 stores a caption information table that stores metadata regarding caption information in the MPU data. The subtitle information table stores subtitle modes and schema URLs for all subtitle information being transmitted with the asset, and subtitle IDs, language codes, display modes, and compression modes for subtitles in multiple languages being transmitted. It is a table. In the subtitle mode, the subtitle information is basic subtitle information that transmits the subtitle character string to be displayed as a fragment each time, or the subtitle character string that is to be displayed in the program in a batch or subtitle character string. In addition, it is information indicating whether it is extended caption information such as caption information including a decoration method of the caption character string. The schema URL is information indicating a URL for acquiring the XML schema of the subtitle used for decompressing the subtitle information when the subtitle described in XML is compressed. The subtitle ID is an ID for indicating subtitle information in each language of subtitle information in multiple languages transmitted by the asset. For example, by designating a certain subtitle ID, the receiver 300 can display Japanese subtitles. The display mode is information indicating whether the subtitle character string display in the receiver 300 is automatically displayed, automatically hidden, selected, or switched between display and non-display according to a specific condition.
The compression mode is information indicating whether or not the caption information is compressed. Specifically, the value of the compression mode indicates “1” when the caption information is compressed, and the value of the compression mode indicates “0” when the caption information is not compressed. In the present embodiment, the compression mode is an example of compression information.

放送部103は、映像コンテンツを格納したMPU、字幕情報を格納したMPU、及び字幕情報テーブルを格納したMPUを、放送波に多重して逐次送出する。具体的には、映像コンテンツを格納したMPUデータを含むアセットと、字幕情報を格納したMPUデータ及び字幕情報テーブルを格納したMPUデータを含むアセットとが、放送波に多重され、遂次送出される。つまり、放送波には、映像ストリームが多重される。なお、字幕情報を含むアセットにおいては、どのタイミングで放送を受信しても字幕情報を適切に取得できるように、一定の頻度で当該字幕情報のメタデータを格納する字幕情報テーブルが伝送される。   The broadcasting unit 103 multiplexes an MPU storing video content, an MPU storing subtitle information, and an MPU storing a subtitle information table on a broadcast wave and sequentially transmits them. Specifically, an asset including MPU data storing video content, an MPU data storing subtitle information, and an asset including MPU data storing a subtitle information table are multiplexed on a broadcast wave and sequentially transmitted. . That is, the video stream is multiplexed on the broadcast wave. Note that, in an asset including subtitle information, a subtitle information table that stores metadata of the subtitle information is transmitted at a certain frequency so that the subtitle information can be appropriately acquired no matter what timing the broadcast is received.

受信機300は、放送受信部301、トランスポート復号部302、映像・音声復号部303、字幕復号部304、テーブル復号部305、字幕伸長部306、字幕処理部307、表示制御部308を備える。
放送受信部301は、放送送出装置100から送出された放送波を受信する。これにより、放送受信部301は、映像ストリームを受信する。本実施形態において放送受信部301は、ストリーム受信部の一例である。
トランスポート復号部302は、放送波に多重されたMMTPパケットをMPUデータとセクションデータとに分離し、MPUデータを映像・音声復号部303、字幕復号部304、テーブル復号部305へ出力する。
The receiver 300 includes a broadcast receiving unit 301, a transport decoding unit 302, a video / audio decoding unit 303, a caption decoding unit 304, a table decoding unit 305, a caption expansion unit 306, a caption processing unit 307, and a display control unit 308.
The broadcast receiving unit 301 receives broadcast waves sent from the broadcast sending device 100. Thereby, the broadcast receiving unit 301 receives the video stream. In the present embodiment, the broadcast receiving unit 301 is an example of a stream receiving unit.
The transport decoding unit 302 separates the MMTP packet multiplexed on the broadcast wave into MPU data and section data, and outputs the MPU data to the video / audio decoding unit 303, the caption decoding unit 304, and the table decoding unit 305.

映像・音声復号部303は、トランスポート復号部302から受け付けたMPUデータを映像コンテンツに復号することで、映像コンテンツを取得する。
字幕復号部304は、トランスポート復号部302から受け付けたMPUデータを字幕情報に復号することで、字幕情報を取得する。
テーブル復号部305は、トランスポート復号部302から受け付けたMPUデータを字幕情報テーブルに復号することで、字幕情報テーブルを取得する。
The video / audio decoding unit 303 acquires the video content by decoding the MPU data received from the transport decoding unit 302 into the video content.
The caption decoding unit 304 acquires the caption information by decoding the MPU data received from the transport decoding unit 302 into the caption information.
The table decoding unit 305 acquires the caption information table by decoding the MPU data received from the transport decoding unit 302 into the caption information table.

字幕伸長部306は、テーブル復号部305が復号した字幕情報テーブルの圧縮モードが「1」である場合に、字幕復号部304が復号した字幕情報を伸長する。字幕伸長部306は、スキーマ記憶部309が記憶するXMLスキーマに基づいて字幕情報の伸長を行う。なお、字幕伸長部306は、字幕情報テーブルにスキーマURLが記述されている場合、当該スキーマURLにアクセスして得られるXMLスキーマの内容をスキーマ記憶部309に書きこんだ上で、更新されたXMLスキーマに基づいて字幕情報の伸長を行う。
字幕処理部307は、字幕復号部304が復号した字幕情報に基づいて、字幕文字列の文字色、配置及び表示・非表示のタイミングを制御する。字幕処理部307は、受信機300の組み込みソフトウェア(レジデントアプリ)である。
The caption expansion unit 306 expands the caption information decoded by the caption decoding unit 304 when the compression mode of the caption information table decoded by the table decoding unit 305 is “1”. The caption decompression unit 306 decompresses caption information based on the XML schema stored in the schema storage unit 309. When the schema URL is described in the caption information table, the caption decompression unit 306 writes the content of the XML schema obtained by accessing the schema URL into the schema storage unit 309 and then updates the XML. The subtitle information is expanded based on the schema.
The caption processing unit 307 controls the character color, arrangement, and display / non-display timing of the caption character string based on the caption information decoded by the caption decoding unit 304. The caption processing unit 307 is embedded software (resident application) of the receiver 300.

表示制御部308は、映像・音声復号部303が復号した映像コンテンツを表示させる表示信号を表示装置(図示せず)に出力する。また、利用者の操作によって字幕の表示の指示があった場合、字幕処理部307が処理した字幕情報を映像コンテンツに重畳して表示させる表示信号を表示装置に出力する。   The display control unit 308 outputs a display signal for displaying the video content decoded by the video / audio decoding unit 303 to a display device (not shown). Also, when there is an instruction to display subtitles by the user's operation, a display signal that superimposes the subtitle information processed by the subtitle processing unit 307 on the video content is displayed on the display device.

スキーマ記憶部309は、字幕情報のデータ構造を定義したXMLスキーマを記憶する。なお、スキーマ記憶部309は、字幕情報の定義の変化に合わせてXMLスキーマを書き換え可能に記憶する。   The schema storage unit 309 stores an XML schema that defines the data structure of caption information. The schema storage unit 309 stores the XML schema in a rewritable manner in accordance with changes in the definition of caption information.

ここで、受信機300による字幕文字列の表示方法について説明する。
図3は、第1の実施形態に係る字幕文字列の表示方法を示すフローチャートである。
放送受信部301が放送波を受信すると、トランスポート復号部302は、放送波からMPUデータを取得する。放送波が伝送するアセットにおいて、字幕情報の前に当該字幕情報のメタデータを格納する字幕情報テーブルが伝送されるため、まずテーブル復号部305が、MPUデータを字幕情報テーブルに復号する(ステップS1)。次に、字幕復号部304は、MPUデータを字幕情報に復号する(ステップS2)。
Here, a method of displaying a caption character string by the receiver 300 will be described.
FIG. 3 is a flowchart showing a subtitle character string display method according to the first embodiment.
When the broadcast receiving unit 301 receives a broadcast wave, the transport decoding unit 302 acquires MPU data from the broadcast wave. In the asset transmitted by the broadcast wave, since the caption information table storing the metadata of the caption information is transmitted before the caption information, the table decoding unit 305 first decodes the MPU data into the caption information table (step S1). ). Next, the caption decoding unit 304 decodes MPU data into caption information (step S2).

次に、字幕伸長部306は、テーブル復号部305が復号した字幕情報テーブルの圧縮モードを読み出す(ステップS3)。次に、字幕伸長部306は、字幕情報テーブルにおいて、ステップS2で復号した字幕情報に関連付けられた圧縮モードが「1」を示すか否か判定する(ステップS4)。字幕伸長部306は、字幕情報テーブルの圧縮モードが「1」を示す場合(ステップS4:YES)、字幕情報テーブルにスキーマURLが含まれるか否かを判定する(ステップS5)。字幕伸長部306は、字幕情報テーブルにスキーマURLが含まれていると判定した場合(ステップS5:YES)、当該スキーマURLにアクセスして新たなXMLスキーマを取得し、当該XMLスキーマによりスキーマ記憶部309が記憶するXMLスキーマを更新する(ステップS6)。   Next, the caption expansion unit 306 reads the compression mode of the caption information table decoded by the table decoding unit 305 (step S3). Next, the subtitle expansion unit 306 determines whether or not the compression mode associated with the subtitle information decoded in step S2 indicates “1” in the subtitle information table (step S4). When the compression mode of the caption information table indicates “1” (step S4: YES), the caption expansion unit 306 determines whether or not the schema URL is included in the caption information table (step S5). When the caption decompression unit 306 determines that the schema URL is included in the caption information table (step S5: YES), the caption decompression unit 306 accesses the schema URL to acquire a new XML schema, and the schema storage unit uses the XML schema. The XML schema stored in 309 is updated (step S6).

字幕伸長部306は、新たなXMLスキーマをスキーマ記憶部309に記録した場合、または字幕情報テーブルにスキーマURLが含まれていない場合(ステップS5:NO)、スキーマ記憶部309からXMLスキーマを読み出す(ステップS7)。そして、字幕伸長部306は、読み出したXMLスキーマに基づいて字幕情報を伸長し(ステップS8)、伸長した字幕情報を字幕処理部307へ出力する。   The subtitle decompression unit 306 reads the XML schema from the schema storage unit 309 when a new XML schema is recorded in the schema storage unit 309 or when the schema URL is not included in the subtitle information table (step S5: NO) ( Step S7). Then, the caption decompression unit 306 decompresses the caption information based on the read XML schema (step S8), and outputs the decompressed caption information to the caption processing unit 307.

他方、字幕伸長部306が読み出した字幕情報テーブルにおいて、ステップS2で復号した字幕情報に関連付けられた圧縮モードが「0」を示す場合(ステップS4:NO)、字幕情報は字幕伸長部306にて伸長されず、字幕復号部304から字幕処理部307へ出力される。字幕処理部307は、字幕復号部304または字幕伸長部306から入力された字幕情報に基づいて、字幕文字列の文字色、配置及び表示・非表示のタイミングを制御する(ステップS9)。   On the other hand, when the compression mode associated with the caption information decoded in step S2 indicates “0” in the caption information table read by the caption decompression unit 306 (step S4: NO), the caption information is stored in the caption decompression unit 306. Without being decompressed, it is output from the caption decoding unit 304 to the caption processing unit 307. The caption processing unit 307 controls the character color, arrangement, and display / non-display timing of the caption character string based on the caption information input from the caption decoding unit 304 or the caption decompression unit 306 (step S9).

このように、本実施形態によれば、受信機300は、放送波に多重される字幕情報に、圧縮されたものと圧縮されていないものが混在する場合に、字幕情報テーブルの情報に基づいて伸長の可否を決定する。これにより、放送事業者は、即時性を要しない情報については字幕情報を圧縮して伝送し、即時性を要する情報については字幕情報を圧縮せずに伝送することで、即時性を要する情報を迅速に通知できるようにしつつ、放送波の帯域を節約することができる。また、字幕情報のXMLスキーマ仕様が変更された場合にも、受信機300は、字幕情報テーブルによりそのスキーマURLにアクセスして最新のXMLスキーマを取得し、更新したうえで字幕情報を伸長することができる。   Thus, according to the present embodiment, the receiver 300 is based on the information in the caption information table when the compressed information and the uncompressed information are mixed in the caption information multiplexed on the broadcast wave. Determines whether or not expansion is possible. As a result, the broadcaster compresses subtitle information for information that does not require immediacy and transmits it without compressing subtitle information for information that requires immediacy. It is possible to save the broadcast wave band while enabling prompt notification. Further, even when the XML schema specification of the caption information is changed, the receiver 300 accesses the schema URL by the caption information table, acquires the latest XML schema, updates the caption information, and then expands the caption information. Can do.

《第2の実施形態》
次に、第2の実施形態について説明する。
図4は、第2の実施形態による放送システム1の構成を示す概略ブロック図である。
第2の実施形態に係る放送システム1は、第1の実施形態と受信機300の構成が異なる。第2の実施形態では、受信機300が実行するHTML5に準拠して記述されたアプリケーションにおいて、字幕情報に含まれる字幕文字列を提示する例について説明する。
<< Second Embodiment >>
Next, a second embodiment will be described.
FIG. 4 is a schematic block diagram showing the configuration of the broadcast system 1 according to the second embodiment.
The broadcasting system 1 according to the second embodiment is different from the first embodiment in the configuration of the receiver 300. In the second embodiment, an example in which a subtitle character string included in subtitle information is presented in an application described in accordance with HTML5 executed by the receiver 300 will be described.

受信機300は、第1の実施形態の構成に加えて、さらに字幕併合部310とアプリケーション実行部311を備える。   The receiver 300 further includes a caption merging unit 310 and an application execution unit 311 in addition to the configuration of the first embodiment.

字幕併合部310は、字幕復号部304が復号した字幕情報及び字幕伸長部306が伸長した字幕情報のうち、字幕文字列の提示が終了していない字幕情報を併合した併合字幕情報を生成する。ここで、字幕文字列の提示が終了していない字幕情報とは、アプリケーション実行部311によって現在提示されている字幕文字列を含む字幕情報と、現在時刻以降に表示すべき字幕文字列を含む字幕情報のことである。   The caption merging unit 310 generates merged caption information obtained by merging the caption information that has not been presented with the caption character string, among the caption information decoded by the caption decoding unit 304 and the caption information expanded by the caption expansion unit 306. Here, the caption information for which the presentation of the caption character string has not ended is the caption information including the caption character string currently presented by the application execution unit 311 and the caption including the caption character string to be displayed after the current time. It is information.

図5は、併合字幕情報の例を示す図である。
図5に示すように、併合字幕情報は、複数の字幕文字列を格納するTTML形式のデータとなる。図5に示す併合字幕情報は、複数の字幕情報に含まれる字幕文字列を示すpタグを併合したdiv要素を有する。
FIG. 5 is a diagram illustrating an example of merged caption information.
As shown in FIG. 5, the merged caption information is TTML format data storing a plurality of caption character strings. The merged caption information shown in FIG. 5 has a div element obtained by merging p tags indicating the caption character strings included in the plurality of caption information.

アプリケーション実行部311は、HTML5に準拠して記述されたアプリケーションを実行する。アプリケーション制御部が実行する当該アプリケーションには、字幕情報を処理するアプリケーションが含まれる。   The application execution unit 311 executes an application described in conformity with HTML5. The application executed by the application control unit includes an application for processing caption information.

ここで、アプリケーション実行部311が映像コンテンツ及び字幕情報を取得する方法について説明する。
図6は、映像コンテンツ及び字幕情報を取得するHTML5アプリケーションの例を示す図である。
アプリケーション実行部311が実行するアプリケーションは、HTML5に準拠して記述されている。当該アプリケーションにおいて、映像コンテンツは、図6(A)に示すvideo要素、または図6(B)に示すobject要素において参照される。そして、図6(A)、(B)に示すように、映像コンテンツを参照する要素に内包されるtrack要素において、併合字幕情報が参照される。track要素は、メディア要素する外部の同期テキストトラックを明示的に指定する要素として、HTML5において定義された要素である。なお、複数の言語の字幕情報が存在する場合、図6(A)、(B)に示すように複数のtrack要素を用いてそれぞれの言語の併合字幕情報を参照する。なお、多言語の字幕文字列の参照方法は、これに限られず、例えば、1つの併合字幕情報の中に複数の言語の字幕文字列を格納しても良い。この場合、字幕文字列は、div要素によって言語ごとに分割される。
Here, a method in which the application execution unit 311 acquires video content and caption information will be described.
FIG. 6 is a diagram illustrating an example of an HTML5 application that acquires video content and caption information.
An application executed by the application execution unit 311 is described in conformity with HTML5. In the application, video content is referred to in the video element shown in FIG. 6A or the object element shown in FIG. Then, as shown in FIGS. 6A and 6B, the merged caption information is referred to in the track element included in the element that refers to the video content. The track element is an element defined in HTML5 as an element that explicitly specifies an external synchronized text track as a media element. When subtitle information in a plurality of languages exists, the merged subtitle information in each language is referred to using a plurality of track elements as shown in FIGS. Note that the multilingual subtitle character string reference method is not limited to this. For example, subtitle character strings of a plurality of languages may be stored in one merged subtitle information. In this case, the subtitle character string is divided for each language by the div element.

このように、本実施形態では、アプリケーション実行部311は、通常ネットワークを介して取得する情報を参照するtrack要素を用いて、放送波に多重された字幕情報を併合した併合字幕情報を取得する。
そして、図6(C)に示すように、アプリケーションにJavaScript(登録商標)によりtrack要素によって参照される字幕情報のキュー(字幕文字列)を取得する命令を記載されていることで、アプリケーション実行部311は、併合字幕情報を処理することができる。
As described above, in the present embodiment, the application execution unit 311 acquires merged caption information obtained by merging caption information multiplexed on a broadcast wave using a track element that refers to information acquired via a normal network.
Then, as shown in FIG. 6C, an application execution unit is described in which an instruction for acquiring a cue (subtitle character string) of subtitle information referred to by a track element by JavaScript (registered trademark) is described in the application. 311 can process the merged caption information.

そして、アプリケーションに、併合字幕情報の更新(例えば、oncuechangeイベント)をイベントとして起動するイベントハンドラが記述されることで、アプリケーション実行部311は、併合字幕情報が更新されたときに、当該併合字幕情報を再取得する処理を実行することができる。これにより、アプリケーション実行部311は、順次送出される字幕情報に含まれる各字幕文字列を、もれなく提示することができる。   Then, by describing an event handler that activates an update of merged caption information (for example, an oncuechange event) as an event in the application, the application execution unit 311 allows the merged caption information to be updated when the merged caption information is updated. It is possible to execute the process of re-acquiring. Thereby, the application execution unit 311 can present all the subtitle character strings included in the sequentially transmitted subtitle information.

ここで、字幕併合部310による併合字幕情報の生成方法について説明する。
図7は、併合字幕情報の生成方法を示す図である。
図7に示す例では、受信機300において字幕情報がA、B、C、D、Eの順に受信・復号される。ここで、字幕情報B及び字幕情報Dは圧縮されているものとする。
図7に示す例において、字幕情報Bが字幕復号部304によって復号され、さらに字幕伸長部306によって伸長されたとき、アプリケーション実行部311は、字幕情報Aに含まれる字幕文字列を表示している。なお、現在どの字幕文字列を表示しているかは、字幕情報及び併合字幕情報に含まれる字幕文字列に関連付けられた表示時刻を参照することで分かる。このとき、字幕併合部310は、現在表示している字幕文字列を含む字幕情報である字幕情報Aと、字幕情報Aが含む字幕文字列以降に表示される字幕文字列を含む字幕文字列である字幕情報Bとを併合して、併合字幕情報を生成する。なお、併合される字幕情報Bは、字幕伸長部306によって伸長されたものである。
Here, a method of generating merged caption information by the caption merger 310 will be described.
FIG. 7 is a diagram illustrating a method for generating merged caption information.
In the example illustrated in FIG. 7, caption information is received and decoded in the order of A, B, C, D, and E in the receiver 300. Here, it is assumed that the caption information B and the caption information D are compressed.
In the example illustrated in FIG. 7, when the caption information B is decoded by the caption decoding unit 304 and further expanded by the caption expansion unit 306, the application execution unit 311 displays the caption character string included in the caption information A. . Note that which subtitle character string is currently displayed can be understood by referring to the display time associated with the subtitle character string included in the subtitle information and the merged subtitle information. At this time, the subtitle merging unit 310 includes subtitle information A that is subtitle information including the subtitle character string that is currently displayed, and a subtitle character string that includes subtitle character strings that are displayed after the subtitle character string included in the subtitle information A. A certain subtitle information B is merged to generate merged subtitle information. Note that the caption information B to be merged is expanded by the caption expansion unit 306.

字幕併合部310は、併合の対象となる字幕情報のヘッダにstyle要素及びregion要素が複数含まれる場合や当該要素がそれぞれ異なるIDを有する場合、IDが重複する要素を除去した上で各要素をヘッダ内に併合し、それぞれをIDの昇順にソートする。また、字幕併合部310は、併合の対象となる字幕情報のdiv要素に複数のp要素が含まれる場合やそれぞれ異なるIDを有する場合、各p要素を1つのdiv要素内に併合し、各p要素をIDの昇順にソートする。また、字幕併合部310は、併合の対象となる字幕情報が複数のdiv要素を含む場合やそれぞれ異なるIDを有する場合、各div要素をbody要素内に併合し、各div要素をIDの昇順にソートする。これにより、字幕併合部は、併合字幕情報を生成する。   The subtitle merging unit 310 removes elements with overlapping IDs when the header of the subtitle information to be merged includes a plurality of style elements and region elements, or when the elements have different IDs. Merge in header and sort each in ascending ID order. Also, the subtitle merging unit 310 merges each p element into one div element when a plurality of p elements are included in the div element of the subtitle information to be merged or has different IDs. Sort elements in ascending ID order. Also, the subtitle merging unit 310 merges each div element into a body element when the subtitle information to be merged includes a plurality of div elements or has different IDs, and the div elements are in ascending order of ID. Sort. Accordingly, the caption merging unit generates merged caption information.

そして、字幕併合部310は、過去に生成した併合字幕情報に当該併合字幕情報を上書きすることで、併合字幕情報を更新する。字幕併合部310は、併合字幕情報の更新の通知をアプリケーション実行部311に通知する。
アプリケーション実行部311は、実行中のアプリケーションに更新の通知を受けると、併合字幕情報の更新をイベントとして起動するイベントハンドラが記述されている場合、当該イベントハンドラを実行し、併合字幕情報を再取得する。このときアプリケーション実行部は、更新前の併合字幕情報に含まれる字幕文字列(字幕情報Aに含まれる字幕文字列)が表示されているが、併合字幕情報の再取得によって表示中の字幕文字列が表示できなくなるといった問題は生じない。これは、字幕情報Aに含まれる字幕文字列が、更新後の併合字幕情報にも含まれるためである。
Then, the caption merging unit 310 updates the merged caption information by overwriting the merged caption information on the merged caption information generated in the past. The caption merging unit 310 notifies the application execution unit 311 of the update of the merged caption information.
When the application execution unit 311 receives an update notification to the application being executed, if an event handler that starts updating the merged caption information as an event is described, the application execution unit 311 executes the event handler and reacquires the merged caption information. To do. At this time, the application execution unit displays the subtitle character string (the subtitle character string included in the subtitle information A) included in the merged subtitle information before the update, but the subtitle character string being displayed by reacquisition of the merged subtitle information There is no problem that cannot be displayed. This is because the subtitle character string included in the subtitle information A is also included in the updated merged subtitle information.

同様に、字幕情報Cを復号したときに表示されている字幕文字列が字幕情報Bに含まれるものである場合、字幕情報Bと字幕情報Cとを併合する。また、字幕情報Dを復号し、さらに伸長したときに表示されている字幕文字列が字幕情報Cに含まれるものである場合、字幕情報Cと字幕情報Dとを併合する。また、字幕情報Eを復号したときに表示されている字幕文字列が字幕情報Cに含まれるものである場合、字幕情報Cと字幕情報Dと字幕情報Eとを併合する。   Similarly, when the subtitle character string displayed when the subtitle information C is decoded is included in the subtitle information B, the subtitle information B and the subtitle information C are merged. Further, when the subtitle character string displayed when the subtitle information D is decoded and further expanded is included in the subtitle information C, the subtitle information C and the subtitle information D are merged. Further, when the subtitle character string displayed when the subtitle information E is decoded is included in the subtitle information C, the subtitle information C, the subtitle information D, and the subtitle information E are merged.

このように、第2の実施形態に係る放送システム1は、字幕文字列の提示が終了していない字幕情報を併合して併合字幕情報を生成し、当該併合字幕情報をHTML5のtrack要素に参照させる。これにより、第2の実施形態に係る放送システム1は、HTML5に準拠して記述されたアプリケーションにおいて、字幕情報に含まれる字幕文字列を提示することができる。このとき、併合字幕情報は、受信時に圧縮されていない字幕情報については、字幕復号部304が復号した字幕情報を併合し、受信時に圧縮されている字幕情報については、字幕伸長部306が伸長した字幕情報を併合する。これにより、字幕情報の圧縮の有無に関わらず、アプリケーション実行部311において併合字幕情報を処理することができる。   As described above, the broadcasting system 1 according to the second embodiment generates merged caption information by merging the caption information for which the presentation of the caption character string has not ended, and refers to the merged caption information in the track element of HTML5. Let Thereby, the broadcasting system 1 according to the second embodiment can present a caption character string included in caption information in an application described in conformity with HTML5. At this time, the merged subtitle information is merged with the subtitle information decoded by the subtitle decoding unit 304 for subtitle information that is not compressed at the time of reception, and the subtitle expansion unit 306 is expanded for subtitle information that is compressed at the time of reception. Merge subtitle information. Accordingly, the merged subtitle information can be processed in the application execution unit 311 regardless of whether or not the subtitle information is compressed.

以上、図面を参照して一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、様々な設計変更等をすることが可能である。
例えば、上述した実施形態では、字幕情報テーブルと字幕情報とを含む映像ストリームが放送波に多重され、放送受信部301が当該放送波を受信する場合について説明したが、これに限らない。例えば、受信機300は、インターネットなどのネットワークを介して、字幕情報テーブルと字幕情報とを含む映像ストリームを受信しても良い。つまり、字幕情報及び字幕情報テーブルは、インターネットを介して配信されるものであっても良い。
As described above, the embodiment has been described in detail with reference to the drawings. However, the specific configuration is not limited to that described above, and various design changes and the like can be made.
For example, in the above-described embodiment, the video stream including the caption information table and the caption information is multiplexed on the broadcast wave, and the broadcast receiving unit 301 receives the broadcast wave. However, the present invention is not limited to this. For example, the receiver 300 may receive a video stream including a caption information table and caption information via a network such as the Internet. That is, the caption information and the caption information table may be distributed via the Internet.

また、第2の実施形態では、字幕併合部310が、複数の字幕情報を併合することで併合字幕情報を生成する場合について説明したが、これに限られない。例えば、字幕併合部310は、前回生成した併合字幕情報に、字幕復号部304が新たに復号した字幕情報を併合することで、併合字幕情報を生成しても良い。この場合、生成される併合字幕情報には、既にすべての字幕文字列の提示が終了した字幕情報も含まれることとなる。この場合、併合字幕情報のデータ量は大きくなるが、当該併合字幕情報を用いて番組の検索を行うなど、メタデータとしての利用価値が高くなる。   In the second embodiment, the case where the caption merging unit 310 generates merged caption information by merging a plurality of caption information is described, but the present invention is not limited to this. For example, the caption merging unit 310 may generate the merged caption information by merging the previously generated merged caption information with the caption information newly decoded by the caption decoding unit 304. In this case, the generated subtitle information includes subtitle information for which presentation of all subtitle character strings has already been completed. In this case, the data amount of the merged caption information is increased, but the utility value as metadata is increased, such as searching for a program using the merged caption information.

1…放送システム 100…放送送出装置 101…映像パケット生成部 102…字
幕パケット生成部 103…放送部 200…サーバ装置 201…拡張字幕送信部 3
00…受信機 301…放送受信部(ストリーム受信部) 302…トランスポート復号
部 303…映像・音声復号部 304…字幕復号部 305…テーブル受信部 306
…字幕伸長部 307…字幕処理部 308…表示制御部 309…スキーマ記憶部 3
10…字幕併合部 311…アプリケーション実行部
DESCRIPTION OF SYMBOLS 1 ... Broadcasting system 100 ... Broadcast transmission apparatus 101 ... Video packet generation part 102 ... Subtitle packet generation part 103 ... Broadcasting part 200 ... Server apparatus 201 ... Extended subtitle transmission part 3
00 ... Receiver 301 ... Broadcast receiving unit (stream receiving unit) 302 ... Transport decoding unit 303 ... Video / audio decoding unit 304 ... Subtitle decoding unit 305 ... Table receiving unit 306
... Subtitle expansion unit 307 ... Subtitle processing unit 308 ... Display control unit 309 ... Schema storage unit 3
10 ... Subtitle merger 311 ... Application execution unit

Claims (1)

映像ストリームを受信するストリーム受信部と、
前記受信した映像ストリームから、映像コンテンツに重畳して表示させる字幕文字列を含む字幕情報を復号する字幕復号部と、
前記受信した映像ストリームから、少なくとも前記字幕情報が圧縮されているか否かを示す圧縮情報を含む字幕情報テーブルを復号するテーブル復号部と、
前記字幕復号部が復号した字幕情報のうち、前記字幕情報テーブルによって圧縮されていることが示されているものを伸長する字幕伸長部と
XMLスキーマを記憶するスキーマ記憶部と
を備え、
前記字幕伸長部は、前記テーブル復号部が復号した字幕情報テーブルに前記字幕情報のXMLスキーマを指定する情報が含まれる場合に、当該情報によって指定されるXMLスキーマに基づいて前記字幕情報を伸長する
受信機。
A stream receiver for receiving a video stream;
A subtitle decoding unit that decodes subtitle information including a subtitle character string to be displayed superimposed on the video content from the received video stream;
A table decoding unit for decoding a caption information table including compressed information indicating whether or not at least the caption information is compressed from the received video stream;
Of the subtitle information decoded by the subtitle decoding unit, a subtitle expansion unit that expands what is shown to be compressed by the subtitle information table ;
A schema storage unit for storing the XML schema ,
When the subtitle information table decoded by the table decoding unit includes information specifying the XML schema of the subtitle information, the subtitle expansion unit expands the subtitle information based on the XML schema specified by the information Receiving machine.
JP2015031545A 2014-02-21 2015-02-20 Receiving machine Active JP6461638B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015031545A JP6461638B2 (en) 2014-02-21 2015-02-20 Receiving machine

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014032053 2014-02-21
JP2014032053 2014-02-21
JP2015031545A JP6461638B2 (en) 2014-02-21 2015-02-20 Receiving machine

Publications (2)

Publication Number Publication Date
JP2015173443A JP2015173443A (en) 2015-10-01
JP6461638B2 true JP6461638B2 (en) 2019-01-30

Family

ID=54260492

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015031545A Active JP6461638B2 (en) 2014-02-21 2015-02-20 Receiving machine

Country Status (1)

Country Link
JP (1) JP6461638B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7328039B2 (en) * 2019-07-11 2023-08-16 日本放送協会 transmitter and receiver

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2546833A3 (en) * 2000-04-21 2014-08-20 Sony Corporation Information processing apparatus, method and computer program
US20060117259A1 (en) * 2002-12-03 2006-06-01 Nam Je-Ho Apparatus and method for adapting graphics contents and system therefor
JP4469788B2 (en) * 2005-12-16 2010-05-26 株式会社東芝 Information processing apparatus and reproducing method
JP2009152807A (en) * 2007-12-19 2009-07-09 Sharp Corp Digital broadcast receiver, digital broadcast receiving method, signal processing program, and program recording medium
JP5941270B2 (en) * 2010-12-17 2016-06-29 キヤノン株式会社 Information processing apparatus and information processing method
US9749504B2 (en) * 2011-09-27 2017-08-29 Cisco Technology, Inc. Optimizing timed text generation for live closed captions and subtitles
KR20140102201A (en) * 2011-12-16 2014-08-21 소니 주식회사 Reception device, method for controlling same, distribution device, distribution method, program, and distribution system

Also Published As

Publication number Publication date
JP2015173443A (en) 2015-10-01

Similar Documents

Publication Publication Date Title
JP6081984B2 (en) Receiving device, broadcast communication cooperation system, and broadcast communication cooperation method
US20190281136A1 (en) Information processing apparatus, information processing method, and program
JP6294503B2 (en) Broadcast signal transmitting apparatus, broadcast signal receiving apparatus, broadcast signal transmitting method, and broadcast signal receiving method
JP7062117B2 (en) Receiver and program
JP6444015B1 (en) Transmission device and reception device, and program
CA2953751C (en) Method and apparatus for transmission and reception of media data
JP6461638B2 (en) Receiving machine
JP6455974B2 (en) Receiving machine
JP6399686B2 (en) Receiving machine
JP2015037264A (en) Reception device, transmission device, and program
JP2015173442A (en) receiver
JP2008147985A (en) Digital broadcast receiver, digital broadcasting system, control program and readable recording medium
JP4755717B2 (en) Broadcast receiving terminal device
JP2015159366A (en) receiver
JP2007028438A (en) Information output method, information output system and image output device
JP2008053991A (en) Digital broadcast receiver
JP2015159365A (en) receiver and program
JP2015159364A (en) receiver and broadcasting system
JP2013176105A (en) Display device, reception device, display method, television receiver, display system, program and recording medium
JP7328039B2 (en) transmitter and receiver
JP5010102B2 (en) Broadcast reception system
JP2006197353A (en) Broadcast reception terminal
JP2016028471A (en) Receiving device
JP2016184826A (en) Reception device, reception method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180104

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180808

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180821

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181015

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20181026

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181226

R150 Certificate of patent or registration of utility model

Ref document number: 6461638

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250