JP6399725B1 - Text content generation device, transmission device, reception device, and program - Google Patents

Text content generation device, transmission device, reception device, and program Download PDF

Info

Publication number
JP6399725B1
JP6399725B1 JP2018121356A JP2018121356A JP6399725B1 JP 6399725 B1 JP6399725 B1 JP 6399725B1 JP 2018121356 A JP2018121356 A JP 2018121356A JP 2018121356 A JP2018121356 A JP 2018121356A JP 6399725 B1 JP6399725 B1 JP 6399725B1
Authority
JP
Japan
Prior art keywords
resolution
text
text content
video
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018121356A
Other languages
Japanese (ja)
Other versions
JP2018174572A (en
Inventor
洋一 所
洋一 所
俊二 砂崎
俊二 砂崎
耕平 大村
耕平 大村
哲 勘解由
哲 勘解由
馨介 塚口
馨介 塚口
好輝 天野
好輝 天野
秀雄 内田
秀雄 内田
彰 花田
彰 花田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Application granted granted Critical
Publication of JP6399725B1 publication Critical patent/JP6399725B1/en
Publication of JP2018174572A publication Critical patent/JP2018174572A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】テキストコンテンツ(字幕や文字スーパーなど)の表示の解像度に関する情報を、放送信号を送出する送信装置に正しく供給する。【解決手段】テキストコンテンツ生成装置が、画面の解像度に関する解像度情報を設定する解像度設定部と、テキストと、前記テキストの前記画面での配置に関する情報と、前記解像度設定部により設定される前記解像度情報とを含むテキストコンテンツデータを生成するテキストデータ生成部と、前記テキストデータ生成部が生成した前記テキストコンテンツデータを、放送送信設備に対して供給するために送信するデータ交換部とを備える。【選択図】図1Information relating to the display resolution of text content (such as subtitles and superimpose characters) is correctly supplied to a transmission device that transmits a broadcast signal. A text content generation device includes a resolution setting unit that sets resolution information relating to a screen resolution, text, information relating to an arrangement of the text on the screen, and the resolution information set by the resolution setting unit. And a data exchange unit that transmits the text content data generated by the text data generation unit to be supplied to a broadcast transmission facility. [Selection] Figure 1

Description

本発明は、テキストコンテンツ生成装置、送信装置、受信装置、およびプログラムに関する。本発明は、特に、放送用のコンテンツの生成、送信、および受信に関する。   The present invention relates to a text content generation device, a transmission device, a reception device, and a program. The present invention particularly relates to the generation, transmission, and reception of broadcast content.

テレビの放送信号には、いわゆる字幕等と呼ばれるテキストデータが含まれている。テレビ放送の受信装置は、放送信号を受信し、放送信号の中から字幕等のテキストデータを抽出し、抽出されたテキストを映像と重ね合わせるように表示する機能を備えている。このとき、字幕テキスト等が制作された状況において想定されていた映像の解像度と、実際に放送されるときの映像の解像度が異なると、字幕テキストが本来意図された領域には表示されないという問題が起こり得る。   Television broadcast signals include text data called subtitles. A television broadcast receiving apparatus has a function of receiving a broadcast signal, extracting text data such as subtitles from the broadcast signal, and displaying the extracted text so as to overlap the video. At this time, if the resolution of the video assumed in the situation in which the subtitle text or the like was produced and the resolution of the video when actually broadcasted, the subtitle text is not displayed in the originally intended area. Can happen.

そのような問題を解決するための技術として、特許文献1(特に、段落0017)には、字幕解析部(806)が字幕データを解析し、解析結果に基づいて字幕表示判定部(807)は字幕が表示領域内に入るか否かを判定し、字幕表示位置補正部(808)が表示位置を補正するという構成が記載されている。   As a technique for solving such a problem, in Patent Document 1 (particularly, paragraph 0017), a caption analysis unit (806) analyzes caption data, and based on the analysis result, a caption display determination unit (807) A configuration is described in which it is determined whether or not a caption enters the display area, and the caption display position correction unit (808) corrects the display position.

特開2010−245618号公報JP 2010-245618 A

しかしながら、特許文献1に記載されている技術では、受信装置側で字幕データを解析するための処理が複雑であり、またその解析や補正のための処理負荷が大きいという問題がある。また、サービスのマルチ編成を実施するために放送映像の解像度を動的に切り替えたり、階層伝送を行っている状況において放送信号の伝搬状況が変化したときに受信装置側で再生する放送映像の解像度が動的に切り替わったりといった場合も考えられるが、このような場合に、字幕の表示に関する判定と補正の処理を、その都度行わなければならないという問題も生じる。   However, the technique described in Patent Document 1 has a problem that the processing for analyzing caption data on the receiving device side is complicated, and the processing load for the analysis and correction is large. Also, the resolution of the broadcast video to be played back on the receiving device side when the broadcast signal propagation status changes in a situation where the broadcast video resolution is dynamically switched or hierarchical transmission is being performed in order to implement multi-service organization However, in such a case, there is a problem that determination and correction processing related to subtitle display must be performed each time.

そのため、放送映像の解像度に関する情報と、字幕等のテキストの表示の解像度に関する情報とを、放送信号そのものの中に含めてしまうことも考え得る。しかしながら、放送側の設備(送信装置等)として、従来の技術では、そのような目的のために字幕等のテキストの表示の解像度に関する情報を供給するしくみが存在しないという問題がある。   For this reason, it can be considered that information relating to the resolution of the broadcast video and information relating to the resolution of the text display such as captions are included in the broadcast signal itself. However, as a facility on the broadcast side (such as a transmission device), the conventional technique has a problem that there is no mechanism for supplying information related to the resolution of text display such as subtitles for such a purpose.

本発明は、上記の課題認識に基づいて行なわれたものであり、テキストコンテンツ(字幕や文字スーパーなど)の表示の解像度に関する情報を、放送信号を送出する送信装置に正しく供給することのできるテキストコンテンツ生成装置(あるいはプログラム)および送信装置を提供するものである。また、本発明は、その放送信号を受信する受信装置(あるいはプログラム)を提供するものである。   The present invention has been made on the basis of the above problem recognition, and is a text that can correctly supply information relating to the display resolution of text content (such as captions and character superimposes) to a transmission device that transmits a broadcast signal. A content generation device (or program) and a transmission device are provided. The present invention also provides a receiving device (or program) that receives the broadcast signal.

[1]上記の課題を解決するため、本発明の一態様によるテキストコンテンツ生成装置は、画面の解像度に関する解像度情報を設定する解像度設定部と、テキストと、前記テキストの前記画面での配置に関する情報と、前記解像度設定部により設定される前記解像度情報とを含むテキストコンテンツデータを生成するテキストデータ生成部と、前記テキストデータ生成部が生成した前記テキストコンテンツデータを、放送送信設備に対して供給するために送信するデータ交換部とを具備する。   [1] In order to solve the above-described problem, a text content generation device according to an aspect of the present invention includes a resolution setting unit that sets resolution information related to a screen resolution, text, and information related to the placement of the text on the screen. A text data generation unit that generates text content data including the resolution information set by the resolution setting unit, and the text content data generated by the text data generation unit is supplied to a broadcast transmission facility. And a data exchange unit for transmission.

[2]また、本発明の一態様は、上記のテキストコンテンツ生成装置において、テキストデータ生成部は、前記テキストの提示時刻の情報を前記テキストコンテンツデータに含めて生成する、ことを特徴とする。   [2] Further, according to an aspect of the present invention, in the text content generation device, the text data generation unit generates the text content data by including information on the presentation time of the text.

[3]また、本発明の一態様は、上記のテキストコンテンツ生成装置において、前記テキストデータ生成部は、タイムドテキストマークアップ言語で記述された前記テキストコンテンツデータのヘッダー部に前記解像度情報を含める、ことを特徴とする。   [3] Further, according to an aspect of the present invention, in the text content generation device, the text data generation unit includes the resolution information in a header portion of the text content data described in a timed text markup language. It is characterized by that.

[4]また、本発明の一態様は、コンピューターを、上記のいずれかに記載のテキストコンテンツ生成装置として機能させるためのプログラムである。   [4] One embodiment of the present invention is a program for causing a computer to function as the text content generation device described above.

[5]また、本発明の一態様は、テキストと、前記テキストの画面での配置に関する情報と、前記テキストを前記画面に表示する際の解像度を表す解像度情報とを含むテキストコンテンツデータを外部から取得するテキスト取得部と、前記テキストと映像と音声とを多重化して得られる放送信号を生成するとともに、取得した前記テキストコンテンツデータに含まれていた前記解像度情報を前記放送信号に含める多重化部と、前記多重化部によって生成された前記放送信号を送出する送信部とを具備する送信装置である。
[6]また、本発明の一態様は、放送信号を受信する受信部と、前記受信部が受信した前記放送信号を分離する分離部と、前記分離部によって分離された映像の信号を受け取り、復号する映像処理部と、前記分離部によって分離された、字幕または文字スーパーの少なくともいずれかであるテキストコンテンツを受け取り、当該テキストコンテンツの解像度の情報を含んだ前記テキストコンテンツを出力するテキスト処理部と、前記映像の解像度と前記テキストコンテンツの解像度とが異なるときには、前記映像の解像度に合うように前記テキストコンテンツの解像度を変更して、前記映像と前記テキストコンテンツとを重ねて出力する提示制御部と、を具備する受信装置である。
[7]また、本発明の一態様は、コンピューターを、上記の受信装置として機能させるためのプログラムである。
[5] Further, according to one aspect of the present invention, text content data including text, information regarding the arrangement of the text on the screen, and resolution information indicating resolution when the text is displayed on the screen is externally received. A text acquisition unit to be acquired, and a multiplexing unit that generates a broadcast signal obtained by multiplexing the text, video, and audio, and includes the resolution information included in the acquired text content data in the broadcast signal And a transmission unit that transmits the broadcast signal generated by the multiplexing unit.
[6] According to another aspect of the present invention, a receiving unit that receives a broadcast signal, a separating unit that separates the broadcasting signal received by the receiving unit, and a video signal separated by the separating unit, A video processing unit for decoding, a text processing unit that receives text content that is at least one of subtitles and character supervisions separated by the separation unit, and outputs the text content including resolution information of the text content; A presentation control unit that, when the resolution of the video and the resolution of the text content are different, changes the resolution of the text content to match the resolution of the video, and outputs the video and the text content in an overlapping manner; , A receiving device.
[7] One embodiment of the present invention is a program for causing a computer to function as the receiving device.

本発明によれば、送信装置に対して、テキストコンテンツの解像度情報を供給することができる。また、そのような送信装置は、放送信号にテキストコンテンツの解像度情報を含めて送出することができるため、受信装置側で、解像度を推定するために字幕データ等を解析する必要がない。   According to the present invention, resolution information of text content can be supplied to a transmission device. Further, since such a transmission apparatus can transmit the broadcast signal including the resolution information of the text content, it is not necessary for the reception apparatus to analyze the caption data or the like in order to estimate the resolution.

本発明の実施形態によるテキストコンテンツ生成装置および送信装置の概略機能構成を示すブロック図である。It is a block diagram which shows schematic function structure of the text content production | generation apparatus and transmission apparatus by embodiment of this invention. 同実施形態による送信装置から送信される信号を受信し、映像やテキストコンテンツなどを表示する受信装置の概略機能構成を示すブロック図である。FIG. 3 is a block diagram illustrating a schematic functional configuration of a receiving apparatus that receives a signal transmitted from the transmitting apparatus according to the embodiment and displays video, text content, and the like. 同実施形態による提示制御部によって行われるオーバーレイ処理を説明するための画面例である。It is an example of a screen for demonstrating the overlay process performed by the presentation control part by the embodiment. 同実施形態による提示制御部がコンテンツ間の解像度調整を行うための対応関係を示す図であり、テキストコンテンツの解像度を放送映像の解像度に合わせる場合を示すものである。It is a figure which shows the correspondence for the presentation control part by the same embodiment to perform the resolution adjustment between content, and shows the case where the resolution of a text content is united with the resolution of a broadcast video. 同実施形態による提示制御部がコンテンツ間の解像度調整を行うための対応関係を示す図であり、放送映像の解像度をテキストコンテンツの解像度に合わせる場合を示すものである。It is a figure which shows the correspondence for the presentation control part by the same embodiment to perform the resolution adjustment between content, and shows the case where the resolution of a broadcast image is matched with the resolution of a text content. 同実施形態による提示制御部がコンテンツ間の解像度調整を行うための対応関係を示す図であり、解像度の高いほうの画像(映像)を解像度の低いほうに合わせる場合を示すものである。It is a figure which shows the correspondence for the presentation control part by the same embodiment to perform the resolution adjustment between content, and shows the case where an image (video) with a higher resolution is matched with a lower resolution. 同実施形態による提示制御部がコンテンツ間の解像度調整を行うための対応関係を示す図であり、解像度の低いほうの画像(映像)を解像度の高いほうに合わせる場合を示すものである。It is a figure which shows the correspondence for the presentation control part by the same embodiment to perform the resolution adjustment between content, and shows the case where an image (video) with a lower resolution is matched with a higher resolution.

次に、図面を参照しながら、本発明の実施形態について説明する。
[実施形態]
図1は、実施形態として、放送局の設備を構成するテキストコンテンツ生成装置および送信装置の概略機能構成を示すブロック図である。図示するように、テキストコンテンツ生成装置1は、テキスト編集部11と、解像度設定部12と、テキストデータ生成部14と、データ交換部15とを含んで構成される。また、送信装置2は、音声取得部21と、映像取得部22と、テキスト取得部23と、制御情報設定部24と、多重化部25と、変調部26と、送信部27と、を含んで構成される。
Next, embodiments of the present invention will be described with reference to the drawings.
[Embodiment]
FIG. 1 is a block diagram illustrating a schematic functional configuration of a text content generation device and a transmission device that constitute equipment of a broadcasting station as an embodiment. As illustrated, the text content generation device 1 includes a text editing unit 11, a resolution setting unit 12, a text data generation unit 14, and a data exchange unit 15. The transmission apparatus 2 includes an audio acquisition unit 21, a video acquisition unit 22, a text acquisition unit 23, a control information setting unit 24, a multiplexing unit 25, a modulation unit 26, and a transmission unit 27. Consists of.

まず、テキストコンテンツ生成装置1側から説明する。
テキストコンテンツ生成装置1は、字幕や文字スーパーなどといったテキストコンテンツを生成するものである。ここで、字幕とは、放送番組の内容に関連するテキストであって、受信装置側で映像の画面に重ねて表示されるものである。また、文字スーパーとは、放送番組の内容には直接関係がないテキストであって、受信装置側で、放送番組の映像に重ねて表示されるものである。ここで、「スーパー」は「スーパーインポーズ」(重ね合わせ)から派生した省略表現である。字幕の典型例は、音声の内容を文字で表したテキスト(日本語の音声の日本語文字による表示)である。また、字幕の用途として、例えば英語の音声で放送される番組における日本語訳のテキストを表示することもある。また、文字スーパーの典型例は、放送番組の途中で伝えられるニュース速報や緊急地震速報などである。字幕および文字スーパーは、放送信号内においてテキストアセットに属するものである。テキストコンテンツ生成装置を構成する各部の機能は、次に述べるとおりである。
First, the text content generation device 1 side will be described.
The text content generation device 1 generates text content such as subtitles and superimpose characters. Here, the subtitle is text related to the content of the broadcast program, and is displayed on the video screen on the receiving device side. Also, the text super is text that is not directly related to the content of the broadcast program, and is displayed on the receiving device side so as to be superimposed on the video of the broadcast program. Here, “super” is an abbreviation derived from “superimpose” (superposition). A typical example of subtitles is text (displaying Japanese speech with Japanese characters) expressing the content of speech. In addition, as a subtitle application, for example, a Japanese translation text in a program broadcast in English sound may be displayed. A typical example of a character supermarket is a news bulletin or an emergency earthquake bulletin transmitted in the middle of a broadcast program. Subtitles and superimposes belong to text assets in the broadcast signal. The function of each part constituting the text content generation device is as follows.

テキスト編集部11は、テキストを編集する。テキスト編集部11は、例えば、ユーザーによる操作に基づき、新たなテキストデータの入力を受け付けたり、既存のテキストデータを一部変更したりすることによって、字幕や文字スーパーとして表示されるテキストデータを編集する。また、テキスト編集部11は、ユーザーによる操作等に基づき、テキストを表示する際のレイアウトや文字属性(色、フォント種類、フォントサイズなど)を設定する。テキスト編集部11は編集作業の結果であるテキストおよびそのレイアウトに関する情報を、テキストデータ生成部14に渡す。   The text editing unit 11 edits text. The text editing unit 11 edits text data displayed as subtitles or character supervisions, for example, by accepting input of new text data or changing part of existing text data based on a user operation. To do. Further, the text editing unit 11 sets the layout and character attributes (color, font type, font size, etc.) for displaying the text based on the operation by the user. The text editing unit 11 passes the text that is the result of the editing operation and information about its layout to the text data generation unit 14.

解像度設定部12は、字幕や文字スーパーとしてテキストを表示する際の解像度を設定する。これは、テキストコンテンツを表示する画面の解像度に関する解像度の情報の設定である。つまり、解像度設定部12は、テキストコンテンツの表示のための解像度を設定する。解像度は、受信装置側での画面における画素数で表される。例えば、解像度は、横1920画素×縦1080画素(いわゆる「2K」)、横3840画素×縦2160画素(いわゆる「4K」)、横7680画素×縦4320画素(いわゆる「8K」)の3通りである。   The resolution setting unit 12 sets a resolution for displaying text as a caption or a character superimposition. This is a setting of resolution information related to the resolution of the screen displaying the text content. That is, the resolution setting unit 12 sets the resolution for displaying the text content. The resolution is represented by the number of pixels on the screen on the receiving device side. For example, there are three resolutions: horizontal 1920 pixels × vertical 1080 pixels (so-called “2K”), horizontal 3840 pixels × vertical 2160 pixels (so-called “4K”), and horizontal 7680 pixels × vertical 4320 pixels (so-called “8K”). is there.

テキストデータ生成部14は、テキスト編集部11から渡されたテキストおよびレイアウト等に関する情報と、解像度設定部12による解像度の設定に基づいて、テキストデータを生成する。本実施形態では、テキストデータ生成部14はこのとき、TTML(Timed Text Markup Language,タイムドテキストマークアップ言語)で記述されたデータを生成する。TTMLは、提示時刻を指定するためのタグ情報を備えるマークアップ言語である。また、TTMLによりテキストのレイアウト(画面上での配置等)を指定することができる。   The text data generation unit 14 generates text data based on the information about the text, layout, etc. passed from the text editing unit 11 and the resolution setting by the resolution setting unit 12. In the present embodiment, the text data generation unit 14 generates data described in TTML (Timed Text Markup Language) at this time. TTML is a markup language provided with tag information for designating a presentation time. Further, a text layout (arrangement on the screen, etc.) can be specified by TTML.

また、テキストデータ生成部14は、生成するテキストデータ内に埋め込む形で(あるいは付随させるなどといった形で)、テキストの表示の際の画面の解像度に関する情報を付加する。一例としては、テキストデータ生成部14は、TTML形式のファイルのヘッダー部分に、メタ(meta)データとして、解像度の情報を付加する。その具体例は、「<meta name="resolution " content="7680"/>」といったデータである。本例の場合、メタ(meta)タグ内に、データ名「resolution」(解像度)、値「7680」という情報を付加している。この値「7680」は、画面における横方向の画素数を表している。解像度を表すデータとしては、横方向の画素数に限らず、縦方向の画素数を用いても良い。また、縦方向および横方向の画素数の組み合わせに対応した指標値を用いて解像度を表しても良い。
つまり、テキストデータ生成部14は、テキストと、そのテキストの画面での配置に関する情報と、解像度設定部12により設定される解像度情報とを含むテキストコンテンツデータを生成するものである。なお、TTMLで記述されたテキストコンテンツのデータは、テキストの提示時刻に関する情報を含むものである。つまり、テキストデータ生成部14は、テキストの提示時刻の情報をテキストコンテンツデータに含めて生成する。
Further, the text data generation unit 14 adds information related to the resolution of the screen at the time of displaying the text in a form embedded in (or attached to) the text data to be generated. As an example, the text data generation unit 14 adds resolution information as meta data to the header portion of a TTML format file. A specific example is data such as “<meta name =" resolution "content =" 7680 "/>". In this example, information of a data name “resolution” (resolution) and a value “7680” is added in a meta tag. This value “7680” represents the number of pixels in the horizontal direction on the screen. The data representing the resolution is not limited to the number of pixels in the horizontal direction, and the number of pixels in the vertical direction may be used. Further, the resolution may be expressed using an index value corresponding to a combination of the number of pixels in the vertical direction and the horizontal direction.
That is, the text data generation unit 14 generates text content data including text, information regarding the arrangement of the text on the screen, and resolution information set by the resolution setting unit 12. Note that the text content data described in TTML includes information related to the text presentation time. That is, the text data generation unit 14 generates text content data including text presentation time information.

データ交換部15は、テキストデータ生成部14によって生成されたテキストコンテンツのデータを、外部の装置との間で交換する機能を有する。具体的には、データ交換部15は、生成されたテキストデータを、送信装置2に対して渡す。言い換えれば、データ交換部15は、テキストデータ生成部14が生成したテキストコンテンツデータを、放送送信設備に対して供給するために送信するものである。   The data exchange unit 15 has a function of exchanging text content data generated by the text data generation unit 14 with an external device. Specifically, the data exchange unit 15 passes the generated text data to the transmission device 2. In other words, the data exchange unit 15 transmits the text content data generated by the text data generation unit 14 in order to supply the broadcast transmission facility.

次に、送信装置2側を説明する。
送信装置2は、テレビの放送信号を送出する装置である。
音声取得部21は、放送番組の音声を外部から取得し、所定の符号化方式により符号化する。
映像取得部22は、放送番組の映像を外部から取得し、所定の符号化方式により符号化する。なお、このとき、映像は所定の解像度(例えば、横7680画素×縦4320画素)を有する。
Next, the transmitting apparatus 2 side will be described.
The transmission apparatus 2 is an apparatus that transmits a television broadcast signal.
The sound acquisition unit 21 acquires the sound of the broadcast program from the outside and encodes it using a predetermined encoding method.
The video acquisition unit 22 acquires a video of a broadcast program from the outside, and encodes it using a predetermined encoding method. At this time, the video has a predetermined resolution (for example, horizontal 7680 pixels × vertical 4320 pixels).

テキスト取得部23は、テキストコンテンツ生成装置1のデータ交換部15から、テキストコンテンツのデータを取得する。前述の通り、このテキストコンテンツのデータは、テキストそのもののほかに、レイアウトに関する情報、文字属性に関する情報、そしてテキストコンテンツの表示の解像度に関する情報を含んでいる。この表示の解像度に関する情報は、一例として、TTML形式のデータのヘッダー部に格納される。
つまり、テキスト取得部23は、テキストと、テキストの画面での配置に関する情報と、テキストを画面に表示する際の解像度を表す解像度情報とを含むテキストコンテンツデータを外部(テキストコンテンツ生成装置1側)から取得する。
制御情報設定部24は、放送に関する各種の制御情報を設定する。
The text acquisition unit 23 acquires text content data from the data exchange unit 15 of the text content generation device 1. As described above, the text content data includes, in addition to the text itself, information relating to layout, information relating to character attributes, and information relating to the resolution of display of the text content. Information relating to the display resolution is stored as an example in the header portion of data in TTML format.
That is, the text acquisition unit 23 externally outputs text content data including text, information regarding the arrangement of the text on the screen, and resolution information indicating the resolution when the text is displayed on the screen (on the text content generation device 1 side). Get from.
The control information setting unit 24 sets various control information related to broadcasting.

多重化部25は、音声取得部21から渡される符号化された音声のデータや、映像取得部22から渡される符号化された映像のデータや、テキスト取得部23から渡されるテキストコンテンツのデータや、制御情報設定部24から渡される制御情報を、多重化する。
多重化部25は、放送用の所定の伝送方式に応じた多重化データを生成する。用いられる伝送方式は、例えば、MMT(MPEG Media Transport)方式や、MPEG−2 TS(Moving Picture Experts Group-2 Transport Stream)方式や、RTP(Real-time Transport Protocol)方式などである。
つまり、多重化部25は、テキストと映像と音声とを多重化して得られる放送信号を生成するとともに、取得したテキストコンテンツデータに含まれていた解像度情報を放送信号に含める。
The multiplexing unit 25 includes encoded audio data passed from the audio acquisition unit 21, encoded video data passed from the video acquisition unit 22, text content data passed from the text acquisition unit 23, The control information passed from the control information setting unit 24 is multiplexed.
The multiplexing unit 25 generates multiplexed data according to a predetermined transmission system for broadcasting. Examples of the transmission method used include MMT (MPEG Media Transport), MPEG-2 TS (Moving Picture Experts Group-2 Transport Stream), and RTP (Real-time Transport Protocol).
That is, the multiplexing unit 25 generates a broadcast signal obtained by multiplexing text, video, and audio, and includes the resolution information included in the acquired text content data in the broadcast signal.

変調部26は、多重化部25によって多重化されデータを伝送用に変調する。
送信部27は、変調部26から出力された信号を送信する。送信部27から送出される放送信号は、電波として、あるいはケーブル上の電気信号あるいは光信号として伝送される。
The modulator 26 is multiplexed by the multiplexer 25 and modulates data for transmission.
The transmission unit 27 transmits the signal output from the modulation unit 26. The broadcast signal transmitted from the transmission unit 27 is transmitted as a radio wave, an electric signal on a cable, or an optical signal.

このように、本実施形態では、テキストコンテンツ生成装置1は、テキストコンテンツの表示のための解像度情報を送信装置2に供給することができる。また、送信装置2は、テキストコンテンツ生成装置1から供給された解像度情報に基づいて、放送信号にテキストコンテンツの解像度情報を含めて、その放送信号を送出する。これにより、受信装置(テレビ受像機)側では、テキストコンテンツ自体の座標情報を解析しなくても、制作者が意図したテキストコンテンツの解像度を得ることができる。   As described above, in this embodiment, the text content generation device 1 can supply the transmission device 2 with resolution information for displaying the text content. Further, based on the resolution information supplied from the text content generation device 1, the transmission device 2 includes the resolution information of the text content in the broadcast signal and transmits the broadcast signal. As a result, on the receiving device (television receiver) side, the resolution of the text content intended by the creator can be obtained without analyzing the coordinate information of the text content itself.

次に、上述の送信装置2から送信される放送信号を受信する受信装置について説明する。
図2は、受信装置の概略機能構成を示すブロック図である。受信装置5は、受信部51と、分離部52と、映像・音声処理部53(映像処理部)と、テキスト処理部54と、提示制御部55と、出力部56と、を含んで構成される。
Next, a receiving apparatus that receives a broadcast signal transmitted from the transmitting apparatus 2 will be described.
FIG. 2 is a block diagram showing a schematic functional configuration of the receiving apparatus. The receiving device 5 includes a receiving unit 51, a separation unit 52, a video / audio processing unit 53 (video processing unit), a text processing unit 54, a presentation control unit 55, and an output unit 56. The

受信部51は、送信装置2からのデジタル放送信号を受信し、復調する。
分離部52は、受信部51によって受信された放送信号を、映像や音声やテキストや制御情報に分離する。分離部52は、分離した映像、音声、テキスト(テキストコンテンツ)、制御情報を、それぞれ出力する。
映像・音声処理部53は、分離部52によって分離された映像および音声の信号をそれぞれ受け取り、復号する。映像・音声処理部53は、復号された映像および音声のそれぞれを、提示制御部55に渡す。これらの映像や音声は、提示タイミング(presentation time)を示す情報と関連付けられている。
つまり、映像・音声処理部53は、分離部52によって分離された映像の信号を受け取り、復号する。
The receiver 51 receives the digital broadcast signal from the transmitter 2 and demodulates it.
The separating unit 52 separates the broadcast signal received by the receiving unit 51 into video, audio, text, and control information. The separation unit 52 outputs the separated video, audio, text (text content), and control information.
The video / audio processing unit 53 receives and decodes the video and audio signals separated by the separation unit 52, respectively. The video / audio processing unit 53 passes each of the decoded video and audio to the presentation control unit 55. These video and audio are associated with information indicating the presentation timing.
That is, the video / audio processing unit 53 receives and decodes the video signal separated by the separation unit 52.

テキスト処理部54は、分離部52によって分離されたテキストコンテンツを受け取り、そのテキストコンテンツ(字幕や文字スーパー)を提示制御部55に渡す。テキストコンテンツは、TTML形式で記述されている。つまり、テキストコンテンツは、提示タイミングを示す情報と関連付けられている。また、テキストコンテンツのデータは、レイアウト情報や、文字の属性情報を含んでいる。また、テキストコンテンツのデータは、画面における表示の解像度の情報を含んでいる。テキスト処理部54は、このテキストの表示解像度の情報を、提示制御部55に渡す。
つまり、テキスト処理部54は、分離部52によって分離された、字幕または文字スーパーの少なくともいずれかであるテキストコンテンツを受け取り、当該テキストコンテンツの画面における表示の解像度の情報を含んだテキストコンテンツを出力する。
The text processing unit 54 receives the text content separated by the separation unit 52, and passes the text content (caption or character super) to the presentation control unit 55. The text content is described in the TTML format. That is, the text content is associated with information indicating the presentation timing. The text content data includes layout information and character attribute information. Further, the text content data includes display resolution information on the screen. The text processing unit 54 passes information on the display resolution of the text to the presentation control unit 55.
That is, the text processing unit 54 receives the text content separated by the separation unit 52 and is at least one of subtitles and superimpose characters, and outputs the text content including the resolution information of the display on the screen of the text content. .

提示制御部55は、映像、音声、テキストといったコンテンツを、指定された提示時刻に合わせて、出力部56から出力する。なお、提示制御部55は、映像の解像度の情報と、テキストコンテンツの解像度の情報をそれぞれ取得し、それら両方の表示内容を重ね合わせて(オーバーレイして)、出力部56に渡す。なお、提示制御部55は、テレビ放送の映像の解像度とテキストコンテンツの表示の解像度とを調整して、両者をオーバーレイする。具体的には、提示制御部55は、テキスト処理部54から渡されるテキスト解像度情報と映像・音声処理部53によって復元された映像の解像度とに基づいて、映像とテキストコンテンツの出力画像との解像度を整合させる処理を行う。この解像度の調整の詳細については、後述する。
つまり、提示制御部55は、映像とテキストコンテンツとを重ねて出力する。
出力部56は、提示制御部55から渡された映像および重ねあわされたテキストコンテンツを画面に出力する。また、出力部56は、提示制御部55から渡された音声を、スピーカー等から出力する。
The presentation control unit 55 outputs content such as video, audio, and text from the output unit 56 in accordance with the designated presentation time. Note that the presentation control unit 55 acquires the information on the resolution of the video and the information on the resolution of the text content, and superimposes (overlays) both of the display contents, and passes them to the output unit 56. The presentation control unit 55 adjusts the resolution of the video of the television broadcast and the resolution of the display of the text content and overlays both. Specifically, the presentation control unit 55 determines the resolution between the video and the output image of the text content based on the text resolution information passed from the text processing unit 54 and the video resolution restored by the video / audio processing unit 53. Process to match. Details of the resolution adjustment will be described later.
That is, the presentation control unit 55 outputs the video and text content in an overlapping manner.
The output unit 56 outputs the video passed from the presentation control unit 55 and the overlaid text content on the screen. Further, the output unit 56 outputs the voice delivered from the presentation control unit 55 from a speaker or the like.

次に、放送の映像と、テキストコンテンツとをオーバーレイする処理の詳細について説明する。
図3は、提示制御部55によるオーバーレイ処理を説明するための画面例の図である。
同図(a)は、テレビ放送の映像を示している。同図(b)は、テキストコンテンツの例を示している。同図(c)は、テレビ放送の映像と、テキストコンテンツとを重ね合わせて表示した状態を示している。
Next, details of processing for overlaying broadcast video and text content will be described.
FIG. 3 is a diagram illustrating an example of a screen for explaining overlay processing by the presentation control unit 55.
FIG. 2A shows a video image of television broadcasting. FIG. 4B shows an example of text content. FIG. 3C shows a state in which a television broadcast video and a text content are superimposed and displayed.

同図(b)や(c)に示すテキストコンテンツの制作者は、テキストコンテンツが画面全体の中でバランスよく配置されることを意図した制作を行っている。提示制御部55は、テレビ放送の映像の解像度とテキストコンテンツの出力解像度が異なっている場合にも、両者が同図(c)のように良いバランスで表示されるように、オーバーレイのしかたを制御する。言い換えれば、提示制御部55によるこのような制御の結果として、テキストコンテンツが画面をはみ出して表示されたり、テキストコンテンツが画面内で必要以上に小さく縮小して表示されたりすることを防いでいる。   The creators of the text content shown in FIGS. 2B and 2C perform production intended to arrange the text content in a balanced manner in the entire screen. The presentation control unit 55 controls the overlay so that both are displayed in good balance as shown in FIG. 5C even when the resolution of the video of the TV broadcast is different from the output resolution of the text content. To do. In other words, as a result of such control by the presentation control unit 55, the text content is prevented from being displayed outside the screen, or the text content is prevented from being displayed in a reduced size more than necessary on the screen.

提示制御部55は、映像の解像度とテキストコンテンツの解像度が異なるときには、映像の解像度に合うように、テキストコンテンツの解像度を変更する。
つまり、提示制御部55は、映像の解像度とテキストコンテンツの解像度とが異なるときには、映像の解像度に合うようにテキストコンテンツの解像度を変更して、映像とテキストコンテンツとを重ねて出力する。
また逆に、提示制御部55が、テキストコンテンツの解像度に合うように映像の解像度を変更しても良い。これらの場合、提示制御部55は、変更するほうのコンテンツを適宜、アップサンプリングまたはダウンサンプリングする。
図4および図5は、提示制御部55によるコンテンツの解像度調整の対応関係を示すものである。図4は、提示制御部55がテキストコンテンツの解像度を放送映像の解像度に合わせる場合の対応関係図である。図5は、提示制御部55が放送映像の解像度をテキストコンテンツの解像度に合わせる場合の対応関係図である。提示制御部55は、図4または図5のいずれの方法を用いても良い。
When the video resolution and the text content resolution are different, the presentation control unit 55 changes the text content resolution to match the video resolution.
That is, when the resolution of the video and the resolution of the text content are different, the presentation control unit 55 changes the resolution of the text content so as to match the resolution of the video, and outputs the video and the text content in an overlapping manner.
Conversely, the presentation control unit 55 may change the video resolution to match the resolution of the text content. In these cases, the presentation control unit 55 appropriately upsamples or downsamples the content to be changed.
4 and 5 show the correspondence relationship of the resolution adjustment of the content by the presentation control unit 55. FIG. FIG. 4 is a correspondence diagram when the presentation control unit 55 matches the resolution of the text content with the resolution of the broadcast video. FIG. 5 is a correspondence diagram when the presentation control unit 55 matches the resolution of the broadcast video to the resolution of the text content. The presentation control unit 55 may use either method of FIG. 4 or FIG.

図4が示すものは2次元の表であり、横方向はテキストコンテンツの解像度に対応し、縦方向は放送の映像の解像度に対応する。本例では、テキストコンテンツの解像度も、放送映像の解像度も、横1920画素×縦1080画素(いわゆる「2K」)、横3840画素×縦2160画素(いわゆる「4K」)、横7680画素×縦4320画素(いわゆる「8K」)の3通りである。但し、解像度の種類はこれらの3種類に限られず、他の解像度を用いても良い。図4の対応関係を用いる場合、テキストコンテンツを、適宜アップサンプリングまたはダウンサンプリングすることによって、放送映像の解像度に合わせる。なお、アプリケーションからの出力解像度と放送映像の解像度が元々等しい場合には、解像度を変えずにそのままオーバーレイする。図4に示す通り、(4−1)放送映像の解像度が横1920画素×縦1080画素である場合、提示制御部55から出力部56に渡す画像(映像)の解像度は横1920画素×縦1080画素である。また、(4−2)放送映像の解像度が横3840画素×縦2160画素である場合、提示制御部55から出力部56に渡す画像(映像)の解像度は横3840画素×縦2160画素である。また、(4−3)放送映像の解像度が横7680×縦4320である場合、提示制御部55から出力部56に渡す画像(映像)の解像度は横7680画素×縦4320画素である。   FIG. 4 shows a two-dimensional table, where the horizontal direction corresponds to the resolution of the text content, and the vertical direction corresponds to the resolution of the broadcast video. In this example, the resolution of the text content and the resolution of the broadcast video are 1920 pixels × 1080 pixels (so-called “2K”), 3840 pixels × 2160 pixels (so-called “4K”), 7680 pixels × 4320 pixels. There are three types of pixels (so-called “8K”). However, the types of resolution are not limited to these three types, and other resolutions may be used. When the correspondence relationship of FIG. 4 is used, the text content is appropriately upsampled or downsampled to match the resolution of the broadcast video. If the output resolution from the application and the resolution of the broadcast video are originally equal, overlay is performed without changing the resolution. As shown in FIG. 4, when the resolution of the broadcast video is (4-1) horizontal 1920 pixels × vertical 1080 pixels, the resolution of the image (video) passed from the presentation control unit 55 to the output unit 56 is horizontal 1920 pixels × vertical 1080. Pixel. Also, (4-2) when the resolution of the broadcast video is horizontal 3840 pixels × vertical 2160 pixels, the resolution of the image (video) passed from the presentation control unit 55 to the output unit 56 is horizontal 3840 pixels × vertical 2160 pixels. Further, (4-3) when the resolution of the broadcast video is horizontal 7680 × vertical 4320, the resolution of the image (video) passed from the presentation control unit 55 to the output unit 56 is horizontal 7680 pixels × vertical 4320 pixels.

図5も、図4と同様の2次元の表であり、解像度は、横1920画素×縦1080画素、横3840画素×縦2160画素、横7680画素×縦4320画素の3通りである。
図5の対応関係を用いる場合、提示制御部55は、放送映像を、適宜アップサンプリングまたはダウンサンプリングすることによって、テキストコンテンツの解像度に合わせる。
なお、テキストコンテンツの解像度と放送映像の解像度が等しい場合には、解像度を変えずにそのままオーバーレイする。図5に示す通り、(5−1)テキストコンテンツの解像度が横1920画素×縦1080画素である場合、提示制御部55から出力部56に渡す画像(映像)の解像度は横1920画素×縦1080画素である。また、(5−2)テキストコンテンツの解像度が横3840画素×縦2160画素である場合、提示制御部55から出力部56に渡す画像(映像)の解像度は横3840画素×縦2160画素である。
また、(5−3)テキストコンテンツの解像度が横7680×縦4320である場合、提示制御部55から出力部56に渡す画像(映像)の解像度は横7680画素×縦4320画素である。
FIG. 5 is also a two-dimensional table similar to FIG. 4, and has three resolutions: horizontal 1920 pixels × vertical 1080 pixels, horizontal 3840 pixels × vertical 2160 pixels, and horizontal 7680 pixels × vertical 4320 pixels.
In the case of using the correspondence relationship of FIG. 5, the presentation control unit 55 matches the resolution of the text content by appropriately upsampling or downsampling the broadcast video.
When the resolution of the text content is equal to the resolution of the broadcast video, the overlay is performed without changing the resolution. As shown in FIG. 5, (5-1) when the resolution of the text content is 1920 horizontal pixels × 1080 vertical pixels, the resolution of the image (video) passed from the presentation control unit 55 to the output unit 56 is 1920 horizontal pixels × vertical 1080 pixels. Pixel. Further, (5-2) when the resolution of the text content is horizontal 3840 pixels × vertical 2160 pixels, the resolution of the image (video) passed from the presentation control unit 55 to the output unit 56 is horizontal 3840 pixels × vertical 2160 pixels.
Further, (5-3) when the resolution of the text content is horizontal 7680 × vertical 4320, the resolution of the image (video) passed from the presentation control unit 55 to the output unit 56 is horizontal 7680 pixels × vertical 4320 pixels.

また、提示制御部55が、各コンテンツの実際の解像度によって動的にどちらのコンテンツの解像度に合わせるかを決定するようにしても良い。
図6および図7は、提示制御部55によるコンテンツの解像度調整の対応関係を示す図である。図6は、提示制御部55が解像度の高いほうのコンテンツを解像度の低いほうに合わせる場合の対応関係図である。図7は、提示制御部55が解像度の低いほうのコンテンツを解像度の高いほうに合わせる場合の対応関係図である。提示制御部55は、図4や図5の方法に代えて、図6または図7のいずれかの方法を用いても良い。
Further, the presentation control unit 55 may determine which content resolution is to be dynamically adjusted according to the actual resolution of each content.
6 and 7 are diagrams illustrating the correspondence relationship of the resolution adjustment of the content by the presentation control unit 55. FIG. FIG. 6 is a correspondence diagram in the case where the presentation control unit 55 matches content with a higher resolution to a content with a lower resolution. FIG. 7 is a correspondence diagram in the case where the presentation control unit 55 matches content with a lower resolution to a content with a higher resolution. The presentation control unit 55 may use one of the methods in FIG. 6 or FIG. 7 instead of the method in FIG. 4 or FIG.

図6が示すものは2次元の表であり、横方向はテキストコンテンツの出力解像度に対応し、縦方向は放送の映像の解像度に対応する。本例では、テキストコンテンツの出力解像度も、放送映像の解像度も、横1920画素×縦1080画素、横3840画素×縦2160画素、横7680画素×縦4320画素の3通りである。但し、解像度の種類はこれらの3種類に限られず、他の解像度を用いても良い。図6の対応関係を用いる場合、テキストコンテンツからの出力と放送映像からの出力のうち、提示制御部55は、解像度の高いほうのコンテンツをダウンサンプリングすることによって、低いほうの解像度に合わせる。なお、テキストコンテンツの出力解像度と放送映像の解像度が等しい場合には、解像度を変えずにそのままオーバーレイする。図6に示す通り、(6−1)テキストコンテンツの解像度と放送映像の解像度のどちらか一方が横1920画素×縦1080画素である場合、提示制御部55から出力部56に渡す画像(映像)の解像度は横1920画素×縦1080画素である。また、(6−2)テキストコンテンツの解像度と放送映像の解像度のどちらか一方が横3840画素×縦2160画素であって、且つ他方の解像度が横3840画素×縦2160画素またはそれ以上である場合、提示制御部55から出力部56に渡す画像(映像)の解像度は横3840画素×縦2160画素である。(6−3)テキストコンテンツの解像度と放送映像の解像度の両方が横7680×縦4320である場合、提示制御部55から出力部56に渡す画像(映像)の解像度は横7680画素×縦4320画素である。   FIG. 6 shows a two-dimensional table. The horizontal direction corresponds to the output resolution of the text content, and the vertical direction corresponds to the resolution of the broadcast video. In this example, the output resolution of the text content and the resolution of the broadcast video are three types: 1920 horizontal pixels × 1080 vertical pixels, 3840 horizontal pixels × 2160 vertical pixels, 7680 horizontal pixels × 4320 vertical pixels. However, the types of resolution are not limited to these three types, and other resolutions may be used. When the correspondence relationship of FIG. 6 is used, the presentation control unit 55 matches the lower resolution by down-sampling the higher-resolution content out of the output from the text content and the output from the broadcast video. If the output resolution of the text content and the resolution of the broadcast video are the same, the overlay is performed without changing the resolution. As shown in FIG. 6, (6-1) an image (video) passed from the presentation control unit 55 to the output unit 56 when either the text content resolution or the broadcast video resolution is 1920 pixels wide × 1080 pixels high. The resolution is 1920 pixels wide × 1080 pixels vertical. (6-2) When either one of the resolution of the text content and the resolution of the broadcast video is horizontal 3840 pixels × vertical 2160 pixels, and the other resolution is horizontal 3840 pixels × vertical 2160 pixels or more The resolution of the image (video) passed from the presentation control unit 55 to the output unit 56 is horizontal 3840 pixels × vertical 2160 pixels. (6-3) When both the resolution of the text content and the resolution of the broadcast video are horizontal 7680 × vertical 4320, the resolution of the image (video) passed from the presentation control unit 55 to the output unit 56 is horizontal 7680 pixels × vertical 4320 pixels. It is.

図7も、図6と同様の2次元の表であり、解像度は、横1920画素×縦1080画素、横3840画素×縦2160画素、横7680画素×縦4320画素の3通りである。
図7の対応関係を用いる場合、テキストコンテンツからの出力と放送映像からの出力のうち、提示制御部55は、解像度の低いほうのコンテンツをアップサンプリングすることによって、高いほうの解像度に合わせる。なお、テキストコンテンツの出力解像度と放送映像の解像度が等しい場合には、解像度を変えずにそのままオーバーレイする。図7に示す通り、(7−1)テキストコンテンツの解像度と放送映像の解像度のどちらか一方が横7680画素×縦4320画素である場合、提示制御部55から出力部56に渡す画像(映像)の解像度は横7680画素×縦4320画素である。また、(7−2)テキストコンテンツの解像度と放送映像の解像度のどちらか一方が横3840画素×縦2160画素であって、且つ他方の解像度が横3840画素×縦2160画素またはそれ以下である場合、提示制御部55から出力部56に渡す画像(映像)の解像度は横3840画素×縦2160画素である。また、(7−3)テキストコンテンツの解像度と放送映像の解像度の両方が横1920×縦1080である場合、提示制御部55から出力部56に渡す画像(映像)の解像度は横1920画素×縦1080画素である。
FIG. 7 is also a two-dimensional table similar to FIG. 6, and has three resolutions: horizontal 1920 pixels × vertical 1080 pixels, horizontal 3840 pixels × vertical 2160 pixels, and horizontal 7680 pixels × vertical 4320 pixels.
In the case of using the correspondence relationship of FIG. 7, the presentation control unit 55 matches the higher resolution by up-sampling the content with the lower resolution out of the output from the text content and the output from the broadcast video. If the output resolution of the text content and the resolution of the broadcast video are the same, the overlay is performed without changing the resolution. As shown in FIG. 7, (7-1) an image (video) passed from the presentation control unit 55 to the output unit 56 when either the text content resolution or the broadcast video resolution is 7680 pixels × 4320 pixels. The resolution is 7680 pixels by 4320 pixels. (7-2) When either one of the resolution of the text content or the resolution of the broadcast video is horizontal 3840 pixels × vertical 2160 pixels and the other resolution is horizontal 3840 pixels × vertical 2160 pixels or less The resolution of the image (video) passed from the presentation control unit 55 to the output unit 56 is horizontal 3840 pixels × vertical 2160 pixels. Further, (7-3) when both the resolution of the text content and the resolution of the broadcast video are 1920 × 1080 in the horizontal direction, the resolution of the image (video) passed from the presentation control unit 55 to the output unit 56 is 1920 pixels × vertical. 1080 pixels.

なお、上述した実施形態におけるテキストコンテンツ生成装置や、送信装置や、受信装置の機能の全体または一部を、コンピューターで実現するようにしても良い。その場合、この制御機能を実現するためのプログラムをコンピューター読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピューターシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピューターシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピューター読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピューターシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピューター読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバーやクライアントとなるコンピューターシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピューターシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。   In addition, you may make it implement | achieve the whole or one part of the function of the text content production | generation apparatus in the embodiment mentioned above, the transmission apparatus, and the receiving apparatus with a computer. In that case, the program for realizing the control function may be recorded on a computer-readable recording medium, and the program recorded on the recording medium may be read into a computer system and executed. Here, the “computer system” includes an OS and hardware such as peripheral devices. The “computer-readable recording medium” refers to a storage device such as a flexible disk, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Furthermore, a “computer-readable recording medium” dynamically holds a program for a short time, like a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line. In this case, a volatile memory inside a computer system serving as a server or a client in that case may be included, and a program that holds a program for a certain period of time. The program may be a program for realizing a part of the above-described functions, or may be a program that can realize the above-described functions in combination with a program already recorded in a computer system.

本発明はさらに次のような変形例でも実施することが可能である。
例えば、上記の実施形態においては、テキストデータ生成部14は、TTML形式のファイルのヘッダー部分に、メタ(meta)データとして、解像度の情報を付加した。代わりに、テキストコンテンツを表示する際の解像度に関する情報は、他の部分に付加してテキストコンテンツ生成装置1から送信装置2に渡すようにしても良い。
例えば、TTMLデータのヘッダー部分に、「メタ」以外のタグを用いて、テキストコンテンツの解像度情報を格納するようにしても良い。
例えば、TTMLデータのヘッダー以外の部分に、テキストコンテンツの解像度情報を格納するようにしても良い。
例えば、TTMLデータの中のコメントの領域に、テキストコンテンツの解像度情報を格納するようにしても良い。
例えば、TTMLデータとは別のファイルとして、テキストコンテンツの解像度情報を付加するようにしても良い。
また、その他の方法により、テキストコンテンツの解像度情報を送信装置2側に渡すようにしても良い。
The present invention can also be implemented in the following modifications.
For example, in the above embodiment, the text data generation unit 14 adds resolution information as meta data to the header portion of a TTML format file. Instead, the information regarding the resolution at the time of displaying the text content may be added to other parts and passed from the text content generation device 1 to the transmission device 2.
For example, the resolution information of the text content may be stored using a tag other than “meta” in the header portion of the TTML data.
For example, the resolution information of the text content may be stored in a portion other than the header of the TTML data.
For example, the resolution information of the text content may be stored in the comment area in the TTML data.
For example, the resolution information of the text content may be added as a file different from the TTML data.
Further, the resolution information of the text content may be passed to the transmitting apparatus 2 side by other methods.

以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。   The embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to this embodiment, and includes designs and the like that do not depart from the gist of the present invention.

本発明は、テレビ放送やその他の映像配信事業などに利用可能である。   The present invention can be used for television broadcasting and other video distribution businesses.

1 テキストコンテンツ生成装置
2 送信装置
5 受信装置
11 テキスト編集部
12 解像度設定部
14 テキストデータ生成部
15 データ交換部
21 音声取得部
22 映像取得部
23 テキスト取得部
24 制御情報設定部
25 多重化部
26 変調部
27 送信部
51 受信部
52 分離部
53 映像・音声処理部(映像処理部)
54 テキスト処理部
55 提示制御部
56 出力部
DESCRIPTION OF SYMBOLS 1 Text content generation apparatus 2 Transmission apparatus 5 Reception apparatus 11 Text editing part 12 Resolution setting part 14 Text data generation part 15 Data exchange part 21 Audio | voice acquisition part 22 Image | video acquisition part 23 Text acquisition part 24 Control information setting part 25 Multiplexing part 26 Modulation unit 27 Transmission unit 51 Reception unit 52 Separation unit 53 Video / audio processing unit (video processing unit)
54 Text Processing Unit 55 Presentation Control Unit 56 Output Unit

Claims (2)

放送信号を受信する受信部と、
前記受信部が受信した前記放送信号を分離する分離部と、
前記分離部によって分離された映像の信号を受け取り、復号する映像処理部と、
前記分離部によって分離された、字幕または文字スーパーの少なくともいずれかであるテキストコンテンツを受け取り、当該テキストコンテンツの解像度の情報を含んだ前記テキストコンテンツを出力するテキスト処理部と、
前記映像処理部によって復号された前記映像の解像度の情報と前記テキスト処理部から渡される前記テキストコンテンツの解像度の情報とに基づいて、前記映像と前記テキストコンテンツの解像度を整合させる処理として、前記映像の解像度と前記テキストコンテンツの解像度とが異なるときには前記テキストコンテンツをアップサンプリングまたはダウンサンプリングすることによって前記映像の解像度に合うように前記テキストコンテンツの解像度を変更して、前記映像と前記テキストコンテンツとを重ねて出力する提示制御部と、
を具備し、
前記提示制御部は、前記テキスト処理部から渡される前記テキストコンテンツの解像度が横1920画素×縦1080画素である場合、前記映像の解像度が横1920画素×縦1080画素ならば前記テキストコンテンツの解像度が横1920画素×縦1080画素であるまま出力し、前記映像の解像度が横3840画素×縦2160画素ならば前記テキストコンテンツの解像度が横3840画素×縦2160画素であるようにアップサンプリングして出力するものである、
ことを特徴とする受信装置。
A receiver for receiving broadcast signals;
A separator for separating the broadcast signal received by the receiver;
A video processing unit for receiving and decoding a video signal separated by the separation unit;
A text processing unit that receives the text content that is at least one of subtitles or character supervision separated by the separation unit, and outputs the text content including information on the resolution of the text content;
As the processing for matching the resolution of the video and the text content based on the resolution information of the video decoded by the video processing unit and the resolution information of the text content passed from the text processing unit, the video When the resolution of the text content is different from the resolution of the text content, the resolution of the text content is changed to match the resolution of the video by up-sampling or down-sampling the text content, and the video and the text content are A presentation control unit that outputs in a superimposed manner;
Comprising
When the resolution of the text content delivered from the text processing unit is 1920 pixels wide × 1080 pixels high, and the resolution of the video is 1920 pixels wide × 1080 pixels high, the presentation control unit determines the resolution of the text content. If the resolution of the video is horizontal 3840 pixels × vertical 2160 pixels, it is up-sampled and output so that the resolution of the text content is horizontal 3840 pixels × vertical 2160 pixels. Is,
A receiving apparatus.
コンピューターを、請求項1に記載の受信装置として機能させるためのプログラム。   A program for causing a computer to function as the receiving device according to claim 1.
JP2018121356A 2014-07-10 2018-06-26 Text content generation device, transmission device, reception device, and program Active JP6399725B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014142689 2014-07-10
JP2014142689 2014-07-10

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2015137973A Division JP6366070B2 (en) 2014-07-10 2015-07-09 A text content generation device, a transmission device, a reception device, and a program.

Publications (2)

Publication Number Publication Date
JP6399725B1 true JP6399725B1 (en) 2018-10-03
JP2018174572A JP2018174572A (en) 2018-11-08

Family

ID=55360813

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2015137973A Active JP6366070B2 (en) 2014-07-10 2015-07-09 A text content generation device, a transmission device, a reception device, and a program.
JP2018121357A Active JP6399726B1 (en) 2014-07-10 2018-06-26 Text content generation device, transmission device, reception device, and program
JP2018121356A Active JP6399725B1 (en) 2014-07-10 2018-06-26 Text content generation device, transmission device, reception device, and program

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2015137973A Active JP6366070B2 (en) 2014-07-10 2015-07-09 A text content generation device, a transmission device, a reception device, and a program.
JP2018121357A Active JP6399726B1 (en) 2014-07-10 2018-06-26 Text content generation device, transmission device, reception device, and program

Country Status (1)

Country Link
JP (3) JP6366070B2 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2016289048B2 (en) * 2015-07-09 2020-12-24 Sony Corporation Reception device, reception method, transmission device, and transmission method
JP6735643B2 (en) * 2015-09-29 2020-08-05 日本放送協会 Receiver and program
TWI728061B (en) * 2016-03-15 2021-05-21 日商新力股份有限公司 Sending device and receiving device
GB2553785A (en) * 2016-09-13 2018-03-21 Sony Corp A decoder, encoder, computer program and method
EP3771214A1 (en) 2016-09-14 2021-01-27 Sony Corporation Transmission device, transmission method, reception device and reception method
CN111741349B (en) * 2020-07-14 2022-08-02 北京简元科技有限公司 Multimedia information special-shaped screen publishing method, device and equipment

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002142199A (en) * 2000-11-01 2002-05-17 Sony Corp Data broadcasting display method and data broadcasting receiving apparatus
JP5248364B2 (en) * 2009-02-18 2013-07-31 株式会社東芝 Subtitle conversion apparatus and subtitle conversion method
JP4803268B2 (en) * 2009-02-19 2011-10-26 ソニー株式会社 Reception device, reception method, program, and communication system
JP5423425B2 (en) * 2010-01-25 2014-02-19 富士通モバイルコミュニケーションズ株式会社 Image processing device
JP5509284B2 (en) * 2012-09-14 2014-06-04 株式会社東芝 Multi-format output device and control method for multi-format output device

Also Published As

Publication number Publication date
JP6366070B2 (en) 2018-08-01
JP2018174572A (en) 2018-11-08
JP2018170783A (en) 2018-11-01
JP2016028472A (en) 2016-02-25
JP6399726B1 (en) 2018-10-03

Similar Documents

Publication Publication Date Title
JP6399725B1 (en) Text content generation device, transmission device, reception device, and program
JP4715886B2 (en) Video display device, video display system, and video display method
JPWO2006092993A1 (en) Subtitle display device
JP2016111691A (en) Transmission method, reception method, transmission apparatus, and reception apparatus
JP2022095692A (en) Reception method and receiving device
JP7062117B2 (en) Receiver and program
US11039212B2 (en) Reception device
JP6700957B2 (en) Subtitle data generation device and program
CN102088631B (en) Live and demand broadcast method of digital television (TV) programs as well as related device and system
CN105491396A (en) Multimedia information processing method and server
JP5903010B2 (en) CG stream distribution apparatus, broadcast communication cooperative reception apparatus, CG stream distribution program, CG synchronous reproduction program, and CG stream synchronous system
JP6715910B2 (en) Subtitle data processing system, processing method, and program for television programs simultaneously distributed via the Internet
JP2009005268A (en) Transmitter, receiver, and reproducer
WO2019188406A1 (en) Subtitle generation device and subtitle generation program
JP4755717B2 (en) Broadcast receiving terminal device
JP2009260685A (en) Broadcast receiver
JP6359134B2 (en) Receiving device, receiving method, program, and storage medium
WO2014207874A1 (en) Electronic device, output method, and program
KR20090002810A (en) Method for storing the broadcast on a data broadcast and a imaging apparatus having the same
JP2016116032A (en) Receiving device, broadcasting system, receiving method, and program
JP2007336004A (en) Transmitter, receiver, transmission program and reception program
JP5010102B2 (en) Broadcast reception system
JP2016028471A (en) Receiving device
Dosch Convergence of broadcasting and broadband Internet-a benefit for people with disabilities (and for us all)
JP2012244200A (en) Content reproduction processor and content reproduction system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180626

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20180626

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20180727

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180807

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180903

R150 Certificate of patent or registration of utility model

Ref document number: 6399725

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250