CN108476341A

CN108476341A - 接收设备、接收方法和发送设备

Info

Publication number: CN108476341A
Application number: CN201780007170.4A
Authority: CN
Inventors: 塚越郁夫; 高林和彦
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2016-01-26
Filing date: 2017-01-17
Publication date: 2018-08-31
Anticipated expiration: 2037-01-17
Also published as: JP6969386B2; US20190028757A1; EP3410730A4; US20200068247A1; CN108476341B; US10511882B2; JPWO2017130804A1; EP3410730A1; WO2017130804A1

Abstract

本发明使得在通过相对位置指定字幕显示位置的情况下能够以令人满意的方式显示字幕。通过对视频流进行解码来获得视频数据，并且通过对具有字幕信息的字幕流进行解码来获得字幕的位图数据。在包括在字幕信息中的字幕显示位置信息中，通过相对于字幕显示范围的相对位置指定字幕显示位置。当视频区域的纵横比与显示视频区域的纵横比彼此不同时，将显示视频区域用作字幕显示范围并且确定字幕显示位置，此外，应用尺寸调整处理，并且基于尺寸调整处理之后的字幕显示位置来执行用于字幕的位图数据的显示位置控制。将进行了显示位置控制的字幕的位图数据叠加在视频数据上，并且获得用于显示的视频数据。

Description

接收设备、接收方法和发送设备

技术领域

本技术涉及接收设备、接收方法以及发送设备，并且具体地，涉及将字幕信息与视频数据一起发送的发送设备等。

背景技术

传统上，例如，诸如数字视频广播(DVB)等广播包括将字幕信息作为位图数据进行传输的操作。近年来，提出了在文本字符码中传输字幕信息，即，基于文本的传输。作为文本信息，例如，万维网联盟(W3C)提出了定时文本标记语言(TTML)(参考专利文献1)。

传统上，例如，存在通过相对于视频区域的相对位置来指定字幕信息中包括的字幕显示位置信息中的字幕显示位置的已知技术。在这种情况下，在视频区域的纵横比与显示区域的纵横比不匹配的情况下，根据该显示方法，一部分字幕可能超出显示区域而不被显示。

引用列表

专利文献

专利文献1：日本专利申请公开号No.2012-169885

发明内容

本发明要解决的问题

为了避免根据如上所述的显示方法中一部分字幕超出显示区域并且不显示的情况，可以想到的是，在接收端执行以下处理：在相对于监视器(显示器)上显示的视频区域(显示视频区域)的相对位置，而不是相对于视频区域的相对位置上，进行显示。在这种情况下，在视频区域的纵横比与显示视频区域的纵横比不同的情况下，字幕显示位置可能仅在水平方向上压缩，并且这可能导致字幕显示给观看者带来不舒服的感觉。

本技术的目的是使得在将字幕显示位置指定为相对位置的情况下可以令人满意地执行字幕显示。

解决问题的方法

本技术的概念是一种接收设备，包括：

接收单元，其接收包含视频流和字幕流的容器，视频流包括视频数据，字幕流包括字幕信息，所述字幕信息包括字幕显示位置信息，字幕显示位置信息通过相对于字幕显示范围的相对位置指定字幕显示位置；以及

控制单元，其控制：视频解码处理，用于对视频流进行解码，以获得视频数据；字幕解码处理，用于对字幕流进行解码，以获得字幕的位图数据；显示位置控制处理，其在视频区域的纵横比与显示视频区域的纵横比不同的情况下，将显示视频区域定义为字幕显示范围，并基于字幕显示位置信息来确定字幕显示位置，对所确定的字幕显示位置执行尺寸调整处理，并且基于已经经过尺寸调整处理的字幕显示位置，对字幕位图数据执行显示位置控制；以及视频叠加处理，用于在视频数据上叠加已经经过显示位置控制的字幕位图数据。

在本技术中，接收单元接收包括包含视频数据的视频流和包含字幕信息的字幕流的容器。在此处，在包括在字幕信息中的字幕显示位置信息中，由相对于字幕显示范围的相对位置指定字幕显示位置。控制单元控制视频解码处理、字幕解码处理、显示位置控制处理和叠加处理。

视频解码处理对视频流进行解码，以获得视频数据。字幕解码处理对字幕流进行解码，以获得字幕的位图数据。在显示位置控制处理中，在视频区域的纵横比与显示视频区域的纵横比不同的情况下，显示视频区域定义为字幕显示范围，并且基于字幕显示位置信息来确定字幕显示位置。

在显示位置控制处理中，对所确定的字幕显示位置执行尺寸调整处理，并且基于已经经过尺寸调整处理的字幕显示位置，对字幕位图数据执行显示位置控制。在视频叠加处理中，在视频数据上叠加已经经过显示位置控制的字幕位图数据。例如，在尺寸调整处理中，在所确定的字幕显示位置仅在水平方向上压缩的情况下，该位置也以相同的比例在垂直方向上压缩。

以这种方式，在本技术中，在视频区域的纵横比与显示视频区域的纵横比不同的情况下，在将显示视频区域定义为字幕显示范围的情况下确定的字幕显示位置进一步经过尺寸调整处理。因此，即使在视频区域的纵横比与显示视频区域的纵横比不同的情况下，原始形状也可以保持为字幕显示位置，使得可以令人满意地执行字幕的显示，而不给观看者带来不舒服的感觉。

注意，在本技术中，例如，在显示控制处理中，在通过字幕显示位置的尺寸调整处理来压缩垂直方向上的尺寸的情况下，在预定行位置固定的状态下执行压缩是允许的。由于以这种方式在预定行位置固定的状态下执行该压缩，所以例如在存在两个字幕显示位置的情况下，甚至在执行尺寸调整处理时，仍可以保持两个字幕显示位置之间在垂直方向上的间隔。

此外，在本技术中，例如，包含在字幕流中的字幕信息可以包括与尺寸调整处理相关的信息，并且显示位置控制处理可以使用与尺寸调整处理相关的信息来对所确定的字幕显示位置执行尺寸调整处理。例如，与尺寸调整处理相关的信息可以是指示在字幕显示位置的尺寸调整处理中压缩垂直方向上的尺寸的情况下要设置为固定位置的行位置的信息。通过以这种方式基于与尺寸调整处理相关的信息执行的尺寸调整处理，可以容易地适当地执行尺寸调整处理。

另外，本技术的另一概念是一种接收设备，包括：

接收单元，其接收包括包含视频数据的视频流和包含字幕信息的字幕流的容器，所述字幕信息包括字幕显示位置信息，字幕显示位置信息通过相对于字幕显示范围的相对位置指定字幕显示位置；以及

控制单元，其控制：视频解码处理，用于对视频流进行解码，以获得视频数据；字幕解码处理，用于对字幕流进行解码，以获得字幕位图数据；显示位置控制处理，其在视频区域的纵横比与显示视频区域的纵横比不同的情况下执行，是以下处理：在显示视频区域中设置字幕显示范围，基于字幕显示位置信息来确定字幕显示位置，并且基于所确定的字幕显示位置，对字幕位图数据执行显示位置控制；以及视频叠加处理，用于在视频数据上叠加已经经过显示位置控制的字幕位图数据。

在本技术中，接收单元接收包括包含视频数据的视频流和包含字幕信息的字幕流的容器。在此处，在包括在字幕信息中的字幕显示位置信息中，字幕显示位置被指定为相对于字幕显示范围的相对位置。控制单元控制视频解码处理、字幕解码处理、显示位置控制处理和叠加处理。视频解码处理对视频流进行解码，以获得视频数据。字幕解码处理对字幕流进行解码，以获得字幕位图数据。

在视频区域的纵横比与显示视频区域的纵横比不同的情况下，显示位置控制处理在显示视频区域中设置字幕显示范围，基于字幕显示位置信息来确定字幕显示位置，并且基于所确定的字幕显示位置，对字幕位图数据执行显示位置控制。例如，在显示视频区域中设置具有与视频区域的纵横比相同的纵横比的字幕显示范围。视频叠加单元在视频数据上叠加已经经过显示位置控制的字幕位图数据。

以这种方式，根据本技术，在视频区域的纵横比与显示视频区域的纵横比不同的情况下，在显示视频区域中设置字幕显示范围，并且基于字幕显示位置信息来确定字幕显示位置。因此，即使在视频区域的纵横比与显示视频区域的纵横比不同的情况下，原始形状也可以保持为字幕显示位置，使得可以令人满意地执行字幕的显示，而不给观看者带来不舒服的感觉。

注意，在本技术中，例如，包含在字幕流中的字幕信息可以包括指示字幕显示范围的信息，并且所述显示位置控制处理可以使用指示字幕显示范围的信息来在显示视频区域中设置字幕显示范围。在这种情况下，例如，指示字幕显示范围的信息是字幕显示范围的基准点信息和纵横比信息或字幕显示范围的基准点信息。通过以这种方式基于指示字幕显示范围的信息执行的字幕显示范围的设置，可以在显示视频区域中容易地适当地设置字幕显示范围。

另外，本技术的另一概念是一种发送设备，包括：

发送单元，其传输包括包含视频数据的视频流和包含字幕信息的字幕流的容器；

其中，在包括在字幕信息中的字幕显示位置信息中，字幕显示位置通过相对于字幕显示范围的相对位置来指定，并且

所述字幕信息包括与对基于字幕显示位置信息确定的字幕显示位置执行的尺寸调整处理相关的信息，其中，在视频区域的纵横比与显示视频区域的纵横比的情况下在接收侧执行所述尺寸调整处理。

在本技术中，发送单元传输包括包含视频数据的视频流和包含字幕信息的字幕流的容器。容器的示例对应于诸如MPEG-2TS传输流、数字广播标准中采用的MMT传输流以及用于经由互联网分发的ISOBMFF(MP4)等各种格式的容器。

在字幕信息中包括的字幕显示位置信息中，字幕显示位置被指定为相对于字幕显示范围的相对位置。字幕信息包括与对基于字幕显示位置信息确定的字幕显示位置执行的尺寸调整处理相关的信息，其中，在视频区域的纵横比与显示视频区域的纵横比的情况下在接收侧执行所述尺寸调整处理。例如，与尺寸调整处理相关的信息可以是指示在字幕显示位置的尺寸调整处理中压缩垂直方向上的尺寸的情况下要设置为固定位置的行位置的信息。

以这种方式，提供本技术，使得字幕信息包括与在接收侧执行的尺寸调整处理相关的信息。由于以这种方式字幕信息包括与尺寸调整处理相关的信息，所以接收侧可以基于该信息执行尺寸调整处理，使得可以容易地适当地执行尺寸调整处理。

另外，本技术的另一概念是一种发送设备，包括：

其中，在包括在字幕信息中的字幕显示位置信息中，通过相对于字幕显示范围的相对位置指定字幕显示位置，并且

所述字幕信息包括指示字幕显示范围的信息。

在本技术中，发送单元传输包括包含视频数据的视频流和包含字幕信息的字幕流的容器。在字幕信息中包括的字幕显示位置信息中，字幕显示位置被指定为相对于字幕显示范围的相对位置。字幕信息包括指示字幕显示范围的信息。例如，指示字幕显示范围的信息可以是字幕显示范围的基准点信息和纵横比信息或字幕显示范围的基准点信息。

以这种方式，在本技术中，字幕信息包括指示字幕显示范围的信息。利用指示字幕显示范围的信息包括在字幕信息中的配置并且通过以这种方式基于该信息执行字幕显示范围的设置，在接收侧可以在显示视频区域中容易地适当地设置字幕显示范围。

本发明的效果

根据本技术，在将字幕显示位置指定为相对位置的情况下，可以令人满意地执行字幕显示。注意，在本说明书中在此处描述的效果是为了示例性说明的目的而提供的，并非旨在是限制性的。还可以设想其他额外效果。

附图说明

图1是示出根据实施例的发送-接收系统的示例性配置的方框图；

图2是示出由字幕显示位置信息确定的字幕显示位置(区域)的示例的示图；

图3是示出TTML(一个字幕显示位置)的示例性结构的示图；

图4是示出包含在TTML结构中的主要信息的示图；

图5是示出TTML(两个字幕显示位置)的示例性结构的示图；

图6是示出在视频区域的纵横比与显示视频区域的纵横比相同的情况下，字幕显示示例(一个字幕显示位置)的示图；

图7是示出在视频区域的纵横比与显示视频区域的纵横比相同的情况下，字幕显示示例(两个字幕显示位置)的示图；

图8是示出在视频区域的纵横比与显示视频区域的纵横比不同的情况下以及在显示视频区域被定义为字幕显示范围并且基于字幕显示位置信息来确定字幕显示位置(第一方法)的情况下，字幕显示(一个字幕显示位置)的示例的示图；

图9是示出在执行尺寸调整处理的情况下的显示示例的示图；

图10是示出在视频区域的纵横比与显示视频区域的纵横比不同的情况下以及在显示视频区域被定义为字幕显示范围并且基于字幕显示位置信息来确定字幕显示位置，并且进一步执行尺寸调整处理(第一方法)的情况下，字幕显示(两个字幕显示位置)的示例的示图；

图11是示出在视频区域的纵横比与显示视频区域的纵横比不同的情况下以及在显示视频区域中设置字幕显示范围并且基于字幕显示位置信息来确定字幕显示位置(第二方法)的情况下，字幕显示(一个字幕显示位置)的示例的示图；

图12是示出在视频区域的纵横比与显示视频区域的纵横比不同的情况下以及在显示视频区域中设置字幕显示范围并且基于字幕显示位置信息来确定字幕显示位置(第二方法)的情况下，字幕显示(两个字幕显示位置)的示例的示图；

图13是示出广播传送系统的流生成单元的示例性配置的方框图；

图14是示出电视接收机的示例性配置的方框图；

图15是示出在电视接收机的CPU中确定字幕显示位置并执行尺寸调整处理的示例性过程的流程图；

图16是示出视频区域的纵横比和监视器(显示器)的纵横比的示例的示图；

图17是示出确定模式是否是用于显示整个视频区域的模式的示例性的示图；

图18是示出在显示整个视频区域的模式下以及在未指定字幕显示范围的情况下，确定字幕显示位置的示图；

图19是示出在显示整个视频区域的模式下以及在指定了字幕显示范围的情况下，确定字幕显示位置的示图；

图20是示出在不显示整个视频区域的模式下以及在未指定字幕显示范围的情况下，确定字幕显示位置的示图；

图21是示出在仅包括基准点信息(RPoffset)作为指示字幕显示范围的信息的情况下，TTML的示例性结构(一个字幕显示位置)的示图；

图22是示出在仅包括基准点信息(RPoffset)作为指示字幕显示范围的信息的情况下，TTML的示例性结构(两个字幕显示位置)的示图；

图23是用于示出在仅给出基准点信息(RPoffset)的情况下电视接收机的CPU如何设置字幕显示范围的示图；

图24是示出在电视接收机的CPU中确定字幕显示位置并执行尺寸调整处理的过程的另一示例的流程图。

具体实施方式

在下文中，将描述本发明的实施例(在下文中，实施例)。注意，将按以下顺序提供描述。

1、实施例

2、修改例

<1、实施例>

【发送-接收系统的示例性配置】

图1示出了根据实施例的发送-接收系统10的示例性配置。发送-接收系统10包括广播传送系统100和电视接收机200。广播传送系统100在广播波上传输作为容器(多路复用流)的MPEG-2TS的传输流(以下简称为“传输流TS”)，并传输该传输流。

传输流TS包括包含视频数据的视频流和包含字幕(图注)信息的字幕流。在本文中，字幕信息是预定格式的字幕的文本信息。尽管文本信息包括例如TTML或TTML派生格式等，但是该实施例是TTML用作文本信息格式的情况。在包括在TTML中的字幕显示位置信息中，字幕显示位置(区域)由相对于字幕显示范围的相对位置(比例值)指定。

TTML包括与基于字幕显示位置信息确定的字幕显示位置进行的尺寸调整处理相关的信息，其中，在视频区域的纵横比不同于显示视频区域的纵横比的情况下，在接收侧执行尺寸调整处理。根据本实施例，与尺寸调整处理相关的信息是指示在字幕显示位置上的尺寸调整处理中压缩垂直方向上的尺寸的情况下要设置为固定位置的行位置的信息。

另外，该TTML包括指示字幕显示范围的信息。根据本实施例，指示字幕显示范围的信息是字幕显示范围的基准点信息和纵横比信息或字幕显示范围的基准点信息。

电视接收机200接收从广播传送系统100发送的传输流TS。电视接收机200对包括视频数据的视频流执行解码处理，以获得视频数据，并且对包括字幕信息的字幕流执行解码处理，以获得字幕位图数据。如上所述，包括在字幕信息中的字幕显示位置信息中的字幕显示位置被指定为相对于字幕显示范围的相对位置。

电视接收机200基于字幕显示位置信息确定字幕显示位置，并基于确定的字幕显示位置对字幕位图数据执行显示位置控制。电视接收机200将已经经过显示位置控制的字幕位图数据叠加在视频数据上，以获得用于显示的视频数据。

在视频区域的纵横比与显示视频区域(在显示器上显示的视频区域)的纵横比不同的情况下，对字幕位图数据进行显示位置控制时，电视接收机200选择性地执行下面描述的第一方法和第二方法中的一种。

通过第一方法，在视频区域的纵横比与显示视频区域的纵横比不同的情况下，电视接收机200将显示视频区域定义为字幕显示范围，基于字幕显示位置信息来确定字幕显示位置，对所确定的字幕显示位置执行尺寸调整处理，并且基于所确定的字幕显示位置，对字幕位图数据执行显示位置控制。

尺寸调整处理是将原始形状恢复为字幕显示位置的处理，并且例如，在确定的字幕显示位置仅在水平方向上压缩的情况下，也以相同的比例在垂直方向上压缩该位置。例如，在通过尺寸调整处理压缩垂直方向上的尺寸的情况下，在固定诸如顶行(上行)、底行(下行)或者中间行(中间行)等预定行位置的状态下，执行压缩。

通过适当地选择预定行位置，例如，在存在两个字幕显示位置的情况下，即使在执行尺寸调整处理时，也可以保持两个字幕显示位置之间的垂直方向上的间隔。当包括在字幕流中的字幕信息包括指示要设置为固定位置的行位置的信息作为与尺寸调整处理相关的信息时，电视接收机200可以利用该信息。

通过第二方法，在视频区域的纵横比与显示视频区域的纵横比不同的情况下，电视接收机200在显示视频区域中设置字幕显示范围，基于字幕显示位置信息来确定字幕显示位置，并且基于所确定的字幕显示位置，对字幕位图数据执行显示位置控制。在这种情况下，例如，在显示视频区域中设置具有与视频区域的纵横比相同的纵横比的字幕显示范围。

在包含在字幕流中的字幕信息包括指示字幕显示范围的信息的情况下，电视接收机200可以使用该信息适当地设置字幕显示范围。例如，当字幕流中包含的字幕信息包括指示字幕显示范围的信息时，电视接收机200选择第二种方法，并且当不包括该信息时，选择第一种方法。

图2示出了由字幕显示位置信息确定的字幕显示位置(区域)的示例。该示例示出TTML的情况，在该情况中，由表示基点(原点)“origin＝”OH％OV％的信息以及由指示字幕显示位置的区域(范围)“extent＝"EH％EV％”的信息给出字幕显示位置信息。符号“RP”表示基准点，其为字幕显示范围的左上角。

图2的(a)示出了在视频区域的纵横比与显示视频区域的纵横比相同的情况下的示例。在该示例中，当视频区域的纵横比是16：9时，显示器的纵横比是16：9，并且显示视频区域的纵横比是16：9。在这种情况下，显示视频区域被定义为字幕显示范围，并且基于由相对于显示视频区域的相对位置指定的字幕显示位置信息来确定字幕显示位置。

图2的(b)是视频区域的纵横比与显示视频区域的纵横比不同并且显示视频区域被定义为字幕显示范围并且基于字幕显示位置信息确定字幕显示位置(第一种方法)的示例性情况。在该示例中，在视频区域的纵横比是16：9的情况下，显示器的纵横比是4：3，并且显示方法是中心切割(center-cut)的，导致显示视频区域的纵横比为4：3。在这种情况下，虽然与图2的(a)的情况相比，字幕显示位置在垂直方向上具有相同的宽度，但是在水平方向上其宽度被压缩。在这种情况下，字幕显示位置的形状与图2的(a)的情况不同。

图2的(c)示出了视频区域的纵横比与显示视频区域的纵横比不同，在显示视频区域中设置字幕显示范围，并且基于字幕显示位置信息确定字幕显示位置(第二种方法)的示例性情况。在该示例中，在视频区域的纵横比是16：9的情况下，显示器的纵横比是4：3，并且显示方法是中心切割的，导致显示视频区域的纵横比为4：3。在这种情况下，与图2的(a)的情况相比，字幕显示位置具有在垂直方向和水平方向均被压缩的宽度。在字幕显示范围的纵横比设置为16:9的情况下，字幕显示位置的形状与图2的(a)的情况相同。

图3示出了示例性TTML结构。这个示例是具有一个字幕显示位置(区域)的示例性情况。基于XML描述TTML。在tt根容器中，定义了语言和命名空间。命名空间被定义为可以在系统或标准系统的所有元素中唯一识别的唯一元素名称。此外，在<tt>中，“tts：extent”首先将视频100％的目标区域声明为字幕位置信息的来源。“全视频”表示在4K视频是目标的情况下分辨率为3840(H)×2160(V)的整个视频，同时示出了在2K(全高清)视频为目标(target，对象)的情况下分辨率为1920(H)×1080(V)的整个视频。

尽管将省略对“xmlns＝http://www.w3.org/ns/ttml”、“xmlns:ttp＝http://www.w3.org/ns/ttml#parameter”、“xmlns:tts＝http://www.w3.org/ns/ttml#styling”的命名空间的详细描述，但是，存在预先确保作为W3C中的TTML的属性类别的命名空间(例如，参数和样式)。

“xmlns:dto＝http://www.example.org/ns/displaytextoverlay”是新定义的命名空间。该命名空间用于插入指示字幕显示范围的信息。然后，“dto：dispasp＝“16：9””和“dto：RPoffset＝“Ax％,By％””表示指示字幕显示范围的信息。

“dto：dispasp＝“16：9””指示字幕显示范围的纵横比信息，并且字幕显示范围是纵横比为16：9的区域。尽管所示的示例示出了字幕显示范围的纵横比是16：9，但是字幕显示范围的纵横比可以被指定为4：3、21：9等，如图4所示。“dto：RPoffset＝“Ax％,By％””指示字幕显示范围的基准点信息，并且如图4所示，显示视频区域的水平和垂直部分中的每个为100％时字幕显示范围的基准点(RP)的位置由与显示视频区域的左上角的偏移(offset)的比率指示。

标头(头)包含布局元素。区域ID由“r1”表示，字幕显示位置的起点(原点)和区域(范围)由作为字幕显示位置信息的相对位置示出。即，“origin＝“OH％OV％””表示字幕显示位置的基点，表示起点是从左边开始的OH％以及从顶部开始的OV％。另外，“extent＝“EH％EV％””表示字幕显示位置的区域，表示水平宽度为EH％，垂直宽度为EV％。

在正文中，XML ID由“p1”表示，并且区域ID由“r1”表示，同时描述字幕(图注)的文本数据。在此处，文本数据由“ABCDE”表示。“dto:scalingjustify＝top”构成与尺寸调整处理相关的信息，并且在通过字幕显示位置的尺寸调整处理来压缩垂直方向上的尺寸的情况下，指示要设置为固定位置的行位置。虽然所示的示例是要设置为固定位置的行位置是顶行(上行)的情况，但是也可以指定底行(下行)、中间行(中行)等，如图4所示。

图5也示出了示例性TTML结构。这个示例是具有两个字幕显示位置(区域)的示例性情况。tt根容器与图3的情况类似，因此将省略描述。

标头(头)包含布局元素。第一字幕显示位置的区域ID由“r1”表示，字幕显示位置的起点(原点)和区域(范围)由作为字幕显示位置信息的相对位置示出。即，“origin＝“OH1％OV1％””表示起点是从左边开始的OH1％以及从顶部开始的OV1％。另外，“extent＝“EH1％EV1％””表示区域的水平宽度为EH1％，区域的垂直宽度为EV1％。

此外，第二字幕显示位置的区域ID由“r2”表示，字幕显示位置的起点(原点)和区域(范围)由作为字幕显示位置信息的相对位置示出。即，“origin＝“OH2％OV2％””表示起点是从左边开始的OH2％以及从顶部开始的OV2％。另外，“extent＝“EH2％EV2％””表示区域的水平宽度为EH2％，区域的垂直宽度为EV2％。

在正文中，与第一字幕位置有关，XML ID由“p1”表示，并且区域ID由“r1”表示，同时描述字幕(图注)的文本数据。在此处，文本数据由“ABCDE”表示。“dto:scalingjustify＝top”构成与尺寸调整处理相关的信息，并且在通过字幕显示位置的尺寸调整处理来压缩垂直方向上的尺寸的情况下，指示要设置为固定位置的行位置。所示的示例示出了要设置为固定位置的行位置是底行(下行)的情况。

此外，在正文中，关于第二字幕位置，XML ID由“p2”表示，并且区域ID由“r2”表示，同时描述字幕(图注)的文本数据。在此处，文本数据由“FGH”表示。“dto:scalingjustify＝top”构成与尺寸调整处理相关的信息，并且在通过字幕显示位置的尺寸调整处理来压缩垂直方向上的尺寸的情况下，指示要设置为固定位置的行位置。在所示的示例中，设置为固定位置的行位置是顶行(上行)。

图6示出了在视频区域的纵横比和显示视频区域的纵横比(显示器上显示的视频区域)相同的情况下的字幕(图注)的显示示例。所示的示例是具有如图3所示的TTML结构(一个字幕显示位置)、视频区域的纵横比是16：9并且显示器的纵横比也是16：9的示例性情况，。

在所示的示例中，视频区域用虚线框表示，而显示器区域用实线框表示。在这种情况下，如单点划线框所示，将显示视频区域定义为字幕显示范围，并且基于由相对于范围的相对位置指定的字幕显示位置信息(“origin＝“OH％OV％””和“extent＝“EH％EV％””)，确定字幕显示位置(区域)。符号“RP”表示作为字幕显示范围的左上角的基准点。

在以这种方式确定的字幕显示位置上显示文本数据中的字幕“ABCDE”。注意，虽然在所示的示例中，指示视频区域、显示器区域和字幕显示范围的框未在显示中对准，但是呈现该图示，用于清楚地显示各个框，并且框实际上彼此对准。虽然省略了说明，但在以下附图中将呈现类似的显示。

图7也示出了在视频区域的纵横比和显示视频区域的纵横比(显示器上显示的视频区域)相同的情况下的字幕(图注)的显示示例。所示的示例是具有如图5所示的TTML结构(两个字幕显示位置)、视频区域的纵横比是16：9并且显示器的纵横比也是16：9的示例性情况。

在所示的示例中，视频区域用虚线框表示，而显示器区域用实线框表示。在这种情况下，如单点划线框所示，将显示视频区域定义为字幕显示范围，并且基于由相对于该范围的相对位置指定的字幕显示位置信息(“origin＝“OH1％OV1％””、“extent＝“EH1％EV1％””、“origin＝“OH2％OV2％””、“extent＝“EH2％EV2％””)，确定第一和第二字幕显示位置(区域)。

然后，在第一字幕显示位置(第一区域)中显示文本数据中的字幕“ABCDE”，而在第二字幕显示位置(第二区域)中显示文本数据中的字幕“FGH”。在这种情况下，例如，两个字幕显示位置(区域)之间的间隔为10行。

图8是示出在视频区域的纵横比与显示视频区域(显示器上显示的视频区域)的纵横比不同的情况下以及在显示视频区域被定义为字幕显示范围并且基于字幕显示位置信息来确定字幕显示位置(第一方法)的情况下显示字幕(图注)的示例的示图。所示的示例是具有如图3所示的TTML结构(一个字幕显示位置)、视频区域的纵横比是16：9并且显示器的纵横比是4：3的示例性情况。

在所示的示例中，视频区域用虚线框表示，而显示器区域用实线框表示。在这种情况下，如单点划线框所示，将显示视频区域定义为字幕显示范围，并且基于由相对于该范围的相对位置指定的字幕显示位置信息(“origin＝“OH％OV％””和“extent＝“EH％EV％””)，确定字幕显示位置(区域)。此外，在字幕显示位置上显示文本数据中的字幕“ABCDE”。

在这种情况下，虽然与图6的情况相比，字幕显示位置在垂直方向上具有相同的宽度，但是其宽度在水平方向上被压缩。在这种情况下，与压缩字幕显示位置的宽度一起，字幕的字体尺寸也被调整为较小的尺寸。如图所示，虽然字幕的字体尺寸的调整允许在字幕显示位置和在该位置显示的字幕之间的关系在水平方向上对准，但字幕显示位置和在该位置显示的字幕之间的关系在未压缩字幕显示位置的宽度的垂直方向上不对准。这给观看者带来字幕显示位置的黑色区域突出的感觉。

鉴于以上内容，如上所述的第一方法对确定的字幕显示位置执行尺寸调整处理，以便不仅在水平方向，而且也在垂直方向上实现字幕显示位置和在该字幕显示位置显示的字幕之间的对准关系。图9示出了执行尺寸调整处理的显示示例。在这种情况下，基于字幕显示位置信息(“origin＝“OH％OV％””和“extent＝“EH％EV％””)确定仅在水平方向上压缩的字幕显示位置也在垂直方向以相同的比例通过尺寸调整处理来压缩。在这种情况下，结果，由字幕显示位置信息(“origin＝“OH％OV％””和“extent＝“EH％EV％””)确定字幕显示位置。在这种情况下，该关系将是EVu＝3/4*EV。

当以这种方式执行尺寸调整处理时，在预定行位置固定的状态下，执行垂直方向上的宽度的压缩。所示出的示例是基于TTML中包括的“dto：

scalingjustify＝top”的信息将预定行位置设置为顶行(上行)的示例。注意，在所示的示例中，虚线框表示在进行垂直方向的宽度压缩之前的字幕显示位置。

图10也是示出在视频区域的纵横比与显示视频区域(显示器上显示的视频区域)的纵横比不同的情况下以及在显示视频区域被定义为字幕显示范围并且基于字幕显示位置信息来确定字幕显示位置(第一方法)的情况下，显示字幕(图注)的示例的示图。所示出的示例是具有如图5所示的TTML结构(两个字幕显示位置)的显示器的示例性情况，其中，视频区域的纵横比是16：9并且显示器的纵横比是4：3，其中执行了尺寸调整处理。

在所示的示例中，视频区域用虚线框表示，而显示器区域用实线框表示。在这种情况下，如单点划线框所示，显示视频区域被定义为字幕显示范围，并且基于由相对于该范围的相对位置指定的字幕显示位置信息(“origin＝“OH1％OV1％””、“extent＝“EH1％EV1％””、“origin＝“OH2％OV2％””和“extent＝“EH2％EV2％””)，确定第一和第二字幕显示位置(区域)，然后，进一步执行尺寸调整处理。

在这种情况下，结果，由字幕显示位置信息(“origin＝“OH1％OV1％””和“extent＝“EH1％EV1％””)确定第一字幕显示位置(第一区域)。在这种情况下，关系将是EV1u＝3/4*EV1。类似地，在这种情况下，结果，由字幕显示位置信息(“origin＝“OH2％OV2％””和“extent＝“EH2％EV2％””)确定第二字幕显示位置(第二区域)。在这种情况下，关系将是EV2u＝3/4*EV2。

然后，在第一字幕显示位置(第一区域)中显示文本数据中的字幕“ABCDE”，而在第二字幕显示位置(第二区域)中显示文本数据中的字幕“FGH”。在这种情况下，调整字幕的字体尺寸，以便根据字幕显示位置(区域)的压缩来对准。

当执行尺寸调整处理时，在预定行位置固定的状态下执行垂直方向上的宽度压缩。所示出的示例是基于包括在TTML中的“dto：scalingjustify＝bottom”的信息将预定行位置设置为相对于第一字幕显示位置(第一区域)为底行(下行)的示例性情况。此外，这是基于包括在TTML中的“dto：scalingjustify＝bottom”的信息将预定行位置设置为相对于第二字幕显示位置(第二区域)为顶行(上行)的示例性情况。

以这种方式，选择第一和第二字幕显示位置中的预定行位置，由此，例如，保持10行作为第一和第二字幕显示位置之间的间隔，类似于图7的显示示例的情况。这使得可以基本上保持观看者可感知到显示图像上的字幕(字幕)。

图11是示出在视频区域的纵横比与显示视频区域(显示器上显示的视频区域)的纵横比不同的情况下以及在显示视频区域中设置字幕显示范围并且基于字幕显示位置信息来确定字幕显示位置(第二方法)的情况下，显示字幕(图注)的示例的示图。所示的示例是具有如图3所示的TTML结构(一个字幕显示位置)、视频区域的纵横比是16：9并且显示器的纵横比是4：3的示例性情况。

在所示的示例中，视频区域用虚线框表示，而显示器区域用实线框表示。在这种情况下，如单点划线框所示，在显示视频区域中设置字幕显示范围，并且基于由相对于该范围的相对位置指定的字幕显示位置信息(“origin＝“OH％OV％””、“extent＝“EH％EV％””)，确定字幕显示位置(区域)。此外，在字幕显示位置上显示文本数据中的字幕“ABCDE”。在这种情况下，调整字幕的字体尺寸，以便根据字幕显示位置(区域)的压缩进行对准。

在这种情况下，例如，在显示视频区域中设置具有与视频区域的纵横比相同的纵横比的字幕显示范围。所示的示例是基于指示在TTML中包含的字幕显示范围的信息，即，字幕显示范围的基准点信息(“dto：RPoffset＝“Ax％、By％””)和纵横比信息(“dto：dispasp＝“16：9””))，在显示视频区域中设置纵横比为16：9的字幕显示范围的示例性情况。

在这种情况下，字幕显示位置在垂直方向和水平方向上的宽度都被压缩，以便形成与图6的情况相同的字幕显示位置的形状，因此，不需要根据对字幕的字体尺寸的调整来执行字幕显示位置调整(尺寸调整处理)。

图12也是示出在视频区域的纵横比与显示视频区域(显示器上显示的视频区域)的纵横比不同的情况下以及在显示视频区域中设置字幕显示范围并且基于字幕显示位置信息来确定字幕显示位置(第二方法)的情况下，显示字幕(图注)的示例的示图。所示的示例是具有如图5所示的TTML结构(两个字幕显示位置)、视频区域的纵横比是16：9并且显示器的纵横比是4：3的示例性情况。

在所示的示例中，视频区域用虚线框表示，而显示器区域用实线框表示。在这种情况下，如单点划线框所示，显示视频区域被定义为字幕显示范围，并且基于由相对于该范围的相对位置指定的字幕显示位置信息(“origin＝“OH1％OV1％””、“extent＝“EH1％EV1％””、“origin＝“OH2％OV2％””以及“extent＝“EH2％EV2％””)，确定第一和第二字幕显示位置(区域)。然后，在第一字幕显示位置(第一区域)中显示文本数据中的字幕“ABCDE”，而在第二字幕显示位置(第二区域)中显示文本数据中的字幕“FGH”。

【广播传送系统的流生成单元的示例性配置】

图13示出了广播传送系统100的流生成单元110的示例性配置。流生成单元110包括控制单元111、视频编码器112、音频编码器113、文本格式转换器114、字幕编码器115和TS格式化器(多路复用器)116。

控制单元111例如包括中央处理单元(CPU)，并且控制流生成单元110的每个部分的操作。视频编码器112输入视频数据DV，编码视频数据DV，并生成由在有效载荷中具有编码的视频数据的视频PES数据包形成的视频流(PES流)。

音频编码器113输入音频数据DA，编码音频数据DA，并生成由具有编码的视频数据的视频PES数据包形成的音频流(PES流)。文本格式转换器114输入文本数据(字符码)DT并获得定时文本标记语言(TTML)作为字幕信息(参考图3和5)。

包括在TTML中的字幕显示位置信息中的字幕显示位置(区域)由相对于字幕显示范围的相对位置(比例值)指定。此外，该TTML包括与在视频区域的纵横比与显示视频区域的纵横比不同的情况下在接收侧要执行的字幕显示位置的尺寸调整处理相关的信息，例如，指示在通过字幕显示位置的尺寸调整处理压缩垂直方向上的尺寸的情况下要设置为固定位置的行位置的信息。另外，该TTML包括指示字幕显示范围的信息(字幕显示范围的基准点信息和纵横比信息)。

字幕编码器115将由文本格式转换器114获得的TTML转换成各个片段，并且生成由在有效载荷中布置这些片段(字幕信息)的字幕PES数据包形成的字幕流(PES流)。

TS格式化器116将由视频编码器112生成的视频流、由音频编码器113生成的音频流和由字幕编码器115生成的字幕流封包成传输数据包，并且多路复用封包的流，从而获得传输流TS作为容器(多路复用流)。

将简要描述图13中所示的流生成单元110的操作。将视频数据DV提供给视频编码器112。视频编码器112对视频数据DV进行编码，并且生成由在有效载荷中具有编码的视频数据的视频PES数据包形成的视频流(PES流)。将该视频流提供给TS格式化器116。

还将音频数据DA提供给音频编码器113。音频编码器113对音频数据DA进行编码并且生成由具有编码的音频数据的音频PES数据包形成的音频流(PES流)。将该音频流提供给TS格式化器116。

此外，将文本数据(字符码)DT提供给文本格式转换器114。该文本格式转换器114获得TTML作为字幕信息(参考图3和5)。将TTML提供给字幕编码器115。字幕编码器115将TTML转换为各个片段，并且生成由字幕PES数据包形成的字幕流，在每个字幕PES数据包中，这些片段布置在有效载荷中。将该字幕流提供给TS格式化器116。

TS格式化器116将由视频编码器112生成的视频流、由音频编码器113生成的音频流和由字幕编码器115生成的字幕流封包成传输数据包，并且多路复用封包的流，从而生成传输流TS，作为容器(多路复用流)。

【电视接收机的示例性配置】

图14示出了电视接收机200的示例性配置。电视接收机200包括接收单元201、TS分析单元(多路分用器)202、视频解码器203、视频叠加单元204、面板驱动电路205以及作为监视器(显示器)的显示面板206。此外，电视接收机200包括音频解码器207、音频输出电路208、扬声器209和字幕解码器210。此外，电视接收机200包括CPU 221、闪存ROM222、DRAM223、内部总线224、遥控接收单元225和遥控发射器226。

CPU 221控制电视接收机200的每个部分的操作。闪存ROM 222存储控制软件和数据。DRAM 223构成CPU 221的工作区域。CPU 221从闪存ROM 222读取的软件和数据导出到DRAM 223上，以激活软件，并且控制电视接收机200的每个部分。

遥控接收单元225接收从遥控发射器226传输的遥控信号(遥控代码)，并将接收到的信号提供给CPU 221。CPU 221基于该遥控代码来控制电视接收机200的每个部分。CPU221、闪存ROM 222和DRAM 223连接到内部总线224。

接收单元201通过广播波接收从广播传送系统100发送的传输流TS。如上所述，传输流TS包括视频流、音频流和字幕流。TS分析单元202从传输流TS中提取视频流、音频流和字幕流中的每一个的PES数据包。

音频解码器207对由TS分析单元202获得的音频PES数据包执行解码处理，然后获得音频数据。音频输出电路208对音频数据执行诸如D/A转换和放大等所需处理，并将处理后的数据提供给扬声器209。视频解码器203对由TS分析单元202获得的视频PES数据包执行解码处理，然后获得视频数据。注意，视频解码器203还根据显示模式等适当地执行视频数据的分辨率转换。例如，在视频区域的纵横比为16：9，监视器(显示器)的纵横比为4：3，并且显示模式是信箱的情况下，执行视频数据的分辨率转换。

字幕解码器210对由TS分析单元202获得的字幕PES数据包执行解码处理，以将包括在TTML中的每个字幕显示位置(区域)的字幕(图注)的文本数据(字体数据)转换为位图数据(二进制图像信息)。在这种情况下，根据由字幕显示位置信息确定的或者通过进一步尺寸调整处理获得的字幕显示位置的尺寸，在CPU 221的控制下，从TTML中指定的字体尺寸，适当地调整字幕的字体尺寸。

此外，字幕解码器210从TTML中提取各种类型的信息并将其提供给CPU 221。该信息还包括由<tt>和<head>定义的属性信息。CPU 221基于字幕显示位置信息来确定字幕显示位置，并且进一步根据需要对确定的字幕显示位置执行尺寸调整处理。下面将进一步描述CPU 221中对字幕显示位置的确定和尺寸调整处理的过程的细节。

视频叠加单元204将从字幕解码器210中获得的每个字幕显示位置上的字幕位图数据叠加在由视频解码器203获得的视频数据上，以便获得显示视频数据。在这种情况下，如上所述，CPU 221基于由字幕显示位置信息确定的或者通过进一步尺寸调整处理获得的字幕显示位置，进行控制以将字幕位图数据的叠加位置设置为字幕显示位置。

面板驱动电路205基于由视频叠加单元204获得的显示视频数据来驱动显示面板206。显示面板206包括例如液晶显示器(LCD)、有机电致发光(EL)显示器等。

将简要描述图14中所示的电视接收机200的操作。接收单元201通过广播波接收从广播传送系统100发送的传输流TS。传输流TS包括视频流、音频流和字幕流。将传输流TS提供给TS分析单元202。TS分析单元202从传输流TS中提取视频流、音频流和字幕流中的每一个的PES数据包。

将由TS分析单元202提取的视频PES数据包提供给视频解码器203。在视频解码器203中，对视频PES数据包执行解码处理，以获得视频数据。在这种情况下，视频解码器203根据显示模式等适当地转换视频数据的分辨率。

此外，将由TS分析单元202提取的字幕PES数据包提供给字幕解码器210。字幕解码器210对由TS分析单元202获得的字幕PES数据包执行解码处理，因此基于包含在TTML中的文本数据来获得要叠加在视频数据上的每个字幕显示位置的字幕位图数据。

此外，字幕解码器210从TTML中提取各种类型的信息并将其提供给CPU 221。该信息还包括由<tt>和<head>定义的属性信息。CPU 221基于字幕显示位置信息来确定字幕显示位置，并且进一步根据需要对确定的字幕显示位置执行尺寸调整处理。

将从字幕解码器210输出的每个字幕显示位置的位图数据提供给视频叠加单元204。视频叠加单元204将从字幕解码器210获得的每个字幕显示位置处的字幕位图数据叠加在由视频解码器203获得的视频数据上，以便获得显示视频数据。在这种情况下，CPU 221基于由字幕显示位置信息确定的或者通过进一步尺寸调整处理获得的字幕显示位置，进行控制以将字幕位图数据的叠加位置设置为字幕显示位置。

将由视频叠加单元204获得的显示视频数据提供给面板驱动电路205。面板驱动电路205基于显示视频数据驱动显示面板206。利用该配置，在显示面板206上显示在每个字幕显示位置(区域)上叠加了字幕(图注)的图像。

此外，将由TS分析单元202提取的音频PES数据包提供给音频解码器207。音频解码器207对音频PES数据包执行解码处理，然后获得音频数据。将该音频数据提供给音频输出电路208。音频输出电路208对音频数据执行诸如D/A转换和放大等必要处理。然后，将处理后的音频数据提供给扬声器209。利用该配置，从扬声器209获得与显示面板206的显示图像对应的音频输出。

“字幕显示位置的确定和尺寸调整处理的过程”

将详细描述CPU 221中对字幕显示位置的确定和尺寸调整处理的过程。图15的流程图示出了CPU 221中对字幕显示位置的确定和尺寸调整处理的示例性过程。

在这个示例中，假设视频区域的纵横比为16：9。然后，如图16的(a)所示，具有两种假设情况，即，TTL未指定字幕显示范围的情况和TTML指定字幕显示范围的情况，如图16的(b)和图16的(c)所示。注意，尽管这是指定的字幕显示范围的纵横比是16：9和4：3的示例，但指定的字幕显示范围的纵横比不限于这些比率。此外，在此处，具有两种假设情况，其中，监视器(显示器)的纵横比是16：9和4：3。

CPU 221在步骤ST1中开始处理，然后进入步骤ST2的处理。在该步骤ST2中，CPU221确定接收机显示器是否处于显示整个视频区域的模式。例如，在显示器的纵横比为16:9(参考图17的(a))的情况下，或者在显示器的纵横比为4:3并且采用信箱的显示方法(图17的(b))的情况下，确定该模式是显示整个视频区域的模式。此外，例如，在显示器的纵横比为4:3并且采用中心切割显示方法(参考图17的(c))的情况下，确定该模式是不显示整个视频区域的模式。

当CPU 221确定该模式是显示整个视频区域的模式时，CPU 221进入步骤ST3的处理。在该步骤ST3中，CPU 221确定是否指定了字幕显示范围。例如，在TTML的tt根容器中存在字幕显示范围的基准点信息(RPoffset)和纵横比信息(dispasp)的情况下，确定指定了字幕显示范围。

当未指定字幕显示范围时，CPU 221进入步骤ST4的处理。在该步骤ST4中，CPU 221确定显示视频区域被定义为字幕显示范围时字幕显示位置(区域)。此时，CPU 221将显示视频区域的左上角定义为基准点RP，并根据由相对于字幕显示范围的相对位置指定的字幕显示位置信息(“origin＝“OH％OV％””和“extent＝“EH％EV％””)的指令，来确定字幕显示位置(区域)。

图18的(a)示出了显示器具有16：9的纵横比的示例性情况。图18的(b)示出了显示器的纵横比为4:3并采用信箱(letterbox)的显示方法的示例性情况。注意，符号“RP”指示作为字幕显示范围的左上角的基准点。

在步骤ST4的处理之后，CPU 221在步骤ST5中结束处理。

当在上述步骤ST3中指定字幕显示范围时，CPU 221进入步骤ST6的处理。在该步骤ST6中，CPU 221确定在指定的字幕显示范围中的字幕显示位置(区域)。此时，CPU 221将纵横比信息(dispasp)用作指示字幕显示范围的信息，并且在显示视频区域中设置字幕显示范围。随后，CPU221将字幕显示范围的左上角设置为基准点RP，并根据由相对于字幕显示范围的相对位置指定的字幕显示位置信息(“origin＝“OH％OV％””和“extent＝“EH％EV％””)的指令，来确定字幕显示位置(区域)。

图19的(a)示出了显示器的纵横比为16:9并且纵横比信息(dispasp)所指示的纵横比为16:9的示例性情况。图19的(b)示出了显示器的纵横比为16:9并且由纵横比信息(dispasp)指示的纵横比是4:3的示例性情况。

注意，在以这种方式由纵横比信息(dispasp)指示的纵横比与显示器的纵横比不同的情况下，CPU 221设置在垂直方向的宽度或在水平方向的宽度彼此匹配并且具有由在显示视频区域的中心处的纵横比信息(dispasp)指示的纵横比的字幕显示范围。在所示的示例中，由于显示器的纵横比为16:9，纵横比信息(dispasp)为4:3，所以在垂直方向的宽度彼此匹配。

图19的(c)示出了显示器的纵横比为4:3，采用了信箱显示方法，并且由纵横比信息(dispasp)指示的纵横比为16:9的示例性情况。图19的(d)示出了显示器的纵横比为4:3，采用信箱显示方法，并且由纵横比信息(dispasp)指示的纵横比为4:3的示例性情况。

在步骤ST6的处理之后，CPU 221结束步骤ST5中的处理。

当在上述步骤ST2中确定该模式是不显示整个视频区域的模式时，处理进入步骤ST7。在该步骤ST7中，CPU 221确定是否指定了字幕显示范围。例如，在TTML的tt根容器中存在字幕显示范围的基准点信息(RPoffset)和纵横比信息(dispasp)的情况下，确定指定了字幕显示范围。

当未指定字幕显示范围时，CPU 221进入步骤ST8的处理。在该步骤ST8中，CPU 221在将显示视频区域定义为字幕显示范围的情况下确定字幕显示位置(区域)。此时，CPU 221将显示视频区域的左上角定义为基准点RP，并根据由相对于字幕显示范围的相对位置指定的字幕显示位置信息(“origin＝“OH％OV％””和“extent＝“EH％EV％””)的指令，来确定字幕显示位置(区域)。

以这种方式确定的字幕显示位置具有仅在水平方向上压缩的宽度。因此，CPU 221还对所确定的字幕显示位置执行尺寸调整处理，也在垂直方向上压缩宽度，以便获得最终字幕显示位置。在这种情况下，例如，CPU 221基于例如包含在TTML中的“dto：scalingjustify＝top”的信息，在预定行位置固定的状态下压缩垂直方向上的宽度。

图20的(a)示出了显示器的纵横比为4:3并且采用中心切割显示方法的示例性情况。字幕显示位置在垂直方向上的宽度通过尺寸调整处理从EV％压缩到EVu％。

在步骤ST8的处理之后，CPU 221结束步骤ST5中的处理。

当在上述步骤ST7中指定字幕显示范围时，CPU 221进入步骤ST9的处理。在该步骤ST9中，CPU 221确定指定的字幕显示范围中的字幕显示位置(区域)。此时，CPU 221使用指示字幕显示范围(基准点信息(RPoffset)和纵横比信息(dispasp))的信息，以便在显示视频区域上设置字幕显示范围。

在这种情况下，CPU 221将从显示视频区域的左上角偏移了基准点信息(RPoffset)的位置设置为字幕显示范围的左上角，然后，设置与由纵横比信息(dispasp)指示的纵横比对应的范围。在这种情况下，字幕显示范围的水平方向宽度与显示视频区域的水平方向宽度匹配。

随后，CPU 221将如上设置的字幕显示范围的左上角设置为基准点RP，并根据由相对于字幕显示范围的相对位置指定的字幕显示位置信息(“origin＝“OH％OV％””和“extent＝“EH％EV％””)的指令，来确定字幕显示位置(区域)。

图20的(b)示出了显示器的纵横比为4:3，采用中心切割显示方法，并且由纵横比信息(dispasp)指示的纵横比为16:9的示例性情况。图20的(c)示出了显示器的纵横比为4:3，采用中心切割显示方法，并且由纵横比信息(dispasp)指示的纵横比为4:3的示例性情况。

在步骤ST9的处理之后，CPU 221在步骤ST5中结束处理。

如上所述，在图1所示的发送-接收系统10中视频区域的纵横比与显示视频区域的纵横比不同的情况下，电视接收机200通过对基于显示视频区域被定义为字幕显示范围时的字幕显示位置信息确定的字幕显示位置进一步进行尺寸调整处理，来获得最终字幕显示位置，或者在显示视频区域中设置字幕显示范围，并基于字幕显示位置信息来确定字幕显示位置。因此，即使在视频区域的纵横比与显示视频区域的纵横比不同的情况下，原始形状也可以保持作为字幕显示位置，使得可以令人满意地执行字幕的显示，而不给观看者带来不舒服的感觉。

此外，在图1所示的发送-接收系统10中，广播传送系统100在TTML中包括与要在接收侧执行的尺寸调整处理相关的信息作为字幕信息，例如，在通过字幕显示位置的尺寸调整处理来压缩垂直方向尺寸的情况下，指示将是固定位置的行位置的信息。因此，这使得接收侧能够基于该信息容易地适当地执行尺寸调整处理。

此外，在图1所示的发送-接收系统10中，广播发送系统100在TTML中包括表示字幕显示范围的信息作为字幕信息。因此，通过基于该信息设置字幕显示范围，可以在接收侧在显示视频区域中容易地适当地设置字幕显示范围。

<2、修改>

注意，上述实施例是这样的示例，即，广播传送系统100在TTML中包括基准点信息(RPoffset)和纵横比信息(dispasp)，作为指示字幕显示范围的信息。然而，可以想象的是，广播传送系统100在TTML中仅包括基准点信息(RPoffset)，作为指示字幕显示范围的信息。图21和图22示出了这种情况下的TTML结构的示例。尽管没有详细描述示例性TTML结构，但是这些结构与图3和5中示出的示例性TTML结构类似，除了没有字幕显示范围的纵横比信息(dispasp)以外。

将参考图23，描述在仅给出基准点信息(RPoffset)的情况下电视接收机200的CPU221如何设置字幕显示范围的示例。所示的示例是视频区域的纵横比为16：9，而显示视频区域的纵横比为4：3的情况。

基于基准点信息(RPoffset)，CPU 221首先将从显示视频区域的左上角偏移了基准点信息(RPoffset)的位置设置为字幕显示范围的基准点RP。显示视频区域的中心位置被定义为OP，并且相对于基准点RP的OP点对称的坐标位置被定义为TP。此外，相对于穿过基准点RP的OP的水平线JK线对称的位置被定义为VP。此外，相对于穿过基准点RP的OP的垂直线ST线对称的位置被定义为HP。然后，由RP-HP-TP-VP包围的矩形区域被设置为字幕显示范围。

以这种方式，在广播传送系统100仅发送基准点信息(RPoffset)，作为指示字幕显示范围的信息的情况下，与发送基准点信息(RPoffset)和纵横比信息(dispasp)的情况相比，可以更灵活地指定字幕显示范围。

图24的流程图示出了在仅发送基准点信息(RPoffset)作为指示字幕显示范围的信息的情况下，在电视接收机200的CPU 221中对字幕显示位置进行确定和尺寸调整处理的示例性过程。在图24中，与图15中对应的部分用相同的附图标记表示。

当在步骤ST2中确定该模式是显示整个视频区域的模式时，CPU 221在步骤ST4中在显示视频区域定义为字幕显示范围时确定字幕显示位置(区域)。此时，CPU 221将显示视频区域的左上角定义为基准点RP，并根据由相对于字幕显示范围的相对位置指定的字幕显示位置信息(“origin＝“OH％OV％””和“extent＝“EH％EV％””)的指令，来确定字幕显示位置(区域)。

在步骤ST4的处理之后，CPU 221在步骤ST5中结束处理。

尽管省略了详细描述，但是图24的流程图的其他步骤与图15的流程图的步骤类似。

此外，在上述实施例中，具有将TTML用作预定格式的字幕的文本信息的示例。然而，本技术不限于此，并且可以想象的是，使用具有等同于TTML的信息的其他文本信息。例如，可以使用TTML的派生格式。

此外，虽然上述实施例示出了发送-接收系统10包括广播发送系统100和电视接收机200的情况，但是本技术可以应用的发送-接收系统的配置不限于此。例如，允许具有包括机顶盒和显示器的配置，显示器与诸如用作电视接收机200的一部分的高清晰度多媒体接口(HDMI)等数字接口连接。注意，“HDMI”是注册商标。

此外，上述实施例示出了容器是MPEG-2TS的传输流的示例。毋庸置疑，本技术可以同样应用于容器是MMT的传输流、DASH/ISOBMFF流等的情况。

此外，也可以如下配置本技术。

(1)一种接收设备，包括：

接收单元，其接收包括包含视频数据的视频流和包含字幕信息的字幕流的预定格式的容器；

视频解码单元，其对视频流进行解码，以获得视频数据；以及

字幕解码单元，其对字幕流进行解码，以获得字幕位图数据；

其中，在包括在字幕信息内的字幕显示位置信息中，通过相对于字幕显示范围的相对位置指定字幕显示位置，

所述接收设备还包括：

显示控制单元，其在视频区域的纵横比与显示视频区域的纵横比不同的情况下，将显示视频区域定义为字幕显示范围并基于字幕显示位置信息来确定字幕显示位置，对所确定的字幕显示位置执行尺寸调整处理，并且基于已经经过尺寸调整处理的字幕显示位置，对字幕位图数据执行显示位置控制；以及

视频叠加单元，其在视频数据上叠加已经经过显示位置控制的字幕位图数据。

(2)根据(1)所述的接收设备，

其中，在通过字幕显示位置的尺寸调整处理来压缩垂直方向上的尺寸的情况下，所述显示位置控制单元在预定行位置固定的状态下执行压缩。

(3)根据(1)或(2)所述的接收设备，

其中，包含在字幕流中的字幕信息包括与尺寸调整处理相关的信息，并且

所述显示位置控制单元使用与尺寸调整处理相关的信息来对所确定的字幕显示位置执行尺寸调整处理。

(4)一种接收方法，包括：

由接收单元执行的接收步骤，用于接收包括包含视频数据的视频流和包含字幕信息的字幕流的预定格式的容器；

视频解码步骤，用于对视频流进行解码，以获得视频数据；以及

字幕解码步骤，用于对字幕流进行解码，以获得字幕位图数据；

所述接收方法还包括：

显示控制步骤，其在视频区域的纵横比与显示视频区域的纵横比不同的情况下执行，用于将显示视频区域定义为字幕显示范围并基于字幕显示位置信息来确定字幕显示位置，对所确定的字幕显示位置执行尺寸调整处理，并且基于已经经过尺寸调整处理的字幕显示位置，对字幕位图数据执行显示位置控制；以及

视频叠加步骤，用于在视频数据上叠加已经经过显示位置控制的字幕位图数据。

(5)一种接收设备，包括：

字幕解码单元，其对字幕流进行解码，以获得字幕的位图数据；

所述接收设备还包括：

显示控制单元，其在视频区域的纵横比与显示视频区域的纵横比不同的情况下，在显示视频区域中设置字幕显示范围，基于字幕显示位置信息来确定字幕显示位置，并且基于所确定的字幕显示位置，对字幕位图数据执行显示位置控制；以及

视频叠加单元，其在视频数据上叠加已经经过显示位置控制的字幕的位图数据。

(6)根据(5)所述的接收设备，

其中，包含在字幕流中的字幕信息包括指示字幕显示范围的信息，并且

所述显示位置控制单元使用指示字幕显示范围的信息在显示视频区域中设置字幕显示范围。

(7)根据(6)所述的接收设备，

其中，指示字幕显示范围的信息是字幕显示范围的基准点信息和纵横比信息或字幕显示范围的基准点信息。

(8)一种接收方法，包括：

由接收单元执行的接收步骤，用于接收包含包括视频数据的视频流和包括字幕信息的字幕流的预定格式的容器；

字幕解码步骤，用于对字幕流进行解码，以获得字幕的位图数据；

所述接收设备还包括：

显示控制步骤，其在视频区域的纵横比与显示视频区域的纵横比不同的情况下执行，用于在显示视频区域中设置字幕显示范围，基于字幕显示位置信息来确定字幕显示位置，并且基于所确定的字幕显示位置，对字幕位图数据执行显示位置控制；以及

视频叠加步骤，用于在视频数据上叠加已经经过显示位置控制的字幕的位图数据。

(9)一种发送设备，包括：发送单元，其传输包含包括视频数据的视频流和包括字幕信息的字幕流的预定格式的容器；

其中，通过相对于字幕显示范围的相对位置指定包括在字幕信息中的字幕显示位置信息中的字幕显示位置，并且

所述字幕信息包括：

与对基于字幕显示位置信息确定的字幕显示位置进行的尺寸调整处理相关的信息，在视频区域的纵横比与显示视频区域的纵横比的情况下在接收侧执行所述尺寸调整处理。

(10)根据(9)所述的发送设备，

其中，与尺寸调整处理相关的信息是指示在字幕显示位置的尺寸调整处理中压缩垂直方向上的尺寸的情况下要设置为固定位置的行位置的信息。

(11)一种发送设备，包括：

发送单元，其传输包含包括视频数据的视频流和包括字幕信息的字幕流的预定格式的容器；

所述字幕信息包括：

指示字幕显示范围的信息。

(12)根据(11)所述的发送设备，

本技术的主要特征包括在视频区域的纵横比与显示视频区域的纵横比不同的情况下通过以下步骤获得最终字幕显示位置的能力：进一步对基于字幕显示位置信息所确定的字幕显示位置执行尺寸调整处理，将显示视频区域定义为字幕显示范围；或者在显示视频区域中设置字幕显示范围；并基于字幕显示位置信息来确定字幕显示位置。利用该配置，在视频区域的纵横比与显示视频区域的纵横比不同的情况下，可以将原始形状保持作为字幕显示位置，使得能够令人满意地显示字幕，而不给观看者带来不舒服的感觉(参见图20)。

附图标记列表

10 发送-接收系统

100 广播传送系统

110 流生成单元

111 控制单元

112 视频编码器

113 音频编码器

114 文本格式转换器

115 字幕编码器

116 TS格式化器

200 电视接收机

201 接收单元

202 TS分析单元

203 视频解码器

204 视频叠加单元

205 面板驱动电路

206 显示面板

207 音频解码器

208 音频输出电路

209 扬声器

210 字幕解码器

221 CPU

Claims

1.一种接收设备，包括：

接收单元，接收包括含有视频数据的视频流和含有字幕信息的字幕流的容器，所述字幕信息包括通过相对于字幕显示范围的相对位置指定字幕显示位置的字幕显示位置信息；以及

控制单元，用于控制以下：视频解码处理，用于对所述视频流进行解码，以获得视频数据；字幕解码处理，用于对所述字幕流进行解码，以获得字幕的位图数据；显示位置控制处理，其在视频区域的纵横比与显示视频区域的纵横比不同的情况下执行，用于将所述显示视频区域定义为字幕显示范围并基于所述字幕显示位置信息来确定字幕显示位置，对所确定的字幕显示位置执行尺寸调整处理，并且基于已经经过了所述尺寸调整处理的字幕显示位置对字幕的位图数据执行显示位置控制；以及视频叠加处理，用于在所述视频数据上叠加已经经过所述显示位置控制的字幕的位图数据。

2.根据权利要求1所述的接收设备，

其中，在所述显示位置控制处理中，在通过字幕显示位置的尺寸调整处理来压缩垂直方向上的尺寸时，在预定行位置固定的状态下执行所述压缩。

3.根据权利要求1所述的接收设备，

其中，包含在所述字幕流中的所述字幕信息包括与所述尺寸调整处理相关的信息，并且

在所述显示位置控制处理中，使用与所述尺寸调整处理相关的信息来对所确定的字幕显示位置执行尺寸调整处理。

4.一种接收方法，包括：

由接收单元执行的接收步骤，用于接收包括包含视频数据的视频流和包含字幕信息的字幕流的容器，所述字幕信息包括通过相对于字幕显示范围的相对位置指定字幕显示位置的字幕显示位置信息；

以及

由控制单元执行的控制步骤，用于控制以下：视频解码处理，用于对所述视频流进行解码，以获得视频数据；字幕解码处理，用于对所述字幕流进行解码，以获得字幕的位图数据；显示位置控制处理，其在视频区域的纵横比与显示视频区域的纵横比不同的情况下执行，用于将显示视频区域定义为字幕显示范围并基于字幕显示位置信息来确定字幕显示位置，对所确定的字幕显示位置执行尺寸调整处理，并且基于已经经过所述尺寸调整处理的字幕显示位置，对字幕的位图数据执行显示位置控制；以及视频叠加处理，用于在视频数据上叠加已经经过所述显示位置控制的字幕的位图数据。

5.一种接收设备，包括：

接收单元，其接收包含包括视频数据的视频流和包括字幕信息的字幕流的容器，所述字幕信息包括通过相对于字幕显示范围的相对位置指定字幕显示位置的字幕显示位置信息；以及

控制单元，其控制：视频解码处理，用于对视频流进行解码，以获得视频数据；字幕解码处理，用于对字幕流进行解码，以获得字幕的位图数据；显示位置控制处理，其在视频区域的纵横比与显示视频区域的纵横比不同的情况下执行，用于在所述显示视频区域中设置字幕显示范围，基于字幕显示位置信息来确定字幕显示位置，并且基于所确定的字幕显示位置，对字幕的位图数据执行显示位置控制；以及视频叠加处理，用于在所述视频数据上叠加已经经过所述显示位置控制的字幕的位图数据。

6.根据权利要求5所述的接收设备，

其中，包含在字幕流中的字幕信息包括指示所述字幕显示范围的信息，并且

在所述显示位置控制处理中，使用指示所述字幕显示范围的信息在所述显示视频区域中设置所述字幕显示范围。

7.根据权利要求6所述的接收设备，

其中，指示所述字幕显示范围的信息是所述字幕显示范围的基准点信息和纵横比信息或所述字幕显示范围的基准点信息。

8.一种接收方法，包括：

以及

由控制单元执行的控制步骤，用于控制以下：视频解码处理，用于对视频流进行解码，以获得视频数据；字幕解码处理，用于对字幕流进行解码，以获得字幕的位图数据；显示位置控制处理，其在视频区域的纵横比与显示视频区域的纵横比不同的情况下执行，用于在显示视频区域中设置字幕显示范围，基于字幕显示位置信息来确定字幕显示位置，并且基于所确定的字幕显示位置对字幕的位图数据执行显示位置控制；以及视频叠加处理，用于在视频数据上叠加已经经过所述显示位置控制的字幕的位图数据。

9.一种发送设备，包括：

其中，在包含在字幕信息中的字幕显示位置信息中，通过相对于字幕显示范围的相对位置指定字幕显示位置，并且

所述字幕信息包括与对基于所述字幕显示位置信息确定的字幕显示位置进行的尺寸调整处理相关的信息，其中，在视频区域的纵横比与显示视频区域的纵横比不同的情况下在接收侧执行所述尺寸调整处理。

10.根据权利要求9所述的发送设备，

其中，与所述尺寸调整处理相关的信息是指示在字幕显示位置的尺寸调整处理中压缩垂直方向上的尺寸的情况下要被设置为固定位置的行位置的信息。

11.一种发送设备，包括：

其中，在包含在所述字幕信息中的字幕显示位置信息中，通过相对于字幕显示范围的相对位置指定字幕显示位置，并且

所述字幕信息包括指示所述字幕显示范围的信息。

12.根据权利要求11所述的发送设备，