ES2859660T3

ES2859660T3 - Dispositivo de transmisión, procedimiento de transmisión, dispositivo de recepción y procedimiento de recepción

Info

Publication number: ES2859660T3
Application number: ES17766483T
Authority: ES
Inventors: Ikuo Tsukagoshi
Original assignee: Sony Group Corp
Current assignee: Sony Group Corp
Priority date: 2016-03-15
Filing date: 2017-03-08
Publication date: 2021-10-04
Anticipated expiration: 2037-03-08
Also published as: US10979664B2; EP3734978A1; EP3432585B1; TW201739241A; TWI728061B; WO2017159482A1; EP3432585A1; JPWO2017159482A1; US20190037168A1; JP7063261B2; CN108886627A; CN108886627B; EP3432585A4

Abstract

Un dispositivo de transmisión, que comprende: una unidad de transmisión que transmite un contenedor de un formato predeterminado, donde el contenedor incluye un flujo de vídeo que incluye datos de vídeo y un flujo de subtítulos que incluye información de texto de un subtítulo, donde la información de texto incluye información de posición de visualización de subtítulos para especificar una posición de visualización de subtítulos como una posición relativa con respecto a un intervalo de visualización de subtítulos, donde el intervalo de visualización de subtítulos es un área establecida en un área de vídeo de visualización para mostrar el subtítulo, y el área de vídeo de visualización es un área de vídeo mostrada en un monitor en un lado de recepción; y una unidad de inserción de información (116) que inserta, en un contenedor del flujo de subtítulos, información auxiliar que se utilizará cuando se muestre el subtítulo mediante el uso de la información de posición de visualización de subtítulos, donde la información auxiliar incluye información para determinar el intervalo de visualización de subtítulos.

Description

DESCRIPCIÓN

Dispositivo de transmisión, procedimiento de transmisión, dispositivo de recepción y procedimiento de recepción CAMPO TÉCNICO

La presente tecnología se refiere a un dispositivo de transmisión, un procedimiento de transmisión, un dispositivo de recepción y un procedimiento de recepción y, en particular, se refiere a un dispositivo de transmisión, y similar, que transmite información de texto de un subtítulo junto con datos de vídeo.

TÉCNICA ANTERIOR

Convencionalmente, por ejemplo, en la radiodifusión de vídeo digital (DVB) y similares, se realiza la operación de transmitir información de subtítulos como datos de mapa de bits. Recientemente, se ha diseñado la transmisión de información de subtítulos como códigos de caracteres de texto, es decir, transmisión basada en texto. Como información de texto, por ejemplo, el lenguaje de marcado de texto temporizado (TTML) ha sido promovido por el Consorcio World Wide Web (W3C) (véase el documento de patente 1).

Convencionalmente, se ha sabido que una posición de visualización de subtítulos en la información de posición de visualización de subtítulos incluida en la información de texto de un subtítulo se especifica, por ejemplo, como una posición relativa con respecto a un área de vídeo. En este caso, en un caso en el que una relación de aspecto del área de vídeo no coincide con una relación de aspecto de un área de visualización, una parte del subtítulo a veces sobresale del área de visualización y no se muestra dependiendo de un procedimiento de visualización. Además, convencionalmente, se sabe que la información de texto del subtítulo se transmite incluyendo información de especificación de fuente.

El documento de la Organización DVB, "TM-SUB0082r1_sony-proposal-to-root-container-region.pdf", 31 de octubre de 2015, revela que si las relaciones de aspecto del vídeo y la pantalla son diferentes, el subtítulo debe situarse de manera proporcional a la pantalla si el área de visualización es menor que el vídeo y de manera proporcional al vídeo si el área de visualización es mayor que el vídeo. Para cubrir ambos casos, propone el concepto de "vídeo para mostrar". Revela que la posición del subtítulo se especifica con respecto al "vídeo para mostrar". El vídeo para mostrar es el vídeo que se muestra en la pantalla.

El documento de la Organización DVB, "TM-SUB0094_Subtitle-Editorial-Area-proposal.pdf", 16 de diciembre de 2015, revela que un área se indica dentro de la región contenedora raíz donde se encuentran los subtítulos. Revela que el "área de edición de subtítulos" se define por los entes de radiodifusión e indica el subconjunto de la región contenedora raíz donde se encuentran los subtítulos. D2 revela que SEA proporciona a los receptores información para ayudarles a saber cuánto pueden recortar vídeo sin peligro de recortar subtítulos cuando los subtítulos se colocan como dispuso el ente de radiodifusión con respecto al vídeo.

LISTA DE CITAS DOCUMENTO DE PATENTE

Documento de patente 1: Solicitud de patente japonesa abierta a inspección pública n.° 2012-169885 RESUMEN DE LA INVENCIÓN PROBLEMAS A RESOLVER POR LA INVENCIÓN

Para evitar que una parte del subtítulo sobresalga del área de visualización y no se muestre como se describió anteriormente, por ejemplo, es concebible realizar un procesamiento, en el lado de recepción, no como una posición relativa con respecto al área de vídeo, sino como una posición relativa con respecto a un área de vídeo (área de vídeo de visualización) mostrada en un monitor (dispositivo de visualización). A este respecto, en un caso en el que la relación de aspecto del área de vídeo es diferente de una relación de aspecto del área de vídeo de visualización, por ejemplo, la posición de visualización de subtítulos se comprime solo en la dirección horizontal y existe la posibilidad de que la visualización de subtítulos se realice dando a un espectador una sensación de incomodidad. Además, en un caso en el que la información de texto del subtítulo se transmite incluyendo la información de especificación de fuente como se describió anteriormente, en un caso en el que un archivo de una fuente especificada no se monta en el lado de recepción, la visualización de subtítulos no es posible con la fuente especificada y existe la posibilidad de que la visualización de subtítulos no se realice como dispuso un creador.

Un objetivo de la presente tecnología es hacer posible realizar satisfactoriamente una visualización de subtítulos en el lado de recepción.

SOLUCIONES A LOS PROBLEMAS

La invención se define mediante las reivindicaciones independientes 1 y 11.

EFECTOS DE LA INVENCIÓN

De acuerdo con la presente tecnología, se hace posible realizar satisfactoriamente una visualización de subtítulos en el lado de recepción. Cabe señalar que los efectos ventajosos descritos en esta memoria descriptiva son meramente ejemplos, y los efectos ventajosos de la presente tecnología no se limitan a los mismos y pueden incluir efectos adicionales.

BREVE DESCRIPCIÓN DE LOS DIBUJOS

La Fig. 1 es un diagrama de bloques que ilustra una configuración de ejemplo de un sistema de transmisión/recepción como una forma de realización.

La Fig. 2 es un diagrama que ilustra un ejemplo de una posición (región) de visualización de subtítulos determinada por información de posición de visualización de subtítulos.

La Fig. 3 es un diagrama que ilustra una estructura de ejemplo de TTML (una posición de visualización de subtítulos). La Fig. 4 es un diagrama que ilustra detalles de información principal en una estructura TTML.

La Fig. 5 es un diagrama que ilustra una estructura de ejemplo del TTML (dos posiciones de visualización de subtítulos).

La Fig. 6 es un diagrama que ilustra un ejemplo de visualización (una posición de visualización de subtítulos) de un subtítulo en un caso en el que una relación de aspecto de un área de vídeo es la misma que una relación de aspecto de un área de vídeo de visualización.

La Fig. 7 es un diagrama que ilustra un ejemplo de visualización (dos posiciones de visualización de subtítulos) de subtítulos en el caso en el que la relación de aspecto del área de vídeo es la misma que la relación de aspecto del área de vídeo de visualización.

La Figura 8 es un diagrama que ilustra un ejemplo de visualización del subtítulo (una posición de visualización de subtítulos) en un caso en el que la relación de aspecto del área de vídeo es diferente de la relación de aspecto del área de vídeo de visualización, el área de vídeo de visualización se establece como un intervalo de visualización de subtítulos y la posición de visualización de subtítulos se determina en función de la información de posición de visualización de subtítulos (un primer procedimiento).

La Fig. 9 es un diagrama que ilustra un ejemplo de visualización en un caso en el que se realiza un procesamiento de redimensionamiento.

La Fig. 10 es un diagrama que ilustra un ejemplo de visualización de los subtítulos (dos posiciones de visualización de subtítulos) en un caso en el que la relación de aspecto del área de vídeo es diferente de la relación de aspecto del área de vídeo de visualización, el área de vídeo de visualización se establece como el intervalo de visualización de subtítulos y la posición de visualización de subtítulos se determina en función de la información de posición de visualización de subtítulos y, además, se realiza el procesamiento de redimensionamiento (el primer procedimiento). La Figura 11 es un diagrama que ilustra un ejemplo de visualización del subtítulo (una posición de visualización de subtítulos) en un caso en el que la relación de aspecto del área de vídeo es diferente de la relación de aspecto del área de vídeo de visualización, el intervalo de visualización de subtítulos se establece en el área de vídeo de visualización y la posición de visualización de subtítulos se determina sobre la base de la información de posición de visualización de subtítulos (un segundo procedimiento).

La Figura 12 es un diagrama que ilustra un ejemplo de visualización de los subtítulos (dos posiciones de visualización de subtítulos) en un caso en el que la relación de aspecto del área de vídeo es diferente de la relación de aspecto del área de vídeo de visualización, el intervalo de visualización de subtítulos se establece en el área de vídeo de visualización y la posición de visualización de subtítulos se determina en función de la información de posición de visualización de subtítulos (un segundo procedimiento).

La Fig. 13 es un diagrama de bloques que ilustra una configuración de ejemplo de una unidad de generación de flujo de un sistema de transmisión de transmisión.

La Fig. 14 es un diagrama que ilustra una estructura de ejemplo de un paquete PES de subtítulos y una estructura de ejemplo de "PES_data_byte_field()".

La Fig. 15 es un diagrama que ilustra un ejemplo de una definición de un tipo de segmento.

La Fig. 16 es un diagrama que ilustra una estructura de ejemplo de un segmento de visualización de TTML.

La Fig. 17 es un diagrama que ilustra detalles de información principal en la estructura de ejemplo del segmento de visualización TTML.

La Fig. 18 es un diagrama que ilustra una estructura de ejemplo de un segmento de descarga de fuentes.

La Fig. 19 es un diagrama que ilustra detalles de información principal en la estructura de ejemplo del segmento de descarga de fuentes.

La Fig. 20 es un diagrama que ilustra una estructura de ejemplo de un segmento de señalización de URL.

La Fig. 21 es un diagrama que ilustra detalles de información principal en la estructura de ejemplo del segmento de señalización de URL.

La Fig. 22 es un diagrama que ilustra una estructura de ejemplo de un descriptor de visualización de TTML.

La Fig. 23 es un diagrama que ilustra una estructura de ejemplo de un descriptor de descarga de fuentes.

La Fig. 24 es un diagrama que ilustra una estructura de ejemplo de un descriptor de descarga de fuentes.

La Fig. 25 es un diagrama que ilustra un esquema de un caso (Caso 1) en el que un archivo de una fuente especificada por información de especificación de fuente del TTML se adquiere de un flujo de transporte TS (señal de radiodifusión) y un caso (Caso 2) en el que el archivo se adquiere de un servidor en una red.

La Fig. 26 es un diagrama que ilustra esquemáticamente que una tabla de secciones que incluye una tabla de fuentes se transmite repetidamente por un carrusel de datos además de N tablas de secciones que incluyen cada una un archivo de fuentes.

La Fig. 27 es un diagrama que ilustra una estructura de ejemplo de una tabla de secciones de descarga de fuentes.

La Fig. 28 es un diagrama que ilustra detalles de información principal en la estructura de ejemplo de la tabla de secciones de descarga de fuentes.

La Fig. 29 es un diagrama que ilustra esquemáticamente la información de tabla de fuentes descrita en la tabla de secciones de descarga de fuentes cuando "data_downloading_id" es "0x00".

La Fig. 30 es un diagrama que ilustra una correspondencia entre un valor de "font_group_id" y un grupo de fuentes.

La Fig. 31 es un diagrama que ilustra una estructura de ejemplo de un descriptor de tabla de fuentes.

La Fig. 32 es un diagrama que ilustra esquemáticamente la información de tabla de fuentes descrita en la tabla de secciones de descarga de fuentes cuando "data_downloading_id" es diferente de "0x00".

La Fig. 33 es un diagrama que ilustra una estructura de ejemplo de un descriptor de archivo de fuentes.

La Fig. 34 es un diagrama que ilustra una configuración de ejemplo del flujo de transporte TS.

La Fig. 35 es un diagrama de bloques que ilustra una configuración de ejemplo de un receptor de televisión.

La Fig. 36 es un diagrama de flujo que ilustra un ejemplo de un procedimiento de determinación y procesamiento de redimensionamiento de la posición de visualización de subtítulos en una CPU del receptor de televisión.

La Fig. 37 es un diagrama de un ejemplo de la relación de aspecto del área de vídeo y una relación de aspecto de un monitor (dispositivo de visualización) y que explica un ejemplo para determinar si un modo es o no para visualizar toda el área de vídeo.

La Fig. 38 es un diagrama para explicar la determinación de la posición de visualización de subtítulos en el modo para visualizar toda el área de vídeo y en un caso en el que no se especifica el intervalo de visualización de subtítulos.

La Fig. 39 es un diagrama para explicar la determinación de la posición de visualización de subtítulos en el modo para visualizar toda el área de vídeo y en un caso en el que se especifica el intervalo de visualización de subtítulos.

La Fig. 40 es un diagrama para explicar la determinación de la posición de visualización de subtítulos en un modo para no visualizar toda el área de vídeo y en un caso en el que no se especifica el intervalo de visualización de subtítulos y en un caso en el que se especifica el intervalo de visualización de subtítulos.

La Fig. 41 es un diagrama de flujo que ilustra un ejemplo de un procedimiento de procesamiento de determinación de un archivo de fuentes que se utilizará en la CPU del receptor de televisión.

La Fig. 42 es un diagrama que ilustra una estructura de ejemplo del TTML (dos posiciones de visualización de subtítulos).

MODO DE LLEVAR A CABO LA INVENCIÓN

A continuación se describe un modo de llevar a cabo la invención (el modo se denominará en lo sucesivo "forma de realización"). Cabe destacar que la explicación se realizará en el siguiente orden.

1. Forma de realización

2. Modificaciones

<1. Forma de realización>

[Configuración de ejemplo del sistema de transmisión/recepción]

La Fig. 1 ilustra una configuración de ejemplo de un sistema de transmisión/recepción 10 como una forma de realización. El sistema de transmisión/recepción 10 está configurado por un sistema de transmisión mediante radiodifusión 100 y un receptor de televisión 200. El sistema de transmisión mediante radiodifusión 100 transmite un flujo de transporte de MPEG-2 TS (en lo sucesivo, simplemente denominado "flujo de transporte TS") como un contenedor (flujo multiplexado) en una onda de radiodifusión.

El flujo de transporte TS incluye un flujo de vídeo que incluye datos de vídeo y un flujo de subtítulos que incluye información de texto de un subtítulo. Aquí, como información de texto del subtítulo puede considerarse, por ejemplo, TTML, un formato derivado del TTML o similar; sin embargo, en la forma de realización, se supone que es el TTML. El TTML incluye información de posición de visualización de subtítulos, y la información de posición de visualización de subtítulos especifica una posición (región) de visualización de subtítulos como una posición relativa (valor proporcional) con respecto a un intervalo de visualización de subtítulos. Además, el TTML incluye información de especificación de fuente.

El sistema de transmisión mediante radiodifusión 100 inserta en el contenedor del TTML y/o el flujo de subtítulos información auxiliar que se utilizará cuando se muestre el subtítulo mediante el uso de la información de posición de visualización de subtítulos. En la forma de realización, el sistema de transmisión mediante radiodifusión 100 incluye la información auxiliar en el TTML y también inserta la información auxiliar en un paquete de flujo elemental empaquetado (PES) y una tabla de mapas de programas (PMT).

La información auxiliar incluye información con respecto al procesamiento de redimensionamiento de la posición de visualización de subtítulos determinada en función de la información de posición de visualización de subtítulos, donde el procesamiento de redimensionamiento se realiza en el lado de recepción en un caso en el que una relación de aspecto de un área de vídeo es diferente de una relación de aspecto de un área de vídeo de visualización. La información con respecto al procesamiento de redimensionamiento es, por ejemplo, información que indica una posición de línea que se establece como una posición fija en un caso en el que el tamaño en la dirección vertical se comprime en el procesamiento de redimensionamiento de la posición de visualización de subtítulos. Además, la información auxiliar incluye información para determinar el intervalo de visualización de subtítulos. Por ejemplo, la información para determinar el intervalo de visualización de subtítulos es información de punto de referencia e información de relación de aspecto del intervalo de visualización de subtítulos.

Además, el sistema de transmisión mediante radiodifusión 100 inserta en el contenedor del flujo de subtítulos información de descarga para descargar un archivo de una fuente especificada por al menos la información de especificación de fuente. La información de descarga es información para adquirir el archivo de fuentes a partir de una señal de radiodifusión (flujo de transporte TS), información para adquirir el archivo de fuentes desde un servidor en una red o similares. En la forma de realización, el sistema de transmisión mediante radiodifusión 100 inserta la información de descarga en el paquete de flujo elemental empaquetado (PES) y la tabla de mapas de programas (PMT).

Además, el sistema de transmisión mediante radiodifusión 100 inserta de forma secuencial y repetida un número predeterminado de tablas de secciones que incluyen, respectivamente, diferentes archivos de fuentes en el flujo de transporte TS como señal de radiodifusión. Es decir, el sistema de transmisión mediante radiodifusión 100 transmite repetidamente el número predeterminado de tablas de secciones mediante un carrusel de datos. Cabe destacar que el flujo de transporte TS en el que se insertan las tablas de secciones, cada una de las cuales incluye el archivo de fuentes, no es necesariamente el mismo que el flujo de transporte TS descrito anteriormente que incluye el flujo de subtítulos, y puede ser el flujo de transporte TS de otro servicio.

El receptor de televisión 200 recibe el flujo de transporte TS transmitido desde el sistema de transmisión mediante radiodifusión 100. El receptor de televisión 200 realiza un procesamiento de descodificación en el flujo de vídeo que incluye los datos de vídeo para obtener los datos de vídeo y realiza un procesamiento de descodificación en los flujos de subtítulos que incluyen el TTML como información de texto del subtítulo para obtener datos de mapa de bits del subtítulo.

El receptor de televisión 200 utiliza el archivo de la fuente especificada por la información de especificación de fuente incluida en el TTML al obtener los datos de mapa de bits del subtítulo. Como se describió anteriormente, la información de descarga para descargar el archivo de la fuente especificada por al menos la información de especificación de fuente se inserta en el paquete PES y la tabla de mapas de programas (PMT). Cuando el archivo de la fuente especificada por la información de especificación de fuente no está montado, el receptor de televisión 200 descarga y utiliza el archivo de fuentes basándose en la información de descarga.

Como se describió anteriormente, en la información de posición de visualización de subtítulos incluida en el TTML, la posición de visualización de subtítulos se especifica como la posición relativa con respecto al intervalo de visualización de subtítulos. Además, como se describió anteriormente, la información auxiliar que se utilizará cuando se muestre el subtítulo mediante el uso de la información de posición de visualización de subtítulos se incluye en el TTML y también se inserta en el paquete PES y la PMT.

El receptor de televisión 200 utiliza la información de posición de visualización de subtítulos y la información auxiliar para adquirir la posición de visualización de subtítulos y realiza un control de posición de visualización en los datos de mapa de bits del subtítulo en función de la posición de visualización de subtítulos adquirida. El receptor de televisión 200 superpone los datos de mapa de bits del subtítulo sometido al control de posición de visualización en los datos de vídeo para obtener los datos de vídeo para su visualización.

En un caso en el que la relación de aspecto del área de vídeo es diferente de la relación de aspecto del área de vídeo de visualización (el área de vídeo se muestra en un monitor), el receptor de televisión 200 realiza a continuación de forma selectiva un primer procedimiento o un segundo procedimiento como control de posición de visualización para los datos de mapa de bits del subtítulo.

En el primer procedimiento, en el caso en el que la relación de aspecto del área de vídeo es diferente de la relación de aspecto del área de vídeo de visualización, el receptor de televisión 200 establece el área de vídeo de visualización como el intervalo de visualización de subtítulos y determina la posición de visualización de subtítulos basándose en la información de posición de visualización de subtítulos y, a continuación, realiza un procesamiento de redimensionamiento en la posición de visualización de subtítulos determinada, para adquirir la posición de visualización de subtítulos final. El receptor de televisión 200 realiza un control de posición de visualización en los datos de mapa de bits del subtítulo en función de la posición de visualización de subtítulos adquirida de este modo.

El procesamiento de redimensionamiento es un procesamiento para restaurar una forma original como la posición de visualización de subtítulos y, por ejemplo, en un caso en el que la posición de visualización de subtítulos determinada solo está comprimida en la dirección horizontal, la compresión también se realiza en la dirección vertical con la misma proporción. Por ejemplo, en un caso en el que el tamaño en la dirección vertical se comprime en el procesamiento de redimensionamiento, la compresión se realiza en un estado en el que una posición de línea predeterminada se fija tal como una línea superior, una línea inferior o una línea central (línea intermedia).

Al seleccionarse adecuadamente la posición de línea predeterminada, por ejemplo, en un caso en el que hay dos posiciones de visualización de subtítulos, se hace posible mantener un intervalo en la dirección vertical entre las dos posiciones de visualización de subtítulos incluso si se realiza el procesamiento de redimensionamiento. Cuando la información que indica la posición de línea que se establecerá como la posición fija se inserta, como información con respecto al procesamiento de redimensionamiento, en el TTML, paquete PES, PMT o similar, el receptor de televisión 200 puede usar la información.

En el segundo procedimiento, en un caso en el que la relación de aspecto del área de vídeo es diferente de la relación de aspecto del área de vídeo de visualización, el receptor de televisión 200 establece el intervalo de visualización de subtítulos en el área de vídeo de visualización, determina la posición de visualización de subtítulos basándose en la información de posición de visualización de subtítulos y adquiere la posición de visualización de subtítulos final. El receptor de televisión 200 realiza un control de posición de visualización en los datos de mapa de bits del subtítulo en función de la posición de visualización de subtítulos adquirida de este modo.

Cuando la información se inserta para determinar el intervalo de visualización de subtítulos insertado en el TTML, paquete PES, PMT o similar, el receptor de televisión 200 puede usar la información para establecer adecuadamente el intervalo de visualización de subtítulos. Por ejemplo, el receptor de televisión 200 selecciona el segundo procedimiento cuando la información para determinar el intervalo de visualización de subtítulos está incluida en el TTML, paquete PES, PMT o similar, y selecciona el primer procedimiento cuando la información no está incluida.

La Fig. 2 ilustra un ejemplo de la posición (región) de visualización de subtítulos determinada por la información de posición de visualización de subtítulos. El ejemplo ilustra un caso en el que la información de posición de visualización de subtítulos se proporciona, en el TTML, como información ''origin='OH% OV%'"', que indica un origen de la posición de visualización de subtítulos, e información "extent=''EH% EV%"", que indica un área (extensión) de la posición de visualización de subtítulos. "RP" indica un punto de referencia, que es la parte superior izquierda del intervalo de visualización de subtítulos.

La Fig. 2(a) ilustra un ejemplo en un caso en el que la relación de aspecto del área de vídeo es la misma que la relación de aspecto del área de vídeo de visualización. En el ejemplo, la relación de aspecto del área de vídeo es 16:9, la relación de aspecto del monitor es 16:9 y la relación de aspecto del área de vídeo de visualización es 16:9. En este caso, el área de vídeo de visualización se establece como el intervalo de visualización de subtítulos y la posición de visualización de subtítulos se determina en función de la información de posición de visualización de subtítulos especificada como la posición relativa con respecto al intervalo de visualización de subtítulos.

La Fig. 2(b) es un ejemplo en un caso en el que la relación de aspecto del área de vídeo es diferente de la relación de aspecto del área de vídeo de visualización, el área de vídeo de visualización se establece como el intervalo de visualización de subtítulos y la posición de visualización de subtítulos se determina en función de la información de posición de visualización de subtítulos (el primer procedimiento). El ejemplo es un caso en el que la relación de aspecto del área de vídeo es 16:9, la relación de aspecto del monitor es 4:3, el procedimiento de visualización es de corte central y la relación de aspecto del área de vídeo de visualización es 4:3. En este caso, en comparación con el caso de la Fig. 2(a), la posición de visualización de subtítulos tiene el mismo ancho en la dirección vertical, pero su ancho se comprime en la dirección horizontal. En este caso, la forma de la posición de visualización de subtítulos es diferente del caso de la Fig. 2(a).

La Fig. 2(c) es un ejemplo en un caso en el que la relación de aspecto del área de vídeo es diferente de la relación de aspecto del área de vídeo de visualización, el intervalo de visualización de subtítulos se establece en el área de vídeo de visualización y la posición de visualización de subtítulos se determina en función de la información de posición de visualización de subtítulos un segundo procedimiento). El ejemplo es un caso en el que la relación de aspecto del área de vídeo es 16:9, la relación de aspecto del monitor es 4:3, el procedimiento de visualización es de corte central y la relación de aspecto del área de vídeo de visualización es 4:3. En este caso, en comparación con el caso de la Fig. 2(a), el ancho de la posición de visualización de subtítulos se comprime tanto en la dirección vertical como en la dirección horizontal. En caso de que la relación de aspecto del intervalo de visualización de subtítulos establecido sea 16:9, la forma de la posición de visualización de subtítulos es igual que en el caso de la Fig. 2(a).

La Fig. 3 ilustra un ejemplo de una estructura TTML. El ejemplo es un caso en el que hay una posición (región) de visualización de subtítulos. El TTML se describe básicamente en XML. En el contenedor raíz tt se define un idioma y un espacio de nombres. El espacio de nombres se define como un nombre de elemento único que se puede identificar de forma única en todos los elementos de un sistema o un sistema estándar. Además, en <tt>, "tts:extent" declara primero un área objetivo del 100% de un vídeo como un origen de un objetivo de la información de posición de subtítulos, y "fullvideo" indica el vídeo completo de una resolución de 3840 (H) x 2160 (V) en un caso en el que un vídeo 4K es el objetivo, e indica el vídeo completo de una resolución de 1920 (H) x 1080 (V) en un caso en el que un vídeo 2K (Full HD) es el objetivo.

"xmlns=http://www.w3.org/ns/ttml", "xmlns:ttp=http://www.w3.org/ns/ttml#parameter" y "xmlns:tts=http://www.w3.org/ns/ttml#styling" son espacios de nombres tales como un parámetro, estilo y similares que se protegen como clasificaciones de atributo del TTML en W3C de antemano, aunque se omiten descripciones detalladas.

"xmlns:dto=http://www.example.org/ns/displaytextove rlay" es un espacio de nombres recientemente definido. El espacio de nombres es para insertar información en el intervalo de visualización de subtítulos. A continuación, "dto:dispasp="16:9"" y "dto:RPoffset="Ax%, By%"" indican la información en el intervalo de visualización de subtítulos.

"dto:dispasp="16:9"" indica la información de relación de aspecto del intervalo de visualización de subtítulos e indica que el intervalo de visualización de subtítulos es un área de la relación de aspecto de 16:9. En el ejemplo ilustrado, se ilustra que la relación de aspecto del intervalo de visualización de subtítulos es 16:9; sin embargo, como relación de aspecto del intervalo de visualización de subtítulos, también es posible especificar 4:3, 21:9, o similares, tal como se ilustra en la Fig. 4. "dto:RPoffset="Ax%, By%"" indica la información del punto de referencia del intervalo de visualización de subtítulos y, como se ilustra en la Fig. 4, una posición del punto de referencia (RP) del intervalo de visualización de subtítulos de cuando cada intervalo horizontal y vertical del área de vídeo de visualización se establece en el 100% se indica como una relación de un desplazamiento desde la parte superior izquierda del área de vídeo de visualización.

La cabecera incluye un elemento de diseño. El ID de región se indica mediante "r1" y, como la información de posición de visualización de subtítulos, el origen de la posición de visualización de subtítulos y el área (extensión) se indican como posiciones relativas. Es decir, "origin="OH% OV%"" indica el origen de la posición de visualización de subtítulos e indica que el origen está en OH desde la izquierda y OV% desde la parte superior. Además, "extent="EH% EV%"" indica el área de la posición de visualización de subtítulos e indica que el ancho horizontal es EH% y el ancho vertical es EV%.

Además, la cabecera incluye un elemento de estilo. "fontFamily="proportionalSansSerif"" es la información de especificación de fuente. Aquí, "proportionalSansSerif" indica una familia genérica (nombre genérico) de la fuente.

En el cuerpo, el ID de XML se indica mediante "p1", el ID de región se indica mediante "r1", se realiza una especificación de fuente y se describen datos de texto del subtítulo. Aquí, los datos de texto se establecen como "ABCDE". "Font-family: 'Arial', 'Tahoma', sans-serif" es la información de especificación de fuente que especifica la fuente del elemento p. Aquí, "Arial" y "Tahoma" indican nombres de fuente individuales y "sans-serif" indica una familia genérica (nombre genérico) de la fuente.

"dto:scalingjustify=top" constituye información con respecto al procesamiento de redimensionamiento e indica la posición de línea que se establecerá como la posición fija en el caso en el que el tamaño en la dirección vertical se comprime mediante el procesamiento de redimensionamiento de la posición de visualización de subtítulos. En el ejemplo ilustrado, se ilustra que la posición de línea que se establecerá como la posición fija es la línea superior; sin embargo, también es posible especificar la línea inferior, la línea central (línea intermedia) o similares, como se ilustra en la Fig. 4.

La Fig. 5 también ilustra un ejemplo de la estructura TTML. El ejemplo es un caso en el que hay dos posiciones (regiones) de visualización de subtítulos. El contenedor raíz tt es el mismo que el de la Fig. 3, de modo que se omitirá su descripción.

La cabecera incluye un elemento de diseño. El ID de región de una primera posición de visualización de subtítulos se indica mediante "r1" y, como la información de posición de visualización de subtítulos, el origen de la posición de visualización de subtítulos y el área (extensión) se indican como posiciones relativas. Es decir, "origin="OH1% OV1%"" indica que el origen está en OH1% desde la izquierda y OV1% desde la parte superior. Además, "extent="EH1% EV1%"indica que el ancho horizontal del área es EH1% y el ancho vertical del área es EV1%.

Además, el ID de región de una segunda posición de visualización de subtítulos se indica mediante "r2" y, como la información de posición de visualización de subtítulos, el origen de la posición de visualización de subtítulos y el área (extensión) se indican como posiciones relativas. Es decir, "origin="OH2% OV2%"" indica que el origen está en OH2% desde la izquierda y OV2% desde la parte superior. Además, "extent="EH2% EV2%"indica que el ancho horizontal del área es EH2% y el ancho vertical del área es EV2%.

Además, la cabecera incluye un elemento de estilo. "fontFamily=" proportionalSansSerif"" es la información de especificación de fuente. Aquí, "proportionalSansSerif" indica una familia genérica (nombre genérico) de la fuente.

En el cuerpo, en asociación con la primera posición de subtítulo, el ID de XML se indica mediante "p1", el ID de región se indica mediante "r1", se realiza una especificación de fuente y se describen datos de texto del subtítulo. Aquí, los datos de texto se establecen como "ABCDE". "Font-family: 'Arial', 'Tahoma', sans-serif" es la información de especificación de fuente que especifica la fuente del elemento p. Aquí, "Arial" y "Tahoma" indican nombres de fuente individuales y "sans-serif" indica una familia genérica (nombre genérico) de la fuente.

“dto:scalingjustify=bottom" constituye información con respecto al procesamiento de redimensionamiento e indica la posición de línea que se establecerá como la posición fija en el caso en el que el tamaño en la dirección vertical se comprime mediante el procesamiento de redimensionamiento de la posición de visualización de subtítulos. En el ejemplo ilustrado, se ilustra que la posición de línea que se establecerá como la posición fija es la línea inferior.

Además, en el cuerpo, en asociación con la segunda posición de subtítulo, el ID de XML se indica mediante "p2", el ID de región se indica mediante "r2" y se describen datos de texto del subtítulo. Aquí, los datos de texto se establecen como "FGH". "font-family="monospaceSerif"" es la información de especificación de fuente que especifica la fuente del elemento p. Aquí, "monospaceSerif" indica una familia genérica (nombre genérico) de la fuente.

(0055)"dto:scalingjustify=top" constituye información con respecto al procesamiento de redimensionamiento e indica la posición de línea que se establecerá como la posición fija en el caso en el que el tamaño en la dirección vertical se comprime mediante el procesamiento de redimensionamiento de la posición de visualización de subtítulos. En el ejemplo ilustrado, se ilustra que la posición de línea que se establecerá como la posición fija es la línea superior.

La Fig. 6 ilustra un ejemplo de visualización del subtítulo en un caso en el que la relación de aspecto del área de vídeo es la misma que la relación de aspecto del área de vídeo de visualización (el área de vídeo mostrada en el monitor). El ejemplo ilustrado es un caso en el que la relación de aspecto del área de vídeo es 16:9 y la relación de aspecto del monitor es también 16:9, y la estructura TTML es como la ilustrada en la Fig. 3 (una posición de visualización de subtítulos).

En el ejemplo ilustrado, el área de vídeo se indica mediante el marco de línea discontinua y el área de monitor se indica mediante el marco de línea continua. En este caso, tal como se indica mediante el marco de línea de cadena con puntos, el área de vídeo de visualización se establece como el intervalo de visualización de subtítulos, y la posición (región) de visualización de subtítulos se determina en función de la información de posición de visualización de subtítulos (''origin=''OH% OV%'"', ''extent=''EH% EV%'"') especificada como las posiciones relativas con respecto al intervalo de visualización de subtítulos. ''RP'' indica un punto de referencia, que es la parte superior izquierda del intervalo de visualización de subtítulos.

El subtítulo ''ABCDE'' por los datos de texto se muestra en la posición de visualización de subtítulos determinada de este modo. Cabe destacar que, en el ejemplo ilustrado, los marcos que indican el área de vídeo, el área de monitor y el intervalo de visualización de subtítulos se muestran desplazados entre sí, pero este es un procedimiento para visualizar claramente cada uno de los marcos y, en realidad, los marcos se superponen entre sí. Aunque se omite la descripción, se realiza una visualización similar en las siguientes figuras.

La Fig. 7 también ilustra un ejemplo de visualización del subtítulo en el caso en el que la relación de aspecto del área de vídeo es la misma que la relación de aspecto del área de vídeo de visualización (el área de vídeo mostrada en el monitor). El ejemplo ilustrado es un caso en el que la relación de aspecto del área de vídeo es 16:9 y la relación de aspecto del monitor es también 16:9, y la estructura TTML es como la ilustrada en la Fig. 5 (dos posiciones de visualización de subtítulos).

En el ejemplo ilustrado, el área de vídeo se indica mediante el marco de línea discontinua y el área de monitor se indica mediante el marco de línea continua. En este caso, tal como se indica mediante el marco de línea de cadena con puntos, el área de vídeo de visualización se establece como el intervalo de visualización de subtítulos, y la primera y segunda posiciones (regiones) de visualización de subtítulos se determinan en función de la información de posición de visualización de subtítulos (''orig¡n=''OH1% OV1%'"', ''extent=''EH1% EV1%'"', ''origin=''OH2% Ov 2%'"', ''extent=''EH2% EV2%'"') especificada como las posiciones relativas con respecto al intervalo de visualización de subtítulos.

A continuación, el subtítulo ''ABCDE'' por los datos de texto se muestra en la primera posición de visualización de subtítulos (primera región), y el subtítulo ''FGH'' por los datos de texto se muestra en la segunda posición de visualización de subtítulos (segunda región). En este caso, el intervalo entre las dos posiciones (regiones) de visualización de subtítulos es, por ejemplo, 10 líneas.

La Fig. 8 ilustra un ejemplo de visualización del subtítulo en un caso en el que la relación de aspecto del área de vídeo es diferente de la relación de aspecto del área de vídeo de visualización (el área de vídeo mostrada en el monitor), el área de vídeo de visualización se establece como el intervalo de visualización de subtítulos y la posición de visualización de subtítulos se determina en función de la información de posición de visualización de subtítulos (el primer procedimiento). El ejemplo ilustrado es un caso en el que la relación de aspecto del área de vídeo es 16:9 y la relación de aspecto del monitor es 4:3, y la estructura TTML es como la ilustrada en la Fig. 3 (una posición de visualización de subtítulos).

En el ejemplo ilustrado, el área de vídeo se indica mediante el marco de línea discontinua y el área de monitor se indica mediante el marco de línea continua. En este caso, tal como se indica mediante el marco de línea de cadena con puntos, el área de vídeo de visualización se establece como el intervalo de visualización de subtítulos, y la posición (región) de visualización de subtítulos se determina en función de la información de posición de visualización de subtítulos (''origin=''OH% OV%'"', ''extent=''EH% EV%'"') especificada como las posiciones relativas con respecto al intervalo de visualización de subtítulos. A continuación, el subtítulo ''ABCDE'' por los datos de texto se muestra en la posición de visualización de subtítulos.

En este caso, en comparación con el caso de la Fig. 6, la posición de visualización de subtítulos tiene el mismo ancho en la dirección vertical, pero su ancho se comprime en la dirección horizontal. En este caso, a medida que se comprime el ancho de la posición de visualización de subtítulos, el tamaño de fuente del subtítulo también se ajusta a un tamaño más pequeño. El tamaño de fuente del subtítulo se ajusta de esta manera, mediante lo cual la relación se encuentra en un estado coincidente entre la posición de visualización de subtítulos y el subtítulo mostrado en la posición de visualización de subtítulos, en la dirección horizontal, como se ilustra en la figura; sin embargo, la relación se encuentra en un estado no coincidente entre la posición de visualización de subtítulos y el subtítulo mostrado en la posición de visualización de subtítulos, en la dirección vertical en la que el ancho de la posición de visualización de subtítulos no se comprime. En este caso, un espectador tiene la sensación de que el área negra en la posición de visualización de subtítulos flota.

En vista de lo anterior, en el primer procedimiento, como se describió anteriormente, el procesamiento de redimensionamiento se realiza en la posición de visualización de subtítulos determinada y la relación se hace en un estado coincidente entre la posición de visualización de subtítulos y el subtítulo mostrado en la posición de visualización de subtítulos, no solo en la dirección horizontal sino también en la dirección vertical. La Fig. 9 ilustra un ejemplo de visualización en un caso en el que se realiza un procesamiento de redimensionamiento. En este caso, al determinarse en función de la información de posición de visualización de subtítulos ("origin="OH% OV%"", ""extent="EH% EV%"") mediante el procesamiento de redimensionamiento, la posición de visualización de subtítulos comprimida solo en la dirección horizontal también se comprime en la misma proporción en la dirección vertical. En este caso, como resultado, la posición de visualización de subtítulos se determina mediante la información de posición de visualización de subtítulos ("origin="OH% OV%"", "extent="EH% EVu%""). En este caso, EVu = 3/4 * EV.

En un caso en el que el procesamiento de redimensionamiento se realiza de esta manera, la compresión del ancho en la dirección vertical se realiza en un estado en el que la posición de línea predeterminada es fija. El ejemplo ilustrado es un caso en el que la posición de línea predeterminada se establece como la línea superior en función de la información de "dto:scalingjustify=top" incluida en el TTML. Cabe destacar que, en el ejemplo ilustrado, el marco de línea discontinua indica la posición de visualización de subtítulos antes de que se realice la compresión del ancho en la dirección vertical.

La Fig. 10 también ilustra un ejemplo de visualización de los subtítulos en un caso en el que la relación de aspecto del área de vídeo es diferente de la relación de aspecto del área de vídeo de visualización (el área de vídeo mostrada en el monitor), el área de vídeo de visualización se establece como el intervalo de visualización de subtítulos y la posición de visualización de subtítulos se determina en función de la información de posición de visualización de subtítulos (el primer procedimiento). El ejemplo ilustrado es un ejemplo de visualización en un caso en el que la relación de aspecto del área de vídeo es 16:9 y la relación de aspecto del monitor es 4:3, y la estructura TTML es como la ilustrada en la Fig. 5 (dos posiciones de visualización de subtítulos), y se realiza el procesamiento de redimensionamiento.

En el ejemplo ilustrado, el área de vídeo se indica mediante el marco de línea discontinua y el área de monitor se indica mediante el marco de línea continua. En este caso, tal como se indica mediante el marco de línea de cadena con puntos, el área de vídeo de visualización se establece como el intervalo de visualización de subtítulos, y la primera y segunda posiciones (regiones) de visualización de subtítulos se determinan en función de la información de posición de visualización de subtítulos ("origin="OH1% OV1%"", "extent="EH1% EV1%"", "origin="OH2% OV2%"", "extent="EH2% EV2%"") especificada como las posiciones relativas con respecto al intervalo de visualización de subtítulos y, a continuación, se realiza el procesamiento de redimensionamiento.

En este caso, la primera posición de visualización de subtítulos (primera región) se determina mediante la información de posición de visualización de subtítulos ("origin="OH1% OV1%"", "extent= "EH1% EV1u%""), como resultado. En este caso, EVlu = 3/4 * EV1. De manera similar, en este caso, la segunda posición de visualización de subtítulos (segunda región) se determina mediante la información de posición de visualización de subtítulos ("origin="OH2% OV2%"," extent= "EH2% EV2u%" "), como resultado. En este caso, EV2u = 3/4 * EV2.

A continuación, el subtítulo "ABCDE" por los datos de texto se muestra en la primera posición de visualización de subtítulos (primera región), y el subtítulo "FGH" por los datos de texto se muestra en la segunda posición de visualización de subtítulos (segunda región). En este caso, dependiendo de la compresión de la posición (región) de visualización de subtítulos, el tamaño de fuente del subtítulo se ajusta para que coincida con la posición de visualización de subtítulos comprimida.

En un caso en el que se realiza el procesamiento de redimensionamiento, la compresión del ancho en la dirección vertical se realiza en un estado en el que la posición de línea predeterminada es fija. El ejemplo ilustrado es un caso en el que la posición de línea predeterminada se establece como la línea inferior en la primera posición de visualización de subtítulos (primera región) en función de la información de "dto:scalingjustify=bottom" incluida en el TTML. Además, el ejemplo es un caso en el que la posición de línea predeterminada se establece como la línea superior en la segunda posición de visualización de subtítulos (segunda región) en función de la información de "dto:scalingjustify=top" incluida en el TTML.

Las posiciones de línea predeterminadas se seleccionan en la primera y segunda posiciones de visualización de subtítulos de esta manera, mediante lo cual, por ejemplo, se mantienen 10 líneas como el intervalo entre la primera y segunda posiciones de visualización de subtítulos, de manera similar al caso en el ejemplo de visualización de la Fig. 7. Por esa razón, se hace posible mantener sustancialmente la perceptibilidad de los subtítulos en la imagen de visualización por parte del espectador.

La Fig. 11 ilustra un ejemplo de visualización del subtítulo en un caso en el que la relación de aspecto del área de vídeo es diferente de la relación de aspecto del área de vídeo de visualización (el área de vídeo mostrada en el monitor), el intervalo de visualización de subtítulos se establece en el área de vídeo de visualización y la posición de visualización de subtítulos se determina en función de la información de posición de visualización de subtítulos (un segundo procedimiento). El ejemplo ilustrado es un ejemplo de visualización en un caso en el que la relación de aspecto del área de vídeo es 16:9 y la relación de aspecto del monitor es 4:3, y la estructura TTML es como la ilustrada en la Fig. 3 (una posición de visualización de subtítulos).

En el ejemplo ilustrado, el área de vídeo se indica mediante el marco de línea discontinua y el área de monitor se indica mediante el marco de línea continua. En este caso, tal como se indica mediante el marco de línea de cadena con puntos, el intervalo de visualización de subtítulos se establece en el área de vídeo de visualización, y la posición (región) de visualización de subtítulos se determina en función de la información de posición de visualización de subtítulos ("origin="OH% OV%"", "extent="EH% EV%"") especificada como las posiciones relativas con respecto al intervalo de visualización de subtítulos. A continuación, el subtítulo "ABCDE" por los datos de texto se muestra en la posición de visualización de subtítulos. En este caso, dependiendo de la compresión de la posición (región) de visualización de subtítulos, el tamaño de fuente del subtítulo se ajusta para que coincida con la posición de visualización de subtítulos comprimida.

En este caso, por ejemplo, en el área de vídeo de visualización, el intervalo de visualización de subtítulos se establece con la misma relación de aspecto que la relación de aspecto del área de vídeo. El ejemplo ilustrado es un caso en el que el intervalo de visualización de subtítulos con una relación de aspecto de 16: 9 se establece en el área de vídeo de visualización en función de la información en el intervalo de visualización de subtítulos incluido en el TTML, es decir, la información de punto de referencia del intervalo de visualización de subtítulos ("dto:RPoffset="Ax%, By%"") y la información de relación de aspecto del intervalo de visualización de subtítulos ("dto:dispasp="16:9"").

En este caso, el ancho de la posición de visualización de subtítulos se comprime tanto en la dirección vertical como en la dirección horizontal, la forma de la posición de visualización de subtítulos es igual que en el caso de la Fig. 6, y el ajuste (procesamiento de redimensionamiento) se vuelve innecesario en relación con el tamaño de fuente del subtítulo debido al ajuste de la posición de visualización de subtítulos.

La Fig. 12 también ilustra un ejemplo de visualización del subtítulo en un caso en el que la relación de aspecto del área de vídeo es diferente de la relación de aspecto del área de vídeo de visualización (el área de vídeo mostrada en el monitor), el intervalo de visualización de subtítulos se establece en el área de vídeo de visualización y la posición de visualización de subtítulos se determina en función de la información de posición de visualización de subtítulos (un segundo procedimiento). El ejemplo ilustrado es un ejemplo de visualización en un caso en el que la relación de aspecto del área de vídeo es 16:9 y la relación de aspecto del monitor es 4:3, y la estructura TTML es como la ilustrada en la Fig. 5 (dos posiciones de visualización de subtítulos).

En el ejemplo ilustrado, el área de vídeo se indica mediante el marco de línea discontinua y el área de monitor se indica mediante el marco de línea continua. En este caso, tal como se indica mediante el marco de línea de cadena con puntos, el área de vídeo de visualización se establece como el intervalo de visualización de subtítulos, y la primera y segunda posiciones (regiones) de visualización de subtítulos se determinan en función de la información de posición de visualización de subtítulos ("origin="OH1% OV1%"", "extent="EH1% EV1%"", "origin="OH2% OV2%"", "extent="EH2% EV2%"") especificada como las posiciones relativas con respecto al intervalo de visualización de subtítulos. A continuación, el subtítulo "ABCDE" por los datos de texto se muestra en la primera posición de visualización de subtítulos (primera región), y el subtítulo "FGH" por los datos de texto se muestra en la segunda posición de visualización de subtítulos (segunda región).

[Configuración de ejemplo de unidad de generación de flujo del sistema de transmisión mediante radiodifusión ]

La Fig. 13 ilustra una configuración de ejemplo de una unidad de generación de flujo 110 del sistema de transmisión mediante radiodifusión 100. La unidad de generación de flujo 110 incluye una unidad de control 111, un codificador de vídeo 112, un codificador de audio 113, una unidad de conversión de formato de texto 114, un codificador de subtítulos 115 y un formateador (multiplexor) de TS 116.

La unidad de control 111 está hecha para tener una configuración que incluye, por ejemplo, una unidad central de procesamiento (CPU), y controla el funcionamiento de cada unidad de la unidad de generación de flujo 110. El codificador de vídeo 112 introduce datos de vídeo DV y realiza codificación en los datos de vídeo DV para generar un flujo de vídeo (flujo PES) configurado por un paquete PES de vídeo que incluye datos de vídeo codificados en una carga útil. El codificador de audio 113 introduce datos de audio DA y realiza codificación en los datos de audio DA para generar un flujo de audio (flujo PES) configurado por un paquete PES de audio que incluye datos de audio codificados.

La unidad de conversión de formato de texto 114 introduce datos de texto (código de caracteres) DT y obtiene el lenguaje de marcado de texto temporizado (TTML) como información de subtítulos (véase las FIG. 3 y 5). El TTML incluye la información de posición de visualización de subtítulos. En la información de posición de visualización de subtítulos, la posición (región) de visualización de subtítulos se especifica como la posición relativa (valor proporcional) con respecto al intervalo de visualización de subtítulos. Además, la información de especificación de fuente se incluye en el TTML.

Además, el TTML incluye la información relacionada con el procesamiento de redimensionamiento de la posición de visualización de subtítulos realizada en el lado de recepción en el caso en el que la relación de aspecto del área de vídeo es diferente de la relación de aspecto del área de vídeo de visualización, por ejemplo la información que indica la posición de línea que se establecerá como la posición fija en el caso en el que el tamaño en la dirección vertical se comprime en el procesamiento de redimensionamiento de la posición de visualización de subtítulos. Además, el TTML incluye la información para determinar el intervalo de visualización de subtítulos (información de punto de referencia e información de relación de aspecto del intervalo de visualización de subtítulos).

El codificador de subtítulos 115 convierte el TTML obtenido por la unidad de conversión de formato de texto 114 en varios segmentos y genera un flujo de subtítulos (flujo PES) configurado por un paquete PES de subtítulos en el que esos segmentos están dispuestos en la carga útil.

En este caso, el codificador de subtítulos 115 inserta, en el paquete PES, la información con respecto al procesamiento de redimensionamiento y la información para determinar el intervalo de visualización de subtítulos que son similares a las incluidas en el TTMl . Específicamente, se genera un segmento de visualización TTML recientemente definido (TTML_display_segment) que incluye esos fragmentos de información, y el segmento se inserta en el paquete PES.

Además, el codificador de subtítulos 115 inserta, en el paquete PES, la información de descarga para descargar el archivo de la fuente especificada por al menos la información de especificación de fuente del TTML. Específicamente, se genera un segmento de descarga de fuentes recientemente definido (Font_download_segment) que incluye información para descargar desde la señal de radiodifusión (flujo de transporte TS) y un segmento de señalización de URL recientemente definido (URL_signaling_segment) que incluye información para descargar desde el servidor en la red, y esos segmentos se insertan en el paquete PES.

La Fig. 14(a) ilustra una estructura de ejemplo (sintaxis) del paquete PES de subtítulos (PES_packet). En un campo "PES_startcode_prefix" de 24 bits hay dispuesto un patrón fijo de "0x000001". Un campo "stream jd" de 8 bits indica un identificador de flujo. En el caso del paquete PES de subtítulos se establece en "10111101", que es un valor que indica "flujo privado1". Un campo "PES_packet_length" de 16 bits indica el número de octetos posteriores como la longitud (tamaño) del paquete PES.

Después de "PES_packet_length" hay un campo "Optional_PES_header()". En el campo hay dispuestas marcas de tiempo de PTS y DTS, y similares. Después del campo hay un campo "PES_packet_data_byte". El campo corresponde a una carga útil PES. En el campo está dispuesto "PES_data_byte_field()" para contener datos.

La Fig. 14(b) ilustra una estructura de ejemplo (sintaxis) de "PES_data_byte_field()". Un campo "datajdentifier" de 8 bits es la parte de contenedor e indica un identificador para identificar el tipo de datos. Dado que el subtítulo convencional (en el caso del mapa de bits) se supone que está indicado por "0x20", en el caso del texto, el subtítulo se puede identificar con un nuevo valor, por ejemplo "0x21".

Un campo "subtitle_stream_id" de 8 bits indica un identificador para identificar el tipo de flujo de subtítulos. En el caso de un flujo de subtítulos que transmite información de texto, se establece un nuevo valor, por ejemplo, "0x01", y es posible distinguir el valor del flujo de subtítulos convencional "0x00" que transmite el mapa de bits.

Después del campo "subtitle_stream_id" hay un campo "TimedTextSubtitling_segments()" que sigue el patrón "00001111". Un paquete de segmento está dispuesto en el campo. Después del campo hay un campo "end_of_PES_data_field_marker" de 8 bits. El campo es un marcador que indica el final del paquete PES.

La Fig. 15 ilustra un ejemplo de una definición de un tipo de segmento (segment_type). "0xA0" indica que es un segmento que transmite todo el documento TTML. "0xA1" indica que es un segmento que transmite la parte <tt>. "0xA2" indica que es un segmento que transmite la parte <head>. "0xA3" indica que es un paquete de segmento que transmite la parte <body>. "0xA4" indica que es el segmento de visualización TTML. "0xA5" indica que es el segmento de descarga de fuentes. "0xA6" indica que es el segmento de señalización de URL.

La Fig. 16 ilustra una estructura (sintaxis) de ejemplo del segmento de visualización TTML (TTML_display_segment). La Fig. 17 ilustra detalles de información principal (semántica) en la estructura de ejemplo. Un campo "sync_byte" de 8 bits es una palabra única que indica el inicio del segmento. Un campo "segment_type" de 8 bits indica el tipo del segmento. En el caso del segmento de visualización TTML, el "segment_type" se establece en "0xA4" (véase la Fig. 15), e indica que es el segmento de visualización TTML. Un campo "segmentjength" de 16 bits indica el número de octetos posteriores como la longitud (tamaño) del segmento de visualización TTML.

Un campo "tds_version_number" de 4 bits indica la actualización del segmento de visualización TTML. En caso de que haya un cambio en el elemento, el valor se incrementa en uno. Un campo "display_aspect_type" de 8 bits indica la relación de aspecto del intervalo de visualización de subtítulos. Por ejemplo, "0x01" indica 16:9, "0x02" indica 4:3, y "0x03" indica 21:9. La información del campo corresponde a la información de "dto:dispasp" en el TTML (véanse las Fig. 3 y 5).

Un campo de 8 bits de "reference_point_offset_v" indica una posición vertical del punto de referencia del intervalo de visualización de subtítulos de cuando cada intervalo horizontal y vertical del área de vídeo de visualización se establece en el 100%, como una relación de un desplazamiento desde la parte superior izquierda del área de vídeo de visualización. Un campo "reference_point_offset_h" de 8 bits indica una posición horizontal del punto de referencia del intervalo de visualización de subtítulos de cuando cada intervalo horizontal y vertical del área de vídeo de visualización se establece en el 100%, como una relación de un desplazamiento desde la parte superior izquierda del área de vídeo de visualización. La información de estos campos corresponde a la información de "dto:RPoffset" en el TTML (véanse las Fig. 3 y 5).

Un campo de 1 bit de "scaling_justify_flag" indica si se debe especificar o no un punto de referencia de escalamiento en un caso en el que se realiza escalamiento de la región. "1" indica que se especifica el punto de referencia, y "0" indica que no se especifica ningún punto de referencia. En un caso en el que se especifica el punto de referencia, cuando hay una pluralidad de regiones, para una región en la posición más alta, la parte inferior de la región se establece como una referencia (bottom_line_justified), y para una región en la posición más baja, la parte superior de la región se establece como una referencia (top_line_justified). La información del campo corresponde a la información de "dto:scalingjustify" en el TTML (véanse las Fig. 3 y 5).

La Fig. 18 ilustra una estructura (sintaxis) de ejemplo del segmento de descarga de fuentes (Font_download_segment). La Fig. 19 ilustra detalles de información principal (semántica) en la estructura de ejemplo. Un campo "sync_byte" de 8 bits es una palabra única que indica el inicio del segmento. Un campo "segment_type" de 8 bits indica el tipo del segmento. En el caso del segmento de descarga de fuentes, el "segment_type" se establece en "0xA5" (véase la Fig. 15), e indica que es el segmento de descarga de fuentes. Un campo "segment_length" de 16 bits indica el número de octetos posteriores como la longitud (tamaño) del segmento de descarga de fuentes. Un campo "fds_version_number" de 4 bits indica la actualización del segmento de descarga de fuentes. En caso de que haya un cambio en el elemento, el valor se incrementa en uno.

Un campo "original_network_id" de 16 bits indica la información de identificación de la red a través de la cual se transmiten los datos de descarga. Un campo "transport_stream_id" de 16 bits indica información de identificación de un flujo de transporte individual. Un campo "service_id" de 16 bits indica información de identificación del servicio a descargar. En el caso de un objetivo de descarga común entre medios de distribución, el archivo de fuentes puede transmitirse no en su propio flujo de transporte sino en otro flujo de transporte, y como información para especificar una sección privada a la que se hará referencia en ese caso, se puede especificar información de "original_network_id", "transport_stream_id" y "service_id".

Un campo "font_file_id" de 8 bits indica un número de identificación asignado al archivo de fuentes. Un campo "ISO_639_language_code" de 24 bits indica un código que incluye tres caracteres para identificar el idioma. Por ejemplo, "jpn" indica japonés y "eng" indica inglés. Un campo "font_group_id" de 8 bits indica información de identificación de un grupo de fuentes y corresponde a la familia genérica del TTML. Un campo "font_name_id" de 8 bits indica el nombre de fuente individual.

Un campo "text_length" de 8 bits indica la longitud (tamaño) de la parte de código de caracteres subsiguiente en octetos. El código de caracteres está dispuesto en el campo "char". Por ejemplo, es posible establecer un código de caracteres que indique el nombre de fuente individual, o similar, como código de caracteres.

Cabe destacar que, en el ejemplo de la Fig. 18, se incluye información de descarga de un archivo de fuentes, pero también es posible incluir información de descarga de una pluralidad de archivos de fuentes. En ese caso, la estructura tiene un bucle "for" en el que se repiten los campos de "original_network_id". De forma alternativa, también es posible suministrar la información de descarga de la pluralidad de archivos de fuentes mediante la transmisión de una pluralidad de segmentos de descarga de fuentes (Font_download_segment).

La Fig. 20 ilustra una estructura (sintaxis) de ejemplo del segmento de señalización URL (URL_signaling_segment). La Fig. 21 ilustra detalles de información principal (semántica) en la estructura de ejemplo. Un campo "sync_byte" de 8 bits es una palabra única que indica el inicio del segmento. Un campo "segment_type" de 8 bits indica el tipo del segmento. En el caso del segmento de señalización de URL, el "segment_type" se establece en "0x A6" (véase la Fig. 15), e indica que es el segmento de señalización de URL. Un campo "segment_length" de 16 bits indica el número de octetos posteriores como la longitud (tamaño) del segmento de descarga de fuentes. Un campo "uss_version_number" de 4 bits indica la actualización del segmento de señalización de URL. En caso de que haya un cambio en el elemento, el valor se incrementa en uno.

Un campo "ISO_639_language_code" de 24 bits indica un código que incluye tres caracteres para identificar el idioma. Por ejemplo, "jpn" indica japonés y "eng" indica inglés. Un campo "font_group_id" de 8 bits indica información de identificación de un grupo de fuentes y corresponde a la familia genérica del TTML. Un campo "font_name_id" de 8 bits indica el nombre de fuente individual.

Un campo "url_type" de 8 bits indica el tipo del servidor. Por ejemplo, "0x01" indica un servidor de fuentes (URL sin comprimir), "0x02" indica un servidor general (URL sin comprimir), "0x11" indica un servidor de fuentes (URL comprimido) y "0x12" indica un servidor general (URL comprimido). Un campo "url_string_length" de 8 bits indica la longitud (tamaño) de la parte de código de caracteres que indica la cadena de caracteres de la URL subsiguiente en octetos. El código de caracteres está dispuesto en el campo "char".

Cabe destacar que, en el ejemplo de la Fig. 20, se incluye información de descarga de un archivo de fuentes, pero también es posible incluir información de descarga de una pluralidad de archivos de fuentes. En ese caso, la estructura tiene un bucle "for" en el que se repiten los campos de "ISO_639_language_code". De forma alternativa, también es posible suministrar la información de descarga de la pluralidad de archivos de fuentes mediante la transmisión de una pluralidad de segmentos de señalización de URL (URL_signaling_segment).

Con referencia de nuevo a la Fig. 13, el formateador de TS 116 hace que el flujo de vídeo generado por el codificador de vídeo 112, el flujo de audio generado por el codificador de audio 113 y el flujo de subtítulos generado por el codificador de subtítulos 115 se inserten en un paquete de transporte para su multiplexación, para obtener el flujo de transporte TS como contenedor (flujo multiplexado).

En este caso, el formateador de TS 116 inserta, en la tabla de mapas de programas (PMT), la información con respecto al procesamiento de redimensionamiento y la información para determinar el intervalo de visualización de subtítulos que son similares a las incluidas en el TTML. Específicamente, se genera un descriptor de visualización TTML recientemente definido (TTML_display_descriptor) que incluye esos fragmentos de información, y el descriptor se inserta en la PMT.

Además, el formateador de TS 116 inserta, en la PMT, la información de descarga para descargar el archivo de la fuente especificada por al menos la información de especificación de fuente del TTML. Específicamente, se genera un descriptor de descarga de fuentes recientemente definido (Font_download_descriptor) que incluye información para descargar desde la señal de radiodifusión (flujo de transporte TS) y un descriptor de señalización de URL recientemente definido (URL_signaling_descriptor) que incluye información para descargar desde el servidor en la red, y esos descriptores se insertan en la PMT.

La Fig. 22 ilustra una estructura (sintaxis) de ejemplo del descriptor de visualización TTML (TTML_display_descriptor). Un campo "descriptor_tag" de 8 bits indica un tipo de descriptor y, aquí, indica que es el descriptor de visualización TTML. Un campo "descriptor_length" de 8 bits indica la longitud (tamaño) del descriptor e indica el número de octetos subsiguientes como la longitud del descriptor.

Un campo "display_aspect_type" de 8 bits indica la relación de aspecto del intervalo de visualización de subtítulos. La información del campo corresponde a la información de "dto:dispasp" en el TTML (véanse las Fig. 3 y 5).

Un campo de 1 bit de "scaling_justify_flag" indica si se debe especificar o no un punto de referencia de escalamiento en un caso en el que se realiza escalamiento de la región. "1" indica que se especifica el punto de referencia, y "0" indica que no se especifica ningún punto de referencia. La información del campo corresponde a la información de "dto:scalingjustify" en el TTML (véanse las Fig. 3 y 5) .

Un campo "text_length" de 8 bits indica la longitud (tamaño) de la parte de código de caracteres subsiguiente en octetos. El código de caracteres está dispuesto en el campo "char". Por ejemplo, es posible establecer un código de caracteres que indique la relación de aspecto de fuente individual, o similar, como código de caracteres.

La Fig. 23 ilustra una estructura (sintaxis) de ejemplo del descriptor de descarga de fuentes (Font_download_descriptor). Un campo "descriptor_tag" de 8 bits indica un tipo de descriptor y, aquí, indica que es el descriptor de descarga de fuentes. Un campo "descriptor_length" de 8 bits indica la longitud (tamaño) del descriptor e indica el número de octetos subsiguientes como la longitud del descriptor.

Un campo "font_file_id" de 8 bits indica un número de identificación asignado al archivo de fuentes. Un campo "ISO_639_language_code" de 24 bits indica un código que incluye tres caracteres para identificar el idioma. Un campo "font_group_id" de 8 bits indica información de identificación de un grupo de fuentes y corresponde a la familia genérica del TTML. Un campo "font_name_id" de 8 bits indica el nombre de fuente individual.

Cabe destacar que, en el ejemplo de la Fig. 23, se incluye información de descarga de un archivo de fuentes, pero también es posible incluir información de descarga de una pluralidad de archivos de fuentes. En ese caso, la estructura tiene un bucle "for" en el que se repiten los campos de "original_network_id".

La Fig. 24 ilustra una estructura (sintaxis) de ejemplo del descriptor de descarga de fuentes (Font_download_descriptor). Un campo "descriptor_tag" de 8 bits indica un tipo de descriptor y, aquí, indica que es el descriptor de descarga de fuentes. Un campo "descriptor_length" de 8 bits indica la longitud (tamaño) del descriptor e indica el número de octetos subsiguientes como la longitud del descriptor.

Un campo "ISO_639_language_code" de 24 bits indica un código que incluye tres caracteres para identificar el idioma. Un campo "font_group_id" de 8 bits indica información de identificación de un grupo de fuentes y corresponde a la familia genérica del TTML. Un campo "font_name_id" de 8 bits indica el nombre de fuente individual. Un campo "url_type" de 8 bits indica el tipo del servidor. Un campo "url_string_length" de 8 bits indica la longitud (tamaño) de la parte de código de caracteres que indica la cadena de caracteres de la URL subsiguiente en octetos. El código de caracteres está dispuesto en el campo "char".

Cabe destacar que, en el ejemplo de la Fig. 24, se incluye información de descarga de un archivo de fuentes, pero también es posible incluir información de descarga de una pluralidad de archivos de fuentes. En ese caso, la estructura tiene un bucle "for" en el que se repiten los campos de "ISO_639_language_code".

Como se describió anteriormente, basándose en la información incluida en el segmento de descarga de fuentes (véase la Fig. 18) insertado en el paquete PES o el descriptor de descarga de fuentes (véase la Fig. 23) insertado en la PMT, el receptor de televisión 200 puede adquirir el archivo de la fuente especificada por la información de especificación de fuente del TTML a partir del flujo de transporte TS (señal de radiodifusión), lo que se ilustra como "Caso de descarga de fuente (Caso 1)" en la Fig. 25 (a).

Además, tal como se describió anteriormente, basándose en la información incluida en el segmento de señalización de URL (véase la Fig. 20) insertado en el paquete PES o el descriptor de descarga de fuentes (véase la Fig. 24) insertado en la PMT, el receptor de televisión 200 puede adquirir el archivo de la fuente especificada por la información de especificación de fuente del TTML desde el servidor en la red, lo que se ilustra como "Caso de descarga de fuente (Caso 2)" en la Fig. 25(b).

Con referencia de nuevo a la Fig. 13, el formateador de TS 116 inserta de forma secuencial y repetida el número predeterminado de tablas de secciones, que incluyen, respectivamente, diferentes archivos de fuentes en el flujo de transporte TS. Es decir, el sistema de transmisión mediante radiodifusión 100 transmite repetidamente el número predeterminado de tablas de secciones mediante el carrusel de datos.

La Fig. 26 ilustra esquemáticamente que una tabla de secciones que incluye una tabla de fuentes se transmite repetidamente por el carrusel de datos además de N tablas de secciones que incluyen cada una un archivo de fuentes, y el receptor 200 puede recibir estas tablas de secciones sin estar limitado en su temporización.

Aquí, como tabla de secciones que incluye el archivo de fuentes y la tabla de fuentes, una tabla de secciones de descarga de fuentes (FDT) (tabla Font_downloading_section) se ha definido recientemente como tabla de secciones privada. En la tabla de secciones de descarga de fuentes, aunque la estructura de tabla se describe más adelante, hay campos tales como "data_downloading_id", "section_number" y "last_section_number".

Tal como se ilustra en la Fig. 26, por ejemplo, los valores de 0 a N se insertan en el campo "data_downloading_id" de la tabla de secciones de descarga de fuentes que circula, y se puede identificar cada tabla de secciones. Valores similares a los del campo "data_downloading_id" también se insertan en el campo "section_number" de la tabla de secciones de descarga de fuentes que circula, y el valor de N se inserta en el campo "last_section_number" de cada tabla de secciones.

El receptor 200 puede reconocer una relación de posición durante el suministro circular con los valores de los campos "section_number" y "last_section_number" de la tabla de secciones de descarga de fuentes recibida. Es decir, el receptor 200 reconoce una posición de la tabla de secciones actual con el valor del campo "section_number", reconoce la última tabla de secciones que circula cuando el valor del campo "section_number" coincide con el valor del campo "last_section_number", y puede usar los valores para adquirir todas las tablas de secciones en una circulación.

La Fig. 27 ilustra una estructura (sintaxis) de ejemplo de la tabla de secciones de descarga de fuentes (tabla Font_downloading_section). La Fig. 28 ilustra detalles de información principal (semántica) en la estructura de ejemplo.

Un campo "tab le jd" de 8 bits indica información de identificación de tabla. Un valor que indica la tabla de secciones de descarga de fuentes se especifica como información de identificación de tabla. Un campo "data_downloading_id" de 16 bits es información de identificación de los datos de descarga e indica un valor único definido para cada "original_network_id". Por ejemplo, "0x00" indica que es información de tabla de fuentes, y un valor distinto de "0x00" indica que es información de archivo de fuentes. Un campo "version_number" de 5 bits indica la actualización de la tabla de secciones de descarga de fuentes. En caso de que haya un cambio en el elemento, el valor se incrementa en uno.

Un campo "original_network_id" de 16 bits indica la información de identificación de la red a través de la cual se transmiten los datos de descarga. Un campo "transport_stream_id" de 16 bits indica información de identificación de un flujo de transporte individual. Un campo "service_id" de 16 bits indica información de identificación del servicio a descargar. El uso conjunto de estos tres fragmentos de información de identificación permite convertirlos en un objetivo de descarga común entre medios de distribución.

En un campo "descriptor()", un descriptor de tabla de fuentes (Font_table_descriptor) se establece cuando "data_downloading_id" es "0x00", y un descriptor de archivos de fuentes (Font_file_descriptor) se establece cuando "data_downloading_id" es diferente de "0x00".Además, cuando "data_downloading_id" es diferente de "0x00", un archivo de fuentes se dispone en el campo "data_byte".

La Fig. 29 ilustra esquemáticamente la información de tabla de fuentes descrita en la tabla de secciones de descarga de fuentes cuando "data_downloading_id" es "0x00".En este caso, como se describió anteriormente, el descriptor de tabla de fuentes (Font_table_descriptor) está dispuesto en el campo "descriptor()" en la tabla de secciones de descarga de fuentes.

En el descriptor de tabla de fuentes, la información se describe en un número predeterminado de archivos de fuentes que se transmitirán de forma circular. Como información en el archivo de fuentes se incluyen fragmentos de información tales como "Font_file_id", "ISO_639_language_code", "font_group_id" y "font_name_id". "Font_file_id" indica un número de identificación asignado al archivo de fuentes. "ISO_639_language_code" indica un código de identificación del idioma. "font_group_id" indica información de identificación de un grupo de fuentes. "font_name_id" indica un nombre de fuente individual. La Fig. 30 ilustra una correspondencia entre un valor de "font_group_id" y el grupo de fuentes.

La Fig. 31 ilustra una estructura (sintaxis) de ejemplo del descriptor de tabla de fuentes (Font_table_descriptor). Un campo "descriptor_tag" de 8 bits indica un tipo de descriptor y, aquí, indica que es el descriptor de tabla de fuentes. Un campo "descriptor_length" de 8 bits indica la longitud (tamaño) del descriptor e indica el número de octetos subsiguientes como la longitud del descriptor.

Un campo "number_of_font_files" de 8 bits indica el número de archivos de fuentes. Hay tantos campos "font_file_id" de 8 bits, tantos campos "ISO_639_language_code" de 24 bits, tantos campos "font_group_id" de 8 bits y tantos campos "font_name_id" de 8 bits como número de archivos de fuentes.

La Fig. 32 ilustra esquemáticamente la información de tabla de fuentes descrita en la tabla de secciones de descarga de fuentes cuando "data_downloading_id" es diferente de "0x00". En este caso, como se describió anteriormente, en la tabla de secciones de descarga de fuentes, el descriptor de archivo de fuentes (Font_file_descriptor) está dispuesto en el campo "descriptor()", y además el archivo de fuentes está dispuesto en el campo "data_byte".

La información acerca del archivo de fuentes que se transmitirá se describe en el descriptor de archivo de fuentes. Como información en el archivo de fuentes se incluyen fragmentos de información tales como "Font_file_id", "ISO_639_language_code", "font_group_id" y "font_name_id". "Font_file_id" indica un número de identificación asignado al archivo de fuentes. "ISO_639_language_code" indica un código de identificación del idioma. "font_group_id" indica información de identificación de un grupo de fuentes. "font_name_id" indica un nombre de fuente individual.

La Fig. 33 ilustra una estructura (sintaxis) de ejemplo del descriptor de archivo de fuentes (Font_file_descriptor). Un campo "descriptor_tag" de 8 bits indica un tipo de descriptor y, aquí, indica que es el descriptor de archivo de fuentes. Un campo "descriptor_length" de 8 bits indica la longitud (tamaño) del descriptor e indica el número de octetos subsiguientes como la longitud del descriptor.

Hay un campo "Font_file_id" de 8 bits, un campo "ISO_639_language_code" de 24 bits, un campo "font_group_id" de 8 bits y un campo "font_name_id" de 8 bits que indican la información en el archivo de fuentes que se va a transmitir. Un campo "text_length" de 8 bits indica la longitud (tamaño) de la parte de código de caracteres subsiguiente en octetos. El código de caracteres está dispuesto en el campo "char". Por ejemplo, es posible establecer un código de caracteres que indique el nombre de fuente individual, o similar, como código de caracteres.

Se describe brevemente el funcionamiento de la unidad de generación de flujo 110 ilustrada en la Fig. 13. Los datos de vídeo DV se suministran al codificador de vídeo 112. El codificador de vídeo 112 realiza una codificación en los datos de vídeo DV para generar el flujo de vídeo (flujo PES) configurado por el paquete PES de vídeo que incluye los datos de imagen codificados en la carga útil. El flujo de vídeo se suministra al formateador de TS 116.

Además, los datos de audio DA se suministran al codificador de audio 113. El codificador de audio 113 codifica los datos de audio DA para generar el flujo de audio (flujo PES) que incluye el paquete PES de audio que incluye los datos de audio codificados. El flujo de audio se suministra al formateador de TS 116.

Además, los datos de texto (código de caracteres) DT se suministran a la unidad de conversión de formato de texto 114. En la unidad de conversión de formato de texto 114, se obtiene el TTML como información de subtítulos (véanse las Fig. 3 y 5). El TTML incluye la información de posición de visualización de subtítulos para especificar la posición (región) de visualización de subtítulos como la posición relativa (valor proporcional) con respecto al intervalo de visualización de subtítulos. Además, la información de especificación de fuente se incluye en el TTML. Además, el TTML incluye la información auxiliar (información con respecto al procesamiento de redimensionamiento, información para determinar el intervalo de visualización de subtítulos) que se utilizará cuando se muestre el subtítulo mediante el uso de la información de posición de visualización de subtítulos.

El TTML se suministra al codificador de subtítulos 115. El codificador de subtítulos 115 convierte el TTML en varios segmentos para generar el flujo de subtítulos configurado por el paquete PES de subtítulos en el que esos segmentos están dispuestos en la carga útil. El flujo de subtítulos se suministra al formateador de TS 116.

En este caso, el codificador de subtítulos 115 inserta, en el paquete PES, información auxiliar (información con respecto al procesamiento de redimensionamiento, información para determinar el intervalo de visualización de subtítulos) que se utilizará cuando se muestre el subtítulo mediante el uso de la información de posición de visualización de subtítulos, donde la información auxiliar es similar a la incluida en el TTML. Específicamente, se genera el segmento de visualización TTML (véase la Fig. 16), que incluye esos fragmentos de información, y el segmento se inserta en el paquete PES.

Además, el codificador de subtítulos 115 inserta, en el paquete PES, la información de descarga para descargar el archivo de la fuente especificada por al menos la información de especificación de fuente del TTML. Específicamente, se genera el segmento de descarga de fuentes (véase la Fig. 18), que incluye información de descarga desde la señal de radiodifusión (flujo de transporte TS), y el segmento de señalización de URL (véase la Fig. 20), que incluye información de descarga desde el servidor en la red, y esos segmentos se insertan en el paquete PES.

El formateador de TS 116 hace que el flujo de vídeo generado por el codificador de vídeo 112, el flujo de audio generado por el codificador de audio 113 y el flujo de subtítulos generado por el codificador de subtítulos 115 se inserten en un paquete de transporte para su multiplexación, para generar el flujo de transporte TS como contenedor (flujo multiplexado).

En este caso, el formateador de TS 116 inserta, en la PMT, información auxiliar (información con respecto al procesamiento de redimensionamiento, información para determinar el intervalo de visualización de subtítulos) que se utilizará cuando se muestre el subtítulo mediante el uso de la información de posición de visualización de subtítulos, donde la información auxiliar es similar a la incluida en el TTML. Específicamente, se genera el descriptor de visualización TTML (véase la Fig. 22), que incluye esos fragmentos de información, y el descriptor se inserta en la PMT.

Además, el formateador de TS 116 inserta, en la PMT, la información de descarga para descargar el archivo de la fuente especificada por al menos la información de especificación de fuente del TTML. Específicamente, se genera el descriptor de descarga de fuentes (véase la Fig. 23), que incluye información de descarga desde la señal de radiodifusión (flujo de transporte TS), y el descriptor de señalización de URL recientemente definido (véase la Fig. 24), que incluye información de descarga desde el servidor en la red, y esos descriptores se insertan en la PMT.

[Configuración de ejemplo de flujo de transporte TS]

La Fig. 34 ilustra una configuración de ejemplo del flujo de transporte TS. En la configuración de ejemplo se omiten configuraciones de partes de vídeo y audio. En la configuración de ejemplo, existe un paquete PES de subtítulos "PES de subtítulos" que es un paquete PES de un flujo de subtítulos.

En el paquete PES de subtítulos, la marca de tiempo del PTS se inserta en la cabecera PES, y todo el documento TTML o segmentos (segmentos de subtitulación de texto temporizado) que incluyen partes divididas del documento TTML se insertan en la carga útil de PES. Los segmentos incluyen la información relacionada con el procesamiento de redimensionamiento ("dto:scalingjustify") y la información para determinar el intervalo de visualización de subtítulos ("dto:dispasp", "dto:RPoffset").

Además, los segmentos incluyen la información de especificación de fuente ("fontFamily"). Cabe destacar, como se describe posteriormente, que también es concebible incluir, en los segmentos, la información de descarga ("fontdlurl=http://www.w3.org/ns/fontdlservice", "fontdlurl:iso639languagecode="value"", "fontdlurl:fontgroupid="value"", "fontdlurl:fontnameid="value"", "fontdlurl:fontname="value"").

Además, el segmento de visualización TTML (TTML_display_segment) (véase la Fig. 16) se inserta en la carga útil de PES del paquete PES de subtítulos. En el segmento, la información relacionada con el procesamiento de redimensionamiento ("scaling_justify_flag") y la información para determinar el intervalo de visualización de subtítulos ("display_aspect_type", "reference_point_offset_v, reference_point_offset_h") se insertan respectivamente en correspondencia con la información relacionada con el procesamiento de redimensionamiento ("dto:scalingjustify") y la información para determinar el intervalo de visualización de subtítulos ("dto:dispasp", "dto:RPoffset") incluidas en los segmentos de subtitulación de texto temporizado descritos anteriormente (segmentos de subtítulos de texto temporizado).

Además, el segmento de descarga de fuentes (Font_download_segment) (véase la Fig. 18) se inserta en la carga útil de PES del paquete PES de subtítulos. En el segmento, la información ("font_file_id", "ISO_639_language_code", "font_group_id", "font_name_id" y similares) se inserta para descargar, desde la señal de radiodifusión (flujo de transporte TS), el archivo de la fuente especificada por la información de especificación de fuentes ("fontFamily") incluida en los segmentos de subtitulación de texto temporizado descritos anteriormente (segmentos de subtítulos de tiempo temporizado).

Además, el segmento de señalización de URL (URL_signalin_segment) (véase la Fig. 20) se inserta en la carga útil de PES del paquete PES de subtítulos. En el segmento, la información ("ISO_639_language_code", "font_group_id", "font_name_id", "url_type", "URL" y similares) se inserta para descargar, desde el servidor en la red, el archivo de la fuente especificada por la información de especificación de fuentes ("fontFamily") incluida en los segmentos de subtitulación de texto temporizado descritos anteriormente (segmentos de subtítulos de texto temporizado).

Además, el flujo de transporte TS incluye la tabla de mapas de programas (PMT) como información específica de programa (PSI). La PSI es información que describe a qué programa pertenece cada flujo elemental incluido en el flujo de transporte TS. En la PMT hay un bucle de flujo elemental de subtítulos (bucle ES de subtítulos) que incluye información asociada al flujo de subtítulos.

En el bucle de flujo elemental de subtítulos se dispone información tal como un identificador de paquete (PID) correspondiente al flujo de subtítulos, y también se dispone un descriptor que describe información asociada al flujo de subtítulos. Como descriptor, se disponen el descriptor de visualización TTML (TTML_display_descriptor) (véase la Fig. 22), el descriptor de descarga de fuentes (Font_download_descriptor) (véase la Fig. 23) y el descriptor de señalización de URL (URL_signaling_descriptor) (véase la Fig. 24).

En el descriptor de visualización TTML se insertan la información relacionada con el procesamiento de redimensionamiento ("scaling_justify_flag") y la información para determinar el intervalo de visualización de subtítulos ("display_aspect_type", "reference_point_offset_v, reference_point_offset_h"). En el descriptor de descarga de fuentes, la información de descarga ("font_file_id", "ISO_639_language_code", "font_group_id", "font_name_id" y similares) se inserta de manera similar a la del segmento de descarga de fuentes. En el descriptor de señalización de URL, la información de descarga ("ISO_639_language_code", "font_group_id", "font_name_id", "url_type", "URL" y similares) se inserta de manera similar a la del segmento de señalización de URL.

Cabe destacar que el descriptor de descarga de fuentes y el descriptor de señalización de URL pueden disponerse según una tabla de información de eventos (EIT) del flujo de transporte TS. Esto permite describir la información de descarga para cada programa.

Además, el flujo de transporte TS incluye la FDT (tabla Font_downloading_section) (véase la Fig. 27)). Con la FDT, el archivo de tabla de fuentes se suministra de forma circular mediante el carrusel de datos. En la FDT se insertan el descriptor de tabla de fuentes (Font_table_descriptor) (véase la Fig. 31), o el descriptor de archivo de fuentes (Font_file_descriptor) (véase la Fig. 33) y el archivo de fuentes (Font_file). Cabe destacar que puede haber un caso en el que la FDT no está en el flujo de transporte TS. A este respecto, en un caso en el que el archivo de fuentes se descarga en función de la información de descarga incluida en el segmento de descarga de fuentes del paquete PES o el descriptor de descarga de fuentes de la PMT, el receptor 200 descarga el archivo de fuentes desde otro flujo de transporte TS.

[Configuración de ejemplo de receptor de televisión]

La Fig. 35 ilustra una configuración de ejemplo del receptor de televisión 200. El receptor de televisión 200 incluye una unidad de recepción 201, una unidad de análisis (desmultiplexor) de TS 202, un descodificador de vídeo 203, una unidad de superposición de vídeo 204, un circuito de activación de panel 205 y un panel de visualización 206 tal como un monitor (dispositivo de visualización). Además, el receptor de televisión 200 incluye un decodificador de audio 207, un circuito de salida de audio 208, un altavoz 209 y un descodificador de subtítulos 210. Además, el receptor de televisión 200 incluye una CPU 221, una ROM flash 222, una DRAM 223, un bus interno 224, una unidad de recepción de control remoto 225, un transmisor de control remoto 226 y una interfaz de comunicación 227.

La CPU 221 controla el funcionamiento de cada unidad del receptor de televisión 200. La ROM flash 222 almacena software de control y guarda datos. La DRAM 223 configura un área de trabajo de la CPU 221. La CPU 221 despliega el software y los datos leídos de la ROM flash 222 en la DRAM 223 para iniciar el software y controla cada unidad del receptor de televisión 200.

La unidad de recepción de control remoto 225 recibe una señal de control remoto (código de control remoto) transmitida desde el transmisor de control remoto 226 y suministra la señal a la CPU 221. La CPU 221 controla cada unidad del receptor de televisión 200 en función del código de control remoto. La CPU 221, la ROM flash 222 y la DRAM 223 están conectadas al bus interno 224.

Bajo el control de la CPU 221, la interfaz de comunicación 227 se comunica con un servidor presente en una red, tal como Internet. La interfaz de comunicación 227 está conectada al bus interno 224.

La unidad de recepción 201 recibe el flujo de transporte TS en la onda de radiodifusión transmitida desde el sistema de transmisión mediante radiodifusión 100. El flujo de transporte TS incluye el flujo de vídeo, el flujo de audio y el flujo de subtítulos, como se describió anteriormente. La unidad de análisis de TS 202 extrae el paquete PES de cada uno de los flujos de vídeo, audio y subtítulos, del flujo de transporte TS. En este caso, la unidad de análisis de TS 202 analiza varios tipos de información insertada en la cabecera de cada paquete TS, extrae de forma selectiva el paquete TS que incluye datos de paquetes PES de vídeo, audio y subtítulos en función del "PID" para obtener los paquetes PES de vídeo, audio y subtítulos.

Además, la unidad de análisis de TS 202 analiza diversos tipos de información insertada en la cabecera de cada paquete TS, extrae diversos tipos de información insertada en el flujo de transporte TS en función del "PID" y transmite la información a la CPU 221. La información también incluye el descriptor de visualización TTML (TTML_display_descriptor) (véase la Fig. 22), el descriptor de descarga de fuentes (Font_download_descriptor) (véase la Fig. 23) y el descriptor de señalización de URL (URL_signaling_descriptor) (véase la Fig. 24).

La CPU 221 adquiere, a partir del descriptor de visualización TTML, la información relacionada con el procesamiento de redimensionamiento ("scaling_justify_flag") y la información para determinar el intervalo de visualización de subtítulos ("display_aspect_type", "reference_point_offset_v, reference_point_offset_h") como información auxiliar que se utilizará cuando se muestre el subtítulo mediante el uso de la información de posición de visualización de subtítulos del TTML incluido en el flujo de subtítulos.

Además, la CPU 221 adquiere, a partir del descriptor de descarga de fuentes, la información ("font_file_id", "ISO_639_language_code", "font_group_id", "font_name_id" y similares) para descargar, desde la señal de radiodifusión (flujo de transporte TS), el archivo de la fuente especificada por la información de especificación de fuentes incluida en el TTML incluido en el flujo de subtítulos.

Además, la CPU 221 adquiere, a partir del descriptor de señalización URL, la información ("ISO_639_language_code", "font_group_id", "font_name_id", "url_type", "URL" y similares) para descargar, desde el servidor en la red, el archivo de la fuente especificada por la información de especificación de fuentes incluida en el TTML incluido en el flujo de subtítulos.

Además, la información extraída por la unidad de análisis de TS 202 también incluye la FDT (tabla Font_downloading_section) (véase la Fig. 27) en el caso de descargar, desde la señal de radiodifusión (flujo de transporte TS), el archivo de la fuente especificada por la información de especificación de fuentes incluida en el TTML incluido en el flujo de subtítulos. La CPU 221 adquiere, de la FDT, el archivo de la fuente especificada por la información de especificación de fuentes incluida en el TTML incluido en el flujo de subtítulos.

El descodificador de audio 207 realiza un procesamiento de descodificación en el paquete PES de audio obtenido por la unidad de análisis de TS 202 para obtener datos de audio. El circuito de salida de audio 208 realiza, en los datos de audio, el procesamiento necesario, tal como conversión D/A o amplificación, y suministra los datos al altavoz 209. El descodificador de vídeo 203 realiza un procesamiento de descodificación en el paquete PES de vídeo obtenido por la unidad de análisis de TS 202 para obtener datos de vídeo. Cabe destacar que el descodificador de vídeo 203 también realiza una conversión de resolución de los datos de vídeo según corresponda, dependiendo de un modo de visualización o similares. Por ejemplo, en un caso en el que la relación de aspecto del área de vídeo es 16:9 y la relación de aspecto del monitor (dispositivo de visualización) es 4:3, y el modo de visualización es buzón (letter box), se realiza la conversión de resolución de los datos de vídeo.

El descodificador de subtítulos 210 realiza un procesamiento de descodificación en el paquete PES de subtítulos obtenido por la unidad de análisis de TS 202 para obtener el TTML a partir de los segmentos de subtitulación de texto temporizado (segmentos de subtítulos de texto temporizado) y transmite el TTML a la CPU 221. La CPU 221 adquiere, a partir del TTML, la información de posición de visualización de subtítulos para especificar la posición (región) de visualización de subtítulos como la posición relativa (valor proporcional) con respecto al intervalo de visualización de subtítulos y, además, la información referente al procesamiento de redimensionamiento ("dto:scalingjustify") y la información para determinar el intervalo de visualización de subtítulos ("dto:dispasp", "dto:RPoffset") como información auxiliar que se utilizará cuando se muestre el subtítulo mediante el uso de la información de posición de visualización de subtítulos y similares.

Además, el descodificador de subtítulos 210 extrae el segmento de visualización TTML (TTML_display_segment) (véase la Fig. 16), el segmento de descarga de fuentes (Font_download_segment) (véase la Fig. 18) y el segmento de señalización de URL (URL_signalin_segment) (véase la Fig. 20) incluido en el paquete PES de subtítulos obtenido por la unidad de análisis de TS 202, y los transmite a la CPU 221.

La CPU 221 adquiere, a partir del segmento de visualización TTML, la información relacionada con el procesamiento de redimensionamiento ("scaling_justify_flag") y la información para determinar el intervalo de visualización de subtítulos ("display_aspect_type", "reference_point_offset_v, reference_point_offset_h") como información auxiliar que se utilizará cuando se muestre el subtítulo mediante el uso de la información de posición de visualización de subtítulos del TTML incluido en el flujo de subtítulos.

Además, la CPU 221 adquiere, a partir del segmento de descarga de fuentes, la información ("font_file_id", "ISO_639_language_code", "font_group_id", "font_name_id" y similares) para descargar, desde la señal de radiodifusión (flujo de transporte TS), el archivo de la fuente especificada por la información de especificación de fuentes incluida en el TTML incluido en el flujo de subtítulos.

Además, la CPU 221 adquiere, a partir del segmento de señalización URL, la información ("ISO_639_language_code", "font_group_id", "font_name_id", "url_type", "URL" y similares) para descargar, desde el servidor en la red, el archivo de la fuente especificada por la información de especificación de fuentes incluida en el TTML incluido en el flujo de subtítulos.

Además, bajo el control de la CPU 221, el descodificador de subtítulos 210 convierte los datos de texto (datos de fuente) del subtítulo de cada posición (región) de visualización de subtítulos incluida en el TTML en datos de mapa de bits (información de imagen binaria). En este caso, bajo el control de la CPU 221, el tamaño de fuente del subtítulo se ajusta adecuadamente a partir del tamaño de fuente especificado en el TTML dependiendo del tamaño de la posición de visualización de subtítulos determinada por información de posición de visualización de subtítulos u obtenida al someterse a un procesamiento de redimensionamiento adicional.

La CPU 221 determina la posición de visualización de subtítulos en función de la información de posición de visualización de subtítulos y, además, realiza un procesamiento de redimensionamiento en la posición de visualización de subtítulos determinada, según sea necesario. En este momento, la CPU 221 utiliza adecuadamente la información auxiliar (información referente al procesamiento de redimensionamiento, información para determinar el intervalo de visualización de subtítulos) insertada en el TTML, el paquete PES, la PMT o similar, como se describió anteriormente. Más adelante se describirán los detalles de un procedimiento de procesamiento de determinación y redimensionamiento de la posición de visualización de subtítulos en la CPU 221.

Además, bajo el control de la CPU 221, el descodificador de subtítulos 210 utiliza el archivo de la fuente especificada por la información de especificación de fuentes incluida en el TTML al obtener los datos de mapa de bits del subtítulo. Cuando el receptor de televisión 200 no monta el archivo de la fuente especificada por la información de especificación de fuentes, la CPU 221 descarga y utiliza adecuadamente el archivo de fuentes a partir de la señal de radiodifusión (flujo de transporte TS) o del servidor en la red basándose en la información de descarga insertada en el paquete PES, la PMT o similares, como se describió anteriormente. Cabe destacar que, cuando el archivo no se puede descargar, se utiliza un archivo de fuentes sustituto (por ejemplo, un archivo de fuentes predeterminado). Más adelante se describirán detalles de un procedimiento de procesamiento de determinación del archivo de fuentes que se utilizará en la CPU 221.

Bajo el control de la CPU 221, la unidad de superposición de vídeo 204 superpone los datos de mapa de bits del subtítulo en cada posición de visualización de subtítulos obtenida por el descodificador de subtítulos 210 en los datos de vídeo obtenidos por el descodificador de vídeo 203 para obtener los datos de vídeo para su visualización. En este caso, la CPU 221 realiza un control para que la posición superpuesta de los datos de mapa de bits de subtítulos se convierta en la posición de visualización de subtítulos, en función de la posición de visualización de subtítulos determinada por la información de posición de visualización de subtítulos u obtenida al someterse a un procesamiento de redimensionamiento adicional como se describió anteriormente.

El circuito de activación de panel 205 activa el panel de visualización 206 en función de los datos de vídeo para su visualización obtenidos por la unidad de superposición de vídeo 204. El panel de visualización 206 está configurado, por ejemplo, por una pantalla de cristal líquido (LCD), una pantalla de electroluminiscencia orgánica (EL) y similares.

Se describe brevemente el funcionamiento del receptor de televisión 200 ilustrado en la Fig. 35. En la unidad de recepción 201, el flujo de transporte TS se recibe cargado en la onda de radiodifusión y se transmite desde el sistema de transmisión mediante radiodifusión 100. El flujo de transporte TS incluye el flujo de vídeo, el flujo de audio y el flujo de subtítulos. El flujo de transporte TS se suministra a la unidad de análisis de TS 202. La unidad de análisis de TS 202 extrae el paquete PES de cada uno de los flujos de vídeo, audio y subtítulos, del flujo de transporte TS.

Además, la unidad de análisis de TS 202 extrae diversos tipos de información insertada en el flujo de transporte TS y transmite la información a la CPU 221. La información también incluye el descriptor de visualización TTML, el descriptor de descarga de fuentes y el descriptor de señalización de URL.

Por lo tanto, la CPU 221 adquiere la información auxiliar (información relacionada con el procesamiento de dimensionamiento, información para determinar el intervalo de visualización de subtítulos que se utilizará cuando se muestre el subtítulo mediante el uso de la información de posición de visualización de subtítulos del TTML incluido en el flujo de subtítulos). Además, la CPU 221 adquiere la información de descarga para descargar desde la señal de radiodifusión (flujo de transporte TS) o el servidor en la red el archivo de la fuente especificada por la información de especificación de fuentes incluida en el TTML incluido en el flujo de subtítulos.

Además, al descargarse desde la señal de radiodifusión (flujo de transporte TS) el archivo de la fuente especificada por la información de especificación de fuentes incluida en el TTML incluido en el flujo de subtítulos, la unidad de análisis de TS 202 extrae la FDT del flujo de transporte TS y transmite la FDT a la CPU 221. Por consiguiente, la CPU 221 adquiere el archivo de la fuente especificada por la información de especificación de fuentes incluida en el TTML incluido en el flujo de subtítulos.

El paquete PES de vídeo extraído por la unidad de análisis de TS 202 se suministra al descodificador de vídeo 203. El descodificador de vídeo 203 realiza un procesamiento de descodificación en el paquete PES de vídeo para obtener los datos de vídeo. En este caso, el descodificador de vídeo 203 también realiza una conversión de resolución de los datos de vídeo según corresponda, dependiendo del modo de visualización o similares.

Además, el paquete PES de subtítulos extraído por la unidad de análisis de TS 202 se suministra al descodificador de subtítulos 210. El descodificador de subtítulos 210 realiza un procesamiento de descodificación en el paquete PES de subtítulos obtenido por la unidad de análisis de TS 202 para obtener el TTML. El TTML se transmite a la CPU 221. A partir del TTML, la CPU 221 adquiere la información de posición de visualización de subtítulos para especificar la posición (región) de visualización de subtítulos como la posición relativa (valor proporcional) con respecto al intervalo de visualización de subtítulos y, además, la información auxiliar (información referente al procesamiento de redimensionamiento, información para determinar el intervalo de visualización de subtítulos) que se utilizará cuando se muestre el subtítulo mediante el uso de la información de posición de visualización de subtítulos y similares.

Además, el descodificador de subtítulos 210 extrae el segmento de visualización TTML, el segmento de descarga de fuentes y el segmento de señalización de URL del paquete PES de subtítulos obtenido por la unidad de análisis de TS 202 y transmite los segmentos a la CPU 221.

Bajo el control de la CPU 221, el descodificador de subtítulos 210 convierte los datos de texto (datos de fuente) del subtítulo de cada posición (región) de visualización de subtítulos incluida en el TTML en datos de mapa de bits (información de imagen binaria). En este caso, bajo el control de la CPU 221, el tamaño de fuente del subtítulo se ajusta adecuadamente a partir del tamaño de fuente especificado en el TTML dependiendo del tamaño de la posición de visualización de subtítulos determinada por información de posición de visualización de subtítulos u obtenida al someterse a un procesamiento de redimensionamiento adicional.

Además, en este caso, cuando se obtienen los datos de mapa de bits del subtítulo, básicamente, el archivo se utiliza de la fuente especificada por la información de especificación de fuentes incluida en el TTML. Cuando el receptor de televisión 200 no monta el archivo de la fuente especificada por la información de especificación de fuentes, el archivo de fuentes se descarga y se usa a partir de la señal de radiodifusión (flujo de transporte TS) o del servidor en la red basándose en la información de descarga insertada en el paquete PES, la PMT o similares. En este momento, cuando el archivo de fuentes no se puede descargar, se utiliza un archivo de fuentes sustituto.

La CPU 221 determina la posición de visualización de subtítulos en función de la información de posición de visualización de subtítulos y, además, realiza un procesamiento de redimensionamiento en la posición de visualización de subtítulos determinada, según sea necesario. En este momento, la CPU 221 utiliza adecuadamente la información auxiliar (información referente al procesamiento de redimensionamiento, información para determinar el intervalo de visualización de subtítulos) insertada en el TTML, el paquete PES, la PMT o similar, como se describió anteriormente.

Los datos de mapa de bits de cada salida de posición de visualización de subtítulos del descodificador de subtítulos 210 se suministran a la unidad de superposición de vídeo 204. La unidad de superposición de vídeo 204 superpone los datos de mapa de bits del subtítulo en cada posición de visualización de subtítulos obtenida por el descodificador de subtítulos 210 en los datos de vídeo obtenidos por el descodificador de vídeo 203 para obtener los datos de vídeo para su visualización. En este caso, la CPU 221 realiza un control para que la posición superpuesta de los datos de mapa de bits de subtítulos se convierta en la posición de visualización de subtítulos, en función de la posición de visualización de subtítulos determinada por la información de posición de visualización de subtítulos u obtenida al someterse a un procesamiento de redimensionamiento adicional.

Los datos de vídeo para su visualización obtenidos por la unidad de superposición de vídeo 204 se suministran al circuito de activación de panel 205. En el circuito de activación de panel 205, el panel de visualización 206 se activa en función de los datos de vídeo para su visualización. Por lo tanto, el panel de visualización 206 muestra una imagen en la que el subtítulo se superpone en cada posición (región) de visualización de subtítulos.

Además, el paquete PES de audio extraído por la unidad de análisis de TS 202 se suministra al descodificador de audio 207. El descodificador de audio 207 realiza un procesamiento de descodificación en el paquete PES de audio para obtener datos de audio. Los datos de audio se suministran al circuito de salida de audio 208. El circuito de salida de audio 208 realiza, en los datos de audio, el procesamiento necesario, tal como conversión D/A o amplificación. A continuación, los datos de audio después del procesamiento se suministran al altavoz 209. Por lo tanto, la salida de audio correspondiente a la imagen de visualización en el panel de visualización 206 se obtiene del altavoz 209.

"Procedimiento de procesamiento de determinación y redimensionamiento de la posición de visualización de subtítulos"

Se describirán los detalles del procedimiento de procesamiento de determinación y redimensionamiento de la posición de visualización de subtítulos en la CPU 221. El diagrama de flujo de la Fig. 36 ilustra un ejemplo del procedimiento de procesamiento de determinación y redimensionamiento de la posición de visualización de subtítulos en la CPU 221.

En el ejemplo, se supone que la relación de aspecto del área de vídeo es 16:9. Entonces, se supone que hay casos en los que el intervalo de visualización de subtítulos no se especifica en el TTML, como se ilustra en la Fig. 37(a), y en los que el intervalo de visualización de subtítulos se especifica en el TTML, como se ilustra en las Figs. 37(b) y 37(c). Cabe señalar que, aquí, se ilustra un ejemplo en el que la relación de aspecto del intervalo de visualización de subtítulos especificado es 16:9 y 4:3; sin embargo, la relación de aspecto del intervalo de visualización de subtítulos especificado no se limita a esto. Además, aquí, se supone que hay casos en los que la relación de aspecto del monitor (dispositivo de visualización) es 16:9, y en los que la relación de aspecto es 4:3.

La CPU 221 comienza el procesamiento en la etapa ST1 y, a continuación, procede con el procesamiento en la etapa ST2. En la etapa ST2, la CPU 221 determina si la visualización del receptor se encuentra o no en un modo para visualizar toda el área de vídeo. Por ejemplo, en un caso en el que la relación de aspecto del monitor es 16:9 (véase la Fig. 37(f)) o en un caso en el que la relación de aspecto del monitor es 4:3 y se utiliza el procedimiento de visualización de tipo buzón (véase la Fig. 37(g)), se determina que la visualización se encuentra en el modo en el que se visualiza toda el área de vídeo. Además, por ejemplo, en un caso en el que la relación de aspecto del monitor es 4:3 y se utiliza el procedimiento de visualización de corte central (véase la Fig. 37(h)), se determina que la visualización se encuentra en un modo en el que no se visualiza toda el área de vídeo.

Cuando se determina que la visualización se encuentra en el modo para visualizar toda el área de vídeo, la CPU 221 procede con el procesamiento en la etapa ST3. En la etapa ST3, la CPU 221 determina si el intervalo de visualización de subtítulos está especificado o no. Por ejemplo, en un caso en el que información de punto de referencia (RPoffset) e información de relación de aspecto (dispasp) del intervalo de visualización de subtítulos están presentes en el contenedor raíz tt del TTML, se determina que el intervalo de visualización de subtítulos está especificado.

Cuando no se especifica el intervalo de visualización de subtítulos, la CPU 221 procede con el procesamiento en la etapa ST4. En la etapa ST4, la CPU 221 establece el área de vídeo de visualización como el intervalo de visualización de subtítulos y determina la posición (región) de visualización de subtítulos. En este momento, la CPU 221 establece la parte superior izquierda del área de vídeo de visualización como un punto de referencia RP, y determina la posición (región) de visualización de subtítulos de acuerdo con una instrucción de la información de posición de visualización de subtítulos (''origin=''OH% OV%'"', ''extent=''EH% EV%'"') especificada como la posición relativa con respecto al intervalo de visualización de subtítulos.

La Fig. 38(a) ilustra un ejemplo en un caso en el que la relación de aspecto del monitor es 16:9. La Fig. 38(b) ilustra un ejemplo en un caso en el que la relación de aspecto del monitor es 4:3 y se utiliza el procedimiento de visualización de tipo buzón. Cabe destacar que ''RP'' indica el punto de referencia, que es la parte superior izquierda del intervalo de visualización de subtítulos.

Después del procesamiento en la etapa ST4, la CPU 221 finaliza el procesamiento en la etapa ST5.

Cuando el intervalo de visualización de subtítulos se especifica en la etapa ST3 descrita anteriormente, la CPU 221 procede con el procesamiento en la etapa ST6. En la etapa ST6, la CPU 221 determina la posición (región) de visualización de subtítulos en el intervalo de visualización de subtítulos especificado. En este momento, la CPU 221 utiliza solo la información de relación de aspecto (dispasp) como la información en el intervalo de visualización de subtítulos y establece el intervalo de visualización de subtítulos en el área de vídeo de visualización. A continuación, la CPU 221 establece la parte superior izquierda del intervalo de visualización de subtítulos como el punto de referencia RP, y determina la posición (región) de visualización de subtítulos de acuerdo con la instrucción de la información de posición de visualización de subtítulos ("origin="OH% OV%'"', "extent="EH% EV%'"') especificada como la posición relativa con respecto al intervalo de visualización de subtítulos.

La Fig. 39(a) ilustra un ejemplo en un caso en el que la relación de aspecto del monitor es 16:9 y la relación de aspecto indicada por la información de relación de aspecto (dispasp) es 16:9. La Fig. 39(b) ilustra un ejemplo en un caso en el que la relación de aspecto del monitor es 16:9 y la relación de aspecto indicada por la información de relación de aspecto (dispasp) es 4:3.

Cabe señalar que, en un caso en el que la relación de aspecto indicada por la información de relación de aspecto (dispasp) es diferente de la relación de aspecto del monitor como se describió anteriormente, la CPU 221 establece, en el centro del área de vídeo de visualización, el intervalo de visualización de subtítulos cuyo ancho de dirección vertical o ancho de dirección horizontal coincide y que tiene la relación de aspecto indicada por la información de relación de aspecto (dispasp). En el ejemplo ilustrado, dado que la relación de aspecto del monitor es 16:9 y la información de relación de aspecto (dispasp) es 4:3, los anchos de dirección vertical coinciden entre sí.

La Fig. 39(c) ilustra un ejemplo en un caso en el que la relación de aspecto del monitor es 4:3 y se utiliza el procedimiento de visualización de tipo buzón y la relación de aspecto indicada por la información de relación de aspecto (dispasp) es 16:9. La Fig. 39(d) ilustra un ejemplo en un caso en el que la relación de aspecto del monitor es 4:3 y se utiliza el procedimiento de visualización de tipo buzón y la relación de aspecto indicada por la información de relación de aspecto (dispasp) es 4:3.

Después del procesamiento en la etapa ST6, la CPU 221 finaliza el procesamiento en la etapa ST5.

Cuando se determina que la visualización se encuentra en el modo en el que no se visualiza toda el área de vídeo en la etapa ST2 descrita anteriormente, el procesamiento procede con la etapa ST7. En la etapa ST7, la CPU 221 determina si el intervalo de visualización de subtítulos está especificado o no. Por ejemplo, en un caso en el que información de punto de referencia (RPoffset) e información de relación de aspecto (dispasp) del intervalo de visualización de subtítulos están presentes en el contenedor raíz tt del TTML, se determina que el intervalo de visualización de subtítulos está especificado.

Cuando no se especifica el intervalo de visualización de subtítulos, la CPU 221 procede con el procesamiento en la etapa ST8. En la etapa ST8, la CPU 221 establece el área de vídeo de visualización como el intervalo de visualización de subtítulos y determina la posición (región) de visualización de subtítulos. En este momento, la CPU 221 establece la parte superior izquierda del área de vídeo de visualización como un punto de referencia RP, y determina la posición (región) de visualización de subtítulos de acuerdo con una instrucción de la información de posición de visualización de subtítulos ("origin="OH% OV%"", "extent="EH% EV%"") especificada como la posición relativa con respecto al intervalo de visualización de subtítulos.

En la posición de visualización de subtítulos determinada de este modo, el ancho se comprime solo en la dirección horizontal. Por esa razón, la CPU 221 realiza además un procesamiento de redimensionamiento en la posición de visualización de subtítulos determinada, para comprimir también el ancho en la dirección vertical, y obtiene la posición de visualización de subtítulos final. En este caso, la CPU 221 comprime el ancho en la dirección vertical en un estado en el que la posición de línea predeterminada se fija en función de la información de "dto:scalingjustify=top" incluida en el TTML, por ejemplo.

La Fig. 40(a) ilustra un ejemplo en un caso en el que la relación de aspecto del monitor es 4:3 y se utiliza el procedimiento de visualización de corte central. El ancho en la dirección vertical de la posición de visualización de subtítulos se comprime de EV% a EVu% mediante el procesamiento de redimensionamiento.

Después del procesamiento en la etapa ST8, la CPU 221 finaliza el procesamiento en la etapa ST5.

Cuando el intervalo de visualización de subtítulos se especifica en la etapa ST7 descrita anteriormente, la CPU 221 procede con el procesamiento en la etapa ST9. En la etapa ST9, la CPU 221 determina la posición (región) de visualización de subtítulos en el intervalo de visualización de subtítulos especificado. En este momento, la CPU 221 utiliza la información en el intervalo de visualización de subtítulos (información de punto de referencia (RPoffset), información de relación de aspecto (dispasp)) para establecer el intervalo de visualización de subtítulos en el área de vídeo de visualización.

En este caso, la CPU 221 establece, como la parte superior izquierda del intervalo de visualización de subtítulos, una posición desplazada desde la parte superior izquierda del área de vídeo de visualización por la información de punto de referencia (RPoffset), y establece un intervalo correspondiente a la relación de aspecto indicada por la información de relación de aspecto (dispasp) en el intervalo de visualización de subtítulos. En este caso, el ancho de dirección horizontal del intervalo de visualización de subtítulos coincide con el ancho de dirección horizontal del área de vídeo de visualización.

A continuación, la CPU 221 establece, como punto de referencia RF, la parte superior izquierda del intervalo de visualización de subtítulos como se describió anteriormente, y determina la posición (región) de visualización de subtítulos de acuerdo con la instrucción de la información de posición de visualización de subtítulos ("origin="OH% OV%'"', ''extent='EH% EV%'"') especificada como la posición relativa con respecto al intervalo de visualización de subtítulos.

La Fig. 40(b) ilustra un ejemplo en un caso en el que la relación de aspecto del monitor es 4:3 y se utiliza el procedimiento de visualización de corte central, y la relación de aspecto indicada por la información de relación de aspecto (dispasp) es 16:9. La Fig. 40(c) ilustra un ejemplo en un caso en el que la relación de aspecto del monitor es 4:3 y se utiliza el procedimiento de visualización de corte central, y la relación de aspecto indicada por la información de relación de aspecto (dispasp) es 4:3.

Después del procesamiento en la etapa ST9, la CPU 221 finaliza el procesamiento en la etapa ST5.

"Procedimiento de procesamiento de determinación de archivo de fuentes a utilizar"

Se describirán los detalles del procedimiento de procesamiento de determinación del archivo de fuentes que se utilizará en la CPU 221. El diagrama de flujo de la Fig. 41 ilustra un ejemplo del procedimiento de procesamiento de determinación del archivo de fuentes que se utilizará en la CPU 221.

La CPU 221 comienza el procesamiento en la etapa ST11 y, a continuación, procede con el procesamiento en la etapa ST12. En la etapa ST12, la CPU 221 recibe la especificación de fuentes en el TTML. Es decir, la CPU 221 recibe el TTML que incluye la información de especificación de fuentes desde el descodificador de subtítulos 210.

A continuación, en la etapa ST13, la CPU 221 determina si el receptor de televisión 200 monta o no un archivo de fuentes específico, un archivo de fuentes especificado por la información de especificación de fuentes del TTML. Cuando se determina que el archivo de fuentes especificado está montado, la CPU 221 determina utilizar el archivo de fuentes especificado montado en la etapa ST14 y, a continuación, finaliza el procesamiento en la etapa ST15.

Cuando se determina que el archivo de fuentes especificado no está montado en la etapa ST13, la CPU 221 determina si el relleno de fuentes especificado se suministra o no en la tabla de secciones privada, es decir, la FDT (tabla Font_downloading_section) en la etapa ST16. Aquí, en un caso en el que el segmento de descarga de fuentes (Font_download_segment) (véase la Fig. 18) o el descriptor de descarga de fuentes (Font_download_descriptor) (véase la Fig. 23) incluye la información de descarga del archivo de fuentes especificado, la CPU 221 determina que el archivo de fuentes especificado se suministra en la FDT.

Cuando se determina que el archivo de fuentes especificado se suministra en la FDT, en la etapa ST17, la CPU 221 determina si el archivo de fuentes especificado puede descargarse o no de la transmisión de carrusel. Cuando el archivo de fuentes especificado puede descargarse, la CPU 221 determina utilizar el archivo de fuentes especificado descargado en la etapa ST14 y, a continuación, finaliza el procesamiento en la etapa ST 15.

Cuando el archivo de fuentes especificado no se puede descargar en la etapa ST17, la CPU 221 procede con el procesamiento en la etapa ST18. Cuando se determina que el archivo de fuentes especificado no se suministra en la FDT en la etapa ST 16, la CPU 221 también procede con el procesamiento en la etapa ST18.

En la etapa ST18, la CPU 221 determina si existe o no información de URL para descargar el archivo de fuentes especificado. Aquí, en un caso en el que el segmento de señalización de URL (URL_signalin_segment) (véase la Fig. 20) o el descriptor de señalización de URL (URL_signaling_descriptor) (véase la Fig. 24) incluye la información de URL para descargar el archivo de fuentes especificado, la CPU 221 determina que existe la información de URL para descargar el archivo de fuentes especificado.

Cuando se determina que existe la información de URL para descargar el archivo de fuentes especificado, en la etapa ST 19, la CPU 221 determina si el archivo de fuentes especificado puede descargarse o no desde el servidor en la red. Cuando el archivo de fuentes especificado puede descargarse, la CPU 221 determina utilizar el archivo de fuentes especificado descargado en la etapa ST14 y, a continuación, finaliza el procesamiento en la etapa ST15.

Cuando el archivo de fuentes especificado no se puede descargar en la etapa ST19, la CPU 221 procede con el procesamiento en la etapa ST20. Cuando se determina que no existe información de URL para descargar el archivo de fuentes especificado en la etapa ST18, la CPU 221 también procede con el procesamiento en la etapa ST20.

En la etapa ST20, la CPU 221 determina no utilizar el archivo de fuentes especificado sino utilizar un archivo de fuentes sustituto, por ejemplo, un archivo de un conjunto de fuentes predeterminado y, a continuación, finaliza el procesamiento en la etapa ST15.

Tal como se describió anteriormente, en el sistema de transmisión/recepción 10 ilustrado en la Fig. 1, el sistema de transmisión mediante radiodifusión 100 inserta, en el contenedor de flujo de subtítulos (por ejemplo, paquete PES, PMT), la información auxiliar (información relacionada con el procesamiento de redimensionamiento, información para determinar el intervalo de visualización de subtítulos) que se utilizará cuando se muestre el subtítulo mediante el uso de la información de posición de subtítulos. Por esa razón, en el lado de recepción, mediante el uso de la información auxiliar junto con la información de posición de subtítulos, se hace posible adquirir adecuadamente la posición de visualización de subtítulos y realizar satisfactoriamente una visualización de subtítulos.

Además, en el sistema de transmisión/recepción 10 ilustrado en la Fig. 1, el receptor de televisión 200 realiza el control de posición de visualización en los datos de mapa de bits del subtítulo basándose en la posición de visualización de subtítulos adquirida mediante el uso de la información de posición de visualización de subtítulos y la información auxiliar. Por esa razón, se hace posible realizar satisfactoriamente una visualización de subtítulos.

Además, en el sistema de transmisión/recepción 10 ilustrado en la Fig. 1, el sistema de transmisión mediante radiodifusión 100 inserta, en el contenedor del flujo de subtítulos (por ejemplo, paquete PES, PMT), la información de descarga para descargar el archivo de la fuente especificada por al menos la información de especificación de fuente del TTML. Por esa razón, en el lado de recepción, en un caso en el que el archivo de la fuente especificada por la información de especificación de fuentes no se incluye, se hace posible adquirir el archivo de la fuente especificada por la información de especificación de fuentes en función de la información de descarga y realizar satisfactoriamente una visualización de subtítulos.

Además, en el sistema de transmisión/recepción 10 ilustrado en la Fig. 1, el receptor de televisión 200 adquiere el archivo de fuentes de la fuente especificada por la información de especificación de fuentes basándose en la información de descarga, y utiliza el archivo de fuentes cuando obtiene los datos de mapa de bits del subtítulo. Por esa razón, incluso en un caso en el que el archivo de la fuente especificada por la información de especificación de fuentes no se incluye, se hace posible realizar satisfactoriamente una visualización de subtítulos.

<2. Modificaciones>

En la forma de realización anterior, se ha descrito un ejemplo en el que la información de descarga de fuentes no se inserta en TTML (véanse las Fig. 3 y 5). Sin embargo, es concebible insertar la información de descarga de fuentes en el TTML. La Fig. 42 ilustra un ejemplo de una estructura TTML en ese caso. El ejemplo es un caso en el que hay dos posiciones (regiones) de visualización de subtítulos de manera similar al caso de la Fig. 5.

Cada fragmento de información de "fontdlurl=http://www.w3.org/ns/fontdlservice", "fontdlurl:iso6391anguagecode="value"","" fontdlurl:fontgroupid="value"", "fontdlurl:fontnameid="value"" y "fontdlurl:fontname="value"" constituye información de descarga. Cabe destacar que las especificaciones de 'Arial' y 'Tahoma' se reflejan como están en el "value" (valor) de "fontdlurl:fontname".

Además, en la forma de realización descrita anteriormente, se ha descrito un ejemplo en el que el TTML se utiliza como información de texto del subtítulo de un formato predeterminado. Sin embargo, la presente tecnología no se limita a esto, y también es concebible utilizar otra información de texto que incluya información equivalente al TTML. Por ejemplo, se puede usar un formato derivado del TTML.

Además, en la forma de realización anterior, se ha descrito el sistema de transmisión/recepción 10 configurado por el sistema de transmisión mediante radiodifusión 100 y el receptor de televisión 200; sin embargo, la configuración del sistema de transmisión/recepción al que se puede aplicar la presente tecnología no se limita a esto. Por ejemplo, el receptor de televisión 200 puede tener una configuración de un descodificador y un monitor conectados juntos a través de una interfaz digital tal como una interfaz multimedia de alta definición (HDMI). Cabe destacar que ''HDMI" es una marca registrada.

Además, en la forma de realización descrita anteriormente, se ha descrito un ejemplo en el que el contenedor es el flujo de transporte TS de MPEG-2. Huelga decir que la presente tecnología se puede aplicar de manera similar a un caso en el que el contenedor es un flujo de transporte de MMT, un flujo DASH/ISOBMFF o similares.

La característica principal de la presente tecnología es que al insertar, en el contenedor del flujo de subtítulos (por ejemplo, paquete PES, PMT), la información auxiliar (información relacionada con el procesamiento de redimensionamiento, información para determinar el intervalo de visualización de subtítulos) que se utilizará cuando se muestre el subtítulo mediante el uso de la información de posición de subtítulos, en el lado de recepción, se hace posible adquirir adecuadamente la posición de visualización de subtítulos mediante el uso de la información auxiliar junto con la información de posición de subtítulos y realizar satisfactoriamente la visualización de subtítulos (véase la Fig. 34).

Además, la característica principal de la presente tecnología es que al insertar, en el contenedor (por ejemplo, paquete PES, PMT) del flujo de subtítulos, la información de descarga para descargar el archivo de la fuente especificada por al menos la información de especificación de fuentes del TTML, en un caso en el que el archivo de la fuente especificada por la información de especificación de fuentes no se incluye, se hace posible adquirir el archivo de la fuente especificada por la información de especificación de fuentes en función de la información de descarga y realizar satisfactoriamente la visualización de subtítulos (véase la Fig. 34).

LISTA DE SIGNOS DE REFERENCIA

10 Sistema de transmisión/recepción

100 Sistema de transmisión mediante radiodifusión

110 Unidad de generación de flujo

111 Unidad de control

112 Codificador de vídeo

113 Codificador de audio

114 Unidad de conversión de formato de texto

115 Codificador de subtítulos

116 Formateador de TS

200 Receptor de televisión

201 Unidad de recepción

202 Unidad de análisis de TS

203 Descodificador de vídeo

204 Unidad de superposición de vídeo

205 Circuito de activación de panel

206 Panel de visualización

207 Descodificador de audio

208 Circuito de salida de audio

209 Altavoz

210 Descodificador de subtítulos

221 CPU

227 Interfaz de comunicación

Claims

REIVINDICACIONES

1. Un dispositivo de transmisión, que comprende:

una unidad de transmisión que transmite un contenedor de un formato predeterminado, donde el contenedor incluye un flujo de vídeo que incluye datos de vídeo y un flujo de subtítulos que incluye información de texto de un subtítulo, donde la información de texto incluye información de posición de visualización de subtítulos para especificar una posición de visualización de subtítulos como una posición relativa con respecto a un intervalo de visualización de subtítulos, donde el intervalo de visualización de subtítulos es un área establecida en un área de vídeo de visualización para mostrar el subtítulo, y el área de vídeo de visualización es un área de vídeo mostrada en un monitor en un lado de recepción; y

una unidad de inserción de información (116) que inserta, en un contenedor del flujo de subtítulos, información auxiliar que se utilizará cuando se muestre el subtítulo mediante el uso de la información de posición de visualización de subtítulos, donde la información auxiliar incluye información para determinar el intervalo de visualización de subtítulos.

2. El dispositivo de transmisión de acuerdo con la reivindicación 1, en el que

la información auxiliar incluye información con respecto al procesamiento de redimensionamiento de la posición de visualización de subtítulos determinada en función de la información de posición de visualización de subtítulos, donde el procesamiento de redimensionamiento se realiza en el lado de recepción en un caso en el que una relación de aspecto del área de vídeo es diferente de una relación de aspecto del área de vídeo de visualización.

3. El dispositivo de transmisión de acuerdo con la reivindicación 2, en el que

la información referente al procesamiento de redimensionamiento es información que indica una posición de línea que se establece como una posición fija en un caso en el que un tamaño en la dirección vertical se comprime en el procesamiento de redimensionamiento de la posición de visualización de subtítulos.

4. El dispositivo de transmisión de acuerdo con la reivindicación 1, en el que

la información para determinar el intervalo de visualización de subtítulos es información de punto de referencia e información de relación de aspecto del intervalo de visualización de subtítulos.

5. El dispositivo de transmisión de acuerdo con una cualquiera de las reivindicaciones anteriores, en el que la unidad de inserción de información (116) inserta la información auxiliar en un paquete de flujo elemental empaquetado, PES, y/o una tabla de mapas de programas.

6. El dispositivo de transmisión según una cualquiera de las reivindicaciones anteriores, en el que la información de texto incluye información de especificación de fuente, y la unidad de inserción de información inserta en el contenedor del flujo de subtítulos información de descarga para descargar un archivo de una fuente especificada por al menos la información de especificación de fuentes.

7. El dispositivo de transmisión de acuerdo con la reivindicación 6, en el que

la información de descarga es información para adquirir un archivo de la fuente a partir de una señal de radiodifusión.

8. El dispositivo de transmisión de acuerdo con la reivindicación 6 o 7, en el que

la información de descarga es información para adquirir un archivo de la fuente desde un servidor en una red.

9. El dispositivo de transmisión de acuerdo con una cualquiera de las reivindicaciones 6 a 8, en el que

la unidad de inserción de información (116) inserta la información de descarga en un paquete de flujo elemental empaquetado, PES, y/o una tabla de mapas de programas.

10. El dispositivo de transmisión de acuerdo con una cualquiera de las reivindicaciones 1 a 9, que comprende:

una unidad de inserción de tabla de secciones que inserta de forma secuencial y repetida un número predeterminado de tablas de secciones, que incluyen, respectivamente, diferentes archivos de fuentes, en un flujo de transporte, y

la unidad de transmisión transmite el flujo de transporte en el que se insertan las tablas de sección.

11. Un dispositivo de recepción, que comprende:

una unidad de recepción (201) que recibe un contenedor de un formato predeterminado, donde el contenedor incluye un flujo de vídeo que incluye datos de vídeo y un flujo de subtítulos que incluye información de texto de un subtítulo, donde la información de texto incluye información de posición de visualización de subtítulos para especificar una posición de visualización de subtítulos como una posición relativa con respecto a un intervalo de visualización de subtítulos, donde el intervalo de visualización de subtítulos es un área establecida en un área de vídeo de visualización para mostrar el subtítulo, y el área de vídeo de visualización es un área de vídeo mostrada en un monitor; y

una unidad de control (221) que controla el procesamiento de descodificación del flujo de vídeo para obtener los datos de vídeo, el procesamiento de descodificación del flujo de subtítulos para obtener datos de mapa de bits del subtítulo, el procesamiento de realizar el control de posición de visualización en los datos de mapa de bits del subtítulo en función de la posición de visualización de subtítulos adquirida mediante el uso de la información de posición de visualización de subtítulos y la información auxiliar que se utilizará cuando se muestre el subtítulo mediante el uso de la información de posición de subtítulos insertada en un contenedor del flujo de subtítulos, y el procesamiento de superposición de los datos de mapa de bits del subtítulo sometido al control de posición de visualización en los datos de vídeo, donde la información auxiliar se extrae de un contenedor del flujo de subtítulos e incluye información para determinar el intervalo de visualización de subtítulos.

12. El dispositivo de recepción de acuerdo con la reivindicación 11, en el que

la información auxiliar incluye información referente al procesamiento de redimensionamiento de la posición de visualización de subtítulos determinada en función de la información de posición de visualización de subtítulos, donde el procesamiento de redimensionamiento se realiza en el lado de recepción en un caso en el que una relación de aspecto de un área de vídeo es diferente de una relación de aspecto de un área de vídeo de visualización, y en el procesamiento de realizar el control de posición de visualización,

en el caso en el que la relación de aspecto del área de vídeo es diferente de la relación de aspecto del área de vídeo de visualización, el área de vídeo de visualización se establece como el intervalo de visualización de subtítulos y la posición de visualización de subtítulos se determina en función de la información de posición de visualización de subtítulos, el procesamiento de redimensionamiento se realiza mediante el uso de la información referente al procesamiento de redimensionamiento en la posición de visualización de subtítulos determinada y el control de posición de visualización se realiza en los datos de mapa de bits del subtítulo en función de la posición de visualización de subtítulos sometida al procesamiento de redimensionamiento.

13. El dispositivo de recepción de acuerdo con la reivindicación 11, en el que

la información auxiliar incluye información para determinar el intervalo de visualización de subtítulos, y

en el procesamiento de realizar el control de posición de visualización,

en el caso en el que la relación de aspecto del área de vídeo es diferente de la relación de aspecto del área de vídeo de visualización, el intervalo de visualización de subtítulos se establece en el área de vídeo de visualización en función de la información para determinar el intervalo de visualización de subtítulos, la posición de visualización de subtítulos se determina en función de la información de posición de visualización de subtítulos y el control de posición de visualización se realiza en los datos de mapa de bits del subtítulo en función de la posición de visualización de subtítulos determinada.

14. El dispositivo de recepción según una cualquiera de las reivindicaciones 11 a 13, en el que la información de texto incluye información de especificación de fuentes y

la unidad de control controla el procesamiento de adquisición de un archivo de fuentes de una fuente especificada por la información de especificación de fuentes en función de la información de descarga para descargar un archivo de la fuente especificada por al menos la información de especificación de fuentes insertada en el contenedor del flujo de subtítulos, el procesamiento de descodificación del flujo de subtítulos y de obtención de datos de mapa de bits del subtítulo en función del archivo de fuente adquirido, y el procesamiento de superposición de los datos de mapa de bits del subtítulo en los datos de vídeo.