WO2017126937A1 - 방송 신호 송수신 방법 및 장치 - Google Patents

방송 신호 송수신 방법 및 장치 Download PDF

Info

Publication number
WO2017126937A1
WO2017126937A1 PCT/KR2017/000723 KR2017000723W WO2017126937A1 WO 2017126937 A1 WO2017126937 A1 WO 2017126937A1 KR 2017000723 W KR2017000723 W KR 2017000723W WO 2017126937 A1 WO2017126937 A1 WO 2017126937A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
font
data
stream
subtitle
Prior art date
Application number
PCT/KR2017/000723
Other languages
English (en)
French (fr)
Inventor
황수진
서종열
오세진
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to EP17741703.7A priority Critical patent/EP3407614A4/en
Publication of WO2017126937A1 publication Critical patent/WO2017126937A1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8543Content authoring using a description language, e.g. Multimedia and Hypermedia information coding Expert Group [MHEG], eXtensible Markup Language [XML]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/858Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot

Definitions

  • the present invention relates to an apparatus and method for transmitting and receiving broadcast signals.
  • broadcasting subtitle service is provided in the form of closed caption or DVB (Digital Video Broadcasting) subtitle.
  • DVB subtitles are provided in the form of a bitmap image. Therefore, subtitles of different sizes should be provided for images of various sizes, or services should be provided by scaling subtitles of a single standard. In this case, in the former case, the efficiency decreases in terms of bandwidth, and in the latter case, a sharpness due to scaling occurs.
  • the discussion of high-definition broadcasting service through UHDTV is being actively conducted, and a need for a new broadcasting subtitle service is emerging to solve this problem.
  • An object of the present invention is to improve transmission efficiency in a method and apparatus for transmitting a broadcast signal.
  • Another object of the present invention is to provide a transmission apparatus and method for providing a caption service in a broadcasting network.
  • Another object of the present invention is to provide an apparatus and method for providing a timed text subtitle service based on extensible markup language (XML).
  • XML extensible markup language
  • An apparatus for transmitting broadcast signals includes an encoder for generating a video stream by encoding video data, a multiplexer for generating a broadcast signal including the generated video stream and a subtitle stream, wherein the broadcast signal is the subtitle.
  • the apparatus may further include information for downloading font data associated with the caption data included in the stream, and an indicator indicating whether the font data is essential, and a transmitter for transmitting the generated broadcast signal.
  • the information for downloading the font data and an indicator indicating whether the font data is essential may be included in program specific information (PSI) or service information and transmitted.
  • PSI program specific information
  • the information for downloading the font data may be uniform / universal resource identifier (URI) information including a transaction ID.
  • URI uniform / universal resource identifier
  • the subtitle stream may further include information on a safe area that prevents cropping by the aspect ratio of the receiver when the subtitle data is displayed.
  • a broadcast signal receiving apparatus is a tuner for receiving a broadcast signal, wherein the broadcast signal includes a video stream and a subtitle stream, and the broadcast signal is font data associated with the subtitle data included in the subtitle stream. And an indicator indicating whether or not the font data is necessary for downloading information, and a demultiplexer for demultiplexing the received broadcast signal into the video stream and the subtitle stream, the video stream and the subtitle stream. And a decoder for decoding each, a network processor for downloading the font data based on information for downloading the font data, and a display processor for displaying the subtitle stream using the font data.
  • the information for downloading the font data and an indicator indicating whether the font data is essential may be included in program specific information (PSI) or service information and transmitted.
  • PSI program specific information
  • the information for downloading the font data may be uniform / universal resource identifier (URI) information including a transaction ID.
  • URI uniform / universal resource identifier
  • the subtitle stream may further include information on a safe area that prevents cropping by the aspect ratio of the receiver when the subtitle data is displayed.
  • a caption service may be provided in a broadcasting network.
  • the broadcast receiving apparatus and method may extract and display a caption included in a broadcast signal.
  • FIG. 1 is a diagram illustrating an XML-based broadcast subtitle service according to an embodiment of the present invention.
  • FIG. 2 illustrates a data field included in a PES packet according to an embodiment of the present invention.
  • FIG. 3 illustrates a font segment according to an embodiment of the present invention.
  • FIG 4 illustrates an extended font segment according to an embodiment of the present invention.
  • FIG. 5 illustrates a font segment according to another embodiment of the present invention.
  • FIG 6 illustrates font segment information for DSMCC according to an embodiment of the present invention.
  • FIG. 7 illustrates a further extended font segment in accordance with an embodiment of the present invention.
  • FIG. 8 illustrates a method of designating a safe area for caption data according to an embodiment of the present invention.
  • FIG 9 illustrates a data field of a PES packet including safe area information according to an embodiment of the present invention.
  • FIG. 10 illustrates a method of transmitting font information as signaling information according to an embodiment of the present invention.
  • FIG. 11 illustrates a method of transmitting safe area information as signaling information according to an embodiment of the present invention.
  • FIG. 12 illustrates a method of receiving font data using font information received through an EIT according to an embodiment of the present invention.
  • FIG. 13 illustrates a method of receiving font data using font information received through an EIT according to another embodiment of the present invention.
  • FIG. 14 illustrates a method of receiving font data using font information received through an EIT according to another embodiment of the present invention.
  • FIG. 15 illustrates a method of receiving font data using font information received through an EIT according to another embodiment of the present invention.
  • FIG. 16 is a diagram illustrating data information indication according to an embodiment of the present invention.
  • FIG 17 illustrates groupInfoIndication according to an embodiment of the present invention.
  • FIG. 18 is a diagram illustrating a font download method using PMT of a broadcast receiver according to an embodiment of the present invention.
  • FIG. 19 is a diagram illustrating a detailed configuration of a broadcast receiver according to an embodiment of the present invention.
  • 20 is a block diagram illustrating a broadcast transmitter according to an embodiment of the present invention.
  • 21 is a block diagram illustrating a broadcast receiver according to an embodiment of the present invention.
  • FIG. 22 illustrates a method of transmitting a broadcast signal including XML subtitles according to an embodiment of the present invention.
  • 23 is a diagram illustrating a method for receiving a broadcast signal including XML subtitles according to an embodiment of the present invention.
  • IP broadcasting subtitle service standards include XML based time text markup language (TTML), SMPTE-TT (Society of Motion Picture and Television Engineers Timed Text), and EBU-TT-D (European Broadcasting Union time text).
  • TTML time text markup language
  • SMPTE-TT Society of Motion Picture and Television Engineers Timed Text
  • EBU-TT-D European Broadcasting Union time text
  • DASH Dynamic Adaptive Streaming over HTTP
  • TTML time text markup language
  • EBU-TT EBU time text
  • Extensible Markup Language is a language that is an improvement of HTML. It has improved the homepage building function and search function, and can easily handle the complex data of the client system.
  • the caption data is used as a language, and the XML caption may be composed of a head and a body.
  • ES Electronic Stream
  • outputs of the video encoder and the audio encoder may be defined as a video ES and an audio ES, respectively.
  • the XML subtitle ES can be defined and used.
  • PES Packetized Elementary Stream
  • PES Packetized Elementary Stream
  • TS Transport Stream
  • TS is a transport stream including one or several programs in an MPEG-2 system and can be used for a transmission medium in which a transport error exists.
  • TS may mean a transport stream in which at least two of a video ES, an audio ES, and a subtitle ES are multiplexed and transmitted.
  • FIG. 1 is a diagram illustrating an XML-based broadcast subtitle service according to an embodiment of the present invention. 1 illustrates a diagram of a transmitter, a receiver, and an end-to-end system for a digital broadcast service.
  • the XML-based subtitles used in the present invention can be applied to both UHD / HD / SD since they are not affected by the size of the image.
  • the transmitting end transmits the compressed image and the transformed XML subtitle for transmission through a multiplexer, and uses PTS (presentation time stamp) information for synchronization between the two data.
  • a transmission terminal may receive video data and subtitle information.
  • the resolution of the video data input to the transmitter may be UHD, HD or SD.
  • the caption information input to the transmitting end may be written in XML or bitmap.
  • Video data input to the transmitting end may be encoded 101 at the transmitting end.
  • the transmitting end may use HEVC (High Efficiency Video Coding) as an encoding method for video data.
  • the transmitting end may synchronize and multiplex the encoded video data with the XML subtitles (102). Here the XML subtitle can be modified for transmission.
  • the XML subtitles can be transformed into XML subtitles ES and XML subtitles PES for transmission.
  • encoded video data and XML subtitles may be synchronized using PTS information.
  • the transmitter may perform channel coding and modulation 103 of the synchronized and multiplexed data and then transmit the broadcast signal as a broadcast signal.
  • the receiving end provides subtitles through video decoding and XML parser after demultiplexing, and performs synchronization between video data and subtitles based on PTS.
  • the receiving end may demodulate the received broadcast signal and perform transport packet decoding (104).
  • the decoded transport packet is input to the video decoder 106 and the subtitle processing (e.g., XML parsing) 107 after demultiplexing 105.
  • the video decoder 106 may decode the UHD, HD or SD video data according to the resolution of the received video data.
  • the video decoder 106 may use high efficiency video coding (HEVC) as a decoding method for video data.
  • Subtitle processor 107 may also extract XML subtitles. In this process, the receiving end may synchronize the video data with XML subtitles based on the PTS. Decoded video data and XML subtitles can be processed and displayed by the display processor 108.
  • a PES packet carrying a caption stream may include a PES data field (PES_data_field ()) in PES_packet_data_byte.
  • PES_data_field () may include a data identifier (data_identifier), a subtitle stream identifier (subtitle_stream_id), and a subtitling segment (subtitling_segment ()).
  • subtitling segment may include a synchronization byte (sync_byte), segment type information (segment_type), page identifier (page_id), segment length information (segment_length), and a segment data field (segment_data_field ()).
  • the data_identifier may identify that the stream included in the corresponding PES packet is a subtitle stream.
  • the subtitle_stream_id may identify different subtitle streams. This may indicate whether the subtitle stream is an existing bitmap based subtitle stream or a timed text based subtitle stream.
  • Segment_type that is, information included in the subtitling_segment (), may indicate the type of segment included in the segment_data_field () that follows. For example, when segment_type has a value of 0x20, this segment may represent a timed text (e.g .: EBU-TT-D, TTML, IMSC1, etc.) based subtitle segment. In addition, when segment_type has a value of 0x21, this may indicate that the segment includes font data used in timed text. In addition, when segment_type has a value of 0x22, this may indicate that the segment includes a safe area used for timed text. page_id may indicate an identifier for a group of segments associated with one subtitle.
  • the segments having the same page_id may represent segments used to construct the same subtitle.
  • subtitle data corresponding to Korean subtitles and subtitle data corresponding to English subtitles may be distinguished by different page_ids. That is, data included in one same service can be specified using page_id.
  • segment_length may indicate the length of segment data included in the following segment_data_field ().
  • segment_data_field () may include substantial segment data.
  • FIG. 3 illustrates a font segment according to an embodiment of the present invention.
  • This embodiment illustrates a case in which the segment_type described above is a font associated with a timed text based subtitle or a segment including download data for the font.
  • the aforementioned segment_data_field () may include the illustrated font_segment ().
  • font_segment () is font number information (num_fonts), language flag information (lang_flag), language information (language), font family length information (font_family_len), font family information (font_family_bytes ()), mime type length information (mime_type_len), mime At least one of type information (mime_type_bytes ()), transmission mode information (transport_mode), font data length information (font_data_len), font data information (font_data_bytes ()), URL length information (url_len), and URL information (url_bytes ()) It may include. num_fonts may indicate the number of subtitle-related fonts. The lang_flag may indicate whether language information of a following font exists.
  • font_family_len may indicate the length of the following font_family_bytes.
  • font_family_bytes () may include a font family of a corresponding font. That is, font_family_bytes () may include "default”, “monospace”, “sansSerif”, “serif”, “monospaceSansSerif”, “monospaceSerif”, “proportionalSansSerif”, “proportionalSerif”, etc.
  • mime_type_len is followed by mime_type_bytes ( Mime_type_bytes () may include the mime type associated with the font, for example, if mime_type_bytes () is in the Open Font Format, it may indicate application / font-sfnt, etc. In addition, this mime_type_bytes () May include the name of the font, for example, “arial.”
  • Transport_mode may indicate a mode for transmitting font data, for example, if the value of transport_mode is 0x00, font data may be assigned to the corresponding segment. If the value of the transport_mode is 0x01, it may indicate that the font data is transmitted through the data carousal in the broadcasting network, and the value of the transport_mode is 0.
  • font_data_len may indicate the length of font_data_bytes () font_data_bytes () may include the font data itself, and url_len is followed by url_bytes.
  • Url_bytes () can indicate the path to download the font data, for example, if the value of transport_mode is 0x01, url_bytes () is the data carousal (DSM-CC) in the broadcasting network. Etc.) may include a path for receiving font data, an object for delivering fonts, or information for identifying a data carousal.
  • the transport_mode value may indicate a URL on the Internet from which font data can be downloaded.
  • the URL can also be expressed as uri or urn. That is, the transport_mode may indicate a uniform concept of URI (uniform / universal resource identifier) instead of URL.
  • the description of the URL may be interpreted as a description of the URI.
  • the aforementioned url_bytes may be configured as follows.
  • font information when font information is delivered in the form of data / object carousel, it can be expressed as follows. dvb: //233a.1041.10bf.1e$3f0ab47c/font/serif/timesNewRoman.ttf
  • path-absolute may include information such as language, font family, mime type, and the like, to signal which font is a url. This may indicate that the font is for component 1e of service 10bf transmitted to TS 1041 in original network 233a. 3f0ab47c described after “$” may indicate a transaction identifier (transaction_id) in a data carousel for a corresponding service.
  • transaction_id may be used as the same meaning as dvb_carousel_id.
  • the presence or absence of a path component may vary depending on whether the data or object carousel is referenced. In the case of a data carousel, the transaction ID can identify a data module (file) in the carousel.
  • /font/serif/timesNewRoman.ttf may indicate an absolute path for the object carousel and file name. This may include the font family of the font information and the mime type (font name, etc.).
  • carousel_type_id one layer carousel, two layer carousel, ...), it can be extended to include group_id, module_id, and the like. In some cases, font-related information may be additionally included.
  • the format for this is as follows.
  • the aforementioned font segment may additionally include an essential indicator (essential_indicator) in addition to the above-mentioned information.
  • essential_indicator may indicate whether a font described in a font segment should be used in a timed text. For example, if the value of essential_indicator is 1, it may indicate that the font should be used in timed text. In this case, the receiver may download and use the font data according to the transport_mode. Description of the fields other than the essential_indicator is as described above.
  • FIG. 5 illustrates a font segment according to another embodiment of the present invention.
  • This embodiment illustrates a case in which the segment_type described above is a font associated with a timed text based subtitle or a segment including download data for the font.
  • the aforementioned segment_data_field () may include the illustrated font_segment ().
  • the illustrated font_segment structure may describe at least one font transmitted by the corresponding mode according to the transport mode, unlike the transport mode for the individual fonts as described above.
  • font_segment () may describe information about a font transmitted for each transport mode.
  • font_segment when the transport mode is 0x00 and the font data itself is transmitted in the segment, font_segment () includes font number information and font_segment_info (), lang_flag, language, font_data_len, and font_data_bytes () for each font. Can be. Description of each field is as described above, and font_segment_info () is as shown at the bottom of the figure. That is, font_segment_info () may include essential_indicator, font_family_len, font_family_bytes (), mime_type_len, and mime_type_bytes ().
  • font data When the transport mode is 0x01, font data may be transmitted through data carousal in the broadcasting network.
  • font_segment () may include font_segment_for_DSMCC (), which will be described later in detail. If the transport mode is 0x02, font data can be downloaded through the Internet.
  • font_segment () may include common URL length information (prefix_url_len), common URL information (prefix_url_bytes ()), lang_flag, language, font_segment_info (), url_len, and url_bytes () for each font.
  • prefix_url_len may indicate the length of the url that can inform the common url address for each font.
  • prefix_url_bytes () may indicate a common url address for each font. Each address for each font can be told by url_bytes ().
  • the aforementioned segment_data_field may include the font_segment_for_DSMCC () described below.
  • the font_segment_for_DSMCC () may include only the module_id when the value is 01 and the group_id and the module_id when the value is 10 according to the value of the carousel_type_id. This may vary depending on the unit containing the font data.
  • the font_segment_for_DSMCC () may be further extended to include block_id which may indicate one block in the module. For example, if one font is included in each module_id, font_segment_info () may be included in each module. That is, font_segment_for_DSMCC () may have mime_type_bytes () for each font. If a font is included in one group, font_segment_info () can be provided along with transaction_id_DII. That is, font_segment_info () must be included for each font.
  • block_id may indicate one block in the module. For example, if one font is included in each module_id, font_segment_info () may be included in each module. That is, font_segment_for_DSMCC () may have mime_type_bytes () for each font. If a font is included in one group, font_segment_info () can be
  • each group is one font, and each super group contains font information of different languages, one font_segment_info () in one font as if carousel_type_id is 01 May be included.
  • the transaction ID may include only the transaction_id without having to be divided into DSI or DII. Likewise, if the carousel_type_id includes only one group as 01, and the entire group needs to be downloaded, the transaction ID does not need to be distinguished according to the carousel_type_id, but can be signaled with only one transaction_id.
  • carousel_id may indicate an identifier for identifying a carousel in a specific network.
  • transport_stream_id, original_network_id, and service_id (same as program_number in PMT) may indicate transport_stream_id, original_network_id, and service_id, which are basic information about a font delivered to the DSM-CC.
  • carousel_type_id may indicate an identifier for identifying the type of data carousel. For example, if carousel_type_id is 01, it may represent one layer carousel, and if it is 10, it may represent two layer carousel.
  • transaction_id_DSI and transaction_id_DII may indicate the same value as the transaction_id of the top-level DownloadServerInitiate message or DownloadInfoIndication message.
  • transaction_id_DSI and transaction_id_DII may be represented as transaction_id without distinction. However, in some cases transaction_id may be changed to download_id. Transaction_id has the following difference from download_id. While connecting the request-response pair operation of the transaction_Id message, download_Id is associated with the full set of data messages. downloadId is an identifier for a download scenario in progress.
  • the downloadId may be uniquely defined within the network for the data carousel and within the connections for flow-controlled and non-flow-controlled scenarios. downloadId may be used in successive DownloadDataBlock, DownloadDataRequest and DownloadCancel messages used by the download scenario. (The downloadId field is the identifier of the download scenario in progress. The downloadId shall be uniquely defined within the Network for data carousel scenario and unique within the connection for the flow-controlled and non-flow-controlled scenarios.This identifier shall be used in all of the subsequent DownloadDataBlock, DownloadDataRequest, and DownloadCancel messages used by the download scenario in progress.)
  • association_tag_DII and the associtation_tag_DSI may include an association_tag associated with a stream that is not part of the corresponding data broadcast service or other DVB service. (this 16-bit field contains the association_tag that is associated with either a stream that is not part of this data broadcast service or another DVB service.)
  • association_tag_DII and associtation_tag_DSI may be included as an association_tag without distinction. It can represent a tag of a stream containing multiple fonts or multiple languages passed in a transaction_id.
  • the module_id may identify a module in an object to be delivered in the carousel.
  • Font_segment_info may indicate a mime type such as a font name.
  • group_id may be set equal to transaction_Id of DownloadInfoIndication for describing a group. (This is a 32-bit field which shall be equal to transaction_Id of the DownloadInfoIndication message that describes the group.) That is, it may have the same value as transaction_id_DII.
  • the above-described embodiment is an example including signaling based on an object carousel. According to an embodiment, some of the above-described fields may be added or subtracted by dividing data_broadcast_id according to whether an object carousel or a data carousel is used.
  • the aforementioned font segment may include the aforementioned data carousel related information in addition to the above-mentioned information.
  • the syntax structure of the illustrated font segment is advantageous when the receiver downloads a desired font, and description of each field is as described above.
  • the illustrated font_segment () embodiment it is a structure including a transmission mode for each font and necessary information according to the corresponding transmission mode.
  • the illustrated font_segment () may include a mime_type including an essential indicator, a font family, and a name indicating whether a font must be downloaded for each font, regardless of the transport mode transport_mode. It is also a structure that can contain additional information about each transport_mode for each font.
  • url_len may indicate the length of url_bytes ()
  • url_bytes may indicate a path from which font data can be downloaded. For example, if the transport_mode value is 0x02, this may indicate a URL on the Internet where font data can be downloaded.
  • the broadcast system according to the present invention may transmit safe area region information, which is information for displaying the subtitles so as not to be cropped.
  • the safe area information may set an area for preventing the area in which the caption data is displayed from being cut off by the aspect ratio of the receiver display.
  • the safety zone information may be included in the PSI, the SI, the PES, and the like, and the following description will be given of an embodiment included in the PES.
  • the safe area information may be included in the caption data included in the PES.
  • segment_type is a segment for indicating a safe area for a timed text based subtitle (eg, segment_type is 0x22)
  • segment_data_field may include the illustrated safe_area_info_segment ().
  • safe_area_info_segment includes version number information (version_number), safe area indication format information (safe_area_format), safe area horizontal start information (safe_area_origin_horizontal), safe area vertical start information (safe_area_origin_vertical), safe area horizontal area information (safe_area_extent_horizontal) It may include at least one of area information (safe_area_origin_vertical).
  • the version_number may indicate a version of safe area information. In the case of new information, the version number may increase in ascending order.
  • safe_area_format represents a format of a value indicating a safe area.
  • the value indicating the safe area may be a pixel or may be expressed in the form of a percentage or% indicating a portion of the root container region. Alternatively, the value may be a value of a cell segmenting the root container region into a predetermined partition.
  • safe_area_origin_horizontal means the x value (horizontal) of the starting point (x, y) at which the safe area starts in the root container region. The meaning of safe_area_origin_horizontal can be interpreted as pixel,%, segment, etc. according to safe_area_format.
  • safe_area_origin_vertical means the y value (vertical) of the starting point (x, y) at which the safe area starts in the root container region.
  • safe_area_origin_vertical can be interpreted as pixel,%, segment, etc. according to safe_area_format.
  • safe_area_extent_horizontal means the area of the horizontal axis starting from the starting point (x) of the safe area in the root container region.
  • safe_area_extent_horizontal can be interpreted as pixel,%, segment, etc. according to safe_area_format.
  • safe_area_origin_vertical means the area of the vertical axis starting from the starting point (y) of the safe area in the root container region.
  • the meaning of safe_area_origin_vertical can be interpreted as pixel,%, segment, etc. according to safe_area_format.
  • the safety area may be designated by the starting point coordinates of the corresponding area and the horizontal and vertical area (length), and may specify a unique area that is not cropped by the aspect ratio of the receiver display.
  • the data field of the PES packet may include a safe area information flag (safe_area_info_flag) and a safe area segment (safe_area_segment ()).
  • the safe_area_info_flag may indicate whether the subtitle includes safe area information that designates a safe area so that the subtitle can be displayed without being cropped regardless of the aspect ratio of the receiver.
  • safe_area_segment () may include information specifying a safe area to prevent the caption from being cropped according to the aspect ratio of the receiver and to be displayed.
  • the receiver may display the caption data in consideration of the caption data included in the PES packet and the safe area information.
  • the aforementioned font_segment () may be delivered as part of signaling on SI (service information).
  • SI service information
  • the SI may be a service description table (SDT), an event information table (EIT), a network information table (NIT), or the like of a digital video broadcasting (DVB) system, and in the form of a descriptor (subtitling_descriptor) within each table. It can be included and signaled.
  • the font_segment () described above may be included in a program map table (PMT) of program specific information (PSI) and transmitted.
  • PMT program map table
  • subtitling_descriptor includes at least one of descriptor tag information (descriptor_tag), descriptor length information (descriptor_length), subtitle type information (subtitling_type), font information flag (font_info_flag), required font indicator (font_essential_indicator), and font segment (font_segment ()).
  • descriptor tag information descriptor_tag
  • descriptor_length descriptor length information
  • subtitle type information subtitling_type
  • font information flag font_info_flag
  • required font indicator font_essential_indicator
  • font segment font_segment ()
  • the subtitling_type field may identify that the component to which the subtitling_descriptor is applied is an XML-based subtitle.
  • MSB 4 bits can be specified as XML, and the embodiment using the lower 4 bits to specify the intended aspect ratio can be used.
  • page_id can match the property of the corresponding subtitle with the applied part
  • font_info_flag is a flag indicating whether font related information associated with subtitle is included.
  • the font related information may indicate a path from which the corresponding font can be downloaded.
  • the font_essential_indicator may indicate whether a corresponding font is necessarily used in timed text. For example, if the value of font_essential_indicator is 1, it may indicate that the font should be used in timed text. In this case, the receiver may download and use the font data according to the transport_mode.
  • the font_segment () may include information on a font family, a mime type, a font download path, and the like as described above.
  • the aforementioned font_segment () may be delivered as part of signaling on SI (service information).
  • the SI may mean program specific information (PSI).
  • PSI program specific information
  • the SI may be a Service Description Table (SDT), an Event Information Table (EIT), or a Network Information Table (NIT) of a DVB system, and may be signaled by being included in each table in the form of a descriptor (subtitling_descriptor). have.
  • the font_segment () described above may be included in a program map table (PMT) of program specific information (PSI) and transmitted.
  • PMT program map table
  • the font_descriptor may include component tag information (component_tag), a required font indicator (font_essential_indicator), and a font segment (font_segment ()).
  • component_tag is an identifier for identifying a subtitle stream associated with the corresponding font data
  • font_segment () may indicate information on a font family, a mime type, a font download path, and the like as described above.
  • the description of the font_essential_indicator is as described above.
  • the broadcast receiver according to the present invention may check whether the specific font is downloaded from the above-described subtitling_descriptor or font_descriptor, and download the corresponding font through related information to display the subtitle data.
  • the above-described safe_area_info_segment () may be delivered as part of signaling on SI (service information).
  • SI service information
  • the SI may be a Service Description Table (SDT), an Event Information Table (EIT), or a Network Information Table (NIT) of a DVB system, and may be signaled by being included in each table in the form of a descriptor (subtitling_descriptor).
  • the above-described safe_area_info_segment () may be included in the Program Map Table (PMT) of PSI (Program Specific Information) and transmitted.
  • PMT Program Map Table
  • the subtitling_descriptor may include the above-described caption related information and additionally safe area information. Subtitle related information is the same as described in the previous drawings, it will be described for the added information.
  • safe_area_info_segment () may include a safe area information flag and a safe area information segment.
  • the safe_area_info_flag may indicate whether the caption data includes information specifying a safe area so that the caption data may be displayed without being cropped regardless of the aspect ratio of the receiver.
  • the safe_area_info_segment () may include information such as starting point information on the root container region and coordinates or sizes of areas to be displayed without cropping.
  • the above-described safe_area_info_segment () may be delivered as part of signaling on SI (service information).
  • SI service information
  • the SI may be a Service Description Table (SDT), an Event Information Table (EIT), or a Network Information Table (NIT) of a DVB system, and may be signaled by being included in each table in the form of a descriptor (subtitling_descriptor).
  • the above-described safe_area_info_segment () may be included in the Program Map Table (PMT) of PSI (Program Specific Information) and transmitted.
  • the safe_area_info_descriptor may include component tag information component_tag and safe region information segment safe_area_info_segment ().
  • component_tag is an identifier for identifying a subtitle stream associated with corresponding safe area information.
  • the safe_area_info_segment () may include information such as starting point information on the root container region and coordinates or sizes of the area to be displayed without cropping.
  • the broadcast reception device may identify a transport mode (transport_mode) from a font descriptor included in the received EIT and download a font through related information. If the transport mode (transport_mode) is 0x01, the font is transmitted in the form of a DSMCC data carousel.
  • the font descriptor may include a transaction_id for uniquely identifying an addressable section including a font. URL information may also be included.
  • an identifier such as a PID for the DSMCC data carousel may be included. Detailed operation thereof is as described above.
  • the font_descriptor () may include url_bytes () and transaction_id.
  • uri_bytes () may include additional information such as a module id, a group id, a carousel type id, and the like depending on the form of the data / object carousel of the DSMCC.
  • uri_bytes () may additionally include all information such as language, font family, mime type bytes, and the like. The receiver may find and receive font data delivered to actual DSMCC data / object carousel using uri_bytes ().
  • the receiver operation when the transmission mode information (transport_mode) is 0x01 and the url information (or uri information and urn information) includes carousel information for font download is as follows.
  • the receiver checks the font descriptor () and font segment () through the EIT.
  • uri_bytes () can be used to find out which path the fonts that need to be downloaded later are received and in which form.
  • the receiver may selectively download fonts by classifying language, font family, mime type, etc. through additional information about fonts included in path-absolute or uri syntax.
  • the receiver may search for the downloaded font associated with the stream including the subtitle using the transport_stream_id, the original_network_id, the service_id (which may additionally include event_id), and the component_tag included in the uri_bytes, and display the subtitle by applying the corresponding font. That is, transport_stream_id, original_network_id, service_id (which may further include event_id) and component_tag included in uri_bytes may associate the downloaded font with the subtitle data, and the receiver may use the downloaded font when the subtitle data is displayed. Can be.
  • the font_descriptor () included in the EIT may signal including a URL according to the transport_mode. That is, when transport_mode is 0x01 and 0x02, font_descriptor () may include information related to font data, and for example, may include URL information for downloading a font. For example, when the transport_mode is 0x01, the broadcast transmission device may transmit font data through data carousal in the broadcast network. In this case, the font_descriptor () may be further extended to include at least one of carousel_type_id, transcation_id, group_id, or module_id.
  • the receiver may be connected to a Data Information indication having the same transcation_id value of the DSM-CC through such information, and may receive font data required for each module.
  • the transport mode is 0x01 (broadcast) in font_descriptor () included in the SDT or EIT
  • the receiver can know information about the font transmitted through the carousel using carousel_type_id, group_id, transaction_id_DII, module_id, mime_type_bytes (), and the like.
  • the font can be identified by its name (mime_type_bytes ()) to see if it has been downloaded.
  • FIG. 15 illustrates a method of receiving font data using font information received through an EIT according to another embodiment of the present invention.
  • This embodiment is an example of a method of using data_broadcast_descriptor, which is defined for data broadcasting, in which font_descriptor () included in the EIT does not include url_bytes () or transaction_id.
  • the data_broadcast_descriptor included in the SDT / EIT indicates a DII message. This message provides various information using ModuleInfoByteField of modules in data carousel. For example, information about a pointer to a location of DownloadDataBlock messages may be provided.
  • the data_broadcast_descriptor may include the following information.
  • data_broadcast_id may be set to a value of 0x0006 indicating a DVB data carousel.
  • the component_tag may be set to the same value as the component_tag field of the stream_identifier_descriptor for the stream used to broadcast the data carousel. (This field shall have the same value as a component_tag field of a stream_identifier_descriptor (if present in the PSI program map section) for the stream that is used to broadcast the data carousel.)
  • the selector_length may be set to 0x10. (This field shall be set to 0x10.)
  • the selector_byte may also provide a data_carousel_info structure.
  • the selector_byte may include data_carousel_info in the case of the data carousel and object_carousel_info in the case of the object carousel. These may each include a transaction_id, and the receiver may be connected to a Data Information indication having the same transcation_id value of the DSM-CC through such information, and may receive font data required for each module.
  • FIG. 16 is a diagram illustrating data information indication according to an embodiment of the present invention.
  • one Data Information Indication is a collection of several modules, and one module is a collection of several blocks (DDB). That is, a module may mean one font. That is, "sansSerif" may be configured as one module.
  • each block may be divided into an uppercase alphabet (block 1), a lowercase alphabet (block 2), a number (block 3), a special character (block 4), and the like of “sansSerif”.
  • each DDB can contain a single letter itself (e.g. “a”). In some cases, it may be composed of one block by dividing the order and the size.
  • Super groups can contain individual fonts for multiple languages.
  • the moduleInfoByte may include the mime_type_byte () of font_segement_info () defined above to identify which font the module is for.
  • the font data itself which is “sansSerif” to be downloaded, may be configured as one DII.
  • each module may be divided into an uppercase alphabet (module 1), a lowercase alphabet (module 2), a number (module 3), a special character (module 4), etc. of “sansSerif”.
  • One module can be configured by dividing size. At this time, one letter can be entered in one block. (e.g. “a”)
  • one module may include the entire font, and the other module may include each family font of “sansSerif“. “sansSerif” (module 1), “serif” (module 2), “monospaceSansSerif” “(module 3), and” monospaceSerif “(module 4) may be included in each module.
  • the DII may be configured with one font and may include fonts of different languages in the DSI.
  • DSI DownloadServerInitiate
  • group_id is included to further include group_id.
  • the illustrated groupInfoIndication may be included in the privateDataByte of DownloadServerInitiate described above.
  • the DownloadServerInitiate message can be used to create a SuperGroup.
  • DownloadServerInitiate message is used to build a SuperGroup.
  • DownloadServerInitiate for DVB data carousels may include the following information.
  • serverId may be set to 20 bytes having a value of 0xFF. (this field shall be set to 20 bytes with the value of 0xFF.)
  • the compatibilityDescriptor () may include only the compatibilityDescriptorLength field of the compatibilityDescriptor () as defined in the DSM-CC.
  • this structure shall only contain the compatibilityDescriptorLength field of the compatibilityDescriptor () as defined in DSM-CC.) This can be set to 0x0000. It shall be set to the value of 0x0000.
  • privateDataLength can define the byte length of the GroupInfoIndication that follows. (privateDataLength: this field defines the length in bytes of the following GroupInfoIndication structure.)
  • the privateDataByte field may include the illustrated GroupInfoIndication ().
  • the private DataByte fields shall contain the GroupInfoIndication structure as defined in the figure.
  • DownloadServerInitiate (DSI) may include language information in groupInfoIndication.
  • groupInfoIndication includes group number information (NumberOfGroups), group identifier (GroupId), group size information (GroupSize), group compatibility information (GroupCompatibility), group info length information (GroupInfoLength), group info byte (groupInfoByte), private data length information It may include at least one of a (PrivateDataLength) and a private data byte (PrivateDataByte).
  • NumberOfGroups may indicate the number of groups, and GroupId may indicate an identifier of an individual group.
  • GroupSize may indicate the size of the group, and GroupInfoLength may indicate length information of the following groupInfoByte.
  • the groupInfoByte may include an identifier that may indicate which language, such as language defined in the font_segement_for_DSMCC () described above. This allows groupInfoByte to identify which language the group is for.
  • FIG. 18 is a diagram illustrating a font download method using PMT of a broadcast receiver according to an embodiment of the present invention.
  • this case indicates that the transport_mode is 0x01.
  • the receiver may check the font descriptor () and the font segment () through the EIT.
  • the font is transmitted through broadcast, information on which path and which font the font to be downloaded later comes through is obtained through font_segment_for_DSMCC () and Data_broadcast_descriptor ().
  • the receiver may acquire information identifying a stream including a font actually transmitted through the DSM-CC later using carousel_id, transport_stream_id, original_network_id, and service_id included in Font_segment_for_DSMCC ().
  • the font to be downloaded can be identified and downloaded through DSI including multiple languages or transaction_id, which is the DII indication information (uniquely identifies an addressable section) that can download multiple fonts according to languages. have.
  • the receiver may identify the carousel_id through the carousel_identifier_descriptor included in the PMT 1st descriptor loop when the corresponding event is actually broadcast.
  • the receiver may recognize another PMT including a specific subtitle by using association_tag, transport_stream_id, and original_network_id included in deffered_association_tags_descriptor (), and grasp information of the stream including the subtitle.
  • the receiver can find the downloaded font connected to the stream including the subtitle and apply the font to display the subtitle.
  • the broadcast receiver includes a receiver (DTV tuner) 1901, a demodulator (1902), a demultiplexer (demux) 1903, a video decoder (1904), an XML subtitle decoder (1905), an audio video subtitle.
  • a synchronization unit (A / V / S sync) 1906, a system information processor (SI processor) 1907, and / or a display processor (1908) may be included.
  • the broadcast receiver may additionally include a network processor 1909 according to an embodiment.
  • the receiver 1901 may receive a broadcast signal transmitted by a transmitter.
  • the received broadcast signal may be input to the demodulator 1902.
  • the received broadcast signal may include media data and subtitle data related thereto.
  • the demodulator 1902 can demodulate a broadcast signal and output a transport stream (TS).
  • the TS may be input to the demultiplexing unit 1903 and demultiplexed.
  • the demultiplexed TS may include media data (e.g. HEVC bitstream), XML subtitle stream, and service information (SI).
  • the XML subtitle may be in packetized or compressed form.
  • the XML subtitle or SI may include information about a font related to caption data.
  • the video decoder 1904 may receive and decode media data (HEVC bitstream) and output a video frame.
  • HEVC bitstream media data
  • the XML subtitle decoder 1905 may receive an XML subtitle stream and extract and decode the subtitle.
  • the PES packet of the XML subtitle stream may include at least one of information on a font related to the caption data, information on a safe area, or information indicating that it is an essential download font.
  • the audio / video subtitle synchronization unit 1906 may synchronize the video frame and the subtitle by receiving the PTS and the PCR (Program Clock Reference) of the media data (HEVC bitstream) and the XML subtitle, respectively.
  • the system information processor 1907 may extract the OSD information by receiving service information (SI) information output from the demultiplexer.
  • SI service information
  • the SI information may include at least one of information on a font related to the caption data, information on a safe area, or information indicating that it is an essential download font.
  • the network processor 1909 may receive font data related to the caption data by using transaction_Id or URL information in the aforementioned caption related font information.
  • the network communication unit may download the corresponding font data.
  • the display processor 1908 may receive the video frame and the subtitle and output the display frame.
  • the display processor 1908 may receive OSD (On Screen Display) information in addition to the video frame and the subtitle to output the display frame.
  • the OSD information may refer to information on a font related to caption data, information on a safe area, or information indicating that the font is an essential download font.
  • the output display frame may be displayed by the image output device, and the XML caption and video frame described in the present invention may be displayed together.
  • the broadcast transmitter d20010 may include an encoder d20020, a multiplexer d20030, and / or a transmitter d20040.
  • the encoder d20020 may receive video data having a resolution of UHD, HD, or SD, and generate a video stream by encoding the video data.
  • the video stream may be encoded by High Efficiency Video Coding (HEVC).
  • the video stream may mean a video elementary stream (ES) or a video packetized elementary stream (PES) in which the video ES is packetized.
  • the encoder may encode caption data into a caption stream, and the PES packets constituting the caption stream may further include at least one of font information, essential download caption information, and safe area information associated with the caption data. Can be.
  • the encoded video stream may be input to the multiplexer d20030 together with the XML subtitle stream.
  • the multiplexer may generate a transport stream (TS) by multiplexing the encoded SI information, the video stream, and the subtitle stream.
  • the caption stream may be an XML caption stream.
  • at least one of font information, essential download font information, and safe area information associated with caption data may be included in the SI information multiplexed with the video stream and the caption stream and transmitted.
  • the transmitter d20040 may transmit the transport stream output from the multiplexer d20030 as a broadcast signal.
  • the transport stream may be transmitted as a broadcast signal after being channel coded and modulated before transmission.
  • the broadcast receiver d21010 may include a receiver d21020, a demultiplexer d21030, and / or a decoder d21040.
  • the broadcast signal received by the receiver d21020 may be demodulated and then channel decoded.
  • the channel decoded broadcast signal may be input to the demultiplexer d21030 and demultiplexed into a video stream, a subtitle stream, and an SI.
  • the subtitle stream or SI may include at least one of font information, essential download font information, and safe area information associated with the subtitle data.
  • the output of the demultiplexer may be input to the decoder d21040 and decoded into video data and subtitle data, respectively. That is, the video stream may be decoded by the video decoder and the subtitle stream by the subtitle decoder and output as video data and subtitle data, respectively. Video data and subtitle data can be synchronized and displayed by the receiver.
  • the broadcast receiver may obtain font information, essential download font information, and safe area information associated with caption data from the caption stream or the SI.
  • the broadcast receiver may receive font data related to caption data using the above information, use font data, and display caption data in consideration of safe area information.
  • a method of transmitting a broadcast signal including XML subtitles includes encoding a video to generate a video stream (ds22010), generating a broadcast signal including the generated video stream and subtitle information (ds22020), and generating the broadcast signal. It may include the step of transmitting (ds22030).
  • video data having a resolution of UHD, HD, or SD may be input, and the video data may be encoded to generate a video stream.
  • the video stream may be encoded by High Efficiency Video Coding (HEVC).
  • the video stream may mean a video elementary stream (ES) or a video packetized elementary stream (PES) in which the video ES is packetized.
  • ES video elementary stream
  • PES video packetized elementary stream
  • an XML subtitle stream can be generated.
  • the caption stream may include at least one of font information associated with caption data, essential download font information, and safe area information.
  • the generating of the broadcast signal including the generated video stream, the SI information, and the subtitle stream may generate a transport stream (TS) by multiplexing the encoded video stream and the subtitle stream.
  • the caption stream may be an XML caption stream.
  • the PES packet included in the TS may include caption data and information related to the caption, and may include, for example, at least one of font information, essential download font information, and safe area information associated with the caption data.
  • the generated broadcast signal may be transmitted as a broadcast signal.
  • the transport stream may be transmitted as a broadcast signal after being channel coded and modulated before transmission.
  • a method of receiving a broadcast signal including XML subtitles includes receiving a broadcast signal (ds23010), demultiplexing the received broadcast signal into SI information, a video stream, and a subtitle stream (ds23020), and decoding the video stream. It may include (ds23030).
  • the broadcast signal received using the receiver may be demodulated and then channel decoded.
  • the demultiplexing of the received broadcast signal into the SI information, the video stream, and the subtitle stream may demultiplex the channel decoded broadcast signal into the video stream and the subtitle stream using the demultiplexer.
  • the SI information or the subtitle stream may include at least one of information on a font related to the subtitle data, information on a safe area, or information indicating that it is an essential download font.
  • Decoding the video stream and the subtitle stream may decode the video stream and obtain video data using a video decoder.
  • the caption data may be obtained using the caption decoder for the caption stream.
  • Video data and subtitle data can be synchronized and displayed by the receiver.
  • the receiver may further receive font data by using information on a font related to the caption data and information indicating that the font is an essential download font.
  • the receiver may display the caption data using the font data and the information about the safe area.
  • font related information associated with a caption stream may be obtained.
  • the font related information may be received from the data carousel using the font related information.
  • font data associated with the subtitle stream may be downloaded essentially.
  • the non-cropped safe area of the area in which the caption data is displayed may be signaled.
  • Apparatus and method according to the present invention is not limited to the configuration and method of the embodiments described as described above, the above-described embodiments may be selectively all or part of each embodiment so that various modifications can be made It may be configured in combination.
  • the image processing method of the present invention can be implemented as a processor-readable code on a processor-readable recording medium provided in the network device.
  • the processor-readable recording medium includes all kinds of recording devices that store data that can be read by the processor. Examples of the processor-readable recording medium include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage device, and the like, and may also be implemented in the form of a carrier wave such as transmission over the Internet. .
  • the processor-readable recording medium can also be distributed over network coupled computer systems so that the processor-readable code is stored and executed in a distributed fashion.
  • the present invention has industrial applicability that is usable and repeatable in the field of broadcast and video signal processing.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

본 발명은 자막 서비스를 포함한 방송 신호를 송수신하는 장치 및 방법에 관한 것이다. 본 발명의 일 실시예에 따른 방송 신호 수신 장치는, 비디오 스트림 및 자막 스트림을 포함하고, 상기 자막 스트림에 포함된 자막 데이터와 연관된 폰트 데이터를 다운로드할 수 있는 정보 및 상기 폰트 데이터가 필수적인지 여부를 지시하는 인디케이터를 더 포함하는 방송 신호를 수신하는 튜너, 상기 수신된 방송 신호를 상기 비디오 스트림 및 상기 자막 스트림으로 역다중화하는 디멀티플렉서, 상기 비디오 스트림 및 상기 자막 스트림을 각각 디코딩하는 디코더, 상기 폰트 데이터를 다운로드할 수 있는 정보에 기초하여 상기 폰트 데이터를 다운로드하는 네트워크 프로세서 및 상기 폰트 데이터를 이용하여 상기 자막 스트림을 디스플레이하는 디스플레이 프로세서를 포함할 수 있다.

Description

방송 신호 송수신 방법 및 장치
본 발명은 방송 신호를 송수신하는 장치 및 방법에 관한 것이다.
디지털 기술 및 통신 기술의 발전으로 방송, 영화뿐만 아니라 인터넷 및 개인 미디어 등의 다양한 영역에서 오디오/비디오 중심의 멀티미디어 컨텐츠 보급 및 수요가 급속도로 확대되고 있다. 나아가 방송 및 영화를 통하여 입체감을 제공하는 실감미디어에 대한 소비자 요구가 증가되고 있다. 또한, 디스플레이 기술의 발전과 더불어 가정에서의 TV 화면이 대형화 됨에 따라 HD (High Definition)급 이상의 고화질에 실감나는 컨텐츠를 즐기고자 하는 소비가 증가되고 있다. 3DTV와 더불어 UHDTV (Ultra High Definition TV)와 같은 실감방송이 차세대 방송 서비스로 관심을 받고 있으며, 특히 UHD (Ultra High Definition) 방송 서비스에 대한 논의가 증가되고 있는 추세이다.
현재 방송 자막 서비스는 closed caption 혹은 DVB (Digital Video Broadcasting) subtitle의 형태로 제공되고 있다. 이 중 DVB subtitle의 경우 자막을 bitmap image 형태로 제공하기 때문에 다양한 크기의 영상에 대해 서로 다른 크기의 자막을 제공하거나, 단일 규격의 subtitle을 스케일링하는 식으로 서비스를 제공해야 한다. 이 때, 전자의 경우 대역폭 측면에서 효율성이 떨어지며 후자의 경우 스케일링에 의한 선예도가 떨어지는 문제가 발생한다. 특히 UHDTV를 통한 고해상도의 방송 서비스에 대한 논의가 활발한 요즈음, 이러한 문제를 해결하기 위한 새로운 방송 자막 서비스의 필요성이 대두되고 있다.
본 발명의 목적은, 방송 신호를 전송하는 방법 및 장치에 있어서 전송 효율을 높이는 것이다.
본 발명의 다른 목적은, 자막 서비스를 방송망에서 제공하기 위한 전송 장치 및 방법을 제공하는 것이다.
본 발명의 다른 목적은, timed text 자막 서비스를 extensible markup language (XML) 기반으로 제공하기 위한 장치 및 방법을 제공하는 것이다.
본 발명의 일 실시예에 따른 방송 신호 송신 장치는 비디오 데이터를 인코딩하여 비디오 스트림을 생성하는 인코더, 상기 생성된 비디오 스트림 및 자막 스트림을 포함하는 방송 신호를 생성하는 멀티플렉서, 여기서 상기 방송 신호는 상기 자막 스트림에 포함된 자막 데이터와 연관된 폰트 데이터를 다운로드할 수 있는 정보 및 상기 폰트 데이터가 필수적인지 여부를 지시하는 인디케이터를 더 포함함 및 상기 생성된 방송 신호를 전송하는 트랜스미터를 포함할 수 있다.
바람직하게는, 상기 폰트 데이터를 다운로드할 수 있는 정보 및 상기 폰트 데이터가 필수적인지 여부를 지시하는 인디케이터는 프로그램 상세 정보 (program specific information, PSI) 또는 서비스 정보 (service information)에 포함되어 전송될 수 있다.
바람직하게는, 상기 폰트 데이터를 다운로드할 수 있는 정보는 트랜잭션 식별자 (transaction ID)를 포함하는 URI (uniform/universal resource identifier) 정보일 수 있다.
바람직하게는, 상기 자막 스트림은 상기 자막 데이터가 디스플레이됨에 있어서, 수신기의 화면 비율에 의해 크롭핑되는 것을 방지하는 안전 영역에 대한 정보를 더 포함할 수 있다.
본 발명의 일 실시예에 따른 방송 신호 수신 장치는 방송 신호를 수신하는 튜너, 여기서 상기 방송 신호는 비디오 스트림 및 자막 스트림을 포함하고, 상기 방송 신호는 상기 자막 스트림에 포함된 자막 데이터와 연관된 폰트 데이터를 다운로드할 수 있는 정보 및 상기 폰트 데이터가 필수적인지 여부를 지시하는 인디케이터를 더 포함함, 상기 수신된 방송 신호를 상기 비디오 스트림 및 상기 자막 스트림으로 역다중화하는 디멀티플렉서, 상기 비디오 스트림 및 상기 자막 스트림을 각각 디코딩하는 디코더, 상기 폰트 데이터를 다운로드할 수 있는 정보에 기초하여 상기 폰트 데이터를 다운로드하는 네트워크 프로세서 및 상기 폰트 데이터를 이용하여 상기 자막 스트림을 디스플레이하는 디스플레이 프로세서를 포함할 수 있다.
바람직하게는, 상기 폰트 데이터를 다운로드할 수 있는 정보 및 상기 폰트 데이터가 필수적인지 여부를 지시하는 인디케이터는 프로그램 상세 정보 (program specific information, PSI) 또는 서비스 정보 (service information)에 포함되어 전송될 수 있다.
바람직하게는, 상기 폰트 데이터를 다운로드할 수 있는 정보는 트랜잭션 식별자 (transaction ID)를 포함하는 URI (uniform/universal resource identifier) 정보일 수 있다.
바람직하게는, 상기 자막 스트림은 상기 자막 데이터가 디스플레이됨에 있어서, 수신기의 화면 비율에 의해 크롭핑되는 것을 방지하는 안전 영역에 대한 정보를 더 포함할 수 있다.
본 발명의 실시예에 따르면, 방송 시스템의 전송 효율을 높일 수 있다.
본 발명의 실시예에 따르면, 자막 서비스를 방송망에서 제공할 수 있다.
본 발명의 실시예에 따르면, 방송 수신 장치 및 방법은 방송 신호에 포함된 자막을 추출하여 디스플레이할 수 있다.
도 1은 본 발명의 일 실시예에 따른 XML 기반 방송 자막 서비스를 나타낸 도면이다.
도 2는 본 발명의 일 실시예에 따른 PES 패킷에 포함되는 데이터 필드를 나타낸다.
도 3은 본 발명의 일 실시예에 따른 폰트 세그먼트를 나타낸다.
도 4는 본 발명의 일 실시예에 따른 확장된 폰트 세그먼트를 나타낸다.
도 5는 본 발명의 다른 실시예에 따른 폰트 세그먼트를 나타낸다.
도 6은 본 발명의 일 실시예에 따른 DSMCC를 위한 폰트 세그먼트 정보를 나타낸다.
도 7은 본 발명의 일 실시예에 따른 추가 확장된 폰트 세그먼트를 나타낸다.
도 8은 본 발명의 일 실시예에 따른 자막 데이터에 대한 안전 영역 (safe area)을 지정하는 방법을 나타낸다.
도 9는 본 발명의 일 실시예에 따른 안전 영역 정보를 포함하는 PES 패킷의 데이터 필드를 나타낸다.
도 10은 본 발명의 일 실시예에 따른 폰트 정보를 시그널링 정보로써 전송하는 방법을 나타낸다.
도 11은 본 발명의 일 실시예에 따른 안전 영역 정보를 시그널링 정보로써 전송하는 방법을 나타낸다.
도 12는 본 발명의 일 실시예에 따른 EIT를 통해 수신된 폰트 정보를 이용하여 폰트 데이터를 수신하는 방법을 나타낸다.
도 13은 본 발명의 다른 실시예에 따른 EIT를 통해 수신된 폰트 정보를 이용하여 폰트 데이터를 수신하는 방법을 나타낸다.
도 14는 본 발명의 다른 실시예에 따른 EIT를 통해 수신된 폰트 정보를 이용하여 폰트 데이터를 수신하는 방법을 나타낸다.
도 15는 본 발명의 다른 실시예에 따른 EIT를 통해 수신된 폰트 정보를 이용하여 폰트 데이터를 수신하는 방법을 나타낸다.
도 16은 본 발명의 일 실시예에 따른 데이터 정보 인디케이션 (data information indication)을 나타낸 도면이다.
도 17은 본 발명의 일 실시예에 따른 그룹 정보 인디케이션 (groupInfoIndication)을 나타낸다.
도 18은 본 발명의 일 실시예에 따른 방송 수신기의 PMT를 이용한 폰트 다운로드 방법을 나타낸 도면이다.
도 19는 본 발명의 일 실시예에 따른 방송 수신기의 상세 구성을 나타낸 도면이다.
도 20은 본 발명의 일 실시예에 따른 방송 송신기를 나타낸 블록도이다.
도 21은 본 발명의 일 실시예에 따른 방송 수신기를 나타낸 블록도이다.
도 22는 본 발명의 일 실시예에 따른 XML 자막을 포함하는 방송 신호를 전송하는 방법을 나타낸 도면이다.
도 23은 본 발명의 일 실시예에 따른 XML 자막을 포함하는 방송 신호를 수신하는 방법을 나타낸 도면이다.
차세대 방송 서비스로써 IP를 통해 방송 서비스를 제공하기 시작하면서, 기존 방송 자막을 대신할 새로운 자막 서비스 표준이 제정되었다. 향후 방송 서비스는 기존 방송과 IP의 융합의 형태로 제공될 것으로 보이는데, 이 때 서로 다른 표준으로 만들어진 자막을 각각 서비스 하는 것은 비효율 적이다.
IP 방송 자막 서비스 표준으로는 XML 기반으로 제정 된 TTML (time text markup language), SMPTE-TT (Society of Motion Picture and Television Engineers Timed Text), EBU-TT-D (European Broadcasting Union time text) 등이 있는데, 이들은 영상의 크기에 독립적인 자막을 서비스 할 수 있다는 관점에서 다양한 해상도를 지원해야 하는 DASH (Dynamic Adaptive Streaming over HTTP) 기반의 서비스에 적합하다. 이러한 장점을 활용하여 UHD 방송 서비스에서도 XML 자막을 사용하고자 하는 움직임이 있는데, media, IP streaming에 적합하도록 제정된 XML 자막을 기존 방송 서비스에 맞춰 전송할 수 있는 방법이 필요하다.
최근 TTML (time text markup language), EBU-TT (EBU time text) 등 XML 언어 기반의 자막에 대한 표준이 제정되었다. 이들의 목적은 media 및 IP streaming 환경에서의 자막 서비스를 목표로 하지만, 이를 방송 서비스에서도 이용하고자 하는 요구가 DVB 및 ATSC 등의 표준 단체에서 나타나고 있다. 이는 다양한 방송 환경에 대해 통합된 자막 source를 이용할 수 있다는 장점 뿐 아니라, 동일 자막 소스를 기반으로 다양한 서비스 환경(예를 들어 HD, UHD 등)에 적응적으로 사용 가능하다는 장점을 이용하기 위한 것이다.
본 발명의 이해와 설명의 편의를 위하여, 용어 및 약어에 대하여 아래와 같이 정의한다.
XML (Extensible Markup Language)은 HTML을 개선하여 만든 언어로써 보다 홈페이지 구축 기능, 검색 기능 등이 향상되었고 클라이언트 시스템의 복잡한 데이터 처리를 쉽게 할 수 있다. 본 발명에서는 자막 데이터를 구성하는 언어로써 사용되며 XML 자막은 헤드와 바디로 구성될 수 있다.
ES(Elementary Stream)는 데이터 인코더의 출력을 의미할 수 있다. 즉, 비디오 인코더 및 오디오 인코더의 출력을 각각 비디오 ES 및 오디오 ES로 정의할 수 있다. 본 발명에서는 XML 자막 ES를 정의하고 사용할 수 있다.
PES (Packetized Elementary Stream)는 ES를 패킷화한 것으로 헤더를 가진 패킷들의 스트림을 의미할 수 있다.
TS (Transport Stream)는 MPEG-2 시스템에서 하나 또는 여러개의 프로그램을 포함한 전송용 스트림으로써 전송에러가 존재하는 전송 매체에 이용할 수 있다. 본 발명에서 TS는 비디오 ES, 오디오 ES 및 자막 ES 중 적어도 두 개가 다중화되어 전송되는 전송 스트림을 의미할 수 있다.
도 1은 본 발명의 일 실시예에 따른 XML 기반 방송 자막 서비스를 나타낸 도면이다. 도 1은 디지털 방송 서비스를 위한 송신단 및 수신단, 단대단 (end-to-end) 시스템에 대한 다이어그램을 나타낸다. 본 발명에서 사용하는 XML 기반 자막은 영상의 크기에 영향을 받지 않기 때문에 UHD/HD/SD 모두에 적용 가능하다.
전송단에서는 압축 된 영상 및 전송을 위해 변형 된 XML 자막을 다중화기를 통해 전송하며, 이 때, 두 데이터 간의 동기화를 위해 PTS(presentation time stamp) 정보를 사용한다. 도 1에서 전송단 (transmission)은 비디오 데이터 및 자막 정보를 입력 받을 수 있다. 전송단에 입력되는 비디오 데이터의 해상도는 UHD, HD 또는 SD가 될 수 있다. 또한 전송단에 입력되는 자막 정보는 XML 또는 bitmap으로 작성될 수 있다. 전송단에 입력된 비디오 데이터는 전송단에서 인코딩(101)될 수 있다. 전송단은 비디오 데이터에 대한 인코딩 방식으로써 HEVC(High Efficiency Video Coding)를 사용할 수 있다. 전송단은 인코딩된 비디오 데이터와 XML 자막을 동기화하고 다중화할 수 있다 (102). 여기서 XML 자막은 전송을 위해 변형될 수 있다. 즉 XML 자막은 전송을 위해 XML 자막 ES 및 XML 자막 PES로 변형될 수 있다. 상술한 바와 같이 인코딩된 비디오 데이터와 XML 자막은 PTS 정보를 사용하여 동기화될 수 있다. 전송단은 동기화되고 다중화된 데이터를 채널 코딩 및 변조 (103)한 후 방송 신호로써 전송할 수 있다.
수신단에서는 역다중화 후 비디오 디코딩 및 XML parser를 통해 자막을 제공하며, 이 때, PTS를 기반으로 비디오 데이터와 자막 간 동기화를 수행한다. 수신단에서는 수신된 방송 신호를 복조하고 트랜스포트 패킷 디코딩을 수행할 수 있다(104). 디코딩된 트랜스포트 패킷은 역다중화(105) 과정을 거친 후 비디오 디코더(106) 및 자막 프로세서 (subtitle processing, e.g., XML parsing, 107)에 입력된다. 여기서 비디오 디코더(106)는 수신된 비디오 데이터의 해상도에 따라 UHD, HD 또는 SD 비디오 데이터를 디코딩할 수 있다. 비디오 디코더(106)는 비디오 데이터에 대한 디코딩 방식으로써 HEVC(High Efficiency Video Coding)를 사용할 수 있다. 또한 자막 프로세서 (107)는 XML 자막을 추출할 수 있다. 이 과정에서 수신단은 PTS를 기반으로 비디오 데이터와 XML 자막을 동기화할 수 있다. 디코딩된 비디오 데이터와 XML 자막은 디스플레이 프로세서(108)에 의해 처리되고 디스플레이될 수 있다.
도 2는 본 발명의 일 실시예에 따른 PES 패킷에 포함되는 데이터 필드를 나타낸다. 본 발명에 따라 자막 스트림을 전달하는 PES 패킷은 PES_packet_data_byte에 PES 데이터 필드 (PES_data_field())를 포함할 수 있다. PES_data_field ()는 데이터 식별자(data_identifier), 자막 스트림 식별자(subtitle_stream_id), 자막 세그먼트(subtitling_segment())를 포함할 수 있다. 또한 자막 세그먼트(subtitling_segment())는 동기화 바이트(sync_byte), 세그먼트 타입 정보(segment_type), 페이지 식별자(page_id), 세그먼트 길이 정보(segment_length), 세그먼트 데이터 필드(segment_data_field())를 포함할 수 있다. data_identifier는 해당 PES 패킷에 포함된 스트림이 자막 관련 스트림 (subtitle stream) 임을 식별할 수 있다. subtitle_stream_id는 서로 다른 subtitle stream 을 식별할 수 있다. 이는 subtitle stream이 기존의 bitmap 기반 subtitle stream 인지, 또는 timed text 기반 subtitle stream 인지 등을 나타낼 수 있다. 자막 세그먼트(subtitling_segment())에 포함된 정보인 segment_type은 뒤따르는 segment_data_field() 에 포함되는 세그먼트의 종류를 나타낼 수 있다. 예를 들어, segment_type이 0x20의 값을 갖는 경우 해당 세그먼트는 timed text (e.g.: EBU-TT-D, TTML, IMSC1 등) 기반 subtitle 세그먼트임을 나타낼 수 있다. 또한 segment_type이 0x21의 값을 갖는 경우 timed text 에서 사용하는 font 데이터 등을 포함하는 세그먼트임을 나타낼 수 있다. 또한 segment_type이 0x22의 값을 갖는 경우 timed text 에서 사용하는 safe area를 포함하는 세그먼트임을 나타낼 수 있다. page_id는 하나의 subtitle 과 연관된 세그먼트들의 그룹에 대한 식별자를 나타낼 수 있다. 즉, 동일한 page_id 을 가지는 세그먼트들은 동일한 subtitle 을 구성하는 데 사용되는 세그먼트들임을 나타낼 수 있다. 예를 들어 한국어 자막과 영어 자막이 포함된 subtitle의 경우, 한국어 자막에 해당되는 subtitle data와 영어 자막에 해당되는 subtitle data를 서로 다른 page_id로 구분할 수 있다. 즉, page_id를 이용해 하나의 동일한 서비스에 포함되는 데이터를 지정할 수 있다. segment_length는 뒤따르는 segment_data_field() 에 포함되는 세그먼트 데이터의 길이를 나타낼 수 있다. segment_data_field()는 실질적인 세그먼트 데이터를 포함할 수 있다.
도 3은 본 발명의 일 실시예에 따른 폰트 세그먼트를 나타낸다. 본 실시예는 전술한 segment_type이 timed text 기반 subtitle 과 관련된 폰트 혹은 해당 폰트에 대한 다운로드 데이터를 포함하는 세그먼트인 경우를 나타내는 경우이다. 예를 들어 segment_type 값이 0x21 인 경우, 전술한 segment_data_field() 는 도시된 font_segment()를 포함할 수 있다. font_segment()는 폰트 개수 정보(num_fonts), 언어 플래그 정보(lang_flag), 언어 정보(language), 폰트 패밀리 길이 정보(font_family_len), 폰트 패밀리 정보(font_family_bytes()), mime 타입 길이 정보(mime_type_len), mime 타입 정보(mime_type_bytes()), 전송 모드 정보(transport_mode), 폰트 데이터 길이 정보(font_data_len), 폰트 데이터 정보(font_data_bytes()), URL 길이 정보(url_len), URL 정보(url_bytes()) 중 적어도 하나를 포함할 수 있다. num_fonts는 자막 (subtitle) 관련 폰트의 개수를 나타낼 수 있다. lang_flag는 뒤따르는 폰트의 언어 정보(language)가 존재하는지 여부를 나타낼 수 있다. language는 폰트의 언어 정보를 나타낼 수 있으며 이는 ISO 639-2 혹은 ISO 639-2/T 등에서 정의하는 형태 등으로 나타내어질 수 있다. font_family_len는 뒤따르는 font_family_bytes의 길이를 나타낼 수 있다. font_family_bytes()는 해당 폰트의 font family 를 포함할 수 있다. 즉, font_family_bytes()는 "default“, "monospace“,"sansSerif", "serif", "monospaceSansSerif", "monospaceSerif", "proportionalSansSerif", "proportionalSerif” 등을 포함할 수 있다. mime_type_len는 뒤따르는 mime_type_bytes() 의 길이를 나타낼 수 있다. mime_type_bytes()는 해당 폰트와 연관된 mime type 을 포함할 수 있다. 예를 들어 mime_type_bytes()가 Open Font Format 인 경우 application/font-sfnt 등을 나타낼 수 있다. 또한 이는 mime_type_bytes()는 해당 폰트의 이름, 예를 들어 “arial” 등을 포함할 수 있다. transport_mode는 폰트 데이터를 전송하는 모드를 가리킬 수 있다. 예를 들어 transport_mode의 값이 0x00인 경우, 해당 세그먼트에 폰트 데이터자체가 포함되어 전송됨을 나타낼 수 있다. 또한 transport_mode의 값이 0x01인 경우, 방송망 내 data carousal 을 통해 폰트 데이터가 전송됨을 나타낼 수 있다. 또한 transport_mode의 값이 0x02인 경우 인터넷 망을 통해 폰트 데이터를 다운로드 할 수 있음을 나타낼 수 있다. font_data_len는 font_data_bytes() 의 길이를 나타낼 수 있다. font_data_bytes()는 해당 폰트 데이터 자체를 포함할 수 있다. url_len는 뒤따르는 url_bytes() 의 길이를 나타낼 수 잇다. url_bytes()는 해당 폰트 데이터를 다운로드 할 수 있는 경로를 나타낼 수 있다. 예를 들어 transport_mode의 값이 0x01 인 경우, url_bytes()는 방송망 내 data carousal (DSM-CC 등) 을 통하여 폰트 데이터를 수신할 수 있는 경로, 또는 font 를 전달하는 object, 또는 Data carousal 을 식별할 수 있는 정보 등을 포함할 수 있다. 또한 transport_mode의 값이 transport_mode 값이 0x02 인 경우 폰트데이터를 다운로드 할 수 있는 인터넷 상의 URL 을 나타낼 수 있다. 여기서 URL은 uri, urn으로 나타낼 수도 있다. 즉 transport_mode는 URL 대신 그 상위 개념인 URI (uniform/universal resource identifier)를 나타낼 수 있다. 본 명세서에서 URL에 대한 설명은 URI에 대한 설명으로 해석될 수 있다.
전술한 url_bytes()는 다음과 같이 구성될 수 있다. transport_mode가 broadcast 인 data/object carousel 형태로 전달될 때 URL에는 다음 format에서 정의한 바와 같이, original network id, transport stream id, service id (event id를 포함할 수도 있음), component tag 및 transaction id(=dvb_carousel_id) 중 적어도 하나를 포함할 수 있다.
format: dvb://<original_network>. [<transport_stream>]. <service_id>. <component_tag>{&<component_tag>} [$<dvb_carousel_id>]<path-absolute>
예를 들어 폰트 정보가 data/object carousel 형태로 전달될 때, 다음과 같이 표현될 수 있다. dvb://233a.1041.10bf.1e$3f0ab47c/font/serif/timesNewRoman.ttf
또한 Path-absolute에는 language, font family, mime type 등과 같은 정보가 각각 포함되어 어떤 font에 대한 url인지를 시그널링할 수 있다. 이는 해당 폰트가 오리지널 네트워크 233a 내의 TS 1041로 전송되는 서비스 10bf의 컴포넌트 1e에 대한 것임을 나타낼 수 있다. “$” 이후에 기재된 3f0ab47c는 해당 서비스에 대한 데이터 캐로젤 (data carousel) 내의 트랜잭션 식별자 (transaction_id)를 나타낼 수 있다. 여기서 transaction_id는 dvb_carousel_id과 동일한 의미로 사용될 수 있다. 경로 컴포넌트 (path component)의 존재 여부는 데이터 또는 오브젝트 캐로젤이 레퍼런스되었는지 여부에 따라 달라질 수 있다. 데이터 캐로젤인 경우, 트랜잭션 아이디가 캐로젤 내의 데이터 모듈 (파일)을 식별할 수 있기 때문이다. 또한, /font/serif/timesNewRoman.ttf는 오브젝트 캐로젤 및 파일 이름을 위한 absolute path를 나타낼 수 있다. 이는 폰트정보의 폰트 패밀리 및 mime 타입 (폰트 이름 등) 을 포함할 수 있다.
여기에 추가로 carousel_type_id(one layer carousel, two layer carousel,…)에 따라서, group_id, module_id 등을 추가로 포함하도록 확장할 수 있다. 경우에 따라서는 font 관련 정보를 추가로 포함할 수도 있다. 이에 대한 포맷은 다음과 같다.
format: dvb://<original_network>. [<transport_stream>]. <service_id>. <component_tag>{&<component_tag>}[$<dvb_carousel_id>.<carousel_type_id>[.<group_id>[.<module_id>{&<module_id>}]]]<path-absolute>
format: dvb://<original_network>. [<transport_stream>]. <service_id>. <component_tag>{&<component_tag>}[$<dvb_carousel_id>. ,,, .<essential_indicator>.<language>.<font_family>.<mime_type>]<path-absolute>
위의 dvb url에서 포함하는 syntax에 대한 설명은 후술할 font_segment_for_DSMCC()의에서 포함하는 field의 설명과 동일하다.
도 4는 본 발명의 일 실시예에 따른 확장된 폰트 세그먼트를 나타낸다. 전술한 폰트 세그먼트는 위에서 언급한 정보 외에 추가적으로 필수 지시자(essential_indicator)를 포함할 수 있다. essential_indicator는 폰트 세그먼트에서 기술하는 font 가 timed text 에서 필수적으로 사용되어야 하는지 여부를 나타낼 수 있다. 예를 들어 즉, essential_indicator의 값이 1인 경우 해당 폰트가 timed text 에서 필수적으로 사용되어야 함을 나타낼 수 있으며 이러한 경우 수신기는 transport_mode 에 따라 해당 폰트 데이터를 다운로드 받은 후 사용할 수 있다. essential_indicator 외의 필드들에 대한 설명은 전술한 바와 같다.
도 5는 본 발명의 다른 실시예에 따른 폰트 세그먼트를 나타낸다. 본 실시예는 전술한 segment_type이 timed text 기반 subtitle 과 관련된 폰트 혹은 해당 폰트에 대한 다운로드 데이터를 포함하는 세그먼트인 경우를 나타내는 경우이다. 예를 들어 segment_type 값이 0x21 인 경우, 전술한 segment_data_field() 는 도시된 font_segment()를 포함할 수 있다. 도시된 font_segment structure는 전술한 바와 같이 개별 font에 대해 transport mode를 구분한 것과 달리 transport mode에 따라 해당 모드에 의해 전송되는 적어도 하나의 font를 기술할 수 있다. font_segment()는 각 transport mode 별로 전송되는 font에 대한 정보를 기술할 수 있다. 예를 들면, transport mode가 0x00으로 해당 세그먼트에 폰트 데이터자체가 포함되어 전송되는 경우, font_segment()는 폰트 개수 정보 및 각 폰트에 대한 font_segment_info(), lang_flag, language, font_data_len, font_data_bytes()를 포함할 수 있다. 각 필드에 대한 설명은 전술한 바와 같으며, font_segment_info()는 도면 하단에 도시된 바와 같다. 즉, font_segment_info()는 essential_indicator, font_family_len, font_family_bytes(), mime_type_len, mime_type_bytes()를 포함할 수 있다. transport mode가 0x01인 경우, 방송망 내의 data carousal 을 통해 폰트 데이터가 전송될 수 있다. 이 경우, font_segment()는 font_segment_for_DSMCC()를 포함할 수 있으며, 이에 대해서는 다음 도면에서 자세히 설명하기로 한다. transport mode가 0x02인 경우, 인터넷 망을 통해 폰트 데이터를 다운로드 할 수 있다. 이 경우, font_segment()는 각 폰트에 대해 공통 URL 길이 정보 (prefix_url_len), 공통 URL 정보 (prefix_url_bytes()), lang_flag, language, font_segment_info(), url_len, url_bytes()을 포함할 수 있다. 여기서 prefix_url_len는 각 폰트에 대한 공통적인 url 주소를 알려줄 수 있는 url의 길이를 나타낼 수 있다. 또한 prefix_url_bytes()은 각 폰트에 대한 공통적인 url 주소를 나타낼 수 있다. 각 폰트에 대한 각각의 주소는 url_bytes()로 알려줄 수 있다.
도 6은 본 발명의 일 실시예에 따른 DSMCC를 위한 폰트 세그먼트 정보를 나타낸다. 전술한 바와 같이, transport_mode가 0x01의 값으로 설정되어 폰트 데이터가 DSM-CC를 통해 전송되는 경우, 전술한 segment_data_field() 는 아래와 같은 font_segment_for_DSMCC()를 포함할 수 있다. font_segment_for_DSMCC()는 carousel_type_id의 값에 따라 그 값이 01인 경우 module_id만을, 10인 경우에는 group_id와 module_id를 포함할 수 있다. 이는 폰트 데이터를 포함하는 단위에 따라서 달라질 수 있는다. 또한 실시예에 따라서는 font_segment_for_DSMCC() 가 module 내의 하나의 block을 나타낼 수 있는 block_id까지도 포함할 수 있도록 추가로 확장할 수 있다. 예를 들어 각 module_id 마다 하나의 폰트가 포함된다고 하면, module 마다 font_segment_info()를 포함할 수 있다. 즉, font_segment_for_DSMCC()는 각 폰트에 대해 mime_type_bytes()을 가질 수 있다. 만약 하나의 font가 하나의 group에 포함된다면, transaction_id_DII와 함께 font_segment_info()를 제공할 수 있다. 즉, 폰트마다 font_segment_info()가 포함돼야 한다.
만약 carousel_type_id가 10으로 하나의 super group이 있고, 각 group이 하나의 폰트이고, super group은 서로 다른 language의 폰트 정보를 각각 포함한다면, carousel_type_id가 01인 경우와 마찬가지로 하나의 폰트에 하나의 font_segment_info( )가 포함될 수 있다.
만약 carousel_type_id가 10으로 하나의 super group이 있고, super group전체를 다운로드 받는 경우에, transaction ID는 DSI나 DII로 구분될 필요 없이 transaction_id만을 포함하도록 할 수 있다. 마찬가지로 carousel_type_id가 01로 하나의 group만을 포함하고, 본 group 전체를 다운로드 받아야 한다면 transaction ID는 carousel_type_id에 따라 구분될 필요가 없이 하나의 transaction_id로만 signaling될 수 있다.
font_segment_for_DSMCC()에 포함된 정보는 다음과 같다. carousel_id는 특정 네트워크 내에서 캐로젤을 식별하는 식별자를 나타낼 수 있다. transport_stream_id, original_network_id 및 service_id (PMT에서 program_number와 동일)는 DSM-CC로 전달되는 폰트에 대한 기본 정보인 transport_stream_id와 original_network_id, service_id를 나타낼 수 있다. carousel_type_id는 데이터 캐로젤의 종류를 식별하는 식별자를 나타낼 수 있다. 예를 들어 carousel_type_id가 01인 경우, one layer carousel을 나타내고, 10인 경우 two layer carousel을 나타낼 수 있다. transaction_id_DSI, transaction_id_DII는 top-level DownloadServerInitiate message 또는 DownloadInfoIndication message의 the transaction_id와 동일한 값을 나타낼 수 있다. 실시예에 따라 transaction_id_DSI와 transaction_id_DII는 구별 없이 transaction_id로 나타내 질 수 있다. 단, 경우에 따라 transaction_id는 download_id로 변경될 수도 있다. Transaction_id는 download_id와 다음과 같은 차이점을 가지고 있다. transaction_Id 메시지의 request-response 페어 동작을 연결하는 반면, download_Id는 데이터 메시지들 전체 세트와 연계되어 있다. downloadId는 프로그레스 내의 다운로드 시나리오에 대한 식별자이다. downloadId는 데이터 캐로젤을 위한 네트워크 내에서, flow-controlled 및 non-flow-controlled 시나리오를 위한 컨넥션 내에서 유일하게 정의될 수 있다. downloadId는 다운로드 시나리오에 의해 사용되는 연속적인 DownloadDataBlock, DownloadDataRequest 및 DownloadCancel 메시지들 내에서 사용될 수 있다. (The downloadId field is the identifier of the download scenario in progress. The downloadId shall be uniquely defined within the Network for data carousel scenario and unique within the connection for the flow-controlled and non-flow-controlled scenarios. This identifier shall be used in all of the subsequent DownloadDataBlock, DownloadDataRequest, and DownloadCancel messages used by the download scenario in progress.)
num_of_fonts는 하나의 module이 하나의 font를 포함한다는 가정하에서 num_of_modules와 동일한 값을 가질 수 있다. association_tag_DII 및 associtation_tag_DSI는 해당 데이터 브로드캐스트 서비스 또는 다른 DVB 서비스의 일부가 아닌 스트림과 관련된 association_tag를 포함할 수 있다. (this 16-bit field contains the association_tag that is associated with either a stream that is not part of this data broadcast service or another DVB service.) association_tag_DII 및 associtation_tag_DSI는 구별 없이 association_tag로 포함될 수 있다. 이는 하나의 transaction_id로 전달되는 여러 개의 폰트들 또는 여러 개의 language를 포함하는 stream의 tag를 나타낼 수 있다. module_id는 캐로젤 내에서 전달되는 오브젝트 내의 모듈을 식별할 수 있다. (The module_id identifies the module in which the object is conveyed within the carousel.) font_segment_info()는 폰트 이름과 같은 mime type 등을 나타낼 수 있다. group_id는 그룹을 설명하는 DownloadInfoIndication의 transaction_Id와 동일하게 설정될 수 있다. (This is a 32-bit field which shall be equal to transaction_Id of the DownloadInfoIndication message that describes the group.) 즉, transaction_id_DII와 동일한 값을 가질 수 있다. 전술한 실시예는 object carousel을 기준으로 시그널링을 포함한 예이다. 실시예에 따라서는, data_broadcast_id를 나눠서 object carousel인지 data carousel인지에 따라서 전술한 field들 중 일부를 가감할 수도 있다.
도 7은 본 발명의 일 실시예에 따른 추가 확장된 폰트 세그먼트를 나타낸다. 전술한 폰트 세그먼트는 위에서 언급한 정보 외에 추가적으로 전술한 데이터 캐로젤 관련 정보를 포함할 수 있다. 도시된 폰트 세그먼트의 신택스 구조는 수신기가 원하는 폰트를 다운로드할 때 유리한 구조이며, 각 필드에 대한 설명은 전술한 바와 같다. 도시된 font_segment() 실시예에서는 각각의 font에 대한 전송모드와 해당 전송 모드에 따른 필요정보들을 포함하는 구조이다. 도시된 font_segment()는 전송 모드인 transport_mode에 상관없이, 각 font에 대해 필수적으로 download해야 하는 font인지 여부를 나타내는 essential indicator, font family, 이름을 포함하는 mime_type을 포함할 수 있다. 또한 폰트별로 각 transport_mode에 대한 추가 정보를 포함할 수 있는 구조이다. 또한 carousel_type_id 값에 따라 01인 경우 module_id만을, 10인 경우에는 group_id와 module_id를 포함할 수 있다. Font data를 담는 단위에 따라서 이는 달라질 수 있는데, 경우에 따라서는 module 내의 하나의 block을 나타낼 수 있는 block_id까지도 포함할 수 있도록 추가로 확장 가능할 수 있다. 전술한 바와 같이, font_segment()에 포함된 정보 중 url_len는 url_bytes() 의 길이를 나타내고, url_bytes()는 해당 폰트 데이터를 다운로드 할 수 있는 경로를 나타낼 수 있다. 예를 들어 transport_mode 값이 0x02 인 경우 폰트데이터를 다운로드 할 수 있는 인터넷 상의 URL 을 나타낼 수 있다.
도 8은 본 발명의 일 실시예에 따른 자막 데이터에 대한 안전 영역 (safe area)을 지정하는 방법을 나타낸다. 본 발명에 따른 방송 시스템은 자막이 크롭핑 (cropping)되지 않도록 디스플레이하기 위한 정보인 안전 영역 정보 (safe area region information)를 전송할 수 있다. 안전 영역 정보는 자막 데이터가 디스플레이되는 영역이 수신기 디스플레이의 화면 비율 등에 의해 잘려지는 것을 방지하기 위한 영역을 설정할 수 있다. 안전 영역 정보는 PSI, SI, PES 등에 포함되어 전송될 수 있으며, 아래에서는 PES에 포함되어 전송되는 실시예에 대해 설명한다. 실시예에 따라 안전 영역 정보는 PES 포함된 자막 데이터에 포함될 수도 있다. 전술한 segment_type이 timed text 기반 subtitle 을 위한 safe area를 알려주기 위한 세그먼트인 경우(예를들어 segment_type이 0x22인 경우), 전술한 segment_data_field() 는 도시된 safe_area_info_segment()를 포함할 수 있다.
safe_area_info_segment()는 버전 넘버 정보(version_number), 안전영역 지시 포맷 정보(safe_area_format), 안전영역 수평 시작정보(safe_area_origin_horizontal), 안전영역 수직 시작 정보(safe_area_origin_vertical), 안전영역 수평 영역 정보(safe_area_extent_horizontal), 안전영역 수직 영역 정보(safe_area_origin_vertical) 중 적어도 하나를 포함할 수 있다. version_number는 safe area 정보의 version을 나타낼 수 있다. 새로운 정보로 바뀌는 경우에 version number는 오름차순으로 증가할 수 있다. safe_area_format는 안전 영역을 지시하는 값의 형식을 나타낸다. safe area를 indication하는 값은 pixel일 수도 있고, 기본 컨테이너 영역 (root container region)의 일부분(portion)을 나타내는 비율 또는 % 형태로 표현될 수도 있다. 또는 root container region을 일정 구획으로 segmentation한 cell의 값일 수도 있다. safe_area_origin_horizontal는 root container region에서 safe area가 시작하는 시작점 (x,y) 중 x값 (horizontal)을 의미한다. safe_area_format에 따라서 safe_area_origin_horizontal의 의미는 pixel, %, segment 등으로 해석될 수 있다. safe_area_origin_vertical는 root container region에서 safe area가 시작하는 시작점 (x,y) 중 y값 (vertical)을 의미한다. 마찬가지로 safe_area_format에 따라서 safe_area_origin_vertical의 의미는 pixel, %, segment 등으로 해석될 수 있다. safe_area_extent_horizontal는 root container region에서 safe area가 시작하는 시작점 (x)에서부터 시작하는 가로축의 면적을 의미한다. 마찬가지로 safe_area_format에 따라서 safe_area_extent_horizontal의 의미는 pixel, %, segment 등으로 해석될 수 있다. safe_area_origin_vertical는 root container region에서 safe area가 시작하는 시작점 (y)에서부터 시작하는 세로축의 면적을 의미한다. 마찬가지로 safe_area_format에 따라서 safe_area_origin_vertical의 의미는 pixel, %, segment 등으로 해석될 수 있다. 상술한 바와 같이 안전 영역은 해당 영역의 시작점 좌표와 가로, 세로축 면적 (길이)에 의해 지정될 수 있으며, 수신기 디스플레이의 화면비율 (aspect ratio)에 의해 크롭핑되지 않는 고유 영역을 지정할 수 있다.
도 9는 본 발명의 일 실시예에 따른 안전 영역 정보를 포함하는 PES 패킷의 데이터 필드를 나타낸다. 도시된 바와 같이 PES 패킷의 데이터 필드는 안정 영역 정보 플래그(safe_area_info_flag) 및 안전 영역 세그먼트(safe_area_segment())를 포함할 수 있다. safe_area_info_flag는 자막(subtitle)이 수신기의 화면 비율(aspect ratio)와 관계없이 크롭핑 (cropping)되지 않고 디스플레이될 수 있도록 안전 영역 (safe area)을 지정하는 안전 영역 정보를 포함하는지 여부를 나타낼 수 있다. safe_area_segment()는 자막이 수신기의 화면 비율(aspect ratio)에 따라 크롭핑 (cropping)되는 것을 방지하고, 디스플레이될 수 있도록 안전 영역 (safe area)을 지정하는 정보를 포함할 수 있다. 수신기는 PES 패킷 내에 포함된 자막 데이터와 안전 영역 정보를 함께 고려하여 자막 데이터를 디스플레이할 수 있다.
도 10은 본 발명의 일 실시예에 따른 폰트 정보를 시그널링 정보로써 전송하는 방법을 나타낸다. 전술한 font_segment()는 SI (service information) 상의 시그널링의 일부로 전달될 수 있다. 예를 들어, SI는 DVB (Digital Video Broadcasting) 시스템의 SDT (Service Description Table), EIT (Event Information Table), NIT (Network Information Table) 등이 될 수 있으며, 각 테이블 내에 디스크립터 (subtitling_descriptor)의 형태로 포함되어 시그널링 될 수 있다. 전술한 font_segment()는 PSI (Program Specific Information)의 PMT (Program Map Table)에 포함되어 전송될 수도 있다. subtitling_descriptor는 디스크립터 태그 정보 (descriptor_tag), 디스크립터 길이 정보 (descriptor_length), 자막 타입 정보(subtitling_type), 폰트 정보 플래그(font_info_flag), 필수 폰트 지시자(font_essential_indicator), 폰트 세그먼트 (font_segment()) 중 적어도 하나를 포함할 수 있다. subtitling_type 필드는 subtitling_descriptor가 적용되는 component가 XML 기반의 subtitle임을 구분할 수 있다. MSB 4비트로 XML임을 지정할 수 있으며 하위 4비트를 이용해 의도된 aspect ratio를 지정하는 실시 예를 사용할 수 있다. 또한 page_id는 해당 subtitle의 특성과 XML body의 적용되는 부분을 매칭 시킬 수 있다. 예를 들어, 특정 언어로 구성된 자막 데이터를 XML body 내에서 추출하기 위해 page_id를 사용할 수 있다. font_info_flag는 subtitle 과 연관된 폰트 관련 정보가 포함되는지 여부를 나타내는 플래그이다. 여기서 폰트 관련 정보는 해당 폰트를 다운로드 받을 수 있는 경로를 나타낼 수 있다. font_essential_indicator는 해당 font 가 timed text 에서 필수적으로 사용되어야 하는지 여부를 나타낼 수 있다. 예를 들어 즉, font_essential_indicator의 값이 1인 경우 해당 폰트가 timed text 에서 필수적으로 사용되어야 함을 나타낼 수 있으며 이러한 경우 수신기는 transport_mode 에 따라 해당 폰트 데이터를 다운로드 받은 후 사용할 수 있다. font_segment()는 전술한 바와 같이 font family, mime type, font 다운로드 경로 등에 대한 정보를 포함할 수 있다.
전술한 font_segment()는 SI (service information) 상의 시그널링의 일부로 전달될 수 있다. 여기서 SI는 프로그램 상세 정보 (program specific information, PSI)를 의미할 수 있다. 예를 들어, SI는 DVB 시스템의 SDT (Service Description Table), EIT (Event Information Table), NIT (Network Information Table) 등이 될 수 있으며, 각 테이블 내에 디스크립터 (subtitling_descriptor)의 형태로 포함되어 시그널링 될 수 있다. 전술한 font_segment()는 PSI (Program Specific Information)의 PMT (Program Map Table)에 포함되어 전송될 수도 있다. font_descriptor는 컴포넌트 태그 정보(component_tag), 필수 폰트 지시자(font_essential_indicator), 폰트 세그먼트(font_segment())를 포함할 수 있다. component_tag는 해당 폰트 데이터와 연관된 subtitle stream 을 식별하기 위한 식별자이고, font_segment()는 전술한 바와 같이 font family, mime type, font 다운로드 경로 등에 대한 정보를 나타낼 수 있다. font_essential_indicator에 대한 설명은 전술한 바와 같다. 본 발명에 따른 방송 수신기는 전술한 subtitling_descriptor 또는 font_descriptor로부터 특정 폰트에 대한 필수 다운로드 여부를 확인하고, 관련 정보를 통해 해당 폰트를 다운로드하여 자막 데이터를 디스플레이하는데 사용할 수 있다.
도 11은 본 발명에 따른 안전 영역 정보를 시그널링 정보로써 전송하는 방법을 나타낸다. 전술한 safe_area_info_segment()는 SI (service information) 상의 시그널링의 일부로 전달될 수 있다. 예를 들어, SI는 DVB 시스템의 SDT (Service Description Table), EIT (Event Information Table), NIT (Network Information Table) 등이 될 수 있으며, 각 테이블 내에 디스크립터 (subtitling_descriptor)의 형태로 포함되어 시그널링 될 수 있다. 전술한 safe_area_info_segment()는 PSI (Program Specific Information)의 PMT (Program Map Table)에 포함되어 전송될 수도 있다. subtitling_descriptor는 도시된 바와 같이 전술한 자막 관련 정보 및 추가적으로 안전 영역 정보를 포함할 수 있다. 자막 관련 정보는 이전 도면에서 설명한 바와 동일하므로, 추가된 정보에 대해서 설명하도록 한다. safe_area_info_segment()는 안전 영역 정보 플래그 및 안전 영역 정보 세그먼트를 포함할 수 있다. safe_area_info_flag는 자막 데이터가 수신기의 화면 비율 (aspect ratio)과 관계없이 크롭핑 (cropping)되지 않고 디스플레이될 수 있도록 안전 영역 (safe area)을 지정하는 정보를 포함하는지 여부를 나타낼 수 있다. safe_area_info_segment()는 전술한 바와 같이 기본 컨테이너 영역 (root container region)에 대한 시작점 정보와 cropping되지 않고 디스플레이되어야 하는 영역의 좌표 또는 크기 등의 정보를 포함할 수 있다.
전술한 safe_area_info_segment()는 SI (service information) 상의 시그널링의 일부로 전달될 수 있다. 예를 들어, SI는 DVB 시스템의 SDT (Service Description Table), EIT (Event Information Table), NIT (Network Information Table) 등이 될 수 있으며, 각 테이블 내에 디스크립터 (subtitling_descriptor)의 형태로 포함되어 시그널링 될 수 있다. 전술한 safe_area_info_segment()는 PSI (Program Specific Information)의 PMT (Program Map Table)에 포함되어 전송될 수도 있다. safe_area_info_descriptor는 컴포넌트 태그 정보(component_tag) 및 안전 영역 정보 세그먼트(safe_area_info_segment())를 포함할 수 있다. component_tag는 해당 safe area 정보와 연관된 subtitle stream 을 식별하는 식별자이다. 또한, safe_area_info_segment()는 전술한 바와 같이 기본 컨테이너 영역 (root container region)에 대한 시작점 정보와 cropping되지 않고 디스플레이되어야 하는 영역의 좌표 또는 크기 등의 정보를 포함할 수 있다.
도 12는 본 발명의 일 실시예에 따른 EIT를 통해 수신된 폰트 정보를 이용하여 폰트 데이터를 수신하는 방법을 나타낸다. 방송 수신 장치는 수신된 EIT에 포함된 font descriptor로부터 전송 모드 (transport_mode)를 확인하고 관련 정보를 통해 폰트를 다운로드할 수 있다. 전송 모드 (transport_mode)가 0x01 인 경우, 폰트는 DSMCC 데이터 캐로젤 (data carousel) 형태로 전송된다. font descriptor 내에는 font가 포함된 addressable section을 유니크(unique)하게 식별할 수 있는 transaction_id가 포함될 수 있다. 또한 URL 정보도 함께 포함될 수 있다. 여기에 추가적으로 DSMCC data carousel에 대한 PID와 같은 식별자가 포함될 수 있다. 이에 대한 상세 동작은 전술한 바와 같다.
도 13은 본 발명의 다른 실시예에 따른 EIT를 통해 수신된 폰트 정보를 이용하여 폰트 데이터를 수신하는 방법을 나타낸다. 전술한 실시예의 도면에서는 font_descriptor()가 url_bytes()와 transaction_id를 포함할 수 있다. 본 실시예에서는 DSMCC의 data/object carousel이 구성되는 형태에 따라서 module id, group id, carousel type id 등과 같은 추가 정보를 uri_bytes()가 포함할 수 있다. 또한, uri_bytes()는 실시예에 따라 추가적으로 language, font family, mime type bytes등의 정보를 모두 포함할 수도 있다. 수신기는 uri_bytes()를 이용하여 실제 DSMCC data/object carousel로 전달되는 font data를 찾고 수신할 수 있다.
전송 모드 정보 (transport_mode)가 0x01 이고, url 정보 (또는 uri 정보, urn 정보)에 font download를 위한 carousel 정보가 포함되어 있는 경우의 수신기 동작은 다음과 같다. 수신기는 EIT를 통해 font descriptor()와 font segment()를 확인한다. Broadcast로 폰트가 전송되는 경우, uri_bytes()를 통해 추후에 다운 받아야 하는 폰트가 어느 경로를 통해 어느 형태로 수신되는지 파악할 수 있다. 수신기는 uri_bytes()가 포함하는 dvb_carousel_id(=transaction_id), carousel_type_id, group_id, module_id 등을 이용해 추후 실제로 DSM-CC를 통해 전달되는 폰트를 포함한 stream을 식별할 수 있는 정보를 획득할 수 있다. 또한 수신기는 Path-absolute 또는 uri syntax가 포함하는 폰트에 대한 추가 정보를 통해 language, font family, mime type등을 구분하여 폰트를 선택적으로 다운로드 할 수도 있다. 수신기는 uri_bytes에 포함된 transport_stream_id, original_network_id, service_id (event_id를 추가로 포함할 수도 있음), component_tag를 이용하여, Subtitle을 포함하는 stream과 연관된 downloaded font 찾아, 해당 폰트를 적용하여 subtitle을 디스플레이 할 수 있다. 즉, uri_bytes에 포함된 transport_stream_id, original_network_id, service_id (event_id를 추가로 포함할 수도 있음), component_tag는 다운로드된 폰트와 자막 데이터를 연관시킬 수 있으며, 수신기는 해당 자막 데이터가 디스플레이될 때 다운로드된 폰트를 이용할 수 있다.
도 14는 본 발명의 다른 실시예에 따른 EIT를 통해 수신된 폰트 정보를 이용하여 폰트 데이터를 수신하는 방법을 나타낸다. EIT에 포함된 font_descriptor()는 transport_mode에 따라 URL을 포함하여 signaling할 수 있다. 즉, transport_mode가 0x01, 0x02인 경우에 font_descriptor()는 폰트 데이터와 관련된 정보를 포함할 수 있으며, 예를 들어 폰트를 다운로드 받을 수 있는 URL 정보를 포함할 수 있다. 예를들어 transport_mode가 0x01인 경우, 방송 송신 장치는 방송망 내 data carousal 을 통해 폰트 데이터를 전송할 수 있다. 이 때, font_descriptor()가 carousel_type_id, transcation_id, group_id, 또는 module_id 중 적어도 하나를 포함하도록 추가로 확장될 수 있다. 수신기는 이와 같은 정보를 통해 DSM-CC의 동일한 transcation_id 값을 갖는 Data Information indication과 연결되어, 각 module에 필요한 font data를 수신할 수 있다. SDT 또는 EIT에서 포함하는 font_descriptor()에서 transport mode가 0x01 (broadcast)인 경우, 수신기는 carousel_type_id, group_id, transaction_id_DII, module_id, mime_type_bytes() 등을 이용해 carousel을 통해 전달되는 font에 대한 정보를 알 수 있다. 다운로드 된 후에는 font를 이름(mime_type_bytes())으로 구별하여 다운로드가 되었는지 아닌지를 확인할 수 있다.
도 15는 본 발명의 다른 실시예에 따른 EIT를 통해 수신된 폰트 정보를 이용하여 폰트 데이터를 수신하는 방법을 나타낸다. 본 실시예는 EIT에 포함된 font_descriptor()가 url_bytes()나 transaction_id 등을 포함하지 않고, 기존에 data broadcasting을 위해서 정의되어 있는 data_broadcast_descriptor를 이용하는 방법에 대한 예이다. SDT/EIT에서 포함하는 data_broadcast_descriptor는 DII message를 가리킨다. 이 message는 data carousel에 있는 module들의 ModuleInfoByteField를 이용해서 다양한 information을 제공한다. 예를 들어, DownloadDataBlock 메시지들의 위치에 대한 포인터에 대한 정보를 제공할 수 있다. data_broadcast_descriptor는 다음과 같은 정보를 포함할 수 있다. data_broadcast_id는 DVB 데이터 캐로젤을 지시하는 0x0006 값으로 설정될 수 있다. component_tag는 데이터 캐로젤을 브로드캐스트하는데 사용되는 스트림에 대한 stream_identifier_descriptor 의 component_tag 필드와 동일한 값으로 설정될 수 있다. (This field shall have the same value as a component_tag field of a stream_identifier_descriptor (if present in the PSI program map section) for the stream that is used to broadcast the data carousel.) selector_length는 0x10으로 설정될 수 있다. (This field shall be set to 0x10.) 또한 selector_byte는 data_carousel_info 구조를 제공할 수 있다. 여기에 포함되어 있는 transaction_id를 이용해서 DSM-CC의 DSI/DII를 찾아 폰트를 다운로드 받을 수 있다. 도시된 바와 같이 selector_byte은 데이터 캐로젤의 경우 data_carousel_info를 포함할 수 있으며, 오브젝트 캐로젤의 경우 object_carousel_info를 포함할 수 있다. 이들은 각각 transaction_id를 포함할 수 있으며, 수신기는 이와 같은 정보를 통해 DSM-CC의 동일한 transcation_id 값을 갖는 Data Information indication과 연결되어, 각 module에 필요한 font data를 수신할 수 있다.
도 16은 본 발명의 일 실시예에 따른 데이터 정보 인디케이션 (data information indication)을 나타낸 도면이다. 기존의 DSM-CC에서 하나의 Data Information indication (DII)는 여러 개의 module의 집합이고, 하나의 module은 여러 개의 block(DDB)의 집합이다. 즉, Module은 하나의 font를 의미할 수 있다. 즉, “sansSerif”가 하나의 module로 구성될 수 있다. 이때 각 block이 “sansSerif”의 알파벳 대문자(block 1), 알파벳 소문자 (block 2), 숫자 (block 3), 특수 문자(block 4) 등으로 구분될 수 있다. 혹은 각각의 DDB가 하나의 글씨 자체가 들어갈 수 있다 (e.g. “a”). 경우에 따라서는 순서와 size를 구분하여 하나의 block으로 구성될 수도 있다. super group은 여러 개의 language에 대한 각각의 font를 포함하고 있을 수 있다. 이러한 경우에 moduleInfoByte에는 앞에서 정의했던 font_segement_info()의 mime_type_byte( )를 포함하여, 어떤 font에 대한 module인지 식별할 수 있게 할 수 있다.
다른 실시예에 따르면, download 받아야 할 “sansSerif”인 font data 자체가 하나의 DII로 구성될 수 있다. 이 경우, 각각의 module은 “sansSerif”의 알파벳 대문자(module 1), 알파벳 소문자 (module 2), 숫자 (module 3), 특수 문자(module 4) 등으로 구분될 수도 있고, 경우에 따라서는 순서와 size를 구분하여 하나의 module로 구성할 수도 있다. 이 때 하나의 block에는 하나의 글씨 자체가 들어갈 수 있다. (e.g. “a”)
다른 실시예에 따르면, 하나의 module에는 하나의 font 전체가 포함되고, 다른 module에는 “sansSerif“의 family font 각각이 포함될 수 있다. "sansSerif“(module 1), "serif“(module 2), "monospaceSansSerif““(module 3), "monospaceSerif“(module 4) 이 각각의 모듈에 포함될 수 있다.
다른 실시예에 따르면, DII는 하나의 font로 구성되고, DSI에서 다른 언어의 font를 포함하도록 할 수도 있다. 이러한 경우에는 DSI(DownloadServerInitiate)가 포함되어 group_id를 추가로 포함하게 된다.
도 17은 본 발명의 일 실시예에 따른 그룹 정보 인디케이션 (groupInfoIndication)을 나타낸다. 도시된 groupInfoIndication은 전술한 DownloadServerInitiate의 privateDataByte에 포함될 수 있다. DownloadServerInitiate 메시지는 슈퍼그룹 (SuperGroup)을 만들기 위해 사용될 수 있다. (DownloadServerInitiate message is used to build a SuperGroup.) 여기서, DVB data carousels 을 위한 DownloadServerInitiate는 다음의 정보를 포함할 수 있다. serverId는 0xFF의 값을 갖는 20 바이트로 설정될 수 있다. (this field shall be set to 20 bytes with the value of 0xFF.) compatibilityDescriptor()는 DSM-CC에서 정의된 바와 같이 compatibilityDescriptor()의 compatibilityDescriptorLength 필드만을 포함할 수 있다. (this structure shall only contain the compatibilityDescriptorLength field of the compatibilityDescriptor() as defined in DSM-CC.) 이는 0x0000으로 설정될 수 있다. It shall be set to the value of 0x0000. privateDataLength는 뒤따르는 GroupInfoIndication의 바이트 길이를 정의할 수 있다. (privateDataLength: this field defines the length in bytes of the following GroupInfoIndication structure.)
privateDataByte 필드는 도시된 GroupInfoIndication()을 포함할 수 있다. (The privateDataByte fields shall contain the GroupInfoIndication structure as defined in the figure.) DownloadServerInitiate(DSI)는 groupInfoIndication에 language정보를 포함할 수 있다.
groupInfoIndication는 그룹 개수 정보(NumberOfGroups), 그룹 식별자(GroupId), 그룹 사이즈 정보(GroupSize), 그룹 컴패터빌러티 정보(GroupCompatibility), 그룹 인포 길이 정보(GroupInfoLength), 그룹 인포 바이트(groupInfoByte), 프라이빗 데이터 길이 정보(PrivateDataLength) 및 프라이빗 데이터 바이트(PrivateDataByte) 중 적어도 하나를 포함할 수 있다. NumberOfGroups은 그룹의 개수를 나타내고, GroupId은 개별 그룹의 식별자를 나타낼 수 있다. GroupSize는 그룹의 사이즈를 나타내고, GroupInfoLength는 뒤따르는 groupInfoByte의 길이 정보를 나타낼 수 있다. groupInfoByte는 전술한 font_segement_for_DSMCC()에서 정의한 language와 같은, 어떤 language를 의미하는지 나타낼 수 있는 식별자를 포함할 수 있다. groupInfoByte는 이를 통해, 어떤 language에 대한 group인지 식별할 수 있게 할 수 있다.
도 18은 본 발명의 일 실시예에 따른 방송 수신기의 PMT를 이용한 폰트 다운로드 방법을 나타낸 도면이다. 특히 transport_mode가 0x01인 경우를 나타낸다. 전술한 바와 같이 수신기는 EIT를 통해 font descriptor()와 font segment()를 확인할 수 있다. Broadcast를 통해 폰트가 전송되는 경우, font_segment_for_DSMCC() 및 Data_broadcast_descriptor( )를 통해 추후에 다운 받아야 하는 font가 어느 경로를 통해 어느 형태로 오는지에 대한 정보를 획득할 수 있다. 수신기는 Font_segment_for_DSMCC()에서 포함하는 carousel_id, transport_stream_id, original_network_id, service_id 를 이용해 추후 실제로 DSM-CC를 통해 전달되는 폰트를 포함한 스트림을 식별하는 정보를 획득할 수 있다. 또한 Carousel_type_id에 따라서 다수개의 language를 포함한 DSI나 language에 따른 다수개의 font를 다운 받을 수 있는 DII의 indication 정보(addressable section을 unique하게 식별)인 transaction_id를 통해 다운 받아야 하는 폰트를 식별하고, 이를 다운로드 할 수 있다. 수신기는 해당 event가 실제 방송되는 시점에, PMT를 이용해 PMT 1st descriptor loop에 포함된 carousel_identifier_descriptor를 통해 carousel_id를 파악할 수 있다. 또한 수신기는 deffered_association_tags_descriptor()에 포함된 association_tag와 transport_stream_id, original_network_id를 이용하여 특정 subtitle을 포함하고 있는 또 다른 PMT를 인식하고, subtitle을 포함한 stream의 정보를 파악할 수 있다. 수신기는 Subtitle을 포함하는 stream과 연결되는 다운로드 된 font 찾아, font를 적용하여 subtitle을 디스플레이 할 수 있다.
도 19는 본 발명의 일 실시예에 따른 방송 수신기의 상세 구성을 나타낸 도면이다. 방송 수신기는 수신부(DTV tuner, 1901), 복조부(demodulator, 1902), 역다중화부(demux, 1903), 비디오 디코더(video decoder, 1904), XML 자막 디코더(XML subtitle decoder 1905), 오디오 비디오 자막 동기화부(A/V/S sync, 1906), 시스템 정보 처리부(SI processor, 1907) 및/또는 디스플레이 처리부(display processor, 1908) 중 적어도 하나를 포함할 수 있다. 또한 방송 수신기는 실시예에 따라 추가적으로 네트워크 프로세서(network processor, 1909)를 포함할 수 있다.
수신부(1901)는 송신기에 의해 송신된 방송 신호를 수신할 수 있다. 수신된 방송 신호는 복조부(1902)에 입력될 수 있다. 수신된 방송 신호는 미디어 데이터 및 이와 관련된 자막 데이터를 포함할 수 있다.
복조부(1902)는 방송 신호를 복조하여 TS (transport stream)를 출력할 수 있다. TS는 역다중화부(1903)에 입력되어 역다중화될 수 있다. 역다중화된 TS는 미디어 데이터 (e.g. HEVC bitstream), XML subtitle 스트림, SI(service information)을 포함할 수 있다. 여기서 XML subtitle은 패킷화 또는 압축된 형태일 수 있다. 전술한 바와 같이 XML subtitle 또는 SI는 자막 데이터와 관련된 폰트에 대한 정보를 포함할 수 있다.
비디오 디코더(1904)는 미디어 데이터 (HEVC bitstream)를 입력받아 디코딩하고 video frame을 출력할 수 있다.
XML 자막 디코더(1905)는 XML subtitle 스트림을 입력 받아 자막을 추출하고 디코딩할 수 있다. 도 4 내지 도 18에서 전술한 바와 같이 XML subtitle 스트림의 PES 패킷은 자막 데이터와 관련된 폰트에 대한 정보, 안전 영역에 대한 정보 또는 필수 다운로드 폰트임을 나타내는 정보 중 적어도 하나를 포함할 수 있다.
오디오 비디오 자막 동기화부(A/V/S sync, 1906)는 미디어 데이터 (HEVC bitstream) 및 XML subtitle 각각의 PTS 및 PCR(Program Clock Reference)을 입력 받아 비디오 프레임과 자막을 동기화할 수 있다.
시스템 정보 처리부(1907)는 역다중화부로부터 출력된 SI(service information) 정보를 수신하여 OSD 정보를 추출할 수 있다. 도 4 내지 도 18에서 전술한 바와 같이 SI 정보는 자막 데이터와 관련된 폰트에 대한 정보, 안전 영역에 대한 정보 또는 필수 다운로드 폰트임을 나타내는 정보 중 적어도 하나를 포함할 수 있다.
네트워크 프로세서(1909)는 전술한 자막 관련 폰트 정보 내의 transaction_Id 또는 URL 정보를 이용하여 자막 데이터와 관련된 폰트 데이터를 수신할 수 있다. 특히, 전술한 필수 다운로드 폰트임을 나타내는 정보가 'essential'로 설정된 경우, 네트워크 통신부는 해당 폰트 데이터를 다운로드할 수 있다.
디스플레이 처리부(1908)은 비디오 프레임 및 자막을 수신하여 디스플레이 프레임을 출력할 수 있다. 디스플레이 처리부(1908)은 비디오 프레임 및 자막에 추가적으로 OSD(On Screen Display)정보를 수신하여 디스플레이 프레임을 출력할 수도 있다. 여기서 OSD 정보란 자막 데이터와 관련된 폰트에 대한 정보, 안전 영역에 대한 정보 또는 필수 다운로드 폰트임을 나타내는 정보를 나타낼 수 있다. 출력된 디스플레이 프레임은 영상 출력 장치에 의해 디스플레이될 수 있으며, 본 발명에서 설명한 XML 자막과 비디오 프레임이 함께 디스플레이될 수 있다.
도 20은 본 발명의 일 실시예에 따른 방송 송신기를 나타낸 블록도이다. 본 발명에 따른 방송 송신기(d20010)은 인코더(d20020), 다중화부(d20030) 및/또는 송신부(d20040)를 포함할 수 있다.
인코더(d20020)는 UHD, HD 또는 SD의 해상도를 갖는 비디오 데이터를 입력 받고, 비디오 데이터를 인코딩하여 비디오 스트림을 생성할 수 있다. 여기서, 비디오 스트림은 HEVC(High Efficiency Video Coding)에 의해 인코딩될 수 있다. 비디오 스트림은 비디오 ES(elementary stream) 또는 비디오 ES가 패킷화된 비디오 PES(packetized elementary stream)를 의미할 수 있다. 본 발명의 실시예에 따르면 인코더는 자막 데이터를 자막 스트림으로 인코딩할 수 있으며, 자막 스트림을 구성하는 PES 패킷들은 자막 데이터와 연관된 폰트 정보, 필수 다운로드 자막 정보, 안전 영역 정보 중 적어도 하나를 더 포함할 수 있다.
인코딩된 비디오 스트림은 XML 자막 스트림과 함께 다중화부(d20030)에 입력될 수 있다. 다중화부는 인코딩된 SI 정보, 비디오 스트림 및 자막 스트림을 다중화하여 트랜스포트 스트림(TS, transport stream)을 생성할 수 있다. 여기서 자막 스트림은 XML 자막 스트림일 수 있다. 실시예에 따라 자막 데이터와 연관된 폰트 정보, 필수 다운로드 폰트 정보, 안전 영역 정보 중 적어도 하나는 비디오 스트림 및 자막 스트림과 함께 다중화되는 SI 정보에 포함되어 전송될 수도 있다.
송신부(d20040)는 다중화부(d20030)로부터 출력된 트랜스포트 스트림을 방송 신호로써 전송할 수 있다. 여기서, 트랜스포트 스트림은 전송 전에 채널 코딩 및 변조된 후 방송 신호로써 전송될 수 있다.
도 21은 본 발명의 일 실시예에 따른 방송 수신기를 나타낸 블록도이다. 본 발명에 따른 방송 수신기(d21010)은 수신부(d21020) 역다중화부(d21030) 및/또는 디코더(d21040)를 포함할 수 있다.
수신부(d21020)에 의해 수신된 방송 신호는 복조된 후 채널 디코딩될 수 있다. 채널 디코딩된 방송 신호는 역다중화부(d21030)에 입력되어 비디오 스트림, 자막 스트림 및 SI로 역다중화될 수 있다. 자막 스트림 또는 SI는 자막 데이터와 연관된 폰트 정보, 필수 다운로드 폰트 정보, 안전 영역 정보 중 적어도 하나를 포함할 수 있다.
역다중화부의 출력은 디코더(d21040)에 입력되어 비디오 데이터 및 자막 데이터로 각각 디코딩될 수 있다. 즉 비디오 스트림은 비디오 디코더에 의해, 자막 스트림은 자막 디코더에 의해 디코딩되어 각각 비디오 데이터 및 자막 데이터로 출력될 수 있다. 비디오 데이터 및 자막 데이터는 동기화되어 수신기에 의해 디스플레이될 수 있다. 방송 수신기는 자막 스트림 또는 SI로부터 자막 데이터와 연관된 폰트 정보, 필수 다운로드 폰트 정보, 안전 영역 정보를 획득할 수 있다. 방송 수신기는 상기 정보들을 이용하여 자막 데이터와 관련된 폰트 데이터를 수신하고, 폰트 데이터를 사용하고, 안전 영역 정보를 고려하여 자막 데이터를 디스플레이할 수 있다.
도 22는 본 발명의 일 실시예에 따른 XML 자막을 포함하는 방송 신호를 전송하는 방법을 나타낸 도면이다. XML 자막을 포함하는 방송 신호를 전송하는 방법은 비디오를 인코딩하여 비디오 스트림을 생성하는 단계(ds22010), 생성된 비디오 스트림 및 자막 정보를 포함하는 방송신호를 생성하는 단계(ds22020) 및 생성된 방송신호를 전송하는 단계(ds22030)를 포함할 수 있다.
비디오를 인코딩하여 비디오 스트림을 생성하는 단계(ds22010)는 UHD, HD 또는 SD의 해상도를 갖는 비디오 데이터를 입력 받고, 비디오 데이터를 인코딩하여 비디오 스트림을 생성할 수 있다. 여기서, 비디오 스트림은 HEVC(High Efficiency Video Coding)에 의해 인코딩될 수 있다. 비디오 스트림은 비디오 ES(elementary stream) 또는 비디오 ES가 패킷화된 비디오 PES(packetized elementary stream)를 의미할 수 있다. 이와 함께 XML 자막 스트림을 생성할 수 있다. 자막 스트림은 자막 데이터와 연관된 폰트 정보, 필수 다운로드 폰트 정보, 안전 영역 정보 중 적어도 하나를 포함할 수 있다.
생성된 비디오 스트림, SI 정보 및 자막 스트림을 포함하는 방송신호를 생성하는 단계(ds22020)는 인코딩된 비디오 스트림와 자막 스트림을 다중화하여 트랜스포트 스트림(TS, transport stream)을 생성할 수 있다. 여기서 자막 스트림은 XML 자막 스트림일 수 있다. TS에 포함된 PES 패킷은 자막 데이터 및 자막과 관련된 정보를 포함할 수 있으며, 예를 들어 자막 데이터와 연관된 폰트 정보, 필수 다운로드 폰트 정보, 안전 영역 정보 중 적어도 하나를 포함할 수 있다.
생성된 방송신호를 전송하는 단계(ds22030)는 트랜스포트 스트림을 방송 신호로써 전송할 수 있다. 여기서, 트랜스포트 스트림은 전송 전에 채널 코딩 및 변조된 후 방송 신호로써 전송될 수 있다.
도 23은 본 발명의 일 실시예에 따른 XML 자막을 포함하는 방송 신호를 수신하는 방법을 나타낸 도면이다. XML 자막을 포함하는 방송 신호를 수신하는 방법은 방송 신호를 수신하는 단계(ds23010), 수신된 방송 신호로부터 SI 정보, 비디오 스트림 및 자막 스트림으로 역다중화하는 단계(ds23020) 및 비디오 스트림을 디코딩하는 단계(ds23030)를 포함할 수 있다.
방송 신호를 수신하는 단계(ds23010)는 수신부를 이용하여 수신된 방송 신호는 복조된 후 채널 디코딩될 수 있다. 수신된 방송 신호로부터 SI 정보, 비디오 스트림 및 자막 스트림으로 역다중화하는 단계(ds23020)는 채널 디코딩된 방송 신호를 역다중화부를 이용하여 비디오 스트림 및 자막 스트림으로 역다중화할 수 있다. SI 정보 또는 자막 스트림은 자막 데이터와 관련된 폰트에 대한 정보, 안전 영역에 대한 정보 또는 필수 다운로드 폰트임을 나타내는 정보 중 적어도 하나를 포함할 수 있다.
비디오 스트림 및 자막 스트림을 각각 디코딩하는 단계(ds23030)는 비디오 디코더를 이용하여 비디오 스트림을 디코딩하고 비디오 데이터를 획득할 수 있다. 이 단계에서 자막 스트림에 대해서는 자막 디코더를 이용하여 자막 데이터를 획득할 수 있다. 비디오 데이터 및 자막 데이터는 동기화되어 수신기에 의해 디스플레이될 수 있다. 수신기는 자막 데이터와 관련된 폰트에 대한 정보 및 필수 다운로드 폰트임을 나타내는 정보를 이용하여 폰트 데이터를 추가로 수신할 수 있다. 수신기는 폰트 데이터 및 안전 영역에 대한 정보를 이용하여 자막 데이터를 디스플레이할 수 있다.
본 발명의 실시예에 따르면, 자막 스트림과 연관된 폰트 관련 정보를 획득할 수 있다.
본 발명의 실시예에 따르면, 폰트 관련 정보를 이용하여 데이터 캐로젤로부터 폰트 관련 정보를 수신할 수 있다.
본 발명의 실시예에 따르면, 자막 스트림과 연관된 폰트 데이터가 필수적으로 다운로드 되어야하는지 여부를 시그널링할 수 있다.
본 발명의 실시예에 따르면, 자막 데이터가 디스플레이되는 영역 중 크롭핑되지 않는 안전 영역을 시그널링할 수 있다.
설명의 편의를 위하여 각 도면을 나누어 설명하였으나, 각 도면에 서술되어 있는 실시 예들을 병합하여 새로운 실시 예를 구현하도록 설계하는 것도 가능하다. 그리고, 당업자의 필요에 따라, 이전에 설명된 실시 예들을 실행하기 위한 프로그램이 기록되어 있는 컴퓨터에서 판독 가능한 기록 매체를 설계하는 것도 본 발명의 권리범위에 속한다.
본 발명에 따른 장치 및 방법은 상술한 바와 같이 설명된 실시 예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상술한 실시 예들은 다양한 변형이 이루어질 수 있도록 각 실시 예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.
한편, 본 발명의 영상 처리 방법은 네트워크 디바이스에 구비된 프로세서가 읽을 수 있는 기록매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 기록매체는 프로세서에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 프로세서가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한, 인터넷을 통한 전송 등과 같은 캐리어 웨이브의 형태로 구현되는 것도 포함한다. 또한, 프로세서가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 프로세서가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
또한, 이상에서는 본 발명의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해돼서는 안 될 것이다.
그리고, 당해 명세서에서는 물건 발명과 방법 발명이 모두 설명되고 있으며, 필요에 따라 양 발명의 설명은 보충적으로 적용될 수가 있다.
발명의 실시를 위한 형태는 위의 발명의 실시를 위한 최선의 형태에서 함께 기술되었다.
본원 발명은 방송 및 비디오 신호 처리 분야에서 사용 가능하고 반복 가능성이 있는 산업상 이용가능성이 있다.

Claims (15)

  1. 비디오 데이터를 인코딩하여 비디오 스트림을 생성하는 단계;
    상기 생성된 비디오 스트림 및 자막 스트림을 포함하는 방송 신호를 생성하는 단계, 여기서 상기 방송 신호는 상기 자막 스트림에 포함된 자막 데이터와 연관된 폰트 데이터를 다운로드할 수 있는 정보 및 상기 폰트 데이터가 필수적인지 여부를 지시하는 인디케이터를 더 포함함; 및
    상기 생성된 방송 신호를 전송하는 단계를 포함하는 방송 신호 송신 방법.
  2. 제 1 항에 있어서,
    상기 폰트 데이터를 다운로드할 수 있는 정보 및 상기 폰트 데이터가 필수적인지 여부를 지시하는 인디케이터는 프로그램 상세 정보 (program specific information, PSI) 또는 서비스 정보 (service information)에 전송되는 방송 신호 송신 방법.
  3. 제 2 항에 있어서,
    상기 폰트 데이터를 다운로드할 수 있는 정보는 트랜잭션 식별자 (transaction ID)를 포함하는 URI (uniform/universal resource identifier) 정보인 방송 신호 송신 방법.
  4. 제 1 항에 있어서,
    상기 자막 스트림은 상기 자막 데이터가 디스플레이됨에 있어서, 수신기의 화면 비율에 의해 크롭핑되는 것을 방지하는 안전 영역에 대한 정보를 더 포함하는 방송 신호 송신 방법.
  5. 비디오 데이터를 인코딩하여 비디오 스트림을 생성하는 인코더;
    상기 생성된 비디오 스트림 및 자막 스트림을 포함하는 방송 신호를 생성하는 멀티플렉서, 여기서 상기 방송 신호는 상기 자막 스트림에 포함된 자막 데이터와 연관된 폰트 데이터를 다운로드할 수 있는 정보 및 상기 폰트 데이터가 필수적인지 여부를 지시하는 인디케이터를 더 포함함; 및
    상기 생성된 방송 신호를 전송하는 트랜스미터를 포함하는 방송 신호 송신 장치.
  6. 제 5 항에 있어서,
    상기 폰트 데이터를 다운로드할 수 있는 정보 및 상기 폰트 데이터가 필수적인지 여부를 지시하는 인디케이터는 프로그램 상세 정보 (program specific information, PSI) 또는 서비스 정보 (service information)에 전송되는 방송 신호 송신 장치.
  7. 제 6 항에 있어서,
    상기 폰트 데이터를 다운로드할 수 있는 정보는 트랜잭션 식별자 (transaction ID)를 포함하는 URI (uniform/universal resource identifier) 정보인 방송 신호 송신 장치.
  8. 제 5 항에 있어서,
    상기 자막 스트림은 상기 자막 데이터가 디스플레이됨에 있어서, 수신기의 화면 비율에 의해 크롭핑되는 것을 방지하는 안전 영역에 대한 정보를 더 포함하는 방송 신호 송신 장치.
  9. 방송 신호를 수신하는 단계, 여기서 상기 방송 신호는 비디오 스트림 및 자막 스트림을 포함하고, 상기 방송 신호는 상기 자막 스트림에 포함된 자막 데이터와 연관된 폰트 데이터를 다운로드할 수 있는 정보 및 상기 폰트 데이터가 필수적인지 여부를 지시하는 인디케이터를 더 포함함;
    상기 수신된 방송 신호를 상기 비디오 스트림 및 상기 자막 스트림으로 역다중화하는 단계;
    상기 비디오 스트림 및 상기 자막 스트림을 각각 디코딩하는 단계;
    상기 폰트 데이터를 다운로드할 수 있는 정보에 기초하여 상기 폰트 데이터를 다운로드하는 단계; 및
    상기 폰트 데이터를 이용하여 상기 자막 스트림을 디스플레이하는 단계를 포함하는 방송 신호 수신 방법.
  10. 제 9 항에 있어서,
    상기 폰트 데이터를 다운로드할 수 있는 정보 및 상기 폰트 데이터가 필수적인지 여부를 지시하는 인디케이터는 프로그램 상세 정보 (program specific information, PSI) 또는 서비스 정보 (service information)에 포함되어 수신되는 방송 신호 수신 방법.
  11. 제 10 항에 있어서,
    상기 폰트 데이터를 다운로드할 수 있는 정보는 트랜잭션 식별자 (transaction ID)를 포함하는 URI (uniform/universal resource identifier) 정보인 방송 신호 수신 방법.
  12. 제 9 항에 있어서,
    상기 자막 스트림은 상기 자막 데이터가 디스플레이됨에 있어서, 수신기의 화면 비율에 의해 크롭핑되는 것을 방지하는 안전 영역에 대한 정보를 더 포함하는 방송 신호 수신 방법.
  13. 방송 신호를 수신하는 튜너, 여기서 상기 방송 신호는 비디오 스트림 및 자막 스트림을 포함하고, 상기 방송 신호는 상기 자막 스트림에 포함된 자막 데이터와 연관된 폰트 데이터를 다운로드할 수 있는 정보 및 상기 폰트 데이터가 필수적인지 여부를 지시하는 인디케이터를 더 포함함;
    상기 수신된 방송 신호를 상기 비디오 스트림 및 상기 자막 스트림으로 역다중화하는 디멀티플렉서;
    상기 비디오 스트림 및 상기 자막 스트림을 각각 디코딩하는 디코더;
    상기 폰트 데이터를 다운로드할 수 있는 정보에 기초하여 상기 폰트 데이터를 다운로드하는 네트워크 프로세서; 및
    상기 폰트 데이터를 이용하여 상기 자막 스트림을 디스플레이하는 디스플레이 프로세서를 포함하는 방송 신호 수신 장치.
  14. 제 9 항에 있어서,
    상기 폰트 데이터를 다운로드할 수 있는 정보 및 상기 폰트 데이터가 필수적인지 여부를 지시하는 인디케이터는 프로그램 상세 정보 (program specific information, PSI) 또는 서비스 정보 (service information)에 수신되는 방송 신호 수신 장치.
  15. 제 10 항에 있어서,
    상기 폰트 데이터를 다운로드할 수 있는 정보는 트랜잭션 식별자 (transaction ID)를 포함하는 URI (uniform/universal resource identifier) 정보인 방송 신호 수신 장치.
PCT/KR2017/000723 2016-01-22 2017-01-20 방송 신호 송수신 방법 및 장치 WO2017126937A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EP17741703.7A EP3407614A4 (en) 2016-01-22 2017-01-20 METHOD AND APPARATUS FOR TRANSMITTING AND RECEIVING BROADCAST SIGNAL

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201662281744P 2016-01-22 2016-01-22
US62/281,744 2016-01-22
US201662288454P 2016-01-29 2016-01-29
US62/288,454 2016-01-29
US201662296089P 2016-02-17 2016-02-17
US62/296,089 2016-02-17

Publications (1)

Publication Number Publication Date
WO2017126937A1 true WO2017126937A1 (ko) 2017-07-27

Family

ID=59362767

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2017/000723 WO2017126937A1 (ko) 2016-01-22 2017-01-20 방송 신호 송수신 방법 및 장치

Country Status (2)

Country Link
EP (1) EP3407614A4 (ko)
WO (1) WO2017126937A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114760518A (zh) * 2022-04-19 2022-07-15 高途教育科技集团有限公司 视频字幕的处理方法及装置、电子设备、可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010096975A (ko) * 2000-04-19 2001-11-08 정상모 온라인 컨벌트 방송 시스템 및 그 제어방법
JP3714880B2 (ja) * 2001-03-07 2005-11-09 シャープ株式会社 字幕表示装置
JP2008154254A (ja) * 2007-12-25 2008-07-03 Sony Corp 文字放送受信装置
JP2010245618A (ja) * 2009-04-01 2010-10-28 Canon Inc デジタルテレビ放送受信装置及びその制御方法
JP2015173444A (ja) * 2014-02-21 2015-10-01 日本放送協会 受信機

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2922302A4 (en) * 2012-11-19 2016-04-06 Lg Electronics Inc SIGNAL TRANSMITTING AND RECEIVING APPARATUS, AND SIGNAL TRANSMITTING AND RECEIVING METHOD
US9860574B2 (en) * 2014-02-23 2018-01-02 Lg Electronics Inc. Method and apparatus for transceiving broadcast signal

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010096975A (ko) * 2000-04-19 2001-11-08 정상모 온라인 컨벌트 방송 시스템 및 그 제어방법
JP3714880B2 (ja) * 2001-03-07 2005-11-09 シャープ株式会社 字幕表示装置
JP2008154254A (ja) * 2007-12-25 2008-07-03 Sony Corp 文字放送受信装置
JP2010245618A (ja) * 2009-04-01 2010-10-28 Canon Inc デジタルテレビ放送受信装置及びその制御方法
JP2015173444A (ja) * 2014-02-21 2015-10-01 日本放送協会 受信機

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3407614A4 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114760518A (zh) * 2022-04-19 2022-07-15 高途教育科技集团有限公司 视频字幕的处理方法及装置、电子设备、可读存储介质

Also Published As

Publication number Publication date
EP3407614A4 (en) 2019-07-10
EP3407614A1 (en) 2018-11-28

Similar Documents

Publication Publication Date Title
JP6463856B2 (ja) 信号送受信装置及び信号送受信方法
US8056110B2 (en) Service system of thumbnail image and transmitting/receiving method thereof
WO2013019042A1 (ko) 실시간으로 전송되는 기준 영상과 별도로 전송되는 부가 영상 및 콘텐츠를 연동하여 3d 서비스를 제공하기 위한 전송 장치 및 방법, 및 수신 장치 및 방법
KR101328946B1 (ko) 방송 신호 송수신 방법 및 방송 신호 수신 장치
US9860574B2 (en) Method and apparatus for transceiving broadcast signal
US10123069B2 (en) Receiving apparatus, receiving method, and receiving display method for displaying images at specified display positions
WO2011126240A2 (ko) 방송 신호로 전송되는 비실시간 방송 서비스 및 콘텐트 처리 방법 및 장치
KR102547789B1 (ko) 수신 장치, 수신 방법, 송신 장치, 및 송신 방법
US11317170B2 (en) Transmission device, transmission method, reception device, and reception method
US20190123842A1 (en) Transmission device, transmission method, reception device, and reception method
US20190037168A1 (en) Transmission device, transmission method, reception device and reception method
EP3236659B1 (en) Transmission device, transmission method, reception device, and reception method
US11765330B2 (en) Transmitter, transmission method, receiver, and reception method
WO2016006971A1 (ko) 방송 신호 송수신 방법 및 장치
WO2012070716A1 (ko) 디지털 방송에서 서비스 호환 방식 전송 방법
EP3400710B1 (en) Transmission apparatus, transmission method, reception apparatus, and reception method
WO2017126937A1 (ko) 방송 신호 송수신 방법 및 장치
WO2017164551A1 (ko) 방송 신호 송수신 방법 및 장치
KR20150122130A (ko) 신호 송수신 장치 및 신호 송수신 방법
JP6658944B2 (ja) 送信装置、送信方法、受信装置および受信方法
WO2016036012A1 (ko) 방송 신호 송수신 방법 및 장치
CN109479154B (zh) 发送装置、发送方法、接收装置和接收方法
WO2015037964A1 (ko) 방송 수신 장치 및 그 제어 방법
JP2006254022A (ja) デジタル放送受信装置
WO2009139608A2 (en) Apparatus and method of processing broadcast information background

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17741703

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2017741703

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2017741703

Country of ref document: EP

Effective date: 20180822