KR102485250B1 - 송신 장치, 송신 방법, 수신 장치 및 수신 방법 - Google Patents

송신 장치, 송신 방법, 수신 장치 및 수신 방법 Download PDF

Info

Publication number
KR102485250B1
KR102485250B1 KR1020177032212A KR20177032212A KR102485250B1 KR 102485250 B1 KR102485250 B1 KR 102485250B1 KR 1020177032212 A KR1020177032212 A KR 1020177032212A KR 20177032212 A KR20177032212 A KR 20177032212A KR 102485250 B1 KR102485250 B1 KR 102485250B1
Authority
KR
South Korea
Prior art keywords
information
audio
predetermined
stream
predetermined information
Prior art date
Application number
KR1020177032212A
Other languages
English (en)
Other versions
KR20180013875A (ko
Inventor
이쿠오 츠카고시
도루 치넨
Original Assignee
소니그룹주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니그룹주식회사 filed Critical 소니그룹주식회사
Publication of KR20180013875A publication Critical patent/KR20180013875A/ko
Application granted granted Critical
Publication of KR102485250B1 publication Critical patent/KR102485250B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23614Multiplexing of additional data and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • H04N21/2335Processing of audio elementary streams involving reformatting operations of audio signals, e.g. by converting from one coding standard to another
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2368Multiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4341Demultiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4348Demultiplexing of additional data and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/436Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/436Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
    • H04N21/4363Adapting the video stream to a specific local network, e.g. a Bluetooth® network
    • H04N21/43632Adapting the video stream to a specific local network, e.g. a Bluetooth® network involving a wired protocol, e.g. IEEE 1394
    • H04N21/43635HDMI
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4398Processing of audio elementary streams involving reformatting operations of audio signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/654Transmission by server directed to the client
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

소정의 정보를 소정수의 오디오 프레임으로 분할하여 송신할 때, 수신측에 있어서 당해 소정의 정보의 취득 처리를 용이하면서도 적절하게 행할 수 있도록 한다. 오디오 압축 데이터 스트림에 소정의 정보를 삽입한다. 소정의 정보가 삽입된 오디오 압축 데이터 스트림을 송신한다. 오디오 압축 데이터 스트림의 소정수의 오디오 프레임에 상기 소정의 정보가 분할되어 얻어진 각 분할 정보의 각각을 삽입하는 것이 가능하게 된다. 최초의 분할 정보에 소정의 정보의 전체 사이즈를 나타내는 정보를 부가한다. 최초의 분할 정보가 취득되는 시점에서 당해 소정의 정보의 전체 사이즈를 나타내는 정보에 기초하여 기억 매체에 당해 소정의 정보를 축적할 수 있을 만큼의 스페이스를 확보할 수 있다.

Description

송신 장치, 송신 방법, 수신 장치 및 수신 방법
본 기술은 송신 장치, 송신 방법, 수신 장치 및 수신 방법에 관한 것이며, 특히 오디오 압축 데이터 스트림에 소정의 정보를 삽입하여 송신하는 송신 장치 등에 관한 것이다.
예를 들어, 특허문헌 1에는 방송국, 배신 서버 등으로부터 소정의 정보를 오디오 압축 데이터 스트림에 삽입하여 송신하고, 수신측의 셋톱 박스가 이 오디오 압축 데이터 스트림을 그대로 HDMI의 디지털 인터페이스를 통하여 텔레비전 수신기에 송신하고, 텔레비전 수신기가 당해 소정의 정보를 이용한 정보 처리를 행하는 것이 제안되어 있다.
일본 특허 공개 제2012-010311호 공보
본 기술의 목적은, 소정의 정보를 소정수의 오디오 프레임으로 분할하여 송신할 때, 수신측에 있어서 당해 소정의 정보의 취득 처리를 용이하면서도 적절하게 행할 수 있도록 하는 데 있다.
본 기술의 개념은,
오디오 압축 데이터 스트림에 소정의 정보를 삽입하는 정보 삽입부와,
상기 소정의 정보가 삽입된 오디오 압축 데이터 스트림을 송신하는 스트림 송신부를 구비하고,
상기 정보 삽입부는,
상기 오디오 압축 데이터 스트림의 소정수의 오디오 프레임에 상기 소정의 정보가 분할되어 얻어진 각 분할 정보의 각각을 삽입하는 것이 가능하게 되고,
최초의 분할 정보에 상기 소정의 정보의 전체 사이즈를 나타내는 정보를 부가하는 송신 장치에 있다.
본 기술에 있어서, 정보 삽입부에 의해, 오디오 압축 데이터 스트림에 소정의 정보가 삽입된다. 예를 들어, 소정의 정보는 네트워크 액세스 정보, 커맨드 정보 또는 미디어 파일이도록 되어도 된다.
스트림 송신부에 의해, 소정의 정보가 삽입된 오디오 압축 데이터 스트림이 송신된다. 예를 들어, 스트림 송신부는, 소정의 정보가 삽입된 오디오 압축 데이터 스트림을 포함하는 소정 포맷의 컨테이너를 송신하도록 되어도 된다.
또한, 예를 들어 스트림 송신부는, 소정의 정보가 삽입된 오디오 압축 데이터 스트림을, 디지털 인터페이스를 통하여 외부 기기에 송신하도록 되어도 된다. 이 경우, 예를 들어 오디오 압축 데이터 스트림을 포함하는 소정 포맷의 컨테이너를 수신하는 수신부를 더 구비하고, 컨테이너의 레이어에 소정의 정보가 삽입되어 있고, 정보 삽입부는, 컨테이너에 포함되어 있는 오디오 압축 데이터 스트림에, 컨테이너의 레이어에 삽입되어 있는 소정의 정보를 삽입하도록 되어도 된다.
정보 삽입부는, 오디오 압축 데이터 스트림의 소정수의 오디오 프레임에 소정의 정보가 분할되어 얻어진 각 분할 정보의 각각을 삽입하는 것이 가능하게 되고, 최초의 분할 정보에 소정의 정보의 전체 사이즈를 나타내는 정보가 부가된다. 예를 들어, 정보 삽입부는, 오디오 프레임의 유저 데이터 영역에 분할 정보를 삽입하도록 되어도 된다. 또한, 예를 들어 정보 삽입부는, 각 분할 정보에, 최초의 분할 정보인지 여부를 나타내는 정보 및 분할 위치를 나타내는 정보를 더 부가하도록 되어도 된다.
이와 같이 본 기술에 있어서는, 오디오 압축 데이터 스트림의 소정수의 오디오 프레임에 소정의 정보가 분할되어 얻어진 각 분할 정보의 각각을 삽입하는 것이 가능하게 된다. 그 때문에, 소정의 정보의 전체 사이즈가 커도 개개의 오디오 프레임에 삽입되는 정보 사이즈를 억제할 수 있고, 오디오 압축 데이터의 송신에 영향을 주지 않고 소정의 정보의 송신을 양호하게 행하는 것이 가능하게 된다.
또한, 본 기술에 있어서는, 오디오 압축 데이터 스트림의 소정수의 오디오 프레임에 소정의 정보가 분할되어 얻어진 각 분할 정보의 각각이 삽입될 때, 최초의 분할 정보에 소정의 정보의 전체 사이즈를 나타내는 정보가 부가된다. 그 때문에, 수신측에 있어서는, 소정수의 오디오 프레임으로부터 소정의 정보를 구성하는 각 분할 정보를 취득할 때, 최초의 분할 정보가 취득되는 시점에서 당해 소정의 정보의 전체 사이즈를 나타내는 정보에 기초하여 기억 매체에 당해 소정의 정보를 축적할 수 있을 만큼의 스페이스를 확보할 수 있어, 소정의 정보의 취득 처리를 용이하면서도 적절하게 행하는 것이 가능하게 된다.
또한, 본 기술의 다른 개념은,
소정의 정보가 삽입된 오디오 압축 데이터 스트림을 외부 기기로부터 디지털 인터페이스를 통하여 수신하는 스트림 수신부를 구비하고,
상기 오디오 압축 데이터 스트림의 소정수의 오디오 프레임에, 상기 소정의 정보가 분할되어 얻어진 분할 정보의 각각이 삽입되어 있고,
최초의 분할 정보에 상기 소정의 정보의 전체 사이즈를 나타내는 정보가 부가되어 있고,
상기 오디오 압축 데이터 스트림을 디코드하여 오디오 데이터를 얻음과 함께, 상기 소정의 정보의 전체 사이즈를 나타내는 정보에 기초하여 상기 소정수의 오디오 프레임으로부터 상기 소정의 정보를 구성하는 각 분할 정보를 얻는 디코드 처리와, 해당 디코드 처리에서 얻어진 상기 소정의 정보를 이용한 정보 처리를 제어하는 제어부를 더 구비하는 수신 장치에 있다.
본 기술에 있어서, 수신부에 의해, 소정의 정보가 삽입된 오디오 압축 데이터 스트림이 외부 기기로부터 디지털 인터페이스를 통하여 수신된다. 예를 들어, 소정의 정보는 네트워크 액세스 정보, 커맨드 정보 또는 미디어 파일이도록 되어도 된다.
오디오 압축 데이터 스트림의 소정수의 오디오 프레임에, 소정의 정보가 분할되어 얻어진 분할 정보의 각각이 삽입되어 있고, 최초의 분할 정보에 소정의 정보의 전체 사이즈를 나타내는 정보가 부가되어 있다.
제어부에 의해, 디코드 처리 및 정보 처리가 제어된다. 디코드 처리에서는, 오디오 압축 데이터 스트림이 디코드되어 오디오 데이터가 얻어짐과 함께, 소정의 정보의 전체 사이즈를 나타내는 정보에 기초하여 소정수의 오디오 프레임으로부터 소정의 정보를 구성하는 각 분할 정보가 취득된다. 이 경우, 최초의 분할 정보가 취득되는 시점에서 당해 소정의 정보의 전체 사이즈를 나타내는 정보에 기초하여 기억 매체에 소정의 정보를 위한 스페이스가 확보된다. 그리고, 정보 처리에서는, 디코드 처리에서 얻어진 소정의 정보를 이용한 처리가 행해진다.
이와 같이 본 기술에 있어서는, 최초의 분할 정보에 부가되어 있는 소정의 정보의 전체 사이즈를 나타내는 정보에 기초하여 소정수의 오디오 프레임으로부터 소정의 정보를 구성하는 각 분할 정보가 취득된다. 이 경우, 소정수의 오디오 프레임으로부터 소정의 정보를 구성하는 각 분할 정보를 취득할 때, 최초의 분할 정보가 취득되는 시점에서 당해 소정의 정보의 전체 사이즈를 나타내는 정보에 기초하여 기억 매체에 당해 소정의 정보를 축적할 수 있을 만큼의 스페이스를 확보할 수 있어, 소정의 정보의 취득 처리를 용이하면서도 적절하게 행하는 것이 가능하게 된다.
또한, 본 기술의 다른 개념은,
오디오 압축 데이터 스트림을 포함하는 소정 포맷의 컨테이너를 수신하는 수신부와,
상기 오디오 압축 데이터 스트림에 소정의 정보를 삽입하는 정보 삽입 처리와, 상기 소정의 정보가 삽입된 오디오 압축 데이터 스트림을, 디지털 인터페이스를 통하여 외부 기기에 송신하는 스트림 송신 처리를 제어하는 제어부를 구비하는 수신 장치에 있다.
본 기술에 있어서, 수신부에 의해, 오디오 압축 데이터 스트림을 포함하는 소정 포맷의 컨테이너가 수신된다. 제어부에 의해, 정보 삽입 처리 및 스트림 송신 처리가 제어된다. 정보 삽입 처리에서는, 오디오 압축 데이터 스트림에 소정의 정보가 삽입된다. 스트림 송신 처리에서는, 소정의 정보가 삽입된 오디오 압축 데이터 스트림이, 디지털 인터페이스를 통하여 외부 기기에 송신된다.
예를 들어, 소정의 정보는, 네트워크 액세스 정보, 커맨드 정보 또는 미디어 파일이도록 되어도 된다. 또한, 예를 들어 수신된 컨테이너의 레이어에 소정의 정보가 삽입되어 있고, 정보 삽입 처리에서는, 컨테이너의 레이어에 삽입되어 있는 소정의 정보를 추출하여 오디오 압축 데이터 스트림에 삽입하도록 되어도 된다.
이와 같이 본 기술에 있어서는, 소정의 정보가 삽입된 오디오 압축 데이터 스트림이, 디지털 인터페이스를 통하여 외부 기기에 송신된다. 그 때문에, 외부 기기에, 오디오 압축 데이터 스트림과 함께, 소정의 정보를 양호하게 송신할 수 있다.
또한, 본 기술에 있어서, 예를 들어 정보 삽입 처리에서는, 오디오 압축 데이터 스트림의 소정수의 오디오 프레임에 소정의 정보가 분할되어 얻어진 각 분할 정보의 각각을 삽입하는 것이 가능하게 되도록 되어도 된다. 이 경우, 예를 들어 정보 삽입 처리에서는, 오디오 프레임의 유저 데이터 영역에 분할 정보를 삽입하도록 되어도 된다. 이 경우, 소정의 정보의 전체 사이즈가 커도 개개의 오디오 프레임에 삽입되는 정보 사이즈를 억제할 수 있고, 오디오 압축 데이터의 송신에 영향을 주지 않고 소정의 정보의 송신을 양호하게 행하는 것이 가능하게 된다.
또한, 이 경우, 예를 들어 정보 삽입 처리에서는, 최초의 분할 정보에 상기 소정의 정보의 전체 사이즈를 나타내는 정보를 부가하고, 또한 각 분할 정보에, 최초의 분할 정보인지 여부를 나타내는 정보 및 분할 위치를 나타내는 정보를 더 부가하도록 되어도 된다. 이와 같이 각 분할 정보에 정보가 부가됨으로써, 소정의 정보의 취득 처리를 용이하면서도 적절하게 행하는 것이 가능하게 된다.
본 기술에 따르면, 소정의 정보를 소정수의 오디오 프레임으로 분할하여 송신할 때, 수신측에 있어서 당해 소정의 정보의 취득 처리를 용이하면서도 적절하게 행할 수 있다. 또한, 본 명세서에 기재된 효과는 어디까지나 예시이며 한정되는 것은 아니며, 더 부가적인 효과가 있어도 된다.
도 1은, 실시 형태로서의 송수신 시스템의 구성예를 도시하는 블록도이다.
도 2는, 소정의 정보를 분할하여 송신함에 따른 효과를 설명하기 위한 도면이다.
도 3은, 방송 송출 장치가 구비하는 스트림 생성부의 구성예를 도시하는 블록도이다.
도 4는, MPEG-H 3D Audio의 전송 데이터에 있어서의 오디오 프레임의 구조예를 도시하는 도면이다.
도 5는, 익스텐션 엘리먼트의 타입과 그 값의 대응 관계를 도시하는 도면이다.
도 6은, 유니버설 메타데이터를 익스텐션 엘리먼트로서 포함하는 유니버설 메타데이터 프레임의 구성예를 도시하는 도면이다.
도 7은, 소정의 정보를 갖는 액세스 인포메이션의 구성예를 도시하는 도면이다.
도 8은, 유니버설 메타데이터 프레임 및 액세스 인포메이션에 있어서의 주요 정보의 내용을 도시하는 도면이다.
도 9는, 컨테이너 대상 데이터가 복수의 유니버설 메타데이터 프레임에서 전송되는 경우의 예를 도시하는 도면이다.
도 10은, 컨테이너 대상 데이터가 하나의 유니버설 메타데이터 프레임에서 전송되는 경우의 예를 도시하는 도면이다.
도 11은, 복수의 컨테이너 대상 데이터가 복수의 유니버설 메타데이터 프레임에서 전송되는 경우의 예를 도시하는 도면이다.
도 12는, 소정의 정보(컨테이너 대상 데이터)를 오디오 스트림에 삽입하여 보내는 경우에 있어서의 트랜스포트 스트림 TS의 구조예를 도시하는 도면이다.
도 13은, 셋톱 박스의 구성예를 도시하는 블록도이다.
도 14는, 오디오 앰프의 구성예를 도시하는 블록도이다.
도 15는, 텔레비전 수신기의 구성예를 도시하는 블록도이다.
도 16은, HDMI 송신부와 HDMI 수신부의 구성예를 도시하는 블록도이다.
도 17은, TMDS 채널에서 화상 데이터가 전송되는 경우의 각종 전송 데이터의 구간을 도시하는 도면이다.
도 18은, 방송 송출 장치가 구비하는 스트림 생성부의 다른 구성예를 도시하는 블록도이다.
도 19는, 애플리케이션 디스크립터의 구조예를 도시하는 도면이다.
도 20은, 소정의 정보(컨테이너 대상 데이터)를 컨테이너에 삽입하여 보내는 경우에 있어서의 트랜스포트 스트림 TS의 구조예를 도시하는 도면이다.
도 21은, 셋톱 박스의 다른 구성예를 도시하는 블록도이다.
도 22는, 소정의 정보(컨테이너 대상 데이터)를 오디오 스트림에 삽입하여 보내는 경우에 있어서의 MMT 스트림의 구조예를 도시하는 도면이다.
도 23은, 소정의 정보(컨테이너 대상 데이터)를 컨테이너에 삽입하여 보내는 경우에 있어서의 MMT 스트림의 구조예를 도시하는 도면이다.
도 24는, 송수신 시스템의 다른 구성예를 도시하는 블록도이다.
이하, 발명을 실시하기 위한 형태(이하, 「실시 형태」라고 함)에 대하여 설명한다. 또한, 설명을 이하의 순서로 행한다.
1. 실시 형태
2. 변형예
<1. 실시 형태>
[송수신 시스템의 구성예]
도 1은, 실시 형태로서의 송수신 시스템(10)의 구성예를 도시하고 있다. 이 송수신 시스템(10)은, 방송 송출 장치(100)와, 셋톱 박스(STB)(200)와, 오디오 앰프(AMP)(300)와, 텔레비전 수신기(TV)(500)를 갖고 있다. 오디오 앰프(300)에는, 멀티채널용 스피커 시스템(400)이 접속되어 있다.
셋톱 박스(200)와 오디오 앰프(300)는, HDMI 케이블(610)을 통하여 접속되어 있다. 이 경우, 셋톱 박스(200)가 소스이고, 오디오 앰프(300)는 데스티네이션이다. 또한, 오디오 앰프(300)와 텔레비전 수신기(500)는, HDMI 케이블(620)을 통하여 접속되어 있다. 이 경우, 오디오 앰프(300)가 소스이고, 텔레비전 수신기(500)는 데스티네이션이다. 또한, 「HDMI」는 등록 상표이다.
방송 송출 장치(100)는, 트랜스포트 스트림 TS를, 방송파에 실어 송신한다. 이 트랜스포트 스트림 TS에는, 비디오 스트림 및 오디오 스트림(오디오 압축 데이터 스트림)이 포함된다. 방송 송출 장치(100)는, 오디오 스트림에, 네트워크 액세스 정보, 커맨드 정보, 미디어 파일 등의 소정의 정보를 컨테이너 대상 데이터로서 삽입한다.
예를 들어, 네트워크 액세스 정보에는, 링크 서버에 접속하기 위한 URL 정보가 포함된다. 또한, 예를 들어 커맨드 정보에는, "start", "pause" 등의 커맨드군이 포함된다. 또한, 예를 들어 미디어 파일에는, 캐릭터 데이터 등의 일반적인 데이터 파일, 오디오 데이터 파일, 오디오 비주얼 데이터 파일 등이 포함된다.
방송 송출 장치(100)는, 오디오 스트림의 소정수의 오디오 프레임에 소정의 정보를 분할하여 삽입한다. 이와 같이 분할함으로써, 소정의 정보의 전체 사이즈가 커도 개개의 오디오 프레임에 삽입되는 정보 사이즈를 억제할 수 있고, 오디오 압축 데이터의 송신에 영향을 주지 않고 소정의 정보의 송신이 가능하게 된다.
이때, 방송 송출 장치(100)는, 최초의 분할 정보에 소정의 정보의 전체 사이즈를 나타내는 정보를 부가하고, 각 분할 정보에 최초의 분할 정보인지 여부를 나타내는 정보 및 분할 위치를 나타내는 정보를 부가한다. 또한, 소정수는 1을 포함하는 것으로 한다. 소정수가 1일 때, 소정의 정보는, 실제로는 분할되지 않고, 그 전체가 하나의 오디오 프레임에 삽입된다.
도 2의 실선(a)은, 전체 사이즈가 큰 소정의 정보를 하나의 오디오 프레임에서 송신하는 경우의 비트 레이트의 변화를 개략적으로 도시하고 있는데, 소정의 정보가 삽입되는 오디오 프레임에서 급격하게 증가한다. 이 경우에는, 예를 들어 오디오 압축 데이터의 비트 레이트가 192kbps이며 소정의 정보가 40바이트일 때, 비트 레이트가 15kbps만큼 증가하여 207kbps가 된다. 이와 같이 비트 레이트가 스파이크상으로 급격하게 증가하는 경우에는, 오디오 압축 데이터의 송신에 영향을 준다.
한편, 도 2의 파선(b)은, 전체 사이즈가 큰 소정의 정보를 복수의 오디오 프레임으로 분할하여 송신하는 경우의 비트 레이트의 변화를 개략적으로 도시하고 있다. 이 경우에는, 비트 레이트가 급격하게 증가한다고 하는 일이 없다. 그 때문에, 오디오 압축 데이터의 송신에 영향을 주지 않고, 전체 사이즈가 큰 소정의 정보를 양호하게 송신할 수 있게 된다.
셋톱 박스(200)는, 방송 송출 장치(100)로부터 방송파에 실어 송신되어 오는 트랜스포트 스트림 TS를 수신한다. 이 트랜스포트 스트림 TS에는, 상술한 바와 같이, 비디오 스트림 및 오디오 스트림이 포함되어 있고, 오디오 스트림에는 소정의 정보가 삽입되어 있다.
셋톱 박스(200)는, 비디오 스트림에 디코드 처리를 실시하여 얻어진 비압축의 비디오 데이터와 함께, 수신된 오디오 스트림 그 자체를, HDMI 케이블(610)을 통하여 오디오 앰프(300)에 송신한다. 이에 의해, 오디오 스트림에 삽입되어 있는 소정의 정보도 오디오 앰프(300)에 보내지게 된다.
오디오 앰프(300)는, 셋톱 박스(200)로부터, HDMI 케이블(610)을 통하여, 비압축의 비디오 데이터와 함께, 소정의 정보가 삽입되어 있는 오디오 스트림을 수신한다. 오디오 앰프(300)는, 오디오 스트림에 디코드 처리를 실시하여 멀티채널용 오디오 데이터를 얻고, 이 오디오 데이터를 스피커 시스템(400)에 공급한다.
또한, 오디오 앰프(300)는, 수신된 비압축의 비디오 데이터와 오디오 스트림을, HDMI 케이블(620)을 통하여, 텔레비전 수신기(500)에 송신한다. 이에 의해, 오디오 스트림에 삽입되어 있는 소정의 정보도 텔레비전 수신기(500)에 보내지게 된다.
텔레비전 수신기(500)는, 오디오 앰프(300)로부터, HDMI 케이블(620)을 통하여, 비압축의 비디오 데이터와 함께, 소정의 정보가 삽입되어 있는 오디오 스트림을 수신한다. 텔레비전 수신기(500)는, 비압축의 비디오 데이터에 의한 화상을 표시한다. 또한, 텔레비전 수신기(500)는, 오디오 스트림에 디코드 처리를 실시하고, 소정의 정보를 취득한다.
소정의 정보는 오디오 스트림의 소정수의 오디오 프레임으로 분할되어 삽입되어 있다. 최초의 분할 정보에, 소정의 정보의 전체 사이즈를 나타내는 정보가 부가되고, 각 분할 정보에 최초의 분할 정보인지 여부를 나타내는 정보 및 분할 위치를 나타내는 정보가 부가되어 있다. 텔레비전 수신기(500)는, 이들 정보에 기초하여, 소정수의 오디오 프레임으로부터, 소정의 정보를 구성하는 각 분할 정보를 취득한다.
이 경우, 텔레비전 수신기(500)는, 최초의 분할 정보가 취득되는 시점에서, 소정의 정보의 전체 사이즈를 나타내는 정보를 인식한다. 그리고, 텔레비전 수신기(500)는, 기억 매체에 소정의 정보를 축적하기 위한 스페이스를 확보할 수 있어, 소정의 정보의 취득 처리를 용이하면서도 적절하게 행하는 것이 가능하게 된다.
텔레비전 수신기(500)는, 소정의 정보를 이용한 정보 처리를 행한다. 예를 들어, 소정의 정보가 네트워크 액세스 정보일 때, 텔레비전 수신기(500)는, 네트워크 상의 소정의 서버에 액세스한다. 또한, 예를 들어 소정의 정보가 커맨드군일 때, 텔레비전 수신기(500)는, 액세스한 소정의 서버의 동작을 제어하거나, 혹은 미디어 파일의 재생 등의 제어를 행한다.
[방송 송출 장치의 스트림 생성부]
도 3은, 방송 송출 장치(100)가 구비하는 스트림 생성부(110)의 구성예를 도시하고 있다. 이 스트림 생성부(110)는, 제어부(111)와, 비디오 인코더(112)와, 오디오 인코더(113)와, 멀티플렉서(114)를 갖고 있다.
제어부(111)는, CPU(111a)를 구비하고 있고, 스트림 생성부(110)의 각 부를 제어한다. 비디오 인코더(112)는, 비디오 데이터(화상 데이터) SV에 대하여, MPEG2, H.264/AVC, H.265/HEVC 등의 부호화를 실시하고, 비디오 스트림(비디오 엘리멘터리 스트림)을 생성한다. 비디오 데이터 SV는, 예를 들어 HDD(hard disk drive) 등의 기록 매체로부터 재생된 비디오 데이터, 혹은 비디오 카메라에서 얻어진 라이브 비디오 데이터 등이다.
오디오 인코더(113)는, 오디오 데이터(음성 데이터) SA에 대하여, MPEG-H 3D Audio의 압축 포맷에 의한 부호화를 실시하고, 오디오 스트림(오디오 엘리멘터리 스트림)을 생성한다. 오디오 데이터 SA는, 상술한 비디오 데이터 SV에 대응하고 있고, HDD 등의 기록 매체로부터 재생된 오디오 데이터, 혹은 마이크로폰에서 얻어진 라이브 오디오 데이터 등이다.
오디오 인코더(113)는, 오디오 부호화 블록부(113a) 및 오디오 프레이밍부(113b)를 갖고 있다. 오디오 부호화 블록부(113a)에서 부호화 블록이 생성되고, 오디오 프레이밍부(113b)에서 프레이밍이 행해진다.
오디오 인코더(113)는, 제어부(111)에 의한 제어 하에, 오디오 스트림에, 소정의 정보를 삽입한다. 이 실시 형태에 있어서, 소정의 정보는, 예를 들어 네트워크 액세스 정보, 커맨드 정보, 미디어 파일 등이다.
오디오 인코더(113)는, 오디오 스트림의 소정수(1을 포함함)의 오디오 프레임에 소정의 정보를 분할하여 삽입한다. 이때, 오디오 인코더(113)는, 최초의 분할 정보에, 소정의 정보의 전체 사이즈를 나타내는 정보를 부가한다. 또한, 오디오 인코더(113)는, 각 분할 정보에, 최초의 분할 정보인지 여부를 나타내는 정보 및 분할 위치를 나타내는 정보로서의 내림차순의 카운트수를 부가한다.
도 4는, MPEG-H 3D Audio의 전송 데이터에 있어서의 오디오 프레임의 구조예를 도시하고 있다. 이 오디오 프레임은, 복수의 MPEG 오디오 스트림 패킷(mpeg Audio Stream Packet)을 포함하고 있다. 각 MPEG 오디오 스트림 패킷은, 헤더(Header)와 페이로드(Payload)에 의해 구성되어 있다.
헤더는, 패킷 타입(Packet Type), 패킷 라벨(Packet Label), 패킷 길이(Packet Length) 등의 정보를 갖는다. 페이로드에는, 헤더의 패킷 타입에서 정의된 정보가 배치된다. 이 페이로드 정보에는, 동기 스타트 코드에 상당하는 "SYNC"와, 3D 오디오의 전송 데이터의 실제 데이터인 "Frame"과, 이 "Frame"의 구성을 나타내는 "Config"가 존재한다.
"Frame"에는, 3D 오디오의 전송 데이터를 구성하는 채널 부호화 데이터와 오브젝트 부호화 데이터가 포함된다. 여기서, 채널 부호화 데이터는, SCE(Single Channel Element), CPE(Channel Pair Element), LFE(Low Frequency Element) 등의 부호화 샘플 데이터로 구성된다. 또한, 오브젝트 부호화 데이터는, SCE(Single Channel Element)의 부호화 샘플 데이터와, 그것을 임의의 위치에 존재하는 스피커에 매핑시켜 렌더링하기 위한 메타데이터에 의해 구성된다. 이 메타데이터는, 익스텐션 엘리먼트(Ext_element)로서 포함된다.
이 실시 형태에서는, 익스텐션 엘리먼트(Ext_element)로서, 네트워크 액세스 정보, 커맨드 정보, 미디어 파일 등의 소정의 정보를 유니버설 메타데이터(universal_metadata)로서 갖는 엘리먼트(Ext_universal_metadata)를 새롭게 정의한다. 이에 수반하여 "Config"에, 그 엘리먼트의 구성 정보(universal_metadataConfig)를 새롭게 정의한다.
도 5는, 익스텐션 엘리먼트(Ext_element)의 타입(ExElementType)과, 그 값(Value)의 대응 관계를 도시하고 있다. 현 상황은 0 내지 7이 정해져 있다. 128 이후는 MPEG 이외까지 확장 가능하므로, 예를 들어 128을 새롭게 "ID_EXT_ELE_universal_metadata"의 타입의 값으로서 정의한다. 또한, MPEG 등의 규격의 경우에는, 8 내지 127로 정의하는 것도 가능하다.
도 6은, 유니버설 메타데이터를 익스텐션 엘리먼트로서 포함하는 유니버설 메타데이터 프레임(universal_metadata_frame())의 구성예(syntax)를 도시하고 있다. 도 7은, 소정수(1을 포함함)의 유니버설 메타데이터 프레임의 「bytes_to_carry_access_information」에 삽입되는 액세스 인포메이션(Access_information())의 구성예(syntax)를 도시하고 있다. 도 8은, 각 구성예에 있어서의 주요 정보의 내용(semantics)을 도시하고 있다.
「organization_id」의 32비트 필드는, 응용할 규격의 대상을 나타낸다. 「metadata_type」의 8비트 필드는, 메타데이터의 종류를 나타낸다. 예를 들어, "0x10"은, MPEG-H 방식의 유니버설 메타데이터를 나타낸다. 「data_id」의 8비트 필드는, 컨테이너 대상 데이터의 식별자를 나타낸다. 동일한 컨테이너 대상 데이터가 분할되어 얻어진 각 분할 정보에는 동일한 식별자가 부여된다.
「start_flag」의 1비트 필드는, 컨테이너 대상 데이터의 개시인지 여부를 나타낸다. "1"은 개시를 나타내고, "0"은 개시가 아님을 나타낸다. 「fcounter」의 7비트 필드는, 분할된 컨테이너 대상 데이터의 분할 위치를 내림차순의 카운트수로 나타낸다. "0"이 최후의 분할 부분을 나타내는 것이다. 「start_flag」가 "1", 또한 「fcounter」가 "0"인 경우, 분할되어 있지 않은 대상 데이터임을 나타낸다.
「start_flag」가 "1"일 때, 「total_data_size」의 16비트 필드가 존재한다. 이 필드는, 컨테이너 대상 데이터의 사이즈를 나타낸다. 「bytes_to_carry_access_information」의 필드에, 액세스 인포메이션(Access_information())의 전체, 혹은 그의 일부(분할 정보)가 삽입된다.
「information_type」의 8비트 필드는, 컨테이너 대상 데이터의 종별을 나타낸다. 예를 들어, "0x01"은 URL 정보를 나타내고, "0x02"는 커맨드군을 나타내고, "0x03"은 미디어 파일을 나타낸다. 「information_length」의 16비트 필드는, 다음 요소로부터 시작되는 컨테이너 대상 데이터의 사이즈를 나타내고, 상술한 「total_data_size」의 16비트 필드와 동일한 값이 된다.
도 3으로 복귀하여, 멀티플렉서(114)는, 비디오 인코더(112)로부터 출력되는 비디오 스트림 및 오디오 인코더(113)로부터 출력되는 오디오 스트림을, PES 패킷화하고, 또한 트랜스포트 패킷화하여 다중하고, 다중화 스트림으로서의 트랜스포트 스트림 TS를 얻는다.
도 3에 도시하는 스트림 생성부(110)의 동작을 간단하게 설명한다. 비디오 데이터 SV는 비디오 인코더(112)에 공급된다. 이 비디오 인코더(112)에서는, 비디오 데이터 SV에 대하여 H.264/AVC, H.265/HEVC 등의 부호화가 실시되고, 부호화 비디오 데이터를 포함하는 비디오 스트림이 생성된다.
또한, 오디오 데이터 SA는, 오디오 인코더(113)에 공급된다. 이 오디오 인코더(113)에서는, 그 오디오 데이터 SA에 대하여, MPEG-H 3D Audio의 압축 포맷에 의한 부호화가 실시되고, 오디오 스트림(오디오 압축 데이터 스트림)이 생성된다.
이때, 제어부(111)로부터 오디오 인코더(113)로, 오디오 스트림에 삽입해야 할 소정의 정보(네트워크 액세스 정보, 커맨드 정보, 미디어 파일 등), 즉 컨테이너 대상 데이터가 공급된다. 오디오 인코더(113)에서는, 오디오 스트림의 소정수(1을 포함함)의 오디오 프레임에 컨테이너 대상 데이터(소정의 정보)가 분할되어 삽입된다.
이때, 오디오 인코더(113)에서는, 최초의 분할 정보에, 소정의 정보(컨테이너 대상 데이터)의 전체 사이즈를 나타내는 정보가 부가된다. 또한, 오디오 인코더(113)에서는, 각 분할 정보에, 최초의 분할 정보인지 여부를 나타내는 정보 및 분할 위치를 나타내는 정보로서의 내림차순의 카운트수가 부가된다.
비디오 인코더(112)에서 생성된 비디오 스트림은, 멀티플렉서(114)에 공급된다. 또한, 오디오 인코더(113)에서 생성된 오디오 스트림은, 멀티플렉서(114)에 공급된다. 그리고, 이 멀티플렉서(114)에서는, 각 인코더로부터 공급되는 스트림이 패킷화되어 다중되고, 전송 데이터로서 트랜스포트 스트림 TS가 얻어진다.
[컨테이너 대상 데이터(소정의 정보)의 삽입]
오디오 스트림으로의 컨테이너 대상 데이터의 삽입에 대하여 더 설명한다. 도 9는, 컨테이너 대상 데이터(소정의 정보)가, 복수의 유니버설 메타데이터 프레임에서 전송되는 경우의 예를 도시하고 있다.
이 경우, 컨테이너 대상 데이터는 복수로 분할되고, 복수의 분할 정보의 각각이 복수의 유니버설 메타데이터 프레임에 할당되고, 「bytes_to_carry_access_information」의 필드에 삽입된다(도 6 참조). 여기서, 최초의 분할 정보에 대응한 「start_flag」는 "1"로 되어, 최초의 분할 정보임이 나타난다. 또한, 최초의 분할 정보에 대응한 「fcounter」는 "n-1"로 되고, 그 값에 1을 가산함으로써 분할수 "n"이 나타난다. 또한, 이 최초의 분할 정보에 대응하여 「total_data_size」의 필드가 존재하고, 컨테이너 대상 데이터(소정의 정보)의 전체 사이즈가 나타난다.
2번째 이후의 분할 정보에 대응한 「start_flag」는 "0"으로 되어, 최초의 분할 정보가 아님이 나타난다. 또한, 2번째 이후의 분할 정보에 대응한 「fcounter」는 "n-1"로부터 순차적으로 디크리먼트된 카운트수로 되어, 분할 위치가 나타남과 함께, 남은 분할 정보의 수가 나타난다. 또한, 마지막 분할 정보에 대응한 「fcounter」는 "0"으로 되어, 최후의 분할 정보임이 나타난다.
또한, 최초의 분할 정보에 대응한 「fcounter」를 "n"으로 하고, 2번째 이후의 분할 정보에 대응한 「fcounter」를 "n"으로부터 순차적으로 디크리먼트된 카운트수로 하고, 마지막 분할 정보에 대응한 「fcounter」를 "1"로 하는 것도 고려된다. 최초의 분할 정보에 대응한 「fcounter」의 "n"은 분할수를 나타내고, 「fcounter」가 "1"인 것은, 최후의 분할 정보임을 나타내는 것이 된다.
도 10은, 컨테이너 대상 데이터(소정의 정보)가, 하나의 유니버설 메타데이터 프레임에서 전송되는 경우의 예를 도시하고 있다. 이 경우, 컨테이너 대상 데이터는 분할되지 않고, 하나의 유니버설 메타데이터 프레임의 「bytes_to_carry_access_information」의 필드에 삽입된다(도 6 참조). 여기서, 「start_flag」는 "1"로 되어, 최초의 분할 정보임이 나타난다. 또한, 「fcounter」는 "0"으로 되어, 최후의 분할 정보임이 나타난다. 따라서, 이들 정보로부터, 분할되어 있지 않음이 나타난다. 또한, 이 최초의 분할 정보에 대응하여 「total_data_size」의 필드가 존재하고, 컨테이너 대상 데이터(소정의 정보)의 전체 사이즈가 나타난다.
도 11은, 복수의 컨테이너 대상 데이터(소정의 정보)가, 복수의 유니버설 메타데이터 프레임에서 전송되는 경우의 예를 도시하고 있다. 도시된 예는, 「data_id」가 "0"으로 나타나는 컨테이너 대상 데이터 A와, 「data_id」가 "1"인 컨테이너 대상 데이터 B의 2개의 컨테이너 대상 데이터가 전송되는 경우의 예이다.
이 경우, 컨테이너 대상 데이터 A는 3분할되고, 3개의 분할 정보의 각각이 3개의 유니버설 메타데이터 프레임에 할당되고, 「bytes_to_carry_access_information」의 필드에 삽입된다(도 6 참조). 여기서, 최초의 분할 정보에 대응한 「start_flag」는 "1"로 되어, 최초의 분할 정보임이 나타난다. 또한, 최초의 분할 정보에 대응한 「fcounter」는 "2"로 되고, 그 값에 1을 가산함으로써 분할수 "3"이 나타난다. 또한, 이 최초의 분할 정보에 대응하여 「total_data_size」의 필드가 존재하고, 컨테이너 대상 데이터(소정의 정보)의 전체 사이즈가 나타난다.
2번째 분할 정보에 대응한 「start_flag」는 "0"으로 되어, 최초의 분할 정보가 아님이 나타난다. 또한, 2번째 분할 정보에 대응한 「fcounter」는 "1"로 되어, 분할 위치가 나타남과 함께, 남은 분할 정보의 수가 "1"임이 나타난다. 또한, 마지막 분할 정보에 대응한 「start_flag」는 "0"으로 되어, 최후의 분할 정보가 아님이 나타난다. 그리고, 최후의 분할 정보에 대응한 「fcounter」는 "0"으로 되어, 최후의 분할 정보임이 나타난다.
또한, 컨테이너 대상 데이터 B는 분할되지 않고, 하나의 유니버설 메타데이터 프레임의 「bytes_to_carry_access_information」의 필드에 삽입된다(도 6 참조). 여기서, 「start_flag」는 "1"로 되어, 최초의 분할 정보임이 나타난다. 또한, 「fcounter」는 "0"으로 되어, 최후의 분할 정보임이 나타난다. 따라서, 이들 정보로부터, 분할되어 있지 않음이 나타난다. 또한, 이 최초의 분할 정보에 대응하여 「total_data_size」의 필드가 존재하고, 컨테이너 대상 데이터(소정의 정보)의 전체 사이즈가 나타난다.
[트랜스포트 스트림 TS의 구조예]
도 12는, 트랜스포트 스트림 TS의 구조예를 도시하고 있다. 이 구조예에서는, PID1로 식별되는 비디오 스트림의 PES 패킷 「video PES」가 존재함과 함께, PID2로 식별되는 오디오 스트림의 PES 패킷 「audio PES」가 존재한다. PES 패킷은, PES 헤더(PES_header)와 PES 페이로드(PES_payload)를 포함하고 있다. PES 헤더에는, DTS, PTS의 타임 스탬프가 삽입되어 있다.
오디오 스트림의 PES 패킷의 PES 페이로드에는 오디오 스트림(Audio coded stream)이 삽입된다. 이 오디오 스트림의 소정수(1을 포함함)의 오디오 프레임 내의 유니버설 메타데이터 프레임(universal_metadata_frame())에, 소정의 정보(컨테이너 대상 데이터)를 포함하는 액세스 인포메이션(Access_information())이 삽입된다.
또한, 트랜스포트 스트림 TS에는, PSI(Program Specific Information)로서, PMT(Program Map Table)가 포함되어 있다. PSI는, 트랜스포트 스트림에 포함되는 각 엘리멘터리 스트림이 어느 프로그램에 속해 있는지를 기재한 정보이다. PMT에는, 프로그램 전체에 관련된 정보를 기술하는 프로그램 루프(Program loop)가 존재한다.
또한, PMT에는, 각 엘리멘터리 스트림에 관련된 정보를 갖는 엘리멘터리 스트림 루프가 존재한다. 이 구성예에서는, 비디오 스트림에 대응한 비디오 엘리멘터리 스트림 루프(video ES loop)가 존재함과 함께, 오디오 스트림에 대응한 오디오 엘리멘터리 스트림 루프(audio ES loop)가 존재한다
비디오 엘리멘터리 스트림 루프(video ES loop)에는, 비디오 스트림에 대응하여, 스트림 타입, PID(패킷 식별자) 등의 정보가 배치됨과 함께, 그 비디오 스트림에 관련된 정보를 기술하는 디스크립터도 배치된다. 이 비디오 스트림의 「Stream_type」의 값은 「0x24」로 설정되고, PID 정보는, 상술한 바와 같이 비디오 스트림의 PES 패킷 「video PES」에 부여되는 PID1을 나타내는 것으로 된다. 디스크립터의 하나로서, HEVC 디스크립터가 배치된다.
또한, 오디오 엘리멘터리 스트림 루프(audio ES loop)에는, 오디오 스트림에 대응하여, 스트림 타입, PID(패킷 식별자) 등의 정보가 배치됨과 함께, 그 오디오 스트림에 관련된 정보를 기술하는 디스크립터도 배치된다. 이 오디오 스트림의 「Stream_type」의 값은 「0x2C」로 설정되고, PID 정보는, 상술한 바와 같이 오디오 스트림의 PES 패킷 「audio PES」에 부여되는 PID2를 나타내는 것으로 된다.
[셋톱 박스의 구성예]
도 13은, 셋톱 박스(200)의 구성예를 도시하고 있다. 이 셋톱 박스(200)는, CPU(201)와, 플래시 ROM(202)과, DRAM(203)과, 내부 버스(204)와, 리모컨 수신부(205)와, 리모컨 송신기(206)를 갖고 있다. 또한, 셋톱 박스(200)는, 안테나 단자(211)와, 디지털 튜너(212)와, 디멀티플렉서(213)와, 비디오 디코더(214)와, 오디오 프레이밍부(215)와, HDMI 송신부(216)와, HDMI 단자(217)를 갖고 있다.
CPU(201)는, 셋톱 박스(200)의 각 부의 동작을 제어한다. 플래시 ROM(202)은, 제어 소프트웨어의 저장 및 데이터의 보관을 행한다. DRAM(203)은, CPU(201)의 워크 에어리어를 구성한다. CPU(201)는, 플래시 ROM(202)으로부터 판독한 소프트웨어나 데이터를 DRAM(203) 상에 전개하여 소프트웨어를 기동시키고, 셋톱 박스(200)의 각 부를 제어한다.
리모컨 수신부(205)는, 리모컨 송신기(206)로부터 송신된 리모트 컨트롤 신호(리모컨 코드)를 수신하고, CPU(201)에 공급한다. CPU(201)는, 이 리모컨 코드에 기초하여, 셋톱 박스(200)의 각 부를 제어한다. CPU(201), 플래시 ROM(202) 및 DRAM(203)은, 내부 버스(204)에 접속되어 있다.
안테나 단자(211)는, 수신 안테나(도시하지 않음)에서 수신된 텔레비전 방송 신호를 입력하는 단자이다. 디지털 튜너(212)는, 안테나 단자(211)에 입력된 텔레비전 방송 신호를 처리하여, 유저의 선택 채널에 대응한 트랜스포트 스트림 TS를 출력한다.
디멀티플렉서(213)는, 트랜스포트 스트림 TS로부터 비디오 스트림의 패킷을 추출하고, 비디오 디코더(214)에 보낸다. 비디오 디코더(214)는, 디멀티플렉서(213)에서 추출된 비디오의 패킷으로부터 비디오 스트림을 재구성하고, 디코드 처리를 행하여 비압축의 비디오 데이터(화상 데이터)를 얻는다.
또한, 디멀티플렉서(213)는, 트랜스포트 스트림 TS로부터 오디오 스트림의 패킷을 추출하고, 오디오 스트림을 재구성한다. 오디오 프레이밍부(215)는, 이와 같이 재구성된 오디오 스트림에 대하여 프레이밍을 행한다. 이 오디오 스트림에는, 상술한 스트림 생성부(110)(도 3 참조)에서 설명한 바와 같이, 네트워크 액세스 정보, 커맨드 정보, 미디어 파일 등의 소정의 정보(컨테이너 대상 데이터)가 삽입되어 있다.
HDMI 송신부(216)는, HDMI에 준거한 통신에 의해, 비디오 디코더(214)에서 얻어진 비압축의 비디오 데이터와, 오디오 프레이밍부(215)에서 프레이밍된 후의 오디오 스트림을, HDMI 단자(217)로부터 송출한다. HDMI 송신부(216)는, HDMI의 TMDS 채널에서 송신하기 위해, 비디오 데이터 및 오디오 스트림을 패킹하여, HDMI 단자(217)에 출력한다. 이 HDMI 송신부(216)의 상세는 후술한다.
셋톱 박스(200)의 동작을 간단하게 설명한다. 안테나 단자(211)에 입력된 텔레비전 방송 신호는 디지털 튜너(212)에 공급된다. 이 디지털 튜너(212)에서는, 텔레비전 방송 신호가 처리되어, 유저의 선택 채널에 대응한 트랜스포트 스트림 TS가 출력된다.
디지털 튜너(212)로부터 출력되는 트랜스포트 스트림 TS는, 디멀티플렉서(213)에 공급된다. 이 디멀티플렉서(213)에서는, 트랜스포트 스트림 TS로부터 비디오의 엘리멘터리 스트림 패킷이 추출되고, 비디오 디코더(214)에 보내진다.
비디오 디코더(214)에서는, 디멀티플렉서(213)에서 추출된 비디오의 패킷으로부터 비디오 스트림이 재구성된 후, 그 비디오 스트림에 대하여 디코드 처리가 행해져, 비압축의 비디오 데이터가 얻어진다. 이 비압축의 비디오 데이터는, HDMI 송신부(216)에 공급된다.
또한, 디멀티플렉서(213)에서는, 트랜스포트 스트림 TS로부터 오디오 스트림의 패킷이 추출되고, 네트워크 액세스 정보, 커맨드 정보, 미디어 파일 등의 소정의 정보(컨테이너 대상 데이터)가 삽입되어 있는 오디오 스트림이 재구성된다. 이 오디오 스트림은 오디오 프레이밍부(215)에서 프레이밍된 후에, HDMI 송신부(216)에 공급된다. 그리고, HDMI 송신부(216)에서는, 비압축의 비디오 데이터 및 오디오 스트림이 패킹되고, HDMI 단자(217)로부터 HDMI 케이블(610)을 통하여 오디오 앰프(300)에 송신된다.
[오디오 앰프의 구성예]
도 14는, 오디오 앰프(300)의 구성예를 도시하고 있다. 오디오 앰프(300)는, CPU(301)와, 플래시 ROM(302)과, DRAM(303)과, 내부 버스(304)와, 리모컨 수신부(305)와, 리모컨 송신기(306)를 갖고 있다. 또한, 오디오 앰프(300)는, HDMI 단자(311)와, HDMI 수신부(312)와, 오디오 디코더(313)와, 음성 처리 회로(314)와, 음성 증폭 회로(315)와, 음성 출력 단자(316)와, HDMI 송신부(317)와, HDMI 단자(318)를 갖고 있다.
CPU(301)는, 오디오 앰프(300)의 각 부의 동작을 제어한다. 플래시 ROM(302)은, 제어 소프트웨어의 저장 및 데이터의 보관을 행한다. DRAM(303)은, CPU(301)의 워크 에어리어를 구성한다. CPU(301)는, 플래시 ROM(302)으로부터 판독한 소프트웨어나 데이터를 DRAM(303) 상에 전개하여 소프트웨어를 기동시키고, 오디오 앰프(300)의 각 부를 제어한다.
리모컨 수신부(305)는, 리모컨 송신기(306)로부터 송신된 리모트 컨트롤 신호(리모컨 코드)를 수신하고, CPU(301)에 공급한다. CPU(301)는, 이 리모컨 코드에 기초하여, 오디오 앰프(300)의 각 부를 제어한다. CPU(301), 플래시 ROM(302) 및 DRAM(303)은, 내부 버스(304)에 접속되어 있다.
HDMI 수신부(312)는, HDMI에 준거한 통신에 의해, HDMI 케이블(610)을 통하여 HDMI 단자(311)에 공급되는 비압축의 비디오 데이터와 오디오 스트림을 수신한다. 오디오 스트림에는, 상술한 셋톱 박스(200)(도 13 참조)에서 설명한 바와 같이, 네트워크 액세스 정보, 커맨드 정보, 미디어 파일 등의 소정의 정보(컨테이너 대상 데이터)가 삽입되어 있다. 이 HDMI 수신부(312)의 상세는 후술한다.
오디오 디코더(313)는, HDMI 수신부(212)에서 수신된 오디오 스트림에 대하여 디코드 처리를 실시하고, 소정 채널수의 비압축의 오디오 데이터(음성 데이터)를 얻는다. 음성 처리 회로(314)는, 소정 채널수의 비압축의 오디오 데이터에, 스피커 시스템(400)(도 1 참조)의 구성에 따라 필요한 업/다운믹스 처리를 실시하여, 필요한 채널수의 오디오 데이터를 얻음과 함께, D/A 변환 등의 필요한 처리를 실시한다.
음성 증폭 회로(315)는, 음성 처리 회로(314)에서 얻어진 각 채널의 오디오 신호를 증폭하여 음성 출력 단자(316)에 출력한다. 또한, 음성 출력 단자(316)에는, 스피커 시스템(400)이 접속된다.
HDMI 송신부(317)는, HDMI에 준거한 통신에 의해, HDMI 수신부(212)에서 수신된 비압축의 비디오 데이터와 오디오 스트림을, HDMI 단자(318)로부터 송출한다. HDMI 송신부(317)는, HDMI의 TMDS 채널에서 송신하기 위해, 비압축의 비디오 데이터 및 오디오 스트림을 패킹하여, HDMI 단자(318)에 출력한다. 이 HDMI 송신부(317)의 상세는 후술한다.
도 14에 도시하는 오디오 앰프(300)의 동작을 간단하게 설명한다. HDMI 수신부(312)에서는, 셋톱 박스(200)로부터 HDMI 케이블(610)을 통하여 HDMI 단자(311)에 송신되어 오는, 비압축의 비디오 데이터와 오디오 스트림이 수신된다.
HDMI 수신부(312)에서 수신된 오디오 스트림은, 오디오 디코더(313)에 공급된다. 오디오 디코더(313)에서는, 오디오 스트림에 대하여 디코드 처리가 실시되어, 소정 채널수의 비압축의 오디오 데이터가 얻어진다. 이 오디오 데이터는, 음성 처리 회로(314)에 공급된다.
음성 처리 회로(314)에서는, 소정 채널수의 비압축의 오디오 데이터에, 스피커 시스템(400)(도 1 참조)의 구성에 따라 필요한 업/다운믹스 처리가 실시되어, 필요한 채널수의 오디오 데이터가 얻어짐과 함께, D/A 변환 등의 필요한 처리가 실시된다. 음성 처리 회로(314)로부터 출력되는 각 채널의 오디오 데이터는 음성 증폭 회로(315)에서 증폭되어 음성 출력 단자(316)에 출력된다. 그 때문에, 음성 출력 단자(316)에 접속된 스피커 시스템(400)으로부터 소정 채널수의 음성 출력이 얻어진다.
또한, HDMI 수신부(312)에서 수신된 비압축의 비디오 데이터와 오디오 스트림은, HDMI 송신부(317)에 공급된다. 또한, HDMI 수신부(312)에서 수신된 비압축의 비디오 데이터 그 자체가 아니라, 이 비압축의 비디오 데이터에 그래픽 데이터의 중첩 등의 처리가 실시된 후의 비디오 데이터가 HDMI 송신부(317)에 공급되어도 된다. HDMI 송신부(317)에서는, 이들 비압축의 비디오 데이터 및 오디오 스트림이 패킹되고, HDMI 단자(318)로부터 HDMI 케이블(620)을 통하여 텔레비전 수신기(500)에 송신된다.
[텔레비전 수신기의 구성예]
도 15는, 텔레비전 수신기(500)의 구성예를 도시하고 있다. 이 텔레비전 수신기(400)는, CPU(501)와, 플래시 ROM(502)과, DRAM(503)과, 내부 버스(504)와, 리모컨 수신부(505)와, 리모컨 송신기(506)와, 통신 인터페이스(507)를 갖고 있다.
또한, 텔레비전 수신기(500)는, 안테나 단자(511)와, 디지털 튜너(512)와, 디멀티플렉서(513)와, 비디오 디코더(514)와, HDMI 단자(515)와, HDMI 수신부(516)를 갖고 있다. 또한, 텔레비전 수신기(500)는, 영상 처리 회로(517)와, 패널 구동 회로(518)와, 표시 패널(519)과, 오디오 디코더(520)와, 음성 처리 회로(521)와, 음성 증폭 회로(522)와, 스피커(523)를 갖고 있다.
CPU(501)는, 텔레비전 수신기(500)의 각 부의 동작을 제어한다. 플래시 ROM(502)은, 제어 소프트웨어의 저장 및 데이터의 보관을 행한다. DRAM(503)은, CPU(501)의 워크 에어리어를 구성한다. CPU(501)는, 플래시 ROM(502)으로부터 판독한 소프트웨어나 데이터를 DRAM(503) 상에 전개하여 소프트웨어를 기동시키고, 텔레비전 수신기(500)의 각 부를 제어한다.
리모컨 수신부(505)는, 리모컨 송신기(506)로부터 송신된 리모트 컨트롤 신호(리모컨 코드)를 수신하고, CPU(501)에 공급한다. CPU(501)는, 이 리모컨 코드에 기초하여, 텔레비전 수신기(500)의 각 부를 제어한다. CPU(501), 플래시 ROM(502) 및 DRAM(503)은, 내부 버스(504)에 접속되어 있다.
통신 인터페이스(507)는, CPU(501)의 제어 하에, 인터넷 등의 네트워크 상에 존재하는 서버와의 사이에서 통신을 행한다. 이 통신 인터페이스(507)는, 내부 버스(504)에 접속되어 있다.
안테나 단자(511)는, 수신 안테나(도시하지 않음)에서 수신된 텔레비전 방송 신호를 입력하는 단자이다. 디지털 튜너(512)는, 안테나 단자(511)에 입력된 텔레비전 방송 신호를 처리하여, 유저의 선택 채널에 대응한 트랜스포트 스트림 TS를 출력한다.
디멀티플렉서(513)는, 트랜스포트 스트림 TS로부터 비디오 스트림의 패킷을 추출하고, 비디오 디코더(514)에 보낸다. 비디오 디코더(514)는, 디멀티플렉서(513)에서 추출된 비디오의 패킷으로부터 비디오 스트림을 재구성하고, 디코드 처리를 행하여 비압축의 비디오 데이터(화상 데이터)를 얻는다.
또한, 디멀티플렉서(513)는, 트랜스포트 스트림 TS로부터 오디오 스트림의 패킷을 추출하고, 오디오 스트림을 재구성한다. 이 오디오 스트림에는, 상술한 스트림 생성부(110)(도 3 참조)에서 설명한 바와 같이, 네트워크 액세스 정보, 커맨드 정보, 미디어 파일 등의 소정의 정보(컨테이너 대상 데이터)가 삽입되어 있다.
HDMI 수신부(516)는, HDMI에 준거한 통신에 의해, HDMI 케이블(620)을 통하여 HDMI 단자(515)에 공급되는 비압축의 비디오 데이터와 오디오 스트림을 수신한다. 오디오 스트림에는, 상술한 오디오 앰프(300)(도 14 참조)에서 설명한 바와 같이, 네트워크 액세스 정보, 커맨드 정보, 미디어 파일 등의 소정의 정보(컨테이너 대상 데이터)가 삽입되어 있다. 이 HDMI 수신부(516)의 상세는 후술한다.
영상 처리 회로(517)는, 비디오 디코더(514)에서 얻어진, 혹은 HDMI 수신부(516)에서 얻어진 비디오 데이터, 나아가 통신 인터페이스(507)에서 네트워크 상의 서버로부터 수신된 비디오 데이터 등에 대하여 스케일링 처리, 합성 처리 등을 행하여, 표시용 비디오 데이터를 얻는다.
패널 구동 회로(518)는, 영상 처리 회로(517)에서 얻어지는 표시용 화상 데이터에 기초하여, 표시 패널(519)을 구동한다. 표시 패널(519)은, 예를 들어 LCD(Liquid Crystal Display), 유기 EL 디스플레이(organic electroluminescence display) 등으로 구성되어 있다.
오디오 디코더(520)는, 디멀티플렉서(513)에서 얻어진, 혹은 HDMI 수신부(516)에서 얻어진 오디오 스트림에 대하여 디코드 처리를 실시하여 비압축의 오디오 데이터(음성 데이터)를 얻는다. 또한, 오디오 디코더(520)는, 오디오 스트림에 삽입되어 있는, 네트워크 액세스 정보, 커맨드 정보, 미디어 파일 등의 소정의 정보(컨테이너 대상 데이터)를 추출하고, CPU(501)에 송신한다. CPU(501)는, 적절히 텔레비전 수신기(500)의 각 부에, 이 소정의 정보를 이용한 정보 처리를 행하게 한다.
여기서, 소정의 정보는, 오디오 스트림의 소정수(1을 포함함)의 오디오 프레임으로 분할되어 삽입되고, 최초의 분할 정보에 소정의 정보의 전체 사이즈를 나타내는 정보가 부가되고, 각 분할 정보에 최초의 분할 정보인지 여부를 나타내는 정보 및 분할 위치를 나타내는 정보로서의 내림차순의 카운트수가 부가되어 있다. 오디오 디코더(520)는, 이들 정보에 기초하여, 소정수의 오디오 프레임으로부터, 소정의 정보를 구성하는 각 분할 정보를 취득한다.
이 경우, 오디오 디코더(520)는, 최초의 분할 정보인지 여부를 나타내는 정보로부터 최초의 분할 정보를 인식할 수 있고, 또한 이 최초의 분할 정보에 대응한 내림차순의 카운트수로부터 분할수를 인식할 수 있고, 또한 내림차순의 카운트수로부터 남은 분할 정보의 수를 인식할 수 있다. 그 때문에, 오디오 디코더(520)는, 소정수의 오디오 프레임으로부터, 소정의 정보를 구성하는 각 분할 정보를, 용이하면서도 적절하게 취득할 수 있다.
또한, 내림차순의 카운트수에 의해, (1) 도중의 전송 패킷이 에러가 된 경우에, 그것을 수신측에서 검출하는 것이 가능하고, (2) 또한, 분할된 최종 패킷이 도달하는 대략의 시간을 수신측에서 미리 알 수 있다.
또한, 최초의 분할 정보에 소정의 정보의 전체 사이즈를 나타내는 정보가 부가되어 있으므로, 최초의 분할 정보가 취득되는 시점에서 소정의 정보의 전체 사이즈를 나타내는 정보에 기초하여 메모리(기억 매체)에 당해 소정의 정보를 축적할 수 있을 만큼의 스페이스를 확보할 수 있어, 소정의 정보의 취득 처리를 용이하면서도 적절하게 행하는 것이 가능하게 된다.
CPU(501)는, 적절히, 텔레비전 수신기(500)의 각 부에 이 소정의 정보를 사용한 정보 처리를 행하게 한다. 예를 들어, 소정의 정보가 네트워크 액세스 정보일 때, 텔레비전 수신기(500)는, 네트워크 상의 소정의 서버에 액세스하여 소정의 미디어 정보를 취득하는 처리를 행한다. 또한, 예를 들어 소정의 정보가 미디어 파일일 때, 텔레비전 수신기(500)는, 그 미디어 파일의 재생 처리를 행한다.
음성 처리 회로(521)는, 오디오 디코더(520)에서 얻어진 오디오 데이터에 대하여 D/A 변환 등의 필요한 처리를 행한다. 음성 증폭 회로(522)는, 음성 처리 회로(521)로부터 출력되는 음성 신호를 증폭하여 스피커(523)에 공급한다.
도 15에 도시하는 텔레비전 수신기(500)의 동작을 간단하게 설명한다. 안테나 단자(511)에 입력된 텔레비전 방송 신호는 디지털 튜너(512)에 공급된다. 이 디지털 튜너(512)에서는, 텔레비전 방송 신호가 처리되어, 유저의 선택 채널에 대응한 트랜스포트 스트림 TS가 얻어진다.
디지털 튜너(512)에서 얻어지는 트랜스포트 스트림 TS는, 디멀티플렉서(513)에 공급된다. 디멀티플렉서(513)는, 트랜스포트 스트림 TS로부터 비디오 스트림의 패킷이 추출되고, 비디오 디코더(514)에 공급된다. 비디오 디코더(514)에서는, 디멀티플렉서(513)에서 추출된 비디오의 패킷으로부터 비디오 스트림이 재구성되고, 디코드 처리가 실시되어, 비압축의 비디오 데이터가 얻어진다. 이 비압축의 비디오 데이터는, 영상 처리 회로(517)에 공급된다.
또한, 디멀티플렉서(513)에서는, 트랜스포트 스트림 TS로부터 오디오 스트림의 패킷이 추출되고, 오디오 스트림이 재구성된다. 이 오디오 스트림은, 오디오 디코더(520)에 공급된다.
HDMI 수신부(516)에서는, HDMI에 준거한 통신에 의해, HDMI 케이블(620)을 통하여 HDMI 단자(515)에 공급되는 비압축의 비디오 데이터 및 오디오 스트림이 수신된다. 비압축의 비디오 데이터는, 영상 처리 회로(517)에 공급된다. 또한, 오디오 스트림은 오디오 디코더(520)에 공급된다.
영상 처리 회로(517)에서는, 비디오 디코더(514)에서 얻어진, 혹은 HDMI 수신부(516)에서 얻어진 비디오 데이터, 나아가 통신 인터페이스(507)에서 네트워크 상의 서버로부터 수신된 비디오 데이터 등에 대하여 스케일링 처리, 합성 처리 등이 실시되고, 표시용 비디오 데이터가 얻어진다.
영상 처리 회로(517)에서 얻어진 표시용 비디오 데이터는 패널 구동 회로(518)에 공급된다. 패널 구동 회로(518)에서는, 표시용 비디오 데이터에 기초하여, 표시 패널(519)을 구동하는 일이 행해진다. 이에 의해, 표시 패널(519)에는, 표시용 비디오 데이터에 대응한 화상이 표시된다.
오디오 디코더(520)에서는, 디멀티플렉서(513)에서 얻어진, 혹은 HDMI 수신부(516)에서 얻어진 오디오 스트림에 대하여 디코드 처리가 실시되어 비압축의 오디오 데이터가 얻어진다. 오디오 디코더(520)에서 얻어지는 오디오 데이터는, 음성 처리 회로(521)에 공급된다. 음성 처리 회로(521)에서는, 오디오 데이터에 대하여 D/A 변환 등의 필요한 처리가 실시된다. 이 오디오 데이터는, 음성 증폭 회로(522)에서 증폭된 후에, 스피커(523)에 공급된다. 그 때문에, 스피커(523)로부터, 표시 패널(519)의 표시 화상에 대응한 음성이 출력된다.
또한, 오디오 디코더(520)에서는, 오디오 스트림에 삽입되어 있는, 네트워크 액세스 정보, 커맨드 정보, 미디어 파일 등의 소정의 정보(컨테이너 대상 데이터)가 추출된다. 이와 같이 오디오 디코더(520)에서 추출되는 소정의 정보는, CPU(501)에 보내진다. 그리고, CPU(501)의 제어에 의해, 적절히, 텔레비전 수신기(500)의 각 부에서 소정의 정보를 이용한 정보 처리가 행해진다.
[HDMI 송신부, HDMI 수신부의 구성예]
도 16은, 도 1의 송수신 시스템(10)에 있어서의, 셋톱 박스(200)의 HDMI 송신부(216)(도 13 참조)와 오디오 앰프(300)의 HDMI 수신부(312)(도 14 참조)의 구성예를 도시하고 있다. 또한, 오디오 앰프(300)의 HDMI 송신부(317)와 텔레비전 수신기(500)의 HDMI 수신부(516)의 구성예에 관해서는, 마찬가지의 구성이 되므로, 설명은 생략한다.
HDMI 송신부(216)는, 하나의 수직 동기 신호에서부터 다음 수직 동기 신호까지의 구간으로부터, 수평 귀선 구간(22) 및 수직 귀선 구간(23)을 제외한 구간인 유효 화상 구간(21)(이하, 적절히 「액티브 비디오 구간」이라고도 함)(도 17 참조)에 있어서, 비압축의 1 화면분의 화상의 화소 데이터에 대응하는 차동 신호를, 복수의 채널에서, HDMI 수신부(312)에 일방향으로 송신한다. 또한, HDMI 송신부(216)는, 수평 귀선 구간(22) 또는 수직 귀선 구간(23)에 있어서, 적어도 화상에 부수되는 음성 데이터나 제어 데이터, 그 밖의 보조 데이터 등에 대응하는 차동 신호를, 복수의 채널에서, HDMI 수신부(312)에 일방향으로 송신한다.
즉, HDMI 송신부(216)는, HDMI 트랜스미터(31)를 갖는다. 트랜스미터(31)는, 예를 들어 비압축의 화상의 화소 데이터를 대응하는 차동 신호로 변환하고, 복수의 채널인 3개의 TMDS(Transition Minimized Differential Signaling) 채널 #0, #1, #2에서, HDMI 수신부(312)에, 일방향으로 시리얼 전송한다.
또한, 트랜스미터(31)는, 비압축의 화상에 부수되는 음성 데이터, 나아가 필요한 제어 데이터 그 밖의 보조 데이터 등을, 대응하는 차동 신호로 변환하고, 3개의 TMDS 채널 #0, #1, #2에서, HDMI 수신부(312)에 일방향으로 시리얼 전송한다.
HDMI 수신부(312)는, 액티브 비디오 구간(21)(도 17 참조)에 있어서, 복수의 채널에서, HDMI 송신부(216)로부터 일방향으로 송신되어 오는, 화소 데이터에 대응하는 차동 신호를 수신한다. 또한, HDMI 수신부(312)는, 수평 귀선 구간(22)(도 17 참조) 또는 수직 귀선 구간(23)(도 17 참조)에 있어서, 복수의 채널에서, HDMI 송신부(216)로부터 일방향으로 송신되어 오는, 음성 데이터나 제어 데이터에 대응하는 차동 신호를 수신한다.
HDMI 송신부(216)와 HDMI 수신부(312)를 포함하는 HDMI 시스템의 전송 채널에는, 화소 데이터 및 음성 데이터를 전송하기 위한 전송 채널로서의 3개의 TMDS 채널 #0 내지 #2와, 픽셀 클럭을 전송하는 전송 채널로서의 TMDS 클럭 채널 외에, DDC(Display Data Channel)(33)나 CEC(Consumer Electronics Control) 라인(34)이라고 불리는 전송 채널이 있다.
DDC(33)는, HDMI 케이블(610)에 포함되는 2개의 신호선을 포함하고, HDMI 송신부(216)가, HDMI 케이블(610)을 통하여 접속된 HDMI 수신부(312)로부터, EDID(Extended Display Identification Data)를 판독하기 위해 사용된다. 즉, HDMI 수신부(312)는, HDMI 리시버(32) 외에, 자신의 성능(ConfigurationㆍCapability)에 관한 성능 정보인 EDID를 기억하고 있는, EDID ROM(Read Only Memory)을 갖고 있다. HDMI 송신부(216)가 EDID를 판독함으로써, 수신측의 복호화 능력 정보가 송신측에 보내지게 된다.
HDMI 송신부(216)는, HDMI 케이블(610)을 통하여 접속되어 있는 HDMI 수신부(312)로부터, EDID를, DDC(33)를 통하여 판독한다. 그리고, 셋톱 박스(200)의 CPU(201)는, 그 EDID에 기초하여, HDMI 수신부(312)를 갖는 오디오 앰프(300)의 성능을 인식한다.
CEC 라인(34)은, HDMI 케이블(610)에 포함되는 하나의 신호선을 포함하고, HDMI 송신부(216)와 HDMI 수신부(312)의 사이에서, 제어용 데이터의 쌍방향 통신을 행하기 위해 사용된다. 또한, HDMI 케이블(610)에는, HPD(Hot Plug Detect)라고 불리는 핀에 접속되는 HPD 라인(35)이 포함되어 있다.
소스 기기는, 이 HPD 라인(35)을 이용하여, 직류 바이어스 전위에 의해, 싱크 기기(데스티네이션 기기)의 접속을 검출할 수 있다. 이 경우, HPD 라인(35)은, 소스 기기측에서 보면, 직류 바이어스 전위에 의해 싱크 기기로부터 접속 상태의 통지를 받는 기능을 갖게 된다. 한편, 이 HPD 라인은, 싱크 기기측에서 보면, 직류 바이어스 전위에 의해 소스 기기에 접속 상태를 통지하는 기능을 갖게 된다. 또한, HDMI 케이블(610)에는, 소스 기기로부터 싱크 기기로 전원을 공급하기 위해 사용되는 전원 라인(36)이 포함되어 있다.
또한, HDMI 케이블(610)에는, 리저브 라인(37)이 포함되어 있다. HPD 라인(35)과 리저브 라인(37)을 사용한, 이더넷의 신호를 전송하는 HDMI 이더넷 채널(HDMI Ethernet Channel: HEC)이 존재한다. 또한, HPD 라인(35)과 리저브 라인(37)의 양쪽 또는 HPD 라인(35)만을 사용한, 오디오 데이터를 데스티네이션 기기(싱크 기기)로부터 소스 기기로 전송하는 오디오 리턴 채널(Audio Return Channel: ARC)이 존재한다. 또한, 「이더넷」, 「Ethernet」은 등록 상표이다.
도 17은, TMDS 채널에 있어서, 가로×세로가 1920픽셀×1080라인의 화상 데이터가 전송되는 경우의, 각종 전송 데이터의 구간을 도시하고 있다. HDMI의 3개의 TMDS 채널에서 전송 데이터가 전송되는 비디오 필드(Video Field)에는, 전송 데이터의 종류에 따라, 비디오 데이터 구간(24)(Video Data Period), 데이터 아일랜드 구간(25)(Data Island Period) 및 컨트롤 구간(26)(Control Period)의 3종류의 구간이 존재한다.
여기서, 비디오 필드 구간은, 어떠한 수직 동기 신호의 상승 에지(Active Edge)에서부터 다음 수직 동기 신호의 상승 에지까지의 구간이며, 수평 귀선 기간(22)(Horizontal Blanking), 수직 귀선 기간(23)(Vertical Blanking), 그리고 비디오 필드 구간으로부터, 수평 귀선 기간 및 수직 귀선 기간을 제외한 구간인 유효 화소 구간(21)(Active Video)으로 나뉜다.
비디오 데이터 구간(24)은, 유효 화소 구간(21)에 할당된다. 이 비디오 데이터 구간(24)에서는, 비압축의 1 화면분의 화상 데이터를 구성하는 1920픽셀(화소)×1080라인분의 유효 화소(Active Pixel)의 데이터가 전송된다. 데이터 아일랜드 구간(25) 및 컨트롤 구간(26)은, 수평 귀선 기간(22) 및 수직 귀선 기간(23)에 할당된다. 이 데이터 아일랜드 구간(25) 및 컨트롤 구간(26)에서는, 보조 데이터(Auxiliary Data)가 전송된다.
즉, 데이터 아일랜드 구간(25)은, 수평 귀선 기간(22)과 수직 귀선 기간(23)의 일부분에 할당되어 있다. 이 데이터 아일랜드 구간(25)에서는, 보조 데이터 중, 제어에 관계하지 않는 데이터인, 예를 들어 음성 데이터의 패킷 등이 전송된다. 컨트롤 구간(26)은, 수평 귀선 기간(22)과 수직 귀선 기간(23)의 다른 부분에 할당되어 있다. 이 컨트롤 구간(26)에서는, 보조 데이터 중의, 제어에 관계하는 데이터인, 예를 들어 수직 동기 신호 및 수평 동기 신호, 제어 패킷 등이 전송된다.
상술한 바와 같이, 도 1에 도시하는 송수신 시스템(10)에 있어서, 방송 송출 장치(100)는, 오디오 스트림(오디오 압축 데이터 스트림)의 소정수의 오디오 프레임에 소정의 정보(컨테이너 대상 데이터)가 분할되어 얻어진 각 분할 정보의 각각을 삽입하는 것이 가능하게 된다. 그 때문에, 소정의 정보의 전체 사이즈가 커도 개개의 오디오 프레임에 삽입되는 정보 사이즈를 억제할 수 있고, 오디오 압축 데이터의 송신에 영향을 주지 않고 소정의 정보의 송신을 양호하게 행할 수 있다.
또한, 도 1에 도시하는 송수신 시스템(10)에 있어서, 방송 송출 장치(100)는, 오디오 스트림(오디오 압축 데이터 스트림)의 소정수의 오디오 프레임에 소정의 정보(컨테이너 대상 데이터)를 분할하여 삽입하고, 최초의 분할 정보에 소정의 정보의 전체 사이즈를 나타내는 정보를 부가한다. 그 때문에, 수신측에서는, 소정수의 오디오 프레임으로부터 소정의 정보를 구성하는 각 분할 정보를 취득할 때, 최초의 분할 정보가 취득되는 시점에서 당해 소정의 정보의 전체 사이즈를 나타내는 정보에 기초하여 기억 매체에 당해 소정의 정보를 축적할 수 있을 만큼의 스페이스를 확보할 수 있어, 소정의 정보의 취득 처리를 용이하면서도 적절하게 행할 수 있다.
또한, 도 1에 도시하는 송수신 시스템(10)에 있어서, 방송 송출 장치(100)는, 오디오 스트림의 복수의 오디오 프레임에, 소정의 정보(컨테이너 대상 데이터)를 분할하여 삽입하고, 각 분할 정보에, 최초의 분할 정보인지 여부를 나타내는 정보와, 분할 위치를 나타내는 정보로서의 내림차순의 카운트수를 부가한다. 그 때문에, 수신측에서는, 최초의 분할 정보인지 여부를 나타내는 정보로부터 최초의 분할 정보를 인식할 수 있고, 또한 이 최초의 분할 정보에 대응한 내림차순의 카운트수로부터 분할수를 인식할 수 있고, 또한 내림차순의 카운트수로부터 남은 분할 정보의 수를 인식할 수 있어, 소정의 정보의 취득 처리를 용이하면서도 적절하게 행할 수 있다.
<2. 변형예>
또한, 상술한 실시 형태에 있어서는, 방송 송출 장치(100)에서 오디오 스트림(오디오 압축 데이터 스트림)에 네트워크 액세스 정보, 커맨드 정보, 미디어 파일 등의 소정의 정보(컨테이너 대상 데이터)를 삽입하는 예를 나타내었다. 그러나, 오디오 스트림으로의 소정의 정보의 삽입을 셋톱 박스(200)에서 행하는 구성도 고려된다.
이 경우, 소정의 정보는, 셋톱 박스(200)에 있어서 발생되거나, 혹은 외부로부터 입력되어도 되지만, 방송 송출 장치(100)로부터 컨테이너로서의 트랜스포트 스트림 TS의 레이어에 삽입되어 보내져 오는 경우도 고려된다. 또한, 컨테이너에서 보내지는 액세스 정보는 그 밖에도, 트리거(trigger) 정보 혹은 이벤트 정보(DSM-CC에서 전달됨)로서 보내지는 것에 포함되는 경우도 있다.
도 18은, 그 경우에 있어서의, 방송 송출 장치(100)가 구비하는 스트림 생성부(110A)의 구성예를 도시하고 있다. 이 도 18에 있어서, 도 3과 대응하는 부분에는 동일 부호를 붙이고, 적절히 그 상세 설명을 생략한다. 이 스트림 생성부(110A)는, 제어부(111)와, 비디오 인코더(112)와, 오디오 인코더(113A)와, 멀티플렉서(114A)를 갖고 있다.
오디오 인코더(113A)에서는, 오디오 데이터 SA에 대하여, MPEG-H 3D Audio의 압축 포맷에 의한 부호화가 실시되고, 오디오 스트림(오디오 압축 데이터 스트림)이 생성된다. 이 오디오 인코더(113A)에서는, 도 3의 스트림 생성부(110)에 있어서의 오디오 인코더(113)와는 달리, 오디오 스트림에 소정의 정보를 삽입하는 일은 행해지지 않는다.
비디오 인코더(112)에서 생성된 비디오 스트림은, 멀티플렉서(114A)에 공급된다. 또한, 오디오 인코더(113A)에서 생성된 오디오 스트림은, 멀티플렉서(114A)에 공급된다. 그리고, 이 멀티플렉서(114A)에서는, 각 인코더로부터 공급되는 스트림이 패킷화되어 다중되고, 전송 데이터로서 트랜스포트 스트림 TS가 얻어진다.
이때, 제어부(111)로부터 멀티플렉서(114A)로, 네트워크 액세스 정보, 커맨드 정보, 미디어 파일 등의 소정의 정보(컨테이너 대상 데이터)가 공급되는, 디멀티플렉서(114A)에서는, 컨테이너로서의 트랜스포트 스트림 TS의 레이어에, 이 소정의 정보가 삽입된다.
예를 들어, 멀티플렉서(114A)에서는, 애플리케이션 인포메이션 테이블(AIT: Application Information Table)의 관리 하에, 소정의 정보를 갖는, 신규 정의하는 애플리케이션 디스크립터(Application_descriptor)가 삽입된다.
도 19는, 애플리케이션 디스크립터의 구조예(Syntax)를 도시하고 있다. 「descriptor_tag」의 8비트 필드는, 디스크립터 타입을 나타낸다. 여기서는, 애플리케이션 디스크립터임을 나타낸다. 「descriptor_length」의 8비트 필드는, 디스크립터의 길이(사이즈)를 나타내고, 디스크립터의 길이로서, 이후의 바이트수를 나타낸다. 「descriptor_length」의 필드에 이어서, 소정의 정보를 갖는, 액세스 인포메이션(Access_information())(도 7 참조)의 필드가 존재한다.
도 20은, AIT의 관리 하에 애플리케이션 디스크립터(Application_descriptor)가 삽입되는 경우에 있어서의 트랜스포트 스트림 TS의 구조예를 도시하고 있다. 이 구조예에서는, 오디오 스트림의 PES 패킷의 PES 페이로드에는 오디오 스트림(Audio coded stream)이 삽입된다. 그러나, 이 오디오 스트림에는, 소정의 정보(컨테이너 대상 데이터)를 포함하는 액세스 인포메이션(Access_information())은 삽입되지 않는다.
또한, 트랜스포트 스트림 TS에는, PMT(Program Map Table) 외에, AIT(Application Information Table)가 포함되어 있다. 이 AIT의 관리 하에, 애플리케이션 식별자(Application_id)와 함께, 애플리케이션 디스크립터(도 19 참조)가 배치되어 있다.
도 21은, 오디오 스트림에 소정의 정보를 삽입하는 셋톱 박스(200A)의 구성예를 도시하고 있다. 이 도 21에 있어서, 도 13과 대응하는 부분에는 동일 부호를 붙여, 적절히 그 상세 설명은 생략한다. 이 셋톱 박스(200A)는, CPU(201)와, 플래시 ROM(202)과, DRAM(203)과, 내부 버스(204)와, 리모컨 수신부(205)와, 리모컨 송신기(206)를 갖고 있다. 또한, 이 셋톱 박스(200A)는, 안테나 단자(211)와, 디지털 튜너(212)와, 디멀티플렉서(213A)와, 비디오 디코더(214)와, 데이터 삽입부(218)와, 오디오 프레이밍부(215)와, HDMI 송신부(216)와, HDMI 단자(217)를 갖고 있다.
디멀티플렉서(213)에서는, 트랜스포트 스트림 TS로부터 오디오 스트림의 패킷이 추출되고, 오디오 스트림(오디오 압축 데이터 스트림)이 재구성된다. 또한, 디멀티플렉서(213A)에서는, 트랜스포트 스트림 TS로부터 각종 디스크립터 등이 추출되고, CPU(201)에 보내진다. 이 디스크립터에는, 소정의 정보를 갖는 애플리케이션 디스크립터(도 19 참조)도 포함된다.
디멀티플렉서(213A)에서 추출된 오디오 스트림은 데이터 삽입부(218)에 공급된다. 이 데이터 삽입부(218)에는, CPU(201)로부터 소정의 정보가 공급된다. 데이터 삽입부(218)에서는, CPU(201)의 제어 하에, 오디오 스트림에, 소정의 정보가 삽입된다.
이 경우, 도 3의 스트림 생성부(110)의 오디오 인코더(113)와 마찬가지로, 오디오 스트림의 소정수(1을 포함함)의 오디오 프레임에 소정의 정보가 분할되어 삽입된다(도 9 내지 도 11 참조). 이때, 최초의 분할 정보에, 소정의 정보의 전체 사이즈를 나타내는 정보가 부가된다. 또한, 각 분할 정보에, 최초의 분할 정보인지 여부를 나타내는 정보 및 분할 위치를 나타내는 정보로서의 내림차순의 카운트수가 부가된다.
또한, 이 경우, 소정의 정보가 삽입된 오디오 스트림의 비트 레이트가 HDMI의 전송 대역 용량 범위에 들어가도록 분할수가 결정된다. 이에 의해, 소정의 정보의 전체 사이즈에 따라서는, 분할되지 않고, 하나의 오디오 프레임에 소정의 정보의 전체가 삽입되는 경우도 있다.
데이터 삽입부(218)로부터의 소정의 정보가 삽입된 오디오 스트림은, 오디오 프레이밍부(215)에서 프레이밍된 후에, HDMI 송신부(216)에 공급된다. 이 도 21에 도시하는 셋톱 박스(200A)에 있어서, 그 밖에는, 도 13에 도시하는 셋톱 박스(200)와 마찬가지로 구성된다.
또한, 상술한 실시 형태에 있어서는, 오디오 압축 포맷이 MPEG-H 3D Audio인 예를 나타내었다. 그러나, 본 기술은, 오디오 압축 포맷이, AAC, AC3, AC4 등의 그 밖의 오디오 압축 포맷인 경우에도, 마찬가지로 적용할 수 있다.
또한, 상술한 실시 형태에 있어서, 셋톱 박스(200)는, 방송 송출 장치(100)로부터의 방송 신호로부터 비디오 스트림 및 오디오 스트림을 수신하는 구성으로 되어 있다. 그러나, 셋톱 박스(200)는, 배신 서버(스트리밍 서버)로부터 네트워크를 통하여 비디오 스트림 및 오디오 스트림을 수신하는 구성도 고려된다.
또한, 상술한 실시 형태에 있어서는, 컨테이너가 트랜스포트 스트림(MPEG-2TS)인 예를 나타내었다. 그러나, 본 기술은, MP4나 그 이외의 포맷의 컨테이너에서 배신되는 시스템에도 마찬가지로 적용할 수 있다. 예를 들어, MPEG-DASH 베이스의 스트림 배신 시스템, 혹은 MMT(MPEG Media Transport) 구조 전송 스트림을 취급하는 송수신 시스템 등이다.
도 22는, 소정의 정보(컨테이너 대상 데이터)를 오디오 스트림에 삽입하여 보내는 경우에 있어서의 MMT 스트림의 구조예를 도시하고 있다. MMT 스트림에는, 비디오, 오디오 등의 각 어셋의 MMT 패킷이 존재한다. 이 구조예에서는, ID1로 식별되는 비디오의 어셋의 MMT 패킷과 함께, ID2로 식별되는 오디오의 어셋의 MMT 패킷이 존재한다.
오디오의 어셋(오디오 스트림)의 소정수(1을 포함함)의 오디오 프레임 내의 유니버설 메타데이터 프레임(universal_metadata_frame())에, 소정의 정보(컨테이너 대상 데이터)를 포함하는 액세스 인포메이션(Access_information())이 삽입되어 있다.
또한, MMT 스트림에는, PA(Packet Access) 메시지 패킷 등의 메시지 패킷이 존재한다. PA 메시지 패킷에는, MMT 패킷 테이블(MMT Package Table) 등의 테이블이 포함되어 있다. MP 테이블에는, 어셋마다의 정보가 포함되어 있다.
도 23은, 소정의 정보(컨테이너 대상 데이터)를 컨테이너에 삽입하여 보내는 경우에 있어서의 MMT 스트림의 구조예를 도시하고 있다. MMT 스트림에는, 비디오, 오디오 등의 각 어셋의 MMT 패킷이 존재한다. 이 구조예에서는, ID1로 식별되는 비디오의 어셋의 MMT 패킷과 함께, ID2로 식별되는 오디오의 어셋의 MMT 패킷이 존재한다. 이 구조예에서는, 도 22의 구조예와는 달리, 오디오의 어셋(오디오 스트림)에 소정의 정보(컨테이너 대상 데이터)는 포함되지 않는다.
또한, MMT 스트림에는, PA(Packet Access) 메시지 패킷 등의 메시지 패킷이 존재한다. PA 메시지 패킷에는, MMT 패킷 테이블(MPT: MMT Package Table) 등이 포함되어 있다. MPT에는, 어셋마다의 정보가 포함되어 있다. 또한, PA 메시지 패킷에는, 애플리케이션 인포메이션 테이블(AIT)이 포함되어 있다. 이 AIT의 관리 하에, 액세스 인포메이션(Access_information())을 갖는 애플리케이션 디스크립터(Application_descriptor)가 삽입되어 있다.
또한, 상술한 실시 형태에 있어서는, 셋톱 박스(200)와 텔레비전 수신기(500)의 사이에 오디오 앰프(300)가 개재되는 예를 나타내었다. 그러나, 셋톱 박스(200)가 텔레비전 수신기(500)에 직접 접속되는, 도 24에 도시하는 바와 같은 송수신 시스템(10A)도 고려된다.
이 송수신 시스템(10A)에 있어서는, 셋톱 박스(200)와 텔레비전 수신기(500)는 HDMI 케이블(610)을 통하여 접속되어 있다. 이 경우, 셋톱 박스(200)가 소스이고, 텔레비전 수신기(500)는 데스티네이션이다. 오디오 앰프(300)와 텔레비전 수신기(500)는, HDMI 케이블(620)을 통하여 접속되어 있다. 이 경우, 오디오 앰프(300)가 소스이고, 텔레비전 수신기(500)는 데스티네이션이다.
이 경우, 셋톱 박스(200)로부터 텔레비전 수신기(500)로, HDMI의 디지털 인터페이스에서, 비압축의 비디오 데이터와, 네트워크 액세스 정보, 미디어 파일 등의 소정의 정보(컨테이너 대상 데이터)가 삽입된 오디오 스트림이 송신된다. 또한, 텔레비전 수신기(500)로부터 오디오 앰프(300)로 HDMI의 오디오 리턴 채널을 이용하여, 오디오 스트림 그 자체, 혹은 디코드 후의 오디오 데이터가 송신된다.
또한, 상술한 실시 형태에 있어서는, 셋톱 박스(200) 및 텔레비전 수신기(500)를 갖는 송수신 시스템(10)을 나타내었다. 그러나, 텔레비전 수신기(500) 대신에 모니터 장치, 혹은 프로젝터 등이 배치되는 구성도 고려된다. 또한, 셋톱 박스(200) 대신에, 수신 기능을 갖는 레코더, 퍼스널 컴퓨터 등이 배치되는 구성도 고려된다.
또한, 상술한 실시 형태에 있어서는, 수신측의 각 기기가 HDMI의 디지털 인터페이스에 의해 유선으로 접속되어 있다. 그러나, 각 기기가, HDMI와 마찬가지의 디지털 인터페이스에 의해 유선 접속되는 경우, 나아가 무선에 의해 접속되는 경우에도, 본 발명을 마찬가지로 적용할 수 있는 것은 물론이다.
또한, 본 기술은, 이하와 같은 구성도 취할 수 있다.
(1) 오디오 압축 데이터 스트림에 소정의 정보를 삽입하는 정보 삽입부와,
상기 소정의 정보가 삽입된 오디오 압축 데이터 스트림을 송신하는 스트림 송신부를 구비하고,
상기 정보 삽입부는,
상기 오디오 압축 데이터 스트림의 소정수의 오디오 프레임에 상기 소정의 정보가 분할되어 얻어진 각 분할 정보의 각각을 삽입하는 것이 가능하게 되고,
최초의 분할 정보에 상기 소정의 정보의 전체 사이즈를 나타내는 정보를 부가하는, 송신 장치.
(2) 상기 정보 삽입부는,
상기 오디오 프레임의 유저 데이터 영역에 상기 분할 정보를 삽입하는, 상기 (1)에 기재된 송신 장치.
(3) 상기 정보 삽입부는,
각 분할 정보에, 최초의 분할 정보인지 여부를 나타내는 정보 및 분할 위치를 나타내는 정보를 더 부가하는, 상기 (1) 또는 (2)에 기재된 송신 장치.
(4) 상기 소정의 정보는 네트워크 액세스 정보, 커맨드 정보 또는 미디어 파일인, 상기 (1) 내지 (3) 중 어느 것에 기재된 송신 장치.
(5) 상기 스트림 송신부는,
상기 소정의 정보가 삽입된 오디오 압축 데이터 스트림을 포함하는 소정 포맷의 컨테이너를 송신하는, 상기 (1) 내지 (4) 중 어느 것에 기재된 송신 장치.
(6) 상기 스트림 송신부는,
상기 소정의 정보가 삽입된 오디오 압축 데이터 스트림을, 디지털 인터페이스를 통하여 외부 기기에 송신하는, 상기 (1) 내지 (4) 중 어느 것에 기재된 송신 장치.
(7) 오디오 압축 데이터 스트림을 포함하는 소정 포맷의 컨테이너를 수신하는 수신부를 더 구비하고,
상기 컨테이너의 레이어에 소정의 정보가 삽입되어 있고,
상기 정보 삽입부는,
상기 컨테이너에 포함되어 있는 오디오 압축 데이터 스트림에 상기 컨테이너의 레이어에 삽입되어 있는 소정의 정보를 삽입하는, 상기 (6)에 기재된 송신 장치.
(8) 오디오 압축 데이터 스트림에 소정의 정보를 삽입하는 정보 삽입 스텝과,
스트림 송신부에 의해, 상기 소정의 정보가 삽입된 오디오 압축 데이터 스트림을 송신하는 스트림 송신 스텝을 구비하고,
상기 정보 삽입 스텝에서는,
상기 오디오 압축 데이터 스트림의 소정수의 오디오 프레임에 상기 소정의 정보가 분할되어 얻어진 각 분할 정보의 각각을 삽입하는 것이 가능하게 되고,
최초의 분할 정보에 상기 소정의 정보의 전체 사이즈를 나타내는 정보를 부가하는, 송신 방법.
(9) 소정의 정보가 삽입된 오디오 압축 데이터 스트림을 외부 기기로부터 디지털 인터페이스를 통하여 수신하는 스트림 수신부를 구비하고,
상기 오디오 압축 데이터 스트림의 소정수의 오디오 프레임에, 상기 소정의 정보가 분할되어 얻어진 분할 정보의 각각이 삽입되어 있고,
최초의 분할 정보에 상기 소정의 정보의 전체 사이즈를 나타내는 정보가 부가되어 있고,
상기 오디오 압축 데이터 스트림에 디코드 처리를 실시하여 오디오 데이터를 얻음과 함께, 상기 소정의 정보의 전체 사이즈를 나타내는 정보에 기초하여 상기 소정수의 오디오 프레임으로부터 상기 소정의 정보를 구성하는 각 분할 정보를 얻는 디코드 처리부와,
상기 디코드 처리부에서 얻어진 상기 소정의 정보를 이용한 정보 처리를 행하는 정보 처리부를 더 구비하는, 수신 장치.
(10) 상기 소정의 정보는 네트워크 액세스 정보, 커맨드 정보 또는 미디어 파일인, 상기 (9)에 기재된 수신 장치.
(11) 스트림 수신부에 의해, 소정의 정보가 삽입된 오디오 압축 데이터 스트림을 외부 기기로부터 디지털 인터페이스를 통하여 수신하는 스트림 수신 스텝을 갖고,
상기 오디오 압축 데이터 스트림의 소정수의 오디오 프레임에, 상기 소정의 정보가 분할되어 얻어진 분할 정보의 각각이 삽입되어 있고,
최초의 분할 정보에 상기 소정의 정보의 전체 사이즈를 나타내는 정보가 부가되어 있고,
상기 오디오 압축 데이터 스트림에 디코드 처리를 실시하여 오디오 데이터를 얻음과 함께, 상기 소정의 정보의 전체 사이즈를 나타내는 정보에 기초하여 상기 소정수의 오디오 프레임으로부터 상기 소정의 정보를 구성하는 각 분할 정보를 얻는 디코드 처리 스텝과,
상기 디코드 처리 스텝에서 얻어진 상기 소정의 정보를 이용한 정보 처리를 행하는 정보 처리 스텝을 더 갖는, 수신 방법.
(12) 오디오 압축 데이터 스트림을 포함하는 소정 포맷의 컨테이너를 수신하는 수신부와,
상기 오디오 압축 데이터 스트림에 소정의 정보를 삽입하는 정보 삽입부와,
상기 소정의 정보가 삽입된 오디오 압축 데이터 스트림을, 디지털 인터페이스를 통하여 외부 기기에 송신하는 스트림 송신부를 구비하는, 수신 장치.
(13) 상기 정보 삽입부는,
상기 오디오 압축 데이터 스트림의 소정수의 오디오 프레임에 상기 소정의 정보가 분할되어 얻어진 각 분할 정보의 각각을 삽입하는 것이 가능하게 되는, 상기 (12)에 기재된 수신 장치.
(14) 상기 정보 삽입부는,
상기 오디오 프레임의 유저 데이터 영역에 상기 분할 정보를 삽입하는, 상기 (13)에 기재된 수신 장치.
(15) 상기 정보 삽입부는,
최초의 분할 정보에 상기 소정의 정보의 전체 사이즈를 나타내는 정보를 부가하는, 상기 (13) 또는 (14)에 기재된 수신 장치.
(16) 상기 정보 삽입부는,
각 분할 정보에, 최초의 분할 정보인지 여부를 나타내는 정보 및 분할 위치를 나타내는 정보를 더 부가하는, 상기 (15)에 기재된 수신 장치.
(17) 상기 소정의 정보는 네트워크 액세스 정보, 커맨드 정보 또는 미디어 파일인, 상기 (12) 내지 (16) 중 어느 것에 기재된 수신 장치.
(18) 상기 수신된 컨테이너의 레이어에 상기 소정의 정보가 삽입되어 있고,
상기 정보 삽입부는,
상기 컨테이너의 레이어에 삽입되어 있는 상기 소정의 정보를 추출하여 상기 오디오 압축 데이터 스트림에 삽입하는, 상기 (12) 내지 (17) 중 어느 것에 기재된 수신 장치.
(19) 수신부에 의해, 오디오 압축 데이터 스트림을 포함하는 소정 포맷의 컨테이너를 수신하는 수신 스텝과,
상기 오디오 압축 데이터 스트림에 소정의 정보를 삽입하는 정보 삽입 스텝과,
상기 소정의 정보가 삽입된 오디오 압축 데이터 스트림을, 디지털 인터페이스를 통하여 외부 기기에 송신하는 스트림 송신 스텝을 갖는, 수신 방법.
본 기술의 주된 특징은, 오디오 스트림의 복수의 오디오 프레임에, 소정의 정보(컨테이너 대상 데이터)를 분할 삽입할 때, 최초의 분할 정보에 소정의 정보의 전체 사이즈를 나타내는 정보를 부가함으로써, 수신측에 있어서 최초의 분할 정보가 취득되는 시점에서 당해 소정의 정보의 전체 사이즈를 나타내는 정보에 기초하여 기억 매체에 당해 소정의 정보를 축적할 수 있을 만큼의 스페이스를 확보 가능하게 하여, 소정의 정보의 취득 처리를 용이하면서도 적절하게 행할 수 있도록 한 것이다(도 6, 도 9 참조).
10, 10A: 송수신 시스템
21: 유효 화소 구간
22: 수평 귀선 기간
23: 수직 귀선 기간
24: 비디오 데이터 구간
25: 데이터 아일랜드 구간
26: 컨트롤 구간
31: HDMI 트랜스미터
32: HDMI 리시버
33: DDC
34: CEC 라인
35: HPD 라인
36: 전원 라인
37: 리저브 라인
100: 방송 송출 장치
110, 110A: 스트림 생성부
111: 제어부
111a: CPU
112: 비디오 인코더
113, 113A: 오디오 인코더
113a: 오디오 부호화 블록부
113b: 오디오 프레이밍부
114, 114A: 멀티플렉서
200, 200A: 셋톱 박스(STB)
201: CPU
202: 플래시 ROM
203: DRAM
204: 내부 버스
205: 리모컨 수신부
206: 리모컨 송신기
211: 안테나 단자
212: 디지털 튜너
213, 213A: 디멀티플렉서
214: 비디오 디코더
215: 오디오 프레이밍부
216: HDMI 송신부
217: HDMI 단자
218: 데이터 삽입부
300: 오디오 앰프(AMP)
301: CPU
302: 플래시 ROM
303: DRAM
304: 내부 버스
305: 리모컨 수신부
306: 리모컨 송신기
311: HDMI 단자
312: HDMI 수신부
313: 오디오 디코더
314: 음성 처리 회로
315: 음성 증폭 회로
316: 음성 출력 단자
317: HDMI 송신부
318: HDMI 단자
400: 스피커 시스템(SP)
500: 텔레비전 수신기(TV)
501: CPU
502: 플래시 ROM
503: DRAM
504: 내부 버스
505: 리모컨 수신부
506: 리모컨 송신기
507: 통신 인터페이스
511: 안테나 단자
512: 디지털 튜너
513: 디멀티플렉서
514: 비디오 디코더
515: HDMI 단자
516: HDMI 수신부
517: 영상 처리 회로
518: 패널 구동 회로
519: 표시 패널
520: 오디오 디코더
521: 음성 처리 회로
522: 음성 증폭 회로
523: 스피커
610, 620: HDMI 케이블

Claims (19)

  1. 오디오 부호화 데이터를 포함하는 MPEG-H 3D Audio의 전송 데이터에 있어서의 오디오 프레임이 연속된 오디오 스트림의 소정 수의 오디오 프레임에 소정의 정보를 해당 소정의 정보를 유니버설 메타데이터로서 갖는 익스텐션 엘리먼트를 설치함으로써 삽입하는 정보 삽입부와,
    상기 소정의 정보가 소정 수의 오디오 프레임에 삽입된 오디오 스트림을 송신하는 스트림 송신부를 구비하고,
    상기 정보 삽입부는,
    상기 소정 수의 오디오 프레임에 상기 소정의 정보가 분할되어 얻어진 각 분할 정보의 각각을 삽입하고, 최초의 분할 정보에 상기 소정의 정보의 전체 사이즈를 나타내는 정보를 부가하는, 송신 장치.
  2. 제1항에 있어서, 상기 정보 삽입부는,
    각 분할 정보에, 최초의 분할 정보인지 여부를 나타내는 정보 및 분할 위치를 나타내는 정보를 더 부가하는, 송신 장치.
  3. 제1항에 있어서, 상기 소정의 정보는 네트워크 액세스 정보, 커맨드 정보 또는 미디어 파일인, 송신 장치.
  4. 제1항에 있어서, 상기 스트림 송신부는,
    상기 소정의 정보가 소정 수의 오디오 프레임에 삽입된 오디오 스트림을 포함하는 소정 포맷의 컨테이너를 송신하는, 송신 장치.
  5. 제1항에 있어서, 상기 스트림 송신부는,
    상기 소정의 정보가 소정 수의 오디오 프레임에 삽입된 오디오 스트림을, 디지털 인터페이스를 통하여 외부 기기에 송신하는, 송신 장치.
  6. 제5항에 있어서, 오디오 부호화 데이터를 포함하는 MPEG-H 3D Audio의 전송 데이터에 있어서의 오디오 프레임이 연속된 오디오 스트림을 포함하는 소정 포맷의 컨테이너를 수신하는 수신부를 더 구비하고,
    상기 컨테이너의 레이어에 상기 소정의 정보가 삽입되어 있고,
    상기 정보 삽입부는,
    상기 컨테이너에 포함되어 있는 상기 오디오 스트림의 소정 수의 오디오 프레임에 상기 컨테이너의 레이어에 삽입되어 있는 상기 소정의 정보를 해당 소정의 정보를 유니버설 메타데이터로서 갖는 익스텐션 엘리먼트를 설치함으로써 삽입하는, 송신 장치.
  7. 오디오 부호화 데이터를 포함하는 MPEG-H 3D Audio의 전송 데이터에 있어서의 오디오 프레임이 연속된 오디오 스트림의 소정 수의 오디오 프레임에 소정의 정보를 해당 소정의 정보를 유니버설 메타데이터로서 갖는 익스텐션 엘리먼트를 설치함으로써 삽입하는 정보 삽입 스텝과,
    스트림 송신부에 의해, 상기 소정의 정보가 소정 수의 오디오 프레임에 삽입된 오디오 스트림을 송신하는 스트림 송신 스텝을 구비하고,
    상기 정보 삽입 스텝에서는,
    상기 소정 수의 오디오 프레임에 상기 소정의 정보가 분할되어 얻어진 각 분할 정보의 각각을 삽입하고, 최초의 분할 정보에 상기 소정의 정보의 전체 사이즈를 나타내는 정보를 부가하는, 송신 방법.
  8. 오디오 부호화 데이터를 포함하는 MPEG-H 3D Audio의 전송 데이터에 있어서의 오디오 프레임이 연속되고, 소정 수의 오디오 프레임에 소정의 정보가 해당 소정의 정보를 유니버설 메타데이터로서 갖는 익스텐션 엘리먼트를 설치함으로써 삽입된 오디오 스트림을 외부 기기로부터 디지털 인터페이스를 통하여 수신하는 스트림 수신부를 구비하고,
    상기 오디오 스트림의 소정 수의 오디오 프레임에 상기 소정의 정보가 분할되어 얻어진 각 분할 정보의 각각이 삽입되고, 최초의 분할 정보에 상기 소정의 정보의 전체 사이즈를 나타내는 정보가 부가되어 있고,
    상기 오디오 스트림에 디코드 처리를 실시하여 오디오 데이터를 얻음과 함께, 상기 소정의 정보의 전체 사이즈를 나타내는 정보에 기초하여 상기 소정 수의 오디오 프레임으로부터 상기 소정의 정보를 구성하는 각 분할 정보를 얻는 디코드 처리부와,
    상기 디코드 처리부에서 얻어진 상기 소정의 정보를 이용한 정보 처리를 행하는 정보 처리부를 더 구비하는, 수신 장치.
  9. 제8항에 있어서, 상기 소정의 정보는 네트워크 액세스 정보, 커맨드 정보 또는 미디어 파일인, 수신 장치.
  10. 스트림 수신부에 의해, 오디오 부호화 데이터를 포함하는 MPEG-H 3D Audio의 전송 데이터에 있어서의 오디오 프레임이 연속되고, 소정 수의 오디오 프레임에 소정의 정보가 해당 소정의 정보를 유니버설 메타데이터로서 갖는 익스텐션 엘리먼트를 설치함으로써 삽입된 오디오 스트림을 외부 기기로부터 디지털 인터페이스를 통하여 수신하는 스트림 수신 스텝을 갖고,
    상기 오디오 스트림의 소정 수의 오디오 프레임에 상기 소정의 정보가 분할되어 얻어진 각 분할 정보의 각각이 삽입되고, 최초의 분할 정보에 상기 소정의 정보의 전체 사이즈를 나타내는 정보가 부가되어 있고,
    상기 오디오 스트림에 디코드 처리를 실시하여 오디오 데이터를 얻음과 함께, 상기 소정의 정보의 전체 사이즈를 나타내는 정보에 기초하여 상기 소정 수의 오디오 프레임으로부터 상기 소정의 정보를 구성하는 각 분할 정보를 얻는 디코드 처리 스텝과,
    상기 디코드 처리 스텝에서 얻어진 상기 소정의 정보를 이용한 정보 처리를 행하는 정보 처리 스텝을 더 갖는, 수신 방법.
  11. 오디오 부호화 데이터를 포함하는 MPEG-H 3D Audio의 전송 데이터에 있어서의 오디오 프레임이 연속된 오디오 스트림을 포함하는 소정 포맷의 컨테이너를 수신하는 수신부와,
    상기 오디오 스트림의 소정 수의 오디오 프레임에 소정의 정보를 해당 소정의 정보를 유니버설 메타데이터로서 갖는 익스텐션 엘리먼트를 설치함으로써 삽입하는 정보 삽입부와,
    상기 소정의 정보가 삽입된 오디오 스트림을, 디지털 인터페이스를 통하여 외부 기기에 송신하는 스트림 송신부를 구비하고,
    상기 소정 수의 오디오 프레임에 상기 소정의 정보가 분할되어 얻어진 각 분할 정보의 각각을 삽입하고, 최초의 분할 정보에 상기 소정의 정보의 전체 사이즈를 나타내는 정보를 부가하는, 수신 장치.
  12. 제11항에 있어서, 상기 정보 삽입부는,
    각 분할 정보에, 최초의 분할 정보인지 여부를 나타내는 정보 및 분할 위치를 나타내는 정보를 더 부가하는, 수신 장치.
  13. 제11항에 있어서, 상기 소정의 정보는 네트워크 액세스 정보, 커맨드 정보 또는 미디어 파일인, 수신 장치.
  14. 제11항에 있어서, 상기 수신된 컨테이너의 레이어에 상기 소정의 정보가 삽입되어 있고,
    상기 정보 삽입부는,
    상기 오디오 스트림의 소정 수의 오디오 프레임에 상기 컨테이너의 레이어에 삽입되어 있는 상기 소정의 정보를 해당 소정의 정보를 유니버설 메타데이터로서 갖는 익스텐션 엘리먼트를 설치함으로써 삽입하는, 수신 장치.
  15. 제11항에 있어서, 상기 정보 삽입부는,
    상기 오디오 스트림의 소정 수의 오디오 프레임에 상기 수신 장치에서 발생된 정보에 기초하여 생성된 상기 소정의 정보를 해당 소정의 정보를 유니버설 메타데이터로서 갖는 익스텐션 엘리먼트를 설치함으로써 삽입하는, 수신 장치.
  16. 수신부에 의해, 오디오 부호화 데이터를 포함하는 MPEG-H 3D Audio의 전송 데이터에 있어서의 오디오 프레임이 연속된 오디오 스트림을 포함하는 소정 포맷의 컨테이너를 수신하는 수신 스텝과,
    상기 오디오 스트림의 소정 수의 오디오 프레임에 소정의 정보를 해당 소정의 정보를 유니버설 메타데이터로서 갖는 익스텐션 엘리먼트를 설치함으로써 삽입하는 정보 삽입 스텝과,
    상기 소정의 정보가 삽입된 오디오 스트림을, 디지털 인터페이스를 통하여 외부 기기에 송신하는 스트림 송신 스텝을 갖고,
    상기 정보 삽입 스텝에서는,
    상기 소정 수의 오디오 프레임에 상기 소정의 정보가 분할되어 얻어진 각 분할 정보의 각각을 삽입하고, 최초의 분할 정보에 상기 소정의 정보의 전체 사이즈를 나타내는 정보를 부가하는, 수신 방법.
  17. 삭제
  18. 삭제
  19. 삭제
KR1020177032212A 2015-05-28 2016-05-10 송신 장치, 송신 방법, 수신 장치 및 수신 방법 KR102485250B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2015109115 2015-05-28
JPJP-P-2015-109115 2015-05-28
PCT/JP2016/063928 WO2016190091A1 (ja) 2015-05-28 2016-05-10 送信装置、送信方法、受信装置および受信方法

Publications (2)

Publication Number Publication Date
KR20180013875A KR20180013875A (ko) 2018-02-07
KR102485250B1 true KR102485250B1 (ko) 2023-01-06

Family

ID=57394135

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177032212A KR102485250B1 (ko) 2015-05-28 2016-05-10 송신 장치, 송신 방법, 수신 장치 및 수신 방법

Country Status (6)

Country Link
US (1) US10862941B2 (ko)
EP (1) EP3306942B1 (ko)
JP (1) JP6891806B2 (ko)
KR (1) KR102485250B1 (ko)
CN (1) CN107615768A (ko)
WO (1) WO2016190091A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115691519A (zh) * 2018-02-22 2023-02-03 杜比国际公司 用于处理嵌入在mpeg-h 3d音频流中的辅媒体流的方法及设备
CN112073789B (zh) * 2019-06-10 2023-04-14 海信视像科技股份有限公司 一种声音处理法及显示设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012010311A (ja) * 2010-05-26 2012-01-12 Sony Corp 送信装置、送信方法、受信装置、受信方法および送受信システム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008276876A (ja) * 2007-04-27 2008-11-13 Toshiba Corp 音声出力装置及び音声出力方法
US8135333B2 (en) * 2008-12-23 2012-03-13 Motorola Solutions, Inc. Distributing a broadband resource locator over a narrowband audio stream
TWI574565B (zh) * 2011-03-31 2017-03-11 Sony Corp A transmitting apparatus, a transmitting method, a receiving apparatus, a receiving method, a computer-readable medium, and a broadcasting system
WO2013129158A1 (ja) * 2012-03-01 2013-09-06 ソニー株式会社 送信装置、送信方法および受信装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012010311A (ja) * 2010-05-26 2012-01-12 Sony Corp 送信装置、送信方法、受信装置、受信方法および送受信システム

Also Published As

Publication number Publication date
JP6891806B2 (ja) 2021-06-18
US10862941B2 (en) 2020-12-08
EP3306942A4 (en) 2019-02-27
EP3306942B1 (en) 2020-11-25
US20180103082A1 (en) 2018-04-12
CN107615768A (zh) 2018-01-19
JPWO2016190091A1 (ja) 2018-03-15
EP3306942A1 (en) 2018-04-11
KR20180013875A (ko) 2018-02-07
WO2016190091A1 (ja) 2016-12-01

Similar Documents

Publication Publication Date Title
KR102396133B1 (ko) 송신 장치, 송신 방법, 수신 장치 및 수신 방법
KR102498740B1 (ko) 송신 장치, 송신 방법, 수신 장치 및 수신 방법
KR102485250B1 (ko) 송신 장치, 송신 방법, 수신 장치 및 수신 방법
JP6809450B2 (ja) 送信装置、送信方法、受信装置および受信方法
JP2023052611A (ja) 送信装置、送信方法、メディア処理装置、メディア処理方法および受信装置
US10812838B2 (en) Transmission device, transmission method, reception device, and reception method
EP3306941B1 (en) Transmission device, transmission method, media processing device and media processing method

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant