KR101803082B1 - Container Generation Method for Ultra High Definition Scalable Video Streaming Services - Google Patents

Container Generation Method for Ultra High Definition Scalable Video Streaming Services Download PDF

Info

Publication number
KR101803082B1
KR101803082B1 KR1020160103471A KR20160103471A KR101803082B1 KR 101803082 B1 KR101803082 B1 KR 101803082B1 KR 1020160103471 A KR1020160103471 A KR 1020160103471A KR 20160103471 A KR20160103471 A KR 20160103471A KR 101803082 B1 KR101803082 B1 KR 101803082B1
Authority
KR
South Korea
Prior art keywords
layer
container
video
encoding information
intra frame
Prior art date
Application number
KR1020160103471A
Other languages
Korean (ko)
Inventor
백종호
손예진
조민주
Original Assignee
서울여자대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울여자대학교 산학협력단 filed Critical 서울여자대학교 산학협력단
Priority to KR1020160103471A priority Critical patent/KR101803082B1/en
Application granted granted Critical
Publication of KR101803082B1 publication Critical patent/KR101803082B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23605Creation or processing of packetized elementary streams [PES]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0125Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level one of the standards being a high definition standard
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/015High-definition television systems
    • H04N7/0152High-definition television systems using spatial or temporal subsampling

Abstract

A method for generating a container for an ultra high definition scalable video streaming service is provided. A video streaming method according to an embodiment of the present invention includes the steps of: generating a scalable encoded video stream; separating the stream according to a layer; constructing the containers by storing encoding information for each intra frame according to the layer; and transmitting the constructed containers. Accordingly, the streaming service can be provided for an ultra high definition (4,8K) video which is scalably encoded.

Description

초고화질 스케일러블 비디오 스트리밍 서비스를 위한 컨테이너 생성 방법{Container Generation Method for Ultra High Definition Scalable Video Streaming Services}[0001] Container Generation Method for Ultra High Definition Scalable Video Streaming [

본 발명은 비디오 스트리밍 서비스 기술에 관한 것으로, 더욱 상세하게는 초고화질 스케일러블 비디오 스트리밍 서비스를 위한 컨테이너 생성 방법에 관한 것이다.The present invention relates to a video streaming service technology, and more particularly, to a container creation method for an ultra-high-quality scalable video streaming service.

디스플레이의 발전으로 Full-HD급 이상의 해상도를 지원하는 단말기가 다양하게 생산되고 있다. 따라서 많은 소비자들은 이런 다양한 단말기(고해상도의 콘텐츠를 모바일 단말기, 노트북, 데스크탑, TV 등)에서 자신이 원하는 시간에 고화질의 비디오를 시청하기 원한다. 따라서 다양한 디스플레이에서 서비스 가능한 초고화질 비디오 스트리밍 서비스에 대한 요구가 높다. With the development of displays, various handsets capable of supporting full-HD or higher resolution are being produced. Many consumers, therefore, want to watch high-definition video at the time they want on a variety of terminals (high-definition content on mobile handsets, laptops, desktops, TVs, etc.). Therefore, there is a high demand for an ultra-high-definition video streaming service capable of providing service in various displays.

초고화질 영상은 용량이 매우 크기 때문에 인코딩하기 위한 시간과 자원이 많이 요구된다. 따라서 동일한 영상을 여러 해상도에 맞도록 각각 인코딩하는 방법은 매우 비효율적이다. 스케일러블 인코딩(SVC, SHVC 등)은 초고화질 영상을 계층적으로 인코딩하여 한 번의 인코딩으로 다양한 해상도를 가진 단말기를 만족시킨다.Ultra-high-quality images are so large that they require a lot of time and resources to encode. Therefore, it is very inefficient to encode the same image to fit different resolutions. Scalable encoding (SVC, SHVC, etc.) hierarchically encodes super-high-resolution images to satisfy terminals with various resolutions in a single encoding.

비디오 스트리밍 서비스를 위해서는 인코딩된 영상을 전송하기 적합한 포맷으로 캡슐화를 해야 한다. 하지만 스케일러블 인코딩된 초고화질(4,8K) 비디오를 스트리밍 하기 위한 캡슐레이션 포맷에 대한 정의와 방법이 없다.For video streaming services, encapsulation must be done in a format suitable for transmitting the encoded video. However, there is no definition and method of encapsulation format for streaming scalable encoded ultra high definition (4,8K) video.

본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은, 스케일러블 인코딩된 초고화질(4,8K) 비디오를 스트리밍 할 수 있는 포맷의 컨테이너 생성 방법을 제공함에 있다.SUMMARY OF THE INVENTION It is an object of the present invention to provide a container generation method of a format capable of streaming scalable encoded super high definition (4, 8K) video.

상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른, 비디오 스트리밍 방법은, 스케일러블 인코딩된 비디오 스트림을 생성하는 단계; 스트림을 계층 별로 분리하고, 계층 별로 인트라 프레임 마다 인코딩 정보를 수록하여 컨테이너들 구성하는 단계; 구성된 컨테이너들을 전송하는 단계;를 포함한다.According to an aspect of the present invention, there is provided a video streaming method including: generating a scalable encoded video stream; Separating streams into layers and constructing containers by storing encoding information for each intra frame in each layer; And transmitting the configured containers.

그리고, 제1 계층의 컨테이너에 수록되는 인코딩 정보는, 비디오에 대한 제1 파라미터 세트, 제1 계층에 대한 제2 파라미터 세트, 제2 계층에 대한 제2 파라미터 세트 및 제1 계층에 대한 제3 파라미터 세트를 포함하고, 제2 계층의 컨테이너에 수록되는 인코딩 정보는, 제2 계층에 대한 제3 파라미터 세트를 포함할 수 있다.The encoding information contained in the container of the first layer includes a first parameter set for video, a second parameter set for the first layer, a second parameter set for the second layer, and a third parameter for the first layer And the encoding information contained in the container of the second layer may include a third set of parameters for the second layer.

또한, 제1 계층의 컨테이너에 수록되는 인코딩 정보는, 비디오에 대한 제1 파라미터 세트, 제1 계층에 대한 제2 파라미터 세트, 제2 계층에 대한 제2 파라미터 세트, 제3 계층에 대한 제2 파라미터 세트 및 제1 계층에 대한 제3 파라미터 세트를 포함하고, 제2 계층의 컨테이너에 수록되는 인코딩 정보는, 제2 계층에 대한 제3 파라미터 세트를 포함하며, 제3 계층의 컨테이너에 수록되는 인코딩 정보는, 제3 계층에 대한 제3 파라미터 세트를 포함할 수 있다.The encoding information contained in the container of the first layer may include a first parameter set for the video, a second parameter set for the first layer, a second parameter set for the second layer, a second parameter for the third layer, And a third parameter set for the first layer, the encoding information included in the container of the second layer includes a third parameter set for the second layer, and encoding information May include a third set of parameters for the third layer.

그리고, 제1 파라미터 세트는, VPS(Video Parameter Set)이고, 제2 파라미터 세트는, SPS(Sequence Parameter Set)이며, 제3 파라미터 세트는, PPS(Picture Parameter Set)일 수 있다.The first parameter set may be a VPS (Video Parameter Set), the second parameter set may be an SPS (Sequence Parameter Set), and the third parameter set may be a PPS (Picture Parameter Set).

한편, 본 발명의 다른 실시예에 따른, 방송 송출 시스템은, 방송 콘텐츠를 생성하는 콘텐츠 제공 서버; 방송 콘텐츠로부터 생성한 스케일러블 인코딩된 비디오 스트림을 계층 별로 분리하고, 계층 별로 인트라 프레임 마다 인코딩 정보를 수록하여 컨테이너들 구성하며, 구성된 컨테이너들을 전송하는 방송 서버;를 포함한다.According to another aspect of the present invention, there is provided a broadcast transmission system including: a content providing server for generating broadcast content; And a broadcasting server which separates the scalable encoded video streams generated from the broadcasting contents into layers and constructs containers by storing encoding information for each intra frame in each layer and transmits the configured containers.

한편, 본 발명의 다른 실시예에 따른, 비디오 수신 방법은, 스케일러블 인코딩된 비디오를 수신하는 단계; 수신된 비디오를 재생하는 단계;를 포함하고, 비디오는, 스케일러블 인코딩된 비디오 스트림을 계층 별로 분리하고, 계층 별로 인트라 프레임 마다 인코딩 정보를 수록하여 구성한 컨테이너들을 포함한다.Meanwhile, according to another embodiment of the present invention, a video receiving method includes: receiving a scalable encoded video; And reproducing the received video, wherein the video includes containers configured by separating the scalable encoded video stream into layers and storing encoding information for each intra frame in each layer.

그리고, 제1 계층의 컨테이너에 수록되는 인코딩 정보는, 비디오에 대한 제1 파라미터 세트, 제1 계층에 대한 제2 파라미터 세트, 제2 계층에 대한 제2 파라미터 세트 및 제1 계층에 대한 제3 파라미터 세트를 포함하고, 제2 계층의 컨테이너에 수록되는 인코딩 정보는, 제2 계층에 대한 제3 파라미터 세트를 포함할 수 있다.The encoding information contained in the container of the first layer includes a first parameter set for video, a second parameter set for the first layer, a second parameter set for the second layer, and a third parameter for the first layer And the encoding information contained in the container of the second layer may include a third set of parameters for the second layer.

또한, 제1 계층의 컨테이너에 수록되는 인코딩 정보는, 비디오에 대한 제1 파라미터 세트, 제1 계층에 대한 제2 파라미터 세트, 제2 계층에 대한 제2 파라미터 세트, 제3 계층에 대한 제2 파라미터 세트 및 제1 계층에 대한 제3 파라미터 세트 를 포함하고, 제2 계층의 컨테이너에 수록되는 인코딩 정보는, 제2 계층에 대한 제3 파라미터 세트를 포함하며, 제3 계층의 컨테이너에 수록되는 인코딩 정보는, 제3 계층에 대한 제3 파라미터 세트를 포함할 수 있다.The encoding information contained in the container of the first layer may include a first parameter set for the video, a second parameter set for the first layer, a second parameter set for the second layer, a second parameter for the third layer, And a third parameter set for the first layer, the encoding information included in the container of the second layer includes a third parameter set for the second layer, and encoding information May include a third set of parameters for the third layer.

그리고, 제1 파라미터 세트는, VPS(Video Parameter Set)이고, 제2 파라미터 세트는, SPS(Sequence Parameter Set)이며, 제3 파라미터 세트는, PPS(Picture Parameter Set)일 수 있다.The first parameter set may be a VPS (Video Parameter Set), the second parameter set may be an SPS (Sequence Parameter Set), and the third parameter set may be a PPS (Picture Parameter Set).

한편, 본 발명의 다른 실시예에 따른, 스케일러블 인코딩된 비디오를 수신하여 재생하는 비디오 수신 단말에 있어서, 비디오는, 스케일러블 인코딩된 비디오 스트림을 계층 별로 분리하고, 계층 별로 인트라 프레임 마다 인코딩 정보를 수록하여 구성한 컨테이너들을 포함한다.Meanwhile, in a video receiving terminal for receiving and reproducing scalably encoded video according to another exemplary embodiment of the present invention, the video may include scalable encoded video streams separated by layers, encoding information for each intra frame, Containers are also included.

이상 설명한 바와 같이, 본 발명의 실시예들에 따르면, 스케일러블 인코딩된 초고화질(4,8K) 비디오에 대해서도, 스트리밍 서비스를 제공할 수 있게 되어, 사용자의 만족도를 높일 수 있게 된다.As described above, according to the embodiments of the present invention, it is possible to provide a streaming service even for a super-high-definition (4,8K) video which is scalably encoded, thereby increasing the satisfaction of the user.

도 1은 비디오 스트리밍 서비스 절차의 설명에 제공되는 흐름도,
도 2는 NAL 스트림의 구조를 나타낸 도면,
도 3은 3계층 스케일러블 영상 크기 비교한 도면이고,
도 4는 도 3과 같이 3계층으로 스케일러블 인코딩된 NAL 스트림을 나타낸 도면,
도 5는 MP4의 init 파일 구조,
도 7은 제1 계층 컨테이너의 설명에 제공되는 도면,
도 8은 제2 계층 컨테이너의 설명에 제공되는 도면,
도 9는 제3 계층 컨테이너의 설명에 제공되는 도면,
도 10은 본 발명의 실시예가 적용 가능한 방송 시스템의 구성도이다.
1 is a flow chart provided in the description of a video streaming service procedure,
2 shows a structure of a NAL stream,
FIG. 3 is a diagram for comparing three-layer scalable image sizes,
FIG. 4 is a diagram illustrating a scalable encoded NAL stream in three layers as shown in FIG. 3,
Figure 5 shows the init file structure of MP4,
Figure 7 is a diagram provided in the description of a first layer container,
8 is a diagram provided in the description of a second layer container,
9 is a diagram provided in the description of a third layer container,
10 is a configuration diagram of a broadcasting system to which an embodiment of the present invention is applicable.

이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다.Hereinafter, the present invention will be described in detail with reference to the drawings.

1. 비디오 스트리밍 서비스1. Video streaming service

도 1은 비디오 스트리밍 서비스 절차의 설명에 제공되는 흐름도이다. 도 1에 도시된 바와 같이, 먼저, 카메라를 통해 비디오 데이터를 획득하고(S10), 스케일러블 인코딩을 진행한다(S20).Figure 1 is a flow chart provided in the description of a video streaming service procedure. As shown in FIG. 1, first, video data is acquired through a camera (S10), and scalable encoding is performed (S20).

인코딩 정보에 따라 인코딩된 비디오의 계층 수는 변경될 수 있다. 다음 단계를 위해 스케일러블 인코딩된 비디오는 인코딩 정보(VPS, SPS, PPS)와 각 계층으로 분리한다(S30, S40).The number of layers of video encoded according to the encoding information can be changed. For the next step, the scalable encoded video is separated into encoding information (VPS, SPS, PPS) and layers (S30, S40).

그리고 인코딩 정보들은 사용자의 임의접근이 가능하도록 필요한 위치에 포함되어 컨테이너 포맷으로 캡슐화 된다(S50).Then, the encoding information is encapsulated in a container format at a necessary position so that the user can arbitrarily access (S50).

2. 스케일러블 인코딩된 비디오 스트림2. Scalable encoded video stream

도 2는 NAL 스트림의 구조를 나타낸 도면이다. NAL(Network Abstract Layer)은 인코딩된 비디오 데이터를 네트워크로 전송하는 계층으로, 다수의 NALU(NAL unit)들의 집합으로 구성되어, 스트림 형태로 생성된다.2 is a diagram showing a structure of a NAL stream. The Network Abstract Layer (NAL) is a layer for transmitting encoded video data over a network, and is composed of a plurality of NALU (NALU) sets, and is generated in a stream format.

NALU은 2byte의 NALU 헤더와 NALU payload(RBSP: raw bytes sequence payload)로 구성된다. 도 2에 구분한 한 단위가 하나의 NALU이다. NALU은 VCL, VPS, SPS 및 PPS로 분류된다.NALU consists of a 2-byte NALU header and a NALU payload (RBSP: raw byte sequence payload). One unit separated in Fig. 2 is one NALU. NALU is classified as VCL, VPS, SPS and PPS.

VCL(Video Coding Layer)는 h.265로 압축된 데이터가 수록되는 NALU이다. VPS(Video Parameter Set)는 비디오 전체에 대한 인코딩 정보가 수록되는 NALU로, 이 정보는 스케일러블 인코딩 시에만 생성된다.The VCL (Video Coding Layer) is a NALU in which compressed data is compressed to h.265. VPS (Video Parameter Set) is a NALU in which encoding information for the entire video is recorded, and this information is generated only in scalable encoding.

SPS(Sequence Parameter Set)는 각 계층에 대한 인코딩 정보가 수록되는 NALU로, 스케일러블 인코딩 시에 생성된 계층 수 만큼 생성된다. PPS(Picture Parameter Set)는 하나의 픽처에 대한 인코딩 정보를 갖는다.An SPS (Sequence Parameter Set) is a NALU in which encoding information for each layer is stored, and is generated by the number of layers generated at the time of scalable encoding. A PPS (Picture Parameter Set) has encoding information for one picture.

도 3은 3계층 스케일러블 영상 크기 비교한 도면이고, 도 4는 도 3과 같이 3계층으로 스케일러블 인코딩된 NAL 스트림_1을 나타낸 도면이다.FIG. 3 is a diagram for comparing 3-layer scalable image sizes, and FIG. 4 is a diagram illustrating NAL stream_1 scalar-encoded in three layers as shown in FIG.

도 4에 나타난 바와 같이, VPS는 콘텐츠당 하나만 생성되고, SPS는 스케일러블된 계층 수만큼 차례로 생성된다. PPS도 SPS와 마찬가지로 계층 수만큼 생성되며, 그 위치는 각 계층의 IDR(intra 프레임) 앞에 하나씩 생성된다. 즉, 1계층 PPS는 1계층 IDR NALUs 앞에, 2계층 PPS는 2계층 IDR NALUs 앞에, 3계층 PPS는 3계층 IDR NALUs 앞에, 각각 생성된다.As shown in Fig. 4, only one VPS is generated per content, and the SPS is sequentially generated in the number of scalable layers. Like the SPS, PPS is generated as many as the number of layers, and its position is generated one by one before the IDR (intra frame) of each layer. That is, the first layer PPS is generated before the first layer IDR NALUs, the second layer PPS is generated before the second layer IDR NALUs, and the third layer PPS is generated before the third layer IDR NALUs.

3. 박스 구조3. Box structure

ISOBMFF를 기반으로 생성하는 MP4 코텍은 스트리밍 모드를 지원한다. 이를 위해서 인코딩된 비디오는 인코딩 정보와 각 계층별 실제 데이터로 분리해야 한다. MP4 codecs based on ISOBMFF support streaming mode. To do this, the encoded video must be separated into encoding information and actual data for each layer.

스트리밍을 위해서 MP4 코덱은 코덱 정보(콘텐츠 정보)와 콘텐츠를 논리적 구조로 분리하여 그에 해당하는 미디어 정보를 싣는 trak 박스를 포함하는 init 파일을 생성한다. 그 구조는 도 5와 같다. 비디오를 3계층으로 스케일러블 인코딩 하는 경우, 각 계층은 각 trak으로 분리되며 각 계층의 인코딩 정보를 가지는 SPS, PPS가 trak 박스 안에 수록된다.For streaming, the MP4 codec separates the codec information (content information) and the content into a logical structure and generates an init file including a trak box for loading the corresponding media information. Its structure is shown in Fig. When the video is scalably encoded into three layers, each layer is separated into traks, and SPS and PPS having encoding information of each layer are recorded in the trak box.

4. 스트리밍을 위한 컨테이너 생성 방법4. How to create a container for streaming

스트리밍 서비스는 사용자의 서비스 임의접근을 지원해야 한다. 이를 위해, 스트리밍 서버는 스케일러블 인코딩 비디오 데이터와 복호화(디코딩) 정보를 함께 컨테이너 포맷에 맞춰 캡슐화해야 한다. 이렇게 생성된 전송 파일을 통해 사용자는 언제든지 서비스를 사용할 수 있다.The streaming service must support the user's random access to the service. To this end, the streaming server must encapsulate the scalable encoded video data and the decode information together in a container format. Through the generated transfer file, the user can use the service at any time.

도 6은 3계층으로 스케일러블 인코딩된 비디오 스트림_2이다. 도 6에서 I'은 인트라 프레임(Intra Frame)을 의미하는데, 인트라 프레임은 키프레임으로 다른 프레임 디코딩 시에 참조가 되는 중요한 프레임이다. IDR, BLA, CRA 프레임이 이에 속한다. 각 NALU가 어떤 종류의 프레임인지는 NALU header 내에 type 필드를 통해 알 수 있다.6 is a three-layer scalably encoded video stream _2. In FIG. 6, I 'denotes an intra frame, which is an important frame which is a key frame and is a reference frame in decoding another frame. IDR, BLA, and CRA frames. The type field in the NALU header tells what kind of frame each NALU is.

NALU의 순서는, 제1 계층의 경우 인트라 프레임이 나올 때마다 VPS, SPS, PPS가 반복적으로 삽입된다. 제2 계층과 제3 계층의 경우, 인트라 프레임이 나올 때마다 해당 계층에 대한 PPS가 인트라 프레임 마다 반복된다. 즉, 제2 계층은 인트라 프레임이 나올 때마다 제2 계층에 대한 PPS가 반복적으로 삽입되고, 제3 계층도 인트라 프레임이 나올 때마다 제3 계층에 대한 PPS가 반복적으로 삽입된다. VPS는 제1 계층에만 삽입된다.In the order of NALU, VPS, SPS, and PPS are repeatedly inserted every time an intra frame occurs in the first layer. In the case of the second layer and the third layer, every time an intra frame comes out, the PPS for that layer is repeated for each intra frame. That is, the second layer repeatedly inserts the PPS for the second layer every time an intra frame comes out, and the third layer repeatedly inserts the PPS for the third layer every time an intra frame comes out. The VPS is inserted only in the first layer.

이 스트림은 제1 계층, 제2 계층 및 제3 계층으로 분리된 뒤에 각각 컨테이너 포맷에 맞게 구성되는데, 이때 각 계층들은 일정한 시간 간격(1초, 2초 등)으로 분리(segment)된다. 분리된 세그먼트들은 컨테이너 구조에 따라 캡슐화 되는데, 만약 세그먼트 내에 인트라 프레임이 포함되어 있다면 인코딩 정보를 함께 삽입하여 캡슐화한다.The streams are divided into a first layer, a second layer and a third layer, respectively, and are configured according to a container format. At this time, each layer is segmented at a constant time interval (1 second, 2 seconds, etc.). The separated segments are encapsulated according to the container structure. If the intra frame is included in the segment, encapsulation is performed by inserting encoding information together.

4.1 제1 계층의 컨테이너 생성4.1 Creating the first tier container

styp 박스는 나눠진 세그먼트들을 포함한다. 세그먼트는 styp 박스로 생성된다. mdat 박스 뒤에는 실제 비디오 데이터들이 삽입된다. 시간 간격과 인코딩 옵션에 따라 나눠진 세그먼트 내에는 인트라 프레임이 들어있을 수도 있다. 이 때, 도 7과 같이 디코딩에 필요한 정보(VPS, SPS, PPS)를 인트라 프레임의 앞에 삽입한다. 구체적으로, 1) 콘텐츠/비디오에 대한 VPS, 2) 제1 계층, 제2 계층 및 제3 계층에 대한 SPS, 3) 제1 계층에 대한 PPS가 삽입된다.The styp box contains the segments that are split. Segments are created as styp boxes. The actual video data is inserted behind the mdat box. Depending on the time interval and encoding options, the segments may contain intra frames. At this time, information (VPS, SPS, PPS) necessary for decoding is inserted in front of the intra frame as shown in FIG. Specifically, 1) VPS for content / video, 2) SPS for the first layer, the second layer and the third layer, and 3) the PPS for the first layer are inserted.

4.2 제1 계층의 컨테이너 생성4.2 Creating the first tier container

기본 내용은 제1 계층과 같다. 단 인트라 프레임 앞에 삽입하는 인코딩 정보는 VPS를 제외하고 제2 계층에 대한 PPS만 삽입한다.The basic content is the same as the first layer. However, the encoding information to be inserted in front of the intra frame only inserts the PPS for the second layer except for the VPS.

4.3 제3 계층의 컨테이너 생성4.3 Creating a third-tier container

인트라 프레임 앞에 삽입하는 인코딩 정보는 제3 계층에 대한 PPS이다. 제3 계층의 컨테이너 생성 방법은 제2 계층에 대한 설명과 동일하므로, 이에 대한 생략한 설명은 생략한다.The encoding information to be inserted in front of the intra frame is the PPS for the third layer. The third layer container generation method is the same as that of the second layer, and a detailed description thereof will be omitted.

5. 방송 시스템5. Broadcasting system

도 10은 본 발명의 실시예가 적용 가능한 방송 시스템의 구성도이다. 도 10에 도시된 바와 같이, 방송 시스템은, 콘텐츠 제공자(110), MMT 기반 서비스 생성기(120), 방송망(130), MMT 기반 서버(140) 및 MMT 기반 단말기(150)를 포함한다.10 is a configuration diagram of a broadcasting system to which an embodiment of the present invention is applicable. 10, the broadcasting system includes a content provider 110, an MMT-based service generator 120, a broadcasting network 130, an MMT-based server 140, and an MMT-based terminal 150.

콘텐츠 제공자(110)는 비디오, 오디오, 데이터 등을 공급하는 서버이고, MMT 서비스 생성기(120)는 콘텐츠 제공자(110)가 공급하는 비디오 등을 수신받아 각각 부호화된 미디어 데이터와 동기화 정보를 추가하여 캡슐화하고 MMT 패킷을 구성하는 서버이다. 콘텐츠 제공자(110)와 MMT 서비스 생성기(120)는 하나의 방송국일 수도 있으며, 물리적으로 분리된 위치에 존재하여 각 역할을 수행할 수도 있다.The MMT service generator 120 receives the video and the like supplied from the content provider 110 and adds the encoded media data and the synchronization information to each other to encapsulate And MMT packets. The content provider 110 and the MMT service generator 120 may be one broadcasting station or may be located at physically separated locations to perform respective roles.

MMT 기반 서비스 생성기(120)는 UHD 영상을 부호화한 뒤 공간적 확장성을 가지도록 기본 계층과 추가 계층으로 분리하여, 기본 계층은 방송망(130)으로 추가 계층은 MMT 기반 서버(140)로 각각 전송한다.The MMT-based service generator 120 encodes the UHD image and separates the UHD image into a base layer and an additional layer so as to have spatial scalability, and transmits the base layer to the broadcasting network 130 and the additional layer to the MMT-based server 140 .

이 경우, MMT 기반 단말기(150)는 방송망(130)을 통해 기본 계층을 수신하여 HD 영상을 디스플레이할 수 있으며, 부가적으로 네트워크망을 통해 추가 계층을 수신하여 UHD 영상을 사용자에게 제공할 수 있다.In this case, the MMT-based terminal 150 can receive the base layer through the broadcasting network 130 to display the HD image, and additionally receive the additional layer through the network to provide the UHD image to the user .

또한, MMT 기반 서비스 생성기(120)는 위 "4."에서 제시한 컨테이너 생성 방법에 의거 UHD 영상에 대한 스트리밍 서비스를 제공한다.In addition, the MMT-based service generator 120 provides the streaming service for the UHD image based on the container creation method described in "4."

6. 변형예6. Variations

한편, 본 실시예에 따른 장치와 방법의 기능을 수행하게 하는 컴퓨터 프로그램을 수록한 컴퓨터로 읽을 수 있는 기록매체에도 본 발명의 기술적 사상이 적용될 수 있음은 물론이다. 또한, 본 발명의 다양한 실시예에 따른 기술적 사상은 컴퓨터로 읽을 수 있는 기록매체에 기록된 컴퓨터로 읽을 수 있는 코드 형태로 구현될 수도 있다. 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터에 의해 읽을 수 있고 데이터를 저장할 수 있는 어떤 데이터 저장 장치이더라도 가능하다. 예를 들어, 컴퓨터로 읽을 수 있는 기록매체는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광디스크, 하드 디스크 드라이브, 등이 될 수 있음은 물론이다. 또한, 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터로 읽을 수 있는 코드 또는 프로그램은 컴퓨터간에 연결된 네트워크를 통해 전송될 수도 있다.It goes without saying that the technical idea of the present invention can also be applied to a computer-readable recording medium having a computer program for performing the functions of the apparatus and method according to the present embodiment. In addition, the technical idea according to various embodiments of the present invention may be embodied in computer-readable code form recorded on a computer-readable recording medium. The computer-readable recording medium is any data storage device that can be read by a computer and can store data. For example, the computer-readable recording medium may be a ROM, a RAM, a CD-ROM, a magnetic tape, a floppy disk, an optical disk, a hard disk drive, or the like. In addition, the computer readable code or program stored in the computer readable recording medium may be transmitted through a network connected between the computers.

또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments, but, on the contrary, It will be understood by those skilled in the art that various changes in form and detail may be made therein without departing from the spirit and scope of the present invention.

110 : 콘텐츠 제공자
120 : MMT 기반 서비스 생성기
130 : 방송망
140 : MMT 기반 서버
150 : MMT 기반 단말기
110: Content provider
120: MMT based service generator
130: Broadcast network
140: MMT based server
150: MMT based terminal

Claims (12)

스케일러블 인코딩된 비디오 스트림을 생성하는 단계;
스트림을 계층 별로 분리하는 단계;
비디오에 대한 VPS(Video Parameter Set), 제1 계층에 대한 SPS(Sequence Parameter Set), 제2 계층에 대한 SPS 및 제1 계층에 대한 PPS(Picture Parameter Set)를 포함하는 인코딩 정보를 인트라 프레임 마다 수록하여 제1 계층의 컨테이너를 구성하는 제1 구성단계;
제2 계층에 대한 PPS를 포함하는 인코딩 정보를 인트라 프레임 마다 수록하여 제2 계층의 컨테이너를 구성하는 제2 구성단계; 및
구성된 컨테이너들을 전송하는 단계;를 포함하며,
전송 단계는,
제1 계층의 컨테이너를 제1 네트워크를 통해 전송하고, 제2 계층의 컨테이너를 제2 네트워크를 통해 전송하는 것을 특징으로 하는 비디오 스트리밍 방법.
Generating a scalable encoded video stream;
Separating the streams into layers;
Encoding information including a VPS (Video Parameter Set) for a video, a SPS (Sequence Parameter Set) for a first layer, an SPS for a second layer, and a PPS (Picture Parameter Set) for a first layer is recorded for each intra frame A first configuration step of configuring a container of a first hierarchy;
A second constructing step of constructing a second layer container by storing encoding information including a PPS for the second layer for each intra frame; And
And transmitting the configured containers,
In the transmitting step,
Wherein a container of the first layer is transmitted through the first network and a container of the second layer is transmitted through the second network.
청구항 1에 있어서,
인코딩 정보는,
인트라 프레임 앞에 수록되는 것을 특징으로 하는 비디오 스트리밍 방법.
The method according to claim 1,
The encoding information,
Wherein the video stream is preceded by an intra frame.
삭제delete 청구항 1에 있어서,
제1 구성단계는,
제3 계층에 대한 SPS를 더 포함하는 인코딩 정보를 인트라 프레임 마다 수록하여 제1 계층의 컨테이너를 구성하고,
비디오 스트리밍 방법은,
제3 계층에 대한 PPS를 포함하는 인코딩 정보를 인트라 프레임 마다 수록하여 제3 계층의 컨테이너를 구성하는 제3 구성단계;를 더 포함하며,
전송 단계는,
제3 계층의 컨테이너를 제2 네트워크를 통해 전송하는 것을 특징으로 하는 비디오 스트리밍 방법.
The method according to claim 1,
The first configuration step comprises:
A first layer container is constructed by storing encoding information including an SPS for the third layer for each intra frame,
In the video streaming method,
And a third configuration step of constructing a third layer container by storing encoding information including a PPS for the third layer for each intra frame,
In the transmitting step,
And the third layer of containers is transmitted through the second network.
삭제delete 방송 콘텐츠를 생성하는 콘텐츠 제공 서버;
방송 콘텐츠로부터 생성한 스케일러블 인코딩된 비디오 스트림을 계층 별로 분리하고, 계층 별로 인트라 프레임 마다 인코딩 정보를 수록하여 컨테이너들 구성하며, 구성된 컨테이너들을 전송하는 방송 서버;를 포함하고,
방송 서버는,
비디오에 대한 VPS(Video Parameter Set), 제1 계층에 대한 SPS(Sequence Parameter Set), 제2 계층에 대한 SPS 및 제1 계층에 대한 PPS(Picture Parameter Set)를 포함하는 인코딩 정보를 인트라 프레임 마다 수록하여 제1 계층의 컨테이너를 구성하고,
제2 계층에 대한 PPS를 포함하는 인코딩 정보를 인트라 프레임 마다 수록하여 제2 계층의 컨테이너를 구성하며,
제1 계층의 컨테이너를 제1 네트워크를 통해 전송하고, 제2 계층의 컨테이너를 제2 네트워크를 통해 전송하는 것을 특징으로 하는 방송 송출 시스템.
A content providing server for generating broadcast content;
And a broadcasting server for separating the scalable encoded video streams generated from the broadcast content into layers and configuring containers by storing encoding information for each intra frame in each layer,
The broadcast server,
Encoding information including a VPS (Video Parameter Set) for a video, a SPS (Sequence Parameter Set) for a first layer, an SPS for a second layer, and a PPS (Picture Parameter Set) for a first layer is recorded for each intra frame Thereby constituting a container of the first hierarchy,
A second layer container is constructed by storing encoding information including a PPS for the second layer for each intra frame,
Wherein the first layer container is transmitted through the first network and the second layer container is transmitted through the second network.
스케일러블 인코딩된 비디오를 수신하는 단계;
수신된 비디오를 재생하는 단계;를 포함하고,
비디오는,
스케일러블 인코딩된 비디오 스트림을 계층 별로 분리하고, 계층 별로 인트라 프레임 마다 인코딩 정보를 수록하여 구성한 컨테이너들을 포함하며,
제1 계층의 컨테이너에는,
비디오에 대한 VPS(Video Parameter Set), 제1 계층에 대한 SPS(Sequence Parameter Set), 제2 계층에 대한 SPS 및 제1 계층에 대한 PPS(Picture Parameter Set)를 포함하는 인코딩 정보가 인트라 프레임 마다 수록되고,
제2 계층의 컨테이너에는,
제2 계층에 대한 PPS를 포함하는 인코딩 정보가 인트라 프레임 마다 수록되며,
수신 단계는,
제1 계층의 컨테이너를 제1 네트워크를 통해 수신하고, 제2 계층의 컨테이너를 제2 네트워크를 통해 수신하는 것을 특징으로 하는 비디오 수신 방법.

Receiving scalably encoded video;
And playing the received video,
In the video,
Containers configured by separating scalable encoded video streams by hierarchy and encoding information for each intra frame,
In the container of the first layer,
Encoding information including a VPS (Video Parameter Set) for a video, a SPS (Sequence Parameter Set) for a first layer, an SPS for a second layer, and a PPS (Picture Parameter Set) for a first layer is recorded for each intra frame And,
In the container of the second layer,
Encoding information including PPS for the second layer is recorded for each intra frame,
In the receiving step,
Wherein a container of a first layer is received via a first network and a container of a second layer is received via a second network.

청구항 7에 있어서,
인코딩 정보는,
인트라 프레임 앞에 수록되는 것을 특징으로 하는 비디오 수신 방법.
The method of claim 7,
The encoding information,
Wherein the video frame is preceded by an intra frame.
삭제delete 청구항 7에 있어서,
제1 계층의 컨테이너에는,
제3 계층에 대한 SPS가 더 포함되고,
제3 계층의 컨테이너에는,
제3 계층에 대한 PPS를 포함하는 인코딩 정보가 인트라 프레임 마다 수록되며,
수신 단계는,
제3 계층의 컨테이너를 제2 네트워크를 통해 수신하는 것을 특징으로 하는 비디오 수신 방법.
The method of claim 7,
In the container of the first layer,
The SPS for the third layer is further included,
In the container of the third hierarchy,
Encoding information including PPS for the third layer is recorded for each intra frame,
In the receiving step,
And a third layer of containers is received over the second network.
삭제delete 스케일러블 인코딩된 비디오를 수신하여 재생하는 비디오 수신 단말에 있어서,
비디오는, 스케일러블 인코딩된 비디오 스트림을 계층 별로 분리하고, 계층 별로 인트라 프레임 마다 인코딩 정보를 수록하여 구성한 컨테이너들을 포함하고,
제1 계층의 컨테이너에는,
비디오에 대한 VPS(Video Parameter Set), 제1 계층에 대한 SPS(Sequence Parameter Set), 제2 계층에 대한 SPS 및 제1 계층에 대한 PPS(Picture Parameter Set)를 포함하는 인코딩 정보가 인트라 프레임 마다 수록되고,
제2 계층의 컨테이너에는,
제2 계층에 대한 PPS를 포함하는 인코딩 정보가 인트라 프레임 마다 수록되며,
비디오 수신 단말은,
제1 계층의 컨테이너를 제1 네트워크를 통해 수신하고, 제2 계층의 컨테이너를 제2 네트워크를 통해 수신하는 것을 특징으로 하는 비디오 수신 단말.
A video receiving terminal for receiving and reproducing scalably encoded video,
The video includes containers configured by separating scalable encoded video streams by hierarchy and encoding information for each intra frame,
In the container of the first layer,
Encoding information including a VPS (Video Parameter Set) for a video, a SPS (Sequence Parameter Set) for a first layer, an SPS for a second layer, and a PPS (Picture Parameter Set) for a first layer is recorded for each intra frame And,
In the container of the second layer,
Encoding information including PPS for the second layer is recorded for each intra frame,
The video receiving terminal,
Wherein a container of the first hierarchy is received through the first network and a container of the second hierarchy is received through the second network.
KR1020160103471A 2016-08-16 2016-08-16 Container Generation Method for Ultra High Definition Scalable Video Streaming Services KR101803082B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160103471A KR101803082B1 (en) 2016-08-16 2016-08-16 Container Generation Method for Ultra High Definition Scalable Video Streaming Services

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160103471A KR101803082B1 (en) 2016-08-16 2016-08-16 Container Generation Method for Ultra High Definition Scalable Video Streaming Services

Publications (1)

Publication Number Publication Date
KR101803082B1 true KR101803082B1 (en) 2017-11-29

Family

ID=60811718

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160103471A KR101803082B1 (en) 2016-08-16 2016-08-16 Container Generation Method for Ultra High Definition Scalable Video Streaming Services

Country Status (1)

Country Link
KR (1) KR101803082B1 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101148733B1 (en) * 2005-03-02 2012-05-21 삼성전자주식회사 Apparatus and method for detecting video stream

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101148733B1 (en) * 2005-03-02 2012-05-21 삼성전자주식회사 Apparatus and method for detecting video stream

Similar Documents

Publication Publication Date Title
US11671625B2 (en) Apparatus, a method and a computer program for video coding and decoding
US10893256B2 (en) Apparatus, a method and a computer program for omnidirectional video
CN110431850B (en) Signaling important video information in network video streaming using MIME type parameters
KR102037009B1 (en) A method, device, and computer program for obtaining media data and metadata from an encapsulated bit-stream in which an operation point descriptor can be set dynamically
US11689705B2 (en) Apparatus, a method and a computer program for omnidirectional video
JP2020526982A (en) Regionwise packing, content coverage, and signaling frame packing for media content
US10575018B2 (en) Enhanced high-level signaling for fisheye virtual reality video in dash
WO2019141907A1 (en) An apparatus, a method and a computer program for omnidirectional video
US20230059516A1 (en) Apparatus, a method and a computer program for omnidirectional video
WO2014111421A1 (en) Method of displaying a region of interest in a video stream
CN111034203A (en) Processing omnidirectional media with dynamic zone-by-zone encapsulation
KR101944601B1 (en) Method for identifying objects across time periods and corresponding device
KR101803082B1 (en) Container Generation Method for Ultra High Definition Scalable Video Streaming Services
US10136146B1 (en) Metadata optimizations for encoding of media content
GB2608469A (en) Method, device, and computer program for dynamically encapsulating media content data
Kammachi‐Sreedhar et al. Omnidirectional video delivery with decoder instance reduction
US20240040169A1 (en) Media file processing method and device therefor
CN117296317A (en) Media file processing method and device
CN116406505A (en) Media file processing method and device

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant