KR101462557B1 - Method of reorganizing representation in DASH - Google Patents

Method of reorganizing representation in DASH Download PDF

Info

Publication number
KR101462557B1
KR101462557B1 KR20130160357A KR20130160357A KR101462557B1 KR 101462557 B1 KR101462557 B1 KR 101462557B1 KR 20130160357 A KR20130160357 A KR 20130160357A KR 20130160357 A KR20130160357 A KR 20130160357A KR 101462557 B1 KR101462557 B1 KR 101462557B1
Authority
KR
South Korea
Prior art keywords
representation
users
bandwidth
representations
distribution
Prior art date
Application number
KR20130160357A
Other languages
Korean (ko)
Inventor
최윤식
홍순기
김정태
Original Assignee
연세대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단 filed Critical 연세대학교 산학협력단
Priority to KR20130160357A priority Critical patent/KR101462557B1/en
Application granted granted Critical
Publication of KR101462557B1 publication Critical patent/KR101462557B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2365Multiplexing of several video streams
    • H04N21/23655Statistical multiplexing, e.g. by controlling the encoder to alter its bitrate to optimize the bandwidth utilization
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/647Control signaling between network components and server or clients; Network processes for video distribution between server and clients, e.g. controlling the quality of the video stream, by dropping packets, protecting content from unauthorised alteration within the network, monitoring of network load, bridging between two different networks, e.g. between IP and wireless
    • H04N21/64723Monitoring of network processes or resources, e.g. monitoring of network load
    • H04N21/64738Monitoring network characteristics, e.g. bandwidth, congestion level

Abstract

A method for reorganizing representation in DASH according to the present invention includes the steps of: estimating the distribution of bandwidths of users; and reorganizing a set of the representation according to the distribution of the estimated bandwidth based on the set of the representation which is previously organized.

Description

DASH에서 레프리젠테이션을 재구성하는 방법{Method of reorganizing representation in DASH}Method of reorganizing representation in DASH [

본 발명은 적응형 스트리밍 서비스 기술에 관한 것으로, 보다 상세하게는 DASH(Dynamic Adaptive Streaming over HTTP)에서 레프리젠테이션을 재구성하는 방법에 관한 것이다.BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an adaptive streaming service technology, and more particularly, to a method of reconstructing a presentation in Dynamic Adaptive Streaming over HTTP (DASH).

최근 네트워크 상황의 폭발적인 증가는 네트워크 환경을 제한적으로 만들었으며, 네트워크 환경의 제한적 상황에서 사용자는 영상의 화질 저하가 있더라도 끊김 없는 스트리밍 서비스를 제공 받기를 원하고 있다. 따라서 네트워크 상황이 좋을 경우는 고화질의 스트리밍 서비스를 지원받지만 네트워크 상황이 나빠지게 되면 화질저하기 생기더라도 영상이 끊기지 않도록 하는 기술이 필요하다.Recently, the explosive increase of the network situation has made the network environment limited, and in a limited network environment, the user wants to receive continuous streaming service even if the image quality deteriorates. Therefore, if the network condition is good, high-quality streaming service is supported. However, if the network situation becomes worse, a technique of preventing the video from being broken even if image quality is low is needed.

이러한 사용자의 요구를 해결하고자, MPEG(Moving Picture Experts Group)에서는 DASH(Dynamic Adaptive Streaming over HTTP)라는 이름으로 적응적 스트리밍 서비스 기술을 표준화하고 있다. DASH는 인터넷 프로토콜(HTTP)을 이용하여 사용자의 디바이스(클라이언트)에서 사용자의 네트워크 상황을 직접 예측하여, 다양한 품질로 콘텐츠가 저장되어 있는 서버에 적절한 품질의 콘텐츠를 요청함으로써 적응적 스트리밍을 할 수 있는 서비스이다.In order to solve such a demand, the Moving Picture Experts Group (MPEG) standardizes an adaptive streaming service technology called Dynamic Adaptive Streaming over HTTP (DASH). DASH can directly predict the network status of a user from a user's device (client) using the Internet protocol (HTTP) and adaptively stream the content by requesting a proper quality content to a server in which contents are stored with various qualities Service.

DASH에서 서버는 여러 단계의 화질을 가지는 영상 비트 스트림을 미리 만들어 놓고, 이렇게 만들어 놓은 비트 스트림들에 대하여 서버에서 HTTP 형식의 URL로 사용자에게 정보를 제공하게 된다. 이 정보를 보고 사용자는 자신에게 필요한 혹은 자신의 네트워크 상황에 적절한 미디어 파일에 해당하는 URL을 요청하여 미디어 파일 서비스를 제공받게 된다. 이것이 DASH 기술의 개략적인 개요인데, DASH의 가장 큰 장점을 사용자가 직접 자신에게 적절한 미디어 파일을 선택하기 때문에 서버에서의 자원 분배 부담이 적어져 낮은 비용으로 서비스를 제공할 수 있다는 점이며, 네트워크 상황이 나쁠 경우 사용자는 낮은 미디어 파일을 선택하여 질(quality)을 저하시키지만 끊김 없는 영상 서비스를 제공 받을 수 있다는 점이다.In the DASH, the server prepares an image bit stream having a plurality of image quality levels, and provides the user with information on the bitstreams from the server in the HTTP format. By viewing this information, the user is provided with a media file service by requesting a URL corresponding to the media file necessary for his / her own network situation. This is a rough outline of DASH technology. One of the biggest advantages of DASH is that users can select a proper media file for themselves, so that it is possible to provide low-cost services because the resource allocation burden on the server is reduced. The user may select a lower media file to lower the quality but receive continuous video service.

이러한 DASH 기술을 구현하기 위해서는 MPD(Media Presentation Description)라는 XML 형식의 description과 MPD에서 미디어 데이터를 표현할 수 있는 가장 작은 단위의 데이터 유닛인 세그먼트(segment)가 필요하다. 다양한 품질로 생성된 미디어 파일(segment)은 서버에서 HTTP 형식의 URL 주소로 저장되어 MPD에 기술된다. 클라이언트는 서버에 MPD를 요청하고, 서버로부터 전달된 MPD를 통하여 서버에 저장되어 있는 해당 파일에 관한 정보를 얻게 된다. 사용자는 자신의 네트워크 상황을 예측하고 MPD 정보를 이용하여 최적의 미디어 파일(segment)을 URL 주소로 요청하게 된다. In order to implement such DASH technology, a description of an XML format called MPD (Media Presentation Description) and a segment which is a data unit of the smallest unit capable of representing media data in MPD are required. Media files created with various qualities are stored in HTTP format URL addresses on the server and described in MPD. The client requests the MPD from the server, and obtains information about the corresponding file stored in the server through the MPD transmitted from the server. The user predicts the network status of the user and requests the optimum media file using the URL address using the MPD information.

도 1은 DASH에서 MPD의 계층적인 구조를 나타낸다. MPD의 각 계층에는 해당 역할과 기능이 있는데 이러한 정보를 MPD에 기술하여 전송함으로써 클라이언트는 서버로부터 미디어 파일에 대한 정보를 얻을 수 있게 된다. 도 1을 참조하면, MPD는 하나 이상의 Period로 구성되어 있고 각 Period는 Adaptation set들로 구성되어 있고 각 Adaptation set들은 하나 이상의 레프리젠테이션(Representation)으로 구성되어 있으며 각 레프리젠테이션들은 하나 이상의 세그먼트(segment)로 구성된다. MPD의 하위 레벨인 Period는 MPD 내의 미디어 파일을 일정한 시간간격으로 잘라주는 역할을 하고, Period의 하위 레벨인 Adaptation set은 콘텐츠의 언어, 네트워크 대역폭 등이 기술되어 있으며, Adaptation set 의 하위 레벨인 레프리젠테이션은 영상의 품질과 크기 등을 기술하고, 세그먼트는 미디어 파일을 전송하기 위한 최소 단위로 URL 정보를 포함한다. 즉, MPD는 미디어 파일의 서비스 시작 과 끝 시간, 영상 정보, 콘텐츠의 특성, URL 정보 등을 포함하고 있다. Figure 1 shows the hierarchical structure of MPD in DASH. Each layer of the MPD has corresponding roles and functions. By transmitting this information to the MPD, the client can obtain information about the media file from the server. Referring to FIG. 1, an MPD is composed of one or more Periods, each Period is composed of Adaptation Sets, each Adaptation Set is composed of one or more Representations, and each Representation includes one or more segments segment. The lower level of the MPD, Period, cuts the media files in the MPD at regular intervals. The adaptation set, which is a lower level of the Period, describes the language of the content and the network bandwidth. The segment describes the quality and size of the image, and the segment includes URL information as a minimum unit for transmitting the media file. That is, MPD includes service start and end times of media files, image information, characteristics of contents, and URL information.

DASH 시스템에서 클라이언트(사용자)는 MPD XML 파일을 분석하고, MPD안에 있는 기술된 정보들을 바탕으로 자신에게 적합한 Adaptation set과 레프리젠테이션을 선택하게 된다. 그에 따라 서버가 해당 레프리젠테이션의 세그먼트들을 전송하면 클라이언트는 버퍼에 세그먼트를 저장하고, 버퍼에 충당된 세그먼트에 해당하는 멀티미디어 파일을 재생한다. 세그먼트는 DASH 시스템에서 미디어 데이터를 표현 할 수 있는 가장 작은 단위의 데이터 유닛이며, 멀티미디어 파일은 버퍼에 세그먼트가 충당 되어야만 플레이될 수 있다. 즉, 멀티미디어 데이터는 다중의 세그먼트들로 나누어져 구성된다. 각각의 세그먼트는 고유한 URL를 할당 받고, 세그먼트의 순서와 시작시간, 지속시간(duration)을 가지고 있다. 레프리젠테이션은 세그먼트를 포함하는 레벨로, 각각의 레프리젠테이션은 영상의 비트율(bit-rate), 즉 영상의 품질에 따라 분류된다.In the DASH system, the client (user) analyzes the MPD XML file and selects the appropriate adaptation set and presentation based on the information in the MPD. Accordingly, when the server transmits the segments of the corresponding presentation, the client stores the segment in the buffer and plays the multimedia file corresponding to the segment in the buffer. A segment is the smallest unit of data that can represent media data in a DASH system, and a multimedia file can only be played if the buffer is full of segments. That is, the multimedia data is divided into a plurality of segments. Each segment is assigned a unique URL, and has a sequence of segments, a start time, and a duration. A representation is a level that includes a segment, and each representation is classified according to the bit-rate of the image, that is, the quality of the image.

레프리텐제이션은 영상의 품질을 나타내 주기 때문에, 높은 품질의 레프리텐제이션을 선택하는 것이 QoS를 보장할 수 있다. 기본적인 레프리젠테이션 선택 방법은, 클라이언트가 자신과 서버 간의 대역폭을 예측하여 예측된 대역폭을 넘지 않는 비트레이트(bit-rate)의 레프리젠테이션을 선택하는 것이다. DASH 시스템에서는, 실시간 스트리밍을 위한 트랜스코더의 성능과 서버의 용량으로 인해 레프리젠테이션의 수가 제한되어 있다. 즉, 어떤 콘텐츠에 대하여 서버에서 제공할 수 있는 레프리젠테이션의 수는 서버의 성능에 의해 결정된다. Since repetition represents the quality of the image, choosing reflination of high quality can guarantee QoS. The basic method of selecting a presentation is to allow the client to predict the bandwidth between itself and the server and select a bit-rate representation that does not exceed the expected bandwidth. In the DASH system, the number of presentations is limited due to the performance of the transcoder and the capacity of the server for real-time streaming. That is, the number of presentations that a server can provide for certain contents is determined by the performance of the server.

DASH에서 이루어진 기존 연구들은 주로 사용자 측면에서 버퍼의 크기를 고려하여 서버로부터 원하는 비트레이트의 레프리젠테이션을 받거나, 대역폭 예측을 정확하게 하여 서버로부터 받을 수 있는 비트레이트를 최대로 만드는 것 등이었다. 즉, 사용자 측면에서 QoS를 향상시키기 위한 연구가 주로 수행되었다.Previous studies in DASH have mainly focused on the user side to receive the desired bit rate representation from the server in consideration of the size of the buffer, or to make the bandwidth prediction accurate to maximize the bit rate that can be received from the server. In other words, researches to improve the QoS on the user side were mainly performed.

그러나 이러한 연구들은 서비스 제공자의 관점에서 더 나은 품질(quality)을 제공하려는 것이 아니었다. 이러한 연구들은 서버가 네트워크의 변화를 고려하지 않기 때문에, 사용자 품질을 증가시키는 데 제한적이다. 기존의 DASH 시스템에서 서비스 제공자는 변화하는 네트워크 상황에도 불구하고 사용자들에게 고정된 화질의 비디오 스트리밍을 제공하여 왔다. However, these studies were not intended to provide better quality in terms of service providers. These studies are limited to increasing user quality, since the server does not consider network changes. In existing DASH systems, service providers have been providing users with fixed video streaming quality despite changing network conditions.

그러나 네트워크 상황은 사용자들의 실제 수에 의존하여 변화한다. 달리 말하면, 비디오 스트리밍 서비스를 받기 원하는 사용자가 많을수록 네트워크 상황은 나빠지게 되고, 그 반대의 상황이라면 네트워크 상황은 좋아지게 된다. 네트워크 상황은 예컨대 주말 또는 휴일과 같은 날짜에 따라서, 또는 하루 중 시간에 따라서 변화할 수 있다. 따라서 실제 네트워크 시스템에서는 사용자들의 생활패턴 등에 따라 사용자들이 요구할 수 있는 대역폭이 변화된다. 예를 들어 사용자 수가 적은 새벽시간에 사용자가 스트리밍 서비스를 이용하는 경우 개개인이 사용할 수 있는 대역폭은 사용자 수가 많은 낮 시간에 비해 상대적으로 클 것이다. 반대로 사용자 수가 많은 낮 시간에는 사용자 개개인이 사용 할 수 있는 대역폭은 작게 될 것이다.However, the network conditions change depending on the actual number of users. In other words, the more users who want to receive video streaming services, the worse the network situation, and vice versa, the better the network situation. The network conditions can vary depending on, for example, a date such as a weekend or holiday, or a time of day. Therefore, in actual network systems, the bandwidth that can be requested by users varies according to the life patterns of users. For example, if users use streaming services in the early morning hours with a small number of users, the bandwidth available to each individual will be relatively large compared to the daytime hours when the number of users is large. Conversely, during the day when the number of users is high, the available bandwidth for each user will be small.

그러나 기존의 DASH 시스템에서는, 사용자들로부터 요청되는 품질들이 변화하더라도, 레프리젠테이션들의 비트레이트는 고정되어 있다. 달리 말하면, 서비스 제공자는 네트워크 상황의 변화에도 불구하고 사용자들에게 고정된 화질의 비디오 스트리밍을 제공한다. 그런데 만일 서버에서 서버와 사용자들 간의 네트워크 상황을 고려한다면, 사용자들은 더 나은 품질의 서비스를 제공받을 수 있을 것이다. 예컨대 만일 서버와 사용자 간의 네트워크 상황이 더 좋다면, 낮은 비트레이트의 레프리젠테이션을 원하는 사용자는 거의 없을 것이므로, DASH의 레프리젠테이션들은 높은 비트레이트를 지원할 필요가 있다. 반대로, 만일 서버와 사용자 간의 네트워크 상황이 나쁘다면, 높은 비트레이트의 몇몇 레프리젠테이션은 사용되지 않을 것이므로, DASH의 레프리젠테이션들은 낮은 비트레이트를 지원할 필요가 있다. 이??, 서비스 제공자가 네트워크 상황에 따라서 적응적인 비디오 스트리밍을 제공한다면, 사용자들은 향상된 QoS를 제공받을 수 있을 것이다. In existing DASH systems, however, the bitrates of the representations are fixed, even if the quality requested from users changes. In other words, the service provider provides the users with fixed video quality streaming despite the changes in network conditions. However, if the server considers the network situation between the server and the users, the users will be provided with better quality of service. For example, if the network situation between the server and the user is better, there will be few users who want a low bit rate representation, so DASH's representations need to support high bit rates. Conversely, if the network situation between the server and the user is bad, some of the high bitrate representations will not be used, so the DASH's representations need to support low bit rates. If the service provider provides adaptive video streaming according to the network conditions, users will be provided with enhanced QoS.

따라서 본 발명이 이루고자 하는 기술적 과제는 네트워크 상황에 따라 사용자들이 전체적으로 높은 품질의 서비스를 받을 수 있도록 레프리젠테이션을 재구성하는 방법을 제공하는 데 있다. SUMMARY OF THE INVENTION Accordingly, the present invention has been made in view of the above problems, and it is an object of the present invention to provide a method of reconfiguring a presentation so that users can receive a high-quality service as a whole.

상기 기술적 과제를 해결하기 위한 본 발명에 따른 DASH에서의 레프리젠테이션을 재구성하는 방법은, (a) 사용자들의 대역폭의 분포를 추정하는 단계; 및 (b) 이미 구성되어 있는 레프리젠테이션의 세트를 바탕으로, 상기 추정된 대역폭의 분포에 따라서 레프리젠테이션의 세트를 재구성하는 단계를 포함하는 것을 특징으로 한다.According to an aspect of the present invention, there is provided a method of reconstructing a representation in a DASH, the method comprising: (a) estimating a bandwidth distribution of users; And (b) reconstructing a set of representations according to the distribution of the estimated bandwidth, based on the set of representations already configured.

상기 (b) 단계는, 사용자들의 대역폭 손실이 최소화되도록 레프리젠테이션의 세트를 재구성할 수 있다.The step (b) may reconfigure a set of representations so that the bandwidth loss of the users is minimized.

상기 (b) 단계는 반복적으로 수행되며, 이미 구성된 레프리젠테이션의 세트와 재구성된 레프리젠테이션의 세트가 동일할 때까지 반복될 수 있다.The step (b) is repeatedly performed, and it may be repeated until the set of the already configured presentation and the set of the reconstructed representation are the same.

상기 (b) 단계에서 레프리젠테이션의 세트를 재구성하는 것은, 레프리젠테이션의 세트를 이루는 각 레프리젠테이션의 비트레이트를 결정하는 것일 수 있다.In the step (b), reconstructing the set of representations may be to determine the bitrate of each representation constituting the set of representations.

상기 각 레프리젠테이션의 비트레이트를 결정함에 있어서 k 번째 레프리젠테이션의 비트레이트를 결정하는 것은, 이미 결정된 k-1 번째 레프리젠테이션의 비트레이트와 이미 결정된 k+1 번째 레프리젠테이션의 비트레이트 및 상기 추정된 대역폭의 분포에 따라서 결정하는 것일 수 있다.The determining of the bit rate of the k-th representation in determining the bit rate of each of the representations may include determining a bit rate of the (k-1) -th representation determined in step And the distribution of the estimated bandwidth.

상기 k 번째 레프리젠테이션의 비트레이트의 결정은 다음 수학식에 따라 이루어질 수 있다.The determination of the bit rate of the k-th representation may be made according to the following equation.

Figure 112013117089789-pat00001
=0
Figure 112013117089789-pat00001
= 0

여기서, rk, rk-1, 및 rk+1은 각각 k 번째 레프리젠테이션, 이미 결정된 k-1 번째 레프리젠테이션 및 이미 결정된 k+1 번째 레프리젠테이션의 비트레이트를 나타내고, u 및 σ는 각각 사용자들의 대역폭의 평균 및 분산을 나타내며, p(b)는 사용자들의 대역폭의 확률 밀도 함수를 나타낸다.Here, r k , r k-1 , and r k + 1 represent the bit rates of the k-th representation, the already determined k-1-th representation and the already determined k + 1 -th representation, σ denotes the mean and variance of users 'bandwidths, and p (b) denotes the probability density function of users' bandwidths.

상기 (a) 단계에서 상기 대역폭의 분포를 추정하는 것은, 사용자들의 대역폭의 평균과 분산으로 정의되는 가우시안 분포로 추정하는 것일 수 있다.In the step (a), the estimation of the bandwidth distribution may be performed using a Gaussian distribution defined by an average and variance of users' bandwidths.

상기 기술적 과제를 해결하기 위하여, 상기된 레프리젠테이션 재구성 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공한다. According to an aspect of the present invention, there is provided a computer-readable recording medium storing a program for executing the above-described method of reconstructing a presentation.

상기된 본 발명에 의하면, 네트워크 상황에 따라 사용자들이 전체적으로 높은 품질의 서비스를 받을 수 있도록 레프리젠테이션을 재구성할 수 있다.According to the present invention, the presentation can be reconfigured so that users can receive high-quality services as a whole according to the network conditions.

도 1은 DASH에서 MPD의 계층적인 구조를 나타낸다.
도 2는 사용자들의 분포와 레프리젠테이션의 분포의 일 예를 나타낸다.
도 3은 사용자들의 분포를 고려하여 레프리젠테이션을 재구성한 것의 예를 나타낸다.
도 4는 네트워크 상황이 변하여 사용자의 분포가 변화한 것을 나타낸다.
도 5는 사용자 분포의 변화에 따라 레프리젠테이션을 재구성한 것의 예를 나타낸다.
도 6은 도 2에 대응되는 사용자 분포 분석 결과를 보여준다.
도 7은 도 3에 대응되는 사용자 분포 분석 결과를 보여준다.
도 8은 수학식 3을 설명하는 도면이다.
도 9는 수학식 5를 설명하는 도면이다.
도 10은 본 발명의 일 실시예에 따라 레프리젠테이션을 재구성하는 방법의 흐름도를 나타낸다.
도 11은 도 10의 1020단계를 보다 구체적으로 나타낸 흐름도이다.
도 12는 본 발명의 실시예에 따른 시뮬레이션 결과, 레프리젠테이션 세트의 재구성을 반복(iteration)함에 따라서 사용자들의 평균 비트레이트가 변화하는 것을 나타내는 그래프이다.
도 13은 본 발명이 실시예를 레프리젠테이션의 수를 달리 하여 시뮬레이션한 결과를 나타낸다.
Figure 1 shows the hierarchical structure of MPD in DASH.
2 shows an example of distribution of users and distribution of the presentation.
FIG. 3 shows an example of a reconstruction of a representation in consideration of the distribution of users.
4 shows that the distribution of users is changed due to the change of the network situation.
Figure 5 shows an example of a reconstruction of a presentation according to a change in user distribution.
FIG. 6 shows the result of user distribution analysis corresponding to FIG. 2. FIG.
FIG. 7 shows a user distribution analysis result corresponding to FIG.
8 is a view for explaining the equation (3).
9 is a diagram for explaining the equation (5).
Figure 10 shows a flow diagram of a method for reconstructing a presentation in accordance with an embodiment of the present invention.
11 is a flowchart showing the step 1020 of FIG. 10 in more detail.
FIG. 12 is a graph showing a change in the average bit rate of users as a result of simulation according to an embodiment of the present invention, by iterating reconstruction of a representation set.
13 shows a result of simulating the embodiment of the present invention with different numbers of representations.

이하에서는 도면을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명한다. 이하 설명 및 첨부된 도면들에서 실질적으로 동일한 구성요소들은 각각 동일한 부호들로 나타냄으로써 중복 설명을 생략하기로 한다. 또한 본 발명을 설명함에 있어 관련된 공지기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그에 대한 상세한 설명은 생략하기로 한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the drawings. In the following description and the accompanying drawings, substantially the same components are denoted by the same reference numerals, and redundant description will be omitted. In the following description of the present invention, a detailed description of known functions and configurations incorporated herein will be omitted when it may make the subject matter of the present invention rather unclear.

네트워크 상황에 따라 모든 사용자들이 전체적으로 높은 품질의 서비스를 받을 수 있도록 하는 이상적인 해법은 서버에서 각 사용자가 필요로 하는 적절한 비트레이트를 제공하는 것이다. 그러나 실시간 비디오 스트리밍 시스템에서, 서버의 CPU의 능력과 트랜스코더의 성능은 한계가 있기 때문에, 레프리젠테이션의 수는 제한되어 있다. 따라서 실제로는 많은 사용자들이 손실을 볼 수밖에 없다. 예를 들어, 사용자의 최대 대역폭은 1Mbps이지만 레프리젠테이션의 최대 비트레이트가 800Kbps라 가정하면, 그 사용자는 200Kbps의 손실을 보게 된다. 만일 서버가 1Mbps의 레프리젠테이션을 제공한다면, 사용자는 손실을 보지 않을 것이다.The ideal solution to ensure that all users receive high quality of service overall, depending on network conditions, is to provide the appropriate bit rate for each user on the server. However, in a real-time video streaming system, the number of representations is limited because the server's CPU capability and transcoder performance are limited. So, in reality, many users are forced to see losses. For example, assuming that the user's maximum bandwidth is 1 Mbps but the maximum bitrate of the presentation is 800 Kbps, the user will see a loss of 200 Kbps. If the server provides a 1 Mbps representation, the user will not see any loss.

기존의 DASH 시스템에서는 변화하는 네트워크 상황에도 불구하고 레프리젠테이션들의 비트레이트가 고정되어 있다. 그러나 만일 사용자의 요구와 네트워크 상황에 따라 레프리젠테이션들을 재구성한다면, 모든 사용자들의 평균 QoS는 향상될 수 있을 것이다. 예를 들어, 서로 다른 대역폭을 가지는 다섯 사용자가 있고, 서버는 두 개의 레프리젠테이션을 제공할 수 있다고 가정하자. 도 2는 이러한 경우의 사용자들의 분포와 레프리젠테이션의 분포를 나타낸다. 도 2의 예에서 레프리젠테이션은 사용자들의 분포와 무관하게 결정된 것이다. 사용자로부터 요청되는 레프리젠테이션의 비트레이트는 해당 사용자의 대역폭 이하이므로, 모든 사용자들의 평균 비트레이트는 (128Kbps×4+320Kbps)/5 = 166.4Kbps가 된다. In existing DASH systems, the bitrates of the representations are fixed despite the changing network conditions. However, if we reconfigure the representations according to user demand and network conditions, the average QoS of all users could be improved. For example, suppose there are five users with different bandwidths, and the server can provide two representations. Figure 2 shows the distributions of users and distributions in this case. In the example of FIG. 2, the presentation is determined regardless of the distribution of users. Since the bit rate of the presentation requested from the user is less than the bandwidth of the corresponding user, the average bit rate of all users is (128 Kbps × 4 + 320 Kbps) / 5 = 166.4 Kbps.

도 3은 위에서 예를 든 사용자들의 분포를 고려하여 레프리젠테이션을 재구성한 것을 나타낸다. 도 3과 같이 레프리젠테이션을 재구성한다면, 모든 사용자들의 평균 비트레이트는 (128Kbps + 256Kbps×4)/5=230.4Kbps로 증가할 것이다. 이와 같이, 사용자들의 대역폭 분포에 따라서 레프리젠테이션을 재구성한다면 사용자들의 평균 비트레이트를 증가시킬 수 있음을 확인할 수 있다. FIG. 3 shows a reconstruction of the presentation in consideration of the distribution of the above-mentioned users. If the presentation is reconstructed as shown in FIG. 3, the average bit rate of all users will increase to (128 Kbps + 256 Kbps 4) /5=230.4 Kbps. Thus, it can be seen that if the presentation is reconstructed according to the bandwidth distribution of the users, the average bit rate of the users can be increased.

나아가, 네트워크 상황이 변하여 예컨대 도 4에 도시된 바와 같이 사용자의 분포가 변화할 수 있다. 이렇게 되면 도 3의 경우보다 사용자들의 평균 비트레이트는 감소하고, 그 값은 (128Kbps×2 + 256Kbps×3)/5 = 204.8Kbps가 된다. 따라서, 레프리젠테이션은 재구성될 필요가 있다. 도 5에 도시된 바와 같이 레프리젠테이션을 재구성한다면, (128Kbps×2 + 320Kbps×3)/5 = 243.2Kbps의 평균 비트레이트를 얻을 수 있다. Furthermore, the network situation may change and the distribution of the user may change, for example, as shown in FIG. In this case, the average bit rate of the users is smaller than that of FIG. 3, and the value is (128 Kbps × 2 + 256 Kbps × 3) / 5 = 204.8 Kbps. Thus, the representation needs to be reconstructed. If the representation is reconstructed as shown in Fig. 5, an average bit rate of (128 Kbps x 2 + 320 Kbps x 3) / 5 = 243.2 Kbps can be obtained.

이상과 같이, 사용자들의 대역폭 분포에 따라서 레프리젠테이션을 재구성한다면, 모든 사용자들의 평균 비트레이트를 향상시킬 수 있다. As described above, if the presentation is reconstructed according to the bandwidth distribution of users, the average bit rate of all users can be improved.

이하 본 발명의 실시예들을 통하여, 사용자들의 대역폭 분포에 따라서 서버에서 제공할 레프리젠테이션을 재구성하는 방법을 제안한다. 이를 위하여 우선 레프리젠테이션 재구성을 위한 최적화 함수를 도출하기로 한다.Hereinafter, embodiments of the present invention propose a method of reconstructing a presentation to be provided by a server according to a bandwidth distribution of users. For this purpose, we first derive an optimization function for reconstruction of representation.

본 명세서에는 많은 기호와 약자들이 등장하는 바, 편의상 아래 표와 같이 기호를 정의하기로 한다. Many symbols and abbreviations appear in this specification, and for convenience, the symbols are defined as shown in the following table.

기호sign 정의Justice NN 사용자(클라이언트)들의 수Number of users (clients) ni n i i 번째 레프리젠테이션을 선택한 사용자의 수Number of users who selected the i-th representation MM 레프리젠테이션 세트에 포함된 레프리젠테이션의 수The number of representations included in the representation set RR 하나의 레프리젠테이션 세트One representation set ri r i i 번째 레프리젠테이션의 비트레이트(i=0, 1, ..., M-1)The bit rate (i = 0, 1, ..., M-1) of the i- rj r j R 내에서 j 번째 사용자에 의해 요청된 레프리젠테이션The presentation requested by the j < th > user in R lossj loss j j 번째 사용자의 대역폭 손실Bandwidth Loss of jth User bj b j j 번째 사용자의 대역폭The bandwidth of the jth user p(b)p (b) 대역폭(b)의 확률 밀도 함수The probability density function of bandwidth (b) CBCB 서버의 최대 채널 대역폭(Channel Bandwidth)The server's maximum channel bandwidth (Channel Bandwidth)

도 6은 도 2에 대응되는 사용자 분포 분석 결과를 보여준다. 전술한 바와 같이 도 2에서 레프리젠테이션은 사용자들의 분포와 무관하게 결정된 것이다. 도 7은 도 3에 대응되는 사용자 분포 분석 결과를 보여준다. FIG. 6 shows the result of user distribution analysis corresponding to FIG. 2. FIG. As described above, in FIG. 2, the presentation is determined regardless of the distribution of users. FIG. 7 shows a user distribution analysis result corresponding to FIG.

도 6과 도 7의 케이스를 참조하면, 양쪽 케이스에서 사용자들마다 대역폭 손실(bandwidth loss)이 존재하는 것을 알 수 있다. 그러나 레프리젠테이션이 재구성된 도 7의 케이스에서 대역폭 손실이 더 적다. 사용자들의 대역폭이 고정되어 있다고 하면, 사용자들의 평균 비트레이트를 높이는 것은 사용자들의 평균 대역폭 손실을 낮추는 것으로 표현될 수 있다. 이것은 다음 수학식과 같이 표현될 수 있다.Referring to FIGS. 6 and 7, it can be seen that there is a bandwidth loss for each user in both cases. However, the bandwidth loss is less in the case of Fig. 7 where the representation is reconstructed. Assuming that the bandwidth of the users is fixed, increasing the average bit rate of the users can be expressed as lowering the average bandwidth loss of the users. This can be expressed as the following equation.

Figure 112013117089789-pat00002
Figure 112013117089789-pat00002

표 1에서도 언급하였지만, 여기서 bj는 j번째 사용자의 대역폭을, lossj는 j 번째 사용자의 대역폭 손실을 나타낸다. In Table 1, b j represents the bandwidth of the j-th user, and loss j represents the bandwidth loss of the j-th user.

따라서 본 발명의 실시예에서는, 사용자들의 대역폭 손실이 최소화되도록 레프리젠테이션을 재구성한다. 사용자들의 대역폭 손실은 사용자들의 대역폭 분포와 레프리젠테이션에 따라 정해진다. 즉, 레프리젠테이션 재구성의 목표는 각 사용자의 대역폭 손실을 최소화하는 것이다. 레프리젠테이션 재구성을 위한 최적화 함수가 볼록(convex) 함수가 되도록 하기 위하여, 상기 최적화 함수는 대역폭 손실의 자승(square)의 기댓값을 최소화하도록 한다. Thus, embodiments of the present invention reconfigure the presentation so that the bandwidth loss of users is minimized. The bandwidth loss of the users is determined by the bandwidth distribution and the presentation of the users. That is, the goal of re-presentation reconstruction is to minimize the bandwidth loss of each user. In order to make the optimization function for representation reconstruction a convex function, the optimization function minimizes the expectation of the square of the bandwidth loss.

상기 수학식 1이 나타내는 바와 같이 대역폭 손실의 자승(이하, 손실 자승)의 기댓값을 최소화하는 것은 사용자들의 평균 비트레이트를 최대화하는 것을 의미한다. 다만, 서버가 제공할 수 있는 최대 채널 대역폭(CB)이 존재한다. 만일 사용자들의 총 비트레이트가 서버의 최대 채널 대역폭(CB)를 초과한다면, 레프리젠테이션을 재구성했음에도 불구하고 일부 사용자들은 정상적인 스트리밍 서비스를 받지 못할 수도 있다. 각 사용자는 그의 최대 대역폭보다 작거나 같은 비트레이트의 레프리젠테이션을 제공받을 수 있으므로, 모든 사용자들의 총 비트레이트는

Figure 112013117089789-pat00003
로 표현될 수 있다. 즉, i 번째 레프리젠테이션을 선택한 사용자의 수 ni를 안다면 모든 사용자들의 총 비트레이트를
Figure 112013117089789-pat00004
로서 구할 수 있다. 결국, 사용자들의 대역폭 손실이 최소화하는 목표는 다음 수학식과 같이 표현될 수 있다. As shown in Equation (1), minimizing the expected value of the square of the bandwidth loss (hereinafter referred to as " lost squared ") means maximizing the average bit rate of users. However, there is a maximum channel bandwidth (CB) that the server can provide. If the total bitrate of the users exceeds the maximum channel bandwidth (CB) of the server, some users may not receive normal streaming services even though the presentation is reconstructed. Each user may be provided with a representation of a bit rate that is less than or equal to its maximum bandwidth so that the total bit rate of all users is
Figure 112013117089789-pat00003
. ≪ / RTI > That is, if knowing the number n i of users who selected the i-th representation, the total bit rate of all users
Figure 112013117089789-pat00004
. As a result, the goal of minimizing the bandwidth loss of the users can be expressed as the following equation.

Figure 112013117089789-pat00005
Figure 112013117089789-pat00005

여기서, N>>M이라고 가정할 수 있다. 즉, 사용자들의 수는 레프리젠테이션의 수보다 훨씬 많다. 그리고 사용자의 대역폭 b의 확률 밀도 함수(probability density function)가 사용될 수 있다. 표 1에서 언급하였지만, ri는 i(i=0, 1, ..., M-1)번째 레프리젠테이션의 비트레이트이고, ni는 i 번째 레프리젠테이션을 선택한 사용자의 수이다. 대역폭 b에서의 대역폭 손실 loss는

Figure 112013117089789-pat00006
이며, 여기서
Figure 112013117089789-pat00007
이다.
Figure 112013117089789-pat00008
은 사용자가 수신하는 레프리젠테이션이며, 사용자는 그의 최대 대역폭을 초과하는 레프리젠테이션을 요청할 수 없는 바, 대역폭 손실은 일반적으로 레프리젠테이션에 의해 결정된다. 나아가, 대역폭 손실은 레프리젠테이션들의 구간에 따라서 정해진다. 예컨대, 레프리젠테이션 r0와 r1 사이의 손실 자승의 기댓값은
Figure 112013117089789-pat00009
이다. 따라서 손실 자승의 기댓값은 다음 수학식과 같이 표현될 수 있다.Here, it can be assumed that N >> M. That is, the number of users is much larger than the number of representations. And a probability density function of the bandwidth b of the user can be used. As mentioned in Table 1, r i is the bit rate of i (i = 0, 1, ..., M-1) th presentation and n i is the number of users who selected the i th presentation. The bandwidth loss at bandwidth b is
Figure 112013117089789-pat00006
, Where
Figure 112013117089789-pat00007
to be.
Figure 112013117089789-pat00008
Is a representation received by the user and the user can not request a representation that exceeds its maximum bandwidth such that the bandwidth loss is generally determined by the presentation. Furthermore, the bandwidth loss is determined by the interval of the representations. For example, the expected value of the loss squared between the representations r 0 and r 1 is
Figure 112013117089789-pat00009
to be. Therefore, the expected value of the loss squared can be expressed by the following equation.

Figure 112013117089789-pat00010
Figure 112013117089789-pat00010

상기 수학식 3을 f(R)로 명명하면, f(R)은 다음 수학식과 같이 표현할 수 있다. 도 8은 f(R)을 설명하는 도면이다. Letting f (R) be the equation (3), f (R) can be expressed by the following equation. 8 is a view for explaining f (R).

Figure 112013117089789-pat00011
Figure 112013117089789-pat00011

일반적으로, 서버에서 사용자들의 수와 사용자들의 대역폭의 분포 또는 확률 밀도 함수는 기존에 알려진 네트워크 정보 수집 기법들을 통하여 추정될 수 있다. 따라서, i 번째 레프리젠테이션을 선택한 사용자의 수 ni는 다음 수학식에 따라서 구해질 수 있다. 도 9는 수학식 5를 설명하는 도면이다. In general, the number of users and the distribution of users' bandwidths or probability density functions in a server can be estimated through known network information collection techniques. Therefore, the number n i of users who selected the i-th representation can be obtained according to the following equation. 9 is a diagram for explaining the equation (5).

Figure 112013117089789-pat00012
Figure 112013117089789-pat00012

수학식 5에서, ri와 ri+1 사이의 적분 값은 그 사이에 분포된 사용자의 확률 값이다. In Equation (5), the integral value between r i and r i + 1 is the probability value of the user distributed therebetween.

수학식 2의

Figure 112013117089789-pat00013
에 대응하는
Figure 112013117089789-pat00014
은 다음 수학식과 같이 표현될 수 있다. h(R)은 라그랑주 승수법(lagrange multiplier)에서 제약 사항에 관련된다. In Equation (2)
Figure 112013117089789-pat00013
Corresponding to
Figure 112013117089789-pat00014
Can be expressed by the following equation. h (R) relates to constraints in the lagrange multiplier.

Figure 112013117089789-pat00015
Figure 112013117089789-pat00015

따라서, 라그랑주 승수법을 이용하여 최적화 함수를 얻을 수 있고, 다음 수학식은 이를 위한 수식을 나타낸다. Therefore, the optimization function can be obtained by using the Lagrange multiplier method, and the following equation represents a formula for this.

Figure 112013117089789-pat00016
Figure 112013117089789-pat00016

수학식 7을 풀기 위하여, 다음 수학식을 계산할 수 있다.In order to solve Equation (7), the following equation can be calculated.

Figure 112013117089789-pat00017
Figure 112013117089789-pat00017

수학식 8을 계산하기 위하여, 다음과 같은 계산 과정을 수행할 수 있다.To calculate Equation (8), the following calculation process can be performed.

Figure 112013117089789-pat00018
Figure 112013117089789-pat00018

수학식 9의 계산 과정을 통하여 수학식 8을 풀면 다음 수학식을 얻을 수 있다.Solving Equation (8) through the calculation process of Equation (9), the following equation can be obtained.

Figure 112013117089789-pat00019
Figure 112013117089789-pat00019

또한, 수학식 6으로부터 다음 수학식을 얻을 수 있다.From the equation (6), the following equation can be obtained.

Figure 112013117089789-pat00020
Figure 112013117089789-pat00020

상기 수학식 7, 10, 11을 이용하여 다음 수학식을 얻을 수 있다.The following equations can be obtained by using Equations (7), (10) and (11).

Figure 112013117089789-pat00021
Figure 112013117089789-pat00021

상기 수학식 12를 만족하는 레프리젠테이션 세트 R을 찾아낸다면, 그 R은 최적의 해가 된다. 다만, 찾아낸 R이

Figure 112013117089789-pat00022
을 만족하지 않는다면, 최적의 해는
Figure 112013117089789-pat00023
을 만족하는 경계값(boundary) 중 하나가 된다. 즉, 모든 사용자들의 총 비트레이트는 서버의 최대 채널 대역폭(CB)을 초과하지 않도록 하는 것이 바람직하다. 이를 위한 최적의 레프리젠테이션 포인트들은
Figure 112013117089789-pat00024
을 만족하는 것이다. If we find a representation set R that satisfies the expression (12), then R is the optimal solution. However,
Figure 112013117089789-pat00022
, Then the optimal solution is
Figure 112013117089789-pat00023
And a boundary value satisfying the following expression. That is, it is desirable that the total bit rate of all users does not exceed the maximum channel bandwidth (CB) of the server. The optimal presentation points for this are
Figure 112013117089789-pat00024
.

나아가, 본 발명의 실시예에서는 하나의 가정을 하기로 한다. 사용자들의 대역폭의 확률 밀도 함수는 중심 극한 정리(central limit theorem)에 따르면 가우시안 분포를 띠게 된다. 실제 스트리밍 서비스에서, ISDN, ASDL, 무선 인터넷 접속 등과 같은 다양한 네트워크 접근 방법이 있고, 각 네트워크 접근 방법은 다른 대역폭을 가지며, 동일한 접근 방법 내에서도 사용자들은 서로 다른 대역폭을 가진다. 따라서 사용자들의 대역폭의 확률 밀도 함수는 가우시안 분포라고 가정할 수 있다. 확률 밀도 함수를 가우시안 분포로 가정하면, 확률 밀도 함수는 대역폭의 평균과 분산으로 정의된다. Furthermore, one assumption will be made in the embodiment of the present invention. The probability density function of users' bandwidths is Gaussian distributed according to the central limit theorem. In an actual streaming service, there are various network access methods such as ISDN, ASDL, and wireless Internet access, and each network access method has a different bandwidth, and users within the same approach have different bandwidths. Therefore, it can be assumed that the probability density function of bandwidth of users is a Gaussian distribution. Assuming a probability density function as a Gaussian distribution, the probability density function is defined as the mean and variance of the bandwidth.

확률 밀도 함수를 가우시안 분포로 가정하면, 상기 수학식 9는 다음 수학식과 같이 계산될 수 있다. 이하에서, u는 대역폭의 평균을, σ는 대역폭의 분산을 나타낸다.Assuming that the probability density function is a Gaussian distribution, Equation (9) can be calculated as the following equation. Hereinafter, u denotes the average of the bandwidths, and? Denotes the variance of the bandwidths.

Figure 112013117089789-pat00025
Figure 112013117089789-pat00025

수학식 13의 계산 과정을 통하여, 수학식 10으로부터 다음 수학식을 얻을 수 있다.Through the calculation process of Equation (13), the following equation can be obtained from Equation (10).

Figure 112013117089789-pat00026
Figure 112013117089789-pat00026

나아가, 수학식 13의 Step 2에서, 치환적분이 사용될 수 있다.

Figure 112013117089789-pat00027
,
Figure 112013117089789-pat00028
로 놓으면, Step 2의
Figure 112013117089789-pat00029
는 다음과 같이 계산된다.Further, in Step 2 of Equation (13), the substitution integral can be used.
Figure 112013117089789-pat00027
,
Figure 112013117089789-pat00028
, Then the
Figure 112013117089789-pat00029
Is calculated as follows.

Figure 112013117089789-pat00030
Figure 112013117089789-pat00030

따라서, 수학식 14를 0으로 놓으면, 다음과 같은 수학식이 얻어진다.
Therefore, when Equation 14 is set to 0, the following equation is obtained.

Figure 112013117089789-pat00031
Figure 112013117089789-pat00031

상기 수학식 14 또는 16을 참조하면, k 번째 레프리젠테이션의 비트레이트 rk를 결정하고자 할 때, rk는 rk-1, rk+1 및 확률 밀도 함수 p(b)에 의하여 결정된다. 즉, rk는 rk-1 과 rk+1 사이에서 결정된다. 다만 본 발명의 실시예에서는, 레프리젠테이션 세트를 구성하는 레프리젠테이션들의 한번의 변경으로 최적화 결과가 얻어지는 것이 아니라, 반복적으로 수행할 필요가 있다. 왜냐하면 변경된 rk에 따라서 그에 인접한 rk-1 과 rk+1 역시 변경되어야 하기 때문이다. 따라서 레프리젠테이션의 재구성은 레프리젠테이션들이 안정적인 값을 얻을 때까지 반복적으로 수행되는 것이 바람직하다.Referring to Equation 14 or 16, when determining the bit rate r k of the k- th representation, r k is determined by r k-1 , r k + 1 and the probability density function p (b) . That is, r k is determined between r k-1 and r k + 1 . However, in the embodiment of the present invention, it is necessary to perform iteratively, not by obtaining a result of optimization by changing the representations constituting the representation set once. Because according to the changed adjacent r k r k-1 and k + r 1 it is because should also be changed. Thus, it is desirable that the reconstruction of the presentation is performed iteratively until the representations get a stable value.

도 10은 본 발명의 일 실시예에 따라 레프리젠테이션을 재구성하는 방법의 흐름도를 나타낸다. Figure 10 shows a flow diagram of a method for reconstructing a presentation in accordance with an embodiment of the present invention.

1010단계에서, 서버는 사용자(클라이언트)들의 대역폭 분포를 추정한다. 전술한 바와 같이, 사용자들의 대역폭의 분포 또는 확률 밀도 함수는 기존에 알려진 네트워크 정보 수집 기법들을 통하여 추정될 수 있다. 나아가, 확률 밀도 함수를 가우시안 분포로 가정하면, 사용자들의 수와 대역폭의 평균 및 분산을 구하는 것으로 대역폭 분포는 결정될 수 있다. In step 1010, the server estimates the bandwidth distribution of users (clients). As described above, the distribution of users' bandwidth or the probability density function can be estimated through known network information collection techniques. Further, assuming that the probability density function is a Gaussian distribution, the bandwidth distribution can be determined by obtaining the average and variance of the number of users and the bandwidth.

1020단계에서, 서버는 이미 구성되어 있는 레프리젠테이션 세트를 바탕으로, 1010단계에서 추정된 대역폭 분포에 따라서 레프리젠테이션 세트를 재구성한다. 도시된 바와 같이 1020단계는 반복적으로 수행되는데, 레프리젠테이션 세트의 초기화 값(즉, 각 레프리젠테이션의 비트레이트)이 정해져 있으며, 하나의 레프리젠테이션 세트를 이루는 레프리젠테이션들의 수는 일정한 것으로 가정한다. 반복의 최초 수행시에는, 이 초기화 값을 바탕으로 재구성하며, 다음 반복 수행시에는 바로 앞의 반복을 통하여 재구성된 레프리젠테이션 세트를 바탕으로 재구성하게 된다. 레프리젠테이션 세트의 재구성은, 레프리젠테이션 세트를 이루는 레프리젠테이션들의 비트레이트를 결정하는 것으로, 본 발명이 실시예에서는 각 레프리젠테이션의 비트레이트를 순차적으로 결정한다. In step 1020, the server reconstructs the representation set according to the estimated bandwidth distribution in step 1010, based on the representation set already configured. As shown in the figure, step 1020 is repeatedly performed. The initialization value of the presentation set (i.e., the bit rate of each presentation) is determined, and the number of presentations constituting one presentation set is fixed I suppose. At the first execution of the iteration, it is reconstructed based on the initialization value, and at the next iteration, it is reconstructed based on the reconstructed representation set through the immediately preceding iteration. The reconstruction of the representation set determines the bitrate of the representations constituting the representation set. In the embodiment of the present invention, the bitrates of each representation are sequentially determined.

본 발명이 실시예에서는, 사용자들의 대역폭 분포와 레프리젠테이션 세트에 따라 정해지는 대역폭 손실이 최소화되도록 레프리젠테이션을 재구성하는데, 이를 위하여 도출된 상기 수학식 14 또는 16을 이용한다.In this embodiment of the present invention, the representation is reconstructed so as to minimize the bandwidth loss determined according to the bandwidth distribution of the users and the presentation set, and the above formula 14 or 16 derived for this purpose is used.

1030단계에서, 서버는 현재 재구성된 레프리젠테이션 세트와, 이미 구성된 즉 이전 반복을 통하여 재구성된 레프리젠테이션 세트가 동일한지 판단한다. 만일 동일하다면, 레프리젠테이션들이 안정적인 값을 얻은 것이므로, 종료하고, 동일하지 않다면 다시 1020단계로 돌아가서 레프리젠테이션 재구성이 반복된다. 실시예에 따라서는, 현재 재구성된 레프리젠테이션 세트와 이전 반복을 통하여 재구성된 레프리젠테이션 세트의 차이가 일정 수준 이하로 작다면 종료하도록 할 수도 있을 것이다. In step 1030, the server determines whether the currently reconstructed representation set is the same as the representation set already reconstructed, i.e. reconstructed through the previous iteration. If they are the same, the representations have obtained a stable value, and thus the process ends. If not, the process returns to step 1020 and the reorganization is repeated. Depending on the embodiment, it may be terminated if the difference between the currently reconstructed representation set and the reconstructed representation set through the previous iteration is smaller than a certain level.

나아가서, 사용자들의 대역폭 분포는 전술한 바와 같이 시간 또는 상황에 따라 변화할 수 있으므로, 본 발명의 실시예에서는 때때로 혹은 주기적으로(예컨대, 하루 중 특정 시간마다 또는 일정 시간마다, 또는 날짜 별로) 사용자들의 대역폭 분포를 추정하고, 추정된 분포에 따라서 전술한 과정들을 수행하여 레프리젠테이션 구성을 변경할 수도 있다. Furthermore, since the bandwidth distribution of users may vary according to time or situation as described above, the embodiments of the present invention may allow users to change their bandwidth distribution from time to time or periodically (e.g., at specific times of the day, The bandwidth distribution may be estimated, and the above-described processes may be performed according to the estimated distribution to change the presentation configuration.

도 11은 도 10의 1020단계를 보다 구체적으로 나타낸 흐름도이다. 전술한 바와 같이 레프리젠테이션 세트를 구성하는 레프리젠테이션들의 수는 M개이며, 따라서 각 레프리젠테이션의 비트레이트는 rk(i=0, 1, ..., M-1)로 표시할 수 있다. 본 발명의 실시예에서, 레프리젠테이션의 가장 낮은 비트레이트 r0는 고정된 값으로 하며, 레프리젠테이션의 가장 높은 비트레이트 rM-1은 서버의 최대 채널 대역폭(CB)를 초과할 수 없다. 11 is a flowchart showing the step 1020 of FIG. 10 in more detail. As described above, the number of presentations constituting the representation set is M, and thus the bit rate of each representation is represented by r k (i = 0, 1, ..., M-1) . In an embodiment of the present invention, the lowest bit rate r 0 of the representation is a fixed value and the highest bit rate r M-1 of the representation can not exceed the maximum channel bandwidth CB of the server .

최초 1021 단계에서 k=0으로 설정되고, 1023단계에서, k를 1 증가시킨다. 1025단계에서 rk를 결정하며, 1027단계에서, k=M-1이 될 때까지 1023단계와 1025 단계가 반복된다. 이러한 과정을 통하여, r1, r2, ..., rM-1까지 각 레프리젠테이션의 비트레이트가 결정된다. In the first step 1021, k = 0 is set, and in step 1023, k is increased by 1. In step 1025, r k is determined. In step 1027, steps 1023 and 1025 are repeated until k = M-1. Through this process, the bit rates of the respective representations up to r 1 , r 2 , ..., r M-1 are determined.

본 실시예에서, k 번째 레프리젠테이션의 비트레이트 rk를 결정하는 것은, 상기 수학식 14를 0으로 하거나, 또는 상기 수학식 16에 따라서 결정한다. 따라서, 전술한 바와 같이, rk는 rk-1, rk+1 및 확률 밀도 함수 p(b)에 의하여 결정된다. 이때 rk-1, rk+1은 이미 결정된 이미 결정된 k-1 번째 레프리젠테이션 및 이미 결정된 k+1 번째 레프리젠테이션의 비트레이트이다. 보다 구체적으로는, rk+1은 1020단계의 이전 반복을 통하여 결정된 비트레이트이고, rk-1은 1020단계의 현재 반복을 통하여 결정된 비트레이트이다. In this embodiment, the determination of the bit rate r k of the k-th representation is made according to Equation (14) to 0 or Equation (16). Therefore, as described above, r k is determined by r k-1 , r k + 1 and the probability density function p (b). Here, r k-1 , r k + 1 are the determined bit rates of the already determined k-1 th presentation and the already determined k + 1 th presentation. More specifically, r k + 1 is the bit rate determined through the previous iteration of step 1020, and r k-1 is the bit rate determined through the current iteration of step 1020.

최초의 1025단계에서는 첫 번째 레프리젠테이션 r0와 세 번째 레프리젠테이션 r2을 바탕으로 두 번째 레프리젠테이션 r1이 결정된다. 마지막 1025단계에서는, rM-2와 rM을 바탕으로 마지막 레프리젠테이션 rM-1이 결정되는데, 본 발명의 실시예에서는 rM-1의 결정을 위한 rM의 값을 서버의 최대 채널 대역폭(CB)으로 설정할 수 있다. 다만, 비트레이트의 최대값을 서버의 최대 채널 대역폭(CB)보다 작은 어떤 값으로 하고자 한다면, rM의 값을 그 값으로 정하면 된다. In the first step 1025, a second presentation r 1 is determined based on the first presentation r 0 and the third presentation r 2 . In the last step 1025, the last representation r M-1 is determined based on r M-2 and r M. In the embodiment of the present invention, the value of r M for determination of r M-1 is set as the maximum channel The bandwidth CB can be set. However, if the maximum value of the bit rate is to be a value smaller than the maximum channel bandwidth (CB) of the server, the value of r M may be set as the value.

도 12는 본 발명의 실시예에 따른 시뮬레이션 결과, 레프리젠테이션 세트의 재구성을 반복(iteration)함에 따라서 사용자들의 평균 비트레이트가 변화하는 것을 나타내는 그래프이다. 도 12를 참조하면, 약 6-7번의 반복 수행으로 비트레이트는 안정화 단계에 접어들었음을 알 수 있다. 이때 비트레이트는 약 940Kbps의 값으로나타나며, 최초 주어진 레프리젠테이션의 세트를 이용하는 경우보다 100Kbps 이상의 개선을 보임을 확인할 수 있다.FIG. 12 is a graph showing a change in the average bit rate of users as a result of simulation according to an embodiment of the present invention, by iterating reconstruction of a representation set. Referring to FIG. 12, it can be seen that the bit rate has entered the stabilization phase by repeating about 6-7 times. At this time, the bit rate is about 940Kbps, and it can be confirmed that the improvement is over 100Kbps in comparison with the case of using the set of initially given presentation.

나아가, 일반적으로 레프리젠테이션의 수를 증가시킬수록 사용자들의 평균 비트레이트를 향상시킬 수 있는데, 본 발명은 레프리젠테이션의 수를 증가시킬수록 더욱 뛰어난 성능을 나타낸다. 도 13은 본 발명이 실시예를 레프리젠테이션의 수를 달리 하여 시뮬레이션한 결과를 나타낸다. 도 13을 참조하면, 레프리젠테이션의 수가 5에서 15까지 증가하는 동안 비트레이트는 급격한 향상을 보이며, 약 25을 넘어가게 되면 더딘 향상을 보임을 알 수 있다. 이처럼 레프리젠테이션의 수를 변화시켜 본 발명의 실시예를 적용할 경우, 사용자가 원하는 비트레이트를 바탕으로 서버의 성능을 고려하여 최적의 레프리젠테이션 수를 정할 수 있다. Furthermore, in general, as the number of presentations increases, the average bit rate of the users can be improved. As the number of presentations increases, the present invention exhibits more excellent performance. 13 shows a result of simulating the embodiment of the present invention with different numbers of representations. Referring to FIG. 13, the bit rate increases sharply while the number of representations increases from 5 to 15, and it is seen that the bit rate increases more slowly when the number of representations increases from about 25 to 15. When the embodiment of the present invention is applied by changing the number of representations, the optimal number of presentations can be determined in consideration of the performance of the server based on the bit rate desired by the user.

한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드 디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등)와 같은 저장매체를 포함한다.The above-described embodiments of the present invention can be embodied in a general-purpose digital computer that can be embodied as a program that can be executed by a computer and operates the program using a computer-readable recording medium. The computer-readable recording medium includes a storage medium such as a magnetic storage medium (e.g., ROM, floppy disk, hard disk, etc.), optical reading medium (e.g., CD ROM,

이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.The present invention has been described with reference to the preferred embodiments. It will be understood by those skilled in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention as defined by the appended claims. Therefore, the disclosed embodiments should be considered in an illustrative rather than a restrictive sense. The scope of the present invention is defined by the appended claims rather than by the foregoing description, and all differences within the scope of equivalents thereof should be construed as being included in the present invention.

Claims (8)

DASH에서 레프리젠테이션을 재구성하는 방법으로서,
(a) 사용자들의 대역폭의 분포를 추정하는 단계; 및
(b) 이미 구성되어 있는 레프리젠테이션의 세트를 바탕으로, 상기 추정된 대역폭의 분포에 따라서 레프리젠테이션의 세트를 재구성하되, 여기서 상기 재구성하는 레프리젠테이션의 세트를 이루는 각 레프리젠테이션의 비트레이트를 상기 이미 구성되어 있는 레프리젠테이션의 세트에서 이미 결정되어 있는 이웃 순번의 레프리젠테이션의 비트레이트를 이용하여 결정하여, 레프리젠테이션의 세트를 재구성하는 단계를 포함하는 것을 특징으로 하는 레프리젠테이션 재구성 방법.
A method of reconstructing a representation in a DASH,
(a) estimating a distribution of users bandwidth; And
(b) reconstructing a set of representations according to the distribution of the estimated bandwidths, based on a set of representations already configured, wherein the bits of each representation constituting the set of representations of the reconstructed representations Determining a rate using a bit rate of a neighboring sequence of presentations already determined in the already set of presentations and reconstructing the set of presentations. Reconstruction method.
제1항에 있어서,
상기 (b) 단계는,
상기 추정된 대역폭의 분포와 레프리젠테이션의 세트에 따라 정해지는 사용자들의 대역폭 손실이 최소화되도록 레프리젠테이션의 세트를 재구성하는 것을 특징으로 하는 레프리젠테이션 재구성 방법.
The method according to claim 1,
The step (b)
Wherein the set of representations is reconstructed such that a bandwidth loss of users determined according to the estimated bandwidth distribution and a set of representations is minimized.
제1항에 있어서,
상기 (b) 단계는 반복적으로 수행되며, 이미 구성된 레프리젠테이션의 세트와 재구성된 레프리젠테이션의 세트가 동일할 때까지 반복되는 것을 특징으로 하는 레프리젠테이션 재구성 방법.
The method according to claim 1,
Wherein the step (b) is repeatedly performed until the set of the already configured presentation is the same as the set of the reconstructed representation.
삭제delete 제1항에 있어서,
상기 각 레프리젠테이션의 비트레이트를 결정함에 있어서 k 번째 레프리젠테이션의 비트레이트를 결정하는 것은, 이미 결정된 k-1 번째 레프리젠테이션의 비트레이트와 이미 결정된 k+1 번째 레프리젠테이션의 비트레이트 및 상기 추정된 대역폭의 분포에 따라서 결정하는 것을 특징으로 하는 레프리젠테이션 재구성 방법.
The method according to claim 1,
The determining of the bit rate of the k-th representation in determining the bit rate of each of the representations may include determining a bit rate of the (k-1) -th representation determined in step And a distribution of the estimated bandwidth.
제5항에 있어서,
상기 k 번째 레프리젠테이션의 비트레이트의 결정은 다음 수학식에 따라 이루어지는 것을 특징으로 하는 레프리젠테이션 재구성 방법.
Figure 112013117089789-pat00032
=0
여기서, rk, rk-1, 및 rk+1은 각각 k 번째 레프리젠테이션, 이미 결정된 k-1 번째 레프리젠테이션 및 이미 결정된 k+1 번째 레프리젠테이션의 비트레이트를 나타내고, u 및 σ는 각각 사용자들의 대역폭의 평균 및 분산을 나타내며, p(b)는 사용자들의 대역폭의 확률 밀도 함수를 나타냄.
6. The method of claim 5,
Wherein the determination of the bit rate of the k-th representation is performed according to the following equation.
Figure 112013117089789-pat00032
= 0
Here, r k , r k-1 , and r k + 1 represent the bit rates of the k-th representation, the already determined k-1-th representation and the already determined k + 1 -th representation, σ denotes the mean and variance of users 'bandwidths, and p (b) denotes the probability density function of users' bandwidths.
제1항에 있어서,
상기 (a) 단계에서 상기 대역폭의 분포를 추정하는 것은, 사용자들의 대역폭의 평균과 분산으로 정의되는 가우시안 분포로 추정하는 것을 특징으로 하는 레프리젠테이션 재구성 방법.
The method according to claim 1,
Wherein the estimation of the bandwidth distribution in step (a) is performed by a Gaussian distribution defined by an average and variance of bandwidths of users.
제1항 내지 제3항 및 제5항 내지 제7항 중 어느 한 항의 레프리젠테이션 재구성 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.A computer-readable recording medium having recorded thereon a program for executing the reproduction reconstruction method according to any one of claims 1 to 3 and 5 to 7.
KR20130160357A 2013-12-20 2013-12-20 Method of reorganizing representation in DASH KR101462557B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20130160357A KR101462557B1 (en) 2013-12-20 2013-12-20 Method of reorganizing representation in DASH

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20130160357A KR101462557B1 (en) 2013-12-20 2013-12-20 Method of reorganizing representation in DASH

Publications (1)

Publication Number Publication Date
KR101462557B1 true KR101462557B1 (en) 2014-11-27

Family

ID=52291795

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20130160357A KR101462557B1 (en) 2013-12-20 2013-12-20 Method of reorganizing representation in DASH

Country Status (1)

Country Link
KR (1) KR101462557B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111064997A (en) * 2018-10-16 2020-04-24 深圳市云帆加速科技有限公司 Resource pre-distribution method and device

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110120836A (en) * 2010-04-29 2011-11-04 이르데토 비.브이. Controlling an adaptive streaming of digital content
KR20130042612A (en) * 2010-08-10 2013-04-26 퀄컴 인코포레이티드 Media representation groups for network streaming of coded video data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110120836A (en) * 2010-04-29 2011-11-04 이르데토 비.브이. Controlling an adaptive streaming of digital content
KR20130042612A (en) * 2010-08-10 2013-04-26 퀄컴 인코포레이티드 Media representation groups for network streaming of coded video data

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Panagiotis Georgopoulos et al., "Towards network-wide QoE fairness using openflow-assisted adaptive video streaming", FhMN '13 Proceedings, ACM, Pages 15-20, 16 August 2013. *
Panagiotis Georgopoulos et al., "Towards network-wide QoE fairness using openflow-assisted adaptive video streaming", FhMN '13 Proceedings, ACM, Pages 15-20, 16 August 2013.*

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111064997A (en) * 2018-10-16 2020-04-24 深圳市云帆加速科技有限公司 Resource pre-distribution method and device
CN111064997B (en) * 2018-10-16 2021-11-16 深圳市云帆加速科技有限公司 Resource pre-distribution method and device

Similar Documents

Publication Publication Date Title
KR100988177B1 (en) Methods and systems for resizing multimedia content based on quality and rate information
JP5897447B2 (en) Method and system for resizing multimedia content based on quality and rate information
US11463750B2 (en) Method and apparatus for transmitting adaptive video in real time using content-aware neural network
CN108833996A (en) Service node selection, update and code rate adaptive approach in distributed DASH system
US11283854B2 (en) Method and system for providing variable quality streaming video services in mobile communication networks
Wang et al. A joint online transcoding and delivery approach for dynamic adaptive streaming
Gao et al. Video transcoding for adaptive bitrate streaming over edge-cloud continuum
CN107637046B (en) Method and apparatus for controlling multiple connections to increase data transfer rate
CN111263229A (en) Video distribution method and device and electronic equipment
KR102129115B1 (en) Method and apparatus for transmitting adaptive video in real time using content-aware neural network
KR102037413B1 (en) Method and Apparatus of Dynamic Buffering for Providing Streaming Service
Haouari et al. Transcoding resources forecasting and reservation for crowdsourced live streaming
KR101462557B1 (en) Method of reorganizing representation in DASH
CN101848224B (en) Network coding method for streaming media of peer-to-peer network
JPWO2013005478A1 (en) Content distribution system, content arrangement determination device, content arrangement determination method, and program
JP2018110361A (en) Information processing apparatus and information processing system
CN113099259A (en) Multicast transmission method, device, multicast server and medium for streaming media
Saleem et al. Stochastic QoE-aware optimization of multisource multimedia content delivery for mobile cloud
US20210144189A1 (en) Methods and systems for streaming media data over a content delivery network
Zhang et al. An Intelligent Learning Approach to Achieve Near-Second Low-Latency Live Video Streaming under Highly Fluctuating Networks
KR101462558B1 (en) Method of determining bandwidth for selecting representation in DASH
CN112533036A (en) Neural self-adaptive video stream multi-path transmission result determination method and system
KR101708266B1 (en) Apparatus and Method of Adaptive Streaming
US20230061526A1 (en) Adaptive Bitrate Algorithm Deployed at Edge Nodes
Xiong et al. Proactive Edge Computing for Video Streaming: A Mutual Conversion Model for Varying Requirements on Representations

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20171023

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20191105

Year of fee payment: 6