KR20220030736A - Method, system, and computer readable record medium to minimize delay in real-time live streaming - Google Patents

Method, system, and computer readable record medium to minimize delay in real-time live streaming Download PDF

Info

Publication number
KR20220030736A
KR20220030736A KR1020200112420A KR20200112420A KR20220030736A KR 20220030736 A KR20220030736 A KR 20220030736A KR 1020200112420 A KR1020200112420 A KR 1020200112420A KR 20200112420 A KR20200112420 A KR 20200112420A KR 20220030736 A KR20220030736 A KR 20220030736A
Authority
KR
South Korea
Prior art keywords
server
client
gop
audio
processor
Prior art date
Application number
KR1020200112420A
Other languages
Korean (ko)
Inventor
김영환
최해성
조희성
Original Assignee
라인플러스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 라인플러스 주식회사 filed Critical 라인플러스 주식회사
Priority to KR1020200112420A priority Critical patent/KR20220030736A/en
Priority to JP2021142379A priority patent/JP2022042997A/en
Priority to CN202111024798.XA priority patent/CN114143562A/en
Publication of KR20220030736A publication Critical patent/KR20220030736A/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/231Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion
    • H04N21/23106Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion involving caching operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23406Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving management of server-side video buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • H04N21/2402Monitoring of the downstream path of the transmission network, e.g. bandwidth available
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/262Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
    • H04N21/26208Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists the scheduling operation being performed under constraints
    • H04N21/26216Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists the scheduling operation being performed under constraints involving the channel capacity, e.g. network bandwidth

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

A method, system, and computer-readable recording medium to minimize delay in real-time live streaming are disclosed. In a real-time live streaming environment, at least two groups of pictures (GOPs) are cached for content received from a streamer, and a completed GOP is transmitted to a client through a cache as a packet beginning with an I-frame for the request of the client.

Description

실시간 라이브 스트리밍에서 지연을 최소화하기 위한 방법, 시스템, 및 컴퓨터 판독가능한 기록 매체{METHOD, SYSTEM, AND COMPUTER READABLE RECORD MEDIUM TO MINIMIZE DELAY IN REAL-TIME LIVE STREAMING}Method, system, and computer-readable recording medium for minimizing delay in real-time live streaming

아래의 설명은 실시간 라이브 스트리밍 환경에서 사용자가 체감하는 품질을 개선하는 기술에 관한 것이다.The description below relates to a technology for improving the quality experienced by users in a real-time live streaming environment.

실시간 라이브 스트리밍 서비스는 전송되는 각종 멀티미디어 데이터를 마치 끊임없고 지속적인 물의 흐름처럼 처리하는 기술을 의미할 수 있다.The real-time live streaming service may refer to a technology that processes various kinds of transmitted multimedia data as if it were a continuous and continuous flow of water.

실시간 라이브 스트리밍 기술은 인터넷의 성장과 함께 더욱 중요해지고 있으며, 그 이유 중 하나는 대부분의 사용자가 대용량 컨텐츠를 즉시 다운로드할 만큼 빠른 접속 회선을 가지고 있지 못하기 때문이다.Real-time live streaming technology is becoming more important with the growth of the Internet, one of the reasons is that most users do not have a fast enough connection line to download large amounts of content immediately.

이러한 상황에서 스트리밍 기술을 이용할 경우 파일이 모두 전송되기 전에라도 클라이언트 플레이어가 데이터의 표현을 시작할 수 있다.Streaming technology in such a situation allows the client player to start presenting data even before all files have been transferred.

예컨대, 한국 공개특허공보 제10-2006-0068547호(공개일 2006년 06월 21일)에는 스트리밍 서버와 클라이언트 간의 전송률을 고려한 실시간 스트리밍 서비스를 제공하는 기술이 개시되어 있다.For example, Korean Patent Laid-Open Publication No. 10-2006-0068547 (published on June 21, 2006) discloses a technology for providing a real-time streaming service in consideration of a transmission rate between a streaming server and a client.

실시간 라이브 스트리밍 플랫폼에서 사용자가 체감하는 품질 중 하나로서 플랫폼 상의 컨텐츠를 선택한 시점부터 플레이어의 실제 화면에 출력되기까지의 지연 시간을 최소화할 수 있는 방법과 시스템을 제공한다.As one of the qualities experienced by users in a real-time live streaming platform, a method and system are provided that can minimize the delay time from when the content on the platform is selected to output on the actual screen of the player.

지연 시간을 최소화하기 위한 캐시(cache) 과정에서 스트리머(streamer)로부터 전달된 영상 정보를 분석하여 비디오가 재생될 때 같이 재생되어야 하는 오디오를 찾아 해당 비디오와 오디오를 함께 저장할 수 있는 방법과 시스템을 제공한다.In the cache process to minimize latency, we analyze the video information delivered from the streamer to find the audio that should be played when the video is played, and a method and system that can store the video and audio together. to provide.

사용자가 선택한 컨텐츠에 대해 캐시를 통해 지연 시간을 최소화하고 즉시 재생 가능한 비디오와 오디오를 전달하되 플레이어에서의 동기화 이슈가 발생하지 않도록 처리하여 전달할 수 있는 방법과 시스템을 제공한다.We provide a method and system for delivering video and audio that can be played immediately with minimal latency through cache for user-selected content, but without causing synchronization issues in the player.

컴퓨터로 구현되는 서버에서 실행되는 방법에 있어서, 상기 서버는 메모리에 포함된 컴퓨터 판독가능한 명령들을 실행하도록 구성된 적어도 하나의 프로세서를 포함하고, 상기 방법은, 상기 적어도 하나의 프로세서에 의해, 실시간 라이브 스트리밍 환경에서 스트리머로부터 수신된 컨텐츠에 대해 적어도 둘 이상의 GOP(group of pictures)를 캐시하는 단계; 및 상기 적어도 하나의 프로세서에 의해, 클라이언트의 요청에 대해 I-프레임으로 시작되는 패킷으로서 캐시를 통해 완성된 GOP부터 상기 클라이언트로 전달하는 단계를 포함하는 방법을 제공한다.A method executed on a computer-implemented server, the server comprising at least one processor configured to execute computer readable instructions contained in a memory, the method comprising: by the at least one processor, real-time live streaming caching at least two groups of pictures (GOPs) for content received from a streamer in the environment; and forwarding, by the at least one processor, from a completed GOP to the client through a cache as an I-frame-initiated packet for the client's request.

일 측면에 따르면, 상기 서버와 관련된 관리자의 설정 또는 상기 서버와 상기 클라이언트 간의 네트워크 상태를 기초로 GOP 캐시 사이즈가 결정될 수 있다.According to one aspect, the GOP cache size may be determined based on a setting of an administrator related to the server or a network state between the server and the client.

다른 측면에 따르면, 상기 서버와 관련된 관리자의 설정 또는 상기 서버와 상기 클라이언트 간의 네트워크 상태를 기초로 전달 대상 GOP가 결정될 수 있다.According to another aspect, a delivery target GOP may be determined based on a setting of an administrator related to the server or a network state between the server and the client.

또 다른 측면에 따르면, 상기 전달하는 단계는, 상기 캐시를 통해 완성된 GOP가 복수 개인 경우 상기 클라이언트의 접속 시점을 기준으로 가장 최근에 완성된 GOP부터 상기 클라이언트로 전달할 수 있다.According to another aspect, in the delivering, when there are a plurality of GOPs completed through the cache, the most recently completed GOPs may be transferred to the client based on the access point of the client.

또 다른 측면에 따르면, 상기 전달하는 단계는, 상기 캐시를 통해 완성된 GOP가 복수 개인 경우 상기 서버와 상기 클라이언트 간의 네트워크 상태에 따라 상기 복수 개의 GOP 중 어느 하나의 GOP부터 상기 클라이언트로 전달할 수 있다.According to another aspect, in the delivering, when there are a plurality of GOPs completed through the cache, any one GOP among the plurality of GOPs may be delivered to the client according to a network state between the server and the client.

또 다른 측면에 따르면, 상기 전달하는 단계는, 상기 클라이언트의 GOP 수신 상태에 따라 일부 프레임을 소거하거나 스킵한 후 나머지 프레임을 전달하는 단계를 포함할 수 있다.According to another aspect, the transmitting may include transmitting the remaining frames after erasing or skipping some frames according to the GOP reception state of the client.

또 다른 측면에 따르면, 상기 캐시하는 단계는, 상기 컨텐츠의 비디오 스트림과 오디오 스트림의 분석을 통해 GOP에 대응되는 오디오 구간을 찾아 비디오 데이터와 오디오 데이터를 타임라인에 맞춰 정렬하는 단계를 포함할 수 있다.According to another aspect, the caching may include finding an audio section corresponding to a GOP through analysis of a video stream and an audio stream of the content and aligning the video data and the audio data with a timeline. .

또 다른 측면에 따르면, 상기 캐시하는 단계는, 비디오의 프레임 별로 데이터 타입을 분석하고 I-프레임 각각을 해당 I-프레임에 대응되는 오디오의 타임스탬프와 맞춰 비디오 데이터와 오디오 데이터를 그룹화하는 단계를 포함할 수 있다.According to another aspect, the caching includes grouping the video data and the audio data by analyzing the data type for each frame of the video and matching each I-frame with the timestamp of the audio corresponding to the corresponding I-frame. can do.

또 다른 측면에 따르면, 상기 전달하는 단계는, 비디오 데이터와 오디오 데이터를 패킷 단위의 데이터가 교차하는 형태로 재구성하여 전달할 수 있다.According to another aspect, in the transmitting, the video data and the audio data may be reconstructed and transmitted in a form in which data in a packet unit intersects.

또 다른 측면에 따르면, 상기 비디오 데이터와 상기 오디오 데이터의 크기에 기초하여 패킷 교차 개수가 결정될 수 있다.According to another aspect, the number of packet intersections may be determined based on sizes of the video data and the audio data.

상기 방법을 컴퓨터에 실행시키기 위한 프로그램이 기록되어 있는 컴퓨터 판독 가능한 기록 매체를 제공한다.There is provided a computer-readable recording medium in which a program for executing the method in a computer is recorded.

컴퓨터로 구현되는 서버에 있어서, 메모리에 포함된 컴퓨터 판독가능한 명령들을 실행하도록 구성된 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는, 실시간 라이브 스트리밍 환경에서 스트리머로부터 수신된 컨텐츠에 대해 적어도 둘 이상의 GOP를 캐시하는 과정; 및 클라이언트의 요청에 대해 I-프레임으로 시작되는 패킷으로서 캐시를 통해 완성된 GOP부터 상기 클라이언트로 전달하는 과정을 처리하는 서버를 제공한다.A computer-implemented server comprising: at least one processor configured to execute computer readable instructions contained in a memory, the at least one processor being configured to: The process of caching more GOPs; and a server that handles a process of transferring a packet starting with an I-frame to the client from a completed GOP through a cache in response to the client's request.

도 1은 본 발명의 일실시예에 따른 네트워크 환경의 예를 도시한 도면이다.
도 2는 본 발명의 일실시예에 있어서 전자 기기 및 서버의 내부 구성을 설명하기 위한 블록도이다.
도 3은 본 발명의 일실시예에 따른 실시간 라이브 스트리밍 환경의 예를 도시한 도면이다.
도 4는 본 발명의 일실시예에 따른 서버의 프로세서가 포함할 수 있는 구성요소의 예를 도시한 블록도이다.
도 5는 본 발명의 일실시예에 따른 서버가 수행할 수 있는 방법의 예를 도시한 흐름도이다.
도 6 내지 도 10은 본 발명의 일실시예에 있어서 스트림 캐시를 통한 GOP 전달 과정을 설명하기 위한 예시 도면이다.
도 11은 본 발명의 일실시예에 있어서 비디오와 오디오를 맞춰 보관하는 과정을 설명하기 위한 예시 도면이다.
도 12는 본 발명의 일실시예에 있어서 비디오와 오디오를 패킷 단위로 재구성하여 전송하는 과정을 설명하기 위한 예시 도면이다.
1 is a diagram illustrating an example of a network environment according to an embodiment of the present invention.
2 is a block diagram for explaining the internal configuration of an electronic device and a server according to an embodiment of the present invention.
3 is a diagram illustrating an example of a real-time live streaming environment according to an embodiment of the present invention.
4 is a block diagram illustrating an example of components that a processor of a server may include according to an embodiment of the present invention.
5 is a flowchart illustrating an example of a method that a server may perform according to an embodiment of the present invention.
6 to 10 are exemplary diagrams for explaining a GOP delivery process through a stream cache in an embodiment of the present invention.
11 is an exemplary diagram for explaining a process of storing video and audio together according to an embodiment of the present invention.
12 is an exemplary diagram for explaining a process of reconstructing and transmitting video and audio in packet units according to an embodiment of the present invention.

이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

본 발명의 실시예들은 실시간 라이브 스트리밍 환경에서 최적의 QoE(Quality of Experience)와 QoS(Quality of Service)를 지원하는 기술에 관한 것이다.Embodiments of the present invention relate to a technology for supporting optimal Quality of Experience (QoE) and Quality of Service (QoS) in a real-time live streaming environment.

본 명세서에서 구체적으로 개시되는 것들을 포함하는 실시예들은 실시간 라이브 스트리밍 플랫폼에서 사용자가 느끼는 중요한 품질 중의 하나로 플랫폼 상의 컨텐츠를 선택한 시점부터 플레이어의 실제 화면에 출력되기까지의 지연 시간을 최소화할 수 있다.Embodiments including those specifically disclosed herein can minimize the delay time from when the content on the platform is selected as one of the important qualities felt by the user in the real-time live streaming platform to being output to the actual screen of the player.

도 1은 본 발명의 일실시예에 따른 네트워크 환경의 예를 도시한 도면이다. 도 1의 네트워크 환경은 복수의 전자 기기들(110, 120, 130, 140), 복수의 서버들(150, 160) 및 네트워크(170)를 포함하는 예를 나타내고 있다. 이러한 도 1은 발명의 설명을 위한 일례로 전자 기기의 수나 서버의 수가 도 1과 같이 한정되는 것은 아니다.1 is a diagram illustrating an example of a network environment according to an embodiment of the present invention. The network environment of FIG. 1 shows an example including a plurality of electronic devices 110 , 120 , 130 , 140 , a plurality of servers 150 , 160 , and a network 170 . 1 is an example for explaining the invention, and the number of electronic devices or the number of servers is not limited as in FIG. 1 .

복수의 전자 기기들(110, 120, 130, 140)은 컴퓨터 시스템으로 구현되는 고정형 단말이거나 이동형 단말일 수 있다. 복수의 전자 기기들(110, 120, 130, 140)의 예를 들면, 스마트폰(smart phone), 휴대폰, 내비게이션, 컴퓨터, 노트북, 디지털방송용 단말, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 태블릿 PC, 게임 콘솔(game console), 웨어러블 디바이스(wearable device), IoT(internet of things) 디바이스, VR(virtual reality) 디바이스, AR(augmented reality) 디바이스 등이 있다. 일례로 도 1에서는 전자 기기(110)의 예로 스마트폰의 형상을 나타내고 있으나, 본 발명의 실시예들에서 전자 기기(110)는 실질적으로 무선 또는 유선 통신 방식을 이용하여 네트워크(170)를 통해 다른 전자 기기들(120, 130, 140) 및/또는 서버(150, 160)와 통신할 수 있는 다양한 물리적인 컴퓨터 시스템들 중 하나를 의미할 수 있다.The plurality of electronic devices 110 , 120 , 130 , and 140 may be a fixed terminal implemented as a computer system or a mobile terminal. Examples of the plurality of electronic devices 110 , 120 , 130 , 140 include a smart phone, a mobile phone, a navigation device, a computer, a notebook computer, a digital broadcasting terminal, a personal digital assistant (PDA), and a portable multimedia player (PMP). ), tablet PCs, game consoles, wearable devices, Internet of things (IoT) devices, virtual reality (VR) devices, augmented reality (AR) devices, and the like. As an example, in FIG. 1 , the shape of a smartphone is shown as an example of the electronic device 110 , but in embodiments of the present invention, the electronic device 110 is substantially different through the network 170 using a wireless or wired communication method. It may refer to one of various physical computer systems capable of communicating with the electronic devices 120 , 130 , 140 and/or the servers 150 and 160 .

통신 방식은 제한되지 않으며, 네트워크(170)가 포함할 수 있는 통신망(일례로, 이동통신망, 유선 인터넷, 무선 인터넷, 방송망, 위성망 등)을 활용하는 통신 방식뿐만 아니라 기기들간의 근거리 무선 통신 역시 포함될 수 있다. 예를 들어, 네트워크(170)는, PAN(personal area network), LAN(local area network), CAN(campus area network), MAN(metropolitan area network), WAN(wide area network), BBN(broadband network), 인터넷 등의 네트워크 중 하나 이상의 임의의 네트워크를 포함할 수 있다. 또한, 네트워크(170)는 버스 네트워크, 스타 네트워크, 링 네트워크, 메쉬 네트워크, 스타-버스 네트워크, 트리 또는 계층적(hierarchical) 네트워크 등을 포함하는 네트워크 토폴로지 중 임의의 하나 이상을 포함할 수 있으나, 이에 제한되지 않는다.The communication method is not limited, and a communication method using a communication network (eg, a mobile communication network, a wired Internet, a wireless Internet, a broadcasting network, a satellite network, etc.) that the network 170 may include, as well as a short-distance wireless communication between devices may be included. can For example, the network 170 may include a personal area network (PAN), a local area network (LAN), a campus area network (CAN), a metropolitan area network (MAN), a wide area network (WAN), and a broadband network (BBN). , the Internet, and the like. In addition, the network 170 may include any one or more of a network topology including a bus network, a star network, a ring network, a mesh network, a star-bus network, a tree or a hierarchical network, etc. not limited

서버(150, 160) 각각은 복수의 전자 기기들(110, 120, 130, 140)과 네트워크(170)를 통해 통신하여 명령, 코드, 파일, 컨텐츠, 서비스 등을 제공하는 컴퓨터 장치 또는 복수의 컴퓨터 장치들로 구현될 수 있다. 예를 들어, 서버(150)는 네트워크(170)를 통해 접속한 복수의 전자 기기들(110, 120, 130, 140)로 제1 서비스를 제공하는 시스템일 수 있으며, 서버(160) 역시 네트워크(170)를 통해 접속한 복수의 전자 기기들(110, 120, 130, 140)로 제2 서비스를 제공하는 시스템일 수 있다. 보다 구체적인 예로, 서버(150)는 복수의 전자 기기들(110, 120, 130, 140)에 설치되어 구동되는 컴퓨터 프로그램으로서의 어플리케이션을 통해, 해당 어플리케이션이 목적하는 서비스(일례로, 실시간 라이브 스트리밍 서비스 등)를 제1 서비스로서 복수의 전자 기기들(110, 120, 130, 140)로 제공할 수 있다. 다른 예로, 서버(160)는 상술한 어플리케이션의 설치 및 구동을 위한 파일을 복수의 전자 기기들(110, 120, 130, 140)로 배포하는 서비스를 제2 서비스로서 제공할 수 있다.Each of the servers 150 and 160 communicates with the plurality of electronic devices 110 , 120 , 130 , 140 and the network 170 through a computer device or a plurality of computers that provides commands, codes, files, contents, services, etc. It can be implemented in devices. For example, the server 150 may be a system that provides a first service to a plurality of electronic devices 110 , 120 , 130 , 140 connected through the network 170 , and the server 160 is also a network ( It may be a system that provides the second service to the plurality of electronic devices 110 , 120 , 130 , and 140 connected through 170 . As a more specific example, the server 150 is installed on the plurality of electronic devices 110 , 120 , 130 , and 140 through an application as a computer program that is driven, and a service (eg, real-time live streaming service, etc.) ) may be provided to the plurality of electronic devices 110 , 120 , 130 , and 140 as a first service. As another example, the server 160 may provide a service for distributing a file for installing and driving the above-described application to the plurality of electronic devices 110 , 120 , 130 , and 140 as the second service.

도 2는 본 발명의 일실시예에 있어서 전자 기기 및 서버의 내부 구성을 설명하기 위한 블록도이다. 도 2에서는 전자 기기에 대한 예로서 전자 기기(110), 그리고 서버(150)의 내부 구성을 설명한다. 또한, 다른 전자 기기들(120, 130, 140)이나 서버(160) 역시 상술한 전자 기기(110) 또는 서버(150)와 동일한 또는 유사한 내부 구성을 가질 수 있다.2 is a block diagram for explaining the internal configuration of an electronic device and a server according to an embodiment of the present invention. In FIG. 2 , the internal configuration of the electronic device 110 and the server 150 will be described as an example of the electronic device. In addition, other electronic devices 120 , 130 , 140 or server 160 may also have the same or similar internal configuration to the aforementioned electronic device 110 or server 150 .

전자 기기(110)와 서버(150)는 메모리(211, 221), 프로세서(212, 222), 통신 모듈(213, 223) 그리고 입출력 인터페이스(214, 224)를 포함할 수 있다. 메모리(211, 221)는 컴퓨터 판독가능한 기록매체로서, RAM(random access memory), ROM(read only memory), 디스크 드라이브, SSD(solid state drive), 플래시 메모리(flash memory) 등과 같은 비소멸성 대용량 저장 장치(permanent mass storage device)를 포함할 수 있다. 여기서 ROM, SSD, 플래시 메모리, 디스크 드라이브 등과 같은 비소멸성 대용량 저장 장치는 메모리(211, 221)와는 구분되는 별도의 영구 저장 장치로서 전자 기기(110)나 서버(150)에 포함될 수도 있다. 또한, 메모리(211, 221)에는 운영체제와 적어도 하나의 프로그램 코드(일례로 전자 기기(110)에 설치되어 구동되는 브라우저나 특정 서비스의 제공을 위해 전자 기기(110)에 설치된 어플리케이션 등을 위한 코드)가 저장될 수 있다. 이러한 소프트웨어 구성요소들은 메모리(211, 221)와는 별도의 컴퓨터에서 판독가능한 기록매체로부터 로딩될 수 있다. 이러한 별도의 컴퓨터에서 판독가능한 기록매체는 플로피 드라이브, 디스크, 테이프, DVD/CD-ROM 드라이브, 메모리 카드 등의 컴퓨터에서 판독가능한 기록매체를 포함할 수 있다. 다른 실시예에서 소프트웨어 구성요소들은 컴퓨터에서 판독가능한 기록매체가 아닌 통신 모듈(213, 223)을 통해 메모리(211, 221)에 로딩될 수도 있다. 예를 들어, 적어도 하나의 프로그램은 개발자들 또는 어플리케이션의 설치 파일을 배포하는 파일 배포 시스템(일례로, 상술한 서버(160))이 네트워크(170)를 통해 제공하는 파일들에 의해 설치되는 컴퓨터 프로그램(일례로 상술한 어플리케이션)에 기반하여 메모리(211, 221)에 로딩될 수 있다.The electronic device 110 and the server 150 may include memories 211 and 221 , processors 212 and 222 , communication modules 213 and 223 , and input/output interfaces 214 and 224 . The memories 211 and 221 are computer-readable recording media, and non-volatile mass storage such as random access memory (RAM), read only memory (ROM), disk drive, solid state drive (SSD), flash memory, etc. It may include a permanent mass storage device. Here, a non-volatile mass storage device such as a ROM, SSD, flash memory, disk drive, etc. may be included in the electronic device 110 or the server 150 as a separate permanent storage device distinct from the memories 211 and 221 . In addition, in the memories 211 and 221 , an operating system and at least one program code (eg, a browser installed and driven in the electronic device 110 or codes for an application installed in the electronic device 110 to provide a specific service) can be stored. These software components may be loaded from a computer-readable recording medium separate from the memories 211 and 221 . The separate computer-readable recording medium may include a computer-readable recording medium such as a floppy drive, a disk, a tape, a DVD/CD-ROM drive, and a memory card. In another embodiment, the software components may be loaded into the memories 211 and 221 through the communication modules 213 and 223 rather than the computer-readable recording medium. For example, the at least one program is a computer program installed by files provided through the network 170 by a file distribution system (eg, the above-described server 160 ) for distributing installation files of developers or applications. It may be loaded into the memories 211 and 221 based on (eg, the above-described application).

프로세서(212, 222)는 기본적인 산술, 로직 및 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(211, 221) 또는 통신 모듈(213, 223)에 의해 프로세서(212, 222)로 제공될 수 있다. 예를 들어 프로세서(212, 222)는 메모리(211, 221)와 같은 기록 장치에 저장된 프로그램 코드에 따라 수신되는 명령을 실행하도록 구성될 수 있다.The processors 212 and 222 may be configured to process instructions of a computer program by performing basic arithmetic, logic, and input/output operations. Commands may be provided to the processors 212 and 222 by the memories 211 and 221 or the communication modules 213 and 223 . For example, the processors 212 and 222 may be configured to execute received instructions according to program codes stored in a recording device such as the memories 211 and 221 .

통신 모듈(213, 223)은 네트워크(170)를 통해 전자 기기(110)와 서버(150)가 서로 통신하기 위한 기능을 제공할 수 있으며, 전자 기기(110) 및/또는 서버(150)가 다른 전자 기기(일례로 전자 기기(120)) 또는 다른 서버(일례로 서버(160))와 통신하기 위한 기능을 제공할 수 있다. 일례로, 전자 기기(110)의 프로세서(212)가 메모리(211)와 같은 기록 장치에 저장된 프로그램 코드에 따라 생성한 요청이 통신 모듈(213)의 제어에 따라 네트워크(170)를 통해 서버(150)로 전달될 수 있다. 역으로, 서버(150)의 프로세서(222)의 제어에 따라 제공되는 제어 신호나 명령, 컨텐츠, 파일 등이 통신 모듈(223)과 네트워크(170)를 거쳐 전자 기기(110)의 통신 모듈(213)을 통해 전자 기기(110)로 수신될 수 있다. 예를 들어 통신 모듈(213)을 통해 수신된 서버(150)의 제어 신호나 명령, 컨텐츠, 파일 등은 프로세서(212)나 메모리(211)로 전달될 수 있고, 컨텐츠나 파일 등은 전자 기기(110)가 더 포함할 수 있는 저장 매체(상술한 영구 저장 장치)로 저장될 수 있다.The communication modules 213 and 223 may provide a function for the electronic device 110 and the server 150 to communicate with each other through the network 170 , and the electronic device 110 and/or the server 150 may communicate with each other through the network 170 . A function for communicating with an electronic device (eg, the electronic device 120 ) or another server (eg, the server 160 ) may be provided. For example, a request generated by the processor 212 of the electronic device 110 according to a program code stored in a recording device such as the memory 211 is transmitted to the server 150 through the network 170 under the control of the communication module 213 . ) can be transferred. Conversely, a control signal, command, content, file, etc. provided under the control of the processor 222 of the server 150 passes through the communication module 223 and the network 170 to the communication module 213 of the electronic device 110 . ) through the electronic device 110 . For example, a control signal, command, content, file, etc. of the server 150 received through the communication module 213 may be transmitted to the processor 212 or the memory 211 , and the content or file may be transmitted to the electronic device ( 110) may be stored as a storage medium (the above-described permanent storage device) that may further include.

입출력 인터페이스(214)는 입출력 장치(215)와의 인터페이스를 위한 수단일 수 있다. 예를 들어, 입력 장치는 키보드, 마우스, 마이크로폰, 카메라 등의 장치를, 그리고 출력 장치는 디스플레이, 스피커, 햅틱 피드백 디바이스(haptic feedback device) 등과 같은 장치를 포함할 수 있다. 다른 예로 입출력 인터페이스(214)는 터치스크린과 같이 입력과 출력을 위한 기능이 하나로 통합된 장치와의 인터페이스를 위한 수단일 수도 있다. 입출력 장치(215)는 전자 기기(110)와 하나의 장치로 구성될 수도 있다. 또한, 서버(150)의 입출력 인터페이스(224)는 서버(150)와 연결되거나 서버(150)가 포함할 수 있는 입력 또는 출력을 위한 장치(미도시)와의 인터페이스를 위한 수단일 수 있다. 보다 구체적인 예로, 전자 기기(110)의 프로세서(212)가 메모리(211)에 로딩된 컴퓨터 프로그램의 명령을 처리함에 있어서 서버(150)나 전자 기기(120)가 제공하는 데이터를 이용하여 구성되는 서비스 화면이나 컨텐츠가 입출력 인터페이스(214)를 통해 디스플레이에 표시될 수 있다.The input/output interface 214 may be a means for interfacing with the input/output device 215 . For example, the input device may include a device such as a keyboard, mouse, microphone, camera, and the like, and the output device may include a device such as a display, a speaker, a haptic feedback device, and the like. As another example, the input/output interface 214 may be a means for an interface with a device in which functions for input and output are integrated into one, such as a touch screen. The input/output device 215 may be configured as one device with the electronic device 110 . In addition, the input/output interface 224 of the server 150 may be a means for interfacing with a device (not shown) for input or output that is connected to the server 150 or that the server 150 may include. As a more specific example, a service configured using data provided by the server 150 or the electronic device 120 when the processor 212 of the electronic device 110 processes a command of a computer program loaded into the memory 211 . A screen or content may be displayed on the display through the input/output interface 214 .

또한, 다른 실시예들에서 전자 기기(110) 및 서버(150)는 도 2의 구성요소들보다 더 많은 구성요소들을 포함할 수도 있다. 그러나, 대부분의 종래기술적 구성요소들을 명확하게 도시할 필요성은 없다. 예를 들어, 전자 기기(110)는 상술한 입출력 장치(215) 중 적어도 일부를 포함하도록 구현되거나 또는 트랜시버(transceiver), GPS(Global Positioning System) 모듈, 카메라, 각종 센서, 데이터베이스 등과 같은 다른 구성요소들을 더 포함할 수도 있다. 보다 구체적인 예로, 전자 기기(110)가 스마트폰인 경우, 일반적으로 스마트폰이 포함하고 있는 가속도 센서나 자이로 센서, 카메라 모듈, 각종 물리적인 버튼, 터치패널을 이용한 버튼, 입출력 포트, 진동을 위한 진동기 등의 다양한 구성요소들이 전자 기기(110)에 더 포함되도록 구현될 수 있다.In addition, in other embodiments, the electronic device 110 and the server 150 may include more components than those of FIG. 2 . However, there is no need to clearly show most of the prior art components. For example, the electronic device 110 is implemented to include at least a portion of the above-described input/output device 215 or other components such as a transceiver, a global positioning system (GPS) module, a camera, various sensors, and a database. may include more. As a more specific example, when the electronic device 110 is a smart phone, an acceleration sensor or a gyro sensor, a camera module, various physical buttons, a button using a touch panel, an input/output port, and a vibrator for vibration generally included in the smart phone Various components such as may be implemented to be further included in the electronic device 110 .

이하에서는 실시간 라이브 스트리밍 환경에서 사용자가 체감하는 지연 시간을 최소화할 수 있는 방법 및 시스템의 구체적인 실시예를 설명하기로 한다.Hereinafter, specific embodiments of a method and system capable of minimizing the delay time experienced by a user in a real-time live streaming environment will be described.

도 3은 본 발명의 일실시예에 따른 실시간 라이브 스트리밍 환경의 예를 도시한 도면이다.3 is a diagram illustrating an example of a real-time live streaming environment according to an embodiment of the present invention.

도 3은 실시간 라이브 스트리밍 환경의 일례로, 클라이언트(310), CP(Contents Provider)(320), 및 서버(350)를 포함하는 컨텐츠 딜리버리 네트워크(CDN, Contents Delivery Network) 서비스 환경을 나타내고 있다. 서버(350)는 도 1과 도 2를 통해 설명한 서버(150)와 대응될 수 있고, 클라이언트(310)와 CP(320)는 도 1과 도 2를 통해 설명한 전자 기기(110, 120, 130, 140 중 어느 하나)와 대응될 수 있다.FIG. 3 illustrates a content delivery network (CDN) service environment including a client 310 , a content provider (CP) 320 , and a server 350 as an example of a real-time live streaming environment. The server 350 may correspond to the server 150 described with reference to FIGS. 1 and 2 , and the client 310 and the CP 320 are the electronic devices 110 , 120 , 130 , described with reference to FIGS. 1 and 2 . 140) and may correspond.

CDN 서비스는 실시간 라이브 스트리밍 환경의 서비스로서, ISP(Internet Service Provider)의 네트워크 하단에 설치된 여러 대의 서버(350)에 송출자(streamer)에 해당되는 CP(320)가 제공하는 컨텐츠를 미리 저장한 후 시청자(viewer)에 해당되는 클라이언트(310)로부터 요청이 있을 때 해당 컨텐츠를 클라이언트(310)로 전달하는 체계로 운영된다.The CDN service is a service of a real-time live streaming environment, and after storing the contents provided by the CP 320 corresponding to the streamer in several servers 350 installed at the bottom of the network of the Internet Service Provider (ISP) in advance, When there is a request from the client 310 corresponding to a viewer, the system is operated to deliver the corresponding content to the client 310 .

클라이언트(310) 측의 플레이어(player)는 사용자가 플랫폼 상에서 선택한 컨텐츠를 서버(350)로부터 수신한 후 수신된 컨텐츠를 출력 장치(디스플레이, 스피커 등)를 통해 출력하여 재생할 수 있다.A player on the client 310 side receives the content selected by the user on the platform from the server 350 and then outputs the received content through an output device (display, speaker, etc.) to play it.

상기한 실시간 라이브 스트리밍 환경에서 사용자가 느끼는 품질 중의 하나로 플랫폼 상의 컨텐츠를 선택한 시점부터 플레이어의 화면에 실제 나오기까지의 지연 시간이 있다.As one of the qualities perceived by the user in the real-time live streaming environment, there is a delay time from when the content on the platform is selected to actually appearing on the screen of the player.

본 발명의 실시예들은 상기한 지연 시간을 최소화할 수 있는 기술을 포함할 수 있고, 아울러 지연 시간을 최소화하기 위해 적용되는 기술의 부작용을 제거할 수 있는 기술을 포함할 수 있다.Embodiments of the present invention may include a technique capable of minimizing the delay time described above, and may also include a technique capable of removing a side effect of a technique applied to minimize the delay time.

도 4는 본 발명의 일실시예에 따른 서버의 프로세서가 포함할 수 있는 구성요소의 예를 도시한 블록도이고, 도 5는 본 발명의 일실시예에 따른 서버가 수행할 수 있는 방법의 예를 도시한 흐름도이다.4 is a block diagram illustrating an example of components that a processor of a server may include according to an embodiment of the present invention, and FIG. 5 is an example of a method that the server may perform according to an embodiment of the present invention is a flowchart showing

본 실시예에 따른 서버(350)는 실시간 라이브 스트리밍 환경에서 CP(320)가 제공하는 컨텐츠를 클라이언트(310)로 전달하는 캐시 서버 역할을 한다. 서버(350)에는 컴퓨터로 구현된 실시간 라이브 스트리밍 시스템이 구성될 수 있다. 서버(350)는 클라이언트(310)를 대상으로 클라이언트(310) 상에 설치된 전용 어플리케이션이나 서버(350)와 관련된 웹/모바일 사이트 접속을 통해 실시간 라이브 스트리밍 서비스를 제공할 수 있다.The server 350 according to the present embodiment serves as a cache server that delivers the content provided by the CP 320 to the client 310 in a real-time live streaming environment. The server 350 may be configured with a computer-implemented real-time live streaming system. The server 350 may provide a real-time live streaming service to the client 310 through a dedicated application installed on the client 310 or a web/mobile site connection related to the server 350 .

서버(350)의 프로세서(222)는 도 5에 따른 실시간 라이브 스트리밍 방법을 수행하기 위한 구성요소로서 도 4에 도시된 바와 같이, 스트림 수신부(410), 스트림 캐시부(420), 오디오 비디오 분석부(430), 및 스트림 전송부(440)를 포함할 수 있다. 실시예에 따라 프로세서(222)의 구성요소들은 선택적으로 프로세서(222)에 포함되거나 제외될 수도 있다. 또한, 실시예에 따라 프로세서(222)의 구성요소들은 프로세서(222)의 기능의 표현을 위해 분리 또는 병합될 수도 있다.The processor 222 of the server 350 is a component for performing the real-time live streaming method according to FIG. 5 , and as shown in FIG. 4 , a stream receiving unit 410 , a stream cache unit 420 , and an audio video analyzing unit 430 , and a stream transmission unit 440 . Depending on the embodiment, components of the processor 222 may be selectively included in or excluded from the processor 222 . In addition, according to an embodiment, the components of the processor 222 may be separated or combined to express the functions of the processor 222 .

이러한 프로세서(222) 및 프로세서(222)의 구성요소들은 도 4의 실시간 라이브 스트리밍 방법이 포함하는 단계들(S510 내지 S540)을 수행하도록 서버(350)를 제어할 수 있다. 예를 들어, 프로세서(222) 및 프로세서(222)의 구성요소들은 메모리(221)가 포함하는 운영체제의 코드와 적어도 하나의 프로그램의 코드에 따른 명령(instruction)을 실행하도록 구현될 수 있다.The processor 222 and components of the processor 222 may control the server 350 to perform steps S510 to S540 included in the real-time live streaming method of FIG. 4 . For example, the processor 222 and components of the processor 222 may be implemented to execute instructions according to the code of the operating system included in the memory 221 and the code of at least one program.

여기서, 프로세서(222)의 구성요소들은 서버(350)에 저장된 프로그램 코드가 제공하는 명령에 따라 프로세서(222)에 의해 수행되는 서로 다른 기능들(different functions)의 표현들일 수 있다. 예를 들어, 서버(350)가 CP(320)로부터 컨텐츠의 스트림을 수신하도록 상술한 명령에 따라 서버(350)를 제어하는 프로세서(222)의 기능적 표현으로서 스트림 수신부(410)가 이용될 수 있다.Here, the components of the processor 222 may be expressions of different functions performed by the processor 222 according to an instruction provided by the program code stored in the server 350 . For example, the stream receiving unit 410 may be used as a functional representation of the processor 222 that controls the server 350 according to the above-described command so that the server 350 receives a stream of content from the CP 320 . .

프로세서(222)는 서버(350)의 제어와 관련된 명령이 로딩된 메모리(221)로부터 필요한 명령을 읽어들일 수 있다. 이 경우, 상기 읽어들인 명령은 프로세서(222)가 이후 설명될 단계들(S510 내지 S540)을 실행하도록 제어하기 위한 명령을 포함할 수 있다.The processor 222 may read a necessary command from the memory 221 in which the command related to the control of the server 350 is loaded. In this case, the read command may include a command for controlling the processor 222 to execute steps S510 to S540 to be described later.

이후 설명될 단계들(S510 내지 S540)은 도 5에 도시된 순서와 다른 순서로 수행될 수 있으며, 단계들(S510 내지 S540) 중 일부가 생략되거나 추가의 과정이 더 포함될 수 있다.Steps S510 to S540 to be described later may be performed in an order different from that shown in FIG. 5 , and some of the steps S510 to S540 may be omitted or additional processes may be further included.

도 5를 참조하면, 단계(S510)에서 스트림 수신부(410)는 실시간 라이브 스트리밍 플랫폼을 통해 스트리머인 CP(320)가 제공하는 컨텐츠의 스트림을 수신할 수 있다.Referring to FIG. 5 , in step S510 , the stream receiving unit 410 may receive a stream of content provided by the streamer CP 320 through a real-time live streaming platform.

단계(S520)에서 스트림 캐시부(420)는 단계(S510)에서 수신된 컨텐츠에 대하여 비디오 스트림을 GOP(group of pictures) 단위로 캐시할 수 있다. 비디오는 I-프레임(intra frame), P-프레임(predicted frame), B-프레임(bidirectional frame)으로 구성되어 있고, 재생을 시작하기 위해서는 최소 하나의 I-프레임이 반드시 필요하다. 스트림 캐시부(420)는 클라이언트(310)의 요청에 대응하여 I-프레임으로 시작되는 패킷을 전달하기 위해 비디오 스트림을 GOP 단위로 캐시할 수 있다.In operation S520 , the stream cache unit 420 may cache the video stream for the content received in operation S510 in units of group of pictures (GOP). A video consists of an I-frame (intra frame), a P-frame (predicted frame), and a B-frame (bidirectional frame), and at least one I-frame is absolutely necessary to start playback. The stream cache unit 420 may cache the video stream in units of GOPs in response to the request of the client 310 to deliver a packet starting with an I-frame.

단계(S530)에서 오디오 비디오 분석부(430)는 비디오 스트림과 오디오 스트림의 분석을 통해 GOP 단위에 대응되는 오디오 구간을 찾아 해당 비디오와 함께 저장할 수 있다. 클라이언트(310)를 대상으로 비디오 스트림을 I-프레임으로 시작되는 GOP 단위로 전달함에 따라 발생할 수 있는 부작용을 해결하기 위해, 오디오 비디오 분석부(430)는 GOP 단위의 비디오와 해당 비디오에 대응되는 오디오 구간을 찾아 비디오와 오디오를 맞춰서 정렬 및 보관할 수 있다.In step S530, the audio/video analysis unit 430 may find an audio section corresponding to the GOP unit through analysis of the video stream and the audio stream and store it together with the corresponding video. In order to solve the side effects that may occur when the video stream is delivered to the client 310 in units of GOP starting with I-frames, the audio/video analysis unit 430 performs GOP unit video and audio corresponding to the video. You can find segments, align and archive video and audio.

단계(S540)에서 스트림 전송부(440)는 클라이언트(310)의 요청에 따라 GOP 단위의 비디오 스트림을 오디오와 함께 클라이언트(310)의 플레이어로 전송할 수 있다. 스트림 전송부(440)는 캐시된 GOP 단위의 비디오와 해당 비디오와 대응되는 구간의 오디오를 클라이언트(310)의 플레이어로 전달함에 있어 비디오와 오디오를 데이터 전송 최소 단위인 패킷 단위로 교차 편집한 형태로 전달할 수 있다. 비디오 스트림을 GOP 단위로 전달함에 따라 발생할 수 있는 부작용을 해결하기 위해 비디오와 오디오가 패킷 단위로 교차되도록 재구성하여 클라이언트(310)의 플레이어로 전달할 수 있다.In step S540 , the stream transmission unit 440 may transmit a GOP unit video stream together with audio to the player of the client 310 according to the request of the client 310 . The stream transmission unit 440 transmits the cached GOP unit video and the audio of the section corresponding to the video to the player of the client 310, in the form of cross-editing the video and audio in packet units, which are the smallest data transmission units. can transmit In order to solve a side effect that may occur when the video stream is delivered in units of GOPs, video and audio may be reconstructed so that they intersect in units of packets and delivered to the player of the client 310 .

이하에서는 구체적인 예시를 통해 실시간 라이브 스트리밍 과정을 설명하기로 한다.Hereinafter, a real-time live streaming process will be described with a specific example.

일반적으로, 비디오는 I-프레임, P-프레임, B-프레임이 일정한 패턴으로 반복되는 형태를 가지며, 하나의 이미지 프레임 그룹, 즉 GOP 단위로 인코딩될 수 있다. 도 6을 참조하면, 하나의 GOP는 I-프레임, P-프레임, B-프레임을 포함하며, I-프레임과 I-프레임 사이에 B-프레임과 P-프레임이 나열된다. 다시 말해, I-프레임으로 시작되는 연속적인 프레임들의 집합을 GOP라고 한다. 경우에 따라서는 B-프레임 없이 I-프레임과 P-프레임만으로 GOP가 이루어질 수도 있다.In general, a video has a form in which I-frames, P-frames, and B-frames are repeated in a constant pattern, and may be encoded in one image frame group, that is, GOP unit. Referring to FIG. 6 , one GOP includes an I-frame, a P-frame, and a B-frame, and B-frames and P-frames are arranged between I-frames and I-frames. In other words, a set of consecutive frames starting with an I-frame is called a GOP. In some cases, the GOP may be performed only with the I-frame and the P-frame without the B-frame.

I-프레임은 키프레임(key frame)을 의미하고, GOP의 기준이 되는 핵심 프레임에 해당된다. 모든 GOP의 첫 프레임은 반드시 I-프레임으로 시작된다. I-프레임은 이전 다른 프레임을 참조하지 않고 원본 그대로 저장된 프레임이다. 그리고, P-프레임은 순방향 예측 프레임으로, 바로 이전에 위치한 I-프레임을 기준으로 차이가 나는 부분 데이터를 예측하여 저장한 프레임이다. 마지막으로, B-프레임은 양방향 예측 프레임으로, I-프레임과 P-프레임 사이에 위치하며 양쪽 프레임 모두를 참조하여 두 프레임 사이의 움직임을 추측 데이터로 저장한 프레임이다.The I-frame means a key frame and corresponds to a key frame that is the basis of the GOP. The first frame of every GOP must start with an I-frame. I-frames are frames stored as-is without reference to other previous frames. In addition, the P-frame is a forward prediction frame, and is a frame in which partial data having a difference is predicted based on the I-frame located immediately before and stored. Finally, the B-frame is a bidirectional prediction frame, which is located between the I-frame and the P-frame and stores motion between the two frames as speculative data with reference to both frames.

도 7에 도시한 바와 같이, 컨텐츠 시청을 위해 클라이언트(310)가 서버(350)에 접속되는 시점(ⓐ)은 대부분 클라이언트(310)의 접속 시 생성되고 있는 GOP의 중간에 걸치게 되고 해당 지점부터 스트림을 전달받게 될 가능성이 높다. 예를 들어, GOP1이 생성되고 있는 도중에 접속되는 경우 클라이언트(310)는 접속 시점(ⓐ) 직후부터의 스트림을 수신하게 되는데, 이후 새로운 GOP(GOP2)의 비디오 시작 패킷, 즉 I-프레임(I_2)을 수신하기 전까지 시청자는 플레이어 화면을 통해 아무것도 볼 수 없어 지연을 체감하게 된다.As shown in FIG. 7 , the time point (ⓐ) at which the client 310 is connected to the server 350 for content viewing is mostly in the middle of the GOP being generated when the client 310 is connected, and from that point It is highly likely that you will receive a stream. For example, if GOP1 is connected while being generated, the client 310 receives the stream immediately after the access point (ⓐ), and thereafter, the video start packet of the new GOP (GOP2), that is, I-frame (I_2) The viewer experiences a delay as they cannot see anything through the player screen until they receive it.

이러한 지연 시간을 최소화하기 위해 서버(350)에서는 GOP 단위의 캐시를 실장한다. 본 실시예에서는 클라이언트(310)의 접속 시점 직후의 스트림부터 전달하는 것이 아니라, 비디오 스트림 캐시를 통해 I-프레임으로 시작되는 GOP로 가장 최근에 캐시된 완전한 GOP를 전달함으로써 지연 시간을 최소화할 수 있다. 클라이언트(310)는 GOP 단위의 비디오 스트림으로서 I-프레임부터 수신함으로써 플레이어에서 비디오를 즉시 재생할 수 있다.In order to minimize this delay time, the server 350 mounts a GOP unit cache. In this embodiment, the delay time can be minimized by delivering the most recently cached complete GOP to the GOP starting with the I-frame through the video stream cache, not from the stream immediately after the connection point of the client 310. . The client 310 can immediately play the video in the player by receiving from I-frames as a video stream in GOP units.

본 실시예에서는 서버 관리자의 설정이나 클라이언트(310)와 서버(350) 간의 네트워크 상태 등을 고려하여 비디오 스트림에 대한 캐시 사이즈를 지정할 수 있다.In the present embodiment, a cache size for a video stream may be designated in consideration of a server administrator setting or a network state between the client 310 and the server 350 .

비디오 스트림 캐시 과정에서 새로운 GOP를 업데이트할 때 캐시된 GOP 중 가장 먼저 완성된 하나의 GOP를 버리는 방식으로 이루어진다.When updating a new GOP in the video stream caching process, the first completed GOP among the cached GOPs is discarded.

도 8을 참조하면, 사이즈가 1인 캐시(701)의 경우 하나의 GOP가 완성되기 이전에 클라이언트(310)가 접속되는 경우, 즉 GOP 캐시 도중에 접속되는 경우 GOP가 완성될 때까지 스트림 전달이 되지 않아 시청자는 여전히 지연을 느끼게 된다. 이는, 하나의 I-프레임이 GOP로 완성되기 이전에 접속되는 경우 접속 시점부터 GOP가 완성되어 네트워크를 통해 클라이언트(310)에게 전달되기까지의 지연이 그대로 노출되기 때문이다.Referring to FIG. 8 , in the case of a cache 701 having a size of 1, if the client 310 is connected before one GOP is completed, that is, if it is connected during the GOP cache, the stream is not delivered until the GOP is completed. As a result, viewers still feel the delay. This is because, when one I-frame is accessed before being completed as a GOP, the delay from the time of access until the GOP is completed and delivered to the client 310 through the network is exposed as it is.

이러한 문제를 방지하기 위해, 본 실시예에서는 적어도 둘 이상의 GOP를 캐시할 수 있도록 사이즈가 2 이상인 캐시(702)를 적용할 수 있다. 다시 말해, GOP 캐시 사이즈를 적어도 2 이상으로 지정할 수 있으며, 클라이언트(310)의 접속 시점을 기준으로 어느 GOP를 전달할 것인지 또한 설정 가능하다.In order to prevent such a problem, in the present embodiment, a cache 702 having a size of 2 or more may be applied so that at least two or more GOPs can be cached. In other words, the size of the GOP cache may be specified as at least 2 or more, and it is also possible to set which GOP will be delivered based on the access point of the client 310 .

예를 들어, GOP 캐시 사이즈를 2로 지정하고 마지막으로 완성된 GOP부터 접근하도록 지정될 수 있다. 도 9에 도시한 바와 같이, 캐시(702)에 GOP1이 완성되고 GOP2는 캐시 진행 중이라 가정하면, 클라이언트(310)가 ⓑ 시점에 접근하더라도 완성된 GOP인 GOP1부터 수신하여 즉시 재생 가능하므로 캐시 진행 중인 GOP2가 완성되어 전달될 때까지의 지연 시간을 제거할 수 있다.For example, it may be specified to set the GOP cache size to 2 and access from the last completed GOP. As shown in FIG. 9 , assuming that GOP1 is completed in the cache 702 and GOP2 is in the process of being cached, even if the client 310 approaches the time point ⓑ, it can receive from GOP1, which is the completed GOP, and play immediately, so the cache proceeds. The delay time until the in-progress GOP2 is completed and delivered can be eliminated.

클라이언트(310)의 접속 시점을 기준으로 가장 최근에 완성된 GOP를 전달하는 것으로 설명하고 있으나, 경우에 따라서는 전달 대상 GOP가 달리 결정될 수 있다. 예를 들어, 도 10을 참조하면, GOP 캐시 사이즈가 3인 경우 시간 순으로 GOP1과 GOP2가 먼저 완성되고 GOP3이 캐시 진행 중인 상황에서 클라이언트(310)가 ⓒ 시점에 접속될 때 클라이언트(310)와의 네트워크 상태를 고려하여 GOP1과 GOP2 중 어느 GOP부터 전달할지 결정될 수 있다. 일례로, 클라이언트(310)의 접속 시점(ⓒ)을 기준으로 현재 네트워크 대역폭이 임계치 이상이면 가장 최근에 완성된 GOP2부터 전달하는 한편, 현재 네트워크 대역폭이 임계치 미만이면 GOP2 이전에 완성된 GOP1부터 전달할 수 있다.Although it has been described that the most recently completed GOP is delivered based on the access point of the client 310, the delivery target GOP may be determined differently in some cases. For example, referring to FIG. 10 , when the GOP cache size is 3, GOP1 and GOP2 are completed first in chronological order, and when the client 310 is connected at the time ⓒ in the situation where the GOP3 is cached, it is connected with the client 310. It may be determined from which GOP of GOP1 and GOP2 to transmit in consideration of the network state. As an example, if the current network bandwidth is greater than or equal to the threshold based on the access point (ⓒ) of the client 310, the most recently completed GOP2 is transmitted, while if the current network bandwidth is less than the threshold, it is transmitted from the GOP1 completed before GOP2 there is.

다른 예로, 네트워크 대역폭에 맞추어 데이터를 전송하는 ABP(Adaptive Bitrate Publish) 기술을 적용할 수 있다. 실시간 라이브 프로토콜(예컨대, RTMP(real time messaging protocol) 등) 환경에서는 네트워크 대역폭을 측정하고 측정된 대역폭에 적응적으로 비트레이트(bitrate)나 fps(frame per second) 등을 즉시 변경하는 적응형 데이터 전송 기술을 활용할 수 있다. 이와 유사하게, 스트림 캐시를 이용한 실시간 라이브 스트리밍 환경에서는 클라이언트(310)의 접속 시점을 기준으로 가장 최근에 완성된 GOP부터 전달하되 클라이언트(310)의 모니터링 결과 클라이언트(310) 측 수신 상황이 좋지 않아 GOP가 밀리는 경우 GOP에서 일부 패킷(B-프레임 및/또는 P-프레임)을 소거하는(drop) 방식, 혹은 컨텐츠의 송출 시간에 맞춰 일부 GOP를 스킵하거나 점프하는 방식 등을 적용할 수 있다. 클라이언트(310)에 대한 모니터링 주기에 따라 소거(스킵 또는 점프)할 프레임 길이가 가변될 수 있다. 예를 들어, 클라이언트(310)가 특정 프로그램을 시청하기 위해 접속하는 경우 접속 시점을 기준으로 가장 최근에 완성된 GOP부터 클라이언트(310) 측에 전달한 이후, 1차 모니터링 결과 클라이언트(310) 측에서 GOP를 정상적으로 수신하지 못하고 밀리게 되면 제1 길이만큼의 프레임을 소거한다. 2차 모니터링 결과에서도 마찬가지로 GOP가 지속적으로 밀리는 경우 제1 길이보다 큰 제2 길이만큼의 프레임을 소거한다. 다시 말해, 클라이언트(310) 측에서의 끊김 없는 시청을 위해서 클라이언트(310)의 수신 상태에 기초하여 일부 프레임을 소거한 후 나머지 프레임을 전달하게 되는데, 이때 모니터링 주기에 따라 소거할 프레임 길이를 조정할 수 있다.As another example, an Adaptive Bitrate Publish (ABP) technology for transmitting data according to a network bandwidth may be applied. In a real-time live protocol (eg, real time messaging protocol (RTMP) environment), adaptive data transmission that measures network bandwidth and immediately changes bitrate or fps (frame per second) adaptively to the measured bandwidth technology can be used. Similarly, in a real-time live streaming environment using a stream cache, the most recently completed GOP is delivered based on the connection time of the client 310 , but as a result of monitoring the client 310 , the reception situation on the client 310 side is not good, so the GOP When is delayed, a method of dropping some packets (B-frames and/or P-frames) from the GOP or a method of skipping or jumping some GOPs according to the content transmission time may be applied. A frame length to be erased (skipped or jumped) may vary according to a monitoring period for the client 310 . For example, when the client 310 accesses to view a specific program, the GOP from the most recently completed GOP is delivered to the client 310 side based on the connection time, and as a result of the first monitoring, the GOP from the client 310 side If it is not received normally and is delayed, a frame corresponding to the first length is erased. Similarly in the secondary monitoring result, when the GOP is continuously pushed, frames of a second length greater than the first length are erased. In other words, for uninterrupted viewing from the client 310 side, some frames are erased based on the reception state of the client 310 and then the remaining frames are transmitted. In this case, the length of the frame to be erased can be adjusted according to the monitoring period.

비디오 스트림을 I-프레임으로 시작되는 GOP 단위로 캐시하여 전달하는 것은 지연 시간을 최소화할 수 있으나, 클라이언트(310) 측 플레이어의 오동작 가능성을 높일 수도 있다. GOP는 비디오 정보만을 포함하고 있기 때문에 플레이어가 내장하고 있는 오디오 비디오 동기화 메커니즘이 오동작할 수 있다. 예를 들어, 비디오 데이터인 하나의 GOP를 먼저 전달한 후 오디오를 전달하는 방식의 경우 비디오 데이터의 사이즈로 인하여 수신 과정에서 오디오 데이터가 없는 것으로 간주하고 재생을 시작할 수 있다.Caching and delivering the video stream in units of GOPs starting with I-frames may minimize delay time, but may increase the possibility of malfunction of the player on the client 310 side. Since the GOP contains only video information, the audio/video synchronization mechanism built into the player may malfunction. For example, in the case of a method in which one GOP, which is video data, is first transmitted and then audio is transmitted, it is assumed that there is no audio data in the reception process due to the size of the video data and playback may be started.

이러한 문제를 방지하기 위하여, 프로세서(222)는 CP(320)로부터 전달 받은 영상 정보(비디오 스트림과 오디오 스트림)를 분석하여 GOP뿐만 아니라 하나의 GOP가 재생될 때 같이 재생되어야 하는 오디오 또한 타임라인에 맞춰 정렬하여 보관할 수 있다.In order to prevent such a problem, the processor 222 analyzes the image information (video stream and audio stream) received from the CP 320, so that not only the GOP but also the audio to be played when one GOP is played is also displayed on the timeline. It can be sorted and stored.

도 11을 참조하면, 스트림 캐시 과정에서 비디오의 프레임 별로 데이터 타입(I-프레임, B-프레임, P-프레임)을 분석하고 I-프레임(I_1, I_2, ??) 각각에 대해 해당 I-프레임에 대응되는 오디오(audio_1, audio_2, ??)의 타임스탬프와 맞춰 비디오와 오디오를 그룹화할 수 있다.Referring to FIG. 11 , in the stream cache process, data types (I-frame, B-frame, P-frame) are analyzed for each video frame, and the corresponding I-frame for each of the I-frames (I_1, I_2, ??) Video and audio can be grouped according to the timestamp of audio (audio_1, audio_2, ??) corresponding to .

또한, 프로세서(222)는 상기한 그룹화를 통해 비디오와 오디오를 함께 캐시하여 플레이어에 전달할 때 플레이어의 오디오 비디오 동기화 메커니즘을 고려하여 전달할 수 있다.In addition, the processor 222 may cache video and audio together through the grouping described above and transmit the video and audio together in consideration of the player's audio-video synchronization mechanism when delivering to the player.

비디오 데이터에 해당되는 하나의 GOP를 전부 전달한 다음 오디오를 전달하거나 혹은 오디오를 먼저 전달한 다음 하나의 GOP를 전달하는 경우, 전달되는 비디오 혹은 오디오의 데이터 크기에 따라 플레이어의 오디오 비디오 동기화 메커니즘에 문제가 생길 가능성이 있다.If you pass one GOP corresponding to video data and then audio, or audio first and then one GOP, depending on the data size of the video or audio being passed, there may be a problem with the audio-video synchronization mechanism of the player. There is a possibility.

이러한 문제를 해결하기 위하여, 프로세서(222)는 비디오와 오디오를 패킷 단위로 교차 편집한 형태로 재구성하여 전달할 수 있다. 도 12를 참조하면, 프로세서(222)는 하나의 GOP(GOP1)에 해당되는 비디오 데이터와 오디오 데이터(audio_1)를 클라이언트(310)의 플레이어로 전달할 때 타임라인에 맞춰 패킷 단위의 비디오(V)와 오디오(A)가 교차하는 형태로 재구성하여 전달할 수 있다.In order to solve this problem, the processor 222 may reconstruct and transmit video and audio in a packet-by-packet cross-edited form. Referring to FIG. 12 , the processor 222 transmits video data and audio data audio_1 corresponding to one GOP (GOP1) to the player of the client 310, video (V) in packets and The audio (A) can be reconstructed and transmitted in an intersecting form.

패킷 교차 방법은 비디오(V)와 오디오(A)의 패킷이 일대일로 교차 배열될 수 있다. 다른 예로는 비디오(V)와 오디오(A)의 데이터 크기에 따라 패킷 교차 개수가 결정되어 일대일, 일대다, 다대일, 다대다 중 어느 하나로 교차 배열되는 것 또한 가능하다.In the packet crossing method, packets of video (V) and audio (A) may be cross-arranged one-to-one. As another example, the number of packet intersections is determined according to the data sizes of the video V and the audio A, and it is also possible to cross-arrange the packets in any one of one-to-one, one-to-many, many-to-one, and many-to-many.

비디오 데이터와 오디오 데이터를 패킷 단위로 교차 편집된 형태로 재구성하여 전달함으로써 플레이어의 오디오 비디오 동기화 메커니즘이 문제없이 동작하게 된다.By reconstructing and delivering video data and audio data in packet-by-packet cross-edited format, the player's audio-video synchronization mechanism works without any problem.

플레이어는 I-프레임을 수신하여만 화면 재생이 가능하다. 사용자가 접속하는 시점이 I-프레임 위치에 해당될 가능성이 낮기 때문에 접속 시점을 기준으로 가장 최근에 완성된 GOP를 전달함으로써 플레이어가 항상 I-프레임부터 수신하여 최대한 빠르게 재생하도록 보장할 수 있다.The player can play the screen only by receiving the I-frame. Since the access point of the user is unlikely to correspond to the I-frame location, it is possible to ensure that the player always receives the I-frame and plays it as quickly as possible by delivering the most recently completed GOP based on the access point.

RTMP와 같은 실시간 라이브 프로토콜은 TCP 위에서 동작한다. TCP에서 전송 속도를 충분히 빠르게 하기 위해서는 슬로우 스타트(slow start) 과정을 거쳐 충분한 대역폭을 확보해야 한다. 서버(350)에서 스트림 캐시를 통한 GOP를 플레이어로 전송함으로써 슬로우 스타트 과정을 빠르게 진행시키는 효과(warm-up)를 얻을 수 있다.Real-time live protocols such as RTMP run on top of TCP. In order to make the transmission speed sufficiently fast in TCP, sufficient bandwidth must be secured through a slow start process. By transmitting the GOP through the stream cache from the server 350 to the player, it is possible to obtain the effect of rapidly advancing the slow start process (warm-up).

뿐만 아니라, 플레이어는 일반적으로 안정적인 재생을 위하여 내부 버퍼에 일정크기 이상의 데이터가 채워져야 재생이 시작된다. 서버(350)에서 스트림 캐시를 통한 GOP를 플레이어로 전송함으로써 버퍼를 빠르게 채울 수 있어 I-프레임에 따른 최초 화면을 그리는 것뿐만 아니라 이후 실제로 영상을 재생하는 것 또한 빠르게 처리할 수 있다.In addition, the player generally starts playing when the internal buffer is filled with data of a certain size or more for stable playback. By sending the GOP through the stream cache from the server 350 to the player, the buffer can be quickly filled, so that not only the first screen according to the I-frame is drawn, but also the actual video playback thereafter can be quickly processed.

이처럼 본 발명의 실시예들에 따르면, 실시간 라이브 스트리밍 환경에서 GOP 단위의 캐시를 이용하여 즉시 재생 가능한 형태의 비디오와 오디오를 플레이어로 전달함으로써 지연 시간을 최소화하여 사용자 체감 품질을 향상시킬 수 있다. 더욱이, 본 발명의 실시예들에 따르면, 지연 시간을 최소화하기 위한 캐시 과정에서 스트리머로부터 전달된 영상 정보를 분석하여 비디오가 재생될 때 같이 재생되어야 하는 오디오를 찾아 함께 보관한 후 전송 과정에서 비디오와 오디오를 패킷 단위로 교차 편집한 형태로 전달함으로써 캐시 레이어의 부작용으로 발생할 수 있는 플레이어에서의 동기화 이슈를 효과적으로 해결할 수 있다.As described above, according to embodiments of the present invention, by using the GOP unit cache in a real-time live streaming environment to deliver video and audio in a form that can be played immediately to the player, delay time can be minimized to improve user experience quality. Furthermore, according to embodiments of the present invention, the video information transmitted from the streamer is analyzed in the cache process to minimize the delay time, and the audio to be played together when the video is played is found and stored together, and then the video is transmitted during the transmission process. and audio in a packet-by-packet cross-edited format, it is possible to effectively solve the synchronization issue in the player, which may occur as a side effect of the cache layer.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 어플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The device described above may be implemented as a hardware component, a software component, and/or a combination of the hardware component and the software component. For example, the apparatus and components described in the embodiments may include a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable gate array (FPGA), and a programmable logic unit (PLU). It may be implemented using one or more general purpose or special purpose computers, such as a logic unit, microprocessor, or any other device capable of executing and responding to instructions. The processing device may execute an operating system (OS) and one or more software applications executed on the operating system. A processing device may also access, store, manipulate, process, and generate data in response to execution of the software. For convenience of understanding, although one processing device is sometimes described as being used, one of ordinary skill in the art will recognize that the processing device includes a plurality of processing elements and/or a plurality of types of processing elements. It can be seen that can include For example, the processing device may include a plurality of processors or one processor and one controller. Other processing configurations are also possible, such as parallel processors.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.Software may comprise a computer program, code, instructions, or a combination of one or more thereof, which configures a processing device to operate as desired or is independently or collectively processed You can command the device. The software and/or data may be embodied in any tangible machine, component, physical device, computer storage medium or device for interpretation by or providing instructions or data to the processing device. there is. The software may be distributed over networked computer systems and stored or executed in a distributed manner. Software and data may be stored in one or more computer-readable recording media.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 이때, 매체는 컴퓨터로 실행 가능한 프로그램을 계속 저장하거나, 실행 또는 다운로드를 위해 임시 저장하는 것일 수도 있다. 또한, 매체는 단일 또는 수 개의 하드웨어가 결합된 형태의 다양한 기록수단 또는 저장수단일 수 있는데, 어떤 컴퓨터 시스템에 직접 접속되는 매체에 한정되지 않고, 네트워크 상에 분산 존재하는 것일 수도 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다. 또한, 다른 매체의 예시로, 어플리케이션을 유통하는 앱 스토어나 기타 다양한 소프트웨어를 공급 내지 유통하는 사이트, 서버 등에서 관리하는 기록매체 내지 저장매체도 들 수 있다.The method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium. In this case, the medium may be to continuously store a program executable by a computer, or to temporarily store it for execution or download. In addition, the medium may be various recording means or storage means in the form of a single or several hardware combined, it is not limited to a medium directly connected to any computer system, and may exist distributed over a network. Examples of the medium include a hard disk, a magnetic medium such as a floppy disk and a magnetic tape, an optical recording medium such as CD-ROM and DVD, a magneto-optical medium such as a floppy disk, and those configured to store program instructions, including ROM, RAM, flash memory, and the like. In addition, examples of other media may include recording media or storage media managed by an app store that distributes applications, sites that supply or distribute other various software, and servers.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.As described above, although the embodiments have been described with reference to the limited embodiments and drawings, various modifications and variations are possible from the above description by those skilled in the art. For example, the described techniques are performed in an order different from the described method, and/or the described components of the system, structure, apparatus, circuit, etc. are combined or combined in a different form than the described method, or other components Or substituted or substituted by equivalents may achieve an appropriate result.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.Therefore, other implementations, other embodiments, and equivalents to the claims are also within the scope of the following claims.

Claims (20)

컴퓨터로 구현되는 서버에서 실행되는 방법에 있어서,
상기 서버는 메모리에 포함된 컴퓨터 판독가능한 명령들을 실행하도록 구성된 적어도 하나의 프로세서를 포함하고,
상기 방법은,
상기 적어도 하나의 프로세서에 의해, 실시간 라이브 스트리밍 환경에서 스트리머로부터 수신된 컨텐츠에 대해 적어도 둘 이상의 GOP(group of pictures)를 캐시하는 단계; 및
상기 적어도 하나의 프로세서에 의해, 클라이언트의 요청에 대해 I-프레임으로 시작되는 패킷으로서 캐시를 통해 완성된 GOP부터 상기 클라이언트로 전달하는 단계
를 포함하는 방법.
In the method executed on a server implemented by a computer,
the server comprises at least one processor configured to execute computer readable instructions contained in a memory;
The method is
caching, by the at least one processor, at least two or more groups of pictures (GOPs) for content received from a streamer in a real-time live streaming environment; and
forwarding, by the at least one processor, from a completed GOP to the client through a cache as an I-frame-initiated packet for the client's request;
How to include.
제1항에 있어서,
상기 서버와 관련된 관리자의 설정 또는 상기 서버와 상기 클라이언트 간의 네트워크 상태를 기초로 GOP 캐시 사이즈가 결정되는 것
을 특징으로 하는 방법.
According to claim 1,
The GOP cache size is determined based on the settings of the administrator related to the server or the network status between the server and the client
How to characterize.
제1항에 있어서,
상기 서버와 관련된 관리자의 설정 또는 상기 서버와 상기 클라이언트 간의 네트워크 상태를 기초로 전달 대상 GOP가 결정되는 것
을 특징으로 하는 방법.
According to claim 1,
The delivery target GOP is determined based on the setting of the administrator related to the server or the network status between the server and the client
How to characterize.
제1항에 있어서,
상기 전달하는 단계는,
상기 캐시를 통해 완성된 GOP가 복수 개인 경우 상기 클라이언트의 접속 시점을 기준으로 가장 최근에 완성된 GOP부터 상기 클라이언트로 전달하는 것
을 특징으로 하는 방법.
According to claim 1,
The delivering step is
When there are a plurality of GOPs completed through the cache, the most recently completed GOP is delivered to the client based on the access point of the client.
How to characterize.
제1항에 있어서,
상기 전달하는 단계는,
상기 캐시를 통해 완성된 GOP가 복수 개인 경우 상기 서버와 상기 클라이언트 간의 네트워크 상태에 따라 상기 복수 개의 GOP 중 어느 하나의 GOP부터 상기 클라이언트로 전달하는 것
을 특징으로 하는 방법.
According to claim 1,
The delivering step is
When there are a plurality of GOPs completed through the cache, transferring from any one of the plurality of GOPs to the client according to the network state between the server and the client
How to characterize.
제1항에 있어서,
상기 전달하는 단계는,
상기 클라이언트의 GOP 수신 상태에 따라 일부 프레임을 소거하거나 스킵한 후 나머지 프레임을 전달하는 단계
를 포함하는 방법.
According to claim 1,
The delivering step is
Transmitting the remaining frames after erasing or skipping some frames according to the GOP reception state of the client
How to include.
제1항에 있어서,
상기 캐시하는 단계는,
상기 컨텐츠의 비디오 스트림과 오디오 스트림의 분석을 통해 GOP에 대응되는 오디오 구간을 찾아 비디오 데이터와 오디오 데이터를 타임라인에 맞춰 정렬하는 단계
를 포함하는 방법.
According to claim 1,
The caching step is
Finding an audio section corresponding to the GOP through analysis of the video stream and the audio stream of the content and aligning the video data and the audio data with a timeline
How to include.
제1항에 있어서,
상기 캐시하는 단계는,
비디오의 프레임 별로 데이터 타입을 분석하고 I-프레임 각각을 해당 I-프레임에 대응되는 오디오의 타임스탬프와 맞춰 비디오 데이터와 오디오 데이터를 그룹화하는 단계
를 포함하는 방법.
According to claim 1,
The caching step is
Analyzing the data type for each frame of the video and grouping the video data and the audio data by matching each I-frame with the timestamp of the audio corresponding to the corresponding I-frame
How to include.
제1항에 있어서,
상기 전달하는 단계는,
비디오 데이터와 오디오 데이터를 패킷 단위의 데이터가 교차하는 형태로 재구성하여 전달하는 것
을 특징으로 하는 방법.
According to claim 1,
The delivering step is
Reconstructing and transmitting video data and audio data in the form of intersecting packet unit data
How to characterize.
제9항에 있어서,
상기 비디오 데이터와 상기 오디오 데이터의 크기에 기초하여 패킷 교차 개수가 결정되는 것
을 특징으로 하는 방법.
10. The method of claim 9,
determining the number of packet intersections based on the sizes of the video data and the audio data
How to characterize.
제1항 내지 제10항 중 어느 한 항의 방법을 컴퓨터에 실행시키기 위한 프로그램이 기록되어 있는 컴퓨터 판독 가능한 기록 매체.A computer-readable recording medium in which a program for causing a computer to execute the method of any one of claims 1 to 10 is recorded. 컴퓨터로 구현되는 서버에 있어서,
메모리에 포함된 컴퓨터 판독가능한 명령들을 실행하도록 구성된 적어도 하나의 프로세서
를 포함하고,
상기 적어도 하나의 프로세서는,
실시간 라이브 스트리밍 환경에서 스트리머로부터 수신된 컨텐츠에 대해 적어도 둘 이상의 GOP를 캐시하는 과정; 및
클라이언트의 요청에 대해 I-프레임으로 시작되는 패킷으로서 캐시를 통해 완성된 GOP부터 상기 클라이언트로 전달하는 과정
을 처리하는 서버.
In the server implemented by a computer,
at least one processor configured to execute computer readable instructions contained in memory
including,
the at least one processor,
A process of caching at least two or more GOPs for content received from a streamer in a real-time live streaming environment; and
The process of transferring from a completed GOP to the client through a cache as a packet starting with an I-frame for a client's request
server that handles it.
제12항에 있어서,
상기 서버와 관련된 관리자의 설정 또는 상기 서버와 상기 클라이언트 간의 네트워크 상태를 기초로 GOP 캐시 사이즈가 결정되는 것
을 특징으로 하는 서버.
13. The method of claim 12,
The GOP cache size is determined based on the settings of the administrator related to the server or the network status between the server and the client
Server characterized by.
제12항에 있어서,
상기 서버와 관련된 관리자의 설정 또는 상기 서버와 상기 클라이언트 간의 네트워크 상태를 기초로 전달 대상 GOP가 결정되는 것
을 특징으로 하는 서버.
13. The method of claim 12,
The delivery target GOP is determined based on the setting of the administrator related to the server or the network status between the server and the client
Server characterized by.
제12항에 있어서,
상기 적어도 하나의 프로세서는,
상기 캐시를 통해 완성된 GOP가 복수 개인 경우 상기 클라이언트의 접속 시점을 기준으로 가장 최근에 완성된 GOP부터 상기 클라이언트로 전달하는 것
을 특징으로 하는 서버.
13. The method of claim 12,
The at least one processor,
When there are a plurality of GOPs completed through the cache, the most recently completed GOP is delivered to the client based on the access point of the client.
Server characterized by.
제12항에 있어서,
상기 적어도 하나의 프로세서는,
상기 캐시를 통해 완성된 GOP가 복수 개인 경우 상기 서버와 상기 클라이언트 간의 네트워크 상태에 따라 상기 복수 개의 GOP 중 어느 하나의 GOP부터 상기 클라이언트로 전달하는 것
을 특징으로 하는 서버.
13. The method of claim 12,
the at least one processor,
When there are a plurality of GOPs completed through the cache, transferring from any one of the plurality of GOPs to the client according to the network state between the server and the client
Server characterized by.
제12항에 있어서,
상기 적어도 하나의 프로세서는,
상기 클라이언트의 GOP 수신 상태에 따라 일부 프레임을 소거하거나 스킵한 후 나머지 프레임을 전달하는 것
을 특징으로 하는 서버.
13. The method of claim 12,
the at least one processor,
Transmitting the remaining frames after erasing or skipping some frames according to the GOP reception status of the client
Server characterized by.
제12항에 있어서,
상기 적어도 하나의 프로세서는,
상기 컨텐츠의 비디오 스트림과 오디오 스트림의 분석을 통해 GOP에 대응되는 오디오 구간을 찾아 비디오 데이터와 오디오 데이터를 타임라인에 맞춰 정렬하는 것
을 특징으로 하는 서버.
13. The method of claim 12,
the at least one processor,
Finding the audio section corresponding to the GOP through the analysis of the video stream and the audio stream of the content and aligning the video data and the audio data with the timeline
Server characterized by.
제12항에 있어서,
상기 적어도 하나의 프로세서는,
비디오의 프레임 별로 데이터 타입을 분석하고 I-프레임 각각을 해당 I-프레임에 대응되는 오디오의 타임스탬프와 맞춰 비디오 데이터와 오디오 데이터를 그룹화하는 것
을 특징으로 하는 서버.
13. The method of claim 12,
the at least one processor,
Analyzing data types for each frame of video and grouping video data and audio data by matching each I-frame with the timestamp of the audio corresponding to the corresponding I-frame
Server characterized by.
제12항에 있어서,
상기 적어도 하나의 프로세서는,
비디오 데이터와 오디오 데이터를 패킷 단위의 데이터가 교차하는 형태로 재구성하여 전달하는 것
을 특징으로 하는 서버.
13. The method of claim 12,
The at least one processor,
Reconstructing and transmitting video data and audio data in the form of intersecting packet unit data
Server characterized by.
KR1020200112420A 2020-09-03 2020-09-03 Method, system, and computer readable record medium to minimize delay in real-time live streaming KR20220030736A (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020200112420A KR20220030736A (en) 2020-09-03 2020-09-03 Method, system, and computer readable record medium to minimize delay in real-time live streaming
JP2021142379A JP2022042997A (en) 2020-09-03 2021-09-01 Method, server, and computer-readable recording medium for minimizing delay in real time live streaming
CN202111024798.XA CN114143562A (en) 2020-09-03 2021-09-02 Delay minimizing method, server, and computer-readable recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200112420A KR20220030736A (en) 2020-09-03 2020-09-03 Method, system, and computer readable record medium to minimize delay in real-time live streaming

Publications (1)

Publication Number Publication Date
KR20220030736A true KR20220030736A (en) 2022-03-11

Family

ID=80393909

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200112420A KR20220030736A (en) 2020-09-03 2020-09-03 Method, system, and computer readable record medium to minimize delay in real-time live streaming

Country Status (3)

Country Link
JP (1) JP2022042997A (en)
KR (1) KR20220030736A (en)
CN (1) CN114143562A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102629381B1 (en) * 2023-05-18 2024-01-25 주식회사 짠컴퍼니 A system for providing a community live streaming and method threrof
WO2024090710A1 (en) * 2022-10-25 2024-05-02 삼성전자주식회사 Electronic device, server device, and control method thereof

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3653569B2 (en) * 1997-01-30 2005-05-25 マイクロソフト コーポレーション A VCR-like feature that renders video on demand
CN107690073B (en) * 2016-08-05 2021-07-16 阿里巴巴集团控股有限公司 Video live broadcast method and video live broadcast server
CN106791994B (en) * 2016-12-30 2020-11-24 北京奇艺世纪科技有限公司 Low-delay quick broadcasting method and device
CN106604064A (en) * 2016-12-30 2017-04-26 北京奇艺世纪科技有限公司 Rapid broadcasting method and device
CN108471548B (en) * 2018-01-25 2021-07-06 湖南于一科技有限公司 Live video quick playing method and device
CN108540819B (en) * 2018-04-12 2020-04-03 腾讯科技(深圳)有限公司 Live broadcast data processing method and device, computer equipment and storage medium

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024090710A1 (en) * 2022-10-25 2024-05-02 삼성전자주식회사 Electronic device, server device, and control method thereof
KR102629381B1 (en) * 2023-05-18 2024-01-25 주식회사 짠컴퍼니 A system for providing a community live streaming and method threrof

Also Published As

Publication number Publication date
CN114143562A (en) 2022-03-04
JP2022042997A (en) 2022-03-15

Similar Documents

Publication Publication Date Title
US11025978B2 (en) Dynamic video image synthesis using multiple cameras and remote control
US11684849B2 (en) Distributed sample-based game profiling with game metadata and metrics and gaming API platform supporting third-party content
US9473548B1 (en) Latency reduction in streamed content consumption
US8473628B2 (en) Dynamically altering playlists
US8190674B2 (en) Variable rate media delivery system
US20170120151A1 (en) System and method for experiencing advertised interactive applications
KR20180018045A (en) Method and system for video recording
US9635431B2 (en) Live event viewing via mixed live and on-demand streaming
KR102123593B1 (en) Method, system, and non-transitory computer readable record medium for synchronization of real-time live video and information data
JP2008503926A (en) Method and system for interactive control of media over a network
CN108632631B (en) Method and device for downloading video fragments in panoramic video
US9769546B2 (en) Preview image processing using a bundle of preview images
US20140243083A1 (en) Apparatus and method of providing cloud service using game platform based on streaming
KR20220030736A (en) Method, system, and computer readable record medium to minimize delay in real-time live streaming
KR101899576B1 (en) Timing synchronization method and timing synchronization system for remote controlling of multimedia content
JP2023515947A (en) Surfacing pre-recorded gameplay videos for in-game player assistance
KR101998303B1 (en) Method and system for managing sliding window for time machine function
CN115623230A (en) Live video playing method and device, electronic equipment and storage medium
US10433023B1 (en) Heuristics for streaming live content
KR20190067557A (en) Method and system for delayed live broadcast
US9215267B2 (en) Adaptive streaming for content playback
KR102085072B1 (en) Method and system for delayed live broadcast
KR101949494B1 (en) Method and system for providing remote operation tool for multimedia content
JP2003046978A (en) Device and method for downloading animation, animation transmitting/receiving system, program storing medium, and program
KR102376295B1 (en) Method, system, and computer readable record medium for playing media using traffic control information

Legal Events

Date Code Title Description
A201 Request for examination