WO2021172941A1 - 영상 스트리밍 방법 및 이를 지원하는 전자 장치 - Google Patents

영상 스트리밍 방법 및 이를 지원하는 전자 장치 Download PDF

Info

Publication number
WO2021172941A1
WO2021172941A1 PCT/KR2021/002467 KR2021002467W WO2021172941A1 WO 2021172941 A1 WO2021172941 A1 WO 2021172941A1 KR 2021002467 W KR2021002467 W KR 2021002467W WO 2021172941 A1 WO2021172941 A1 WO 2021172941A1
Authority
WO
WIPO (PCT)
Prior art keywords
sub
image
track
tracks
electronic device
Prior art date
Application number
PCT/KR2021/002467
Other languages
English (en)
French (fr)
Inventor
박광우
배형진
홍승석
김현수
변광민
심재국
염동현
이상준
이승범
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Publication of WO2021172941A1 publication Critical patent/WO2021172941A1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/44029Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display for generating different versions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/21805Source of audio or video content, e.g. local disk arrays enabling multiple viewpoints, e.g. using a plurality of cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/436Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/436Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
    • H04N21/43615Interfacing a Home Network, e.g. for connecting the client to a plurality of peripherals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440281Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the temporal resolution, e.g. by frame skipping

Definitions

  • Various embodiments of the present document relate to a method of streaming an image and an electronic device supporting the same.
  • An image service in which a server provides a multi-viewpoint image (multi-directional image) simultaneously photographed using a plurality of cameras to a user's terminal device is being used.
  • the server may stream the image of another viewpoint to the terminal device in response to the request.
  • each image is taken using a plurality of cameras, and an image captured by one camera (eg, an image captured by a first-base camera) is streamed to the user's terminal device (eg, a smartphone) by a streaming method. , tablet PC, laptop PC).
  • an image captured by a camera of a different angle eg, an image captured by a third-base side camera
  • a method of transmitting a multi-view video includes: i) a method of simultaneously receiving images from different viewpoints, ii) a method of additionally generating a switching frame, iii) a method of transmitting two streams in a hierarchical structure, iv ), a method of delivering an additional image for changing the viewpoint is being used.
  • the above schemes may require an increase in network bandwidth or may increase encoding resources and cost due to additional frame generation.
  • the server device may reduce network bandwidth required for streaming by using sub-tracks having different frame structures for one view.
  • the electronic device transmits an image to an external device and includes a communication circuit, a memory for storing a plurality of images corresponding to a plurality of viewpoints, and a processor, each of the plurality of images comprising a plurality of sub-tracks, Each of the plurality of sub-tracks consists of consecutive frames, each of the frames has one property of a first-type frame or a second-type frame, and the plurality of sub-tracks includes the first type of the entire frame.
  • the processor transmits one of a plurality of sub-tracks of a first image for a first viewpoint among the plurality of images to the external device, from the external device through the communication circuit
  • the first sub-track including the first type frame from among a plurality of sub-tracks of a second image for a second view corresponding to the request is played by the external device at a first time can be sent to
  • the electronic device may reduce a network bandwidth used for image reproduction in a multi-view video service by using sub-tracks having different frame structures.
  • the electronic device may reduce a response time to a user's request for changing a viewpoint by using sub-tracks having different frame structures.
  • FIG. 1 illustrates a video streaming system according to various embodiments.
  • FIG. 2 shows a streaming server according to an embodiment.
  • FIG. 3 illustrates storage and selection of a plurality of sub-tracks according to various embodiments.
  • FIG. 4 shows a video streaming method performed by a streaming server according to various embodiments.
  • FIG. 5 illustrates a dynamic change of a frame structure over time according to various embodiments of the present disclosure
  • FIG. 6 illustrates a video streaming method through transmission of frame structure information according to various embodiments.
  • FIG. 7 is a block diagram of an electronic device in a network environment according to various embodiments of the present disclosure.
  • FIG. 1 illustrates a video streaming system according to various embodiments.
  • the video streaming system 100 may include a source device 110 , a streaming server 120 , and a terminal device 130 . 1 is illustrative and not limited thereto.
  • the video streaming system 100 may include other devices among the components of FIG. 1 .
  • a separate association server may be included between the source device 110 and the streaming server 120 .
  • a separate relay device eg, a desktop PC
  • the source device 110 may acquire or store a multi-viewpoint image.
  • the source device 110 may include a camera device capable of capturing an image, a storage device capable of storing an image captured by the camera device, or a plurality of image processing devices.
  • the source device 110 may be a plurality of smart phones.
  • the multi-viewpoint image may be an image obtained by photographing the same object from various angles, or may be an image photographed in various directions within the same or adjacent space.
  • the multi-view image may be an image captured by installing a plurality of cameras at various angles in a baseball field. Images captured by each camera may be stored in association with each other according to a shooting time. Alternatively, the images captured by each camera may be linked to each other according to the shooting time and streamed to a server (eg, the streaming server 120 or another server) through a network.
  • a server eg, the streaming server 120 or another server
  • the streaming server 120 may receive an image from the source device 110 .
  • the streaming server 120 may stream the received image to the terminal device 130 .
  • the streaming server 120 may receive a real-time image from the source device 110 or may receive a pre-stored image (eg, a video on demand (VOD) image).
  • VOD video on demand
  • the streaming server 120 may receive a multi-view image from the source device 110 .
  • the multi-view image may be an image obtained by photographing the same object from various angles, or may be an image photographed in various directions within the same or adjacent space.
  • the streaming server 120 may receive images (or image sources) corresponding to N views by mapping the N tracks.
  • the streaming server 120 transmits the received multi-view image (multi-directional image) to an image (hereinafter, a viewpoint image) corresponding to each viewpoint to a plurality of sub-tracks having different GOP structures (or a plurality of sub-images).
  • a viewpoint image corresponding to each viewpoint to a plurality of sub-tracks having different GOP structures (or a plurality of sub-images).
  • the first view image (or the first direction image) for the first view (or first direction) may be converted into a plurality of sub-tracks having different GOP structures.
  • each sub-track is decoded, the same image as the first view image may be restored.
  • the streaming server 120 may transmit the received multi-view image to the terminal device 130 .
  • the streaming server 120 may stream a viewpoint image requested by the terminal device 130 .
  • the streaming server 120 may stream a fifth viewpoint image (or a fifth track) corresponding to the fifth viewpoint to the terminal device 130 according to the request of the terminal device 130 .
  • a viewpoint switching request it is possible to stream a viewpoint image corresponding to .
  • the streaming server 120 may receive a view switching request to change to the fifth view from the terminal device 130 while streaming the 17th view image to the terminal device 130 .
  • the streaming server 120 may stream the fifth viewpoint image to the terminal device 130 in response to the viewpoint switching request.
  • the streaming server 120 may provide each of the streaming images to the plurality of terminal devices 130 .
  • the streaming server 120 since it is necessary to provide a streaming service using a limited network resource (eg, bandwidth), the streaming server 120 needs to efficiently transmit streaming data.
  • the streaming server 120 quickly responds to the request for changing the viewpoint requested by the terminal device 130 in order to satisfy the user's service quality requirements, and it is necessary to quickly transmit the viewpoint image requested by each terminal device 130 .
  • the streaming server 120 can efficiently manage a network resource (eg, bandwidth) by using a plurality of sub-tracks having different frame structures for one viewpoint image, and request a viewpoint change of the terminal device 130 . can react quickly to
  • the streaming server 120 may include a processor 150 , a memory 160 and a communication circuit 190 .
  • the processor 150 may perform various operations necessary for the operation of the streaming server 120 .
  • the processor 150 may receive a multi-view image from the source device 110 through the communication circuit 190 .
  • the processor 150 may transmit a viewpoint image requested by the terminal device 130 from among a plurality of viewpoint images constituting the received multi-view image.
  • the processor 150 may transmit one of the multi-view images to the terminal device 130 through the communication circuit 190 .
  • the streaming server 120 may stream a fifth viewpoint image (or a fifth track) corresponding to the fifth viewpoint to the terminal device 130 according to the request of the terminal device 130 .
  • the processor 150 in response to the request for changing the viewpoint of the terminal device 130, may change the streaming viewpoint image.
  • the processor 150 may receive a view switching request to change to the fifth view from the terminal device 130 while streaming the 17th view image to the terminal device 130 .
  • the processor 150 may stream the fifth viewpoint image to the terminal device 130 in response to the viewpoint switching request.
  • the processor 150 may store a plurality of sub-tracks (or a plurality of sub-images) having different frame structures for one view image.
  • a plurality of sub-tracks for one view image may have different group of pictures (GOP) structures.
  • a plurality of sub-tracks constituting one view image may have different I-frame rates. For example, when one view image is composed of first to third sub-tracks, all frames of the first sub-track may be composed of I-frames.
  • the second sub-track may have an I-frame rate of 1/4 and a P-frame rate of 3/4 among all frames.
  • the third sub-track may have an I-frame rate of 1/8 of the entire frame and a P-frame rate of 7/8.
  • the processor 150 may check various conditions such as a network situation and the number of terminal devices 130 , select one sub-track from among a plurality of sub-tracks, and transmit the selected sub-track to the terminal device 130 . have.
  • the memory 160 may store various information necessary for the operation of the streaming server 120 .
  • the memory 160 may include an input buffer 170 and an output buffer 180 .
  • the input buffer 170 and the output buffer 180 may be set to be distinguished by physical or logical addresses, or may be implemented with different storage devices.
  • the input buffer 170 may store a multi-view image.
  • the input buffer 170 may store a plurality of sub-tracks for each viewpoint image.
  • the plurality of sub-tracks may have different frame structures, and when decoded, may be converted into images having the same quality.
  • the output buffer 180 may store an image to be transmitted to the terminal device 130 .
  • the output buffer 180 may temporarily store a viewpoint image (or a sub-track selected from among a plurality of sub-tracks constituting the viewpoint image) by switching of the processor 150 .
  • the communication circuit 190 may transmit/receive data to and from an external device (eg, the source device 110 or the terminal device 130) through wireless communication or wired communication.
  • the communication circuit 190 may receive the viewpoint image from the source device 110 and transmit it to be stored in the input buffer 170 .
  • the communication circuit 190 may transmit the image stored in the output buffer 180 to the terminal device 130 .
  • the terminal device 130 may receive data regarding a single viewpoint image through a network and display it through a display.
  • There may be a plurality of terminal devices 130 and may each receive and output a viewpoint image from the streaming server 120 .
  • the terminal device 130 may be outputting images from different viewpoints.
  • the terminal device 130 includes the first to fifth terminal devices
  • the first to fifth terminal devices may output images from different viewpoints, respectively.
  • the first to third terminal devices may output a first viewpoint image
  • the fourth terminal device may output a second viewpoint image
  • the fifth terminal device may output a fourth viewpoint image.
  • Viewpoint images selected by each user of the terminal device 130 may be variously output.
  • FIG. 2 shows a streaming server according to an embodiment.
  • the streaming server 120 includes an input buffer 210 (eg, the input buffer 170 of FIG. 1 ), a track selector 220 and An output buffer 230 (eg, the output buffer 180 of FIG. 1 ) may be included.
  • the streaming server 120 is classified according to functions, but is not limited thereto. Some components may be added or omitted. Alternatively, the components may be integrated or separate.
  • the streaming server 120 may not be a single device or a single server device, and a plurality of devices or a plurality of server devices may be combined. Alternatively, at least some functions of the streaming server 120 may be performed in another device or the terminal device 130 .
  • the input buffer 210 may store a multi-viewpoint image.
  • the input buffer 210 may store a plurality of sub-tracks for the viewpoint images 250-1, 250-2, ... 250-N corresponding to each viewpoint.
  • the plurality of sub-tracks may have different frame structures, and when decoded, may be converted into images having the same quality.
  • the first viewpoint image 250 - 1 may include three sub-tracks, and each sub-track may have a different I-frame rate.
  • FIG. 2 exemplarily illustrates a case in which one viewpoint image is composed of three sub-tracks, but the present invention is not limited thereto.
  • Various embodiments of the plurality of sub-tracks stored in the input buffer 210 may be further provided with reference to FIG. 3 .
  • the track selector 220 may include a first selector (or a first switch) 221 and a second selector (or a second switch) 222 .
  • the first selector 221 may select a viewpoint image (or a track) in response to the viewpoint switching request of the terminal device 130 .
  • the second selector 222 may select one of a plurality of sub-tracks (or sub-tracks) for image transmission efficiency.
  • the switching operation of the track selector 220 may be an operation of a processor inside the streaming server 120 (eg, the processor 150 of FIG. 1 ) or an operation under the control of the processor 150 .
  • the operation of the track selector 220 (the first selector 221 and the second selector 222 ) may be an operation under the control of the processor 150 of FIG. 1 .
  • the switching operation in FIG. 2 is exemplary and not limited thereto.
  • the switching operation of the track selector 220 may be switching by software or switching by a hardware element.
  • the switching of the first selector 221 and the second selector 222 may be controlled by the same arithmetic element or may be controlled by different arithmetic elements.
  • the track selection unit 220 may operate through communication with each other in different containers, virtualization servers, or physical servers according to a method in which the streaming server 120 is installed.
  • the first selector 221 may switch (or select) a track to be streamed in response to a view change request from the terminal device 130 .
  • the first selector 221 controls the streaming track may be switched from a first track through which the first view image 250-1 is transmitted to an N-th track through which the N-th view image 201-N is transmitted.
  • the second selector 222 may select one of a plurality of sub-tracks according to a specified condition. For example, when a track is changed by the first selector 221 , a sub-track having the highest I-frame ratio among a plurality of sub-tracks constituting the switched viewpoint image may be selected. Thereafter, the second selector 222 may select a sub-track having a gradually lower I-frame ratio among the plurality of sub-tracks (eg, refer to FIG. 3 ).
  • the output buffer 230 may store an image to be transmitted to the terminal device 130 .
  • the output buffer 230 may temporarily store an image transmitted through a track selected by the first selector 221 and the second selector 222 .
  • FIG. 3 illustrates storage and selection of a plurality of sub-tracks according to various embodiments.
  • the input buffer 210 may store a multi-viewpoint image.
  • the input buffer 210 may store a plurality of sub-tracks for each viewpoint image 250 - 1 , 250 - 2 , ... 250 -N.
  • the plurality of sub-tracks may have different group of pictures (GOP) structures.
  • the entire frame of the first sub-track 1,1 250-1-1 for the first viewpoint image 250-1 may consist of all I-frames (I-frames).
  • Frame rate (RI) 1).
  • the second sub-tracks (sub-tracks 1,2 ) 250-1-2 for the first viewpoint image 250-1 include one I frame per four frames, and the rest are composed of P frames.
  • I-frame rate (RI) 1/4).
  • the second sub-track N,2 (250-N-2) for the N-th view image 250-N includes 4 I frames per 4 frames, and the remainder is composed of P frames.
  • I-frame rate (RI) 1/4).
  • the processor 150 of FIG. 1 receives the source image received from the source device (eg, the source device 110 of FIG. 1 ) with a different GOP structure. Branches can be converted into a plurality of sub-tracks and stored. Alternatively, the processor 150 may receive and store the source image converted into a plurality of sub-tracks for each viewpoint image from the source device 110 .
  • all of the plurality of sub-tracks for one view image may provide the same image quality, and due to the characteristics of inter-frame compression, the bitrate of each sub-track is the third It may increase in the order of sub-track 250-N-3 ⁇ second sub-track 250-N-2 ⁇ first sub-track 250-N-1. Accordingly, the network bandwidth required to reproduce an image of the same quality is determined by the ratio of the third sub-track 250-N-3 ⁇ the second sub-track 250-N-2 ⁇ the first sub-track 250-N-1. may increase in sequence.
  • a sub-video having a lower I-frame ratio may have a higher network priority. For example, the network priority may be higher in the order of the first sub-track 250-N-1 ⁇ the second sub-track 250-N-2 ⁇ the third sub-track 250-N-3.
  • each of the plurality of sub-tracks constituting the viewpoint image may be configured by successive video frames.
  • the processor 150 eg, the first selector 221 of FIG. 2
  • the processor 150 may switch to the N-th view image (or track) 250 -N corresponding to the view change request.
  • the processor 150 eg, the second selector 222 of FIG. 2
  • the types of frames of each sub-track may be different from each other.
  • the first to third views constituting the N-th view image 250-N Frames of the sub-tracks 250-N-1, 250-N-2, and 250-N-3 may be I-frames, P-frames, and P-frames, respectively.
  • the processor 150 selects a sub-track to be streamed with an I-frame.
  • Streaming may be started by determining the first sub-track 250-N-1.
  • the terminal device 130 may not output a normal screen because it does not have a reference frame capable of decoding the received frame.
  • a reference frame may not be required and the terminal device ( 130) may provide a normal screen to the user.
  • the processor 150 when a viewpoint image is maintained at a second time (eg, t1) when the second sub-track 250 -N-2 has an I-frame (when a separate viewpoint switching request is not received) , the processor 150 (eg, the second selector 222 of FIG. 2 ) may select and stream the second sub-track 250-N-2.
  • the processor 150 when a viewpoint image is maintained at a third time (eg, t5) when the third sub-track 250-N-3 has an I-frame, the processor 150 (eg, the second selector 222) ) can be streamed by selecting the third sub-track 250-N-3.
  • the ratio of I-frames of the streaming sub-track may be gradually lowered, and network efficiency may be increased.
  • the processor 150 may quickly set a change time between sub-tracks according to network conditions. For example, when the communication quality of the network is less than or equal to a specified value, the processor 150 (eg, the second selector 222 of FIG. 2 ) determines that the second sub-track 250-N-2 has an I-frame. At the second time (eg, t1), the second sub-track 250-N-2 may be selected and streamed. For another example, when the communication quality of the network exceeds a specified value, the processor 150 (eg, the second selector 222 of FIG. 2 ) determines that the second sub-track 250-N-2 is displayed for the second time. It is possible to select and stream the second sub-track 250-N-2 at a time other than (eg, t1).
  • the processor 150 may provide the terminal device 130 with a message indicating that the quality change may occur.
  • the processor 150 may set a section limiting the change between sub-tracks according to a specified condition.
  • the condition may be based on information about the user's history related to viewpoint switching, or information previously analyzed related to viewpoint switching.
  • FIG. 4 shows a video streaming method performed by a streaming server according to various embodiments.
  • the processor of the streaming server 120 performs a plurality of sub-tracks constituting a first view image in a multi-view image.
  • One of them may be used to stream to the terminal device 130 .
  • the processor may be in progress streaming to the sub-track having the lowest ratio of I-frames among the plurality of sub-tracks.
  • the processor 150 may perform streaming through an operation of enqueueing the frame to the output buffer 230 after dequeueing the corresponding frame in the input buffer 210 .
  • the processor 150 of the streaming server 120 may determine whether a viewpoint switching request is received from the terminal device 130 . When the view switching request is not received (No in operation 420 ), the processor 150 may maintain the streaming state or may continue streaming by changing to a sub-track having a higher network priority.
  • a first time to switch to a second view image corresponding to the request For example, a sub-track including a first type frame (eg, an I-frame) among the second view image may be streamed.
  • a first type frame eg, an I-frame
  • the processor 150 performs the first sub-track Track 250-N-1 may be streamed.
  • the processor 150 may stream the second sub-track 250 -N-2 having a high network priority.
  • the first to third sub-tracks 250- that are switched from the streaming view image to the N-th view image 250-N, and constitute the N-th view image 250-N at the time of the conversion.
  • the processor 150 streams the third sub-track 250-N-3 having the highest network priority.
  • the processor 150 may select a sub-track by reflecting a network situation at a first time when the first-view image is switched to the second-view image. For example, when the number of terminal devices 130 receiving streaming data is drastically reduced or when the bandwidth allocated to the network is expanded, a sub-track having a relatively high I-frame ratio can be selected and streamed. .
  • FIG. 5 illustrates a dynamic change of a frame structure over time according to various embodiments of the present disclosure
  • an input buffer (eg, the input buffer 210 of FIG. 3 ) according to various embodiments may store a multi-viewpoint image.
  • the input buffer 210 may store a plurality of sub-tracks 550-1-1 to 550-1-3 for the viewpoint image 550-1 corresponding to one viewpoint.
  • the plurality of sub-tracks 550-1-1 to 550-1-3 may have different group of pictures (GOP) structures.
  • the plurality of sub-tracks 550-1-1 to 550-1-3 may be images having different I-frame rates.
  • the processor (eg, the processor 150 of FIG. 1 ) of the streaming server 120 is I- of a plurality of sub-tracks (550-1-1 to 550-1-3) according to a specified condition.
  • the frame rate (RI) can be dynamically changed.
  • the processor 150 may increase or decrease the I-frame rate RI according to a relationship between a computing resource or network bandwidth and the number of users using a service.
  • the processor 150 may change the I-frame rate RI according to the user's track switching pattern or the attribute (or characteristic) of the image to be transmitted.
  • the second sub-tracks 1,2 (550-1-2) for the first viewpoint image 550-1 include 2 I frames per 8 frames, and the rest are composed of P frames.
  • (I-frame rate (RI) 1/4).
  • the processor 150 increases the I-frame rate for the sub-track having a relatively high network priority, so that the user's It can quickly respond to continuous track switching requests.
  • the same I-frame rate as the first time period T1 may be maintained.
  • the processor 150 sets the I-frame rate of the plurality of sub-tracks 550-1-1 to 550-1-3 to the previous first. It is possible to return to the state in the time period T1.
  • the processor 150 determines at least one of a network state, the number of terminal devices 130 receiving a streaming service, whether a user frequently requests a view change, and a characteristic of a view image to be provided. Accordingly, the I-frame rate can be dynamically changed.
  • FIG. 6 illustrates a video streaming method through transmission of frame structure information according to various embodiments.
  • the processor (eg, the processor 150 of FIG. 1 ) of the streaming server 120 transmits information on the frame structure of a multi-view image to the terminal device 130 (hereinafter, frame structure). information) 610 .
  • the frame structure information 610 for the multi-view image may be provided through the same channel as the channel providing the streaming service to the terminal device 130 or through a different channel.
  • the frame structure information 610 may include information on the entire multi-view image or information on a part of the multi-view image.
  • the terminal device 130 may receive the frame structure information 610 in the second view image with a high possibility of switching.
  • the processor of the terminal device 130 may effectively respond to the user's request for changing the viewpoint by using the received frame structure information 610 .
  • the time it takes for the actual track to change from the time the user generates an input related to viewpoint switching e.g., touch input, voice input
  • reaction time (d_react) may be an important quality factor for streaming services.
  • the reaction time d_react may be managed to maintain a specified value or less, and the reaction time d_react may be changed according to the type of service or content.
  • the processor of the terminal device 130 may change the actual track change time according to the value of the reaction time d_react. For example, when a time point change request occurs at time t0 and the reaction time d_react is set to 1, the terminal device 130 may request that the track be switched at time t1. As another example, when a time point change request occurs at time t0 and the reaction time d_react is set to 2, the terminal device 130 may request that the track be switched at time t2.
  • the second sub-track may also include I-frames, so that the processor of the terminal device 130 (eg, the processor 720 of FIG.
  • the terminal device 130 may request that the track be switched at time t4.
  • the third sub-track may also include an I-frame, so that the processor of the terminal device 130 (eg, the processor 720 of FIG. 7 ) can immediately switch to the first sub-track or the second sub-track without switching to the first sub-track or the second sub-track. You can switch to the 3rd sub-track.
  • the terminal device 130 may request that the track be switched at time t8.
  • the fourth sub-track may also include an I-frame, so that the processor of the terminal device 130 (eg, the processor 720 of FIG. 7 ) performs the first sub-track, the second sub-track, or the third sub-track. You can switch directly to the 4th sub-track without switching to .
  • the processor of the terminal device 130 eg, the processor 720 of FIG. 7
  • the processor eg, the processor 720 of FIG. 7
  • a time designated in response to a set value of the reaction time d_react After waiting, it is possible to transmit a request for switching the viewpoint to the streaming server 120 .
  • the streaming server 120 may transmit a multi-view image using various transport protocols such as a real-time streaming protocol (eg, RTSP, RTMP) or an adaptive streaming protocol (eg, HLS, DASH).
  • a real-time streaming protocol eg, RTSP, RTMP
  • an adaptive streaming protocol eg, HLS, DASH.
  • the streaming server 120 may store the state of the terminal device 130 and transmit an image in units of frames.
  • the streaming server 120 may manage information on the track being played by the terminal device 130 connected to the streaming service.
  • the streaming server 120 may select and transmit a track to be transmitted according to the characteristics of each frame of the multi-track.
  • the view change request may be transmitted in the form of a message of a protocol for video transmission, or may be transmitted in another form.
  • the streaming server 120 may delay the view switching request or attempt to directly switch to an appropriate track.
  • the streaming server 120 may transmit a manifest file that is frame structure information 610 regarding a multi-view image to the terminal device 130 .
  • a manifest file that is frame structure information 610 regarding a multi-view image
  • the address of all multi-tracks may be transmitted in xml format in Media Presentation Description (MPD).
  • MPD Media Presentation Description
  • the terminal device 130 may request and reproduce a current segment of a decodable track.
  • the terminal device 130 may directly control the track selection.
  • the terminal device 130 may select a plurality of tracks to be played during the track change and may request segments of the tracks.
  • the terminal device 130 may select a discontinuous track by selecting an appropriate speed.
  • the streaming server 120 may store information about the reaction time (d_react) in the terminal device 130 in advance. In this case, the streaming server 120 may switch the viewpoint image after waiting a specified time when the viewpoint switching request occurs in consideration of the reaction time (d_react) in the terminal device 130 .
  • the streaming server 120 may receive viewpoint images from different source devices 120 .
  • the streaming server 120 receives, among the first to fifteenth view images constituting the multi-view image, first to fifth view images from the first source device, and the sixth to fifteenth view images 2 Receive from the source device.
  • the streaming server 120 or the terminal device 130 is a mobile edge computing (MEC) server inside a base station that supports a network for some images in a section in which a viewpoint change occurs frequently or is highly likely to occur among streaming images. can be requested to be stored in .
  • MEC mobile edge computing
  • the terminal device 130 may display some images stored in the MEC server by first being transmitted from the MEC server.
  • the terminal device 130 may receive and display an image after the image stored in the MEC server from the streaming server 120 .
  • the streaming server 120 may transmit an image after the image stored in the MEC server to the terminal device 130 .
  • the streaming server 120 or the terminal device 130 may request each source device 130 to prefetch data for a section in which switching occurs or an expected section. .
  • the streaming server 120 or the terminal device 130 when the possibility of switching from the fifth viewpoint image received from the first source device to the tenth viewpoint image received from the second source device is high, the streaming server 120 or the terminal device 130 When the 5-view image is being streamed, the second source device may request to increase the prefetched data of the 10-view image.
  • Electronic devices may be devices of various types.
  • Electronic devices include, for example, portable communication devices (eg, smartphones), computer devices (eg, personal digital assistants), tablet PCs (tablet PCs), laptop PCs (desktop PCs, workstations, or servers); It may include at least one of a portable multimedia device (eg, an e-book reader or an MP3 player), a portable medical device (eg, a heart rate, blood sugar, blood pressure, or body temperature monitor), a camera, or a wearable device. (e.g.
  • the electronic device is, for example, a television, a digital video disk (DVD) player, an audio device, an audio accessory device.
  • DVD digital video disk
  • the electronic device is, for example, a television, a digital video disk (DVD) player, an audio device, an audio accessory device.
  • speakers, headphones, or headsets refrigerators, air conditioners, vacuum cleaners, ovens, microwaves, washing machines, air purifiers, set-top boxes, home automation control panels, security control panels, game consoles, electronic dictionaries, electronic keys, camcorders , or at least one of an electronic picture frame.
  • the electronic device may include a navigation device, a global navigation satellite system (GNSS), an event data recorder (EDR) (eg, a black box for a vehicle/vessel/airplane), and an automotive infotainment device.
  • GNSS global navigation satellite system
  • EDR event data recorder
  • automotive infotainment device e.g. head-up displays for vehicles
  • industrial or domestic robots drones, automated teller machines (ATMs), point of sales (POS) instruments
  • metering instruments e.g. water, electricity, or gas metering instruments
  • IoT device eg, a light bulb, a sprinkler device, a fire alarm, a thermostat, or a street lamp.
  • the electronic device is not limited to the above-described devices, and, for example, as in the case of a smartphone equipped with a function of measuring personal biometric information (eg, heart rate or blood sugar), a plurality of electronic devices
  • the functions of the devices may be provided in a complex manner.
  • the term user may refer to a person who uses an electronic device or a device (eg, an artificial intelligence electronic device) using the electronic device.
  • the electronic device 701 communicates with the electronic device 702 through a first network 798 (eg, a short-range wireless communication network) or a second network 799 . It may communicate with the electronic device 704 or the server 708 through (eg, a remote wireless communication network). According to an embodiment, the electronic device 701 may communicate with the electronic device 704 through the server 708 .
  • the electronic device 701 includes a processor 720 , a memory 730 , an input device 750 , a sound output device 755 , a display device 760 , an audio module 770 , and a sensor module ( 776 , interface 777 , haptic module 779 , camera module 780 , power management module 788 , battery 789 , communication module 790 , subscriber identification module 796 , or antenna module 797 . ) may be included. In some embodiments, at least one of these components (eg, the display device 760 or the camera module 780 ) may be omitted or one or more other components may be added to the electronic device 701 . In some embodiments, some of these components may be implemented as one integrated circuit. For example, the sensor module 776 (eg, a fingerprint sensor, an iris sensor, or an illuminance sensor) may be implemented while being embedded in the display device 760 (eg, a display).
  • the sensor module 776 eg, a fingerprint sensor, an
  • the processor 720 executes software (eg, a program 740) to execute at least one other component (eg, a hardware or software component) of the electronic device 701 connected to the processor 720 . It can control and perform various data processing or operations. According to one embodiment, as at least part of data processing or computation, the processor 720 converts commands or data received from other components (eg, the sensor module 776 or the communication module 790 ) to the volatile memory 732 . may load into the volatile memory 732 , process the commands or data stored in the volatile memory 732 , and store the resulting data in the non-volatile memory 734 .
  • software eg, a program 740
  • the processor 720 converts commands or data received from other components (eg, the sensor module 776 or the communication module 790 ) to the volatile memory 732 . may load into the volatile memory 732 , process the commands or data stored in the volatile memory 732 , and store the resulting data in the non-volatile memory 734 .
  • the processor 720 includes a main processor 721 (eg, a central processing unit or an application processor), and a co-processor 723 (eg, a graphics processing unit, an image signal processor) capable of operating independently or in conjunction with the main processor 721 (eg, a graphics processing unit or an image signal processor). , a sensor hub processor, or a communication processor). Additionally or alternatively, the auxiliary processor 723 may be configured to use less power than the main processor 721 or to be specialized for a designated function.
  • the coprocessor 723 may be implemented separately from or as part of the main processor 721 .
  • the coprocessor 723 may, for example, act on behalf of the main processor 721 while the main processor 721 is in an inactive (eg, sleep) state, or when the main processor 721 is active (eg, executing an application). ), together with the main processor 721, at least one of the components of the electronic device 701 (eg, the display device 760, the sensor module 776, or the communication module 790) It is possible to control at least some of the related functions or states.
  • coprocessor 723 eg, image signal processor or communication processor
  • the memory 730 may store various data used by at least one component (eg, the processor 720 or the sensor module 776 ) of the electronic device 701 .
  • the data may include, for example, input data or output data for software (eg, the program 740 ) and instructions related thereto.
  • the memory 730 may include a volatile memory 732 or a non-volatile memory 734 .
  • the program 740 may be stored as software in the memory 730 , and may include, for example, an operating system 742 , middleware 744 , or an application 746 .
  • the input device 750 may receive a command or data to be used by a component (eg, the processor 720 ) of the electronic device 701 from the outside (eg, a user) of the electronic device 701 .
  • the input device 750 may include, for example, a microphone, a mouse, a keyboard, or a digital pen (eg, a stylus pen).
  • the sound output device 755 may output a sound signal to the outside of the electronic device 701 .
  • the sound output device 755 may include, for example, a speaker or a receiver.
  • the speaker can be used for general purposes, such as multimedia playback or recording playback, and the receiver can be used to receive incoming calls. According to one embodiment, the receiver may be implemented separately from or as part of the speaker.
  • the display device 760 may visually provide information to the outside (eg, a user) of the electronic device 701 .
  • the display device 760 may include, for example, a display, a hologram device, or a projector and a control circuit for controlling the corresponding device.
  • the display device 760 may include a touch circuitry configured to sense a touch or a sensor circuit (eg, a pressure sensor) configured to measure the intensity of a force generated by the touch. have.
  • the audio module 770 may convert a sound into an electric signal or, conversely, convert an electric signal into a sound. According to an embodiment, the audio module 770 obtains a sound through the input device 750 or an external electronic device (eg, a sound output device 755 ) directly or wirelessly connected to the electronic device 701 .
  • the electronic device 702) eg, a speaker or headphones
  • the sensor module 776 detects an operating state (eg, power or temperature) of the electronic device 701 or an external environmental state (eg, a user state), and generates an electrical signal or data value corresponding to the sensed state. can do.
  • the sensor module 776 may include, for example, a gesture sensor, a gyro sensor, a barometric pressure sensor, a magnetic sensor, an acceleration sensor, a grip sensor, a proximity sensor, a color sensor, an IR (infrared) sensor, a biometric sensor, It may include a temperature sensor, a humidity sensor, or an illuminance sensor.
  • the interface 777 may support one or more designated protocols that may be used for the electronic device 701 to be directly or wirelessly connected with an external electronic device (eg, the electronic device 702 ).
  • the interface 777 may include, for example, a high definition multimedia interface (HDMI), a universal serial bus (USB) interface, an SD card interface, or an audio interface.
  • HDMI high definition multimedia interface
  • USB universal serial bus
  • SD card interface Secure Digital Card
  • connection terminal 778 may include a connector through which the electronic device 701 can be physically connected to an external electronic device (eg, the electronic device 702 ).
  • the connection terminal 778 may include, for example, an HDMI connector, a USB connector, an SD card connector, or an audio connector (eg, a headphone connector).
  • the haptic module 779 may convert an electrical signal into a mechanical stimulus (eg, vibration or movement) or an electrical stimulus that the user can perceive through tactile or kinesthetic sense.
  • the haptic module 779 may include, for example, a motor, a piezoelectric element, or an electrical stimulation device.
  • the camera module 780 may capture still images and moving images. According to one embodiment, the camera module 780 may include one or more lenses, image sensors, image signal processors, or flashes.
  • the power management module 788 may manage power supplied to the electronic device 701 .
  • the power management module 788 may be implemented as at least part of a power management integrated circuit (PMIC), for example.
  • PMIC power management integrated circuit
  • the battery 789 may supply power to at least one component of the electronic device 701 .
  • battery 789 may include, for example, a non-rechargeable primary cell, a rechargeable secondary cell, or a fuel cell.
  • the communication module 790 is a direct (eg, wired) communication channel or a wireless communication channel between the electronic device 701 and an external electronic device (eg, the electronic device 702 , the electronic device 704 , or the server 708 ). It can support establishment and communication through the established communication channel.
  • the communication module 790 may include one or more communication processors that operate independently of the processor 720 (eg, an application processor) and support direct (eg, wired) communication or wireless communication.
  • the communication module 790 is a wireless communication module 792 (eg, a cellular communication module, a short-range communication module, or a global navigation satellite system (GNSS) communication module) or a wired communication module 794 (eg, : It may include a local area network (LAN) communication module, or a power line communication module).
  • a wireless communication module 792 eg, a cellular communication module, a short-range communication module, or a global navigation satellite system (GNSS) communication module
  • GNSS global navigation satellite system
  • wired communication module 794 eg, : It may include a local area network (LAN) communication module, or a power line communication module.
  • a corresponding communication module may be a first network 798 (eg, a short-range communication network such as Bluetooth, WiFi direct, or infrared data association (IrDA)) or a second network 799 (eg, a cellular network, the Internet, or It may communicate with the external electronic device 704 through a computer network (eg, a telecommunication network such as a LAN or WAN).
  • a computer network eg, a telecommunication network such as a LAN or WAN.
  • These various types of communication modules may be integrated into one component (eg, a single chip) or may be implemented as a plurality of components (eg, multiple chips) separate from each other.
  • the wireless communication module 792 uses the subscriber information (eg, International Mobile Subscriber Identifier (IMSI)) stored in the subscriber identification module 796 within a communication network, such as the first network 798 or the second network 799 .
  • the electronic device 701 may be identified and authenticated.
  • the antenna module 797 may transmit or receive a signal or power to the outside (eg, an external electronic device).
  • the antenna module 797 may include one antenna including a conductor formed on a substrate (eg, a PCB) or a radiator formed of a conductive pattern.
  • the antenna module 797 may include a plurality of antennas. In this case, at least one antenna suitable for a communication scheme used in a communication network such as the first network 798 or the second network 799 is connected from the plurality of antennas by, for example, the communication module 790 . can be selected. A signal or power may be transmitted or received between the communication module 790 and the external electronic device through the selected at least one antenna.
  • other components eg, RFIC
  • other than the radiator may be additionally formed as a part of the antenna module 797 .
  • peripheral devices eg, a bus, general purpose input and output (GPIO), serial peripheral interface (SPI), or mobile industry processor interface (MIPI)
  • GPIO general purpose input and output
  • SPI serial peripheral interface
  • MIPI mobile industry processor interface
  • the command or data may be transmitted or received between the electronic device 701 and the external electronic device 704 through the server 708 connected to the second network 799 .
  • Each of the external electronic devices 702 and 1204 may be the same as or different from the electronic device 701 .
  • all or part of the operations performed by the electronic device 701 may be executed by one or more of the external electronic devices 702 , 704 , or 708 .
  • the electronic device 701 may instead of executing the function or service itself.
  • one or more external electronic devices may be requested to perform at least a part of the function or the service.
  • the one or more external electronic devices that have received the request may execute at least a part of the requested function or service, or an additional function or service related to the request, and transmit a result of the execution to the electronic device 701 .
  • the electronic device 701 may process the result as it is or additionally and provide it as at least a part of a response to the request.
  • cloud computing, distributed computing, or client-server computing technology may be used.
  • An electronic device (eg, the streaming server 120 of FIG. 1 , the server 708 of FIG. 7 ) according to various embodiments of the present disclosure is an external device (eg, the terminal device 130 of FIG. 1 , the electronic device 701 of FIG. 7 ) ), a communication circuit (eg, the communication circuit 190 of FIG. 1 ), a memory that stores a plurality of images corresponding to a plurality of viewpoints (eg, the memory 160 of FIG. 1 ), and a processor ( Example: the processor 150 of FIG.
  • each of the plurality of images consists of a plurality of sub-tracks, each of the plurality of sub-tracks consists of successive frames, and each of the frames has one attribute of a first type frame or a second type frame, the plurality of sub-tracks have different ratios of the first type frame among all frames
  • the processor eg, the processor 150 in FIG. 1
  • a request for viewpoint switching from the external device eg, the terminal device 130 of FIG. 1 , the electronic device 701 of FIG. 7
  • transmit a first sub-track including the first type frame among a plurality of sub-tracks of a second image for a second time point corresponding to the request to the external device eg, FIG. 1 .
  • the first sub-track may be a sub-track having the highest rate of inclusion of the first type frame among a plurality of sub-tracks of the second image.
  • the first sub-track may be an image in which all frames are composed of the first type frame.
  • the first time is a time for switching to the second image in response to the request
  • the processor eg, the processor 150 of FIG. 1
  • the second image may be changed to a second sub-track including the first type frame among the plurality of sub-tracks and transmitted.
  • the second sub-track may have a lower proportion of the first type frame than the first sub-track.
  • the second sub-track may have a higher image compression ratio than the first sub-track.
  • the second sub-track may have a higher network priority than the first sub-track.
  • the processor selects a sub-track having a low ratio of the first type frame among the plurality of sub-tracks of the second image. It can be sequentially changed and transmitted.
  • the processor eg, the processor 150 of FIG. 1
  • the external device eg, the terminal device 130 of FIG. 1 , the electronic device 701 of FIG. 7
  • the processor is the external device before the first time information on the frame configuration of the first image or the second image may be transmitted to the .
  • the processor may change the frame configuration of the plurality of sub-tracks of the second image according to time.
  • the processor may include a network condition, the number of the external devices (eg, the terminal device 130 of FIG. 1 , the electronic device 701 of FIG. 7 );
  • the frame configuration may be changed based on one of the properties of the first image or the second image.
  • the first image may have the same frame configuration as that of the second image.
  • the processor may receive the request, wait a specified time, and then switch the image in response to the request.
  • the first type frame may be an independently decodable frame
  • the second type frame may be a decodable frame using the second type frame
  • the processor may include a first switch for switching corresponding to the request and a first switch for selecting one of the plurality of sub-tracks of the second image. 2 switches can be controlled.
  • the processor eg, the processor 150 of FIG. 1
  • the processor 150 when all of the plurality of sub-tracks of the second image are of the second type frame at the first time, the processor (eg, the processor 150 of FIG. 1 ) is configured to control the plurality of sub-tracks. It may wait until at least one of them is changed to the first type frame.
  • An image transmission method includes an electronic device (eg, the electronic device of FIG. 1 ) that transmits one of a plurality of images to an external device (eg, the terminal device 130 of FIG. 1 and the electronic device 701 of FIG. 7 ).
  • Streaming server 120 performed in the server 708 of FIG. 7), one of the plurality of sub-tracks of the first image for the first view among the plurality of images to the external device (eg, the terminal of FIG. 1)
  • the operation of transmitting to the device 130 the electronic device 701 of FIG.
  • each of the plurality of sub-tracks is composed of consecutive frames, and each of the frames is one of a first type frame or a second type frame
  • the plurality of sub-tracks have one property, the ratio of the first type frame among the entire frame is different from each other, and the external device (eg, the terminal device 130 of FIG. 1 , the electronic device 701 of FIG. 7 ) a plurality of sub-tracks of the second image in the operation of receiving a request for view switching from Among them, the method may include transmitting the first sub-track including the first type frame to the external device (eg, the terminal device 130 of FIG. 1 and the electronic device 701 of FIG. 7 ).
  • the operation of transmitting the first sub-track may include the operation of transmitting the sub-track having the highest rate of inclusion of the first type frame among a plurality of sub-tracks of the second image.
  • the operation of transmitting the first sub-track may include an operation of transmitting the first sub-track in which all frames are configured as the first type frame.
  • the method of transmitting the image may further include the operation of changing and transmitting the second image to a second sub-track including the first type frame among the plurality of sub-tracks.
  • the electronic device may have various types of devices.
  • the electronic device may include, for example, a portable communication device (eg, a smart phone), a computer device, a portable multimedia device, a portable medical device, a camera, a wearable device, or a home appliance device.
  • a portable communication device eg, a smart phone
  • a computer device e.g., a smart phone
  • a portable multimedia device e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a wearable device e.g., a smart bracelet
  • a home appliance device e.g., a home appliance
  • first”, “second”, or “first” or “second” may simply be used to distinguish the component from other components in question, and may refer to components in other aspects (e.g., importance or order) is not limited. that one (eg first) component is “coupled” or “connected” to another (eg, second) component with or without the terms “functionally” or “communicatively” When referenced, it means that one component can be connected to the other component directly (eg by wire), wirelessly, or through a third component.
  • module may include a unit implemented in hardware, software, or firmware, and may be used interchangeably with terms such as, for example, logic, logic block, component, or circuit.
  • a module may be an integrally formed component or a minimum unit or a part of the component that performs one or more functions.
  • the module may be implemented in the form of an application-specific integrated circuit (ASIC).
  • ASIC application-specific integrated circuit
  • Various embodiments of the present document include one or more instructions stored in a storage medium (eg, internal memory 736 or external memory 738) readable by a machine (eg, electronic device 701). may be implemented as software (eg, a program 740) including
  • a processor eg, processor 720
  • a device eg, electronic device 701
  • the one or more instructions may include code generated by a compiler or code executable by an interpreter.
  • the device-readable storage medium may be provided in the form of a non-transitory storage medium.
  • 'non-transitory' only means that the storage medium is a tangible device and does not contain a signal (eg, electromagnetic wave), and this term refers to the case where data is semi-permanently stored in the storage medium and It does not distinguish between temporary storage cases.
  • a signal eg, electromagnetic wave
  • the method according to various embodiments disclosed in this document may be provided as included in a computer program product.
  • Computer program products may be traded between sellers and buyers as commodities.
  • the computer program product is distributed in the form of a machine-readable storage medium (eg compact disc read only memory (CD-ROM)), or via an application store (eg Play Store TM ) or on two user devices ( It can be distributed (eg downloaded or uploaded) directly or online between smartphones (eg: smartphones).
  • a part of the computer program product may be temporarily stored or temporarily generated in a machine-readable storage medium such as a memory of a server of a manufacturer, a server of an application store, or a relay server.
  • each component eg, a module or a program of the above-described components may include a singular or a plurality of entities.
  • one or more components or operations among the above-described corresponding components may be omitted, or one or more other components or operations may be added.
  • a plurality of components eg, a module or a program
  • the integrated component may perform one or more functions of each component of the plurality of components identically or similarly to those performed by the corresponding component among the plurality of components prior to the integration. .
  • operations performed by a module, program, or other component are executed sequentially, in parallel, repeatedly, or heuristically, or one or more of the operations are executed in a different order, or omitted. or one or more other operations may be added.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

전자 장치는 통신 회로, 복수의 영상들을 저장하는 메모리, 및 프로세서를 포함하고, 상기 복수의 영상들 각각은 복수의 서브 트랙들로 구성되고, 상기 복수의 서브 트랙들 각각은 연속적인 프레임들로 구성되고, 상기 프레임들 각각은 제1 타입 프레임 또는 제2 타입 프레임 중 하나의 속성을 가지고, 상기 복수의 서브 트랙들은 전체 프레임 중 상기 제1 타입 프레임의 비율이 서로 다르고, 상기 프로세서는 상기 복수의 영상들 중 제1 시점에 대한 제1 영상의 복수의 서브 트랙들 중 하나를 상기 외부 장치에 전송하고, 상기 외부 장치로부터 시점 전환에 관한 요청을 수신하고, 제1 시간에, 상기 요청에 대응하는 제2 시점에 대한 제2 영상의 복수의 서브 트랙들 중 상기 제1 타입 프레임을 포함하는 제1 서브 트랙을 상기 외부 장치에 전송할 수 있다.

Description

영상 스트리밍 방법 및 이를 지원하는 전자 장치
본 문서의 다양한 실시 예는 영상을 스트리밍하는 방법 및 이를 지원하는 전자 장치에 관한 것이다.
복수의 카메라들을 이용하여 동시에 촬영된 다시점 영상(다방향 영상)을 서버에서 사용자의 단말 장치에 제공하는 영상 서비스가 이용되고 있다. 서버에서 단말 장치로 하나의 시점에 대응하는 영상을 스트리밍하는 과정 중, 단말 장치에서 시점을 전환하도록 하는 요청이 발생하는 경우, 서버는 상기 요청에 대응하여 다른 시점의 영상을 단말 장치에 스트리밍할 수 있다. 예를 들어, 야구장에서 복수의 카메라들을 이용하여 각각 영상이 촬영되고, 하나의 카메라에서 촬영된 영상(예: 1루측 카메라에서 촬영된 영상)이 스트리밍 방식에 의해 사용자의 단말 장치(예: 스마트폰, 태블릿 PC, 랩탑 PC)를 통해 표시될 수 있다. 사용자가 시점을 전환하는 입력을 발생시키는 경우, 다른 각도의 카메라에서 촬영된 영상(예: 3루측 카메라에서 촬영 영상)이 스트리밍될 수 있다.
종래의 기술에 의한 다시점 영상의 전송 방법은, i) 다른 시점의 영상을 동시 수신 하는 방식, ii) 스위칭 프레임을 추가 생성하는 방식, iii) 계층적 구조로 2개의 스트림을 전달하는 방식, iv) 시점 전환용 추가 영상을 전달하는 방식 등이 이용되고 있다. 상기 방식들은 네트워크 대역폭의 증가가 요구되거나, 추가적인 프레임 생성으로 인해, 인코딩 자원 및 비용이 증가할 수 있다.
본 문서의 다양한 실시예에 따른 서버 장치는 하나의 시점에 대해 서로 다른 프레임 구조를 가지는 서브 트랙들을 이용하여, 스트리밍에 필요한 네트워크 대역폭을 줄일 수 있다.
전자 장치는 외부 장치에 영상을 전송하고, 통신 회로, 복수의 시점에 대응하는 복수의 영상들을 저장하는 메모리, 및 프로세서를 포함하고, 상기 복수의 영상들 각각은 복수의 서브 트랙들로 구성되고, 상기 복수의 서브 트랙들 각각은 연속적인 프레임들로 구성되고, 상기 프레임들 각각은 제1 타입 프레임 또는 제2 타입 프레임 중 하나의 속성을 가지고, 상기 복수의 서브 트랙들은 전체 프레임 중 상기 제1 타입 프레임의 비율이 서로 다르고, 상기 프로세서는 상기 복수의 영상들 중 제1 시점에 대한 제1 영상의 복수의 서브 트랙들 중 하나를 상기 외부 장치에 전송하고, 상기 통신 회로를 통해, 상기 외부 장치로부터 시점 전환에 관한 요청을 수신하고, 제1 시간에, 상기 요청에 대응하는 제2 시점에 대한 제2 영상의 복수의 서브 트랙들 중 상기 제1 타입 프레임을 포함하는 제1 서브 트랙을 상기 외부 장치에 전송할 수 있다.
본 문서에 개시되는 다양한 실시예들에 따른 전자 장치는 서로 다른 프레임 구조를 가지는 서브 트랙들을 이용하여, 다시점 비디오 서비스에서 영상 재생에 사용되는 네트워크 대역폭을 감소시킬 수 있다.
본 문서에 개시되는 다양한 실시예들에 따른 전자 장치는 서로 다른 프레임 구조를 가지는 서브 트랙들을 이용하여, 사용자의 시점 전환 요청에 대한 반응 시간을 줄일 수 있다.
도 1은 다양 실시 예에 따른 영상 스트리밍 시스템을 나타낸다.
도 2는 일 실시예에 따른 스트리밍 서버를 나타낸다.
도 3은 다양한 실시예에 따른 복수의 서브 트랙들의 저장 및 선택을 나타낸다.
도 4는 다양한 실시예에 따른 스트리밍 서버에서 수행되는 영상 스트리밍 방법을 나타낸다.
도 5는 다양한 실시예에 따른 시간에 따른 프레임 구조의 동적 변경을 나타낸다.
도 6은 다양한 실시예에 따른 프레임 구조 정보의 전송을 통한 영상 스트리밍 방법을 나타낸다.
도 7은 다양한 실시 예들에 따른 네트워크 환경 내의 전자 장치의 블록도 이다.
도면의 설명과 관련하여, 동일 또는 유사한 구성요소에 대해서는 동일 또는 유사한 참조 부호가 사용될 수 있다.
이하, 본 문서의 다양한 실시예가 첨부된 도면을 참조하여 기재된다. 그러나, 이는 본 문서에 기재된 기술을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 문서의 실시예의 다양한 변경(modifications), 균등물(equivalents), 및/또는 대체물(alternatives)을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다.
도 1은 다양 실시 예에 따른 영상 스트리밍 시스템을 나타낸다.
도 1을 참조하면, 영상 스트리밍 시스템(100)은 소스 장치(110), 스트리밍 서버(120) 및 단말 장치(130)을 포함할 수 있다. 도 1은 예시적인 것으로 이에 한정되는 것은 아니다. 예를 들어, 영상 스트리밍 시스템(100)은 도 1의 구성들 사이에 다른 장치들을 포함할 수 있다. 예를 들어, 소스 장치(110)와 스트리밍 서버(120) 사이에 별도의 연계 서버가 포함될 수 있다. 다른 예를 들어, 스트리밍 서버(120)와 단말 장치(130) 사이에 별도의 중계 장치(예: 데스크탑 PC)가 포함될 수 있다.
다양한 실시 예에 따르면, 소스(source) 장치(110)는 다시점 영상을 획득하거나 저장할 수 있다. 소스 장치(110)는 영상을 촬영할 수 있는 카메라 장치, 카메라 장치를 통해 촬영된 영상을 저장할 수 있는 저장 장치, 또는 복수의 영상 처리 장치들을 포함할 수 있다. 예를 들어, 소스 장치(110)는 복수개의 스마트폰들일 수 있다. 일 실시예에서, 다시점 영상은 동일 객체를 다양한 각도에서 촬영한 영상이거나, 동일 또는 인접한 공간내에서 다양한 방향으로 촬영된 영상일 수 있다. 예를 들어, 다시점 영상은 야구장 내에 복수의 카메라들을 다양한 각도로 설치하고 촬영된 영상일 수 있다. 각각의 카메라에서 촬영된 영상들은 촬영 시간에 따라 서로 연계되어 저장될 수 있다. 또는 각각의 카메라에서 촬영된 영상들은 촬영 시간에 따라 서로 연계되어 네트워크를 통해 서버(예: 스트리밍 서버(120) 또는 다른 서버)로 스트리밍 될 수 있다.
다양한 실시 예에 따르면, 스트리밍 서버(120)(예: 도 7의 서버 (708))는 소스 장치(110)으로부터 영상을 수신할 수 있다. 스트리밍 서버(120)는 수신한 영상을 단말 장치(130)에 스트리밍할 수 있다. 스트리밍 서버(120)는 소스 장치(110)으로부터 실시간 영상을 수신하거나, 미리 저장된 영상(예: VOD(video on demand) 영상)을 수신할 수 있다.
일 실시예에서, 스트리밍 서버(120)는 소스 장치(110)으로부터 다시점 영상을 수신할 수 있다. 다시점 영상은 동일 객체를 다양한 각도에서 촬영한 영상이거나, 동일 또는 인접한 공간내에서 다양한 방향으로 촬영된 영상일 수 있다. 예를 들어, 스트리밍 서버(120)는 N개 시점에 대응하는 영상(또는 영상 소스)들을 N개의 트랙으로 매핑하여 수신할 수 있다.
다양한 실시예에 따르면, 스트리밍 서버(120)는 수신한 다시점 영상(다방향 영상)을 각각의 시점에 대응하는 영상(이하, 시점 영상)을 서로 다른 GOP 구조를 가지는 복수의 서브 트랙들(또는 복수의 서브 영상들)로 변환할 수 있다. 예를 들어, 제1 시점(또는 제1 방향)에 대한 제1 시점 영상(또는 제1 방향 영상)을 서로 다른 GOP 구조를 가지는 복수의 서브 트랙들로 변환할 수 있다. 각각의 서브 트랙은 디코딩 되는 경우, 제1 시점 영상과 동일한 영상으로 복원될 수 있다.
다양한 실시 예에 따르면, 스트리밍 서버(120)는 수신한 다시점 영상을 단말 장치(130)에 전송할 수 있다. 스트리밍 서버(120)는 단말 장치(130)에서 요청하는 시점 영상을 스트리밍할 수 있다. 예를 들어, 스트리밍 서버(120)는 단말 장치(130)의 요청에 따라 제5 시점에 대응하는 제5 시점 영상(또는 제5 트랙)을 단말 장치(130)에 스트리밍할 수 있다.
다양한 실시 예에 따르면, 스트리밍 서버(120)는 하나의 시점 영상을 스트리밍하는 중, 단말 장치(130)로부터 다른 시점 영상을 스트리밍하도록 하는 요청(이하, 시점 전환 요청)을 수신하는 경우, 시점 전환 요청에 대응하는 시점 영상을 스트리밍할 수 있다. 예를 들어, 스트리밍 서버(120)는 제17 시점 영상을 단말 장치(130)에 스트리밍하는 중, 단말 장치(130)로부터 제5 시점으로 변경하도록 하는 시점 전환 요청을 수신할 수 있다. 스트리밍 서버(120)는 시점 전환 요청에 대응하여 제5 시점 영상을 단말 장치(130)에 스트리밍할 수 있다.
다양한 실시 예에 따르면, 스트리밍 서버(120)는 단말 장치(130)가 복수개인 경우, 복수개의 단말 장치(130)에 각각 스트리밍 영상을 제공할 수 있다. 이 경우, 한정된 네트워크 리소스(예: 대역폭)를 이용하여 스트리밍 서비스를 제공해야 하기 때문에, 스트리밍 서버(120)는 스트리밍 데이터를 효율적으로 전송할 필요가 있다. 또한, 스트리밍 서버(120)는 사용자의 서비스 품질 요구를 만족시키기 위하여, 단말 장치(130)가 요청하는 시점 변경 요청에 빠르게 반응하여, 각각의 단말 장치(130)가 요청하는 시점 영상을 빠르게 전송할 필요가 있다. 스트리밍 서버(120)는 하나의 시점 영상에 대해 서로 다른 프레임 구조를 가지는 복수의 서브 트랙들을 이용하여, 네트워크 리소스(예: 대역폭)를 효율적으로 운용할 수 있고, 단말 장치(130)의 시점 변경 요구에 빠르게 반응할 수 있다.
다양한 실시예에 따르면, 스트리밍 서버(120)는 프로세서(150), 메모리(160) 및 통신 회로(190)를 포함할 수 있다.
프로세서(150)는 스트리밍 서버(120)의 동작에 필요한 다양한 연산을 수행할 수 있다. 프로세서(150)는 통신 회로(190)을 통해 소스 장치(110)으로부터 다시점 영상을 수신할 수 있다. 프로세서(150)는 수신한 다시점 영상을 구성하는 복수개의 시점 영상들 중 단말 장치(130)가 요청하는 시점 영상을 전송할 수 있다.
다양한 실시예에 따르면, 프로세서(150)는 통신 회로(190)을 통해 다시점 영상 중 하나의 시점 영상을 단말 장치(130)에 전송할 수 있다. 예를 들어, 스트리밍 서버(120)는 단말 장치(130)의 요청에 따라 제5 시점에 대응하는 제5 시점 영상(또는 제5 트랙)을 단말 장치(130)에 스트리밍할 수 있다.
다양한 실시예에 따르면, 프로세서(150)는 스트리밍 서버(120)는 단말 장치(130)의 시점 전환 요청에 대응하여, 스트리밍되는 시점 영상을 변경할 수 있다. 예를 들어, 프로세서(150)는 제17 시점 영상을 단말 장치(130)에 스트리밍하는 중, 단말 장치(130)로부터 제5 시점으로 변경하도록 하는 시점 전환 요청을 수신할 수 있다. 프로세서(150)는 시점 전환 요청에 대응하여 제5 시점 영상을 단말 장치(130)에 스트리밍할 수 있다.
다양한 실시예에 따르면, 프로세서(150)는 하나의 시점 영상에 대해 서로 다른 프레임 구조를 가지는 복수의 서브 트랙들(또는 복수의 서브 영상들)을 저장할 수 있다.
일 실시예에서, 하나의 시점 영상에 대한 복수의 서브 트랙들은 서로 다른 GOP(group of pictures) 구조를 가질 수 있다. 하나의 시점 영상을 구성하는 복수의 서브 트랙들은 서로 다른 I-프레임 비율을 가질 수 있다. 예를 들어, 하나의 시점 영상이 제1 내지 제3 서브 트랙들로 구성되는 경우, 제1 서브 트랙은 모든 프레임이 I-프레임으로 구성될 수 있다. 제2 서브 트랙은 전체 프레임 중 1/4의 I-프레임 비율을 가질 수 있고, 3/4의 P-프레임 비율을 가질 수 있다. 제3 서브 트랙은 전체 프레임 중 1/8의 I-프레임 비율을 가질 수 있고, 7/8의 P-프레임 비율을 가질 수 있다.
다양한 실시예에 따르면, 프로세서(150)는 네트워크 상황, 단말 장치(130)의 개수와 같은 다양한 조건을 확인하여, 복수의 서브 트랙들 중 하나의 서브 트랙을 선택하여 단말 장치(130)에 전송할 수 있다.
다양한 실시예에 따르면, 메모리(160)는 스트리밍 서버(120)의 동작에 필요한 다양한 정보를 저장할 수 있다. 일 실시예에 따르면, 메모리(160)는 입력 버퍼(170) 및 출력 버퍼(180)를 포함할 수 있다. 입력 버퍼(170) 및 출력 버퍼(180)는 물리적 또는 논리적 주소로 구분되도록 설정되거나, 각각 다른 저장 소자로 구현될 수 있다. 입력 버퍼(170)는 다시점 영상을 저장할 수 있다. 입력 버퍼(170)는 각각의 시점 영상에 대해 복수의 서브 트랙들을 저장할 수 있다. 복수의 서브 트랙들은 서로 다른 프레임 구조를 가질 수 있고, 디코딩되는 경우 동일한 품질을 가지는 영상으로 변환될 수 있다. 출력 버퍼(180)는 단말 장치(130)로 전송될 영상을 저장할 수 있다. 출력 버퍼(180)는 프로세서(150)의 스위칭에 의해 시점 영상(또는 시점 영상을 구성하는 복수의 서브 트랙들 중 선택된 서브 트랙)을 일시적으로 저장할 수 있다.
다양한 실시예에 따르면, 통신 회로(190)는 외부 장치(예: 소스 장치(110), 단말 장치(130))와 무선 통신 또는 유선 통신을 통해 데이터를 송수신할 수 있다. 통신 회로(190)는 소스 장치(110)으로부터 시점 영상을 수신하여 입력 버퍼(170)에 저장되도록 전달할 수 있다. 또는 통신 회로(190)는 출력 버퍼(180)에 저장된 영상을 단말 장치(130)에 전송할 수 있다.
다양한 실시예에 따르면, 단말 장치(130)(예: 도 7의 전자 장치(701))는 네트워크를 통해 하나의 시점 영상에 관한 데이터를 수신하여 디스플레이를 통해 표시할 수 있다. 단말 장치(130)는 복수개일 수 있고, 스트리밍 서버(120)로부터 각각 시점 영상을 수신하여 출력할 수 있다. 단말 장치(130)는 서로 다른 시점의 영상을 출력 중일 수 있다. 예를 들어, 단말 장치(130)가 제1 내지 제5 단말 장치를 포함하는 경우, 제1 내지 제5 단말 장치는 각각 서로 다른 시점 영상을 출력할 수 있다. 다른 예를 들어, 제1 내지 제3 단말 장치는 제1 시점 영상을 출력하고, 제4 단말 장치는 제2 시점 영상을 출력하고, 제5 단말 장치는 제4 시점 영상을 출력할 수 있다. 단말 장치(130) 각각의 사용자가 선택한 시점 영상이 다양하게 출력될 수 있다.
도 2는 일 실시예에 따른 스트리밍 서버를 나타낸다.
도 2를 참조하면, 다양한 실시예에 따른 스트리밍 서버(120)는 입력 버퍼(input buffer)(210)(예: 도 1의 입력 버퍼(170)), 트랙 선택부(track selector)(220) 및 출력 버퍼(output buffer)(230)(예: 도 1의 출력 버퍼(180))를 포함할 수 있다. 도 2에서는 스트리밍 서버(120)를 기능에 따라 분류한 것으로 이에 한정되는 것은 아니다. 일부 구성이 추가되거나 생략될 수 있다. 또는 구성이 통합되거나 분리될 수 있다. 스트리밍 서버(120)는 단일 장치 또는 단일 서버 장치가 아닐 수 있고, 복수의 장치 또는 복수의 서버 장치가 결합된 형태일 수 있다. 또는 스트리밍 서버(120)의 적어도 일부 기능은 다른 장치 또는 단말 장치(130)에서 수행될 수도 있다.
다양한 실시예에 따른 입력 버퍼(210)는 다시점 영상을 저장할 수 있다. 입력 버퍼(210)는 각 시점에 대응하는 시점 영상(250-1, 250-2, ... 250-N)에 대해 복수의 서브 트랙들을 저장할 수 있다. 복수의 서브 트랙들은 서로 다른 프레임 구조를 가질 수 있고, 디코딩되는 경우 동일한 품질을 가지는 영상으로 변환될 수 있다. 예를 들어, 제1 시점 영상(250-1)은 3개의 서브 트랙으로 구성될 수 있고, 각각의 서브 트랙은 서로 다른 I-프레임 비율을 가질 수 있다.
도 2에서는 하나의 시점 영상이 3개의 서브 트랙들로 구성되는 경우를 예시적으로 도시하였으나, 이에 한정되는 것은 아니다. 입력 버퍼(210)에 저장되는 복수의 서브 트랙들에 관한 다양한 실시예들은 도 3을 통해 더 제공될 수 있다.
다양한 실시예에 따른 트랙 선택부(220)는 제1 선택부(또는 제1 스위치)(221) 및 제2 선택부(또는 제2 스위치)(222)를 포함할 수 있다. 제1 선택부(221)는 단말 장치(130)의 시점 전환 요청에 대응하여 시점 영상(또는 트랙)을 선택할 수 있다. 제2 선택부(222)는 영상의 전송 효율을 위해 복수의 서브 트랙(또는 서브 트랙)들 중 하나를 선택할 수 있다.
다양한 실시예에 따른 트랙 선택부(220)의 스위칭 동작은 스트리밍 서버(120) 내부의 프로세서(예: 도 1의 프로세서(150))의 동작이거나, 프로세서(150)의 제어에 의한 동작일 수 있다. 이하에서, 트랙 선택부(220)(제1 선택부(221) 및 제2 선택부(222))의 동작은 도 1의 프로세서(150)의 제어에 의한 동작일 수 있다.
도 2에서의 스위칭 동작은 예시적인 것으로 이에 한정되는 것은 아니다. 트랙 선택부(220)의 스위칭 동작은 소프트웨어에 의한 스위칭 또는, 하드웨어 소자에 의한 스위칭일 수 있다.
일 실시예에 따르면, 제1 선택부(221) 및 제2 선택부(222)의 스위칭은 동일한 연산 소자에 의해 제어되거나 서로 다른 연산 소자에 의해 제어될 수 있다. 트랙 선택부(220)는 스트리밍 서버(120)가 설치되는 방식에 따라 서로 다른 컨테이너, 가상화 서버 또는 물리적 서버에서 서로 통신을 통하여 동작할 수도 있다.
다양한 실시예에 따른 제1 선택부(221)는 단말 장치(130)의 시점 전환 요청에 대응하여 스트리밍 할 트랙을 스위칭(또는, 선택)할 수 있다. 예를 들어, 제1 시점 영상(250-1)을 스트리밍 하는 중, 단말 장치(130)로부터 제N 시점으로 전환하도록 하는 시점 변경 요청을 수신하는 경우, 제1 선택부(221)는 스트리밍 하는 트랙을 제1 시점 영상(250-1)이 전송되는 제1 트랙에서, 제N 시점 영상(201-N)이 전송되는 제N 트랙으로 스위칭할 수 있다.
다양한 실시예에 따른 제2 선택부(222)는 지정된 조건에 따라 복수의 서브 트랙들 중 하나를 선택할 수 있다. 예를 들어, 제1 선택부(221)에 의해 트랙이 변경되는 경우, 전환된 시점 영상을 구성하는 복수의 서브 트랙들 중 I-프레임의 비율이 가장 높은 서브 트랙을 선택할 수 있다. 이후, 제2 선택부(222)는 복수의 서브 트랙들 중 I-프레임의 비율이 점차적으로 낮은 서브 트랙을 선택할 수 있다(예: 도 3 참고).
다양한 실시예에 따른 출력 버퍼(230)는 단말 장치(130)로 전송될 영상을 저장할 수 있다. 출력 버퍼(230)는 제1 선택부(221) 및 제2 선택부(222)에 의해 선택된 트랙을 통해 전송되는 영상을 일시적으로 저장할 수 있다.
도 3은 다양한 실시예에 따른 복수의 서브 트랙들의 저장 및 선택 을 나타낸다.
도 3을 참조하면, 다양한 실시예에 따른 입력 버퍼(210)는 다시점 영상을 저장할 수 있다. 입력 버퍼(210)는 각각의 시점 영상(250-1, 250-2, ... 250-N)에 대해 복수의 서브 트랙들을 저장할 수 있다. 복수의 서브 트랙들은 서로 다른 GOP(group of pictures) 구조를 가질 수 있다.
예를 들어, 제1 시점 영상(250-1)에 대한 제1 서브 트랙(sub-track1,1)(250-1-1)은 전체 프레임이 모두 I-프레임으로 구성될 수 있다(I-프레임 비율(RI)=1). 제1 시점 영상(250-1)에 대한 제2 서브 트랙(sub-track1,2)(250-1-2)은 4개의 프레임 당 1개의 I 프레임을 포함하고, 나머지는 P 프레임으로 구성될 수 있다(I-프레임 비율(RI)=1/4). 제1 시점 영상(250-1)에 대한 제3 서브 트랙(sub-track1,3)(250-1-3)은 8개의 프레임 당 하나의 I-프레임을 포함하고, 나머지는 P 프레임으로 구성될 수 있다(I-프레임 비율(RI)=1/8).
다른 예를 들어, 제N 시점 영상(250-N)에 대한 제1 서브 트랙(sub-trackN,1)(250-N-1)은 전체 프레임이 모두 I-프레임으로 구성될 수 있다(I-프레임 비율(RI)=1). 제N 시점 영상(250-N)에 대한 제2 서브 트랙(sub-trackN,2)(250-N-2)은 4개의 프레임 당 4개의 I 프레임을 포함하고, 나머지는 P 프레임으로 구성될 수 있다(I-프레임 비율(RI)=1/4). 제N 시점 영상(250-N)에 대한 제3 서브 트랙(sub-trackN,3)(250-N-3)은 8개의 프레임 당 하나의 I-프레임을 포함하고, 나머지는 P 프레임으로 구성될 수 있다(I-프레임 비율(RI)=1/8).
다양한 실시예에 따르면, 스트리밍 서버(120)의 프로세서(예: 도 1의 프로세서(150))는 소스 장치(예: 도 1의 소스 장치(110))으로부터 수신한 소스 영상을 서로 다른 GOP 구조를 가지는 복수의 서브 트랙들로 변환하여 저장할 수 있다. 또는 프로세서(150)는 소스 장치(110)로부터 각각의 시점 영상에 대해 복수의 서브 트랙들로 변환된 소스 영상을 수신하여 저장할 수도 있다.
다양한 실시예에 따르면, 하나의 시점 영상에 대한 복수의 서브 트랙들은 모두 동일한 화질을 제공할 수 있고, 인터 프레임(inter-frame) 압축의 특성 상, 각 서브 트랙의 비트레이트(bitrate)는 제3 서브 트랙(250-N-3) < 제2 서브 트랙(250-N-2) < 제1 서브 트랙(250-N-1)의 순서로 증가할 수 있다. 따라서, 동일한 화질의 영상을 재생하기 위해 필요한 네트워크 대역폭은 제3 서브 트랙(250-N-3) < 제2 서브 트랙(250-N-2) < 제1 서브 트랙(250-N-1)의 순서로 증가할 수 있다. 다수의 사용자에게 동일한 스트리밍 서비스를 제공하기 위해서는 한정된 네트워크 대역폭을 효율적으로 이용해는 경우, I-프레임의 비율이 낮은 서브 영상일수록 높은 네트워크 우선 순위(priority)를 가질 수 있다. 예를 들어, 네트워크 우선 순위는 제1 서브 트랙(250-N-1) < 제2 서브 트랙(250-N-2) < 제3 서브 트랙(250-N-3)의 순서로 높을 수 있다.
다양한 실시예에 따르면, 시점 영상을 구성하는 복수의 서브 트랙들은 각각 연속된 비디오 프레임들로 구성될 수 있다. 영상이 스트리밍 되는 중, 단말 장치(130)로부터 시점 전환 요청을 수신하는 경우, 프로세서(150)(예: 도 2의 제1 선택부(221))는 스트리밍 중인 제1 시점 영상(250-1)에서, 시점 전환 요청에 대응하는 제N 시점 영상(또는, 트랙)(250-N)으로 전환할 수 있다. 프로세서(150)(예: 도 2의 제2 선택부(222))는 지정된 조건에 따라 복수의 서브 트랙(또는, 서브 영상)들 중 하나를 선택하여 스트리밍할 수 있다.
다양한 실시예에 따르면, 시점 영상이 전환되는 제1 시간(또는, 프로세서(150)가 시점 영상의 스위칭을 수행하는 시간)에, 각각의 서브 트랙이 가지는 프레임의 종류는 서로 다를 수 있다. 예를 들어, t0 시간에 스트리밍 중인 제1 시점 영상(250-1)에서 제N 시점 영상(250-N)으로 전환되는 경우, 제N 시점 영상(250-N)을 구성하는 제1 내지 제3 서브 트랙들(250-N-1, 250-N-2, 250-N-3))이 가지는 프레임은 각각 I-프레임, P-프레임, 및 P-프레임일 수 있다.
다양한 실시예에 따르면, 시점 영상이 전환되는 제1 시간(예: t0)에, 프로세서(150)(예: 도 2의 제2 선택부(222))는 스트리밍할 서브 트랙을 I-프레임을 가지는 제1 서브 트랙(250-N-1)으로 결정하여 스트리밍을 시작할 수 있다. 비교 예에서, 단말 장치(예: 도 1의 단말 장치 (130))가 스트리밍 서버(120)로부터 P-프레임을 가지는 제2 서브 트랙(250-N-2) 또는 제3 서브 트랙(250-N-3)을 수신하는 경우, 단말 장치(130)는 수신한 프레임을 디코딩할 수 있는 기준 프레임(reference frame)을 가지고 있지 않아 정상적인 화면을 출력하지 못할 수 있다. 반면, 본 발명의 일 실시예에서, I-프레임을 가지는 제1 서브 트랙(250-N-1)이 1차적으로 전송되는 경우, 기준 프레임(reference frame)을 필요로 하지 않을 수 있고 단말 장치(130)는 사용자에게 정상적인 화면을 제공할 수 있다.
다양한 실시예에 따르면, 제2 서브 트랙(250-N-2)이 I-프레임을 가지는 제2 시간(예: t1)에 시점 영상이 유지되는 경우(별도의 시점 전환 요청이 수신되지 않은 경우), 프로세서(150)(예: 도 2의 제2 선택부(222))는 제2 서브 트랙(250-N-2)를 선택하여 스트리밍할 수 있다. 유사하게, 제3 서브 트랙(250-N-3)가 I-프레임을 가지는 제3 시간(예: t5)에 시점 영상이 유지되는 경우, 프로세서(150)(예: 제2 선택부(222))는 제3 서브 트랙(250-N-3)을 선택하여 스트리밍할 수 있다. 프로세서(150)(예: 제2 선택부(222))의 순차적인 스위칭에 의해 스트리밍하는 서브 트랙의 I-프레임의 비율이 점차적으로 낮아질 수 있고, 네트워크 효율성이 높아질 수 있다.
다양한 실시예에 따르면, 프로세서(150)는 네트워크 상황에 따라 서브 트랙 사이의 변경 시간을 빠르게 설정할 수 있다. 예를 들어, 네트워크의 통신 품질이 지정된 값 이하인 경우, 프로세서(150)(예: 도 2의 제2 선택부(222))는 제2 서브 트랙(250-N-2)이 I-프레임을 가지는 제2 시간(예: t1)에 바로 제2 서브 트랙(250-N-2)를 선택하여 스트리밍할 수 있다. 다른 예를 들어, 네트워크의 통신 품질이 지정된 값 초과인 경우, 프로세서(150)(예: 도 2의 제2 선택부(222))는 제2 서브 트랙(250-N-2)이 제2 시간(예: t1)이 아닌 이후의 다른 시간에 제2 서브 트랙(250-N-2)을 선택하여 스트리밍할 수 있다.
다양한 실시예에 따르면, 프로세서(150)는 시점 전환 전후의 프레임 구조가 변경되는 경우, 관련 정보를 단말 장치(130)에 제공할 수 있다. 예를 들어, 제1 시점 영상(250-1)에 대한 제3 서브 트랙(sub-track1,3)(250-1-3)(I-프레임 비율(RI)=1/8)으로 스트리밍 하는 중, 시점 전환 요청에 의해 제N 시점 영상(250-N)에 대한 제1 서브 트랙(sub-trackN,1)(250-N-1)(I-프레임 비율(RI)=1)로 전환되는 경우, 프로세서(150)는 화질 변경이 발생할 수 있다는 메시지를 단말 장치(130)에 제공할 수 있다.
다양한 실시예에 따르면, 프로세서(150)는 지정된 조건에 따라 서브 트랙 사이의 변경을 제한하는 구간을 설정할 수 있다. 상기 조건은 사용자들의 시점 전환과 관련된 이력에 관한 정보, 또는 시점 전환과 관련된 미리 분석된 정보를 기반으로 할 수 있다.
도 4는 다양한 실시예에 따른 스트리밍 서버에서 수행되는 영상 스트리밍 방법을 나타낸다.
도 4를 참조하면, 다양한 실시예에 따르면, 동작 410에서, 스트리밍 서버(120)의 프로세서(예: 도 1의 프로세서(150))는 다시점 영상에서 제1 시점 영상을 구성하는 복수의 서브 트랙 중 하나를 이용하여 단말 장치(130)에 스트리밍할 수 있다. 예를 들어, 프로세서는 복수의 서브 트랙 중 I-프레임의 비율이 가장 낮은 서브 트랙으로 스트리밍을 진행 중일 수 있다.
다양한 실시예에 따르면, 프로세서(150)는 입력 버퍼(210)에서 해당 프레임을 dequeue 한 후, 출력 버퍼(230)로 프레임이 enqueue 하는 동작을 통해 스트리밍을 수행할 수 있다.
다양한 실시예에 따르면, 동작 420에서, 스트리밍 서버(120)의 프로세서(150)는 단말 장치(130)로부터 시점 전환 요청을 수신하는지를 확인할 수 있다. 프로세서(150)는 시점 전환 요청을 수신하지 않은 경우(동작 420의 No), 스트리밍 상태를 유지하거나, 보다 높은 네트워크 우선 순위를 가지는 서브 트랙으로 변경하여 스트리밍을 계속할 수 있다.
다양한 실시예에 따르면, 동작 430에서, 스트리밍 서버(120)의 프로세서는 단말 장치로부터 시점 전환 요청을 수신하는 경우(동작 420의 Yes), 상기 요청에 대응하는 제2 시점 영상으로 전환하는 제1 시간에, 상기 제2 시점 영상 중 제1 타입 프레임(예: I-프레임)을 포함하는 서브 트랙을 스트리밍할 수 있다.
예를 들어, 도 3의 예에서, 스트리밍 중인 시점 영상에서 제N 시점 영상(250-N)으로 전환되고, 전환되는 시간에 제N 시점 영상(250-N)을 구성하는 제1 내지 제3 서브 트랙(250-N-1, 250-N-2, 250-N-3) 중, 제1 서브 트랙(250-N-1)만 I-프레임을 포함하는 경우, 프로세서(150)는 제1 서브 트랙(250-N-1)을 스트리밍할 수 있다.
다른 예를 들어, 스트리밍 중인 시점 영상에서 제N 시점 영상(250-N)으로 전환되고, 전환되는 시간에 제N 시점 영상(250-N)을 구성하는 제1 내지 제3 서브 트랙(250-N-1, 250-N-2, 250-N-3) 중, 제1 서브 트랙(250-N-1)과 제2 서브 트랙(250-N-2)이 모두 I-프레임을 포함하는 경우, 프로세서(150)는 네트워크 우선 순위가 높은 제2 서브 트랙(250-N-2)을 스트리밍할 수 있다.
또 다른 예를 들어, 스트리밍 중인 시점 영상에서 제N 시점 영상(250-N)으로 전환되고, 전환되는 시간에 제N 시점 영상(250-N)을 구성하는 제1 내지 제3 서브 트랙(250-N-1, 250-N-2, 250-N-3) 모두 I-프레임을 포함하는 경우, 프로세서(150)는 네트워크 우선 순위가 가장 높은 제3 서브 트랙(250-N-3)을 스트리밍할 수 있다.
다양한 실시예에 따르면, 프로세서(150)는 제1 시점 영상에서 제2 시점 영상으로 전환하는 제1 시간에서의 네트워크 상황을 반영하여, 서브 트랙을 선택할 수 있다. 예를 들어, 스트리밍 데이터를 수신하는 단말 장치(130)의 개수가 급격하게 줄어든 경우 또는 네트워크에 할당된 대역폭이 확장되는 경우, I-프레임의 비율이 상대적으로 높은 서브 트랙을 선택하여 스트리밍할 수 있다.
도 5 다양한 실시예에 따른 시간에 따른 프레임 구조의 동적 변경을 나타낸다.
도 5를 참조하면, 다양한 실시예에 따른 입력 버퍼(예: 도 3의 입력 버퍼(210))는 다시점 영상을 저장할 수 있다. 입력 버퍼(210)는 하나의 시점에 대응하는 시점 영상(550-1)에 대해 복수의 서브 트랙들 (550-1-1 내지 550-1-3)을 저장할 수 있다.
다양한 실시예에 따르면, 복수의 서브 트랙들(550-1-1 내지 550-1-3)은 서로 다른 GOP(group of pictures) 구조를 가질 수 있다. 예를 들어, 복수의 서브 트랙들(550-1-1 내지 550-1-3)은 서로 다른 I-프레임 비율을 가지는 영상일 수 있다.
다양한 실시예에 따르면, 스트리밍 서버(120)의 프로세서(예: 도 1의 프로세서(150))는 지정된 조건에 따라 복수의 서브 트랙들(550-1-1 내지 550-1-3)의 I-프레임 비율(RI)을 동적으로 변경할 수 있다. 예를 들어, 프로세서(150)는 컴퓨팅 자원이나 네트워크 대역폭과 서비스를 이용하는 사용자 수의 관계에 따라 I-프레임 비율(RI)을 높이거나 낮출 수 있다. 또는, 프로세서(150)는 사용자의 트랙 전환 패턴 또는 전송하는 영상의 속성(또는 특성)에 따라 I-프레임 비율(RI)을 변경할 수 있다.
다양한 실시예에 따르면, 제1 시간 구간(T1)에서, 제1 시점 영상(550-1)에 대한 제1 서브 트랙(sub-track1,1)(550-1-1)은 모두 I-프레임으로 구성될 수 있다(I-프레임 비율(RI)=1). 제1 시점 영상(550-1)에 대한 제2 서브 트랙(sub-track1,2)(550-1-2)은 8개의 프레임 당 2개의 I 프레임을 포함하고, 나머지는 P 프레임으로 구성될 수 있다(I-프레임 비율(RI)=1/4). 제1 시점 영상(550-1)에 대한 제3 서브 트랙(sub-track1,3)(550-1-3)은 8개의 프레임 당 하나의 I-프레임을 포함하고, 나머지는 P 프레임으로 구성될 수 있다(I-프레임 비율(RI)=1/8).
다양한 실시예에 따르면, 제1 시간 구간(T1) 이후의 제2 시간 구간(T2)에서, 제1 시점 영상(550-1)에 대한 제1 서브 트랙(sub-track1,1)(550-1-1)은 계속적으로 모두 I-프레임으로 구성될 수 있다(I-프레임 비율(RI)=1). 제1 시점 영상(550-1)에 대한 제2 서브 트랙(sub-track1,2)(550-1-2)은 8개의 프레임 당 4개의 I 프레임을 포함하고, 나머지는 P 프레임으로 구성될 수 있다(I-프레임 비율(RI)=1/2). 제1 시점 영상(550-1)에 대한 제3 서브 트랙(sub-track1,3)(550-1-3)은 8개의 프레임 당 2개의 I-프레임을 포함하고, 나머지는 P 프레임으로 구성될 수 있다(I-프레임 비율(RI)=1/4). 예를 들어, 제2 시간 구간(T2)에서 사용자의 트랙 전환 요청이 빈번할 것으로 예측되는 경우, 프로세서(150)는 네트워크 우선 순위가 상대적으로 높은 서브 트랙에 대한 I-프레임 비율을 높여, 사용자의 연속된 트랙 전환 요청에 빠르게 대응할 수 있다.
다양한 실시예에 따르면, 제2 시간 구간(T2) 이후의 제3 시간 구간(T3)에서, 제1 시간 구간(T1)과 동일한 I-프레임 비율을 유지할 수 있다. 예를 들어, 트랙 전환 요청 빈도가 다시 낮아지는 것으로 예측되는 경우, 프로세서(150)는 복수의 서브 트랙들 (550-1-1 내지 550-1-3)의 I-프레임 비율을 이전의 제1 시간 구간(T1)에서의 상태로 복귀시킬 수 있다.
다양한 실시예에 따르면, 프로세서(150)는 네트워크 상태, 스트리밍 서비스를 제공 받는 단말 장치(130)의 개수, 시점 전환 요청이 많이 발생하는 사용자인지 여부, 제공하는 시점 영상의 특성 중 적어도 하나의 조건에 따라, I-프레임 비율을 동적으로 변경할 수 있다.
도 6은 다양한 실시예에 따른 프레임 구조 정보의 전송을 통한 영상 스트리밍 방법을 나타낸다.
도 6을 참조하면, 다양한 실시예에 따른 스트리밍 서버(120)의 프로세서(예: 도 1의 프로세서(150))는 단말 장치(130)로 다시점 영상의 프레임 구조에 관한 정보(이하, 프레임 구조 정보)(610)를 전송할 수 있다. 다시점 영상에 대한 프레임 구조 정보(610)는 단말 장치(130)에 스트리밍 서비스를 제공하는 채널과 동일한 채널 또는 별도의 다른 채널을 통해 제공될 수 있다.
다양한 실시예에 따르면, 프레임 구조 정보(610)는 다시점 영상 전체에 대한 정보를 포함할 수도 있고, 다시점 영상의 일부에 대한 정보를 포함할 수도 있다. 예를 들어, 제1 시점 영상을 수신하는 상태에서, 단말 장치(130)는 전환 가능성이 높은 제2 시점 영상에 프레임 구조 정보(610)을 수신할 수 있다.
다양한 실시예에 따르면, 단말 장치(130)의 프로세서(예: 도 7의 프로세서(720))는 수신한 프레임 구조 정보(610)을 이용하여, 사용자의 시점 전환 요청에 대해 효과적으로 대응할 수 있다. 예를 들어, 사용자가 시점 전환과 관련된 입력(예: 터치 입력, 음성 입력)을 발생시킨 시간으로부터 실제 트랙이 전환되는데 걸리는 시간(이하, 반응 시간(d_react))은 스트리밍 서비스의 중요한 품질 사항일 수 있다. 반응 시간(d_react)은 지정된 값 이하를 유지하도록 관리될 수 있고, 서비스 혹은 컨텐츠 종류에 따라 반응 시간(d_react)이 변경될 수 있다.
다양한 실시예에 따르면, 단말 장치(130)의 프로세서(예: 도 7의 프로세서(720))는 실제로 트랙을 변경하는 시점을 반응 시간(d_react)의 값에 따라 변경할 수 있다. 예를 들어, t0 시간에 시점 변경 요청이 발생하고, 반응 시간(d_react)가 1로 설정된 경우, 단말 장치(130)는 t1 시간에 트랙이 전환되도록 요청할 수 있다. 다른 예를 들어, t0 시간에 시점 변경 요청이 발생하고, 반응 시간(d_react)가 2로 설정된 경우, 단말 장치(130)는 t2시간에 트랙이 전환되도록 요청할 수 있다. 이 경우, 제2 서브 트랙도 I-프레임을 포함할 수 있어, 단말 장치(130)의 프로세서(예: 도 7의 프로세서(720))는 제1 서브 트랙으로의 전환 없이 바로 제2 서브 트랙으로 전환할 수 있다. 또 다른 예를 들어, t0 시간에 시점 변경 요청이 발생하고 반응 시간(d_react)가 4로 설정된 경우, 단말 장치(130)는 t4시간에 트랙이 전환되도록 요청할 수 있다. 이 경우, 제3 서브 트랙도 I-프레임을 포함할 수 있어, 단말 장치(130)의 프로세서(예: 도 7의 프로세서(720))는 제1 서브 트랙 또는 제2 서브 트랙으로의 전환 없이 바로 제3 서브 트랙으로 전환할 수 있다. 또 다른 예를 들어, t0 시간에 시점 변경 요청이 발생하고 반응 시간(d_react)가 8로 설정된 경우, 단말 장치(130)는 t8시간에 트랙이 전환되도록 요청할 수 있다. 이 경우, 제4 서브 트랙도 I-프레임을 포함할 수 있어, 단말 장치(130)의 프로세서(예: 도 7의 프로세서(720))는 제1 서브 트랙, 제2 서브 트랙 또는 제3 서브 트랙으로의 전환 없이 바로 제4 서브 트랙으로 전환할 수 있다. 단말 장치(130)의 프로세서(예: 도 7의 프로세서(720))는 네트워크 우선권이 높은 서브 트랙을 선택할 수 있고, 이에 따라 통신 효율이 개선될 수 있다.
다양한 실시예에 따르면, 단말 장치(130)의 프로세서(예: 도 7의 프로세서(720))는 사용자의 시점을 전환하는 입력이 발생하는 경우, 반응 시간(d_react)의 설정값에 대응하여 지정된 시간 대기 후 시점 전환 요청을 스트리밍 서버(120)에 전송할 수 있다.
다양한 실시예에 따르면, 스트리밍 서버(120)는 실시간 스트리밍 프로토콜(예: RTSP, RTMP) 또는 적응형 스트리밍 프로토콜(예: HLS, DASH)과 같은 다양한 전송 프로토콜을 이용하여 다시점 영상을 전송할 수 있다.
다양한 실시예에 따르면, 실시간 스트리밍 프로토콜(예: RTSP, RTMP)의 경우, 스트리밍 서버(120)는 단말 장치(130)의 상태를 저장하고, 영상을 프레임 단위로 전송할 수 있다. 스트리밍 서버(120)는 스트리밍 서비스에 접속한 단말 장치(130)가 재생하고 있는 트랙의 정보를 관리할 수 있다. 시점 전환 요청이 발생하는 경우, 스트리밍 서버(120)는 다중 트랙의 각 프레임 특성에 따라 전송할 트랙을 선택하여 전송할 수 있다. 시점 전환 요청은 영상 전송을 위한 프로토콜의 메시지 형태로 전송되거나, 다른 형태로 전송될 수 있다. 프레임 구조 정보(610)를 단말 장치(130)가 사용하는 경우, 스트리밍 서버(120)는 시점 전환 요청을 미루거나 적절한 트랙으로 직접 전환을 시도할 수 있다.
다양한 실시예에 따르면, 적응형 스트리밍 프로토콜(예: HLS, DASH)의 경우, 스트리밍 서버(120)는 다시점 영상에 관한 프레임 구조 정보(610)인 manifest 파일을 단말 장치(130)에 전송할 수 있다. 예를 들어, DASH 의 경우 Media Presentation Description(MPD) 에 xml 형태로 전체 다중 트랙의 주소가 전송될 수 있다. Manifest 파일을 수신한 단말 장치(130)는 디코딩 가능한 트랙의 현재 세그먼트(segment)를 요청하여 재생할 수 있다.
다양한 실시예에 따르면, 단말 장치(130)는 트랙 선택에 관한 제어를 직접 수행할 수 있다. 시점 전환 요청이 발생하는 경우, 단말 장치(130)는 트랙 전환 중에 재생되어야 하는 복수의 트랙을 선정할 수 있고, 해당 트랙들의 세그먼트들을 요청할 수 있다. 사용자가 빠르게 연속적인 트랙 전환을 요청하는 경우, 단말 장치(130)는 적절한 속도를 선정하여 불연속적인 트랙을 선택할 수 있다.
다양한 실시예에 따르면, 스트리밍 서버(120)는 단말 장치(130)에서의 반응 시간(d_react)에 관한 정보를 미리 저장할 수 있다. 이 경우, 스트리밍 서버(120)는 단말 장치(130)에서의 반응 시간(d_react)을 고려하여, 시점 전환 요청에 발생한 경우에 지정된 시간 대기 후, 시점 영상을 전환할 수 있다.
다양한 실시예에 따르면, 스트리밍 서버(120)는 서로 다른 소스 장치(120)으로부터 시점 영상을 수신할 수 있다. 예를 들어, 스트리밍 서버(120)는 다중 시점 영상을 구성하는 제1 내지 제15 시점 영상 중, 제1 내지 제5 시점 영상은 제1 소스 장치로부터 수신하고, 제6 내지 제15 시점 영상은 제2 소스 장치로부터 수신할 수 있다.
다양한 실시 예에 따르면, 스트리밍 서버(120) 또는 단말 장치(130)는 스트리밍 영상 중 시점 전환이 자주 발생하거나 발생 가능성이 높은 구간의 일부 영상을 네트워크를 지원하는 기지국 내부의 MEC (mobile edge computing) 서버에 저장하도록 요청할 수 있다. 시점 전환 요청이 발생하는 경우, 단말 장치(130)는 MEC 서버에 저장된 일부 영상을 MEC 서버로부터 우선 송신 받아 표시할 수 있다. 단말 장치(130)는 MEC 서버에 저장된 영상 이후의 영상을 스트리밍 서버(120)로부터 수신하여 표시할 수 있다. 스트리밍 서버(120)은 MEC 서버에 저장된 영상 이후의 영상을 단말 장치(130)에 전송할 수 있다.
다양한 실시예에 따르면, 스트리밍 서버(120) 또는 단말 장치(130)는 스위칭이 발생하는 구간 또는 예상되는 구간에 대해, 각각의 소스 장치(130)에 데이터를 미리 가져오기(prefetch)되도록 요청할 수 있다. 앞의 예에서, 제1 소스 장치로부터 수신되는 제5 시점 영상에서, 제2 소스 장치로부터 수신되는 제10 시점 영상으로의 전환 가능성이 높은 경우, 스트리밍 서버(120) 또는 단말 장치(130)는 제5 시점 영상이 스트리밍 중인 경우 제2 소스 장치에 제10 시점 영상의 미리 가져오기(prefetch)되는 데이터를 증가시키도록 요청할 수 있다.
도 7은 다양한 실시 예들에 따른 네트워크 환경(700) 내의 전자 장치(701)의 블록도 이다. 본 문서에 개시된 다양한 실시 예들에 따른 전자 장치는 다양한 형태의 장치가 될 수 있다. 전자 장치는, 예를 들면, 휴대용 통신 장치(예: 스마트폰), 컴퓨터 장치(예: PDA(personal digital assistant), 태블릿 PC(tablet PC), 랩탑 PC(데스크톱 PC, 워크스테이션, 또는 서버), 휴대용 멀티미디어 장치(예: 전자 책 리더기 또는 MP3 플레이어), 휴대용 의료 기기(예: 심박, 혈당, 혈압, 또는 체온 측정기), 카메라, 또는 웨어러블 장치 중 적어도 하나를 포함할 수 있다. 웨어러블 장치는 액세서리 형(예: 시계, 반지, 팔찌, 발찌, 목걸이, 안경, 콘택트 렌즈, 또는 머리 착용 형 장치(head-mounted-device(HMD)), 직물 또는 의류 일체형(예: 전자 의복), 신체 부착 형(예: 스킨 패드 또는 문신), 또는 생체 이식 형 회로 중 적어도 하나를 포함할 수 있다. 어떤 실시 예들에서, 전자 장치는, 예를 들면, 텔레비전, DVD(digital video disk) 플레이어, 오디오 장치, 오디오 액세서리 장치(예: 스피커, 헤드폰, 또는 헤드 셋), 냉장고, 에어컨, 청소기, 오븐, 전자레인지, 세탁기, 공기 청정기, 셋톱 박스, 홈 오토메이션 컨트롤 패널, 보안 컨트롤 패널, 게임 콘솔, 전자 사전, 전자 키, 캠코더, 또는 전자 액자 중 적어도 하나를 포함할 수 있다.
다른 실시 예에서, 전자 장치는 네비게이션 장치, 위성 항법 시스템(GNSS(global navigation satellite system)), EDR(event data recorder)(예: 차량/선박/비행기 용 블랙박스(black box)), 자동차 인포테인먼트 장치(예: 차량용 헤드-업 디스플레이), 산업용 또는 가정용 로봇, 드론(drone), ATM(automated teller machine), POS(point of sales) 기기, 계측 기기(예: 수도, 전기, 또는 가스 계측 기기), 또는 사물 인터넷 장치(예: 전구, 스프링클러 장치, 화재 경보기, 온도 조절기, 또는 가로등) 중 적어도 하나를 포함할 수 있다. 본 문서의 실시 예에 따른 전자 장치는 전술한 기기들에 한정되지 않으며, 또한, 예를 들면, 개인의 생체 정보(예: 심박 또는 혈당)의 측정 기능이 구비된 스마트폰의 경우처럼, 복수의 장치들의 기능들을 복합적으로 제공할 수 있다. 본 문서에서, 사용자라는 용어는 전자 장치를 사용하는 사람 또는 전자 장치를 사용하는 장치(예: 인공지능 전자 장치)를 지칭할 수 있다.
도 7를 참조하면, 네트워크 환경(700)에서 전자 장치(701)는 제 1 네트워크(798)(예: 근거리 무선 통신 네트워크)를 통하여 전자 장치(702)와 통신하거나, 또는 제 2 네트워크(799)(예: 원거리 무선 통신 네트워크)를 통하여 전자 장치(704) 또는 서버(708)와 통신할 수 있다. 일실시예에 따르면, 전자 장치(701)는 서버(708)를 통하여 전자 장치(704)와 통신할 수 있다. 일실시예에 따르면, 전자 장치(701)는 프로세서(720), 메모리(730), 입력 장치(750), 음향 출력 장치(755), 표시 장치(760), 오디오 모듈(770), 센서 모듈(776), 인터페이스(777), 햅틱 모듈(779), 카메라 모듈(780), 전력 관리 모듈(788), 배터리(789), 통신 모듈(790), 가입자 식별 모듈(796), 또는 안테나 모듈(797)을 포함할 수 있다. 어떤 실시예에서는, 전자 장치(701)에는, 이 구성요소들 중 적어도 하나(예: 표시 장치(760) 또는 카메라 모듈(780))가 생략되거나, 하나 이상의 다른 구성요소가 추가될 수 있다. 어떤 실시예에서는, 이 구성요소들 중 일부들은 하나의 통합된 회로로 구현될 수 있다. 예를 들면, 센서 모듈(776)(예: 지문 센서, 홍채 센서, 또는 조도 센서)은 표시 장치(760)(예: 디스플레이)에 임베디드된 채 구현될 수 있다.
프로세서(720)는, 예를 들면, 소프트웨어(예: 프로그램(740))를 실행하여 프로세서(720)에 연결된 전자 장치(701)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일실시예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(720)는 다른 구성요소(예: 센서 모듈(776) 또는 통신 모듈(790))로부터 수신된 명령 또는 데이터를 휘발성 메모리(732)에 로드하고, 휘발성 메모리(732)에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비휘발성 메모리(734)에 저장할 수 있다. 일실시예에 따르면, 프로세서(720)는 메인 프로세서(721)(예: 중앙 처리 장치 또는 어플리케이션 프로세서), 및 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(723)(예: 그래픽 처리 장치, 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다. 추가적으로 또는 대체적으로, 보조 프로세서(723)는 메인 프로세서(721)보다 저전력을 사용하거나, 또는 지정된 기능에 특화되도록 설정될 수 있다. 보조 프로세서(723)는 메인 프로세서(721)와 별개로, 또는 그 일부로서 구현될 수 있다.
보조 프로세서(723)는, 예를 들면, 메인 프로세서(721)가 인액티브(예: 슬립) 상태에 있는 동안 메인 프로세서(721)를 대신하여, 또는 메인 프로세서(721)가 액티브(예: 어플리케이션 실행) 상태에 있는 동안 메인 프로세서(721)와 함께, 전자 장치(701)의 구성요소들 중 적어도 하나의 구성요소(예: 표시 장치(760), 센서 모듈(776), 또는 통신 모듈(790))와 관련된 기능 또는 상태들의 적어도 일부를 제어할 수 있다. 일실시예에 따르면, 보조 프로세서(723)(예: 이미지 시그널 프로세서 또는 커뮤니케이션 프로세서)는 기능적으로 관련 있는 다른 구성요소(예: 카메라 모듈(780) 또는 통신 모듈(790))의 일부로서 구현될 수 있다.
메모리(730)는, 전자 장치(701)의 적어도 하나의 구성요소(예: 프로세서(720) 또는 센서모듈(776))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램(740)) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(730)는, 휘발성 메모리(732) 또는 비휘발성 메모리(734)를 포함할 수 있다.
프로그램(740)은 메모리(730)에 소프트웨어로서 저장될 수 있으며, 예를 들면, 운영 체제(742), 미들 웨어(744) 또는 어플리케이션(746)을 포함할 수 있다.
입력 장치(750)는, 전자 장치(701)의 구성요소(예: 프로세서(720))에 사용될 명령 또는 데이터를 전자 장치(701)의 외부(예: 사용자)로부터 수신할 수 있다. 입력 장치(750)는, 예를 들면, 마이크, 마우스, 키보드, 또는 디지털 펜(예: 스타일러스 펜)을 포함할 수 있다.
음향 출력 장치(755)는 음향 신호를 전자 장치(701)의 외부로 출력할 수 있다. 음향 출력 장치(755)는, 예를 들면, 스피커 또는 리시버를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 녹음 재생과 같이 일반적인 용도로 사용될 수 있고, 리시버는 착신 전화를 수신하기 위해 사용될 수 있다. 일실시예에 따르면, 리시버는 스피커와 별개로, 또는 그 일부로서 구현될 수 있다.
표시 장치(760)는 전자 장치(701)의 외부(예: 사용자)로 정보를 시각적으로 제공할 수 있다. 표시 장치(760)는, 예를 들면, 디스플레이, 홀로그램 장치, 또는 프로젝터 및 해당 장치를 제어하기 위한 제어 회로를 포함할 수 있다. 일실시예에 따르면, 표시 장치(760)는 터치를 감지하도록 설정된 터치 회로(touch circuitry), 또는 상기 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 센서 회로(예: 압력 센서)를 포함할 수 있다.
오디오 모듈(770)은 소리를 전기 신호로 변환시키거나, 반대로 전기 신호를 소리로 변환시킬 수 있다. 일실시예에 따르면, 오디오 모듈(770)은, 입력 장치(750)를 통해 소리를 획득하거나, 음향 출력 장치(755), 또는 전자 장치(701)와 직접 또는 무선으로 연결된 외부 전자 장치(예: 전자 장치(702))(예: 스피커 또는 헤드폰)를 통해 소리를 출력할 수 있다.
센서 모듈(776)은 전자 장치(701)의 작동 상태(예: 전력 또는 온도), 또는 외부의 환경 상태(예: 사용자 상태)를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일실시예에 따르면, 센서 모듈(776)은, 예를 들면, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 또는 조도 센서를 포함할 수 있다.
인터페이스(777)는 전자 장치(701)가 외부 전자 장치(예: 전자 장치(702))와 직접 또는 무선으로 연결되기 위해 사용될 수 있는 하나 이상의 지정된 프로토콜들을 지원할 수 있다. 일실시예에 따르면, 인터페이스(777)는, 예를 들면, HDMI(high definition multimedia interface), USB(universal serial bus) 인터페이스, SD카드 인터페이스, 또는 오디오 인터페이스를 포함할 수 있다.
연결 단자(778)는, 그를 통해서 전자 장치(701)가 외부 전자 장치(예: 전자 장치(702))와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일실시예에 따르면, 연결 단자(778)는, 예를 들면, HDMI 커넥터, USB 커넥터, SD 카드 커넥터, 또는 오디오 커넥터(예: 헤드폰 커넥터)를 포함할 수 있다.
햅틱 모듈(779)은 전기적 신호를 사용자가 촉각 또는 운동 감각을 통해서 인지할 수 있는 기계적인 자극(예: 진동 또는 움직임) 또는 전기적인 자극으로 변환할 수 있다. 일실시예에 따르면, 햅틱 모듈(779)은, 예를 들면, 모터, 압전 소자, 또는 전기 자극 장치를 포함할 수 있다.
카메라 모듈(780)은 정지 영상 및 동영상을 촬영할 수 있다. 일실시예에 따르면, 카메라 모듈(780)은 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다.
전력 관리 모듈(788)은 전자 장치(701)에 공급되는 전력을 관리할 수 있다. 일실시예에 따르면, 전력 관리 모듈(788)은, 예를 들면, PMIC(power management integrated circuit)의 적어도 일부로서 구현될 수 있다.
배터리(789)는 전자 장치(701)의 적어도 하나의 구성요소에 전력을 공급할 수 있다. 일실시예에 따르면, 배터리(789)는, 예를 들면, 재충전 불가능한 1차 전지, 재충전 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.
통신 모듈(790)은 전자 장치(701)와 외부 전자 장치(예: 전자 장치(702), 전자 장치(704), 또는 서버(708)) 간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(790)은 프로세서(720)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일실시예에 따르면, 통신 모듈(790)은 무선 통신 모듈(792)(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(794)(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제 1 네트워크(798)(예: 블루투스, WiFi direct 또는 IrDA(infrared data association) 같은 근거리 통신 네트워크) 또는 제 2 네트워크(799)(예: 셀룰러 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부 전자 장치(704)와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성요소(예: 단일 칩)로 통합되거나, 또는 서로 별도의 복수의 구성요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈(792)은 가입자 식별 모듈(796)에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제 1 네트워크(798) 또는 제 2 네트워크(799)와 같은 통신 네트워크 내에서 전자 장치(701)를 확인 및 인증할 수 있다.
안테나 모듈(797)은 신호 또는 전력을 외부(예: 외부 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일실시예에 따르면, 안테나 모듈(797)은 서브스트레이트(예: PCB) 위에 형성된 도전체 또는 도전성 패턴으로 이루어진 방사체를 포함하는 하나의 안테나를 포함할 수 있다. 일실시예에 따르면, 안테나 모듈(797)은 복수의 안테나들을 포함할 수 있다. 이런 경우, 제 1 네트워크(798) 또는 제 2 네트워크(799)와 같은 통신 네트워크에서 사용되는 통신 방식에 적합한 적어도 하나의 안테나가, 예를 들면, 통신 모듈(790)에 의하여 상기 복수의 안테나들로부터 선택될 수 있다. 신호 또는 전력은 상기 선택된 적어도 하나의 안테나를 통하여 통신 모듈(790)과 외부 전자 장치 간에 송신되거나 수신될 수 있다. 어떤 실시예에 따르면, 방사체 이외에 다른 부품(예: RFIC)이 추가로 안테나 모듈(797)의 일부로 형성될 수 있다.
상기 구성요소들 중 적어도 일부는 주변 기기들간 통신 방식(예: 버스, GPIO(general purpose input and output), SPI(serial peripheral interface), 또는 MIPI(mobile industry processor interface))을 통해 서로 연결되고 신호(예: 명령 또는 데이터)를 상호간에 교환할 수 있다.
일실시예에 따르면, 명령 또는 데이터는 제 2 네트워크(799)에 연결된 서버(708)를 통해서 전자 장치(701)와 외부의 전자 장치(704)간에 송신 또는 수신될 수 있다. 외부 전자 장치(702, 1204) 각각은 전자 장치(701)와 동일한 또는 다른 종류의 장치일 수 있다. 일실시예에 따르면, 전자 장치(701)에서 실행되는 동작들의 전부 또는 일부는 외부 전자 장치들(702, 704, 또는 708) 중 하나 이상의 외부 전자 장치들에서 실행될 수 있다. 예를 들면, 전자 장치(701)가 어떤 기능이나 서비스를 자동으로, 또는 사용자 또는 다른 장치로부터의 요청에 반응하여 수행해야 할 경우에, 전자 장치(701)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 하나 이상의 외부 전자 장치들에게 그 기능 또는 그 서비스의 적어도 일부를 수행하라고 요청할 수 있다. 상기 요청을 수신한 하나 이상의 외부 전자 장치들은 요청된 기능 또는 서비스의 적어도 일부, 또는 상기 요청과 관련된 추가 기능 또는 서비스를 실행하고, 그 실행의 결과를 전자 장치(701)로 전달할 수 있다. 전자 장치(701)는 상기 결과를, 그대로 또는 추가적으로 처리하여, 상기 요청에 대한 응답의 적어도 일부로서 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다.
다양한 실시 예에 따른 전자 장치(예: 도 1의 스트리밍 서버(120), 도 7의 서버(708))는 외부 장치(예: 도 1의 단말 장치(130), 도 7의 전자 장치(701))에 영상을 전송하고, 통신 회로(예: 도 1의 통신 회로(190)), 복수의 시점에 대응하는 복수의 영상들을 저장하는 메모리(예: 도 1의 메모리(160)), 및 프로세서(예: 도 1의 프로세서(150))를 포함하고, 상기 복수의 영상들 각각은 복수의 서브 트랙들로 구성되고, 상기 복수의 서브 트랙들 각각은 연속적인 프레임들로 구성되고, 상기 프레임들 각각은 제1 타입 프레임 또는 제2 타입 프레임 중 하나의 속성을 가지고, 상기 복수의 서브 트랙들은 전체 프레임 중 상기 제1 타입 프레임의 비율이 서로 다르고, 상기 프로세서(예: 도 1의 프로세서(150))는 상기 복수의 영상들 중 제1 시점에 대한 제1 영상의 복수의 서브 트랙들 중 하나를 상기 외부 장치(예: 도 1의 단말 장치(130), 도 7의 전자 장치(701))에 전송하고, 상기 통신 회로(예: 도 1의 통신 회로(190))를 통해, 상기 외부 장치(예: 도 1의 단말 장치(130), 도 7의 전자 장치(701))로부터 시점 전환에 관한 요청을 수신하고, 제1 시간에, 상기 요청에 대응하는 제2 시점에 대한 제2 영상의 복수의 서브 트랙들 중 상기 제1 타입 프레임을 포함하는 제1 서브 트랙을 상기 외부 장치(예: 도 1의 단말 장치(130), 도 7의 전자 장치(701))에 전송할 수 있다.
다양한 실시 예에 따르면, 상기 제1 서브 트랙은 상기 제2 영상의 복수의 서브 트랙들 중 상기 제1 타입 프레임의 포함 비율이 가장 높은 서브 트랙일 수 있다.
다양한 실시 예에 따르면, 상기 제1 서브 트랙은 모든 프레임이 상기 제1 타입 프레임으로 구성된 영상일 수 있다.
다양한 실시 예에 따르면, 상기 제1 시간은, 상기 요청에 대응하여 상기 제2 영상으로 전환하는 시간이고, 상기 프로세서(예: 도 1의 프로세서(150))는 상기 제1 시간 이후의 제2 시간에, 상기 제2 영상의 상기 복수의 서브 트랙들 중 상기 제1 타입 프레임을 포함하는 제2 서브 트랙으로 변경하여 전송할 수 있다.
다양한 실시 예에 따르면, 상기 제2 서브 트랙은 상기 제1 서브 트랙 보다 상기 제1 타입 프레임의 포함 비율이 낮을 수 있다.
다양한 실시 예에 따르면, 상기 제2 서브 트랙은 상기 제1 서브 트랙 보다 영상의 압축 비율이 더 높을 수 있다.
다양한 실시 예에 따르면, 상기 제2 서브 트랙은 상기 제1 서브 트랙 보다 네트워크 우선 순위가 높을 수 있다.
다양한 실시 예에 따르면, 상기 프로세서(예: 도 1의 프로세서(150))는 상기 제1 시간 이후, 상기 제2 영상의 상기 복수의 서브 트랙들 중 상기 제1 타입 프레임의 비율이 낮은 서브 트랙으로 순차적으로 변경하여 전송할 수 있다.
다양한 실시 예에 따르면, 상기 프로세서(예: 도 1의 프로세서(150))는 상기 제1 시간 이전에 상기 외부 장치(예: 도 1의 단말 장치(130), 도 7의 전자 장치(701))에 상기 제1 영상 또는 상기 제2 영상에 대한 프레임 구성에 관한 정보를 전송할 수 있다.
다양한 실시 예에 따르면, 상기 프로세서(예: 도 1의 프로세서(150))는 시간에 따라 상기 제2 영상의 상기 복수의 서브 트랙들에 대한 프레임 구성을 변경할 수 있다.
다양한 실시 예에 따르면, 상기 프로세서(예: 도 1의 프로세서(150))는 네트워크 상황, 상기 외부 장치(예: 도 1의 단말 장치(130), 도 7의 전자 장치(701))의 개수, 상기 제1 영상 또는 상기 제2 영상의 속성 중 적으로 하나를 기반으로 상기 프레임 구성을 변경할 수 있다.
다양한 실시 예에 따르면, 상기 제1 영상은 상기 제2 영상과 동일한 프레임 구성을 가질 수 있다.
다양한 실시 예에 따르면, 상기 프로세서(예: 도 1의 프로세서(150))는 상기 요청을 수신하고 지정된 시간 대기 후, 상기 요청에 대응하여 영상을 전환할 수 있다.
다양한 실시 예에 따르면, 상기 제1 타입 프레임은 단독으로 복호화 가능한 프레임이고, 상기 제2 타입 프레임을 상기 제2 타입 프레임을 이용하여 복호화 가능한 프레임일 수 있다.
다양한 실시 예에 따르면, 상기 프로세서(예: 도 1의 프로세서(150))는 상기 요청에 대응하는 스위칭을 하는 제1 스위치, 상기 제2 영상의 상기 복수의 서브 트랙들 중 하나를 선택하기 위한 제2 스위치를 제어할 수 있다.
다양한 실시 예에 따르면, 상기 프로세서(예: 도 1의 프로세서(150))는 상기 제1 시간에, 상기 제2 영상의 상기 복수의 서브 트랙들이 모두 제2 타입 프레임인 경우, 상기 복수의 서브 트랙들 중 적어도 하나가 상기 제1 타입 프레임으로 변경될 때까지 대기할 수 있다.
다양한 실시 예에 따른 영상 전송 방법은 외부 장치(예: 도 1의 단말 장치(130), 도 7의 전자 장치(701))에 복수의 영상들 중 하나를 전송 하는 전자 장치(예: 도 1의 스트리밍 서버(120), 도 7의 서버(708))에서 수행되고, 복수의 영상들 중 제1 시점에 대한 제1 영상의 복수의 서브 트랙들 중 하나를 상기 외부 장치(예: 도 1의 단말 장치(130), 도 7의 전자 장치(701))에 전송하는 동작, 상기 복수의 서브 트랙들 각각은 연속적인 프레임들로 구성되고, 상기 프레임들 각각은 제1 타입 프레임 또는 제2 타입 프레임 중 하나의 속성을 가지고, 상기 복수의 서브 트랙들은 전체 프레임 중 상기 제1 타입 프레임의 비율이 서로 다르고, 상기 외부 장치(예: 도 1의 단말 장치(130), 도 7의 전자 장치(701))로부터 시점 전환에 관한 요청을 수신하는 동작, 상기 요청에 대응하는 제2 시점에 대한 제2 영상으로 전환하는 동작 및 상기 제2 영상으로 전환되는 제1 시간에, 상기 제2 영상의 복수의 서브 트랙들 중 상기 제1 타입 프레임을 포함하는 제1 서브 트랙을 상기 외부 장치(예: 도 1의 단말 장치(130), 도 7의 전자 장치(701))에 전송하는 동작을 포함할 수 있다.
다양한 실시 예에 따르면, 상기 제1 서브 트랙을 전송하는 동작은 상기 제2 영상의 복수의 서브 트랙들 중 상기 제1 타입 프레임의 포함 비율이 가장 높은 서브 트랙을 전송하는 동작을 포함할 수 있다.
다양한 실시 예에 따르면, 상기 제1 서브 트랙을 전송하는 동작은 모든 프레임이 상기 제1 타입 프레임으로 구성된 상기 제1 서브 트랙을 전송하는 동작을 포함할 수 있다.
다양한 실시 예에 따르면, 상기 영상 전송 방법은 상기 제2 영상의 상기 복수의 서브 트랙들 중 상기 제1 타입 프레임을 포함하는 제2 서브 트랙으로 변경하여 전송하는 동작을 더 포함할 수 있다.
본 문서에 개시된 다양한 실시예들에 따른 전자 장치는 다양한 형태의 장치가 될 수 있다. 전자 장치는, 예를 들면, 휴대용 통신 장치(예: 스마트폰), 컴퓨터 장치, 휴대용 멀티미디어 장치, 휴대용 의료 기기, 카메라, 웨어러블 장치, 또는 가전 장치를 포함할 수 있다. 본 문서의 실시예에 따른 전자 장치는 전술한 기기들에 한정되지 않는다.
본 문서의 다양한 실시예들 및 이에 사용된 용어들은 본 문서에 기재된 기술적 특징들을 특정한 실시예들로 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 또는 관련된 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 아이템에 대응하는 명사의 단수 형은 관련된 문맥상 명백하게 다르게 지시하지 않는 한, 상기 아이템 한 개 또는 복수 개를 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및 B 중 적어도 하나",“A 또는 B 중 적어도 하나”, "A, B 또는 C", "A, B 및 C 중 적어도 하나”, 및 “A, B, 또는 C 중 적어도 하나"와 같은 문구들 각각은 그 문구들 중 해당하는 문구에 함께 나열된 항목들 중 어느 하나, 또는 그들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", 또는 "첫째" 또는 "둘째"와 같은 용어들은 단순히 해당 구성요소를 다른 해당 구성요소와 구분하기 위해 사용될 수 있으며, 해당 구성요소들을 다른 측면(예: 중요성 또는 순서)에서 한정하지 않는다. 어떤(예: 제 1) 구성요소가 다른(예: 제 2) 구성요소에, “기능적으로” 또는 “통신적으로”라는 용어와 함께 또는 이런 용어 없이, “커플드” 또는 “커넥티드”라고 언급된 경우, 그것은 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로(예: 유선으로), 무선으로, 또는 제 3 구성요소를 통하여 연결될 수 있다는 것을 의미한다.
본 문서에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구현된 유닛을 포함할 수 있으며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로와 같은 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는, 상기 부품의 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 일실시예에 따르면, 모듈은 ASIC(application-specific integrated circuit)의 형태로 구현될 수 있다.
본 문서의 다양한 실시예들은 기기(machine)(예: 전자 장치(701)) 의해 읽을 수 있는 저장 매체(storage medium)(예: 내장 메모리(736) 또는 외장 메모리(738))에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어(예: 프로그램(740))로서 구현될 수 있다. 예를 들면, 기기(예: 전자 장치(701))의 프로세서(예: 프로세서(720))는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장 매체는, 비일시적(non-transitory) 저장 매체의 형태로 제공될 수 있다. 여기서, ‘비일시적’은 저장 매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장 매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.
일실시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory(CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두 개의 사용자 장치들(예: 스마트 폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.
다양한 실시예들에 따르면, 상기 기술한 구성요소들의 각각의 구성요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있다. 다양한 실시예들에 따르면, 전술한 해당 구성요소들 중 하나 이상의 구성요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성요소들(예: 모듈 또는 프로그램)은 하나의 구성요소로 통합될 수 있다. 이런 경우, 통합된 구성요소는 상기 복수의 구성요소들 각각의 구성요소의 하나 이상의 기능들을 상기 통합 이전에 상기 복수의 구성요소들 중 해당 구성요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 상기 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.

Claims (15)

  1. 외부 장치에 영상을 전송하는 전자 장치에 있어서,
    통신 회로;
    복수의 시점에 대응하는 복수의 영상들을 저장하는 메모리; 및
    프로세서;를 포함하고,
    상기 복수의 영상들 각각은 복수의 서브 트랙들로 구성되고,
    상기 복수의 서브 트랙들 각각은 연속적인 프레임들로 구성되고,
    상기 프레임들 각각은 제1 타입 프레임 또는 제2 타입 프레임 중 하나의 속성을 가지고,
    상기 복수의 서브 트랙들은 전체 프레임 중 상기 제1 타입 프레임의 비율이 서로 다르고,
    상기 프로세서는
    상기 복수의 영상들 중 제1 시점에 대한 제1 영상의 복수의 서브 트랙들 중 하나를 상기 외부 장치에 전송하고,
    상기 통신 회로를 통해, 상기 외부 장치로부터 시점 전환에 관한 요청을 수신하고,
    제1 시간에, 상기 요청에 대응하는 제2 시점에 대한 제2 영상의 복수의 서브 트랙들 중 상기 제1 타입 프레임을 포함하는 제1 서브 트랙을 상기 외부 장치에 전송하는 전자 장치.
  2. 제1항에 있어서, 상기 제1 서브 트랙은
    상기 제2 영상의 복수의 서브 트랙들 중 상기 제1 타입 프레임의 포함 비율이 가장 높은 서브 트랙인 전자 장치.
  3. 제1항에 있어서, 상기 제1 서브 트랙은
    모든 프레임이 상기 제1 타입 프레임으로 구성된 영상인 전자 장치.
  4. 제1항에 있어서, 상기 제1 시간은,
    상기 요청에 대응하여 상기 제2 영상으로 전환하는 시간이고,
    상기 프로세서는
    상기 제1 시간 이후의 제2 시간에, 상기 제2 영상의 상기 복수의 서브 트랙들 중 상기 제1 타입 프레임을 포함하는 제2 서브 트랙을 상기 외부 장치에 전송하는 전자 장치.
  5. 제4항에 있어서, 상기 제2 서브 트랙은
    상기 제1 서브 트랙 보다 상기 제1 타입 프레임의 포함 비율이 낮은 전자 장치.
  6. 제4항에 있어서, 상기 제2 서브 트랙은
    상기 제1 서브 트랙 보다 영상의 압축 비율이 더 높은 전자 장치.
  7. 제4항에 있어서, 상기 제2 서브 트랙은
    상기 제1 서브 트랙 보다 네트워크 우선 순위가 높은 전자 장치.
  8. 제1항에 있어서, 상기 프로세서는
    상기 제1 시간 이후, 상기 제2 영상의 상기 복수의 서브 트랙들 중 상기 제1 타입 프레임의 비율이 낮은 서브 트랙으로 순차적으로 변경하여 상기 외부 장치에 전송하는 전자 장치.
  9. 제1항에 있어서, 상기 프로세서는
    상기 제1 시간 이전에 상기 외부 장치에 상기 제1 영상 또는 상기 제2 영상의 프레임 구성에 관한 정보를 전송하는 전자 장치.
  10. 제1항에 있어서, 상기 프로세서는
    시간에 따라 상기 제2 영상의 상기 복수의 서브 트랙들에 대한 프레임 구성을 변경하는 전자 장치.
  11. 제10항에 있어서, 상기 프로세서는
    네트워크 상황, 상기 외부 장치의 개수, 상기 제1 영상 또는 상기 제2 영상의 속성 중 적으로 하나를 기반으로 상기 프레임 구성을 변경하는 전자 장치.
  12. 제1항에 있어서, 상기 프로세서는
    상기 요청을 수신하고 지정된 시간 대기 후, 상기 요청에 대응하여 상기 제1 영상에서 상기 제2 영상으로 전환하는 전자 장치.
  13. 제1항에 있어서, 상기 프로세서는
    상기 요청에 대응하는 스위칭을 하는 제1 스위치; 및
    상기 제2 영상의 상기 복수의 서브 트랙들 중 하나를 선택하기 위한 제2 스위치를 제어하는 전자 장치.
  14. 제1항에 있어서, 상기 프로세서는
    상기 제1 시간에, 상기 제2 영상의 상기 복수의 서브 트랙들이 모두 제2 타입 프레임인 경우, 상기 복수의 서브 트랙들 중 적어도 하나가 상기 제1 타입 프레임으로 변경될 때까지 대기하는 전자 장치.
  15. 외부 장치에 복수의 영상들 중 하나를 전송 하는 전자 장치에서 수행되는 영상 전송 방법에 있어서,
    복수의 영상들 중 제1 시점에 대한 제1 영상의 복수의 서브 트랙들 중 하나를 상기 외부 장치에 전송하는 동작, 상기 복수의 서브 트랙들 각각은 연속적인 프레임들로 구성되고, 상기 프레임들 각각은 제1 타입 프레임 또는 제2 타입 프레임 중 하나의 속성을 가지고, 상기 복수의 서브 트랙들은 전체 프레임 중 상기 제1 타입 프레임의 비율이 서로 다르고;
    상기 외부 장치로부터 시점 전환에 관한 요청을 수신하는 동작;
    상기 요청에 대응하는 제2 시점에 대한 제2 영상으로 전환하는 동작; 및
    상기 제2 영상으로 전환되는 제1 시간에, 상기 제2 영상의 복수의 서브 트랙들 중 상기 제1 타입 프레임을 포함하는 제1 서브 트랙을 상기 외부 장치에 전송하는 동작;을 포함하는 방법.
PCT/KR2021/002467 2020-02-28 2021-02-26 영상 스트리밍 방법 및 이를 지원하는 전자 장치 WO2021172941A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020200025583A KR20210110097A (ko) 2020-02-28 2020-02-28 영상 스트리밍 방법 및 이를 지원하는 전자 장치
KR10-2020-0025583 2020-02-28

Publications (1)

Publication Number Publication Date
WO2021172941A1 true WO2021172941A1 (ko) 2021-09-02

Family

ID=77490298

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2021/002467 WO2021172941A1 (ko) 2020-02-28 2021-02-26 영상 스트리밍 방법 및 이를 지원하는 전자 장치

Country Status (2)

Country Link
KR (1) KR20210110097A (ko)
WO (1) WO2021172941A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023128491A1 (ko) * 2021-12-30 2023-07-06 주식회사 카이 다채널 영상을 전송하기 위한 시스템의 동작 방법 및 이를 수행하는 시스템

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130056287A (ko) * 2010-07-20 2013-05-29 퀄컴 인코포레이티드 비디오 데이터를 스트리밍하기 위한 서브-트랙 단편들의 배열
KR20140019003A (ko) * 2011-06-03 2014-02-13 애플 인크. 실시간 또는 준 실시간 스트리밍을 위한 재생 리스트
KR20140054418A (ko) * 2011-09-06 2014-05-08 퀄컴 인코포레이티드 코딩된 비디오 데이터의 네트워크 스트리밍
KR20170051913A (ko) * 2015-11-03 2017-05-12 주식회사 케이티 멀티 트랙 영상을 이용한 다시점 영상 시청 방법 및 다시점 영상 제공 방법 및 사용자 단말
US20190174114A1 (en) * 2017-12-04 2019-06-06 Kt Corporation Generating time slice video

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130056287A (ko) * 2010-07-20 2013-05-29 퀄컴 인코포레이티드 비디오 데이터를 스트리밍하기 위한 서브-트랙 단편들의 배열
KR20140019003A (ko) * 2011-06-03 2014-02-13 애플 인크. 실시간 또는 준 실시간 스트리밍을 위한 재생 리스트
KR20140054418A (ko) * 2011-09-06 2014-05-08 퀄컴 인코포레이티드 코딩된 비디오 데이터의 네트워크 스트리밍
KR20170051913A (ko) * 2015-11-03 2017-05-12 주식회사 케이티 멀티 트랙 영상을 이용한 다시점 영상 시청 방법 및 다시점 영상 제공 방법 및 사용자 단말
US20190174114A1 (en) * 2017-12-04 2019-06-06 Kt Corporation Generating time slice video

Also Published As

Publication number Publication date
KR20210110097A (ko) 2021-09-07

Similar Documents

Publication Publication Date Title
WO2018128472A1 (en) Virtual reality experience sharing
WO2018043884A1 (ko) 카메라를 제어하기 위한 방법 및 그 전자 장치
WO2015105345A1 (en) Method and apparatus for screen sharing
WO2018070803A1 (en) Method and apparatus for session control support for field of view virtual reality streaming
WO2018117533A1 (en) Electronic device and method for controlling the same
WO2022030893A1 (ko) 오디오 공유를 지원하는 전자 장치
WO2021172941A1 (ko) 영상 스트리밍 방법 및 이를 지원하는 전자 장치
WO2015102451A1 (en) Image processing method and electronic device implementing the same
WO2021235856A1 (ko) 멀티미디어 콘텐츠를 제공하는 방법 및 그 전자 장치
KR20150085919A (ko) 영상 처리 방법 및 그 전자 장치
WO2020171565A1 (en) Electronic device for processing image and image processing method thereof
WO2020138909A1 (ko) 콘텐트 공유 방법 및 그 전자 장치
US11825235B2 (en) Electronic device for processing image and image processing method thereof
WO2020204401A1 (ko) 전자 장치 및 전자 장치에서의 스트리밍 어플리케이션 처리 방법
WO2020159032A1 (ko) 복수의 어플리케이션에 카메라에서 획득한 이미지를 제공하는 전자 장치 및 그의 동작 방법
WO2024085665A1 (ko) 디스플레이의 동기화를 위한 전자 장치 및 방법
WO2021049770A1 (ko) 복수의 어플리케이션을 실행하는 전자 장치 및 방법
WO2022025633A1 (ko) 영상 출력 방법 및 이를 지원하는 전자 장치
WO2024111795A1 (ko) 이미지 프레임들 내에서 피사체를 크롭하기 위한 전자 장치 및 그 방법
WO2023158151A1 (ko) 전자 장치 및 전자 장치에서 객체를 디스플레이하는 방법
WO2024117744A1 (ko) 카메라를 포함하는 전자 장치 및 그 동작 방법
WO2021137584A1 (ko) 동영상 처리 방법 및 이를 지원하는 전자 장치
WO2022025692A1 (ko) 입력 기반 스트리밍 제어 방법 및 이를 위한 전자 장치
WO2021145693A1 (ko) 이미지 데이터를 처리하는 전자 장치 및 이미지 데이터 처리 방법
WO2020032656A1 (en) Method for processing dynamic image and electronic device thereof

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21761950

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21761950

Country of ref document: EP

Kind code of ref document: A1