WO2022065952A2 - 비디오 데이터와 오디오 데이터의 동기화를 수행하는 전자 장치 및 그 제어 방법 - Google Patents

비디오 데이터와 오디오 데이터의 동기화를 수행하는 전자 장치 및 그 제어 방법 Download PDF

Info

Publication number
WO2022065952A2
WO2022065952A2 PCT/KR2021/013134 KR2021013134W WO2022065952A2 WO 2022065952 A2 WO2022065952 A2 WO 2022065952A2 KR 2021013134 W KR2021013134 W KR 2021013134W WO 2022065952 A2 WO2022065952 A2 WO 2022065952A2
Authority
WO
WIPO (PCT)
Prior art keywords
electronic device
output
time
delay time
audio data
Prior art date
Application number
PCT/KR2021/013134
Other languages
English (en)
French (fr)
Other versions
WO2022065952A3 (ko
Inventor
허진
김원기
박혜정
방지영
정재현
최근하
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Publication of WO2022065952A2 publication Critical patent/WO2022065952A2/ko
Publication of WO2022065952A3 publication Critical patent/WO2022065952A3/ko
Priority to US18/190,981 priority Critical patent/US20230232063A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/41407Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream

Definitions

  • This document relates to an electronic device that synchronizes video data and audio data, and a method for controlling the same.
  • an electronic device for example, a smart phone or a portable electronic device such as a wearable device connected to the smart phone
  • communication service providers or electronic device manufacturers are competitively developing electronic devices to provide various functions and differentiate them from other companies. Accordingly, various functions provided through the electronic device are also increasingly advanced.
  • 1A to 1F are exemplary diagrams for explaining the synchronization of video data and audio data according to the prior art.
  • a terminal may obtain a video data output request while outputting only audio data with respect to media including both audio data and video data.
  • Decoding a video frame may take a certain amount of time due to characteristics that occur when obtaining the decoded video frame. For example, in order to output a video at the 10 second position, decoding starts from the sync frame (which may also be referred to as a “key frame” in this document), and then starts decoding at the 10 second position. It may be necessary to acquire video data. For example, if the position of the sync frame is 8 seconds and the video data consists of 30 images per second, it may be necessary to decode a total of 60 images. For this purpose, FIG.
  • a time of 750 ms is required.
  • a time point at which video data is output by the terminal and a time point at which audio data is output by the terminal may be different due to a characteristic that occurs when a decoded video frame is obtained.
  • the conventional terminal converts the video data as shown in FIG. 1C .
  • video data After dropping (eg, not outputting through the terminal, or discarding), video data may be output together at a time point (10.75 seconds) at which audio data is currently being output.
  • a time point (10.75 seconds) at which audio data is currently being output.
  • the user may feel that the video is cut and output.
  • a terminal may obtain an output request of audio data while outputting only video data with respect to media including both audio data and video data.
  • audio data unlike the case of the above-described video data, audio data may not need to move to a specific position (eg, an 8-second position) for decoding every frame as a sync frame.
  • various delay values may be represented according to characteristics of an audio data output device (eg, a speaker of a terminal).
  • FIG. 1E it is exemplarily shown that the delay value that appears according to the characteristics of the audio data output device is 0.2 seconds.
  • the terminal temporarily stops the output of video data in order to synchronize the output timing of the video data and the output timing of the audio data. were output together to perform synchronization. However, in this case, the user may feel that the video output is temporarily stopped.
  • a delay time for outputting video data is compensated for Disclosed is an electronic device that synchronizes audio data and video data.
  • a delay time for outputting audio data is compensated for Disclosed is an electronic device that synchronizes audio data and video data.
  • an electronic device capable of performing accurate synchronization by compensating for such an error is disclosed.
  • An electronic device includes a touch screen display, at least one speaker, and at least one processor, wherein the at least one processor receives audio data of a first media through the at least one speaker.
  • a user input for outputting the video data of the first media is obtained, and based on the obtained user input, a time point at which the audio data is being outputted through the at least one speaker is identified, and the A time point at which video data is output through the touch screen display or the external electronic device is calculated based on at least the identified time point, and the video data is converted to the touch screen display or the external electronic device based on the calculated time point. It may be set to control the touch screen display or the external electronic device to be output through the .
  • the electronic device includes a touch screen display, at least one speaker, and at least one processor, wherein the at least one processor outputs video data of a first media through the touch screen display.
  • a user input for outputting the audio data of the first media is obtained, and based on the obtained user input, a time point at which the video data is being outputted through the touch screen display is identified, and the audio data calculates a time point to be output through the at least one speaker or an external electronic device, outputs the video data through the touch screen display based on the identified time point and the calculated time point, and outputs the audio data to the It may be configured to control the at least one speaker or the external electronic device to be output through the at least one speaker or the external electronic device.
  • An electronic device includes at least one speaker and at least one processor, wherein the at least one processor identifies an output timing of audio data of the first media determined based on a delay time and selecting a frame of the audio data corresponding to the output time, the frame including a plurality of pulse code modulation (PCM) audio data, and comparing the output time with the output time of the selected frame.
  • PCM pulse code modulation
  • a comparison result is obtained, and in response to the obtained first comparison result, when the output time is later than the output time of the selected frame, the sum of the output time of the selected frame and the size of the frame; , obtains a second comparison result by comparing the output time, and in response to the obtained second comparison result, the output time is later than the sum of the output time of the selected frame and the size of the frame
  • the selected frame is dropped, and in response to the obtained first comparison result, when the output time is the same as or earlier than the output time of the selected frame, the output time and the selected frame Calculate the output time difference, drop at least one PCM audio data corresponding to the operation result among the plurality of PCM audio data, and PCM audio data other than the dropped PCM audio data among the plurality of PCM audio data may be set to be transmitted to the at least one speaker or an external electronic device.
  • a delay time for outputting video data is compensated for Synchronization of audio data and video data may be performed.
  • a delay time for outputting audio data is compensated for Synchronization of audio data and video data may be performed.
  • accurate synchronization when an error occurs in the process of synchronizing audio data and video data, accurate synchronization may be performed by compensating for such an error.
  • 1A to 1F are exemplary diagrams for explaining the synchronization of video data and audio data according to the prior art.
  • FIG. 2 is a block diagram of an electronic device in a network environment, according to various embodiments of the present disclosure
  • 3A to 3E are exemplary diagrams for explaining a function or operation of synchronizing audio data and video data according to various embodiments.
  • 4A to 4H are exemplary diagrams for explaining specific examples to which the functions or operations described in relation to FIGS. 3A to 3F according to various embodiments may be applied.
  • 5A to 5E are exemplary diagrams for explaining a function or operation of synchronizing audio data and video data according to various embodiments.
  • 6A and 6B are exemplary views for explaining a function or operation of updating information required to synchronize audio data and video data according to various embodiments of the present disclosure
  • 7A to 7D are exemplary views for explaining an operation or function for correcting an error when an error occurs in a location of audio data according to various embodiments of the present disclosure
  • 8A and 8B are exemplary diagrams for explaining various modules included in a processor according to various embodiments.
  • FIG. 2 is a block diagram of an electronic device 201 in a network environment 200, according to various embodiments.
  • the electronic device 201 communicates with the electronic device 202 through a first network 298 (eg, a short-range wireless communication network) or a second network 299 . It may communicate with the electronic device 204 or the server 208 through (eg, a long-distance wireless communication network). According to an embodiment, the electronic device 201 may communicate with the electronic device 204 through the server 208 .
  • a first network 298 eg, a short-range wireless communication network
  • a second network 299 e.g., a second network 299 . It may communicate with the electronic device 204 or the server 208 through (eg, a long-distance wireless communication network). According to an embodiment, the electronic device 201 may communicate with the electronic device 204 through the server 208 .
  • the electronic device 201 includes a processor 220 , a memory 230 , an input module 250 , a sound output module 255 , a display module 260 , an audio module 270 , and a sensor module ( 276), interface 277, connection terminal 278, haptic module 279, camera module 280, power management module 288, battery 289, communication module 290, subscriber identification module 296 , or an antenna module 297 .
  • at least one of these components eg, the connection terminal 278
  • some of these components are integrated into one component (eg, display module 260 ). can be
  • the processor 220 executes software (eg, the program 240) to execute at least one other component (eg, a hardware or software component) of the electronic device 201 connected to the processor 220 It can control and perform various data processing or operations. According to one embodiment, as at least part of data processing or operation, the processor 220 converts commands or data received from other components (eg, the sensor module 276 or the communication module 290 ) to the volatile memory 232 . may be stored in the volatile memory 232 , may process commands or data stored in the volatile memory 232 , and may store the result data in the non-volatile memory 234 .
  • software eg, the program 240
  • the processor 220 converts commands or data received from other components (eg, the sensor module 276 or the communication module 290 ) to the volatile memory 232 .
  • the volatile memory 232 may be stored in the volatile memory 232 , may process commands or data stored in the volatile memory 232 , and may store the result data in the non-volatile memory 234 .
  • the processor 220 is the main processor 221 (eg, a central processing unit or an application processor) or a secondary processor 223 (eg, a graphic processing unit, a neural network processing unit) a neural processing unit (NPU), an image signal processor, a sensor hub processor, or a communication processor).
  • the main processor 221 e.g, a central processing unit or an application processor
  • a secondary processor 223 e.g, a graphic processing unit, a neural network processing unit
  • a neural processing unit NPU
  • an image signal processor e.g., a sensor hub processor, or a communication processor.
  • the main processor 221 e.g, a central processing unit or an application processor
  • a secondary processor 223 eg, a graphic processing unit, a neural network processing unit
  • NPU neural processing unit
  • image signal processor e.g., a sensor hub processor, or a communication processor
  • the sub-processor 223 may use less power than the main processor 221 or may be set to be specialized
  • the auxiliary processor 223 may be, for example, on behalf of the main processor 221 while the main processor 221 is in an inactive (eg, sleep) state, or when the main processor 221 is active (eg, executing an application). ), together with the main processor 221 , at least one of the components of the electronic device 201 (eg, the display module 260 , the sensor module 276 , or the communication module 290 ). It is possible to control at least some of the related functions or states.
  • the coprocessor 223 eg, an image signal processor or communication processor
  • may be implemented as part of another functionally related component eg, the camera module 280 or the communication module 290). there is.
  • the auxiliary processor 223 may include a hardware structure specialized for processing an artificial intelligence model.
  • Artificial intelligence models can be created through machine learning. Such learning may be performed, for example, in the electronic device 201 itself on which artificial intelligence is performed, or may be performed through a separate server (eg, the server 208).
  • the learning algorithm may include, for example, supervised learning, unsupervised learning, semi-supervised learning, or reinforcement learning, but in the above example not limited
  • the artificial intelligence model may include a plurality of artificial neural network layers.
  • Artificial neural networks include deep neural networks (DNNs), convolutional neural networks (CNNs), recurrent neural networks (RNNs), restricted boltzmann machines (RBMs), deep belief networks (DBNs), bidirectional recurrent deep neural networks (BRDNNs), It may be one of deep Q-networks or a combination of two or more of the above, but is not limited to the above example.
  • the artificial intelligence model may include, in addition to, or alternatively, a software structure in addition to the hardware structure.
  • the memory 230 may store various data used by at least one component (eg, the processor 220 or the sensor module 276 ) of the electronic device 201 .
  • the data may include, for example, input data or output data for software (eg, the program 240 ) and instructions related thereto.
  • the memory 230 may include a volatile memory 232 or a non-volatile memory 234 .
  • the program 240 may be stored as software in the memory 230 , and may include, for example, an operating system 242 , middleware 244 , or an application 246 .
  • the input module 250 may receive a command or data to be used in a component (eg, the processor 220 ) of the electronic device 201 from the outside (eg, a user) of the electronic device 201 .
  • the input module 250 may include, for example, a microphone, a mouse, a keyboard, a key (eg, a button), or a digital pen (eg, a stylus pen).
  • the sound output module 255 may output a sound signal to the outside of the electronic device 201 .
  • the sound output module 255 may include, for example, a speaker or a receiver.
  • the speaker can be used for general purposes such as multimedia playback or recording playback.
  • the receiver may be used to receive an incoming call. According to one embodiment, the receiver may be implemented separately from or as part of the speaker.
  • the display module 260 may visually provide information to the outside (eg, a user) of the electronic device 201 .
  • the display module 260 may include, for example, a control circuit for controlling a display, a hologram device, or a projector and a corresponding device.
  • the display module 260 may include a touch sensor configured to sense a touch or a pressure sensor configured to measure the intensity of a force generated by the touch.
  • the audio module 270 may convert a sound into an electric signal or, conversely, convert an electric signal into a sound. According to an embodiment, the audio module 270 acquires a sound through the input module 250 , or an external electronic device (eg, a sound output module 255 ) connected directly or wirelessly with the electronic device 201 . Sound may be output through the electronic device 202 (eg, a speaker or headphones).
  • an external electronic device eg, a sound output module 255
  • Sound may be output through the electronic device 202 (eg, a speaker or headphones).
  • the sensor module 276 detects an operating state (eg, power or temperature) of the electronic device 201 or an external environmental state (eg, a user state), and generates an electrical signal or data value corresponding to the sensed state. can do.
  • the sensor module 276 may include, for example, a gesture sensor, a gyro sensor, a barometric pressure sensor, a magnetic sensor, an acceleration sensor, a grip sensor, a proximity sensor, a color sensor, an IR (infrared) sensor, a biometric sensor, It may include a temperature sensor, a humidity sensor, or an illuminance sensor.
  • the interface 277 may support one or more specified protocols that may be used for the electronic device 201 to directly or wirelessly connect with an external electronic device (eg, the electronic device 202 ).
  • the interface 277 may include, for example, a high definition multimedia interface (HDMI), a universal serial bus (USB) interface, an SD card interface, or an audio interface.
  • HDMI high definition multimedia interface
  • USB universal serial bus
  • SD card interface Secure Digital Card
  • the connection terminal 278 may include a connector through which the electronic device 201 can be physically connected to an external electronic device (eg, the electronic device 202 ).
  • the connection terminal 278 may include, for example, an HDMI connector, a USB connector, an SD card connector, or an audio connector (eg, a headphone connector).
  • the haptic module 279 may convert an electrical signal into a mechanical stimulus (eg, vibration or movement) or an electrical stimulus that the user can perceive through tactile or kinesthetic sense.
  • the haptic module 279 may include, for example, a motor, a piezoelectric element, or an electrical stimulation device.
  • the camera module 280 may capture still images and moving images.
  • the camera module 280 may include one or more lenses, image sensors, image signal processors, or flashes.
  • the power management module 288 may manage power supplied to the electronic device 201 .
  • the power management module 288 may be implemented as, for example, at least a part of a power management integrated circuit (PMIC).
  • PMIC power management integrated circuit
  • the battery 289 may supply power to at least one component of the electronic device 201 .
  • battery 289 may include, for example, a non-rechargeable primary cell, a rechargeable secondary cell, or a fuel cell.
  • the communication module 290 is a direct (eg, wired) communication channel or a wireless communication channel between the electronic device 201 and an external electronic device (eg, the electronic device 202, the electronic device 204, or the server 208). It can support establishment and communication performance through the established communication channel.
  • the communication module 290 may include one or more communication processors that operate independently of the processor 220 (eg, an application processor) and support direct (eg, wired) communication or wireless communication.
  • the communication module 290 is a wireless communication module 292 (eg, a cellular communication module, a short-range communication module, or a global navigation satellite system (GNSS) communication module) or a wired communication module 294 (eg, : It may include a LAN (local area network) communication module, or a power line communication module).
  • GNSS global navigation satellite system
  • a corresponding communication module among these communication modules is a first network 298 (eg, a short-range communication network such as Bluetooth, wireless fidelity (WiFi) direct, or infrared data association (IrDA)) or a second network 299 (eg, legacy It may communicate with the external electronic device 204 through a cellular network, a 5G network, a next-generation communication network, the Internet, or a computer network (eg, a telecommunication network such as a LAN or WAN).
  • a first network 298 eg, a short-range communication network such as Bluetooth, wireless fidelity (WiFi) direct, or infrared data association (IrDA)
  • a second network 299 eg, legacy It may communicate with the external electronic device 204 through a cellular network, a 5G network, a next-generation communication network, the Internet, or a computer network (eg, a telecommunication network such as a LAN or WAN).
  • a telecommunication network such as a
  • the wireless communication module 292 uses subscriber information (eg, International Mobile Subscriber Identifier (IMSI)) stored in the subscriber identification module 296 within a communication network, such as the first network 298 or the second network 299 .
  • subscriber information eg, International Mobile Subscriber Identifier (IMSI)
  • IMSI International Mobile Subscriber Identifier
  • the electronic device 201 may be identified or authenticated.
  • the wireless communication module 292 may support a 5G network after a 4G network and a next-generation communication technology, for example, a new radio access technology (NR).
  • NR access technology includes high-speed transmission of high-capacity data (eMBB (enhanced mobile broadband)), minimization of terminal power and access to multiple terminals (mMTC (massive machine type communications)), or high reliability and low latency (URLLC (ultra-reliable and low-latency) -latency communications)).
  • eMBB enhanced mobile broadband
  • mMTC massive machine type communications
  • URLLC ultra-reliable and low-latency
  • the wireless communication module 292 may support a high frequency band (eg, mmWave band) to achieve a high data rate, for example.
  • a high frequency band eg, mmWave band
  • the wireless communication module 292 uses various techniques for securing performance in a high-frequency band, for example, beamforming, massive multiple-input and multiple-output (MIMO), all-dimensional multiplexing. It may support technologies such as full dimensional MIMO (FD-MIMO), an array antenna, analog beam-forming, or a large scale antenna.
  • the wireless communication module 292 may support various requirements specified in the electronic device 201 , an external electronic device (eg, the electronic device 204 ), or a network system (eg, the second network 299 ).
  • the wireless communication module 292 may include a peak data rate (eg, 20 Gbps or more) for realizing eMBB, loss coverage (eg, 164 dB or less) for realizing mMTC, or U-plane latency for realizing URLLC (eg, 20 Gbps or more).
  • a peak data rate eg, 20 Gbps or more
  • loss coverage e.g, 164 dB or less
  • U-plane latency for realizing URLLC
  • URLLC eg, 20 Gbps or more
  • DL downlink
  • UL uplink
  • the antenna module 297 may transmit or receive a signal or power to the outside (eg, an external electronic device).
  • the antenna module 297 may include an antenna including a conductor formed on a substrate (eg, a PCB) or a radiator formed of a conductive pattern.
  • the antenna module 297 may include a plurality of antennas (eg, an array antenna). In this case, at least one antenna suitable for a communication method used in a communication network such as the first network 298 or the second network 299 is connected from the plurality of antennas by, for example, the communication module 290 . can be selected. A signal or power may be transmitted or received between the communication module 290 and an external electronic device through the selected at least one antenna.
  • other components eg, a radio frequency integrated circuit (RFIC)
  • RFIC radio frequency integrated circuit
  • the antenna module 297 may form a mmWave antenna module.
  • the mmWave antenna module comprises a printed circuit board, an RFIC disposed on or adjacent to a first side (eg, underside) of the printed circuit board and capable of supporting a designated high frequency band (eg, mmWave band); and a plurality of antennas (eg, an array antenna) disposed on or adjacent to a second side (eg, top or side) of the printed circuit board and capable of transmitting or receiving signals of the designated high frequency band. can do.
  • peripheral devices eg, a bus, general purpose input and output (GPIO), serial peripheral interface (SPI), or mobile industry processor interface (MIPI)
  • GPIO general purpose input and output
  • SPI serial peripheral interface
  • MIPI mobile industry processor interface
  • the command or data may be transmitted or received between the electronic device 201 and the external electronic device 204 through the server 208 connected to the second network 299 .
  • Each of the external electronic devices 202 or 204 may be the same as or different from the electronic device 201 .
  • all or a part of operations executed in the electronic device 201 may be executed in one or more external electronic devices 202 , 204 , or 208 .
  • the electronic device 201 may perform the function or service itself instead of executing the function or service itself.
  • one or more external electronic devices may be requested to perform at least a part of the function or the service.
  • One or more external electronic devices that have received the request may execute at least a part of the requested function or service, or an additional function or service related to the request, and transmit a result of the execution to the electronic device 201 .
  • the electronic device 201 may process the result as it is or additionally and provide it as at least a part of a response to the request.
  • cloud computing, distributed computing, mobile edge computing (MEC), or client-server computing technology may be used.
  • the electronic device 201 may provide an ultra-low latency service using, for example, distributed computing or mobile edge computing.
  • the external electronic device 204 may include an Internet of things (IoT) device.
  • the server 208 may be an intelligent server using machine learning and/or neural networks.
  • the external electronic device 204 or the server 208 may be included in the second network 299 .
  • the electronic device 201 may be applied to an intelligent service (eg, smart home, smart city, smart car, or health care) based on 5G communication technology and IoT-related technology.
  • 3A to 3E are exemplary diagrams for explaining a function or operation of synchronizing audio data and video data according to various embodiments.
  • the electronic device eg, the processor 220 of FIG. 2
  • the electronic device outputs an output device (eg, the sound output module 255 or an external sound output device) It is possible to detect the occurrence of an event for outputting the video data of the media while outputting the audio data of the media through .
  • the electronic device 201 may output only audio data without outputting video data.
  • the electronic device 201 may output only audio data of media while displaying a specific screen (eg, a home screen) instead of an output screen of video data.
  • the electronic device 201 provides video data of media, such as a selection input to a specific application 303 (eg, a video application) for playing media. It is possible to detect the occurrence of an event (eg, user input) that causes the output to be output.
  • a specific application 303 eg, a video application
  • the electronic device eg, the processor 220 of FIG. 2
  • the electronic device 201 identifies a time point at which audio data is being output through the output device. For example, when the event is detected when 10 seconds have elapsed from the initial playback start start time of the media (eg, 0 seconds), the electronic device 201 according to an embodiment of the present document , it is possible to identify a time point at which audio data is being output through the output device as “10 seconds”.
  • the electronic device determines when video data is to be output through the electronic device 201 or an external electronic device, at least of the video data. You can calculate based on attributes.
  • the electronic device according to an exemplary embodiment of the present document includes a first delay time, a second delay time, a third delay time, and a second delay time to calculate a time point at which video data is output through the electronic device 201 or an external electronic device. 4 The delay time can be determined.
  • the first delay time is a time corresponding to a position of a previous sync frame closest to a point in time from which current audio data is being output through at least one speaker or an external electronic device, and video data is decoded It may be determined based on a maximum frame per second (FPS) of a decoder, an FPS of video data, and a time point at which audio data is output through at least one speaker or an external electronic device.
  • the electronic device 201 may determine the first delay time using Equation 1 below.
  • “Audio pos” may mean a point in time when audio data is being output through at least one speaker or an external electronic device
  • “Video prev sync pos” indicates that current audio data is outputted through at least one speaker or an external electronic device. It may mean a time corresponding to the position of the previous sync frame closest to the time outputted through the device.
  • current audio data among the plurality of sync frames 305a, 305b, and 305c includes at least one speaker or an external electronic device.
  • Video fps may mean an FPS of video data
  • decoder max fps may mean a maximum FPS of a decoder for decoding video data.
  • Information on the maximum FPS of the decoder according to the embodiment of this document may be stored in the electronic device 201 in the format of Table 1 below. In Table 1 below, width and height may refer to the width and height of an image frame constituting video data. The electronic device 201 according to an embodiment of the present document may determine the maximum FPS of the decoder with reference to information shown in Table 1 below.
  • the second delay time according to an embodiment of this document may be determined based on a delay time of at least one video filter applied to video data.
  • Information on the video filter type and delay time according to an embodiment of this document may be stored in the electronic device 201 in the format of Table 2 below.
  • the electronic device 201 according to an embodiment of the present document may determine a delay time (eg, a second delay time) corresponding to a video filter applied to video data with reference to information shown in Table 2 below.
  • a delay time eg, a second delay time
  • the electronic device 201 according to an embodiment of the present document calculates the sum of delay times corresponding to the used video filter types to obtain a second delay time. can be decided
  • Table 2 it is expressed that different delay times may be applied according to the width and height of an image frame constituting video data even when the same video filter type is used.
  • the third delay time according to an embodiment of this document may be determined based on a video data transmission delay time required to output video data from the display module 260 of the electronic device 201 or from an external electronic device.
  • the video data transmission delay time according to an embodiment of the present document may mean a time required when video data is transmitted to the video output device (in other words, an output delay time).
  • the electronic device 201 according to an embodiment of the present document may determine a video data transmission delay time (eg, a third delay time) with reference to information shown in Table 3 below.
  • the fourth delay time may be a delay time for compensating for a delay time generated in the process of calculating the first delay time, the second delay time, and the third delay time.
  • the electronic device 201 may determine the fourth delay time using Equation 2 below.
  • Video fps may mean an FPS of video data
  • decoder max fps may mean a maximum FPS of a decoder for decoding video data
  • the electronic device 201 may calculate a time point at which video data is output through the electronic device 201 or an external electronic device using Equation 3 below.
  • the electronic device 201 may determine a time point calculated through Equation 3 below as a time point at which video data is to be output. Referring to FIG. 3E , by determining as an output frame video data located at a point in time at which delay times are reflected from a point in time when a request to output video data is obtained (eg, when 10 seconds have elapsed from the initial point of time (0 second) of the media) , it may be possible to output seamless video data. However, when the time point calculated through Equation 3 below is greater than the next sync frame, the electronic device 201 according to an embodiment of the present document sets the time corresponding to the position of the next sync frame at which the video data is to be output. time can be determined.
  • the electronic device 201 includes a display module 260 and a display module 260 to output video data through the electronic device 201 and/or an external electronic device based on the calculated viewpoint. / or an external electronic device may be controlled.
  • video data located at a point in time at which delay times are reflected from the point in time when a request to output video data is obtained eg, when 10 seconds have elapsed from the initial playback time (0 second) of the media
  • 4A to 4H are exemplary diagrams for explaining specific examples to which the functions or operations described in relation to FIGS. 3A to 3F according to various embodiments may be applied.
  • the electronic device 201 according to an embodiment of the present document may be coupled to a cover.
  • the electronic device 201 according to an embodiment of this document may output only audio data of media when the cover is in a covered state (eg, FIG. 4A ). Thereafter, when the cover is changed to the open state as shown in FIG. 4B , the electronic device 201 according to an embodiment of the present document may identify this as a video data output request.
  • the electronic device 201 according to an embodiment of the present document may output video data in consideration of the aforementioned delay times, thereby enabling seamless video data output.
  • a screen eg, the display module 260 of FIG.
  • the electronic device 201 may output only audio data.
  • a user input for turning on the screen of the electronic device 201 eg, a touch/press input for a button provided in the electronic device 201
  • occurrence of a screen turn-on event eg, a touch/press input for a button provided in the electronic device 201
  • the screen may be turned on (eg, switching to the wake-up state of the AP or releasing the low-power state).
  • the electronic device 201 may output video data together with audio data when the screen is turned on, and output video data in consideration of the aforementioned delay times to output video data without interruption. This may be possible.
  • the electronic device 201 displays the screen being displayed on the electronic device 201 on the external electronic device 415 while outputting audio data. (415) can be controlled.
  • the electronic device 201 according to various embodiments of the present document obtains a user input requesting output of video data as shown in FIG. 4G , as shown in FIG. 4H , together with the video data Audio data may be output through the electronic device 201 and the external electronic device 415 .
  • the electronic device 201 according to various embodiments of the present document may output video data in consideration of the aforementioned delay times, thereby enabling seamless video data output.
  • 5A to 5E are exemplary views for explaining a function or operation of synchronizing audio data and video data according to various embodiments of the present document.
  • the electronic device 201 (eg, the processor 220 of FIG. 2 ) according to an embodiment of the present document performs an output device (eg, the display module 260 or an external display device). ), while outputting the video data of the media, it is possible to detect the occurrence of an event for outputting the audio data of the media (eg, a user input to change the setting for outputting the audio data).
  • the electronic device 201 may output only video data without outputting audio data. For example, when it is set to output only the video data of the media without outputting the audio data of the media on the execution screen of a specific application (eg, the gallery application), only the video data of the media may be output.
  • the electronic device 201 may identify a point in time when video data is being output through the output device. For example, when the event is detected when 10 seconds have elapsed from the initial playback start time of the media (eg, 0 seconds), the electronic device 201 according to an embodiment of the present document provides the video data It can be identified as "10 seconds" when is being outputted through the output device.
  • the electronic device 201 may calculate a time point at which audio data is output through the sound output module 255 and/or an external electronic device.
  • the electronic device 201 according to an embodiment of the present document may determine a fifth delay time and a sixth delay time to calculate a time point at which audio data is output through the electronic device 201 or an external electronic device. .
  • the fifth delay time according to an embodiment of this document may be determined based on a delay time of an audio filter applied to audio data.
  • Information on the audio filter type and delay time according to an embodiment of this document may be stored in the electronic device 201 in the format of Table 4 below.
  • the electronic device 201 according to an embodiment of the present document may determine a delay time (eg, a fifth delay time) corresponding to an audio filter applied to audio data with reference to information shown in Table 4 below.
  • a delay time eg, a fifth delay time
  • the electronic device 201 according to an embodiment of the present document calculates a sum of delay times corresponding to the used audio filter types to obtain a fifth delay time can be decided
  • the sixth delay time according to an embodiment of the present document may be determined based on an audio data transmission delay time required for an output device to output audio data.
  • the audio data transmission delay time according to an embodiment of the present document may mean a time (in other words, an output delay time) required when audio data is transmitted to an audio output device.
  • the electronic device 201 according to an embodiment of the present document may determine an audio data transmission delay time (eg, a sixth delay time) with reference to information shown in Table 5 below.
  • audio output device delay time electronic device speaker 200 ms electronic device wired earphone 190 ms BT AVDTP 1.3 delay reporting support device 450 ms
  • the electronic device 201 may calculate a time point at which audio data is output through the electronic device 201 or an external electronic device using Equation 4 below.
  • the electronic device 201 may determine a time point calculated through Equation 4 below as a time point at which audio data is to be output.
  • audio data located at a point in time at which delay times are reflected from a point in time when an event for outputting audio data is detected eg, when 10 seconds have elapsed from the initial playback time of the media (eg, 0 seconds)
  • By determining as an output frame it may be possible to output video data without stopping.
  • the electronic device 201 outputs the sound output module 255 so that audio data is output through the electronic device 201 and/or an external electronic device based on the calculated time point. and/or control an external electronic device.
  • audio data located at a time point at which delay times are reflected from a point in time when a request to output audio data is obtained eg, when 10 seconds have elapsed from the initial playback time (0 second) of the media
  • the electronic device 201 according to an embodiment of the present document may play a video 505 in a specific application (eg, a gallery application). In this case, the electronic device 201 according to an embodiment of the present document may not output audio data corresponding to the moving picture 505 .
  • the electronic device 201 according to an embodiment of the present document may detect the occurrence of an audio data output event (eg, a selection input to the graphic user interface 505a).
  • an audio data output event eg, a selection input to the graphic user interface 505a.
  • the electronic device 201 when the occurrence of an audio data output event is detected, uses delay times (eg, a fifth delay time and a sixth delay time) to By outputting audio data, it is possible to output seamless audio data.
  • delay times eg, a fifth delay time and a sixth delay time
  • 6A and 6B are exemplary views for explaining a function or operation of updating information required to synchronize audio data and video data according to various embodiments of the present disclosure
  • the electronic device 201 eg, the processor 220 of FIG. 2
  • the electronic device 201 provides information related to a plurality of processes for outputting video data. It can be identified (or acquired).
  • the plurality of processes according to an embodiment of the present document may include, for example, at least one of a decoding process, a filtering process, and a video transmission process to an output device.
  • information related to a plurality of processes includes information on processing time actually consumed by each of a plurality of processes for outputting video data, information on a type of decoder applied to a decoding process, information, information about the type of filter applied to the filtering process (eg, the process of applying a post-processing effect to the video data) and information about the type of output device, and information about the properties of the video data, such as the resolution of the video data.
  • information related to a plurality of processes includes information on processing time actually consumed by each of a plurality of processes for outputting video data, information on a type of decoder applied to a decoding process, information, information about the type of filter applied to the filtering process (eg, the process of applying a post-processing effect to the video data) and information about the type of output device, and information about the properties of the video data, such as the resolution of the video data. may contain information.
  • the electronic device 201 may determine whether the information obtained in operation 610 is information stored in the electronic device 201 .
  • the electronic device 201 according to an embodiment of this document may determine whether the decoder type, the video filter type, and the output device type are information stored in the electronic device 201 .
  • the electronic device 201 according to an embodiment of the present document may refer to Tables 1 to 3.
  • the electronic device 201 determines that when the information obtained in operation 610 is information stored in the electronic device 201 (operation 620 - Yes), the electronic device 201 You can update information (eg, Tables 1 to 3) stored in .
  • the electronic device 201 according to an embodiment of the present document provides an average value of previously stored information on delay time and information on processing time actually consumed by each of a plurality of processes for outputting video data. By calculating , information stored in the electronic device 201 (eg, Tables 1 to 3) may be updated.
  • the delay time stored in advance in the electronic device 201 is 50 ms, and it takes time to actually perform the filtering process.
  • the electronic device 201 may update the delay time (eg, the second delay time) to 51 ms, which is an average value of 50 ms and 52 ms.
  • the electronic device 201 determines that the information obtained in operation 610 is not information stored in the electronic device 201 (operation 620 - NO).
  • the electronic device 201 may additionally store information about the type and delay time obtained in operation 610 in the electronic device 201 .
  • the electronic device 201 determines the type of the video filter used in the filtering process.
  • information stored in the electronic device 201 eg, Tables 1 to 3 may be updated by adding the required delay time to Table 2 .
  • the electronic device 201 receives information related to a plurality of processes for outputting audio data. It can be identified (or acquired).
  • the plurality of processes according to an embodiment of the present document may include, for example, at least one of a filtering process and an audio transmission process to an output device.
  • information related to a plurality of processes includes information on processing time actually consumed by each of a plurality of processes for outputting audio data, and a filtering process (eg, for audio data). It may include information on the type of filter applied to the process of applying the post-processing effect) and information on the type of the output device.
  • the electronic device 201 may determine whether the information obtained in operation 605 is information stored in the electronic device 201 .
  • the electronic device 201 according to an embodiment of the present document may determine whether the type of the audio filter and the type of the output device are information stored in the electronic device 201 .
  • the electronic device 201 according to an exemplary embodiment of this document may refer to Tables 4 and 5 .
  • the electronic device 201 determines that the information obtained in operation 605 is information stored in the electronic device 201 (operation 615 - Yes), the electronic device 201 You can update the information stored in , such as Tables 4 and 5.
  • the electronic device 201 according to an embodiment of the present document is an average of information on delay time stored in advance and information on processing time actually consumed by each of a plurality of processes for outputting audio data. By calculating the value, information stored in the electronic device 201 (eg, Tables 4 and 5) may be updated.
  • the electronic device 201 may update the delay time (eg, the fifth delay time) to 81 ms, which is an average value of 80 ms and 82 ms.
  • the electronic device 201 determines that the information obtained in operation 605 is not information stored in the electronic device 201 (operation 615 - NO).
  • the electronic device 201 may additionally store information about the type and delay time obtained in operation 605 in the electronic device 201 .
  • the electronic device 201 determines the type of the audio filter used in the filtering process.
  • information stored in the electronic device 201 eg, Table 4 and/or Table 5 may be updated by adding the required delay time to Table 4 .
  • 7A to 7D are exemplary views for explaining an operation or function for correcting an error when an error occurs in a location of audio data according to various embodiments of the present disclosure
  • the electronic device eg, the processor 220 of FIG. 2
  • determines an output time of the audio data of the first media based on the delay time. can be identified.
  • the delay time according to the exemplary embodiment of this document may refer to the delay time of audio data described with reference to FIGS. 5A and 5B .
  • the output timing of audio data according to an exemplary embodiment of this document may refer to an output timing in which the delay time described with reference to FIGS. 5A and 5B is compensated.
  • the electronic device eg, the processor 220 of FIG. 2
  • a frame of audio data eg, a third audio frame 925
  • the electronic device 201 may select an audio frame that coincides with the output time of the audio data (eg, 10 seconds), but the time (eg, the output time of the audio data and the frame of the audio data) : The start time of a specific audio frame or the output time of audio data) may not exactly match.
  • the output time of the delay time-compensated audio data may be 10 seconds, but the output time of the selected audio frame (eg, the third audio frame 925 ) may be 9.95 seconds.
  • PCM audio data eg, first PCM audio data 925a, second PCM audio data 925b, third PCM audio data 925c, fourth PCM audio data 925d
  • a group of the fifth PCM audio data 925e and the sixth PCM audio data 925f may constitute one frame (eg, the third audio frame 925), and a plurality of frames (eg, the first A group of the audio frame 905 , the second audio frame 915 , the third audio frame 925 , and the first audio frame 935 may constitute one audio data.
  • the electronic device may compare an output time of audio data with an output time of the selected audio frame.
  • the electronic device 101 according to an exemplary embodiment of the present document provides a delay time-compensated output timing (eg, 10 seconds) of audio data and a selected audio frame (eg, a third audio frame 925 ). ) output time (eg 9.95 seconds) can be compared.
  • the electronic device eg, the processor 220 of FIG. 2
  • the output time of the audio data for which the delay time is compensated is later than the output time of the selected audio frame (operation 730 - Yes) ) (eg, when the delay time-compensated output time of audio data is 10 seconds and the output time of the selected audio frame is 9.95 seconds)
  • the output time of the selected audio frame and the size of the selected audio frame (or , length) may be compared with the output timing of the audio data for which the delay time is compensated.
  • the output time of the selected audio frame and the size (or length) of the selected audio frame ) is 10.05 seconds (eg, 9.95 seconds + 0.1 seconds), so in the electronic device 201 according to an embodiment of the present document, the output time of the audio data for which the delay time is compensated is longer than the output time of the selected audio frame. It can be judged to be an early point.
  • the electronic device eg, the processor 220 of FIG. 2
  • the difference between the output time of the audio data and the output time of the selected audio frame is calculated, at least one pulse code modulation (PCM) audio data corresponding to the calculated result is dropped, and the dropped PCM PCM audio data other than audio data may be transmitted to a speaker or an external electronic device.
  • PCM pulse code modulation
  • the difference between the output time of the audio data and the output time of the selected audio frame is 50 ms
  • the size (byte) of at least one PCM audio data corresponding to 50 ms is obtained by Equation 4 below. can be decided.
  • bit width may mean a bit width of audio data
  • channel number may mean the number of channels of an output device (eg, a speaker).
  • time difference may mean a difference between an output time of audio data and an output time of a selected audio frame, and according to an embodiment of the present document, the time difference may be 50 ms.
  • the “sampling rate” may be a sampling rate (eg, 44.1 KHz) of audio data. Referring to FIGS. 7B and 7C , as shown in FIG. 7B , an audio frame (eg, a third audio frame 925 ) having a frame start time of 9.95 seconds may be selected according to a user's request for outputting audio data.
  • the electronic device 201 when the size of at least one PCM audio data calculated by the above equation is, for example, a data size corresponding to 50 ms, the electronic device 201 according to an embodiment of the present document is illustrated in FIG. 7C .
  • PCM data 945 corresponding to 50 ms in the selected audio frame may be dropped, and data after the dropped PCM data (955 and fourth audio frame 935) may be transmitted to an output device (eg, a speaker).
  • the electronic device eg, the processor 220 of FIG.
  • the electronic device (eg, the processor 220 of FIG. 2 ) according to an embodiment of the present document, when the output time of the audio data for which the delay time is compensated is the same as or earlier than the output time of the selected audio frame (operation 730 ) -No) (eg, output time of the audio data for which the delay time is compensated: 10 seconds, the output time of the selected audio frame: 10.05 seconds), in operation 760, the output time of the audio data for which the delay time is compensated and the selected audio frame After adding PCM data corresponding to the difference in output time, it can be transmitted to an output device (eg, a speaker). For example, as shown in FIG.
  • a PCM corresponding to a difference between an output time of audio data for which a delay time is compensated and an output time of a selected audio frame is performed.
  • Data eg, the first PCM audio data 925a, the second PCM audio data 925b, the third PCM audio data 925c, and the fourth PCM audio data 925d
  • the selected audio frame eg, the fourth audio After adding to the front part of the frame 935
  • audio frames to which PCM data corresponding to the difference between the output time of the delay time-compensated audio data and the output time of the selected audio frame are added may be transmitted to the output device.
  • 8A and 8B are exemplary diagrams for explaining various modules included in the processor 220 according to various embodiments.
  • the processor 220 may include at least one of a player engine 221 , a video generation module 222a , and a video delay management module 223a .
  • the player engine 221 may obtain information about audio data currently being output from the electronic device 201 .
  • the player engine 221 may transmit information on the obtained audio data to the video generation module 222a.
  • the player engine 221 according to the exemplary embodiment of this document may transmit a request for the video delay management module 223a to calculate a start position of video data to the video delay management module 223a.
  • the request according to an embodiment of this document may include information about the width and height of video data, a decoder type, filter information, and an output timing of audio data currently being output.
  • the video delay management module 223a may calculate at least one delay time (eg, a first delay time, a second delay time, a third delay time, and a fourth delay time). .
  • the video delay management module 223a according to an embodiment of the present document is the closest previous sync frame (eg: The time of the second sync frame 305b) may be acquired and transmitted to the video generation module 222a.
  • the video delay management module 223a according to an embodiment of this document may transmit information on the calculated at least one delay time to the player engine 221 .
  • the player engine 221 may determine an output time of video data by using information about at least one delay time received from the video delay management module 223a.
  • the player module 221 may transmit information on the determined output time of the video data to the video generation module 222a.
  • the video generating module 222a decodes at least one video frame corresponding to the output time by using the information on the output time of the video data received from the player engine 221, and then , the decoded video data may be output from the electronic device 201 or an external electronic device.
  • the processor 220 may include at least one of a player engine 221 , an audio generation module 222b , and an audio delay management module 223b .
  • the player engine 221 according to the exemplary embodiment of this document may obtain information about video data currently being output from the electronic device 201 .
  • the player engine 221 according to an embodiment of this document may transmit information on the obtained video data to the audio generation module 222b.
  • the player engine 221 according to the exemplary embodiment of this document may transmit a request for the audio delay management module 223b to calculate a start position of audio data to the audio delay management module 223b.
  • the request according to an embodiment of this document may include filter information and information on an output timing of video data currently being output.
  • the audio delay management module 223b may calculate at least one delay time (eg, a fifth delay time and a sixth delay time).
  • the audio delay management module 223b according to an embodiment of this document may transmit information on the calculated at least one delay time to the player engine 221 .
  • the player engine 221 according to an embodiment of this document may determine an output time of audio data by using information on at least one delay time received from the audio delay management module 223b.
  • the player module 221 according to an embodiment of this document may transmit information on the determined output time of the audio data to the audio generation module 222b.
  • the audio generation module 222b decodes at least one audio frame corresponding to the output time by using the information on the output time of the audio data received from the player engine 221, and then , the decoded audio data may be output from the electronic device 201 or an external electronic device.
  • a function or operation of selecting a frame of audio data (eg, the third audio frame 925 ) according to an embodiment of the present document may be performed by, for example, the player engine 221 .
  • the electronic device 201 calculates the delay time described above for each device when video data is additionally output when a plurality of audio data is output through a plurality of devices, respectively.
  • Video data can be output.
  • the electronic device 201 sends the electronic device 201 It is possible to calculate a first delay time, a second delay time, a third delay time, and a fourth delay time for the external electronic device, and a first delay time, a second delay time, a third delay time, and a fourth delay time for the external electronic device. can be calculated individually.
  • the electronic device 201 may determine an output timing of video data to be output from each device based on each calculated delay time.
  • a network delay time required to transmit video data to an external electronic device may be additionally considered.
  • Information on the network delay time according to an embodiment of this document may be previously stored in the electronic device 201 in the form of a mapping table.
  • FIGS. 8A and 8B a case of processing audio data and a case of processing video data have been described separately.
  • at least one module may be implemented by being integrated with each other.
  • the video generating module 222a and the audio generating module 222b may be integrated with each other and implemented as one media generating module (not shown).
  • the video delay management module 223a and the audio delay management module 223b may be integrated with each other and implemented as one delay management module (not shown).
  • the video delay management module 223a may identify (or acquire) information related to a plurality of processes for outputting video data.
  • the plurality of processes may include, for example, at least one of a decoding process, a filtering process, and a video transmission process to an output device.
  • information related to a plurality of processes includes information on processing time actually consumed by each of a plurality of processes for outputting video data, information on a type of decoder applied to a decoding process, information, information about the type of filter applied to the filtering process (eg, the process of applying a post-processing effect to the video data) and information about the type of output device, and information about the properties of the video data, such as the resolution of the video data. may contain information.
  • the video delay management module 223a may determine whether the obtained information is information stored in the electronic device 201 .
  • the electronic device 201 may determine whether the decoder type, the video filter type, and the output device type are information stored in the electronic device 201 .
  • the video delay management module 223a may refer to Tables 1 to 3.
  • the video delay management module 223a When the obtained information is information stored in the electronic device 201, the video delay management module 223a according to an exemplary embodiment of the present document provides information stored in the electronic device 201 (eg, Tables 1 to 3). ) can be updated.
  • the video delay management module 223a according to an embodiment of the present document stores information on delay time stored in advance and information on processing time actually consumed by each of a plurality of processes for outputting video data. By calculating the average value, information stored in the electronic device 201 (eg, Tables 1 to 3) may be updated. For example, when the filtering process on video data is performed using the “Object Tracking” filter, the delay time stored in advance in the electronic device 201 is 50 ms, and it takes time to actually perform the filtering process.
  • the video delay management module 223a may update the delay time (eg, the second delay time) to 51 ms, which is an average value of 50 ms and 52 ms. In this case, the video delay management module 223a may further perform an operation of determining whether a time taken to actually perform the filtering process (eg, 52 ms) is a value included in a predetermined error range.
  • the video delay management module 223a according to an embodiment of the present document, when the time taken to actually perform the filtering process (eg, 52 ms) is included within a predetermined error range, 51 ms, which is an average value of 50 ms and 52 ms to update the delay time (eg, the second delay time).
  • the video delay management module 223a when the time (eg, 52 ms) required to actually perform the filtering process does not fall within a predetermined error range, the electronic device 201 ), which is a pre-stored delay time of 50ms, can be maintained. According to an embodiment of the present document, the video delay management module 223a obtains information about the delay time from another external electronic device (eg, a cloud server), thereby obtaining information stored in the electronic device 201 (eg, Table 1). to Table 3) may be updated.
  • another external electronic device eg, a cloud server
  • the video delay management module 223a transmits information on the acquired type and information on the delay time to the electronic device. (201) can be additionally stored.
  • the video delay management module 223a may include a video filter used in the filtering process.
  • Information stored in the electronic device 201 eg, Tables 1 to 3) may be updated by adding the type and the required delay time to Table 2.
  • various embodiments of this document described above may be applied even in a state in which an external electronic device (eg, AR glasses or a head mounted device (HMD)) is operably connected to the electronic device 201 .
  • an external electronic device eg, AR glasses or a head mounted device (HMD)
  • it calculates the delay time required to process the sensor information to be measured (eg, the depth value of the object, the hovering height value, or the motion degree value of the motion sensor), and based on the calculated delay time, audio data and / or output video data.
  • Information on a delay time required to process sensor information (eg, a depth value of an object, a hovering height value, or a motion degree value of a motion sensor) according to an embodiment of the present document is stored in advance in the electronic device 201 may have been Or, for example, an operation of the sensor module is turned off while outputting video data or audio data through an external electronic device, or a situation in which the user's gaze is not detected (eg, when the user separates the external electronic device from the body) case) occurs, when the sensor module is switched back to the on state or changed to a state capable of detecting the user's gaze (eg, when the user wears the external electronic device again), various embodiments of the present document can be applied.
  • sensor information eg, a depth value of an object, a hovering height value, or a motion degree value of a motion sensor
  • the event for outputting the video data or the audio data may be a switching event of the sensor module to an on state or a re-wearing detection event of the external electronic device.
  • the electronic device 201 or the external electronic device may detect a re-wear detection event of the external electronic device while audio data is output through the electronic device 201 or the external electronic device. .
  • the electronic device 201 according to an embodiment of the present document identifies a time point at which audio data is outputted through the output device, and calculates a time point at which video data is output through the electronic device 201 or an external electronic device.
  • the electronic device 201 according to an embodiment of the present document may control the external electronic device to output video data through the electronic device 201 or an external electronic device based on the calculated time point.
  • the electronic device includes a touch screen display (eg, the display module 260 of FIG. 2 ), at least one speaker (eg, the sound output module 255 of FIG. 2 ), and at least one processor ( Example: a processor 220 of FIG.
  • the at least one processor outputs video data of the first medium while outputting audio data of the first medium through the at least one speaker obtain a user input, identify a point in time when the audio data is being output through the at least one speaker, based on the obtained user input, and output the video data through the touch screen display or an external electronic device
  • a viewpoint is calculated based on at least the identified viewpoint, and the touch screen display or the external electronic device is controlled to output the video data through the touch screen display or the external electronic device based on the calculated viewpoint.
  • the at least one processor is further configured to determine a first delay time to calculate a time point at which the video data is output through the touch screen display or the external electronic device, wherein the first delay time includes the audio data A time corresponding to the position of the closest previous sync frame (eg, the second sync frame 305b) from the point in time at which ⁇ is being output through the at least one speaker, and the maximum FPS (frame) of the decoder for decoding the video data. per second), the FPS of the video data, and a time point at which the audio data is being output through the at least one speaker.
  • the first delay time includes the audio data A time corresponding to the position of the closest previous sync frame (eg, the second sync frame 305b) from the point in time at which ⁇ is being output through the at least one speaker, and the maximum FPS (frame) of the decoder for decoding the video data. per second), the FPS of the video data, and a time point at which the audio data is being output through the at least one speaker.
  • the at least one processor is further configured to determine a second delay time to calculate a time point at which the video data is output through the touch screen display or the external electronic device, wherein the second delay time includes the video data It may be determined based on a delay time of at least one video filter applied to .
  • the at least one processor may be further configured to determine the second delay time by adding up delay times of the plurality of video filters when there are a plurality of the at least one video filter.
  • the at least one processor is further configured to determine a third delay time in order to calculate a time point at which the video data is output through the touch screen display or the external electronic device, wherein the third delay time includes: It may include a video data transmission delay time required to output the video data from a display or the external electronic device.
  • the at least one processor is further configured to determine a fourth delay time for calculating a time point at which the video data is output through the touch screen display or the external electronic device, wherein the fourth delay time includes: It may be determined based on a value obtained by dividing a value obtained by multiplying the sum of the delay time, the second delay time, and the third delay time by the FPS of the video data by the maximum FPS of the decoder.
  • the at least one processor is configured to determine a time point at which the sum of the first delay time, the second delay time, the third delay time, and the fourth delay time and the audio data are being output through the at least one speaker.
  • the sum may be further set to determine a time point at which the video data is output through the touch screen display or the external electronic device.
  • the electronic device is configured to pre-store information required to determine at least one of the first delay time, the second delay time, the third delay time, and the fourth delay time and each delay time. Further comprising at least one set memory, wherein the at least one processor is configured to store the video data in the at least one memory based on information on processing time actually consumed by each of the plurality of processes for outputting the video data. It may be further configured to update the respective delay times stored in advance.
  • the at least one processor may be further configured to update the respective delay times by calculating an average value of the actually consumed processing time and the previously stored respective delay times.
  • the at least one processor may be further configured to acquire information on a type of a video codec, a video filter, and the external electronic device used in each of the plurality of processes.
  • the at least one processor may be further configured to update the requested information stored in the at least one memory by using the obtained information on the type of the video codec, the video filter, and the external electronic device.
  • the electronic device includes a touch screen display (eg, the display module 260 of FIG. 2 ), at least one speaker (eg, the sound output module 255 of FIG. 2 ), and at least one processor (eg, the processor 220 of FIG.
  • a touch screen display eg, the display module 260 of FIG. 2
  • at least one speaker eg, the sound output module 255 of FIG. 2
  • at least one processor eg, the processor 220 of FIG.
  • the at least one processor outputs audio data of the first media while outputting the video data of the first media through the touch screen display obtain a user input, identify a point in time when the video data is being output through the touch screen display, based on the obtained user input, and output the audio data through the at least one speaker or an external electronic device calculating a viewpoint, outputting the video data through the touch screen display based on the identified viewpoint and the calculated viewpoint, and outputting the audio data through the at least one speaker or the external electronic device It may be set to control at least one speaker or the external electronic device.
  • the at least one processor is further configured to determine a fifth delay time to calculate a time when the audio data is output through the at least one speaker or the external electronic device,
  • the fifth delay time includes: It may be determined based on the delay time of the audio filter applied to the data.
  • the at least one processor is further configured to determine a sixth delay time to calculate a time point at which the audio data is outputted through the at least one speaker or the external electronic device, wherein the sixth delay time includes the at least one It may be determined based on an audio data transmission delay time required for one speaker or the external electronic device to output the audio data.
  • the at least one processor is configured to calculate a sum of the sum of the fifth delay time and the sixth delay time, and a time point at which the video data is being output through the touch screen display, and the audio data is transmitted through the at least one speaker or It may be further set to determine the timing to be output through an external electronic device.
  • the electronic device may further include at least one memory configured to previously store information required to determine at least one of the fifth delay time and the sixth delay time, wherein the at least one processor comprises: In order to update the requested information stored in advance in the at least one memory, at least one of the determined delay times may be further configured to be stored in the at least one memory.
  • An electronic device includes at least one speaker (eg, the sound output module 255 of FIG. 2 ) and at least one processor, and the at least one processor includes a delay time (eg: Identifies the output timing of the audio data of the first media determined based on the fifth delay time and the sixth delay time), and selects a frame of the audio data corresponding to the output timing (eg, the first audio frame ( 905), a second audio frame 915, a third audio frame 925, and a fourth audio frame 935), and the frame includes a plurality of pulse code modulation (PCM) audio data (eg, first PCM audio data).
  • PCM pulse code modulation
  • the delay time may be determined based on a delay time of an audio filter applied to the audio data and an audio data transmission delay time required for the at least one speaker or an external electronic device to output the audio data.
  • the at least one processor is configured to: It may be further configured to determine the size of the dropped at least one PCM data based on a sampling rate, a bit width of the audio data, and the number of channels of the at least one speaker or the external electronic device.
  • the at least one processor is configured to: , may be further set to reselect the frame of the audio data.
  • the electronic device may have various types of devices.
  • the electronic device may include, for example, a portable communication device (eg, a smart phone), a computer device, a portable multimedia device, a portable medical device, a camera, a wearable device, or a home appliance device.
  • a portable communication device eg, a smart phone
  • a computer device e.g., a smart phone
  • a portable multimedia device e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a wearable device e.g., a smart bracelet
  • a home appliance device e.g., a home appliance
  • first, second, or first or second may be used simply to distinguish the element from other elements in question, and may refer to elements in other aspects (e.g., importance or order) is not limited. It is said that one (eg, first) component is “coupled” or “connected” to another (eg, second) component, with or without the terms “functionally” or “communicatively”. When referenced, it means that one component can be connected to the other component directly (eg by wire), wirelessly, or through a third component.
  • module used in various embodiments of this document may include a unit implemented in hardware, software, or firmware, and is interchangeable with terms such as, for example, logic, logic block, component, or circuit.
  • a module may be an integrally formed part or a minimum unit or a part of the part that performs one or more functions.
  • the module may be implemented in the form of an application-specific integrated circuit (ASIC).
  • ASIC application-specific integrated circuit
  • Various embodiments of the present document include one or more instructions stored in a storage medium (eg, internal memory 236 or external memory 238) readable by a machine (eg, electronic device 201). may be implemented as software (eg, the program 240) including
  • a processor eg, processor 220
  • a device eg, electronic device 201
  • the one or more instructions may include code generated by a compiler or code executable by an interpreter.
  • the device-readable storage medium may be provided in the form of a non-transitory storage medium.
  • 'non-transitory' only means that the storage medium is a tangible device and does not include a signal (eg, electromagnetic wave), and this term is used in cases where data is semi-permanently stored in the storage medium and It does not distinguish between temporary storage cases.
  • a signal eg, electromagnetic wave
  • the method according to various embodiments documented in this document may be included in a computer program product and provided.
  • Computer program products may be traded between sellers and buyers as commodities.
  • the computer program product is distributed in the form of a machine-readable storage medium (eg compact disc read only memory (CD-ROM)), or through an application store (eg Play StoreTM) or on two user devices ( It can be distributed (eg downloaded or uploaded) directly between smartphones (eg: smartphones) and online.
  • a part of the computer program product may be temporarily stored or temporarily created in a machine-readable storage medium such as a memory of a server of a manufacturer, a server of an application store, or a relay server.
  • each component (eg, module or program) of the above-described components may include a singular or a plurality of entities, and some of the plurality of entities may be separately disposed in other components. there is.
  • one or more components or operations among the above-described corresponding components may be omitted, or one or more other components or operations may be added.
  • a plurality of components eg, a module or a program
  • the integrated component may perform one or more functions of each component of the plurality of components identically or similarly to those performed by the corresponding component among the plurality of components prior to the integration. .
  • operations performed by a module, program, or other component are executed sequentially, in parallel, repeatedly, or heuristically, or one or more of the operations are executed in a different order, or omitted. or one or more other operations may be added.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

비디오 데이터와 오디오 데이터의 동기화를 수행하는 전자 장치 및 그 제어 방법이 개시된다. 본 문서의 일 실시예에 따른 전자 장치는, 터치스크린 디스플레이, 적어도 하나의 스피커, 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는, 상기 적어도 하나의 스피커를 통해 제1 미디어의 오디오 데이터를 출력하는 동안에, 상기 제1 미디어의 비디오 데이터를 출력하도록 하는 사용자 입력을 획득하고, 상기 획득된 사용자 입력에 기반하여, 상기 오디오 데이터가 상기 적어도 하나의 스피커를 통해 출력되고 있는 시점을 식별하고, 상기 비디오 데이터가 상기 터치스크린 디스플레이 또는 외부 전자 장치를 통해 출력될 시점을, 적어도 상기 식별된 시점을 기반으로 연산된 지연 시간을 이용하여 결정하고, 상기 결정된 시점에서, 상기 비디오 데이터를 상기 터치스크린 디스플레이 또는 상기 외부 전자 장치를 통해 출력되도록 상기 터치스크린 디스플레이 또는 상기 외부 전자 장치를 제어하도록 설정될 수 있다.

Description

비디오 데이터와 오디오 데이터의 동기화를 수행하는 전자 장치 및 그 제어 방법
본 문서는, 비디오 데이터와 오디오 데이터의 동기화를 수행하는 전자 장치 및 그 제어 방법에 관한 것이다.
전자 장치, 예를 들어, 스마트 폰 또는 스마트 폰과 연결된 웨어러블 장치와 같은 휴대용 전자 장치를 통해 제공되는 다양한 서비스 및 부가 기능들이 점차 증가하고 있다. 이러한 전자 장치의 효용 가치를 높이고, 다양한 사용자들의 욕구를 만족시키기 위해서 통신 서비스 제공자 또는 전자 장치 제조사들은 다양한 기능들을 제공하고 다른 업체와의 차별화를 위해 전자 장치를 경쟁적으로 개발하고 있다. 이에 따라, 전자 장치를 통해서 제공되는 다양한 기능들도 점점 고도화 되고 있다.
도 1a 내지 도 1f는, 종래 기술에 따라 비디오 데이터와 오디오 데이터의 동기화를 설명하기 위한 예시 도면이다.
도 1a 내지 도 1c를 참조하면, 종래의 기술에 따른 단말은, 오디오 데이터 및 비디오 데이터를 모두 포함하는 미디어에 대해서, 오디오 데이터만을 출력하는 중에 비디오 데이터의 출력 요청을 획득할 수 있다. 비디오 프레임을 디코딩하고, 디코딩 된 비디오 프레임을 획득할 때 발생하는 특징에 기인하여 특정한 시간이 소요될 수 있다. 예를 들어, 10초 위치에서 비디오를 출력하기 위해서는 싱크 프레임(sync frame)(본 문서에서, "키 프레임(key frame)"이라는 용어로도 언급될 수 있다)부터 디코딩을 시작해서 10초 위치의 비디오 데이터를 획득해야할 수 있다. 예를 들어, 싱크 프레임의 위치가 8초이고, 비디오 데이터가 초당 30장의 이미지들로 구성되어 있다면 총 60장의 이미지들을 디코딩 해야 할 수 있다. 이를 위하여, 도 1b에서는 750ms의 시간이 소요된다는 점을 나타내고 있다. 예를 들어, 디코딩 된 비디오 프레임을 획득할 때 발생하는 특징 때문에, 비디오 데이터가 단말에 의하여 출력되는 시점과 오디오 데이터가 단말에 의하여 출력되는 시점이 상이할 수 있다. 이와 같은, 상이한 시점을 동기화(예: 비디오 데이터와 오디오 데이터의 출력 시간 차이가 임계 시간(예: 40ms) 이내가 되는 경우)하기 위하여, 종래의 단말은, 도 1c에 도시된 바와 같이 비디오 데이터를 드롭(drop)하고(예를 들어, 단말을 통해 출력하지 않고, 또는, 폐기하고) 오디오 데이터가 현재 출력되고 있는 시점(10.75초)에서 비디오 데이터를 함께 출력할 수 있다. 다만, 이와 같이 비디오 데이터를 드롭하는 경우, 사용자는 비디오가 끊어지면서(cut) 출력된다고 느낄 수 있다.
도 1d 내지 도 1f를 참조하면, 종래의 기술에 따른 단말은, 오디오 데이터 및 비디오 데이터를 모두 포함하는 미디어에 대해서, 비디오 데이터만을 출력하는 중에 오디오 데이터의 출력 요청을 획득할 수 있다. 오디오 데이터의 경우, 상술한 비디오 데이터의 경우와는 다르게, 오디오 데이터는 모든 프레임이 싱크 프레임으로서 디코딩을 위하여 특정한 위치(예: 8초 위치)로 이동할 필요가 없을 수 있다. 다만, 오디오 데이터의 경우, 오디오 데이터의 출력 장치(예: 단말의 스피커)의 특성에 따라 다양한 지연 값을 나타낼 수 있다. 도 1e에서는, 오디오 데이터의 출력 장치의 특성에 따라 나타나는 지연 값이 0.2초임을 예시적으로 나타내고 있다. 종래의 기술에 따른 단말은, 비디오 데이터의 출력 시점과 오디오 데이터의 출력 시점을 동기화 하기 위하여 비디오 데이터의 출력을 일시적으로 멈추었다가 오디오 데이터가 비디오 데이터의 현재 출력 위치까지 출력되면, 오디오 데이터와 비디오 데이터를 함께 출력하여 동기화를 수행하였다. 다만, 이 경우, 사용자는 비디오의 출력이 일시적으로 멈추었다고 느낄 수 있다.
본 문서의 일 실시예에 따르면, 비디오 데이터 및 오디오 데이터를 모두 포함하는 미디어에 대해서, 오디오 데이터만이 출력 중에 비디오 데이터에 대한 출력 요청을 획득하는 경우, 비디오 데이터의 출력을 위한 지연 시간을 보상하여 오디오 데이터와 비디오 데이터의 동기화를 수행하는 전자 장치가 개시된다.
본 문서의 일 실시예에 따르면, 비디오 데이터 및 오디오 데이터를 모두 포함하는 미디어에 대해서, 비디오 데이터만이 출력 중에 오디오 데이터에 대한 출력 요청을 획득하는 경우, 오디오 데이터의 출력을 위한 지연 시간을 보상하여 오디오 데이터와 비디오 데이터의 동기화를 수행하는 전자 장치가 개시된다.
본 문서의 일 실시예에 따르면, 오디오 데이터와 비디오 데이터의 동기화를 수행하는 과정에서 오차가 발생한 경우, 이와 같은 오차를 보상하여 정확한 동기화를 수행할 수 있는 전자 장치가 개시된다.
본 문서의 일 실시예에 따른 전자 장치는, 터치스크린 디스플레이, 적어도 하나의 스피커, 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는, 상기 적어도 하나의 스피커를 통해 제1 미디어의 오디오 데이터를 출력하는 동안에, 상기 제1 미디어의 비디오 데이터를 출력하도록 하는 사용자 입력을 획득하고, 상기 획득된 사용자 입력에 기반하여, 상기 오디오 데이터가 상기 적어도 하나의 스피커를 통해 출력되고 있는 시점을 식별하고, 상기 비디오 데이터가 상기 터치스크린 디스플레이 또는 외부 전자 장치를 통해 출력될 시점을, 적어도 상기 식별된 시점을 기반으로 연산하고, 상기 연산된 시점을 기반으로, 상기 비디오 데이터를 상기 터치스크린 디스플레이 또는 상기 외부 전자 장치를 통해 출력되도록 상기 터치스크린 디스플레이 또는 상기 외부 전자 장치를 제어하도록 설정될 수 있다.
본 문서의 일 실시예에 따른 전자 장치는, 터치스크린 디스플레이, 적어도 하나의 스피커, 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는, 상기 터치스크린 디스플레이를 통해 제1 미디어의 비디오 데이터를 출력하는 동안에, 상기 제1 미디어의 오디오 데이터를 출력하도록 하는 사용자 입력을 획득하고, 상기 획득된 사용자 입력에 기반하여, 상기 비디오 데이터가 상기 터치스크린 디스플레이를 통해 출력되고 있는 시점을 식별하고, 상기 오디오 데이터가 상기 적어도 하나의 스피커 또는 외부 전자 장치를 통해 출력될 시점을 연산하고, 상기 식별된 시점 및 상기 연산된 시점을 기반으로, 상기 비디오 데이터를 상기 터치스크린 디스플레이를 통해 출력하고, 상기 오디오 데이터를 상기 적어도 하나의 스피커 또는 상기 외부 전자 장치를 통해 출력되도록 상기 적어도 하나의 스피커 또는 상기 외부 전자 장치를 제어하도록 설정될 수 있다.
본 문서의 일 실시예에 따른 전자 장치는, 적어도 하나의 스피커, 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는, 지연 시간에 기반하여 결정된, 제1 미디어의 오디오 데이터의 출력 시점을 식별하고, 상기 출력 시점에 대응하는, 상기 오디오 데이터의 프레임을 선택하고, 상기 프레임은 복수 개의 PCM(pulse code modulation) 오디오 데이터를 포함하고, 상기 출력 시점과 상기 선택된 프레임의 출력 시간을 비교한 제1 비교 결과를 획득하고, 상기 획득된 제1 비교 결과에 대한 응답으로, 상기 출력 시점이 상기 선택된 프레임의 출력 시간보다 늦은 시점인 경우, 상기 선택된 프레임의 출력 시간과 상기 프레임의 크기를 합산한 값과, 상기 출력 시점을 비교한 제2 비교 결과를 획득하고, 상기 획득된 제2 비교 결과에 대한 응답으로, 상기 출력 시점이 상기 선택된 프레임의 출력 시간과 상기 프레임의 크기를 합산한 값보다 늦은 시점인 경우, 상기 선택된 프레임을 드롭(drop)하고, 상기 획득된 제1 비교 결과에 대한 응답으로, 상기 출력 시점이 상기 선택된 프레임의 출력 시간과 동일하거나 빠른 시점인 경우, 상기 출력 시점과 상기 선택된 프레임의 출력 시간의 차이를 연산하고, 상기 복수 개의 PCM 오디오 데이터 중 상기 연산 결과에 대응하는 적어도 하나의 PCM 오디오 데이터를 드롭하고, 상기 복수 개의 PCM 오디오 데이터 중 상기 드롭된 PCM 오디오 데이터를 제외한 나머지 PCM 오디오 데이터를 상기 적어도 하나의 스피커 또는 외부 전자 장치로 전송하도록 설정될 수 있다.
본 문서의 일 실시예에 따르면, 비디오 데이터 및 오디오 데이터를 모두 포함하는 미디어에 대해서, 오디오 데이터만이 출력 중에 비디오 데이터에 대한 출력 요청을 획득하는 경우, 비디오 데이터의 출력을 위한 지연 시간을 보상하여 오디오 데이터와 비디오 데이터의 동기화가 수행될 수 있다.
본 문서의 일 실시예에 따르면, 비디오 데이터 및 오디오 데이터를 모두 포함하는 미디어에 대해서, 비디오 데이터만이 출력 중에 오디오 데이터에 대한 출력 요청을 획득하는 경우, 오디오 데이터의 출력을 위한 지연 시간을 보상하여 오디오 데이터와 비디오 데이터의 동기화가 수행될 수 있다.
본 문서의 일 실시예에 따르면, 오디오 데이터와 비디오 데이터의 동기화를 수행하는 과정에서 오차가 발생한 경우, 이와 같은 오차를 보상하여 정확한 동기화가 수행될 수 있다.
도 1a 내지 도 1f는, 종래 기술에 따라 비디오 데이터와 오디오 데이터의 동기화를 설명하기 위한 예시 도면이다.
도 2는, 다양한 실시예들에 따른, 네트워크 환경 내의 전자 장치의 블록도이다.
도 3a 내지 도 3e는, 다양한 실시예들에 따른 오디오 데이터와 비디오 데이터를 동기화하는 기능 또는 동작을 설명하기 위한 예시 도면이다.
도 4a 내지 도 4h는, 다양한 실시예들에 따른 도 3a 내지 도 3f와 관련하여 설명된 기능 또는 동작이 적용될 수 있는 구체적인 예를 설명하기 위한 예시 도면이다.
도 5a 내지 도 5e는, 다양한 실시예들에 따른 오디오 데이터와 비디오 데이터를 동기화하는 기능 또는 동작을 설명하기 위한 예시 도면이다.
도 6a 및 도 6b는, 다양한 실시예들에 따른 오디오 데이터와 비디오 데이터를 동기화하기 위하여 요구되는 정보를 업데이트 하는 기능 또는 동작을 설명하기 위한 예시 도면이다.
도 7a 내지 도 7d는, 다양한 실시예들에 따른 오디오 데이터의 위치에 오차가 발생한 경우, 오차를 보정하기 위한 동작 또는 기능을 설명하기 위한 예시 도면이다.
도 8a 및 도 8b는, 다양한 실시예들에 따른 프로세서에 포함되는 다양한 모듈들을 설명하기 위한 예시 도면이다.
도 2는, 다양한 실시예들에 따른, 네트워크 환경(200) 내의 전자 장치(201)의 블록도이다.
도 2를 참조하면, 네트워크 환경(200)에서 전자 장치(201)는 제 1 네트워크(298)(예: 근거리 무선 통신 네트워크)를 통하여 전자 장치(202)와 통신하거나, 또는 제 2 네트워크(299)(예: 원거리 무선 통신 네트워크)를 통하여 전자 장치(204) 또는 서버(208)와 통신할 수 있다. 일 실시예에 따르면, 전자 장치(201)는 서버(208)를 통하여 전자 장치(204)와 통신할 수 있다. 일 실시예에 따르면, 전자 장치(201)는 프로세서(220), 메모리(230), 입력 모듈(250), 음향 출력 모듈(255), 디스플레이 모듈(260), 오디오 모듈(270), 센서 모듈(276), 인터페이스(277), 연결 단자(278), 햅틱 모듈(279), 카메라 모듈(280), 전력 관리 모듈(288), 배터리(289), 통신 모듈(290), 가입자 식별 모듈(296), 또는 안테나 모듈(297)을 포함할 수 있다. 어떤 실시예에서는, 전자 장치(201)에는, 이 구성요소들 중 적어도 하나(예: 연결 단자(278))가 생략되거나, 하나 이상의 다른 구성요소가 추가될 수 있다. 어떤 실시예에서는, 이 구성요소들 중 일부들(예: 센서 모듈(276), 카메라 모듈(280), 또는 안테나 모듈(297))은 하나의 구성요소(예: 디스플레이 모듈(260))로 통합될 수 있다.
프로세서(220)는, 예를 들면, 소프트웨어(예: 프로그램(240))를 실행하여 프로세서(220)에 연결된 전자 장치(201)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일 실시예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(220)는 다른 구성요소(예: 센서 모듈(276) 또는 통신 모듈(290))로부터 수신된 명령 또는 데이터를 휘발성 메모리(232)에 저장하고, 휘발성 메모리(232)에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비휘발성 메모리(234)에 저장할 수 있다. 일 실시예에 따르면, 프로세서(220)는 메인 프로세서(221)(예: 중앙 처리 장치 또는 어플리케이션 프로세서) 또는 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(223)(예: 그래픽 처리 장치, 신경망 처리 장치(NPU: neural processing unit), 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다. 예를 들어, 전자 장치(201)가 메인 프로세서(221) 및 보조 프로세서(223)를 포함하는 경우, 보조 프로세서(223)는 메인 프로세서(221)보다 저전력을 사용하거나, 지정된 기능에 특화되도록 설정될 수 있다. 보조 프로세서(223)는 메인 프로세서(221)와 별개로, 또는 그 일부로서 구현될 수 있다.
보조 프로세서(223)는, 예를 들면, 메인 프로세서(221)가 인액티브(예: 슬립) 상태에 있는 동안 메인 프로세서(221)를 대신하여, 또는 메인 프로세서(221)가 액티브(예: 어플리케이션 실행) 상태에 있는 동안 메인 프로세서(221)와 함께, 전자 장치(201)의 구성요소들 중 적어도 하나의 구성요소(예: 디스플레이 모듈(260), 센서 모듈(276), 또는 통신 모듈(290))와 관련된 기능 또는 상태들의 적어도 일부를 제어할 수 있다. 일 실시예에 따르면, 보조 프로세서(223)(예: 이미지 시그널 프로세서 또는 커뮤니케이션 프로세서)는 기능적으로 관련 있는 다른 구성요소(예: 카메라 모듈(280) 또는 통신 모듈(290))의 일부로서 구현될 수 있다. 일 실시예에 따르면, 보조 프로세서(223)(예: 신경망 처리 장치)는 인공지능 모델의 처리에 특화된 하드웨어 구조를 포함할 수 있다. 인공지능 모델은 기계 학습을 통해 생성될 수 있다. 이러한 학습은, 예를 들어, 인공지능이 수행되는 전자 장치(201) 자체에서 수행될 수 있고, 별도의 서버(예: 서버(208))를 통해 수행될 수도 있다. 학습 알고리즘은, 예를 들어, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)을 포함할 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은, 복수의 인공 신경망 레이어들을 포함할 수 있다. 인공 신경망은 심층 신경망(DNN: deep neural network), CNN(convolutional neural network), RNN(recurrent neural network), RBM(restricted boltzmann machine), DBN(deep belief network), BRDNN(bidirectional recurrent deep neural network), 심층 Q-네트워크(deep Q-networks) 또는 상기 중 둘 이상의 조합 중 하나일 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은 하드웨어 구조 이외에, 추가적으로 또는 대체적으로, 소프트웨어 구조를 포함할 수 있다.
메모리(230)는, 전자 장치(201)의 적어도 하나의 구성요소(예: 프로세서(220) 또는 센서 모듈(276))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램(240)) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(230)는, 휘발성 메모리(232) 또는 비휘발성 메모리(234)를 포함할 수 있다.
프로그램(240)은 메모리(230)에 소프트웨어로서 저장될 수 있으며, 예를 들면, 운영 체제(242), 미들 웨어(244) 또는 어플리케이션(246)을 포함할 수 있다.
입력 모듈(250)은, 전자 장치(201)의 구성요소(예: 프로세서(220))에 사용될 명령 또는 데이터를 전자 장치(201)의 외부(예: 사용자)로부터 수신할 수 있다. 입력 모듈(250)은, 예를 들면, 마이크, 마우스, 키보드, 키(예: 버튼), 또는 디지털 펜(예: 스타일러스 펜)을 포함할 수 있다.
음향 출력 모듈(255)은 음향 신호를 전자 장치(201)의 외부로 출력할 수 있다. 음향 출력 모듈(255)은, 예를 들면, 스피커 또는 리시버를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 녹음 재생과 같이 일반적인 용도로 사용될 수 있다. 리시버는 착신 전화를 수신하기 위해 사용될 수 있다. 일 실시예에 따르면, 리시버는 스피커와 별개로, 또는 그 일부로서 구현될 수 있다.
디스플레이 모듈(260)은 전자 장치(201)의 외부(예: 사용자)로 정보를 시각적으로 제공할 수 있다. 디스플레이 모듈(260)은, 예를 들면, 디스플레이, 홀로그램 장치, 또는 프로젝터 및 해당 장치를 제어하기 위한 제어 회로를 포함할 수 있다. 일 실시예에 따르면, 디스플레이 모듈(260)은 터치를 감지하도록 설정된 터치 센서, 또는 상기 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 압력 센서를 포함할 수 있다.
오디오 모듈(270)은 소리를 전기 신호로 변환시키거나, 반대로 전기 신호를 소리로 변환시킬 수 있다. 일 실시예에 따르면, 오디오 모듈(270)은, 입력 모듈(250)을 통해 소리를 획득하거나, 음향 출력 모듈(255), 또는 전자 장치(201)와 직접 또는 무선으로 연결된 외부 전자 장치(예: 전자 장치(202))(예: 스피커 또는 헤드폰)를 통해 소리를 출력할 수 있다.
센서 모듈(276)은 전자 장치(201)의 작동 상태(예: 전력 또는 온도), 또는 외부의 환경 상태(예: 사용자 상태)를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일 실시예에 따르면, 센서 모듈(276)은, 예를 들면, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 또는 조도 센서를 포함할 수 있다.
인터페이스(277)는 전자 장치(201)가 외부 전자 장치(예: 전자 장치(202))와 직접 또는 무선으로 연결되기 위해 사용될 수 있는 하나 이상의 지정된 프로토콜들을 지원할 수 있다. 일 실시예에 따르면, 인터페이스(277)는, 예를 들면, HDMI(high definition multimedia interface), USB(universal serial bus) 인터페이스, SD카드 인터페이스, 또는 오디오 인터페이스를 포함할 수 있다.
연결 단자(278)는, 그를 통해서 전자 장치(201)가 외부 전자 장치(예: 전자 장치(202))와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일 실시예에 따르면, 연결 단자(278)는, 예를 들면, HDMI 커넥터, USB 커넥터, SD 카드 커넥터, 또는 오디오 커넥터(예: 헤드폰 커넥터)를 포함할 수 있다.
햅틱 모듈(279)은 전기적 신호를 사용자가 촉각 또는 운동 감각을 통해서 인지할 수 있는 기계적인 자극(예: 진동 또는 움직임) 또는 전기적인 자극으로 변환할 수 있다. 일 실시예에 따르면, 햅틱 모듈(279)은, 예를 들면, 모터, 압전 소자, 또는 전기 자극 장치를 포함할 수 있다.
카메라 모듈(280)은 정지 영상 및 동영상을 촬영할 수 있다. 일 실시예에 따르면, 카메라 모듈(280)은 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다.
전력 관리 모듈(288)은 전자 장치(201)에 공급되는 전력을 관리할 수 있다. 일 실시예에 따르면, 전력 관리 모듈(288)은, 예를 들면, PMIC(power management integrated circuit)의 적어도 일부로서 구현될 수 있다.
배터리(289)는 전자 장치(201)의 적어도 하나의 구성요소에 전력을 공급할 수 있다. 일 실시예에 따르면, 배터리(289)는, 예를 들면, 재충전 불가능한 1차 전지, 재충전 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.
통신 모듈(290)은 전자 장치(201)와 외부 전자 장치(예: 전자 장치(202), 전자 장치(204), 또는 서버(208)) 간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(290)은 프로세서(220)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일 실시예에 따르면, 통신 모듈(290)은 무선 통신 모듈(292)(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(294)(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제 1 네트워크(298)(예: 블루투스, WiFi(wireless fidelity) direct 또는 IrDA(infrared data association)와 같은 근거리 통신 네트워크) 또는 제 2 네트워크(299)(예: 레거시 셀룰러 네트워크, 5G 네트워크, 차세대 통신 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부의 전자 장치(204)와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성요소(예: 단일 칩)로 통합되거나, 또는 서로 별도의 복수의 구성요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈(292)은 가입자 식별 모듈(296)에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제 1 네트워크(298) 또는 제 2 네트워크(299)와 같은 통신 네트워크 내에서 전자 장치(201)를 확인 또는 인증할 수 있다.
무선 통신 모듈(292)은 4G 네트워크 이후의 5G 네트워크 및 차세대 통신 기술, 예를 들어, NR 접속 기술(new radio access technology)을 지원할 수 있다. NR 접속 기술은 고용량 데이터의 고속 전송(eMBB(enhanced mobile broadband)), 단말 전력 최소화와 다수 단말의 접속(mMTC(massive machine type communications)), 또는 고신뢰도와 저지연(URLLC(ultra-reliable and low-latency communications))을 지원할 수 있다. 무선 통신 모듈(292)은, 예를 들어, 높은 데이터 전송률 달성을 위해, 고주파 대역(예: mmWave 대역)을 지원할 수 있다. 무선 통신 모듈(292)은 고주파 대역에서의 성능 확보를 위한 다양한 기술들, 예를 들어, 빔포밍(beamforming), 거대 배열 다중 입출력(massive MIMO(multiple-input and multiple-output)), 전차원 다중입출력(FD-MIMO: full dimensional MIMO), 어레이 안테나(array antenna), 아날로그 빔형성(analog beam-forming), 또는 대규모 안테나(large scale antenna)와 같은 기술들을 지원할 수 있다. 무선 통신 모듈(292)은 전자 장치(201), 외부 전자 장치(예: 전자 장치(204)) 또는 네트워크 시스템(예: 제 2 네트워크(299))에 규정되는 다양한 요구사항을 지원할 수 있다. 일 실시예에 따르면, 무선 통신 모듈(292)은 eMBB 실현을 위한 Peak data rate(예: 20Gbps 이상), mMTC 실현을 위한 손실 Coverage(예: 164dB 이하), 또는 URLLC 실현을 위한 U-plane latency(예: 다운링크(DL) 및 업링크(UL) 각각 0.5ms 이하, 또는 라운드 트립 1ms 이하)를 지원할 수 있다.
안테나 모듈(297)은 신호 또는 전력을 외부(예: 외부의 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일 실시예에 따르면, 안테나 모듈(297)은 서브스트레이트(예: PCB) 위에 형성된 도전체 또는 도전성 패턴으로 이루어진 방사체를 포함하는 안테나를 포함할 수 있다. 일 실시예에 따르면, 안테나 모듈(297)은 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다. 이런 경우, 제 1 네트워크(298) 또는 제 2 네트워크(299)와 같은 통신 네트워크에서 사용되는 통신 방식에 적합한 적어도 하나의 안테나가, 예를 들면, 통신 모듈(290)에 의하여 상기 복수의 안테나들로부터 선택될 수 있다. 신호 또는 전력은 상기 선택된 적어도 하나의 안테나를 통하여 통신 모듈(290)과 외부의 전자 장치 간에 송신되거나 수신될 수 있다. 어떤 실시예에 따르면, 방사체 이외에 다른 부품(예: RFIC(radio frequency integrated circuit))이 추가로 안테나 모듈(297)의 일부로 형성될 수 있다.
다양한 실시예에 따르면, 안테나 모듈(297)은 mmWave 안테나 모듈을 형성할 수 있다. 일 실시예에 따르면, mmWave 안테나 모듈은 인쇄 회로 기판, 상기 인쇄 회로 기판의 제 1 면(예: 아래 면)에 또는 그에 인접하여 배치되고 지정된 고주파 대역(예: mmWave 대역)을 지원할 수 있는 RFIC, 및 상기 인쇄 회로 기판의 제 2 면(예: 윗 면 또는 측 면)에 또는 그에 인접하여 배치되고 상기 지정된 고주파 대역의 신호를 송신 또는 수신할 수 있는 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다.
상기 구성요소들 중 적어도 일부는 주변 기기들간 통신 방식(예: 버스, GPIO(general purpose input and output), SPI(serial peripheral interface), 또는 MIPI(mobile industry processor interface))을 통해 서로 연결되고 신호(예: 명령 또는 데이터)를 상호간에 교환할 수 있다.
일 실시예에 따르면, 명령 또는 데이터는 제 2 네트워크(299)에 연결된 서버(208)를 통해서 전자 장치(201)와 외부의 전자 장치(204)간에 송신 또는 수신될 수 있다. 외부의 전자 장치(202, 또는 204) 각각은 전자 장치(201)와 동일한 또는 다른 종류의 장치일 수 있다. 일 실시예에 따르면, 전자 장치(201)에서 실행되는 동작들의 전부 또는 일부는 외부의 전자 장치들(202, 204, 또는 208) 중 하나 이상의 외부의 전자 장치들에서 실행될 수 있다. 예를 들면, 전자 장치(201)가 어떤 기능이나 서비스를 자동으로, 또는 사용자 또는 다른 장치로부터의 요청에 반응하여 수행해야 할 경우에, 전자 장치(201)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 하나 이상의 외부의 전자 장치들에게 그 기능 또는 그 서비스의 적어도 일부를 수행하라고 요청할 수 있다. 상기 요청을 수신한 하나 이상의 외부의 전자 장치들은 요청된 기능 또는 서비스의 적어도 일부, 또는 상기 요청과 관련된 추가 기능 또는 서비스를 실행하고, 그 실행의 결과를 전자 장치(201)로 전달할 수 있다. 전자 장치(201)는 상기 결과를, 그대로 또는 추가적으로 처리하여, 상기 요청에 대한 응답의 적어도 일부로서 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 모바일 에지 컴퓨팅(MEC: mobile edge computing), 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다. 전자 장치(201)는, 예를 들어, 분산 컴퓨팅 또는 모바일 에지 컴퓨팅을 이용하여 초저지연 서비스를 제공할 수 있다. 다른 실시예에 있어서, 외부의 전자 장치(204)는 IoT(internet of things) 기기를 포함할 수 있다. 서버(208)는 기계 학습 및/또는 신경망을 이용한 지능형 서버일 수 있다. 일 실시예에 따르면, 외부의 전자 장치(204) 또는 서버(208)는 제 2 네트워크(299) 내에 포함될 수 있다. 전자 장치(201)는 5G 통신 기술 및 IoT 관련 기술을 기반으로 지능형 서비스(예: 스마트 홈, 스마트 시티, 스마트 카, 또는 헬스 케어)에 적용될 수 있다.
도 3a 내지 도 3e는, 다양한 실시예에 따른 오디오 데이터와 비디오 데이터를 동기화하는 기능 또는 동작을 설명하기 위한 예시 도면이다.
도 3a를 참조하면, 본 문서의 일 실시예에 따른 전자 장치(예: 도 2의 프로세서(220))는, 동작 310에서, 출력 장치(예: 음향 출력 모듈(255) 또는 외부 음향 출력 장치)를 통해 미디어의 오디오 데이터를 출력하는 동안에, 미디어의 비디오 데이터를 출력하도록 하는 이벤트의 발생을 검출할 수 있다. 본 문서의 일 실시예에 따르면, 도 3b에 도시된 바와 같이, 전자 장치(201)는 비디오 데이터를 출력하지 않고 오디오 데이터만을 출력할 수 있다. 예를 들어, 전자 장치(201)는, 비디오 데이터의 출력 화면이 아닌 특정한 화면(예: 홈 화면)을 표시하면서 미디어의 오디오 데이터 만을 출력할 수 있다. 또는, 특정한 어플리케이션(예: 갤러리 어플리케이션)의 실행 화면이 전자 장치(201)에 표시된 상태에서 미디어의 비디오 데이터는 출력하지 않고 미디어의 오디오 데이터만을 출력할 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 도 3c에 도시된 바와 같이, 미디어를 재생하기 위한 특정한 어플리케이션(303)(예: 비디오 어플리케이션)에 대한 선택 입력과 같은, 미디어의 비디오 데이터를 출력하도록 하는 이벤트(예: 사용자 입력)의 발생을 검출할 수 있다.
본 문서의 일 실시예에 따른 전자 장치(예: 도 2의 프로세서(220))는, 동작 320에서, 오디오 데이터가 출력 장치를 통해 출력되고 있는 시점을 식별할 수 있다. 예를 들어, 이벤트가 검출된 시점이 미디어의 초기 재생 시작 시작 시점(예를 들어, 0초)으로부터 10초가 경과된 시점에 검출된 경우, 본 문서의 일 실시예에 따른 전자 장치(201)는, 오디오 데이터가 출력 장치를 통해 출력되고 있는 시점을 "10초"라고 식별할 수 있다.
본 문서의 일 실시예에 따른 전자 장치(예: 도 2의 프로세서(220))는, 동작 330에서, 비디오 데이터가 전자 장치(201) 또는 외부 전자 장치를 통해 출력될 시점을, 적어도 비디오 데이터의 속성을 기반으로 연산할 수 있다. 본 문서의 일 실시예에 따른 전자 장치는, 비디오 데이터가 전자 장치(201) 또는 외부 전자 장치를 통해 출력될 시점을 연산하기 위해, 제1 지연 시간, 제2 지연 시간, 제3 지연 시간 및 제4 지연 시간을 결정할 수 있다.
본 문서의 일 실시예에 따른 제1 지연 시간은, 현재 오디오 데이터가 적어도 하나의 스피커 또는 외부 전자 장치를 통해 출력되고 있는 시점으로부터 가장 가까운 이전의 싱크 프레임의 위치에 대응하는 시간, 비디오 데이터를 디코딩하기 위한 디코더의 최대 FPS(frame per second), 비디오 데이터의 FPS, 및 오디오 데이터가 적어도 하나의 스피커 또는 외부 전자 장치를 통해 출력되고 있는 시점을 기반으로 결정될 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는 아래의 수학식 1을 이용하여 제1 지연 시간을 결정할 수 있다.
Figure PCTKR2021013134-appb-M000001
수학식 1에서 "Audio pos"은 오디오 데이터가 적어도 하나의 스피커 또는 외부 전자 장치를 통해 출력되고 있는 시점을 의미할 수 있고, "Video prev sync pos"는 현재 오디오 데이터가 적어도 하나의 스피커 또는 외부 전자 장치를 통해 출력되고 있는 시점으로부터 가장 가까운 이전의 싱크 프레임의 위치에 대응하는 시간을 의미할 수 있다. 예를 들어, 도 3d를 참조하면, 본 문서의 일 실시예에 따른 전자 장치(201)는, 복수의 싱크 프레임들(305a, 305b, 305c) 중 현재 오디오 데이터가 적어도 하나의 스피커 또는 외부 전자 장치를 통해 출력되고 있는 시점으로부터 가장 가까운 이전의 싱크 프레임(305b)을 선택하고, 싱크 프레임(305b)의 출력 시간(예: 8초)을 식별할 수 있다. "Video fps"는 비디오 데이터의 FPS를 의미할 수 있고, "디코더 max fps"는, 비디오 데이터를 디코딩하기 위한 디코더의 최대 FPS를 의미할 수 있다. 본 문서의 일 실시예에 따른 디코더의 최대 FPS에 대한 정보는 아래와 같은 표 1의 형식으로 전자 장치(201)에 저장되어 있을 수 있다. 이하의 표 1에서 폭(width) 및 높이(height)는, 비디오 데이터를 구성하는 이미지 프레임의 폭 및 높이를 의미할 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 이하의 표 1과 같은 정보를 참조하여 디코더의 최대 FPS를 결정할 수 있다.
디코더 타입 width * height max fps
h.264 921600 960
2073600 480
8294400 120
본 문서의 일 실시예에 따른 제2 지연 시간은, 비디오 데이터에 적용되는 적어도 하나의 비디오 필터의 지연 시간을 기반으로 결정될 수 있다. 본 문서의 일 실시예에 따른 비디오 필터 타입 및 지연 시간에 대한 정보는 아래와 같은 표 2의 형식으로 전자 장치(201)에 저장되어 있을 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 이하의 표 2와 같은 정보를 참조하여, 비디오 데이터에 적용된 비디오 필터에 대응하는 지연 시간(예: 제2 지연 시간)을 결정할 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 비디오 데이터를 출력하기 위하여 복수 개의 비디오 필터가 사용된 경우라면, 사용된 비디오 필터 타입에 대응하는 지연 시간의 합을 연산함으로써 제2 지연 시간을 결정할 수 있다. 본 문서의 일 실시예에 따른 표 2에서는, 동일한 비디오 필터 타입이 사용된 경우라도 비디오 데이터를 구성하는 이미지 프레임의 폭 및 높이에 따라 서로 상이한 지연 시간이 적용될 수 있음이 표현된다.
비디오 필터 타입 Width * height 지연시간
Object Tracking 921600 20 ms
2073600 40 ms
Stabilization 921600 50 ms
2073600 100 ms
Remove Flicker 921600 30 ms
2073600 60 ms
Super Resolution 921600 50 ms
2073600 100 ms
본 문서의 일 실시예에 따른 제3 지연 시간은, 전자 장치(201)의 디스플레이 모듈(260) 또는 외부 전자 장치로부터 비디오 데이터를 출력하기 위해 요구되는 비디오 데이터 전송 지연 시간을 기반으로 결정될 수 있다. 본 문서의 일 실시예에 따른 비디오 데이터 전송 지연 시간은, 비디오 출력 장치로 비디오 데이터가 전송되는 경우에 소요되는 시간(다른 말로, 출력 지연 시간)을 의미할 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 이하의 표 3과 같은 정보를 참조하여, 비디오 데이터 전송 지연 시간(예: 제3 지연 시간)을 결정할 수 있다.
비디오 출력 장치 지연 시간
단말 디스플레이 20 ms
스크린 미러링 200 ms
AR Glass 300 ms
VR 400 ms
본 문서의 일 실시예에 따른 제4 지연 시간은, 제1 지연 시간, 제2 지연 시간 및 제3 지연 시간을 연산하는 과정에서 발생된 지연 시간을 보상하기 위한 지연 시간일 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 아래의 수학식 2를 이용하여 제4 지연 시간을 결정할 수 있다.
Figure PCTKR2021013134-appb-M000002
수학식 2에서, "Video fps"는 비디오 데이터의 FPS를 의미할 수 있고, "디코더 max fps"는, 비디오 데이터를 디코딩하기 위한 디코더의 최대 FPS를 의미할 수 있다.
본 문서의 일 실시예에 따른 전자 장치(201)는, 아래의 수학식 3을 이용하여 비디오 데이터가 전자 장치(201) 또는 외부 전자 장치를 통해 출력될 시점을 연산할 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 아래의 수학식 3을 통해 연산된 시점을, 비디오 데이터가 출력될 시점으로 결정할 수 있다. 도 3e를 참조하면, 비디오 데이터를 출력하는 요청을 획득한 시점(예: 미디어의 최초 시점(0초)로부터 10초가 경과된 시점)으로부터 지연 시간들이 반영된 시점에 위치한 비디오 데이터를 출력 프레임으로 결정함으로써, 끊김 없는 비디오 데이터의 출력이 가능할 수 있다. 다만, 본 문서의 일 실시예에 따른 전자 장치(201)는, 아래의 수학식 3을 통해 연산된 시점이 다음 싱크 프레임보다 큰 경우, 다음 싱크 프레임의 위치에 대응하는 시간을 비디오 데이터가 출력될 시점으로 결정할 수 있다.
Figure PCTKR2021013134-appb-M000003
본 문서의 일 실시예에 따른 전자 장치(201)는, 동작 340에서, 연산된 시점을 기반으로, 비디오 데이터가 전자 장치(201) 및/또는 외부 전자 장치를 통해 출력되도록 디스플레이 모듈(260) 및/또는 외부 전자 장치를 제어할 수 있다. 이와 같은 동작을 통해, 비디오 데이터를 출력하는 요청을 획득한 시점(예: 미디어의 최초 재생 시점(0초)로부터 10초가 경과된 시점)으로부터 지연 시간들이 반영된 시점에 위치한 비디오 데이터를 출력 프레임으로 결정함으로써, 끊김 없는 비디오 데이터의 출력이 가능할 수 있다.
도 4a 내지 도 4h는, 다양한 실시예에 따른 도 3a 내지 도 3f와 관련하여 설명된 기능 또는 동작이 적용될 수 있는 구체적인 예를 설명하기 위한 예시 도면이다.
도 4a 및 도 4b를 참조하면, 본 문서의 일 실시예에 따른 전자 장치(201)는 커버와 결합될 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는 커버가 덮힌 상태에 있는 경우(예: 도 4a), 미디어의 오디오 데이터만을 출력할 수 있다. 이후,도 4b에 도시된 바와 같이 커버가 오픈 상태로 변경되는 경우, 본 문서의 일 실시예에 따른 전자 장치(201)는 이를 비디오 데이터 출력 요청으로 식별할 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 상술한 지연 시간들을 고려하여 비디오 데이터를 출력함으로써 끊김 없는 비디오 데이터의 출력이 가능할 수 있다. 또는, 본 개시의 일 실시예에 따르면, 화면(예: 도 2의 디스플레이 모듈(260))이 오프(OFF) 상태(예: AP의 슬립(sleep) 상태)에 있거나 저전력 상태(예: AOD(always on display) 상태)에 있는 동안에 전자 장치(201)는 오디오 데이터만을 출력할 수 있다. 이 경우, 전자 장치(201)의 화면을 턴 온(turn on) 시키기 위한 사용자의 입력(예: 전자 장치(201)에 구비된 버튼에 대한 터치/프레스 입력) 또는 화면 턴 온 이벤트의 발생(예: 수신 콜 발생 또는 메시지의 수신)에 따라 화면이 턴 온(예: AP의 웨이크 업 상태로의 전환 또는 저전력 상태의 해제) 될 수 있다. 본 개시의 일 실시예에 따른 전자 장치(201)는, 화면이 턴 온 되면 오디오 데이터와 함께 비디오 데이터를 출력할 수 있으며, 상술한 지연 시간들을 고려하여 비디오 데이터를 출력함으로써 끊김 없는 비디오 데이터의 출력이 가능할 수 있다.
본 문서의 일 실시예에 따르면, 멀티 윈도우 환경 또는 전자 장치(201)가 복수의 스크린들을 포함하는 환경에서도, 도 3a 내지 도 3e와 관련된 기능 또는 동작이 적용될 수 있다. 도 4c 내지 도 4e를 참조하면, 도 4c와 같이 복수의 어플리케이션 실행 화면들이 멀티 윈도우 디스플레이 방식으로 표시된 상태에서, 미디어의 오디오 데이터만이 출력될 수 있다. 본 문서의 다양한 실시예들에 따른 전자 장치(201)는, 도 4d에 도시된 바와 같이 비디오 데이터의 출력을 요청하는 사용자 입력을 획득하면, 도 4e에 도시된 바와 같이 비디오 데이터와 함께 오디오 데이터를 출력할 수 있다. 이 때, 본 문서의 다양한 실시예들에 따른 전자 장치(201)는, 상술한 지연 시간들을 고려하여 비디오 데이터를 출력함으로써 끊김없는 비디오 데이터의 출력이 가능할 수 있다.
본 문서의 일 실시예에 따르면, 외부 전자 장치(415)와 미러링이 수행되는 경우에도 도 3a 내지 도 3e와 관련된 기능 또는 동작이 적용될 수 있다. 도 4f를 참조하면, 본 문서의 일 실시예에 따른 전자 장치(201)는 오디오 데이터를 출력하면서, 외부 전자 장치(415)에, 전자 장치(201)에 표시되고 있는 화면을 표시하도록 외부 전자 장치(415)를 제어할 수 있다. 이 경우, 본 문서의 다양한 실시예들에 따른 전자 장치(201)는, 도 4g에 도시된 바와 같이 비디오 데이터의 출력을 요청하는 사용자 입력을 획득하면, 도 4h에 도시된 바와 같이 비디오 데이터와 함께 오디오 데이터를 전자 장치(201) 및 외부 전자 장치(415)를 통해 출력할 수 있다. 이 때, 본 문서의 다양한 실시예들에 따른 전자 장치(201)는, 상술한 지연 시간들을 고려하여 비디오 데이터를 출력함으로써 끊김없는 비디오 데이터의 출력이 가능할 수 있다.
도 5a 내지 도 5e는, , 본 문서의 다양한 실시예들에 따른 오디오 데이터와 비디오 데이터를 동기화하는 기능 또는 동작을 설명하기 위한 예시 도면이다.
도 5a를 참조하면, 본 문서의 일 실시예에 따른 전자 장치(201)(예: 도 2의 프로세서(220))는, 동작 510에서, 출력 장치(예: 디스플레이 모듈(260) 또는 외부 디스플레이 장치)를 통해 미디어의 비디오 데이터를 출력하는 동안에, 미디어의 오디오 데이터를 출력하도록 하는 이벤트(예: 오디오 데이터를 출력하기 위한 설정으로 변경하는 사용자 입력)의 발생을 검출할 수 있다. 본 문서의 일 실시예에 따르면, 전자 장치(201)는 오디오 데이터를 출력하지 않고 비디오 데이터만을 출력할 수 있다. 예를 들어, 특정한 어플리케이션(예: 갤러리 어플리케이션)의 실행 화면 상에서 미디어의 오디오 데이터는 출력하지 않고 미디어의 비디오 데이터만을 출력하도록 설정된 경우, 미디어의 비디오 데이터만을 출력할 수 있다.
본 문서의 일 실시예에 따른 전자 장치(201)는, 동작 520에서, 비디오 데이터가 출력 장치를 통해 출력되고 있는 시점을 식별할 수 있다. 예를 들어, 이벤트가 검출된 시점이 미디어의 초기 재생 시작 시점(예: 0초)으로부터 10초가 경과된 시점에 검출된 경우, 본 문서의 일 실시예에 따른 전자 장치(201)는, 비디오 데이터가 출력 장치를 통해 출력되고 있는 시점을 "10초"라고 식별할 수 있다.
본 문서의 일 실시예에 따른 전자 장치(201)는, 동작 530에서, 오디오 데이터가 음향 출력 모듈(255) 및/또는 외부 전자 장치를 통해 출력될 시점을 연산할 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 오디오 데이터가 전자 장치(201) 또는 외부 전자 장치를 통해 출력될 시점을 연산하기 위해, 제5 지연 시간 및 제6 지연 시간을 결정할 수 있다.
본 문서의 일 실시예에 따른 제5 지연 시간은, 오디오 데이터에 적용되는 오디오 필터의 지연 시간에 기반하여 결정될 수 있다. 본 문서의 일 실시예에 따른 오디오 필터 타입 및 지연 시간에 대한 정보는 아래와 같은 표 4의 형식으로 전자 장치(201)에 저장되어 있을 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 이하의 표 4와 같은 정보를 참조하여, 오디오 데이터에 적용된 오디오 필터에 대응하는 지연 시간(예: 제5 지연 시간)을 결정할 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 오디오 데이터를 출력하기 위하여 복수 개의 오디오 필터가 사용된 경우라면, 사용된 오디오 필터 타입에 대응하는 지연 시간의 합을 연산함으로써 제5 지연 시간을 결정할 수 있다.
오디오 필터 타입 지연시간
공간 오디오 80 ms
High Quality 오디오 20 ms
본 문서의 일 실시예에 따른 제6 지연 시간은, 출력 장치가 오디오 데이터를 출력하기 위해 요구되는 오디오 데이터 전송 지연 시간을 기반으로 결정될 수 있다. 본 문서의 일 실시예에 따른 오디오 데이터 전송 지연 시간은, 오디오 출력 장치로 오디오 데이터가 전송되는 경우에 소요되는 시간(다른 말로, 출력 지연 시간)을 의미할 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 이하의 표 5와 같은 정보를 참조하여, 오디오 데이터 전송 지연 시간(예: 제6 지연 시간)을 결정할 수 있다.
오디오 출력 장치 지연 시간
전자 장치 스피커 200 ms
전자 장치 유선 이어폰 190 ms
BT AVDTP 1.3 delay reporting 지원 장치 450 ms
본 문서의 일 실시예에 따른 전자 장치(201)는, 아래의 수학식 4를 이용하여 오디오 데이터가 전자 장치(201) 또는 외부 전자 장치를 통해 출력될 시점을 연산할 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 아래의 수학식 4를 통해 연산된 시점을, 오디오 데이터가 출력될 시점으로 결정할 수 있다. 본 문서의 일 실시예에 따르면, 오디오 데이터를 출력하는 이벤트를 검출한 시점(예: 미디어의 최초 재생 시점(예: 0초)로부터 10초가 경과된 시점)으로부터 지연 시간들이 반영된 시점에 위치한 오디오 데이터를 출력 프레임으로 결정함으로써, 멈춤 없는 비디오 데이터의 출력이 가능할 수 있다.
Figure PCTKR2021013134-appb-M000004
본 문서의 일 실시예에 따른 전자 장치(201)는, 동작 540에서, 연산된 시점을 기반으로, 오디오 데이터가 전자 장치(201) 및/또는 외부 전자 장치를 통해 출력되도록 음향 출력 모듈(255) 및/또는 또는 외부 전자 장치를 제어할 수 있다. 이와 같은 동작을 통해, 오디오 데이터를 출력하는 요청을 획득한 시점(예: 미디어의 최초 재생 시점(0초)로부터 10초가 경과된 시점)으로부터 지연 시간들이 반영된 시점에 위치한 오디오 데이터를 출력 데이터 또는 출력 프레임으로 결정함으로써, 멈춤 없는 비디오 데이터의 출력이 가능할 수 있다.
도 5c를 참조하면, 본 문서의 일 실시예에 따른 전자 장치(201)는, 특정한 어플리케이션(예: 갤러리 어플리케이션)에서 동영상(505)을 재생할 수 있다. 이 경우, 본 문서의 일 실시예에 따른 전자 장치(201)는, 동영상(505)에 대응하는 오디오 데이터는 출력하지 않는 상태일 수 있다. 도 5d를 참조하면, 본 문서의 일 실시예에 따른 전자 장치(201)는, 오디오 데이터의 출력 이벤트(예: 그래픽 사용자 인터페이스(505a)에 대한 선택 입력)의 발생을 검출할 수 있다. 도 5e를 참조하면, 본 개시의 일 실시예에 따른 전자 장치(201)는, 오디오 데이터의 출력 이벤트의 발생이 검출되면, 지연 시간(예: 제 5 지연 시간 및 제6 지연 시간)을 이용하여 오디오 데이터를 출력함으로써, 끊김 없는 오디오 데이터를 출력할 수 있다.
도 6a 및 도 6b는, 다양한 실시예들에 따른 오디오 데이터와 비디오 데이터를 동기화하기 위하여 요구되는 정보를 업데이트 하는 기능 또는 동작을 설명하기 위한 예시 도면이다.
도 6a를 참조하면, 본 문서의 일 실시예에 따른 전자 장치(201)(예: 도 2의 프로세서(220))는, 동작 610에서, 비디오 데이터를 출력하기 위한 복수 개의 프로세스들과 관련된 정보를 식별(또는, 획득)할 수 있다. 본 문서의 일 실시예에 따른 복수 개의 프로세스들은, 예를 들면, 디코딩 프로세스, 필터링 프로세스, 및 출력 장치로의 비디오 전송 프로세스 중 적어도 하나의 프로세스를 포함할 수 있다. 본 문서의 일 실시예에 따른, 복수 개의 프로세스들과 관련된 정보는, 비디오 데이터를 출력하기 위한 복수 개의 프로세스들 각각에 의해 실제적으로 소요된 처리 시간에 대한 정보, 디코딩 프로세스에 적용된 디코더의 타입에 대한 정보, 필터링 프로세스(예: 비디오 데이터에 대한 후처리 효과를 적용하는 프로세스)에 적용된 필터의 타입에 대한 정보 및 출력 장치의 타입에 대한 정보, 및 비디오 데이터의 해상도와 같은, 비디오 데이터의 속성에 대한 정보를 포함할 수 있다.
본 문서의 일 실시예에 따른 전자 장치(201)는, 동작 620에서, 동작 610에서 획득된 정보가 전자 장치(201)에 저장되어 있는 정보인지 여부를 판단할 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 디코더의 타입, 비디오 필터의 타입 및 출력 장치의 타입이 전자 장치(201)에 저장되어 있는 정보인지 여부를 판단할 수 있다. 동작 620을 수행하기 위하여 본 문서의 일 실시예에 따른 전자 장치(201)는 표 1 내지 표 3을 참조할 수 있다.
본 문서의 일 실시예에 따른 전자 장치(201)는, 동작 630에서, 동작 610에서 획득된 정보가 전자 장치(201)에 저장되어 있는 정보인 경우(동작 620-예), 전자 장치(201)에 저장된 정보(예: 표 1 내지 표 3)를 업데이트 할 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 미리 저장되어 있는 지연 시간에 대한 정보와 비디오 데이터를 출력하기 위한 복수 개의 프로세스들 각각에 의해 실제적으로 소요된 처리 시간에 대한 정보의 평균 값을 연산함으로써 전자 장치(201)에 저장된 정보(예: 표 1 내지 표 3)를 업데이트 할 수 있다. 예를 들어, "객체 추적(Object Tracking)" 필터를 이용하여 비디오 데이터에 대한 필터링 프로세스를 수행한 경우, 전자 장치(201)에 미리 저장된 지연 시간이 50ms이고, 실제적으로 필터링 프로세스를 수행하기 위해 소요된 시간이 52ms인 경우, 전자 장치(201)는, 50ms와 52ms의 평균 값인 51ms로 지연 시간(예: 제2 지연 시간)을 업데이트 할 수 있다.
본 문서의 일 실시예에 따른 전자 장치(201)는, 동작 640에서, 동작 610에서 획득된 정보가 전자 장치(201)에 저장되어 있는 정보가 아닌 경우(동작 620-아니오), 본 문서의 일 실시예에 따른 전자 장치(201)는, 동작 610에서 획득된 타입에 대한 정보 및 지연 시간에 대한 정보를 전자 장치(201)에 추가적으로 저장할 수 있다. 예를 들어, 표 2에 표현되어 있는 필터들 이외의 다른 필터를 이용하여 필터링 프로세스를 수행한 경우, 본 문서의 일 실시예에 따른 전자 장치(201)는, 필터링 프로세스에서 이용된 비디오 필터의 타입 및 소요된 지연 시간을 표 2에 추가하는 방식으로 전자 장치(201)에 저장된 정보(예: 표 1 내지 표 3)를 업데이트 할 수 있다.
도 6b를 참조하면, 본 문서의 일 실시예에 따른 전자 장치(201)(예: 도 2의 프로세서(220))는, 동작 605에서, 오디오 데이터를 출력하기 위한 복수 개의 프로세스들과 관련된 정보를 식별(또는, 획득)할 수 있다. 본 문서의 일 실시예에 따른 복수 개의 프로세스들은, 예를 들면, 필터링 프로세스, 및 출력 장치로의 오디오 전송 프로세스 중 적어도 하나의 프로세스를 포함할 수 있다. 본 문서의 일 실시예에 따른, 복수 개의 프로세스들과 관련된 정보는, 오디오 데이터를 출력하기 위한 복수 개의 프로세스들 각각에 의해 실제적으로 소요된 처리 시간에 대한 정보, 필터링 프로세스(예: 오디오 데이터에 대한 후처리 효과를 적용하는 프로세스)에 적용된 필터의 타입에 대한 정보 및 출력 장치의 타입에 대한 정보를 포함할 수 있다.
본 문서의 일 실시예에 따른 전자 장치(201)는, 동작 615에서, 동작 605에서 획득된 정보가 전자 장치(201)에 저장되어 있는 정보인지 여부를 판단할 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 오디오 필터의 타입 및 출력 장치의 타입이 전자 장치(201)에 저장되어 있는 정보인지 여부를 판단할 수 있다. 동작 615를 수행하기 위하여 본 문서의 일 실시예에 따른 전자 장치(201)는 표 4 및 표 5를 참조할 수 있다.
본 문서의 일 실시예에 따른 전자 장치(201)는, 동작 625에서, 동작 605에서 획득된 정보가 전자 장치(201)에 저장되어 있는 정보인 경우(동작 615-예), 전자 장치(201)에 저장된 정보(예: 표 4 및 표 5)를 업데이트 할 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 미리 저장되어 있는 지연 시간에 대한 정보와, 오디오 데이터를 출력하기 위한 복수 개의 프로세스들 각각에 의해 실제적으로 소요된 처리 시간에 대한 정보의 평균 값을 연산함으로써 전자 장치(201)에 저장된 정보(예: 표 4 및 표 5)를 업데이트 할 수 있다. 예를 들어, "공간 오디오" 필터를 이용하여 오디오 데이터에 대한 필터링 프로세스를 수행한 경우, 전자 장치(201)에 미리 저장된 지연 시간이 80ms이고, 실제적으로 필터링 프로세스를 수행하기 위해 소요된 시간이 82ms인 경우, 전자 장치(201)는, 80ms와 82ms의 평균 값인 81ms로 지연 시간(예: 제5 지연 시간)을 업데이트 할 수 있다.
본 문서의 일 실시예에 따른 전자 장치(201)는, 동작 635에서, 동작 605에서 획득된 정보가 전자 장치(201)에 저장되어 있는 정보가 아닌 경우(동작 615-아니오), 본 문서의 일 실시예에 따른 전자 장치(201)는, 동작 605에서 획득된 타입에 대한 정보 및 지연 시간에 대한 정보를 전자 장치(201)에 추가적으로 저장할 수 있다. 예를 들어, 표 4에 표현되어 있는 필터들 이외의 다른 필터를 이용하여 필터링 프로세스를 수행한 경우, 본 문서의 일 실시예에 따른 전자 장치(201)는, 필터링 프로세스에서 이용된 오디오 필터의 타입 및 소요된 지연 시간을 표 4에 추가하는 방식으로 전자 장치(201)에 저장된 정보(예: 표 4 및/또는 표 5)를 업데이트 할 수 있다.
도 7a 내지 도 7d는, 다양한 실시예들에 따른 오디오 데이터의 위치에 오차가 발생한 경우, 오차를 보정하기 위한 동작 또는 기능을 설명하기 위한 예시 도면이다.
도 7a를 참조하면, 본 문서의 일 실시예에 따른 전자 장치(예: 도 2의 프로세서(220))는, 동작 710에서, 지연 시간에 기반하여 결정된, 제1 미디어의 오디오 데이터의 출력 시점을 식별할 수 있다. 본 문서의 일 실시예에 따른 지연 시간은, 도 5a 및 도 5b와 관련하여 설명된 오디오 데이터의 지연 시간을 의미할 수 있다. 본 문서의 일 실시예에 따른 오디오 데이터의 출력 시점은, 도 5a 및 도 5b와 관련하여 설명된 지연 시간이 보상된 출력 시점을 의미할 수 있다.
본 문서의 일 실시예에 따른 전자 장치(예: 도 2의 프로세서(220))는, 동작 720에서, 오디오 데이터의 출력 시점에 대응하는, 오디오 데이터의 프레임(예: 제3 오디오 프레임(925))을 선택할 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 오디오 데이터의 출력 시점(예: 10초)과 일치하는 오디오 프레임을 선택할 수도 있지만, 오디오 데이터의 출력 시점과 오디오 데이터의 프레임의 시간(예: 특정한 오디오 프레임의 시작 시간 또는 오디오 데이터의 출력 시간)이 정확하게 일치하지 않을 수도 있다. 예를 들면, 지연 시간이 보상된 오디오 데이터의 출력 시점은 10초 이지만, 선택된 오디오 프레임(예: 제3 오디오 프레임(925))의 출력 시간은 9.95초 일 수 있다. 본 문서의 일 실시예에 따른 PCM 오디오 데이터(예: 제1 PCM 오디오 데이터(925a), 제2 PCM 오디오 데이터(925b), 제3 PCM 오디오 데이터(925c), 제4 PCM 오디오 데이터(925d), 제5 PCM 오디오 데이터(925e), 제6 PCM 오디오 데이터(925f))의 그룹은 하나의 프레임(예: 제3 오디오 프레임(925))을 구성할 수 있고, 복수의 프레임들(예: 제1 오디오 프레임(905), 제2 오디오 프레임(915) 제3 오디오 프레임(925), 제1 오디오 프레임(935))의 그룹은 하나의 오디오 데이터를 구성할 수 있다.
본 문서의 일 실시예에 따른 전자 장치(예: 도 2의 프로세서(220))는, 동작 730에서, 오디오 데이터의 출력 시점과 선택된 오디오 프레임의 출력 시간을 비교할 수 있다. 예를 들면, 본 문서의 일 실시예에 따른 전자 장치(101)는, 지연 시간이 보상된 오디오 데이터의 출력 시점(예: 10초)과, 선택된 오디오 프레임(예: 제3 오디오 프레임(925))의 출력 시간(예: 9.95초)를 비교할 수 있다.
본 문서의 일 실시예에 따른 전자 장치(예: 도 2의 프로세서(220))는, 지연 시간이 보상된 오디오 데이터의 출력 시점이 선택된 오디오 프레임의 출력 시간보다 늦은 시점인 경우(동작 730-예)(예: 지연 시간이 보상된 오디오 데이터의 출력 시점은 10초 이고, 선택된 오디오 프레임의 출력 시간은 9.95초 인 경우), 동작 740에서, 선택된 오디오 프레임의 출력 시간과 선택된 오디오 프레임의 크기(또는, 길이)를 합산한 값을, 지연 시간이 보상된 오디오 데이터의 출력 시점과 비교할 수 있다. 예를 들면, 오디오 프레임의 크기가 100ms(샘플 레이트: 44.1KHz, 채널 수: 2) 인 경우, 본 문서의 일 실시예에 따르면, 선택된 오디오 프레임의 출력 시간과 선택된 오디오 프레임의 크기(또는, 길이)의 합이 10.05초(예: 9.95초 + 0.1초)이므로, 본 문서의 일 실시예에 따른 전자 장치(201)는, 지연 시간이 보상된 오디오 데이터의 출력 시점이 선택된 오디오 프레임의 출력 시간보다 빠른 시점이라고 판단할 수 있다.
본 문서의 일 실시예에 따른 전자 장치(예: 도 2의 프로세서(220))는, 지연 시간이 보상된 오디오 데이터의 출력 시점이 선택된 오디오 프레임의 출력 시간과 동일하거나 빠른 시점인 경우(동작 740-아니오), 동작 750에서, 오디오 데이터의 출력 시점과 선택된 오디오 프레임의 출력 시간의 차이를 연산하고, 연산된 결과에 대응하는 적어도 하나의 PCM(pulse code modulation) 오디오 데이터를 드롭하고, 드롭된 PCM 오디오 데이터를 제외한 나머지 PCM 오디오 데이터를 스피커 또는 외부 전자 장치로 전송할 수 있다. 본 문서의 일 실시예에 따르면, 오디오 데이터의 출력 시점과 선택된 오디오 프레임의 출력 시간의 차이는 50ms이고, 50ms에 대응하는 적어도 하나의 PCM 오디오 데이터의 크기(byte)는 아래의 수학식 4에 의하여 결정될 수 있다.
Figure PCTKR2021013134-appb-M000005
수학식 5에서, "비트 폭"은 오디오 데이터의 비트 폭을 의미할 수 있고, "채널 개수"는 출력 장치(예; 스피커)의 채널 개수를 의미할 수 있다. "시간 차이"는 오디오 데이터의 출력 시점과 선택된 오디오 프레임의 출력 시간의 차이를 의미할 수 있고, 본 문서의 일 실시예에 따르면, 시간 차이는 50ms 일 수 있다. "샘플링 레이트"는 오디오 데이터의 샘플링 레이트(예: 44.1KHz)일 수 있다. 도 7b 및 도 7c를 참조하면, 도 7b에 도시된 바와 같이 사용자의 오디오 데이터 출력 요청에 따라 프레임의 시작 시간이 9.95초인 오디오 프레임(예: 제3 오디오 프레임(925))이 선택될 수 있다. 이 경우, 상기 수학식에 의하여 연산된 적어도 하나의 PCM 오디오 데이터의 크기가 예를 들어 50ms에 대응하는 데이터 크기인 경우, 본 문서의 일 실시예에 따른 전자 장치(201)는, 도 7c에 도시된 바와 같이 선택된 오디오 프레임에서 50ms에 대응하는 PCM 데이터(945)를 드롭하고, 드롭된 PCM 데이터 이후의 데이터(955 및 제4 오디오 프레임(935))를 출력 장치(예: 스피커)로 전송할 수 있다. 본 문서의 일 실시예에 따른 전자 장치(예: 도 2의 프로세서(220))는, 지연 시간이 보상된 오디오 데이터의 출력 시점이 선택된 오디오 프레임의 출력 시간보다 늦은 시점인 경우(동작 740-예), 선택된 오디오 프레임을 드롭하고, 동작 720 및 동작 720 이후의 동작들을 재 수행할 수 있다.
본 문서의 일 실시예에 따른 전자 장치(예: 도 2의 프로세서(220))는, 지연 시간이 보상된 오디오 데이터의 출력 시점이 선택된 오디오 프레임의 출력 시간과 동일하거나 빠른 시점인 경우(동작 730-아니오)(예: 지연 시간이 보상된 오디오 데이터의 출력 시점: 10초, 선택된 오디오 프레임의 출력 시간: 10.05초), 동작 760에서, 지연 시간이 보상된 오디오 데이터의 출력 시점과 선택된 오디오 프레임의 출력 시간의 차이에 대응하는 PCM 데이터를 추가한 후, 출력 장치(예: 스피커)로 전송할 수 있다. 예를 들면, 본 문서의 일 실시예에 따른 전자 장치(201)는, 도 7d에 도시된 바와 같이, 지연 시간이 보상된 오디오 데이터의 출력 시점과 선택된 오디오 프레임의 출력 시간의 차이에 대응하는 PCM 데이터(예: 제1 PCM 오디오 데이터(925a), 제2 PCM 오디오 데이터(925b), 제3 PCM 오디오 데이터(925c), 제4 PCM 오디오 데이터(925d))를 선택된 오디오 프레임(예: 제4 오디오 프레임(935))의 앞 부분에 추가한 후, 지연 시간이 보상된 오디오 데이터의 출력 시점과 선택된 오디오 프레임의 출력 시간의 차이에 대응하는 PCM 데이터가 추가된 오디오 프레임들을 출력 장치로 전송할 수 있다. 이와 같은 동작을 통하여, 선택된 오디오 프레임의 시작 시간과 지연 시간이 보상된 오디오 데이터의 출력 시점이 상이한 경우에도, 지연 시간이 보상된 오디오 데이터의 출력 시점과 일치하는 오디오 데이터가 출력 장치로 전송될 수 있다.
도 8a 및 도 8b는, 다양한 실시예들에 따른 프로세서(220)에 포함되는 다양한 모듈들을 설명하기 위한 예시 도면이다.
도 8a를 참조하면, 본 문서의 일 실시예에 따른 프로세서(220)는, 플레이어 엔진(221), 비디오 생성 모듈(222a) 및 비디오 지연 관리 모듈(223a) 중 적어도 하나를 포함할 수 있다. 본 문서의 일 실시예에 따른 플레이어 엔진(221)은, 현재 전자 장치(201)에서 출력 중인 오디오 데이터에 대한 정보를 득할 수 있다. 본 문서의 일 실시예에 따른 플레이어 엔진(221)은, 획득된 오디오 데이터에 대한 정보를 비디오 생성 모듈(222a)로 전송할 수 있다. 본 문서의 일 실시예에 따른 플레이어 엔진(221)은, 비디오 지연 관리 모듈(223a)이 비디오 데이터의 시작 위치를 연산하도록 하는 요청을 비디오 지연 관리 모듈(223a)로 전송할 수 있다. 본 문서의 일 실시예에 따른 요청에는, 비디오 데이터의 폭과 높이, 디코더의 타입, 필터 정보 및 현재 출력 중인 오디오 데이터의 출력 시점에 대한 정보가 포함될 수 있다. 본 문서의 일 실시예에 따른 비디오 지연 관리 모듈(223a)은, 적어도 하나의 지연 시간(예: 제1 지연 시간, 제2 지연 시간, 제3 지연 시간 및 제4 지연 시간)을 연산할 수 있다. 본 문서의 일 실시예에 따른 비디오 지연 관리 모듈(223a)은, 현재 전자 장치(201)에서 재생 중인 시점(예: 비디오 데이터 출력 요청 이벤트가 검출된 시점)에서 가장 가까운 이전의 싱크 프레임(예: 제2 싱크 프레임(305b))의 시간을 획득하여 비디오 생성 모듈(222a) 로 전송할 수 있다. 본 문서의 일 실시예에 따른 비디오 지연 관리 모듈(223a)은, 연산된 적어도 하나의 지연 시간에 대한 정보를 플레이어 엔진(221)으로 전송할 수 있다. 본 문서의 일 실시예에 따른 플레이어 엔진(221)은, 비디오 지연 관리 모듈(223a)로부터 수신한 적어도 하나의 지연 시간에 대한 정보를 이용하여 비디오 데이터의 출력 시점을 결정할 수 있다. 본 문서의 일 실시예에 따른 플레이어 모듈(221)은, 결정된 비디오 데이터의 출력 시점에 대한 정보를 비디오 생성 모듈(222a)로 전송할 수 있다. 본 문서의 일 실시예에 따른 비디오 생성 모듈(222a)은, 플레이어 엔진(221)으로부터 수신한 비디오 데이터의 출력 시점에 대한 정보를 이용하여, 출력 시점에 대응하는 적어도 하나의 비디오 프레임을 디코딩한 후, 디코딩 된 비디오 데이터를 전자 장치(201) 또는 외부 전자 장치에서 출력할 수 있다.
도 8b를 참조하면, 본 문서의 일 실시예에 따른 프로세서(220)는, 플레이어 엔진(221), 오디오 생성 모듈(222b) 및 오디오 지연 관리 모듈(223b) 중 적어도 하나를 포함할 수 있다. 본 문서의 일 실시예에 따른 플레이어 엔진(221)은, 현재 전자 장치(201)에서 출력 중인 비디오 데이터에 대한 정보를 득할 수 있다. 본 문서의 일 실시예에 따른 플레이어 엔진(221)은, 획득된 비디오 데이터에 대한 정보를 오디오 생성 모듈(222b)로 전송할 수 있다. 본 문서의 일 실시예에 따른 플레이어 엔진(221)은, 오디오 지연 관리 모듈(223b)이 오디오 데이터의 시작 위치를 연산하도록 하는 요청을 오디오 지연 관리 모듈(223b)로 전송할 수 있다. 본 문서의 일 실시예에 따른 요청에는, 필터 정보 및 현재 출력 중인 비디오 데이터의 출력 시점에 대한 정보가 포함될 수 있다. 본 문서의 일 실시예에 따른 오디오 지연 관리 모듈(223b)은, 적어도 하나의 지연 시간(예: 제5 지연 시간 및 제6 지연 시간)을 연산할 수 있다. 본 문서의 일 실시예에 따른 오디오 지연 관리 모듈(223b)은, 연산된 적어도 하나의 지연 시간에 대한 정보를 플레이어 엔진(221)으로 전송할 수 있다. 본 문서의 일 실시예에 따른 플레이어 엔진(221)은, 오디오 지연 관리 모듈(223b)로부터 수신한 적어도 하나의 지연 시간에 대한 정보를 이용하여 오디오 데이터의 출력 시점을 결정할 수 있다. 본 문서의 일 실시예에 따른 플레이어 모듈(221)은, 결정된 오디오 데이터의 출력 시점에 대한 정보를 오디오 생성 모듈(222b)로 전송할 수 있다. 본 문서의 일 실시예에 따른 오디오 생성 모듈(222b)은, 플레이어 엔진(221)으로부터 수신한 오디오 데이터의 출력 시점에 대한 정보를 이용하여, 출력 시점에 대응하는 적어도 하나의 오디오 프레임을 디코딩한 후, 디코딩 된 오디오 데이터를 전자 장치(201) 또는 외부 전자 장치에서 출력할 수 있다. 본 문서의 일 실시예에 따른 오디오 데이터의 프레임(예: 제3 오디오 프레임(925))을 선택하는 기능 또는 동작은, 예를 들어 플레이어 엔진(221)에 의하여 수행될 수 있다.
본 문서의 일 실시예에 따른 전자 장치(201)는, 복수 개의 오디오 데이터가 각각 복수 개의 장치를 통해서 출력되는 경우에 비디오 데이터가 추가적으로 출력되는 경우, 각각의 장치에 대해서 상술한 지연 시간을 연산하여 비디오 데이터를 출력할 수 있다. 예를 들어, 오디오 데이터가 전자 장치(201) 및 외부 전자 장치(예: 전자 장치(201)의 화면을 미러링 중인 TV)를 통해 출력되는 경우, 전자 장치(201)는, 전자 장치(201)에 대한 제1 지연 시간, 제2 지연 시간, 제3 지연 시간 및 제4 지연 시간을 연산할 수 있고, 외부 전자 장치에 대한 제1 지연 시간, 제2 지연 시간, 제3 지연 시간 및 제4 지연 시간을 각각 연산할 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 연산된 각각의 지연 시간을 기반으로 각각의 장치에서 출력될 비디오 데이터의 출력 시점을 결정할 수 있다. 이 경우, 본 문서의 일 실시예에 따르면, 비디오 데이터를 외부 전자 장치로 전송하기 위해 요구되는 네트워크 지연 시간을 추가적으로 더 고려할 수 있다. 본 문서의 일 실시예에 따른 네트워크 지연 시간에 대한 정보는 매핑 테이블의 형식으로 전자 장치(201)에 미리 저장되어 있을 수 있다. 이와 같이, 본 문서의 일 실시예에 따르면, 복수의 장치들에 대해서 오디오 데이터 및/또는 비디오 데이터가 각각 출력되는 경우에도 각각의 장치에 대해서 지연 시간을 고려하여 오디오 데이터 및/또는 비디오 데이터를 출력함으로써, 끊김 없는 데이터의 출력이 가능할 수 있다.
도 8a 및 도 8b에서는, 오디오 데이터를 프로세싱 하는 경우와 비디오 데이터를 프로세싱 하는 경우가 구분되어 설명되었지만, 본 문서의 일 실시예에 따르면, 적어도 하나의 모듈은 서로 통합되어 구현될 수도 있다. 예를 들면, 비디오 생성 모듈(222a) 및 오디오 생성 모듈(222b)은 서로 통합되어 하나의 미디어 생성 모듈(미도시)로 구현될 수도 있다. 또한, 비디오 지연 관리 모듈(223a) 및 오디오 지연 관리 모듈(223b)은, 서로 통합되어 하나의 지연 관리 모듈(미도시)로 구현될 수도 있다. 본 문서의 일 실시예에 따른 비디오 지연 관리 모듈(223a)은, 비디오 데이터를 출력하기 위한 복수 개의 프로세스들과 관련된 정보를 식별(또는, 획득)할 수 있다. 본 문서의 일 실시예에 따른 복수 개의 프로세스들은, 예를 들면, 디코딩 프로세스, 필터링 프로세스, 및 출력 장치로의 비디오 전송 프로세스 중 적어도 하나의 프로세스를 포함할 수 있다. 본 문서의 일 실시예에 따른, 복수 개의 프로세스들과 관련된 정보는, 비디오 데이터를 출력하기 위한 복수 개의 프로세스들 각각에 의해 실제적으로 소요된 처리 시간에 대한 정보, 디코딩 프로세스에 적용된 디코더의 타입에 대한 정보, 필터링 프로세스(예: 비디오 데이터에 대한 후처리 효과를 적용하는 프로세스)에 적용된 필터의 타입에 대한 정보 및 출력 장치의 타입에 대한 정보, 및 비디오 데이터의 해상도와 같은, 비디오 데이터의 속성에 대한 정보를 포함할 수 있다.
본 문서의 일 실시예에 따른 비디오 지연 관리 모듈(223a)은, 획득된 정보가 전자 장치(201)에 저장되어 있는 정보인지 여부를 판단할 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 디코더의 타입, 비디오 필터의 타입 및 출력 장치의 타입이 전자 장치(201)에 저장되어 있는 정보인지 여부를 판단할 수 있다. 이를 위하여 본 문서의 일 실시예에 따른 비디오 지연 관리 모듈(223a)은 표 1 내지 표 3을 참조할 수 있다.
본 문서의 일 실시예에 따른 비디오 지연 관리 모듈(223a)은, 획득된 정보가 전자 장치(201)에 저장되어 있는 정보인 경우, 전자 장치(201)에 저장된 정보(예: 표 1 내지 표 3)를 업데이트 할 수 있다. 본 문서의 일 실시예에 따른 비디오 지연 관리 모듈(223a)은, 미리 저장되어 있는 지연 시간에 대한 정보와 비디오 데이터를 출력하기 위한 복수 개의 프로세스들 각각에 의해 실제적으로 소요된 처리 시간에 대한 정보의 평균 값을 연산함으로써 전자 장치(201)에 저장된 정보(예: 표 1 내지 표 3)를 업데이트 할 수 있다. 예를 들어, "객체 추적(Object Tracking)" 필터를 이용하여 비디오 데이터에 대한 필터링 프로세스를 수행한 경우, 전자 장치(201)에 미리 저장된 지연 시간이 50ms이고, 실제적으로 필터링 프로세스를 수행하기 위해 소요된 시간이 52ms인 경우, 비디오 지연 관리 모듈(223a)은, 50ms와 52ms의 평균 값인 51ms로 지연 시간(예: 제2 지연 시간)을 업데이트 할 수 있다. 이 경우, 비디오 지연 관리 모듈(223a)은, 실제적으로 필터링 프로세스를 수행하기 위해 소요된 시간(예: 52ms)가 미리 지정된 오차 범위 내에 포함되는 값인지 여부를 판단하는 동작을 더 수행할 수 있다. 본 문서의 일 실시예에 따른 비디오 지연 관리 모듈(223a)은, 실제적으로 필터링 프로세스를 수행하기 위해 소요된 시간(예: 52ms)가 미리 지정된 오차 범위 내에 포함되는 경우, 50ms와 52ms의 평균 값인 51ms로 지연 시간(예: 제2 지연 시간)을 업데이트 할 수 있다. 다만, 본 문서의 일 실시예에 따른 비디오 지연 관리 모듈(223a)은, 실제적으로 필터링 프로세스를 수행하기 위해 소요된 시간(예: 52ms)가 미리 지정된 오차 범위 내에 포함되지 않는 경우, 전자 장치(201)에 미리 저장된 지연 시간인 50ms를 유지할 수 있다. 본 문서의 일 실시예에 따르면, 비디오 지연 관리 모듈(223a)은, 다른 외부 전자 장치(예: 클라우드 서버)로부터 지연 시간에 대한 정보를 획득함으로써 전자 장치(201)에 저장된 정보(예: 표 1 내지 표 3)를 업데이트 할 수도 있다.
본 문서의 일 실시예에 따른 비디오 지연 관리 모듈(223a)은, 획득된 정보가 전자 장치(201)에 저장되어 있는 정보가 아닌 경우, 획득된 타입에 대한 정보 및 지연 시간에 대한 정보를 전자 장치(201)에 추가적으로 저장할 수 있다. 예를 들어, 표 2에 표현되어 있는 필터들 이외의 다른 필터를 이용하여 필터링 프로세스를 수행한 경우, 본 문서의 일 실시예에 따른 비디오 지연 관리 모듈(223a)은, 필터링 프로세스에서 이용된 비디오 필터의 타입 및 소요된 지연 시간을 표 2에 추가하는 방식으로 전자 장치(201)에 저장된 정보(예: 표 1 내지 표 3)를 업데이트 할 수 있다.
본 문서의 일 실시예에 따르면, 외부 전자 장치(예: AR 글래스 또는 머리 장착형 장치(HMD))가 전자 장치(201)와 동작 가능하도록 연결된 상태에서도 상술한 본 문서의 다양한 실시예들이 적용될 수 있다. 예를 들어, 측정되어야 하는 센서 정보(예: 오브젝트의 깊이 값, 호버링 높이 값 또는 모션 센서의 움직임 정도 값)를 처리하기 위하여 소요되는 지연 시간을 연산하고, 연산된 지연 시간에 기반하여 오디오 데이터 및/또는 비디오 데이터를 출력할 수 있다. 본 문서의 일 실시예에 따른, 센서 정보(예: 오브젝트의 깊이 값, 호버링 높이 값 또는 모션 센서의 움직임 정도 값)를 처리하기 위하여 소요되는 지연 시간에 대한 정보는 전자 장치(201)에 미리 저장되어 있을 수 있다. 또는, 예를 들어, 외부 전자 장치를 통해 비디오 데이터 또는 오디오 데이터를 출력하는 중에 센서 모듈의 동작이 오프되거나, 또는 사용자의 시선을 감지하지 못하는 상황(예: 사용자가 외부 전자 장치를 신체로부터 분리한 경우)이 발생된 후, 다시 센서 모듈이 온 상태로 전환되거나 사용자의 시선을 감지할 수 있는 상태로 전환되는 경우(예: 사용자가 다시 외부 전자 장치를 착용한 경우)에 본 문서의 다양한 실시예들이 적용될 수 있다. 이 경우, 비디오 데이터 또는 오디오 데이터를 출력하기 위한 이벤트는, 센서 모듈의 온 상태로의 전환 이벤트 또는 외부 전자 장치의 재 착용 감지 이벤트일 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201) 또는 외부 전자 장치는, 오디오 데이터가 전자 장치(201) 또는 외부 전자 장치를 통해 출력되는 동안에, 외부 전자 장치의 재 착용 감지 이벤트를 검출할 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 오디오 데이터가 출력 장치를 통해 출력되고 있는 시점을 식별하고, 비디오 데이터가 전자 장치(201) 또는 외부 전자 장치를 통해 출력될 시점을 연산할 수 있다. 본 문서의 일 실시예에 따른 전자 장치(201)는, 연산된 시점을 기반으로, 비디오 데이터가 전자 장치(201) 또는 외부 전자 장치를 통해 출력되도록 외부 전자 장치를 제어할 수 있다.
본 문서의 일 실시예에 따른 전자 장치는, 터치스크린 디스플레이(예: 도 2의 디스플레이 모듈(260)), 적어도 하나의 스피커(예: 도 2의 음향 출력 모듈(255), 적어도 하나의 프로세서(예: 도 2의 프로세서(220))를 포함하고, 상기 적어도 하나의 프로세서는, 상기 적어도 하나의 스피커를 통해 제1 미디어의 오디오 데이터를 출력하는 동안에, 상기 제1 미디어의 비디오 데이터를 출력하도록 하는 사용자 입력을 획득하고, 상기 획득된 사용자 입력에 기반하여, 상기 오디오 데이터가 상기 적어도 하나의 스피커를 통해 출력되고 있는 시점을 식별하고, 상기 비디오 데이터가 상기 터치스크린 디스플레이 또는 외부 전자 장치를 통해 출력될 시점을, 적어도 상기 식별된 시점을 기반으로 연산하고, 상기 연산된 시점을 기반으로, 상기 비디오 데이터를 상기 터치스크린 디스플레이 또는 상기 외부 전자 장치를 통해 출력되도록 상기 터치스크린 디스플레이 또는 상기 외부 전자 장치를 제어하도록 설정될 수 있다.
상기 적어도 하나의 프로세서는, 상기 비디오 데이터가 상기 터치스크린 디스플레이 또는 상기 외부 전자 장치를 통해 출력될 시점을 연산하기 위하여 제1 지연 시간을 결정하도록 더 설정되고, 상기 제1 지연 시간은, 상기 오디오 데이터가 상기 적어도 하나의 스피커를 통해 출력되고 있는 시점으로부터 가장 가까운 이전의 싱크 프레임(예: 제2 싱크 프레임(305b))의 위치에 대응하는 시간, 상기 비디오 데이터를 디코딩하기 위한 디코더의 최대 FPS(frame per second), 상기 비디오 데이터의 FPS, 및 상기 오디오 데이터가 상기 적어도 하나의 스피커를 통해 출력되고 있는 시점을 기반으로 결정될 수 있다.
상기 적어도 하나의 프로세서는, 상기 비디오 데이터가 상기 터치스크린 디스플레이 또는 상기 외부 전자 장치를 통해 출력될 시점을 연산하기 위하여 제2 지연 시간을 결정하도록 더 설정되고, 상기 제2 지연 시간은, 상기 비디오 데이터에 적용되는 적어도 하나의 비디오 필터의 지연 시간을 기반으로 결정될 수 있다.
상기 적어도 하나의 프로세서는, 상기 적어도 하나의 비디오 필터가 복수 개인 경우, 상기 복수 개의 비디오 필터들의 지연 시간들을 합산하여 상기 제2 지연 시간을 결정하도록 더 설정될 수 있다.
상기 적어도 하나의 프로세서는, 상기 비디오 데이터가 상기 터치스크린 디스플레이 또는 상기 외부 전자 장치를 통해 출력될 시점을 연산하기 위하여 제3 지연 시간을 결정하도록 더 설정되고, 상기 제3 지연 시간은, 상기 터치스크린 디스플레이 또는 상기 외부 전자 장치로부터 상기 비디오 데이터를 출력하기 위해 요구되는 비디오 데이터 전송 지연 시간을 포함할 수 있다.
상기 적어도 하나의 프로세서는, 상기 비디오 데이터가 상기 터치스크린 디스플레이 또는 상기 외부 전자 장치를 통해 출력될 시점을 연산하기 위하여 제4 지연 시간을 결정하도록 더 설정되고, 상기 제4 지연 시간은, 상기 제1 지연 시간, 상기 제2 지연 시간 및 상기 제3 지연 시간의 합과 상기 비디오 데이터의 FPS를 곱한 값을 상기 디코더의 최대 FPS로 나눈 값에 기반하여 결정될 수 있다.
상기 적어도 하나의 프로세서는, 상기 제1 지연 시간, 상기 제2 지연 시간, 상기 제3 지연 시간 및 상기 제4 지연 시간의 합과, 상기 오디오 데이터가 상기 적어도 하나의 스피커를 통해 출력되고 있는 시점의 합을, 상기 비디오 데이터가 상기 터치스크린 디스플레이 또는 상기 외부 전자 장치를 통해 출력될 시점으로 결정하도록 더 설정될 수 있다.
상기 전자 장치는, 상기 제1 지연 시간, 상기 제2 지연 시간, 상기 제3 지연 시간 및 상기 제4 지연 시간 중 적어도 하나의 지연 시간을 결정하기 위해 요구되는 정보 및 각각의 지연 시간을 미리 저장하도록 설정된 적어도 하나의 메모리를 더 포함하고, 상기 적어도 하나의 프로세서는, 상기 비디오 데이터를 출력하기 위한 복수 개의 프로세스들 각각에 의해 실제적으로 소요된 처리 시간에 대한 정보를 기반으로, 상기 적어도 하나의 메모리에 미리 저장된, 상기 각각의 지연 시간을 업데이트 하도록 더 설정될 수 있다.
상기 적어도 하나의 프로세서는, 상기 실제적으로 소요된 처리 시간과 상기 미리 저장된 각각의 지연 시간의 평균 값을 연산함으로써 상기 각각의 지연 시간을 업데이트 하도록 더 설정될 수 있다.
상기 적어도 하나의 프로세서는, 상기 복수 개의 프로세스들 각각에 사용된 비디오 코덱, 비디오 필터 및 상기 외부 전자 장치의 타입에 대한 정보를 획득하도록 더 설정될 수 있다.
상기 적어도 하나의 프로세서는, 상기 획득된 비디오 코덱, 비디오 필터 및 상기 외부 전자 장치의 타입에 대한 정보를 이용하여 상기 적어도 하나의 메모리에 저장된, 상기 요구되는 정보를 업데이트 하도록 더 설정될 수 있다.
본 문서의 일 실시예에 따른 전자 장치는, 터치스크린 디스플레이(예: 도 2의 디스플레이 모듈(260)), 적어도 하나의 스피커(예: 도 2의 음향 출력 모듈(255)), 적어도 하나의 프로세서(예: 도 2의 프로세서(220))를 포함하고, 상기 적어도 하나의 프로세서는, 상기 터치스크린 디스플레이를 통해 제1 미디어의 비디오 데이터를 출력하는 동안에, 상기 제1 미디어의 오디오 데이터를 출력하도록 하는 사용자 입력을 획득하고, 상기 획득된 사용자 입력에 기반하여, 상기 비디오 데이터가 상기 터치스크린 디스플레이를 통해 출력되고 있는 시점을 식별하고, 상기 오디오 데이터가 상기 적어도 하나의 스피커 또는 외부 전자 장치를 통해 출력될 시점을 연산하고, 상기 식별된 시점 및 상기 연산된 시점을 기반으로, 상기 비디오 데이터를 상기 터치스크린 디스플레이를 통해 출력하고, 상기 오디오 데이터를 상기 적어도 하나의 스피커 또는 상기 외부 전자 장치를 통해 출력되도록 상기 적어도 하나의 스피커 또는 상기 외부 전자 장치를 제어하도록 설정될 수 있다.
상기 적어도 하나의 프로세서는, 상기 오디오 데이터가 상기 적어도 하나의 스피커 또는 상기 외부 전자 장치를 통해 출력될 시점을 연산하기 위하여 제5 지연 시간을 결정하도록 더 설정되고,상기 제5 지연 시간은, 상기 오디오 데이터에 적용되는 오디오 필터의 지연 시간에 기반하여 결정될 수 있다.
상기 적어도 하나의 프로세서는, 상기 오디오 데이터가 상기 적어도 하나의 스피커 또는 상기 외부 전자 장치를 통해 출력될 시점을 연산하기 위하여 제6 지연 시간을 결정하도록 더 설정되고, 상기 제6 지연 시간은, 상기 적어도 하나의 스피커 또는 상기 외부 전자 장치가 상기 오디오 데이터를 출력하기 위해 요구되는 오디오 데이터 전송 지연 시간을 기반으로 결정될 수 있다.
상기 적어도 하나의 프로세서는, 상기 제5 지연 시간 및 상기 제6 지연 시간의 합과, 상기 비디오 데이터가 상기 터치스크린 디스플레이를 통해 출력되고 있는 시점의 합을, 상기 오디오 데이터가 상기 적어도 하나의 스피커 또는 외부 전자 장치를 통해 출력될 시점으로 결정하도록 더 설정될 수 있다.
상기 전자 장치는, 상기 제5 지연 시간 및 상기 제6 지연 시간 중 적어도 하나의 지연 시간을 결정하기 위해 요구되는 정보를 미리 저장하도록 설정된 적어도 하나의 메모리를 더 포함하고, 상기 적어도 하나의 프로세서는, 상기 적어도 하나의 메모리에 미리 저장된, 상기 요구되는 정보를 업데이트 하기 위해, 상기 결정된 지연 시간 중 적어도 하나의 지연 시간을 상기 적어도 하나의 메모리에 저장하도록 더 설정될 수 있다.
본 문서의 일 실시예에 따른 전자 장치는, 적어도 하나의 스피커(예: 도 2의 음향 출력 모듈(255)) 및 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는, 지연 시간(예: 제5 지연 시간 및 제6 지연 시간)에 기반하여 결정된, 제1 미디어의 오디오 데이터의 출력 시점을 식별하고, 상기 출력 시점에 대응하는, 상기 오디오 데이터의 프레임을 선택(예: 제1 오디오 프레임(905), 제2 오디오 프레임(915), 제3 오디오 프레임(925), 제4 오디오 프레임(935))하고, 상기 프레임은 복수 개의 PCM(pulse code modulation) 오디오 데이터(예: 제1 PCM 오디오 데이터(925a), 제2 PCM 오디오 데이터(925b), 제3 PCM 오디오 데이터(925c), 제4 PCM 오디오 데이터(925d), 제5 PCM 오디오 데이터(925e), 제6 PCM 오디오 데이터(925f))를 포함하고, 상기 출력 시점과 상기 선택된 프레임의 출력 시간을 비교한 제1 비교 결과를 획득하고, 상기 획득된 제1 비교 결과에 대한 응답으로, 상기 출력 시점이 상기 선택된 프레임의 출력 시간보다 늦은 시점인 경우, 상기 선택된 프레임의 출력 시간과 상기 프레임의 크기를 합산한 값과, 상기 출력 시점을 비교한 제2 비교 결과를 획득하고, 상기 획득된 제2 비교 결과에 대한 응답으로, 상기 출력 시점이 상기 선택된 프레임의 출력 시간과 상기 프레임의 크기를 합산한 값보다 늦은 시점인 경우, 상기 선택된 프레임을 드롭(drop)하고, 상기 획득된 제1 비교 결과에 대한 응답으로, 상기 출력 시점이 상기 선택된 프레임의 출력 시간과 동일하거나 빠른 시점인 경우, 상기 출력 시점과 상기 선택된 프레임의 출력 시간의 차이를 연산하고, 상기 복수 개의 PCM 오디오 데이터 중 상기 연산 결과에 대응하는 적어도 하나의 PCM 오디오 데이터를 드롭하고, 상기 복수 개의 PCM 오디오 데이터 중 상기 드롭된 PCM 오디오 데이터를 제외한 나머지 PCM 오디오 데이터를 상기 적어도 하나의 스피커 또는 외부 전자 장치로 전송하도록 설정될 수 있다.
상기 지연 시간은, 상기 오디오 데이터에 적용되는 오디오 필터의 지연 시간 및 상기 적어도 하나의 스피커 또는 외부 전자 장치가 상기 오디오 데이터를 출력하기 위해 요구되는 오디오 데이터 전송 지연 시간을 기반으로 결정될 수 있다.
상기 획득된 제2 비교 결과에 대한 응답으로, 상기 출력 시점이 상기 선택된 프레임의 출력 시간과 상기 프레임의 크기를 합산한 값과 동일하거나 빠른 시점인 경우, 상기 적어도 하나의 프로세서는, 상기 오디오 데이터의 샘플링 레이트, 상기 오디오 데이터의 비트 폭, 및 상기 적어도 하나의 스피커 또는 상기 외부 전자 장치의 채널 수에 기반하여 상기 드롭되는 적어도 하나의 PCM 데이터의 크기를 결정하도록 더 설정될 수 있다.
상기 획득된 제2 비교 결과에 대한 응답으로, 상기 출력 시점이 상기 선택된 프레임의 출력 시간과 상기 프레임의 크기를 합산한 값보다 늦은 시점인 경우, 상기 적어도 하나의 프로세서는, 상기 출력 시점에 대응하는, 상기 오디오 데이터의 프레임을 재 선택하도록 더 설정될 수 있다.
본 문서에 개시된 다양한 실시예들에 따른 전자 장치는 다양한 형태의 장치가 될 수 있다. 전자 장치는, 예를 들면, 휴대용 통신 장치(예: 스마트폰), 컴퓨터 장치, 휴대용 멀티미디어 장치, 휴대용 의료 기기, 카메라, 웨어러블 장치, 또는 가전 장치를 포함할 수 있다. 본 문서의 실시예에 따른 전자 장치는 전술한 기기들에 한정되지 않는다.
본 문서의 다양한 실시예들 및 이에 사용된 용어들은 본 문서에 기재된 기술적 특징들을 특정한 실시예들로 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 또는 관련된 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 아이템에 대응하는 명사의 단수 형은 관련된 문맥상 명백하게 다르게 지시하지 않는 한, 상기 아이템 한 개 또는 복수 개를 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및 B 중 적어도 하나", "A 또는 B 중 적어도 하나", "A, B 또는 C", "A, B 및 C 중 적어도 하나", 및 "A, B, 또는 C 중 적어도 하나"와 같은 문구들 각각은 그 문구들 중 해당하는 문구에 함께 나열된 항목들 중 어느 하나, 또는 그들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", 또는 "첫째" 또는 "둘째"와 같은 용어들은 단순히 해당 구성요소를 다른 해당 구성요소와 구분하기 위해 사용될 수 있으며, 해당 구성요소들을 다른 측면(예: 중요성 또는 순서)에서 한정하지 않는다. 어떤(예: 제 1) 구성요소가 다른(예: 제 2) 구성요소에, "기능적으로" 또는 "통신적으로"라는 용어와 함께 또는 이런 용어 없이, "커플드" 또는 "커넥티드"라고 언급된 경우, 그것은 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로(예: 유선으로), 무선으로, 또는 제 3 구성요소를 통하여 연결될 수 있다는 것을 의미한다.
본 문서의 다양한 실시예들에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구현된 유닛을 포함할 수 있으며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로와 같은 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는, 상기 부품의 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 일 실시예에 따르면, 모듈은 ASIC(application-specific integrated circuit)의 형태로 구현될 수 있다.
본 문서의 다양한 실시예들은 기기(machine)(예: 전자 장치(201)) 의해 읽을 수 있는 저장 매체(storage medium)(예: 내장 메모리(236) 또는 외장 메모리(238))에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어(예: 프로그램(240))로서 구현될 수 있다. 예를 들면, 기기(예: 전자 장치(201))의 프로세서(예: 프로세서(220))는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장 매체는, 비일시적(non-transitory) 저장 매체의 형태로 제공될 수 있다. 여기서, '비일시적'은 저장 매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장 매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.
일 실시예에 따르면, 본 문서에 문서된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory(CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두 개의 사용자 장치들(예: 스마트 폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.
다양한 실시예들에 따르면, 상기 기술한 구성요소들의 각각의 구성요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있으며, 복수의 개체 중 일부는 다른 구성요소에 분리 배치될 수도 있다. 다양한 실시예들에 따르면, 전술한 해당 구성요소들 중 하나 이상의 구성요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성요소들(예: 모듈 또는 프로그램)은 하나의 구성요소로 통합될 수 있다. 이런 경우, 통합된 구성요소는 상기 복수의 구성요소들 각각의 구성요소의 하나 이상의 기능들을 상기 통합 이전에 상기 복수의 구성요소들 중 해당 구성요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 상기 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.

Claims (15)

  1. 전자 장치에 있어서,
    터치스크린 디스플레이,
    적어도 하나의 스피커,
    적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는,
    상기 적어도 하나의 스피커를 통해 제1 미디어의 오디오 데이터를 출력하는 동안에, 상기 제1 미디어의 비디오 데이터를 출력하도록 하는 사용자 입력을 획득하고,
    상기 획득된 사용자 입력에 기반하여:
    상기 오디오 데이터가 상기 적어도 하나의 스피커를 통해 출력되고 있는 시점을 식별하고,
    상기 비디오 데이터가 상기 터치스크린 디스플레이 또는 외부 전자 장치를 통해 출력될 시점을, 적어도 상기 식별된 시점을 기반으로 연산된 지연 시간을 이용하여 결정하고,
    상기 결정된 시점에서, 상기 비디오 데이터를 상기 터치스크린 디스플레이 또는 상기 외부 전자 장치를 통해 출력되도록 상기 터치스크린 디스플레이 또는 상기 외부 전자 장치를 제어하도록 설정된 것을 특징으로 하는, 전자 장치.
  2. 제1항에 있어서,
    상기 적어도 하나의 프로세서는, 상기 비디오 데이터가 상기 터치스크린 디스플레이 또는 상기 외부 전자 장치를 통해 출력될 시점을 연산하기 위하여 상기 지연 시간에 포함되는 제1 지연 시간을 결정하도록 더 설정되고,
    상기 제1 지연 시간은, 상기 오디오 데이터가 상기 적어도 하나의 스피커를 통해 출력되고 있는 시점으로부터 가장 가까운 이전의 싱크 프레임의 위치에 대응하는 시간, 상기 비디오 데이터를 디코딩하기 위한 디코더의 최대 FPS(frame per second), 상기 비디오 데이터의 FPS, 및 상기 오디오 데이터가 상기 적어도 하나의 스피커를 통해 출력되고 있는 시점을 기반으로 결정되는 것을 특징으로 하는, 전자 장치.
  3. 제2항에 있어서,
    상기 적어도 하나의 프로세서는, 상기 비디오 데이터가 상기 터치스크린 디스플레이 또는 상기 외부 전자 장치를 통해 출력될 시점을 연산하기 위하여 상기 지연 시간에 포함되는 제2 지연 시간을 결정하도록 더 설정되고,
    상기 제2 지연 시간은, 상기 비디오 데이터에 적용되는 적어도 하나의 비디오 필터의 지연 시간을 기반으로 결정되는 것을 특징으로 하는, 전자 장치.
  4. 제3항에 있어서,
    상기 적어도 하나의 프로세서는, 상기 적어도 하나의 비디오 필터가 복수 개인 경우, 상기 복수 개의 비디오 필터들의 지연 시간들을 합산하여 상기 제2 지연 시간을 결정하도록 더 설정된 것을 특징으로 하는, 전자 장치.
  5. 제4항에 있어서,
    상기 적어도 하나의 프로세서는, 상기 비디오 데이터가 상기 터치스크린 디스플레이 또는 상기 외부 전자 장치를 통해 출력될 시점을 연산하기 위하여 상기 지연 시간에 포함되는 제3 지연 시간을 결정하도록 더 설정되고,
    상기 제3 지연 시간은, 상기 터치스크린 디스플레이 또는 상기 외부 전자 장치로부터 상기 비디오 데이터를 출력하기 위해 요구되는 비디오 데이터 전송 지연 시간을 포함하는 것을 특징으로 하는, 전자 장치.
  6. 제5항에 있어서,
    상기 적어도 하나의 프로세서는, 상기 비디오 데이터가 상기 터치스크린 디스플레이 또는 상기 외부 전자 장치를 통해 출력될 시점을 연산하기 위하여 상기 지연 시간에 포함되는 제4 지연 시간을 결정하도록 더 설정되고,
    상기 제4 지연 시간은, 상기 제1 지연 시간, 상기 제2 지연 시간 및 상기 제3 지연 시간의 합과 상기 비디오 데이터의 FPS를 곱한 값을 상기 디코더의 최대 FPS로 나눈 값에 기반하여 결정되는 것을 특징으로 하는, 전자 장치.
  7. 제6항에 있어서,
    상기 적어도 하나의 프로세서는, 상기 제1 지연 시간, 상기 제2 지연 시간, 상기 제3 지연 시간 및 상기 제4 지연 시간의 합과, 상기 오디오 데이터가 상기 적어도 하나의 스피커를 통해 출력되고 있는 시점의 합을, 상기 비디오 데이터가 상기 터치스크린 디스플레이 또는 상기 외부 전자 장치를 통해 출력될 시점으로 결정하도록 더 설정된 것을 특징으로 하는, 전자 장치.
  8. 제6항에 있어서,
    상기 전자 장치는, 상기 제1 지연 시간, 상기 제2 지연 시간, 상기 제3 지연 시간 및 상기 제4 지연 시간 중 적어도 하나의 지연 시간을 결정하기 위해 요구되는 정보 및 각각의 지연 시간을 미리 저장하도록 설정된 적어도 하나의 메모리를 더 포함하고,
    상기 적어도 하나의 프로세서는, 상기 비디오 데이터를 출력하기 위한 복수 개의 프로세스들 각각에 의해 실제적으로 소요된 처리 시간에 대한 정보를 기반으로, 상기 적어도 하나의 메모리에 미리 저장된, 상기 각각의 지연 시간을 업데이트 하도록 더 설정된 것을 특징으로 하는, 전자 장치.
  9. 제8항에 있어서,
    상기 적어도 하나의 프로세서는, 상기 실제적으로 소요된 처리 시간과 상기 미리 저장된 각각의 지연 시간의 평균 값을 연산함으로써 상기 각각의 지연 시간을 업데이트 하도록 더 설정된 것을 특징으로 하는, 전자 장치.
  10. 제8항에 있어서,
    상기 적어도 하나의 프로세서는, 상기 복수 개의 프로세스들 각각에 사용된 비디오 코덱, 비디오 필터 및 상기 외부 전자 장치의 타입에 대한 정보를 획득하도록 더 설정된 것을 특징으로 하는, 전자 장치.
  11. 제10항에 있어서,
    상기 적어도 하나의 프로세서는, 상기 획득된 비디오 코덱, 비디오 필터 및 상기 외부 전자 장치의 타입에 대한 정보를 이용하여 상기 적어도 하나의 메모리에 저장된, 상기 요구되는 정보를 업데이트 하도록 더 설정된 것을 특징으로 하는, 전자 장치.
  12. 전자 장치에 있어서,
    적어도 하나의 스피커,
    적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는,
    지연 시간에 기반하여 결정된, 제1 미디어의 오디오 데이터의 출력 시점을 식별하고,
    상기 출력 시점에 대응하는, 상기 오디오 데이터의 프레임을 선택하고, 상기 프레임은 복수 개의 PCM(pulse code modulation) 오디오 데이터를 포함하고,
    상기 출력 시점과 상기 선택된 프레임의 출력 시간을 비교한 제1 비교 결과를 획득하고,
    상기 획득된 제1 비교 결과에 대한 응답으로, 상기 출력 시점이 상기 선택된 프레임의 출력 시간보다 늦은 시점인 경우:
    상기 선택된 프레임의 출력 시간과 상기 프레임의 크기를 합산한 값과, 상기 출력 시점을 비교한 제2 비교 결과를 획득하고,
    상기 획득된 제2 비교 결과에 대한 응답으로, 상기 출력 시점이 상기 선택된 프레임의 출력 시간과 상기 프레임의 크기를 합산한 값보다 늦은 시점인 경우, 상기 선택된 프레임을 드롭(drop)하고,
    상기 획득된 제1 비교 결과에 대한 응답으로, 상기 출력 시점이 상기 선택된 프레임의 출력 시간과 동일하거나 빠른 시점인 경우:
    상기 출력 시점과 상기 선택된 프레임의 출력 시간의 차이를 연산하고,
    상기 복수 개의 PCM 오디오 데이터 중 상기 연산 결과에 대응하는 적어도 하나의 PCM 오디오 데이터를 드롭하고, 상기 복수 개의 PCM 오디오 데이터 중 상기 드롭된 PCM 오디오 데이터를 제외한 나머지 PCM 오디오 데이터를 상기 적어도 하나의 스피커 또는 외부 전자 장치로 전송하도록 설정된 것을 특징으로 하는, 전자 장치.
  13. 제12항에 있어서,
    상기 지연 시간은, 상기 오디오 데이터에 적용되는 오디오 필터의 지연 시간 및 상기 적어도 하나의 스피커 또는 외부 전자 장치가 상기 오디오 데이터를 출력하기 위해 요구되는 오디오 데이터 전송 지연 시간을 기반으로 결정되는 것을 특징으로 하는, 전자 장치.
  14. 제12항에 있어서,
    상기 획득된 제2 비교 결과에 대한 응답으로, 상기 출력 시점이 상기 선택된 프레임의 출력 시간과 상기 프레임의 크기를 합산한 값과 동일하거나 빠른 시점인 경우, 상기 적어도 하나의 프로세서는, 상기 오디오 데이터의 샘플링 레이트, 상기 오디오 데이터의 비트 폭, 및 상기 적어도 하나의 스피커 또는 상기 외부 전자 장치의 채널 수에 기반하여 상기 드롭되는 적어도 하나의 PCM 데이터의 크기를 결정하도록 더 설정된 것을 특징으로 하는, 전자 장치.
  15. 제12항에 있어서,
    상기 획득된 제2 비교 결과에 대한 응답으로, 상기 출력 시점이 상기 선택된 프레임의 출력 시간과 상기 프레임의 크기를 합산한 값보다 늦은 시점인 경우, 상기 적어도 하나의 프로세서는, 상기 출력 시점에 대응하는, 상기 오디오 데이터의 프레임을 재 선택하도록 더 설정된 것을 특징으로 하는, 전자 장치.
PCT/KR2021/013134 2020-09-28 2021-09-27 비디오 데이터와 오디오 데이터의 동기화를 수행하는 전자 장치 및 그 제어 방법 WO2022065952A2 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US18/190,981 US20230232063A1 (en) 2020-09-28 2023-03-28 Electronic device for performing synchronization of video data and audio data, and control method therefor

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020200126272A KR20220042893A (ko) 2020-09-28 2020-09-28 비디오 데이터와 오디오 데이터의 동기화를 수행하는 전자 장치 및 그 제어 방법
KR10-2020-0126272 2020-09-28

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US18/190,981 Continuation US20230232063A1 (en) 2020-09-28 2023-03-28 Electronic device for performing synchronization of video data and audio data, and control method therefor

Publications (2)

Publication Number Publication Date
WO2022065952A2 true WO2022065952A2 (ko) 2022-03-31
WO2022065952A3 WO2022065952A3 (ko) 2022-05-19

Family

ID=80846786

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2021/013134 WO2022065952A2 (ko) 2020-09-28 2021-09-27 비디오 데이터와 오디오 데이터의 동기화를 수행하는 전자 장치 및 그 제어 방법

Country Status (3)

Country Link
US (1) US20230232063A1 (ko)
KR (1) KR20220042893A (ko)
WO (1) WO2022065952A2 (ko)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2356817B1 (en) * 2008-12-08 2017-04-12 Telefonaktiebolaget LM Ericsson (publ) Device and method for synchronizing received audio data with video data
KR20130087678A (ko) * 2012-01-30 2013-08-07 오픈스택 주식회사 Tv셋에서 출력되는 영상과 스피커에서 출력되는 오디오 신호의 싱크조절장치 및 방법
KR102140612B1 (ko) * 2013-09-13 2020-08-11 삼성전자주식회사 오디오 신호의 출력을 지연시키는 a/v 수신 장치 및 그 방법, 그리고, a/v 신호 처리 시스템
KR101942269B1 (ko) * 2017-01-20 2019-01-25 한화테크윈 주식회사 웹 브라우저에서 미디어를 재생하고 탐색하는 장치 및 방법
JP7004627B2 (ja) * 2018-09-18 2022-01-21 三菱電機株式会社 映像音声再生システム、映像表示装置及び映像表示方法

Also Published As

Publication number Publication date
WO2022065952A3 (ko) 2022-05-19
KR20220042893A (ko) 2022-04-05
US20230232063A1 (en) 2023-07-20

Similar Documents

Publication Publication Date Title
WO2021075786A1 (en) Electronic device and method of processing pop-up window using multi-window thereof
WO2021145727A1 (en) Electronic device and screen refresh method thereof
WO2022065952A2 (ko) 비디오 데이터와 오디오 데이터의 동기화를 수행하는 전자 장치 및 그 제어 방법
WO2022225188A1 (ko) 스캔 듀티에 기반한 백 오프 처리 방법 및 장치
WO2022177299A1 (ko) 통화 기능의 제어 방법 및 이를 지원하는 전자 장치
WO2022092580A1 (ko) 전자 장치 표면의 온도를 예측하는 방법 및 그 전자 장치
WO2022169092A1 (ko) 전자 장치 및 그 제어 방법
WO2021235856A1 (ko) 멀티미디어 콘텐츠를 제공하는 방법 및 그 전자 장치
WO2022114648A1 (ko) 배경 화면을 설정하기 위한 전자 장치 및 그의 동작 방법
WO2022103156A1 (ko) 플렉서블 디스플레이를 포함하는 전자 장치 및 이를 이용하는 방법
WO2023022356A1 (ko) 디스플레이 패널을 제어하는 커맨드들을 처리하는 타이밍을 동기화하기 위한 전자 장치 및 방법
WO2024029688A1 (ko) 무선 환경 내에서의 오디오 스트리밍을 위한 전자 장치, 방법, 및 비일시적 컴퓨터 판독가능 저장 매체
WO2023214675A1 (ko) 터치 입력을 처리하기 위한 전자 장치 및 방법
WO2023287057A1 (ko) 주변 장치로부터 입력을 수신하였을 때 화면을 빠르게 업데이트하는 전자 장치
WO2024072057A1 (ko) 터치 회로로부터의 신호에 기반하여 이미지의 표시를 스케줄링하는 전자 장치 및 방법
WO2023158151A1 (ko) 전자 장치 및 전자 장치에서 객체를 디스플레이하는 방법
WO2024072056A1 (ko) 프로세서로부터 디스플레이로의 펄스 신호를 제어하는 전자 장치
WO2022086253A1 (ko) 이미지 표시 방법 및 이를 지원하는 웨어러블 전자 장치
WO2024019359A1 (ko) 컨텐츠를 표시하는 전자 장치 및 그 동작 방법
WO2022025692A1 (ko) 입력 기반 스트리밍 제어 방법 및 이를 위한 전자 장치
WO2024034784A1 (ko) 다른 전자 장치의 어드버타이징 프로세스와 동기화된 어드버타이징 프로세스를 수행하는 전자 장치, 방법, 및 비일시적 컴퓨터 판독가능 저장 매체
WO2024072053A1 (ko) 디스플레이 내의 메모리를 제어하는 전자 장치 및 방법
WO2022025457A1 (ko) 이미지를 처리하기 위한 전자 장치 및 그의 동작 방법
WO2022191451A1 (ko) 운동 영상의 속도를 제어하는 전자 장치 및 이의 제어 방법
WO2022250246A1 (ko) 움직이는 객체에 대한 효과를 이미지에 적용하는 전자 장치 및 그 작동 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21872980

Country of ref document: EP

Kind code of ref document: A2

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21872980

Country of ref document: EP

Kind code of ref document: A2