WO2023013865A1 - 전자 장치 및 전자 장치의 멀티미디어 재생 방법 - Google Patents

전자 장치 및 전자 장치의 멀티미디어 재생 방법 Download PDF

Info

Publication number
WO2023013865A1
WO2023013865A1 PCT/KR2022/007627 KR2022007627W WO2023013865A1 WO 2023013865 A1 WO2023013865 A1 WO 2023013865A1 KR 2022007627 W KR2022007627 W KR 2022007627W WO 2023013865 A1 WO2023013865 A1 WO 2023013865A1
Authority
WO
WIPO (PCT)
Prior art keywords
audio
data
time
main processor
time information
Prior art date
Application number
PCT/KR2022/007627
Other languages
English (en)
French (fr)
Inventor
허진
최근하
김원기
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Priority to EP22853245.3A priority Critical patent/EP4322536A1/en
Priority to US17/838,850 priority patent/US11843818B2/en
Publication of WO2023013865A1 publication Critical patent/WO2023013865A1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8547Content authoring involving timestamps for synchronizing content

Definitions

  • Various embodiments disclosed in this document relate to an electronic device, and, for example, to a method for maintaining synchronization between image data and audio data included in video data reproduced by the electronic device.
  • An electronic device can reproduce multimedia contents such as images and videos including audio.
  • Multimedia content may be stored, transmitted, and/or reproduced in the form of data included in various media containers.
  • a single media container can include data in various formats to compose multimedia content.
  • Types of data included in the media container may include, for example, some of metadata, image (video) data, audio data, and text data.
  • the electronic device separates coded data in the same media container into different types (e.g., image data and audio data), and uses different components (e.g., main processor and auxiliary processor) for each type of separated data to decode it. and playback (hereinafter referred to as an offloading playback method).
  • different types of data can be simultaneously processed by different components, the processing time required for playing multimedia can be reduced.
  • an offload playback method it may be difficult to maintain sync for each type of data since data is reproduced in different components.
  • An electronic device includes at least one auxiliary processor and a main processor operatively connected to the at least one auxiliary processor, wherein the main processor obtains video data;
  • the video data is divided into image data including a plurality of continuous image frames, first audio data including a plurality of continuous audio frames, and a plurality of timestamps corresponding to each of the plurality of continuous audio frames; generates second audio data by adding header data to each of the plurality of audio frames using the first audio data, transmits the second audio data to the at least one auxiliary processor, and generating second time information based on first time information successively received from one auxiliary processor and reproducing the image data based on the second time information, wherein the at least one auxiliary processor is configured to: An audio signal may be reproduced based on the received second audio data, and the first time information regarding the reproduction time of the audio signal may be generated based on the header data.
  • a method of reproducing video data that may include at least one auxiliary processor includes image data including a plurality of continuous image frames, a plurality of continuous audio data, and the like. Separating first audio data including a frame into a plurality of time stamps corresponding to each of the plurality of consecutive audio frames, and header data (header data) for each of the plurality of audio frames using the first audio data. ) to generate second audio data, transmitting the second audio data to the at least one auxiliary processor, and generating second audio data based on the first time information continuously received from the at least one auxiliary processor. An operation of generating time information and an operation of reproducing the image data based on the second time information may be included.
  • An electronic device includes a communication module communicatively connected to an external electronic device, and a processor operatively connected to the communication module, the processor comprising: When video data is reproduced, the video data is divided into image data including a plurality of continuous image frames and first audio data including a plurality of continuous audio frames, and the first audio data is encoded by the AAC method. Audio frame, it is checked whether the external electronic device supports ADTS format data, and if the external electronic device supports ADTS format data, header data is added to each of the plurality of audio frames. generating second audio data, transmitting the second audio data to the external electronic device, generating second time information based on first time information received from the external electronic device, and generating the second time information It can be set to reproduce the image data based on.
  • synchronization between images and audio may be maintained.
  • FIG. 1 is a block diagram of an electronic device in a network environment, according to various embodiments.
  • FIG. 2 is a block diagram of an electronic device according to various embodiments.
  • FIG. 3 is a block diagram of a configuration used for reproducing video data according to various embodiments.
  • FIG. 4 illustrates a process of processing each frame in an embodiment of offloading and reproducing audio by generating header data.
  • 5A and 5B illustrate a process of obtaining a first time using header data in an embodiment of offloading and reproducing audio by generating header data.
  • FIG. 6 is a flowchart illustrating an operation in which an electronic device reproduces video data according to various embodiments of the present disclosure.
  • FIG. 7 is a flowchart illustrating an operation in which an electronic device reproduces video data including audio data encoded in an AAC scheme according to various embodiments of the present disclosure.
  • FIG 8 illustrates an embodiment in which a time jump occurs.
  • FIG. 9 illustrates a process of reproducing video data in an embodiment in which a time jump occurs.
  • FIG. 10 is a flowchart illustrating an operation in which an electronic device reproduces video data in which a time jump occurs, according to various embodiments of the present disclosure.
  • 11 is a signal transmission diagram when an electronic device reproduces video data in which a time jump occurs, according to various embodiments.
  • FIG. 12 is a flowchart illustrating an operation when an electronic device performs offloading playback using an external electronic device according to various embodiments of the present disclosure.
  • FIG. 1 is a block diagram of an electronic device 101 within a network environment 100, according to various embodiments.
  • an electronic device 101 communicates with an electronic device 102 through a first network 198 (eg, a short-range wireless communication network) or through a second network 199. It may communicate with at least one of the electronic device 104 or the server 108 through (eg, a long-distance wireless communication network). According to one embodiment, the electronic device 101 may communicate with the electronic device 104 through the server 108 .
  • a first network 198 eg, a short-range wireless communication network
  • the server 108 e.g, a long-distance wireless communication network
  • the electronic device 101 includes a processor 120, a memory 130, an input module 150, an audio output module 155, a display module 160, an audio module 170, a sensor module ( 176), interface 177, connection terminal 178, haptic module 179, camera module 180, power management module 188, battery 189, communication module 190, subscriber identification module 196 , or the antenna module 197 may be included.
  • at least one of these components eg, the connection terminal 178) may be omitted or one or more other components may be added.
  • some of these components eg, sensor module 176, camera module 180, or antenna module 197) are integrated into a single component (eg, display module 160). It can be.
  • the processor 120 for example, executes software (eg, the program 140) to cause at least one other component (eg, hardware or software component) of the electronic device 101 connected to the processor 120. It can control and perform various data processing or calculations. According to one embodiment, as at least part of data processing or operation, the processor 120 transfers instructions or data received from other components (e.g., sensor module 176 or communication module 190) to volatile memory 132. , processing commands or data stored in the volatile memory 132 , and storing resultant data in the non-volatile memory 134 .
  • software eg, the program 140
  • the processor 120 transfers instructions or data received from other components (e.g., sensor module 176 or communication module 190) to volatile memory 132. , processing commands or data stored in the volatile memory 132 , and storing resultant data in the non-volatile memory 134 .
  • the processor 120 may include a main processor 121 (eg, a central processing unit or an application processor) or a secondary processor 123 (eg, a graphic processing unit, a neural network processing unit ( NPU: neural processing unit (NPU), image signal processor, sensor hub processor, or communication processor).
  • a main processor 121 eg, a central processing unit or an application processor
  • a secondary processor 123 eg, a graphic processing unit, a neural network processing unit ( NPU: neural processing unit (NPU), image signal processor, sensor hub processor, or communication processor.
  • NPU neural network processing unit
  • the secondary processor 123 may be implemented separately from or as part of the main processor 121 .
  • the secondary processor 123 may, for example, take the place of the main processor 121 while the main processor 121 is in an inactive (eg, sleep) state, or the main processor 121 is active (eg, running an application). ) state, together with the main processor 121, at least one of the components of the electronic device 101 (eg, the display module 160, the sensor module 176, or the communication module 190) It is possible to control at least some of the related functions or states.
  • the auxiliary processor 123 eg, image signal processor or communication processor
  • the auxiliary processor 123 may include a hardware structure specialized for processing an artificial intelligence model.
  • AI models can be created through machine learning. Such learning may be performed, for example, in the electronic device 101 itself where the artificial intelligence model is performed, or may be performed through a separate server (eg, the server 108).
  • the learning algorithm may include, for example, supervised learning, unsupervised learning, semi-supervised learning or reinforcement learning, but in the above example Not limited.
  • the artificial intelligence model may include a plurality of artificial neural network layers.
  • Artificial neural networks include deep neural networks (DNNs), convolutional neural networks (CNNs), recurrent neural networks (RNNs), restricted boltzmann machines (RBMs), deep belief networks (DBNs), bidirectional recurrent deep neural networks (BRDNNs), It may be one of deep Q-networks or a combination of two or more of the foregoing, but is not limited to the foregoing examples.
  • the artificial intelligence model may include, in addition or alternatively, software structures in addition to hardware structures.
  • the memory 130 may store various data used by at least one component (eg, the processor 120 or the sensor module 176) of the electronic device 101 .
  • the data may include, for example, input data or output data for software (eg, program 140) and commands related thereto.
  • the memory 130 may include volatile memory 132 or non-volatile memory 134 .
  • the program 140 may be stored as software in the memory 130 and may include, for example, an operating system 142 , middleware 144 , or an application 146 .
  • the input module 150 may receive a command or data to be used by a component (eg, the processor 120) of the electronic device 101 from the outside of the electronic device 101 (eg, a user).
  • the input module 150 may include, for example, a microphone, a mouse, a keyboard, a key (eg, a button), or a digital pen (eg, a stylus pen).
  • the sound output module 155 may output sound signals to the outside of the electronic device 101 .
  • the sound output module 155 may include, for example, a speaker or a receiver.
  • the speaker can be used for general purposes such as multimedia playback or recording playback.
  • a receiver may be used to receive an incoming call. According to one embodiment, the receiver may be implemented separately from the speaker or as part of it.
  • the display module 160 may visually provide information to the outside of the electronic device 101 (eg, a user).
  • the display module 160 may include, for example, a display, a hologram device, or a projector and a control circuit for controlling the device.
  • the display module 160 may include a touch sensor set to detect a touch or a pressure sensor set to measure the intensity of force generated by the touch.
  • the audio module 170 may convert sound into an electrical signal or vice versa. According to one embodiment, the audio module 170 acquires sound through the input module 150, the sound output module 155, or an external electronic device connected directly or wirelessly to the electronic device 101 (eg: Sound may be output through the electronic device 102 (eg, a speaker or a headphone).
  • the audio module 170 acquires sound through the input module 150, the sound output module 155, or an external electronic device connected directly or wirelessly to the electronic device 101 (eg: Sound may be output through the electronic device 102 (eg, a speaker or a headphone).
  • the sensor module 176 detects an operating state (eg, power or temperature) of the electronic device 101 or an external environmental state (eg, a user state), and generates an electrical signal or data value corresponding to the detected state. can do.
  • the sensor module 176 may include, for example, a gesture sensor, a gyro sensor, an air pressure sensor, a magnetic sensor, an acceleration sensor, a grip sensor, a proximity sensor, a color sensor, an IR (infrared) sensor, a bio sensor, It may include a temperature sensor, humidity sensor, or light sensor.
  • the interface 177 may support one or more designated protocols that may be used to directly or wirelessly connect the electronic device 101 to an external electronic device (eg, the electronic device 102).
  • the interface 177 may include, for example, a high definition multimedia interface (HDMI), a universal serial bus (USB) interface, an SD card interface, or an audio interface.
  • HDMI high definition multimedia interface
  • USB universal serial bus
  • SD card interface Secure Digital Card interface
  • audio interface audio interface
  • connection terminal 178 may include a connector through which the electronic device 101 may be physically connected to an external electronic device (eg, the electronic device 102).
  • the connection terminal 178 may include, for example, an HDMI connector, a USB connector, an SD card connector, or an audio connector (eg, a headphone connector).
  • the haptic module 179 may convert electrical signals into mechanical stimuli (eg, vibration or motion) or electrical stimuli that a user may perceive through tactile or kinesthetic senses.
  • the haptic module 179 may include, for example, a motor, a piezoelectric element, or an electrical stimulation device.
  • the camera module 180 may capture still images and moving images. According to one embodiment, the camera module 180 may include one or more lenses, image sensors, image signal processors, or flashes.
  • the power management module 188 may manage power supplied to the electronic device 101 .
  • the power management module 188 may be implemented as at least part of a power management integrated circuit (PMIC), for example.
  • PMIC power management integrated circuit
  • the battery 189 may supply power to at least one component of the electronic device 101 .
  • the battery 189 may include, for example, a non-rechargeable primary cell, a rechargeable secondary cell, or a fuel cell.
  • the communication module 190 is a direct (eg, wired) communication channel or a wireless communication channel between the electronic device 101 and an external electronic device (eg, the electronic device 102, the electronic device 104, or the server 108). Establishment and communication through the established communication channel may be supported.
  • the communication module 190 may include one or more communication processors that operate independently of the processor 120 (eg, an application processor) and support direct (eg, wired) communication or wireless communication.
  • the communication module 190 is a wireless communication module 192 (eg, a cellular communication module, a short-range wireless communication module, or a global navigation satellite system (GNSS) communication module) or a wired communication module 194 (eg, : a local area network (LAN) communication module or a power line communication module).
  • a wireless communication module 192 eg, a cellular communication module, a short-range wireless communication module, or a global navigation satellite system (GNSS) communication module
  • GNSS global navigation satellite system
  • wired communication module 194 eg, : a local area network (LAN) communication module or a power line communication module.
  • a corresponding communication module is a first network 198 (eg, a short-range communication network such as Bluetooth, wireless fidelity (WiFi) direct, or infrared data association (IrDA)) or a second network 199 (eg, legacy It may communicate with the external electronic device 104 through a cellular network, a 5G network, a next-generation communication network, the Internet, or a telecommunications network such as a computer network (eg, a LAN or a WAN).
  • a telecommunications network such as a computer network (eg, a LAN or a WAN).
  • These various types of communication modules may be integrated as one component (eg, a single chip) or implemented as a plurality of separate components (eg, multiple chips).
  • the wireless communication module 192 uses subscriber information (eg, International Mobile Subscriber Identifier (IMSI)) stored in the subscriber identification module 196 within a communication network such as the first network 198 or the second network 199.
  • subscriber information eg, International Mobile Subscriber Identifier (IMSI)
  • IMSI International Mobile Subscriber Identifier
  • the electronic device 101 may be identified or authenticated.
  • the wireless communication module 192 may support a 5G network after a 4G network and a next-generation communication technology, for example, NR access technology (new radio access technology).
  • NR access technologies include high-speed transmission of high-capacity data (enhanced mobile broadband (eMBB)), minimization of terminal power and access of multiple terminals (massive machine type communications (mMTC)), or high reliability and low latency (ultra-reliable and low latency (URLLC)).
  • eMBB enhanced mobile broadband
  • mMTC massive machine type communications
  • URLLC ultra-reliable and low latency
  • -latency communications can be supported.
  • the wireless communication module 192 may support a high frequency band (eg, mmWave band) to achieve a high data rate, for example.
  • the wireless communication module 192 uses various technologies for securing performance in a high frequency band, such as beamforming, massive multiple-input and multiple-output (MIMO), and full-dimensional multiplexing. Technologies such as input/output (FD-MIMO: full dimensional MIMO), array antenna, analog beam-forming, or large scale antenna may be supported.
  • the wireless communication module 192 may support various requirements defined for the electronic device 101, an external electronic device (eg, the electronic device 104), or a network system (eg, the second network 199).
  • the wireless communication module 192 is a peak data rate for eMBB realization (eg, 20 Gbps or more), a loss coverage for mMTC realization (eg, 164 dB or less), or a U-plane latency for URLLC realization (eg, Example: downlink (DL) and uplink (UL) each of 0.5 ms or less, or round trip 1 ms or less) may be supported.
  • eMBB peak data rate for eMBB realization
  • a loss coverage for mMTC realization eg, 164 dB or less
  • U-plane latency for URLLC realization eg, Example: downlink (DL) and uplink (UL) each of 0.5 ms or less, or round trip 1 ms or less
  • the antenna module 197 may transmit or receive signals or power to the outside (eg, an external electronic device).
  • the antenna module 197 may include an antenna including a radiator including a conductor or a conductive pattern formed on a substrate (eg, PCB).
  • the antenna module 197 may include a plurality of antennas (eg, an array antenna). In this case, at least one antenna suitable for a communication method used in a communication network such as the first network 198 or the second network 199 is selected from the plurality of antennas by the communication module 190, for example. can be chosen A signal or power may be transmitted or received between the communication module 190 and an external electronic device through the selected at least one antenna.
  • other components eg, a radio frequency integrated circuit (RFIC) may be additionally formed as a part of the antenna module 197 in addition to the radiator.
  • RFIC radio frequency integrated circuit
  • the antenna module 197 may form a mmWave antenna module.
  • the mmWave antenna module includes a printed circuit board, an RFIC disposed on or adjacent to a first surface (eg, a lower surface) of the printed circuit board and capable of supporting a designated high frequency band (eg, mmWave band); and a plurality of antennas (eg, array antennas) disposed on or adjacent to a second surface (eg, a top surface or a side surface) of the printed circuit board and capable of transmitting or receiving signals of the designated high frequency band. can do.
  • peripheral devices eg, a bus, general purpose input and output (GPIO), serial peripheral interface (SPI), or mobile industry processor interface (MIPI)
  • signal e.g. commands or data
  • commands or data may be transmitted or received between the electronic device 101 and the external electronic device 104 through the server 108 connected to the second network 199 .
  • Each of the external electronic devices 102 or 104 may be the same as or different from the electronic device 101 .
  • all or part of operations executed in the electronic device 101 may be executed in one or more external electronic devices among the external electronic devices 102 , 104 , or 108 .
  • the electronic device 101 when the electronic device 101 needs to perform a certain function or service automatically or in response to a request from a user or another device, the electronic device 101 instead of executing the function or service by itself.
  • one or more external electronic devices may be requested to perform the function or at least part of the service.
  • One or more external electronic devices receiving the request may execute at least a part of the requested function or service or an additional function or service related to the request, and deliver the execution result to the electronic device 101 .
  • the electronic device 101 may provide the result as at least part of a response to the request as it is or additionally processed.
  • cloud computing distributed computing, mobile edge computing (MEC), or client-server computing technology may be used.
  • the electronic device 101 may provide an ultra-low latency service using, for example, distributed computing or mobile edge computing.
  • the external electronic device 104 may include an internet of things (IoT) device.
  • Server 108 may be an intelligent server using machine learning and/or neural networks. According to one embodiment, the external electronic device 104 or server 108 may be included in the second network 199 .
  • the electronic device 101 may be applied to intelligent services (eg, smart home, smart city, smart car, or health care) based on 5G communication technology and IoT-related technology.
  • FIG. 2 is a block diagram of an electronic device according to various embodiments.
  • the electronic device 101 may include a main processor 121, an offloading module 200, and an output module 210, and in some embodiments, some of the illustrated components may be omitted or replaced. may be
  • the electronic device 101 may further include at least some of the configurations and/or functions of the electronic device 101 of FIG. 1 . At least some of the components of the illustrated (or not illustrated) electronic device 101 may be operatively, functionally, and/or electrically connected to each other.
  • the output module 210 may include an output circuit and output multimedia content to the outside of the electronic device 101 .
  • Multimedia content may include, for example, a sound signal and a visual signal.
  • the output module 210 may output, for example, an audio signal to the outside.
  • the output module 210 may output an image to the outside.
  • the output module 210 may include at least some of the configurations and/or functions of the audio output module 155, the display module 160, and the audio module 170 of FIG. 1 .
  • the offloading module 200 may include various circuit configurations for reproducing multimedia data received from the main processor 121 .
  • the offloading module 200 may receive audio data from the main processor 121 and process the received audio data.
  • the audio data received by the offloading module 200 may be data in an encoded state.
  • the offloading module 200 may decode received audio data.
  • the offloading module 200 may externally output a sound signal based on the decoded audio data using the output module 210 .
  • the offloading module 200 may include an auxiliary processor 123 .
  • the auxiliary processor 123 may include, for example, a digital signal processor (DSP).
  • DSP digital signal processor
  • the offloading module 200 may transmit or receive data related to reproduction of audio data to or from the main processor 121 .
  • the auxiliary processor 200 may generate data (eg, first time information) related to audio reproduction time and receive a request related to the first time information from the main processor 121 .
  • the auxiliary processor 200 may transmit the first time information to the main processor 121.
  • the main processor 121 is a component capable of performing calculations or data processing related to control and/or communication of each component of the electronic device 101, and may include one or more processors. .
  • the main processor 121 may include at least some of the components and/or functions of the processor 120 of FIG. 1 .
  • arithmetic and data processing functions that the main processor 121 can implement on the electronic device 101 will not be limited, but hereinafter, when the electronic device 101 plays video data, the offloading module 200 ), various embodiments related to an operation of reproducing audio data in an offload reproduction method will be described.
  • contents related to reproduction of video data among multimedia data by the electronic device 101 will be described, but various embodiments may be applied to various types of multimedia data in addition to video data.
  • the main processor 121 may obtain video data.
  • Video data may include one or more image data and audio data.
  • the main processor 121 receives streaming data from an external electronic device (eg, the electronic devices 102 and 104 or the server 108 of FIG. 1), and video data included in the received streaming data. can be obtained.
  • the main processor 121 may acquire video data by reading data stored in a memory (eg, the memory 130 of FIG. 1 ).
  • the main processor 121 may obtain image data and first audio data.
  • the main processor 121 de-multiplexes (de-MUXing) the acquired video data to obtain image data, audio data (eg, first audio data) and audio data included in the video data. It can be separated by the timestamp corresponding to .
  • image data and audio data (eg, first audio data) obtained by demultiplexing by the main processor 121 may be encoded data.
  • image data may include a plurality of coded image frames.
  • a plurality of image frames may include images consecutive to each other.
  • the first audio data may include a plurality of encoded audio frames.
  • a plurality of audio frames may include sound signals consecutive to each other.
  • the first audio data may include a plurality of consecutive audio frames encoded by an advanced audio coding (AAC) scheme.
  • the timestamp may include a plurality of data corresponding to each of a plurality of frames included in the audio data, and may be data including time information corresponding to each of the audio frames.
  • the main processor 121 may generate second audio data and transmit the generated second audio data to the offloading module 200 . According to one embodiment, the main processor 121 may not transmit a timestamp to the offloading module 200 .
  • the main processor 121 may generate second audio data based on first audio data obtained from video data. The second audio data may be obtained by adding header data to the first audio data.
  • the header data may include meta data corresponding to the first audio data.
  • the main processor 121 may generate a plurality of header data corresponding to each of a plurality of audio frames included in the first audio data.
  • the plurality of header data may include metadata for each of the plurality of audio frames, for example, information about the length and sampling frequency of the audio frame.
  • the header data may include data in an audio data transport stream (ADTS) format.
  • the main processor 121 may generate ADTS format header data when the first audio data includes an audio frame encoded by the AAC method.
  • the main processor 121 may generate second audio data by adding generated header data to the first audio data.
  • the main processor 121 may check whether image data is simultaneously reproduced with an audio signal.
  • the main processor 121 may generate second audio data by adding header data when confirming that the image data is reproduced simultaneously with the audio signal.
  • the main processor 121 may check whether the first audio data is data encoded using the AAC method.
  • the main processor 121 may read the obtained encoding information of the first audio data and check whether an audio frame encoded by the AAC method is included. For example, the main processor 121 may check whether the first audio data includes an audio frame encoded by the AAC method based on information obtained by parsing the header information.
  • the main processor 121 may check whether the offloading module 200 supports ADTS format data. For example, the main processor 121 may check whether the offloading module 200 can read, decode, and reproduce ADTS format data based on the audio playback related signal received from the offloading module 200. . For another example, the main processor 121 may check whether the offloading module 200 supports ADTS format data based on information previously stored in a memory (eg, the memory 130 of FIG. 1 ). .
  • the main processor 121 may receive first time information from the offloading module 200 .
  • the first time information may be time information generated by the offloading module 200 by decoding a plurality of audio frames included in the second audio data.
  • the first time information may be, for example, time information for the offloading module 200 to reproduce each audio frame.
  • the first time information may be time information generated by the offloading module 200 based on header data.
  • the offloading module 200 may generate first time information based on information about an audio frame length included in header data.
  • the main processor 121 may reproduce image data based on the first time.
  • the main processor 121 may decode a plurality of image frames included in image data and output them to the outside using a display module (eg, the display module 160 of FIG. 1 ).
  • the main processor 121 may reproduce image data based on the first time information in order to reproduce each of a plurality of image frames simultaneously with an audio frame corresponding to a corresponding sync.
  • the main processor 121 may generate second time information based on the first time information and reproduce image data based on the generated second time information.
  • the second time information may include, for example, time information obtained by adding the first time information to a preset reference time.
  • the reference time may be a preset and stored value, and the main processor 121 may change the reference time.
  • the main processor 121 may check whether a time jump has occurred.
  • a time jump may be understood as an event in which an interval between timestamps corresponding to each of a plurality of audio frames is not constant.
  • the first audio data may include a plurality of consecutive audio frames
  • the timestamp may include a plurality of data corresponding to each of the plurality of audio frames.
  • the time stamp may include time information corresponding to each audio frame.
  • the main processor 121 determines a difference between timestamps (eg, a first timestamp and a second timestamp) corresponding to consecutive audio frames (eg, a first audio frame and a second audio frame).
  • the time jump threshold may be calculated based on an audio frame length and a frame sampling frequency value. For example, a value obtained by dividing the audio frame length by the sampling frequency may have the same value as a constant difference value of consecutive timestamps within an error range.
  • the main processor 121 may set a predetermined value as a time jump threshold. According to an embodiment, the main processor 121 may determine that a time jump has occurred when a difference between two consecutive timestamps is greater than a time jump threshold.
  • the length of the audio frame, the sampling frequency of the audio frame, and the size of the corresponding time jump threshold may have various values, but in this document, for convenience, each sample size is 1024 bytes and the sampling frequency is 44100 Hz, that is, the time jump threshold The description will be limited to the case of 0.023 seconds (23 ms).
  • the main processor 121 may stop transmitting an audio frame to the offloading module 200 when a time jump occurs. For example, when a time jump is confirmed between two consecutive audio frames, that is, a first audio frame and a second audio frame, the main processor 121 transmits up to the first audio frame to the offloading module 200. After that, transmission of the second audio frame may be stopped. In this case, the difference between the first timestamp and the second timestamp may exceed the time jump threshold, and the second audio frame corresponding to the second timestamp is referred to as an 'audio frame in which time jump occurs'. It can be.
  • the main processor 121 may receive reproduction completion information from the offloading module 200 .
  • the offloading module 200 may generate reproduction completion information when all audio frames received from the main processor 121 are decoded, and transmit the generated reproduction completion information to the main processor 121.
  • the main processor 121 may transmit a signal for stopping audio playback to the offloading module 200 after stopping transmission of the second audio frame.
  • the reproduction completion information may be a signal generated by the offloading module 200 in response to a signal for stopping audio reproduction.
  • the main processor 121 may change the reference time.
  • the main processor 121 may change the reference time based on a timestamp (eg, second timestamp) value corresponding to an audio frame in which a time jump occurs.
  • the reference time may be in a state in which an initial value is set to 0, or may be a value that has already been changed from an initial value.
  • the main processor 121 may change the reference time based on the second timestamp value. For example, the main processor 121 may change the reference time by adding the second timestamp value at which the time jump occurs to the reference time.
  • the main processor 121 may resume transmission of audio frames. After changing the reference time, the main processor 121 may transmit the audio frame to the offloading module 200 again. According to an embodiment, the main processor 121 adds the first time information generated and transmitted by the offloading module 200 based on the received audio frame to the changed reference time to generate second time information. there is. The main processor 121 may reproduce image data based on the generated second time information.
  • FIG. 3 is a block diagram of a configuration used for reproducing video data according to various embodiments.
  • the de-MUXer demultiplexes the video data acquired by the main processor 121 and separates them into audio data, image data, and timestamps corresponding to the audio data. can do.
  • video data may include both audio data and image data, and these data may be transmitted to the demuxer 301 in a multiplexing (MUXing) state.
  • the demuxer 301 may transmit image data acquired as a result of demultiplexing to the video decoder 302 and audio data to the offloading controller 303 respectively.
  • the offloading controller 303 may convert received audio data.
  • audio data eg, first audio data
  • received by the offloading controller 303 from the demuxer 301 may include a plurality of audio frames.
  • the offloading controller 303 adds a plurality of header data corresponding to each of the audio frames included in the first audio data to generate second audio data including the plurality of header data and audio frames. can do.
  • the offloading controller 303 may check whether the image data and the audio signal are simultaneously reproduced. The offloading controller 303 may generate second audio data by adding header data when confirming that the image data is reproduced simultaneously with the audio signal.
  • the offloading controller 303 may generate second audio data and transmit the generated second audio data to the audio decoder 304 .
  • the offloading controller 303 may generate second audio data based on the first audio data received from the demuxer 301 .
  • the second audio data may be obtained by adding header data to the first audio data.
  • the header data may include meta data corresponding to the first audio data.
  • the offloading controller 303 may generate a plurality of header data corresponding to each of a plurality of audio frames included in the first audio data.
  • the plurality of header data may include metadata for each of the plurality of audio frames, for example, information about the length and sampling frequency of the audio frame.
  • the header data may include data in an audio data transport stream (ADTS) format.
  • the offloading controller 303 may generate ADTS format header data when the first audio data includes an audio frame encoded by the AAC method.
  • the offloading controller 303 may generate second audio data by adding generated header data to the first audio data.
  • the offloading controller 303 may check whether the first audio data is data encoded using the AAC method. For example, the offloading controller 303 may read the obtained encoding information of the first audio data and check whether an audio frame encoded by the AAC method is included. For example, the offloading controller 303 may check whether the first audio data includes an audio frame encoded by the AAC method through information obtained by parsing the header information in the demuxer 301 .
  • the offloading controller 303 may check whether the audio decoder 304 supports ADTS format data. For example, the offloading controller 303 may check whether the audio decoder 304 can read, decode, and reproduce ADTS format data based on the audio playback related signal received from the audio decoder 304 . For another example, the offloading controller 303 may determine whether the audio decoder 304 supports ADTS format data based on information previously stored in a memory (eg, the memory 130 of FIG. 1 ). .
  • the offloading controller 303 may transfer information about whether a time jump event has occurred to the media clock 306 .
  • the offloading controller 303 may receive a plurality of timestamps corresponding to each audio frame from the demuxer 301 .
  • the offloading controller 303 may check whether a time jump has occurred.
  • a time jump may be understood as an event in which an interval between timestamps corresponding to each of a plurality of audio frames is not constant.
  • the time stamp may include time information corresponding to each audio frame.
  • the offloading controller 303 is configured to provide an interval between timestamps (eg, a first timestamp and a second timestamp) corresponding to consecutive audio frames (eg, a first audio frame and a second audio frame). Whether a time jump has occurred may be confirmed based on a comparison between the difference value and the time jump threshold.
  • the time jump threshold may be calculated based on an audio frame length and a frame sampling frequency value. For example, a value obtained by dividing the audio frame length by the sampling frequency may have the same value as a constant difference value of consecutive timestamps within an error range.
  • the offloading controller 303 may set a predetermined value as a time jump threshold.
  • the offloading controller 303 may determine that a time jump has occurred when a difference between two consecutive timestamps is greater than a time jump threshold. According to an embodiment, the offloading controller 303 may stop transmitting the second audio data to the audio decoder 304 when a time jump occurs. When a time jump occurs, the offloading controller 303 may transmit information about whether a time jump has occurred to the media clock 306 . After the media clock 306 changes the reference time based on the occurrence of the time jump, the offloading controller 303 may resume transmission of audio frames to the audio decoder 304 .
  • the audio decoder 304 may decode the second audio data received from the offloading controller 303 .
  • the audio data received by the audio decoder 304 from the offloading controller 303 may include a plurality of audio frames, and each audio frame may be data encoded in a predetermined manner.
  • the audio decoder 304 may decode and convert a plurality of encoded audio frames into a plurality of decoded audio frames based on a coding scheme.
  • the audio decoder 304 may deliver the decoded audio frame to the output module 210 .
  • the play time information controller 305 may update play time information based on header data included in the second audio data.
  • the header data may include information about the lengths of a plurality of audio frames, and the audio reproduction time may be calculated according to the sampling frequency when each audio frame is reproduced using the output module 210 .
  • the reproduction time information controller 305 may generate first time information related to audio reproduction in response to reproduction of each audio frame.
  • the playback time information controller 305 may periodically and/or continuously update the first time information to the media clock 306 .
  • the media clock 306 may create and change time information (eg, second time information) related to image data reproduction for video reproduction.
  • the second time information may be time information referred to for reproducing a plurality of image frames.
  • the media clock 306 may transfer second time information to the video renderer 307 .
  • the second time information may have a value obtained by adding the first time information to the reference time.
  • the first time information may be time information received from the playback time information controller 305 .
  • the first time information may be time information related to reproduction of audio data.
  • the play time information controller 305 may transmit first time information generated while playing a plurality of audio frames, and the media clock 306 may transmit the first time information from the play time information controller 305.
  • Information may be received periodically and/or continuously.
  • the media clock 306 may change the reference time.
  • the media clock 306 may change the reference time based on a timestamp (eg, second timestamp) value corresponding to an audio frame in which a time jump occurs.
  • the reference time may be in a state in which an initial value is set to 0, or may be a value that has already been changed from an initial value.
  • the media clock 306 may change the reference time based on the second timestamp value.
  • the media clock 306 may change the reference time by adding the second timestamp value at which the time jump occurs to the reference time.
  • the media clock 306 may generate second time information by adding the first time to the changed reference time.
  • the video decoder 302 may receive image data from the demuxer 301 .
  • the image data received by the video decoder 302 from the demuxer 301 may include a plurality of image frames, and each image frame may be data encoded in a predetermined manner. there is.
  • the video decoder 302 may decode a plurality of encoded image frames based on a coding method and convert them into a plurality of decoded image frames.
  • the video decoder 302 may transmit the decoded image frame to the video renderer 307 .
  • the video renderer 307 may perform a rendering operation of image data processed on the output module 210 .
  • the video renderer 307 may generate an image to be output frame by frame based on the decoded image frame received from the video decoder 302 and transmit a command to display the generated image to the output module 210. there is.
  • the video renderer 307 may receive information (eg, second time information) related to image output time from the media clock 306 .
  • the video renderer 307 may output an image frame based on the received second time information.
  • the output module 210 may output multimedia content to the outside of the electronic device 101 .
  • the output module 210 may externally output the image frame received from the video renderer 307 based on the second time using a display module (eg, the display module 160 of FIG. 1 ).
  • the output module 210 may externally output the image frame received from the audio decoder 304 using an audio output module (eg, the audio output module 155 of FIG. 1 ).
  • FIG. 4 illustrates a process of processing each frame in an embodiment of offloading and reproducing audio by generating header data.
  • a de-MUXer demultiplexes video data obtained by the main processor 121 to convert audio data, image data, and a timestamp.
  • video data may include both audio data and image data, and these data may be transmitted to the demuxer 301 in a multiplexing (MUXing) state.
  • the demuxer 301 may transfer audio data obtained as a result of demultiplexing to the offloading controller 303 respectively. Audio data acquired by the demuxer 301 (eg, first audio data 410) Audio frames (eg, first frame 411 and second frame 412)
  • the offloading controller 303 may convert the received first audio data 410 .
  • the audio data (eg, the first audio data 410) received by the offloading controller 303 from the demuxer 301 includes a plurality of audio frames (eg, the first audio frame 411 and A second audio frame 412) may be included.
  • the offloading controller 303 provides a plurality of audio frames corresponding to each of the audio frames included in the first audio data 410 (eg, the first audio frame 411 and the second audio frame 412).
  • header data eg. first header data 421 and second header data 422
  • a plurality of header data eg. first header data 421 and second header data 422
  • audio Second audio data 420 including frames eg, first audio frame 411 and second audio frame 412
  • the offloading controller 303 may transmit the generated second audio data 420 to the offloading module 200 .
  • the header data 421 and 422 may include meta data corresponding to the first audio data 410 .
  • the offloading controller 303 corresponds to each of a plurality of audio frames included in the first audio data 410 (eg, the first audio frame 411 and the second audio frame 412).
  • a plurality of header data (eg, first header data 421 and second header data 422 ) may be generated.
  • the plurality of header data (eg, the first header data 421 and the second header data 422) are for each of the plurality of audio frames (eg, the first audio frame 411 and the second audio frame 412).
  • Meta data for example, information about the length and sampling frequency of an audio frame.
  • the header data may include data in an audio data transport stream (ADTS) format.
  • the offloading controller 303 may generate ADTS format header data when the first audio data 410 includes an audio frame encoded by the AAC method.
  • the offloading controller 303 may generate second audio data 420 by adding generated header data to the first audio data 410 .
  • 5A and 5B illustrate a process of obtaining a first time using header data in an embodiment of offloading and reproducing audio by generating header data.
  • the length of an audio frame, the sampling frequency of an audio frame, and the size of the corresponding time jump threshold may have various values, but in this document, for convenience, the size of each audio frame is 1024 bytes and the sampling frequency is 44100 Hz, that is, the case where the playback time per audio frame is 0.023 seconds (23 ms) will be described.
  • first audio data 510 in which some audio frames (eg, a second audio frame 512, a third audio frame 513, and a fourth audio frame 514) are damaged is obtained.
  • some audio frames eg, a second audio frame 512, a third audio frame 513, and a fourth audio frame 514.
  • the offloading module eg, the offloading module 200 of FIG. 2
  • the abnormal first time information 520 generated by the offloading module 200 includes a total of five frames (eg, the first audio frame 511, the second audio frame 512, and the third audio frame 513). , the 4th audio frame 514 and the 5th audio frame 515), despite the progress of playback, two normal audio frames (e.g., the 1st audio frame 514 and the 5th audio frame 515) Only the playback time for , can be calculated as 46 ms. In this case, when the main processor (eg, the main processor 121 of FIG. 2 ) generates second time information based on the abnormal first time 520 and reproduces an image frame corresponding to the second time, Sound and image may not be in sync.
  • the main processor eg, the main processor 121 of FIG. 2
  • Sound and image may not be in sync.
  • the second audio data 530 is a plurality of audio frames (eg, a first audio frame 511, a second audio frame 512, a third audio frame 513, a fourth audio frame ( 514) and the fifth audio frame 515) and header data corresponding to the respective audio frames (eg, first header data 531, second header data 532, third header data 533, 4 header data 534 and 5 header data 535).
  • the main processor 121 may generate second audio data 530 and transmit the generated second audio data 530 to the offloading module 200 .
  • the main processor 121 may generate second audio data 530 based on first audio data 510 obtained from video data.
  • the header data may include meta data corresponding to the first audio data.
  • the main processor 121 may generate a plurality of header data corresponding to each of a plurality of audio frames included in the first audio data.
  • the plurality of header data may include metadata for each of the plurality of audio frames, for example, information about the length and sampling frequency of the audio frame.
  • the header data may include data in an audio data transport stream (ADTS) format.
  • the main processor 121 may generate ADTS format header data when the first audio data 510 includes an audio frame encoded by the AAC method.
  • the main processor 121 may generate the second audio data 530 by adding generated header data to the first audio data 510 .
  • the main processor 121 may receive first time information from the offloading module 200 .
  • the first time information may be time information generated by the offloading module 200 by decoding a plurality of audio frames included in the second audio data.
  • the first time information may be, for example, time information for the offloading module 200 to reproduce each audio frame.
  • the first time information may be time information generated by the offloading module 200 based on header data.
  • the offloading module 200 may generate first time information based on information about an audio frame length included in header data. Therefore, referring to FIG.
  • header data eg, first header data
  • Time information can be created.
  • FIG. 6 is a flowchart illustrating an operation in which an electronic device reproduces video data according to various embodiments of the present disclosure.
  • FIG. 6 a series of operations in which an electronic device (eg, the electronic device 101 of FIG. 2 ) reproduces video data is performed by a main processor of the electronic device 101 (eg, the main processor 121 of FIG. 2 ). ) can be described as each operation of Each operation of FIG. 6 to be described below may be partially omitted, replaced with another operation, or a new operation may be added, and the order may be changed.
  • the main processor 121 may obtain video data.
  • Video data may include one or more image data and audio data.
  • the main processor 121 receives streaming data from an external electronic device (eg, the electronic devices 102 and 104 or the server 108 of FIG. 1), and video data included in the received streaming data. can be obtained.
  • the main processor 121 may acquire video data by reading data stored in a memory (eg, the memory 130 of FIG. 1 ).
  • the main processor 121 may obtain image data and first audio data.
  • the main processor 121 de-multiplexes (de-MUXing) the acquired video data to obtain image data, audio data (eg, first audio data) and audio data included in the video data. It can be separated by the timestamp corresponding to .
  • image data and audio data (eg, first audio data) obtained by demultiplexing by the main processor 121 may be encoded data.
  • image data may include a plurality of coded image frames.
  • a plurality of image frames may include images consecutive to each other.
  • the first audio data may include a plurality of encoded audio frames.
  • a plurality of audio frames may include sound signals consecutive to each other.
  • the first audio data may include a plurality of consecutive audio frames encoded by an advanced audio coding (AAC) scheme.
  • AAC advanced audio coding
  • the main processor 121 may generate second audio data and transmit the generated second audio data to the offloading module 200 .
  • the main processor 121 may generate second audio data based on first audio data obtained from video data.
  • the second audio data may be obtained by adding header data to the first audio data.
  • the header data may include meta data corresponding to the first audio data.
  • the main processor 121 may generate a plurality of header data corresponding to each of a plurality of audio frames included in the first audio data.
  • the plurality of header data may include metadata for each of the plurality of audio frames, for example, information about the length and sampling frequency of the audio frame.
  • the header data may include data in an audio data transport stream (ADTS) format.
  • ADTS audio data transport stream
  • the main processor 121 may generate ADTS format header data when the first audio data includes an audio frame encoded by the AAC method. According to an embodiment, the main processor 121 may generate second audio data by adding generated header data to the first audio data. According to an embodiment, the main processor 121 may check whether image data is simultaneously reproduced with an audio signal. The main processor 121 may generate second audio data by adding header data when confirming that the image data is reproduced simultaneously with the audio signal.
  • the main processor 121 may receive first time information from the offloading module 200 .
  • the first time information may be time information generated by the offloading module 200 by decoding a plurality of audio frames included in the second audio data.
  • the first time information may be, for example, time information for the offloading module 200 to reproduce each audio frame.
  • the first time information may be time information generated by the offloading module 200 based on header data.
  • the offloading module 200 may generate first time information based on information about an audio frame length included in header data.
  • the main processor 121 may continuously and/or periodically receive first time information from the offloading module 200 .
  • the main processor 121 may generate second time information based on the first time information.
  • the second time information may refer to time information used by the main processor 121 to reproduce image data.
  • the second time information may include, for example, time information obtained by adding the first time information to a preset reference time.
  • the reference time may be a preset and stored value, and the main processor 121 may change the reference time.
  • the main processor 121 may generate second time information by adding first time information to a reference time.
  • the main processor 121 may reproduce image data based on the second time.
  • the main processor 121 may decode a plurality of image frames included in image data and output them to the outside using a display module (eg, the display module 160 of FIG. 1 ).
  • the main processor 121 may reproduce image data based on the second time information in order to reproduce each of a plurality of image frames simultaneously with an audio frame corresponding to a corresponding sync.
  • FIG. 7 is a flowchart illustrating an operation in which an electronic device reproduces video data including audio data encoded in an AAC scheme according to various embodiments of the present disclosure.
  • FIG. 7 a series of operations in which an electronic device (eg, the electronic device 101 of FIG. 2 ) reproduces video data including audio data encoded by the AAC method is performed by a main processor of the electronic device 101 ( Example: Each operation of the main processor 121 of FIG. 2 may be described. Each operation of FIG. 7 to be described below may be partially omitted, replaced with another operation, or a new operation may be added, and the order may be changed.
  • an electronic device eg, the electronic device 101 of FIG. 2
  • Each operation of FIG. 7 to be described below may be partially omitted, replaced with another operation, or a new operation may be added, and the order may be changed.
  • the main processor 121 may check whether the first audio data is data encoded using the AAC method.
  • the main processor 121 may read the obtained encoding information of the first audio data and check whether an audio frame encoded by the AAC method is included. For example, the main processor 121 may check whether the first audio data includes an audio frame encoded by the AAC method based on information obtained by parsing the header information.
  • the main processor 121 may check whether the offloading module 200 supports ADTS format data. For example, the main processor 121 may check whether the offloading module 200 can read, decode, and reproduce ADTS format data based on the audio playback related signal received from the offloading module 200. . For another example, the main processor 121 may check whether the offloading module 200 supports ADTS format data based on information previously stored in a memory (eg, the memory 130 of FIG. 1 ). . Based on whether the offloading module 200 supports ADTS format data, the main processor 121 may proceed to operation 704 if the ADTS format data is supported, and otherwise terminate the playback operation.
  • a memory eg, the memory 130 of FIG. 1
  • the main data 121 may add header data to the first audio data.
  • the main processor 121 may generate second audio data and transmit the generated second audio data to the offloading module 200 .
  • the main processor 121 may generate second audio data based on first audio data obtained from video data.
  • the second audio data may be obtained by adding header data to the first audio data.
  • the header data may include meta data corresponding to the first audio data.
  • the main processor 121 may generate a plurality of header data corresponding to each of a plurality of audio frames included in the first audio data.
  • the plurality of header data may include metadata for each of the plurality of audio frames, for example, information about the length and sampling frequency of the audio frame.
  • the header data may include data in an audio data transport stream (ADTS) format.
  • the main processor 121 may generate ADTS format header data when the first audio data includes an audio frame encoded by the AAC method.
  • the main processor 121 may generate second audio data by adding generated header data to the first audio data.
  • the main processor 121 may check whether image data is simultaneously reproduced with an audio signal.
  • the main processor 121 may generate second audio data by adding header data when confirming that the image data is reproduced simultaneously with the audio signal.
  • the main processor 121 may transfer the generated second audio data to the offloading module 200 .
  • FIG 8 illustrates an embodiment in which a time jump occurs.
  • the length of an audio frame, the sampling frequency of an audio frame, and the size of a time jump threshold corresponding thereto may have various values, but in this document, for convenience, the size of each audio frame 1024 bytes, a sampling frequency of 44100 Hz, that is, a case in which a playback time per audio frame is 0.023 seconds (23 ms) will be described.
  • a time jump may be understood as an event in which an interval between timestamps corresponding to each of a plurality of audio frames is not constant.
  • the first audio data 810 includes a plurality of consecutive audio frames (e.g., a first audio frame 811, a second audio frame 812, a third audio frame 813, and and a fourth audio frame 814), and may include a timestamp 820 corresponding to each of the plurality of audio frames.
  • the time stamp 820 may include each audio frame (eg, the first audio frame ( 811), time information corresponding to the second audio frame 812, the third audio frame 813, and the fourth audio frame 814.
  • a main processor eg, FIG.
  • the main processor 121 of 2) determines the difference between timestamps corresponding to two consecutive audio frames (eg, the second audio frame 812 and the third audio frame 813), and the time jump threshold. Based on the comparison, it is possible to determine whether the time jump 830 has occurred.
  • the time jump threshold may be calculated based on the audio frame length and the frame sampling frequency value. For example, the audio frame length A value obtained by dividing ? A predetermined value may be set as the time jump threshold According to one embodiment, the main processor 121 determines that the time jump 830 has occurred when the difference between two consecutive timestamps is greater than the time jump threshold.
  • the description will be limited to the case where each sample size is 1024 bytes, the sampling frequency is 44100 Hz, that is, the time jump threshold is 0.023 seconds (23 ms).
  • the threshold value may be set to 23 ms According to an embodiment, the time jump threshold value may be larger or smaller than 23 ms within a predetermined ratio by applying an error range within a predetermined range. Referring to FIG.
  • the difference between the value of the third timestamp corresponding to the third audio frame 813 (eg, 2320ms) and the value of the second timestamp corresponding to the second audio frame 812 (eg, 23ms) is the time jump threshold. Since the value of 23 ms is exceeded, the time jump event 830 has occurred, and the main processor 121 can detect the time jump.
  • FIG. 9 illustrates a process of reproducing video data in an embodiment in which a time jump occurs.
  • a plurality of audio frames included in the first audio information 910 eg, a first audio frame 911, a second audio frame ( 912) and the third audio frame 913
  • the offloading controller 303 may determine whether a time jump 930 has occurred.
  • the offloading controller 303 may stop transmitting an audio frame to the offloading module 200 when a time jump occurs. For example, when a time jump is confirmed between two consecutive audio frames, that is, the second audio frame 912 and the third audio frame 913, the offloading controller 303 operates the second audio frame 912 ) to the offloading module 200, transmission of the audio frame may be stopped (931) without transmitting the third audio frame 913.
  • the difference between the second timestamp (eg 23 ms) and the third timestamp (eg 2320 ms) may exceed the time jump threshold value (eg 23 ms), and the corresponding third timestamp
  • the third audio frame 913 may be referred to as an 'audio frame in which a time jump occurs'.
  • the offloading controller 303 may receive reproduction completion information from the offloading module 200 .
  • the offloading module 200 may generate reproduction completion information and transmit it to the offloading controller 303 when all audio frames received from the offloading controller 303 are decoded.
  • the offloading controller 303 may transmit a signal for stopping audio playback to the offloading module 200 together with a stop 931 before the third audio frame 913 .
  • the signal for stopping audio reproduction may include a signal that there is no more audio data to be transmitted to the offloading module 200 .
  • the playback completion information generated by the offloading module 200 and transmitted to the offloading controller 303 corresponds to a signal for stopping audio playback (eg, a signal that there is no more audio data to be transmitted), and the offloading module 200 It may be a signal generated by
  • the offloading controller 303 may change the reference time.
  • the offloading controller 303 changes the reference time based on a timestamp (eg, third timestamp) value corresponding to an audio frame (eg, the third audio frame 913) in which a time jump occurs.
  • the reference time may be in a state in which an initial value is set to 0, or may be a value that has already been changed from an initial value
  • the offloading controller 303 determines the value of the third timestamp 2320 For example, the offloading controller 303 may change the reference time by adding a third timestamp value at which a time jump occurs to the reference time. Referring to FIG.
  • the loading controller 303 may change the reference time whose initial value is set to 0 to 2320 ms based on the third timestamp.
  • the offloading controller 303 may resume audio frame transmission. After changing the reference time, the offloading controller 303 may retransmit (932) the audio frame to the offloading module 200.
  • the media clock 306 may update the reference time or change the reference time based on information about the reference time change received from the changed offloading controller 303 .
  • the media clock 306 may generate second time information by adding the first time information received from the offloading module 200 to the changed reference time.
  • the offloading controller 303 may reproduce image data based on the generated second time information.
  • FIG. 10 is a flowchart illustrating an operation in which an electronic device reproduces video data in which a time jump occurs, according to various embodiments of the present disclosure.
  • FIG. 10 a series of operations in which an electronic device (eg, the electronic device 101 of FIG. 2 ) reproduces video data in which a time jump occurs is performed by a main processor of the electronic device 101 (eg, the main processor of FIG. 2 ).
  • a main processor of the electronic device 101 eg, the main processor of FIG. 2
  • Each operation of the processor 121) may be described.
  • Each operation of FIG. 10 to be described below may be partially omitted, replaced with another operation, or a new operation may be added, and the order may be changed.
  • an audio frame may include a plurality of consecutive frames included in audio data (eg, first audio data) obtained by demultiplexing video data.
  • a plurality of audio frames may be in an encoded state.
  • the main processor 121 may check whether a time jump has occurred.
  • a time jump may be understood as an event in which an interval between timestamps corresponding to each of a plurality of audio frames is not constant.
  • the first audio data may include a plurality of consecutive audio frames
  • the timestamp may include a plurality of data corresponding to each of the plurality of audio frames.
  • the time stamp may include time information corresponding to each audio frame.
  • the main processor 121 determines a difference between timestamps (eg, a first timestamp and a second timestamp) corresponding to consecutive audio frames (eg, a first audio frame and a second audio frame).
  • the time jump threshold may be calculated based on an audio frame length and a frame sampling frequency value. For example, a value obtained by dividing the audio frame length by the sampling frequency may have the same value as a constant difference value of consecutive timestamps within an error range.
  • the main processor 121 may set a predetermined value as a time jump threshold. According to an embodiment, the main processor 121 may determine that a time jump has occurred when a difference between two consecutive timestamps is greater than a time jump threshold.
  • the length of the audio frame, the sampling frequency of the audio frame, and the size of the corresponding time jump threshold may have various values, but in this document, for convenience, each sample size is 1024 bytes and the sampling frequency is 44100 Hz, that is, the time jump threshold The description will be limited to the case of 0.023 seconds (23 ms). If a time jump occurs, the process may proceed to operation 1003, and if a time jump does not occur, the process may proceed to operation 1001.
  • the main processor 121 may stop transmitting audio frames to the offloading module 200 when a time jump occurs. For example, when a time jump is confirmed between two consecutive audio frames, that is, a first audio frame and a second audio frame, the main processor 121 transmits up to the first audio frame to the offloading module 200. After that, transmission of the second audio frame may be stopped. In this case, the difference between the first timestamp and the second timestamp may exceed the time jump threshold, and the second audio frame corresponding to the second timestamp is referred to as an 'audio frame in which time jump occurs'. It can be.
  • the main processor 121 may receive reproduction completion information from the offloading module 200.
  • the offloading module 200 may generate reproduction completion information when all audio frames received from the main processor 121 are decoded, and transmit the generated reproduction completion information to the main processor 121.
  • the main processor 121 may transmit a signal for stopping audio playback to the offloading module 200 after stopping transmission of the second audio frame.
  • the signal for stopping audio reproduction may include a signal that there is no more audio data to be transmitted to the offloading module 200 .
  • the reproduction completion information may be a signal generated by the offloading module 200 in response to a signal for stopping audio reproduction (eg, a signal indicating that there is no more audio data to be transmitted).
  • the main processor 121 may change the reference time.
  • the main processor 121 may change the reference time based on a timestamp (eg, second timestamp) value corresponding to an audio frame in which a time jump occurs.
  • the reference time may be in a state in which an initial value is set to 0, or may be a value that has already been changed from an initial value.
  • the main processor 121 may change the reference time based on the second timestamp value. For example, the main processor 121 may change the reference time by adding the second timestamp value at which the time jump occurs to the reference time.
  • the main processor 121 may resume transmission of the audio frame. After changing the reference time, the main processor 121 may transmit the audio frame to the offloading module 200 again. According to an embodiment, the main processor 121 adds the first time information generated and transmitted by the offloading module 200 based on the received audio frame to the changed reference time to generate second time information. there is. The main processor 121 may reproduce image data based on the generated second time information.
  • 11 is a signal transmission diagram when an electronic device reproduces video data in which a time jump occurs, according to various embodiments.
  • an audio frame may include a plurality of consecutive frames included in audio data (eg, first audio data) obtained by demultiplexing video data.
  • a plurality of audio frames may be in an encoded state.
  • the offloading module 200 may generate first time information.
  • the first time information may be time information generated by the offloading module 200 by decoding a plurality of audio frames included in the second audio data.
  • the first time information may be, for example, time information for the offloading module 200 to reproduce each audio frame.
  • the first time information may be time information generated by the offloading module 200 based on header data.
  • the offloading module 200 may generate first time information based on information about an audio frame length included in header data.
  • the main processor 121 may receive first time information from the offloading module 200.
  • the offloading module 200 may transmit first time information to the main processor 121 .
  • the main processor 121 may generate second time information based on the first time information and reproduce image data based on the generated second time information.
  • the second time information may include, for example, time information obtained by adding the first time information to a preset reference time.
  • the reference time may be a preset and stored value, and the main processor 121 may change the reference time.
  • the main processor 121 may reproduce image data based on the second time.
  • the main processor 121 decodes a plurality of image frames included in the image data, and displays a display module (eg, the display module 160 of FIG. 1) (eg, the output module 210 of FIG. 2). ) can be used to output to the outside.
  • the main processor 121 may reproduce image data based on the second time information in order to reproduce each of a plurality of image frames simultaneously with an audio frame corresponding to a corresponding sync.
  • the main processor 121 may check whether a time jump has occurred.
  • a time jump may be understood as an event in which an interval between timestamps corresponding to each of a plurality of audio frames is not constant.
  • the first audio data may include a plurality of consecutive audio frames
  • the timestamp may include a plurality of data corresponding to each of the plurality of audio frames.
  • the time stamp may include time information corresponding to each audio frame.
  • the main processor 121 determines a difference between timestamps (eg, a first timestamp and a second timestamp) corresponding to consecutive audio frames (eg, a first audio frame and a second audio frame).
  • the time jump threshold may be calculated based on an audio frame length and a frame sampling frequency value. For example, a value obtained by dividing the audio frame length by the sampling frequency may have the same value as a constant difference value of consecutive timestamps within an error range.
  • the main processor 121 may set a predetermined value as a time jump threshold. According to an embodiment, the main processor 121 may determine that a time jump has occurred when a difference between two consecutive timestamps is greater than a time jump threshold.
  • the length of the audio frame, the sampling frequency of the audio frame, and the size of the corresponding time jump threshold may have various values, but in this document, for convenience, each sample size is 1024 bytes and the sampling frequency is 44100 Hz, that is, the time jump threshold The description will be limited to the case of 0.023 seconds (23 ms).
  • the main processor 121 may stop transmitting audio frames to the offloading module 200 when a time jump occurs. For example, when a time jump is confirmed between two consecutive audio frames, that is, a first audio frame and a second audio frame, the main processor 121 transmits up to the first audio frame to the offloading module 200. After that, transmission of the second audio frame may be stopped. In this case, the difference between the first timestamp and the second timestamp may exceed the time jump threshold, and the second audio frame corresponding to the second timestamp is referred to as an 'audio frame in which time jump occurs'. It can be.
  • the main processor 121 may receive reproduction completion information from the offloading module 200 .
  • the offloading module 200 may generate reproduction completion information when all audio frames received from the main processor 121 are decoded, and transmit the generated reproduction completion information to the main processor 121.
  • the main processor 121 may transmit a signal for stopping audio playback to the offloading module 200 after stopping transmission of the second audio frame.
  • the signal for stopping audio reproduction may include a signal that there is no more audio data to be transmitted to the offloading module 200 .
  • the reproduction completion information may be a signal generated by the offloading module 200 in response to a signal for stopping audio reproduction (eg, a signal indicating that there is no more audio data to be transmitted).
  • the main processor 121 may change the reference time.
  • the main processor 121 may change the reference time based on a timestamp (eg, second timestamp) value corresponding to an audio frame in which a time jump occurs.
  • the reference time may be in a state in which an initial value is set to 0, or may be a value that has already been changed from an initial value.
  • the main processor 121 may change the reference time based on the second timestamp value. For example, the main processor 121 may change the reference time by adding the second timestamp value at which the time jump occurs to the reference time.
  • the main processor 121 may resume transmission of the audio frame. After changing the reference time, the main processor 121 may transmit the audio frame to the offloading module 200 again.
  • the main processor 121 receives the first time information again from the offloading module 200 (operation 1111), and the main processor 121 receives the changed reference time information.
  • Second time information may be generated by adding the first time information (operation 1112), and an image may be reproduced based on the second time information.
  • the main processor 121 adds the first time information generated and transmitted by the offloading module 200 based on the received audio frame to the changed reference time to generate second time information. there is.
  • the main processor 121 may reproduce image data based on the generated second time information.
  • FIG. 12 is a flowchart illustrating an operation when an electronic device performs offloading playback using an external electronic device according to various embodiments of the present disclosure.
  • FIG. 12 a series of operations in which an electronic device (eg, the electronic device 101 of FIG. 2 ) performs offloading playback using an external electronic device (eg, the electronic device 102 of FIG. 1 ),
  • Each operation of the main processor (eg, the main processor 121 of FIG. 2 ) of the electronic device 101 may be described.
  • Each operation of FIG. 12 to be described below may be partially omitted, replaced with another operation, or a new operation may be added, and the order may be changed.
  • the main processor 121 may check whether the first audio data is data encoded using the AAC method.
  • the main processor 121 may read the obtained encoding information of the first audio data and check whether an audio frame encoded by the AAC method is included. For example, the main processor 121 may check whether the first audio data includes an audio frame encoded by the AAC method based on information obtained by parsing the header information. If the first audio data is not audio data encoded by the AAC method, the operation ends, and if the first audio data is data encoded by the AAC method, the process may proceed to operation 1202 .
  • the main processor 121 may check whether the external electronic device 102 supports ADTS format data. For example, the main processor 121 may check whether the external electronic device 102 can read, decode, and reproduce data in the ADTS format based on the audio playback related signal received from the external electronic device 102. . For another example, the main processor 121 may determine whether the external electronic device 102 supports data in the ADTS format based on information previously stored in a memory (eg, the memory 130 of FIG. 1 ). . Based on whether the external electronic device 102 supports ADTS format data, the main processor 121 may proceed to operation 1204 if the external electronic device 102 supports ADTS format data, and may terminate the playback operation if not.
  • a memory eg, the memory 130 of FIG. 1
  • the main data 121 may add header data to the first audio data.
  • the main processor 121 may generate second audio data and transmit the generated second audio data to the external electronic device 102 .
  • the main processor 121 may generate second audio data based on first audio data obtained from video data.
  • the second audio data may be obtained by adding header data to the first audio data.
  • the header data may include meta data corresponding to the first audio data.
  • the main processor 121 may generate a plurality of header data corresponding to each of a plurality of audio frames included in the first audio data.
  • the plurality of header data may include metadata for each of the plurality of audio frames, for example, information about the length and sampling frequency of the audio frame.
  • the header data may include data in an audio data transport stream (ADTS) format.
  • the main processor 121 may generate ADTS format header data when the first audio data includes an audio frame encoded by the AAC method.
  • the main processor 121 may generate second audio data by adding generated header data to the first audio data.
  • the main processor 121 may check whether image data is simultaneously reproduced with an audio signal.
  • the main processor 121 may generate second audio data by adding header data when confirming that the image data is reproduced simultaneously with the audio signal.
  • the main processor 121 may transmit the generated second audio data to the external electronic device 102 .
  • the main processor 121 may transmit second audio data to the external electronic device 102 using a communication module (eg, the communication module 190 of FIG. 1 ).
  • An electronic device includes at least one auxiliary processor and a main processor operatively connected to the at least one auxiliary processor, wherein the main processor obtains video data;
  • the video data is divided into image data including a plurality of continuous image frames, first audio data including a plurality of continuous audio frames, and a plurality of timestamps corresponding to each of the plurality of continuous audio frames; generates second audio data by adding header data to each of the plurality of audio frames using the first audio data, transmits the second audio data to the at least one auxiliary processor, and generating second time information based on first time information successively received from one auxiliary processor and reproducing the image data based on the second time information, wherein the at least one auxiliary processor is configured to: An audio signal may be reproduced based on the received second audio data, and the first time information regarding the reproduction time of the audio signal may be generated based on the header data.
  • the plurality of audio frames may be encoded using an advanced audio coding (AAC) method.
  • AAC advanced audio coding
  • header data may include data in an audio data transport stream (ADTS) format.
  • ADTS audio data transport stream
  • the header data may include at least data length information of each corresponding audio frame.
  • the main processor checks whether the image data is reproduced simultaneously with the audio signal, and the at least one auxiliary processor determines whether the ADTS format It is checked whether data of is supported, the image data is reproduced simultaneously with the audio signal, and if the at least one auxiliary processor supports ADTS format data, the header data is added to the first audio data It may be set to generate the second audio data.
  • the main processor determines the time stamp based on a comparison between a first timestamp corresponding to a first audio frame among the plurality of timestamps and a second timestamp corresponding to a second audio frame consecutive to the first audio frame. It may be configured to check whether a jump has occurred, and if the time jump has occurred, change the second time information based on the second timestamp.
  • the main processor may be configured to calculate a difference between the second timestamp and the first timestamp, and determine that the time jump has occurred if the difference is greater than a time jump threshold.
  • the main processor may be set to calculate the time jump threshold based on the sizes of the plurality of audio frames and the sampling frequency of the audio frames.
  • the main processor stops transmitting the second audio frame after transmitting the first audio frame to the at least one auxiliary processor, and receives playback completion information from the at least one auxiliary processor. and change second time information based on the second timestamp, and resume transmission of the second audio frame to the at least one auxiliary processor.
  • the main processor continuously receives the first time information from the at least one auxiliary processor and sequentially adds the received first time information to a reference time to obtain the second time information;
  • the reference time may be set to be changed based on the value of the second timestamp.
  • a method of reproducing video data that may include at least one auxiliary processor includes image data including a plurality of continuous image frames, a plurality of continuous audio data, and the like. Separating first audio data including a frame into a plurality of time stamps corresponding to each of the plurality of consecutive audio frames, and header data (header data) for each of the plurality of audio frames using the first audio data. ) to generate second audio data, transmitting the second audio data to the at least one auxiliary processor, and generating second audio data based on the first time information continuously received from the at least one auxiliary processor. An operation of generating time information and an operation of reproducing the image data based on the second time information may be included.
  • the plurality of audio frames may be encoded using an advanced audio coding (AAC) method.
  • AAC advanced audio coding
  • header data may include data in an audio data transport stream (ADTS) format.
  • ADTS audio data transport stream
  • the header data may include at least data length information of each corresponding audio frame.
  • the first audio data includes an audio frame encoded by the AAC method
  • an operation of determining whether the image data is reproduced simultaneously with the audio signal, and the at least one auxiliary processor supports ADTS format data when the image data is reproduced simultaneously with the audio signal and the at least one auxiliary processor supports ADTS format data, adding the header data to the first audio data to perform the first audio signal.
  • An operation of generating audio data may be further included.
  • the method may also include an operation of calculating a difference between the second timestamp and the first timestamp, and determining that the time jump has occurred when the difference is greater than a time jump threshold.
  • the operation of continuously receiving the first time information from the at least one auxiliary processor, the operation of sequentially adding the received first time information to the reference time to obtain the second time information, and the time jump occurs, an operation of changing the reference time based on the value of the second timestamp may be included.
  • An electronic device includes a communication module communicatively connected to an external electronic device, and a processor operatively connected to the communication module, the processor comprising: When video data is reproduced, the video data is divided into image data including a plurality of continuous image frames and first audio data including a plurality of continuous audio frames, and the first audio data is encoded by the AAC method. Audio frame, it is checked whether the external electronic device supports ADTS format data, and if the external electronic device supports ADTS format data, header data is added to each of the plurality of audio frames. generating second audio data, transmitting the second audio data to the external electronic device, generating second time information based on first time information received from the external electronic device, and generating the second time information It can be set to reproduce the image data based on.
  • Electronic devices may be devices of various types.
  • the electronic device may include, for example, a portable communication device (eg, a smart phone), a computer device, a portable multimedia device, a portable medical device, a camera, a wearable device, or a home appliance.
  • a portable communication device eg, a smart phone
  • a computer device e.g., a smart phone
  • a portable multimedia device e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a camera e.g., a camera
  • a wearable device e.g., a smart bracelet
  • first, second, or first or secondary may simply be used to distinguish a given component from other corresponding components, and may be used to refer to a given component in another aspect (eg, importance or order) is not limited.
  • a (e.g., first) component is said to be “coupled” or “connected” to another (e.g., second) component, with or without the terms “functionally” or “communicatively.”
  • the certain component may be connected to the other component directly (eg by wire), wirelessly, or through a third component.
  • module used in various embodiments of this document may include a unit implemented in hardware, software, or firmware, and is interchangeable with terms such as, for example, logic, logical blocks, parts, or circuits.
  • a module may be an integrally constructed component or a minimal unit of components or a portion thereof that performs one or more functions.
  • the module may be implemented in the form of an application-specific integrated circuit (ASIC).
  • ASIC application-specific integrated circuit
  • a storage medium eg, internal memory 136 or external memory 138
  • a machine eg, electronic device 101
  • a processor eg, the processor 120
  • a device eg, the electronic device 101
  • the one or more instructions may include code generated by a compiler or code executable by an interpreter.
  • the device-readable storage medium may be provided in the form of a non-transitory storage medium.
  • the storage medium is a tangible device and does not contain a signal (e.g. electromagnetic wave), and this term refers to the case where data is stored semi-permanently in the storage medium. It does not discriminate when it is temporarily stored.
  • a signal e.g. electromagnetic wave
  • the method according to various embodiments disclosed in this document may be included and provided in a computer program product.
  • Computer program products may be traded between sellers and buyers as commodities.
  • a computer program product is distributed in the form of a device-readable storage medium (e.g. compact disc read only memory (CD-ROM)), or through an application store (e.g. Play Store TM ) or on two user devices (e.g. It can be distributed (eg downloaded or uploaded) online, directly between smart phones.
  • a device e.g. compact disc read only memory (CD-ROM)
  • an application store e.g. Play Store TM
  • It can be distributed (eg downloaded or uploaded) online, directly between smart phones.
  • at least part of the computer program product may be temporarily stored or temporarily created in a storage medium readable by a device such as a manufacturer's server, an application store server, or a relay server's memory.
  • each component (eg, module or program) of the above-described components may include a single object or a plurality of entities, and some of the plurality of entities may be separately disposed in other components. there is.
  • one or more components or operations among the aforementioned corresponding components may be omitted, or one or more other components or operations may be added.
  • a plurality of components eg modules or programs
  • the integrated component may perform one or more functions of each of the plurality of components identically or similarly to those performed by a corresponding component of the plurality of components prior to the integration. .
  • the actions performed by a module, program, or other component are executed sequentially, in parallel, iteratively, or heuristically, or one or more of the actions are executed in a different order, or omitted. or one or more other actions may be added.

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computer Security & Cryptography (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

본 문서의 다양한 실시예에 따른 전자 장치는, 적어도 하나의 보조 프로세서, 상기 적어도 하나의 보조 프로세서와 작동적으로 연결되는 메인 프로세서를 포함하고, 상기 메인 프로세서는, 동영상 데이터를 획득하고, 상기 동영상 데이터를 복수의 연속된 이미지 프레임을 포함하는 이미지 데이터, 복수의 연속된 오디오 프레임을 포함하는 제1오디오 데이터 및 상기 복수의 연속된 오디오 프레임 각각에 대응되는 복수의 타임스탬프로 분리하고, 상기 제1오디오 데이터를 이용하여, 상기 복수의 오디오 프레임 각각에 헤더 데이터를 추가하여 제2오디오 데이터를 생성하고, 상기 적어도 하나의 보조 프로세서로 상기 제2오디오 데이터를 전송하고, 상기 적어도 하나의 보조 프로세서로부터 연속적으로 수신한 제1시간 정보에 기초하여 제2시간 정보를 생성하고, 상기 제2시간 정보에 기초하여 상기 이미지 데이터를 재생하도록 설정되며, 상기 적어도 하나의 보조 프로세서는, 상기 수신한 제2오디오 데이터를 기초로 오디오 신호를 재생하고, 상기 헤더 데이터에 기초하여 상기 오디오 신호 재생 시간에 관한 상기 제1시간 정보를 생성하도록 설정될 수 있다.

Description

전자 장치 및 전자 장치의 멀티미디어 재생 방법
본 문서에 개시된 다양한 실시예는 전자 장치에 관한 것이며, 예를 들어 전자 장치가 재생하는 동영상 데이터에 포함된 이미지 데이터와 오디오 데이터의 싱크(sync)를 유지하는 방법에 관한 것이다.
이동통신 및 하드웨어/소프트웨어 기술의 발달에 따라, 스마트폰으로 대표되는 휴대용 전자 장치(이하, 전자 장치)는 다양한 기능들을 제공한다. 전자 장치는 이미지, 오디오를 포함하는 동영상과 같은 멀티미디어 컨텐츠를 재생할 수 있다.
멀티미디어 컨텐츠는 다양한 미디어 컨테이너에 포함되는 데이터 형태로 저장, 전송 및/또는 재생될 수 있다. 하나의 미디어 컨테이너에 다양한 포맷의 데이터가 포함되어 멀티미디어 컨텐츠를 구성할 수 있다. 미디어 컨테이너 내에 포함되는 데이터의 종류는 예를 들면, 메타 데이터, 이미지(영상) 데이터, 오디오 데이터 및 텍스트 데이터 가운데 일부를 포함할 수 있다.
전자 장치는 동일한 미디어 컨테이너에서 부호화된 데이터를 종류 별(예: 이미지 데이터 및 오디오 데이터)로 분리하고, 분리된 각 데이터의 종류 별로 서로 다른 구성요소(예: 메인 프로세서 및 보조 프로세서)를 이용하여 복호화 및 재생(이하, 오프로딩 재생 방식)할 수 있다. 이 경우 서로 다른 구성요소에서 동시에 서로 다른 종류의 데이터를 처리할 수 있기 때문에 멀티미디어 재생에 소요되는 처리시간이 감소될 수 있다. 다만, 동일한 미디어 컨테이너에 포함된 데이터를 오프로드 재생 방식을 이용해 재생하는 경우, 서로 다른 구성요소에서 재생하므로 데이터의 종류 별로 싱크의 유지가 어려울 수 있다.
본 문서의 다양한 실시예에 따른 전자 장치는, 적어도 하나의 보조 프로세서, 상기 적어도 하나의 보조 프로세서와 작동적으로(operatively) 연결되는 메인 프로세서를 포함하고, 상기 메인 프로세서는, 동영상 데이터를 획득하고, 상기 동영상 데이터를 복수의 연속된 이미지 프레임을 포함하는 이미지 데이터, 복수의 연속된 오디오 프레임을 포함하는 제1오디오 데이터 및 상기 복수의 연속된 오디오 프레임 각각에 대응되는 복수의 타임스탬프로 분리하고, 상기 제1오디오 데이터를 이용하여, 상기 복수의 오디오 프레임 각각에 헤더 데이터(header data)를 추가하여 제2오디오 데이터를 생성하고, 상기 적어도 하나의 보조 프로세서로 상기 제2오디오 데이터를 전송하고, 상기 적어도 하나의 보조 프로세서로부터 연속적으로 수신한 제1시간 정보에 기초하여 제2시간 정보를 생성하고, 상기 제2시간 정보에 기초하여 상기 이미지 데이터를 재생하도록 설정되며, 상기 적어도 하나의 보조 프로세서는, 상기 수신한 제2오디오 데이터를 기초로 오디오 신호를 재생하고, 상기 헤더 데이터에 기초하여 상기 오디오 신호 재생 시간에 관한 상기 제1시간 정보를 생성하도록 설정될 수 있다.
본 문서에 개시된 다양한 실시예에 따른, 적어도 하나의 보조 프로세서를 포함할 수 있다가 동영상 데이터를 재생하는 방법은, 상기 동영상 데이터를 복수의 연속된 이미지 프레임을 포함하는 이미지 데이터, 복수의 연속된 오디오 프레임을 포함하는 제1오디오 데이터 및 상기 복수의 연속된 오디오 프레임 각각에 대응되는 복수의 타임스탬프로 분리하는 동작, 상기 제1오디오 데이터를 이용하여, 상기 복수의 오디오 프레임 각각에 헤더 데이터(header data)를 추가하여 제2오디오 데이터를 생성하는 동작, 상기 적어도 하나의 보조 프로세서로 상기 제2오디오 데이터를 전송하는 동작, 상기 적어도 하나의 보조 프로세서로부터 연속적으로 수신한 제1시간 정보에 기초하여 제2시간 정보를 생성하는 동작, 및 상기 제2시간 정보에 기초하여 상기 이미지 데이터를 재생하는 동작을 포함할 수 있다.
본 문서에 개시된 다양한 실시예에 따른 전자 장치는, 외부 전자 장치와 통신적으로(communicatively) 연결되는 통신 모듈, 및 상기 통신 모듈과 작동적으로(operatively) 연결되는 프로세서를 포함하고, 상기 프로세서는, 동영상 데이터를 재생하는 경우, 상기 동영상 데이터를 복수의 연속된 이미지 프레임을 포함하는 이미지 데이터 및 복수의 연속된 오디오 프레임을 포함하는 제1오디오 데이터로 분리하고, 상기 제1오디오 데이터가 AAC 방식으로 부호화된 오디오 프레임을 포함하는 경우, 상기 외부 전자 장치가 ADTS 형식의 데이터를 지원하는지 여부를 확인하고, 상기 외부 전자 장치가 ADTS 형식의 데이터를 지원하는 경우, 상기 복수의 오디오 프레임 각각에 헤더 데이터를 추가하여 제2오디오 데이터를 생성하고, 상기 외부 전자 장치로 상기 제2오디오 데이터를 전송하고, 상기 외부 전자 장치로부터 수신한 제1시간 정보에 기초하여 제2시간 정보를 생성하고, 상기 제2시간 정보에 기초하여 상기 이미지 데이터를 재생하도록 설정될 수 있다.
다양한 실시예에 따르면, 오프로딩 재생 방식을 이용하여 멀티미디어를 재생하는 경우 이미지 및 오디오 간의 싱크를 유지할 수 있다.
다양한 실시예에 따르면, 오프로딩 재생 방식을 이용함으로써 소모 전류 절감 및 멀티미디어 데이터의 처리에 필요한 소요시간 및 소모전류가 감소될 수 있다.
다양한 실시예에 따르면, 동영상 재생 시 AAC 형식으로 부호화된 오디오 프레임을 오프로드 재생 방식으로 재생할 때 싱크 품질을 유지할 수 있도록 보장할 수 있다.
도면의 설명과 관련하여, 동일 또는 유사한 구성 요소에 대하여는 동일 또는 유사한 참조 부호가 사용될 수 있다.
도 1은 다양한 실시예들에 따른, 네트워크 환경 내의 전자 장치의 블록도이다.
도 2는 다양한 실시예에 따른 전자 장치의 블록도이다.
도 3은 다양한 실시예에 따른 동영상 데이터 재생에 사용되는 구성의 블록도이다.
도 4는 헤더 데이터를 생성하여 오디오를 오프로딩 재생하는 실시예에서 각 프레임의 처리 과정을 도시한 것이다.
도 5a 및 도 5b는 헤더 데이터를 생성하여 오디오를 오프로딩 재생하는 실시예에서 헤더 데이터를 이용하여 제1시간을 획득하는 과정을 도시한 것이다.
도 6은 다양한 실시예에 따른 전자 장치가 동영상 데이터를 재생하는 동작 흐름도이다.
도 7은 다양한 실시예에 따른 전자 장치가 AAC 방식으로 부호화된 오디오 데이터가 포함된 동영상 데이터를 재생하는 동작 흐름도이다.
도 8은 타임 점프(time jump)가 발생한 실시예를 나타낸 것이다.
도 9는 타임 점프가 발생한 실시예에서 동영상 데이터를 재생하는 과정을 도시한 것이다.
도 10은 다양한 실시예에 따른 전자 장치가 타임 점프가 발생한 동영상 데이터를 재생하는 동작 흐름도이다.
도 11은 다양한 실시예에 따른 전자 장치가 타임 점프가 발생한 동영상 데이터를 재생할 때의 신호전달도이다.
도 12는 다양한 실시예에 따른 전자 장치가 외부 전자 장치를 이용하여 오프로딩 재생을 수행할 때의 동작 흐름도이다.
도 1은, 다양한 실시예들에 따른, 네트워크 환경(100) 내의 전자 장치(101)의 블록도이다. 도 1을 참조하면, 네트워크 환경(100)에서 전자 장치(101)는 제 1 네트워크(198)(예: 근거리 무선 통신 네트워크)를 통하여 전자 장치(102)와 통신하거나, 또는 제 2 네트워크(199)(예: 원거리 무선 통신 네트워크)를 통하여 전자 장치(104) 또는 서버(108) 중 적어도 하나와 통신할 수 있다. 일실시예에 따르면, 전자 장치(101)는 서버(108)를 통하여 전자 장치(104)와 통신할 수 있다. 일실시예에 따르면, 전자 장치(101)는 프로세서(120), 메모리(130), 입력 모듈(150), 음향 출력 모듈(155), 디스플레이 모듈(160), 오디오 모듈(170), 센서 모듈(176), 인터페이스(177), 연결 단자(178), 햅틱 모듈(179), 카메라 모듈(180), 전력 관리 모듈(188), 배터리(189), 통신 모듈(190), 가입자 식별 모듈(196), 또는 안테나 모듈(197)을 포함할 수 있다. 어떤 실시예에서는, 전자 장치(101)에는, 이 구성요소들 중 적어도 하나(예: 연결 단자(178))가 생략되거나, 하나 이상의 다른 구성요소가 추가될 수 있다. 어떤 실시예에서는, 이 구성요소들 중 일부들(예: 센서 모듈(176), 카메라 모듈(180), 또는 안테나 모듈(197))은 하나의 구성요소(예: 디스플레이 모듈(160))로 통합될 수 있다.
프로세서(120)는, 예를 들면, 소프트웨어(예: 프로그램(140))를 실행하여 프로세서(120)에 연결된 전자 장치(101)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일실시예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(120)는 다른 구성요소(예: 센서 모듈(176) 또는 통신 모듈(190))로부터 수신된 명령 또는 데이터를 휘발성 메모리(132)에 저장하고, 휘발성 메모리(132)에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비휘발성 메모리(134)에 저장할 수 있다. 일실시예에 따르면, 프로세서(120)는 메인 프로세서(121)(예: 중앙 처리 장치 또는 어플리케이션 프로세서) 또는 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(123)(예: 그래픽 처리 장치, 신경망 처리 장치(NPU: neural processing unit), 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다. 예를 들어, 전자 장치(101)가 메인 프로세서(121) 및 보조 프로세서(123)를 포함하는 경우, 보조 프로세서(123)는 메인 프로세서(121)보다 저전력을 사용하거나, 지정된 기능에 특화되도록 설정될 수 있다. 보조 프로세서(123)는 메인 프로세서(121)와 별개로, 또는 그 일부로서 구현될 수 있다.
보조 프로세서(123)는, 예를 들면, 메인 프로세서(121)가 인액티브(예: 슬립) 상태에 있는 동안 메인 프로세서(121)를 대신하여, 또는 메인 프로세서(121)가 액티브(예: 어플리케이션 실행) 상태에 있는 동안 메인 프로세서(121)와 함께, 전자 장치(101)의 구성요소들 중 적어도 하나의 구성요소(예: 디스플레이 모듈(160), 센서 모듈(176), 또는 통신 모듈(190))와 관련된 기능 또는 상태들의 적어도 일부를 제어할 수 있다. 일실시예에 따르면, 보조 프로세서(123)(예: 이미지 시그널 프로세서 또는 커뮤니케이션 프로세서)는 기능적으로 관련 있는 다른 구성요소(예: 카메라 모듈(180) 또는 통신 모듈(190))의 일부로서 구현될 수 있다. 일실시예에 따르면, 보조 프로세서(123)(예: 신경망 처리 장치)는 인공지능 모델의 처리에 특화된 하드웨어 구조를 포함할 수 있다. 인공지능 모델은 기계 학습을 통해 생성될 수 있다. 이러한 학습은, 예를 들어, 인공지능 모델이 수행되는 전자 장치(101) 자체에서 수행될 수 있고, 별도의 서버(예: 서버(108))를 통해 수행될 수도 있다. 학습 알고리즘은, 예를 들어, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)을 포함할 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은, 복수의 인공 신경망 레이어들을 포함할 수 있다. 인공 신경망은 심층 신경망(DNN: deep neural network), CNN(convolutional neural network), RNN(recurrent neural network), RBM(restricted boltzmann machine), DBN(deep belief network), BRDNN(bidirectional recurrent deep neural network), 심층 Q-네트워크(deep Q-networks) 또는 상기 중 둘 이상의 조합 중 하나일 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은 하드웨어 구조 이외에, 추가적으로 또는 대체적으로, 소프트웨어 구조를 포함할 수 있다.
메모리(130)는, 전자 장치(101)의 적어도 하나의 구성요소(예: 프로세서(120) 또는 센서 모듈(176))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램(140)) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(130)는, 휘발성 메모리(132) 또는 비휘발성 메모리(134)를 포함할 수 있다.
프로그램(140)은 메모리(130)에 소프트웨어로서 저장될 수 있으며, 예를 들면, 운영 체제(142), 미들 웨어(144) 또는 어플리케이션(146)을 포함할 수 있다.
입력 모듈(150)은, 전자 장치(101)의 구성요소(예: 프로세서(120))에 사용될 명령 또는 데이터를 전자 장치(101)의 외부(예: 사용자)로부터 수신할 수 있다. 입력 모듈(150)은, 예를 들면, 마이크, 마우스, 키보드, 키(예: 버튼), 또는 디지털 펜(예: 스타일러스 펜)을 포함할 수 있다.
음향 출력 모듈(155)은 음향 신호를 전자 장치(101)의 외부로 출력할 수 있다. 음향 출력 모듈(155)은, 예를 들면, 스피커 또는 리시버를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 녹음 재생과 같이 일반적인 용도로 사용될 수 있다. 리시버는 착신 전화를 수신하기 위해 사용될 수 있다. 일실시예에 따르면, 리시버는 스피커와 별개로, 또는 그 일부로서 구현될 수 있다.
디스플레이 모듈(160)은 전자 장치(101)의 외부(예: 사용자)로 정보를 시각적으로 제공할 수 있다. 디스플레이 모듈(160)은, 예를 들면, 디스플레이, 홀로그램 장치, 또는 프로젝터 및 해당 장치를 제어하기 위한 제어 회로를 포함할 수 있다. 일실시예에 따르면, 디스플레이 모듈(160)은 터치를 감지하도록 설정된 터치 센서, 또는 상기 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 압력 센서를 포함할 수 있다.
오디오 모듈(170)은 소리를 전기 신호로 변환시키거나, 반대로 전기 신호를 소리로 변환시킬 수 있다. 일실시예에 따르면, 오디오 모듈(170)은, 입력 모듈(150)을 통해 소리를 획득하거나, 음향 출력 모듈(155), 또는 전자 장치(101)와 직접 또는 무선으로 연결된 외부 전자 장치(예: 전자 장치(102))(예: 스피커 또는 헤드폰)를 통해 소리를 출력할 수 있다.
센서 모듈(176)은 전자 장치(101)의 작동 상태(예: 전력 또는 온도), 또는 외부의 환경 상태(예: 사용자 상태)를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일실시예에 따르면, 센서 모듈(176)은, 예를 들면, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 또는 조도 센서를 포함할 수 있다.
인터페이스(177)는 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 직접 또는 무선으로 연결되기 위해 사용될 수 있는 하나 이상의 지정된 프로토콜들을 지원할 수 있다. 일실시예에 따르면, 인터페이스(177)는, 예를 들면, HDMI(high definition multimedia interface), USB(universal serial bus) 인터페이스, SD카드 인터페이스, 또는 오디오 인터페이스를 포함할 수 있다.
연결 단자(178)는, 그를 통해서 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일실시예에 따르면, 연결 단자(178)는, 예를 들면, HDMI 커넥터, USB 커넥터, SD 카드 커넥터, 또는 오디오 커넥터(예: 헤드폰 커넥터)를 포함할 수 있다.
햅틱 모듈(179)은 전기적 신호를 사용자가 촉각 또는 운동 감각을 통해서 인지할 수 있는 기계적인 자극(예: 진동 또는 움직임) 또는 전기적인 자극으로 변환할 수 있다. 일실시예에 따르면, 햅틱 모듈(179)은, 예를 들면, 모터, 압전 소자, 또는 전기 자극 장치를 포함할 수 있다.
카메라 모듈(180)은 정지 영상 및 동영상을 촬영할 수 있다. 일실시예에 따르면, 카메라 모듈(180)은 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다.
전력 관리 모듈(188)은 전자 장치(101)에 공급되는 전력을 관리할 수 있다. 일실시예에 따르면, 전력 관리 모듈(188)은, 예를 들면, PMIC(power management integrated circuit)의 적어도 일부로서 구현될 수 있다.
배터리(189)는 전자 장치(101)의 적어도 하나의 구성요소에 전력을 공급할 수 있다. 일실시예에 따르면, 배터리(189)는, 예를 들면, 재충전 불가능한 1차 전지, 재충전 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.
통신 모듈(190)은 전자 장치(101)와 외부 전자 장치(예: 전자 장치(102), 전자 장치(104), 또는 서버(108)) 간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(190)은 프로세서(120)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일실시예에 따르면, 통신 모듈(190)은 무선 통신 모듈(192)(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(194)(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제 1 네트워크(198)(예: 블루투스, WiFi(wireless fidelity) direct 또는 IrDA(infrared data association)와 같은 근거리 통신 네트워크) 또는 제 2 네트워크(199)(예: 레거시 셀룰러 네트워크, 5G 네트워크, 차세대 통신 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부의 전자 장치(104)와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성요소(예: 단일 칩)로 통합되거나, 또는 서로 별도의 복수의 구성요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈(192)은 가입자 식별 모듈(196)에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제 1 네트워크(198) 또는 제 2 네트워크(199)와 같은 통신 네트워크 내에서 전자 장치(101)를 확인 또는 인증할 수 있다.
무선 통신 모듈(192)은 4G 네트워크 이후의 5G 네트워크 및 차세대 통신 기술, 예를 들어, NR 접속 기술(new radio access technology)을 지원할 수 있다. NR 접속 기술은 고용량 데이터의 고속 전송(eMBB(enhanced mobile broadband)), 단말 전력 최소화와 다수 단말의 접속(mMTC(massive machine type communications)), 또는 고신뢰도와 저지연(URLLC(ultra-reliable and low-latency communications))을 지원할 수 있다. 무선 통신 모듈(192)은, 예를 들어, 높은 데이터 전송률 달성을 위해, 고주파 대역(예: mmWave 대역)을 지원할 수 있다. 무선 통신 모듈(192)은 고주파 대역에서의 성능 확보를 위한 다양한 기술들, 예를 들어, 빔포밍(beamforming), 거대 배열 다중 입출력(massive MIMO(multiple-input and multiple-output)), 전차원 다중입출력(FD-MIMO: full dimensional MIMO), 어레이 안테나(array antenna), 아날로그 빔형성(analog beam-forming), 또는 대규모 안테나(large scale antenna)와 같은 기술들을 지원할 수 있다. 무선 통신 모듈(192)은 전자 장치(101), 외부 전자 장치(예: 전자 장치(104)) 또는 네트워크 시스템(예: 제 2 네트워크(199))에 규정되는 다양한 요구사항을 지원할 수 있다. 일실시예에 따르면, 무선 통신 모듈(192)은 eMBB 실현을 위한 Peak data rate(예: 20Gbps 이상), mMTC 실현을 위한 손실 Coverage(예: 164dB 이하), 또는 URLLC 실현을 위한 U-plane latency(예: 다운링크(DL) 및 업링크(UL) 각각 0.5ms 이하, 또는 라운드 트립 1ms 이하)를 지원할 수 있다.
안테나 모듈(197)은 신호 또는 전력을 외부(예: 외부의 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일실시예에 따르면, 안테나 모듈(197)은 서브스트레이트(예: PCB) 위에 형성된 도전체 또는 도전성 패턴을 포함하는 방사체를 포함하는 안테나를 포함할 수 있다. 일실시예에 따르면, 안테나 모듈(197)은 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다. 이런 경우, 제 1 네트워크(198) 또는 제 2 네트워크(199)와 같은 통신 네트워크에서 사용되는 통신 방식에 적합한 적어도 하나의 안테나가, 예를 들면, 통신 모듈(190)에 의하여 상기 복수의 안테나들로부터 선택될 수 있다. 신호 또는 전력은 상기 선택된 적어도 하나의 안테나를 통하여 통신 모듈(190)과 외부의 전자 장치 간에 송신되거나 수신될 수 있다. 어떤 실시예에 따르면, 방사체 이외에 다른 부품(예: RFIC(radio frequency integrated circuit))이 추가로 안테나 모듈(197)의 일부로 형성될 수 있다.
다양한 실시예에 따르면, 안테나 모듈(197)은 mmWave 안테나 모듈을 형성할 수 있다. 일실시예에 따르면, mmWave 안테나 모듈은 인쇄 회로 기판, 상기 인쇄 회로 기판의 제 1 면(예: 아래 면)에 또는 그에 인접하여 배치되고 지정된 고주파 대역(예: mmWave 대역)을 지원할 수 있는 RFIC, 및 상기 인쇄 회로 기판의 제 2 면(예: 윗 면 또는 측 면)에 또는 그에 인접하여 배치되고 상기 지정된 고주파 대역의 신호를 송신 또는 수신할 수 있는 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다.
상기 구성요소들 중 적어도 일부는 주변 기기들간 통신 방식(예: 버스, GPIO(general purpose input and output), SPI(serial peripheral interface), 또는 MIPI(mobile industry processor interface))을 통해 서로 연결되고 신호(예: 명령 또는 데이터)를 상호간에 교환할 수 있다.
일실시예에 따르면, 명령 또는 데이터는 제 2 네트워크(199)에 연결된 서버(108)를 통해서 전자 장치(101)와 외부의 전자 장치(104)간에 송신 또는 수신될 수 있다. 외부의 전자 장치(102, 또는 104) 각각은 전자 장치(101)와 동일한 또는 다른 종류의 장치일 수 있다. 일실시예에 따르면, 전자 장치(101)에서 실행되는 동작들의 전부 또는 일부는 외부의 전자 장치들(102, 104, 또는 108) 중 하나 이상의 외부의 전자 장치들에서 실행될 수 있다. 예를 들면, 전자 장치(101)가 어떤 기능이나 서비스를 자동으로, 또는 사용자 또는 다른 장치로부터의 요청에 반응하여 수행해야 할 경우에, 전자 장치(101)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 하나 이상의 외부의 전자 장치들에게 그 기능 또는 그 서비스의 적어도 일부를 수행하라고 요청할 수 있다. 상기 요청을 수신한 하나 이상의 외부의 전자 장치들은 요청된 기능 또는 서비스의 적어도 일부, 또는 상기 요청과 관련된 추가 기능 또는 서비스를 실행하고, 그 실행의 결과를 전자 장치(101)로 전달할 수 있다. 전자 장치(101)는 상기 결과를, 그대로 또는 추가적으로 처리하여, 상기 요청에 대한 응답의 적어도 일부로서 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 모바일 에지 컴퓨팅(MEC: mobile edge computing), 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다. 전자 장치(101)는, 예를 들어, 분산 컴퓨팅 또는 모바일 에지 컴퓨팅을 이용하여 초저지연 서비스를 제공할 수 있다. 다른 실시예에 있어서, 외부의 전자 장치(104)는 IoT(internet of things) 기기를 포함할 수 있다. 서버(108)는 기계 학습 및/또는 신경망을 이용한 지능형 서버일 수 있다. 일실시예에 따르면, 외부의 전자 장치(104) 또는 서버(108)는 제 2 네트워크(199) 내에 포함될 수 있다. 전자 장치(101)는 5G 통신 기술 및 IoT 관련 기술을 기반으로 지능형 서비스(예: 스마트 홈, 스마트 시티, 스마트 카, 또는 헬스 케어)에 적용될 수 있다.
도 2는 다양한 실시예에 따른 전자 장치의 블록도이다.
도 2를 참조 하면, 전자 장치(101)는 메인 프로세서(121), 오프로딩 모듈(200) 및 출력 모듈(210)을 포함할 수 있으며, 일부 실시예에서 도시된 구성 중 일부가 생략 또는 치환 될 수도 있다. 전자 장치(101)는 도 1의 전자 장치(101)의 구성 및/또는 기능 중 적어도 일부를 더 포함할 수 있다. 도시된(또는 도시되지 않은) 전자 장치(101)의 각 구성 중 적어도 일부는 상호 작동적으로(operatively), 기능적으로(functionally) 및/또는 전기적으로 (electrically) 연결될 수 있다.
다양한 실시예에 따르면, 출력 모듈(210)은 출력 회로를 포함하고, 전자 장치(101)의 외부로 멀티미디어 컨텐츠를 출력할 수 있다. 멀티미디어 컨텐츠는, 예를 들면, 음향 신호 및 시각적 신호를 포함할 수 있다. 출력 모듈(210)은, 예를 들면, 오디오 신호를 외부로 출력할 수 있다. 또 다른 예를 들면, 출력 모듈(210)은 이미지를 외부에 출력할 수 있다. 일 실시예에 따르면, 출력 모듈(210)은 도 1의 음향 출력 모듈(155), 디스플레이 모듈(160) 및 오디오 모듈(170)의 구성 및/또는 기능 가운데 적어도 일부를 포함할 수 있다.
다양한 실시예에 따르면, 오프로딩 모듈(200)은 메인 프로세서(121)로부터 수신한 멀티미디어 데이터를 재생하기 위한 다양한 회로 구성을 포함할 수 있다. 다양한 실시예에 따르면, 오프로딩 모듈(200)은 메인 프로세서(121)로부터 오디오 데이터를 수신하고 수신한 오디오 데이터를 처리할 수 있다. 오프로딩 모듈(200)이 수신한 오디오 데이터는 부호화된(encoded) 상태의 데이터일 수 있다. 일실시예에 따르면, 오프로딩 모듈(200)은 수신한 오디오 데이터를 복호화(decoding) 할 수 있다. 일 실시예에 따르면, 오프로딩 모듈(200)은 출력 모듈(210)을 이용하여 복호화된 오디오 데이터에 기초한 음향 신호를 외부로 출력할 수 있다. 일 실시예에 따르면, 오프로딩 모듈(200)은 보조 프로세서(123)를 포함할 수 있다. 보조 프로세서(123)은, 예를 들면 DSP(디지털 신호 처리 장치: digital signal processor)를 포함할 수 있다. 일 실시예에 따르면, 오프로딩 모듈(200)는 오디오 데이터를 재생과 관련된 데이터를 메인 프로세서(121)로 전송하거나 메인 프로세서(121)로부터 수신할 수 있다. 예를 들면, 보조 프로세서(200)는 오디오 재생 시간에 관한 데이터(예: 제1시간 정보)를 생성하고, 메인 프로세서(121)로부터 제1시간 정보에 관련된 요청을 수신할 수 있다. 보조 프로세서(200)는 메인 프로세서(121)로부터 제1시간 정보에 관련된 요청을 수신하는 경우, 메인 프로세서(121)로 제1시간 정보를 전송할 수 있다.
다양한 실시예에 따르면, 메인 프로세서(121)는 전자 장치(101)의 각 구성 요소들의 제어 및/또는 통신에 관한 연산이나 데이터 처리를 수행할 수 있는 구성으로써, 하나 이상의 프로세서들로 구성될 수 있다. 메인 프로세서(121)는 도 1의 프로세서(120)의 구성 및/또는 기능 중 적어도 일부를 포함할 수 있다.
다양한 실시예에 따르면, 메인 프로세서(121)가 전자 장치(101) 상에서 구현할 수 있는 연산 및 데이터 처리 기능에는 한정됨이 없을 것이나, 이하에서는 전자 장치(101)가 동영상 데이터를 재생할 때 오프로딩 모듈(200)을 이용하여 오프로드 재생 방식으로 오디오 데이터를 재생하는 동작과 관련된 다양한 실시예들에 대해 설명하기로 한다. 이하에서는, 전자 장치(101)가 멀티미디어 데이터 가운데 동영상 데이터를 재생하는 것에 관련된 내용을 설명하기로 하나, 동영상 데이터 외에 다양한 종류의 멀티미디어 데이터에도 다양한 실시예들이 적용될 수 있다.
다양한 실시예에 따르면, 메인 프로세서(121)는 동영상 데이터를 획득할 수 있다. 동영상 데이터는, 하나 이상의 이미지 데이터 및 오디오 데이터를 포함할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 외부 전자 장치(예: 도 1의 전자 장치(102, 104) 또는 서버(108))로부터 스트리밍 데이터를 수신하고, 수신된 스트리밍 데이터 내에 포함된 동영상 데이터를 획득할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 메모리(예: 도 1의 메모리(130))에 저장된 데이터를 읽어 들여 동영상 데이터를 획득할 수 있다.
다양한 실시예에 따르면, 메인 프로세서(121)는 이미지 데이터 및 제1오디오 데이터를 획득할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 획득한 동영상 데이터를 역다중화(de-MUXing: de-multiplexing) 하여 동영상 데이터에 포함된 이미지 데이터, 오디오 데이터(예: 제1오디오 데이터) 및 오디오 데이터에 대응되는 타임스탬프로 분리할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)가 역다중화 하여 획득한 이미지 데이터 및 오디오 데이터(예: 제1오디오 데이터)는 각각 부호화된(encoded) 데이터일 수 있다. 일 실시예에 따르면, 이미지 데이터는 복수의 부호화된 이미지 프레임을 포함할 수 있다. 복수의 이미지 프레임은 서로 연속된 이미지를 포함할 수 있다. 일 실시예에 따르면, 제1오디오 데이터는 복수의 부호화된 오디오 프레임을 포함할 수 있다. 복수의 오디오 프레임은 서로 연속된 음향 신호를 포함할 수 있다. 일 실시예에 따르면, 제1오디오 데이터는 AAC(고급 오디오 부호화: advanced audio coding) 방식으로 부호화된 복수의 연속된 오디오 프레임을 포함할 수 있다. 타임스탬프는 오디오 데이터에 포함된 복수의 프레임 각각에 대응되는 복수의 데이터를 포함할 수 있고, 오디오 프레임 각각에 대응되는 시간 정보를 포함하는 데이터일 수 있다.
다양한 실시예에 따르면, 메인 프로세서(121)는 제2오디오 데이터를 생성하고, 생성된 제2오디오 데이터를 오프로딩 모듈(200)로 전송할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 오프로딩 모듈(200)로 타임스탬프를 전송하지 않을 수 있다. 메인 프로세서(121)는 동영상 데이터로부터 획득된 제1오디오 데이터에 기초하여 제2오디오 데이터를 생성할 수 있다. 제2오디오 데이터는, 제1오디오 데이터에 헤더 데이터(header data) 가 추가된 것일 수 있다. 헤더 데이터는 제1오디오 데이터에 대응되는 메타 데이터를 포함할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 제1오디오 데이터에 포함된 복수의 오디오 프레임 각각에 대응하여 복수의 헤더 데이터를 생성할 수 있다. 복수의 헤더 데이터는 복수의 오디오 프레임 각각에 대한 메타 데이터, 예를 들어 오디오 프레임의 길이 및 샘플링 주파수에 관한 정보를 포함할 수 있다. 일 실시예에 따르면, 헤더 데이터는 ADTS(오디오 데이터 전송 스트림: audio data transport stream) 형식의 데이터를 포함할 수 있다. 메인 프로세서(121)는 제1오디오 데이터가 AAC 방식으로 부호화된 오디오 프레임을 포함하는 경우 ADTS 형식의 헤더 데이터를 생성할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 제1오디오 데이터에, 생성된 헤더 데이터를 추가하여 제2오디오 데이터를 생성할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 이미지 데이터가 오디오 신호와 동시에 재생되는지 여부를 확인할 수 있다. 메인 프로세서(121)는 이미지 데이터가 오디오 신호와 동시에 재생됨을 확인하는 경우, 헤더 데이터를 추가하여 제2오디오 데이터를 생성할 수 있다.
일 실시예에 따르면, 메인 프로세서(121)는 제1오디오 데이터가 AAC 방식으로 부호화된 데이터인지 여부를 확인할 수 있다. 메인 프로세서(121)는 획득된 제1오디오 데이터의 부호화 정보를 읽어 들여 AAC 방식으로 부호화된 오디오 프레임을 포함하는지 여부를 확인할 수 있다. 예를 들면, 메인 프로세서(121)는 헤더 정보를 파싱하여 획득한 정보에 기초하여 제1오디오 데이터가 AAC 방식으로 부호화된 오디오 프레임을 포함하는지 여부를 확인할 수 있다.
일 실시예에 따르면, 메인 프로세서(121)는 오프로딩 모듈(200)이 ADTS 형식의 데이터를 지원하는지 여부를 확인할 수 있다. 예를 들면, 메인 프로세서(121)는 오프로딩 모듈(200)로부터 수신한 오디오 재생 관련 신호에 기초하여 오프로딩 모듈(200)이 ADTS 형식의 데이터를 읽어들이고 복호화 및 재생할 수 있는지 여부를 확인할 수 있다. 또 다른 예를 들면, 메인 프로세서(121)는 메모리(예: 도 1의 메모리(130))에 미리 저장된 정보에 기초하여 오프로딩 모듈(200)이 ADTS 형식의 데이터를 지원하는지 여부를 확인할 수 있다.
다양한 실시예에 따르면, 메인 프로세서(121)는 오프로딩 모듈(200)로부터 제1시간 정보를 수신할 수 있다. 제1시간 정보는, 오프로딩 모듈(200)이 제2오디오 데이터에 포함된 복수의 오디오 프레임을 복호화하여 생성한 시간 정보일 수 있다. 제1시간 정보는 예를 들면, 오프로딩 모듈(200)이 각각의 오디오 프레임을 재생하기 위한 시간 정보일 수 있다. 일 실시예에 따르면, 제1시간 정보는 헤더 데이터에 기초하여 오프로딩 모듈(200)이 생성한 시간 정보일 수 있다. 예를 들면, 오프로딩 모듈(200)은 헤더 데이터에 포함된 오디오 프레임 길이에 관한 정보에 기초하여 제1시간 정보를 생성할 수 있다.
다양한 실시예에 따르면, 메인 프로세서(121)는 제1시간에 기초하여 이미지 데이터를 재생할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 이미지 데이터에 포함된 복수의 이미지 프레임을 복호화 하고, 디스플레이 모듈(예: 도 1의 디스플레이 모듈(160))을 이용하여 외부에 출력할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 복수의 이미지 프레임 각각을, 대응되는 싱크(sync)에 해당하는 오디오 프레임과 동시에 재생하기 위하여 제1시간 정보에 기초하여 이미지 데이터를 재생할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 제1시간 정보에 기초하여 제2시간 정보를 생성하고, 생성된 제2시간 정보에 기초하여 이미지 데이터를 재생할 수 있다. 제2시간 정보는, 예를 들면, 미리 설정된 기준 시간에, 제1시간 정보를 가산한 시간 정보를 포함할 수 있다. 기준 시간은 미리 설정되어 저장된 값일 수 있으며, 메인 프로세서(121)는 기준 시간을 변경할 수 있다.
다양한 실시예에 따르면, 메인 프로세서(121)는 타임 점프(time jump)가 발생하였는지 여부를 확인할 수 있다. 타임 점프는, 복수의 오디오 프레임 각각에 대응하는 타임스탬프 간의 간격이 일정하지 않게 되는 이벤트로 이해될 수 있다. 일 실시예에 따르면, 제1오디오 데이터는 복수의 연속된 오디오 프레임을 포함하고, 타임스탬프는 복수의 오디오 프레임 각각에 대응되는 복수의 데이터를 포함할 수 있다. 타임 스탬프는, 각각의 오디오 프레임에 대응되는 시간 정보를 포함할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 연속된 오디오 프레임(예: 제1오디오 프레임 및 제2오디오 프레임)에 대응되는 타임스탬프들(예: 제1타임스탬프 및 제2타임스탬프) 간의 차이값의, 타임 점프 임계값과의 비교에 기초하여 타임 점프 발생 여부를 확인할 수 있다. 일 실시예에 따르면, 타임 점프 임계값은 오디오 프레임 길이 및 프레임 샘플링 주파수 값에 기초하여 계산될 수 있다. 예를 들어, 오디오 프레임 길이를 샘플링 주파수로 나눈 값은, 연속된 타임스탬프가 가지는 일정한 차이값과 오차 범위 내에서 동일한 값을 가질 수 있다. 일 실시예에 따르면, 오디오 프레임 길이가 일정하지 않은 경우, 메인 프로세서(121)는 미리 정해진 값을 타임 점프 임계값으로 설정할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 연속된 2개의 타임스탬프 간의 차이값이 타임 점프 임계값보다 큰 경우 타임 점프가 발생한 것으로 판단할 수 있다. 오디오 프레임의 길이, 오디오 프레임의 샘플링 주파수 및 그에 대응되는 타임 점프 임계값의 크기는 다양한 값을 가질 수 있으나, 본 문서에서는 편의상 각 샘플 크기가 1024 byte, 샘플링 주파수가 44100Hz, 즉, 타임 점프 임계값이 0.023초(23ms)인 경우에 한정하여 설명하도록 한다.
다양한 실시예에 따르면, 메인 프로세서(121)는 타임 점프가 발생한 경우 오프로딩 모듈(200)에 대한 오디오 프레임 전송을 중단할 수 있다. 예를 들어, 연속된 2개의 오디오 프레임, 즉, 제1오디오 프레임 및 제2오디오 프레임 사이에 타임 점프가 확인되는 경우, 메인 프로세서(121)는 제1오디오 프레임까지 오프로딩 모듈(200)로 전송한 뒤, 제2오디오 프레임의 전송을 중단할 수 있다. 이 경우, 제1타임스탬프 및 제2타임스탬프의 차이값이 타임 점프 임계값을 초과하는 경우일 수 있고, 제2타임스탬프에 대응되는 제2오디오 프레임은 '타임 점프가 발생한 오디오 프레임'으로 지칭될 수 있다.
다양한 실시예에 따르면, 메인 프로세서(121)는 오프로딩 모듈(200)로부터 재생 완료 정보를 수신할 수 있다. 일 실시예에 따르면, 오프로딩 모듈(200)은 메인 프로세서(121)로부터 수신한 오디오 프레임을 모두 복호화하는 경우 재생 완료 정보를 생성하고, 생성된 재생 완료 정보를 메인 프로세서(121)로 전송할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 제2오디오 프레임 전송을 중단한 뒤 오프로딩 모듈(200)로 오디오 재생을 중단하도록 하는 신호를 전송할 수 있다. 재생 완료 정보는 오디오 재생을 중단하도록 하는 신호에 대응되어 오프로딩 모듈(200)에서 생성한 신호일 수 있다.
다양한 실시예에 따르면, 메인 프로세서(121)는 기준 시간을 변경할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 타임 점프가 발생한 오디오 프레임에 대응되는 타임스탬프(예: 제2타임스탬프) 값에 기초하여 기준 시간을 변경할 수 있다. 기준 시간은 초기값이 0으로 설정된 상태일 수 있고, 또는, 초기값에서 이미 변경된 값일 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 제2타임스탬프 값에 기초하여, 기준 시간을 변경할 수 있다. 예를 들어, 메인 프로세서(121)는 기준 시간에 타임 점프가 발생한 제2타임스탬프 값을 가산하여 기준 시간을 변경할 수 있다.
다양한 실시예에 따르면, 메인 프로세서(121)는 오디오 프레임 전송을 재개할 수 있다. 기준 시간을 변경한 메인 프로세서(121)는 오프로딩 모듈(200)로 오디오 프레임을 다시 전송할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 오프로딩 모듈(200)이, 수신한 오디오 프레임에 기초하여 생성 및 전송하는 제1시간 정보를 변경된 기준 시간에 가산하여 제2시간 정보를 생성할 수 있다. 메인 프로세서(121)는 생성한 제2시간 정보에 기초하여 이미지 데이터를 재생할 수 있다.
도 3은 다양한 실시예에 따른 동영상 데이터 재생에 사용되는 구성의 블록도이다.
다양한 실시예에 따르면, 디먹서(301)(de-MUXer: de-multiplexer)는 메인 프로세서(121)가 획득한 동영상 데이터를 역다중화 하여 오디오 데이터, 이미지 데이터 및 오디오 데이터에 대응되는 타임스탬프로 분리할 수 있다. 일 실시예에 따르면, 동영상 데이터는 오디오 데이터 및 이미지 데이터를 모두 포함할 수 있고, 이들 데이터는 다중화(MUXing: multiplexing) 처리된 상태로 디먹서(301)로 전달될 수 있다. 디먹서(301)는 역다중화 결과로 획득한 이미지 데이터를 비디오 디코더(302)로 전송하고, 오디오 데이터를 오프로딩 컨트롤러(303)로 각각 전달할 수 있다.
다양한 실시예에 따르면, 오프로딩 컨트롤러(303)는 수신한 오디오 데이터를 변환할 수 있다. 일 실시예에 따르면, 디먹서(301)로부터 오프로딩 컨트롤러(303)가 수신한 오디오 데이터(예: 제1오디오 데이터)는 복수의 오디오 프레임을 포함할 수 있다. 일 실시예에 따르면, 오프로딩 컨트롤러(303)는 제1오디오 데이터에 포함된 오디오 프레임 각각에 대응되는 복수의 헤더 데이터를 추가하여, 복수의 헤더 데이터 및 오디오 프레임을 포함하는 제2오디오 데이터를 생성할 수 있다. 일 실시예에 따르면, 오프로딩 컨트롤러(303)는 이미지 데이터가 오디오 신호와 동시에 재생되는지 여부를 확인할 수 있다. 오프로딩 컨트롤러(303)는 이미지 데이터가 오디오 신호와 동시에 재생됨을 확인하는 경우, 헤더 데이터를 추가하여 제2오디오 데이터를 생성할 수 있다.
다양한 실시예에 따르면, 오프로딩 컨트롤러(303)는 제2오디오 데이터를 생성하고, 생성된 제2오디오 데이터를 오디오 디코더(304)로 전송할 수 있다. 오프로딩 컨트롤러(303)는 디먹서(301)로부터 수신한 제1오디오 데이터에 기초하여 제2오디오 데이터를 생성할 수 있다. 제2오디오 데이터는, 제1오디오 데이터에 헤더 데이터(header data) 가 추가된 것일 수 있다. 헤더 데이터는 제1오디오 데이터에 대응되는 메타 데이터를 포함할 수 있다. 일 실시예에 따르면, 오프로딩 컨트롤러(303)는 제1오디오 데이터에 포함된 복수의 오디오 프레임 각각에 대응하여 복수의 헤더 데이터를 생성할 수 있다. 복수의 헤더 데이터는 복수의 오디오 프레임 각각에 대한 메타 데이터, 예를 들어 오디오 프레임의 길이 및 샘플링 주파수에 관한 정보를 포함할 수 있다. 일 실시예에 따르면, 헤더 데이터는 ADTS(오디오 데이터 전송 스트림: audio data transport stream) 형식의 데이터를 포함할 수 있다. 오프로딩 컨트롤러(303)는 제1오디오 데이터가 AAC 방식으로 부호화된 오디오 프레임을 포함하는 경우 ADTS 형식의 헤더 데이터를 생성할 수 있다. 일 실시예에 따르면, 오프로딩 컨트롤러(303)는 제1오디오 데이터에, 생성된 헤더 데이터를 추가하여 제2오디오 데이터를 생성할 수 있다.
일 실시예에 따르면, 오프로딩 컨트롤러(303)는 제1오디오 데이터가 AAC 방식으로 부호화된 데이터인지 여부를 확인할 수 있다. 예를 들면, 오프로딩 컨트롤러(303)는 획득된 제1오디오 데이터의 부호화 정보를 읽어 들여 AAC 방식으로 부호화된 오디오 프레임을 포함하는지 여부를 확인할 수 있다. 예를 들면, 오프로딩 컨트롤러(303)는 디먹서(301) 에서 헤더 정보를 파싱해서 획득한 정보를 통해 제1오디오 데이터가 AAC 방식으로 부호화된 오디오 프레임을 포함하는지 여부를 확인할 수 있다.
일 실시예에 따르면, 오프로딩 컨트롤러(303)는 오디오 디코더(304)가 ADTS 형식의 데이터를 지원하는지 여부를 확인할 수 있다. 예를 들면, 오프로딩 컨트롤러(303)는 오디오 디코더(304)로부터 수신한 오디오 재생 관련 신호에 기초하여 오디오 디코더(304)가 ADTS 형식의 데이터를 읽어들이고 복호화 및 재생할 수 있는지 여부를 확인할 수 있다. 또 다른 예를 들면, 오프로딩 컨트롤러(303)는 메모리(예: 도 1의 메모리(130))에 미리 저장된 정보에 기초하여 오디오 디코더(304)가 ADTS 형식의 데이터를 지원하는지 여부를 확인할 수 있다.
다양한 실시예에 따르면, 오프로딩 컨트롤러(303)는 미디어 클락(306)으로 타임 점프 이벤트 발생 여부에 관한 정보를 전달할 수 있다. 일 실시예에 따르면, 오프로딩 컨트롤러(303)는 디먹서(301)로부터 각각의 오디오 프레임에 대응되는 복수의 타임스탬프를 수신할 수 있다. 다양한 실시예에 따르면, 오프로딩 컨트롤러(303)는 타임 점프(time jump)가 발생하였는지 여부를 확인할 수 있다. 타임 점프는, 복수의 오디오 프레임 각각에 대응하는 타임스탬프 간의 간격이 일정하지 않게 되는 이벤트로 이해될 수 있다. 타임 스탬프는, 각각의 오디오 프레임에 대응되는 시간 정보를 포함할 수 있다. 일 실시예에 따르면, 오프로딩 컨트롤러(303)는 연속된 오디오 프레임(예: 제1오디오 프레임 및 제2오디오 프레임)에 대응되는 타임스탬프들(예: 제1타임스탬프 및 제2타임스탬프) 간의 차이값의, 타임 점프 임계값과의 비교에 기초하여 타임 점프 발생 여부를 확인할 수 있다. 일 실시예에 따르면, 타임 점프 임계값은 오디오 프레임 길이 및 프레임 샘플링 주파수 값에 기초하여 계산될 수 있다. 예를 들어, 오디오 프레임 길이를 샘플링 주파수로 나눈 값은, 연속된 타임스탬프가 가지는 일정한 차이값과 오차 범위 내에서 동일한 값을 가질 수 있다. 일 실시예에 따르면, 오디오 프레임 길이가 일정하지 않은 경우, 오프로딩 컨트롤러(303)는 미리 정해진 값을 타임 점프 임계값으로 설정할 수 있다. 일 실시예에 따르면, 오프로딩 컨트롤러(303)는 연속된 2개의 타임스탬프 간의 차이값이 타임 점프 임계값보다 큰 경우 타임 점프가 발생한 것으로 판단할 수 있다. 일 실시예에 따르면, 오프로딩 컨트롤러(303)는 타임 점프가 발생하는 경우, 오디오 디코더(304)로 제2오디오 데이터 전송을 중단할 수 있다. 오프로딩 컨트롤러(303)는 타임 점프가 발생하는 경우 타임 점프 발생 여부에 관한 정보를 미디어 클락(306)으로 전송할 수 있다. 미디어 클락(306)이 타임 점프 발생에 기초하여 기준 시간을 변경한 뒤 오프로딩 컨트롤러(303)는 오디오 디코더(304)로 오디오 프레임 전송을 재개할 수 있다.
다양한 실시예에 따르면, 오디오 디코더(304)는 오프로딩 컨트롤러(303)로부터 수신한 제2오디오 데이터를 복호화 할 수 있다. 일 실시예에 따르면, 오디오 디코더(304)가 오프로딩 컨트롤러(303)로부터 수신한 오디오 데이터는 복수의 오디오 프레임을 포함할 수 있고, 각각의 오디오 프레임은 미리 정해진 방식으로 부호화된(encoded) 데이터일 수 있다. 일 실시예에 따르면, 오디오 디코더(304)는 부호화된 복수의 오디오 프레임의 부호화 방식에 기초하여 복호화(decoding)하여 복수의 복호화된 오디오 프레임으로 변환할 수 있다. 오디오 디코더(304)는 복호화된 오디오 프레임을 출력 모듈(210)로 전달할 수 있다.
다양한 실시예에 따르면, 재생 시간 정보 컨트롤러(305)는 제2오디오 데이터에 포함된 헤더 데이터에 기초하여 재생 시간 정보를 업데이트 할 수 있다. 헤더 데이터는 복수의 오디오 프레임의 길이에 관한 정보를 포함할 수 있고, 출력 모듈(210)을 이용하여 각 오디오 프레임 재생 시 샘플링 주파수에 따라 오디오가 재생되는 시간을 계산할 수 있다. 일 실시예에 따르면, 재생 시간 정보 컨트롤러(305)는 각 오디오 프레임 재생에 대응하여 오디오 재생에 관련된 제1시간 정보를 생성할 수 있다. 재생 시간 정보 컨트롤러(305)는 미디어 클락(306)에 제1시간 정보를 주기적 및/또는 연속적으로 업데이트 할 수 있다.
다양한 실시예에 따르면, 미디어 클락(306)은 동영상 재생을 위하여 이미지 데이터 재생에 관련된 시간 정보(예: 제2시간 정보)를 생성 및 변경할 수 있다. 일 실시예에 따르면, 제2시간 정보는 복수의 이미지 프레임을 재생하기 위하여 참조되는 시간 정보일 수 있다. 미디어 클락(306)은 비디오 렌더러(307)로 제2시간 정보를 전달할 수 있다. 일 실시예에 따르면, 제2시간 정보는 기준 시간에 제1시간 정보를 가산한 값을 가질 수 있다. 제1시간 정보는, 재생시간 정보 컨트롤러(305)로부터 수신한 시간 정보일 수 있다. 제1시간 정보는 오디오 데이터를 재생과 관련된 시간 정보일 수 있다. 일 실시예에 따르면, 재생시간 정보 컨트롤러(305)는 복수의 오디오 프레임을 재생하는 동안 생성된 제1시간 정보를 전달할 수 있고, 미디어 클락(306)은 재생 시간 정보 컨트롤러(305)로부터 제1시간 정보를 주기적으로 및/또는 연속적으로 수신할 수 있다.
다양한 실시예에 따르면, 미디어 클락(306)은 기준 시간을 변경할 수 있다. 일 실시예에 따르면, 미디어 클락(306)은 타임 점프가 발생한 오디오 프레임에 대응되는 타임스탬프(예: 제2타임스탬프) 값에 기초하여 기준 시간을 변경할 수 있다. 기준 시간은 초기값이 0으로 설정된 상태일 수 있고, 또는, 초기값에서 이미 변경된 값일 수 있다. 일 실시예에 따르면, 미디어 클락(306)은 제2타임스탬프 값에 기초하여, 기준 시간을 변경할 수 있다. 예를 들어, 미디어 클락(306)은 기준 시간에 타임 점프가 발생한 제2타임스탬프 값을 가산하여 기준 시간을 변경할 수 있다. 일 실시예에 따르면, 미디어 클락(306)은 변경된 기준 시간에 제1시간을 가산하여 제2시간 정보를 생성할 수 있다.
다양한 실시예에 따르면, 비디오 디코더(302)는 디먹서(301)로부터 이미지 데이터를 수신할 수 있다. 일 실시예에 따르면, 비디오 디코더(302)가 디먹서(301)로부터 수신한 이미지 데이터는 복수의 이미지 프레임을 포함할 수 있고, 각각의 이미지 프레임은 미리 정해진 방식으로 부호화된(encoded) 데이터일 수 있다. 일 실시예에 따르면, 비디오 디코더(302)는 부호화된 복수의 이미지 프레임의 부호화 방식에 기초하여 복호화(decoding)하여 복수의 복호화된 이미지 프레임으로 변환할 수 있다. 비디오 디코더(302)는 복호화된 이미지 프레임을 비디오 렌더러(307)로 전달할 수 있다.
다양한 실시예에 따르면, 비디오 렌더러(307)는 출력 모듈(210) 상에 처리되는 이미지 데이터의 렌더링 동작을 수행할 수 있다. 비디오 렌더러(307)은 비디오 디코더(302)로부터 수신한, 복호화된 이미지 프레임을 기초로, 출력할 이미지를 프레임 단위로 생성하고, 출력 모듈(210)로 생성된 이미지를 표시하도록 하는 명령을 전달할 수 있다. 비디오 렌더러(307)는 미디어 클락(306)으로부터 이미지 출력 시간에 관련된 정보(예: 제2시간 정보)를 수신할 수 있다. 비디오 렌더러(307)는 수신된 제2시간 정보에 기초하여 이미지 프레임을 출력할 수 있다.
다양한 실시예에 따르면, 출력 모듈(210)은 전자 장치(101)의 외부로 멀티미디어 컨텐츠를 출력할 수 있다. 출력 모듈(210)은 비디오 렌더러(307)로부터 제2시간에 기초하여 수신한 이미지 프레임을 디스플레이 모듈(예: 도 1의 디스플레이 모듈(160))을 이용하여 외부로 출력할 수 있다. 출력 모듈(210)은, 오디오 디코더(304)로부터 수신한 이미지 프레임을 음향 출력 모듈(예: 도 1의 음향 출력 모듈(155))을 이용하여 외부로 출력할 수 있다.
도 4는 헤더 데이터를 생성하여 오디오를 오프로딩 재생하는 실시예에서 각 프레임의 처리 과정을 도시한 것이다.
도 4를 참조하면, 다양한 실시예에 따르면, 디먹서(301)(de-MUXer: de-multiplexer)는 메인 프로세서(121)가 획득한 동영상 데이터를 역다중화 하여 오디오 데이터, 이미지 데이터 및 타임스탬프로 분리할 수 있다. 일 실시예에 따르면, 동영상 데이터는 오디오 데이터 및 이미지 데이터를 모두 포함할 수 있고, 이들 데이터는 다중화(MUXing: multiplexing) 처리된 상태로 디먹서(301)로 전달될 수 있다. 디먹서(301)는 역다중화 결과로 획득된 오디오 데이터를 오프로딩 컨트롤러(303)로 각각 전달할 수 있다. 디먹서(301)가 획득한 오디오 데이터(예: 제1오디오 데이터(410)) 오디오 프레임(예: 제1프레임(411) 및 제2프레임(412))
다양한 실시예에 따르면, 오프로딩 컨트롤러(303)는 수신한 제1오디오 데이터(410)를 변환할 수 있다. 일 실시예에 따르면, 디먹서(301)로부터 오프로딩 컨트롤러(303)가 수신한 오디오 데이터(예: 제1오디오 데이터(410))는 복수의 오디오 프레임(예: 제1오디오 프레임(411) 및 제2오디오 프레임(412))을 포함할 수 있다. 일 실시예에 따르면, 오프로딩 컨트롤러(303)는 제1오디오 데이터(410)에 포함된 오디오 프레임 각각(예: 제1오디오 프레임(411) 및 제2오디오 프레임(412))에 대응되는 복수의 헤더 데이터(예: 제1헤더 데이터(421), 제2헤더 데이터(422))를 추가하여, 복수의 헤더 데이터(예: 제1헤더 데이터(421), 제2헤더 데이터(422)) 및 오디오 프레임(예: 제1오디오 프레임(411) 및 제2오디오 프레임(412))을 포함하는 제2오디오 데이터(420)를 생성할 수 있다.
다양한 실시예에 따르면, 오프로딩 컨트롤러(303)는 생성된 제2오디오 데이터(420)를 오프로딩 모듈(200)로 전송할 수 있다. 헤더 데이터(421, 422)는 제1오디오 데이터(410)에 대응되는 메타 데이터를 포함할 수 있다. 일 실시예에 따르면, 오프로딩 컨트롤러(303)는 제1오디오 데이터(410)에 포함된 복수의 오디오 프레임 각각(예: 제1오디오 프레임(411) 및 제2오디오 프레임(412))에 대응하여 복수의 헤더 데이터(예: 제1헤더 데이터(421), 제2헤더 데이터(422))를 생성할 수 있다. 복수의 헤더 데이터(예: 제1헤더 데이터(421), 제2헤더 데이터(422))는 복수의 오디오 프레임 각각(예: 제1오디오 프레임(411) 및 제2오디오 프레임(412))에 대한 메타 데이터, 예를 들어 오디오 프레임의 길이 및 샘플링 주파수에 관한 정보를 포함할 수 있다. 일 실시예에 따르면, 헤더 데이터는 ADTS(오디오 데이터 전송 스트림: audio data transport stream) 형식의 데이터를 포함할 수 있다. 오프로딩 컨트롤러(303)는 제1오디오 데이터(410)가 AAC 방식으로 부호화된 오디오 프레임을 포함하는 경우 ADTS 형식의 헤더 데이터를 생성할 수 있다. 일 실시예에 따르면, 오프로딩 컨트롤러(303)는 제1오디오 데이터(410)에, 생성된 헤더 데이터를 추가하여 제2오디오 데이터(420)를 생성할 수 있다.
도 5a 및 도 5b는 헤더 데이터를 생성하여 오디오를 오프로딩 재생하는 실시예에서 헤더 데이터를 이용하여 제1시간을 획득하는 과정을 도시한 것이다.
도 5를 참조하면, 오디오 프레임의 길이, 오디오 프레임의 샘플링 주파수 및 그에 대응되는 타임 점프 임계값의 크기는 다양한 값을 가질 수 있으나, 본 문서에서는 편의상 각 오디오 프레임의 크기가 1024 byte, 샘플링 주파수가 44100Hz, 즉, 각각의 오디오 프레임 당 재생 시간이 0.023초(23ms)인 경우에 한정하여 설명하도록 한다.
도 5a를 참조하면, 일부 오디오 프레임(예: 제2오디오 프레임(512), 제3오디오 프레임(513) 및 제4오디오 프레임(514))이 손상된 제1오디오 데이터(510)가 획득된 경우를 나타낸 것일 수 있다. 이 경우 제1오디오 데이터(510)만을 기초로 오디오 프레임을 재생하는 경우, 손상된 오디오 프레임(예: 제2오디오 프레임(512), 제3오디오 프레임(513) 및 제4오디오 프레임(514))은 원활하게 재생되지 않고, 오프로딩 모듈(예: 도 2의 오프로딩 모듈(200))은 손상된 오디오 프레임들의 재생에 소요되는 시간을 제1시간에 반영하지 못할 수 있다. 이 경우 오프로딩 모듈(200)이 생성한 비정상적 제1시간 정보(520)는 총 5개의 프레임 (예: 제1오디오 프레임(511), 제2오디오 프레임(512), 제3오디오 프레임(513), 제4오디오 프레임(514) 및 제5오디오 프레임(515)) 에 걸쳐 재생이 진행되었음에도 불구하고 정상적인 2개의 오디오 프레임(예: 제1오디오 프레임(514) 및 제5오디오 프레임(515))에 대한 재생시간만이 합산되어, 46ms로 계산될 수 있다. 이 경우 비정상적 제1시간(520)에 기초하여 메인 프로세서(예: 도 2의 메인 프로세서(121))가 제2시간 정보를 생성하고, 제2시간에 대응하여 이미지 프레임을 재생하는 경우, 동영상의 음향 및 이미지의 싱크가 맞지 않을 수 있다.
도 5b를 참조하면, 제2오디오 데이터(530)는 복수의 오디오 프레임 (예: 제1오디오 프레임(511), 제2오디오 프레임(512), 제3오디오 프레임(513), 제4오디오 프레임(514) 및 제5오디오 프레임(515)) 및 각각의 오디오 프레임들에 대응되는 헤더 데이터(예: 제1헤더 데이터(531), 제2헤더 데이터(532), 제3헤더 데이터(533), 제4헤더 데이터(534) 및 제5헤더 데이터(535))를 포함할 수 있다. 다양한 실시예에 따르면, 메인 프로세서(121)는 제2오디오 데이터(530)를 생성하고, 생성된 제2오디오 데이터(530)를 오프로딩 모듈(200)로 전송할 수 있다. 메인 프로세서(121)는 동영상 데이터로부터 획득된 제1오디오 데이터(510)에 기초하여 제2오디오 데이터(530)를 생성할 수 있다. 헤더 데이터는 제1오디오 데이터에 대응되는 메타 데이터를 포함할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 제1오디오 데이터에 포함된 복수의 오디오 프레임 각각에 대응하여 복수의 헤더 데이터를 생성할 수 있다. 복수의 헤더 데이터는 복수의 오디오 프레임 각각에 대한 메타 데이터, 예를 들어 오디오 프레임의 길이 및 샘플링 주파수에 관한 정보를 포함할 수 있다. 일 실시예에 따르면, 헤더 데이터는 ADTS(오디오 데이터 전송 스트림: audio data transport stream) 형식의 데이터를 포함할 수 있다. 메인 프로세서(121)는 제1오디오 데이터(510)가 AAC 방식으로 부호화된 오디오 프레임을 포함하는 경우 ADTS 형식의 헤더 데이터를 생성할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 제1오디오 데이터(510)에, 생성된 헤더 데이터를 추가하여 제2오디오 데이터(530)를 생성할 수 있다.
다양한 실시예에 따르면, 메인 프로세서(121)는 오프로딩 모듈(200)로부터 제1시간 정보를 수신할 수 있다. 제1시간 정보는, 오프로딩 모듈(200)이 제2오디오 데이터에 포함된 복수의 오디오 프레임을 복호화하여 생성한 시간 정보일 수 있다. 제1시간 정보는 예를 들면, 오프로딩 모듈(200)이 각각의 오디오 프레임을 재생하기 위한 시간 정보일 수 있다. 일 실시예에 따르면, 제1시간 정보는 헤더 데이터에 기초하여 오프로딩 모듈(200)이 생성한 시간 정보일 수 있다. 예를 들면, 오프로딩 모듈(200)은 헤더 데이터에 포함된 오디오 프레임 길이에 관한 정보에 기초하여 제1시간 정보를 생성할 수 있다. 따라서 도 5b를 참조하면, 손상된 오디오 프레임(예: 제2오디오 프레임(512), 제3오디오 프레임(513) 및 제4오디오 프레임(514))에도 불구하고, 헤더 데이터(예: 제1헤더 데이터(531), 제2헤더 데이터(532), 제3헤더 데이터(533), 제4헤더 데이터(534) 및 제5헤더 데이터(535))에 기초하여 제1시간 정보를 생성하여, 5개의 프레임(예: 제1오디오 프레임(511), 제2오디오 프레임(512), 제3오디오 프레임(513), 제4오디오 프레임(514) 및 제5오디오 프레임(515))에 해당하는 115ms의 제1시간 정보를 생성할 수 있다.
도 6은 다양한 실시예에 따른 전자 장치가 동영상 데이터를 재생하는 동작 흐름도이다.
도 6을 참조하면, 전자 장치(예: 도 2의 전자 장치(101))가 동영상 데이터를 재생하는 일련의 동작은, 전자 장치(101)의 메인 프로세서(예: 도 2의 메인 프로세서(121))의 각 동작으로 설명될 수 있다. 이하 설명될 도 6의 각 동작은, 일부가 생략, 다른 동작으로 치환 또는 새로운 동작이 추가될 수 있으며, 순서가 서로 변경될 수 있다.
동작 601을 참조하면, 메인 프로세서(121)는 동영상 데이터를 획득할 수 있다. 동영상 데이터는, 하나 이상의 이미지 데이터 및 오디오 데이터를 포함할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 외부 전자 장치(예: 도 1의 전자 장치(102, 104) 또는 서버(108))로부터 스트리밍 데이터를 수신하고, 수신된 스트리밍 데이터 내에 포함된 동영상 데이터를 획득할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 메모리(예: 도 1의 메모리(130))에 저장된 데이터를 읽어 들여 동영상 데이터를 획득할 수 있다.
동작 602를 참조하면, 메인 프로세서(121)는 이미지 데이터 및 제1오디오 데이터를 획득할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 획득한 동영상 데이터를 역다중화(de-MUXing: de-multiplexing) 하여 동영상 데이터에 포함된 이미지 데이터, 오디오 데이터(예: 제1오디오 데이터) 및 오디오 데이터에 대응되는 타임스탬프로 분리할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)가 역다중화 하여 획득한 이미지 데이터 및 오디오 데이터(예: 제1오디오 데이터)는 각각 부호화된(encoded) 데이터일 수 있다. 일 실시예에 따르면, 이미지 데이터는 복수의 부호화된 이미지 프레임을 포함할 수 있다. 복수의 이미지 프레임은 서로 연속된 이미지를 포함할 수 있다. 일 실시예에 따르면, 제1오디오 데이터는 복수의 부호화된 오디오 프레임을 포함할 수 있다. 복수의 오디오 프레임은 서로 연속된 음향 신호를 포함할 수 있다. 일 실시예에 따르면, 제1오디오 데이터는 AAC(고급 오디오 부호화: advanced audio coding) 방식으로 부호화된 복수의 연속된 오디오 프레임을 포함할 수 있다.
동작 603을 참조하면, 메인 프로세서(121)는 제2오디오 데이터를 생성하고, 생성된 제2오디오 데이터를 오프로딩 모듈(200)로 전송할 수 있다. 메인 프로세서(121)는 동영상 데이터로부터 획득된 제1오디오 데이터에 기초하여 제2오디오 데이터를 생성할 수 있다. 제2오디오 데이터는, 제1오디오 데이터에 헤더 데이터(header data) 가 추가된 것일 수 있다. 헤더 데이터는 제1오디오 데이터에 대응되는 메타 데이터를 포함할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 제1오디오 데이터에 포함된 복수의 오디오 프레임 각각에 대응하여 복수의 헤더 데이터를 생성할 수 있다. 복수의 헤더 데이터는 복수의 오디오 프레임 각각에 대한 메타 데이터, 예를 들어 오디오 프레임의 길이 및 샘플링 주파수에 관한 정보를 포함할 수 있다. 일 실시예에 따르면, 헤더 데이터는 ADTS(오디오 데이터 전송 스트림: audio data transport stream) 형식의 데이터를 포함할 수 있다. 메인 프로세서(121)는 제1오디오 데이터가 AAC 방식으로 부호화된 오디오 프레임을 포함하는 경우 ADTS 형식의 헤더 데이터를 생성할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 제1오디오 데이터에, 생성된 헤더 데이터를 추가하여 제2오디오 데이터를 생성할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 이미지 데이터가 오디오 신호와 동시에 재생되는지 여부를 확인할 수 있다. 메인 프로세서(121)는 이미지 데이터가 오디오 신호와 동시에 재생됨을 확인하는 경우, 헤더 데이터를 추가하여 제2오디오 데이터를 생성할 수 있다.
동작 604를 참조하면, 메인 프로세서(121)는 오프로딩 모듈(200)로부터 제1시간 정보를 수신할 수 있다. 제1시간 정보는, 오프로딩 모듈(200)이 제2오디오 데이터에 포함된 복수의 오디오 프레임을 복호화하여 생성한 시간 정보일 수 있다. 제1시간 정보는 예를 들면, 오프로딩 모듈(200)이 각각의 오디오 프레임을 재생하기 위한 시간 정보일 수 있다. 일 실시예에 따르면, 제1시간 정보는 헤더 데이터에 기초하여 오프로딩 모듈(200)이 생성한 시간 정보일 수 있다. 예를 들면, 오프로딩 모듈(200)은 헤더 데이터에 포함된 오디오 프레임 길이에 관한 정보에 기초하여 제1시간 정보를 생성할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 오프로딩 모듈(200)로부터 연속적으로 및/또는 주기적으로 제1시간 정보를 수신할 수 있다.
동작 605를 참조하면, 메인 프로세서(121)는 제1시간 정보에 기초하여 제2시간 정보를 생성할 수 있다. 제2시간 정보는, 메인 프로세서(121)가 이미지 데이터를 재생하기 위하여 이용하는 시간 정보를 의미할 수 있다. 제2시간 정보는, 예를 들면, 미리 설정된 기준 시간에, 제1시간 정보를 가산한 시간 정보를 포함할 수 있다. 기준 시간은 미리 설정되어 저장된 값일 수 있으며, 메인 프로세서(121)는 기준 시간을 변경할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 기준 시간에 제1시간 정보를 가산하여 제2시간 정보를 생성할 수 있다.
동작 606을 참조하면, 메인 프로세서(121)는 제2시간에 기초하여 이미지 데이터를 재생할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 이미지 데이터에 포함된 복수의 이미지 프레임을 복호화 하고, 디스플레이 모듈(예: 도 1의 디스플레이 모듈(160))을 이용하여 외부에 출력할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 복수의 이미지 프레임 각각을, 대응되는 싱크(sync)에 해당하는 오디오 프레임과 동시에 재생하기 위하여 제2시간 정보에 기초하여 이미지 데이터를 재생할 수 있다.
도 7은 다양한 실시예에 따른 전자 장치가 AAC 방식으로 부호화된 오디오 데이터가 포함된 동영상 데이터를 재생하는 동작 흐름도이다.
도 7을 참조하면, 전자 장치(예: 도 2의 전자 장치(101))가 AAC 방식으로 부호화된 오디오 데이터가 포함된 동영상 데이터를 재생하는 일련의 동작은, 전자 장치(101)의 메인 프로세서(예: 도 2의 메인 프로세서(121))의 각 동작으로 설명될 수 있다. 이하 설명될 도 7의 각 동작은, 일부가 생략, 다른 동작으로 치환 또는 새로운 동작이 추가될 수 있으며, 순서가 서로 변경될 수 있다.
동작 701을 참조하면, 메인 프로세서(121)는 제1오디오 데이터가 AAC 방식으로 부호화된 데이터인지 여부를 확인할 수 있다. 메인 프로세서(121)는 획득된 제1오디오 데이터의 부호화 정보를 읽어 들여 AAC 방식으로 부호화된 오디오 프레임을 포함하는지 여부를 확인할 수 있다. 예를 들면, 메인 프로세서(121)는 헤더 정보를 파싱하여 획득한 정보에 기초하여 제1오디오 데이터가 AAC 방식으로 부호화된 오디오 프레임을 포함하는지 여부를 확인할 수 있다.
동작 702 및 동작 703을 참조하면, 메인 프로세서(121)는 오프로딩 모듈(200)이 ADTS 형식의 데이터를 지원하는지 여부를 확인할 수 있다. 예를 들면, 메인 프로세서(121)는 오프로딩 모듈(200)로부터 수신한 오디오 재생 관련 신호에 기초하여 오프로딩 모듈(200)이 ADTS 형식의 데이터를 읽어들이고 복호화 및 재생할 수 있는지 여부를 확인할 수 있다. 또 다른 예를 들면, 메인 프로세서(121)는 메모리(예: 도 1의 메모리(130))에 미리 저장된 정보에 기초하여 오프로딩 모듈(200)이 ADTS 형식의 데이터를 지원하는지 여부를 확인할 수 있다. 메인 프로세서(121)는 오프로딩 모듈(200)이 ADTS 형식의 데이터를 지원하는지 여부에 기초하여, ADTS 형식의 데이터를 지원하는 경우 동작 704로 진행하고, 그렇지 않은 경우 재생 동작을 종료할 수 있다.
동작 704를 참조하면, 메인 데이터(121)는 헤더 데이터를 제1오디오 데이터에 추가할 수 있다. 메인 프로세서(121)는 제2오디오 데이터를 생성하고, 생성된 제2오디오 데이터를 오프로딩 모듈(200)로 전송할 수 있다. 메인 프로세서(121)는 동영상 데이터로부터 획득된 제1오디오 데이터에 기초하여 제2오디오 데이터를 생성할 수 있다. 제2오디오 데이터는, 제1오디오 데이터에 헤더 데이터(header data) 가 추가된 것일 수 있다. 헤더 데이터는 제1오디오 데이터에 대응되는 메타 데이터를 포함할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 제1오디오 데이터에 포함된 복수의 오디오 프레임 각각에 대응하여 복수의 헤더 데이터를 생성할 수 있다. 복수의 헤더 데이터는 복수의 오디오 프레임 각각에 대한 메타 데이터, 예를 들어 오디오 프레임의 길이 및 샘플링 주파수에 관한 정보를 포함할 수 있다. 일 실시예에 따르면, 헤더 데이터는 ADTS(오디오 데이터 전송 스트림: audio data transport stream) 형식의 데이터를 포함할 수 있다. 메인 프로세서(121)는 제1오디오 데이터가 AAC 방식으로 부호화된 오디오 프레임을 포함하는 경우 ADTS 형식의 헤더 데이터를 생성할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 제1오디오 데이터에, 생성된 헤더 데이터를 추가하여 제2오디오 데이터를 생성할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 이미지 데이터가 오디오 신호와 동시에 재생되는지 여부를 확인할 수 있다. 메인 프로세서(121)는 이미지 데이터가 오디오 신호와 동시에 재생됨을 확인하는 경우, 헤더 데이터를 추가하여 제2오디오 데이터를 생성할 수 있다.
동작 705를 참조하면, 메인 프로세서(121)는 생성된 제2오디오 데이터를 오프로딩 모듈(200)로 전달할 수 있다.
도 8은 타임 점프(time jump)가 발생한 실시예를 나타낸 것이다.
도 8을 참조하면, 도 5를 참조하면, 오디오 프레임의 길이, 오디오 프레임의 샘플링 주파수 및 그에 대응되는 타임 점프 임계값의 크기는 다양한 값을 가질 수 있으나, 본 문서에서는 편의상 각 오디오 프레임의 크기가 1024 byte, 샘플링 주파수가 44100Hz, 즉, 각각의 오디오 프레임 당 재생 시간이 0.023초(23ms)인 경우에 한정하여 설명하도록 한다.
다양한 실시예에 따르면, 타임 점프는, 복수의 오디오 프레임 각각에 대응하는 타임스탬프 간의 간격이 일정하지 않게 되는 이벤트로 이해될 수 있다. 일 실시예에 따르면, 제1오디오 데이터(810)는 복수의 연속된 오디오 프레임(예: (예: 제1오디오 프레임(811), 제2오디오 프레임(812), 제3오디오 프레임(813) 및 제4오디오 프레임(814))을 포함하고, 복수의 오디오 프레임 각각에 대응되는 타임스탬프(820)를 포함할 수 있다. 타임 스탬프(820)는, 각각의 오디오 프레임(예: 제1오디오 프레임(811), 제2오디오 프레임(812), 제3오디오 프레임(813) 및 제4오디오 프레임(814))에 대응되는 시간 정보를 포함할 수 있다. 일 실시예에 따르면, 메인 프로세서(예: 도 2의 메인 프로세서(121))는 연속된 2개의 오디오 프레임(예: 제2오디오 프레임(812) 및 제3오디오 프레임(813))에 대응되는 타임스탬프 간의 차이값의, 타임 점프 임계값과의 비교에 기초하여 타임 점프(830) 발생 여부를 확인할 수 있다. 일 실시예에 따르면, 타임 점프 임계값은 오디오 프레임 길이 및 프레임 샘플링 주파수 값에 기초하여 계산될 수 있다. 예를 들어, 오디오 프레임 길이를 샘플링 주파수로 나눈 값은, 연속된 타임스탬프가 가지는 일정한 차이값과 오차 범위 내에서 동일한 값을 가질 수 있다. 일 실시예에 따르면, 오디오 프레임 길이가 일정하지 않은 경우, 메인 프로세서(121)는 미리 정해진 값을 타임 점프 임계값으로 설정할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 연속된 2개의 타임스탬프 간의 차이값이 타임 점프 임계값보다 큰 경우 타임 점프(830)가 발생한 것으로 판단할 수 있다. 본 문서에서는 편의상 각 샘플 크기가 1024 byte, 샘플링 주파수가 44100Hz, 즉, 타임 점프 임계값이 0.023초(23ms)인 경우에 한정하여 설명하도록 한다. 도 8을 참조하면, 타임 점프 임계값은 23ms로 설정될 수 있다. 일 실시예에 따르면, 타임 점프 임계값은 일정한 범위 이내의 오차범위를 적용하여 23ms보다, 일정 비율 이내에서 더 크거나 작을 수 있다. 도 8을 참조하면, 제3오디오 프레임(813)에 대응되는 제3타임스탬프의 값(예: 2320ms) 및 제2오디오 프레임(812))에 대응되는 제2타임스탬프의 값(예: 23ms)의 차이는 타임 점프 임계값인 23ms를 초과하므로, 타임 점프 이벤트(830)가 발생한 것이며, 메인 프로세서(121)는 타임 점프를 감지할 있다.
도 9는 타임 점프가 발생한 실시예에서 동영상 데이터를 재생하는 과정을 도시한 것이다.
도 9를 참조하면, 디먹서(301)로부터 제1오디오 정보(910) 및 제1오디오 정보(910)에 포함된 복수의 오디오 프레임(예: 제1오디오 프레임(911), 제2오디오 프레임(912) 및 제3오디오 프레임(913)) 및 각 오디오 프레임들에 대응되는 타임스탬프(920)를 수신한 오프로딩 컨트롤러(303)는 타임 점프(930)가 발생하였는지 여부를 확인할 수 있다.
도 9를 참조하면, 오프로딩 컨트롤러(303)는 타임 점프가 발생한 경우 오프로딩 모듈(200)에 대한 오디오 프레임 전송을 중단할 수 있다. 예를 들어, 연속된 2개의 오디오 프레임, 즉, 제2오디오 프레임(912) 및 제3오디오 프레임(913) 사이에 타임 점프가 확인되는 경우, 오프로딩 컨트롤러(303)는 제2오디오 프레임(912)까지 오프로딩 모듈(200)로 전송한 뒤, 제3오디오 프레임(913)을 전송하지 않고, 오디오 프레임 전송을 중단(931)할 수 있다. 이 경우, 제2타임스탬프(예: 23ms) 및 제3타임스탬프(예: 2320ms)의 차이값이 타임 점프 임계값(예: 23ms)을 초과하는 경우일 수 있고, 제3타임스탬프에 대응되는 제3오디오 프레임(913)은 '타임 점프가 발생한 오디오 프레임'으로 지칭될 수 있다.
다양한 실시예에 따르면, 오프로딩 컨트롤러(303)는 오프로딩 모듈(200)로부터 재생 완료 정보를 수신할 수 있다. 일 실시예에 따르면, 오프로딩 모듈(200)은 오프로딩 컨트롤러(303)로부터 수신한 오디오 프레임을 모두 복호화하는 경우 재생 완료 정보를 생성하고, 오프로딩 컨트롤러(303)로 전송할 수 있다. 일 실시예에 따르면, 오프로딩 컨트롤러(303)는 제3오디오 프레임(913) 전 중단(931)과 함께 오프로딩 모듈(200)로 오디오 재생을 중단하도록 하는 신호를 전송할 수 있다. 오디오 재생을 중단하도록 하는 신호는, 오프로딩 모듈(200)로 전달할 오디오 데이터가 더 이상 없다는 신호를 포함할 수 있다. 오프로딩 모듈(200)이 생성 및 오프로딩 컨트롤러(303)로 전송하는 재생 완료 정보는 오디오 재생을 중단하도록 하는 신호(예: 더 이상 전달할 오디오 데이터가 없다는 신호)에 대응되어 오프로딩 모듈(200)에서 생성한 신호일 수 있다.
다양한 실시예에 따르면, 오프로딩 컨트롤러(303)는 기준 시간을 변경할 수 있다. 일 실시예에 따르면, 오프로딩 컨트롤러(303)는 타임 점프가 발생한 오디오 프레임(예: 제3오디오 프레임(913)에 대응되는 타임스탬프(예: 제3타임스탬프) 값에 기초하여 기준 시간을 변경할 수 있다. 기준 시간은 초기값이 0으로 설정된 상태일 수 있고, 또는, 초기값에서 이미 변경된 값일 수 있다. 일 실시예에 따르면, 오프로딩 컨트롤러(303)는 제3타임스탬프(2320) 값에 기초하여, 기준 시간을 변경할 수 있다. 예를 들어, 오프로딩 컨트롤러(303)는 기준 시간에 타임 점프가 발생한 제3타임스탬프 값을 가산하여 기준 시간을 변경할 수 있다. 도 9를 참조하면, 오프로딩 컨트롤러(303)는 초기값이 0으로 설정되어 있던 기준 시간을 제3타임스탬프에 기초하여 2320ms로 변경할 수 있다.
다양한 실시예에 따르면, 오프로딩 컨트롤러(303)는 오디오 프레임 전송을 재개할 수 있다. 기준 시간을 변경한 오프로딩 컨트롤러(303)는 오프로딩 모듈(200)로 오디오 프레임을 다시 전송(932)할 수 있다. 일 실시예에 따르면, 미디어 클락(306)은 변경된 오프로딩 컨트롤러(303)로부터 수신한 기준 시간 변경에 관한 정보에 기초하여, 기준 시간을 업데이트 하거나 기준 시간을 변경할 수 있다. 미디어 클락(306)은 오프로딩 모듈(200)로부터 수신한 제1시간 정보를 변경된 기준 시간에 가산하여 제2시간 정보를 생성할 수 있다. 오프로딩 컨트롤러(303)는 생성한 제2시간 정보에 기초하여 이미지 데이터를 재생할 수 있다.
도 10은 다양한 실시예에 따른 전자 장치가 타임 점프가 발생한 동영상 데이터를 재생하는 동작 흐름도이다.
도 10을 참조하면, 전자 장치(예: 도 2의 전자 장치(101))가 타임 점프가 발생한 동영상 데이터를 재생하는 일련의 동작은, 전자 장치(101)의 메인 프로세서(예: 도 2의 메인 프로세서(121))의 각 동작으로 설명될 수 있다. 이하 설명될 도 10의 각 동작은, 일부가 생략, 다른 동작으로 치환 또는 새로운 동작이 추가될 수 있으며, 순서가 서로 변경될 수 있다.
동작 1001을 참조하면, 메인 프로세서(121)는 오프로딩 모듈(예: 도 2의 오프로딩 모듈(200))로 오디오 프레임을 전송할 수 있다. 일 실시예에 따르면, 오디오 프레임은, 동영상 데이터를 역다중화 하여 획득한 오디오 데이터(예: 제1오디오 데이터)에 포함된 복수의 연속된 프레임을 포함할 수 있다. 복수의 오디오 프레임은 부호화된 상태일 수 있다.
동작 1002를 참조하면, 메인 프로세서(121)는 타임 점프(time jump)가 발생하였는지 여부를 확인할 수 있다. 타임 점프는, 복수의 오디오 프레임 각각에 대응하는 타임스탬프 간의 간격이 일정하지 않게 되는 이벤트로 이해될 수 있다. 일 실시예에 따르면, 제1오디오 데이터는 복수의 연속된 오디오 프레임을 포함하고, 타임스탬프는 복수의 오디오 프레임 각각에 대응되는 복수의 데이터를 포함할 수 있다. 타임 스탬프는, 각각의 오디오 프레임에 대응되는 시간 정보를 포함할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 연속된 오디오 프레임(예: 제1오디오 프레임 및 제2오디오 프레임)에 대응되는 타임스탬프들(예: 제1타임스탬프 및 제2타임스탬프) 간의 차이값의, 타임 점프 임계값과의 비교에 기초하여 타임 점프 발생 여부를 확인할 수 있다. 일 실시예에 따르면, 타임 점프 임계값은 오디오 프레임 길이 및 프레임 샘플링 주파수 값에 기초하여 계산될 수 있다. 예를 들어, 오디오 프레임 길이를 샘플링 주파수로 나눈 값은, 연속된 타임스탬프가 가지는 일정한 차이값과 오차 범위 내에서 동일한 값을 가질 수 있다. 일 실시예에 따르면, 오디오 프레임 길이가 일정하지 않은 경우, 메인 프로세서(121)는 미리 정해진 값을 타임 점프 임계값으로 설정할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 연속된 2개의 타임스탬프 간의 차이값이 타임 점프 임계값보다 큰 경우 타임 점프가 발생한 것으로 판단할 수 있다. 오디오 프레임의 길이, 오디오 프레임의 샘플링 주파수 및 그에 대응되는 타임 점프 임계값의 크기는 다양한 값을 가질 수 있으나, 본 문서에서는 편의상 각 샘플 크기가 1024 byte, 샘플링 주파수가 44100Hz, 즉, 타임 점프 임계값이 0.023초(23ms)인 경우에 한정하여 설명하도록 한다. 만약, 타임 점프가 발생하는 경우, 프로세스는 동작 1003으로 진행하고, 타임 점프가 발생하지 않는 경우, 프로세스는 동작 1001로 진행할 수 있다.
동작 1003을 참조하면, 메인 프로세서(121)는 타임 점프가 발생한 경우 오프로딩 모듈(200)에 대한 오디오 프레임 전송을 중단할 수 있다. 예를 들어, 연속된 2개의 오디오 프레임, 즉, 제1오디오 프레임 및 제2오디오 프레임 사이에 타임 점프가 확인되는 경우, 메인 프로세서(121)는 제1오디오 프레임까지 오프로딩 모듈(200)로 전송한 뒤, 제2오디오 프레임의 전송을 중단할 수 있다. 이 경우, 제1타임스탬프 및 제2타임스탬프의 차이값이 타임 점프 임계값을 초과하는 경우일 수 있고, 제2타임스탬프에 대응되는 제2오디오 프레임은 '타임 점프가 발생한 오디오 프레임'으로 지칭될 수 있다.
동작 1004를 참조하면, 메인 프로세서(121)는 오프로딩 모듈(200)로부터 재생 완료 정보를 수신할 수 있다. 일 실시예에 따르면, 오프로딩 모듈(200)은 메인 프로세서(121)로부터 수신한 오디오 프레임을 모두 복호화하는 경우 재생 완료 정보를 생성하고, 생성된 재생 완료 정보를 메인 프로세서(121)로 전송할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 제2오디오 프레임 전송을 중단한 뒤 오프로딩 모듈(200)로 오디오 재생을 중단하도록 하는 신호를 전송할 수 있다. 오디오 재생을 중단하도록 하는 신호는, 오프로딩 모듈(200)로 전달할 오디오 데이터가 더 이상 없다는 신호를 포함할 수 있다. 재생 완료 정보는 오디오 재생을 중단하도록 하는 신호(예: 더 이상 전달할 오디오 데이터가 없다는 신호)에 대응되어 오프로딩 모듈(200)에서 생성한 신호일 수 있다.
동작 1005를 참조하면, 메인 프로세서(121)는 기준 시간을 변경할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 타임 점프가 발생한 오디오 프레임에 대응되는 타임스탬프(예: 제2타임스탬프) 값에 기초하여 기준 시간을 변경할 수 있다. 기준 시간은 초기값이 0으로 설정된 상태일 수 있고, 또는, 초기값에서 이미 변경된 값일 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 제2타임스탬프 값에 기초하여, 기준 시간을 변경할 수 있다. 예를 들어, 메인 프로세서(121)는 기준 시간에 타임 점프가 발생한 제2타임스탬프 값을 가산하여 기준 시간을 변경할 수 있다.
동작 1006을 참조하면, 메인 프로세서(121)는 오디오 프레임 전송을 재개할 수 있다. 기준 시간을 변경한 메인 프로세서(121)는 오프로딩 모듈(200)로 오디오 프레임을 다시 전송할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 오프로딩 모듈(200)이, 수신한 오디오 프레임에 기초하여 생성 및 전송하는 제1시간 정보를 변경된 기준 시간에 가산하여 제2시간 정보를 생성할 수 있다. 메인 프로세서(121)는 생성한 제2시간 정보에 기초하여 이미지 데이터를 재생할 수 있다.
도 11은 다양한 실시예에 따른 전자 장치가 타임 점프가 발생한 동영상 데이터를 재생할 때의 신호전달도이다.
동작 1101을 참조하면, 메인 프로세서(121)는 오프로딩 모듈(예: 도 2의 오프로딩 모듈(200))로 오디오 프레임을 전송할 수 있다. 일 실시예에 따르면, 오디오 프레임은, 동영상 데이터를 역다중화 하여 획득한 오디오 데이터(예: 제1오디오 데이터)에 포함된 복수의 연속된 프레임을 포함할 수 있다. 복수의 오디오 프레임은 부호화된 상태일 수 있다.
동작 1102를 참조하면, 오프로딩 모듈(200)는 제1시간 정보를 생성할 수 있다. 제1시간 정보는, 오프로딩 모듈(200)이 제2오디오 데이터에 포함된 복수의 오디오 프레임을 복호화하여 생성한 시간 정보일 수 있다. 제1시간 정보는 예를 들면, 오프로딩 모듈(200)이 각각의 오디오 프레임을 재생하기 위한 시간 정보일 수 있다. 일 실시예에 따르면, 제1시간 정보는 헤더 데이터에 기초하여 오프로딩 모듈(200)이 생성한 시간 정보일 수 있다. 예를 들면, 오프로딩 모듈(200)은 헤더 데이터에 포함된 오디오 프레임 길이에 관한 정보에 기초하여 제1시간 정보를 생성할 수 있다.
동작 1103을 참조하면, 실시예에 따르면, 메인 프로세서(121)는 오프로딩 모듈(200)로부터 제1시간 정보를 수신할 수 있다. 오프로딩 모듈(200)은 메인 프로세서(121)로 제1시간 정보를 전송할 수 있다.
동작 1104를 참조하면, 메인 프로세서(121)는 제1시간 정보에 기초하여 제2시간 정보를 생성하고, 생성된 제2시간 정보에 기초하여 이미지 데이터를 재생할 수 있다. 제2시간 정보는, 예를 들면, 미리 설정된 기준 시간에, 제1시간 정보를 가산한 시간 정보를 포함할 수 있다. 기준 시간은 미리 설정되어 저장된 값일 수 있으며, 메인 프로세서(121)는 기준 시간을 변경할 수 있다.
동작 1105를 참조하면, 메인 프로세서(121)는 제2시간에 기초하여 이미지 데이터를 재생할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 이미지 데이터에 포함된 복수의 이미지 프레임을 복호화 하고, 디스플레이 모듈(예: 도 1의 디스플레이 모듈(160))(예: 도 2의 출력 모듈(210))을 이용하여 외부에 출력할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 복수의 이미지 프레임 각각을, 대응되는 싱크(sync)에 해당하는 오디오 프레임과 동시에 재생하기 위하여 제2시간 정보에 기초하여 이미지 데이터를 재생할 수 있다.
동작 1106을 참조하면, 실시예에 따르면, 메인 프로세서(121)는 타임 점프(time jump)가 발생하였는지 여부를 확인할 수 있다. 타임 점프는, 복수의 오디오 프레임 각각에 대응하는 타임스탬프 간의 간격이 일정하지 않게 되는 이벤트로 이해될 수 있다. 일 실시예에 따르면, 제1오디오 데이터는 복수의 연속된 오디오 프레임을 포함하고, 타임스탬프는 복수의 오디오 프레임 각각에 대응되는 복수의 데이터를 포함할 수 있다. 타임 스탬프는, 각각의 오디오 프레임에 대응되는 시간 정보를 포함할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 연속된 오디오 프레임(예: 제1오디오 프레임 및 제2오디오 프레임)에 대응되는 타임스탬프들(예: 제1타임스탬프 및 제2타임스탬프) 간의 차이값의, 타임 점프 임계값과의 비교에 기초하여 타임 점프 발생 여부를 확인할 수 있다. 일 실시예에 따르면, 타임 점프 임계값은 오디오 프레임 길이 및 프레임 샘플링 주파수 값에 기초하여 계산될 수 있다. 예를 들어, 오디오 프레임 길이를 샘플링 주파수로 나눈 값은, 연속된 타임스탬프가 가지는 일정한 차이값과 오차 범위 내에서 동일한 값을 가질 수 있다. 일 실시예에 따르면, 오디오 프레임 길이가 일정하지 않은 경우, 메인 프로세서(121)는 미리 정해진 값을 타임 점프 임계값으로 설정할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 연속된 2개의 타임스탬프 간의 차이값이 타임 점프 임계값보다 큰 경우 타임 점프가 발생한 것으로 판단할 수 있다. 오디오 프레임의 길이, 오디오 프레임의 샘플링 주파수 및 그에 대응되는 타임 점프 임계값의 크기는 다양한 값을 가질 수 있으나, 본 문서에서는 편의상 각 샘플 크기가 1024 byte, 샘플링 주파수가 44100Hz, 즉, 타임 점프 임계값이 0.023초(23ms)인 경우에 한정하여 설명하도록 한다.
동작 1107을 참조하면, 메인 프로세서(121)는 타임 점프가 발생한 경우 오프로딩 모듈(200)에 대한 오디오 프레임 전송을 중단할 수 있다. 예를 들어, 연속된 2개의 오디오 프레임, 즉, 제1오디오 프레임 및 제2오디오 프레임 사이에 타임 점프가 확인되는 경우, 메인 프로세서(121)는 제1오디오 프레임까지 오프로딩 모듈(200)로 전송한 뒤, 제2오디오 프레임의 전송을 중단할 수 있다. 이 경우, 제1타임스탬프 및 제2타임스탬프의 차이값이 타임 점프 임계값을 초과하는 경우일 수 있고, 제2타임스탬프에 대응되는 제2오디오 프레임은 '타임 점프가 발생한 오디오 프레임'으로 지칭될 수 있다.
동작 1108을 참조하면, 메인 프로세서(121)는 오프로딩 모듈(200)로부터 재생 완료 정보를 수신할 수 있다. 일 실시예에 따르면, 오프로딩 모듈(200)은 메인 프로세서(121)로부터 수신한 오디오 프레임을 모두 복호화하는 경우 재생 완료 정보를 생성하고, 생성된 재생 완료 정보를 메인 프로세서(121)로 전송할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 제2오디오 프레임 전송을 중단한 뒤 오프로딩 모듈(200)로 오디오 재생을 중단하도록 하는 신호를 전송할 수 있다. 오디오 재생을 중단하도록 하는 신호는, 오프로딩 모듈(200)로 전달할 오디오 데이터가 더 이상 없다는 신호를 포함할 수 있다. 재생 완료 정보는 오디오 재생을 중단하도록 하는 신호(예: 더 이상 전달할 오디오 데이터가 없다는 신호)에 대응되어 오프로딩 모듈(200)에서 생성한 신호일 수 있다.
동작 1109를 참조하면, 메인 프로세서(121)는 기준 시간을 변경할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 타임 점프가 발생한 오디오 프레임에 대응되는 타임스탬프(예: 제2타임스탬프) 값에 기초하여 기준 시간을 변경할 수 있다. 기준 시간은 초기값이 0으로 설정된 상태일 수 있고, 또는, 초기값에서 이미 변경된 값일 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 제2타임스탬프 값에 기초하여, 기준 시간을 변경할 수 있다. 예를 들어, 메인 프로세서(121)는 기준 시간에 타임 점프가 발생한 제2타임스탬프 값을 가산하여 기준 시간을 변경할 수 있다.
동작 1110을 참조하면, 메인 프로세서(121)는 오디오 프레임 전송을 재개할 수 있다. 기준 시간을 변경한 메인 프로세서(121)는 오프로딩 모듈(200)로 오디오 프레임을 다시 전송할 수 있다.
동작 1111, 동작 1112 및 동작 1113을 참조하면, 메인 프로세서(121)는 제1시간 정보를 오프로딩 모듈(200)로부터 다시 수신하고(동작 1111), 메인 프로세서(121)는 변경된 기준시간 정보에 수신한 제1시간 정보를 가산하여 제2시간 정보를 생성하고(동작 1112), 제2시간 정보에 기초하여 이미지를 재생할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 오프로딩 모듈(200)이, 수신한 오디오 프레임에 기초하여 생성 및 전송하는 제1시간 정보를 변경된 기준 시간에 가산하여 제2시간 정보를 생성할 수 있다. 메인 프로세서(121)는 생성한 제2시간 정보에 기초하여 이미지 데이터를 재생할 수 있다.
도 12는 다양한 실시예에 따른 전자 장치가 외부 전자 장치를 이용하여 오프로딩 재생을 수행할 때의 동작 흐름도이다.
도 12을 참조하면, 전자 장치(예: 도 2의 전자 장치(101))가 외부 전자 장치(예: 도 1의 전자 장치(102))를 이용하여 오프로딩 재생을 수행하는 일련의 동작은, 전자 장치(101)의 메인 프로세서(예: 도 2의 메인 프로세서(121))의 각 동작으로 설명될 수 있다. 이하 설명될 도 12의 각 동작은, 일부가 생략, 다른 동작으로 치환 또는 새로운 동작이 추가될 수 있으며, 순서가 서로 변경될 수 있다.
동작 1201을 참조하면, 메인 프로세서(121)는 제1오디오 데이터가 AAC 방식으로 부호화된 데이터인지 여부를 확인할 수 있다. 메인 프로세서(121)는 획득된 제1오디오 데이터의 부호화 정보를 읽어 들여 AAC 방식으로 부호화된 오디오 프레임을 포함하는지 여부를 확인할 수 있다. 예를 들면, 메인 프로세서(121)는 헤더 정보를 파싱하여 획득한 정보에 기초하여 제1오디오 데이터가 AAC 방식으로 부호화된 오디오 프레임을 포함하는지 여부를 확인할 수 있다. 만약, 제1오디오 데이터가 AAC 방식으로 부호화된 오디오 데이터가 아닌 경우, 동작은 종료되고, 제1오디오 데이터가 AAC 방식으로 부호화된 데이터인 경우 프로세스는 동작 1202로 진행할 수 있다.
동작 1202 및 동작 1203을 참조하면, 메인 프로세서(121)는 외부 전자 장치(102)가 ADTS 형식의 데이터를 지원하는지 여부를 확인할 수 있다. 예를 들면, 메인 프로세서(121)는 외부 전자 장치(102)로부터 수신한 오디오 재생 관련 신호에 기초하여 외부 전자 장치(102)가 ADTS 형식의 데이터를 읽어들이고 복호화 및 재생할 수 있는지 여부를 확인할 수 있다. 또 다른 예를 들면, 메인 프로세서(121)는 메모리(예: 도 1의 메모리(130))에 미리 저장된 정보에 기초하여 외부 전자 장치(102)가 ADTS 형식의 데이터를 지원하는지 여부를 확인할 수 있다. 메인 프로세서(121)는 외부 전자 장치(102)가 ADTS 형식의 데이터를 지원하는지 여부에 기초하여, ADTS 형식의 데이터를 지원하는 경우 동작 1204로 진행하고, 그렇지 않은 경우 재생 동작을 종료할 수 있다.
동작 1204를 참조하면, 메인 데이터(121)는 헤더 데이터를 제1오디오 데이터에 추가할 수 있다. 메인 프로세서(121)는 제2오디오 데이터를 생성하고, 생성된 제2오디오 데이터를 외부 전자 장치(102)로 전송할 수 있다. 메인 프로세서(121)는 동영상 데이터로부터 획득된 제1오디오 데이터에 기초하여 제2오디오 데이터를 생성할 수 있다. 제2오디오 데이터는, 제1오디오 데이터에 헤더 데이터(header data) 가 추가된 것일 수 있다. 헤더 데이터는 제1오디오 데이터에 대응되는 메타 데이터를 포함할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 제1오디오 데이터에 포함된 복수의 오디오 프레임 각각에 대응하여 복수의 헤더 데이터를 생성할 수 있다. 복수의 헤더 데이터는 복수의 오디오 프레임 각각에 대한 메타 데이터, 예를 들어 오디오 프레임의 길이 및 샘플링 주파수에 관한 정보를 포함할 수 있다. 일 실시예에 따르면, 헤더 데이터는 ADTS(오디오 데이터 전송 스트림: audio data transport stream) 형식의 데이터를 포함할 수 있다. 메인 프로세서(121)는 제1오디오 데이터가 AAC 방식으로 부호화된 오디오 프레임을 포함하는 경우 ADTS 형식의 헤더 데이터를 생성할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 제1오디오 데이터에, 생성된 헤더 데이터를 추가하여 제2오디오 데이터를 생성할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 이미지 데이터가 오디오 신호와 동시에 재생되는지 여부를 확인할 수 있다. 메인 프로세서(121)는 이미지 데이터가 오디오 신호와 동시에 재생됨을 확인하는 경우, 헤더 데이터를 추가하여 제2오디오 데이터를 생성할 수 있다.
동작 1205를 참조하면, 메인 프로세서(121)는 생성된 제2오디오 데이터를 외부 전자 장치(102)로 전송할 수 있다. 일 실시예에 따르면, 메인 프로세서(121)는 통신 모듈(예: 도 1의 통신 모듈(190))을 이용하여 외부 전자 장치(102)로 제2오디오 데이터를 전송할 수 있다.
본 문서의 다양한 실시예에 따른 전자 장치는, 적어도 하나의 보조 프로세서, 상기 적어도 하나의 보조 프로세서와 작동적으로(operatively) 연결되는 메인 프로세서를 포함하고, 상기 메인 프로세서는, 동영상 데이터를 획득하고, 상기 동영상 데이터를 복수의 연속된 이미지 프레임을 포함하는 이미지 데이터, 복수의 연속된 오디오 프레임을 포함하는 제1오디오 데이터 및 상기 복수의 연속된 오디오 프레임 각각에 대응되는 복수의 타임스탬프로 분리하고, 상기 제1오디오 데이터를 이용하여, 상기 복수의 오디오 프레임 각각에 헤더 데이터(header data)를 추가하여 제2오디오 데이터를 생성하고, 상기 적어도 하나의 보조 프로세서로 상기 제2오디오 데이터를 전송하고, 상기 적어도 하나의 보조 프로세서로부터 연속적으로 수신한 제1시간 정보에 기초하여 제2시간 정보를 생성하고, 상기 제2시간 정보에 기초하여 상기 이미지 데이터를 재생하도록 설정되며, 상기 적어도 하나의 보조 프로세서는, 상기 수신한 제2오디오 데이터를 기초로 오디오 신호를 재생하고, 상기 헤더 데이터에 기초하여 상기 오디오 신호 재생 시간에 관한 상기 제1시간 정보를 생성하도록 설정될 수 있다.
또한, 상기 복수의 오디오 프레임은, AAC(고급 오디오 부호화: advanced audio coding) 방식으로 부호화될 수 있다.
또한, 상기 헤더 데이터는 ADTS(오디오 데이터 전송 스트림: audio data transport stream) 형식의 데이터를 포함할 수 있다.
또한, 상기 헤더 데이터는 대응되는 오디오 프레임 각각의 데이터 길이 정보를 적어도 포함할 수 있다.
또한, 상기 메인 프로세서는, 상기 제1오디오 데이터가 AAC 방식으로 부호화된 오디오 프레임을 포함하는 경우, 상기 이미지 데이터가 상기 오디오 신호와 동시에 재생되는지 여부를 확인하고, 상기 적어도 하나의 보조 프로세서가 ADTS 형식의 데이터를 지원하는지 여부를 확인하고, 상기 이미지 데이터가 상기 오디오 신호와 동시에 재생되며, 상기 적어도 하나의 보조 프로세서가 ADTS 형식의 데이터를 지원하는 경우, 상기 제1오디오 데이터에 상기 헤더 데이터를 추가하여 상기 제2오디오 데이터를 생성하도록 설정될 수 있다.
또한, 상기 메인 프로세서는, 상기 복수의 타임스탬프 가운데 제1오디오 프레임에 대응되는 제1타임스탬프 및 상기 제1오디오 프레임과 연속된 제2오디오 프레임에 대응되는 제2타임스탬프의 비교에 기초하여 타임 점프 발생 여부를 확인하고, 상기 타임 점프가 발생한 경우, 상기 제2타임스탬프에 기초하여 상기 제2시간 정보를 변경하도록 설정될 수 있다.
또한, 상기 메인 프로세서는, 상기 제2타임스탬프 및 상기 제1타임스탬프의 차이값을 계산하고, 상기 차이값이 타임 점프 임계값보다 큰 경우, 상기 타임 점프가 발생한 것으로 판단하도록 설정될 수 있다.
또한, 상기 메인 프로세서는, 상기 복수의 오디오 프레임의 크기 및 상기 오디오 프레임의 샘플링 주파수에 기초하여 상기 타임 점프 임계값을 계산하도록 설정될 수 있다.
또한, 상기 메인 프로세서는, 상기 타임 점프가 발생한 경우, 상기 적어도 하나의 보조 프로세서로 상기 제1오디오 프레임 전송 후 상기 제2오디오 프레임 전송을 중단하고, 상기 적어도 하나의 보조 프로세서로부터 재생 완료 정보를 수신하고, 상기 제2타임스탬프에 기초하여 제2시간 정보를 변경하고, 상기 적어도 하나의 보조 프로세서로 상기 제2오디오 프레임 전송을 재개하도록 설정될 수 있다.
또한, 상기 메인 프로세서는, 상기 적어도 하나의 보조 프로세서로부터 상기 제1시간 정보를 연속적으로 수신하고, 상기 수신한 제1시간 정보를 기준시간에 순차적으로 합산하여 상기 제2시간 정보를 획득하고, 상기 타임 점프가 발생한 경우, 상기 제2타임스탬프의 값을 기초로 상기 기준시간을 변경하도록 설정될 수 있다.
본 문서에 개시된 다양한 실시예에 따른, 적어도 하나의 보조 프로세서를 포함할 수 있다가 동영상 데이터를 재생하는 방법은, 상기 동영상 데이터를 복수의 연속된 이미지 프레임을 포함하는 이미지 데이터, 복수의 연속된 오디오 프레임을 포함하는 제1오디오 데이터 및 상기 복수의 연속된 오디오 프레임 각각에 대응되는 복수의 타임스탬프로 분리하는 동작, 상기 제1오디오 데이터를 이용하여, 상기 복수의 오디오 프레임 각각에 헤더 데이터(header data)를 추가하여 제2오디오 데이터를 생성하는 동작, 상기 적어도 하나의 보조 프로세서로 상기 제2오디오 데이터를 전송하는 동작, 상기 적어도 하나의 보조 프로세서로부터 연속적으로 수신한 제1시간 정보에 기초하여 제2시간 정보를 생성하는 동작, 및 상기 제2시간 정보에 기초하여 상기 이미지 데이터를 재생하는 동작을 포함할 수 있다.
또한, 상기 복수의 오디오 프레임은, AAC(고급 오디오 부호화: advanced audio coding) 방식으로 부호화될 수 있다.
또한, 상기 헤더 데이터는 ADTS(오디오 데이터 전송 스트림: audio data transport stream) 형식의 데이터를 포함할 수 있다.
또한, 상기 헤더 데이터는 대응되는 오디오 프레임 각각의 데이터 길이 정보를 적어도 포함할 수 있다.
또한, 상기 제1오디오 데이터가 AAC 방식으로 부호화된 오디오 프레임을 포함하는 경우, 상기 이미지 데이터가 상기 오디오 신호와 동시에 재생되는지 여부를 확인하는 동작, 상기 적어도 하나의 보조 프로세서가 ADTS 형식의 데이터를 지원하는지 여부를 확인하는 동작, 및 상기 이미지 데이터가 상기 오디오 신호와 동시에 재생되며, 상기 적어도 하나의 보조 프로세서가 ADTS 형식의 데이터를 지원하는 경우, 상기 제1오디오 데이터에 상기 헤더 데이터를 추가하여 상기 제2오디오 데이터를 생성하는 동작을 더 포함할 수 있다.
또한, 상기 복수의 타임스탬프 가운데 제1오디오 프레임에 대응되는 제1타임스탬프 및 상기 제1오디오 프레임과 연속된 제2오디오 프레임에 대응되는 제2타임스탬프의 비교에 기초하여 타임 점프 발생 여부를 확인하는 동작, 및 상기 타임 점프가 발생한 경우, 상기 제2타임스탬프에 기초하여 상기 제2시간 정보를 변경하는 동작을 포함할 수 있다.
또한, 상기 제2타임스탬프 및 상기 제1타임스탬프의 차이값을 계산하고, 상기 차이값이 타임 점프 임계값보다 큰 경우, 상기 타임 점프가 발생한 것으로 판단하는 동작을 포함할 수 있다.
또한, 상기 타임 점프가 발생한 경우, 상기 적어도 하나의 보조 프로세서로 상기 제1오디오 프레임 전송 후 상기 제2오디오 프레임 전송을 중단하는 동작, 상기 적어도 하나의 보조 프로세서로부터 재생 완료 정보를 수신하는 동작, 상기 제2타임스탬프에 기초하여 제2시간 정보를 변경하는 동작, 및, 상기 적어도 하나의 보조 프로세서로 상기 제2오디오 프레임 전송을 재개하는 동작을 포함할 수 있다.
또한, 상기 적어도 하나의 보조 프로세서로부터 상기 제1시간 정보를 연속적으로 수신하는 동작, 상기 수신한 제1시간 정보를 기준시간에 순차적으로 합산하여 상기 제2시간 정보를 획득하는 동작, 및 상기 타임 점프가 발생한 경우, 상기 제2타임스탬프의 값을 기초로 상기 기준시간을 변경하는 동작을 포함할 수 있다.
본 문서에 개시된 다양한 실시예에 따른 전자 장치는, 외부 전자 장치와 통신적으로(communicatively) 연결되는 통신 모듈, 및 상기 통신 모듈과 작동적으로(operatively) 연결되는 프로세서를 포함하고, 상기 프로세서는, 동영상 데이터를 재생하는 경우, 상기 동영상 데이터를 복수의 연속된 이미지 프레임을 포함하는 이미지 데이터 및 복수의 연속된 오디오 프레임을 포함하는 제1오디오 데이터로 분리하고, 상기 제1오디오 데이터가 AAC 방식으로 부호화된 오디오 프레임을 포함하는 경우, 상기 외부 전자 장치가 ADTS 형식의 데이터를 지원하는지 여부를 확인하고, 상기 외부 전자 장치가 ADTS 형식의 데이터를 지원하는 경우, 상기 복수의 오디오 프레임 각각에 헤더 데이터를 추가하여 제2오디오 데이터를 생성하고, 상기 외부 전자 장치로 상기 제2오디오 데이터를 전송하고, 상기 외부 전자 장치로부터 수신한 제1시간 정보에 기초하여 제2시간 정보를 생성하고, 상기 제2시간 정보에 기초하여 상기 이미지 데이터를 재생하도록 설정될 수 있다.
본 문서에 개시된 다양한 실시예들에 따른 전자 장치는 다양한 형태의 장치가 될 수 있다. 전자 장치는, 예를 들면, 휴대용 통신 장치(예: 스마트폰), 컴퓨터 장치, 휴대용 멀티미디어 장치, 휴대용 의료 기기, 카메라, 웨어러블 장치, 또는 가전 장치를 포함할 수 있다. 본 문서의 실시예에 따른 전자 장치는 전술한 기기들에 한정되지 않는다.
본 문서의 다양한 실시예들 및 이에 사용된 용어들은 본 문서에 기재된 기술적 특징들을 특정한 실시예들로 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 또는 관련된 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 아이템에 대응하는 명사의 단수 형은 관련된 문맥상 명백하게 다르게 지시하지 않는 한, 상기 아이템 한 개 또는 복수 개를 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및 B 중 적어도 하나", "A 또는 B 중 적어도 하나", "A, B 또는 C", "A, B 및 C 중 적어도 하나", 및 "A, B, 또는 C 중 적어도 하나"와 같은 문구들 각각은 그 문구들 중 해당하는 문구에 함께 나열된 항목들 중 어느 하나, 또는 그들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", 또는 "첫째" 또는 "둘째"와 같은 용어들은 단순히 해당 구성요소를 다른 해당 구성요소와 구분하기 위해 사용될 수 있으며, 해당 구성요소들을 다른 측면(예: 중요성 또는 순서)에서 한정하지 않는다. 어떤(예: 제 1) 구성요소가 다른(예: 제 2) 구성요소에, "기능적으로" 또는 "통신적으로"라는 용어와 함께 또는 이런 용어 없이, "커플드" 또는 "커넥티드"라고 언급된 경우, 그것은 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로(예: 유선으로), 무선으로, 또는 제 3 구성요소를 통하여 연결될 수 있다는 것을 의미한다.
본 문서의 다양한 실시예들에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구현된 유닛을 포함할 수 있으며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로와 같은 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는, 상기 부품의 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 일실시예에 따르면, 모듈은 ASIC(application-specific integrated circuit)의 형태로 구현될 수 있다.
본 문서의 다양한 실시예들은 기기(machine)(예: 전자 장치(101)) 의해 읽을 수 있는 저장 매체(storage medium)(예: 내장 메모리(136) 또는 외장 메모리(138))에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어(예: 프로그램(140))로서 구현될 수 있다. 예를 들면, 기기(예: 전자 장치(101))의 프로세서(예: 프로세서(120))는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장 매체는, 비일시적(non-transitory) 저장 매체의 형태로 제공될 수 있다. 여기서, '비일시적'은 저장 매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장 매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.
일실시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory(CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두 개의 사용자 장치들(예: 스마트 폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.
다양한 실시예들에 따르면, 상기 기술한 구성요소들의 각각의 구성요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있으며, 복수의 개체 중 일부는 다른 구성요소에 분리 배치될 수도 있다. 다양한 실시예들에 따르면, 전술한 해당 구성요소들 중 하나 이상의 구성요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성요소들(예: 모듈 또는 프로그램)은 하나의 구성요소로 통합될 수 있다. 이런 경우, 통합된 구성요소는 상기 복수의 구성요소들 각각의 구성요소의 하나 이상의 기능들을 상기 통합 이전에 상기 복수의 구성요소들 중 해당 구성요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 상기 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.

Claims (15)

  1. 전자 장치에 있어서,
    적어도 하나의 보조 프로세서;
    상기 적어도 하나의 보조 프로세서와 작동적으로(operatively) 연결되는 메인 프로세서를 포함하고,
    상기 메인 프로세서는,
    동영상 데이터를 획득하고,
    상기 동영상 데이터를 복수의 연속된 이미지 프레임을 포함하는 이미지 데이터, 복수의 연속된 오디오 프레임을 포함하는 제1오디오 데이터 및 상기 복수의 연속된 오디오 프레임 각각에 대응되는 복수의 타임스탬프로 분리하고,
    상기 제1오디오 데이터를 이용하여, 상기 복수의 오디오 프레임 각각에 헤더 데이터(header data)를 추가하여 제2오디오 데이터를 생성하고,
    상기 적어도 하나의 보조 프로세서로 상기 제2오디오 데이터를 전송하고,
    상기 적어도 하나의 보조 프로세서로부터 연속적으로 수신한 제1시간 정보에 기초하여 제2시간 정보를 생성하고,
    상기 제2시간 정보에 기초하여 상기 이미지 데이터를 재생하도록 설정되며,
    상기 적어도 하나의 보조 프로세서는,
    상기 수신한 제2오디오 데이터를 기초로 오디오 신호를 재생하고,
    상기 헤더 데이터에 기초하여 상기 오디오 신호 재생 시간에 관한 상기 제1시간 정보를 생성하도록 설정된 전자 장치.
  2. 제1항에 있어서,
    상기 복수의 오디오 프레임은, AAC(고급 오디오 부호화: advanced audio coding) 방식으로 부호화되고,
    상기 헤더 데이터는 ADTS(오디오 데이터 전송 스트림: audio data transport stream) 형식의 데이터를 포함하는 전자 장치.
  3. 제1항에 있어서,
    상기 헤더 데이터는 대응되는 오디오 프레임 각각의 데이터 길이 정보를 적어도 포함하는 전자 장치.
  4. 제1항에 있어서,
    상기 메인 프로세서는,
    상기 제1오디오 데이터가 AAC 방식으로 부호화된 오디오 프레임을 포함하는 경우,
    상기 이미지 데이터가 상기 오디오 신호와 동시에 재생되는지 여부를 확인하고,
    상기 적어도 하나의 보조 프로세서가 ADTS 형식의 데이터를 지원하는지 여부를 확인하고,
    상기 이미지 데이터가 상기 오디오 신호와 동시에 재생되며, 상기 적어도 하나의 보조 프로세서가 ADTS 형식의 데이터를 지원하는 경우, 상기 제1오디오 데이터에 상기 헤더 데이터를 추가하여 상기 제2오디오 데이터를 생성하도록 설정된 전자 장치.
  5. 제1항에 있어서,
    상기 메인 프로세서는,
    상기 복수의 타임스탬프 가운데 제1오디오 프레임에 대응되는 제1타임스탬프 및 상기 제1오디오 프레임과 연속된 제2오디오 프레임에 대응되는 제2타임스탬프의 비교에 기초하여 타임 점프 발생 여부를 확인하고,
    상기 타임 점프가 발생한 경우, 상기 제2타임스탬프에 기초하여 상기 제2시간 정보를 변경하도록 설정된 전자 장치.
  6. 제5항에 있어서,
    상기 메인 프로세서는,
    상기 제2타임스탬프 및 상기 제1타임스탬프의 차이값을 계산하고,
    상기 차이값이 타임 점프 임계값보다 큰 경우, 상기 타임 점프가 발생한 것으로 판단하도록 설정된 전자 장치.
  7. 제6항에 있어서,
    상기 메인 프로세서는,
    상기 복수의 오디오 프레임의 크기 및 상기 오디오 프레임의 샘플링 주파수에 기초하여 상기 타임 점프 임계값을 계산하도록 설정된 전자 장치.
  8. 제5항에 있어서,
    상기 메인 프로세서는,
    상기 타임 점프가 발생한 경우, 상기 적어도 하나의 보조 프로세서로 상기 제1오디오 프레임 전송 후 상기 제2오디오 프레임 전송을 중단하고,
    상기 적어도 하나의 보조 프로세서로부터 재생 완료 정보를 수신하고,
    상기 제2타임스탬프에 기초하여 제2시간 정보를 변경하고,
    상기 적어도 하나의 보조 프로세서로 상기 제2오디오 프레임 전송을 재개하도록 설정된 전자 장치.
  9. 제5항에 있어서,
    상기 메인 프로세서는,
    상기 적어도 하나의 보조 프로세서로부터 상기 제1시간 정보를 연속적으로 수신하고,
    상기 수신한 제1시간 정보를 기준시간에 순차적으로 합산하여 상기 제2시간 정보를 획득하고,
    상기 타임 점프가 발생한 경우, 상기 제2타임스탬프의 값을 기초로 상기 기준시간을 변경하도록 설정된 전자 장치.
  10. 적어도 하나의 보조 프로세서를 포함하는 전자 장치가 동영상 데이터를 재생하는 방법에 있어서,
    상기 동영상 데이터를 복수의 연속된 이미지 프레임을 포함하는 이미지 데이터, 복수의 연속된 오디오 프레임을 포함하는 제1오디오 데이터 및 상기 복수의 연속된 오디오 프레임 각각에 대응되는 복수의 타임스탬프로 분리하는 동작;
    상기 제1오디오 데이터를 이용하여, 상기 복수의 오디오 프레임 각각에 헤더 데이터(header data)를 추가하여 제2오디오 데이터를 생성하는 동작;
    상기 적어도 하나의 보조 프로세서로 상기 제2오디오 데이터를 전송하는 동작;
    상기 적어도 하나의 보조 프로세서로부터 연속적으로 수신한 제1시간 정보에 기초하여 제2시간 정보를 생성하는 동작; 및
    상기 제2시간 정보에 기초하여 상기 이미지 데이터를 재생하는 동작을 포함하는 방법.
  11. 제10항에 있어서,
    상기 헤더 데이터는 대응되는 오디오 프레임 각각의 데이터 길이 정보를 적어도 포함하는 방법.
  12. 제10항에 있어서,
    상기 제1오디오 데이터가 AAC 방식으로 부호화된 오디오 프레임을 포함하는 경우,
    상기 이미지 데이터가 상기 오디오 신호와 동시에 재생되는지 여부를 확인하는 동작;
    상기 적어도 하나의 보조 프로세서가 ADTS 형식의 데이터를 지원하는지 여부를 확인하는 동작; 및
    상기 이미지 데이터가 상기 오디오 신호와 동시에 재생되며, 상기 적어도 하나의 보조 프로세서가 ADTS 형식의 데이터를 지원하는 경우, 상기 제1오디오 데이터에 상기 헤더 데이터를 추가하여 상기 제2오디오 데이터를 생성하는 동작을 더 포함하는 방법.
  13. 제10항에 있어서,
    상기 복수의 타임스탬프 가운데 제1오디오 프레임에 대응되는 제1타임스탬프 및 상기 제1오디오 프레임과 연속된 제2오디오 프레임에 대응되는 제2타임스탬프의 비교에 기초하여 타임 점프 발생 여부를 확인하는 동작; 및
    상기 타임 점프가 발생한 경우, 상기 제2타임스탬프에 기초하여 상기 제2시간 정보를 변경하는 동작을 포함하는 방법.
  14. 제13항에 있어서,
    상기 제2타임스탬프 및 상기 제1타임스탬프의 차이값을 계산하고,
    상기 차이값이 타임 점프 임계값보다 큰 경우, 상기 타임 점프가 발생한 것으로 판단하는 동작을 포함하는 방법.
  15. 제13항에 있어서,
    상기 타임 점프가 발생한 경우, 상기 적어도 하나의 보조 프로세서로 상기 제1오디오 프레임 전송 후 상기 제2오디오 프레임 전송을 중단하는 동작;
    상기 적어도 하나의 보조 프로세서로부터 재생 완료 정보를 수신하는 동작;
    상기 제2타임스탬프에 기초하여 제2시간 정보를 변경하는 동작; 및,
    상기 적어도 하나의 보조 프로세서로 상기 제2오디오 프레임 전송을 재개하는 동작을 포함하는 방법.
PCT/KR2022/007627 2021-08-05 2022-05-30 전자 장치 및 전자 장치의 멀티미디어 재생 방법 WO2023013865A1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP22853245.3A EP4322536A1 (en) 2021-08-05 2022-05-30 Electronic device and method for multimedia playback in electronic device
US17/838,850 US11843818B2 (en) 2021-08-05 2022-06-13 Electronic device and multimedia playback method thereof

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2021-0103452 2021-08-05
KR1020210103452A KR20230021508A (ko) 2021-08-05 2021-08-05 전자 장치 및 전자 장치의 멀티미디어 재생 방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US17/838,850 Continuation US11843818B2 (en) 2021-08-05 2022-06-13 Electronic device and multimedia playback method thereof

Publications (1)

Publication Number Publication Date
WO2023013865A1 true WO2023013865A1 (ko) 2023-02-09

Family

ID=85156057

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2022/007627 WO2023013865A1 (ko) 2021-08-05 2022-05-30 전자 장치 및 전자 장치의 멀티미디어 재생 방법

Country Status (2)

Country Link
KR (1) KR20230021508A (ko)
WO (1) WO2023013865A1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170023870A (ko) * 2014-05-28 2017-03-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 데이터 프로세서 및 사용자 제어 데이터의 오디오 디코더들과 렌더러들로의 전송
KR101832963B1 (ko) * 2012-01-11 2018-02-28 엘지전자 주식회사 전자 기기 및 그것의 미디어 콘텐츠 재생 방법
KR101849749B1 (ko) * 2011-02-10 2018-05-30 주식회사 미디어엑셀코리아 트랜스코딩 시스템에서의 오디오 및 비디오 동기화 방법
JP2019176503A (ja) * 2013-07-19 2019-10-10 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 送信方法、受信方法、送信装置及び受信装置
KR20210028880A (ko) * 2019-09-05 2021-03-15 삼성전자주식회사 디스플레이 장치 및 그 제어 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101849749B1 (ko) * 2011-02-10 2018-05-30 주식회사 미디어엑셀코리아 트랜스코딩 시스템에서의 오디오 및 비디오 동기화 방법
KR101832963B1 (ko) * 2012-01-11 2018-02-28 엘지전자 주식회사 전자 기기 및 그것의 미디어 콘텐츠 재생 방법
JP2019176503A (ja) * 2013-07-19 2019-10-10 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 送信方法、受信方法、送信装置及び受信装置
KR20170023870A (ko) * 2014-05-28 2017-03-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 데이터 프로세서 및 사용자 제어 데이터의 오디오 디코더들과 렌더러들로의 전송
KR20210028880A (ko) * 2019-09-05 2021-03-15 삼성전자주식회사 디스플레이 장치 및 그 제어 방법

Also Published As

Publication number Publication date
KR20230021508A (ko) 2023-02-14

Similar Documents

Publication Publication Date Title
WO2022154270A1 (ko) 요약 영상 생성 방법 및 그 전자 장치
WO2022030882A1 (ko) 오디오 데이터를 처리하는 전자 장치와 이의 동작 방법
WO2023013865A1 (ko) 전자 장치 및 전자 장치의 멀티미디어 재생 방법
WO2023058860A1 (ko) 멀티 서명된 apk 파일을 처리하는 전자 장치 및 그 동작 방법
WO2021235856A1 (ko) 멀티미디어 콘텐츠를 제공하는 방법 및 그 전자 장치
WO2022211389A1 (ko) 오디오 공유를 지원하기 위한 전자 장치
WO2022196939A1 (ko) 대체 컨텐츠를 제공하는 전자 장치 및 그의 동작 방법
WO2021221440A1 (ko) 음질 향상 방법 및 그 장치
WO2021153962A1 (ko) 스트리밍 데이터를 처리하는 방법 및 전자 장치
WO2023277572A1 (ko) 오디오 데이터에 오디오 효과의 중복 적용을 방지하는 방법 및 이를 지원하는 전자 장치
WO2023068904A1 (ko) 전자 장치 및 전자 장치의 동작 방법
WO2024080586A1 (ko) 멀티 디바이스 환경에서 공동 편집을 위한 전자 장치 및 방법
WO2024034784A1 (ko) 다른 전자 장치의 어드버타이징 프로세스와 동기화된 어드버타이징 프로세스를 수행하는 전자 장치, 방법, 및 비일시적 컴퓨터 판독가능 저장 매체
WO2022245116A1 (ko) 전자 장치 및 전자 장치의 동작 방법
WO2022220417A1 (ko) 비디오를 인코딩하는 전자 장치 및 그 제어 방법
WO2023068507A1 (ko) Rcs 기능을 제공하기 위한 전자 장치 및 그의 동작 방법
WO2022030771A1 (ko) 전자 장치 및 그의 오디오 데이터를 출력하는 방법
WO2024029688A1 (ko) 무선 환경 내에서의 오디오 스트리밍을 위한 전자 장치, 방법, 및 비일시적 컴퓨터 판독가능 저장 매체
WO2022191455A1 (ko) 파일 리댁션을 수행하는 전자 장치 및 이의 동작 방법
WO2023090663A1 (ko) 콘텐츠 재생 장치 제어 방법 및 상기 방법을 수행하는 전자 장치
WO2023008732A1 (ko) 제품의 불량을 예측하는 예측 모델 업데이트 방법 및 장치
WO2022265209A1 (ko) Frc를 이용한 영상 통화를 수행하는 전자 장치 및 전자 장치의 동작 방법
WO2022191451A1 (ko) 운동 영상의 속도를 제어하는 전자 장치 및 이의 제어 방법
WO2023080625A1 (ko) 휘발성 메모리의 구동 전압을 조정하는 전자 장치와 이의 동작 방법
WO2023146063A1 (ko) 햅틱 신호를 생성하는 전자 장치 및 그 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22853245

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2022853245

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2022853245

Country of ref document: EP

Effective date: 20231108

NENP Non-entry into the national phase

Ref country code: DE