WO2022220417A1 - 비디오를 인코딩하는 전자 장치 및 그 제어 방법 - Google Patents

비디오를 인코딩하는 전자 장치 및 그 제어 방법 Download PDF

Info

Publication number
WO2022220417A1
WO2022220417A1 PCT/KR2022/003609 KR2022003609W WO2022220417A1 WO 2022220417 A1 WO2022220417 A1 WO 2022220417A1 KR 2022003609 W KR2022003609 W KR 2022003609W WO 2022220417 A1 WO2022220417 A1 WO 2022220417A1
Authority
WO
WIPO (PCT)
Prior art keywords
video
tone mapping
mapping function
luminance
metadata
Prior art date
Application number
PCT/KR2022/003609
Other languages
English (en)
French (fr)
Inventor
박상욱
정봉수
김성환
염동현
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Publication of WO2022220417A1 publication Critical patent/WO2022220417A1/ko
Priority to US18/380,130 priority Critical patent/US20240037722A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/92Dynamic range modification of images or parts thereof based on global image properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N5/926Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation
    • H04N5/9261Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation involving data reduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/40Image enhancement or restoration using histogram techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/70Circuitry for compensating brightness variation in the scene
    • H04N23/71Circuitry for evaluating the brightness variation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/95Computational photography systems, e.g. light-field imaging systems
    • H04N23/951Computational photography systems, e.g. light-field imaging systems by using two or more images to influence resolution, frame rate or aspect ratio
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20208High dynamic range [HDR] image processing

Definitions

  • Various embodiments relate to an electronic device for encoding a video and a method for controlling the same.
  • HDR10+ is an HDR format that supports rendering using dynamic metadata, and is described in the technical document of SMPTE 2094-40.
  • the electronic device capturing HDR10+ video with a camera may generate a dynamic tone mapping function of HDR10+ by analyzing characteristics of the image for each frame, and may store metadata representing the dynamic tone mapping function in the SEI user data space of the HEVC codec.
  • the electronic device that reproduces the HDR10+ video does not support the maximum luminance of the HDR10+ video
  • the electronic device parses the metadata stored in the SEI user data space to convert the HDR10+ video into a video having a low maximum luminance and performs dynamic tone mapping A function may be obtained, and tone mapping may be performed on the HDR10+ video based on the dynamic tone mapping function.
  • the electronic device that reproduces the HDR10+ video in the SDR format may generate an SDR tone mapping function by referring to the dynamic tone mapping function, and may perform tone mapping on the HDR10+ video based on the SDR tone mapping function.
  • the electronic device that reproduces the HDR10+ video in the SDR format may generate an SDR tone mapping function by referring to the dynamic tone mapping function, and may perform tone mapping on the HDR10+ video based on the SDR tone mapping function.
  • generation of an SDR tone mapping function may be frequently required.
  • the process of generating the SDR tone mapping function may require more computation.
  • the electronic device includes first metadata representing a first tone mapping function for converting a first video having a first luminance having a maximum luminance into a second video having a second luminance having a maximum luminance lower than the first luminance; Second metadata indicating a second tone mapping function for converting the first video into a third video having a third luminance lower than the second luminance may be stored in association with the first video.
  • An electronic device includes at least one camera and at least one processor, wherein the at least one processor acquires a first video having a maximum luminance of a first luminance through the at least one camera, , identify a first tone mapping function for converting the first video into a second video having a second luminance having a maximum luminance lower than the first luminance, and convert the first video to a second video having a maximum luminance lower than the second luminance.
  • a second tone mapping function for converting a third video having 3 luminance is identified, and first metadata based on the first tone mapping function and second metadata based on the second tone mapping function are added to the first video. It can be configured to store associatively.
  • the method performed in the electronic device includes: acquiring a first video having a maximum luminance of a first luminance through at least one camera of the electronic device; identifying a first tone mapping function for converting to a second video having a lower second luminance, a second for converting the first video to a third video having a third luminance lower than the second luminance identifying a tone mapping function; and storing first metadata based on the first tone mapping function and second metadata based on the second tone mapping function in association with the first video.
  • An electronic device includes a display and at least one processor, wherein the at least one processor obtains a first video having a maximum luminance of a first luminance and metadata associated with the first video,
  • the metadata includes first metadata representing a first tone mapping function for converting the first video into a second video having a second luminance lower than the first luminance, and converting the first video to a maximum luminance greater than the second luminance.
  • It includes second metadata indicating a second tone mapping function for converting a video having a lower third luminance, and identifies the maximum luminance supported by the display and a function performed in an application in which an execution screen is displayed on the display.
  • an electronic device for encoding a video and a method for controlling the same includes first metadata representing a first tone mapping function for converting a first video having a first luminance having a maximum luminance into a second video having a second luminance having a maximum luminance lower than the first luminance; Second metadata indicating a second tone mapping function for converting the first video into a third video having a third luminance lower than the second luminance may be stored in association with the first video. Since the second metadata as well as the first metadata are stored in association with the first video, an electronic device that decodes and reproduces the first video does not need to generate a second tone mapping function based on the first tone mapping function. , since the second tone mapping function can be identified by parsing the second metadata, the first video can be converted into a form having a low maximum luminance with a small amount of computation.
  • the electronic device stores third metadata indicating a frame corresponding to a scene change in the first video in association with the first video, so that the same scene in the electronic device that decodes and reproduces the first video It may be possible to reduce current consumption by using the same second tone mapping function.
  • FIG. 1 is a block diagram of an electronic device in a network environment, according to various embodiments of the present disclosure
  • FIG. 2 is a block diagram of an electronic device for encoding a video and an electronic device for decoding a video, according to various embodiments of the present disclosure
  • FIG. 3 illustrates operations performed by an electronic device encoding a video according to various embodiments of the present disclosure.
  • 4A illustrates first metadata and second metadata according to various embodiments.
  • 4B illustrates an example of a first tone mapping function according to various embodiments.
  • 4C illustrates an example of a second tone mapping function according to various embodiments.
  • 4D illustrates an example of a second tone mapping function according to various embodiments.
  • 5A illustrates an example of a method of generating a second tone mapping function according to various embodiments.
  • 5B illustrates an example of a method of generating a second tone mapping function according to various embodiments.
  • 6A illustrates an example of a method of simplifying a second tone mapping function in accordance with various embodiments.
  • 6B illustrates an example of a method of simplifying a second tone mapping function in accordance with various embodiments.
  • FIG. 7 illustrates operations performed by an electronic device encoding a video according to various embodiments of the present disclosure.
  • FIG 8 illustrates first metadata, second metadata, and third metadata according to various embodiments.
  • FIG. 9 illustrates operations performed by an electronic device for decoding a video according to various embodiments of the present disclosure.
  • FIG. 1 is a block diagram of an electronic device 101 in a network environment 100, according to various embodiments.
  • an electronic device 101 communicates with an electronic device 102 through a first network 198 (eg, a short-range wireless communication network) or a second network 199 . It may communicate with the electronic device 104 or the server 108 through (eg, a long-distance wireless communication network). According to an embodiment, the electronic device 101 may communicate with the electronic device 104 through the server 108 .
  • a first network 198 eg, a short-range wireless communication network
  • a second network 199 e.g., a second network 199
  • the electronic device 101 may communicate with the electronic device 104 through the server 108 .
  • the electronic device 101 includes a processor 120 , a memory 130 , an input module 150 , a sound output module 155 , a display module 160 , an audio module 170 , and a sensor module ( 176), interface 177, connection terminal 178, haptic module 179, camera module 180, power management module 188, battery 189, communication module 190, subscriber identification module 196 , or an antenna module 197 .
  • at least one of these components eg, the connection terminal 178
  • some of these components are integrated into one component (eg, display module 160 ). can be
  • the processor 120 for example, executes software (eg, a program 140) to execute at least one other component (eg, a hardware or software component) of the electronic device 101 connected to the processor 120. It can control and perform various data processing or operations. According to one embodiment, as at least part of data processing or operation, the processor 120 converts commands or data received from other components (eg, the sensor module 176 or the communication module 190 ) to the volatile memory 132 . may be stored in , process commands or data stored in the volatile memory 132 , and store the result data in the non-volatile memory 134 .
  • software eg, a program 140
  • the processor 120 converts commands or data received from other components (eg, the sensor module 176 or the communication module 190 ) to the volatile memory 132 .
  • the volatile memory 132 may be stored in , process commands or data stored in the volatile memory 132 , and store the result data in the non-volatile memory 134 .
  • the processor 120 is the main processor 121 (eg, a central processing unit or an application processor) or a secondary processor 123 (eg, a graphic processing unit, a neural network processing unit (eg, a graphic processing unit, a neural network processing unit) a neural processing unit (NPU), an image signal processor, a sensor hub processor, or a communication processor).
  • the main processor 121 eg, a central processing unit or an application processor
  • a secondary processor 123 eg, a graphic processing unit, a neural network processing unit (eg, a graphic processing unit, a neural network processing unit) a neural processing unit (NPU), an image signal processor, a sensor hub processor, or a communication processor.
  • the main processor 121 e.g, a central processing unit or an application processor
  • a secondary processor 123 eg, a graphic processing unit, a neural network processing unit (eg, a graphic processing unit, a neural network processing unit) a neural processing unit (NPU), an image signal processor, a
  • the secondary processor 123 may, for example, act on behalf of the main processor 121 while the main processor 121 is in an inactive (eg, sleep) state, or when the main processor 121 is active (eg, executing an application). ), together with the main processor 121, at least one of the components of the electronic device 101 (eg, the display module 160, the sensor module 176, or the communication module 190) It is possible to control at least some of the related functions or states.
  • the coprocessor 123 eg, an image signal processor or a communication processor
  • may be implemented as part of another functionally related component eg, the camera module 180 or the communication module 190 ). have.
  • the auxiliary processor 123 may include a hardware structure specialized for processing an artificial intelligence model.
  • Artificial intelligence models can be created through machine learning. Such learning may be performed, for example, in the electronic device 101 itself on which artificial intelligence is performed, or may be performed through a separate server (eg, the server 108).
  • the learning algorithm may include, for example, supervised learning, unsupervised learning, semi-supervised learning, or reinforcement learning, but in the above example not limited
  • the artificial intelligence model may include a plurality of artificial neural network layers.
  • Artificial neural networks include deep neural networks (DNNs), convolutional neural networks (CNNs), recurrent neural networks (RNNs), restricted boltzmann machines (RBMs), deep belief networks (DBNs), bidirectional recurrent deep neural networks (BRDNNs), It may be one of deep Q-networks or a combination of two or more of the above, but is not limited to the above example.
  • the artificial intelligence model may include, in addition to, or alternatively, a software structure in addition to the hardware structure.
  • the memory 130 may store various data used by at least one component (eg, the processor 120 or the sensor module 176 ) of the electronic device 101 .
  • the data may include, for example, input data or output data for software (eg, the program 140 ) and instructions related thereto.
  • the memory 130 may include a volatile memory 132 or a non-volatile memory 134 .
  • the program 140 may be stored as software in the memory 130 , and may include, for example, an operating system 142 , middleware 144 , or an application 146 .
  • the input module 150 may receive a command or data to be used by a component (eg, the processor 120 ) of the electronic device 101 from the outside (eg, a user) of the electronic device 101 .
  • the input module 150 may include, for example, a microphone, a mouse, a keyboard, a key (eg, a button), or a digital pen (eg, a stylus pen).
  • the sound output module 155 may output a sound signal to the outside of the electronic device 101 .
  • the sound output module 155 may include, for example, a speaker or a receiver.
  • the speaker can be used for general purposes such as multimedia playback or recording playback.
  • the receiver can be used to receive incoming calls. According to one embodiment, the receiver may be implemented separately from or as part of the speaker.
  • the display module 160 may visually provide information to the outside (eg, a user) of the electronic device 101 .
  • the display module 160 may include, for example, a control circuit for controlling a display, a hologram device, or a projector and a corresponding device.
  • the display module 160 may include a touch sensor configured to sense a touch or a pressure sensor configured to measure the intensity of a force generated by the touch.
  • the audio module 170 may convert a sound into an electric signal or, conversely, convert an electric signal into a sound. According to an embodiment, the audio module 170 acquires a sound through the input module 150 , or an external electronic device (eg, a sound output module 155 ) connected directly or wirelessly with the electronic device 101 .
  • the electronic device 102) eg, a speaker or headphones
  • the electronic device 102 may output a sound.
  • the sensor module 176 detects an operating state (eg, power or temperature) of the electronic device 101 or an external environmental state (eg, a user state), and generates an electrical signal or data value corresponding to the sensed state. can do.
  • the sensor module 176 may include, for example, a gesture sensor, a gyro sensor, a barometric pressure sensor, a magnetic sensor, an acceleration sensor, a grip sensor, a proximity sensor, a color sensor, an IR (infrared) sensor, a biometric sensor, It may include a temperature sensor, a humidity sensor, or an illuminance sensor.
  • the interface 177 may support one or more specified protocols that may be used by the electronic device 101 to directly or wirelessly connect with an external electronic device (eg, the electronic device 102 ).
  • the interface 177 may include, for example, a high definition multimedia interface (HDMI), a universal serial bus (USB) interface, an SD card interface, or an audio interface.
  • the connection terminal 178 may include a connector through which the electronic device 101 can be physically connected to an external electronic device (eg, the electronic device 102 ).
  • the connection terminal 178 may include, for example, an HDMI connector, a USB connector, an SD card connector, or an audio connector (eg, a headphone connector).
  • the haptic module 179 may convert an electrical signal into a mechanical stimulus (eg, vibration or movement) or an electrical stimulus that the user can perceive through tactile or kinesthetic sense.
  • the haptic module 179 may include, for example, a motor, a piezoelectric element, or an electrical stimulation device.
  • the camera module 180 may capture still images and moving images. According to an embodiment, the camera module 180 may include one or more lenses, image sensors, image signal processors, or flashes.
  • the power management module 188 may manage power supplied to the electronic device 101 .
  • the power management module 188 may be implemented as, for example, at least a part of a power management integrated circuit (PMIC).
  • PMIC power management integrated circuit
  • the battery 189 may supply power to at least one component of the electronic device 101 .
  • battery 189 may include, for example, a non-rechargeable primary cell, a rechargeable secondary cell, or a fuel cell.
  • the communication module 190 is a direct (eg, wired) communication channel or a wireless communication channel between the electronic device 101 and an external electronic device (eg, the electronic device 102, the electronic device 104, or the server 108). It can support establishment and communication performance through the established communication channel.
  • the communication module 190 may include one or more communication processors that operate independently of the processor 120 (eg, an application processor) and support direct (eg, wired) communication or wireless communication.
  • the communication module 190 is a wireless communication module 192 (eg, a cellular communication module, a short-range communication module, or a global navigation satellite system (GNSS) communication module) or a wired communication module 194 (eg, : It may include a local area network (LAN) communication module, or a power line communication module).
  • a wireless communication module 192 eg, a cellular communication module, a short-range communication module, or a global navigation satellite system (GNSS) communication module
  • GNSS global navigation satellite system
  • wired communication module 194 eg, : It may include a local area network (LAN) communication module, or a power line communication module.
  • a corresponding communication module among these communication modules is a first network 198 (eg, a short-range communication network such as Bluetooth, wireless fidelity (WiFi) direct, or infrared data association (IrDA)) or a second network 199 (eg, legacy It may communicate with the external electronic device 104 through a cellular network, a 5G network, a next-generation communication network, the Internet, or a computer network (eg, a telecommunication network such as a LAN or a WAN).
  • a first network 198 eg, a short-range communication network such as Bluetooth, wireless fidelity (WiFi) direct, or infrared data association (IrDA)
  • a second network 199 eg, legacy It may communicate with the external electronic device 104 through a cellular network, a 5G network, a next-generation communication network, the Internet, or a computer network (eg, a telecommunication network such as a LAN or a WAN).
  • a telecommunication network
  • the wireless communication module 192 uses subscriber information (eg, International Mobile Subscriber Identifier (IMSI)) stored in the subscriber identification module 196 within a communication network such as the first network 198 or the second network 199 .
  • subscriber information eg, International Mobile Subscriber Identifier (IMSI)
  • IMSI International Mobile Subscriber Identifier
  • the electronic device 101 may be identified or authenticated.
  • the wireless communication module 192 may support a 5G network after a 4G network and a next-generation communication technology, for example, a new radio access technology (NR).
  • NR access technology includes high-speed transmission of high-capacity data (eMBB (enhanced mobile broadband)), minimization of terminal power and access to multiple terminals (mMTC (massive machine type communications)), or high reliability and low latency (URLLC (ultra-reliable and low-latency) -latency communications)).
  • eMBB enhanced mobile broadband
  • mMTC massive machine type communications
  • URLLC ultra-reliable and low-latency
  • the wireless communication module 192 may support a high frequency band (eg, mmWave band) to achieve a high data rate, for example.
  • a high frequency band eg, mmWave band
  • the wireless communication module 192 uses various techniques for securing performance in a high-frequency band, for example, beamforming, massive multiple-input and multiple-output (MIMO), all-dimensional multiplexing. It may support technologies such as full dimensional MIMO (FD-MIMO), an array antenna, analog beam-forming, or a large scale antenna.
  • the wireless communication module 192 may support various requirements defined in the electronic device 101 , an external electronic device (eg, the electronic device 104 ), or a network system (eg, the second network 199 ).
  • the wireless communication module 192 may include a peak data rate (eg, 20 Gbps or more) for realizing eMBB, loss coverage (eg, 164 dB or less) for realizing mMTC, or U-plane latency for realizing URLLC ( Example: Downlink (DL) and uplink (UL) each 0.5 ms or less, or round trip 1 ms or less) can be supported.
  • a peak data rate eg, 20 Gbps or more
  • loss coverage eg, 164 dB or less
  • U-plane latency for realizing URLLC
  • the antenna module 197 may transmit or receive a signal or power to the outside (eg, an external electronic device).
  • the antenna module 197 may include an antenna including a conductor formed on a substrate (eg, a PCB) or a radiator formed of a conductive pattern.
  • the antenna module 197 may include a plurality of antennas (eg, an array antenna). In this case, at least one antenna suitable for a communication method used in a communication network such as the first network 198 or the second network 199 is connected from the plurality of antennas by, for example, the communication module 190 . can be selected. A signal or power may be transmitted or received between the communication module 190 and an external electronic device through the selected at least one antenna.
  • other components eg, a radio frequency integrated circuit (RFIC)
  • RFIC radio frequency integrated circuit
  • the antenna module 197 may form a mmWave antenna module.
  • the mmWave antenna module comprises a printed circuit board, an RFIC disposed on or adjacent to a first side (eg, bottom side) of the printed circuit board and capable of supporting a designated high frequency band (eg, mmWave band); and a plurality of antennas (eg, an array antenna) disposed on or adjacent to a second side (eg, top or side) of the printed circuit board and capable of transmitting or receiving signals of the designated high frequency band. can do.
  • peripheral devices eg, a bus, general purpose input and output (GPIO), serial peripheral interface (SPI), or mobile industry processor interface (MIPI)
  • GPIO general purpose input and output
  • SPI serial peripheral interface
  • MIPI mobile industry processor interface
  • the command or data may be transmitted or received between the electronic device 101 and the external electronic device 104 through the server 108 connected to the second network 199 .
  • Each of the external electronic devices 102 or 104 may be the same as or different from the electronic device 101 .
  • all or a part of operations executed in the electronic device 101 may be executed in one or more external electronic devices 102 , 104 , or 108 .
  • the electronic device 101 may perform the function or service itself instead of executing the function or service itself.
  • one or more external electronic devices may be requested to perform at least a part of the function or the service.
  • One or more external electronic devices that have received the request may execute at least a part of the requested function or service, or an additional function or service related to the request, and transmit a result of the execution to the electronic device 101 .
  • the electronic device 101 may process the result as it is or additionally and provide it as at least a part of a response to the request.
  • cloud computing, distributed computing, mobile edge computing (MEC), or client-server computing technology may be used.
  • the electronic device 101 may provide an ultra-low latency service using, for example, distributed computing or mobile edge computing.
  • the external electronic device 104 may include an Internet of things (IoT) device.
  • the server 108 may be an intelligent server using machine learning and/or neural networks.
  • the external electronic device 104 or the server 108 may be included in the second network 199 .
  • the electronic device 101 may be applied to an intelligent service (eg, smart home, smart city, smart car, or health care) based on 5G communication technology and IoT-related technology.
  • the electronic device 201 (eg, the electronic device 101 ) may be an electronic device that encodes a video.
  • the electronic device 201 may include a camera 250 , an HDR10+ encoder 220 , and an HEVC encoder 230 .
  • the electronic device 201 may acquire HDR10+ video through the camera 250 .
  • the maximum luminance may be the first luminance.
  • the electronic device 201 may include a plurality of cameras 250 according to various embodiments.
  • the HDR10+ encoder 220 may be implemented using at least one of a CPU, a GPU, a DSP of the electronic device 202, a camera ISP in an application processor, or a codec. Histogram operation 221 , HDR10+ tone mapping function operation 222 , device computing power 223 , scene change detection 224 , SDR tone mapping function operation 225 , and HDR10+ displayed in the HDR10+ encoder 220 in FIG. 2 .
  • the metadata and SDR metadata 226 represent functions performed by the HDR10+ encoder 220 .
  • the HDR10+ encoder 220 calculates a histogram of the maximum value among the R value, the G value, and the B value for a plurality of frames included in the HDR10+ video acquired through the camera 250 . (221) can be performed.
  • the histogram obtained through the histogram operation 221 may be used to determine the amount of motion in an image in order to divide scenes included in the HDR10+ video.
  • the HDR10+ encoder 220 derives, based on the histogram, an HDR10+ tone mapping function for converting an HDR10+ video having a maximum luminance of a first luminance into a video having a maximum luminance of a second luminance. Operation 222 may be performed. According to various embodiments, the second luminance may be lower than the first luminance. According to various embodiments, the HDR10+ tone mapping function may be individually defined for a plurality of frames included in the HDR10+ video.
  • the HDR10+ encoder 220 may check the device computing power 223 of the electronic device 201 . According to various embodiments, the HDR10+ encoder 220 may perform the scene change detection 224 based on the histogram obtained through the histogram operation 221 . According to various embodiments, the HDR10+ encoder 220 derives a correlation between frames based on the histogram, and categorizes frames with a small amount of change in motion into one scene based on the correlation, thereby changing the scene. can be detected. According to various embodiments, the HDR10+ encoder 220 may generate scene metadata indicating frames included in the HDR10+ video at a time when a scene is changed, for example, first frames or last frames of the scenes. can
  • the HDR10+ encoder 220 may perform the scene change detection 224 in consideration of the device computing power 223 . For example, when the device computing power 223 is low, the scene change detection 224 is performed so that the number of scenes included in the HDR10+ video is small by categorizing it as one scene even if the amount of change in motion between frames is large, When the device computing power 223 is high, the scene change detection 224 may be performed so that the number of scenes included in the HDR10+ video is large by categorizing the scenes into different scenes even if the amount of change in motion between frames is small.
  • the HDR10+ encoder 220 may perform the scene change detection 224 multiple times, and generate a plurality of scene metadata corresponding to the scene change detection 224 multiple times.
  • the plurality of scene metadata may include scene metadata indicating that the number of scenes included in the HDR10+ video is relatively large and scene metadata indicating that the number of scenes included in the HDR10+ video is relatively small.
  • the HDR10+ encoder 220 may perform the SDR tone mapping function operation 225 based on the result of the HDR10+ tone mapping function operation 222 .
  • the SDR tone mapping function operation 225 may be a process of deriving an SDR tone mapping function for converting an HDR10+ video having a maximum luminance of a first luminance into an SDR video having a maximum luminance of a third luminance.
  • the third luminance may be lower than the first luminance and the second luminance.
  • a process of performing the SDR tone mapping function operation 225 based on the HDR10+ tone mapping function operation 222 result will be described later with reference to operation 330 of FIG. 3 .
  • the HDR10+ encoder 220 may identify a plurality of Bezier curves having different orders for one frame as a plurality of SDR tone mapping functions.
  • the HDR10+ encoder 220 may perform the SDR tone mapping function operation 225 in consideration of the device computing power 223 .
  • the HDR10+ encoder 220 may individually calculate the SDR tone mapping function with reference to the HDR10+ tone mapping function for all frames included in the HDR10+ video. have.
  • the HDR10+ encoder 220 calculates a representative SDR tone mapping function applied to frames included in the same scene by referring to the result of the scene change detection 224 when the device computing power 223 is low. can do.
  • the HDR10+ encoder 220 identifies a low-order Bezier curve as an SDR tone mapping function when the device computing power 223 is low, and obtains a high-order Bezier curve when the device computing power 223 is high. This can be verified as an SDR tone mapping function.
  • the HDR10+ encoder 220 may generate HDR10+ metadata based on the result of the HDR10+ tone mapping function operation 222 and generate SDR metadata based on the result of the SDR tone mapping function operation 225 .
  • the HDR10+ metadata may indicate an HDR10+ tone mapping function for frames included in an HDR10+ video.
  • the SDR metadata may indicate an SDR tone mapping function for frames included in HDR10+ video.
  • the HDR10+ metadata and the SDR metadata 226 may be stored in the SEI user data space of the HEVC codec when the HEVC encoder 230 performs HEVC encoding on the HDR10+ video.
  • scene metadata may be stored in the SEI user data space of the HEVC codec.
  • the HDR10+ video clip 203 including HDR10+ video, HDR10+ metadata, and SDR metadata may be stored in a memory (eg, memory 130 ) of the electronic device 201 .
  • the electronic device 202 (eg, the processor 120 of the electronic device 101 ) is an electronic device for decoding and reproducing HDR10+ video, and may be the same electronic device as the electronic device 201 .
  • the HDR10+ video clip 203 may be delivered to the electronic device 202 separate from the electronic device 201 .
  • the electronic device 202 may reproduce the HDR10+ video in different formats based on the maximum luminance supported by the display 260 and the function performed by the application being executed on the electronic device 202 . For example, if the display 260 supports the display of the first luminance, which is the maximum luminance of the HDR10+ video, and a function performed by an application running on the electronic device 202 allows playback of a video in the HDR10+ format, the electronic Device 202 may play HDR10+ video on display 260 in HDR10+ format.
  • the electronic device 202 displays a format different from the HDR10+ based on the maximum luminance supported by the display 260 . It can play HDR10+ video. For example, when the maximum luminance that can be displayed by the display 260 is higher than the second luminance, the electronic device 202 converts the HDR10+ video into a video having the second luminance based on the HDR10+ tone mapping, The converted video may be played on the display 260 .
  • the electronic device 202 converts the HDR10+ video into a video having the third luminance based on the SDR tone mapping. converted, and the converted video may be played on the display 260 .
  • the electronic device 202 displays an SDR format corresponding to the SDR video or a display format corresponding to the still image. HDR10+ video may be converted to , and the converted video may be played on the display 260 .
  • the electronic device 202 when the application running on the electronic device 202 does not support playback of the HDR10+ video, the electronic device 202 converts the HDR10+ video into a display format supported by the application, and displays the converted video ( 260) can be played on.
  • the electronic device 202 when an application running on the electronic device 202 performs a function of displaying a still image, such as capturing a video and displaying a thumbnail, the electronic device 202 displays the HDR10+ video in the SDR format corresponding to the SDR video. , and the converted video may be played on the display 260 .
  • the electronic device 202 may check the HDR10+ video, HDR10+ metadata, and SDR metadata from the HDR10+ video clip 203 using the HEVC decoder 240 .
  • the electronic device 202 may check the scene metadata using the HEVC decoder 240 .
  • the electronic device 202 may reproduce the HDR10+ video on the display 260 without referring to the HDR10+ metadata and the SDR metadata.
  • the electronic device 202 may identify the HDR10+ tone mapping function by parsing the HDR10+ metadata ( 251 ). The electronic device 202 may perform HDR10+ tone mapping 252 for converting the HDR10+ video into a video having the second luminance at the maximum luminance based on the identified HDR10+ tone mapping function. The electronic device 202 may reproduce a video having a maximum luminance of a second luminance on the display 260 .
  • the electronic device 202 may identify the SDR tone mapping function by parsing 254 the SDR metadata.
  • the electronic device 202 may perform SDR tone mapping 255 for converting the HDR10+ video into a video having the third luminance at the maximum luminance based on the identified SDR tone mapping function.
  • the electronic device 202 may reproduce a video having a maximum luminance of a third luminance on the display 260 .
  • the electronic device 202 may check the device computing power 253 of the electronic device 202 and perform SDR tone mapping 255 based on the checked computing power.
  • the HDR10+ video clip 203 when the HDR10+ video clip 203 further includes scene metadata, when the device computing power 253 of the electronic device 202 is low, based on the scene metadata, The same SDR tone mapping function is applied to frames included in the same scene, and when the device computing power 253 of the electronic device 202 is high, different SDR tone mapping functions are applied to frames included in the same scene. can do.
  • the electronic device 202 when the HDR10+ video clip 203 further includes a plurality of scene metadata, the electronic device 202 has a relatively small number of scenes included in the HDR10+ video when the device computing power 253 is low.
  • Adopt scene metadata representing The same SDR tone mapping function can be applied to
  • the electronic device 202 when the SDR metadata indicates a plurality of Bezier curves having different orders for one frame, the electronic device 202 performs SDR tone mapping of the lower order Bezier curves when the device computing power 253 is low.
  • SDR tone mapping 255 may be performed by applying it as a function, and when the device computing power 253 is high, a high-order Bezier curve may be applied as an SDR tone mapping function to perform SDR tone mapping 255 .
  • the at least one processor eg, the processor 120 of the electronic device (eg, the electronic device 101) through the at least one camera (eg, the camera module 180)
  • a first video having a maximum luminance of the first luminance may be acquired.
  • the first video may be an HDR10+ video, and the first luminance may be 1000 cd/m 2 .
  • At least one processor (eg, processor 120 ) of the electronic device transmits the first video to a second luminance whose maximum luminance is lower than the first luminance.
  • the second luminance may be 400 cd/m 2 .
  • the first tone mapping function may be individually defined for a plurality of frames included in the first video.
  • the first video may be an HDR10+ format video and may include a plurality of frames 411 , 412 , 413 , 414 , 415 , 416 , 417 , 418 , and 419 .
  • the first metadata may include static metadata 420 and dynamic metadata 431 , 432 , 433 , 434 , 435 , 436 , 437 , 438 , 439 .
  • the static metadata 420 may be static metadata defined in SMPTE 2086.
  • dynamic metadata 431 , 432 , 433 , 434 , 435 , 436 , 437 , 438 , 439 includes a plurality of frames 411 and 412 included in the first video.
  • 413, 414, 415, 416, 417, 418, 419) may indicate a first tone mapping function that is individually defined.
  • FIG. 4B An example of a first tone mapping function is shown in FIG. 4B , in accordance with various embodiments.
  • the horizontal axis of FIG. 4B represents the luminance of the first video
  • the vertical axis of FIG. 4B represents the luminance of the second video obtained by converting the first video according to the first tone mapping function 430b.
  • FIG. 4B by converting the first video having a luminance range of 0cd/m 2 to 1000cd/m 2 by the first tone mapping function 430b, 0cd/m 2 to 400cd/m 2 A second video having a luminance range may be acquired.
  • At least one processor (eg, processor 120) of the electronic device transmits the first video to a third luminance having a third luminance lower than the second luminance.
  • the third luminance may be 100 cd/m 2 .
  • the third video may be a video in an SDR format.
  • the second metadata 441 , 442 , 443 , 444 , 445 , 446 , 447 , 448 , 449 includes a plurality of frames 411 and 412 included in the first video. , 413, 414, 415, 416, 417, 418, 419) may indicate a second tone mapping function that is individually defined. According to various embodiments, some of the second tone mapping functions corresponding to the second metadata 441 , 442 , 443 , 444 , 445 , 446 , 447 , 448 and 449 may be identical to each other.
  • the electronic device 101 checks the amount of change in the motion through the scene change detection 224 , and when the amount of change in the movement identified corresponding to the adjacent frames 411 and 412 is less than a predefined level, the next frame 412 .
  • the second metadata 442 corresponding to can be configured in the same way as the second metadata 441 corresponding to the previous frame 411 .
  • FIGS. 4C and 4D An example of a second tone mapping function is shown in FIGS. 4C and 4D , in accordance with various embodiments.
  • the horizontal axis of FIGS. 4C and 4D represents the luminance of the first video
  • the vertical axis of FIGS. 4C and 4D represents the luminance of the third video obtained by transforming the first video according to the second tone mapping functions 440c and 440d.
  • 4C and 4D by converting the first video having a luminance range of 0cd/m 2 to 1000cd/m 2 by second tone mapping functions 440c and 440d, 0cd/m 2 to 100cd
  • a third video having a luminance range up to /m 2 may be obtained.
  • the second tone mapping function may be the same as the second tone mapping function 440c or may be the same as the second tone mapping function 440d having a simpler form than the second tone mapping function 440c.
  • at least one processor eg, processor 120 ) of the electronic device (eg, electronic device 101 ) performs second tone mapping in consideration of computing power of the electronic device 101 .
  • the second tone mapping function may be identified in the form of a function 440c or a second tone mapping function 440d.
  • the second tone mapping function 540a applies the same method as the method for determining the first tone mapping function (eg, the first tone mapping function 430b), and , can be confirmed by substituting the third luminance instead of the second luminance.
  • the second tone mapping function 540a may be a Bezier curve generated based on the histogram analysis of the first video.
  • the second tone mapping function 540a makes the luminance higher in the first section 551a than before the conversion 501a, and in the second section 552a, the luminance is higher than before the conversion 501a. It could be a function that makes it lower. According to various embodiments, the second tone mapping function 540a may be a function such that a change in luminance is relatively small in the first section 551a and a change in luminance is relatively large in the second section 552a.
  • the second tone mapping function 540b may be identified by linearly scaling or non-linearly scaling the first tone mapping function 530b.
  • the second tone mapping function 540b may be a function that makes the luminance higher than before conversion in the first section 551b and lowers the luminance in the second section 552b than before conversion. have. According to various embodiments, the second tone mapping function 540b may be a function such that the change in luminance is relatively small in the first section 551b and the change in luminance is relatively large in the second section 552b.
  • the second tone mapping function may be further simplified.
  • 6A and 6B show examples of a method of simplifying a second tone mapping function in accordance with various embodiments.
  • the N-1st-order Bezier curve 601a is, among anchor points P0, P1, P2, P3 of the N-1st-order Bezier curve 602a, two adjacent Euclidean distances less than a preset distance. It can be identified by substituting the anchor points P1 and P2 with the midpoint P5 of the two anchor points P1 and P2.
  • a distortion error 603 occurs, but metadata corresponding to the third tone mapping function corresponds to the second tone mapping function. It has a smaller size than that of the corresponding metadata, and tone mapping using the third tone mapping function may require less computing power than tone mapping using the second tone mapping function.
  • the second tone mapping function 601b may include a plurality of inflection points 611b, 612b, 613b, and 614b
  • the at least one processor 120 of the electronic device 101 may include a plurality of inflection points 611b, 612b, and 613b. , 614b) having the same slope as the slope of the second tone mapping function 601b and passing through the plurality of inflection points 611b, 612b, 613b, 614b, respectively, a plurality of straight lines m1, m2, m3, m4 can be identified have.
  • the distortion error is less than a preset value.
  • a simplified third tone mapping function 602b may be identified.
  • the magnitude of the distortion error when the second tone mapping function 601b is replaced with the straight line m1 and the straight line m2 is the inflection point 611b and
  • the area between the inflection points 612b may be equal to the area defined by the straight line m1, the straight line m2, and the second tone mapping function 601b, and the at least one processor 120 of the electronic device 101 is It can be confirmed that the magnitude of the distortion error in the section between the inflection point 611b and the inflection point 612b is less than a preset value.
  • the at least one processor 120 of the electronic device 101 determines that the magnitude of the distortion error in the section between the inflection point 611b and the inflection point 612b is less than a preset value, between the inflection point 611b and the inflection point 612b
  • the third tone mapping function 602b may be confirmed.
  • the magnitude of the distortion error when the second tone mapping function 601b is replaced with the straight line m2 and the straight line m3 is the inflection point 612b and the inflection point 613b.
  • the straight line m2, the straight line m3, and the area defined by the second tone mapping function 601b may be equal to, and the at least one processor 120 of the electronic device 101 is an inflection point. It can be confirmed that the magnitude of the distortion error in the section between 612b and the inflection point 613b is less than a preset value.
  • the at least one processor 120 of the electronic device 101 determines that the magnitude of the distortion error is less than a preset value in the section between the inflection point 612b and the inflection point 613b, between the inflection point 612b and the inflection point 613b
  • the third tone mapping function 602b may be confirmed.
  • the magnitude of the distortion error when the second tone mapping function 601b is replaced with the straight line m3 and the straight line m4 is the inflection point 613b and the inflection point 614b.
  • the straight line m3, the straight line m4, and the area defined by the second tone mapping function 601b may be equal to, and the at least one processor 120 of the electronic device 101 is an inflection point. It can be confirmed that the magnitude of the distortion error in the section between 613b and the inflection point 614b is greater than or equal to a preset value.
  • the third tone mapping function 602b may be identified as the second tone mapping function 601b without replacing the second tone mapping function 601b with the straight lines m3 and m4.
  • the metadata corresponding to the third tone mapping function identified by simplifying the second tone mapping function is smaller than the metadata corresponding to the second tone mapping function, and the third tone mapping function is used. Tone mapping may require less computing power as compared to tone mapping using the second tone mapping function.
  • At least one processor eg, processor 120 of the electronic device (eg, electronic device 101 ) performs first metadata based on the first tone mapping function and a second tone mapping function
  • the second metadata based on ? may be associated with the first video and stored in a memory (eg, the memory 130 ).
  • the first metadata and the second metadata may be stored in a user data space of the SEI.
  • the second metadata may be stored using HDR Dynamic Metadata Syntax of ST 2094-40 described in CTA-861-G.
  • the first metadata may indicate a first tone mapping function.
  • the second metadata may indicate a second tone mapping function.
  • the second metadata may indicate the third tone mapping function identified by simplifying the second tone mapping function.
  • the second metadata may indicate a second tone mapping function and at least one third tone mapping function.
  • the second metadata may further include information about an amount of computation required by the electronic device for reproducing the first video in response to the plurality of functions.
  • the electronic device for reproducing the first video may perform tone mapping using one of a plurality of functions indicated by the second metadata based on information on the amount of computation and its own computing power.
  • the electronic device for playing the first video may include: If it is high enough to perform tone mapping using the tone mapping function, the second tone mapping function is identified by increasing the order of the third tone mapping function identified based on the second metadata, and the second tone mapping function is tone mapping may be performed on the first video using
  • FIG. 7 illustrates operations performed by an electronic device encoding a video according to various embodiments of the present disclosure.
  • the at least one processor (eg, the processor 120 ) of the electronic device operates through at least one camera (eg, the camera module 180 ).
  • a first video having a maximum luminance of the first luminance may be acquired. Details regarding operation 310 may be equally applied to operation 710 .
  • At least one processor eg, processor 120 of the electronic device (eg, electronic device 101 ) transmits the first video to a second luminance whose maximum luminance is lower than the first luminance. 2 You can check the first tone mapping function for converting to video. Details regarding operation 320 may be equally applied to operation 720 .
  • At least one processor (eg, processor 120 ) of the electronic device transmits the first video with a third luminance whose maximum luminance is lower than the second luminance. 3 You can check the second tone mapping function for converting to video. Details regarding operation 330 may be equally applied to operation 730 .
  • At least one processor eg, the processor 120 of the electronic device (eg, the electronic device 101 ) may identify third metadata based on the amount of change in the motion of the first video.
  • the processor 120 performs the scene change detection 224 , so that, based on the change amount of the frame images of the first video, a second frame indicating a frame corresponding to the scene change among a plurality of frames in the first video. 3 You can check the metadata.
  • the third metadata may indicate a boundary between frames into which a scene is divided.
  • the third metadata 851 , 852 , 853 , and 854 may indicate frames in which a new scene starts.
  • the third metadata may not only indicate boundaries of frames into which a scene is divided, but may further include additional information about the scenes.
  • the at least one processor 120 may check a resource status such as computing power and/or memory of the electronic device 101 and configure the third metadata differently based on the checked resource status.
  • the at least one processor 120 categorizes the electronic device 101 into different scenes even if the amount of change in motion between frames is small when the resource condition of the electronic device 101 is good, When the resource of the device 101 is insufficient, the third metadata may be checked to categorize the same scene into the same scene even if the amount of change in motion between frames is large.
  • the at least one processor 120 is configured to The third metadata may be checked so that the number of scenes is relatively small.
  • the at least one processor 120 may identify a plurality of third metadata having a different number of scenes.
  • the third metadata 851 , 852 , 853 , and 854 include frames 1 411 to 414 , 5 frames 415 to 7 frames 417 , 8 Frame No. 418 and Frame No. 9 419 may be categorized into different scenes, respectively.
  • the at least one processor 120 uses frames 1 to 411 to frame 417 as one scene, and frame 8 to frame 8 .
  • Third metadata (not shown) for categorizing frames 418 and ninth frames 419 into another scene may be further identified.
  • the at least one processor 120 may check the scene transformation coefficient values corresponding to the plurality of third metadata.
  • a high scene transform coefficient value may indicate a large number of scene changes and a relatively large number of scenes included in the video.
  • At least one processor eg, processor 120 of the electronic device (eg, electronic device 101 ) performs first metadata based on the first tone mapping function, the second tone mapping function
  • the second metadata and the third metadata based on ? may be associated with the first video and stored in a memory (eg, the memory 130 ).
  • a memory eg, the memory 130 .
  • the details described above with respect to operation 340 may be equally applied in operation 750 .
  • the at least one processor 120 may store one piece of third metadata in association with the first video, or store a plurality of pieces of third metadata in association with the first video. According to various embodiments, when storing the plurality of third metadata in association with the first video, the at least one processor 120 may further store scene transformation coefficient values corresponding to the plurality of third metadata. .
  • the second tone is different for each frame based on the second metadata 441 , 442 , 443 , 444 , 445 , 446 , 447 , 448 , and 449 .
  • the first video may be transformed by applying the same second tone mapping function to frames included in the same scene based on the third metadata 851 , 852 , 853 , and 854 .
  • an electronic device for reproducing the first video may use one third metadata among a plurality of third metadata in consideration of a computational resource such as its own computing power.
  • the electronic device for reproducing the first video uses a plurality of third metadata corresponding to a large scene transformation coefficient when the computational resource is good, and uses a plurality of pieces of third metadata corresponding to a small scene transformation coefficient when the computational resource is insufficient. of the third metadata can be used.
  • At least one processor eg, the processor 120 of the electronic device (eg, the electronic device 101 ) may obtain a first video and metadata associated with the first video.
  • metadata associated with the first video may include first metadata and second metadata.
  • metadata associated with the first video may include first metadata, second metadata, and third metadata.
  • At least one processor (eg, processor 120 ) of the electronic device sets the maximum value supported by the display (eg, display module 160 ). It is possible to check the luminance and the function performed in the application on which the execution screen is displayed on the display 160 .
  • At least one processor (eg, processor 120 ) of the electronic device sets the maximum supported by the display (eg, display module 160 ). Based on the luminance and the function performed in the application, a first video having a maximum luminance of a first luminance is displayed on the display 160, or a second luminance of which the maximum luminance is lower than the first luminance based on the first tone mapping function. The second video may be displayed, or a video having a third luminance whose maximum luminance is lower than the second luminance based on the second tone mapping function may be displayed.
  • the display format of the video displayed by the at least one processor 120 may be limited by the maximum luminance supported by the display 160 .
  • the at least one processor 120 may display the video on the display 160 in a display format where the maximum luminance is the first luminance or the second luminance. cannot be displayed, and video can be displayed only in a display format in which the maximum luminance is the third luminance.
  • the at least one processor 120 may display the display 160 on the display 160 in a display format in which the maximum luminance is the first luminance.
  • the video cannot be displayed, and the video can be displayed in a display format in which the maximum luminance is the second luminance or the third luminance.
  • the at least one processor 120 may display the video on the display 160 in a display format in which the maximum luminance is the first luminance.
  • a display format of a video displayed on the at least one processor 120 may be limited by a function performed in an application that displays an execution screen on the display 160 .
  • the function currently performed in the application further includes display of the first video having the maximum luminance of the first luminance as well as the display of the video or still image having the maximum luminance of the third luminance, in other words, the display 160 )
  • the at least one processor 120 converts the first video to a maximum luminance of the third luminance. It can be converted into a display format and displayed.
  • the at least one processor 120 is The first video may be converted and displayed in a display format in which the maximum luminance is the third luminance.
  • the function currently performed in the application in which the execution screen is displayed on the display 160 is the thumbnail display of the first video whose maximum luminance is the first luminance or the capture image display from the first video
  • at least one The processor 120 may convert a frame corresponding to a thumbnail or a captured image in the first video into a display format in which the maximum luminance is a third luminance, and display it as a thumbnail or a captured image.
  • the at least one processor 120 is configured to display a display format with a lower maximum luminance among a display format indicated by the maximum luminance supported by the display 160 and a display format indicated by a function performed in an application. So, the video can be displayed.
  • the at least one processor 120 displays the first video having the maximum luminance of the first luminance on the display 160 , the first metadata, the second metadata, or the third metadata
  • the first video may be displayed without referring to .
  • the at least one processor 120 may display the first video based on the first metadata.
  • a first tone mapping function for converting a second video having a maximum luminance of a second luminance is identified, the first video is converted into a second video based on the first tone mapping function, and the second video is displayed (160). can be displayed on the
  • the at least one processor 120 may display the first video based on the second metadata.
  • a second tone mapping function for converting a video having a maximum luminance of a third luminance is identified, the first video is converted into a video having a third luminance based on the second tone mapping function, and the converted video is displayed (160). can be displayed on the
  • the at least one processor 120 determines resource conditions such as computing power and/or memory resources of the electronic device 101 . and may transform the first video using a different tone mapping function based on the resource situation. For example, when the resource of the electronic device 101 is good, the at least one processor 120 converts the first video into a video having a maximum luminance of a third luminance by using the second tone mapping function, and the electronic device 101 . ), the first video is converted to a video having a maximum luminance of a third luminance using a third tone mapping function identified by simplifying the second tone mapping function, and the converted video is displayed on the display 160 . can be displayed
  • the at least one processor 120 may generate third metadata indicating a frame corresponding to a scene change in the first video.
  • the first video may be converted.
  • the at least one processor 120 converts the first video into a video having a maximum luminance of a third luminance by using the same second tone mapping function for frames included in the same scene by referring to the third metadata, The converted video may be displayed on the display 160 .
  • the at least one processor 120 when displaying the first video in a display format in which the maximum luminance is the third luminance, the at least one processor 120 further refers to the third metadata in consideration of the resource condition of the electronic device 101 . may or may not be referenced. For example, when the resource of the electronic device 101 is good, the at least one processor 120 converts the first video into a video having a maximum luminance of a third luminance by using a second tone mapping function defined differently for each frame. When the resource of the electronic device 101 is insufficient, the first video is converted to a video having a maximum luminance of a third luminance by using the same second tone mapping function for frames included in the same scene by referring to the third metadata. , and the converted video may be displayed on the display 160 .
  • the at least one processor 120 displays the first video in a display format in which the maximum luminance is the third luminance and refers to the third metadata
  • the resource situation of the electronic device 101 is considered.
  • the first video may be converted by referring to one of the plurality of third metadata.
  • the at least one processor 120 refers to third metadata corresponding to a high scene transformation coefficient value among a plurality of third metadata, and the electronic device 101 .
  • the third metadata corresponding to the low scene transformation coefficient value among the plurality of third metadata is referred to, and the first video is generated using the same second tone mapping function for frames included in the same scene.
  • a video having a maximum luminance of a third luminance may be converted, and the converted video may be displayed on the display 160 .
  • the third metadata is added to the metadata associated with the first video obtained in operation 910 .
  • the first video may be converted into a video having a maximum luminance of a third luminance by using the same second tone mapping function for a plurality of frames in consideration of the resource condition of the electronic device 101 .
  • the at least one processor 120 groups a plurality of frames included in the first video in an IDR unit, and applies the same to frames included in the same group.
  • the first video may be converted into a video having a maximum luminance of a third luminance using the second tone mapping function, and the converted video may be displayed on the display 160 .
  • the electronic device (eg, the electronic device 101 ) includes at least one camera (eg, the camera module 180 ), and at least one processor (eg, the processor 120 ). )), wherein the at least one processor 120 acquires a first video having a maximum luminance of a first luminance through the at least one camera (eg, the camera module 180), and the second A first tone mapping function for converting a video into a second video having a second luminance having a maximum luminance lower than the first luminance is identified, and the first video is converted to a third luminance having a maximum luminance lower than the second luminance.
  • Identifies a second tone mapping function for converting to a third video and stores first metadata based on the first tone mapping function and second metadata based on the second tone mapping function in association with the first video can be configured to
  • the second tone mapping function may be individually defined for a plurality of frames included in the first video.
  • the at least one processor 120 may be configured to identify the second tone mapping function in the form of a Bezier curve based on a histogram analysis of the third luminance and the first video.
  • the at least one processor 120 may be configured to identify the second tone mapping function by non-linearly scaling the first tone mapping function.
  • the at least one processor 120 is configured to convert the first video into a fourth video having a third luminance lower than the second luminance by simplifying the second tone mapping function. and identify a third tone mapping function for, the second metadata may be identified based on the second tone mapping function and the third tone mapping function.
  • the second metadata may be configured to include information on the amount of operations corresponding to the second tone mapping function and the third tone mapping function.
  • the at least one processor 120 identifies third metadata indicating a frame corresponding to a scene change in the first video based on the amount of change of frame images of the first video, and , and store the third metadata in association with the first video.
  • the at least one processor 120 may be configured to check the resource status of the electronic device 101 and to check the third metadata based on the resource status.
  • the at least one processor 120 identifies a plurality of third metadata having different scene change coefficients, and sets a plurality of scene change coefficients corresponding to the plurality of third metadata to the plurality of scene change coefficients. It may be configured to store in correspondence with the third metadata.
  • the electronic device (eg, the electronic device 101 ) includes a display (eg, the display module 160 ) and at least one processor (eg, the processor 120 ). and the at least one processor 120 obtains a first video having a maximum luminance of a first luminance and metadata associated with the first video, wherein the metadata sets the first video to a lower luminance than the first luminance.
  • First metadata representing a first tone mapping function for converting a second video having a second luminance, and second tone mapping for converting the first video into a video having a third luminance lower than the second luminance.
  • It includes second metadata indicating a function, and confirms the maximum luminance supported by the display and a function performed in an application in which an execution screen is displayed on the display, and the maximum luminance supported by the display and in the application Based on a function performed, displaying the first video, displaying the second video based on the first tone mapping function, or displaying a video whose maximum luminance is the third luminance based on the second tone mapping function may be configured to display.
  • the second metadata further indicates a third tone mapping function for converting the first video into a video having a maximum luminance of the third luminance
  • the at least one processor 120 is configured to: Based on the maximum luminance supported by the display and the function performed by the application, as part of an operation of displaying a video having the maximum luminance of the third luminance, the resource status of the electronic device 101 is checked, and the resource Tone mapping is performed on the first video based on the second tone mapping function, or tone mapping is performed on the first video based on the third tone mapping function, according to a situation. and display a video whose maximum luminance is the third luminance based on the tone mapping.
  • the metadata includes a plurality of third metadata indicating a frame corresponding to a scene change in the first video, the plurality of third metadata corresponding to different scene change coefficients;
  • the at least one processor 120 performs, as part of an operation of displaying a video having the maximum luminance of the third luminance, based on the maximum luminance supported by the display and a function performed in the application, the electronic device ( 101), and perform tone mapping on the first video based on one third metadata and second metadata identified based on the resource status among the plurality of third metadata, and display a video whose maximum luminance is the third luminance based on the tone mapping to the first video.
  • the method performed in the electronic device is performed through at least one camera (eg, the camera module 180 ) of the electronic device 101 .
  • obtaining a first video having a luminance of a first luminance identifying a first tone mapping function for converting the first video into a second video having a second luminance having a maximum luminance lower than the first luminance; identifying a second tone mapping function for converting a first video into a third video having a third luminance lower than the second luminance, and first metadata based on the first tone mapping function and the second luminance and storing second metadata based on the two tone mapping function in association with the first video.
  • the second tone mapping function may be individually defined for a plurality of frames included in the first video.
  • the confirming of the second tone mapping function may include identifying the second tone mapping function in the form of a Bezier curve based on the analysis of the third luminance and the histogram of the first video. It can include actions.
  • the operation of identifying the second tone mapping function may include the operation of non-linearly scaling the first tone mapping function.
  • the method includes a third tone mapping function for converting the first video into a third video having a third luminance lower than the second luminance by simplifying the second tone mapping function.
  • the method may further include identifying the second metadata, wherein the second metadata may be identified based on the second tone mapping function and the third tone mapping function.
  • the method includes: identifying third metadata indicating a frame corresponding to a scene change in the first video, based on a change amount of frame images of the first video;
  • the method may further include storing metadata in association with the first video.
  • the method may further include checking the resource status of the electronic device 101 , and the checking of the third metadata may be performed based on the resource status.
  • the checking of the third metadata includes checking a plurality of third metadata having different scene change coefficients
  • the method includes: The method may further include storing a plurality of scene change coefficients in correspondence with the plurality of third metadata.
  • the electronic device may have various types of devices.
  • the electronic device may include, for example, a portable communication device (eg, a smart phone), a computer device, a portable multimedia device, a portable medical device, a camera, a wearable device, or a home appliance device.
  • a portable communication device eg, a smart phone
  • a computer device e.g., a smart phone
  • a portable multimedia device e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a wearable device e.g., a smart bracelet
  • a home appliance device e.g., a home appliance
  • first, second, or first or second may simply be used to distinguish an element from other elements in question, and may refer elements to other aspects (e.g., importance or order) is not limited. It is said that one (eg, first) component is “coupled” or “connected” to another (eg, second) component, with or without the terms “functionally” or “communicatively”. When referenced, it means that one component can be connected to the other component directly (eg by wire), wirelessly, or through a third component.
  • module used in various embodiments of this document may include a unit implemented in hardware, software, or firmware, and is interchangeable with terms such as, for example, logic, logic block, component, or circuit.
  • a module may be an integrally formed part or a minimum unit or a part of the part that performs one or more functions.
  • the module may be implemented in the form of an application-specific integrated circuit (ASIC).
  • ASIC application-specific integrated circuit
  • Various embodiments of the present document include one or more instructions stored in a storage medium (eg, internal memory 136 or external memory 138) readable by a machine (eg, electronic device 101).
  • a storage medium eg, internal memory 136 or external memory 138
  • the processor eg, the processor 120
  • the device eg, the electronic device 101
  • the one or more instructions may include code generated by a compiler or code executable by an interpreter.
  • the device-readable storage medium may be provided in the form of a non-transitory storage medium.
  • 'non-transitory' only means that the storage medium is a tangible device and does not contain a signal (eg, electromagnetic wave), and this term is used in cases where data is semi-permanently stored in the storage medium and It does not distinguish between temporary storage cases.
  • a signal eg, electromagnetic wave
  • the method according to various embodiments disclosed in this document may be provided in a computer program product (computer program product).
  • Computer program products may be traded between sellers and buyers as commodities.
  • the computer program product is distributed in the form of a machine-readable storage medium (eg compact disc read only memory (CD-ROM)), or through an application store (eg Play StoreTM) or on two user devices ( It can be distributed (eg downloaded or uploaded) directly or online between smartphones (eg: smartphones).
  • a portion of the computer program product may be temporarily stored or temporarily created in a machine-readable storage medium such as a memory of a server of a manufacturer, a server of an application store, or a relay server.
  • each component eg, a module or a program of the above-described components may include a singular or a plurality of entities, and some of the plurality of entities may be separately disposed in other components. have.
  • one or more components or operations among the above-described corresponding components may be omitted, or one or more other components or operations may be added.
  • a plurality of components eg, a module or a program
  • the integrated component may perform one or more functions of each component of the plurality of components identically or similarly to those performed by the corresponding component among the plurality of components prior to the integration. .
  • operations performed by a module, program, or other component are executed sequentially, in parallel, repeatedly, or heuristically, or one or more of the operations are executed in a different order, or omitted. or one or more other operations may be added.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Studio Devices (AREA)

Abstract

다양한 실시예에 따라서, 전자 장치는, 적어도 하나의 카메라, 및 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는, 상기 적어도 하나의 카메라를 통하여 최대 휘도가 제1 휘도인 제1 비디오를 획득하고, 상기 제1 비디오를 최대 휘도가 상기 제1 휘도보다 낮은 제2 휘도인 제2 비디오로 변환하기 위한 제1 톤 매핑 함수를 확인하고, 상기 제1 비디오를 최대 휘도가 상기 제2 휘도보다 낮은 제3 휘도인 제3 비디오로 변환하기 위한 제2 톤 매핑 함수를 확인하고, 상기 제1 톤 매핑 함수에 기초한 제1 메타데이터 및 상기 제2 톤 매핑 함수에 기초한 제2 메타데이터를 상기 제1 비디오에 연관시켜 저장하도록 구성될 수 있다. 그 밖의 다양한 실시예가 가능하다.

Description

비디오를 인코딩하는 전자 장치 및 그 제어 방법
다양한 실시예는 비디오를 인코딩하는 전자 장치 및 그 제어 방법에 관한 것이다.
HDR10+는 동적 메타데이터를 이용한 렌더링을 지원하는 HDR 포맷으로서, SMPTE 2094-40의 기술 문서에서 기술된다. HDR10+ 비디오를 카메라로 촬영한 전자 장치는, 프레임별로 영상의 특성을 분석하여 HDR10+의 동적 톤 매핑 함수를 생성하고, 동적 톤 매핑 함수를 나타내는 메타데이터를 HEVC 코덱의 SEI user data space에 저장할 수 있다.
HDR10+ 비디오를 재생하는 전자 장치가 HDR10+ 비디오의 최대 휘도를 지원하지 않는 경우, 전자 장치는 HDR10+ 비디오를 낮은 최대 휘도를 갖는 비디오로 변환하기 위하여, SEI user data space에 저장된 메타데이터를 파싱하여 동적 톤 매핑 함수를 획득하고, 동적 톤 매핑 함수에 기초하여 HDR10+ 비디오에 톤 매핑을 수행할 수 있다. 또한, HDR10+ 비디오를 SDR 형식으로 재생하는 전자 장치는, 동적 톤 매핑 함수를 참조하여 SDR 톤 매핑 함수를 생성하고, SDR 톤 매핑 함수에 기초하여 HDR10+ 비디오에 톤 매핑을 수행할 수 있다.
HDR10+ 비디오를 SDR 형식으로 재생하는 전자 장치는, 동적 톤 매핑 함수를 참조하여 SDR 톤 매핑 함수를 생성하고, SDR 톤 매핑 함수에 기초하여 HDR10+ 비디오에 톤 매핑을 수행할 수 있다. 스마트폰에서 촬영된 HDR10+ 비디오가 편집되고 공유되는 과정에서, SDR 톤 매핑 함수의 생성이 빈번하게 요구될 수 있다. 또한, 동영상의 프레임 수가 많은 경우 SDR 톤 매핑 함수를 생성하는 과정은 더 많은 연산량을 요구할 수 있다.
다양한 실시예에 따른 전자 장치는 최대 휘도가 제1 휘도인 제1 비디오를 최대 휘도가 제1 휘도보다 낮은 제2 휘도인 제2 비디오로 변환하기 위한 제1 톤 매핑 함수를 나타내는 제1 메타데이터 및 제1 비디오를 최대 휘도가 제2 휘도보다 낮은 제3 휘도인 제3 비디오로 변환하기 위한 제2 톤 매핑 함수를 나타내는 제2 메타데이터를 제1 비디오에 연관시켜 저장할 수 있다.
다양한 실시예에 따른 전자 장치는, 적어도 하나의 카메라, 및 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는, 상기 적어도 하나의 카메라를 통하여 최대 휘도가 제1 휘도인 제1 비디오를 획득하고, 상기 제1 비디오를 최대 휘도가 상기 제1 휘도보다 낮은 제2 휘도인 제2 비디오로 변환하기 위한 제1 톤 매핑 함수를 확인하고, 상기 제1 비디오를 최대 휘도가 상기 제2 휘도보다 낮은 제3 휘도인 제3 비디오로 변환하기 위한 제2 톤 매핑 함수를 확인하고, 상기 제1 톤 매핑 함수에 기초한 제1 메타데이터 및 상기 제2 톤 매핑 함수에 기초한 제2 메타데이터를 상기 제1 비디오에 연관시켜 저장하도록 구성될 수 있다.
다양한 실시예에 따른 전자 장치에서 수행되는 방법은, 상기 전자 장치의 적어도 하나의 카메라를 통하여 최대 휘도가 제1 휘도인 제1 비디오를 획득하는 동작, 상기 제1 비디오를 최대 휘도가 상기 제1 휘도보다 낮은 제2 휘도인 제2 비디오로 변환하기 위한 제1 톤 매핑 함수를 확인하는 동작, 상기 제1 비디오를 최대 휘도가 상기 제2 휘도보다 낮은 제3 휘도인 제3 비디오로 변환하기 위한 제2 톤 매핑 함수를 확인하는 동작, 및 상기 제1 톤 매핑 함수에 기초한 제1 메타데이터 및 상기 제2 톤 매핑 함수에 기초한 제2 메타데이터를 상기 제1 비디오에 연관시켜 저장하는 동작을 포함할 수 있다.
다양한 실시예에 따른 전자 장치는, 디스플레이 및 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는, 최대 휘도가 제1 휘도인 제1 비디오 및 상기 제1 비디오에 연관된 메타데이터를 획득하고, 상기 메타데이터는 상기 제1 비디오를 상기 제1 휘도보다 낮은 제2 휘도인 제2 비디오로 변환하기 위한 제1 톤 매핑 함수를 나타내는 제1 메타데이터, 및 제1 비디오를 최대 휘도가 상기 제2 휘도보다 낮은 제3 휘도인 비디오로 변환하기 위한 제2 톤 매핑 함수를 나타내는 제2 메타데이터를 포함하고, 상기 디스플레이에 의하여 지원되는 최대 휘도 및 상기 디스플레이 상에 실행 화면이 표시되는 어플리케이션에서 수행되는 기능을 확인하고, 상기 디스플레이에 의하여 지원되는 최대 휘도 및 상기 어플리케이션에서 수행되는 기능에 기초하여, 상기 제1 비디오를 표시하거나, 상기 제1 톤 매핑 함수에 기초하여 상기 제2 비디오를 표시하거나, 상기 제2 톤 매핑 함수에 기초하여 최대 휘도가 상기 제3 휘도인 비디오를 표시하도록 구성될 수 있다.
다양한 실시예에 따라서, 비디오를 인코딩하는 전자 장치 및 그 제어 방법이 제공된다. 다양한 실시예에 따른 전자 장치는 최대 휘도가 제1 휘도인 제1 비디오를 최대 휘도가 제1 휘도보다 낮은 제2 휘도인 제2 비디오로 변환하기 위한 제1 톤 매핑 함수를 나타내는 제1 메타데이터 및 제1 비디오를 최대 휘도가 제2 휘도보다 낮은 제3 휘도인 제3 비디오로 변환하기 위한 제2 톤 매핑 함수를 나타내는 제2 메타데이터를 제1 비디오에 연관시켜 저장할 수 있다. 제1 메타데이터뿐 아니라 제2 메타데이터가 제1 비디오에 연관되어 저장되므로, 제1 비디오를 디코딩하여 재생하는 전자 장치에서는, 제1 톤 매핑 함수에 기초하여 제2 톤 매핑 함수를 생성할 필요 없이, 제2 메타데이터를 파싱하여 제2 톤 매핑 함수를 확인할 수 있으므로, 적은 연산량으로 제1 비디오를 최대 휘도가 낮은 형태로 변환할 수 있다.
다양한 실시예에 따른 전자 장치는 제1 비디오 내에서 장면 전환에 대응하는 프레임을 나타내는 제3 메타데이터를 제1 비디오에 연관시켜 저장함으로써, 제1 비디오를 디코딩하여 재생하는 전자 장치에서 동일한 장면에 대하여 동일한 제2 톤 매핑 함수를 사용함으로써 소모전류를 저감하는 것을 가능하게 할 수 있다.
도 1은 다양한 실시예에 따른, 네트워크 환경 내의 전자 장치의 블록도이다.
도 2는 다양한 실시예에 따른, 비디오를 인코딩하는 전자 장치 및 디코딩하는 전자 장치의 블록도이다.
도 3은 다양한 실시예에 따른 비디오를 인코딩하는 전자 장치에서 수행되는 동작들을 도시한다.
도 4a는 다양한 실시예에 따른 제1 메타데이터 및 제2 메타데이터를 도시한다.
도 4b는 다양한 실시예에 따른 제1 톤 매핑 함수의 예시를 도시한다.
도 4c는 다양한 실시예에 따른 제2 톤 매핑 함수의 예시를 도시한다.
도 4d는 다양한 실시예에 따른 제2 톤 매핑 함수의 예시를 도시한다.
도 5a는 다양한 실시예에 따른 제2 톤 매핑 함수를 생성하는 방법의 예시를 도시한다.
도 5b는 다양한 실시예에 따른 제2 톤 매핑 함수를 생성하는 방법의 예시를 도시한다.
도 6a는 다양한 실시예에 따른 제2 톤 매핑 함수를 단순화하는 방법의 예시를 도시한다.
도 6b는 다양한 실시예에 따른 제2 톤 매핑 함수를 단순화하는 방법의 예시를 도시한다.
도 7은 다양한 실시예에 따른 비디오를 인코딩하는 전자 장치에서 수행되는 동작들을 도시한다.
도 8은 다양한 실시예에 따른 제1 메타데이터, 제2 메타데이터, 및 제3 메타데이터를 도시한다.
도 9는 다양한 실시예에 따른 비디오를 디코딩하는 전자 장치에서 수행되는 동작들을 도시한다.
도 1은, 다양한 실시예들에 따른, 네트워크 환경(100) 내의 전자 장치(101)의 블록도이다. 도 1을 참조하면, 네트워크 환경(100)에서 전자 장치(101)는 제 1 네트워크(198)(예: 근거리 무선 통신 네트워크)를 통하여 전자 장치(102)와 통신하거나, 또는 제 2 네트워크(199)(예: 원거리 무선 통신 네트워크)를 통하여 전자 장치(104) 또는 서버(108)와 통신할 수 있다. 일실시예에 따르면, 전자 장치(101)는 서버(108)를 통하여 전자 장치(104)와 통신할 수 있다. 일실시예에 따르면, 전자 장치(101)는 프로세서(120), 메모리(130), 입력 모듈(150), 음향 출력 모듈(155), 디스플레이 모듈(160), 오디오 모듈(170), 센서 모듈(176), 인터페이스(177), 연결 단자(178), 햅틱 모듈(179), 카메라 모듈(180), 전력 관리 모듈(188), 배터리(189), 통신 모듈(190), 가입자 식별 모듈(196), 또는 안테나 모듈(197)을 포함할 수 있다. 어떤 실시예에서는, 전자 장치(101)에는, 이 구성요소들 중 적어도 하나(예: 연결 단자(178))가 생략되거나, 하나 이상의 다른 구성요소가 추가될 수 있다. 어떤 실시예에서는, 이 구성요소들 중 일부들(예: 센서 모듈(176), 카메라 모듈(180), 또는 안테나 모듈(197))은 하나의 구성요소(예: 디스플레이 모듈(160))로 통합될 수 있다.
프로세서(120)는, 예를 들면, 소프트웨어(예: 프로그램(140))를 실행하여 프로세서(120)에 연결된 전자 장치(101)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일실시예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(120)는 다른 구성요소(예: 센서 모듈(176) 또는 통신 모듈(190))로부터 수신된 명령 또는 데이터를 휘발성 메모리(132)에 저장하고, 휘발성 메모리(132)에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비휘발성 메모리(134)에 저장할 수 있다. 일실시예에 따르면, 프로세서(120)는 메인 프로세서(121)(예: 중앙 처리 장치 또는 어플리케이션 프로세서) 또는 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(123)(예: 그래픽 처리 장치, 신경망 처리 장치(NPU: neural processing unit), 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다. 예를 들어, 전자 장치(101)가 메인 프로세서(121) 및 보조 프로세서(123)를 포함하는 경우, 보조 프로세서(123)는 메인 프로세서(121)보다 저전력을 사용하거나, 지정된 기능에 특화되도록 설정될 수 있다. 보조 프로세서(123)는 메인 프로세서(121)와 별개로, 또는 그 일부로서 구현될 수 있다.
보조 프로세서(123)는, 예를 들면, 메인 프로세서(121)가 인액티브(예: 슬립) 상태에 있는 동안 메인 프로세서(121)를 대신하여, 또는 메인 프로세서(121)가 액티브(예: 어플리케이션 실행) 상태에 있는 동안 메인 프로세서(121)와 함께, 전자 장치(101)의 구성요소들 중 적어도 하나의 구성요소(예: 디스플레이 모듈(160), 센서 모듈(176), 또는 통신 모듈(190))와 관련된 기능 또는 상태들의 적어도 일부를 제어할 수 있다. 일실시예에 따르면, 보조 프로세서(123)(예: 이미지 시그널 프로세서 또는 커뮤니케이션 프로세서)는 기능적으로 관련 있는 다른 구성요소(예: 카메라 모듈(180) 또는 통신 모듈(190))의 일부로서 구현될 수 있다. 일실시예에 따르면, 보조 프로세서(123)(예: 신경망 처리 장치)는 인공지능 모델의 처리에 특화된 하드웨어 구조를 포함할 수 있다. 인공지능 모델은 기계 학습을 통해 생성될 수 있다. 이러한 학습은, 예를 들어, 인공지능이 수행되는 전자 장치(101) 자체에서 수행될 수 있고, 별도의 서버(예: 서버(108))를 통해 수행될 수도 있다. 학습 알고리즘은, 예를 들어, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)을 포함할 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은, 복수의 인공 신경망 레이어들을 포함할 수 있다. 인공 신경망은 심층 신경망(DNN: deep neural network), CNN(convolutional neural network), RNN(recurrent neural network), RBM(restricted boltzmann machine), DBN(deep belief network), BRDNN(bidirectional recurrent deep neural network), 심층 Q-네트워크(deep Q-networks) 또는 상기 중 둘 이상의 조합 중 하나일 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은 하드웨어 구조 이외에, 추가적으로 또는 대체적으로, 소프트웨어 구조를 포함할 수 있다.
메모리(130)는, 전자 장치(101)의 적어도 하나의 구성요소(예: 프로세서(120) 또는 센서 모듈(176))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램(140)) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(130)는, 휘발성 메모리(132) 또는 비휘발성 메모리(134)를 포함할 수 있다.
프로그램(140)은 메모리(130)에 소프트웨어로서 저장될 수 있으며, 예를 들면, 운영 체제(142), 미들 웨어(144) 또는 어플리케이션(146)을 포함할 수 있다.
입력 모듈(150)은, 전자 장치(101)의 구성요소(예: 프로세서(120))에 사용될 명령 또는 데이터를 전자 장치(101)의 외부(예: 사용자)로부터 수신할 수 있다. 입력 모듈(150)은, 예를 들면, 마이크, 마우스, 키보드, 키(예: 버튼), 또는 디지털 펜(예: 스타일러스 펜)을 포함할 수 있다.
음향 출력 모듈(155)은 음향 신호를 전자 장치(101)의 외부로 출력할 수 있다. 음향 출력 모듈(155)은, 예를 들면, 스피커 또는 리시버를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 녹음 재생과 같이 일반적인 용도로 사용될 수 있다. 리시버는 착신 전화를 수신하기 위해 사용될 수 있다. 일실시예에 따르면, 리시버는 스피커와 별개로, 또는 그 일부로서 구현될 수 있다.
디스플레이 모듈(160)은 전자 장치(101)의 외부(예: 사용자)로 정보를 시각적으로 제공할 수 있다. 디스플레이 모듈(160)은, 예를 들면, 디스플레이, 홀로그램 장치, 또는 프로젝터 및 해당 장치를 제어하기 위한 제어 회로를 포함할 수 있다. 일실시예에 따르면, 디스플레이 모듈(160)은 터치를 감지하도록 설정된 터치 센서, 또는 상기 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 압력 센서를 포함할 수 있다.
오디오 모듈(170)은 소리를 전기 신호로 변환시키거나, 반대로 전기 신호를 소리로 변환시킬 수 있다. 일실시예에 따르면, 오디오 모듈(170)은, 입력 모듈(150)을 통해 소리를 획득하거나, 음향 출력 모듈(155), 또는 전자 장치(101)와 직접 또는 무선으로 연결된 외부 전자 장치(예: 전자 장치(102))(예: 스피커 또는 헤드폰)를 통해 소리를 출력할 수 있다.
센서 모듈(176)은 전자 장치(101)의 작동 상태(예: 전력 또는 온도), 또는 외부의 환경 상태(예: 사용자 상태)를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일실시예에 따르면, 센서 모듈(176)은, 예를 들면, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 또는 조도 센서를 포함할 수 있다.
인터페이스(177)는 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 직접 또는 무선으로 연결되기 위해 사용될 수 있는 하나 이상의 지정된 프로토콜들을 지원할 수 있다. 일실시예에 따르면, 인터페이스(177)는, 예를 들면, HDMI(high definition multimedia interface), USB(universal serial bus) 인터페이스, SD카드 인터페이스, 또는 오디오 인터페이스를 포함할 수 있다.
연결 단자(178)는, 그를 통해서 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일실시예에 따르면, 연결 단자(178)는, 예를 들면, HDMI 커넥터, USB 커넥터, SD 카드 커넥터, 또는 오디오 커넥터(예: 헤드폰 커넥터)를 포함할 수 있다.
햅틱 모듈(179)은 전기적 신호를 사용자가 촉각 또는 운동 감각을 통해서 인지할 수 있는 기계적인 자극(예: 진동 또는 움직임) 또는 전기적인 자극으로 변환할 수 있다. 일실시예에 따르면, 햅틱 모듈(179)은, 예를 들면, 모터, 압전 소자, 또는 전기 자극 장치를 포함할 수 있다.
카메라 모듈(180)은 정지 영상 및 동영상을 촬영할 수 있다. 일실시예에 따르면, 카메라 모듈(180)은 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다.
전력 관리 모듈(188)은 전자 장치(101)에 공급되는 전력을 관리할 수 있다. 일실시예에 따르면, 전력 관리 모듈(188)은, 예를 들면, PMIC(power management integrated circuit)의 적어도 일부로서 구현될 수 있다.
배터리(189)는 전자 장치(101)의 적어도 하나의 구성요소에 전력을 공급할 수 있다. 일실시예에 따르면, 배터리(189)는, 예를 들면, 재충전 불가능한 1차 전지, 재충전 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.
통신 모듈(190)은 전자 장치(101)와 외부 전자 장치(예: 전자 장치(102), 전자 장치(104), 또는 서버(108)) 간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(190)은 프로세서(120)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일실시예에 따르면, 통신 모듈(190)은 무선 통신 모듈(192)(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(194)(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제 1 네트워크(198)(예: 블루투스, WiFi(wireless fidelity) direct 또는 IrDA(infrared data association)와 같은 근거리 통신 네트워크) 또는 제 2 네트워크(199)(예: 레거시 셀룰러 네트워크, 5G 네트워크, 차세대 통신 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부의 전자 장치(104)와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성요소(예: 단일 칩)로 통합되거나, 또는 서로 별도의 복수의 구성요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈(192)은 가입자 식별 모듈(196)에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제 1 네트워크(198) 또는 제 2 네트워크(199)와 같은 통신 네트워크 내에서 전자 장치(101)를 확인 또는 인증할 수 있다.
무선 통신 모듈(192)은 4G 네트워크 이후의 5G 네트워크 및 차세대 통신 기술, 예를 들어, NR 접속 기술(new radio access technology)을 지원할 수 있다. NR 접속 기술은 고용량 데이터의 고속 전송(eMBB(enhanced mobile broadband)), 단말 전력 최소화와 다수 단말의 접속(mMTC(massive machine type communications)), 또는 고신뢰도와 저지연(URLLC(ultra-reliable and low-latency communications))을 지원할 수 있다. 무선 통신 모듈(192)은, 예를 들어, 높은 데이터 전송률 달성을 위해, 고주파 대역(예: mmWave 대역)을 지원할 수 있다. 무선 통신 모듈(192)은 고주파 대역에서의 성능 확보를 위한 다양한 기술들, 예를 들어, 빔포밍(beamforming), 거대 배열 다중 입출력(massive MIMO(multiple-input and multiple-output)), 전차원 다중입출력(FD-MIMO: full dimensional MIMO), 어레이 안테나(array antenna), 아날로그 빔형성(analog beam-forming), 또는 대규모 안테나(large scale antenna)와 같은 기술들을 지원할 수 있다. 무선 통신 모듈(192)은 전자 장치(101), 외부 전자 장치(예: 전자 장치(104)) 또는 네트워크 시스템(예: 제 2 네트워크(199))에 규정되는 다양한 요구사항을 지원할 수 있다. 일실시예에 따르면, 무선 통신 모듈(192)은 eMBB 실현을 위한 Peak data rate(예: 20Gbps 이상), mMTC 실현을 위한 손실 Coverage(예: 164dB 이하), 또는 URLLC 실현을 위한 U-plane latency(예: 다운링크(DL) 및 업링크(UL) 각각 0.5ms 이하, 또는 라운드 트립 1ms 이하)를 지원할 수 있다.
안테나 모듈(197)은 신호 또는 전력을 외부(예: 외부의 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일실시예에 따르면, 안테나 모듈(197)은 서브스트레이트(예: PCB) 위에 형성된 도전체 또는 도전성 패턴으로 이루어진 방사체를 포함하는 안테나를 포함할 수 있다. 일실시예에 따르면, 안테나 모듈(197)은 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다. 이런 경우, 제 1 네트워크(198) 또는 제 2 네트워크(199)와 같은 통신 네트워크에서 사용되는 통신 방식에 적합한 적어도 하나의 안테나가, 예를 들면, 통신 모듈(190)에 의하여 상기 복수의 안테나들로부터 선택될 수 있다. 신호 또는 전력은 상기 선택된 적어도 하나의 안테나를 통하여 통신 모듈(190)과 외부의 전자 장치 간에 송신되거나 수신될 수 있다. 어떤 실시예에 따르면, 방사체 이외에 다른 부품(예: RFIC(radio frequency integrated circuit))이 추가로 안테나 모듈(197)의 일부로 형성될 수 있다.
다양한 실시예에 따르면, 안테나 모듈(197)은 mmWave 안테나 모듈을 형성할 수 있다. 일실시예에 따르면, mmWave 안테나 모듈은 인쇄 회로 기판, 상기 인쇄 회로 기판의 제 1 면(예: 아래 면)에 또는 그에 인접하여 배치되고 지정된 고주파 대역(예: mmWave 대역)을 지원할 수 있는 RFIC, 및 상기 인쇄 회로 기판의 제 2 면(예: 윗 면 또는 측 면)에 또는 그에 인접하여 배치되고 상기 지정된 고주파 대역의 신호를 송신 또는 수신할 수 있는 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다.
상기 구성요소들 중 적어도 일부는 주변 기기들간 통신 방식(예: 버스, GPIO(general purpose input and output), SPI(serial peripheral interface), 또는 MIPI(mobile industry processor interface))을 통해 서로 연결되고 신호(예: 명령 또는 데이터)를 상호간에 교환할 수 있다.
일실시예에 따르면, 명령 또는 데이터는 제 2 네트워크(199)에 연결된 서버(108)를 통해서 전자 장치(101)와 외부의 전자 장치(104)간에 송신 또는 수신될 수 있다. 외부의 전자 장치(102, 또는 104) 각각은 전자 장치(101)와 동일한 또는 다른 종류의 장치일 수 있다. 일실시예에 따르면, 전자 장치(101)에서 실행되는 동작들의 전부 또는 일부는 외부의 전자 장치들(102, 104, 또는 108) 중 하나 이상의 외부의 전자 장치들에서 실행될 수 있다. 예를 들면, 전자 장치(101)가 어떤 기능이나 서비스를 자동으로, 또는 사용자 또는 다른 장치로부터의 요청에 반응하여 수행해야 할 경우에, 전자 장치(101)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 하나 이상의 외부의 전자 장치들에게 그 기능 또는 그 서비스의 적어도 일부를 수행하라고 요청할 수 있다. 상기 요청을 수신한 하나 이상의 외부의 전자 장치들은 요청된 기능 또는 서비스의 적어도 일부, 또는 상기 요청과 관련된 추가 기능 또는 서비스를 실행하고, 그 실행의 결과를 전자 장치(101)로 전달할 수 있다. 전자 장치(101)는 상기 결과를, 그대로 또는 추가적으로 처리하여, 상기 요청에 대한 응답의 적어도 일부로서 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 모바일 에지 컴퓨팅(MEC: mobile edge computing), 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다. 전자 장치(101)는, 예를 들어, 분산 컴퓨팅 또는 모바일 에지 컴퓨팅을 이용하여 초저지연 서비스를 제공할 수 있다. 다른 실시예에 있어서, 외부의 전자 장치(104)는 IoT(internet of things) 기기를 포함할 수 있다. 서버(108)는 기계 학습 및/또는 신경망을 이용한 지능형 서버일 수 있다. 일실시예에 따르면, 외부의 전자 장치(104) 또는 서버(108)는 제 2 네트워크(199) 내에 포함될 수 있다. 전자 장치(101)는 5G 통신 기술 및 IoT 관련 기술을 기반으로 지능형 서비스(예: 스마트 홈, 스마트 시티, 스마트 카, 또는 헬스 케어)에 적용될 수 있다.
도 2는 다양한 실시예에 따른, 비디오를 인코딩하는 전자 장치 및 비디오를 디코딩하는 전자 장치의 블록도이다. 다양한 실시예에 따라서, 전자 장치(201)(예를 들어, 전자 장치(101))는 비디오를 인코딩하는 전자 장치일 수 있다. 다양한 실시예에 따라서, 전자 장치(201)는 카메라(250), HDR10+ 인코더(220), 및 HEVC 인코더(230)를 포함할 수 있다.
다양한 실시예에 따라서, 전자 장치(201)는 카메라(250)를 통하여 HDR10+ 비디오를 획득할 수 있다. 다양한 실시예에 따라서, HDR10+ 비디오는 최대 휘도가 제1 휘도일 수 있다. 도 2에는 카메라(250)가 하나만 도시되었으나, 다양한 실시예에 따라서, 전자 장치(201)는 복수 개의 카메라(250)를 포함할 수 있다.
다양한 실시예에 따라서, HDR10+ 인코더(220)는 전자 장치(202)의 CPU, GPU, DSP, 어플리케이션 프로세서 내 카메라 ISP, 또는 코덱 중 적어도 하나를 이용하여 구현될 수 있다. 도 2에서 HDR10+ 인코더(220) 내에 표시된 히스토그램 연산(221), HDR10+ 톤 매핑 함수 연산(222), 디바이스 컴퓨팅 파워(223), 장면 변화 검출(224), SDR 톤 매핑 함수 연산(225), 및 HDR10+ 메타데이터 및 SDR 메타데이터(226)는 HDR10+ 인코더(220)가 수행하는 기능을 나타낸 것이다.
다양한 실시예에 따라서, HDR10+ 인코더(220)는 카메라(250)를 통하여 획득된 HDR10+ 비디오에 포함된 복수의 프레임들에 대하여, R값, G값, 및 B값 중 최댓값의 히스토그램을 계산하는 히스토그램 연산(221)을 수행할 수 있다. 히스토그램 연산(221)을 통하여 획득된 히스토그램은 HDR10+ 비디오에 포함된 장면들을 나누기 위하여 영상 내의 움직임의 양을 결정하는 데 이용될 수 있다.
다양한 실시예에 따라서, HDR10+ 인코더(220)는 히스토그램에 기초하여, 최대 휘도가 제1 휘도인 HDR10+ 비디오를 최대 휘도가 제2 휘도인 비디오로 변환하기 위한 HDR10+ 톤 매핑 함수를 도출하는 HDR10+ 톤 매핑 함수 연산(222)을 수행할 수 있다. 다양한 실시예에 따라서, 제2 휘도는 제1 휘도보다 낮을 수 있다. 다양한 실시예에 따라서, HDR10+ 톤 매핑 함수는 HDR10+ 비디오에 포함되는 복수의 프레임에 대하여 각각 개별적으로 정의될 수 있다.
다양한 실시예에 따라서, HDR10+ 인코더(220)는 전자 장치(201)의 디바이스 컴퓨팅 파워(223)를 확인할 수 있다. 다양한 실시예에 따라서, HDR10+ 인코더(220)는 히스토그램 연산(221)을 통하여 획득된 히스토그램에 기초하여 장면 변화 검출(224)을 수행할 수 있다. 다양한 실시예에 따라서, HDR10+ 인코더(220)는 히스토그램에 기초하여 프레임들 간 상관도(correlation)를 도출하고, 상관도에 기초하여 움직임의 변화량이 적은 프레임들을 하나의 장면으로 범주화함으로써, 장면 변화를 검출할 수 있다. 다양한 실시예에 따라서, HDR10+ 인코더(220)는 HDR10+ 비디오에 포함되는 프레임들 중 장면이 전환되는 시점에서의 프레임들, 예를 들어, 장면들의 첫 프레임들 또는 마지막 프레임들을 나타내는 씬 메타데이터를 생성할 수 있다.
다양한 실시예에 따라서, HDR10+ 인코더(220)는 디바이스 컴퓨팅 파워(223)를 고려하여 장면 변화 검출(224)을 수행할 수 있다. 예를 들어, 디바이스 컴퓨팅 파워(223)가 낮은 경우, 프레임들 간 움직임의 변화량이 크더라도 하나의 장면으로 범주화함으로써, HDR10+ 비디오에 포함되는 장면들의 수가 적도록 장면 변화 검출(224)을 수행하고, 디바이스 컴퓨팅 파워(223)가 높은 경우, 프레임들 간 움직임의 변화량이 작더라도 상이한 장면들로 범주화함으로써, HDR10+ 비디오에 포함되는 장면들의 수가 많도록 장면 변화 검출(224)을 수행할 수 있다.
다양한 실시예에 따라서, HDR10+ 인코더(220)는 장면 변화 검출(224)을 복수 회 수행하고, 복수 회의 장면 변화 검출(224)에 대응하는 복수의 씬 메타데이터를 생성할 수 있다. 복수의 씬 메타데이터는 HDR10+ 비디오에 포함되는 장면들의 수가 비교적 많음을 나타내는 씬 메타데이터 및 HDR10+ 비디오에 포함되는 장면들의 수가 비교적 적음을 나타내는 씬 메타데이터를 포함할 수 있다.
다양한 실시예에 따라서, HDR10+ 인코더(220)는 HDR10+ 톤 매핑 함수 연산(222) 결과에 기초하여 SDR 톤 매핑 함수 연산(225)을 수행할 수 있다. SDR 톤 매핑 함수 연산(225)은 최대 휘도가 제1 휘도인 HDR10+ 비디오를 최대 휘도가 제3 휘도인 SDR 비디오로 변환하기 위한 SDR 톤 매핑 함수를 도출하는 과정일 수 있다. 다양한 실시예에 따라서, 제3 휘도는 제1 휘도 및 제2 휘도보다 낮을 수 있다. HDR10+ 톤 매핑 함수 연산(222) 결과에 기초하여 SDR 톤 매핑 함수 연산(225)을 수행하는 과정에 대해서는 도 3의 330 동작을 참조하여 후술한다. 다양한 실시예에 따라서, HDR10+ 인코더(220)는 하나의 프레임에 대하여 차수가 상이한 복수의 Bezier 곡선들을 복수의 SDR 톤 매핑 함수들로서 확인할 수 있다.
다양한 실시예에 따라서, HDR10+ 인코더(220)는 디바이스 컴퓨팅 파워(223)를 고려하여 SDR 톤 매핑 함수 연산(225)을 수행할 수 있다. 다양한 실시예에 따라서, HDR10+ 인코더(220)는 디바이스 컴퓨팅 파워(223)가 높은 경우, HDR10+ 비디오에 포함되는 모든 프레임들에 대하여 개별적으로, HDR10+ 톤 매핑 함수를 참조하여 SDR 톤 매핑 함수를 연산할 수 있다. 다양한 실시예에 따라서, HDR10+ 인코더(220)는 디바이스 컴퓨팅 파워(223)가 낮은 경우 장면 변화 검출(224) 결과를 참조하여, 동일한 장면에 포함되는 프레임들에 대하여 적용되는 대표적인 SDR 톤 매핑 함수를 연산할 수 있다. 다양한 실시예에 따라서, HDR10+ 인코더(220)는 디바이스 컴퓨팅 파워(223)가 낮은 경우 낮은 차수의 Bezier 곡선을 SDR 톤 매핑 함수로서 확인하고, 디바이스 컴퓨팅 파워(223)가 높은 경우 높은 차수의 Bezier 곡선을 SDR 톤 매핑 함수로서 확인할 수 있다.
다양한 실시예에 따라서, HDR10+ 인코더(220)는 HDR10+ 톤 매핑 함수 연산(222) 결과에 기초하여 HDR10+ 메타데이터를 생성하고, SDR 톤 매핑 함수 연산(225) 결과에 기초하여 SDR 메타데이터를 생성할 수 있다. 다양한 실시예에 따라서, HDR10+ 메타데이터는 HDR10+ 비디오에 포함되는 프레임들에 대한 HDR10+ 톤 매핑 함수를 나타낼 수 있다. 다양한 실시예에 따라서, SDR 메타데이터는 HDR10+ 비디오에 포함되는 프레임들에 대한 SDR 톤 매핑 함수를 나타낼 수 있다.
다양한 실시예에 따라서, HDR10+ 메타데이터 및 SDR 메타데이터(226)는 HEVC 인코더(230)에서 HDR10+ 비디오에 대한 HEVC 인코딩을 수행할 때, HEVC 코덱의 SEI user data space에 저장될 수 있다. 다양한 실시예에 따라서, HDR10+ 메타데이터 및 SDR 메타데이터(226)에 더하여, 씬 메타데이터가 HEVC 코덱의 SEI user data space에 저장될 수 있다.
HDR10+ 비디오, HDR10+ 메타데이터, 및 SDR 메타데이터를 포함하는 HDR10+ 비디오 클립(203)은 전자 장치(201)의 메모리(예를 들어, 메모리(130)) 내에 저장될 수 있다.
다양한 실시예에 따라서, 전자 장치(202)(예를 들어, 전자 장치(101)의 프로세서(120))는 HDR10+ 비디오를 디코딩하고 재생하기 위한 전자 장치로서, 전자 장치(201)와 동일한 전자 장치일 수 있다. 또는, 다양한 실시예에 따라서, HDR10+ 비디오 클립(203)은 전자 장치(201)와 별개인 전자 장치(202)에 전달될 수 있다.
다양한 실시예에 따라서, 전자 장치(202)는 디스플레이(260)에 의하여 지원되는 최대 휘도 및 전자 장치(202)에서 실행되고 있는 어플리케이션에서 수행되는 기능에 기초하여 상이한 형식으로 HDR10+ 비디오를 재생할 수 있다. 예를 들어, 디스플레이(260)가 HDR10+ 비디오의 최대 휘도인 제1 휘도의 표시를 지원하고, 전자 장치(202)에서 실행되고 있는 어플리케이션에서 수행되는 기능이 HDR10+ 형식의 동영상 재생을 허용하는 경우, 전자 장치(202)는 디스플레이(260) 상에 HDR10+ 형식으로 HDR10+ 비디오를 재생할 수 있다. 다른 예시에서, 디스플레이(260)가 HDR10+ 비디오의 최대 휘도인 제1 휘도의 표시를 지원하지 않는 경우, 전자 장치(202)는 디스플레이(260)에 의하여 지원되는 최대 휘도에 기초하여 HDR10+와 상이한 형식으로 HDR10+ 비디오를 재생할 수 있다. 예를 들어, 디스플레이(260)가 표시할 수 있는 최대 휘도가 제2 휘도보다 높은 경우, 전자 장치(202)는 HDR10+ 톤 매핑에 기초하여 HDR10+ 비디오를 최대 휘도가 제2 휘도인 비디오로 변환하고, 변환된 비디오를 디스플레이(260) 상에 재생할 수 있다. 또는, 디스플레이(260)가 표시할 수 있는 최대 휘도가 제2 휘도보다 낮고 제3 휘도보다 높은 경우, 전자 장치(202)는 SDR 톤 매핑에 기초하여 HDR10+ 비디오를 최대 휘도가 제3 휘도인 비디오로 변환하고, 변환된 비디오를 디스플레이(260) 상에 재생할 수 있다. 다른 예시에서, 전자 장치(202)에서 실행되고 있는 어플리케이션에서 SDR 비디오 또는 정지 이미지를 HDR10+ 비디오와 함께 표시하는 경우, 전자 장치(202)는 SDR 비디오에 대응되는 SDR 형식 또는 정지 이미지에 대응되는 표시 형식으로 HDR10+ 비디오를 변환하고, 변환된 비디오를 디스플레이(260) 상에 재생할 수 있다. 다른 예시에서, 전자 장치(202)에서 실행되고 있는 어플리케이션이 HDR10+ 비디오의 재생을 지원하지 않는 경우, 전자 장치(202)는 어플리케이션이 지원하는 표시 형식으로 HDR10+ 비디오를 변환하고, 변환된 비디오를 디스플레이(260) 상에 재생할 수 있다. 다른 예시에서, 전자 장치(202)에서 실행되고 있는 어플리케이션이 동영상 캡쳐 및 썸네일 표시와 같이 정지 이미지를 표시하는 기능을 수행하고 있는 경우, 전자 장치(202)는 SDR 비디오에 대응되는 SDR 형식으로 HDR10+ 비디오를 변환하고, 변환된 비디오를 디스플레이(260) 상에 재생할 수 있다.
다양한 실시예에 따라서, 전자 장치(202)는 HEVC 디코더(240)를 이용하여 HDR10+ 비디오 클립(203)으로부터 HDR10+ 비디오, HDR10+ 메타데이터, 및 SDR 메타데이터를 확인할 수 있다. 다양한 실시예에 따라서, HDR10+ 비디오 클립(203)이 씬 메타데이터를 더 포함하는 경우, 전자 장치(202)는 HEVC 디코더(240)를 이용하여 씬 메타데이터를 확인할 수 있다.
다양한 실시예에 따라서, HDR10+ 비디오를 HDR10+ 형식으로 재생하는 경우, 전자 장치(202)는 HDR10+ 메타데이터, 및 SDR 메타데이터를 참조하지 않고 HDR10+ 비디오를 디스플레이(260) 상에 재생할 수 있다.
다양한 실시예에 따라서, HDR10+ 비디오를 최대 휘도가 제2 휘도인 비디오로 변환하여 재생하는 경우, 전자 장치(202)는 HDR10+ 메타데이터를 파싱(251)함으로써 HDR10+ 톤 매핑 함수를 확인할 수 있다. 전자 장치(202)는 확인된 HDR10+ 톤 매핑 함수에 기초하여 HDR10+ 비디오를 최대 휘도가 제2 휘도인 비디오로 변환하는 HDR10+ 톤 매핑(252)을 수행할 수 있다. 전자 장치(202)는 최대 휘도가 제2 휘도인 비디오를 디스플레이(260) 상에 재생할 수 있다.
다양한 실시예에 따라서, HDR10+ 비디오를 최대 휘도가 제3 휘도인 비디오로 변환하여 재생하는 경우, 전자 장치(202)는 SDR 메타데이터를 파싱(254)함으로써 SDR 톤 매핑 함수를 확인할 수 있다. 전자 장치(202)는 확인된 SDR 톤 매핑 함수에 기초하여 HDR10+ 비디오를 최대 휘도가 제3 휘도인 비디오로 변환하는 SDR 톤 매핑(255)을 수행할 수 있다. 전자 장치(202)는 최대 휘도가 제3 휘도인 비디오를 디스플레이(260) 상에 재생할 수 있다.
다양한 실시예에 따라서, 전자 장치(202)는 전자 장치(202)의 디바이스 컴퓨팅 파워(253)를 확인하고, 확인된 컴퓨팅 파워에 기초하여 SDR 톤 매핑(255)을 수행할 수 있다.
다양한 실시예에 따라서, 전자 장치(202)는 HDR10+ 비디오 클립(203)이 씬 메타데이터를 더 포함하는 경우, 전자 장치(202)의 디바이스 컴퓨팅 파워(253)가 낮은 경우에 씬 메타데이터에 기초하여 동일한 장면에 포함되는 프레임들에 대해서는 동일한 SDR 톤 매핑 함수를 적용하고, 전자 장치(202)의 디바이스 컴퓨팅 파워(253)가 높은 경우에는 동일한 장면에 포함되는 프레임들에 대해서 상이한 SDR 톤 매핑 함수들을 적용할 수 있다.
다양한 실시예에 따라서, HDR10+ 비디오 클립(203)이 복수의 씬 메타데이터를 더 포함하는 경우, 전자 장치(202)는 디바이스 컴퓨팅 파워(253)가 낮은 경우에 HDR10+ 비디오에 포함되는 장면들의 수가 비교적 적음을 나타내는 씬 메타데이터를 채택하고, 디바이스 컴퓨팅 파워(253)가 높은 경우에 장면들의 수가 비교적 많음을 나타내는 씬 메타데이터를 채택하고, 채택된 씬 메타데이터에 기초하여, 동일한 장면에 포함되는 프레임들에 대해서 동일한 SDR 톤 매핑 함수를 적용할 수 있다.
다양한 실시예에 따라서, SDR 메타데이터가 하나의 프레임에 대하여 차수가 상이한 복수의 Bezier 곡선들을 나타내는 경우, 전자 장치(202)는 디바이스 컴퓨팅 파워(253)가 낮은 경우 차수가 낮은 Bezier 곡선을 SDR 톤 매핑 함수로서 적용하여 SDR 톤 매핑(255)을 수행하고, 디바이스 컴퓨팅 파워(253)가 높은 경우 차수가 높은 Bezier 곡선을 SDR 톤 매핑 함수로서 적용하여 SDR 톤 매핑(255)을 수행할 수 있다.
도 3은 다양한 실시예에 따른 비디오를 인코딩하는 전자 장치에서 수행되는 동작들을 도시한다. 310 동작에서, 전자 장치(예를 들어, 전자 장치(101))의 적어도 하나의 프로세서(예를 들어, 프로세서(120))는 적어도 하나의 카메라(예를 들어, 카메라 모듈(180))를 통하여 최대 휘도가 제1 휘도인 제1 비디오를 획득할 수 있다. 다양한 실시예에 따라서, 제1 비디오는 HDR10+ 비디오이고, 제1 휘도는 1000cd/m2일 수 있다.
320 동작에서, 전자 장치(예를 들어, 전자 장치(101))의 적어도 하나의 프로세서(예를 들어, 프로세서(120))는 제1 비디오를 최대 휘도가 제1 휘도보다 낮은 제2 휘도인 제2 비디오로 변환하기 위한 제1 톤 매핑 함수를 확인할 수 있다. 다양한 실시예에 따라서, 제2 휘도는 400cd/m2일 수 있다. 다양한 실시예에 따라서, 제1 톤 매핑 함수는 제1 비디오에 포함되는 복수의 프레임에 대하여 각각 개별적으로 정의될 수 있다.
도 4a는 다양한 실시예에 따른, 제1 비디오에 대응되는 메타데이터를 도시한다. 도 4a를 참조하면, 제1 비디오는 HDR10+ 형식의 비디오일 수 있고, 복수의 프레임(411, 412, 413, 414, 415, 416, 417, 418, 419)을 포함할 수 있다. 제1 메타데이터는 정적 메타데이터(420) 및 동적 메타데이터(431, 432, 433, 434, 435, 436, 437, 438, 439)를 포함할 수 있다. 다양한 실시예에 따라서, 정적 메타데이터(420)는 SMPTE 2086에 정의된 Static metadata일 수 있다. 제1 비디오가 HDR10+ 형식의 비디오 재생을 지원하는 장치에서 재생되는 경우, 재생하는 장치는 정적 메타데이터(420)를 참조하여 제1 비디오를 재생할 수 있다.
도 4a에 도시된 바와 같이, 다양한 실시예에 따라서, 동적 메타데이터(431, 432, 433, 434, 435, 436, 437, 438, 439)는 제1 비디오에 포함되는 복수의 프레임(411, 412, 413, 414, 415, 416, 417, 418, 419)에 대응하여 개별적으로 정의되는 제1 톤 매핑 함수를 나타낼 수 있다.
다양한 실시예에 따른, 제1 톤 매핑 함수의 예시가 도 4b에 도시된다. 도 4b의 가로 축은 제1 비디오의 휘도, 도 4b의 세로 축은 제1 비디오를 제1 톤 매핑 함수(430b)에 따라 변환함으로써 획득된 제2 비디오의 휘도를 나타낸다. 도 4b를 참조하면, 제1 톤 매핑 함수(430b)에 의하여, 0cd/m2에서 1000cd/m2까지의 휘도 범위를 갖는 제1 비디오를 변환함으로써, 0cd/m2에서 400cd/m2까지의 휘도 범위를 갖는 제2 비디오를 획득할 수 있다.
330 동작에서, 전자 장치(예를 들어, 전자 장치(101))의 적어도 하나의 프로세서(예를 들어, 프로세서(120))는 제1 비디오를 최대 휘도가 제2 휘도보다 낮은 제3 휘도인 제3 비디오로 변환하기 위한 제2 톤 매핑 함수를 확인할 수 있다. 다양한 실시예에 따라서, 제3 휘도는 100cd/m2일 수 있다. 다양한 실시예에 따라서, 제3 비디오는 SDR 형식의 비디오일 수 있다.
도 4a를 다시 참조하면, 다양한 실시예에 따라서, 제2 메타데이터 (441, 442, 443, 444, 445, 446, 447, 448, 449)는 제1 비디오에 포함되는 복수의 프레임(411, 412, 413, 414, 415, 416, 417, 418, 419)에 대응하여 개별적으로 정의되는 제2 톤 매핑 함수를 나타낼 수 있다. 다양한 실시예에 따라서, 제2 메타데이터(441, 442, 443, 444, 445, 446, 447, 448, 449)에 대응되는 제2 톤 매핑 함수들 중 일부는 서로 동일할 수 있다. 전자 장치(101)는 장면 변화 검출(224)을 통하여 움직임의 변화량을 확인하고, 인접한 프레임들(411, 412)에 대응하여 확인되는 움직임의 변화량이 미리 정의된 수준보다 적은 경우 다음 프레임(412)에 대응하는 제2 메타데이터(442)를 이전 프레임(411)에 대응하는 제2 메타데이터(441)와 동일하게 구성할 수 있다.
다양한 실시예에 따른, 제2 톤 매핑 함수의 예시가 도 4c 및 도 4d에 도시된다. 도 4c 및 도 4d의 가로 축은 제1 비디오의 휘도, 도 4c 및 도 4d의 세로 축은 제1 비디오를 제2 톤 매핑 함수(440c, 440d)에 따라 변환함으로써 획득된 제3 비디오의 휘도를 나타낸다. 도 4c 및 도 4d를 참조하면, 제2 톤 매핑 함수(440c, 440d)에 의하여, 0cd/m2에서 1000cd/m2까지의 휘도 범위를 갖는 제1 비디오를 변환함으로써, 0cd/m2에서 100cd/m2까지의 휘도 범위를 갖는 제3 비디오를 획득할 수 있다. 다양한 실시예에 따라서, 제2 톤 매핑 함수는 제2 톤 매핑 함수(440c)와 같거나, 제2 톤 매핑 함수(440c)보다 간소화된 형태인 제2 톤 매핑 함수(440d)와 같을 수 있다. 다양한 실시예에 따라서, 전자 장치(예를 들어, 전자 장치(101))의 적어도 하나의 프로세서(예를 들어, 프로세서(120))는 전자 장치(101)의 컴퓨팅 파워를 고려하여 제2 톤 매핑 함수(440c) 또는 제2 톤 매핑 함수(440d)의 형태로 제2 톤 매핑 함수를 확인할 수 있다.
도 5a 및 도 5b는 다양한 실시예에 따른 제2 톤 매핑 함수를 생성하는 방법의 예시를 도시한다. 도 5a를 참조하면, 다양한 실시예에 따라서, 제2 톤 매핑 함수(540a)는 제1 톤 매핑 함수(예를 들어, 제1 톤 매핑 함수(430b))를 확인하는 방법과 동일한 방법을 적용하고, 제2 휘도 대신 제3 휘도를 대입함으로써 확인될 수 있다. 도 5a를 참조하면 제2 톤 매핑 함수(540a)는 제1 비디오의 히스토그램 분석에 기초하여 생성된 베지어(Bezier) 곡선일 수 있다.
다양한 실시예에 따라서, 제2 톤 매핑 함수(540a)는 제1 구간(551a)에서는 변환 이전(501a)보다 휘도가 더 높아지도록 하고, 제2 구간(552a)에서는 변환 이전(501a)보다 휘도가 더 낮아지도록 하는 함수일 수 있다. 다양한 실시예에 따라서, 제2 톤 매핑 함수(540a)는 제1 구간(551a)에서는 휘도의 변화가 비교적 작고, 제2 구간(552a)에서는 휘도의 변화가 비교적 크도록 하는 함수일 수 있다.
도 5b를 참조하면, 다양한 실시예에 따라서, 제2 톤 매핑 함수(540b)는 제1 톤 매핑 함수(530b)를 선형 스케일링하거나 또는 비선형 스케일링함으로써 확인될 수 있다.
다양한 실시예에 따라서, 제2 톤 매핑 함수(540b)는 제1 구간(551b)에서는 변환 이전보다 휘도가 더 높아지도록 하고, 제2 구간(552b)에서는 변환 이전보다 휘도가 더 낮아지도록 하는 함수일 수 있다. 다양한 실시예에 따라서, 제2 톤 매핑 함수(540b)는 제1 구간(551b)에서는 휘도의 변화가 비교적 작고, 제2 구간(552b)에서는 휘도의 변화가 비교적 크도록 하는 함수일 수 있다.
다양한 실시예에 따라서, 제2 톤 매핑 함수는 더 단순화될 수 있다. 도 6a 및 도 6b는 다양한 실시예에 따른 제2 톤 매핑 함수를 단순화하는 방법의 예시를 도시한다.
도 6a를 참조하면, 베지어 곡선인 제2 톤 매핑 함수의 차수를 낮춤으로써 제3 톤 매핑 함수를 확인하는 방법이 도시된다. N-1차 베지어 곡선(601a)은, N차 베지어 곡선(602a)의 앵커 포인트들(P0, P1, P2, P3) 중, 유클리디언 거리(Euclidian distance)가 미리 설정된 거리 미만인 인접한 두 앵커 포인트들(P1, P2)을 두 앵커 포인트들(P1, P2)의 중점(P5)으로 치환함으로써 확인될 수 있다. N차 베지어 곡선(602a)을 N-1차 베지어 곡선(601a)으로 대체함으로써, 왜곡 오차(603)가 발생하지만, 제3 톤 매핑 함수에 대응하는 메타데이터는 제2 톤 매핑 함수에 대응하는 메타데이터보다 크기가 작으며, 제3 톤 매핑 함수를 이용한 톤 매핑은 제2 톤 매핑 함수를 이용한 톤 매핑에 비하여 더 적은 컴퓨팅 파워를 필요로 할 수 있다.
도 6b를 참조하면, 곡선인 제2 톤 매핑 함수의 일부분을 선형적으로 변환함으로써 제3 톤 매핑 함수를 확인하는 방법이 도시된다. 제2 톤 매핑 함수(601b)는 복수의 변곡점(611b, 612b, 613b, 614b)을 포함할 수 있고, 전자 장치(101)의 적어도 하나의 프로세서(120)는 복수의 변곡점(611b, 612b, 613b, 614b)에서의 제2 톤 매핑 함수(601b)의 기울기와 동일한 기울기를 갖고 복수의 변곡점(611b, 612b, 613b, 614b)을 각각 지나는 복수의 직선(m1, m2, m3, m4)을 확인할 수 있다. 전자 장치(101)의 적어도 하나의 프로세서(120)는 제2 톤 매핑 함수(601b)를 복수의 직선(m1, m2, m3, m4)으로 대체하였을 때의 왜곡 오차의 크기가 미리 설정된 값 미만인 경우에 제2 톤 매핑 함수(601b)를 복수의 직선(m1, m2, m3, m4)으로 대체함으로써 단순화된 형태의 제3 톤 매핑 함수(602b)를 확인할 수 있다.
예를 들어, 변곡점(611b) 및 변곡점(612b) 사이 구간에서, 제2 톤 매핑 함수(601b)를 직선(m1) 및 직선(m2)으로 대체하였을 때의 왜곡 오차의 크기는 변곡점(611b) 및 변곡점(612b) 사이 구간에서 직선(m1), 직선(m2), 및 제2 톤 매핑 함수(601b)에 의하여 정의되는 면적과 같을 수 있고, 전자 장치(101)의 적어도 하나의 프로세서(120)는 변곡점(611b) 및 변곡점(612b) 사이 구간에서 왜곡 오차의 크기가 미리 설정된 값 미만이라고 확인할 수 있다. 전자 장치(101)의 적어도 하나의 프로세서(120)는 변곡점(611b) 및 변곡점(612b) 사이 구간에서 왜곡 오차의 크기가 미리 설정된 값 미만이라고 확인됨에 따라, 변곡점(611b) 및 변곡점(612b) 사이 구간에서 제2 톤 매핑 함수(601b)를 직선(m1) 및 직선(m2)으로 대체함으로써 제3 톤 매핑 함수(602b)를 확인할 수 있다.
유사하게, 변곡점(612b) 및 변곡점(613b) 사이 구간에서, 제2 톤 매핑 함수(601b)를 직선(m2) 및 직선(m3)으로 대체하였을 때의 왜곡 오차의 크기는 변곡점(612b) 및 변곡점(613b) 사이 구간에서 직선(m2), 직선(m3), 및 제2 톤 매핑 함수(601b)에 의하여 정의되는 면적과 같을 수 있고, 전자 장치(101)의 적어도 하나의 프로세서(120)는 변곡점(612b) 및 변곡점(613b) 사이 구간에서 왜곡 오차의 크기가 미리 설정된 값 미만이라고 확인할 수 있다. 전자 장치(101)의 적어도 하나의 프로세서(120)는 변곡점(612b) 및 변곡점(613b) 사이 구간에서 왜곡 오차의 크기가 미리 설정된 값 미만이라고 확인됨에 따라, 변곡점(612b) 및 변곡점(613b) 사이 구간에서 제2 톤 매핑 함수(601b)를 직선(m2) 및 직선(m3)으로 대체함으로써 제3 톤 매핑 함수(602b)를 확인할 수 있다.
유사하게, 변곡점(613b) 및 변곡점(614b) 사이 구간에서, 제2 톤 매핑 함수(601b)를 직선(m3) 및 직선(m4)으로 대체하였을 때의 왜곡 오차의 크기는 변곡점(613b) 및 변곡점(614b) 사이 구간에서 직선(m3), 직선(m4), 및 제2 톤 매핑 함수(601b)에 의하여 정의되는 면적과 같을 수 있고, 전자 장치(101)의 적어도 하나의 프로세서(120)는 변곡점(613b) 및 변곡점(614b) 사이 구간에서 왜곡 오차의 크기가 미리 설정된 값 이상이라고 확인할 수 있다. 전자 장치(101)의 적어도 하나의 프로세서(120)는 변곡점(613b) 및 변곡점(614b) 사이 구간에서 왜곡 오차의 크기가 미리 설정된 값 이상이라고 확인됨에 따라, 변곡점(613b) 및 변곡점(614b) 사이 구간에서 제2 톤 매핑 함수(601b)를 직선(m3) 및 직선(m4)으로 대체하지 않고, 제3 톤 매핑 함수(602b)를 제2 톤 매핑 함수(601b)와 동일하게 확인할 수 있다.
다양한 실시예에 따라서, 제2 톤 매핑 함수를 단순화함으로써 확인된 제3 톤 매핑 함수에 대응하는 메타데이터는 제2 톤 매핑 함수에 대응하는 메타데이터보다 크기가 작으며, 제3 톤 매핑 함수를 이용한 톤 매핑은 제2 톤 매핑 함수를 이용한 톤 매핑에 비하여 더 적은 컴퓨팅 파워를 필요로 할 수 있다.
340 동작에서, 전자 장치(예를 들어, 전자 장치(101))의 적어도 하나의 프로세서(예를 들어, 프로세서(120))는 제1 톤 매핑 함수에 기초한 제1 메타데이터 및 제2 톤 매핑 함수에 기초한 제2 메타데이터를 제1 비디오에 연관시켜 메모리(예를 들어, 메모리(130))에 저장할 수 있다. 다양한 실시예에 따라서, 제1 메타데이터 및 제2 메타데이터는 SEI의 user data space에 저장될 수 있다. 예를 들어, 제2 메타데이터는 CTA-861-G에 기술된 ST 2094-40 의 HDR Dynamic Metadata Syntax를 이용하여 저장될 수 있다.
다양한 실시예에 따라서, 제1 메타데이터는 제1 톤 매핑 함수를 나타낼 수 있다. 다양한 실시예에 따라서, 제2 메타데이터는 제2 톤 매핑 함수를 나타낼 수 있다. 다양한 실시예에 따라서, 제2 메타데이터는 제2 톤 매핑 함수를 단순화하여 확인된 제3 톤 매핑 함수를 나타낼 수 있다. 다양한 실시예에 따라서, 제2 메타데이터는 제2 톤 매핑 함수 및 적어도 하나의 제3 톤 매핑 함수를 나타낼 수 있다. 제2 메타데이터가 복수의 함수를 나타내는 경우, 제2 메타데이터는 복수의 함수에 대응하여, 제1 비디오를 재생하기 위한 전자 장치에서 요구되는 연산량에 관한 정보를 더 포함할 수 있다. 제1 비디오를 재생하기 위한 전자 장치에서는 연산량에 관한 정보 및 자신의 컴퓨팅 파워에 기초하여 제2 메타데이터가 나타내는 복수의 함수 중 하나를 이용하여 톤 매핑을 수행할 수 있다.
다양한 실시예에 따라서, 제2 메타데이터가 제2 톤 매핑 함수의 차수를 낮춤으로써 확인된 제3 톤 매핑 함수를 나타낼 때, 제1 비디오를 재생하기 위한 전자 장치는, 자신의 컴퓨팅 파워가 제2 톤 매핑 함수를 이용한 톤 매핑을 수행할 수 있을 정도로 높은 경우, 제2 메타데이터에 기초하여 확인된 제3 톤 매핑 함수의 차수를 높임으로써 제2 톤 매핑 함수를 확인하고, 제2 톤 매핑 함수를 이용하여 제1 비디오에 톤 매핑을 수행할 수 있다.
도 7은 다양한 실시예에 따른 비디오를 인코딩하는 전자 장치에서 수행되는 동작들을 도시한다.
710 동작에서, 전자 장치(예를 들어, 전자 장치(101))의 적어도 하나의 프로세서(예를 들어, 프로세서(120))는 적어도 하나의 카메라(예를 들어, 카메라 모듈(180))를 통하여 최대 휘도가 제1 휘도인 제1 비디오를 획득할 수 있다. 310 동작에 관한 세부 사항이 710 동작에 동일하게 적용될 수 있다.
720 동작에서, 전자 장치(예를 들어, 전자 장치(101))의 적어도 하나의 프로세서(예를 들어, 프로세서(120))는 제1 비디오를 최대 휘도가 제1 휘도보다 낮은 제2 휘도인 제2 비디오로 변환하기 위한 제1 톤 매핑 함수를 확인할 수 있다. 320 동작에 관한 세부 사항이 720 동작에 동일하게 적용될 수 있다.
730 동작에서, 전자 장치(예를 들어, 전자 장치(101))의 적어도 하나의 프로세서(예를 들어, 프로세서(120))는 제1 비디오를 최대 휘도가 제2 휘도보다 낮은 제3 휘도인 제3 비디오로 변환하기 위한 제2 톤 매핑 함수를 확인할 수 있다. 330 동작에 관한 세부 사항이 730 동작에 동일하게 적용될 수 있다.
740 동작에서, 전자 장치(예를 들어, 전자 장치(101))의 적어도 하나의 프로세서(예를 들어, 프로세서(120))는 제1 비디오의 움직임의 변화량에 기초한 제3 메타데이터를 확인할 수 있다. 다양한 실시예에 따라서, 프로세서(120)는 장면 변화 검출(224)을 수행함으로써, 제1 비디오의 프레임 이미지들의 변화량에 기초하여, 제1 비디오 내의 복수의 프레임 중 장면 전환에 대응하는 프레임을 나타내는 제3 메타데이터를 확인할 수 있다.
다양한 실시예에 따라서, 제3 메타데이터는 장면이 나뉘어지는 프레임들의 경계를 나타낼 수 있다. 도 8을 참조하면, 제3 메타데이터(851, 852, 853, 854)는 새로운 장면이 시작되는 프레임들을 나타낼 수 있다. 다양한 실시예에 따라서, 제3 메타데이터는 장면이 나뉘어지는 프레임들의 경계를 나타낼 뿐 아니라, 장면들에 대한 추가적인 정보를 더 포함할 수 있다.
다양한 실시예에 따라서, 적어도 하나의 프로세서(120)는 전자 장치(101)의 컴퓨팅 파워 및/또는 메모리와 같은 자원 상황을 확인하고, 확인된 자원 상황에 기초하여 제3 메타데이터를 상이하게 구성할 수 있다. 장면 변화 검출(224)을 참조하여 상술한 바와 같이, 적어도 하나의 프로세서(120)는 전자 장치(101)의 자원 상황이 양호한 경우 프레임들 간 움직임의 변화량이 작더라도 상이한 장면들로 범주화하고, 전자 장치(101)의 자원이 부족한 경우 프레임들 간 움직임의 변화량이 크더라도 동일한 장면으로 범주화하도록 제3 메타데이터를 확인할 수 있다. 달리 말하면, 적어도 하나의 프로세서(120)는 전자 장치(101)의 자원 상황이 양호한 경우 제1 비디오에 포함되는 장면들의 수가 비교적 많고, 전자 장치(101)의 자원이 부족한 경우 제1 비디오에 포함되는 장면들의 수가 비교적 적도록 제3 메타데이터를 확인할 수 있다.
다양한 실시예에 따라서, 적어도 하나의 프로세서(120)는 장면들의 수가 상이한 복수의 제3 메타데이터를 확인할 수 있다. 도 8을 다시 참조하면, 제3 메타데이터(851, 852, 853, 854)는 1번 프레임(411) 내지 4번 프레임(414), 5번 프레임(415) 내지 7번 프레임(417), 8번 프레임(418), 및 9번 프레임(419)을 각각 상이한 장면들로 범주화할 수 있다. 적어도 하나의 프로세서(120)는 도 8에 도시된 제3 메타데이터(851, 852, 853, 854) 외에도, 1번 프레임(411) 내지 7번 프레임(417)을 하나의 장면으로, 8번 프레임(418) 및 9번 프레임(419)을 다른 하나의 장면으로 범주화하는 제3 메타데이터(미도시)를 더 확인할 수 있다. 적어도 하나의 프로세서(120)는 복수의 제3 메타데이터에 대응하는 장면 변환 계수 값을 확인할 수 있다. 다양한 실시예에 따라서, 높은 장면 변환 계수 값은 장면 변화가 많고 비디오에 포함되는 장면들의 수가 비교적 많음을 나타낼 수 있다.
750 동작에서, 전자 장치(예를 들어, 전자 장치(101))의 적어도 하나의 프로세서(예를 들어, 프로세서(120))는 제1 톤 매핑 함수에 기초한 제1 메타데이터, 제2 톤 매핑 함수에 기초한 제2 메타데이터, 및 제3 메타데이터를 제1 비디오에 연관시켜 메모리(예를 들어, 메모리(130))에 저장할 수 있다. 제1 메타데이터 및 제2 메타데이터에 대해서는 340 동작에 관하여 상술한 세부 사항이 750 동작에서 동일하게 적용될 수 있다.
다양한 실시예에 따라서, 적어도 하나의 프로세서(120)는 하나의 제3 메타데이터를 제1 비디오에 연관시켜 저장하거나, 복수의 제3 메타데이터를 제1 비디오에 연관시켜 저장할 수 있다. 다양한 실시예에 따라서, 복수의 제3 메타데이터를 제1 비디오에 연관시켜 저장하는 경우에, 적어도 하나의 프로세서(120)는 복수의 제3 메타데이터에 대응하는 장면 변환 계수 값을 더 저장할 수 있다.
다양한 실시예에 따라, 제1 비디오를 재생하기 위한 전자 장치에서는, 제2 메타데이터(441, 442, 443, 444, 445, 446, 447, 448, 449)에 기초하여, 프레임마다 상이한 제2 톤 매핑 함수를 적용하는 대신, 제3 메타데이터(851, 852, 853, 854)에 기초하여 동일한 장면에 포함되는 프레임들에 대해서는 동일한 제2 톤 매핑 함수를 적용하여 제1 비디오를 변환할 수 있다.
다양한 실시예에 따라, 제1 비디오를 재생하기 위한 전자 장치에서는, 자신의 컴퓨팅 파워와 같은 연산 자원을 고려하여 복수의 제3 메타데이터 중 하나의 제3 메타데이터를 이용할 수 있다. 예를 들어, 제1 비디오를 재생하기 위한 전자 장치는, 연산 자원이 양호한 경우 큰 장면 변환 계수에 대응하는 복수의 제3 메타데이터를 사용하고, 연산 자원이 부족한 경우 작은 장면 변환 계수에 대응하는 복수의 제3 메타데이터를 사용할 수 있다.
도 9는 다양한 실시예에 따른 비디오를 디코딩하는 전자 장치에서 수행되는 동작들을 도시한다. 910 동작에서, 전자 장치(예를 들어, 전자 장치(101))의 적어도 하나의 프로세서(예를 들어, 프로세서(120))는 제1 비디오 및 제1 비디오에 연관된 메타데이터를 획득할 수 있다. 다양한 실시예에 따라서, 제1 비디오에 연관된 메타데이터는 제1 메타데이터 및 제2 메타데이터를 포함할 수 있다. 다양한 실시예에 따라서, 제1 비디오에 연관된 메타데이터는 제1 메타데이터, 제2 메타데이터, 및 제3 메타데이터를 포함할 수 있다.
920 동작에서, 전자 장치(예를 들어, 전자 장치(101))의 적어도 하나의 프로세서(예를 들어, 프로세서(120))는 디스플레이(예를 들어, 디스플레이 모듈(160))에 의하여 지원되는 최대 휘도 및 디스플레이(160) 상에 실행 화면이 표시되는 어플리케이션에서 수행되는 기능을 확인할 수 있다.
930 동작에서, 전자 장치(예를 들어, 전자 장치(101))의 적어도 하나의 프로세서(예를 들어, 프로세서(120))는 디스플레이(예를 들어, 디스플레이 모듈(160))에 의하여 지원되는 최대 휘도 및 어플리케이션에서 수행되는 기능에 기초하여, 디스플레이(160) 상에 최대 휘도가 제1 휘도인 제1 비디오를 표시하거나, 제1 톤 매핑 함수에 기초하여 최대 휘도가 제1 휘도보다 낮은 제2 휘도인 제2 비디오를 표시하거나, 제2 톤 매핑 함수에 기초하여 최대 휘도가 제2 휘도보다 낮은 제3 휘도인 비디오를 표시할 수 있다.
다양한 실시예에 따라서, 적어도 하나의 프로세서(120)에서 표시되는 비디오의 표시 형식은 디스플레이(160)에 의하여 지원되는 최대 휘도에 의하여 제한될 수 있다. 예를 들어, 디스플레이(160)에 의하여 지원되는 최대 휘도가 제2 휘도 미만인 경우, 적어도 하나의 프로세서(120)는 디스플레이(160) 상에 최대 휘도가 제1 휘도이거나 제2 휘도인 표시 형식으로 비디오를 표시할 수 없고, 최대 휘도가 제3 휘도인 표시 형식으로만 비디오를 표시할 수 있다. 다른 예시에서, 디스플레이(160)에 의하여 지원되는 최대 휘도가 제2 휘도 이상 제1 휘도 미만인 경우, 적어도 하나의 프로세서(120)는 디스플레이(160) 상에 최대 휘도가 제1 휘도인 표시 형식으로 제1 비디오를 표시할 수 없고, 최대 휘도가 제2 휘도이거나 제3 휘도인 표시 형식으로 비디오를 표시할 수 있다. 또는, 디스플레이(160)에 의하여 지원되는 최대 휘도가 제1 휘도 이상인 경우, 적어도 하나의 프로세서(120)는 디스플레이(160) 상에 최대 휘도가 제1 휘도인 표시 형식으로 비디오를 표시할 수 있다.
다양한 실시예에 따라서, 적어도 하나의 프로세서(120)에서 표시되는 비디오의 표시 형식은 디스플레이(160) 상에 실행 화면이 표시되는 어플리케이션에서 수행되는 기능에 의하여 제한될 수 있다. 예를 들어, 어플리케이션에서 현재 수행되는 기능이 최대 휘도가 제1 휘도인 제1 비디오의 표시뿐 아니라 최대 휘도가 제3 휘도인 비디오 또는 정지 영상의 표시를 더 포함하는 경우, 달리 말하면, 디스플레이(160) 상에 표시되는 실행 화면에 제1 비디오뿐 아니라, 최대 휘도가 제3 휘도인 비디오 또는 정지 영상이 더 포함되는 경우, 적어도 하나의 프로세서(120)는 제1 비디오를 최대 휘도가 제3 휘도인 표시 형식으로 변환하여 표시할 수 있다.
다른 예시에서, 디스플레이(160) 상에 실행 화면이 표시되는 어플리케이션이 최대 휘도가 제2 휘도인 표시 형식 및 최대 휘도가 제1 휘도인 표시 형식을 지원하지 않는 경우, 적어도 하나의 프로세서(120)는 제1 비디오를 최대 휘도가 제3 휘도인 표시 형식으로 변환하여 표시할 수 있다.
다른 예시에서, 디스플레이(160) 상에 실행 화면이 표시되는 어플리케이션에서 현재 수행되는 기능이 최대 휘도가 제1 휘도인 제1 비디오의 썸네일 표시 또는 제1 비디오로부터의 캡쳐 이미지 표시인 경우, 적어도 하나의 프로세서(120)는 제1 비디오에서 썸네일 또는 캡쳐 이미지에 대응하는 프레임을 최대 휘도가 제3 휘도인 표시 형식으로 변환하여 썸네일 또는 캡쳐 이미지로서 표시할 수 있다.
다양한 실시예에 따라서, 적어도 하나의 프로세서(120)는 디스플레이(160)에 의하여 지원되는 최대 휘도가 지시하는 표시 형식과, 어플리케이션에서 수행되는 기능에 의하여 지시되는 표시 형식 중 최대 휘도가 낮은 표시 형식에 따라서 비디오를 표시할 수 있다.
다양한 실시예에 따라서, 적어도 하나의 프로세서(120)는 최대 휘도가 제1 휘도인 제1 비디오를 디스플레이(160) 상에 표시하는 경우, 제1 메타데이터, 제2 메타데이터, 또는 제3 메타데이터를 참조하지 않고 제1 비디오를 표시할 수 있다.
다양한 실시예에 따라서, 적어도 하나의 프로세서(120)는 최대 휘도가 제1 휘도인 제1 비디오를 최대 휘도가 제2 휘도인 표시 형식으로 표시하는 경우, 제1 메타데이터에 기초하여 제1 비디오를 최대 휘도가 제2 휘도인 제2 비디오로 변환하기 위한 제1 톤 매핑 함수를 확인하고, 제1 톤 매핑 함수에 기초하여 제1 비디오를 제2 비디오로 변환하고, 제2 비디오를 디스플레이(160) 상에 표시할 수 있다.
다양한 실시예에 따라서, 적어도 하나의 프로세서(120)는 최대 휘도가 제1 휘도인 제1 비디오를 최대 휘도가 제3 휘도인 표시 형식으로 표시하는 경우, 제2 메타데이터에 기초하여 제1 비디오를 최대 휘도가 제3 휘도인 비디오로 변환하기 위한 제2 톤 매핑 함수를 확인하고, 제2 톤 매핑 함수에 기초하여 제1 비디오를 제3 휘도인 비디오로 변환하고, 변환된 비디오를 디스플레이(160) 상에 표시할 수 있다.
다양한 실시예에 따라서, 적어도 하나의 프로세서(120)는 최대 휘도가 제3 휘도인 표시 형식으로 제1 비디오를 표시하는 경우, 전자 장치(101)의 컴퓨팅 파워 및/또는 메모리 자원과 같은 자원 상황을 확인하고, 자원 상황에 기초하여 상이한 톤 매핑 함수를 이용하여 제1 비디오를 변환할 수 있다. 예를 들어, 적어도 하나의 프로세서(120)는 전자 장치(101)의 자원이 양호한 경우 제2 톤 매핑 함수를 이용하여 제1 비디오를 최대 휘도가 제3 휘도인 비디오로 변환하고, 전자 장치(101)의 자원이 부족한 경우 제2 톤 매핑 함수를 단순화함으로써 확인된 제3 톤 매핑 함수를 이용하여 제1 비디오를 최대 휘도가 제3 휘도인 비디오로 변환하고, 변환된 비디오를 디스플레이(160) 상에 표시할 수 있다.
다양한 실시예에 따라서, 적어도 하나의 프로세서(120)는 최대 휘도가 제3 휘도인 표시 형식으로 제1 비디오를 표시하는 경우, 제1 비디오 내에서 장면 전환에 대응하는 프레임을 나타내는 제3 메타데이터를 더 참조하여 제1 비디오를 변환할 수 있다. 적어도 하나의 프로세서(120)는 제3 메타데이터를 참조하여, 동일한 장면에 포함되는 프레임들에 대해서는 동일한 제2 톤 매핑 함수를 이용하여 제1 비디오를 최대 휘도가 제3 휘도인 비디오로 변환하고, 변환된 비디오를 디스플레이(160) 상에 표시할 수 있다.
다양한 실시예에 따라서, 적어도 하나의 프로세서(120)는 최대 휘도가 제3 휘도인 표시 형식으로 제1 비디오를 표시하는 경우, 전자 장치(101)의 자원 상황을 고려하여 제3 메타데이터를 더 참조하거나 참조하지 않을 수 있다. 예를 들어, 적어도 하나의 프로세서(120)는 전자 장치(101)의 자원이 양호한 경우 프레임마다 상이하게 정의되는 제2 톤 매핑 함수를 이용하여 제1 비디오를 최대 휘도가 제3 휘도인 비디오로 변환하고, 전자 장치(101)의 자원이 부족한 경우 제3 메타데이터를 참조하여, 동일한 장면에 포함되는 프레임들에 대해서는 동일한 제2 톤 매핑 함수를 이용하여 제1 비디오를 최대 휘도가 제3 휘도인 비디오로 변환하고, 변환된 비디오를 디스플레이(160) 상에 표시할 수 있다.
다양한 실시예에 따라서, 적어도 하나의 프로세서(120)는 최대 휘도가 제3 휘도인 표시 형식으로 제1 비디오를 표시하고, 제3 메타데이터를 참조하는 경우, 전자 장치(101)의 자원 상황을 고려하여 복수의 제3 메타데이터 중 하나를 참조하여 제1 비디오를 변환할 수 있다. 예를 들어, 적어도 하나의 프로세서(120)는 전자 장치(101)의 자원이 양호한 경우 복수의 제3 메타데이터 중 높은 장면 변환 계수 값에 대응하는 제3 메타데이터를 참조하고, 전자 장치(101)의 자원이 부족한 경우 복수의 제3 메타데이터 중 낮은 장면 변환 계수 값에 대응하는 제3 메타데이터를 참조하고, 동일한 장면에 포함되는 프레임들에 대해서는 동일한 제2 톤 매핑 함수를 이용하여 제1 비디오를 최대 휘도가 제3 휘도인 비디오로 변환하고, 변환된 비디오를 디스플레이(160) 상에 표시할 수 있다.
다양한 실시예에 따라서, 적어도 하나의 프로세서(120)는 최대 휘도가 제3 휘도인 표시 형식으로 제1 비디오를 표시하는 경우에, 910 동작에서 획득된 제1 비디오에 연관된 메타데이터에 제3 메타데이터가 포함되어 있지 않더라도, 전자 장치(101)의 자원 상황을 고려하여 복수의 프레임들에 대하여 동일한 제2 톤 매핑 함수를 이용하여 제1 비디오를 최대 휘도가 제3 휘도인 비디오로 변환할 수 있다. 예를 들어, 적어도 하나의 프로세서(120)는 전자 장치(101)의 자원이 부족한 경우에, 제1 비디오에 포함되는 복수의 프레임을 IDR 단위로 그룹화하고, 동일한 그룹에 포함되는 프레임들에 대해서는 동일한 제2 톤 매핑 함수를 이용하여 제1 비디오를 최대 휘도가 제3 휘도인 비디오로 변환하고, 변환된 비디오를 디스플레이(160) 상에 표시할 수 있다.
다양한 실시예에 따라서, 전자 장치(예를 들어, 전자 장치(101))는, 적어도 하나의 카메라(예를 들어, 카메라 모듈(180)), 및 적어도 하나의 프로세서(예를 들어, 프로세서(120))를 포함하고, 상기 적어도 하나의 프로세서(120)는, 상기 적어도 하나의 카메라(예를 들어, 카메라 모듈(180))를 통하여 최대 휘도가 제1 휘도인 제1 비디오를 획득하고, 상기 제1 비디오를 최대 휘도가 상기 제1 휘도보다 낮은 제2 휘도인 제2 비디오로 변환하기 위한 제1 톤 매핑 함수를 확인하고, 상기 제1 비디오를 최대 휘도가 상기 제2 휘도보다 낮은 제3 휘도인 제3 비디오로 변환하기 위한 제2 톤 매핑 함수를 확인하고, 상기 제1 톤 매핑 함수에 기초한 제1 메타데이터 및 상기 제2 톤 매핑 함수에 기초한 제2 메타데이터를 상기 제1 비디오에 연관시켜 저장하도록 구성될 수 있다.
다양한 실시예에 따라서, 상기 제2 톤 매핑 함수는, 상기 제1 비디오에 포함되는 복수의 프레임에 대하여 각각 개별적으로 정의될 수 있다.
다양한 실시예에 따라서, 상기 적어도 하나의 프로세서(120)는, 상기 제3 휘도 및 상기 제1 비디오의 히스토그램 분석에 기초하여 베지어(Bezier) 곡선 형태의 상기 제2 톤 매핑 함수를 확인하도록 구성될 수 있다.
다양한 실시예에 따라서, 상기 적어도 하나의 프로세서(120)는, 상기 제1 톤 매핑 함수를 비선형 스케일링함으로써 상기 제2 톤 매핑 함수를 확인하도록 구성될 수 있다.
다양한 실시예에 따라서, 상기 적어도 하나의 프로세서(120)는, 상기 제2 톤 매핑 함수를 단순화함으로써, 상기 제1 비디오를 최대 휘도가 상기 제2 휘도보다 낮은 제3 휘도인 제4 비디오로 변환하기 위한 제3 톤 매핑 함수를 확인하도록 구성되고, 상기 제2 메타데이터는 상기 제2 톤 매핑 함수 및 상기 제3 톤 매핑 함수에 기초하여 확인될 수 있다.
다양한 실시예에 따라서, 상기 제2 메타데이터는 상기 제2 톤 매핑 함수 및 상기 제3 톤 매핑 함수에 대응되는 연산량 정보를 포함하도록 구성될 수 있다.
다양한 실시예에 따라서, 상기 적어도 하나의 프로세서(120)는, 상기 제1 비디오의 프레임 이미지들의 변화량에 기초하여, 상기 제1 비디오 내에서 장면 전환에 대응하는 프레임을 나타내는 제3 메타데이터를 확인하고, 상기 제3 메타데이터를 상기 제1 비디오에 연관시켜 저장하도록 구성될 수 있다.
다양한 실시예에 따라서, 상기 적어도 하나의 프로세서(120)는, 상기 전자 장치(101)의 자원 상황을 확인하고, 상기 자원 상황에 기초하여 상기 제3 메타데이터를 확인하도록 구성될 수 있다.
다양한 실시예에 따라서, 상기 적어도 하나의 프로세서(120)는, 장면 전환 계수가 상이한 복수의 제3 메타데이터를 확인하고, 상기 복수의 제3 메타데이터에 대응하는 복수의 장면 전환 계수를 상기 복수의 제3 메타데이터에 대응시켜 저장하도록 구성될 수 있다.
다양한 실시예에 따라서, 전자 장치(예를 들어, 전자 장치(101))는, 디스플레이(예를 들어, 디스플레이 모듈(160)) 및 적어도 하나의 프로세서(예를 들어, 프로세서(120))를 포함하고, 상기 적어도 하나의 프로세서(120)는, 최대 휘도가 제1 휘도인 제1 비디오 및 상기 제1 비디오에 연관된 메타데이터를 획득하고, 상기 메타데이터는 상기 제1 비디오를 상기 제1 휘도보다 낮은 제2 휘도인 제2 비디오로 변환하기 위한 제1 톤 매핑 함수를 나타내는 제1 메타데이터, 및 제1 비디오를 최대 휘도가 상기 제2 휘도보다 낮은 제3 휘도인 비디오로 변환하기 위한 제2 톤 매핑 함수를 나타내는 제2 메타데이터를 포함하고, 상기 디스플레이에 의하여 지원되는 최대 휘도 및 상기 디스플레이 상에 실행 화면이 표시되는 어플리케이션에서 수행되는 기능을 확인하고, 상기 디스플레이에 의하여 지원되는 최대 휘도 및 상기 어플리케이션에서 수행되는 기능에 기초하여, 상기 제1 비디오를 표시하거나, 상기 제1 톤 매핑 함수에 기초하여 상기 제2 비디오를 표시하거나, 상기 제2 톤 매핑 함수에 기초하여 최대 휘도가 상기 제3 휘도인 비디오를 표시하도록 구성될 수 있다.
다양한 실시예에 따라서, 상기 제2 메타데이터는 상기 제1 비디오를 최대 휘도가 상기 제3 휘도인 비디오로 변환하기 위한 제3 톤 매핑 함수를 더 나타내고, 상기 적어도 하나의 프로세서(120)는, 상기 디스플레이에 의하여 지원되는 최대 휘도 및 상기 어플리케이션에서 수행되는 기능에 기초하여, 최대 휘도가 상기 제3 휘도인 비디오를 표시하는 동작의 일부로서, 상기 전자 장치(101)의 자원 상황을 확인하고, 상기 자원 상황에 기초하여 상기 제2 톤 매핑 함수에 기초하여 상기 제1 비디오에 톤 매핑을 수행하거나, 상기 제3 톤 매핑 함수에 기초하여 상기 제1 비디오에 톤 매핑을 수행하고, 상기 제1 비디오에 대한 상기 톤 매핑에 기초한, 최대 휘도가 상기 제3 휘도인 비디오를 표시하도록 구성될 수 있다.
다양한 실시예에 따라서, 상기 메타데이터는 상기 제1 비디오 내에서 장면 전환에 대응하는 프레임을 나타내는 복수의 제3 메타데이터를 포함하고, 상기 복수의 제3 메타데이터는 상이한 장면 전환 계수에 대응되고, 상기 적어도 하나의 프로세서(120)는, 상기 디스플레이에 의하여 지원되는 최대 휘도 및 상기 어플리케이션에서 수행되는 기능에 기초하여, 최대 휘도가 상기 제3 휘도인 비디오를 표시하는 동작의 일부로서, 상기 전자 장치(101)의 자원 상황을 확인하고, 상기 복수의 제3 메타데이터 중 상기 자원 상황에 기초하여 확인된 하나의 제3 메타데이터 및 제2 메타데이터에 기초하여 상기 제1 비디오에 톤 매핑을 수행하고, 상기 제1 비디오에 대한 상기 톤 매핑에 기초한, 최대 휘도가 상기 제3 휘도인 비디오를 표시하도록 구성될 수 있다.
다양한 실시예에 따라서, 전자 장치(예를 들어, 전자 장치(101))에서 수행되는 방법은, 상기 전자 장치(101)의 적어도 하나의 카메라(예를 들어, 카메라 모듈(180))를 통하여 최대 휘도가 제1 휘도인 제1 비디오를 획득하는 동작, 상기 제1 비디오를 최대 휘도가 상기 제1 휘도보다 낮은 제2 휘도인 제2 비디오로 변환하기 위한 제1 톤 매핑 함수를 확인하는 동작, 상기 제1 비디오를 최대 휘도가 상기 제2 휘도보다 낮은 제3 휘도인 제3 비디오로 변환하기 위한 제2 톤 매핑 함수를 확인하는 동작, 및 상기 제1 톤 매핑 함수에 기초한 제1 메타데이터 및 상기 제2 톤 매핑 함수에 기초한 제2 메타데이터를 상기 제1 비디오에 연관시켜 저장하는 동작을 포함할 수 있다.
다양한 실시예에 따라서, 상기 제2 톤 매핑 함수는, 상기 제1 비디오에 포함되는 복수의 프레임에 대하여 각각 개별적으로 정의될 수 있다.
다양한 실시예에 따라서, 상기 제2 톤 매핑 함수를 확인하는 동작은, 상기 제3 휘도 및 상기 제1 비디오의 히스토그램 분석에 기초하여 베지어(Bezier) 곡선 형태의 상기 제2 톤 매핑 함수를 확인하는 동작을 포함할 수 있다.
다양한 실시예에 따라서, 상기 제2 톤 매핑 함수를 확인하는 동작은, 상기 제1 톤 매핑 함수를 비선형 스케일링하는 동작을 포함할 수 있다.
다양한 실시예에 따라서, 상기 방법은, 상기 제2 톤 매핑 함수를 단순화함으로써, 상기 제1 비디오를 최대 휘도가 상기 제2 휘도보다 낮은 제3 휘도인 제3 비디오로 변환하기 위한 제3 톤 매핑 함수를 확인하는 동작을 더 포함하고, 상기 제2 메타데이터는 상기 제2 톤 매핑 함수 및 상기 제3 톤 매핑 함수에 기초하여 확인될 수 있다.
다양한 실시예에 따라서, 상기 방법은, 상기 제1 비디오의 프레임 이미지들의 변화량에 기초하여, 상기 제1 비디오 내에서 장면 전환에 대응하는 프레임을 나타내는 제3 메타데이터를 확인하는 동작, 및 상기 제3 메타데이터를 상기 제1 비디오에 연관시켜 저장하는 동작을 더 포함할 수 있다.
다양한 실시예에 따라서, 상기 방법은, 상기 전자 장치(101)의 자원 상황을 확인하는 동작을 더 포함하고, 상기 제3 메타데이터를 확인하는 동작은, 상기 자원 상황에 기초하여 수행될 수 있다.
다양한 실시예에 따라서, 상기 제3 메타데이터를 확인하는 동작은, 장면 전환 계수가 상이한 복수의 제3 메타데이터를 확인하는 동작을 포함하고, 상기 방법은, 상기 복수의 제3 메타데이터에 대응하는 복수의 장면 전환 계수를 상기 복수의 제3 메타데이터에 대응시켜 저장하는 동작을 더 포함할 수 있다.
본 문서에 개시된 다양한 실시예들에 따른 전자 장치는 다양한 형태의 장치가 될 수 있다. 전자 장치는, 예를 들면, 휴대용 통신 장치(예: 스마트폰), 컴퓨터 장치, 휴대용 멀티미디어 장치, 휴대용 의료 기기, 카메라, 웨어러블 장치, 또는 가전 장치를 포함할 수 있다. 본 문서의 실시예에 따른 전자 장치는 전술한 기기들에 한정되지 않는다.
본 문서의 다양한 실시예들 및 이에 사용된 용어들은 본 문서에 기재된 기술적 특징들을 특정한 실시예들로 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 또는 관련된 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 아이템에 대응하는 명사의 단수 형은 관련된 문맥상 명백하게 다르게 지시하지 않는 한, 상기 아이템 한 개 또는 복수 개를 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및 B 중 적어도 하나", "A 또는 B 중 적어도 하나", "A, B 또는 C", "A, B 및 C 중 적어도 하나", 및 "A, B, 또는 C 중 적어도 하나"와 같은 문구들 각각은 그 문구들 중 해당하는 문구에 함께 나열된 항목들 중 어느 하나, 또는 그들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", 또는 "첫째" 또는 "둘째"와 같은 용어들은 단순히 해당 구성요소를 다른 해당 구성요소와 구분하기 위해 사용될 수 있으며, 해당 구성요소들을 다른 측면(예: 중요성 또는 순서)에서 한정하지 않는다. 어떤(예: 제 1) 구성요소가 다른(예: 제 2) 구성요소에, "기능적으로" 또는 "통신적으로"라는 용어와 함께 또는 이런 용어 없이, "커플드" 또는 "커넥티드"라고 언급된 경우, 그것은 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로(예: 유선으로), 무선으로, 또는 제 3 구성요소를 통하여 연결될 수 있다는 것을 의미한다.
본 문서의 다양한 실시예들에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구현된 유닛을 포함할 수 있으며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로와 같은 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는, 상기 부품의 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 일실시예에 따르면, 모듈은 ASIC(application-specific integrated circuit)의 형태로 구현될 수 있다.
본 문서의 다양한 실시예들은 기기(machine)(예: 전자 장치(101)) 의해 읽을 수 있는 저장 매체(storage medium)(예: 내장 메모리(136) 또는 외장 메모리(138))에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어(예: 프로그램(140))로서 구현될 수 있다. 예를 들면, 기기(예: 전자 장치(101))의 프로세서(예: 프로세서(120))는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장 매체는, 비일시적(non-transitory) 저장 매체의 형태로 제공될 수 있다. 여기서, ‘비일시적’은 저장 매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장 매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.
일실시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory(CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두 개의 사용자 장치들(예: 스마트 폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.
다양한 실시예들에 따르면, 상기 기술한 구성요소들의 각각의 구성요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있으며, 복수의 개체 중 일부는 다른 구성요소에 분리 배치될 수도 있다. 다양한 실시예들에 따르면, 전술한 해당 구성요소들 중 하나 이상의 구성요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성요소들(예: 모듈 또는 프로그램)은 하나의 구성요소로 통합될 수 있다. 이런 경우, 통합된 구성요소는 상기 복수의 구성요소들 각각의 구성요소의 하나 이상의 기능들을 상기 통합 이전에 상기 복수의 구성요소들 중 해당 구성요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 상기 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.

Claims (15)

  1. 전자 장치에 있어서,
    적어도 하나의 카메라, 및
    적어도 하나의 프로세서를 포함하고,
    상기 적어도 하나의 프로세서는,
    상기 적어도 하나의 카메라를 통하여 최대 휘도가 제1 휘도인 제1 비디오를 획득하고,
    상기 제1 비디오를 최대 휘도가 상기 제1 휘도보다 낮은 제2 휘도인 제2 비디오로 변환하기 위한 제1 톤 매핑 함수를 확인하고,
    상기 제1 비디오를 최대 휘도가 상기 제2 휘도보다 낮은 제3 휘도인 제3 비디오로 변환하기 위한 제2 톤 매핑 함수를 확인하고,
    상기 제1 톤 매핑 함수에 기초한 제1 메타데이터 및 상기 제2 톤 매핑 함수에 기초한 제2 메타데이터를 상기 제1 비디오에 연관시켜 저장하도록 구성되는, 전자 장치.
  2. 제1항에 있어서,
    상기 제2 톤 매핑 함수는, 상기 제1 비디오에 포함되는 복수의 프레임에 대하여 각각 개별적으로 정의되는, 전자 장치.
  3. 제1항에 있어서,
    상기 적어도 하나의 프로세서는,
    상기 제3 휘도 및 상기 제1 비디오의 히스토그램 분석에 기초하여 베지어(Bezier) 곡선 형태의 상기 제2 톤 매핑 함수를 확인하도록 구성되는, 전자 장치.
  4. 제1항에 있어서,
    상기 적어도 하나의 프로세서는,
    상기 제1 톤 매핑 함수를 비선형 스케일링함으로써 상기 제2 톤 매핑 함수를 확인하도록 구성되는, 전자 장치.
  5. 제1항에 있어서,
    상기 적어도 하나의 프로세서는,
    상기 제2 톤 매핑 함수를 단순화함으로써, 상기 제1 비디오를 최대 휘도가 상기 제2 휘도보다 낮은 제3 휘도인 제4 비디오로 변환하기 위한 제3 톤 매핑 함수를 확인하도록 구성되고,
    상기 제2 메타데이터는 상기 제2 톤 매핑 함수 및 상기 제3 톤 매핑 함수에 기초하여 확인되는, 전자 장치.
  6. 제5항에 있어서,
    상기 제2 메타데이터는 상기 제2 톤 매핑 함수 및 상기 제3 톤 매핑 함수에 대응되는 연산량 정보를 포함하도록 구성되는, 전자 장치.
  7. 제1항에 있어서,
    상기 적어도 하나의 프로세서는,
    상기 제1 비디오의 프레임 이미지들의 변화량에 기초하여, 상기 제1 비디오 내에서 장면 전환에 대응하는 프레임을 나타내는 제3 메타데이터를 확인하고,
    상기 제3 메타데이터를 상기 제1 비디오에 연관시켜 저장하도록 구성되는, 전자 장치.
  8. 제7항에 있어서,
    상기 적어도 하나의 프로세서는,
    상기 전자 장치의 자원 상황을 확인하고,
    상기 자원 상황에 기초하여 상기 제3 메타데이터를 확인하도록 구성되는, 전자 장치.
  9. 제7항에 있어서,
    상기 적어도 하나의 프로세서는,
    장면 전환 계수가 상이한 복수의 제3 메타데이터를 확인하고,
    상기 복수의 제3 메타데이터에 대응하는 복수의 장면 전환 계수를 상기 복수의 제3 메타데이터에 대응시켜 저장하도록 구성되는, 전자 장치.
  10. 전자 장치에서 수행되는 방법에 있어서,
    상기 전자 장치의 적어도 하나의 카메라를 통하여 최대 휘도가 제1 휘도인 제1 비디오를 획득하는 동작,
    상기 제1 비디오를 최대 휘도가 상기 제1 휘도보다 낮은 제2 휘도인 제2 비디오로 변환하기 위한 제1 톤 매핑 함수를 확인하는 동작,
    상기 제1 비디오를 최대 휘도가 상기 제2 휘도보다 낮은 제3 휘도인 제3 비디오로 변환하기 위한 제2 톤 매핑 함수를 확인하는 동작, 및
    상기 제1 톤 매핑 함수에 기초한 제1 메타데이터 및 상기 제2 톤 매핑 함수에 기초한 제2 메타데이터를 상기 제1 비디오에 연관시켜 저장하는 동작을 포함하는 방법.
  11. 제10항에 있어서,
    상기 제2 톤 매핑 함수는, 상기 제1 비디오에 포함되는 복수의 프레임에 대하여 각각 개별적으로 정의되는, 방법.
  12. 제10항에 있어서,
    상기 제2 톤 매핑 함수를 확인하는 동작은,
    상기 제3 휘도 및 상기 제1 비디오의 히스토그램 분석에 기초하여 베지어(Bezier) 곡선 형태의 상기 제2 톤 매핑 함수를 확인하는 동작을 포함하는, 방법.
  13. 제10항에 있어서,
    상기 제2 톤 매핑 함수를 확인하는 동작은, 상기 제1 톤 매핑 함수를 비선형 스케일링하는 동작을 포함하는, 방법.
  14. 제10항에 있어서, 상기 방법은,
    상기 제2 톤 매핑 함수를 단순화함으로써, 상기 제1 비디오를 최대 휘도가 상기 제2 휘도보다 낮은 제3 휘도인 제3 비디오로 변환하기 위한 제3 톤 매핑 함수를 확인하는 동작을 더 포함하고,
    상기 제2 메타데이터는 상기 제2 톤 매핑 함수 및 상기 제3 톤 매핑 함수에 기초하여 확인되는, 방법.
  15. 제10항에 있어서,
    상기 방법은,
    상기 제1 비디오의 프레임 이미지들의 변화량에 기초하여, 상기 제1 비디오 내에서 장면 전환에 대응하는 프레임을 나타내는 제3 메타데이터를 확인하는 동작, 및
    상기 제3 메타데이터를 상기 제1 비디오에 연관시켜 저장하는 동작을 더 포함하는, 방법.
PCT/KR2022/003609 2021-04-15 2022-03-15 비디오를 인코딩하는 전자 장치 및 그 제어 방법 WO2022220417A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US18/380,130 US20240037722A1 (en) 2021-04-15 2023-10-13 Electronic device for encoding video, and control method therefor

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020210049179A KR20220142751A (ko) 2021-04-15 2021-04-15 비디오를 인코딩하는 전자 장치 및 그 제어 방법
KR10-2021-0049179 2021-04-15

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US18/380,130 Continuation US20240037722A1 (en) 2021-04-15 2023-10-13 Electronic device for encoding video, and control method therefor

Publications (1)

Publication Number Publication Date
WO2022220417A1 true WO2022220417A1 (ko) 2022-10-20

Family

ID=83640426

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2022/003609 WO2022220417A1 (ko) 2021-04-15 2022-03-15 비디오를 인코딩하는 전자 장치 및 그 제어 방법

Country Status (3)

Country Link
US (1) US20240037722A1 (ko)
KR (1) KR20220142751A (ko)
WO (1) WO2022220417A1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170140437A (ko) * 2015-01-19 2017-12-20 돌비 레버러토리즈 라이쎈싱 코오포레이션 높은 동적 범위 비디오에 대한 디스플레이 관리
KR20180088740A (ko) * 2015-06-02 2018-08-06 삼성전자주식회사 톤 매핑 방법 및 장치
US20190311694A1 (en) * 2014-12-11 2019-10-10 Koninklijke Philips N.V. Optimizing high dynamic range images for particular displays
KR20210001762A (ko) * 2019-06-28 2021-01-06 삼성전자주식회사 영상을 처리하는 전자 장치 및 그 영상 처리 방법
JP2021022354A (ja) * 2019-07-30 2021-02-18 エヌビディア コーポレーション 強化された高ダイナミック・レンジ画像化及びトーン・マッピング

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190311694A1 (en) * 2014-12-11 2019-10-10 Koninklijke Philips N.V. Optimizing high dynamic range images for particular displays
KR20170140437A (ko) * 2015-01-19 2017-12-20 돌비 레버러토리즈 라이쎈싱 코오포레이션 높은 동적 범위 비디오에 대한 디스플레이 관리
KR20180088740A (ko) * 2015-06-02 2018-08-06 삼성전자주식회사 톤 매핑 방법 및 장치
KR20210001762A (ko) * 2019-06-28 2021-01-06 삼성전자주식회사 영상을 처리하는 전자 장치 및 그 영상 처리 방법
JP2021022354A (ja) * 2019-07-30 2021-02-18 エヌビディア コーポレーション 強化された高ダイナミック・レンジ画像化及びトーン・マッピング

Also Published As

Publication number Publication date
US20240037722A1 (en) 2024-02-01
KR20220142751A (ko) 2022-10-24

Similar Documents

Publication Publication Date Title
WO2020153738A1 (ko) 카메라 모듈에 접지 노드를 연결하기 위한 전자 장치 및 방법
WO2021235856A1 (ko) 멀티미디어 콘텐츠를 제공하는 방법 및 그 전자 장치
WO2020171565A1 (en) Electronic device for processing image and image processing method thereof
WO2022220417A1 (ko) 비디오를 인코딩하는 전자 장치 및 그 제어 방법
WO2022211389A1 (ko) 오디오 공유를 지원하기 위한 전자 장치
WO2022092580A1 (ko) 전자 장치 표면의 온도를 예측하는 방법 및 그 전자 장치
WO2022240076A1 (ko) 영상 처리 방법 및 이를 지원하는 전자 장치
WO2022154337A1 (ko) 이미지를 업스케일하는 전자 장치 및 이의 제어 방법
WO2021096063A1 (ko) 스트리밍 데이터를 제공하는 전자 장치 및 그 작동 방법
WO2022154410A1 (ko) 이미지 필터 효과의 생성 방법 및 그 전자 장치
WO2022114648A1 (ko) 배경 화면을 설정하기 위한 전자 장치 및 그의 동작 방법
WO2023013865A1 (ko) 전자 장치 및 전자 장치의 멀티미디어 재생 방법
WO2022145939A1 (ko) 이미지 처리 방법 및 이를 지원하는 전자 장치
WO2023146063A1 (ko) 햅틱 신호를 생성하는 전자 장치 및 그 방법
WO2022250246A1 (ko) 움직이는 객체에 대한 효과를 이미지에 적용하는 전자 장치 및 그 작동 방법
WO2023287012A1 (ko) 외부 장치의 성능에 기반하여 컨텐츠 생성 방법 및 전자 장치
WO2022186646A1 (ko) 이미지 생성을 위한 전자 장치 및 전자 장치의 동작 방법
WO2023068904A1 (ko) 전자 장치 및 전자 장치의 동작 방법
WO2024112035A1 (ko) 전자 장치 및 전자 장치의 데이터 압축 방법
WO2022092609A1 (ko) 오디오 데이터 처리 방법 및 그 장치
WO2022191418A1 (ko) 전자 장치 및 미디어 콘텐츠의 재생구간 이동 방법
WO2024043485A1 (ko) 텍스트를 포함하는 이미지를 처리하기 위한 전자 장치 및 방법
WO2024043731A1 (ko) 인터폴레이션을 수행하는 전자 장치, 동작 방법, 및 저장 매체
WO2023158216A1 (ko) 컨텐츠 디스플레의 영역의 비율에 대응하도록 플렉서블 디스플레이의 노출 영역의 크기를 제어하는 전자 장치 및 그 제어 방법
WO2022260457A1 (ko) 플렉서블 디스플레이를 통해 배경 이미지를 표시하는 방법 및 그 전자 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22788274

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 22788274

Country of ref document: EP

Kind code of ref document: A1