KR20220028814A - Apparatus for inverse tone mapping and method for inverse mapping through exposure changing using the same - Google Patents

Apparatus for inverse tone mapping and method for inverse mapping through exposure changing using the same Download PDF

Info

Publication number
KR20220028814A
KR20220028814A KR1020200110354A KR20200110354A KR20220028814A KR 20220028814 A KR20220028814 A KR 20220028814A KR 1020200110354 A KR1020200110354 A KR 1020200110354A KR 20200110354 A KR20200110354 A KR 20200110354A KR 20220028814 A KR20220028814 A KR 20220028814A
Authority
KR
South Korea
Prior art keywords
image
target
value
exposure value
ldr
Prior art date
Application number
KR1020200110354A
Other languages
Korean (ko)
Inventor
강석주
조소연
Original Assignee
서강대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서강대학교산학협력단 filed Critical 서강대학교산학협력단
Priority to KR1020200110354A priority Critical patent/KR20220028814A/en
Publication of KR20220028814A publication Critical patent/KR20220028814A/en

Links

Images

Classifications

    • G06T5/90
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/007Dynamic range modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration by the use of more than one image, e.g. averaging, subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20208High dynamic range [HDR] image processing

Abstract

The present invention relates to an inverse tone mapping method for allowing an inverse tone mapping apparatus to perform inverse tone mapping on an LDR image. The method includes: generating an LDR image, a target exposure value to be reflected in the LDR image, and training data obtained by mapping the target exposure value to a correct answer image; when a deep neural network is trained using the training data and a target image for reverse tone mapping and a target exposure value are received, generating a target exposure value formed by reflecting image reflecting the target exposure value in the target image by using the learned deep neural network.

Description

역 톤 매핑 장치 및 이를 이용한 노출 변경을 통한 역 톤 매핑 방법{Apparatus for inverse tone mapping and method for inverse mapping through exposure changing using the same}Apparatus for inverse tone mapping and method for inverse mapping through exposure changing using the same}

본 발명은 역 톤 매핑 장치 및 이를 이용한 노출 변경을 통한 역 톤 매핑에 관한 것이다.The present invention relates to an inverse tone mapping apparatus and inverse tone mapping through exposure change using the same.

디스플레이의 최대 출력 밝기 향상과 색 영역이 증가함에 따라, 과다 노출 영역 및 과소 노출 영역에서 정보를 잃은 낮은 동적 영역(LDR: Low Dynamic Range) 영상으로부터 높은 동적 영역(HDR: High Dynamic Range) 영상을 생성하는 역 톤 매핑(Inverse Tone Mapping) 알고리즘에 대한 관심이 증가하고 있다. As the maximum output brightness of the display increases and the color gamut increases, high dynamic range (HDR) images are created from low dynamic range (LDR) images that lose information in overexposed and underexposed areas. Interest in the Inverse Tone Mapping algorithm is increasing.

일반적인 역 톤 매핑 알고리즘은 동일한 장면에 대해 서로 다른 노출로 여러 장의 낮은 동적 영역 영상들을 촬영한 뒤, 여러 장의 낮은 동적 영역 영상들을 높은 동적 영역 영상으로 병합한다. 해당 역 톤 매핑 알고리즘을 이용할 경우 같은 장면을 여러 번 촬영하는 과정에서, 카메라나 물체의 움직임에 의해 고스팅(Ghosting) 및 번짐(Blurring) 현상이 발생한다. A general inverse tone mapping algorithm captures several low dynamic region images with different exposures for the same scene, and then merges several low dynamic region images into a high dynamic region image. In the case of using the inverse tone mapping algorithm, ghosting and blurring may occur due to camera or object movement in the process of photographing the same scene multiple times.

이 문제를 해결하기 위해, 최근 딥러닝(Deep learning) 기반의 역 톤 매핑 알고리즘들이 활발하게 연구되고 있으며, 기존 알고리즘 대비 높은 성능을 보이고 있다. 딥러닝 기반의 역 톤 매핑 알고리즘은 직접 접근법과 스택(stack) 기반 접근법으로 나눌 수 있다.In order to solve this problem, inverse tone mapping algorithms based on deep learning are being actively studied recently, and they show high performance compared to existing algorithms. Deep learning-based inverse tone mapping algorithms can be divided into direct approaches and stack-based approaches.

직접 접근법은 한 장의 낮은 동적 영역 영상에서 직접 높은 동적 영역 영상을 생성하는 기법이다. 직접 접근법은 가장 간단한 딥러닝 기반 역 톤 매핑 알고리즘으로, 낮은 동적 영역 영상에서 높은 동적 영역 영상의 종단 간(end-to-end) 매핑을 직접 학습한다. 하지만 하나의 낮은 동적 영역 영상은 동적 영역이 서로 다른 다수의 높은 동적 영역 영상에 대응될 수 있기 때문에, 네트워크가 생성해야 하는 대상이 불명확해지는 문제를 일으킨다. The direct approach is a technique for directly generating a high dynamic region image from a single low dynamic region image. The direct approach is the simplest deep learning-based inverse tone mapping algorithm, which directly learns end-to-end mapping of high dynamic region images from low dynamic region images. However, since one low dynamic region image may correspond to a plurality of high dynamic region images having different dynamic regions, an object to be generated by the network becomes unclear.

스택 기반 접근 법은 한 장의 낮은 동적 영역 영상으로부터 서로 다른 노출 값을 갖는 여러 장의 영상들을 생성하고 일반적인 역 톤 매핑 알고리즘을 통해 높은 동적 영역 영상으로 병합하는 기법이다. 대표적인 스택 기반 접근법인 Deep Recursive HDRI는 각각 단위 노출 값(Exposure Value)을 올리고 내리는 2개의 합성 곱 신경망을 재귀적으로 이용하여 서로 다른 노출 값을 갖는 여러 장의 영상들을 생성한다. The stack-based approach is a technique to generate multiple images with different exposure values from a single low dynamic region image and merge them into a high dynamic region image through a general inverse tone mapping algorithm. Deep Recursive HDRI, a typical stack-based approach, generates multiple images with different exposure values by recursively using two convolutional neural networks that raise and lower the exposure value, respectively.

스택 기반 접근법을 이용할 경우 생성해야 하는 대상이 명확하기 때문에, 네트워크가 학습 과정에서 혼란을 겪지 않는다. 하지만, 같은 네트워크를 재귀적으로 이용할 경우, 각 추론 과정에서 발생한 에러가 다음 추론과정으로 누적되거나 증폭되는 문제가 발생한다. With the stack-based approach, the network does not get confused in the learning process because what needs to be created is clear. However, when the same network is used recursively, a problem arises in that errors generated in each reasoning process are accumulated or amplified to the next reasoning process.

이로 인해, 입력 영상과 노출 값 차이가 큰 영상을 생성하는 과정에서 영상의 품질이 저하된다. 결과적으로 높은 동적 영역 영상 병합 과정에서 저하된 영상에 의해 심하게 과다 노출되거나 과소 노출된 영역의 디테일이 복원되지 않고 뭉개진 영상을 얻게 된다.For this reason, in the process of generating an image having a large difference between the input image and the exposure value, the image quality is deteriorated. As a result, in the high dynamic area image merging process, the detail of the severely overexposed or underexposed area due to the degraded image is not restored and a crushed image is obtained.

따라서, 본 발명은 재귀적 추론에 의한 오차 누적 문제를 해결하기 위해 임의의 목표 노출 값만큼 바로 변화시키는 노출 조절 네트워크를 이용한 역 톤 매핑 장치 및 역 톤 매핑 방법을 제공한다.Accordingly, the present invention provides an inverse tone mapping apparatus and an inverse tone mapping method using an exposure control network that directly changes an arbitrary target exposure value in order to solve the error accumulation problem due to recursive reasoning.

상기 본 발명의 기술적 과제를 달성하기 위한 본 발명의 하나의 특징인 역 톤 매핑 장치가 LDR 영상을 역 톤 매핑하는 방법으로서,As a method for inverse tone mapping an LDR image by an inverse tone mapping apparatus, which is a feature of the present invention for achieving the technical problem of the present invention,

LDR 영상과 상기 LDR 영상에 반영할 목표 노출 값, 그리고 상기 목표 노출 값을 해당 정답 이미지에 매핑한 학습 데이터를 생성하는 단계, 상기 학습 데이터를 이용하여 심층 신경망을 학습시키는 단계, 그리고 역 톤 매핑할 대상 이미지와 목표 노출 값을 수신하고, 학습된 심층 신경망을 이용하여 상기 대상 이미지에 목표 노출 값을 반영한 목표 노출 값 반영 이미지를 생성하는 단계를 포함한다.Generating the LDR image, the target exposure value to be reflected in the LDR image, and training data mapping the target exposure value to the correct answer image, training a deep neural network using the training data, and performing reverse tone mapping and receiving a target image and a target exposure value, and generating a target exposure value reflection image in which the target exposure value is reflected in the target image by using the learned deep neural network.

상기 학습된 심층 신경망은, LDR 영상과, 목표 노출 값을 기초로 생성된 가중치가 입력되면, 상기 LDR 영상에 상기 가중치를 반영하여 목표 노출 값 반영 이미지를 출력하도록 학습된 노출 조절 네트워크, 그리고 목표 노출 값과 상기 LDR 영상으로부터 추출된 휘도 정보가 입력되면, 상기 LDR 영상을 구성하는 복수의 픽셀별로 노출을 각각 조절할 밝기 정보를 상기 특성 맵으로 생성하도록 학습된 밝기 특성 생성기를 포함할 수 있다.The trained deep neural network includes an LDR image and an exposure control network trained to output a target exposure value reflected image by reflecting the weight in the LDR image when a weight generated based on the target exposure value is input, and a target exposure When a value and luminance information extracted from the LDR image are input, the display may include a luminance characteristic generator learned to generate luminance information to adjust exposure for each of a plurality of pixels constituting the LDR image as the characteristic map.

상기 노출 조절 네트워크는 보조 분류기-생성적 적대 신경망(Auxiliary classifier-generative adversarial networks) 기반일 수 있다.The exposure control network may be based on Auxiliary classifier-generative adversarial networks.

상기 심층 신경망을 학습시키는 단계는, 상기 LDR 영상에 상기 노출 조절 네트워크의 초기 가중치를 반영하여 노출 조절 이미지를 생성하는 단계, 상기 노출 조절 이미지의 각 픽셀 값과 상기 정답 이미지의 각 픽셀 값의 차이 값을 계산하는 단계, 그리고 상기 차이 값이 발생한 픽셀에 대응하는 임의의 값을 상기 차이 값만큼 조절하여 상기 노출 조철 네트워크를 학습시키는 단계를 포함할 수 있다.The step of training the deep neural network includes generating an exposure control image by reflecting the initial weight of the exposure control network in the LDR image, a difference value between each pixel value of the exposure control image and each pixel value of the correct image , and learning the exposure tidal network by adjusting an arbitrary value corresponding to the pixel in which the difference value occurs by the difference value.

상기 목표 노출 값 반영 이미지를 생성하는 단계는, 역 톤 매핑할 대상 LDR 영상과 목표 노출 값을 수신하는 단계, 상기 LDR 영상으로부터 휘도 값을 추출하는 단계, 상기 휘도 값과 상기 목표 노출 값을 기초로 특성 맵을 생성하는 단계, 그리고 상기 대상 LDR 영상에 상기 특성 맵을 반영하여 상기 목표 노출 값 반영 이미지를 생성하는 단계를 포함할 수 있다.The generating of the target exposure value reflection image may include receiving a target LDR image to be reverse tone mapped and a target exposure value, extracting a luminance value from the LDR image, and based on the luminance value and the target exposure value The method may include generating a characteristic map, and generating an image reflecting the target exposure value by reflecting the characteristic map in the target LDR image.

상기 목표 노출 값 반영 이미지를 생성하는 단계 이후에, 상기 목표 노출 값 반영 이미지와 수신한 상기 대상 LDR 영상을 하나의 셋트로 수신하고, 수신한 하나의 셋트에 포함된 상기 목표 노출 값 반영 이미지가, 상기 목표 노출 값이 반영된 목표 노출 값 반영 이미지인지 정답 이미지인지 구분하는 단계를 더 포함할 수 있다.After the step of generating the target exposure value reflection image, the target exposure value reflection image and the received target LDR image are received as one set, and the target exposure value reflection image included in the received one set is, The method may further include the step of discriminating whether the target exposure value is the reflected target exposure value or the correct answer image.

상기 본 발명의 기술적 과제를 달성하기 위한 본 발명의 또 다른 특징인 LDR 영상을 역 톤 매핑하는 역 톤 매핑 시스템으로서,As an inverse tone mapping system for inverse tone mapping of an LDR image, which is another feature of the present invention for achieving the technical problem of the present invention,

적어도 하나의 명령어를 포함하고, 정답 이미지별 학습 데이터를 저장하는 메모리, 대상 LDR 영상과 상기 대상 LDR 영상에 반영할 목표 노출 값을 수신하는 인터페이스, 그리고 프로세서를 포함하고, 상기 프로세서는, 상기 정답 이미지별 학습 데이터로부터 LDR 영상들과 노출 값들을 확인하고, 상기 LDR 영상들과 상기 노출 값들을 이용하여 심층 신경망을 학습시키고, 학습된 심층 신경망으로 상기 수신한 대상 LDR 영상과 목표 노출 값을 이용하여 상기 대상 LDR 영상으로부터 목표 노출 값 반영 이미지를 생성한다.a memory for storing training data for each correct answer image, including at least one instruction, an interface for receiving a target LDR image and a target exposure value to be reflected in the target LDR image, and a processor, wherein the processor includes the correct answer image Check LDR images and exposure values from star learning data, train a deep neural network using the LDR images and the exposure values, and use the received target LDR image and target exposure value with the learned deep neural network An image reflecting the target exposure value is generated from the target LDR image.

상기 프로세서는, 상기 학습 데이터에 포함된 LDR 영상이 입력되면, 가중치를 초기화시킬 수 있다.The processor may initialize the weights when the LDR image included in the training data is input.

상기 프로세서는, 상기 LDR 영상에 초기화된 상기 가중치를 반영하여 노출 조절 이미지를 생성하고, 상기 노출 조절 이미지의 각 픽셀 값과 상기 정답 이미지의 각 픽셀 값의 차이 값을 계산하며, 상기 차이 값이 발생한 픽셀에 대응하는 가중치를 상기 차이 값만큼 조절할 수 있다.The processor generates an exposure control image by reflecting the initialized weight in the LDR image, calculates a difference value between each pixel value of the exposure control image and each pixel value of the correct answer image, and the difference value occurs The weight corresponding to the pixel may be adjusted by the difference value.

상기 프로세서는, 상기 LDR 영상으로부터 휘도 값을 추출하고, 상기 휘도 값과 상기 목표 노출 값을 기초로 특성 맵을 생성할 수 있다.The processor may extract a luminance value from the LDR image and generate a characteristic map based on the luminance value and the target exposure value.

상기 프로세서는, 상기 목표 노출 값 반영 이미지와 수신한 상기 대상 LDR 영상을 기초로, 상기 목표 노출 값 반영 이미지가 상기 목표 노출 값이 반영된 이미지인지 정답 이미지인지 구분할 수 있다.The processor may distinguish whether the target exposure value reflection image is an image reflecting the target exposure value or a correct answer image based on the target exposure value reflection image and the received target LDR image.

상기 프로세서는, 복수의 상기 목표 노출 값 반영 이미지들을 병합하여 상기 LDR 영상에 대한 HDR 영상을 생성할 수 있다.The processor may generate an HDR image for the LDR image by merging the plurality of images reflecting the target exposure value.

본 발명에 따르면, 노출 변경을 통한 역 톤 매핑 기법을 이용하여, 광원을 포함하여 심하게 과다 노출되거나 과소 노출된 영역의 세부사항을 뚜렷하게 복원할 수 있다.According to the present invention, details of severely overexposed or underexposed areas including light sources can be reconstructed distinctly by using the inverse tone mapping technique through exposure change.

도 1은 본 발명의 실시예에 따른 역 톤 매핑 장치의 구성도이다.
도 2는 본 발명의 실시예에 따른 노출 조절 네트워크의 학습 과정을 나타낸 예시도이다.
도 3은 본 발명의 실시예에 따른 노출 조절 네트워크의 예시도이다.
도 4는 본 발명의 실시예에 따른 역 톤 매핑 장치의 동작 방법에 대한 흐름도이다.
도 5는 본 발명의 실시예에 따른 역 톤 매핑 장치와 일반적인 기술을 이용할 경우의 성능 비교를 나타낸 예시도이다.
도 6은 본 발명의 실시예에 따른 컴퓨팅 장치의 하드웨어 구성도이다.
1 is a block diagram of an inverse tone mapping apparatus according to an embodiment of the present invention.
2 is an exemplary diagram illustrating a learning process of an exposure control network according to an embodiment of the present invention.
3 is an exemplary diagram of an exposure control network according to an embodiment of the present invention.
4 is a flowchart illustrating a method of operating an inverse tone mapping apparatus according to an embodiment of the present invention.
5 is an exemplary diagram illustrating a performance comparison of an inverse tone mapping apparatus according to an embodiment of the present invention and a general technique.
6 is a hardware configuration diagram of a computing device according to an embodiment of the present invention.

아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, with reference to the accompanying drawings, embodiments of the present invention will be described in detail so that those of ordinary skill in the art to which the present invention pertains can easily implement them. However, the present invention may be embodied in several different forms and is not limited to the embodiments described herein. And in order to clearly explain the present invention in the drawings, parts irrelevant to the description are omitted, and similar reference numerals are attached to similar parts throughout the specification.

명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. Throughout the specification, when a part "includes" a certain element, it means that other elements may be further included, rather than excluding other elements, unless otherwise stated.

이하 도면을 참조로 하여 본 발명의 실시예에 따른 역 톤 매핑 장치 및 이를 이용한 노출 변경을 통한 역 톤 매핑 방법에 대해 설명한다. Hereinafter, an apparatus for inverse tone mapping according to an embodiment of the present invention and a method for inverse tone mapping by changing an exposure using the apparatus will be described with reference to the drawings.

도 1은 본 발명의 실시예에 따른 역 톤 매핑 장치의 구성도이다.1 is a block diagram of an inverse tone mapping apparatus according to an embodiment of the present invention.

도 1에 도시된 바와 같이, 역 톤 매핑 장치(100)는 낮은 동적 영역 영상(LDR: Low Dynamic Range)과 목표 노출 값(EV: Exposure Value)를 입력 받아, 목표 노출 값만큼 변화된 노출을 가지는 노출값이 반영된 영상을 생성한다. 역 톤 매핑 장치(100)는 복수의 노출값이 반영된 영상들을 이용하여 높은 동적 영역 영상(HDR: High dynamic Range)을 생성한다. 1 , the inverse tone mapping apparatus 100 receives a low dynamic range image (LDR) and an exposure value (EV), and an exposure value having an exposure changed by the target exposure value. This reflected image is created. The reverse tone mapping apparatus 100 generates a high dynamic range (HDR) image using images to which a plurality of exposure values are reflected.

역 톤 매핑 장치(100)는 심층 신경망인 노출 조절 네트워크(110)와 밝기 특성 생성기(120)를 포함하고, 심층 신경망 외에 컨버터(130), 병합부(merge)(140), 그리고 판별기(150)를 포함한다. 본 발명의 실시예에서는, 노출 조절 네트워크(110)와 밝기 특성 생성기(120)를 서로 구별되는 구성 요소로 표시하였으나, 하나의 심층 신경망 내에 포함될 수 있다. 즉, 밝기 특성 생성기(120)가 노출 조절 네트워크(110)에 포함될 수도 있다.The inverse tone mapping apparatus 100 includes an exposure control network 110 which is a deep neural network and a brightness feature generator 120 , and in addition to the deep neural network, a converter 130 , a merge unit 140 , and a discriminator 150 . ) is included. In the embodiment of the present invention, although the exposure control network 110 and the brightness characteristic generator 120 are represented as distinct components, they may be included in one deep neural network. That is, the brightness characteristic generator 120 may be included in the exposure control network 110 .

노출 조절 네트워크(110)는 외부로부터 LDR 영상과 목표 노출 값을 입력 받는다. 그리고, 이후 설명할 밝기 특성 생성기(120)로부터 밝기 정보를 수신한다. The exposure control network 110 receives an LDR image and a target exposure value from the outside. Then, brightness information is received from the brightness characteristic generator 120, which will be described later.

노출 조절 네트워크(110)는 입력된 목표 노출 값을 LDR 영상에 반영하여 노출값 반영 영상을 생성하여 출력한다.The exposure control network 110 reflects the input target exposure value in the LDR image to generate and output the exposure value reflection image.

이를 위해, 노출 조절 네트워크(110)를 미리 학습 데이터를 이용하여 학습시킨다. 본 발명의 실시예에서는 AC-GANs(Auxiliary Classifier-Generative Adversarial Networks, 보조 분류기-생성적 적대 신경망) 구조를 이용하여 노출 조절 네트워크(110)를 학습시키는 것을 예를 들어 설명한다. 입력된 이미지와 해당 이미지에 반영될 노출값, 그리고 노출값이 반영된 정답 이미지를 쌍으로 갖는 학습 데이터가 노출 조절 네트워크(110)로 입력되면, 노출값이 반영된 정답 이미지가 출력되도록 사전에 노출 조절 네트워크(110)를 학습시킨다. To this end, the exposure control network 110 is trained using the training data in advance. In the embodiment of the present invention, learning the exposure control network 110 using the AC-GANs (Auxiliary Classifier-Generative Adversarial Networks, Auxiliary Classifier-Generative Adversarial Networks) structure will be described as an example. When the training data having the input image, the exposure value to be reflected in the image, and the correct answer image with the exposure value reflected as a pair is input to the exposure control network 110, the exposure control network 110 in advance so that the correct answer image with the exposure value is outputted to learn

밝기 특성 생성기(120)는 목표 노출 값과 입력 영상의 휘도 값을 입력 받아, 노출 조절 네트워크(110)에서 LDR 영상에 반영할 밝기 정보를 생성한다. 여기서, 밝기 정보는, 목표 노출 값을 LDR 영상에 반영할 때, 어느 지점을 얼마만큼의 밝기로 조절할 것인지를 나타내는 정보로, 픽셀 별로 반영될 밝기 정보를 특성 맵 형태로 생성되는 것을 예로 하여 설명한다. The brightness characteristic generator 120 receives the target exposure value and the luminance value of the input image, and generates brightness information to be reflected in the LDR image in the exposure control network 110 . Here, the brightness information is information indicating which point is to be adjusted to how much brightness when the target exposure value is reflected in the LDR image, and the brightness information to be reflected for each pixel is generated in the form of a characteristic map as an example .

노출 조절 네트워크(110)와 밝기 특성 생성기(120)는 모두 가중치로 구성된다. 따라서, 최초의 노출 조절 네트워크(110)는 임의의 가중치(weight)를 가지도록 초기화되고, 밝기 특성 생성기(120)가 최초로 생성하는 밝기 정보 역시 초기화된 가중치(weight)에 의한 임의의 값이다. Both the exposure control network 110 and the brightness characteristic generator 120 are configured with weights. Accordingly, the initial exposure control network 110 is initialized to have an arbitrary weight, and the brightness information initially generated by the brightness characteristic generator 120 is also an arbitrary value based on the initialized weight.

초기화된 노출 조절 네트워크(110)에 LDR 영상이 입력되면, 임의의 가중치로 영상의 밝기 값이 조절되어 의미 없는 영상이 출력된다. 밝기 특성 생성기(120)의 경우 영상이 아닌 특성 맵으로 출력 값이 생성되므로, 초기화된 밝기 특성 생성기(120)에 입력 영상이 들어간다면 임의의 가중치로 영상의 밝기 값이 조절되어 의미없는 특성맵이 출력된다. 이와 같이, 최초 노출 조절 네트워크(110)를 학습시킬 때, 밝기 특성 생성기(120)도 동시에 학습된다. When the LDR image is input to the initialized exposure control network 110 , the brightness value of the image is adjusted with an arbitrary weight, so that a meaningless image is output. In the case of the brightness characteristic generator 120, an output value is generated as a characteristic map rather than an image. Therefore, if an input image is entered into the initialized brightness characteristic generator 120, the brightness value of the image is adjusted with an arbitrary weight, resulting in a meaningless characteristic map. is output In this way, when the initial exposure control network 110 is trained, the brightness characteristic generator 120 is also learned at the same time.

즉, 노출 조절 네트워크(110)가 가중치들로 LDR 영상로부터 노출 조절 이미지를 생성하면, 노출 조절 네트워크(110)는 학습 데이터에 포함되어 있는 노출값이 반영된 정답 이미지와 노출 조절 이미지를 비교한다. 그리고 노출 조절 이미지와 정답 이미지의 각 픽셀을 비교하여, 초기 노출 조절 네트워크와 밝기 특성 생성기의 가중치들을 수정하여 학습된 가중치들을 가지도록 한다. 본 발명의 실시예에서는 초기 가중치들을 조절하는 절차는 노출 조절 네트워크(110)를 학습시킬 때 같이 실행되는 것을 예로 하여 설명한다.That is, when the exposure control network 110 generates an exposure control image from the LDR image with weights, the exposure control network 110 compares the exposure control image with the correct answer image reflecting the exposure value included in the training data. Then, each pixel of the exposure control image and the correct answer image is compared, and the weights of the initial exposure control network and the brightness characteristic generator are modified to have the learned weights. In the embodiment of the present invention, the procedure for adjusting the initial weights will be described as an example that is executed when the exposure control network 110 is trained.

컨버터(130)는 입력되는 RGB의 LDR 영상을 YUV, Y-Pr-Pb, YCbCr 또는 Y'CbCr 등의 색공간으로 변환하고, 색공간으로부터 휘도 정보(Y)를 산출한다. 컨버터(130)는 산출된 휘도 정보를 밝기 특성 생성기(120)로 전달한다. 여기서, 컨버터(130)가 RGB에서 휘도 정보를 산출하는 방법은 이미 알려진 것으로, 본 발명의 실시예에서는 상세한 설명을 생략한다.The converter 130 converts the input RGB LDR image into a color space such as YUV, Y-Pr-Pb, YCbCr, or Y'CbCr, and calculates luminance information Y from the color space. The converter 130 transmits the calculated luminance information to the luminance characteristic generator 120 . Here, the method for the converter 130 to calculate the luminance information from RGB is already known, and detailed description will be omitted in the embodiment of the present invention.

병합부(140)는 노출 조절 네트워크(110)에서 생성된 복수의 노출값 반영 영상들을 병합하여 HDR 영상으로 생성한다. 병합부(140)가 복수의 노출값 반영 영상들을 병합하여 HDR 영상으로 생성하는 방법은 이미 알려진 것으로, 본 발명의 실시예에서는 상세한 설명을 생략한다.The merging unit 140 merges a plurality of exposure value-reflecting images generated in the exposure control network 110 to generate an HDR image. A method for the merging unit 140 to generate an HDR image by merging a plurality of exposure value-reflecting images is already known, and a detailed description thereof will be omitted in the exemplary embodiment of the present invention.

판별기(150)는 노출 조절 네트워크(110)에서 생성된 노출값 반영 영상과 LDR 영상을 하나의 셋트로 입력 받거나, LDR 영상과 노출값이 반영될 경우의 정답 이미지를 하나의 셋트로 입력 받는다. The discriminator 150 receives the exposure value reflection image and the LDR image generated by the exposure control network 110 as one set, or receives the correct answer image when the LDR image and the exposure value are reflected as one set.

그리고, 판별기(150)는 노출 값 반영 이미지인지 노출 값이 반영될 경우의 정답 이미지인지를 구분한다. 또한, 판별기(150)는 목표 노출 값이 EV-3부터 EV+3까지 7개 중 어떤 것인지 분류한다. 본 발명의 실시예에서는 노출 값의 범위를 -3에서부터 +3까지 7개를 예를 들어 설명하나, 반드시 이와 같이 한정되는 것은 아니다.And, the discriminator 150 discriminates whether the image is an exposure value-reflected image or a correct image when the exposure value is reflected. In addition, the discriminator 150 classifies which of the seven target exposure values from EV-3 to EV+3. In the exemplary embodiment of the present invention, seven exposure values ranging from -3 to +3 are described as examples, but the present invention is not limited thereto.

이상에서 설명한 역 톤 매핑 장치(100)로 노출 조절 네트워크를 학습하는 과정에 대해 도 2를 참조로 설명한다.A process of learning the exposure control network with the inverse tone mapping apparatus 100 described above will be described with reference to FIG. 2 .

도 2는 본 발명의 실시예에 따른 노출 조절 네트워크의 학습 과정을 나타낸 예시도이다.2 is an exemplary diagram illustrating a learning process of an exposure control network according to an embodiment of the present invention.

도 2에 도시된 바와 같이, 본 발명의 실시예에 따른 역 톤 매핑 장치(100)의 노출 조절 네트워크(110)는 한 장의 LDR 영상과 목표 노출 값을 입력 받아, 목표 노출 값만큼 변화된 노출 반영 이미지를 생성한다. As shown in FIG. 2 , the exposure control network 110 of the inverse tone mapping apparatus 100 according to the embodiment of the present invention receives an LDR image and a target exposure value, and the exposure reflected image changed by the target exposure value. to create

기존 스택 기반 접근법의 경우 한 번 학습되면 학습 데이터 셋에 의해 목표 노출 값이 고정된다. 이렇게 고정된 목표 노출 값을 변경하려면, 학습 데이터 셋을 변경하여 재 학습 해야만 변경이 가능하다. In the case of the existing stack-based approach, once trained, the target exposure value is fixed by the training data set. To change this fixed target exposure value, it can be changed only by changing the training data set and re-learning.

이와 달리, 본 발명의 실시예에 따른 노출 조절 네트워크는 재 학습 없이도 비정수형 즉, 실수를 포함한 임의의 노출 값을 조절할 수 있기 때문에, 손실된 동적 영역을 매우 정밀하게 복원할 수 있다. On the contrary, since the exposure control network according to the embodiment of the present invention can adjust an arbitrary exposure value including a non-integer type, that is, a real number without re-learning, it is possible to very precisely restore a lost dynamic region.

즉, 학습 데이터 셋에는 -3, -2, -1, 0, 1, 2, 3의 노출 값과 각 노출 값이 적용된 이미지가 포함되어 있다고 가정한다. 이때, 차원 축소 기법을 이용하면 노출 값이 적용된 이미지들이 다면체 공간에서 연속적으로 존재하게 되기 때문에, 두 정수의 노출 값들 사이의 노출 값이 반영된 이미지도 파악할 수 있다. That is, it is assumed that the training data set includes exposure values of -3, -2, -1, 0, 1, 2, and 3 and images to which each exposure value is applied. In this case, since the images to which the exposure value is applied continuously exist in the polyhedral space when the dimension reduction technique is used, an image in which an exposure value between two integer exposure values is reflected can also be identified.

이에 따라 본 발명의 실시예에서는 목표 노출 값으로 정수가 아닌 비정수 즉, 실수를 입력하더라도 노출 조절 네트워크(110)는 해당 실수에 해당하는 노출 값이 반영된 노출 반영 영상을 생성할 수 있다. 여기서, 차원 축소 기법은 이미 알려진 기법으로, 본 발명의 실시예에서는 상세한 설명을 생략한다.Accordingly, in an embodiment of the present invention, even if a non-integer, that is, a real number, is input as the target exposure value, the exposure control network 110 may generate an exposure-reflecting image in which the exposure value corresponding to the real number is reflected. Here, the dimension reduction technique is a known technique, and detailed description thereof will be omitted in the embodiment of the present invention.

또한, 기존 스택 기반 접근법은 과다 노출 또는 과소 노출로 인해 손실된 정보의 세부사항을 복원하지 못하는 한계를 가지고 있다. 노출 조정의 경우 비선형 함수에 의해 영역의 휘도에 따라 픽셀 별 밝기 변화 폭이 다르게 결정된다. In addition, the existing stack-based approach has a limitation in that it cannot recover details of information lost due to over- or under-exposure. In the case of exposure adjustment, the brightness change width for each pixel is determined differently according to the luminance of the area by a non-linear function.

따라서, 동일한 가중치의 필터가 모든 픽셀에 적용되어 공간적으로 동등한 성질을 갖는 합성 곱 연산은 적응적으로 밝기 값을 변화시키는 데 적합하지 않다. 그러므로, 본 발명의 실시예에서는 입력 영상의 휘도 성분과 목표 노출 값을 통해 정규화 파라미터를 결정함으로써, 적응적으로 픽셀 밝기 값을 변화시키는데 용이한 새로운 공간 적응적 정규화를 제안한다. Therefore, a composite product operation having spatially equivalent properties in which a filter of the same weight is applied to all pixels is not suitable for adaptively changing the brightness value. Therefore, an embodiment of the present invention proposes a new spatial adaptive normalization that is easy to adaptively change a pixel brightness value by determining a normalization parameter based on a luminance component of an input image and a target exposure value.

이때, 밝기 특성 생성기(120)는 밝기 조정이 필요한 영역을 추정하기 위해 밝기 정보를 생성하고, 네트워크에 저주파 성분을 복원하는 노출 값 조건부 합성 곱(EV Conditional Convolution)을 추가함으로써 공간 적응적 정규화가 고주파 성분 복원에 집중하도록 유도한다.At this time, the brightness characteristic generator 120 generates brightness information to estimate an area requiring brightness adjustment, and adds an exposure value conditional convolution that restores a low-frequency component to the network, so that spatial adaptive normalization is performed at a high frequency. Induces you to focus on restoring the ingredients.

도 3은 본 발명의 실시예에 따른 노출 조절 네트워크의 예시도이다.3 is an exemplary diagram of an exposure control network according to an embodiment of the present invention.

도 3에 도시된 바와 같이, 본 발명의 실시예에서는 입력된 이미지인 LDR 영상을 인코더(도면 미도시)에서 잠재 표현(latent representation)으로 압축하고, 디코더(도면 미도시)에서 목표 노출값에 의해 변경된 이미지로 복원한다. 여기서, 잠재 표현으로 압축한다는 의미는, 입력된 LDR 영상을 가장 잘 나타내는 압축본을 생성한다는 것을 의미하며, 잠재 표현으로 압축하는 방법은 이미 입력 영상을 생성하는 오토 인코더 분야 알려진 것으로 본 발명의 실시예에서는 상세한 설명을 생략한다.3, in the embodiment of the present invention, the LDR image, which is the input image, is compressed into a latent representation by the encoder (not shown), and changed by the target exposure value in the decoder (not shown) restore as an image. Here, the compression to the latent representation means to generate a compressed version that best represents the input LDR image, and the method of compressing the latent representation is already known in the field of auto-encoders that generate the input image, an embodiment of the present invention A detailed description is omitted.

이를 위해, 본 발명의 실시예에서는 공간 적응 정규화와 노출값 조건부 합성 곱을 사용하여 디코더를 설계하는 것을 예로 하여 설명하나, 반드시 이와 같이 한정되는 것은 아니다.To this end, in the embodiment of the present invention, designing a decoder using spatial adaptive normalization and exposure value conditional synthesis product is described as an example, but the present invention is not limited thereto.

지름길 연결에서, 특징 맵의 공간 차원으로 확장된 목표 노출값은 특징 맵에 연결되고, 이어서 저주파 성분을 변경하기 위해 합성 곱 층에 적용된다. 공간 적응 정규화는 밝기 특성 생성기(120)에서 생성된 밝기 정보를 수신하고, 고주파수 성분을 변경시킨다. In shortcut linking, the target exposure values extended to the spatial dimension of the feature map are connected to the feature map, and then applied to the convolutional product layer to change the low-frequency components. Spatial adaptive normalization receives the brightness information generated by the brightness characteristic generator 120 and changes the high-frequency component.

노출값 조건부 합성 곱을 통해 복원된 저주파 성분과, 공간적 적응 정규화를 통해 복원된 고주파 성분이 요소 별로 더해짐에 따라, 이미지의 노출값은 목표 노출값에 의해 변경된다.As the low frequency component reconstructed through the exposure value conditional synthesis product and the high frequency component reconstructed through spatial adaptive normalization are added for each element, the exposure value of the image is changed according to the target exposure value.

톤 맵핑된(Tone Mapped) HDR 영상에 대한 정량적 평가를 위하여, 본 발명의 실시예에서는 PSNR(Peak Signal-to-Noise Ratio)과 SSIM(Structure Similarity Index)이 지표로 사용하는 것을 예로 하여 설명한다. 그리고 Reinhard의 톤 매핑 알고리즘도 사용하여 정량적 평가를 수행하는 것을 예로 하여 설명하나, 반드시 이와 같이 한정되는 것은 아니다. For quantitative evaluation of tone-mapped HDR images, in the embodiment of the present invention, the use of Peak Signal-to-Noise Ratio (PSNR) and Structure Similarity Index (SSIM) as indicators will be described as an example. In addition, although quantitative evaluation is performed using Reinhard's tone mapping algorithm as an example, the description is not necessarily limited thereto.

HDR 영상에 대한 정량적 평가를 위해, HDR-VDP-2 점수가 사용될 수 있다. 표 1에서는 제안하는 방법과 Deep Recursive HDRI의 정량적 성능 비교를 수치로 표현하였다.For quantitative evaluation of HDR images, the HDR-VDP-2 score may be used. Table 1 expresses the quantitative performance comparison of the proposed method and Deep Recursive HDRI numerically.

PSNRPSNR SSIMSSIM HDR-VDP-2HDR-VDP-2 평균Average 표준편차Standard Deviation 평균Average 표준편차Standard Deviation 평균Average 표준편차Standard Deviation 본 발명의 실시예embodiment of the present invention 35.7935.79 3.173.17 0.9650.965 0.0420.042 60.6460.64 4.984.98 Deep Recursive HDRIDeep Recursive HDRI 33.8633.86 3.453.45 0.9470.947 0.0530.053 58.1958.19 4.794.79

표 1에 나타낸 바와 같이, 본 발명의 실시예에 따른 방법이 Deep Recursive HDRI보다 평균 PSNR이 1.93dB 높고, 평균 SSIM이 0.018 높으며, 평균 HDR-CDP-2가 2.45 높은 성능을 달성함을 알 수 있다.As shown in Table 1, it can be seen that the method according to the embodiment of the present invention achieves 1.93 dB higher average PSNR, 0.018 higher average SSIM, and 2.45 higher average HDR-CDP-2 than Deep Recursive HDRI. .

도 4는 본 발명의 실시예에 따른 역 톤 매핑 장치의 동작 방법에 대한 흐름도이다.4 is a flowchart illustrating a method of operating an inverse tone mapping apparatus according to an embodiment of the present invention.

도 4에 도시된 바와 같이, 역 톤 매핑 장치(100)는 노출 조절 네트워크(110)와 밝기 특성 생성기(120)를 학습 데이터로 학습시킨다(S100). 여기서 학습 데이터는 LDR 영상, 노출값, 그리고 노출값이 LDR 영상에 반영된 정답 이미지를 포함한다. As shown in FIG. 4 , the inverse tone mapping apparatus 100 trains the exposure control network 110 and the brightness characteristic generator 120 as training data ( S100 ). Here, the training data includes an LDR image, an exposure value, and a correct answer image in which the exposure value is reflected in the LDR image.

즉, 역 톤 매핑 장치(100)는 입력된 이미지와 해당 이미지에 반영될 노출값, 그리고 노출값이 반영된 정답 이미지를 쌍으로 갖는 학습 데이터가 노출 조절 네트워크(110)와 밝기 특성 생성기(120)로 입력되면, 노출값이 반영된 노출값 반영 영상이 출력되도록 사전에 노출 조절 네트워크(110)와 밝기 특성 생성기(120)를 학습시킨다. 그리고 역 톤 매핑 장치(100)는 노출 조절 네트워크(110)에서 생성된 노출값 반영 영상과 정답 이미지를 비교하여, 노출 조절 네트워크(110)와 밝기 특성 생성기(120)의 최초 가중치들을 조절시킨다. That is, the inverse tone mapping apparatus 100 receives the input image, the exposure value to be reflected in the corresponding image, and the learning data having the correct image in which the exposure value is reflected as a pair is input to the exposure control network 110 and the brightness characteristic generator 120 . , the exposure control network 110 and the brightness characteristic generator 120 are trained in advance so that the exposure value-reflected image to which the exposure value is reflected is output. In addition, the inverse tone mapping apparatus 100 compares the exposure value reflection image generated by the exposure control network 110 with the correct image, and adjusts the initial weights of the exposure control network 110 and the brightness characteristic generator 120 .

이와 같이 노출 조절 네트워크(110)와 밝기 특성 생성기(120)를 학습시킨 후, 역 톤 매핑 장치(100)는 LDR 영상과 목표 노출 값을 수신한다(S110). 그리고 학습된 노출 조절 네트워크(110)가 LDR 영상에 노출 값을 반영하여, 노출값 반영 영상으로 생성한다(S120). After learning the exposure control network 110 and the brightness characteristic generator 120 in this way, the inverse tone mapping apparatus 100 receives the LDR image and the target exposure value ( S110 ). Then, the learned exposure control network 110 reflects the exposure value in the LDR image, and generates an exposure value reflection image (S120).

이때, 역 톤 매핑 장치(100)는 LDR 영상으로부터 휘도 값을 추출하고, 상기 밝기 특성 생성기(120)에 제공한다. 밝기 특성 생성기(120)는 휘도 값과 목표 노출 값을 기초로 특성 맵을 생성하여 노출 조절 네트워크(110)로 전달한다.In this case, the inverse tone mapping apparatus 100 extracts a luminance value from the LDR image and provides it to the luminance characteristic generator 120 . The brightness characteristic generator 120 generates a characteristic map based on the luminance value and the target exposure value and transmits it to the exposure control network 110 .

노출 조절 네트워크(110)는 LDR 영상에 특성 맵을 적용하여 노출값 반영 영상을 생성한다. 역 톤 매핑 장치(100)는 복수의 노출값 반영 영상을 병합하여 HDR 영상으로 생성한다. The exposure control network 110 applies the characteristic map to the LDR image to generate an image reflecting the exposure value. The inverse tone mapping apparatus 100 generates an HDR image by merging a plurality of images reflecting the exposure value.

다음은 본 발명의 실시예에 따른 역 톤 매핑 장치(100)와 일반적인 기술을 이용한 경우 LDR 영상을 HDR 영상으로 변환한 성능을 도 5를 참조로 비교한다.Next, the performance of converting an LDR image into an HDR image when the inverse tone mapping apparatus 100 according to an embodiment of the present invention is used and a general technique is compared with reference to FIG. 5 .

도 5는 본 발명의 실시예에 따른 역 톤 매핑 장치와 일반적인 기술을 이용할 경우의 성능 비교를 나타낸 예시도이다.5 is an exemplary diagram illustrating a performance comparison of an inverse tone mapping apparatus according to an embodiment of the present invention and a general technique.

도 5에 도시된 바와 같이, 본 발명의 실시예에 따른 역 톤 매핑 장치(100)를 통해 생성된 HDR 영상과 Deep Recursive HDRI의 정성적 성능 비교를 확인할 수 있다. 도 5에서 (a)는 정답 이미지, (b)는 본 발명의 실시예에 따른 역 톤 매핑 장치(100)를 통해 목표 노출값이 반영된 이미지, 그리고 (c)는 일반적인 Deep Recursive HDRI를 이용한 경우의 이미지를 나타낸다.As shown in FIG. 5 , a qualitative performance comparison between the HDR image and Deep Recursive HDRI generated by the inverse tone mapping apparatus 100 according to the embodiment of the present invention can be confirmed. In FIG. 5, (a) is an image of the correct answer, (b) is an image in which a target exposure value is reflected through the inverse tone mapping apparatus 100 according to an embodiment of the present invention, and (c) is an image in the case of using general Deep Recursive HDRI indicates

LDR 영상이 입력되면, Deep Recursive HDRI의 경우 재귀적 추론에 의한 오차 누적으로 심하게 과다 노출 또는 과소 노출된 영역의 세부사항이 복원되지 않고 뭉개진 결과를 보인다. 그러나, 본 발명의 실시예에 따른 방법에 따른 역 톤 매핑 장치(100)를 이용하면, 광원을 포함하여 심하게 과다 노출 또는 과소 노출된 영역의 세부사항을 뚜렷하게 복원됨을 알 수 있다.When an LDR image is input, in the case of Deep Recursive HDRI, the details of severely overexposed or underexposed areas are not restored and the result is crushed due to error accumulation due to recursive reasoning. However, it can be seen that, when the inverse tone mapping apparatus 100 according to the method according to the embodiment of the present invention is used, the details of the severely overexposed or underexposed area including the light source are clearly restored.

도 6은 본 발명의 실시예에 따른 컴퓨팅 장치의 하드웨어 구성도이다.6 is a hardware configuration diagram of a computing device according to an embodiment of the present invention.

도 6에 도시된 바와 같이, 역 톤 매핑 장치(100)는 적어도 하나의 프로세서에 의해 동작하는 컴퓨팅 장치(200)에서, 본 발명의 동작을 실행하도록 기술된 명령들(instructions)이 포함된 프로그램을 실행한다. As shown in FIG. 6 , the inverse tone mapping apparatus 100 executes a program including instructions described to execute the operation of the present invention in the computing device 200 operated by at least one processor. run

컴퓨팅 장치(200)의 하드웨어는 적어도 하나의 프로세서(210), 메모리(220), 스토리지(230), 통신 인터페이스(240)를 포함할 수 있고, 버스를 통해 연결될 수 있다. 이외에도 입력 장치 및 출력 장치 등의 하드웨어가 포함될 수 있다. 컴퓨팅 장치(200)는 프로그램을 구동할 수 있는 운영 체제를 비롯한 각종 소프트웨어가 탑재될 수 있다.Hardware of the computing device 200 may include at least one processor 210 , a memory 220 , a storage 230 , and a communication interface 240 , and may be connected through a bus. In addition, hardware such as an input device and an output device may be included. The computing device 200 may be loaded with various software including an operating system capable of driving a program.

프로세서(210)는 컴퓨팅 장치(200)의 동작을 제어하는 장치로서, 프로그램에 포함된 명령들을 처리하는 다양한 형태의 프로세서(210)일 수 있고, 예를 들면, CPU(Central Processing Unit), MPU(Micro Processor Unit), MCU(Micro Controller Unit), GPU(Graphic Processing Unit) 등 일 수 있다. 메모리(220)는 본 발명의 동작을 실행하도록 기술된 명령들이 프로세서(210)에 의해 처리되도록 해당 프로그램을 로드한다. 메모리(220)는 예를 들면, ROM(read only memory), RAM(random access memory) 등 일 수 있다. 스토리지(230)는 본 발명의 동작을 실행하는데 요구되는 각종 데이터, 프로그램 등을 저장한다. 통신 인터페이스(240)는 유/무선 통신 모듈일 수 있다.The processor 210 is a device for controlling the operation of the computing device 200, and may be various types of processors 210 that process instructions included in a program, for example, a CPU (Central Processing Unit), MPU (Central Processing Unit) It may be a micro processor unit), a micro controller unit (MCU), a graphic processing unit (GPU), or the like. The memory 220 loads the corresponding program so that the instructions described to execute the operation of the present invention are processed by the processor 210 . The memory 220 may be, for example, read only memory (ROM), random access memory (RAM), or the like. The storage 230 stores various data and programs required for executing the operation of the present invention. The communication interface 240 may be a wired/wireless communication module.

이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.Although the embodiments of the present invention have been described in detail above, the scope of the present invention is not limited thereto, and various modifications and improvements by those skilled in the art using the basic concept of the present invention as defined in the following claims are also provided. is within the scope of the right.

Claims (12)

역 톤 매핑 장치가 LDR 영상을 역 톤 매핑하는 방법으로서,
LDR 영상과 상기 LDR 영상에 반영할 목표 노출 값, 그리고 상기 목표 노출 값을 해당 정답 이미지에 매핑한 학습 데이터를 생성하는 단계,
상기 학습 데이터를 이용하여 심층 신경망을 학습시키는 단계, 그리고
역 톤 매핑할 대상 이미지와 목표 노출 값을 수신하고, 학습된 심층 신경망을 이용하여 상기 대상 이미지에 목표 노출 값을 반영한 목표 노출 값 반영 이미지를 생성하는 단계
를 포함하는, 역 톤 매핑 방법.
A method for an inverse tone mapping device to inverse tone-mapping an LDR image, the method comprising:
generating an LDR image, a target exposure value to be reflected in the LDR image, and learning data in which the target exposure value is mapped to the correct answer image;
training a deep neural network using the training data, and
receiving a target image to be reverse tone mapped and a target exposure value, and generating a target exposure value-reflected image in which the target exposure value is reflected in the target image using the learned deep neural network
An inverse tone mapping method comprising:
제1항에 있어서,
상기 학습된 심층 신경망은,
LDR 영상과, 목표 노출 값을 기초로 생성된 가중치가 입력되면, 상기 LDR 영상에 상기 가중치를 반영하여 목표 노출 값 반영 이미지를 출력하도록 학습된 노출 조절 네트워크, 그리고
목표 노출 값과 상기 LDR 영상으로부터 추출된 휘도 정보가 입력되면, 상기 LDR 영상을 구성하는 복수의 픽셀별로 노출을 각각 조절할 밝기 정보를 상기 특성 맵으로 생성하도록 학습된 밝기 특성 생성기
를 포함하는, 역 톤 매핑 방법.
According to claim 1,
The learned deep neural network is
When an LDR image and a weight generated based on a target exposure value are input, an exposure control network trained to output an image reflecting the target exposure value by reflecting the weight in the LDR image; and
When a target exposure value and luminance information extracted from the LDR image are input, the brightness characteristic generator is trained to generate brightness information to adjust exposure for each pixel constituting the LDR image as the characteristic map.
An inverse tone mapping method comprising:
제2항에 있어서,
상기 노출 조절 네트워크는 보조 분류기-생성적 적대 신경망(Auxiliary classifier-generative adversarial networks) 기반인, 역 톤 매핑 방법.
3. The method of claim 2,
wherein the exposure control network is based on Auxiliary classifier-generative adversarial networks.
제3항에 있어서,
상기 심층 신경망을 학습시키는 단계는,
상기 LDR 영상에 상기 노출 조절 네트워크의 초기 가중치를 반영하여 노출 조절 이미지를 생성하는 단계,
상기 노출 조절 이미지의 각 픽셀 값과 상기 정답 이미지의 각 픽셀 값의 차이 값을 계산하는 단계, 그리고
상기 차이 값이 발생한 픽셀에 대응하는 임의의 값을 상기 차이 값만큼 조절하여 상기 노출 조철 네트워크를 학습시키는 단계
를 포함하는, 역 톤 매핑 방법.
4. The method of claim 3,
The step of learning the deep neural network is,
generating an exposure control image by reflecting an initial weight of the exposure control network in the LDR image;
calculating a difference value between each pixel value of the exposure control image and each pixel value of the correct image; and
learning the exposure tidal network by adjusting an arbitrary value corresponding to the pixel in which the difference value occurs by the difference value
An inverse tone mapping method comprising:
제1항에 있어서,
상기 목표 노출 값 반영 이미지를 생성하는 단계는,
역 톤 매핑할 대상 LDR 영상과 목표 노출 값을 수신하는 단계,
상기 LDR 영상으로부터 휘도 값을 추출하는 단계,
상기 휘도 값과 상기 목표 노출 값을 기초로 특성 맵을 생성하는 단계, 그리고
상기 대상 LDR 영상에 상기 특성 맵을 반영하여 상기 목표 노출 값 반영 이미지를 생성하는 단계
를 포함하는, 역 톤 매핑 방법.
The method of claim 1,
The step of generating an image reflecting the target exposure value,
receiving a target LDR image to be reverse tone mapped and a target exposure value;
extracting a luminance value from the LDR image;
generating a characteristic map based on the luminance value and the target exposure value; and
generating an image reflecting the target exposure value by reflecting the characteristic map on the target LDR image
An inverse tone mapping method comprising:
제5항에 있어서,
상기 목표 노출 값 반영 이미지를 생성하는 단계 이후에,
상기 목표 노출 값 반영 이미지와 수신한 상기 대상 LDR 영상을 하나의 셋트로 수신하고, 수신한 하나의 셋트에 포함된 상기 목표 노출 값 반영 이미지가, 상기 목표 노출 값이 반영된 목표 노출 값 반영 이미지인지 정답 이미지인지 구분하는 단계
를 더 포함하는, 역 톤 매핑 방법.
6. The method of claim 5,
After generating the image reflecting the target exposure value,
Receive the target exposure value reflection image and the received target LDR image as one set, and whether the target exposure value reflection image included in the received one set is the target exposure value reflection image reflecting the target exposure value Steps to distinguish whether it is an image
Further comprising, an inverse tone mapping method.
LDR 영상을 역 톤 매핑하는 역 톤 매핑 시스템으로서,
적어도 하나의 명령어를 포함하고, 정답 이미지별 학습 데이터를 저장하는 메모리,
대상 LDR 영상과 상기 대상 LDR 영상에 반영할 목표 노출 값을 수신하는 인터페이스, 그리고
프로세서
를 포함하고,
상기 프로세서는,
상기 정답 이미지별 학습 데이터로부터 LDR 영상들과 노출 값들을 확인하고, 상기 LDR 영상들과 상기 노출 값들을 이용하여 심층 신경망을 학습시키고, 학습된 심층 신경망으로 상기 수신한 대상 LDR 영상과 목표 노출 값을 이용하여 상기 대상 LDR 영상으로부터 목표 노출 값 반영 이미지를 생성하는, 역 톤 매핑 시스템.
An inverse tone mapping system for inverse tone mapping of an LDR image, comprising:
A memory that contains at least one instruction and stores learning data for each correct image,
An interface for receiving a target LDR image and a target exposure value to be reflected in the target LDR image, and
processor
including,
The processor is
Check LDR images and exposure values from the training data for each correct image, train a deep neural network using the LDR images and the exposure values, and use the learned deep neural network to determine the received target LDR image and target exposure value An inverse tone mapping system that generates an image reflecting a target exposure value from the target LDR image by using it.
제7항에 있어서,
상기 프로세서는,
상기 학습 데이터에 포함된 LDR 영상이 입력되면, 가중치를 초기화시키는, 역 톤 매핑 시스템.
8. The method of claim 7,
The processor is
When the LDR image included in the training data is input, the weight is initialized, an inverse tone mapping system.
제8항에 있어서,
상기 프로세서는,
상기 LDR 영상에 초기화된 상기 가중치를 반영하여 노출 조절 이미지를 생성하고, 상기 노출 조절 이미지의 각 픽셀 값과 상기 정답 이미지의 각 픽셀 값의 차이 값을 계산하며, 상기 차이 값이 발생한 픽셀에 대응하는 가중치를 상기 차이 값만큼 조절하는, 역 톤 매핑 시스템.
9. The method of claim 8,
The processor is
generating an exposure control image by reflecting the initialized weight in the LDR image, calculating a difference value between each pixel value of the exposure control image and each pixel value of the correct image, corresponding to the pixel in which the difference value occurs adjusting a weight by the difference value.
제9항에 있어서,
상기 프로세서는,
상기 LDR 영상으로부터 휘도 값을 추출하고, 상기 휘도 값과 상기 목표 노출 값을 기초로 특성 맵을 생성하는, 역 톤 매핑 시스템.
10. The method of claim 9,
The processor is
extracting a luminance value from the LDR image and generating a feature map based on the luminance value and the target exposure value.
제10항에 있어서,
상기 프로세서는,
상기 목표 노출 값 반영 이미지와 수신한 상기 대상 LDR 영상을 기초로, 상기 목표 노출 값 반영 이미지가 상기 목표 노출 값이 반영된 이미지인지 정답 이미지인지 구분하는, 역 톤 매핑 시스템.
11. The method of claim 10,
The processor is
An inverse tone mapping system for discriminating whether the target exposure value reflection image is an image reflecting the target exposure value or a correct answer image based on the target exposure value reflection image and the received target LDR image.
제11항에 있어서,
상기 프로세서는,
복수의 상기 목표 노출 값 반영 이미지들을 병합하여 상기 LDR 영상에 대한 HDR 영상을 생성하는, 역 톤 매핑 시스템.
12. The method of claim 11,
The processor is
An inverse tone mapping system for generating an HDR image for the LDR image by merging the plurality of images reflecting the target exposure value.
KR1020200110354A 2020-08-31 2020-08-31 Apparatus for inverse tone mapping and method for inverse mapping through exposure changing using the same KR20220028814A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200110354A KR20220028814A (en) 2020-08-31 2020-08-31 Apparatus for inverse tone mapping and method for inverse mapping through exposure changing using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200110354A KR20220028814A (en) 2020-08-31 2020-08-31 Apparatus for inverse tone mapping and method for inverse mapping through exposure changing using the same

Publications (1)

Publication Number Publication Date
KR20220028814A true KR20220028814A (en) 2022-03-08

Family

ID=80812964

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200110354A KR20220028814A (en) 2020-08-31 2020-08-31 Apparatus for inverse tone mapping and method for inverse mapping through exposure changing using the same

Country Status (1)

Country Link
KR (1) KR20220028814A (en)

Similar Documents

Publication Publication Date Title
US9275445B2 (en) High dynamic range and tone mapping imaging techniques
US8989484B2 (en) Apparatus and method for generating high dynamic range image from which ghost blur is removed using multi-exposure fusion
US9230304B2 (en) Apparatus and method for enhancing image using color channel
US8406569B2 (en) Methods and systems for enhanced dynamic range images and video from multiple exposures
US20230214976A1 (en) Image fusion method and apparatus and training method and apparatus for image fusion model
US8774559B2 (en) Stereoscopic dynamic range image sequence
US9390482B2 (en) Image processing apparatus and method of processing image
US20190294931A1 (en) Systems and Methods for Generative Ensemble Networks
US8391598B2 (en) Methods for performing local tone mapping
WO2022116989A1 (en) Image processing method and apparatus, and device and storage medium
KR20060012278A (en) A system and process for generating high dynamic range video
CN113781320A (en) Image processing method and device, terminal equipment and storage medium
CN107492077B (en) Image deblurring method based on self-adaptive multidirectional total variation
US11941791B2 (en) High-dynamic-range image generation with pre-combination denoising
US20210217151A1 (en) Neural network trained system for producing low dynamic range images from wide dynamic range images
US20230153966A1 (en) Apparatus and method for image processing
KR20200089410A (en) Low-light image correction method based on optimal gamma correction
JP5765893B2 (en) Image processing apparatus, imaging apparatus, and image processing program
CN115496668A (en) Image processing method, image processing device, electronic equipment and storage medium
CN110717864B (en) Image enhancement method, device, terminal equipment and computer readable medium
US10567777B2 (en) Contrast optimization and local adaptation approach for high dynamic range compression
KR102277005B1 (en) Low-Light Image Processing Method and Device Using Unsupervised Learning
US20210125318A1 (en) Image processing method and apparatus
JP7446797B2 (en) Image processing device, imaging device, image processing method and program
CN115867934A (en) Rank invariant high dynamic range imaging