WO2021080233A1

WO2021080233A1 - 이미지 복원 방법 및 장치

Info

Publication number: WO2021080233A1
Application number: PCT/KR2020/013937
Authority: WO
Inventors: 신재섭; 류성걸; 손세훈; 김형덕; 김효성
Original assignee: 주식회사 픽스트리
Priority date: 2019-10-21
Filing date: 2020-10-13
Publication date: 2021-04-29
Also published as: KR102236788B1; US20230005114A1

Abstract

이미지 복원 방법 및 장치를 개시한다. 본 실시예는 서로 상이한 해상도마다 학습을 수행하여 서로 다른 독립된 복원 모델을 생성하고, 왜곡이 발생한 이미지를 입력받아 서로 다른 독립된 복원 모델 중 왜곡이 발생한 이미지의 해상도에 대응하는 복원 모델을 적용하여 왜곡 이미지 내의 복원 대상 객체를 중심으로 개선한 업스케일링 영상으로 복원하는 이미지 복원 방법 및 장치를 제공한다.

Description

이미지 복원 방법 및 장치

본 실시예는 이미지 복원 방법 및 장치에 관한 것이다.

이하에 기술되는 내용은 단순히 본 실시예와 관련되는 배경 정보만을 제공할 뿐 종래기술을 구성하는 것이 아니다.

일반적으로 저해상도 영상을 고해상도 영상으로 복원하는 기술은 복원에 사용되는 입력영상의 수 또는 복원 기술에 따라 구분된다. 입력영상의 수에 따라 단일영상 초해상도 복원 기술과 연속영상 초해상도 복원 기술로 구분된다.

일반적으로 단일영상 초해상도 영상복원 기술은 연속영상 초해상도 영상복원에 비하여 처리 속도는 빠르지만, 복원에 필요한 정보가 부족하므로 영상 복원의 품질이 낮다.

연속영상 초해상도 영상복원 기술은 연속적으로 획득된 다수의 영상들로부터 추출된 다양한 특징을 이용하므로 단일영상 초해상도 영상복원 기술에 비하여 복원된 영상의 품질은 우수하나, 알고리즘이 복잡하고 연산량이 많아 실시간 처리가 어렵다.

복원 기술에 따라서는 보간법을 이용한 기술, 에지 정보를 이용한 기술, 주파수 특성을 이용한 기술, 딥러닝 등과 같은 기계학습을 이용한 기술 등이 있다. 보간법을 이용한 기술은 처리 속도가 빠르지만 가장자리 부분이 흐릿해지는 단점이 있다.

에지 정보를 이용한 기술은 속도도 빠르고 가장자리의 선명도를 유지하면서 영상을 복원할 수 있으나, 에지 방향을 잘못 추정한 경우에는 시각적으로 두드러지는 복원 에러를 포함할 수 있는 단점이 있다.

주파수 특성을 이용한 기술은 고주파성분을 이용하여 에지 정보를 이용한 기술과 같이 가장자리의 선명도를 유지하며 영상을 복원할 수 있으나 경계선 부근의 Ringing Artifact가 발생하는 단점이 있다. 마지막으로 예제 기반 또는 딥러닝과 같은 기계학습을 이용한 기술은 복원된 영상의 품질이 가장 우수하지만 처리속도가 매우 느리다.

상술한 바와 같이 기존의 다양한 고해상도 영상 복원 기술들 중 연속영상 초해상도 영상복원 기술은 기존의 보간법을 이용한 디지털 줌 기능이 필요한 분야에 적용될 수 있으며, 보간법 기반의 영상복원 기술에 비해 우수한 품질의 영상을 제공한다. 그러나, 기존의 초해상도 영상복원 기술은, 제한된 리소스와 실시간 처리가 요구되는 전자광학 장비에는 복잡한 연산량으로 인해 적용할 수 있는 기술이 제한적이다.

실시간 처리가 가능한 기존의 단일영상 기반의 초해상도 영상복원 기술은 2배 이상의 고배율로 영상 확대가 필요한 경우에 연속영상 기반의 복원 기술에 비해 성능 저하가 크다는 문제가 있다.

본 실시예는 서로 상이한 해상도마다 학습을 수행하여 서로 다른 독립된 복원 모델을 생성하고, 왜곡이 발생한 이미지를 입력받아 서로 다른 독립된 복원 모델 중 왜곡이 발생한 이미지의 해상도에 대응하는 복원 모델을 적용하여 왜곡 이미지 내의 복원 대상 객체를 중심으로 개선한 업스케일링 영상으로 복원하는 이미지 복원 방법 및 장치를 제공하는 데 목적이 있다.

본 실시예의 일 측면에 의하면, 이미지를 수신하는 수신기와 컨볼루션 연산 및 비선형화를 통해 상기 이미지를 처리하는 프로세서를 포함하고, 상기 프로세서는, 서로 상이한 해상도를 갖는 복수의 이미지를 입력 받아 상기 서로 상이한 해상도마다 학습을 수행하여 해상도별로 독립된 복원 모델을 학습하는 학습부; 왜곡된 관측 이미지(observed image y)를 입력받으면, 상기 왜곡된 관측 이미지(y)의 해상도를 분석하여 적합한 복원 모델을 선택하는 선택부; 및 상기 해상도별로 서로 다른 독립된 복원 모델 중 상기 관측 이미지(y)의 해상도에 대응하는 복원 모델을 이용하여 상기 관측 이미지를 복원한 복원 이미지(restored image x^)를 생성하는 이미지 복원부;를 포함하는 것을 특징으로 하는 이미지 복원 장치를 제공한다.

본 실시예의 다른 측면에 의하면, 서로 상이한 해상도를 갖는 복수의 이미지를 입력 받아 상기 서로 상이한 해상도마다 학습을 수행하여 해상도별로 독립된 복원 모델을 학습하는 학습 과정; 왜곡된 관측 이미지(y)를 입력받으면, 상기 왜곡된 관측 이미지(y)의 해상도를 분석하여 적합한 복원 모델을 선택하는 선택 과정; 및 상기 해상도별로 서로 다른 독립된 복원 모델 중 상기 관측 이미지(y)의 해상도에 대응하는 복원 모델을 이용하여 상기 관측 이미지를 복원한 복원 이미지(x^)를 생성하는 이미지 복원 과정;을 포함하는 것을 특징으로 하는 이미지 복원 방법을 제공한다.

이상에서 설명한 바와 같이 본 실시예에 의하면, 서로 상이한 해상도마다 학습을 수행하여 서로 다른 독립된 복원 모델을 생성하고, 왜곡이 발생한 이미지를 입력 받아 서로 다른 독립된 복원 모델 중 왜곡이 발생한 이미지의 해상도에 대응하는 복원 모델을 적용하여 왜곡 이미지 내의 복원 대상 객체를 중심으로 개선한 업스케일링 영상으로 복원할 수 있는 효과가 있다.

도 1은 본 실시예에 따른 입력 영상과 출력 영상을 나타낸 도면이다.

도 2는 본 실시예에 따른 영상 복원 과정을 설명하기 위한 도면이다.

도 3은 본 실시예에 따른 관측 이미지와 복원 이미지를 설명하기 위한 도면이다.

도 4는 본 실시예에 따른 관측 이미지의 왜곡을 나타낸 도면이다.

도 5는 본 실시예에 따른 관측 이미지별 복원 이미지를 나타낸 도면이다.

도 6은 본 실시예에 따른 입력 영상의 원본 이미지, 관측 이미지, 생성된 가짜 이미지를 나타낸 도면이다.

도 7a,7b는 본 실시예에 따른 이미지 복원 장치를 나타낸 도면이다.

<도면에 나타낸 부호의 설명>

700: 이미지 복원 장치

710: 학습부

712: 생성부(G) 714: 구별부(D)

720: 이미지 복원부

이하, 본 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.

본 실시예에 따른 이미지 복원 장치(700)는 왜곡된 이미지에 대해 GAN(Generative Adversarial Networks)를 적용하여 업스케일링 이미지로 출력한다.

이미지 복원 장치(700)는 왜곡된 이미지 내의 복원 대상 객체를 중심으로 개선하여 업스케일링 영상으로 복원한다.

도 1의 (a)에 도시된 바와 같이, 64×64 왜곡 이미지를 복원하면, 종래의 도 1의 (b)에 도시된 정도로 복원될 수 있으나, 본 실시예에 따른 이미지 복원 장치(700)는 도 1의 (c)에 도시된 바와 같은 수준의 업스케일링 이미지로 복원할 수 있다.

원본 이미지(clean image x)가 존재할 때 다양한 원인에 의해서 원본 이미지(x)에 왜곡이 발생할 수 있다. 도 2에 도시된 바와 같이, 원본 이미지(x)에 원인을 알 수 없는 왜곡(Unknown degradation)(블러, 노이즈, 압축 등에 의한 원인)이 발생하여 관측 이미지(observed image y)에 왜곡이 발생한다.

이미지 복원 장치(700)는 관측 이미지(y)에 딥러닝(deep learning) 기술을 적용하여 복원(restoration)한 복원 이미지(restored image x^)를 생성한다.

GAN(Generative Adversarial Networks) 내의 생성부(generator)(712)는 입력 이미지(32×32)를 기반으로 CNN을 이용하여 복원 업스케일링 이미지(64×64)를 생성한다.

GAN 내의 구별부(discriminator)(714)에서 생성부(G)(712)에서 출력한 업스케일링 이미지가 원본 진짜(real) 이미지인지 생성된 가짜(fake) 이미지인지의 여부를 판별한다. GAN 내의 구별부(D)(714)에서 생성부(G)(712)에서 출력한 업스케일링 이미지가 원본(real)인지 생성된 가짜(fake)인지를 판별한 점수를 역전파하고, GAN은 원본(real)인지 생성된 가짜(fake)인지를 판별하기 위한 점수를 높이기 위해 원본(real)같은 생성된 가짜 업스케일링 이미지를 생성하기 위해 학습을 수행한다.

관측 이미지(y)와 원본 이미지(x)의 관계는 [수학식 1]로 나타낼 수 있다.

(y｜x)은 원본 이미지(x)로부터 왜곡된 이미지인 관측 이미지(y)가 얻어지게 되므로, 블러(blur), 노이즈(noise), 압축(compression) 등과 같은 확인된 왜곡 지식을 모델링(likehood)할 수 있다.

P(x)은 prior term으로서, 원본 이미지(x)에 대한 지식을 모델링할 수 있다.

구별부(D)(714) 자체가 p(x)에 대한 확률 분포를 모델링해서 확률 분포 사이의 거리가 얼마나 유사한지를 기반으로 원본(real)인지 생성된 가짜(fake)인지를 판별한다. 구별부(D)(714) 자체가 prior term을 대표한다.

일반적으로 구별부(D)는 32×32 이미지를 64×64 이미지로 모델링하거나 64×64 이미지를 128×128로 두 배를 모델링한다고 가정할 때, 해상도가 2배 낮은 이미지를 입력하고, 정답(출력)으로 해상도가 2배 높은 이미지를 기준으로 학습한다.

하지만, 이러한 학습 방법은 구별부(D) 자체가 원본 이미지(x)(타겟 이미지)에 대한 확률 분포를 모델링하기 때문에 모든 이미지들을 정답(출력)으로 설정하면, 32×32 이미지에 대한 정답(출력)은 64×64 이미지로 출력되나, 64×64 이미지에 대한 정답(출력)은 128×128 이미지뿐만 아니라 64×64 이미지까지 원본(real) 이미지로 출력되는 문제가 있다.

본 실시예에 따른 이미지 복원 장치(700)는 각각의 원본 이미지(x)(타겟 이미지)마다 서로 독립된 모델을 생성하여 가장 적합한 이미지를 출력한다.

본 실시예에 따른 이미지 복원 장치(700)는 블러, 노이즈, 압축 등에 대한 지식을 모델링하기 때문에, 원본 이미지(x)로부터 랜덤 노이즈(Random Noise)를 더하고, 블러 커널이 컨볼루션(Convolution)된 상태에서 이미지 압축 기술이 압축된 결과로서 왜곡된 관측 이미지(y)를 획득한다.

관측 이미지(y)는 왜곡 발생으로 인해 [수학식 2]와 같은 값을 갖는다.

N_σ;c: AWGN with channel dependent noise level

K_S: blur kernel with size s

JPEGq: JPEG compression with quality q

다시 말해, N_σ;c는 채널 c에 의존적인 노이즈 레벨을 의미한다. K_S는 사이즈 s에 대한 블러 커널을 의미한다. JPEG_q는 압축 퀄리티 q로 JPEG 압축을 수행함을 의미한다. 여기서, JPEG 압축은 일례이며 본 발명은 특정 이미지/비디오 압축 기술에 한정되지 않는다.

본 실시예에 따른 구별부(D)(714)는 왜곡된 이미지(y)를 획득한 후 왜곡된 관측 이미지(y), 원본 이미지(x)를 기반으로 학습을 수행한다. 즉, 이미지 복원 장치(700)는 왜곡된 관측 이미지(y)를 입력으로 원본 이미지(x)를 정답(출력)으로 설정하고 학습을 수행한다.

본 실시예에 따른 이미지 복원 장치(700)는 왜곡된 관측 이미지(y)를 획득한 후 왜곡된 관측 이미지(y), 원본 이미지(x)를 기반으로 복원 이미지(x^)를 생성한다.

본 실시예에 따른 이미지 복원 장치(700)는 복원 이미지(x^)를 생성하기 위해 [수학식 3]을 이용한다.

F: (5,4)-th convolution map of object recognition network

G_θ: generator network (EDSR) with parameter

D_φ;x : discriminator network with parameter φ given prior x

P(y｜x)는 왜곡된 관측 이미지(y)를 모델링하는 확률분포를 의미한다.

P(x)는 원본 이미지(x)의 확률분포를 의미한다.

복원 이미지(x^)는 왜곡된 관측 이미지(y)를 모델링하는 확률분포 P(y｜x)와 원본 이미지(x)의 확률분포 P(x)를 최대값으로 만들기 위한 값(x)을 갖는다.

복원 이미지(x^)는 -log을 취한 왜곡된 관측 이미지(y)를 모델링하는 확률분포 P(y｜x)와 -log을 취한 원본 이미지(x)의 확률분포 P(x)를 최소값으로 만들기 위한 값(x)을 갖는다.

R(x)는 GAN 내의 구별부(D)(714)에서 생성부(G)(712)에서 출력한 업스케일링 이미지가 원본(real)인지 생성된 가짜(fake)인지를 판별한 점수를 의미한다.

G_θ(y)는 생성부(G)(712)에서 생성한 가짜(fake) 이미지를 의미한다.

E는 원본 이미지(x)와 G_θ(y) 사이의 차를 제곱한 값을 의미한다.

F는 객체 인식을 위해 학습한 네트워크를 의미한다.

이미지 복원 장치(700)는 [수학식1]에 기재된 바와 같이, Likelihood term, Prior term에 의해 모델이 분리되어 학습됨을 알 수 있다.

이미지 복원 장치(700)는 prior term에 따라 정답으로 하는 타겟 이미지가 64×64 이미지인지 128×128 이미지 인지 2k 이미지 인지, 4k 이미지, 8k 이미지 인지에 따라서 독립된 모델(G)을 학습한다. 즉, 이미지 복원 장치(700)는 해상도 별로 독립된 모델(G)를 구비해야 한다.

본 실시예에 따른 이미지 복원 장치(700)는 수식적으로 [수학식1]과 같이 모델링하므로 해상도별로 분리해서 학습을 수행한다. 이미지 복원 장치(700)는 왜곡된 관측 이미지(y)를 [수학식2]와 같이 모델링을 수행할 수 있다.

이미지 복원 장치(700)는 왜곡된 관측 이미지(y)와 정답 이미지 사이의 데이터 텀을 최소화할 때 객체 인식 네트워크를 추가적으로 구현하여 복원 대상 객체의 주요 특징만을 최소화한다. 여기서, 객체 인식 네트워크(F)는 컨볼루션 맵의 사이즈를 줄여나가면서 복원 대상 객체의 특징을 추출하게 된다. 일례로, 복원하고자 하는 대상 객체가 얼굴 이미지인 응용 예에서는 얼굴 인식 네트워크를 구현하여 얼굴의 주요 특징 사이의 차를 최소화하는 방향으로 학습할 수 있다.

이미지 복원 장치(700)는 GAN의 구별부(D)(714)가 생성부(G)(712)에서 출력한 업스케일링 이미지가 원본(real)인지 생성된 가짜(fake)인지를 판별한 점수를 산출한다.

구별부(D)(714)는 학습한 정보를 토대로 생성부(G)에서 출력한 업스케일링 이미지가 원본(real)인지 생성된 가짜(fake)인지를 판별한다. 이후 구별부(D)(714)를 개선하여 원본(real)인지 생성된 가짜(fake)인지를 판별하는 기준으로 정답에 대한 정보 없이 학습된 정보를 이용할 수 있다.

이후 이미지 복원 장치(700)는 전술한 과정을 통합하기 위해 멀티 스케일 구조를 갖는다.

이미지 복원 장치(700)는 다양한 해상도를 갖는 임의의 왜곡된(열화된) 이미지가 입력되면 기 설정된 해상도(512×512)를 갖는 업스케일링 이미지로 업스케일링한다. 이미지 복원 장치(700)는 업스케일링 이미지(512×512)를 다시 기 설정된 배수(2배, 4배)로 다운스케일링(32×32, 64×64, 128×128)한다.

이후 이미지 복원 장치(700)는 서로 다른 스케일의 데이터를 생성한다. 업스케일링 이미지(512×512)를 입력으로 학습된 네트워크를 통과시켜서 결과를 얻게 된다.

이미지 복원 장치(700)는 업스케일링 이미지(512×512)를 입력으로 학습된 네트워크를 통과시켜서 다시 기 설정된 배수(2배, 4배)로 다운스케일링(32×32, 64×64, 128×128)된 영상을 생성한다. 이미지 복원 장치(700)는 다운스케일링할 때 가장 작은 이미지(32×32)부터 생성한다. 이미지 복원 장치(700)는 가장 작은 다운스케일링 이미지(32×32)를 업스케일링 이미지(64×64)로 변환한다.

이미지 복원 장치(700)는 업스케일링 이미지(64×64)와 다운스케일링된 이미지(64×64)를 결합하여 업스케일링 이미지(128×128)를 생성한다. 이미지 복원 장치(700)는 업스케일링 이미지(128×128)와 다운스케일링된 이미지(128×128)를 결합하여 업스케일링 이미지(256×256)를 생성한다. 이미지 복원 장치(700)는 업스케일링 이미지(256×256)와 다운스케일링된 이미지(256×256)를 결합하여 업스케일링 이미지(512×512)를 생성한다. 이미지 복원 장치(700)는 서로 다른 스케일과 서로 다른 왜곡에 대해서 무관하게 항상 일정하게 좋은 결과를 얻고자 한다.

이미지 복원 장치(700)는 원본 이미지(x)를 가지고 왜곡된 관측 이미지(y)를 생성하고, 왜곡된 관측 이미지(y)를 복원하여 복원 이미지(x^)를 생성한다. 이미지 복원 장치(700)는 입력 이미지를 512×512로 업스케일링 하고, 업스케일링 이미지를 1/2, 1/4, 1/8 등으로 해상도를 낮춰가면서 입력 이미지를 생성하고, 입력하는 것을 반복한다.

도 4에 도시된 바와 같이, 원본 이미지(x)에 대해 다양한 형태로 관측 이미지(y)가 왜곡될 수 있다. 다시 말해, 원본 이미지(x)에 대해 노이즈 이미지, 블러 이미지, 리사이즈 이미지, 압축 이미지, 노이즈 및 압축 이미지로 인해 도 4에 도시된 관측 이미지(y)와 같은 왜곡이 발생할 수 있다.

이미지 복원 장치(700)는 도 4에 도시된 다양한 형태의 왜곡된 관측 이미지(y)를 입력 받아 복원 이미지(x^)를 생성한 결과는 도 5에 도시된 바와 같다.

다시 말해, 이미지 복원 장치(700)는 다양한 형태의 왜곡된 관측 이미지(y)를 입력 받아 복원하면 도 5에 도시된 바와 같이, 노이즈 이미지, 블러 이미지, 리사이즈 이미지, 압축 이미지, 노이즈 및 압축 이미지 각각에 대한 복원 이미지가 생성된다.

이미지 복원 장치(700)는 도 6에 도시된 바와 같이 입력 영상을 복원한 복원 영상으로 생성하는 과정에서, 생성부(G)(712)로 입력되는 Input 이미지, 생성부(G)(712)에서 생성한 CNN 이미지, 구별부(D)(714)로 입력되는 Ground-Truth 이미지 등은 도 6과 같다. 이미지 복원 장치(700) 내의 구별부(D)(714)가 생성부(G)(712)에서 출력한 업스케일링 이미지가 원본(real)인지 생성된 가짜(fake)인지를 판별한 점수를 산출한다.

이미지 복원 장치(700) 내의 구별부(D)(714)는 학습한 정보를 토대로 생성부(G)에서 출력한 업스케일링 이미지가 원본(real)인지 생성된 가짜(fake)인지를 판별한다. 이미지 복원 장치(700)는 구별부(D)(714)의 성능을 개선하여 원본(real)인지 생성된 가짜(fake)인지를 판별하는 기준으로 정답 이미지(Ground-Truth)와 생성부(G)에서 생성한 가짜 이미지(Relative-GAN)를 함께 전달한다.

본 실시예에 따른 이미지 복원 장치(700)는 학습부(710), 이미지 복원부(720)를 포함한다. 이미지 복원 장치(700)에 포함된 구성요소는 반드시 이에 한정되는 것은 아니다.

이미지 복원 장치(700)에 포함된 각 구성요소는 장치 내부의 소프트웨어적인 모듈 또는 하드웨어적인 모듈을 연결하는 통신 경로에 연결되어 상호 간에 유기적으로 동작할 수 있다. 이러한 구성요소는 하나 이상의 통신 버스 또는 신호선을 이용하여 통신한다.

도 7a,7b에 도시된 이미지 복원 장치(700)의 각 구성요소는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 소프트웨어적인 모듈, 하드웨어적인 모듈 또는 소프트웨어와 하드웨어의 결합으로 구현될 수 있다.

학습부(710)는 서로 상이한 해상도를 갖는 복수의 이미지를 입력받아 서로 상이한 해상도마다 학습을 수행하여 해상도별로 서로 다른 독립된 복원 모델을 각각 생성한다.

학습부(710)는 생성부(G)(712), 구별부(D)(714)를 포함한다.

생성부(G)(712)는 입력된 이미지가 갖는 해상도를 기 설정된 해상도만큼 업스케일링(upscaling)한 복원 이미지를 생성한다.

생성부(G)(712)는 입력된 이미지를 기 설정된 해상도를 갖는 이미지로 업스케일링한 업스케일링 이미지를 생성한다. 생성부(G)(712)는 업스케일링 이미지를 기 설정된 비율의 해상도를 갖도록 해상도를 낮춰가면서 입력 이미지로 입력하는 것을 반복한다.

구별부(D)(714)는 생성된 가짜(fake) 이미지와 원본 이미지(x)를 입력받고, 생성된 가짜 이미지가 원본(real) 이미지인지 생성된 가짜(fake) 이미지인지의 여부를 판별한 점수를 산출한다. 구별부(D)(714)는 점수를 기반으로 해상도별로 복원 모델을 생성한다.

이미지 복원부(720)는 왜곡된 관측 이미지(y)를 입력 받으면, 해상도별로 서로 다른 독립된 복원 모델 중 관측 이미지(y)의 해상도에 대응하는 복원 모델을 이용하여 관측 이미지를 복원한 복원 이미지(x^)를 생성한다.

관측 이미지(y)는 원본 이미지(x)에 더해진 채널에 의존적인 노이즈 레벨(N_σ;c) 값에 사이즈에 대한 블러 커널(K_S), JPEG 압축 퀄리티(JPEG_q)가 적용된 값을 갖는다.

이미지 복원부(720)는 왜곡된 관측 이미지(y)를 모델링하는 확률분포 P(y｜x)와 원본 이미지(x)의 확률분포 P(x)를 최대값으로 만들기 위한 값을 갖도록 하는 복원 이미지(x^)를 생성한다.

이미지 복원부(720)는 -log을 취한 왜곡된 관측 이미지(y)를 모델링하는 확률분포 P(y｜x)와 -log을 취한 원본 이미지(x)의 확률분포 P(x)를 최소값으로 만들기 위한 값을 갖도록 하는 복원 이미지(x^)를 생성한다.

이미지 복원부(720)는 원본 이미지(x), 생성부(G)(712)에서 생성한 가짜 이미지 G_θ(y), 생성부(G)(712)에서 생성한 이미지가 원본(real)인지 생성된 가짜(fake)인지를 판별한 점수 R(x)를 기반으로 원본 이미지(x)와 생성된 가짜 이미지 G_θ(y) 사이의 차를 제곱한 값 E를 최소화하는 파라미터 셋으로부터 복원 이미지(x^)를 생성한다.

이미지 복원부(720)는 복원 이미지(x^)를 생성할 때, 왜곡된 관측 이미지(y)와 원본 이미지(x) 사이의 데이터 텀을 최소화하기 위해 추가적으로 구현된 객체 인식 네트워크(object recognition network)적용하여 컨볼루션 맵(convolution map)의 사이즈를 줄여나가면서 복원 대상 객체의 주요 특징만을 추출한 값을 적용한다.

이상의 설명은 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 실시예들은 본 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims

이미지를 수신하는 수신기와 컨볼루션 연산 및 비선형화를 통해 상기 이미지를 처리하는 프로세서를 포함하고,

상기 프로세서는,

서로 상이한 해상도를 갖는 복수의 이미지를 입력 받아 상기 서로 상이한 해상도마다 학습을 수행하여 해상도별로 독립된 복원 모델을 학습하는 학습부;

왜곡된 관측 이미지(observed image y)를 입력받으면, 상기 왜곡된 관측 이미지(y)의 해상도를 분석하여 적합한 복원 모델을 선택하는 선택부; 및

상기 해상도별로 서로 다른 독립된 복원 모델 중 상기 관측 이미지(y)의 해상도에 대응하는 복원 모델을 이용하여 상기 관측 이미지를 복원한 복원 이미지(restored image x^)를 생성하는 이미지 복원부;

를 포함하는 것을 특징으로 하는 이미지 복원 장치.
제1항에 있어서,

상기 학습부는,

입력된 이미지가 갖는 해상도를 기 설정된 해상도만큼 증가시키는 가짜 이미지를 생성하는 생성부(generator);

상기 생성된 가짜 이미지(fake image)와 원본 이미지(x)를 입력받고, 상기 생성된 가짜 이미지가 원본(real) 이미지인지 가짜(fake) 이미지인지의 여부를 판별하여 점수를 산출하며, 산출한 점수를 기반으로 해상도별로 상기 복원 모델을 생성하는 구별부(discriminator);

를 포함하는 것을 특징으로 하는 이미지 복원 장치.
제1항에 있어서,

상기 관측 이미지(y)는,

상기 원본 이미지(x)에 채널 의존적인 노이즈 와 다양한 강도의 블러 및 이미지/동영상 압축이 적용되는 것을 특징으로 하는 이미지 복원 장치.
제1항에 있어서,

상기 이미지 복원부는,

상기 왜곡된 관측 이미지(y)를 모델링하는 확률분포 P(y｜x)와 상기 원본 이미지(x)의 확률분포 P(x)를 최대값으로 만들기 위한 값을 갖도록 하는 상기 복원 이미지(x^)를 생성하는 것을 특징으로 하는 이미지 복원 장치.
제1항에 있어서,

상기 이미지 복원부는,

-log을 취한 상기 왜곡된 관측 이미지(y)를 모델링하는 확률분포 P(y｜x)와 -log을 취한 상기 원본 이미지(x)의 확률분포 P(x)를 최소값으로 만들기 위한 값을 갖도록 하는 상기 복원 이미지(x^)를 생성하는 것을 특징으로 하는 이미지 복원 장치.
제2항에 있어서,

상기 이미지 복원부는,

상기 생성부에서 생성된 가짜 이미지가 원본(real)인지 생성된 가짜(fake)인지 여부를 상기 구별부에서 산출한 점수 R(x)를 기반으로 상기 원본 이미지(x)와 상기 생성된 가짜 이미지 G_θ(y) 사이의 차를 최소화하는 상기 복원 이미지(x^)를 생성하는 것을 특징으로 하는 이미지 복원 장치.
제2항에 있어서,

상기 구별부는,

상기 생성부에 의해 생성된 가짜 이미지가 원본(real)인지 생성된 가짜(fake)인지를 산출한 점수와 원본 이미지가 원본(real)인지 생성된 가짜(fake)인지를 산출한 점수를 상대적으로 비교하여 해당 점수의 차이가 최소화되도록 하는 상기 복원 이미지(x^)를 생성하는 것을 특징으로 하는 이미지 복원 장치.
제2항에 있어서,

상기 학습부는,

상기 복원 이미지(x^)를 생성할 때, 상기 왜곡된 관측 이미지(y)와 상기 원본 이미지(x) 사이의 데이터 텀을 최소화하기 위해 객체 인식 네트워크(object recognition network) 모델을 통과하여 컨볼루션 맵(convolution map)에서 추출된 복원 대상 객체의 주요 특징 사이의 차이를 학습하는 것을 특징으로 하는 이미지 복원 장치.
제2항에 있어서,

상기 생성부는,

입력된 이미지를 기 설정된 해상도를 갖는 이미지로 업스케일링한 업스케일링 이미지를 생성하고, 상기 업스케일링 이미지를 기 설정된 비율의 해상도를 갖도록 해상도를 낮춰가면서 입력 이미지로 입력하는 것을 반복하는 것을 특징으로 하는 이미지 복원 장치.
서로 상이한 해상도를 갖는 복수의 이미지를 입력 받아 상기 서로 상이한 해상도마다 학습을 수행하여 해상도별로 독립된 복원 모델을 학습하는 학습 과정;

왜곡된 관측 이미지(y)를 입력받으면, 상기 왜곡된 관측 이미지(y)의 해상도를 분석하여 적합한 복원 모델을 선택하는 선택 과정; 및

상기 해상도별로 서로 다른 독립된 복원 모델 중 상기 관측 이미지(y)의 해상도에 대응하는 복원 모델을 이용하여 상기 관측 이미지를 복원한 복원 이미지(x^)를 생성하는 이미지 복원 과정;

을 포함하는 것을 특징으로 하는 이미지 복원 방법.
제10항에 있어서,

상기 학습 과정은,

입력된 이미지가 갖는 해상도를 기 설정된 해상도만큼 증가시키는 가짜 이미지를 생성하는 생성 과정;

상기 생성된 가짜 이미지(fake image)와 원본 이미지(x)를 입력받고, 상기 생성된 가짜 이미지가 원본(real) 이미지인지 생성된 가짜(fake) 이미지인지의 여부를 판별하여 점수를 산출하며, 산출한 점수를 기반으로 해상도별로 상기 복원 모델을 생성하는 구별 과정;

를 포함하는 것을 특징으로 하는 이미지 복원 방법.
제10항에 있어서,

상기 이미지 복원 과정은,

상기 왜곡된 관측 이미지(y)를 모델링하는 확률분포 P(y｜x)와 상기 원본 이미지(x)의 확률분포 P(x)를 최대값으로 만들기 위한 값을 갖도록 하는 상기 복원 이미지(x^)를 생성하는 것을 특징으로 하는 이미지 복원 방법.
제10항에 있어서,

상기 이미지 복원 과정은,

-log을 취한 상기 왜곡된 관측 이미지(y)를 모델링하는 확률분포 P(y｜x)와 -log을 취한 상기 원본 이미지(x)의 확률분포 P(x)를 최소값으로 만들기 위한 값을 갖도록 하는 상기 복원 이미지(x^)를 생성하는 것을 특징으로 하는 이미지 복원 방법.
제11항에 있어서,

상기 이미지 복원 과정은,

상기 생성 과정에서 생성된 가짜 이미지가 원본(real)인지 생성된 가짜(fake)인지 여부를 상기 구별부에서 산출한 점수 R(x)를 기반으로 상기 원본 이미지(x)와 상기 생성된 가짜 이미지 G_θ(y) 사이의 차를 최소화하는 상기 복원 이미지(x^)를 생성하는 것을 특징으로 하는 이미지 복원 방법.
제11항에 있어서,

상기 구별 과정은,

상기 생성 과정에서 생성된 가짜 이미지가 원본(real)인지 생성된 가짜(fake)인지를 산출한 점수와 원본 이미지가 원본(real)인지 생성된 가짜(fake)인지를 산출한 점수를 상대적으로 비교하여 해당 점수의 차이가 최소화되도록 하는 상기 복원 이미지(x^)를 생성하는 것을 특징으로 하는 이미지 복원 방법.
제11항에 있어서,

상기 학습 과정은,

상기 복원 이미지(x^)를 생성할 때, 상기 왜곡된 관측 이미지(y)와 상기 원본 이미지(x) 사이의 데이터 텀을 최소화하기 위해 객체 인식 네트워크(object recognition network) 모델을 통과하여 컨볼루션 맵(convolution map)에서 추출된 복원 대상 객체의 주요 특징 사이의 차를 학습하는 것을 특징으로 하는 이미지 복원 방법.
제11항에 있어서,

상기 생성 과정은,

입력된 이미지를 기 설정된 해상도를 갖는 이미지로 업스케일링한 업스케일링 이미지를 생성하고, 상기 업스케일링 이미지를 기 설정된 비율의 해상도를 갖도록 해상도를 낮춰가면서 입력 이미지로 입력하는 것을 반복하는 것을 특징으로 하는 이미지 복원 방법.