KR102283416B1

KR102283416B1 - Gan 기반 딥러닝 모델을 이용한 이미지 생성 방법 및 장치

Info

Publication number: KR102283416B1
Application number: KR1020190039230A
Authority: KR
Inventors: 정호엽
Original assignee: 조선대학교산학협력단
Priority date: 2019-04-03
Filing date: 2019-04-03
Publication date: 2021-07-28
Also published as: KR102283416B9; KR20200120970A

Abstract

본 발명은 GAN 기반 딥러닝 모델을 이용한 이미지 생성 방법 및 장치에 관한 것이다. 본 발명의 일 실시예에 따른 이미지 생성 장치는 GAN(generative adversarial network) 기반 딥러닝 모델을 이용하여 랜덤 정보를 입력받고, 상기 랜덤 정보에 기반하여 가상 이미지에 대응하는 주파수 도메인의 적어도 하나의 가상 데이터를 생성하는 생성부(generator); 및 상기 적어도 하나의 가상 데이터와 실제 이미지에 대응하는 주파수 도메인의 적어도 하나의 실제 데이터의 분간 가능 여부를 판단하여 상기 적어도 하나의 가상 데이터의 진위를 판별하는 판별부(discriminator);를 포함하고, 상기 생성부는, 상기 판별 결과에 따라 상기 적어도 하나의 가상 데이터로부터 상기 가상 이미지를 생성할 수 있다.

Description

GAN 기반 딥러닝 모델을 이용한 이미지 생성 방법 및 장치{A method and apparatus for generating image using GAN based deep learning model}

본 발명은 이미지 생성 방법 및 장치에 관한 것으로, 더욱 상세하게는 GAN 기반 딥러닝 모델을 이용한 이미지 생성 방법 및 장치에 관한 것이다.

인공지능(Artificial Intelligence, AI) 시스템은 인간 수준의 지능을 구현하는 컴퓨터 시스템이며, 기존 규칙(Rule) 기반 스마트 시스템과 달리 기계가 스스로 학습하고 판단하며 똑똑해지는 시스템이다. 인공지능 시스템은 사용할수록 인식률이 향상되고 사용자 취향을 보다 정확하게 이해할 수 있게 되어, 기존 규칙 기반 스마트 시스템은 점차 딥러닝 기반 인공지능 시스템으로 대체되고 있다.

인공지능 기술은 기계학습(딥러닝) 및 기계학습을 이용한 요소 기술들로 구성된다. 기계학습은 입력 데이터들의 특징을 스스로 분류/학습하는 알고리즘 기술이며, 요소기술은 딥러닝 등의 기계학습 알고리즘을 이용하여 인간 두뇌의 인지, 판단 등의 기능을 모사하는 기술로서, 언어적 이해, 시각적 이해, 추론/예측, 지식 표현, 동작 제어 등의 기술 분야로 구성된다.

인공지능 기술이 응용되는 다양한 분야는 다음과 같다. 언어적 이해는 인간의 언어/문자를 인식하고 응용/처리하는 기술로서, 자연어 처리, 기계 번역, 대화시스템, 질의 응답, 음성 인식/합성 등을 포함한다. 시각적 이해는 사물을 인간의 시각처럼 인식하여 처리하는 기술로서, 객체 인식, 객체 추적, 영상 검색, 사람 인식, 장면 이해, 공간 이해, 영상 개선 등을 포함한다. 추론 예측은 정보를 판단하여 논리적으로 추론하고 예측하는 기술로서, 지식/확률 기반 추론, 최적화 예측, 선호 기반 계획, 추천 등을 포함한다. 지식 표현은 인간의 경험정보를 지식데이터로 자동화 처리하는 기술로서, 지식 구축(데이터 생성/분류), 지식 관리(데이터 이용) 등을 포함한다. 동작 제어는 차량의 자율 주행, 로봇의 움직임을 제어하는 기술로서, 움직임 제어(항법, 충돌, 주행), 조작 제어(행동 제어) 등을 포함한다.

한편, 멀티 미디어 기술 및 컴퓨터 기술이 발전함에 따라, 딥러닝 기법을 이용한 이미지 생성 기술이 개발되고 있으나, 학습 속도가 현저히 느리고 연산 복잡도가 높으며, 생성된 이미지의 해상도가 낮다는 문제점이 있다.

[특허문헌 1] 한국공개특허 제10-2018-0004898호

본 발명은 전술한 문제점을 해결하기 위하여 창출된 것으로, GAN(generative adversarial network) 기반 딥러닝 모델을 이용한 이미지 생성 방법 및 장치를 제공하는 것을 그 목적으로 한다.

또한, 본 발명은 이미지를 픽셀 블록 단위로 주파수 도메인으로 변환하여 생성된 데이터들 중 일부를 제거하는 이미지 생성 방법 및 장치를 제공하는 것을 그 목적으로 한다.

또한, 본 발명은 GAN 기반 딥러닝 모델을 사용하여 단계별로 주파수 도메인의 가상 이미지에 대한 진폭의 실수를 생성하는 것을 그 목적으로 한다.

본 발명의 목적들은 이상에서 언급한 목적들로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 명확하게 이해될 수 있을 것이다.

상기한 목적들을 달성하기 위하여, 본 발명의 일 실시예에 따른 이미지 생성 장치는, GAN(generative adversarial network) 기반 딥러닝 모델을 이용하여 랜덤 정보를 입력받고, 상기 랜덤 정보에 기반하여 가상 이미지에 대응하는 주파수 도메인의 적어도 하나의 가상 데이터를 생성하는 생성부(generator); 및 상기 적어도 하나의 가상 데이터와 실제 이미지에 대응하는 주파수 도메인의 적어도 하나의 실제 데이터의 분간 가능 여부를 판단하여 상기 적어도 하나의 가상 데이터의 진위를 판별하는 판별부(discriminator);를 포함하고, 상기 생성부는, 상기 판별 결과에 따라 상기 적어도 하나의 가상 데이터로부터 상기 가상 이미지를 생성할 수 있다.

실시예에서, 상기 이미지 생성 장치는 상기 실제 이미지를 상기 주파수 도메인으로 변환하여 다수의 실제 데이터를 생성하고, 상기 다수의 실제 데이터를 주파수 단위 정규화(frequency-wise normalize)시키고, 상기 다수의 실제 데이터를 진폭 편차 기준으로 정렬하며, 상기 다수의 실제 데이터 중 기설정된 임계값보다 큰 상기 적어도 하나의 실제 데이터를 추출하는 이미지 변환부;를 더 포함할 수 있다.

실시예에서, 상기 판별부와 생성부는, 상기 판별 결과를 피드백받아 상기 GAN 기반 딥러닝 모델의 학습을 수행할 수 있다.

실시예에서, 상기 판별 결과는, 0 내지 1 사이의 값을 포함할 수 있다.

실시예에서, 상기 생성부는, 상기 판별 결과가 0.5인 경우 상기 적어도 하나의 가상 데이터로부터 상기 가상 이미지를 생성할 수 있다.

실시예에서, 상기 생성부는, 상기 적어도 하나의 가상 데이터와 상기 적어도 하나의 실제 데이터가 분간되지 못하는 경우, 상기 적어도 하나의 가상 데이터로부터 상기 가상 이미지를 생성할 수 있다.

실시예에서, 상기 생성부는, 제1 랜덤 정보를 입력받고, 상기 제1 랜덤 정보에 기반하여 상기 가상 이미지의 제1 픽셀 블록에 대응하는 주파수 도메인의 제1 가상 데이터를 생성하고, 제2 랜덤 정보를 입력받고, 상기 제1 가상 데이터 및 상기 제2 랜덤 정보에 기반하여 상기 가상 이미지의 제2 픽셀 블록에 대응하는 주파수 도메인의 제2 가상 데이터를 생성할 수 있다.

실시예에서, 상기 생성부는, 상기 제1 가상 데이터와 상기 제2 가상 데이터를 진폭 편차 기준으로 정렬하고, 상기 판별 결과에 따라 상기 정렬된 제1 가상 데이터와 제2 가상 데이터를 이용하여 상기 가상 이미지를 생성할 수 있다.

실시예에서, 이미지 생성 방법은 GAN(generative adversarial network) 기반 딥러닝 모델을 이용하여 랜덤 정보를 입력받는 단계; 상기 랜덤 정보에 기반하여 가상 이미지에 대응하는 주파수 도메인의 적어도 하나의 가상 데이터를 생성하는 단계; 상기 적어도 하나의 가상 데이터와 실제 이미지에 대응하는 주파수 도메인의 적어도 하나의 실제 데이터의 분간 가능 여부를 판단하여 상기 적어도 하나의 가상 데이터의 진위를 판별하는 단계; 및 상기 판별 결과에 따라 상기 적어도 하나의 가상 데이터로부터 상기 가상 이미지를 생성하는 단계;를 포함할 수 있다.

실시예에서, 상기 이미지 생성 방법은 상기 적어도 하나의 가상 데이터의 진위를 판별하는 단계 이전에, 상기 실제 이미지를 상기 주파수 도메인으로 변환하여 다수의 실제 이미지를 생성하는 단계; 상기 다수의 실제 이미지를 주파수 단위 정규화(frequency-wise normalize)시키는 단계; 상기 다수의 실제 데이터를 진폭 편차 기준으로 정렬하는 단계; 및 상기 다수의 실제 데이터 중 기설정된 임계값보다 큰 상기 적어도 하나의 실제 데이터를 추출하는 단계;를 더 포함할 수 있다.

실시예에서, 상기 GAN 기반 딥러닝 모델은 상기 판별 결과에 기반하여 학습될 수 있다.

실시예에서, 상기 가상 이미지를 생성하는 단계는, 상기 판별 결과가 0.5인 경우 상기 적어도 하나의 가상 데이터로부터 상기 가상 이미지를 생성하는 단계;를 포함할 수 있다.

실시예에서, 상기 가상 이미지를 생성하는 단계는, 상기 적어도 하나의 가상 데이터와 상기 적어도 하나의 실제 데이터가 분간되지 못하는 경우, 상기 적어도 하나의 가상 데이터로부터 상기 가상 이미지를 생성하는 단계;를 포함할 수 있다.

실시예에서, 상기 적어도 하나의 가상 데이터를 생성하는 단계는, 제1 랜덤 정보를 입력받고, 상기 제1 랜덤 정보에 기반하여 상기 가상 이미지의 제1 픽셀 블록에 대응하는 주파수 도메인의 제1 가상 데이터를 생성하는 단계; 및 제2 랜덤 정보를 입력받고, 상기 제1 가상 데이터 및 상기 제2 랜덤 정보에 기반하여 상기 가상 이미지의 제2 픽셀 블록에 대응하는 주파수 도메인의 제2 가상 데이터를 생성하는 단계;를 포함할 수 있다.

실시예에서, 상기 가상 이미지를 생성하는 단계는, 상기 제1 가상 데이터와 상기 제2 가상 데이터를 진폭 편자 기준으로 정렬하는 단계; 및 상기 판별 결과에 따라 상기 정렬된 제1 가상 데이터와 제2 가상 데이터를 이용하여 상기 가상 이미지를 생성하는 단계;를 포함할 수 있다.

상기한 목적들을 달성하기 위한 구체적인 사항들은 첨부된 도면과 함께 상세하게 후술될 실시예들을 참조하면 명확해질 것이다.

그러나, 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라, 서로 다른 다양한 형태로 구성될 수 있으며, 본 발명의 개시가 완전하도록 하고 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자(이하, "통상의 기술자")에게 발명의 범주를 완전하게 알려주기 위해서 제공되는 것이다.

본 발명의 일 실시예에 의하면, 이미지를 픽셀 블록 단위로 주파수 도메인으로 변환하여 생성된 데이터들 중 일부를 제거함으로써, 이미지의 너비와 높이를 줄이는 대신 채널의 수를 높여서 CNN(convolutional neural network)을 사용하기에 적합한 형태로 만들 수 있다.

또한, 본 발명의 일 실시예에 의하면, GAN 기반 딥러닝 모델은 단계별로 주파수 도메인의 가상 이미지에 대한 진폭의 실수를 생성함으로써, 작은 신경망으로도 큰 이미지를 생성하는 생성부를 학습시키면서도 생성된 이미지 크기에 변화가 없다.

본 발명의 효과들은 상술된 효과들로 제한되지 않으며, 본 발명의 기술적 특징들에 의하여 기대되는 잠정적인 효과들은 아래의 기재로부터 명확하게 이해될 수 있을 것이다.

도 1은 본 발명의 일 실시예에 따른 이미지 생성 장치의 동작 방법을 도시한 도면이다.
도 2a 및 2b는 본 발명의 일 실시예에 따른 이미지 생성 장치의 이미지 생성 과정을 도시한 도면이다.
도 3은 본 발명의 일 실시예에 따른 이미지 생성 장치의 기능적 구성을 도시한 도면이다.

본 발명은 다양한 변경을 가할 수 있고, 여러 가지 실시예들을 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 이를 상세히 설명하고자 한다.

청구범위에 개시된 발명의 다양한 특징들은 도면 및 상세한 설명을 고려하여 더 잘 이해될 수 있을 것이다. 명세서에 개시된 장치, 방법, 제법 및 다양한 실시예들은 예시를 위해서 제공되는 것이다. 개시된 구조 및 기능상의 특징들은 통상의 기술자로 하여금 다양한 실시예들을 구체적으로 실시할 수 있도록 하기 위한 것이고, 발명의 범위를 제한하기 위한 것이 아니다. 개시된 용어 및 문장들은 개시된 발명의 다양한 특징들을 이해하기 쉽게 설명하기 위한 것이고, 발명의 범위를 제한하기 위한 것이 아니다.

본 발명을 설명함에 있어서, 관련된 공지기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우, 그 상세한 설명을 생략한다.

이하, 본 발명의 일 실시예에 따른 GAN(generative adversarial network) 기반 딥러닝 모델을 이용한 이미지 생성 방법 및 장치를 설명한다.

도 1은 본 발명의 일 실시예에 따른 이미지 생성 장치(200)의 동작 방법을 도시한 도면이다. 도 2a 및 2b는 본 발명의 일 실시예에 따른 이미지 생성 장치(200)의 이미지 생성 과정을 도시한 도면이다.

도 1, 도 2a 및 2b를 참고하면, 이미지 생성 장치(200)는 생성부(generator)(210), 이미지 변환부(220) 및 판별부(discriminator)(230)를 포함할 수 있다.

S101 단계에서, 생성부(210)는 GAN 기반 딥러닝 모델을 이용하여 랜덤 정보를 입력받을 수 있다.

S103 단계에서, 생성부(210)는 입력된 랜덤 정보에 기반하여 가상 이미지에 대응하는 주파수 도메인의 적어도 하나의 가상 데이터를 생성할 수 있다. 여기서, 랜덤 정보는 랜덤 노이즈 입력(random noise input)을 포함할 수 있다.

예를 들어, 도 1a를 참고하면, 생성부(210)는 제1 랜덤 정보(201)를 입력받고, 제1 랜덤 정보(201)에 기반하여 가상 이미지(208)의 제1 픽셀 블록에 대응하는 주파수 도메인의 제1 가상 데이터(202)를 생성할 수 있다.

이후, 생성부(210)는 제2 랜덤 정보(203)를 입력받고, 제1 가상 데이터(202) 및 제2 랜덤 정보(203)에 기반하여 가상 이미지(208)의 제2 픽셀 블록에 대응하는 주파수 도메인의 제2 가상 데이터(204)를 생성할 수 있다.

이 경우, 종래의 라플라시안 피라미드(laplacian pyramid) 방식을 사용한 생성부에서 생성되는 결과는 실제 이미지 크기와 같아야 하기 때문에 큰 이미지를 생성하는 생성부는 크고 학습하기에 어려움이 있다. 반면, 본 발명의 일 실시예에 따른 GAN 기반 딥러닝 모델은 단계별로 주파수 도메인의 진폭의 실수를 생성함으로써, 작은 신경망으로도 큰 이미지를 생성하는 생성부(210)를 학습시키면서도 생성된 이미지 크기에 변화가 없다.

이미지 변환부(220)는 실제 이미지(205)를 주파수 도메인으로 변환하여 다수의 실제 데이터를 생성하고, 생성된 다수의 실제 데이터를 주파수 단위 정규화(frequency-wise nomalize)시킬 수 있다.

이후, 이미지 변환부(220)는 다수의 실제 데이터를 진폭 편차 기준으로 정렬하며, 다수의 실제 데이터 중 기설정된 임계값보다 큰 적어도 하나의 실제 데이터(206)를 추출할 수 있다. 즉, 다수의 실제 데이터 중 기설정된 임계값보다 작은 실제 데이터(207)는 제거될 수 있다.

여기서, 기설정된 임계값은 추출된 적어도 하나의 실제 데이터(206)를 다시 기존 이미지로 변환할 시 이미지가 훼손되지 않을 정도의 낮은 진폭 편차를 의미할 수 있다. 또한, 기설정된 임계값은 추출된 적어도 하나의 실제 데이터(206)에 기반하여 본 발명에 따른 GAN 기반 딥러닝 모델이 학습할 수 있는 진폭 편차를 의미할 수 있다.

이를 통해, 이미지 변환부(220)는 실제 이미지를 픽셀 블록 단위로 주파수 도메인으로 변환하여 생성된 데이터들 중 일부를 제거함으로써, 실제 이미지의 비트의 수를 감소시키는 것이 아니라, 실제 이미지의 실수의 수를 감소시킴에 따라, 이미지의 너비와 높이가 줄어들어 채널의 수가 높아지며, 이에 따라 작은 CNN(convolutional neural network)을 사용하기에 적합한 형태가 된다.

S105 단계에서, 판별부(230)는 적어도 하나의 가상 데이터와 실제 이미지에 대응하는 주파수 도메인의 적어도 하나의 실제 데이터의 분간 가능 여부를 판단하여 상기 적어도 하나의 가상 데이터의 진위를 판별할 수 있다.

일 실시예에서, 생성부(210)와 판별부(230)는, 상기 판별 결과를 피드백받아 GAN 기반 딥러닝 모델의 학습을 수행할 수 있다. 이는, 생성부(210)와 판별부(230) 간의 대립적 경쟁(adversarial competence)을 통해 서로의 능력, 즉, 생성부(210)는 실제 이미지에 최대한 가까운 가상 이미지를 생성해내는 능력, 판별부(230)는 가상 이미지를 실제 이미지로부터 구별해내는 능력을 개선시킬 수 있다. 이러한 대립적 경쟁을 통해 생성부(210)와 판별부(230)는 양자 각각을 속이고 분간하는 능력을 발전시키며 결과적으로 가상 이미지와 실제 이미지의 분간이 어려울 정도에 이르게 된다.

S107 단계에서, 생성부(210)는 상기 판별 결과에 따라 상기 적어도 하나의 가상 데이터로부터 상기 가상 이미지를 생성할 수 있다. 예를 들어, 상기 판별 결과는, 0 내지 1 사이의 값을 포함할 수 있다. 이 경우, 생성부(210)는, 상기 판결 결과가 0.5인 경우 적어도 하나의 가상 데이터로부터 가상 이미지를 생성할 수 있다. 즉, 판별 결과가 0 또는 1에 근접하는 경우에는 결론적으로 구별이 가능하여 진위 판별에 성공했다는 의미이다. 만약 판별 결과가 0.5인 경우 생성된 가상 이미지와 실제 이미지가 서로 구별이 잘 되지 않는다는 의미이며 이는 진위 판별에 실패했다는 의미이다. 따라서, 진위 판별에 실패할 만큼 이미지 생성 능력이 개선되었기 때문에, 생성부(210)는 최종적인 가상 이미지를 생성할 수 있다.

예를 들어, 도 2b를 참고하면, 생성부(210)는 제1 가상 데이터(202)와 제2 가상 데이터(204)를 진폭 편차 기준으로 정렬하고, 상기 판별 결과에 따라 정렬된 제1 가상 데이터(202)와 제2 가상 데이터(204)를 이용하여 가상 이미지(208)를 생성할 수 있다.

일 실시예에서, 판별부(230)가 적어도 하나의 가상 데이터와 적어도 하나의 실제 데이터를 분간하지 못하는 경우, 생성부(210)는 적어도 하나의 가상 데이터로부터 가상 이미지를 생성할 수 있다.

도 3은 본 발명의 일 실시예에 따른 이미지 생성 장치(200)의 기능적 구성을 도시한 도면이다.

도 3을 참고하면, 이미지 생성 장치(200)는 제어부(310), 통신부(320) 및 저장부(330)를 포함할 수 있다.

제어부(330)는 생성부(210), 이미지 변환부(220) 및 판별부(230)를 포함할 수 있다. 일 실시예에서, 생성부(210)는 GAN 기반 딥러닝 모델을 이용하여 랜덤 정보를 입력받고, 상기 랜덤 정보에 기반하여 가상 이미지에 대응하는 주파수 도메인의 적어도 하나의 가상 데이터를 생성할 수 있다.

일 실시예에서, 이미지 변환부(220)는 상기 실제 이미지를 주파수 도메인으로 변환하여 다수의 실제 데이터를 생성하고, 상기 다수의 실제 데이터를 주파수 단위 정규화시키고, 상기 다수의 실제 데이터를 진폭 편차 기준으로 정렬하며, 상기 다수의 실제 데이터 중 기설정된 임계값보다 큰 상기 적어도 하나의 실제 데이터를 추출할 수 있다.

일 실시예에서, 판별부(230)는 상기 적어도 하나의 가상 데이터와 실제 이미지에 대응하는 주파수 도메인의 적어도 하나의 실제 데이터의 분간 가능 여부를 판단하여 상기 적어도 하나의 가상 데이터의 진위를 판별할 수 있다. 이후, 생성부(210)는, 상기 판별 결과에 따라 상기 적어도 하나의 가상 데이터로부터 상기 가상 이미지를 생성할 수 있다.

일 실시예에서, 제어부(330)는 적어도 하나의 프로세서 또는 마이크로(micro) 프로세서를 포함하거나, 또는, 프로세서의 일부일 수 있다. 또한, 제어부(330)는 CP(communication processor)라 지칭될 수 있다. 일 실시예에서, 제어부(330)는 본 발명의 일 실시예에 따른 이미지 생성 장치(200)의 동작을 제어할 수 있다.

일 실시예에서, 통신부(310)는 외부 전자 장치로부터 실제 이미지를 입력받을 수 있다. 일 실시예에서, 통신부(310)는 일반 유/무선 통신 모듈 및 차량 통신 모듈 중 적어도 하나를 포함할 수 있다. 통신부(310)의 전부 또는 일부는 '송신부', '수신부' 또는 '송수신부(transceiver)'로 지칭될 수 있다.

일 실시예에서, 저장부(320)는 실제 이미지, 가상 이미지 및 이미지 생성 장치(200)에 의해 생성된 데이터를 저장할 수 있다. 일 실시예에서, 저장부(320)는 휘발성 메모리, 비휘발성 메모리 또는 휘발성 메모리와 비휘발성 메모리의 조합으로 구성될 수 있다. 그리고, 저장부(320)는 제어부(330)의 요청에 따라 저장된 데이터를 제공할 수 있다.

이상의 설명은 본 발명의 기술적 사상을 예시적으로 설명한 것에 불과한 것으로, 통상의 기술자라면 본 발명의 본질적인 특성이 벗어나지 않는 범위에서 다양한 변경 및 수정이 가능할 것이다.

따라서, 본 명세서에 개시된 실시예들은 본 발명의 기술적 사상을 한정하기 위한 것이 아니라, 설명하기 위한 것이고, 이러한 실시예들에 의하여 본 발명의 범위가 한정되는 것은 아니다.

본 발명의 보호범위는 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 이해되어야 한다.

200: 이미지 생성 장치
201: 제1 랜덤 정보
202: 제1 가상 데이터
203: 제2 랜덤 정보
204: 제2 가상 데이터
205: 실제 이미지
206: 실제 데이터
207: 실제 데이터
208: 가상 이미지
210: 생성부
220: 판별부
230: 이미지 변환부
310: 제어부
320: 통신부
330: 저장부

Claims

GAN(generative adversarial network) 기반 딥러닝 모델을 이용하여 랜덤 정보를 입력받고, 상기 랜덤 정보에 기반하여 가상 이미지에 대응하는 주파수 도메인의 적어도 하나의 가상 데이터를 생성하는 생성부(generator);
상기 가상 이미지에 대응하는 실제 이미지를 주파수 도메인으로 변환하여 다수의 실제 데이터를 생성하고, 상기 다수의 실제 데이터를 주파수 단위 정규화(frequency-wise normalize)시키고, 상기 다수의 실제 데이터를 진폭 편차 기준으로 정렬하며, 상기 다수의 실제 데이터 중 기설정된 임계값보다 큰 적어도 하나의 실제 데이터를 추출하는 이미지 변환부; 및
상기 적어도 하나의 가상 데이터와 상기 적어도 하나의 실제 데이터의 분간 가능 여부를 판단하여 상기 적어도 하나의 가상 데이터의 진위를 판별하는 판별부(discriminator);
를 포함하고,
상기 생성부는, 상기 판별 결과에 따라 상기 적어도 하나의 가상 데이터로부터 상기 가상 이미지를 생성하는,
이미지 생성 장치.
삭제
제1항에 있어서,
상기 판별부와 생성부는, 상기 판별 결과를 피드백받아 상기 GAN 기반 딥러닝 모델의 학습을 수행하는,
이미지 생성 장치.
제1항에 있어서,
상기 판별 결과는, 0 내지 1 사이의 값을 포함하는,
이미지 생성 장치.
제4항에 있어서,
상기 생성부는, 상기 판별 결과가 0.5인 경우 상기 적어도 하나의 가상 데이터로부터 상기 가상 이미지를 생성하는,
이미지 생성 장치.
제1항에 있어서,
상기 생성부는, 상기 적어도 하나의 가상 데이터와 상기 적어도 하나의 실제 데이터가 분간되지 못하는 경우, 상기 적어도 하나의 가상 데이터로부터 상기 가상 이미지를 생성하는,
이미지 생성 장치.
제1항에 있어서,
상기 생성부는,
제1 랜덤 정보를 입력받고, 상기 제1 랜덤 정보에 기반하여 상기 가상 이미지의 제1 픽셀 블록에 대응하는 주파수 도메인의 제1 가상 데이터를 생성하고,
제2 랜덤 정보를 입력받고, 상기 제1 가상 데이터 및 상기 제2 랜덤 정보에 기반하여 상기 가상 이미지의 제2 픽셀 블록에 대응하는 주파수 도메인의 제2 가상 데이터를 생성하는,
이미지 생성 장치.
제7항에 있어서,
상기 생성부는, 상기 제1 가상 데이터와 상기 제2 가상 데이터를 진폭 편차 기준으로 정렬하고,
상기 판별 결과에 따라 상기 정렬된 제1 가상 데이터와 제2 가상 데이터를 이용하여 상기 가상 이미지를 생성하는,
이미지 생성 장치.
GAN(generative adversarial network) 기반 딥러닝 모델을 이용하여 랜덤 정보를 입력받는 단계;
상기 랜덤 정보에 기반하여 가상 이미지에 대응하는 주파수 도메인의 적어도 하나의 가상 데이터를 생성하는 단계;
상기 가상 이미지에 대응하는 실제 이미지를 상기 주파수 도메인으로 변환하여 다수의 실제 데이터를 생성하는 단계;
상기 다수의 실제 데이터를 주파수 단위 정규화(frequency-wise normalize)시키는 단계;
상기 다수의 실제 데이터를 진폭 편차 기준으로 정렬하는 단계;
상기 다수의 실제 데이터 중 기설정된 임계값보다 큰 적어도 하나의 실제 데이터를 추출하는 단계;
상기 적어도 하나의 가상 데이터와 상기 적어도 하나의 실제 데이터의 분간 가능 여부를 판단하여 상기 적어도 하나의 가상 데이터의 진위를 판별하는 단계; 및
상기 판별 결과에 따라 상기 적어도 하나의 가상 데이터로부터 상기 가상 이미지를 생성하는 단계;
를 포함하는,
이미지 생성 방법.
삭제
제9항에 있어서,
상기 GAN 기반 딥러닝 모델은 상기 판별 결과에 기반하여 학습되는,
이미지 생성 방법.
제9항에 있어서,
상기 판별 결과는, 0 내지 1 사이의 값을 포함하는,
이미지 생성 방법.
제12항에 있어서,
상기 가상 이미지를 생성하는 단계는,
상기 판별 결과가 0.5인 경우 상기 적어도 하나의 가상 데이터로부터 상기 가상 이미지를 생성하는 단계;
를 포함하는,
이미지 생성 방법.
제9항에 있어서,
상기 가상 이미지를 생성하는 단계는,
상기 적어도 하나의 가상 데이터와 상기 적어도 하나의 실제 데이터가 분간되지 못하는 경우, 상기 적어도 하나의 가상 데이터로부터 상기 가상 이미지를 생성하는 단계;
를 포함하는,
이미지 생성 방법.
제9항에 있어서,
상기 적어도 하나의 가상 데이터를 생성하는 단계는,
제1 랜덤 정보를 입력받고, 상기 제1 랜덤 정보에 기반하여 상기 가상 이미지의 제1 픽셀 블록에 대응하는 주파수 도메인의 제1 가상 데이터를 생성하는 단계; 및
제2 랜덤 정보를 입력받고, 상기 제1 가상 데이터 및 상기 제2 랜덤 정보에 기반하여 상기 가상 이미지의 제2 픽셀 블록에 대응하는 주파수 도메인의 제2 가상 데이터를 생성하는 단계;
를 포함하는,
이미지 생성 방법.
제15항에 있어서,
상기 가상 이미지를 생성하는 단계는,
상기 제1 가상 데이터와 상기 제2 가상 데이터를 진폭 편자 기준으로 정렬하는 단계; 및
상기 판별 결과에 따라 상기 정렬된 제1 가상 데이터와 제2 가상 데이터를 이용하여 상기 가상 이미지를 생성하는 단계;
를 포함하는,
이미지 생성 방법.