KR102299956B1 - Image quality improvement apparatus using artificial neural network - Google Patents
Image quality improvement apparatus using artificial neural network Download PDFInfo
- Publication number
- KR102299956B1 KR102299956B1 KR1020200021991A KR20200021991A KR102299956B1 KR 102299956 B1 KR102299956 B1 KR 102299956B1 KR 1020200021991 A KR1020200021991 A KR 1020200021991A KR 20200021991 A KR20200021991 A KR 20200021991A KR 102299956 B1 KR102299956 B1 KR 102299956B1
- Authority
- KR
- South Korea
- Prior art keywords
- sample
- image
- neural network
- definition
- image quality
- Prior art date
Links
- 238000013528 artificial neural network Methods 0.000 title description 6
- 238000003062 neural network model Methods 0.000 claims abstract description 31
- 239000000284 extract Substances 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 25
- 238000000034 method Methods 0.000 claims description 10
- 239000013598 vector Substances 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 7
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000002860 competitive effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
이미지 화질 개선 장치는 제 1 이미지로부터 유사 고화질 샘플을 생성하는 생성자 및 유사 고화질 샘플의 진위 여부를 판별하는 판별자를 포함하는 적대적 생성 신경망 모델을 생성하는 모델 생성부, 생성자가 제 1 이미지의 적어도 일부의 샘플을 추출하고, 샘플을 다운 스케일링하고, 다운 스케일링한 샘플의 화질을 개선하여 유사 고화질 샘플을 생성하고, 판별자가 유사 고화질 샘플의 진위 여부를 판별하도록 적대적 생성 신경망 모델을 학습시키는 학습부 및 학습된 적대적 생성 신경망 모델에 제 2 이미지를 입력하여 제 2 이미지의 화질을 개선하는 이미지 화질 개선부를 포함할 수 있다. The image quality improving apparatus includes a model generator generating an adversarial generated neural network model including a generator generating a similar high-definition sample from a first image and a discriminator determining whether the similar high-definition sample is authentic or not; A learning unit that extracts a sample, downscales the sample, and improves the image quality of the downscaled sample to generate a pseudo-high-definition sample, and trains the adversarial generated neural network model so that the discriminator determines whether the pseudo-high-definition sample is authentic or not. and an image quality improvement unit that improves the quality of the second image by inputting the second image to the adversarial generative neural network model.
Description
본 발명은 인공 신경망을 이용한 이미지 화질 개선 장치에 관한 것이다. The present invention relates to an apparatus for improving image quality using an artificial neural network.
딥러닝 기술은 컴퓨터 비전, 음성 인식, 화질 개선 등 다양한 분야에서 널리 사용되고 있다. Deep learning technology is widely used in various fields such as computer vision, speech recognition, and image quality improvement.
화질 개선의 방법으로서 최근에 제안된 ZSSR(Zero-Shot Super-Resolution) 모델은 한 장의 고화질 이미지로부터 내부 학습을 통해 새로운 고화질 이미지를 만들어 낸다. 하지만, ZSSR 모델의 경우, 한 장의 이미지로 학습이 이루어져 일반화된 화질 개선 모델을 얻기 힘들기 때문에 이미지의 종류에 따라 왜곡된 모델을 학습할 가능성이 있다. 또한, ZSSR 모델은 학습하는 고화질 이미지의 종류에 따라 다소 성능에 차이가 나타나는 문제가 있다. The recently proposed ZSSR (Zero-Shot Super-Resolution) model as a method of image quality improvement creates a new high-quality image through internal learning from a single high-quality image. However, in the case of the ZSSR model, it is difficult to obtain a generalized image quality improvement model because it is learned from a single image, so there is a possibility of learning a distorted model depending on the type of image. In addition, the ZSSR model has a problem in that the performance is somewhat different depending on the type of high-definition image to be learned.
한편, SRGAN(Super- Resolution GAN) 모델은 단일 이미지 화질 개선을 위해 적대적 생성 신경망을 이용한 모델로서 사전 학습된 이미지넷 가중치를 사용하기 때문에 기존의 화질 개선 모델들보다 성능이 높다. 하지만, SRGAN 모델은 내부 학습 구조가 아니기 때문에 좋은 성능을 내기 위해서는 많은 양의 고화질 이미지가 필요하다. On the other hand, the SRGAN (Super-Resolution GAN) model uses an adversarial generative neural network to improve single image quality. However, since the SRGAN model is not an internal learning structure, a large amount of high-quality images is required to achieve good performance.
본 발명은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 제 1 이미지를 이용한 이미지 화질 개선 방법을 적대적 생성 신경망 모델에 학습시키고, 학습된 적대적 생성 신경망 모델에 제 2 이미지를 입력하여 화질이 개선된 제 2 이미지를 제공하고자 한다. 다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다. The present invention is to solve the problems of the prior art described above, in which an image quality improvement method using a first image is trained in an adversarial generating neural network model, and the image quality is improved by inputting a second image to the learned adversarial generating neural network model. I would like to provide a second image. However, the technical problems to be achieved by the present embodiment are not limited to the technical problems described above, and other technical problems may exist.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 일측면에 따른 이미지 화질 개선 장치는 제 1 이미지로부터 유사 고화질 샘플을 생성하는 생성자 및 상기 유사 고화질 샘플의 진위 여부를 판별하는 판별자를 포함하는 적대적 생성 신경망 모델을 생성하는 모델 생성부; 상기 생성자가 상기 제 1 이미지의 적어도 일부의 샘플을 추출하고, 상기 샘플을 다운 스케일링하고, 상기 다운 스케일링한 샘플의 화질을 개선하여 상기 유사 고화질 샘플을 생성하고, 상기 판별자가 상기 유사 고화질 샘플의 진위 여부를 판별하도록 상기 적대적 생성 신경망 모델을 학습시키는 학습부; 및 상기 학습된 적대적 생성 신경망 모델에 제 2 이미지를 입력하여 상기 제 2 이미지의 화질을 개선하는 이미지 화질 개선부를 포함할 수 있다. As a technical means for achieving the above technical problem, an apparatus for improving image quality according to an aspect of the present invention includes a generator for generating a similar high-definition sample from a first image and a discriminator for determining whether the similar high-definition sample is authentic a model generator for generating an adversarial generative neural network model; the generator extracts samples of at least a portion of the first image, downscales the samples, and improves image quality of the downscaled samples to generate the pseudo-high-definition sample, and the discriminator determines the authenticity of the pseudo-high-definition sample. a learning unit that trains the adversarial generative neural network model to determine whether or not; and an image quality improvement unit configured to improve the quality of the second image by inputting a second image to the learned adversarial generative neural network model.
상술한 과제 해결 수단은 단지 예시적인 것으로서, 본 발명을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 기재된 추가적인 실시예가 존재할 수 있다.The above-described problem solving means are merely exemplary, and should not be construed as limiting the present invention. In addition to the exemplary embodiments described above, there may be additional embodiments described in the drawings and detailed description.
전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 본 발명은 제 1 이미지를 이용한 이미지 화질 개선 방법을 적대적 생성 신경망 모델에 학습시키고, 학습된 적대적 생성 신경망 모델에 제 2 이미지를 입력하여 화질이 개선된 제 2 이미지를 제공할 수 있다. According to any one of the above-described problem solving means of the present invention, the present invention trains an adversarial generative neural network model to learn an image quality improvement method using a first image, and inputs the second image to the learned adversarial generative neural network model to improve the image quality. An improved second image may be provided.
이를 통해, 본 발명은 적대적 생성 신경망 모델의 학습을 통해 화질 개선의 성능을 높일 수 있고, 제로샷 이미지 화질 개선의 단점을 보완함으로써 적대적 생성 신경망 모델의 견고성을 향상시킬 수 있다. Through this, the present invention can improve the performance of image quality improvement by learning the adversarial generative neural network model, and improve the robustness of the adversarial generative neural network model by compensating for the drawbacks of zero-shot image quality improvement.
도 1은 본 발명의 일 실시예에 따른, 이미지 화질 개선 장치의 블록도이다.
도 2는 본 발명의 일 실시예에 따른, 적대적 생성 신경망 모델의 구조를 나타낸 도면이다.
도 3a 내지 3c는 본 발명의 일 실시예에 따른, 적대적 생성 신경망 모델을 학습시키는 방법을 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른, 적대적 생성 신경망 모델을 통해 이미지 화질을 개선하는 방법을 설명하기 위한 도면이다. 1 is a block diagram of an apparatus for improving image quality according to an embodiment of the present invention.
2 is a diagram illustrating the structure of an adversarial generative neural network model according to an embodiment of the present invention.
3A to 3C are diagrams for explaining a method of training an adversarial generative neural network model according to an embodiment of the present invention.
4 is a diagram for explaining a method of improving image quality through an adversarial generative neural network model according to an embodiment of the present invention.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다. DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those of ordinary skill in the art can easily implement them. However, the present invention may be embodied in many different forms and is not limited to the embodiments described herein. And in order to clearly explain the present invention in the drawings, parts irrelevant to the description are omitted, and similar reference numerals are attached to similar parts throughout the specification.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. Throughout the specification, when a part is "connected" with another part, this includes not only the case of being "directly connected" but also the case of being "electrically connected" with another element interposed therebetween. . In addition, when a part "includes" a certain component, this means that other components may be further included, rather than excluding other components, unless otherwise stated.
본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다. In this specification, a "part" includes a unit realized by hardware, a unit realized by software, and a unit realized using both. In addition, one unit may be implemented using two or more hardware, and two or more units may be implemented by one hardware.
본 명세서에 있어서 단말 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말 또는 디바이스에서 수행될 수도 있다. Some of the operations or functions described as being performed by the terminal or device in the present specification may be instead performed by a server connected to the terminal or device. Similarly, some of the operations or functions described as being performed by the server may also be performed in a terminal or device connected to the server.
이하, 첨부된 구성도 또는 처리 흐름도를 참고하여, 본 발명의 실시를 위한 구체적인 내용을 설명하도록 한다. Hereinafter, detailed contents for carrying out the present invention will be described with reference to the accompanying configuration diagram or process flow diagram.
도 1은 본 발명의 일 실시예에 따른, 인공 신경망을 이용한 이미지 화질 개선 장치(10)의 블록도이다. 1 is a block diagram of an image
도 1을 참조하면, 이미지 화질 개선 장치(10)는 모델 생성부(100), 학습부(110) 및 이미지 화질 개선부(120)를 포함할 수 있다. 다만, 도 1에 도시된 이미지 화질 개선 장치(10)는 본 발명의 하나의 구현 예에 불과하며, 도 1에 도시된 구성요소들을 기초로 하여 여러 가지 변형이 가능하다. Referring to FIG. 1 , the image
이하에서는 도 2 내지 4를 함께 참조하여 도 1을 설명하기로 한다. Hereinafter, FIG. 1 will be described with reference to FIGS. 2 to 4 together.
모델 생성부(100)는 적대적 생성 네트워크(Generative Adversarial Network, GAN)에 기초하여 이미지 화질을 개선하기 위한 적대적 생성 신경망 모델을 생성할 수 있다. 여기서, 적대적 생성 네트워크는 심층 신경망에 경쟁적 학습이 적용된 네트워크이다. The
도 2를 참조하면, 적대적 생성 신경망 모델(200)은 고화질의 제 1 이미지로부터 랜덤으로 추출된 패치 단위의 고화질 샘플을 이용하여 유사 고화질 샘플을 생성하는 것을 학습하고 생성된 유사 고화질 샘플의 진위 여부를 판별하도록 학습하는 모델이다. Referring to FIG. 2 , the adversarial generation
이러한, 적대적 생성 신경망 모델(200)은 제 1 이미지로부터 유사 고화질 샘플을 생성하는 생성자(210) 및 유사 고화질 샘플의 진위 여부를 판별하는 판별자(220)를 포함하고, 생성자(210) 및 판별자(220) 각각은 학습하면서 서로에게 영향을 미친다. The adversarial generative
생성자(210)의 구조를 살펴보면, 생성자(210)는 64개의 채널을 가진 완전히 연결된 합성곱 계층, 배치 정규화 계층 및 RELU (Rectified Linear Unit) 계층을 8번 쌓는 구조로 형성되어 있다. 이 때, 적대적 생성 신경망 구조의 전체 파라미터의 수를 줄이기 위해 깊이 합성곱 계층이 생성자(210)의 구조에 사용된다. 여기서, 깊이 합성곱 계층 계층은 각 채널의 결과값을 하나로 합쳐주는 특징을 가지고 있기 때문에 각 계층의 특성을 유지함과 동시에 파라미터의 수를 줄일 수 있다. Looking at the structure of the
판별자(220)의 구조를 살펴보면, 판별자(220)는 완전히 연결된 컨볼루션 계층, 배치 정규화 계층 및 Leaky RELU 계층을 5번 쌓는 구조로 형성되어 있다. Looking at the structure of the
학습부(110)는 제 1 이미지를 이용하여 적대적 생성 신경망 모델의 생성자(210) 및 판별자(220)를 학습시킬 수 있다. 또한, 학습부(110)는 생성자(210) 및 판별자(220)가 제로샷 방식으로 학습하도록 적대적 생성 신경망 모델을 학습시킬 수 있다. The
구체적으로, 생성자(210)는 적대적 생성 네트워크에 기초하여 제 1 이미지와 유사한 이미지를 생성하도록 학습할 수 있다. 생성자(210)는 제 1 이미지로부터 추출된 고화질 샘플과 유사한 유사 고화질 샘플을 생성하도록 학습할 수 있다. Specifically, the
판별자(220)는 적대적 생성 네트워크에 기초하여 실제 제 1 이미지와 유사한 이미지를 구별하기 위해 학습할 수 있다. 판별자(220)는 유사 고화질 샘플과 실제 제 1 이미지의 고화질 샘플을 구별하도록 학습할 수 있다. The
도 3a 내지 3c를 참조하면, 학습부(110)는 제 1 이미지(301)가 적대적 생성 신경망 모델에 입력되면, 생성자(210)가 제 1 이미지(301)로부터 고화질 샘플(303)을 추출하고, 추출된 고화질 샘플(303)을 다운 스케일링하도록 적대적 생성 신경망 모델을 학습시킬 수 있다. 또한, 학습부(110)는 다운 스케일링된 샘플(305)의 화질을 개선하여 유사 고화질 샘플(307)을 생성하도록 적대적 생성 신경망 모델을 학습시킬 수 있다. 여기서, 유사 고화질 샘플(307)은 제 1 이미지(301)로부터 추출된 고화질 샘플(303)과 유사한 샘플 이미지일 수 있다. 3A to 3C, when the
학습부(110)는 제 1 이미지로부터 추출된 고화질 샘플(303)에 대한 특징 벡터와 생성자(210)에 의해 생성된 유사 고화질 샘플(307)에 대한 특징 벡터 간 거리 비교에 기초하여 생성자(210)가 제 1 이미지(301)의 고화질 샘플(303)과 유사한 샘플을 생성하도록 사전 학습된 고화질 이미지넷 가중치를 적대적 생성 신경망 모델에 적용하면서 적대적 생성 신경망 모델을 학습시킬 수 있다. The
학습부(110)는 고화질 샘플(303)의 특징 벡터와 다운 스케일링한 샘플(305)의 특징 벡터 간의 거리를 최소화하도록 생성자(210)를 학습시킬 수 있다. The
학습부(110)는 다운 스케일링된 샘플(305)에 의해 생성된 유사 고화질 샘플(307)이 판별자(220)를 속이도록 생성자(210)를 학습시킴으로써 생성자(210)가 실제와 상당히 유사한 고화질 샘플(305)을 생성하도록 생성자(210)를 학습시킬 수 있다. The
학습부(110)는 판별자(220)가 생성된 유사 고화질 샘플(307)의 진위 여부를 판별하도록 적대적 생성 신경망 모델을 학습시킬 수 있다. The
학습부(110)는 판별자(220)가 생성된 유사 고화질 샘플(307)이 실제 제 1 이미지(301)로부터 추출된 고화질 샘플(303)에 해당하는지 또는 생성된 유사 고화질 샘플(307)에 해당하는지를 판별하도록 적대적 생성 신경망 모델을 학습시킬 수 있다. The
생성자(210)는 기설정된 손실함수에 기초하여 고화질 샘플의 특징 벡터와 다운 스케일링한 샘플의 특징 벡터 간의 거리를 최소화하도록 학습할 수 있다. 여기서, 기설정된 손실함수는 [수학식 1]과 같이 나타낼 수 있고, 기설정된 손실함수는 생성자(210) 및 판별자(220) 간의 적대적 학습을 위한 제 1 손실함수 및 기학습된 네트워크(예컨대, VGG 네트워크)로부터 추출된 특징 벡터 간의 거리를 나타내는 제 2 손실함수로 구성될 수 있다. 여기서, 제 1 손실함수는 [수학식 2]와 같이 나타내고, 제 2 손실함수는 [수학식 3]과 같이 나타낼 수 있다. The
[수학식 1][Equation 1]
여기서, 는 기설정된 손실함수이고, 은 제 1 손실함수이고, 는 제 2 손실함수이고, α는 하이퍼 파라미터이다. here, is a preset loss function, is the first loss function, is the second loss function, and α is the hyperparameter.
[수학식 2][Equation 2]
여기서, 은 고화질의 제 1 이미지이고, P()는 제 1 이미지로부터 추출된 고화질 샘플이고, 은 추출된 고화질 샘플을 다운 스케일링한 샘플이고, G()는 다운 스케이링한 샘플의 화질이 개선된 유사 고화질 샘플이고, D(G())는 판별자(220)가 유사 고화질 샘플의 진위 여부를 판별할 때의 결과값이다. here, is the first image of high quality, and P( ) is a high-quality sample extracted from the first image, is a down-scaled sample of the extracted high-definition sample, and G( ) is a pseudo-high-definition sample in which the image quality of the down-scaled sample is improved, and D(G( )) is a result value when the
여기서, 제 1 손실함수()는 생성자(210)에 의해 생성된 유사 고화질 샘플이 판별자(220)를 속이도록 학습하는데 사용되는 함수로서 기울기 값이 사라지는 문제를 최소화할 수 있다. Here, the first loss function ( ) is a function used to learn that the similar high-definition sample generated by the
[수학식 3] [Equation 3]
여기서, 제 2 손실함수()는 제 1 이미지로부터 추출된 고화질 샘플(P())과 생성자(210)에 의해 생성된 유사 고화질 샘플(G()) 간의 기학습된 네트워크의 19 계층함수인 f 함수로부터 추출된 특징 벡터 간의 거리가 최소화되도록 학습하는데 사용된다. Here, the second loss function ( ) is a high-quality sample extracted from the first image (P( )) and the pseudo-high-definition sample G( ))) is used to learn to minimize the distance between feature vectors extracted from the f function, which is a 19-layer function of the pre-trained network.
판별자(220)는 기설정된 판별 손실함수에 기초하여 생성자(210)에 의해 생성된 유사 고화질 샘플이 실제 고화질 샘플인지 생성된 유사 고화질 샘플인지를 판별하도록 학습할 수 있다. 판별자(220)는 LSGAN(Least Square Generative Adversarial Networks)을 이용하여 기울기 값이 사라지는 문제를 최소화할 수 있다. 여기서, 기설정된 판별 손실 함수는 [수학식 4]와 같이 나타낼 수 있다. The
[수학식 4][Equation 4]
도 4를 참조하면, 이미지 화질 개선부(120)는 학습된 적대적 생성 신경망 모델에 제 2 이미지(401)를 입력하여 제 2 이미지(401)의 화질을 개선하여 화질이 개선된 제 2 이미지(403)를 생성할 수 있다. Referring to FIG. 4 , the image
한편, 당업자라면, 모델 생성부(100), 학습부(110) 및 이미지 화질 개선부(120) 각각이 분리되어 구현되거나, 이 중 하나 이상이 통합되어 구현될 수 있음을 충분히 이해할 것이다. Meanwhile, those skilled in the art will fully understand that the
본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. An embodiment of the present invention may also be implemented in the form of a recording medium including instructions executable by a computer, such as a program module executed by a computer. Computer-readable media can be any available media that can be accessed by a computer and includes both volatile and nonvolatile media, removable and non-removable media. Also, computer-readable media may include all computer storage media. Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다. The description of the present invention described above is for illustration, and those of ordinary skill in the art to which the present invention pertains can understand that it can be easily modified into other specific forms without changing the technical spirit or essential features of the present invention. will be. Therefore, it should be understood that the embodiments described above are illustrative in all respects and not restrictive. For example, each component described as a single type may be implemented in a distributed manner, and likewise components described as distributed may be implemented in a combined form.
본 발명의 범위는 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.The scope of the present invention is indicated by the following claims rather than the detailed description, and all changes or modifications derived from the meaning and scope of the claims and their equivalent concepts should be construed as being included in the scope of the present invention. .
10: 이미지 화질 개선 장치
100: 모델 생성부
110: 학습부
120: 이미지 화질 개선부10: Image quality improvement device
100: model generation unit
110: study department
120: image quality improvement unit
Claims (3)
제 1 이미지로부터 유사 고화질 샘플을 생성하는 생성자 및 상기 유사 고화질 샘플의 진위 여부를 판별하는 판별자를 포함하는 적대적 생성 신경망 모델을 생성하는 모델 생성부;
상기 생성자가 상기 제 1 이미지의 적어도 일부의 샘플을 추출하고, 상기 샘플을 다운 스케일링하고, 상기 다운 스케일링한 샘플의 화질을 개선하여 상기 유사 고화질 샘플을 생성하고, 상기 판별자가 상기 유사 고화질 샘플의 진위 여부를 판별하도록 상기 적대적 생성 신경망 모델을 학습시키는 학습부; 및
상기 학습된 적대적 생성 신경망 모델에 제 2 이미지를 입력하여 상기 제 2 이미지의 화질을 개선하는 이미지 화질 개선부
를 포함하되,
상기 학습부는 제 1 손실함수를 이용하여 상기 생성자가 상기 샘플과 유사한 유사 고화질 샘플을 생성하여 상기 판별자를 속이도록 상기 생성자를 학습시키고,
상기 제 1 손실함수는
인 것인, 이미지 화질 개선 장치.
In the image quality improvement apparatus,
a model generator for generating an adversarial generated neural network model including a generator for generating a similar high-definition sample from the first image and a discriminator for determining whether the similar high-definition sample is authentic;
the generator extracts samples of at least a portion of the first image, down-scales the samples, and improves the quality of the down-scaled samples to generate the pseudo-high-definition sample, and the discriminator determines the authenticity of the pseudo-high-definition sample. a learning unit that trains the adversarial generative neural network model to determine whether or not; and
An image quality improvement unit for improving the quality of the second image by inputting a second image to the learned adversarial generative neural network model
including,
The learning unit trains the generator to deceive the discriminator by generating a similar high-quality sample similar to the sample by the generator using a first loss function,
The first loss function is
which is an image quality improvement device.
상기 학습부는 제 2 손실함수를 이용하여 상기 샘플의 특징 벡터와 상기 유사 고화질 샘플의 특징 벡터 간의 거리를 최소화하도록 상기 생성부를 학습시키고,
상기 제 2 손실함수는
인 것인, 이미지 화질 개선 장치.
The method of claim 1,
The learning unit trains the generator to minimize the distance between the feature vector of the sample and the feature vector of the similar high-definition sample using a second loss function,
The second loss function is
which is an image quality improvement device.
상기 제 1 손실함수 및 상기 제 2 손실함수에 있어서,
은 상기 제 1 이미지를 나타내고, P()는 상기 제 1 이미지로부터 추출된 샘플을 나타내고, 은 상기 추출된 샘플을 다운 스케일링한 샘플을 나타내고, G()는 상기 다운 스케일링한 샘플의 화질이 개선된 유사 고화질 샘플을 나타내고, D(G())는 상기 판별자가 상기 유사 고화질 샘플의 진위 여부를 판별할 때의 결과값을 나타내는 것인, 이미지 화질 개선 장치.3. The method of claim 2,
In the first loss function and the second loss function,
denotes the first image, and P( ) represents the sample extracted from the first image, denotes a down-scaled sample of the extracted sample, and G ( ) represents a similar high-definition sample in which the picture quality of the down-scaled sample is improved, and D(G( )) represents a result value when the discriminator determines whether the similar high-definition sample is authentic or not.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200021991A KR102299956B1 (en) | 2020-02-24 | 2020-02-24 | Image quality improvement apparatus using artificial neural network |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200021991A KR102299956B1 (en) | 2020-02-24 | 2020-02-24 | Image quality improvement apparatus using artificial neural network |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210107259A KR20210107259A (en) | 2021-09-01 |
KR102299956B1 true KR102299956B1 (en) | 2021-09-08 |
Family
ID=77780039
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200021991A KR102299956B1 (en) | 2020-02-24 | 2020-02-24 | Image quality improvement apparatus using artificial neural network |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102299956B1 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190295302A1 (en) | 2018-03-22 | 2019-09-26 | Northeastern University | Segmentation Guided Image Generation With Adversarial Networks |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10055821B2 (en) | 2016-01-30 | 2018-08-21 | John W. Glotzbach | Device for and method of enhancing quality of an image |
KR102184755B1 (en) * | 2018-05-31 | 2020-11-30 | 서울대학교 산학협력단 | Apparatus and Method for Training Super Resolution Deep Neural Network |
-
2020
- 2020-02-24 KR KR1020200021991A patent/KR102299956B1/en active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190295302A1 (en) | 2018-03-22 | 2019-09-26 | Northeastern University | Segmentation Guided Image Generation With Adversarial Networks |
Non-Patent Citations (1)
Title |
---|
Shocher et al. "zero-shot" super-resolution using deep internal learning. CVPR, 2018년 6월, pp. 3118-3126. 1부.* |
Also Published As
Publication number | Publication date |
---|---|
KR20210107259A (en) | 2021-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | Privacy-protective-GAN for privacy preserving face de-identification | |
CN111476200B (en) | Face de-identification generation method based on generation of confrontation network | |
Lu et al. | Attribute-guided face generation using conditional cyclegan | |
CN108269245A (en) | A kind of eyes image restorative procedure based on novel generation confrontation network | |
US20200364478A1 (en) | Method and apparatus for liveness detection, device, and storage medium | |
CN113674140B (en) | Physical countermeasure sample generation method and system | |
Fan et al. | Stacked latent attention for multimodal reasoning | |
CN110175646B (en) | Multi-channel confrontation sample detection method and device based on image transformation | |
US20220012846A1 (en) | Method of modifying digital images | |
CN113935365A (en) | Depth counterfeit video identification method and system based on spatial domain and frequency domain dual characteristics | |
CN109344709A (en) | A kind of face generates the detection method of forgery image | |
Li et al. | Super resolution image reconstruction of textile based on SRGAN | |
CN111507467A (en) | Neural network model training method and device, computer equipment and storage medium | |
KR102299956B1 (en) | Image quality improvement apparatus using artificial neural network | |
CN113435264A (en) | Face recognition attack resisting method and device based on black box substitution model searching | |
CN116310008B (en) | Image processing method based on less sample learning and related equipment | |
CN110569881B (en) | Data augmentation method and device based on convolutional neural network | |
CN116844008A (en) | Attention mechanism guided content perception non-reference image quality evaluation method | |
CN116562366A (en) | Federal learning method based on feature selection and feature alignment | |
Zakeri et al. | Whispernet: Deep siamese network for emotion and speech tempo invariant visual-only lip-based biometric | |
Sun et al. | Face image-sketch synthesis via generative adversarial fusion | |
CN115204366A (en) | Model generation method and device, computer equipment and storage medium | |
Akram et al. | Integrating GAN with CNN for face sketch synthesis | |
Teissier et al. | Models for audiovisual fusion in a noisy-vowel recognition task | |
CN111860212B (en) | Super-division method, device, equipment and storage medium for face image |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |