KR102188732B1 - System and Method for Data Processing using Sphere Generative Adversarial Network Based on Geometric Moment Matching - Google Patents

System and Method for Data Processing using Sphere Generative Adversarial Network Based on Geometric Moment Matching Download PDF

Info

Publication number
KR102188732B1
KR102188732B1 KR1020190011377A KR20190011377A KR102188732B1 KR 102188732 B1 KR102188732 B1 KR 102188732B1 KR 1020190011377 A KR1020190011377 A KR 1020190011377A KR 20190011377 A KR20190011377 A KR 20190011377A KR 102188732 B1 KR102188732 B1 KR 102188732B1
Authority
KR
South Korea
Prior art keywords
data
discriminator
sphere
geometric
moment
Prior art date
Application number
KR1020190011377A
Other languages
Korean (ko)
Other versions
KR20200093975A (en
Inventor
권준석
박성우
Original Assignee
중앙대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 중앙대학교 산학협력단 filed Critical 중앙대학교 산학협력단
Priority to KR1020190011377A priority Critical patent/KR102188732B1/en
Publication of KR20200093975A publication Critical patent/KR20200093975A/en
Application granted granted Critical
Publication of KR102188732B1 publication Critical patent/KR102188732B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N3/0454
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/092Reinforcement learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/10Interfaces, programming languages or software development kits, e.g. for simulating neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Neurology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)

Abstract

본 발명은 판별 네트워크의 특징공간을 구라고 가정하여 그 위에서 다차 모멘트를 최소화시켜 그레디언트 제약에 대한 문제를 해결할 수 있도록 한 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치 및 방법에 관한 것으로, 랜덤한 노이즈 z로부터 값을 받아들여 가짜 데이터를 생성하고 생성된 가짜 데이터를 판별기로 전달하는 생성기;실제 데이터 및 가짜 데이터를 받아 훈련하는 판별기;상기 판별기로부터 최종 데이터를 받아 n 차원 유클리드(Euclidean) 특징 공간에 매핑하고, 각각 가짜 데이터와 실제 데이터의 특징점을 기하학적 변환에 의해 n 차원 초구(hypersphere)로 다시 매핑하고, 매핑된 점을 사용하여 구형 GAN으로 초구(hypersphere)의 중심점(north pole)을 중심으로 하는 기하학적 모멘트를 계산하는 기하학적 모멘트 매칭부;를 포함하고, 상기 판별기는 실제 및 가짜 데이터 간의 확률 측정의 모멘트 차이를 최대화하려고 시도하고, 생성기는 모멘트 차이를 최소화하여 판별기를 간섭하려고 시도하여 훈련하는 것을 특징으로 한다.The present invention relates to a data processing apparatus and method using an adversarial generating network on a sphere through geometric moment matching to solve the problem of gradient constraints by assuming that the feature space of the discriminant network is a sphere and minimize multi-order moments thereon. As a result, a generator that receives a value from random noise z to generate fake data and transmits the generated fake data to a discriminator; a discriminator that receives and trains the real data and the fake data; and n-dimensional Euclid receiving final data from the discriminator (Euclidean) Mapping to the feature space, re-mapping the feature points of fake data and real data into n-dimensional hyperspheres by geometric transformation, respectively, and using the mapped points to map the north of the hypersphere to a spherical GAN. pole); a geometric moment matching unit that calculates a geometric moment centered on the pole); wherein the discriminator attempts to maximize a moment difference in probability measurement between real and fake data, and the generator attempts to interfere with the discriminator by minimizing the moment difference. It is characterized by trying to train.

Description

기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치 및 방법{System and Method for Data Processing using Sphere Generative Adversarial Network Based on Geometric Moment Matching}System and Method for Data Processing using Sphere Generative Adversarial Network Based on Geometric Moment Matching

본 발명은 머신러닝 및 컴퓨터비전의 하위분야인 생성 모델에 관한 것으로, 구체적으로 판별 네트워크의 특징공간을 구라고 가정하여 그 위에서 다차 모멘트를 최소화시켜 그레디언트 제약에 대한 문제를 해결할 수 있도록 한 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치 및 방법에 관한 것이다.The present invention relates to a generative model that is a subfield of machine learning and computer vision, and specifically, assuming that a feature space of a discriminant network is a sphere, geometric moment matching that minimizes multi-order moments on it to solve the problem of gradient constraints It relates to a data processing apparatus and method using a hostile generation network on the sphere through the.

적대적 생성망(Generative Adversarial Networks;GANs)은 이미지 생성, 수퍼 해상도, 비디오 예측, 스타일 전송, 시각적 추적, 3D 재구성, 세그먼테이션, 객체 감지, 보강 학습 및 의료 이미징과 같은 다양한 기능을 제공하기 위한 광범위한 컴퓨터 비전 애플리케이션에서 높은 성능을 달성하기 위하여 사용되고 있다.Generative Adversarial Networks (GANs) are a wide range of computer vision to provide a variety of functions such as image generation, super resolution, video prediction, style transfer, visual tracking, 3D reconstruction, segmentation, object detection, reinforcement learning, and medical imaging. It is being used to achieve high performance in applications.

이와 같은 적대적 생성망은 2014년 이안 굿펠로우(Ian J. Goodfellow)가 처음 소개한 이후 지금까지 많은 관심을 받고 있다.This hostile generation network has been receiving a lot of attention since its first introduction by Ian J. Goodfellow in 2014.

GAN은 기존 CNN, RNN 등 딥러닝 알고리즘과 달리 비교사 학습방법으로 이미지와 음성 데이터를 생성한다.Unlike existing deep learning algorithms such as CNN and RNN, GAN generates image and voice data using a non-transfer learning method.

작동원리는 생성기와 판별기로 구성된 서로 다른 주체가 적대적으로 경쟁하며 각자의 성능을 최대화한다. 이 과정을 통해 실제 데이터에 가까운 가짜 데이터를 생성하는 원리다.The principle of operation is that different subjects composed of generators and discriminators compete against each other and maximize their performance. This is the principle of creating fake data close to real data through this process.

GAN을 활용하면 저화질의 이미지를 복원하거나 간단한 스케치만으로 완성된 이미지를 만들 수 있다. 현실적으로 학습에 필요한 데이터가 절대적으로 부족한 재난사고 점검 자동화 등에 GAN 모델을 활용할 수 있다.Using GAN, you can restore a low-quality image or create a finished image with just a simple sketch. In reality, the GAN model can be used for automating disaster accident inspection, where the data necessary for learning are absolutely insufficient.

종래 기술의 GAN은 가짜 데이터와 실제 데이터 간의 분포 차이를 최소화하려고 시도하는데, 이를 위해 생성기(generator)는 실제 데이터처럼 보이는 원하는 샘플을 생성하려고 시도하고, 판별자(discriminator)는 실제 데이터와 구별을 시도한다.GAN of the prior art attempts to minimize the distribution difference between fake data and real data.To this end, a generator tries to generate a desired sample that looks like real data, and a discriminator tries to distinguish it from the real data. do.

이와 같은 GAN은 다양한 업무에 성공적으로 적용되었지만 이를 훈련하는 것은 매우 어렵다. 따라서 GAN을 사용하여 보다 복잡한 문제를 해결하는 것은 어렵다.GAN like this has been successfully applied to various tasks, but it is very difficult to train it. Therefore, it is difficult to solve more complex problems using GAN.

이와 같이, 적대적 생성망(Generative Adversarial Networks;GANs)은 머신러닝 및 컴퓨터비전의 하위분야인 생성 모델을 위한 네트워크로, 실제의 이미지와 유사한 생성된 이미지의 품질을 높이기 위해서 여러 연구가 진행되고 있다.As such, Generative Adversarial Networks (GANs) are networks for generative models, which are subfields of machine learning and computer vision, and several studies are being conducted to increase the quality of generated images similar to real images.

최초의 GAN의 문제점을 해결하기 위해서 DCGAN, LSGAN, WGAN등 여러 가지 기술들이 제시되었다. 이렇게 발전되어 가는 GAN은 학계에서뿐만 아니라 실제 IT 산업 전반에서 사용되고 있으며 특히 영상 처리 분야에서 다양한 가치를 창출하고 있다.In order to solve the problem of the first GAN, various technologies such as DCGAN, LSGAN, and WGAN were proposed. GAN, which is developing in this way, is used not only in academia, but also in the actual IT industry as a whole, and is creating various values, especially in the image processing field.

그러나 실제 데이터를 표현하는 확률 측도와 생성 네트워크가 만들어낸 확률 측도 사이의 차이를 줄이기 위해서 웨서스테인 거리(Wesserstein distance)가 사용되는데 이를 위해서 판별 네트워크의 그레디언트에 제약이 가해진다.However, in order to reduce the difference between the probability measure representing the actual data and the probability measure created by the generating network, the Wesserstein distance is used, and for this purpose, a constraint is placed on the gradient of the discriminant network.

이는 훈련에는 도움이 될 수 있지만, 네트워크의 용량을 제한하게 되어 신경망의 특성을 전부 살리지 못하여 성능히 떨어지게 된다.This can be helpful for training, but it limits the capacity of the network, which results in poor performance due to not fully utilizing the characteristics of the neural network.

따라서, 그레디언트 제약에 대한 문제를 해결하기 위한 새로운 기술의 적대적 생성망을 이용하는 데이터 처리 기술의 개발이 요구되고 있다.Therefore, development of a data processing technology using a hostile generation network of a new technology to solve the problem of the gradient constraint is required.

대한민국 등록특허 제10-1843066호Korean Patent Registration No. 10-1843066 대한민국 공개특허 제10-2018-0120478호Republic of Korea Patent Publication No. 10-2018-0120478

본 발명은 종래 기술의 적대적 생성망을 이용하는 데이터 처리 기술의 문제점을 해결하기 위한 것으로, 판별 네트워크의 특징공간을 구라고 가정하여 그 위에서 다차 모멘트를 최소화시켜 그레디언트 제약에 대한 문제를 해결할 수 있도록 한 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치 및 방법을 제공하는데 그 목적이 있다.The present invention is to solve the problem of the data processing technology using the hostile generation network of the prior art, assuming that the feature space of the discrimination network is a sphere, the geometrical structure that minimizes the multi-order moment thereon to solve the problem of the gradient constraint An object thereof is to provide a data processing apparatus and method using a hostile generation network on a sphere through moment matching.

본 발명은 일반적인 IPM 기반 GAN에 비해 몇 가지 장점을 제공하는 새로운 개념의 구 GAN(sphere GAN)으로, 수학적으로 잘 정의된 측도간의 메트릭(metric)을 새롭게 정의하여 훈련되는 네트워크의 거동을 예측할 수 있도록 한 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치 및 방법을 제공하는데 그 목적이 있다.The present invention is a new concept sphere GAN (sphere GAN) that provides several advantages over general IPM-based GANs, so that a metric between mathematically well-defined measures is newly defined to predict the behavior of a trained network. An object of the present invention is to provide a data processing apparatus and method using a hostile generation network on a sphere through one geometric moment matching.

본 발명은 GAN 목적 함수에서 IPM(integral probability metrics)을 정의하기 위해 리만 매니폴드(Riemannian manifolds) 사용하여, 그레디언트 패널티 또는 가상 데이터 샘플링 기술을 사용하지 않고 안정적 훈련이 가능하도록 한 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치 및 방법을 제공하는데 그 목적이 있다.The present invention uses Riemannian manifolds to define IPM (integral probability metrics) in the GAN objective function, and uses geometric moment matching to enable stable training without using a gradient penalty or virtual data sampling technique. An object thereof is to provide a data processing apparatus and method using the hostile generation network described above.

본 발명은 Sphere GAN에서 대수 함수를 사용하여 목적 함수에서 IPM을 바인딩하여 안정적으로 훈련될 수 있도록 하고, 기하학적 모멘트 매칭을 사용하여 고차원 데이터 통계 정보를 활용하여 더 정확한 결과를 제공할 수 있도록 한 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치 및 방법을 제공하는데 그 목적이 있다.The present invention uses an algebraic function in Sphere GAN to enable stable training by binding IPM in the objective function, and geometric moment matching to provide more accurate results by utilizing high-dimensional data statistical information. An object thereof is to provide a data processing apparatus and method using a hostile generation network on a sphere through matching.

본 발명에 따른 Sphere GAN은 특징 공간에서 고차 모멘트를 효율적으로 매칭시켜 정확도를 크게 향상시켜 CIFAR-10, STL-10등 현실의 객체에 대한 이미지셋에서 생성 네트워크를 통해 실사와 거의 비슷한 이미지를 생성할 수 있도록 한 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치 및 방법을 제공하는데 그 목적이 있다.Sphere GAN according to the present invention can efficiently match higher-order moments in a feature space to significantly improve accuracy, and generate images that are almost similar to real life through a network that creates images from image sets for real objects such as CIFAR-10 and STL-10. An object of the present invention is to provide a data processing apparatus and method using a hostile generation network on a sphere through geometric moment matching.

본 발명의 다른 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.Other objects of the present invention are not limited to the objects mentioned above, and other objects that are not mentioned will be clearly understood by those skilled in the art from the following description.

상기와 같은 목적을 달성하기 위한 본 발명에 따른 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치는 랜덤한 노이즈 z로부터 값을 받아들여 가짜 데이터를 생성하고 생성된 가짜 데이터를 판별기로 전달하는 생성기;실제 데이터(x) 및 가짜 데이터를 받아 훈련하는 판별기;상기 판별기로부터 최종 데이터를 받아 n 차원 유클리드(Euclidean) 특징 공간에 매핑하고, 각각 가짜 데이터와 실제 데이터의 특징점을 기하학적 변환에 의해 n 차원 초구(hypersphere)로 다시 매핑하고, 매핑된 점을 사용하여 구형 GAN으로 초구(hypersphere)의 중심점(north pole)을 중심으로 하는 기하학적 모멘트를 계산하는 기하학적 모멘트 매칭부;를 포함하고, 상기 판별기는 실제 및 가짜 데이터 간의 확률 측정의 모멘트 차이를 최대화하려고 시도하고, 생성기는 모멘트 차이를 최소화하여 판별기를 간섭하려고 시도하여 훈련하는 것을 특징으로 한다.A data processing apparatus using a hostile generation network on a sphere through geometric moment matching according to the present invention to achieve the above object generates fake data by receiving a value from random noise z, and uses the generated fake data as a discriminator. A generator that delivers; A discriminator that receives and trains real data (x) and fake data; receives final data from the discriminator and maps it to an n-dimensional Euclidean feature space, and geometrically transforms feature points of fake data and real data, respectively Including; a geometric moment matching unit for re-mapping to an n-dimensional hypersphere by using the mapped point, and calculating a geometric moment centered on the north pole of the hypersphere with a spherical GAN using the mapped point, The discriminator is characterized in that the discriminator attempts to maximize the moment difference of the probability measurement between the real and the fake data, and the generator attempts to interfere with the discriminator by minimizing the moment difference.

다른 목적을 달성하기 위한 본 발명에 따른 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 방법은 판별 네트워크의 특징공간을 구라고 가정하여 그 위에서 다차 모멘트를 최소화시켜 수학적으로 정의된 측도간의 메트릭을 새롭게 정의하여 훈련되는 네트워크의 거동을 예측할 수 있도록 하는 구형 GAN을 이용하여, 생성기에서 랜덤한 노이즈 z로부터 값을 받아들여 실제와 유사한 가짜 데이터를 생성하는 단계;생성기에서 생성된 가짜 데이터를 판별기로 전달하는 단계;판별기가 실제 데이터 및 가짜 데이터를 받아 훈련하고 n 차원 유클리드(Euclidean) 특징 공간에 매핑하는 단계;각각 가짜 데이터와 실제 데이터의 특징점을 기하학적 변환에 의해 n 차원 초구(hypersphere)로 다시 매핑하는 단계;매핑된 점을 사용하여 구형 GAN은 초구(hypersphere)의 중심점(north pole)을 중심으로 하는 기하학적 모멘트를 계산하는 단계;구형 GAN의 판별기는 실제 및 가짜 샘플 간의 확률 측정의 모멘트 차이를 최대화하려고 시도하고, 생성기는 모멘트 차이를 최소화하여 판별자를 간섭하려고 시도하여 훈련하는 단계;를 포함하는 것을 특징으로 한다.The data processing method using the hostile generation network on the sphere through geometric moment matching according to the present invention to achieve another object is assuming that the feature space of the discriminant network is a sphere, minimizing the multi-order moment on it, and between mathematically defined measures. Generating fake data similar to the real thing by receiving a value from the random noise z in a generator using a spherical GAN that allows predicting the behavior of the network to be trained by newly defining a metric; discriminating fake data generated in the generator Transmitting to a Qi; The discriminator receives real data and fake data, trains them, and maps them to an n-dimensional Euclidean feature space; Each feature point of the fake data and real data is converted back into an n-dimensional hypersphere by geometric transformation. Mapping; Using the mapped points, the spherical GAN calculates a geometric moment about a north pole of a hypersphere; the discriminator of the spherical GAN calculates the moment difference of the probability measurement between real and fake samples. And training by attempting to maximize, and the generator attempting to interfere with the discriminator by minimizing the moment difference.

이상에서 설명한 바와 같은 본 발명에 따른 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치 및 방법은 다음과 같은 효과가 있다.The data processing apparatus and method using a hostile generation network on a sphere through geometric moment matching according to the present invention as described above has the following effects.

첫째, 판별 네트워크의 특징공간을 구라고 가정하여 그 위에서 다차 모멘트를 최소화시켜 그레디언트 제약에 대한 문제를 해결할 수 있도록 한다.First, assuming that the feature space of the discriminant network is a sphere, the problem of the gradient constraint can be solved by minimizing the multi-order moment on it.

둘째, 일반적인 IPM 기반 GAN에 비해 몇 가지 장점을 제공하는 새로운 개념의 구 GAN(sphere GAN)의 사용으로 수학적으로 잘 정의된 측도간의 메트릭(metric)을 새롭게 정의하여 훈련되는 네트워크의 거동을 예측할 수 있도록 한다.Second, by using a new concept of sphere GAN (sphere GAN) that provides several advantages over general IPM-based GANs, a metric between mathematically well-defined measures is newly defined so that the behavior of the trained network can be predicted. do.

셋째, GAN 목적 함수에서 IPM(integral probability metrics)을 정의하기 위해 리만 매니폴드(Riemannian manifolds) 사용하여, 그레디언트 패널티 또는 가상 데이터 샘플링 기술을 사용하지 않고 안정적 훈련이 가능하도록 한다.Third, Riemannian manifolds are used to define IPM (integral probability metrics) in the GAN objective function, so that stable training is possible without using a gradient penalty or virtual data sampling technique.

넷째, Sphere GAN에서 대수 함수를 사용하여 목적 함수에서 IPM을 바인딩하여 안정적으로 훈련될 수 있도록 하고, 기하학적 모멘트 매칭을 사용하여 고차원 데이터 통계 정보를 활용하여 더 정확한 결과를 제공할 수 있도록 한다.Fourth, Sphere GAN uses an algebraic function to bind the IPM in the objective function to ensure stable training, and to provide more accurate results by utilizing high-dimensional data statistics information using geometric moment matching.

다섯째, Sphere GAN이 특징 공간에서 고차 모멘트를 효율적으로 매칭시켜 정확도를 크게 향상시켜 CIFAR-10, STL-10등 현실의 객체에 대한 이미지셋에서 생성 네트워크를 통해 실사와 거의 비슷한 이미지를 생성할 수 있도록 한다.Fifth, Sphere GAN can efficiently match higher-order moments in a feature space to greatly improve accuracy, so that images that are almost similar to real life can be generated through a network that creates images from image sets for real objects such as CIFAR-10 and STL-10. do.

도 1은 본 발명에 따른 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치의 전체 구성도
도 2는 본 발명에 따른 기하학적 변환 함수의 일 예인 스테레오그래픽 투영(stereographic projection)을 설명하기 위한 구성도
도 3은 본 발명에 따른 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 방법을 나타낸 플로우 차트
도 4는 IS(Inception scores)를 이용한 초구(hypersphere)의 차원 및 매칭모드에 따른 평가 결과 그래프
도 5는 Sphere GAN 및 WGAN-GP 판별기 네트워크의 그레디언트 특성 그래프
도 6은 서로 다른 GAN 변형에 대해 100 회 반복하는 평균 계산 시간 비교 그래프
도 7a와 도 7b는 LSUN- bedroom 데이터 세트의 구형 GAN의 정성적 결과 및 STL-10 데이터 세트에 대한 구형 GAN의 정성적 결과 구성도
1 is an overall configuration diagram of a data processing apparatus using a hostile generation network on a sphere through geometric moment matching according to the present invention
FIG. 2 is a diagram illustrating a stereographic projection, which is an example of a geometric transformation function according to the present invention.
3 is a flow chart showing a data processing method using a hostile generation network on a sphere through geometric moment matching according to the present invention
4 is a graph of evaluation results according to the dimension and matching mode of a hypersphere using IS (Inception scores)
5 is a graph of gradient characteristics of the Sphere GAN and WGAN-GP discriminator networks
6 is a graph comparing average calculation time repeated 100 times for different GAN variants
7A and 7B are qualitative results of the old GAN of the LSUN-bedroom data set and the configuration diagram of the qualitative results of the old GAN of the STL-10 data set.

이하, 본 발명에 따른 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치 및 방법의 바람직한 실시 예에 관하여 상세히 설명하면 다음과 같다.Hereinafter, an exemplary embodiment of a data processing apparatus and method using a hostile generation network on a sphere through geometric moment matching according to the present invention will be described in detail as follows.

본 발명에 따른 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치 및 방법의 특징 및 이점들은 이하에서의 각 실시 예에 대한 상세한 설명을 통해 명백해질 것이다.Features and advantages of a data processing apparatus and method using a hostile generation network on a sphere through geometric moment matching according to the present invention will become apparent through detailed description of each embodiment below.

도 1은 본 발명에 따른 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치의 전체 구성도이다.1 is an overall configuration diagram of a data processing apparatus using a hostile generation network on a sphere through geometric moment matching according to the present invention.

본 발명은 판별 네트워크의 특징공간을 구라고 가정하여 그 위에서 다차 모멘트를 최소화시켜 수학적으로 잘 정의된 측도간의 metric을 새롭게 정의하여 훈련되는 네트워크의 거동을 예측할 수 있도록 한 것으로, CIFAR-10, STL-10등 현실의 객체에 대한 이미지셋에서 생성 네트워크를 통해 실사와 거의 비슷한 이미지를 생성할 수 있도록 하는 것이다.The present invention assumes that the feature space of the discriminant network is a sphere and minimizes the multi-order moment on it to newly define the metric between mathematically well-defined measures to predict the behavior of the network to be trained, CIFAR-10, STL- It is possible to create an image that is almost similar to the real life through the creation network from the image set of the 10th real object.

이와 같은 본 발명은 머신러닝 및 컴퓨터비전의 하위분야인 생성 모델의 하나인 적대적 생성망(generative adversarial network)에 관한 것으로, 실제 데이터(real data)와 가짜 데이터(fake data)를 구분하는 GAN의 판별기(discriminator)는 최종 데이터를 구(sphere)에 맵핑하는 구성 및, 최종 데이터를 구(sphere)에 맵핑하여 거리를 계산하는 구성을 포함하고 거리(distance)의 바운드(bound)가 존재하는 것을 이용하여 안정적인 GAN 학습을 할 수 있도록 하는 것이다.The present invention relates to a generative adversarial network, which is one of the generative models that are sub-fields of machine learning and computer vision, and discrimination of GANs that distinguish real data from fake data. The discriminator includes a configuration that maps the final data to a sphere and a configuration that calculates the distance by mapping the final data to a sphere, and uses the presence of a bound of the distance. This is to enable stable GAN learning.

본 발명에 따른 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치는 도 1에서와 같이, 랜덤한 noise z로부터 값을 받아들여 실제와 비슷한 이미지(가짜 데이터)를 생성하여 생성된 가짜 데이터를 판별기(200)로 전달하는 생성기(100)와, 실제 데이터 및 가짜 데이터를 받아 훈련하는 판별기(200)와, n 차원 유클리드(Euclidean) 특징 공간에 매핑하고, 각각 가짜 샘플과 실제 샘플의 특징점이 기하학적 변환에 의해 n 차원 초구(hypersphere)로 다시 매핑하고, 매핑된 점을 사용하여 구형 GAN은 초구(hypersphere)의 중심점(north pole)을 중심으로 하는 기하학적 모멘트를 계산하는 기하학적 모멘트 매칭부(300)를 포함하고, 구형 GAN의 판별기(200)는 실제 및 가짜 샘플 간의 확률 측정의 모멘트 차이를 최대화하려고 시도하고, 생성기(100)는 모멘트 차이를 최소화하여 판별자를 간섭하려고 시도하여 훈련하는 것이다.The data processing apparatus using the hostile generation network on the sphere through geometric moment matching according to the present invention receives a value from random noise z and generates an image similar to the real one, as shown in FIG. A generator 100 that transmits data to the discriminator 200, a discriminator 200 that receives and trains real and fake data, and maps to an n-dimensional Euclidean feature space, respectively, and a fake sample and a real sample A geometric moment matching unit that calculates the geometric moment centered on the north pole of the hypersphere using the mapped point and re-maps the feature points of the n-dimensional hypersphere by geometric transformation. Including 300, the discriminator 200 of the spherical GAN attempts to maximize the moment difference of the probability measurement between the real and the fake sample, and the generator 100 trains by attempting to interfere with the discriminator by minimizing the moment difference. will be.

첫번째로 z가 생성기(100)에 들어가게 되면, 가짜 이미지를 만들어내어 판별기(200)의 입력으로 전달한다.First, when z enters the generator 100, a fake image is created and transmitted as an input of the discriminator 200.

이후에, LReLu(31), Avg Pooling(32), Dense(33)를 거쳐 ISP(Inver stereographic projection)을 통해서 위의 노란색과 같이 구(34)에 맵핑한다.Thereafter, the sphere 34 is mapped to the sphere 34 as shown in the yellow above through Inver stereographic projection (ISP) through LReLu (31), Avg Pooling (32), and Dense (33).

이때, ISP는 Dense의 output인 평면의 점들을 구 위의 점으로 맵핑하는 역할을 한다.At this time, the ISP plays a role of mapping the points on the plane, which are the output of Dense, to the points on the sphere.

도 1은 구형 GAN의 파이프 라인 구조를 나타낸 것으로, 가짜 데이터는 생성기에 의해 잡음 입력으로부터 생성된다.Fig. 1 shows the pipeline structure of an old GAN, where fake data is generated from noise input by a generator.

그리고 실제 및 가짜 데이터는 판별기(discriminator)에 보내져 그 출력을 n 차원 유클리드(Euclidean) 특징 공간(즉, 황색 평면)에 매핑한다.The real and spurious data are then sent to a discriminator to map its output to an n-dimensional Euclidean feature space (ie, a yellow plane).

평면(plane)의 녹색과 보라색 원은 각각 가짜 샘플과 실제 샘플의 특징점을 나타낸다. 기하학적 변환에 의해, 이들 특징점은 n 차원 초구(hypersphere)(즉, 황색 구)로 다시 매핑된다.The green and purple circles on the plane represent the feature points of the fake and real samples, respectively. By geometric transformation, these feature points are mapped back to n-dimensional hyperspheres (ie, yellow spheres).

이러한 매핑된 점을 사용하여 구형 GAN은 초구(hypersphere)의 중심점(north pole)을 중심으로 하는 기하학적 모멘트를 계산한다.Using these mapped points, the spherical GAN calculates the geometric moment about the north pole of the hypersphere.

구형 GAN의 판별기는 실제 및 가짜 샘플 간의 확률 측정의 모멘트 차이를 최대화하려고 시도하지만, 생성기는 모멘트 차이를 최소화하여 판별자를 간섭하려고 시도한다.The discriminator of the old GAN attempts to maximize the moment difference of the probabilistic measure between the real and the fake sample, while the generator attempts to interfere with the discriminator by minimizing the moment difference.

초구(hypersphere)에 정의된 기하학적 모멘트를 사용하여 생성자와 판별기는 2 인용 미니 맥스 게임을 통해 성능을 향상시키는 것이다.Using the geometric moments defined in the hypersphere, the generator and discriminator are to improve performance through a two-player minimax game.

본 발명에 따른 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망에 관하여 구체적으로 설명하면 다음과 같다.The hostile generation network on a sphere through geometric moment matching according to the present invention will be described in detail as follows.

웨서스테인 메트릭을 기반으로 하는 목적 함수는 1 차원 특징 공간에서의 첫번째 모멘트는 다음과 같이 정의된다.In the objective function based on the Westerstein metric, the first moment in the one-dimensional feature space is defined as follows.

Figure 112019010592360-pat00001
Figure 112019010592360-pat00001

여기서, G와 D는 각각 생성자와 판별자를 나타내며 P와 N은 실제 데이터와 잠재 코드 분포를 각각 나타내는 것이고, 수학식 1에서 판별기 (D)는 데이터 (x)를 실수 (R)로 맵핑하고, 이는Here, G and D represent the generator and the discriminator, respectively, and P and N represent the actual data and the potential code distribution, respectively, and the discriminator (D) in Equation 1 maps the data (x) to the real number (R), this is

Figure 112019010592360-pat00002
Figure 112019010592360-pat00002

여기서, D는 1-Lipschitz 조건 D ∈ Lip1을 만족해야하며, X ⊂ Rn은 n 차원 유클리드 이미지 공간이다.Here, D must satisfy the 1-Lipschitz condition D ∈ Lip1, and X ⊂ Rn is an n-dimensional Euclidean image space.

기존의 IPM 기반 GAN에서와 마찬가지로 구형 GAN의 목적 함수는 수학식 1을 기반으로 한다.As in the existing IPM-based GAN, the objective function of the old GAN is based on Equation 1.

1 차원 특징 공간의 첫 번째 모멘트와 직접 매칭되는 기존 GAN과는 달리, 구형 GAN은 3차원보다 큰 차원으로 확장한 초구(hypersphere)에 정의된 고차원 및 다중 모멘트와 매칭된다.Unlike the existing GAN, which directly matches the first moment of the one-dimensional feature space, the spherical GAN matches the high-dimensional and multiple moments defined in a hypersphere that extends to a dimension larger than three-dimensional.

이를 위해, 본 발명에 따른 판별기의 출력은 다음과 같이 정의된다.To this end, the output of the discriminator according to the present invention is defined as follows.

Figure 112019010592360-pat00003
Figure 112019010592360-pat00003

수학식 1은 기존 WGAN(Sphere GAN의 baseline)의 목적함수 형태를 나타낸 것이다.Equation 1 shows the shape of the objective function of the existing WGAN (baseline of Sphere GAN).

여기서 x는 실제 이미지 데이터, z는 랜덤한 노이즈이다.Where x is the actual image data and z is the random noise.

생성기(Generator G)는 랜덤한 노이즈 z로부터 값을 받아들여 실제와 비슷한 이미지를 생성하고 판별기(Discriminator D)는 실제 데이터 x를 받아 훈련을 한다.Generator G receives a value from random noise z and generates an image similar to the real one, and Discriminator D receives real data x and trains.

위와 같이 표현된 차이 값을 최소화(min)하는 방식으로 생성기는 작동을 하여 실제 판별기가 훈련한 '판별'을 최소화하려고 노력하고, 판별기는 그것을 판별하기 위해서 최대화(max) 하려고 노력하도록 훈련이 이루어진다.The generator works in a way that minimizes the difference value expressed as above (min), and tries to minimize the'discrimination' trained by the actual discriminator, and the discriminator is trained to try to maximize it to determine it.

구형 GAN(sphere GAN)의 목적함수는 다음과 같이 정리된다.The objective function of the spherical GAN is summarized as follows.

Figure 112019010592360-pat00004
Figure 112019010592360-pat00004

r = 1, ..., R 인 경우 함수

Figure 112019010592360-pat00005
는 각 샘플과 hypersphere N의 north pole사이의 r 번째 모멘트 거리를 측정하는 것을 나타내고, 아래 첨자 s는
Figure 112019010592360-pat00006
Figure 112019010592360-pat00007
상에서 정의되어 있음을 나타낸다.Function for r = 1, ..., R
Figure 112019010592360-pat00005
Represents the measurement of the r-th moment distance between each sample and the north pole of hypersphere N, and the subscript s is
Figure 112019010592360-pat00006
end
Figure 112019010592360-pat00007
Indicates that it is defined in phase.

수학식 4의 새로운 목적 함수를 사용하면 구형 GAN이 초구(hypersphere)상에 IPM을 정의하여, 판별기에 부과된 몇 가지 제약을 완화할 수 있다.If the new objective function of Equation 4 is used, the old GAN defines the IPM on the hypersphere, and some restrictions imposed on the discriminator can be relaxed.

하지만, 이상에서 설명한 목적함수에서 만족해야 할 조건이, D가 1-Lipschitz function이어야 한다는 것이다.However, the condition to be satisfied in the objective function described above is that D must be a 1-Lipschitz function.

이 조건을 만족시키기 위해서 WGAN을 기반으로 한 WGAN-GP, CT, LP 세 기술들은 다음과 같은 gradient penalty들을 사용한다.To satisfy this condition, the WGAN-GP, CT, and LP technologies based on WGAN use the following gradient penalties.

Figure 112019010592360-pat00008
Figure 112019010592360-pat00008

Figure 112019010592360-pat00009
Figure 112019010592360-pat00009

여기서, G*는 고정된 생성기를 나타내고 C는 표 1에 정의된 추가 제약 조건을 나타낸다.Here, G* represents a fixed generator and C represents an additional constraint defined in Table 1.

수학식 5에서 모든 그레디언트 놈(gradient norm)은 반복될 때마다 계산되어야하고, 이는 계산상의 복잡성을 증가시킨다.In Equation 5, all gradient norms must be calculated each iteration, which increases the computational complexity.

이러한 그레디언트 제약(gradient penalty)은 판별기(discriminator)의 커패시티(capacity)를 제한하기 때문에 Lipschitz condition을 만족시키기 위해서 성능 감소를 감수해야 하고 본 발명은 이와 같은 문제를 해결할 수 있도록 한 것이다.Since such a gradient penalty limits the capacity of a discriminator, it is necessary to take a performance reduction in order to satisfy the Lipschitz condition, and the present invention can solve such a problem.

기존의 접근 방식과 달리 구형 GAN은 판별기가 원하는 함수 공간에 위치하도록하는 추가적인 제약 조건을 필요로하지 않는다. 기하학적 변환을 사용하여 구형 GAN은 거리 함수가 원하는 함수 공간에 있음을 보장한다.Unlike the existing approach, the old GAN does not require additional constraints to ensure that the discriminator is located in the desired function space. Using geometric transformations, the spherical GAN ensures that the distance function is in the desired function space.

판별기(discriminator)의 새로운 목적 함수는 다음과 같다.The new objective function of the discriminator is:

Figure 112019010592360-pat00010
Figure 112019010592360-pat00010

표 2의 알고리즘은 본 발명에 따른 구형 GAN의 의사 코드(pseudo-code)를 나타낸 것이다.The algorithm in Table 2 shows the pseudo-code of the old GAN according to the present invention.

Figure 112019010592360-pat00011
Figure 112019010592360-pat00011

3차원보다 큰 차원으로 확장한 초구(hypersphere)에 관하여 설명하면 다음과 같다.The hypersphere expanded to a dimension larger than 3D will be described as follows.

수학식 4에서와 같이, 구형 GAN은 초구(hypersphere)

Figure 112019010592360-pat00012
에서 정의된 특징 공간을 통해 여러 모멘트를 매칭한다.As in Equation 4, the spherical GAN is hypersphere
Figure 112019010592360-pat00012
Multiple moments are matched through the feature space defined in.

구형 GAN은 임의의 리만 매니폴드 M 대신에 초구(hypersphere)를 사용하여 다음과 같은 장점을 제공한다.The older GAN uses a hypersphere instead of any Riemann manifold M, providing the following advantages:

첫째, 초구(hypersphere)의 거리 함수

Figure 112019010592360-pat00013
는 바운드를 형성하고 구현하기가 매우 용이하다.First, the hypersphere's distance function
Figure 112019010592360-pat00013
Is very easy to form and implement bounds.

둘째, 그레디언트 놈(gradient norm)은 거리 함수로 잘 작동하며, 이는 안정적인 학습에 중요하다.Second, the gradient norm works well as a distance function, which is important for stable learning.

셋째, 초구(hypersphere)의 리만 구조(Riemannian structure)는 GAN 객체를 정의하는데 적합하다.Third, the Riemannian structure of hypersphere is suitable for defining GAN objects.

이에 비하여, 일반적인 GAN은 유클리드 거리를 갖는 유클리드 공간

Figure 112019010592360-pat00014
을 전형적으로 고려한다. 이러한 GAN은 임의의 리만 매니폴드를 모델링하여 확장할 수 있다. 그러나 이러한 매니폴드는 컴팩트하지 않고 거리 함수가 바운드되지 않고, 그레디언트 폭발(gradient explosion)과 불안정한 학습을 유발할 수 있다.In contrast, a general GAN is a Euclidean space with a Euclidean distance.
Figure 112019010592360-pat00014
Is typically considered. These GANs can be extended by modeling any Riemann manifold. However, these manifolds are not compact, the distance function is not bound, and can lead to gradient explosions and unstable learning.

이러한 문제를 해결하기 위해 구형 GAN은 유클리드 공간

Figure 112019010592360-pat00015
을 초구(hypersphere)
Figure 112019010592360-pat00016
으로 변환하는 기하학 인식 변환 함수를 사용한다.To solve this problem, the old GAN is a Euclidean space
Figure 112019010592360-pat00015
Hypersphere
Figure 112019010592360-pat00016
Use a geometry recognition transform function to transform into.

이 함수는 판별기의 마지막 컨볼루셔널 레이어(last convolutional layer)에 의해 구현된다.This function is implemented by the last convolutional layer of the discriminator.

이와 같은 본 발명에 따른 변환 함수는

Figure 112019010592360-pat00017
에서
Figure 112019010592360-pat00018
에 이르는 미분동형사상(diffeomorphism)에 의해 설계된다. 따라서, 변환 함수는 미분 가능하고 특징 공간의 모든 점에서 차원을 보존할 수 있다.Such a conversion function according to the present invention is
Figure 112019010592360-pat00017
in
Figure 112019010592360-pat00018
It is designed by diffeomorphism to reach. Thus, the transform function is differentiable and can preserve dimensions at every point in the feature space.

다음은 기하학적 변환 함수로서 스테레오그래픽 투영(stereographic projection)을 설명한다.The following describes stereographic projection as a geometric transformation function.

도 2는 본 발명에 따른 기하학적 변환 함수의 일 예인 스테레오그래픽 투영(stereographic projection)을 설명하기 위한 구성도이다.2 is a block diagram illustrating a stereographic projection, which is an example of a geometric transformation function according to the present invention.

스테레오그래픽 투영(stereographic projection)의 역함수는 유클리드 공간

Figure 112019010592360-pat00019
을 초구(hypersphere)
Figure 112019010592360-pat00020
으로의 미분동형사상(diffeomorphism)이다.The inverse function of stereographic projection is Euclidean space
Figure 112019010592360-pat00019
Hypersphere
Figure 112019010592360-pat00020
It is a diffeomorphism.

직관적으로, 스테레오그래픽 투영(stereographic projection)의 역함수는 초평면(hyperplane)에 투영하는 방법으로 간주될 수 있다.Intuitively, the inverse function of stereographic projection can be considered a method of projecting onto a hyperplane.

Figure 112019010592360-pat00021
의 좌표계를 p = (p1, ..., pn)이라고 하고, 초구(hypersphere)의 중심점(north pole)을 N = (0, ..., 1)이라고 하면,
Figure 112019010592360-pat00021
If the coordinate system of is p = (p1, ..., pn) and the north pole of the hypersphere is N = (0, ..., 1),

스테레오그래픽 투영(stereographic projection)의 역함수

Figure 112019010592360-pat00022
은 다음과 같이 정의된다.Inverse function of stereographic projection
Figure 112019010592360-pat00022
Is defined as

Figure 112019010592360-pat00023
Figure 112019010592360-pat00023

스테레오그래픽 투영(stereographic projection)의 역함수를 통해 두 점

Figure 112019010592360-pat00024
을 투영한 후, 두 점 사이의 거리를 초구(hypersphere) 메트릭 측면에서 측정한다.Two points through the inverse function of stereographic projection
Figure 112019010592360-pat00024
After projecting, the distance between the two points is measured in terms of a hypersphere metric.

Figure 112019010592360-pat00025
Figure 112019010592360-pat00025

여기서,

Figure 112019010592360-pat00026
Figure 112019010592360-pat00027
에 정의되는 거리함수이다. 기하학적으로
Figure 112019010592360-pat00028
는 측지 거리로 고려될 수 있다.here,
Figure 112019010592360-pat00026
Is
Figure 112019010592360-pat00027
It is a distance function defined in. Geometrically
Figure 112019010592360-pat00028
Can be considered as a geodetic distance.

도 2에서와 같이, 초구(hypersphere)상의 두 점 사이의 측지 거리(geodesic distance)는 유클리드 거리보다 훨씬 짧으며 초평면(즉, 노란색 구)에 바운드되어 있기 때문에 수학식 4에서의 목적 함수를 갖는 구형 GAN을 사용할 때 안정적인 학습이 가능하다.As shown in Fig. 2, since the geodesic distance between two points on the hypersphere is much shorter than the Euclidean distance and is bound to the hyperplane (i.e., yellow sphere), a sphere having an objective function in Equation 4 Stable learning is possible when using GAN.

(보조정리 1) 수학식 8의 거리함수는 미분가능하고 바운드되어 있다.(Body adjustment 1) The distance function of Equation 8 is differentiable and bound.

수학식 8의 거리함수는 음이 아닌 값, 대칭 값, 삼각형 부등식을 만족하므로 미분 가능하다.Since the distance function of Equation 8 satisfies a non-negative value, a symmetric value, and a triangular inequality, it can be differentiated.

초구(hypersphere)는 컴팩트 매니폴드이므로 두 점 사이의 거리는 바운드되어 있다.Since the hypersphere is a compact manifold, the distance between the two points is bound.

예를 들어, 두 점 0 = (0, ..., 0)과 q = (t, ..., t) 사이의 유클리드 거리가 발산한다.(

Figure 112020104974056-pat00029
)For example, the Euclidean distance between two points 0 = (0, ..., 0) and q = (t, ..., t) diverges.
Figure 112020104974056-pat00029
)

대조적으로, 수학식 8에서 초구(hypersphere)에 정의된 거리는 수렴한다.In contrast, the distance defined in the hypersphere in Equation 8 converges.

(

Figure 112019010592360-pat00030
Figure 112019010592360-pat00031
)(
Figure 112019010592360-pat00030
Figure 112019010592360-pat00031
)

구형 GAN의 기하학 - 인식 변환 함수는 판별기 출력의 경계 발산을 제한하여 안정적인 훈련 동력을 강화하고, 특징 공간의 차원을 보존하고 차별성을 유지한다.The geometry-recognition transformation function of the spherical GAN limits the divergence of the boundary of the discriminator output to enhance a stable training power, preserves the dimension of the feature space, and maintains differentiation.

구형 GAN에 관한 수학적 분석을 하면 다음과 같다.The mathematical analysis of the spherical GAN is as follows.

먼저, IPM에 연결에 관하여 설명하면 다음과 같다.First, the connection to the IPM will be described as follows.

수학식 4의 목적 함수를 최소화하는 것이 IPM을 최소화하는 것임을 증명한다.It is proved that minimizing the objective function of Equation 4 minimizes IPM.

이를 위하여 리만 매니폴드(Riemannian manifold)에 대한 기하학적 중심 모멘트를 정의한다.To this end, we define the geometric center moment about the Riemannian manifold.

M은 보렐 σ 대수학, Σ을 가진 작고, 연결되어 있고, 측지학적으로 완전한 리만 매니폴드라 한다.M is called a small, connected, geodetically complete Riemann manifold with Borel σ algebra, Σ.

Figure 112019010592360-pat00032
Figure 112019010592360-pat00033
는 모두 측정 가능한 공간 (M, Σ)에 정의된 확률 측정치이다.
Figure 112019010592360-pat00032
Wow
Figure 112019010592360-pat00033
Are all probability measures defined in the measurable space (M, Σ).

IPM은 다음과 같이 정의된다.IPM is defined as follows.

(정의 1)IPM은 두 확률 측정치

Figure 112019010592360-pat00034
Figure 112019010592360-pat00035
사이의 거리 측정값이다.(Definition 1) IPM is two measures of probability
Figure 112019010592360-pat00034
Wow
Figure 112019010592360-pat00035
Is a measure of the distance between.

Figure 112019010592360-pat00036
Figure 112019010592360-pat00036

여기서, F는 M에 대한 실제 값의 경계 측정 가능 함수의 클래스이다.Here, F is a class of a function capable of measuring the boundary of the actual value for M.

M에 대한 기하학적 모멘트를 정의하면 다음과 같다.The geometric moment about M is defined as follows.

(정의 2)주어진 점 p0에 관한 (M, Σ)상의

Figure 112019010592360-pat00037
의 r 번째 중심 모멘트는 다음과 같다.(Definition 2) on (M, Σ) for a given point p 0
Figure 112019010592360-pat00037
The r-th center moment of is

Figure 112019010592360-pat00038
Figure 112019010592360-pat00038

여기서,

Figure 112019010592360-pat00039
Figure 112019010592360-pat00040
이다.here,
Figure 112019010592360-pat00039
And
Figure 112019010592360-pat00040
to be.

Figure 112019010592360-pat00041
은 M에서의 리만 거리 함수(Riemannian distance function)이다.
Figure 112019010592360-pat00041
Is the Riemannian distance function in M.

구형 GAN에서

Figure 112019010592360-pat00042
Figure 112019010592360-pat00043
사이의 새로운 IPM을 다음과 같이 정의한다.In the old GAN
Figure 112019010592360-pat00042
Wow
Figure 112019010592360-pat00043
The new IPM between is defined as follows.

(정의 3)(Definition 3)

모멘트 차이를 기반으로 한 IPM은 다음과 같다.The IPM based on the moment difference is as follows.

Figure 112019010592360-pat00044
Figure 112019010592360-pat00044

여기서,

Figure 112019010592360-pat00045
은 주어진 점 p0에서 다른 점으로부터의 유한 거리 함수(bounded distance functions)의 클래스이다.here,
Figure 112019010592360-pat00045
Is a class of bounded distance functions from another point at a given point p 0 .

(정의 1)과 (정의 3)을 비교할 때, 이전의 IPM과 구형 GAN의 IPM 사이의 관계를 고려한다.When comparing (Definition 1) and (Definition 3), consider the relationship between the previous IPM and the IPM of the old GAN.

수학식 11의

Figure 112019010592360-pat00046
는 수학식 4의
Figure 112019010592360-pat00047
에 해당하지만, M은
Figure 112019010592360-pat00048
으로 대체될 수 있고,
Figure 112019010592360-pat00049
는 중심점(north pole) N으로 설정할 수 있다.Of Equation 11
Figure 112019010592360-pat00046
Is of Equation 4
Figure 112019010592360-pat00047
Corresponds to, but M is
Figure 112019010592360-pat00048
Can be replaced with
Figure 112019010592360-pat00049
Can be set as the north pole N.

그런 다음 수학식 4와 같은 방정식을 얻는다. 이는 수학식 4의 목적 함수를 최소화하는 것이 수학식 11에서 IPM을 최소화하는 것임을 의미한다.Then, an equation such as Equation 4 is obtained. This means that minimizing the objective function of Equation 4 is to minimize the IPM in Equation 11.

그러나 이전의 IPM과 구형 GAN의 IPM에는 몇 가지 차이가 있다.However, there are some differences between the previous IPM and the IPM of the old GAN.

본 발명에 따른 IPM의 함수 공간은

Figure 112019010592360-pat00050
을 중심으로 한 M상의 한정된 거리 함수의 집합이다.The function space of IPM according to the present invention is
Figure 112019010592360-pat00050
It is a set of finite distance functions of the M phase centered on.

따라서, 구형 GAN은 거리 함수를 매개 변수화하면 다음과 같다.Therefore, the spherical GAN is as follows when the distance function is parameterized.

Figure 112019010592360-pat00051
Figure 112019010592360-pat00051

여기서, {xi}는 이미지 집합이다. 대조적으로, WGAN의 IPM의 함수 공간은 1-Lipschitz 판별자의 집합이다.Here, {xi} is an image set. In contrast, the function space of WGAN's IPM is a set of 1-Lipschitz discriminants.

따라서 판별자를 매개 변수화하면 다음과 같다.Therefore, if the discriminator is parameterized, it is as follows.

Figure 112019010592360-pat00052
Figure 112019010592360-pat00052

여기서,

Figure 112019010592360-pat00053
이다.here,
Figure 112019010592360-pat00053
to be.

그리고 웨서스테인(Wesserstein) 거리 링크에 관하여 설명하면 다음과 같다.And the Westerstein distance link is as follows.

Figure 112019010592360-pat00054
은 수학식 11에서 정의된 구형 GAN의 IPM이며, 여기서
Figure 112019010592360-pat00055
이다.
Figure 112019010592360-pat00054
Is the IPM of the spherical GAN defined in Equation 11, where
Figure 112019010592360-pat00055
to be.

구형 GAN의 생성기는

Figure 112019010592360-pat00056
를 감소시키는 것을 목적로 하는데, 이는
Figure 112019010592360-pat00057
에 정의된 두 가지 확률 측정
Figure 112019010592360-pat00058
Figure 112019010592360-pat00059
사이의 고차 중심 모멘트를 매칭시키는 것과 상응한다.The generator of the old GAN is
Figure 112019010592360-pat00056
Is aimed at reducing
Figure 112019010592360-pat00057
The two probability measures defined in
Figure 112019010592360-pat00058
Wow
Figure 112019010592360-pat00059
Corresponds to matching high-order central moments between.

(명제 1)

Figure 112019010592360-pat00060
가 약하게
Figure 112019010592360-pat00061
에 수렴한다.(Proposition 1)
Figure 112019010592360-pat00060
Weakly
Figure 112019010592360-pat00061
Converge to

Figure 112019010592360-pat00062
Figure 112019010592360-pat00062

Figure 112019010592360-pat00063
Figure 112019010592360-pat00064
에 정의된 확률 측정의 r-웨서스테인 거리라 한다.
Figure 112019010592360-pat00063
To
Figure 112019010592360-pat00064
It is called the r-westerstein distance of the probability measure defined in.

그런 다음

Figure 112019010592360-pat00065
을 최소화하는 것은 모든 r에 대해 r-웨서스테인 거리의 합계를 최소화하는 것과 같다.after that
Figure 112019010592360-pat00065
Minimizing r is equivalent to minimizing the sum of the r-westerstein distances for all r.

(명제 2)

Figure 112019010592360-pat00066
이 0으로 수렴한다.(Proposition 2)
Figure 112019010592360-pat00066
Converges to zero.

Figure 112019010592360-pat00067
Figure 112019010592360-pat00067

웨서스테인 거리를 기반으로 하는 기존의 GAN에서 목적 함수는 Kantorovich-Rubinstein 이중성 정리에 의해 이중 형태로 설계된다. 이중 형태에서는 GAN의 효율적인 학습을 위해 1-Wesserstein 거리로만 구현할 수 있다.In the conventional GAN based on the Westerstein distance, the objective function is designed in a double form by the Kantorovich-Rubinstein duality theorem. In the dual form, it can be implemented only with 1-Wesserstein distance for efficient learning of GAN.

기존의 GAN과 달리 구형 GAN 영역은 보다 일반적인 r-Wesserstein 거리를 사용할 수 있으므로 함수 공간이 훨씬 넓다.Unlike the conventional GAN, the spherical GAN area has a much wider function space because a more general r-Wesserstein distance can be used.

그리고 그레디언트 분석에 관하여 설명하면 다음과 같다.And the gradient analysis is as follows.

다른 IPM보다

Figure 112019010592360-pat00068
을 사용하면, 구형 GAN은
Figure 112019010592360-pat00069
의 다른 모멘트를 선택하여 손실 함수(loss functions)의 그레디언트를 계산할 수 있다.Than other IPMs
Figure 112019010592360-pat00068
Using, the old GAN is
Figure 112019010592360-pat00069
You can calculate the gradient of the loss functions by selecting a different moment of.

서로 다른 모멘트를 선택하면 그레디언트가 서로 다른 학습 행동으로 이어진다. 따라서, 구형 GAN을 사용하여 어떠한 모멘트에 관해서도 안정적인 학습이 가능하다.If you choose different moments, the gradient leads to different learning behaviors. Therefore, it is possible to learn stable about any moment by using the old GAN.

(보조 정리 2)

Figure 112019010592360-pat00070
(Supplementary Theorem 2)
Figure 112019010592360-pat00070

(보조 정리 2)는 초구(hypersphere)를 사용하는 것이 GAN을 안정적으로 학습하기 위한 합리적인 선택이라는 것을 의미한다.(Supplementary Theorem 2) means that using a hypersphere is a reasonable option for stably learning GAN.

이상의 설명에서 WGAN의 W는 'Wasserstein'으로 웨서스테인 거리(Wasserstein distance)를 사용하여 실제 이미지의 확률측도와 생성된 이미지의 확률측도의 거리를 비교하는 메트릭(metric)으로 사용된다.In the above description, W of WGAN is'Wasserstein', and is used as a metric for comparing the distance of the probability measure of the actual image and the probability measure of the generated image by using the Wasserstein distance.

본 발명에서는 이와 같은 기술들이 가지고 있는 문제점을 해결하기 위해서 조금 더 큰 범위의 메트릭을 정의한다.In the present invention, a slightly larger range of metrics is defined in order to solve the problems of these technologies.

본 발명에서 사용되는 메트릭은 IPM(Integral Probability Metrics)으로 상기한 수학식 9에서와 같은 형식으로 정의된다.The metric used in the present invention is IPM (Integral Probability Metrics) and is defined in the same format as in Equation 9 above.

수학식 9에서 f가 1-Lipschitz function이라고 보면 Wasserstein distance는 IPM의 한 종류라고 생각될 수 있다.If f is a 1-Lipschitz function in Equation 9, the Wasserstein distance can be considered a type of IPM.

본 발명에서는 f가 수학식 12에서와 같이 정의되는 거리함수(distance function)이다. 이때 거리함수는 구 위의 두 점사이의 거리함수이다.In the present invention, f is a distance function defined as in Equation 12. At this time, the distance function is the distance function between two points on the sphere.

이는 더 이상 1-Lipschitz condition을 만족하지 않아도 되는 것을 뜻하는 것으로, 그레디언트 제약(gradient penalty)를 사용하지 않아도 된다는 의미이다.This means that the 1-Lipschitz condition no longer needs to be satisfied, meaning that the gradient penalty does not need to be used.

수학식 12를 보면 이전의 WGAN 기반의 기술들에서는 판별기(discriminator)를 훈련을 할 때, 수학식 5의 C(x)의 term이 추가가 되어 capacity가 제한이 되는것에 반해 본 발명에서는 수학식 6에서와 같이 추가적인 term이 아무것도 없기에 기존의 방식보다 discriminator network에 constraint가 적고 이에 따라서 같은 신경망 모양이라도 성능이 더 우수하다.Looking at Equation 12, in the previous WGAN-based techniques, when training a discriminator, the term of C(x) in Equation 5 is added to limit capacity, whereas in the present invention, Equation As in 6, since there is no additional term, there are fewer constraints on the discriminator network than the existing method, and accordingly, the performance is better even with the same neural network shape.

본 발명에 따른 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 방법을 구체적으로 설명하면 다음과 같다.A data processing method using a hostile generation network on a sphere through geometric moment matching according to the present invention will be described in detail as follows.

도 3은 본 발명에 따른 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 방법을 나타낸 플로우 차트이다.3 is a flow chart showing a data processing method using a hostile generation network on a sphere through geometric moment matching according to the present invention.

먼저, 생성기에서 랜덤한 noise z로부터 값을 받아들여 실제와 비슷한 이미지(가짜 데이터)를 생성한다.(S301)First, the generator receives a value from the random noise z and generates an image (fake data) similar to the actual one. (S301)

이어, 생성기에서 생성된 가짜 데이터를 판별기로 전달한다.(S302)Then, the fake data generated by the generator is transmitted to the discriminator (S302).

그리고 판별기가 실제 데이터 및 가짜 데이터를 받아 훈련하고 n 차원 유클리드(Euclidean) 특징 공간에 매핑한다.(S303)Then, the discriminator receives real data and fake data, trains it, and maps it to an n-dimensional Euclidean feature space (S303).

이어, 각각 가짜 샘플과 실제 샘플의 특징점이 기하학적 변환에 의해 n 차원 초구(hypersphere)로 다시 매핑한다.(S304)Subsequently, the feature points of the fake sample and the real sample are mapped back to an n-dimensional hypersphere by geometric transformation (S304).

그리고 매핑된 점을 사용하여 구형 GAN은 초구(hypersphere)의 중심점(north pole)을 중심으로 하는 기하학적 모멘트를 계산한다.(S305)And using the mapped point, the spherical GAN calculates the geometric moment centered on the north pole of the hypersphere (S305).

이어, 구형 GAN의 판별기는 실제 및 가짜 샘플 간의 확률 측정의 모멘트 차이를 최대화하려고 시도하고, 생성기는 모멘트 차이를 최소화하여 판별자를 간섭하려고 시도하여 훈련한다.(S306)Subsequently, the discriminator of the spherical GAN attempts to maximize the moment difference of the probability measurement between the real and the fake sample, and the generator trains by attempting to interfere with the discriminator by minimizing the moment difference (S306).

이상에서 설명한 본 발명에 따른 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치 및 방법의 성능 평가 결과는 다음과 같다.Performance evaluation results of the data processing apparatus and method using the hostile generation network on a sphere through geometric moment matching according to the present invention described above are as follows.

도 4는 IS(Inception scores)를 이용한 초구(hypersphere)의 다른 차원 및 모멘트 매칭모드에 따른 평가 결과 그래프이다.4 is a graph of evaluation results according to different dimensions and moment matching modes of hypersphere using IS (Inception scores).

빨간색, 노란색 및 파란색 막대는 각각

Figure 112019010592360-pat00071
,
Figure 112019010592360-pat00072
,
Figure 112019010592360-pat00073
모멘트 매칭모드를 나타낸 것이고, 가로축은 초구(hypersphere)
Figure 112019010592360-pat00074
의 차원을 나타낸 것으로,n = 16, 64, 256, 1024이다.The red, yellow and blue bars are respectively
Figure 112019010592360-pat00071
,
Figure 112019010592360-pat00072
,
Figure 112019010592360-pat00073
Moment matching mode is shown, and the horizontal axis is hypersphere.
Figure 112019010592360-pat00074
It represents the dimension of n = 16, 64, 256, 1024.

도 5는 Sphere GAN 및 WGAN-GP 판별기 네트워크의 그레디언트 특성 그래프이다.5 is a graph of gradient characteristics of the Sphere GAN and WGAN-GP discriminator networks.

아래의 표 3은 CIFAR-10의 감독되지 않은 이미지 생성 결과를 나타낸 것으로, IS(Inception Scores)는 높으면 높을수록, FID(Frechet Inception Distance)는 낮을수록 우수한 결과로 해석된다.Table 3 below shows the results of unsupervised image generation of CIFAR-10, and the higher the IS (Inception Scores) is, the lower the FID (Frechet Inception Distance) is, the better results are interpreted.

Figure 112019010592360-pat00075
Figure 112019010592360-pat00075

CIFAR-10에서의 정량적 결과를 나타낸 표 3에서와 같이 구형 GAN-ResNet은 최신의 기록을 보관한 것으로, IS와 FID 모두 큰 차이가 있음을 알 수 있고, 구형 GAN-Conv이 WGAN-GP 및 MMD GAN보다 아주 우수한 결과를 보여주고 있다.As shown in Table 3, which shows the quantitative results of CIFAR-10, the old GAN-ResNet has the latest records, and it can be seen that there is a big difference between both IS and FID, and the old GAN-Conv is WGAN-GP and MMD. It shows much better results than GAN.

아래의 표 4는 STL-10에서 감독되지 않은 이미지 생성 결과를 나타낸 것이다.Table 4 below shows the results of unsupervised image generation in STL-10.

Figure 112019010592360-pat00076
Figure 112019010592360-pat00076

STL-10 실험에서 원래의 네트워크에 비해 네트워크 매개 변수의 수의 약 절반을 사용하였고, 적은 수의 네트워크 매개 변수에도 불구하고 구형 GAN-ResNet는 표 4에서와 같이, SN-GAN 및 기타 IPM 기반 GAN보다 탁월한 성능을 보여주고 있다.In the STL-10 experiment, about half of the number of network parameters compared to the original network was used, and despite the small number of network parameters, the old GAN-ResNet was shown in Table 4, SN-GAN and other IPM-based GANs. It shows better performance.

아래의 표 5는 LSUN bedroom에서 감독되지 않은 이미지 생성 결과를 나타낸 것이다.Table 5 below shows the results of unsupervised image creation in LSUN bedroom.

Figure 112019010592360-pat00077
Figure 112019010592360-pat00077

LSUN bedroom 실험에서는 IS는 의미가 없으므로 FID만 나타낸 것으로, 구형 GAN-ResNet이 최첨단 GAN보다 성능이 우수함을 보여주고 있다.In the LSUN bedroom experiment, IS is meaningless, so only FID is shown, showing that the old GAN-ResNet has better performance than the state-of-the-art GAN.

그리고 도 6은 서로 다른 GAN 변형에 대해 100 회 반복하는 평균 계산 시간 비교 그래프이다.And Figure 6 is a graph comparing the average calculation time repeated 100 times for different GAN variants.

노란색과 빨간색 막대는 생성기와 판별기의 업데이트 비율이 각각 1 : 1과 1 : 5 인 경우의 평균 계산 시간을 나타낸 것이다.The yellow and red bars represent the average calculation time when the generator and discriminator update rates are 1: 1 and 1: 5, respectively.

도 7a와 도 7b는 LSUN- bedroom 데이터 세트의 구형 GAN의 정성적 결과 및 STL-10 데이터 세트에 대한 구형 GAN의 정성적 결과 구성도이다.7A and 7B are diagrams showing qualitative results of the old GAN of the LSUN-bedroom data set and the qualitative results of the old GAN of the STL-10 data set.

이와 같은 평가 결과에서 알 수 있듯이, 본 발명에서 제시한 네트워크는 머신러닝 및 컴퓨터비전의 하위분야인 생성 모델의 일환인 적대적 생성망으로, 종래 기술들이 갖는 문제점을 수학적 모델링을 통하여 해결하여 빠른 훈련 속도와 확장성을 갖는다.As can be seen from such evaluation results, the network proposed in the present invention is a hostile generation network that is a part of the generation model, which is a subfield of machine learning and computer vision, and solves the problems of the prior art through mathematical modeling and provides fast training speed. And extensibility.

이에 따라 산업 현장에서 본 발명에서 제시한 기술을 통하여 현장에 알맞은 데이터를 생성할 수 있고, 빠른 실행속도를 갖는 것에 의해 특히 3D, 음성 처리 등 영상 데이터 외의 다른 목적으로 사용될 때에도 단순한 구조에 의해 우수한 확장성을 갖는다.Accordingly, it is possible to generate data suitable for the field through the technology presented in the present invention in the industrial field, and by having a fast execution speed, especially when used for purposes other than image data such as 3D and audio processing, excellent expansion by a simple structure Have a surname

이상에서 설명한 본 발명에 따른 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치 및 방법은 머신러닝 및 컴퓨터비전의 하위분야인 생성 모델의 하나인 적대적 생성망(generative adversarial network)에 관한 것으로, 실제 데이터(real data)와 가짜 데이터(fake data)를 구분하는 GAN의 판별기(discriminator)는 최종 데이터를 구(sphere)에 맵핑하는 구성 및, 최종 데이터를 구(sphere)에 맵핑하여 거리를 계산하는 구성을 포함하고 거리(distance)의 바운드(bound)가 존재하는 것을 이용하여 안정적인 GAN 학습을 할 수 있도록 하는 것이다.The data processing apparatus and method using the hostile generation network on the sphere through geometric moment matching according to the present invention described above relates to a generative adversarial network, which is one of the generation models that are subfields of machine learning and computer vision. The GAN's discriminator, which distinguishes between real data and fake data, maps the final data to a sphere and maps the final data to a sphere. Including the configuration to calculate the distance (distance) is to enable stable GAN learning by using the existence of a bound.

이상에서의 설명에서와 같이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 본 발명이 구현되어 있음을 이해할 수 있을 것이다.As described above, it will be understood that the present invention is implemented in a modified form without departing from the essential characteristics of the present invention.

그러므로 명시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 하고, 본 발명의 범위는 전술한 설명이 아니라 특허청구 범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.Therefore, the specified embodiments should be considered from a descriptive point of view rather than a limiting point of view, and the scope of the present invention is shown in the claims rather than the above description, and all differences within the scope equivalent thereto are included in the present invention. It will have to be interpreted.

100. 생성기
200. 판별기
300. 기하학적 모멘트 매칭부
100. Generator
200. Discriminator
300. Geometric Moment Matching Unit

Claims (15)

랜덤한 노이즈 z로부터 값을 받아들여 가짜 데이터를 생성하고 생성된 가짜 데이터를 판별기로 전달하는 생성기;
실제 데이터(x) 및 가짜 데이터를 받아 훈련하는 판별기;
상기 판별기로부터 최종 데이터를 받아 n 차원 유클리드(Euclidean) 특징 공간에 매핑하고, 각각 가짜 데이터와 실제 데이터의 특징점을 기하학적 변환에 의해 n 차원 초구(hypersphere)로 다시 매핑하고, 매핑된 점을 사용하여 구형 GAN으로 초구(hypersphere)의 중심점(north pole)을 중심으로 하는 기하학적 모멘트를 계산하는 기하학적 모멘트 매칭부;를 포함하고,
상기 판별기는 실제 및 가짜 데이터 간의 확률 측정의 모멘트 차이를 최대화하려고 시도하고, 생성기는 모멘트 차이를 최소화하여 판별기를 간섭하려고 시도하여 훈련하는 것을 특징으로 하는 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치.
A generator that receives a value from the random noise z, generates fake data, and transmits the generated fake data to a discriminator;
A discriminator that receives and trains real data (x) and fake data;
Receive the final data from the discriminator and map it to an n-dimensional Euclidean feature space, remap the feature points of fake data and real data to n-dimensional hyperspheres by geometric transformation, and use the mapped points. Including; a geometric moment matching unit for calculating a geometric moment centered on a central point (north pole) of a hypersphere with a spherical GAN,
The discriminator attempts to maximize the moment difference in probability measurement between real and fake data, and the generator tries to interfere with the discriminator by minimizing the moment difference and trains a hostile generating network on a sphere through geometric moment matching. Data processing device to be used.
제 1 항에 있어서, 구형 GAN은, 판별 네트워크의 특징공간을 구라고 가정하여 그 위에서 다차 모멘트를 최소화시켜 수학적으로 정의된 측도간의 메트릭을 새롭게 정의하여 훈련되는 네트워크의 거동을 예측할 수 있도록 하는 것을 특징으로 하는 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치.The method of claim 1, wherein the spherical GAN assumes that the feature space of the discriminant network is a sphere and minimizes the multi-order moment thereon to newly define a metric between mathematically defined measures to predict the behavior of the network to be trained. A data processing device that uses a hostile generation network on a sphere through geometric moment matching. 제 1 항에 있어서, 상기 기하학적 모멘트 매칭부는,
1 차원 특징 공간에서의 첫번째 모멘트가
Figure 112019010592360-pat00078
으로 정의되고,
여기서, G와 D는 각각 생성자와 판별자를 나타내며 P와 N은 실제 데이터와 잠재 코드 분포를 각각 나타내는 것이고,
판별기 (D)는 데이터 (x)를 실수 (R)로 맵핑하고,
Figure 112019010592360-pat00079
으로 정의되고,
여기서, D는 1-Lipschitz 조건 D ∈ Lip1을 만족해야하며, X ⊂ Rn은 n 차원 유클리드 이미지 공간인 것을 기반으로 구형 GAN은 3차원보다 큰 차원으로 확장한 초구(hypersphere)에 정의된 고차원 및 다중 모멘트와 매칭되도록 하는 것을 특징으로 하는 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치.
The method of claim 1, wherein the geometric moment matching unit,
The first moment in the one-dimensional feature space is
Figure 112019010592360-pat00078
Is defined as,
Here, G and D represent the generator and discriminator, respectively, and P and N represent the actual data and potential code distribution, respectively,
Discriminator (D) maps data (x) to real number (R),
Figure 112019010592360-pat00079
Is defined as,
Here, D must satisfy the 1-Lipschitz condition D ∈ Lip1, and X ⊂ Rn is an n-dimensional Euclidean image space.Based on the fact that the spherical GAN is a high-dimensional and multi-dimensional hypersphere that has been expanded to a dimension larger than 3D A data processing apparatus using a hostile generation network on a sphere through geometrical moment matching, characterized in that matching the moment.
제 3 항에 있어서, 판별기의 출력은,
Figure 112019010592360-pat00080
으로 정의되고,
여기서 x는 실제 이미지 데이터, z는 랜덤한 노이즈인 것을 특징으로 하는 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치.
The method of claim 3, wherein the output of the discriminator is
Figure 112019010592360-pat00080
Is defined as,
Here, x is the actual image data, z is a data processing device using a hostile generation network on a sphere through geometric moment matching, characterized in that the random noise.
제 4 항에 있어서, 구형 GAN(sphere GAN)의 목적함수는,
Figure 112019010592360-pat00081
으로 정의되고,
r = 1, ..., R 인 경우 함수
Figure 112019010592360-pat00082
는 각 샘플과 초구(hypersphere) N의 중심점(north pole) 사이의 r 번째 모멘트 거리를 측정하는 것을 나타내고, 아래 첨자 s는
Figure 112019010592360-pat00083
Figure 112019010592360-pat00084
상에서 정의되어 있음을 나타내는 것을 특징으로 하는 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치.
The method of claim 4, wherein the objective function of a sphere GAN is
Figure 112019010592360-pat00081
Is defined as,
Function for r = 1, ..., R
Figure 112019010592360-pat00082
Represents the measurement of the r-th moment distance between each sample and the north pole of the hypersphere N, and the subscript s is
Figure 112019010592360-pat00083
end
Figure 112019010592360-pat00084
A data processing apparatus using a hostile generation network on a sphere through geometric moment matching, which indicates that the phase is defined.
제 5 항에 있어서, 구형 GAN은 판별기가 원하는 함수 공간에 위치하도록하는 추가적인 제약 조건을 필요로하지 않도록 하고,
기하학적 변환을 사용하여 구형 GAN은 거리 함수가 원하는 함수 공간에 있음을 보장하기 위하여,
판별기(discriminator)의 새로운 목적 함수를
Figure 112019010592360-pat00085
으로 정의하는 것을 특징으로 하는 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치.
The method of claim 5, wherein the spherical GAN does not require additional constraints that allow the discriminator to be located in the desired function space,
Using geometric transformation, the spherical GAN is to ensure that the distance function is in the desired function space,
The new objective function of the discriminator
Figure 112019010592360-pat00085
A data processing apparatus using a hostile generation network on a sphere through geometric moment matching, characterized in that it is defined as.
제 6 항에 있어서, 구형 GAN은 초구(hypersphere)
Figure 112019010592360-pat00086
에서 정의된 특징 공간을 통해 여러 모멘트를 매칭하고,
구형 GAN은 임의의 리만 매니폴드 M 대신에 초구(hypersphere)를 사용하여,
초구(hypersphere)의 거리 함수
Figure 112019010592360-pat00087
는 바운드를 형성하는 것과,
그레디언트 놈(gradient norm)은 거리 함수로 작동하는 것과,
초구(hypersphere)의 리만 구조(Riemannian structure)를 통하여 GAN 객체를 정의하는 것을 이용하는 것을 특징으로 하는 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치.
The method of claim 6, wherein the spherical GAN is hypersphere
Figure 112019010592360-pat00086
Matching several moments through the feature space defined in
The old GAN uses a hypersphere instead of any Riemann manifold M,
Hypersphere distance function
Figure 112019010592360-pat00087
Is to form a bound,
The gradient norm works as a function of distance,
A data processing apparatus using a hostile generation network on a sphere through geometric moment matching, characterized in that it uses defining a GAN object through a Riemannian structure of a hypersphere.
제 6 항에 있어서, 구형 GAN은 유클리드 공간
Figure 112019010592360-pat00088
을 초구(hypersphere)
Figure 112019010592360-pat00089
으로 변환하는 기하학적 변환 함수를 사용하고,
변환 함수는
Figure 112019010592360-pat00090
에서
Figure 112019010592360-pat00091
에 이르는 미분동형사상(diffeomorphism)에 의해 설계되어 미분 가능하고 특징 공간의 모든 점에서 차원을 보존할 수 있도록 하는 것을 특징으로 하는 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치.
The method of claim 6, wherein the spherical GAN is a Euclidean space
Figure 112019010592360-pat00088
Hypersphere
Figure 112019010592360-pat00089
Use a geometric transformation function that converts to,
The conversion function is
Figure 112019010592360-pat00090
in
Figure 112019010592360-pat00091
A data processing device that uses a hostile generation network on a sphere through geometric moment matching, characterized in that it is designed according to diffeomorphism to be differentiated and preserves dimensions at all points in the feature space.
제 8 항에 있어서, 기하학적 변환 함수로 스테레오그래픽 투영(stereographic projection)을 사용하고,
스테레오그래픽 투영(stereographic projection)의 역함수는 유클리드 공간
Figure 112019010592360-pat00092
을 초구(hypersphere)
Figure 112019010592360-pat00093
으로의 미분동형사상(diffeomorphism)이고,
Figure 112019010592360-pat00094
의 좌표계를 p = (p1, ..., pn)이라고 하고, 초구(hypersphere)의 중심점(north pole)을 N = (0, ..., 1)이라고 하면,
스테레오그래픽 투영(stereographic projection)의 역함수
Figure 112019010592360-pat00095
은,
Figure 112019010592360-pat00096
으로 정의되는 것을 특징으로 하는 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치.
The method of claim 8, using a stereographic projection as a geometric transformation function,
The inverse function of stereographic projection is Euclidean space
Figure 112019010592360-pat00092
Hypersphere
Figure 112019010592360-pat00093
Is the differential weighted morphism of
Figure 112019010592360-pat00094
If the coordinate system of is p = (p1, ..., pn) and the north pole of the hypersphere is N = (0, ..., 1),
Inverse function of stereographic projection
Figure 112019010592360-pat00095
silver,
Figure 112019010592360-pat00096
Data processing apparatus using a hostile generation network on a sphere through geometric moment matching, characterized in that defined as.
제 9 항에 있어서, 스테레오그래픽 투영(stereographic projection)의 역함수를 통해 두 점
Figure 112019010592360-pat00097
을 투영한 후, 두 점 사이의 거리를 초구(hypersphere) 메트릭 측면에서 측정하면,
Figure 112019010592360-pat00098
으로 정의되고,
여기서,
Figure 112019010592360-pat00099
Figure 112019010592360-pat00100
에 정의되는 거리함수이다. 기하학적으로
Figure 112019010592360-pat00101
는 측지 거리로 고려되는 것을 특징으로 하는 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치.
The method of claim 9, wherein the two points through the inverse function of stereographic projection (stereographic projection)
Figure 112019010592360-pat00097
After projecting, the distance between the two points is measured in terms of the hypersphere metric,
Figure 112019010592360-pat00098
Is defined as,
here,
Figure 112019010592360-pat00099
Is
Figure 112019010592360-pat00100
It is a distance function defined in. Geometrically
Figure 112019010592360-pat00101
A data processing apparatus using a hostile generation network on a sphere through geometric moment matching, characterized in that is considered as a geodetic distance.
제 10 항에 있어서, 구형 GAN에서 사용되는 메트릭 IPM(Integral Probability Metrics)을 최소화하기 위하여,
리만 매니폴드(Riemannian manifold)에 대한 기하학적 중심 모멘트를 정의하고, M은 보렐 σ 대수학, Σ을 가진 작고, 연결되어 있고, 측지 학적으로 완전한 리만 매니폴드라 하면,
Figure 112019010592360-pat00102
Figure 112019010592360-pat00103
는 모두 측정 가능한 공간 (M, Σ)에 정의된 확률 측정치이고, 두 확률 측정치
Figure 112019010592360-pat00104
Figure 112019010592360-pat00105
사이의 거리 측정값인 IPM은,
Figure 112019010592360-pat00106
으로 정의되고,
F는 M에 대한 실제 값의 경계 측정 가능 함수의 클래스인 것을 특징으로 하는 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치.
The method of claim 10, wherein in order to minimize the metric IPM (Integral Probability Metrics) used in the old GAN,
Define the geometric centroid moment about the Riemannian manifold, where M is the Borel σ algebra, a small, connected, geodetically complete Riemann manifold with Σ,
Figure 112019010592360-pat00102
Wow
Figure 112019010592360-pat00103
Are all probabilistic measures defined in the measurable space (M, Σ), and both probabilistic measures
Figure 112019010592360-pat00104
Wow
Figure 112019010592360-pat00105
IPM, a measure of the distance between,
Figure 112019010592360-pat00106
Is defined as,
F is a data processing device using a hostile generation network on a sphere through geometric moment matching, characterized in that F is a class of a function capable of measuring the boundary of an actual value with respect to M.
제 11 항에 있어서, M에 대한 기하학적 모멘트를 정의하면,
주어진 점 p0에 관한 (M, Σ)상의
Figure 112020104974056-pat00107
의 r 번째 중심 모멘트는,
Figure 112020104974056-pat00108
으로 정의되고,
여기서,
Figure 112020104974056-pat00109
Figure 112020104974056-pat00110
이고,
Figure 112020104974056-pat00111
은 M에서의 리만 거리 함수(Riemannian distance function)인 것을 특징으로 하는 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치.
The method of claim 11, defining the geometric moment about M,
On (M, Σ) for a given point p 0
Figure 112020104974056-pat00107
The r th central moment of is,
Figure 112020104974056-pat00108
Is defined as,
here,
Figure 112020104974056-pat00109
And
Figure 112020104974056-pat00110
ego,
Figure 112020104974056-pat00111
Is a Riemannian distance function in M. A data processing device using a hostile generation network on a sphere through geometric moment matching.
제 12 항에 있어서, 구형 GAN에서
Figure 112019010592360-pat00112
Figure 112019010592360-pat00113
사이의 새로운 IPM을 정의하면,
모멘트 차이를 기반으로 한 IPM은,
Figure 112019010592360-pat00114
으로 정의되고,
여기서,
Figure 112019010592360-pat00115
은 주어진 점 p0에서 다른 점으로부터의 유한 거리 함수(bounded distance functions)의 클래스인 것을 특징으로 하는 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치.
The method of claim 12, wherein in the old GAN
Figure 112019010592360-pat00112
Wow
Figure 112019010592360-pat00113
If you define a new IPM between,
IPM based on the moment difference,
Figure 112019010592360-pat00114
Is defined as,
here,
Figure 112019010592360-pat00115
Is a class of bounded distance functions from another point at a given point p 0. A data processing apparatus using a hostile generation network on a sphere through geometric moment matching.
제 13 항에 있어서, IPM의 함수 공간은
Figure 112019010592360-pat00116
을 중심으로 한 M상의 한정된 거리 함수의 집합이고, 구형 GAN은 거리 함수를 매개 변수화하면,
Figure 112019010592360-pat00117
이고,
여기서, {xi}는 이미지 집합이고,
판별자를 매개 변수화하면,
Figure 112019010592360-pat00118
이고,
여기서,
Figure 112019010592360-pat00119
인 것을 특징으로 하는 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치.
The method of claim 13, wherein the function space of IPM is
Figure 112019010592360-pat00116
Is a set of finite distance functions of the M phase centered on, and the spherical GAN parameterizes the distance function,
Figure 112019010592360-pat00117
ego,
Where {xi} is an image set,
Parameterizing the discriminator,
Figure 112019010592360-pat00118
ego,
here,
Figure 112019010592360-pat00119
Data processing apparatus using a hostile generation network on a sphere through geometric moment matching, characterized in that.
랜덤한 노이즈 z로부터 값을 받아들여 가짜 데이터를 생성하고 생성된 가짜 데이터를 판별기로 전달하는 생성기;실제 데이터(x) 및 가짜 데이터를 받아 훈련하는 판별기;상기 판별기로부터 최종 데이터를 받아 n 차원 유클리드(Euclidean) 특징 공간에 매핑하고, 각각 가짜 데이터와 실제 데이터의 특징점을 기하학적 변환에 의해 n 차원 초구(hypersphere)로 다시 매핑하고, 매핑된 점을 사용하여 구형 GAN으로 초구(hypersphere)의 중심점(north pole)을 중심으로 하는 기하학적 모멘트를 계산하는 기하학적 모멘트 매칭부;를 포함하는 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 장치의 데이터 처리 방법에 있어서,
판별 네트워크의 특징공간을 구라고 가정하여 그 위에서 다차 모멘트를 최소화시켜 수학적으로 정의된 측도간의 메트릭을 새롭게 정의하여 훈련되는 네트워크의 거동을 예측할 수 있도록 하는 구형 GAN을 이용하여,
생성기에서 랜덤한 노이즈 z로부터 값을 받아들여 실제와 유사한 가짜 데이터를 생성하는 단계;
생성기에서 생성된 가짜 데이터를 판별기로 전달하는 단계;
판별기가 실제 데이터 및 가짜 데이터를 받아 훈련하고 기하학적 모멘트 매칭부에서 n 차원 유클리드(Euclidean) 특징 공간에 매핑하는 단계;
기하학적 모멘트 매칭부에서 각각 가짜 데이터와 실제 데이터의 특징점을 기하학적 변환에 의해 n 차원 초구(hypersphere)로 다시 매핑하는 단계;
기하학적 모멘트 매칭부에서 매핑된 점을 사용하여 구형 GAN은 초구(hypersphere)의 중심점(north pole)을 중심으로 하는 기하학적 모멘트를 계산하는 단계;
구형 GAN의 판별기는 실제 및 가짜 샘플 간의 확률 측정의 모멘트 차이를 최대화하려고 시도하고, 생성기는 모멘트 차이를 최소화하여 판별자를 간섭하려고 시도하여 훈련하는 단계;를 포함하는 것을 특징으로 하는 기하학적 모멘트 매칭을 통한 구 위에서의 적대적 생성망을 이용하는 데이터 처리 방법.
Generator that receives a value from random noise z, generates fake data, and transfers the generated fake data to a discriminator; Discriminator that receives and trains real data (x) and fake data; n-dimensional by receiving final data from the discriminator Mapping to the Euclidean feature space, respectively, the feature points of the fake data and the real data are re-mapped to an n-dimensional hypersphere by geometric transformation, and the center point of the hypersphere with a spherical GAN using the mapped points ( In the data processing method of a data processing device using a hostile generation network on a sphere through geometric moment matching, including; a geometric moment matching unit that calculates a geometric moment centered on a north pole),
By assuming that the feature space of the discriminant network is a sphere, using a spherical GAN that minimizes the multi-order moment on it and newly defines the metric between mathematically defined measures to predict the behavior of the network being trained,
Generating fake data similar to real by receiving a value from the random noise z in a generator;
Passing the fake data generated by the generator to the discriminator;
The discriminator receives real data and fake data, trains them, and maps them to an n-dimensional Euclidean feature space in a geometric moment matching unit;
Re-mapping the feature points of the fake data and the real data into an n-dimensional hypersphere by geometric transformation in the geometric moment matching unit;
Calculating a geometric moment about a north pole of a hypersphere in the spherical GAN by using the mapped point in the geometric moment matching unit;
The discriminator of the spherical GAN attempts to maximize the moment difference in the probability measurement between the real and the fake sample, and the generator attempts to interfere with the discriminator by minimizing the moment difference and trains it; through geometric moment matching, comprising: Data processing method using hostile generation networks on the sphere.
KR1020190011377A 2019-01-29 2019-01-29 System and Method for Data Processing using Sphere Generative Adversarial Network Based on Geometric Moment Matching KR102188732B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190011377A KR102188732B1 (en) 2019-01-29 2019-01-29 System and Method for Data Processing using Sphere Generative Adversarial Network Based on Geometric Moment Matching

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190011377A KR102188732B1 (en) 2019-01-29 2019-01-29 System and Method for Data Processing using Sphere Generative Adversarial Network Based on Geometric Moment Matching

Publications (2)

Publication Number Publication Date
KR20200093975A KR20200093975A (en) 2020-08-06
KR102188732B1 true KR102188732B1 (en) 2020-12-08

Family

ID=72040095

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190011377A KR102188732B1 (en) 2019-01-29 2019-01-29 System and Method for Data Processing using Sphere Generative Adversarial Network Based on Geometric Moment Matching

Country Status (1)

Country Link
KR (1) KR102188732B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230076424A (en) 2021-11-24 2023-05-31 재단법인대구경북과학기술원 Apparatus and method for modeling noise and apparatus for simulating driving environment using thereof

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112329833B (en) * 2020-10-28 2022-08-12 浙江大学 Image metric learning method based on spherical surface embedding
KR20220153209A (en) * 2021-05-11 2022-11-18 삼성전자주식회사 Method for processing image and electronic device supporting the same
CN117197589B (en) * 2023-11-03 2024-01-30 武汉大学 Target classification model countermeasure training method and system

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102403494B1 (en) 2017-04-27 2022-05-27 에스케이텔레콤 주식회사 Method for learning Cross-domain Relations based on Generative Adversarial Network
KR101843066B1 (en) 2017-08-23 2018-05-15 주식회사 뷰노 Method for classifying data via data augmentation of the data for machine-learning and apparatus using the same

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Sung Woo Park et al., Sphere Generative Adversarial Network Based on Geometric Moment Matching, 2019 IEEE/CVF CVPR, Jun. 2019

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230076424A (en) 2021-11-24 2023-05-31 재단법인대구경북과학기술원 Apparatus and method for modeling noise and apparatus for simulating driving environment using thereof

Also Published As

Publication number Publication date
KR20200093975A (en) 2020-08-06

Similar Documents

Publication Publication Date Title
KR102188732B1 (en) System and Method for Data Processing using Sphere Generative Adversarial Network Based on Geometric Moment Matching
Xie et al. Point clouds learning with attention-based graph convolution networks
US11443192B2 (en) Machine-learning for 3D modeled object inference
US10176404B2 (en) Recognition of a 3D modeled object from a 2D image
CN108960001B (en) Method and device for training image processing device for face recognition
US11562207B2 (en) Set of neural networks
JP4516957B2 (en) Method, system and data structure for searching for 3D objects
JP5131072B2 (en) 3D model search device, 3D model search method and program
JP7135659B2 (en) SHAPE COMPLEMENTATION DEVICE, SHAPE COMPLEMENTATION LEARNING DEVICE, METHOD, AND PROGRAM
CN111460193B (en) Three-dimensional model classification method based on multi-mode information fusion
JP7129529B2 (en) UV mapping to 3D objects using artificial intelligence
US20220189070A1 (en) Machine-learning for 3d object detection
Rios et al. On the efficiency of a point cloud autoencoder as a geometric representation for shape optimization
JP2023503732A (en) Point cloud interpolation method, network training method, device, equipment and storage medium
CN113469091B (en) Face recognition method, training method, electronic device and storage medium
JP2017168081A (en) 3d object localization with descriptor
Yuan et al. Research on simulation of 3D human animation vision technology based on an enhanced machine learning algorithm
Li et al. Geodesic self-attention for 3d point clouds
CN115222951A (en) Image processing method based on three-dimensional point cloud descriptor with rotation invariance
JP2004185626A (en) Description method for perceptually recognizable three-dimensional shape, and method and device for searching database of three-dimensional graphic model using the method
JP2022184829A (en) Deep parameterization for three-dimensional shape optimization
CN111414802B (en) Protein data characteristic extraction method
CN114511745A (en) Three-dimensional point cloud classification and rotation attitude prediction method and system
Takashima et al. Shape descriptor-based similar feature extraction for finite element meshing
CN111210870A (en) Protein classification method

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant