KR20210055747A - 신경 네트워크 훈련 방법 및 장치, 이미지 생성 방법 및 장치 - Google Patents
신경 네트워크 훈련 방법 및 장치, 이미지 생성 방법 및 장치 Download PDFInfo
- Publication number
- KR20210055747A KR20210055747A KR1020217010144A KR20217010144A KR20210055747A KR 20210055747 A KR20210055747 A KR 20210055747A KR 1020217010144 A KR1020217010144 A KR 1020217010144A KR 20217010144 A KR20217010144 A KR 20217010144A KR 20210055747 A KR20210055747 A KR 20210055747A
- Authority
- KR
- South Korea
- Prior art keywords
- network
- distribution
- discriminant
- loss
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
- 238000012549 training Methods 0.000 title claims abstract description 267
- 238000000034 method Methods 0.000 title claims abstract description 141
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 37
- 238000009826 distribution Methods 0.000 claims abstract description 631
- 239000013598 vector Substances 0.000 claims abstract description 74
- 238000013507 mapping Methods 0.000 claims description 57
- 238000012545 processing Methods 0.000 claims description 44
- 238000003860 storage Methods 0.000 claims description 35
- 230000008569 process Effects 0.000 claims description 34
- 230000015654 memory Effects 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 23
- 238000010586 diagram Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 14
- 230000009466 transformation Effects 0.000 description 12
- 238000013459 approach Methods 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 10
- 230000002829 reductive effect Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 7
- 230000002441 reversible effect Effects 0.000 description 7
- 230000007423 decrease Effects 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 230000006872 improvement Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 230000036961 partial effect Effects 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007430 reference method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G06N7/005—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
- G06V10/7747—Organisation of the process, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20076—Probabilistic image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Quality & Reliability (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
Description
도 1은 본 발명의 실시예에 따른 신경 네트워크 훈련 방법의 흐름도이다.
도 2는 본 발명의 실시예에 따른 신경 네트워크 훈련 방법의 응용 예시도이다.
도 3은 본 발명의 실시예에 따른 신경 네트워크 훈련 장치의 블록도이다.
도 4는 본 발명의 실시예에 따른 전자 장치의 블록도이다.
도 5는 본 발명의 실시예에 따른 전자 장치의 블록도이다.
Claims (25)
- 신경 네트워크 훈련 방법으로서,
제1 랜덤 벡터를 생성 네트워크에 입력하여, 제1 생성 이미지를 획득하는 단계;
상기 제1 생성 이미지 및 제1 트루 이미지를 판별 네트워크에 각각 입력하여, 상기 제1 생성 이미지의 제1 판별 분포와 제1 트루 이미지의 제2 판별 분포를 각각 획득하는 단계 - 상기 제1 판별 분포는 상기 제1 생성 이미지의 진실 정도의 확률 분포를 나타내고, 상기 제2 판별 분포는 상기 제1 트루 이미지의 진실 정도의 확률 분포를 나타냄 - ;
상기 제1 판별 분포, 상기 제2 판별 분포, 기설정된 제1 타깃 분포 및 기설정된 제2 타깃 분포에 따라, 상기 판별 네트워크의 제1 네트워크 손실을 결정하는 단계 - 상기 제1 타깃 분포는 생성 이미지의 타깃 확률 분포이고, 상기 제2 타깃 분포는 트루 이미지의 타깃 확률 분포임 - ;
상기 제1 판별 분포 및 상기 제2 판별 분포에 따라, 상기 생성 네트워크의 제2 네트워크 손실을 결정하는 단계; 및
상기 제1 네트워크 손실 및 상기 제2 네트워크 손실에 따라, 상기 생성 네트워크 및 상기 판별 네트워크를 적대적 훈련하는 단계를 포함하는 것을 특징으로 하는 신경 네트워크 훈련 방법. - 제1항에 있어서,
상기 제1 판별 분포, 상기 제2 판별 분포, 기설정된 제1 타깃 분포 및 기설정된 제2 타깃 분포에 따라, 상기 판별 네트워크의 제1 네트워크 손실을 결정하는 단계는,
상기 제1 판별 분포 및 상기 제1 타깃 분포에 따라, 상기 제1 생성 이미지의 제1 분포 손실을 결정하는 단계;
상기 제2 판별 분포 및 상기 제2 타깃 분포에 따라, 상기 제1 트루 이미지의 제2 분포 손실을 결정하는 단계; 및
상기 제1 분포 손실 및 상기 제2 분포 손실에 따라, 상기 제1 네트워크 손실을 결정하는 단계를 포함하는 것을 특징으로 하는 신경 네트워크 훈련 방법. - 제2항에 있어서,
상기 제1 판별 분포 및 상기 제1 타깃 분포에 따라, 상기 제1 생성 이미지의 제1 분포 손실을 결정하는 단계는,
상기 제1 판별 분포를 상기 제1 타깃 분포의 지원 세트에 맵핑하여, 제1 맵핑 분포를 획득하는 단계;
상기 제1 맵핑 분포와 상기 제1 타깃 분포의 제1 상대적 엔트로피를 결정하는 단계; 및
상기 제1 상대적 엔트로피에 따라, 상기 제1 분포 손실을 결정하는 단계를 포함하는 것을 특징으로 하는 신경 네트워크 훈련 방법. - 제2항에 있어서,
상기 제2 판별 분포 및 상기 제2 타깃 분포에 따라, 상기 제1 트루 이미지의 제2 분포 손실을 결정하는 단계는,
상기 제2 판별 분포를 상기 제2 타깃 분포의 지원 세트에 맵핑하여, 제2 맵핑 분포를 획득하는 단계;
상기 제2 맵핑 분포와 상기 제2 타깃 분포의 제2 상대적 엔트로피를 결정하는 단계; 및
상기 제2 상대적 엔트로피에 따라, 상기 제2 분포 손실을 결정하는 단계를 포함하는 것을 특징으로 하는 신경 네트워크 훈련 방법. - 제2항에 있어서,
상기 제1 분포 손실 및 상기 제2 분포 손실에 따라, 상기 제1 네트워크 손실을 결정하는 단계는,
상기 제1 분포 손실 및 상기 제2 분포 손실에 대해 가중 합산 처리를 수행하여, 상기 제1 네트워크 손실을 획득하는 단계를 포함하는 것을 특징으로 하는 신경 네트워크 훈련 방법. - 제1항 내지 제5항 중 어느 한 항에 있어서,
상기 제1 판별 분포 및 상기 제2 판별 분포에 따라, 상기 생성 네트워크의 제2 네트워크 손실을 결정하는 단계는,
상기 제1 판별 분포와 상기 제2 판별 분포의 제3 상대적 엔트로피를 결정하는 단계; 및
상기 제3 상대적 엔트로피에 따라, 상기 제2 네트워크 손실을 결정하는 단계를 포함하는 것을 특징으로 하는 신경 네트워크 훈련 방법. - 제1항 내지 제6항 중 어느 한 항에 있어서,
상기 제1 네트워크 손실 및 상기 제2 네트워크 손실에 따라, 상기 생성 네트워크 및 상기 판별 네트워크를 적대적 훈련하는 단계는,
상기 제1 네트워크 손실에 따라, 상기 판별 네트워크의 네트워크 파라미터를 조정하는 단계;
상기 제2 네트워크 손실에 따라, 상기 생성 네트워크의 네트워크 파라미터를 조정하는 단계; 및
상기 판별 네트워크 및 상기 생성 네트워크가 훈련 조건을 만족하는 경우, 훈련된 상기 생성 네트워크 및 상기 판별 네트워크를 획득하는 단계를 포함하는 것을 특징으로 하는 신경 네트워크 훈련 방법. - 제7항에 있어서,
상기 제1 네트워크 손실에 따라, 상기 판별 네트워크의 네트워크 파라미터를 조정하는 단계는,
제2 랜덤 벡터를 생성 네트워크에 입력하여, 제2 생성 이미지를 획득하는 단계;
상기 제2 생성 이미지에 따라 제2 트루 이미지에 대해 보간 처리를 수행하여, 보간 이미지를 획득하는 단계;
상기 보간 이미지를 상기 판별 네트워크에 입력하여, 상기 보간 이미지의 제3 판별 분포를 획득하는 단계;
상기 제3 판별 분포에 따라, 상기 판별 네트워크의 네트워크 파라미터의 구배를 결정하는 단계;
상기 구배가 구배 임계값보다 크거나 같을 경우, 상기 제3 판별 분포에 따라 구배 징벌 파라미터를 결정하는 단계; 및
상기 제1 네트워크 손실 및 상기 구배 징벌 파라미터에 따라, 상기 판별 네트워크의 네트워크 파라미터를 조정하는 단계를 포함하는 것을 특징으로 하는 신경 네트워크 훈련 방법. - 제1항 내지 제8항 중 어느 한 항에 있어서,
상기 제1 네트워크 손실 및 상기 제2 네트워크 손실에 따라, 상기 생성 네트워크 및 상기 판별 네트워크를 적대적 훈련하는 단계는,
과거 훈련 주기에서 생성 네트워크에 입력한 적어도 하나의 제1 랜덤 벡터를 현재 훈련 주기의 생성 네트워크에 입력하여, 적어도 하나의 제3 생성 이미지를 획득하는 단계;
상기 과거 훈련 주기에서 생성 네트워크에 입력한 적어도 하나의 제1 랜덤 벡터에 대응되는 제1 생성 이미지, 적어도 하나의 상기 제3 생성 이미지 및 적어도 하나의 트루 이미지를 현재 훈련 주기의 판별 네트워크에 각각 입력하여, 적어도 하나의 제1 생성 이미지의 제4 판별 분포, 적어도 하나의 제3 생성 이미지의 제5 판별 분포 및 적어도 하나의 트루 이미지의 제6 판별 분포를 각각 획득하는 단계;
상기 제4 판별 분포, 상기 제5 판별 분포 및 상기 제6 판별 분포에 따라 현재 훈련 주기의 생성 네트워크의 훈련 진척 파라미터를 결정하는 단계; 및
상기 훈련 진척 파라미터가 훈련 진척 임계값보다 작거나 같을 경우, 상기 판별 네트워크의 네트워크 파라미터를 조정하는 것을 중지하고, 상기 생성 네트워크의 네트워크 파라미터만 조정하는 단계를 포함하는 것을 특징으로 하는 신경 네트워크 훈련 방법. - 제9항에 있어서,
상기 제4 판별 분포, 상기 제5 판별 분포 및 상기 제6 판별 분포에 따라 현재 훈련 주기의 생성 네트워크의 훈련 진척 파라미터를 결정하는 단계는,
적어도 하나의 상기 제4 판별 분포의 제1 소망값, 적어도 하나의 상기 제5 판별 분포의 제2 소망값 및 적어도 하나의 상기 제6 판별 분포의 제3 소망값을 각각 획득하는 단계;
적어도 하나의 상기 제1 소망값의 제1 평균값, 적어도 하나의 상기 제2 소망값의 제2 평균값 및 적어도 하나의 상기 제3 소망값의 제3 평균값을 각각 획득하는 단계;
상기 제3 평균값과 상기 제2 평균값의 제1 차이값 및 상기 제2 평균값과 상기 제1 평균값의 제2 차이값을 결정하는 단계; 및
상기 제1 차이값과 상기 제2 차이값의 비례값을 상기 현재 훈련 주기의 생성 네트워크의 훈련 진척 파라미터로 결정하는 단계를 포함하는 것을 특징으로 하는 신경 네트워크 훈련 방법. - 이미지 생성 방법으로서,
제3 랜덤 벡터를 획득하는 단계; 및
상기 제3 랜덤 벡터를 제1항 내지 제10항 중 어느 한 항에 따른 신경 네트워크 훈련 방법에 따라 훈련한 후 획득된 생성 네트워크에 입력하여 처리함으로써, 타깃 이미지를 획득하는 단계를 포함하는 것을 특징으로 하는 이미지 생성 방법. - 신경 네트워크 훈련 장치로서,
제1 랜덤 벡터를 생성 네트워크에 입력하여, 제1 생성 이미지를 획득하기 위한 생성 모듈;
상기 제1 생성 이미지 및 제1 트루 이미지를 판별 네트워크에 각각 입력하여, 상기 제1 생성 이미지의 제1 판별 분포와 제1 트루 이미지의 제2 판별 분포를 각각 획득하기 위한 판별 모듈 - 상기 제1 판별 분포는 상기 제1 생성 이미지의 진실 정도의 확률 분포를 나타내고, 상기 제2 판별 분포는 상기 제1 트루 이미지의 진실 정도의 확률 분포를 나타냄 - ;
상기 제1 판별 분포, 상기 제2 판별 분포, 기설정된 제1 타깃 분포 및 기설정된 제2 타깃 분포에 따라, 상기 판별 네트워크의 제1 네트워크 손실을 결정하기 위한 제1 결정 모듈 - 상기 제1 타깃 분포는 생성 이미지의 타깃 확률 분포이고, 상기 제2 타깃 분포는 트루 이미지의 타깃 확률 분포임 - ;
상기 제1 판별 분포 및 상기 제2 판별 분포에 따라, 상기 생성 네트워크의 제2 네트워크 손실을 결정하기 위한 제2 결정 모듈; 및
상기 제1 네트워크 손실 및 상기 제2 네트워크 손실에 따라, 상기 생성 네트워크 및 상기 판별 네트워크를 적대적 훈련하기 위한 훈련 모듈을 포함하는 것을 특징으로 하는 신경 네트워크 훈련 장치. - 제12항에 있어서,
상기 제1 결정 모듈은 더 나아가,
상기 제1 판별 분포 및 상기 제1 타깃 분포에 따라, 상기 제1 생성 이미지의 제1 분포 손실을 결정하고;
상기 제2 판별 분포 및 상기 제2 타깃 분포에 따라, 상기 제1 트루 이미지의 제2 분포 손실을 결정하며;
상기 제1 분포 손실 및 상기 제2 분포 손실에 따라, 상기 제1 네트워크 손실을 결정하도록 구성된 것을 특징으로 하는 신경 네트워크 훈련 장치. - 제13항에 있어서,
상기 제1 결정 모듈은 더 나아가,
상기 제1 판별 분포를 상기 제1 타깃 분포의 지원 세트에 맵핑하여, 제1 맵핑 분포를 획득하고;
상기 제1 맵핑 분포와 상기 제1 타깃 분포의 제1 상대적 엔트로피를 결정하며;
상기 제1 상대적 엔트로피에 따라, 상기 제1 분포 손실을 결정하도록 구성된 것을 특징으로 하는 신경 네트워크 훈련 장치. - 제13항에 있어서,
상기 제1 결정 모듈은 더 나아가,
상기 제2 판별 분포를 상기 제2 타깃 분포의 지원 세트에 맵핑하여, 제2 맵핑 분포를 획득하고;
상기 제2 맵핑 분포와 상기 제2 타깃 분포의 제2 상대적 엔트로피를 결정하며;
상기 제2 상대적 엔트로피에 따라, 상기 제2 분포 손실을 결정하도록 구성된 것을 특징으로 하는 신경 네트워크 훈련 장치. - 제13항에 있어서,
상기 제1 결정 모듈은 더 나아가,
상기 제1 분포 손실 및 상기 제2 분포 손실에 대해 가중 합산 처리를 수행하여, 상기 제1 네트워크 손실을 획득하도록 구성된 것을 특징으로 하는 신경 네트워크 훈련 장치. - 제12항 내지 제16항 중 어느 한 항에 있어서,
상기 제2 결정 모듈은 더 나아가,
상기 제1 판별 분포와 상기 제2 판별 분포의 제3 상대적 엔트로피를 결정하고;
상기 제3 상대적 엔트로피에 따라, 상기 제2 네트워크 손실을 결정하도록 구성된 것을 특징으로 하는 신경 네트워크 훈련 장치. - 제12항 내지 제17항 중 어느 한 항에 있어서,
상기 훈련 모듈은 더 나아가,
상기 제1 네트워크 손실에 따라, 상기 판별 네트워크의 네트워크 파라미터를 조정하고;
상기 제2 네트워크 손실에 따라, 상기 생성 네트워크의 네트워크 파라미터를 조정하며;
상기 판별 네트워크 및 상기 생성 네트워크가 훈련 조건을 만족하는 경우, 훈련된 상기 생성 네트워크 및 상기 판별 네트워크를 획득하도록 구성된 것을 특징으로 하는 신경 네트워크 훈련 장치. - 제18항에 있어서,
상기 훈련 모듈은 더 나아가,
제2 랜덤 벡터를 생성 네트워크에 입력하여, 제2 생성 이미지를 획득하고;
상기 제2 생성 이미지에 따라 제2 트루 이미지에 대해 보간 처리를 수행하여, 보간 이미지를 획득하며;
상기 보간 이미지를 상기 판별 네트워크에 입력하여, 상기 보간 이미지의 제3 판별 분포를 획득하며;
상기 제3 판별 분포에 따라, 상기 판별 네트워크의 네트워크 파라미터의 구배를 결정하며;
상기 구배가 구배 임계값보다 크거나 같을 경우, 상기 제3 판별 분포에 따라 구배 징벌 파라미터를 결정하며;
상기 제1 네트워크 손실 및 상기 구배 징벌 파라미터에 따라, 상기 판별 네트워크의 네트워크 파라미터를 조정하도록 구성된 것을 특징으로 하는 신경 네트워크 훈련 장치. - 제11항 내지 제19항 중 어느 한 항에 있어서,
상기 훈련 모듈은 더 나아가,
과거 훈련 주기에서 생성 네트워크에 입력한 적어도 하나의 제1 랜덤 벡터를 현재 훈련 주기의 생성 네트워크에 입력하여, 적어도 하나의 제3 생성 이미지를 획득하고;
상기 과거 훈련 주기에서 생성 네트워크에 입력한 적어도 하나의 제1 랜덤 벡터에 대응되는 제1 생성 이미지, 적어도 하나의 상기 제3 생성 이미지 및 적어도 하나의 트루 이미지를 현재 훈련 주기의 판별 네트워크에 각각 입력하여, 적어도 하나의 제1 생성 이미지의 제4 판별 분포, 적어도 하나의 제3 생성 이미지의 제5 판별 분포 및 적어도 하나의 트루 이미지의 제6 판별 분포를 각각 획득하며;
상기 제4 판별 분포, 상기 제5 판별 분포 및 상기 제6 판별 분포에 따라 현재 훈련 주기의 생성 네트워크의 훈련 진척 파라미터를 결정하며;
상기 훈련 진척 파라미터가 훈련 진척 임계값보다 작거나 같을 경우, 상기 판별 네트워크의 네트워크 파라미터를 조정하는 것을 중지하고, 상기 생성 네트워크의 네트워크 파라미터만 조정하도록 구성된 것을 특징으로 하는 신경 네트워크 훈련 장치. - 제20항에 있어서,
상기 훈련 모듈은 더 나아가,
적어도 하나의 상기 제4 판별 분포의 제1 소망값, 적어도 하나의 상기 제5 판별 분포의 제2 소망값 및 적어도 하나의 상기 제6 판별 분포의 제3 소망값을 각각 획득하고;
적어도 하나의 상기 제1 소망값의 제1 평균값, 적어도 하나의 상기 제2 소망값의 제2 평균값 및 적어도 하나의 상기 제3 소망값의 제3 평균값을 각각 획득하며;
상기 제3 평균값과 상기 제2 평균값의 제1 차이값 및 상기 제2 평균값과 상기 제1 평균값의 제2 차이값을 결정하며;
상기 제1 차이값과 상기 제2 차이값의 비례값을 상기 현재 훈련 주기의 생성 네트워크의 훈련 진척 파라미터로 결정하도록 구성된 것을 특징으로 하는 신경 네트워크 훈련 장치. - 이미지 생성 장치로서,
제3 랜덤 벡터를 획득하기 위한 취득 모듈; 및
상기 제3 랜덤 벡터를 제12항 내지 제21항 중 어느 한 항에 따른 신경 네트워크 훈련 장치에 따라 훈련한 후 획득된 생성 네트워크에 입력하여 처리함으로써, 타깃 이미지를 획득하기 위한 획득 모듈을 포함하는 것을 특징으로 하는 이미지 생성 장치. - 전자 기기로서,
프로세서; 및
프로세서가 실행 가능한 명령어를 저장하기 위한 메모리를 포함하고,
상기 프로세서는, 제1항 내지 제11항 중 어느 한 항에 따른 신경 네트워크 훈련 방법을 실행하도록 구성된 것을 특징으로 하는 전자 기기. - 컴퓨터 프로그램 명령이 저장되어 있는 컴퓨터 판독 가능한 저장 매체로서,
상기 컴퓨터 프로그램 명령어는 프로세서에 의해 실행될 경우 제1항 내지 제11항 중 어느 한 항에 따른 신경 네트워크 훈련 방법을 구현하는 것을 특징으로 하는 컴퓨터 판독 가능한 저장 매체. - 컴퓨터 프로그램으로서,
컴퓨터 판독 가능한 코드를 포함하고, 상기 컴퓨터 판독 가능한 코드가 전자 기기에서 작동될 경우, 상기 전자 기기에서의 프로세서는 제1항 내지 제11항 중 어느 한 항에 따른 신경 네트워크 훈련 방법을 실행하는 것을 특징으로 하는 컴퓨터 프로그램.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910927729.6A CN110634167B (zh) | 2019-09-27 | 2019-09-27 | 神经网络训练方法及装置和图像生成方法及装置 |
CN201910927729.6 | 2019-09-27 | ||
PCT/CN2019/124541 WO2021056843A1 (zh) | 2019-09-27 | 2019-12-11 | 神经网络训练方法及装置和图像生成方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210055747A true KR20210055747A (ko) | 2021-05-17 |
Family
ID=68973281
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217010144A Ceased KR20210055747A (ko) | 2019-09-27 | 2019-12-11 | 신경 네트워크 훈련 방법 및 장치, 이미지 생성 방법 및 장치 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20210224607A1 (ko) |
JP (1) | JP7165818B2 (ko) |
KR (1) | KR20210055747A (ko) |
CN (1) | CN110634167B (ko) |
SG (1) | SG11202103479VA (ko) |
TW (1) | TWI752405B (ko) |
WO (1) | WO2021056843A1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220161839A (ko) * | 2021-05-31 | 2022-12-07 | 한국전자기술연구원 | Gan 구조를 활용한 영상 영역 분할 방법 및 시스템 |
KR20220167614A (ko) * | 2021-06-14 | 2022-12-21 | 아주대학교산학협력단 | 공간 분포를 이용한 휴먼 파싱 방법 및 장치 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7482551B2 (ja) * | 2020-02-12 | 2024-05-14 | 国立大学法人大阪大学 | 心的イメージ可視化方法、心的イメージ可視化装置及びプログラム |
CN113436081B (zh) * | 2020-03-23 | 2025-02-28 | 阿里巴巴集团控股有限公司 | 数据处理方法、图像增强方法及其模型训练方法 |
GB2594070B (en) * | 2020-04-15 | 2023-02-08 | James Hoyle Benjamin | Signal processing system and method |
US11272097B2 (en) * | 2020-07-30 | 2022-03-08 | Steven Brian Demers | Aesthetic learning methods and apparatus for automating image capture device controls |
CN112258297A (zh) * | 2020-11-12 | 2021-01-22 | 北京沃东天骏信息技术有限公司 | 推送物品的描述信息的方法、装置和计算机可读存储介质 |
KR102354181B1 (ko) * | 2020-12-31 | 2022-01-21 | 주식회사 나인티나인 | 비쥬얼라이징 구현 가능한 건설 사업 정보 관리 시스템 및 이의 제어 방법 |
CN112990211B (zh) * | 2021-01-29 | 2023-07-11 | 华为技术有限公司 | 一种神经网络的训练方法、图像处理方法以及装置 |
CA3207420A1 (en) * | 2021-02-04 | 2022-08-11 | Andrew Brock | Neural networks with adaptive gradient clipping |
EP4047524B1 (en) * | 2021-02-18 | 2025-04-09 | Robert Bosch GmbH | Device and method for training a machine learning system for generating images |
CN113159315B (zh) * | 2021-04-06 | 2025-04-08 | 华为技术有限公司 | 一种神经网络的训练方法、数据处理方法以及相关设备 |
TWI766690B (zh) * | 2021-05-18 | 2022-06-01 | 詮隼科技股份有限公司 | 封包產生方法及封包產生系統之設定方法 |
CN114565693A (zh) * | 2021-08-11 | 2022-05-31 | 商汤国际私人有限公司 | 图像生成和神经网络训练方法、装置、设备及介质 |
CN114501164B (zh) * | 2021-12-28 | 2024-11-22 | 海信视像科技股份有限公司 | 音视频数据的标注方法、装置及电子设备 |
CN114565713A (zh) * | 2022-02-10 | 2022-05-31 | 北京箩筐时空数据技术有限公司 | 基于深度强化学习的虚拟三维场景构建方法、装置及设备 |
CN114881884B (zh) * | 2022-05-24 | 2024-03-29 | 河南科技大学 | 一种基于生成对抗网络的红外目标样本增强方法 |
KR20250011017A (ko) * | 2023-07-13 | 2025-01-21 | 주식회사 클라리파이 | 딥러닝 기반 의료영상 이미지 스타일 중립화 장치 및 방법 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100996209B1 (ko) * | 2008-12-23 | 2010-11-24 | 중앙대학교 산학협력단 | 변화값 템플릿을 이용한 객체 모델링 방법 및 그 시스템 |
US8520958B2 (en) * | 2009-12-21 | 2013-08-27 | Stmicroelectronics International N.V. | Parallelization of variable length decoding |
WO2018052587A1 (en) * | 2016-09-14 | 2018-03-22 | Konica Minolta Laboratory U.S.A., Inc. | Method and system for cell image segmentation using multi-stage convolutional neural networks |
JP6318211B2 (ja) * | 2016-10-03 | 2018-04-25 | 株式会社Preferred Networks | データ圧縮装置、データ再現装置、データ圧縮方法、データ再現方法及びデータ転送方法 |
EP3336800B1 (de) * | 2016-12-19 | 2019-08-28 | Siemens Healthcare GmbH | Bestimmen einer trainingsfunktion zum generieren von annotierten trainingsbildern |
CN107293289B (zh) * | 2017-06-13 | 2020-05-29 | 南京医科大学 | 一种基于深度卷积生成对抗网络的语音生成方法 |
US10665326B2 (en) * | 2017-07-25 | 2020-05-26 | Insilico Medicine Ip Limited | Deep proteome markers of human biological aging and methods of determining a biological aging clock |
CN108495110B (zh) * | 2018-01-19 | 2020-03-17 | 天津大学 | 一种基于生成式对抗网络的虚拟视点图像生成方法 |
CN108510435A (zh) * | 2018-03-28 | 2018-09-07 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN108615073B (zh) * | 2018-04-28 | 2020-11-03 | 京东数字科技控股有限公司 | 图像处理方法及装置、计算机可读存储介质、电子设备 |
CN109377448B (zh) * | 2018-05-20 | 2021-05-07 | 北京工业大学 | 一种基于生成对抗网络的人脸图像修复方法 |
CN108805833B (zh) * | 2018-05-29 | 2019-06-18 | 西安理工大学 | 基于条件对抗网络的字帖二值化背景噪声杂点去除方法 |
CN109377452B (zh) * | 2018-08-31 | 2020-08-04 | 西安电子科技大学 | 基于vae和生成式对抗网络的人脸图像修复方法 |
CN109933677A (zh) * | 2019-02-14 | 2019-06-25 | 厦门一品威客网络科技股份有限公司 | 图像生成方法和图像生成系统 |
CN109919921B (zh) * | 2019-02-25 | 2023-10-20 | 天津大学 | 基于生成对抗网络的环境影响程度建模方法 |
CN109920016B (zh) * | 2019-03-18 | 2021-06-25 | 北京市商汤科技开发有限公司 | 图像生成方法及装置、电子设备和存储介质 |
-
2019
- 2019-09-27 CN CN201910927729.6A patent/CN110634167B/zh active Active
- 2019-12-11 WO PCT/CN2019/124541 patent/WO2021056843A1/zh active Application Filing
- 2019-12-11 JP JP2021518079A patent/JP7165818B2/ja active Active
- 2019-12-11 SG SG11202103479VA patent/SG11202103479VA/en unknown
- 2019-12-11 KR KR1020217010144A patent/KR20210055747A/ko not_active Ceased
-
2020
- 2020-01-14 TW TW109101220A patent/TWI752405B/zh not_active IP Right Cessation
-
2021
- 2021-04-02 US US17/221,096 patent/US20210224607A1/en not_active Abandoned
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220161839A (ko) * | 2021-05-31 | 2022-12-07 | 한국전자기술연구원 | Gan 구조를 활용한 영상 영역 분할 방법 및 시스템 |
KR20220167614A (ko) * | 2021-06-14 | 2022-12-21 | 아주대학교산학협력단 | 공간 분포를 이용한 휴먼 파싱 방법 및 장치 |
US12272172B2 (en) | 2021-06-14 | 2025-04-08 | Ajou University Industry-Academic Cooperation Foundation | Method and device for human parsing |
Also Published As
Publication number | Publication date |
---|---|
CN110634167A (zh) | 2019-12-31 |
CN110634167B (zh) | 2021-07-20 |
US20210224607A1 (en) | 2021-07-22 |
JP7165818B2 (ja) | 2022-11-04 |
WO2021056843A1 (zh) | 2021-04-01 |
TW202113752A (zh) | 2021-04-01 |
JP2022504071A (ja) | 2022-01-13 |
TWI752405B (zh) | 2022-01-11 |
SG11202103479VA (en) | 2021-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20210055747A (ko) | 신경 네트워크 훈련 방법 및 장치, 이미지 생성 방법 및 장치 | |
KR102390580B1 (ko) | 얼굴 인식 방법 및 장치, 전자 기기 및 저장 매체 | |
US20220262012A1 (en) | Image Processing Method and Apparatus, and Storage Medium | |
US20210012143A1 (en) | Key Point Detection Method and Apparatus, and Storage Medium | |
CN110633755A (zh) | 网络训练方法、图像处理方法及装置、电子设备 | |
JP2021526698A (ja) | 画像生成方法および装置、電子機器、並びに記憶媒体 | |
CN107845062B (zh) | 图像生成方法及装置 | |
TW202127369A (zh) | 網路訓練方法、圖像生成方法、電子設備及電腦可讀儲存介質 | |
CN109165738B (zh) | 神经网络模型的优化方法及装置、电子设备和存储介质 | |
KR20200081466A (ko) | 이미지 처리 방법, 이미지 처리 장치, 전자 기기 및 저장 매체 | |
CN105335684B (zh) | 人脸检测方法及装置 | |
WO2021082381A1 (zh) | 人脸识别方法及装置、电子设备和存储介质 | |
CN113361540A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
TW202133030A (zh) | 圖像處理方法及圖像處理裝置、電子設備和電腦可讀儲存媒體 | |
CN110135349A (zh) | 识别方法、装置、设备及存储介质 | |
CN110059548B (zh) | 目标检测方法及装置 | |
CN109447258B (zh) | 神经网络模型的优化方法及装置、电子设备和存储介质 | |
CN109978759B (zh) | 图像处理方法及装置和图像生成网络的训练方法及装置 | |
CN110543900A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
KR102374400B1 (ko) | 이미지 처리 방법 및 장치, 전자 기기와 저장 매체 | |
HK40019326B (en) | Neural network training method and device, and image generating method and device | |
HK40019326A (en) | Neural network training method and device, and image generating method and device | |
CN111915536B (zh) | 一种提高图像清晰度的方法、装置及介质 | |
HK40003483A (en) | Face recognition method and apparatus, electronic device and storage medium | |
HK40020908A (en) | Image processing method, device, electronic apparatus and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0105 | International application |
Patent event date: 20210406 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20210406 Comment text: Request for Examination of Application |
|
PG1501 | Laying open of application | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20220923 Patent event code: PE09021S01D |
|
E601 | Decision to refuse application | ||
PE0601 | Decision on rejection of patent |
Patent event date: 20221206 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20220923 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |