KR102490503B1 - 순환형 적대적 생성 신경망을 이용한 이미지 처리 장치 및 방법 - Google Patents
순환형 적대적 생성 신경망을 이용한 이미지 처리 장치 및 방법 Download PDFInfo
- Publication number
- KR102490503B1 KR102490503B1 KR1020220085648A KR20220085648A KR102490503B1 KR 102490503 B1 KR102490503 B1 KR 102490503B1 KR 1020220085648 A KR1020220085648 A KR 1020220085648A KR 20220085648 A KR20220085648 A KR 20220085648A KR 102490503 B1 KR102490503 B1 KR 102490503B1
- Authority
- KR
- South Korea
- Prior art keywords
- discriminator
- loss
- generator
- style
- target image
- Prior art date
Links
- 238000012545 processing Methods 0.000 title claims abstract description 43
- 238000000034 method Methods 0.000 title claims description 48
- 238000013528 artificial neural network Methods 0.000 claims abstract description 46
- 239000003623 enhancer Substances 0.000 claims abstract description 15
- 230000007423 decrease Effects 0.000 claims abstract description 14
- 230000002708 enhancing effect Effects 0.000 claims abstract description 5
- 230000003416 augmentation Effects 0.000 claims description 37
- 238000012549 training Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 14
- 230000003190 augmentative effect Effects 0.000 claims description 10
- 238000003672 processing method Methods 0.000 claims description 8
- 230000000306 recurrent effect Effects 0.000 claims description 7
- 230000006870 function Effects 0.000 description 12
- 238000012546 transfer Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 241000283070 Equus zebra Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
Description
도 2는 본 발명의 일 실시예에 따른 이미지 처리 장치에 의한 훈련 데이터 학습 과정을 나타낸 개념도이다.
도 3은 본 발명의 일 실시예에 따른 이미지 처리 장치에 의한 훈련 데이터 학습 과정을 설명하기 위한 흐름도이다.
도 4는 본 발명의 일 실시예에 따른 이미지 처리 장치에 의한 훈련 데이터 학습 과정 중 증강 기법 결정 과정을 설명하기 위한 흐름도이다.
도 5는 본 발명의 일 실시예에 따른 이미지 처리 장치에 의한 이미지 처리 과정을 설명하기 위한 흐름도이다.
도 6은 본 발명의 일 실시예에 따른 능동적 판별자 증강을 적용한 모델과 적용하지 모델의 손실함수 학습곡선을 나타낸 그래프이다.
도 7 본 발명의 일 실시예에 따른 능동적 판별자 증강을 적용한 모델과 적용하지 모델의 이미지 처리 결과를 비교한 것이다.
110, 120: 생성자
130, 140: 판별자
150, 160: 능동적 판별자 증강기
170: 컨트롤러
Claims (10)
- 순환형 적대적 생성 신경망에 제 1 스타일을 갖는 제 1 입력 이미지를 입력하여, 상기 순환형 적대적 생성 신경망의 출력으로서 제 2 스타일을 갖도록 변환된 제 1 목표 이미지를 출력하는 제 1 생성자와,
상기 제 1 목표 이미지를 제 2 입력 이미지로서 상기 순환형 적대적 생성 신경망에 입력하여, 상기 순환형 적대적 생성 신경망의 출력으로서 상기 제 1 스타일을 갖도록 변환된 제 2 목표 이미지를 출력하는 제 2 생성자와,
상기 제 1 목표 이미지가 상기 제 1 스타일을 갖는지 또는 상기 제 2 스타일을 갖는지 판별하는 제 1 판별자와,
상기 제 1 생성자의 손실 및 상기 제 1 판별자의 손실이 감소하는 방향으로 능동적으로 상기 제 1 판별자를 증강시키는 제 1 능동적 판별자 증강기와,
상기 제 2 목표 이미지가 상기 제 1 스타일을 갖는지 또는 상기 제 2 스타일을 갖는지 판별하는 제 2 판별자와,
상기 제 2 생성자의 손실 및 상기 제 2 판별자의 손실이 감소하는 방향으로 능동적으로 상기 제 2 판별자를 증강시키는 제 2 능동적 판별자 증강기와,
상기 제 1 생성자의 손실, 상기 제 1 판별자의 손실, 상기 제 2 생성자의 손실 및 상기 제 2 판별자의 손실에 기초하여 복수의 배치(batch)별로 증강 기법을 결정하고, 상기 제 1 판별자 및 상기 제 2 판별자가 증강될 확률을 상기 제 1 판별자의 손실 및 상기 제 2 판별자의 손실에 기초하여 결정하는 컨트롤러를 포함하고,
상기 제 1 생성자에 의해 출력되고 상기 제 2 생성자로 입력되는 상기 제 1 목표 이미지는, 상기 제 1 스타일로 복구 가능하도록 변환되고,
상기 제 2 생성자에 의해 출력되고 상기 제 1 생성자로 입력되는 상기 제 2 목표 이미지는, 상기 제 2 스타일로 복구 가능하도록 변환되고,
상기 순환형 적대적 생성 신경망은, 복수의 에폭(epoch)을 통해 훈련 데이터가 학습되되, 상기 복수의 에폭(epoch)은 제 1 에폭과 상기 제 1 에폭 이후에 수행되는 제 2 에폭을 포함하고,
상기 컨트롤러는,
상기 제 1 에폭에서, 상기 복수의 배치별로 2개 이상의 증강 기법을 결정하여 학습되도록 제어하고,
상기 제 2 에폭에서, 상기 제 1 에폭에서 발생된 상기 제 1 생성자의 손실, 상기 제 1 판별자의 손실, 상기 제 2 생성자의 손실 및 상기 제 2 판별자의 손실에 기초하여, 상기 복수의 배치별로 상기 2개 이상의 증강 기법 중에서 하나의 증강 기법을 택일하여 학습되도록 제어하고,
상기 증강 기법의 강도를 베이지안 최적화(bayesian optimizer)를 통해 결정하는,
순환형 적대적 생성 신경망을 이용한 이미지 처리 장치. - 삭제
- 삭제
- 삭제
- 이미지 처리 장치가 수행하는 이미지 처리 방법으로서,
순환형 적대적 생성 신경망의 제 1 생성자에 제 1 스타일을 갖는 제 1 입력 이미지를 입력하여, 상기 제 1 생성자의 출력으로서 제 2 스타일을 갖도록 변환된 제 1 목표 이미지를 출력하는 단계와,
상기 제 1 목표 이미지를 제 2 입력 이미지로서 상기 순환형 적대적 생성 신경망의 제 2 생성자에 입력하여, 상기 제 2 생성자의 출력으로서 상기 제 1 스타일을 갖도록 변환된 제 2 목표 이미지를 출력하는 단계와,
상기 순환형 적대적 생성 신경망의 제 1 판별자를 통해 상기 제 1 목표 이미지가 상기 제 1 스타일을 갖는지 또는 상기 제 2 스타일을 갖는지 판별하는 단계와,
상기 제 1 생성자의 손실 및 상기 제 1 판별자의 손실이 감소하는 방향으로 능동적으로 상기 제 1 판별자를 증강시키는 단계와,
상기 순환형 적대적 생성 신경망의 제 2 판별자를 통해 상기 제 2 목표 이미지가 상기 제 1 스타일을 갖는지 또는 상기 제 2 스타일을 갖는지 판별하는 단계와,
상기 제 2 생성자의 손실 및 상기 제 2 판별자의 손실이 감소하는 방향으로 능동적으로 상기 제 2 판별자를 증강시키는 단계를 포함하고,
상기 제 1 목표 이미지를 출력하는 단계는,
상기 제 1 생성자에 의해 출력되고 상기 제 2 생성자로 입력되는 상기 제 1 목표 이미지가 상기 제 1 스타일로 복구 가능하도록 변환하는 단계를 포함하고,
상기 제 2 목표 이미지를 출력하는 단계는,
상기 제 2 생성자에 의해 출력되고 상기 제 1 생성자로 입력되는 상기 제 2 목표 이미지가 상기 제 2 스타일로 복구 가능하도록 변환하는 단계를 포함하고,
상기 순환형 적대적 생성 신경망은, 복수의 에폭(epoch)을 통해 훈련 데이터가 학습되되, 상기 복수의 에폭(epoch)은 제 1 에폭과 상기 제 1 에폭 이후에 수행되는 제 2 에폭을 포함하고,
상기 이미지 처리 방법은,
상기 제 1 생성자의 손실, 상기 제 1 판별자의 손실, 상기 제 2 생성자의 손실 및 상기 제 2 판별자의 손실에 기초하여 복수의 배치(batch)별로 증강 기법을 결정하고, 상기 제 1 판별자 및 상기 제 2 판별자가 증강될 확률을 상기 제 1 판별자의 손실 및 상기 제 2 판별자의 손실에 기초하여 결정하고,
상기 제 1 에폭에서, 상기 복수의 배치별로 2개 이상의 증강 기법을 결정하여 학습을 수행하고,
상기 제 2 에폭에서, 상기 제 1 에폭에서 발생된 상기 제 1 생성자의 손실, 상기 제 1 판별자의 손실, 상기 제 2 생성자의 손실 및 상기 제 2 판별자의 손실에 기초하여, 상기 복수의 배치별로 상기 2개 이상의 증강 기법 중에서 하나의 증강 기법을 택일하여 학습을 수행하고,
상기 증강 기법의 강도는, 베이지안 최적화(bayesian optimizer)를 통해 결정되는,
순환형 적대적 생성 신경망을 이용한 이미지 처리 방법. - 삭제
- 삭제
- 삭제
- 컴퓨터 프로그램을 저장하고 있는 컴퓨터 판독 가능 기록매체로서,
상기 컴퓨터 프로그램은, 프로세서에 의해 실행되면, 제5항의 방법을 상기 프로세서가 수행하도록 하기 위한 명령어를 포함하는, 컴퓨터 판독 가능한 기록매체. - 컴퓨터 판독 가능 기록매체에 저장된 컴퓨터 프로그램으로서,
상기 컴퓨터 프로그램은, 프로세서에 의해 실행되면, 제5항의 방법을 상기 프로세서가 수행하도록 하기 위한 명령어를 포함하는, 컴퓨터 프로그램.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220085648A KR102490503B1 (ko) | 2022-07-12 | 2022-07-12 | 순환형 적대적 생성 신경망을 이용한 이미지 처리 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220085648A KR102490503B1 (ko) | 2022-07-12 | 2022-07-12 | 순환형 적대적 생성 신경망을 이용한 이미지 처리 장치 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102490503B1 true KR102490503B1 (ko) | 2023-01-19 |
Family
ID=85078189
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220085648A KR102490503B1 (ko) | 2022-07-12 | 2022-07-12 | 순환형 적대적 생성 신경망을 이용한 이미지 처리 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102490503B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7344501B1 (ja) * | 2023-03-29 | 2023-09-14 | AI inside株式会社 | プログラム、方法、情報処理装置、システム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210088656A (ko) | 2019-06-24 | 2021-07-14 | 센스타임 그룹 리미티드 | 이미지 생성 및 신경망 트레이닝 방법, 장치, 기기 및 매체 |
-
2022
- 2022-07-12 KR KR1020220085648A patent/KR102490503B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210088656A (ko) | 2019-06-24 | 2021-07-14 | 센스타임 그룹 리미티드 | 이미지 생성 및 신경망 트레이닝 방법, 장치, 기기 및 매체 |
Non-Patent Citations (2)
Title |
---|
Nazrul Ismail et al., Real-time visual inspection system for grading fruits using computer vision and deep learning techniques, INFORMATION PROCESSING IN AGRICULTURE 9 (2022), 24-37pages (2022. 3.) * |
김진용 등., 적대적 생성 신경망을 이용한 얼굴 감정인식 데이터 증강, Journal of KIISE, Vol. 48, No. 4, 398-404pages (2021. 4.) * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7344501B1 (ja) * | 2023-03-29 | 2023-09-14 | AI inside株式会社 | プログラム、方法、情報処理装置、システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yi et al. | On learning contrastive representations for learning with noisy labels | |
US11270188B2 (en) | Joint optimization of ensembles in deep learning | |
US11354578B2 (en) | Mixture of generators model | |
KR102347496B1 (ko) | 방사선 치료 계획 수립을 위한 인공지능 기반의 장기 및 종양 이미지 분할 시스템 및 방법 | |
Jeon et al. | T-gd: Transferable gan-generated images detection framework | |
US11010670B2 (en) | Building a deep neural network with diverse strata | |
US11775817B2 (en) | Reinforcement learning-based techniques for training a natural media agent | |
TW201923664A (zh) | 模型生成伺服器及其模型生成方法 | |
CN111340011B (zh) | 一种自适应时序移位神经网络时序行为识别方法 | |
CN112507159B (zh) | 哈希网络训练方法、广告图像素材检索方法及相关装置 | |
KR102490503B1 (ko) | 순환형 적대적 생성 신경망을 이용한 이미지 처리 장치 및 방법 | |
US20230214719A1 (en) | Method for performing continual learning using representation learning and apparatus thereof | |
CN113963165A (zh) | 一种基于自监督学习的小样本图像分类方法及系统 | |
US20230281981A1 (en) | Methods, devices, and computer readable media for training a keypoint estimation network using cgan-based data augmentation | |
Ye et al. | Low-quality image object detection based on reinforcement learning adaptive enhancement | |
US20240242085A1 (en) | Method for training deep learning model using self-knowledge distillation algorithm, inferring apparatus using deep learning model, and storage medium storing instructions to perform method for training deep learning model | |
JP7626132B2 (ja) | 学習装置、生成方法、推論装置、推論方法、およびプログラム | |
KR20210007234A (ko) | 이미지 보정 방법 및 이미지 보정 시스템 | |
Larres et al. | Using unrestricted loops in genetic programming for image classification | |
KR20210012464A (ko) | 보조 식별기가 추가된 기계학습을 통해 이미지의 생성을 가능하게 하는 생성적 적대 신경망 기반의 이미지 생성 처리 장치 및 방법 | |
Feng et al. | Resisting stochastic risks in diffusion planners with the trajectory aggregation tree | |
US20240046624A1 (en) | Image processing apparatus, image processing method, and recording medium | |
CN112541906B (zh) | 一种数据处理的方法及装置、电子设备、存储介质 | |
WO2019064461A1 (ja) | 学習ネットワーク生成装置、及び学習ネットワーク生成プログラム | |
JP6674393B2 (ja) | 特徴量登録装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20220712 |
|
PA0201 | Request for examination | ||
PA0302 | Request for accelerated examination |
Patent event date: 20221014 Patent event code: PA03022R01D Comment text: Request for Accelerated Examination Patent event date: 20220712 Patent event code: PA03021R01I Comment text: Patent Application |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20221219 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20230116 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20230116 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |