KR102648354B1 - 인공 신경망을 이용한 영상 변환 시스템 및 그 방법 - Google Patents
인공 신경망을 이용한 영상 변환 시스템 및 그 방법 Download PDFInfo
- Publication number
- KR102648354B1 KR102648354B1 KR1020220104927A KR20220104927A KR102648354B1 KR 102648354 B1 KR102648354 B1 KR 102648354B1 KR 1020220104927 A KR1020220104927 A KR 1020220104927A KR 20220104927 A KR20220104927 A KR 20220104927A KR 102648354 B1 KR102648354 B1 KR 102648354B1
- Authority
- KR
- South Korea
- Prior art keywords
- image
- learning
- unit
- aerial
- learning data
- Prior art date
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 139
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 72
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000013016 learning Effects 0.000 claims description 178
- 230000006870 function Effects 0.000 claims description 51
- 238000012545 processing Methods 0.000 claims description 42
- 238000013256 Gubra-Amylin NASH model Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000010422 painting Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000035045 associative learning Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0475—Generative networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
- G06T17/05—Geographic models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10032—Satellite or aerial image; Remote sensing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Geometry (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Computer Graphics (AREA)
- Remote Sensing (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
Description
도 2는 본 발명의 일 실시예에 따른 인공 신경망을 이용한 영상 변환 시스템 및 그 방법에 의한 제1 영상 변환 모듈의 학습 과정을 나타낸 예시도이다.
도 3은 본 발명의 일 실시예에 따른 인공 신경망을 이용한 영상 변환 시스템 및 그 방법에 의한 제2 영상 변환 모듈의 인공 신경망 구조를 나타낸 예시도이다.
도 4는 종래의 pix2pix 인공 신경망을 이용하여 항공영상을 기본 지도로 변환하는 기술과 본 발명의 일 실시예에 따른 인공 신경망을 이용한 영상 변환 시스템 및 그 방법에 의한 위성영상을 기본 지도로 변환하는 기술의 성능 비교 예시도이다.
도 5는 본 발명의 일 실시예에 따른 인공 신경망을 이용한 영상 변환 방법을 나타낸 순서 예시도이다.
200 : 제1 변환부
210 : 제1 수집부 220 : 제1a 생성부
230 : 제1a 판별부 240 : 제1b 생성부
250 : 제1b 판별부
300 : 제2 변환부
310 : 제2 수집부 320 : 제2 생성부
330 : 제2 편발부
Claims (8)
- 기본 지도(Base map) 도메인 형태로 변환하고자 하는 위성영상과 항공영상 도메인 형태의 데이터를 모두 입력받는 입력부;
저장된 제1 영상 변환 모듈을 이용하여, 상기 입력부에 의해 입력된 위성영상을 항공영상 도메인 형태로 변환하는 제1 변환부; 및
저장된 제2 영상 변환 모듈을 이용하여, 상기 입력부에 의해 입력된 항공영상 또는, 상기 제1 변환부에 의해 변환한 항공영상을 기본 지도 도메인 형태로 변환하는 제2 변환부;
를 포함하며,
상기 제1 변환부는
외부로부터 다수의 항공영상과 다수의 위성영상을 수집하여, 각각의 학습 데이터 셋을 생성하는 제1 수집부;
상기 제1 수집부에 의한 항공영상 학습 데이터 셋과 위성영상 학습 데이터 셋의 학습 처리를 수행하여, 입력되는 위성영상을 가상의 항공영상으로 변환하여 출력하는 제1a 생성부;
상기 제1 수집부에 의한 항공영상 데이터 셋으로부터 추출한 특징점과 상기 제1a 생성부에 의한 가상의 항공영상으로부터 추출한 특징점을 비교하여 판별하도록 학습 처리를 수행하는 제1a 판별부;
상기 제1 수집부에 의한 항공영상 학습 데이터 셋과 위성영상 학습 데이터 셋의 학습 처리를 수행하여, 상기 제1a 생성부에 의한 가상의 항공영상을 입력받아 가상의 위성영상으로 변환하여 출력하는 제1b 생성부; 및
상기 제1 수집부에 의한 위성영상 데이터 셋으로부터 추출한 특징점과 상기 제1b 생성부에 의한 가상의 위성영상으로부터 추출한 특징점을 비교하여 판별하도록 학습 처리를 수행하는 제1b 판별부;
를 더 포함하며,
상기 제1a 생성부, 제1a 판별부, 제1b 생성부 및 제1b 판별부는
인공 신경망으로 구현되는 GAN(Generative Adversarial Network) 모델을 이용하되,
상기 제1a 생성부로 입력되는 위성영상과 상기 제1b 생성부에 의한 가상의 위성영상이 같아지도록, 기저장된 손실함수를 이용하여, 상기 제1a 생성부와 상기 제1a 판별부가 적대적 학습 처리를 수행함과 동시에 상기 제1b 생성부와 제1b 판별부가 적대적 학습 처리를 수행하되,
상기 손실함수는 상기 제1a 생성부에 의해 학습 처리 시, 기설정된 특정 영역에 대한 형태 변형이 일어나지 않도록 왜곡을 최소화하는 함수를 포함하는, 인공 신경망을 이용한 영상 변환 시스템.
- 삭제
- 제 1항에 있어서,
상기 제1 변환부는
상기 제1a 생성부에 의해 최종 학습 처리된 학습 모델을 상기 제1 영상 변환 모듈로 저장하는, 인공 신경망을 이용한 영상 변환 시스템.
- 제 1항에 있어서,
상기 제2 변환부는
외부로부터 대응 쌍을 이루는 다수의 항공영상과 다수의 기본 지도를 수집하여, 학습 데이터 셋을 생성하는 제2 수집부;
상기 제2 수집부에 의한 학습 데이터 셋의 학습 처리를 수행하여, 입력되는 항공영상을 가상의 기본 지도로 변환하여 출력하는 제2 생성부; 및
상기 제2 수집부에 의한 학습 데이터 셋으로부터 추출한 특징점과 상기 제2 생성부에 의한 가상의 기본 지도로부터 추출한 특징점을 비교하여 판별하도록 학습 처리를 수행하는 제2 판별부;
를 포함하며,
상기 제2 생성부 및 제2 판별부는
인공 신경망으로 구현되는 GAN 모델을 이용하되,
기저장된 손실함수를 이용하여, 상기 제2 생성부와 제2 판별부는 적대적 학습 처리를 수행하는, 인공 신경망을 이용한 영상 변환 시스템.
- 제 4항에 있어서,
상기 제2 변환부는
상기 제2 생성부에 의해 최종 학습 처리된 학습 모델을 상기 제2 영상 변환 모듈로 저장하는, 인공 신경망을 이용한 영상 변환 시스템.
- 컴퓨터로 구현되는 인공 신경망을 이용한 영상 변환 시스템에 의해 각 단계가 수행되는 인공 신경망을 이용한 영상 변환 방법에 있어서,
기본 지도(Base map) 도메인 형태로 변환하고자 하는 위성영상과 항공영상 도메인 형태의 데이터를 모두 입력받는 입력 단계(S100);
저장된 제1 영상 변환 모듈을 이용하여, 상기 입력 단계(S100)에 의해, 입력된 위성영상을 항공영상 도메인 형태로 변환하는 제1 변환 단계(S200); 및
저장된 제2 영상 변환 모듈을 이용하여, 상기 입력 단계(S100)에 의해, 입력된 항공영상을 또는, 상기 제1 변환 단계(S200)에 의해 변환한 항공영상을 기본 지도 도메인 형태로 변환하는 제2 변환 단계(S300);
를 포함하며,
상기 제1 변환 단계(S200)는
인공 신경망으로 구현되는 GAN(Generative Adversarial Network) 모델을 이용하되,
외부로부터 다수의 항공영상과 다수의 위성영상을 수집하여, 각각의 학습 데이터 셋을 생성하는 학습 데이터 생성 단계(S210);
상기 학습 데이터 생성 단계(S210)에 의한 항공영상 학습 데이터 셋과 위성영상 학습 데이터 셋의 학습 처리를 수행하여, 입력되는 위성영상을 가상의 항공영상으로 변환하여 출력하는 제1 생성 단계(S220);
상기 학습 데이터 생성 단계(S210)에 의한 항공영상 학습 데이터 셋으로부터 추출한 특징점과 상기 제1 생성 단계(S220)에 의한 가상의 항공영상으로부터 추출한 특징점을 비교하여 판별하는 제1 판별 단계(S230);
상기 학습 데이터 생성 단계(S210)에 의한 항공영상 학습 데이터 셋과 위성영상 학습 데이터 셋의 학습 처리를 수행하여, 상기 제1 생성 단계(S220)에 의한 가상의 항공영상을 입력받아 가상의 위성영상으로 변환하여 출력하는 제2 생성 단계(S240); 및
상기 학습 데이터 생성 단계(S210)에 의한 위성영상 학습 데이터 셋으로부터 추출한 특징점과 상기 제2 생성 단계(S240)에 의한 가상의 위성영상으로부터 추출한 특징점을 비교하여 판별하는 제2 판별 단계(S250);
를 포함하며,
상기 제1 생성 단계(S220)로 입력되는 위성영상과 상기 제2 생성 단계(S240)에 의해 출력되는 가상의 위성영상이 같아지도록, 상기 제1 생성 단계(S220)와 제1 판별 단계(S230) 및 상기 제2 생성 단계(S240)와 제2 판별 단계(S250)는 기저장된 손실함수를 이용하여, 적대적 학습 처리를 수행하되,
상기 손실함수는 상기 제1 변환 단계(S200)에 의해 학습 처리 시, 기설정된 특정 영역에 대한 형태 변형이 일어나지 않도록 왜곡을 최소화하는 함수를 포함하고,
상기 제1 생성 단계(S220)에 의해 최종 학습 처리된 학습 모델을 상기 제1 영상 변환 모듈로 저장하는, 인공 신경망을 이용한 영상 변환 방법.
- 삭제
- 제 6항에 있어서,
상기 제2 변환 단계(S300)는
인공 신경망으로 구현되는 GAN(Generative Adversarial Network) 모델을 이용하되,
외부로부터 대응 쌍을 이루는 다수의 항공영상과 다수의 기본 지도를 수집하여, 학습 데이터 셋을 생성하는 학습 데이터 생성 단계(S310);
상기 학습 데이터 생성 단계(S310)에 의한 학습 데이터 셋의 학습 처리를 수행하여, 입력되는 항공영상을 가상의 기본 지도로 변환하여 출력하는 제3 생성 단계(S320); 및
상기 학습 데이터 생성 단계(S310)에 의한 학습 데이터 셋으로부터 추출한 특징점과 상기 제3 생성 단계(S320)에 의한 가상의 기본 지도로부터 추출한 특징점을 비교하여 판별하는 제3 판별 단계(S330);
를 포함하며,
상기 제3 생성 단계(S320)와 제3 판별 단계(S330)는 기저장된 손실함수를 이용하여, 적대적 학습 처리를 수행하고,
상기 제3 생성 단계(S320)에 의해 최종 학습 처리된 학습 모델을 상기 제2 영상 변환 모듈로 저장하는, 인공 신경망을 이용한 영상 변환 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220104927A KR102648354B1 (ko) | 2022-08-22 | 2022-08-22 | 인공 신경망을 이용한 영상 변환 시스템 및 그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220104927A KR102648354B1 (ko) | 2022-08-22 | 2022-08-22 | 인공 신경망을 이용한 영상 변환 시스템 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20240026717A KR20240026717A (ko) | 2024-02-29 |
KR102648354B1 true KR102648354B1 (ko) | 2024-03-15 |
Family
ID=90041441
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220104927A KR102648354B1 (ko) | 2022-08-22 | 2022-08-22 | 인공 신경망을 이용한 영상 변환 시스템 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102648354B1 (ko) |
-
2022
- 2022-08-22 KR KR1020220104927A patent/KR102648354B1/ko active IP Right Grant
Non-Patent Citations (2)
Title |
---|
Ahmed Nassar et al., A Deep CNN-Based Framework For Enhanced Aerial Imagery Registration with Applications to UAV Geolocalization", Proceedings of the IEEE Conferenc on CVPR Workshops, (2018.06.22.)* |
YING ZHANG et al., "An Enhanced GAN Model for Automatic Satellite-to-Map Image Conversion", IEEE Access, (2020.09.18.)* |
Also Published As
Publication number | Publication date |
---|---|
KR20240026717A (ko) | 2024-02-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Anderson et al. | Bottom-up and top-down attention for image captioning and visual question answering | |
CN107423700B (zh) | 人证核实的方法及装置 | |
CN108549895A (zh) | 一种基于对抗网络的半监督语义分割方法 | |
CN110781882A (zh) | 一种基于yolo模型的车牌定位和识别方法 | |
US20180349716A1 (en) | Apparatus and method for recognizing traffic signs | |
CN111160481B (zh) | 基于深度学习的adas目标检测方法及系统 | |
CN106529532A (zh) | 一种基于积分特征通道与灰度投影的车牌识别系统 | |
CN114255403A (zh) | 基于深度学习的光学遥感图像数据处理方法及系统 | |
CN109993806A (zh) | 一种颜色识别方法、装置及电子设备 | |
JP2021068056A (ja) | 路上障害物検知装置、路上障害物検知方法、及び路上障害物検知プログラム | |
CN117789185A (zh) | 基于深度学习的汽车油孔姿态识别系统及方法 | |
CN114331946A (zh) | 一种图像数据处理方法、设备以及介质 | |
CN111222447A (zh) | 基于神经网络及多通道融合lbp特征的活体检测方法 | |
CN111723852B (zh) | 针对目标检测网络的鲁棒训练方法 | |
JP2008251029A (ja) | 文字認識装置、ナンバープレート認識システム | |
CN115424323A (zh) | 风电场权限管理系统及其方法 | |
KR102648354B1 (ko) | 인공 신경망을 이용한 영상 변환 시스템 및 그 방법 | |
Zhang et al. | Deep evidential remote sensing landslide image classification with a new divergence, multiscale saliency and an improved three-branched fusion | |
CN111753722B (zh) | 一种基于特征点类型的指纹识别方法及装置 | |
Oublal et al. | An advanced combination of semi-supervised Normalizing Flow & Yolo (YoloNF) to detect and recognize vehicle license plates | |
CN117437615A (zh) | 雾天交通标志检测方法、装置、存储介质和电子设备 | |
CN113379001B (zh) | 针对图像识别模型的处理方法及装置 | |
JP4264332B2 (ja) | 文字認識装置、ナンバープレート認識システム | |
CN115482463A (zh) | 一种生成对抗网络矿区土地覆盖识别方法及系统 | |
KR20210124727A (ko) | 로고 생성 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20220822 |
|
PA0201 | Request for examination | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20230919 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20240311 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20240312 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20240313 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |