KR102131273B1 - 영상분할을 위한 신경망 학습장치 및 방법 - Google Patents
영상분할을 위한 신경망 학습장치 및 방법 Download PDFInfo
- Publication number
- KR102131273B1 KR102131273B1 KR1020180086684A KR20180086684A KR102131273B1 KR 102131273 B1 KR102131273 B1 KR 102131273B1 KR 1020180086684 A KR1020180086684 A KR 1020180086684A KR 20180086684 A KR20180086684 A KR 20180086684A KR 102131273 B1 KR102131273 B1 KR 102131273B1
- Authority
- KR
- South Korea
- Prior art keywords
- learning
- resolution
- batch
- patches
- image
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 28
- 238000003709 image segmentation Methods 0.000 title claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 52
- 230000008569 process Effects 0.000 claims abstract description 18
- 238000005070 sampling Methods 0.000 claims abstract description 15
- 238000002372 labelling Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 7
- 230000007423 decrease Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000013480 data collection Methods 0.000 description 2
- 230000007786 learning performance Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
Description
도 2는 초고해상도 원영상에서 서로 다른 해상도의 패치를 나타낸 설명도이다.
도 3은 종래 학습방법의 흐름도이다.
도 4는 본 발명의 바람직한 실시예에 따른 객체 인식을 위한 신경망 학습 장치의 구성도이다.
도 5는 본 발명의 바람직한 실시예에 따른 객체 인식을 위한 신경망 학습방법의 흐름도이다.
도 6은 다운샘플링된 원영상과 패치의 관계도이다.
Claims (10)
- 원영상의 패치들을 입력하는 영상입력부;
입력된 상기 패치들을 다단계의 다운샘플링을 통해 해상도가 단계적으로 다른 동일 패치들로 변환하는 다운샘플링 처리부;
상기 다운샘플링 처리부에서 처리된 패치들을 동일 해상도별 묶음인 배치로 묶어 처리하는 배치 처리부; 및
해상도별 상기 배치들을 입력받아, 해상도가 가장 낮은 배치로부터 가장 높은 배치까지 단계적으로 학습하여 최종 학습 파라미터를 제공하되,
해상도가 가장 낮은 배치의 학습은 초기 학습 파라미터를 이용하여 학습하고, 해상도가 가장 낮은 배치의 학습 결과인 출력 파라미터를 그 다음으로 해상도가 낮은 배치의 학습에 이용하는 과정을 해상도가 가장 높은 배치의 학습까지 단계적으로 수행하여 최종 학습 파라미터를 생성하는 학습처리부를 포함하는 영상분할을 위한 신경망 학습장치. - 제1항에 있어서,
상기 학습처리부는,
입력된 원영상의 패치들과 대응되는 레이블링 영상의 패치들을 출력할 수 있도록 학습 파라미터를 수정하는 것을 특징으로 하는 영상분할을 위한 신경망 학습장치. - 삭제
- 제1항에 있어서,
해상도가 가장 높은 배치의 해상도는 원영상의 해상도인 것을 특징으로 하는 영상분할을 위한 신경망 학습장치. - 제1항에 있어서,
상기 배치는 패치들의 집합이며,
하나의 배치에는 해상도가 상대적으로 낮은 패치들이 해상도가 상대적으로 높은 패치들보다 더 많이 포함되는 것을 특징으로 하는 영상분할을 위한 신경망 학습장치. - a) 원영상의 패치들을 단계적으로 다운샘플링하여, 해상도가 단계적으로 다른 동일 패치들을 생성하는 단계;
b) 해상도가 단계적으로 다른 패치들을 그룹화하여 해상도별 배치로 처리하는 단계; 및
c) 해상도가 가장 낮은 배치부터 가장 높은 배치까지 단계적으로 학습하여 최종 학습 파라미터를 생성하는 단계를 포함하되,
상기 c) 단계는,
c1) 해상도가 가장 낮은 배치를 초기 학습 파라미터를 이용하여 학습하는 과정;
c2) 상기 c1 과정의 출력 파라미터를 이용하여 그 다음으로 해상도가 낮은 배치의 학습에 이용하는 과정을 포함하여,
해상도가 가장 낮은 배치로부터 가장 높은 배치까지 단계적으로 학습하되, 이전 단계의 학습 결과인 출력 파라미터를 다음 단계의 학습 파라미터로 사용하는 것을 특징으로 하는 영상분할을 위한 신경망 학습방법. - 제6항에 있어서,
상기 c) 단계의 학습은,
입력된 원영상의 패치들과 대응되는 레이블링 영상의 패치들을 출력할 수 있도록 학습 파라미터를 수정하는 과정인 것을 특징으로 하는 영상분할을 위한 신경망 학습방법. - 삭제
- 제6항에 있어서,
해상도가 가장 높은 배치의 해상도는 원영상의 해상도인 것을 특징으로 하는 영상분할을 위한 신경망 학습방법. - 제6항에 있어서,
상기 배치는 패치들의 집합이며,
하나의 배치에는 해상도가 상대적으로 낮은 패치들이 해상도가 상대적으로 높은 패치들보다 더 많이 포함되는 것을 특징으로 하는 영상분할을 위한 신경망 학습방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180086684A KR102131273B1 (ko) | 2018-07-25 | 2018-07-25 | 영상분할을 위한 신경망 학습장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180086684A KR102131273B1 (ko) | 2018-07-25 | 2018-07-25 | 영상분할을 위한 신경망 학습장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200011789A KR20200011789A (ko) | 2020-02-04 |
KR102131273B1 true KR102131273B1 (ko) | 2020-08-05 |
Family
ID=69571031
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180086684A KR102131273B1 (ko) | 2018-07-25 | 2018-07-25 | 영상분할을 위한 신경망 학습장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102131273B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022099118A1 (en) * | 2020-11-09 | 2022-05-12 | Canon U.S.A., Inc. | Detection of image sharpness in frequency domain |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004252940A (ja) | 2002-07-22 | 2004-09-09 | Mitsubishi Electric Research Laboratories Inc | 画像内のオブジェクトを検出するシステムおよび方法 |
-
2018
- 2018-07-25 KR KR1020180086684A patent/KR102131273B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004252940A (ja) | 2002-07-22 | 2004-09-09 | Mitsubishi Electric Research Laboratories Inc | 画像内のオブジェクトを検出するシステムおよび方法 |
Non-Patent Citations (3)
Title |
---|
"DeepEdge: A Multi-Scale Bifurcated Deep Network for Top-Down Contour Detection", The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2015.04.* |
"RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation", The IEEE Conference on Computer Vision and Pattern Recognition, 2017.07.* |
Image Segmentation-Based Multi-Focus Image Fusion Through Multi-Scale Convolutional Neural Network", IEEE, 2017.08. |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022099118A1 (en) * | 2020-11-09 | 2022-05-12 | Canon U.S.A., Inc. | Detection of image sharpness in frequency domain |
Also Published As
Publication number | Publication date |
---|---|
KR20200011789A (ko) | 2020-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112446383B (zh) | 车牌识别方法及装置、存储介质、终端 | |
US11301965B2 (en) | Method and image processing device for image super resolution, image enhancement, and convolutional neural network model training | |
EP3427195B1 (en) | Convolutional neural networks, particularly for image analysis | |
CN110532897B (zh) | 零部件图像识别的方法和装置 | |
EP3776451B1 (en) | Image processing apparatus, image processing method thereof, image processing system, and training method thereof | |
CN109949224B (zh) | 一种基于深度学习的联级超分辨率重建的方法及装置 | |
CN113570508A (zh) | 图像修复方法及装置、存储介质、终端 | |
US11176672B1 (en) | Machine learning method, machine learning device, and machine learning program | |
EP3120322A1 (en) | Method for processing input low-resolution (lr) image to output high-resolution (hr) image | |
CN111626267B (zh) | 一种利用空洞卷积的高光谱遥感图像分类方法 | |
CN111340049B (zh) | 基于广域动态卷积的图像处理方法及装置 | |
CN113841162A (zh) | 深度神经网络中的深度优先卷积 | |
CN111444923A (zh) | 自然场景下图像语义分割方法和装置 | |
US20230289608A1 (en) | Optimizing Supervised Generative Adversarial Networks via Latent Space Regularizations | |
KR102131273B1 (ko) | 영상분할을 위한 신경망 학습장치 및 방법 | |
CN111611999B (zh) | 一种融合小型深度生成模型的显著性检测方法及终端 | |
KR20190138434A (ko) | 기계 학습 장치 및 기계 학습 장치의 학습 방법 | |
US12190472B2 (en) | Video enhancement method and apparatus, and electronic device and storage medium | |
CN111402164B (zh) | 矫正网络模型的训练方法和装置、文本识别方法和装置 | |
KR20210061800A (ko) | 희소 신경망 생성 방법 및 이를 위한 시스템 | |
CN114943655B (zh) | 基于循环深度卷积生成对抗网络结构的图像修复系统 | |
CN117218344A (zh) | 基于深度神经网络的火星表面目标分割方法、装置及设备 | |
CN110211041B (zh) | 一种基于感受野集成的神经网络图像分类器的优化方法 | |
JP6942204B2 (ja) | データ処理システムおよびデータ処理方法 | |
CN113128614A (zh) | 基于图像梯度的卷积方法、基于方向卷积的神经网络及分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20180725 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20191125 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20200526 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20200701 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20200701 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20230626 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20240624 Start annual number: 5 End annual number: 5 |