KR102580658B1 - 스케치 이미지 객체 탐지를 위한 이미지 변환 장치 및 방법 - Google Patents
스케치 이미지 객체 탐지를 위한 이미지 변환 장치 및 방법 Download PDFInfo
- Publication number
- KR102580658B1 KR102580658B1 KR1020220079047A KR20220079047A KR102580658B1 KR 102580658 B1 KR102580658 B1 KR 102580658B1 KR 1020220079047 A KR1020220079047 A KR 1020220079047A KR 20220079047 A KR20220079047 A KR 20220079047A KR 102580658 B1 KR102580658 B1 KR 102580658B1
- Authority
- KR
- South Korea
- Prior art keywords
- image
- catalog
- sketch
- object detection
- fine
- Prior art date
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 101
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 99
- 238000000034 method Methods 0.000 title claims abstract description 79
- 239000011159 matrix material Substances 0.000 claims description 22
- 238000012549 training Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 238000011426 transformation method Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 18
- 238000005516 engineering process Methods 0.000 description 7
- 238000013135 deep learning Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000009246 art therapy Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G06T3/0056—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/20—Drawing from basic elements, e.g. lines or circles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
Description
도 2는 도 1의 이미지 변환 장치의 시스템 구성을 설명하는 도면이다.
도 3은 도 1의 이미지 변환 장치의 기능적 구성을 설명하는 도면이다.
도 4는 본 발명에 따른 스케치 이미지 객체 탐지를 위한 이미지 변환 방법을 설명하는 순서도이다.
도 5는 본 발명에 따른 스케치 이미지 객체 탐지를 위한 이미지 변환 과정을 설명하는 도면이다.
도 6은 본 발명에 따른 그람 매트릭스의 생성 과정을 설명하는 도면이다.
도 7은 본 발명에 따른 드로잉 카탈로그의 일 실시예를 설명하는 도면이다.
도 8은 본 발명에 따른 카탈로그 이미지 생성 모델의 구축을 위한 CycleGAN의 학습 과정을 설명하는 도면이다.
도 9는 본 발명에 따른 CycleGAN을 이용한 추론 이미지 생성 과정의 일 실시예를 설명하는 도면이다.
도 10은 본 발명에 따른 mAP 기준 드로잉 카탈로그 선정 과정의 일 실시예를 설명하는 도면이다.
110: 사용자 단말 130: 이미지 변환 장치
150: 데이터베이스
210: 프로세서 230: 메모리
250: 사용자 입출력부 270: 네트워크 입출력부
310: 드로잉 카탈로그 생성부 320: 모델 구축부
330: 이미지 변환부 340: 미세조정 수행부
350: 카탈로그 결정부 360: 객체 탐지부
Claims (14)
- 드로잉(drawing) 이미지 데이터셋의 각 드로잉 이미지로부터 추출된 그람 매트릭스(gram matrix)들을 클러스터링(clustering)하여 드로잉 카탈로그를 생성하는 드로잉 카탈로그 생성부;
스케치(sketch) 이미지를 입력으로 수신하여 각 드로잉 카탈로그의 스타일로 변환된 스타일 이미지를 출력으로 생성하는 카탈로그 이미지 생성 모델을 상기 드로잉 카탈로그 별로 구축하는 모델 구축부;
상기 카탈로그 이미지 생성 모델을 이용하여 스케치 이미지 데이터셋의 각 스케치 이미지에 대해 상기 드로잉 카탈로그별 스타일 이미지들로 변환하는 이미지 변환부;
상기 드로잉 카탈로그별 스타일 이미지들을 이용하여 사전학습된 객체 탐지 모델에 대한 미세조정(fine tuning)을 수행하여 상기 드로잉 카탈로그 별로 미세조정된 객체 탐지 모델들을 생성하는 미세조정 수행부; 및
상기 미세조정된 객체 탐지 모델들 중에서 특정 성능지표를 기준으로 가장 높은 성능을 제공하는 모델에 해당하는 최상위 모델의 해당 드로잉 카탈로그를 스케치 특화 객체 카탈로그로 결정하는 카탈로그 결정부;를 포함하는 스케치 이미지 객체 탐지를 위한 이미지 변환 장치.
- 제1항에 있어서, 상기 드로잉 카탈로그 생성부는
상기 각 드로잉 이미지를 CNN(Convolution Neural Network)에 입력하고 상기 CNN의 개별 레이어 간의 채널(Channel)별 내적(product)을 통해 상기 그람 매트릭스를 생성하는 것을 특징으로 하는 스케치 이미지 객체 탐지를 위한 이미지 변환 장치.
- 제1항에 있어서, 상기 드로잉 카탈로그 생성부는
IMSAT(Information Maximizing Self-Augmented Training) 알고리즘을 이용하여 상기 그람 매트릭스들의 값에 관한 군집들을 상기 드로잉 카탈로그로서 생성하는 것을 특징으로 하는 스케치 이미지 객체 탐지를 위한 이미지 변환 장치.
- 제1항에 있어서, 상기 모델 구축부는
제1 도메인의 참조 이미지의 스타일을 제2 도메인의 타겟 이미지로 변환하는 CycleGAN을 기초로 상기 카탈로그 이미지 생성 모델을 구축하는 것을 특징으로 하는 스케치 이미지 객체 탐지를 위한 이미지 변환 장치.
- 제4항에 있어서, 상기 모델 구축부는
상기 스케치 이미지를 상기 제1 도메인으로 지정하고 상기 드로잉 카탈로그를 상기 제2 도메인으로 지정하여 상기 드로잉 카탈로그 별로 상기 CycleGAN에 관한 학습을 독립적으로 수행하는 것을 특징으로 하는 스케치 이미지 객체 탐지를 위한 이미지 변환 장치.
- 제1항에 있어서, 상기 미세조정 수행부는
상기 사전학습된 YOLO(You Only Look Once)를 미세조정하여 미세조정된 YOLO를 생성하는 것을 특징으로 하는 스케치 이미지 객체 탐지를 위한 이미지 변환 장치.
- 제1항에 있어서, 상기 카탈로그 결정부는
상기 미세조정된 객체 탐지 모델들에 관한 성능지표인 mAP(mean Average Precision)를 산출한 다음 가장 높은 mAP에 해당하는 모델을 상기 최상위 모델로 결정하는 것을 특징으로 하는 스케치 이미지 객체 탐지를 위한 이미지 변환 장치.
- 제1항에 있어서,
사용자 단말로부터 특정 스케치 이미지가 입력되면 상기 특정 스케치 이미지를 상기 스케치 특화 객체 카탈로그의 스타일로 변환하는 제1 과정과 스타일 변환된 특정 스케치 이미지 내에서 객체를 탐지하는 제2 과정을 수행하여 상기 특정 스케치 이미지에 관한 객체 탐지 결과를 생성하는 객체 탐지부;를 더 포함하는 것을 특징으로 하는 스케치 이미지 객체 탐지를 위한 이미지 변환 장치.
- 제8항에 있어서, 상기 객체 탐지부는
상기 제1 과정에서 상기 스케치 특화 객체 카탈로그의 카탈로그 이미지 생성 모델을 적용하고 상기 제2 과정에서 상기 스케치 특화 객체 카탈로그의 미세조정된 객체 탐지 모델을 적용하는 것을 특징으로 하는 스케치 이미지 객체 탐지를 위한 이미지 변환 장치.
- 드로잉 카탈로그 생성부를 통해, 드로잉(drawing) 이미지 데이터셋의 각 드로잉 이미지로부터 추출된 그람 매트릭스(gram matrix)들을 클러스터링(clustering)하여 드로잉 카탈로그를 생성하는 단계;
모델 구축부를 통해, 스케치(sketch) 이미지를 입력으로 수신하여 각 드로잉 카탈로그의 스타일로 변환된 스타일 이미지를 출력으로 생성하는 카탈로그 이미지 생성 모델을 상기 드로잉 카탈로그 별로 구축하는 단계;
이미지 변환부를 통해, 상기 카탈로그 이미지 생성 모델을 이용하여 스케치 이미지 데이터셋의 각 스케치 이미지에 대해 상기 드로잉 카탈로그별 스타일 이미지들로 변환하는 단계;
미세조정 수행부를 통해, 상기 드로잉 카탈로그별 스타일 이미지들을 이용하여 사전학습된 객체 탐지 모델에 대한 미세조정(fine tuning)을 수행하여 상기 드로잉 카탈로그 별로 미세조정된 객체 탐지 모델들을 생성하는 단계; 및
카탈로그 결정부를 통해, 상기 미세조정된 객체 탐지 모델들 중에서 특정 성능지표를 기준으로 가장 높은 성능을 제공하는 모델에 해당하는 최상위 모델의 해당 드로잉 카탈로그를 스케치 특화 객체 카탈로그로 결정하는 단계;를 포함하는 스케치 이미지 객체 탐지를 위한 이미지 변환 방법.
- 제10항에 있어서, 상기 상기 드로잉 카탈로그 별로 구축하는 단계는
제1 도메인의 참조 이미지의 스타일을 제2 도메인의 타겟 이미지로 변환하는 CycleGAN을 기초로 상기 카탈로그 이미지 생성 모델을 구축하는 단계를 포함하는 것을 특징으로 하는 스케치 이미지 객체 탐지를 위한 이미지 변환 방법.
- 제10항에 있어서, 상기 미세조정된 객체 탐지 모델들을 생성하는 단계는
상기 사전학습된 YOLO(You Only Look Once)를 미세조정하여 미세조정된 YOLO를 생성하는 단계를 포함하는 것을 특징으로 하는 스케치 이미지 객체 탐지를 위한 이미지 변환 방법.
- 제10항에 있어서,
객체 탐지부를 통해, 사용자 단말로부터 특정 스케치 이미지가 입력되면 상기 특정 스케치 이미지를 상기 스케치 특화 객체 카탈로그의 스타일로 변환하는 제1 과정과 스타일 변환된 특정 스케치 이미지 내에서 객체를 탐지하는 제2 과정을 수행하여 상기 특정 스케치 이미지에 관한 객체 탐지 결과를 생성하는 단계;를 더 포함하는 것을 특징으로 하는 스케치 이미지 객체 탐지를 위한 이미지 변환 방법.
- 제13항에 있어서, 상기 객체 탐지 결과를 생성하는 단계는
상기 제1 과정에서 상기 스케치 특화 객체 카탈로그의 카탈로그 이미지 생성 모델을 적용하고 상기 제2 과정에서 상기 스케치 특화 객체 카탈로그의 미세조정된 객체 탐지 모델을 적용하는 단계를 포함하는 것을 특징으로 하는 스케치 이미지 객체 탐지를 위한 이미지 변환 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220079047A KR102580658B1 (ko) | 2022-06-28 | 2022-06-28 | 스케치 이미지 객체 탐지를 위한 이미지 변환 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220079047A KR102580658B1 (ko) | 2022-06-28 | 2022-06-28 | 스케치 이미지 객체 탐지를 위한 이미지 변환 장치 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102580658B1 true KR102580658B1 (ko) | 2023-09-21 |
Family
ID=88189168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220079047A KR102580658B1 (ko) | 2022-06-28 | 2022-06-28 | 스케치 이미지 객체 탐지를 위한 이미지 변환 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102580658B1 (ko) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190138438A (ko) * | 2018-06-05 | 2019-12-13 | 네이버 주식회사 | 모바일 환경에서 실시간 추론이 가능한 dnn 구성을 위한 최적화 기법 |
KR20200087340A (ko) | 2018-12-31 | 2020-07-21 | 아주대학교산학협력단 | 딥러닝을 이용한 객체 인식 방법 및 장치 |
KR20200093424A (ko) * | 2019-01-28 | 2020-08-05 | 주식회사 스트라드비젼 | 도메인 적응에 적용될 수 있는 사이클 gan을 이용하여 실제 이미지 상의 객체 검출에 사용되는, 실제 세계 상의 실제 이미지를 가상 세계 상의 가상 이미지로 변환하는 런타임 입력 변환을 위한 학습 방법 및 학습 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치 |
KR102404166B1 (ko) * | 2021-07-20 | 2022-06-02 | 국민대학교산학협력단 | 스타일 전이를 활용한 엑스레이 영상의 유체 탐지 방법 및 장치 |
-
2022
- 2022-06-28 KR KR1020220079047A patent/KR102580658B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190138438A (ko) * | 2018-06-05 | 2019-12-13 | 네이버 주식회사 | 모바일 환경에서 실시간 추론이 가능한 dnn 구성을 위한 최적화 기법 |
KR20200087340A (ko) | 2018-12-31 | 2020-07-21 | 아주대학교산학협력단 | 딥러닝을 이용한 객체 인식 방법 및 장치 |
KR20200093424A (ko) * | 2019-01-28 | 2020-08-05 | 주식회사 스트라드비젼 | 도메인 적응에 적용될 수 있는 사이클 gan을 이용하여 실제 이미지 상의 객체 검출에 사용되는, 실제 세계 상의 실제 이미지를 가상 세계 상의 가상 이미지로 변환하는 런타임 입력 변환을 위한 학습 방법 및 학습 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치 |
KR102404166B1 (ko) * | 2021-07-20 | 2022-06-02 | 국민대학교산학협력단 | 스타일 전이를 활용한 엑스레이 영상의 유체 탐지 방법 및 장치 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11853903B2 (en) | SGCNN: structural graph convolutional neural network | |
JP7193252B2 (ja) | 画像の領域のキャプション付加 | |
EP3686848A1 (en) | Semantic image synthesis for generating substantially photorealistic images using neural networks | |
CN111027563B (zh) | 一种文本检测方法、装置及识别系统 | |
US11741361B2 (en) | Machine learning-based network model building method and apparatus | |
Chai et al. | Autohair: Fully automatic hair modeling from a single image | |
CN112883839B (zh) | 基于自适应样本集构造与深度学习的遥感影像解译方法 | |
CN112819686B (zh) | 基于人工智能的图像风格处理方法、装置及电子设备 | |
US11170264B2 (en) | Labeling using interactive assisted segmentation | |
US20160155016A1 (en) | Method for Implementing a High-Level Image Representation for Image Analysis | |
CN110837836A (zh) | 基于最大化置信度的半监督语义分割方法 | |
CN111967533B (zh) | 一种基于场景识别的草图图像翻译方法 | |
US20220270341A1 (en) | Method and device of inputting annotation of object boundary information | |
Yuan et al. | Modeling spatial layout for scene image understanding via a novel multiscale sum-product network | |
Sicre et al. | Discriminative part model for visual recognition | |
Saqib et al. | Intelligent dynamic gesture recognition using CNN empowered by edit distance | |
CN111079374A (zh) | 字体生成方法、装置和存储介质 | |
Zhang et al. | Facial component-landmark detection with weakly-supervised LR-CNN | |
KR102580658B1 (ko) | 스케치 이미지 객체 탐지를 위한 이미지 변환 장치 및 방법 | |
KR102624934B1 (ko) | 딥러닝 모델 구축의 효율성 향상을 위한 이미지 초해상화 기반 선택적 레이블링 장치 및 방법 | |
KR102437396B1 (ko) | 모델 학습 방법 | |
Cao et al. | Understanding 3D point cloud deep neural networks by visualization techniques | |
Quan et al. | Object detection model based on deep dilated convolutional networks by fusing transfer learning | |
KR20220029366A (ko) | 모델 학습 방법 | |
CN113536016A (zh) | 一种融合图卷积的跨模态检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20220628 |
|
PA0201 | Request for examination | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20230622 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20230816 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20230915 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20230918 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |