KR102109855B1 - Sift 구분자를 활용한 실내도면 이미지에서의 텍스트 정보 구축 방법 - Google Patents
Sift 구분자를 활용한 실내도면 이미지에서의 텍스트 정보 구축 방법 Download PDFInfo
- Publication number
- KR102109855B1 KR102109855B1 KR1020190025736A KR20190025736A KR102109855B1 KR 102109855 B1 KR102109855 B1 KR 102109855B1 KR 1020190025736 A KR1020190025736 A KR 1020190025736A KR 20190025736 A KR20190025736 A KR 20190025736A KR 102109855 B1 KR102109855 B1 KR 102109855B1
- Authority
- KR
- South Korea
- Prior art keywords
- text
- components
- graphic
- image
- component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 85
- 238000010276 construction Methods 0.000 title abstract description 16
- 238000000926 separation method Methods 0.000 claims abstract description 44
- 230000000877 morphologic effect Effects 0.000 claims abstract description 41
- 238000013145 classification model Methods 0.000 claims abstract description 30
- 238000004458 analytical method Methods 0.000 claims abstract description 27
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 238000012805 post-processing Methods 0.000 claims abstract description 13
- 238000006243 chemical reaction Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G06K9/00456—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G06K9/38—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
Description
도 2 는 본 발명에 따른 실내도면 이미지에서의 텍스트 정보 구축 방법의 전체 흐름도를 나타낸 도면.
도 3 은 텍스트 분류모형 학습·구축 단계에서 실내 도면 DB가 텍스트 이미지와 그래픽 이미지로 분리된 일실시예를 나타낸 도면.
도 4 는 텍스트 분류모형 학습·구축 단계에서 그래픽 연결성분 이미지와 텍스트 연결성분 이미지의 일실시예를 나타낸 도면.
도 5 는 본 발명에 따른 실내도면 이미지에서의 텍스트 정보 구축 방법에서 그래픽 성분과 겹치지 않는 텍스트 분리 단계와 그래픽 성분과 겹치는 텍스트 분리 단계의 상세 흐름도를 나타낸 도면.
도 6 은 사용자가 입력한 실내도면 이미지에 연결성분 분석 결과의 일실시예를 나타낸 도면.
도 7 은 한글 문자의 연결성분 분석 결과의 일실시예를 나타낸 도면.
도 8 은 형태학적 방법론과 연결성분 분석을 활용하여 실내도면 이미지를 텍스트 이미지와 그래픽 이미지로 분리한 일실시예를 나타낸 도면.
도 9 는 SVM-BoW 모형을 활용하여 불완전한 텍스트 이미지에서 텍스트 성분과 그래픽 성분을 분리한 일실시예를 나타낸 도면.
도 10 은 SVM-Descriptor 모형을 활용하여 불완전한 그래픽 이미지에서 텍스트 성분과 그래픽 성분을 분리한 일실시예를 나타낸 도면.
도 11 은 도 9와 도 10에서 생성된 텍스트 성분을 합친 텍스트 이미지와 후처리된 텍스트 이미지의 일실시예를 나타낸 도면.
11: 텍스트 분류모형 학습·구축 모듈
12: 전처리 모듈
13: 겹치지 않는 텍스트 분리 모듈
14: 겹치는 텍스트 분리 모듈
15: 후처리 모듈
20: 저장 장치
Claims (6)
- (a) 텍스트 정보 구축 장치(10)의 텍스트 분류모형 학습·구축 모듈(11)이 실내 도면 DB를 활용하여 텍스트 분류모형(SVM-BoW 모형, SVM-Descriptor 모형)을 학습시키고 구축하는 단계(S10)와;
(b) 텍스트 정보 구축 장치(10)의 전처리 모듈(12)이 텍스트 분리 대상인, 사용자에 의해 입력된 실내도면 이미지를 흰색과 검은색 두 개의 픽셀로 변환·분류하는 이진화 과정을 통해 전처리를 수행하는 단계(S20)와;
(c) 텍스트 정보 구축 장치(10)의 겹치지 않는 텍스트 분리 모듈(13)이 형태학적 방법과 SVM-BoW 모형을 통해 전처리가 완료된 실내도면 이미지에서 그래픽 성분과 겹치지 않는 텍스트를 분리하는 단계(S30)와;
(d) 텍스트 정보 구축 장치(10)의 겹치는 텍스트 분리 모듈(14)이 SVM-Descriptor 모형을 그래픽 성분의 SIFT 구분자에 적용하여 상기 단계(c)가 완료된 실내도면 이미지에서 그래픽 성분과 겹치는 텍스트를 분리하는 단계(S40), 및
(e) 텍스트 정보 구축 장치(10)의 후처리 모듈(15)이 상기 단계(c)에서 생성된 텍스트 이미지와 상기 단계(d)에서 생성된 텍스트 이미지를 합치는 단계를 포함하여 이루어지되,
상기 단계(d)는,
(d1) 겹치는 텍스트 분리 모듈(14)이 상기 단계(a)에서 구축된 SVM-Descriptor 모형을 그래픽 성분의 SIFT 구분자에 적용하여 텍스트로 분류된 특이점들의 위치 정보를 수집하는 단계(S42)와;
(d2) 겹치는 텍스트 분리 모듈(14)이 텍스트 특이점 사이의 거리가 2.5×(여기서, 는 한글 문자의 경우 하나의 문자에서 분리된 연결성분을 하나의 연결성분으로 묶은 후의 텍스트 평균 높이) 이하인 텍스트 특이점들을 하나의 그룹으로 묶고 묶인 그룹을 실내도면 이미지에서 분리하여, 텍스트 성분이 포함된 그래픽 이미지를 텍스트 성분과 그래픽 성분으로 분리하는 단계로 이루어지는 것을 특징으로 하는, SIFT 구분자를 활용한 실내도면 이미지에서의 텍스트 정보 구축 방법.
- 제 1 항에 있어서,
상기 단계(a)는,
(a1) 텍스트 정보 구축 장치(10)의 전처리 모듈(12)이 실내 도면 DB를 흰색과 검은색 두 개의 픽셀로 변환·분류하는 이진화 과정을 통해 전처리를 수행하는 단계(S11)와;
(a2) 상기 텍스트 분류모형 학습·구축 모듈(11)이 실내 도면 DB로부터 분리된 그래픽 이미지와 텍스트 이미지에서 연결성분 분석을 수행한 뒤 텍스트와 그래픽별로 SVM-BoW 모형의 학습데이터인 연결성분 이미지를 생성하고, 실내 도면 DB로부터 분리된 그래픽 이미지와 텍스트 이미지에 SIFT 알고리즘을 적용한 뒤 텍스트와 그래픽별로 SVM-Descriptor 모형의 학습데이터인 SIFT Descriptor를 생성하는 단계(S12)와;
(a3) 상기 텍스트 분류모형 학습·구축 모듈(11)이 생성된 상기 학습데이터(연결성분 이미지, SIFT Descriptor)를 통해 SVM-BoW 모형과 SVM-Descriptor 모형을 학습시키는 단계(S13), 및
(a4) 상기 텍스트 분류모형 학습·구축 모듈(11)이 연결성분의 클래스(텍스트와 그래픽)를 분류하는 SVM-BoW 모형과, SIFT 특이점의 클래스(텍스트와 그래픽)를 분류하는 SVM-Descriptor 모형을 구축하는 단계(S14)로 이루어지는 것을 특징으로 하는, SIFT 구분자를 활용한 실내도면 이미지에서의 텍스트 정보 구축 방법.
- 제 1 항에 있어서,
상기 단계(c)는,
(c1) 겹치지 않는 텍스트 분리 모듈(13)이 실내도면 이미지에 연결성분 분석 후 형태학적 방법을 통한 텍스트 성분 분리를 통해 그래픽 성분과 겹치지 않는 텍스트 성분을 분리하는 단계(S31)와;
(c2) 상기 단계(c1)에서 분리한 텍스트 성분 중에는 형태학적 방법으로 분리되지 않는 형태학적으로 텍스트 연결성분과 유사한 그래픽 성분이 포함되어 있으므로, 겹치지 않는 텍스트 분리 모듈(13)이 상기 단계(a)에서 구축된 SVM-BoW 모형을 통해 텍스트 연결성분으로 분류된 연결성분들만을 분리하여 실내도면 이미지를 그래픽 성분과 겹치지 않는 텍스트 이미지와 텍스트 연결성분과 형태가 유사한 그래픽 이미지로 분리하는 단계(S32)로 이루어지는 것을 특징으로 하는, SIFT 구분자를 활용한 실내도면 이미지에서의 텍스트 정보 구축 방법.
- 삭제
- 제 1 항에 있어서,
(f) 후처리 모듈(15)이 상기 단계(e)에서 합쳐진 텍스트 이미지에 연결성분 분석을 수행하고 연결성분 간 거리가 연결성분의 높이 평균의 2.5배 이하인 연결성분들을 하나의 그룹으로 묶어 원본 실내도면 이미지에서 텍스트 성분을 분리하는 후처리 과정을 거쳐 최종 텍스트 이미지를 생성하는 단계가 추가되는 것을 특징으로 하는, SIFT 구분자를 활용한 실내도면 이미지에서의 텍스트 정보 구축 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190025736A KR102109855B1 (ko) | 2019-03-06 | 2019-03-06 | Sift 구분자를 활용한 실내도면 이미지에서의 텍스트 정보 구축 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190025736A KR102109855B1 (ko) | 2019-03-06 | 2019-03-06 | Sift 구분자를 활용한 실내도면 이미지에서의 텍스트 정보 구축 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102109855B1 true KR102109855B1 (ko) | 2020-05-12 |
Family
ID=70679402
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190025736A Active KR102109855B1 (ko) | 2019-03-06 | 2019-03-06 | Sift 구분자를 활용한 실내도면 이미지에서의 텍스트 정보 구축 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102109855B1 (ko) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102274081B1 (ko) * | 2021-04-12 | 2021-07-07 | 사단법인 한국선급 | 딥러닝을 이용한 선박 도면 내 객체 인식 시스템 |
CN114638957A (zh) * | 2022-03-14 | 2022-06-17 | 北京感易智能科技有限公司 | 文本分离方法、装置、电子设备和存储介质 |
KR20230036327A (ko) * | 2021-09-07 | 2023-03-14 | 서울대학교산학협력단 | 패치기반의 딥러닝 알고리즘을 통한 실내도면 이미지에서의 실내공간정보 자동추출방법 및 그 장치 |
CN118887671A (zh) * | 2024-09-29 | 2024-11-01 | 湖北微模式科技发展有限公司 | 一种基于图像处理的彩色文字打印重影质检方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011022938A (ja) * | 2009-07-17 | 2011-02-03 | Fujitsu Ltd | 文字認識装置、文字認識プログラムおよび文字認識方法 |
KR20140061033A (ko) * | 2012-11-13 | 2014-05-21 | 삼성전자주식회사 | 문서 영상 인식 방법, 장치 및 이를 이용한 사진 촬영 방법 |
-
2019
- 2019-03-06 KR KR1020190025736A patent/KR102109855B1/ko active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011022938A (ja) * | 2009-07-17 | 2011-02-03 | Fujitsu Ltd | 文字認識装置、文字認識プログラムおよび文字認識方法 |
KR20140061033A (ko) * | 2012-11-13 | 2014-05-21 | 삼성전자주식회사 | 문서 영상 인식 방법, 장치 및 이를 이용한 사진 촬영 방법 |
Non-Patent Citations (1)
Title |
---|
2002 International Work shop on Document Analysis Systems, Springer, Princeton, NJ, USA, Aug. 19-21, pp. 200-211.;Tombre, K., S. Tabbone, L. Pelissier, B. Lamiroy, and P. Dosch; Text/graphics separation revisited |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102274081B1 (ko) * | 2021-04-12 | 2021-07-07 | 사단법인 한국선급 | 딥러닝을 이용한 선박 도면 내 객체 인식 시스템 |
KR20230036327A (ko) * | 2021-09-07 | 2023-03-14 | 서울대학교산학협력단 | 패치기반의 딥러닝 알고리즘을 통한 실내도면 이미지에서의 실내공간정보 자동추출방법 및 그 장치 |
KR102535054B1 (ko) | 2021-09-07 | 2023-05-26 | 서울대학교산학협력단 | 패치기반의 딥러닝 알고리즘을 통한 실내도면 이미지에서의 실내공간정보 자동추출방법 및 그 장치 |
CN114638957A (zh) * | 2022-03-14 | 2022-06-17 | 北京感易智能科技有限公司 | 文本分离方法、装置、电子设备和存储介质 |
CN118887671A (zh) * | 2024-09-29 | 2024-11-01 | 湖北微模式科技发展有限公司 | 一种基于图像处理的彩色文字打印重影质检方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Moreno-García et al. | New trends on digitisation of complex engineering drawings | |
KR102109855B1 (ko) | Sift 구분자를 활용한 실내도면 이미지에서의 텍스트 정보 구축 방법 | |
CN110929665A (zh) | 一种自然场景曲线文本检测方法 | |
CN109685065B (zh) | 试卷内容自动分类的版面分析方法、系统 | |
Fabrizio et al. | Textcatcher: a method to detect curved and challenging text in natural scenes | |
Kölsch et al. | Recognizing challenging handwritten annotations with fully convolutional networks | |
Bhatti et al. | Image search in patents: a review | |
Abedin et al. | Traffic sign recognition using hybrid features descriptor and artificial neural network classifier | |
Mishchenko et al. | Model-based chart image classification | |
CN115620322A (zh) | 一种基于关键点检测的全线表表格结构识别方法 | |
Sarkar et al. | Suppression of non-text components in handwritten document images | |
Hamplová et al. | Cuneiform reading using computer vision algorithms | |
Mizanur Rahman et al. | Graph-based object detection enhancement for symbolic engineering drawings | |
KS et al. | SolveIt: an application for automated recognition and processing of handwritten mathematical equations | |
CN118135582A (zh) | 文献图表提取及分类方法、系统、计算机设备及存储介质 | |
Ganpatrao et al. | Information extraction from topographic map using colour and shape analysis | |
Kashevnik et al. | An approach to engineering drawing organization: Title block detection and processing | |
Samundiswary et al. | Real-time detection and classification of street signs using deep learning with voice alert system | |
Sinha et al. | An effective real-time approach to automatic number plate recognition (ANPR) using YOLOv3 and OCR | |
Chen et al. | Text detection in traffic informatory signs using synthetic data | |
Zaki et al. | Hand drawn graph recognition | |
Gupta et al. | HTML Atomic UI Elements Extraction from Hand-Drawn Website Images using Mask-RCNN and novel Multi-Pass Inference Technique. | |
Bhutra et al. | Enhanced Recognition of Hand-Drawn Circuit Components Using Fast R-CNN and Faster R-CNN | |
Alexiou et al. | An evaluation of table detection methods in document images | |
Li et al. | Comic2cebx: a system for automatic comic content adaptation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20190306 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20200326 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20200501 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20200506 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20200506 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20230424 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20240424 Start annual number: 5 End annual number: 5 |