KR100540173B1 - 주소기입형식 구분 장치 및 그 방법과 그를 이용한 주소인식 시스템 - Google Patents
주소기입형식 구분 장치 및 그 방법과 그를 이용한 주소인식 시스템 Download PDFInfo
- Publication number
- KR100540173B1 KR100540173B1 KR1020030071032A KR20030071032A KR100540173B1 KR 100540173 B1 KR100540173 B1 KR 100540173B1 KR 1020030071032 A KR1020030071032 A KR 1020030071032A KR 20030071032 A KR20030071032 A KR 20030071032A KR 100540173 B1 KR100540173 B1 KR 100540173B1
- Authority
- KR
- South Korea
- Prior art keywords
- address
- image
- character
- string
- connection element
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 239000013598 vector Substances 0.000 claims abstract description 26
- 238000013528 artificial neural network Methods 0.000 claims abstract description 10
- 238000000605 extraction Methods 0.000 claims description 18
- 239000000284 extract Substances 0.000 claims description 6
- 238000000926 separation method Methods 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 5
- 239000000463 material Substances 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/273—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion removing elements interfering with the pattern to be recognised
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
Description
본 발명에서 '최상위 문자열'은 주소 영상에서 첫 번째 문자열을 의미한다.
그리고, 영상에서 가로방향을 x축, 세로방향을 y축이라고 하고 영상의 왼쪽 상단의 좌표를 (0,0)이라고 정의할 때, '스카이 라인'은 각 x 좌표상에 존재하는 검은 화소들 중 최소 y값을 x 좌표 기준 왼쪽에서 오른쪽 방향으로 정렬해 놓은 y 좌표 리스트를 의미한다.
Claims (10)
- 주소기입형식 구분 장치에 있어서,영상 입력기로부터 획득된 영상에 존재하는 명도 레벨의 주소 영상을 획득하기 위한 주소 영상 입력수단;상기 주소 영상을 이진 주소 영상으로 변환하기 위한 영상 이진화수단;상기 이진 주소 영상에서 방향 연결성을 갖는 연결요소를 추출하기 위한 연결요소 추출수단;크기 및 화소 밀도 정도를 바탕으로, 상기 연결요소에서 잡영으로 추정되는 연결요소를 제거하기 위한 잡영 제거수단;잡영이 제거되고 남아있는 연결요소 중에서 최상위 문자열에 속하는 연결요소를 선택하기 위한 연결요소 선택수단;상기 최상위 문자열에 속하는 연결요소를 문자단위로 병합하기 위한 연결요소 병합수단;문자단위로 병합된 연결요소의 각 그룹을 최소인접사각형으로 표현한 후, 최소인접사각형으로부터 분류를 위한 특징을 추출하기 위한 특징 추출수단; 및상기 특징 추출수단으로부터 제공받은 폭 크기 및 위치 특징 벡터를 입력으로 받는 다층 신경망을 사용하여 주소 영상의 기입형식을 구분하기 위한 주소기입형식 분류수단을 포함하는 주소기입형식 구분 장치.
- 제 1 항에 있어서,상기 연결요소 선택수단은,잡영이 제거되고 남아있는 연결요소 중에서 주소기입형식 구분을 위한 영상의 단위로 주소 영상의 최상위 문자열에 속하는 연결요소들만을 선택하되, 최상위 문자열에 속하는 연결요소들을 선택하기 위하여, 주소 영상에서 스카이 라인을 형성하는 연결요소를 추출하고, 주소 영상에서 스카이 라인을 형성하는 연결요소 중 y값의 평균(여기서, y값의 평균은 주소 영상에서 스카이 라인을 형성하는 연결요소들의 y값의 평균임)보다 아래에 존재하는 연결요소를 제거하는 것을 특징으로 하는 주소기입형식 구분 장치.
- 제 1 항에 있어서,상기 연결요소 병합수단은,잡영이 제거되고 남아있는 연결요소들을 대략적인 문자단위로 병합하되, 수평방향으로 주어진 임계치 이내의 거리에 있는 연결요소들을 병합하거나, 수직방향으로 주어진 임계치 이상으로 겹침이 발생한 연결요소들을 병합하는 것을 특징으로 하는 주소기입형식 구분 장치.
- 제 4 항에 있어서,상기 폭 크기 특징 벡터를 계산하기 위하여 상기 최소인접사각형들로부터 계산된 폭 크기값을 폭 크기 히스토그램의 해당 계급구간에 누적하여 계산하고, 상기 폭 크기 히스토그램의 계급구간의 시작점과 끝점 그리고 계급구간의 개수는 훈련 데이터를 사용하여 결정하며, 상기 폭 크기 히스토그램 각각을 원소의 합이 1이 되도록 정규화하여 사용하는 것을 특징으로 하는 주소기입형식 구분 장치.
- 제 6 항에 있어서,상기 위치 특징 벡터를 계산하기 위하여 상기 최소인접사각형들로부터 계산된 위치값을 위치 히스토그램의 해당 계급구간에 누적하여 계산하고, 상기 위치 히스토그램의 계급구간의 시작점과 끝점 그리고 계급구간의 개수는 훈련 데이터를 사용하여 결정하며, 상기 위치 히스토그램 각각을 원소의 합이 1이 되도록 정규화하여 사용하는 것을 특징으로 하는 주소기입형식 구분 장치.
- 주소기입형식 구분 장치에 적용되는 주소기입형식 구분 방법에 있어서,영상 입력기로부터 획득된 영상에 존재하는 명도 레벨의 주소 영상을 이진 주소 영상으로 변환하는 단계;상기 이진 주소 영상에서 방향 연결성을 갖는 연결요소를 추출하여, 상기 연결요소에서 잡영으로 추정되는 연결요소를 제거하고, 잡영이 제거되고 남아있는 연결요소 중에서 최상위 문자열에 속하는 연결요소를 선택하는 단계;상기 최상위 문자열에 속하는 연결요소를 문자단위로 병합하여, 문자단위로 병합된 연결요소의 최소인접사각형으로부터 분류를 위한 특징을 추출하는 단계; 및추출된 폭 크기 및 위치 특징 벡터를 입력으로 받는 다층 신경망을 사용하여 주소 영상의 기입형식을 구분하는 단계를 포함하는 주소기입형식 구분 방법.
- 주소 인식 시스템에 있어서,입력 영상으로부터 주소 영역을 추출하기 위한 주소 영역 추출수단;상기 주소 영역 추출수단에서 추출된 주소 영상의 최상위 문자열에 속하는 연결요소를 선택하여 주소기입형식 구분의 대상으로 취하며, 최상위 문자열에 속하는 연결요소들을 문자단위로 병합한 후 이들로부터 폭 크기 특징과 위치 특징을 계 산하여 주소 영상의 기입형식을 구분하기 위한 주소기입형식 구분수단;주소기입형식이 구분된 인쇄체/필기체 주소 영상을 문자열 단위로 분할하고 다시 각 문자열 영상을 문자 단위로 분할하기 위한 문자열 및 문자 분리수단;문자 단위로 분할된 각 인쇄체/필기체 문자 영상에 대하여 인식을 수행하기 위한 문자 인식수단; 및상기 문자 인식수단에서의 문자 인식 결과와 주소 사전을 기반으로 주소를 해석하기 위한 주소 해석수단을 포함하는 주소 인식 시스템.
- 제 9 항에 있어서,상기 주소기입형식 구분수단은,상기 주소 영역 추출수단으로부터 획득된 영상에 존재하는 명도 레벨의 주소 영상을 획득하기 위한 주소 영상 입력수단;상기 주소 영상을 이진 주소 영상으로 변환하기 위한 영상 이진화수단;상기 이진 주소 영상에서 방향 연결성을 갖는 연결요소를 추출하기 위한 연결요소 추출수단;크기 및 화소 밀도 정도를 바탕으로, 상기 연결요소에서 잡영으로 추정되는 연결요소를 제거하기 위한 잡영 제거수단;잡영이 제거되고 남아있는 연결요소 중에서 최상위 문자열에 속하는 연결요 소를 선택하기 위한 연결요소 선택수단;상기 최상위 문자열에 속하는 연결요소를 문자단위로 병합하기 위한 연결요소 병합수단;문자단위로 병합된 연결요소의 각 그룹을 최소인접사각형으로 표현한 후, 최소인접사각형으로부터 분류를 위한 특징을 추출하기 위한 특징 추출수단; 및상기 특징 추출수단으로부터 제공받은 폭 크기 및 위치 특징 벡터를 입력으로 받는 다층 신경망을 사용하여 주소 영상의 기입형식을 구분하기 위한 주소기입형식 분류수단을 포함하는 주소 인식 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030071032A KR100540173B1 (ko) | 2003-10-13 | 2003-10-13 | 주소기입형식 구분 장치 및 그 방법과 그를 이용한 주소인식 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030071032A KR100540173B1 (ko) | 2003-10-13 | 2003-10-13 | 주소기입형식 구분 장치 및 그 방법과 그를 이용한 주소인식 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050035610A KR20050035610A (ko) | 2005-04-19 |
KR100540173B1 true KR100540173B1 (ko) | 2006-01-10 |
Family
ID=37238988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020030071032A Expired - Fee Related KR100540173B1 (ko) | 2003-10-13 | 2003-10-13 | 주소기입형식 구분 장치 및 그 방법과 그를 이용한 주소인식 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100540173B1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112308058B (zh) * | 2020-10-25 | 2023-10-24 | 北京信息科技大学 | 一种手写字符的识别方法 |
-
2003
- 2003-10-13 KR KR1020030071032A patent/KR100540173B1/ko not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
KR20050035610A (ko) | 2005-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cao et al. | Text/graphics separation in maps | |
Shi et al. | A steerable directional local profile technique for extraction of handwritten arabic text lines | |
Lehal et al. | A Gurmukhi script recognition system | |
Shi et al. | Line separation for complex document images using fuzzy runlength | |
Kumar et al. | Segmentation of isolated and touching characters in offline handwritten Gurmukhi script recognition | |
Pal et al. | Automatic identification of english, chinese, arabic, devnagari and bangla script line | |
Pal et al. | Identification of different script lines from multi-script documents | |
Garlapati et al. | A system for handwritten and printed text classification | |
US20050123199A1 (en) | Method for optical recognition of a multi-language set of letters with diacritics | |
Suen et al. | Bank check processing system | |
Lehal et al. | Feature extraction and classification for OCR of Gurmukhi script | |
Shi et al. | Skew detection for complex document images using fuzzy runlength | |
Verma et al. | A novel approach for structural feature extraction: contour vs. direction | |
Boulid et al. | Segmentation of Arabic handwritten documents into text lines using watershed transform | |
Vijay Kumar et al. | Machine recognition of printed Kannada text | |
US7072514B1 (en) | Method of distinguishing handwritten and machine-printed images | |
Sas et al. | Three-stage method of text region extraction from diagram raster images | |
KR100540173B1 (ko) | 주소기입형식 구분 장치 및 그 방법과 그를 이용한 주소인식 시스템 | |
Shakunthala et al. | Enhanced text line segmentation and skew estimation for handwritten Kannada document | |
Okun et al. | A survey of texture-based methods for document layout analysis | |
Kandan et al. | A robust two level classification algorithm for text localization in documents | |
Srinivas et al. | An overview of OCR research in Indian scripts | |
Kamble et al. | Handwritten marathi basic character recognition using statistical method | |
Haraty et al. | Segmenting handwritten Arabic text | |
Kanoun et al. | Script identification for arabic and latin printed and handwritten documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20031013 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20050915 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20051221 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20051223 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20051226 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20081202 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20091113 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20101201 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20111129 Start annual number: 7 End annual number: 7 |
|
FPAY | Annual fee payment |
Payment date: 20121129 Year of fee payment: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20121129 Start annual number: 8 End annual number: 8 |
|
FPAY | Annual fee payment |
Payment date: 20131128 Year of fee payment: 9 |
|
PR1001 | Payment of annual fee |
Payment date: 20131128 Start annual number: 9 End annual number: 9 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20151109 |