KR100480024B1 - 획의두께정보를이용한모음인식방법 - Google Patents

획의두께정보를이용한모음인식방법 Download PDF

Info

Publication number
KR100480024B1
KR100480024B1 KR1019970080353A KR19970080353A KR100480024B1 KR 100480024 B1 KR100480024 B1 KR 100480024B1 KR 1019970080353 A KR1019970080353 A KR 1019970080353A KR 19970080353 A KR19970080353 A KR 19970080353A KR 100480024 B1 KR100480024 B1 KR 100480024B1
Authority
KR
South Korea
Prior art keywords
stroke
vowel
thickness
vertical
character
Prior art date
Application number
KR1019970080353A
Other languages
English (en)
Other versions
KR19990060132A (ko
Inventor
고동익
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1019970080353A priority Critical patent/KR100480024B1/ko
Publication of KR19990060132A publication Critical patent/KR19990060132A/ko
Application granted granted Critical
Publication of KR100480024B1 publication Critical patent/KR100480024B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

본 발명은 획의 두께 정보를 이용한 모음 인식 방법에 관한 것으로, 종래에는 초성과 종성의 분리 및 모음 인식시 글자의 굵기가 굵거나 지나치게 가는 경우 특정 글자체에 대해 인식율이 현격히 저하되고, 획의 윤곽이 매끄럽지 못한 문자들에 대해서는 잡영으로 인해 획의 돌기를 감지하는데 오류를 일으킬 수 있는 문제점이 있었다. 따라서 본 발명은 입력된 이진영상에서 수평방향의 누적흑화소를 구해 문자 열을 분리하고 그 문자열로 부터 수직방향의 흑화소 히스토그램을 구한 후 누적흑화소수를 이용하여 개별문자를 추출하는 개별문자 추출단계와, 상기에서 추출한 개별문자가 수직획의 모음이 있는 문자인지 수평획의 모음만 있는 문자인지를 분류하는 유형 분류단계와, 상기에서 분류한 수직획 또는 수평획의 두께를 추출하는 획 두께 추출단계와, 상기에서 구한 수직획 또는 수평획의 두께와 문자 크기의 비를 구해 모음획의 드레쉬홀드값을 조정하는 모음획 크기 조정단계와, 상기에서 조정한 드래쉬홀드값을 이용하여 모음을 인식하는 모음 인식단계로 동작하여, 모음 인식시 획의 굵기가 다양한 글자이거나 글자획의 표면이 매끄럽지 못한 열악한 글자의 경우에도 인식율을 높일 수 있도록 한 것이다.

Description

획의 두께 정보를 이용한 모음 인식 방법
본 발명은 획의 굵기가 다른 다양한 글자들에 대한 모음 인식율을 높이기 위한 획의 두께 정보를 이용한 모음 인식 방법에 관한 것으로, 특히 모음을 수직획 모음과 수평획 모음으로 구분하고 그 수직획 또는 수평획의 굵기를 이용하여 정확하게 모음을 인식하도록 한 획의 두께 정보를 이용한 모음 인식 방법에 관한 것이다.
도 1은 종래 문자 인식 시스템의 문자 분리 방법에 대한 동작 과정도로서, 이에 도시한 바와같이, 입력된 문서의 이진영상에 대하여 문자열을 분리하는 문자열 분리단계와, 상기 문자열 분리단계에서 분리된 문자열에 대해 수직방향의 누적 흑화소를 이용해 개별문자를 추출하는 개별문자 분리단계와, 상기 개별문자 분리단계에서 분리된 개별문자에 대해 초성과 종성을 분리한 후 모음을 인식하는 모음 인식단계와, 상기에서 분리한 자소와 모음을 조합하여 하나의 문자를 생성하는 문자 인식단계로 이루어진다.
이와같이 각 단계로 이루어진 종래기술에 대하여 살펴보면 다음과 같다.
스캐너를 통해 문서 영상에 해당하는 이진 데이터 값을 입력받아, 그 입력받은 문서 영상의 수평방향의 누적흑화소를 구하고, 이 구한 값과 임계값을 비교하여 문자열의 상하위치를 구해 문서로부터 문자열을 분리해낸다(S1).
이후에 상기에서 분리한 문자열에 대해 수직방향의 흑화소 히스토그램을 구한 후 누적흑화수를 이용하여 개별문자를 분리한다.(S2)
상기 단계(S2)에서 분리된 개별문자를 인식하기 위하여, 그 문자의 초성과 종성을 분리하고(S3), 모음을 인식한다.(S4)
이후에 분리된 초성과 종성 그리고 모음을 조합하여 문자를 인식한다.(S5)
이와같은 방법으로 각 문자열의 문자를 인식한다.
그러나, 상기에서와 같은 종래 개별문자내에서 초성과 종성의 분리 및 모음 인식시 도 2의 (a)에서와 같이 글자의 굵기가 굵거나 도 2의 (b)에서와 같이 글자의 굵기가 지나치게 가는 경우 특정 글자체에 대해 인식율의 현격한 저하되고, 또한 도 3에서와 같이 획의 윤곽이 매끄럽지 못한 문자들에 대해서는 잡영으로 인해 획의 돌기를 감지하는데 오류를 일으킬 수 있는 문제점이 있다.
그리고, 도 2의 (a)에서와 같이 돌기가 획으로 인정되기에 작은 경우도 문제를 일으킬 수 있다.
따라서 상기에서와 같은 종래의 문제점을 해결하기 위한 본 발명의 목적은 획의 굵기가 다른 다양한 글자들에 대한 모음 인식율을 높이기 위한 획의 두께 정보를 이용한 모음 인식 방법을 제공함에 있다.
본 발명의 다른 목적은 글자 획의 표면이 매끄럽지 못한 열악한 이미지에 대한 인식율을 높이도록 한 획의 두께 정보를 이용한 모음 인식 방법을 제공함에 있다.
본 발명의 다른 목적은 수직획 모음과 수평획 모음으로 구분하여 수직획 또는 수평획의 굵기를 이용하여 정확하게 모음을 인식하도록 한 획의 두께 정보를 이용한 모음 인식 방법을 제공함에 있다.
상기 목적을 달성하기 위한 본 발명은 입력된 이진영상에서 수평방향의 누적흑화소를 구해 문자열을 분리하고 그 문자열로 부터 수직방향의 흑화소 히스토그램을 구한 후 누적흑화소수를 이용하여 개별문자를 추출하는 개별문자 추출단계와, 상기에서 추출한 개별문자가 수직획의 모음이 있는 문자인지 수평획의 모음만 있는 문자인지를 분류하는 유형 분류단계와, 상기에서 분류한 수직획 또는 수평획의 두께를 추출하는 획 두께 추출단계와, 상기에서 구한 수직획 또는 수평획의 두께와 문자 크기의 비를 구해 모음획의 드레쉬홀드값을 조정하는 모음획 크기 조정단계와, 상기에서 조정한 드레쉬홀드값을 이용하여 모음을 인식하는 모음 인식단계로 이루어진 것을 특징으로 한다.
이하, 첨부한 도면에 의거하여 상세히 살펴보면 다음과 같다.
도 4는 본 발명 획의 두께 정보를 이용한 모음 인식 방법에 대한 동작 흐름도로서, 이에 도시한 바와같이, 입력된 이진영상에서 수평방향의 누적흑화소를 구해 문자열을 분리하고 그 문자열로 부터 수직방향의 흑화소 히스토그램을 구한 후 누적흑화소수를 이용하여 개별문자를 추출하는 개별문자 추출단계와, 상기에서 추출한 개별문자가 수직획의 모음이 있는 문자인지 수평획의 모음만 있는 문자인지를 분류하는 유형 분류단계와, 상기에서 분류한 수직획 또는 수평획의 두께를 추출하는 획 두께 추출단계와, 상기에서 구한 수직획 또는 수평획의 두께와 문자 크기의 비를 구해 모음획의 드레쉬홀드값을 조정하는 모음획 크기 조정단계와, 상기에서 조정한 드레쉬홀드값을 이용하여 모음을 인식하는 모음 인식단계로 이루어진다.
상기 각 단계로 이루어진 본 발명의 동작 및 작용 효과에 대하여 상세히 설명하면 다음과 같다.
스캐너를 통해 문서 영상에 해당되는 이진영상을 입력받아, 그 입력받은 이진영상에서 수평방향의 누적흑화소를 구하고, 그 구한 누적흑화소 값과 임계값을 비교하는 것에 의해 문자열을 먼저 분리해 내고, 그 문자열로 부터 수직방향의 흑화소 히스토그램을 구한 후 누적흑화소수를 이용하여 개별문자를 추출해낸다. (S11)
이후에 상기에서 추출한 개별문자가 수직획의 모음이 있는 "가", "과", "각", "곽"과 같은 부류에 속하는지 아니면 수평획의 모음이 있는 "고", "곤"과 같은 부류에 속하는지 유형을 분류한다.(S12)
상기 S12단계에서 분류한 유형이 "가", "과", "각", "곽"과 같으면, 그 글자로 부터 수직획을 추출하고, "고", "곤"과 같으면 그 글자로 부터 수평획을 추출한다.
그러다음 상기에서 추출한 획이 수직획이면, 그 수직획의 두께를 추출하고(S13), 상기에서 추출한 획이 수평획이면, 그 수평획의 두께를 추출하여 구한다(S14).
이렇게 수직획 또는 수평획의 두께를 구한 다음 그 구한 수직획 또는 수평획의 두께와 문자 크기의 비(두께/글자 크기)를 구한다.
이렇게 구한 수직획 또는 수평획의 두께와 문자 크기의 비로 모음획의 드레쉬홀드값을 조정한다.(S15)
상기에서 조정된 모음획의 드레쉬홀드값을 이용하여 획의 돌기를 모음 부분으로 선택할 것인지 선택하지 않을 것인지를 결정하고, 이 결정한 결과 선택하기로 하면 모음으로 인식한다.(S16)
이상에서와 같은 방법으로 모음을 인식할 경우 획의 굵기가 다양한 글자이거나 글자획의 표면이 매끄럽지 못한 열악한 글자의 경우에도 인식율을 높일 수 있다.
따라서, 본 발명은 수직획 모음과 수평획 모음으로 구분하고 그 수직획 또는 수평획의 굵기를 이용하여 정확하게 모음을 인식하도록 함으로써, 획의 굵기가 굵거나 지나치게 가능 경우와 같은 다양한 글자 또는 표면이 매끄럽지 못한 글자의 경우에도 인식율을 높일 수 있도록 한 효과가 있다.
도 1은 종래 문자 인식 시스템의 문자 인식방법에 대한 동작 흐름도.
도 2는 획의 굵기가 굵거나 지나치게 가는 글자에 대한 예시도.
도 3은 글자획의 표면이 매끄럽지 못한 글자에 대한 예시도.
도 4는 본 발명 획의 두께 정보를 이용한 모음 인식 방법에 대한 동작 흐름도.

Claims (1)

  1. 입력된 이진영상에서 수평방향의 누적흑화소를 구해 문자열을 분리하고 그 문자열로 부터 수직방향의 흑화소 히스토그램을 구한 후 누적흑화소수를 이용하여 개별문자를 추출하는 개별문자 추출단계와, 상기에서 추출한 개별문자가 수직획의 모음이 있는 문자인지 수평획의 모음만 있는 문자인지를 분류하는 유형 분류단계와, 상기에서 분류한 수직획 또는 수평획의 두께를 추출하는 획 두께 추출단계와, 상기에서 구한 수직획 또는 수평획의 두께와 문자 크기의 비를 구해 모음획의 드레쉬홀드값을 조정하는 모음획 크기 조정단계와, 상기에서 조정한 드레쉬홀드값을 이용하여 모음을 인식하는 모음 인식단계로 이루어진 것을 특징으로 하는 획의 두께 정보를 이용한 모음 인식 방법.
KR1019970080353A 1997-12-31 1997-12-31 획의두께정보를이용한모음인식방법 KR100480024B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019970080353A KR100480024B1 (ko) 1997-12-31 1997-12-31 획의두께정보를이용한모음인식방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019970080353A KR100480024B1 (ko) 1997-12-31 1997-12-31 획의두께정보를이용한모음인식방법

Publications (2)

Publication Number Publication Date
KR19990060132A KR19990060132A (ko) 1999-07-26
KR100480024B1 true KR100480024B1 (ko) 2005-08-01

Family

ID=37303793

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970080353A KR100480024B1 (ko) 1997-12-31 1997-12-31 획의두께정보를이용한모음인식방법

Country Status (1)

Country Link
KR (1) KR100480024B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011112522A2 (en) * 2010-03-10 2011-09-15 Microsoft Corporation Text enhancement of a textual image undergoing optical character recognition

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07249100A (ja) * 1994-03-11 1995-09-26 Sharp Corp 線認識方法
KR19990049667A (ko) * 1997-12-13 1999-07-05 구자홍 한글 문자체 인식 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07249100A (ja) * 1994-03-11 1995-09-26 Sharp Corp 線認識方法
KR19990049667A (ko) * 1997-12-13 1999-07-05 구자홍 한글 문자체 인식 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011112522A2 (en) * 2010-03-10 2011-09-15 Microsoft Corporation Text enhancement of a textual image undergoing optical character recognition
WO2011112522A3 (en) * 2010-03-10 2011-11-03 Microsoft Corporation Text enhancement of a textual image undergoing optical character recognition
CN102782706A (zh) * 2010-03-10 2012-11-14 微软公司 经历光学字符识别的文本图像的文本增强
US8526732B2 (en) 2010-03-10 2013-09-03 Microsoft Corporation Text enhancement of a textual image undergoing optical character recognition

Also Published As

Publication number Publication date
KR19990060132A (ko) 1999-07-26

Similar Documents

Publication Publication Date Title
Blumenstein et al. A novel feature extraction technique for the recognition of segmented handwritten characters
Zhou et al. Bangla/English script identification based on analysis of connected component profiles
US7512272B2 (en) Method for optical recognition of a multi-language set of letters with diacritics
Dholakia et al. Zone identification in the printed Gujarati text
CN105760901A (zh) 一种多语种倾斜文档图像的自动语言判别方法
US5561720A (en) Method for extracting individual characters from raster images of a read-in handwritten or typed character sequence having a free pitch
Shaikh et al. Character segmentation of Sindhi, an Arabic style scripting language, using height profile vector
Indira et al. Kannada character recognition system a review
KR100480024B1 (ko) 획의두께정보를이용한모음인식방법
Allam Segmentation versus segmentation-free for recognizing Arabic text
KR20090111202A (ko) 한글의 기본 구성요소인 수평선, 수직선, 사선, 원의개수와 특성치를 이용한 한글인식 방법 및 장치
Kavallieratou et al. Handwritten text localization in skewed documents
KR19980058361A (ko) 한글 문자 인식 방법 및 시스템
KR0186172B1 (ko) 문자 인식장치의 접촉문자 분리 및 특징 추출방법
KR19990049667A (ko) 한글 문자체 인식 방법
KR100479349B1 (ko) 자소기반 문자인식기 성능 향상방법
Gatos et al. A segmentation-free recognition technique to assist old Greek handwritten manuscript OCR
KR100241447B1 (ko) 윤곽선 정보를 이용한 영문/숫자 인식방법
KR100248384B1 (ko) 다국어 문서 인식에서 개별 문자 추출 방법 및 그 인식 시스템
Choudhary et al. An efficient algorithm for characters recognition of printed oriya script
JPS63269267A (ja) 文字認識方法
KR100286709B1 (ko) 영문자열에서의 개별문자 분리 방법
JP3428504B2 (ja) 文字認識装置
Kuhl et al. Model-based character recognition in low resolution
Bodduluri et al. A novel way of identifying telugu, tamil and english scripts by priority check using discerning features

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee