KR20090111202A - The Optical Character Recognition method and device by the numbers of horizon, vertical and slant lines which is the element of Hanguel - Google Patents

The Optical Character Recognition method and device by the numbers of horizon, vertical and slant lines which is the element of Hanguel Download PDF

Info

Publication number
KR20090111202A
KR20090111202A KR1020080036842A KR20080036842A KR20090111202A KR 20090111202 A KR20090111202 A KR 20090111202A KR 1020080036842 A KR1020080036842 A KR 1020080036842A KR 20080036842 A KR20080036842 A KR 20080036842A KR 20090111202 A KR20090111202 A KR 20090111202A
Authority
KR
South Korea
Prior art keywords
line
vertical
character
lines
distinguish
Prior art date
Application number
KR1020080036842A
Other languages
Korean (ko)
Inventor
조영선
박수희
Original Assignee
슬림디스크 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 슬림디스크 주식회사 filed Critical 슬림디스크 주식회사
Priority to KR1020080036842A priority Critical patent/KR20090111202A/en
Publication of KR20090111202A publication Critical patent/KR20090111202A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/293Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of characters other than Kanji, Hiragana or Katakana

Abstract

PURPOSE: An optical character recognition method and a device by the numbers of horizon, vertical and slant lines which is the element of Hanguel is provided to make the apparatus which changes the captured document into TTS conversion audio for visually-handicapped person. CONSTITUTION: An optical character recognition method and a device by the numbers of horizon, vertical and slant lines which is the element of Hanguel forms a character image of one letter. Each characteristic is recorded for horizontal line, vertical line, and slant lines are extracted from the target character image. The unique code value which indicates the letter encodes each number. It is recognized as the target character after comparing the line number with the recorded character database.

Description

한글의 기본 구성요소인 수평선, 수직선, 사선, 원의 개수와 특성치를 이용한 한글인식 방법 및 장치{The Optical Character Recognition method and device by the numbers of horizon, vertical and slant lines which is the element of Hanguel}      The Optical Character Recognition method and device by the numbers of horizon, vertical and slant lines which is the element of Hanguel}

한글 인식은 영문, 한자 등에 비해서 매우 어렵고, 현재 기술로도 다양한 서체에 비해 관련 분야의 연구가 지속되지 않아 명조, 고딕체에 대해서만 인식 가능한 수준이지만 고려대, KAIST, 숙명여대 등 연구소에서 다양한 서체 및 표지판/ 간판 등의 서체를 인식하기 위한 전처리, 후처리 등 다양한 접근 연구가 진행되고 있다. Recognition of Hangul is very difficult compared to English and Chinese characters, and the current technology does not continue research in related fields compared to various fonts, so it can only recognize Myeongjo and Gothic fonts. Various approaches such as pre-processing and post-processing to recognize fonts such as signs are being conducted.

즉, 한글 문서 인식 SW 관련 기업으로 알려진 퍼셉콤, 한국인식기술에서 10년 전부터 명함인식기를 출시한 이래 시장이 대규모로 형성되지 않아 지속적 투자가 이루어지지 않아 최근 수년간 성능 향상이 없었지만, 학계에서는 자연 영상에서 문자영역 검증기법, 카메라 영상에서 텍스트 영역 추출 기법 등을 통해 문서가 아닌 주변 환경의 문자를 인식하는 발전적 연구도 이루어지고 있다. In other words, since Perceptcom, a Korean document recognition SW-related company, launched the business card reader since 10 years ago, the market has not been formed on a large scale, so investment has not been made in recent years. In addition, the research on the recognition of characters in the surrounding environment, rather than documents, has been done through the character region verification technique and the text region extraction technique from the camera image.

2차원 인쇄 한글 문서의 OCR(Optical Character Recognition) 기술이 휴대폰 기술의 발달에 따라 모바일 환경에도 적용해야 하는 요구가 증대하고 있지만, 최근 40여 년간 인쇄 문서의 인식 기술이 지속적으로 연구되어 왔으나 기술 수준은 아직 일반인이 기대하는 수준에 미달함 또한 사실이다. OCR (Optical Character Recognition) technology for two-dimensional printing Korean documents has been increasingly applied to mobile environments with the development of mobile phone technology, but the recognition technology of printed documents has been continuously studied for the last 40 years. It is also true that it is still not as expected by the general public.

본 발명은 한글의 문서인식 기능을 모바일 환경에 접목하기 위해서는 인식율 및 인식속도를 향상 시켜야 하는데, 한글은 생성가능한 문자수가 2350자로 방대하고 비교적 적은 수의 기본 자소들이 하나의 문자를 복잡하게 초성, 중성, 종성 등의 형태로 형성하기 때문에 문자의 유사성이 커서 인식하는데 한계가 있다. The present invention has to improve the recognition rate and recognition speed in order to incorporate the document recognition function of the Hangul into the mobile environment, the Hangul has a large number of 2350 characters that can be generated and a relatively small number of basic characters complicate one character Because it is formed in the form of, for example, the finality, there is a limit in recognition of the similarity of characters.

한글의 구조적인 특성을 이용하는 기존의 많은 인식 방법론들에서는 한글의 기본 요소를 획으로 정의하는데 반해, 본 발명은 수직선, 수평선, 사선과 같이 방향성이 강한 선소들로 구성되어 있다는 점을 이용하여 한글을 인식보다는 구분하도록 제공하였다. While many existing recognition methodologies that use the structural characteristics of Hangeul define the basic elements of Hangeul as strokes, the present invention uses Hangeul, which is composed of highly directional elements such as vertical lines, horizontal lines, and diagonal lines. It was provided to distinguish rather than to recognize.

즉, 휴대폰과 같은 모바일 환경에서 문자 인식율과 인식 속도 향상을 위해서는 새로운 문자 인식 알고리즘 개발이 필요하다는 점에서 본 발명이 이루어지게 되었다. That is, the present invention has been made in that it is necessary to develop a new character recognition algorithm in order to improve the character recognition rate and recognition speed in a mobile environment such as a mobile phone.

특히 최근 휴대폰에 3M 픽셀 이상(영어 인식 가능 해상도)의 고성능의 카메라 센서가 장착됨에 따라 3차원 카메라 획득 문서 및 배경의 OCR 기술을 적용할 수 있게 되어 한글문자 인식율과 인식 속도가 향상된다면 시각장애인용 실시간 독서보조기로 적용도 가능하다는 점에서 본 발명이 이루어지게 되었다. In particular, recently equipped with high-performance camera sensor of more than 3M pixels (English recognizable resolution), it is possible to apply the OCR technology of 3D camera acquisition document and background. The present invention has been made in that it can be applied as a real-time reading aid.

시각장애인의 한계나 요구에 따른 신뢰성/ 인식율/ 속도의 적절한 조합 및 선택에 따른 새로운 알고리즘 개발 필요한데, 기존에 한국에서 상용화된 ‘아르미’, ‘글눈’ 등은 기본적으로 개발 환경이 컴퓨터용 스캐너 장비를 이용하는 정적 인식 수준에 그치고 있고 모바일 특유의 흔들림, 빛, 인식대상의 3차원 기울임에 대한 보정 기술 개발도 필요하다. It is necessary to develop new algorithms based on the appropriate combination and selection of reliability / recognition rate / speed according to the limitations and demands of the visually impaired. In addition to the level of static recognition used, it is also necessary to develop a technique for correcting mobile-specific shaking, light, and three-dimensional tilt of a recognition object.

최근 들어 카메라 센서, CPU 성능이 부분적으로 향상되면서 모바일 OCR 관련 연구가 단순 명함인식 기능을 벗어나는 연구가 진행되고 있지만, 아직은 카메라센서 해상도 및 휴대폰 CPU 등의 인식 속도 등의 문제로 한정된 형태로 접근하고 있는 실정이다. Recently, as the camera sensor and CPU performance have been partially improved, research on mobile OCR has been conducted beyond simple business card recognition. However, it is still approaching in a limited form due to problems such as camera sensor resolution and recognition speed of mobile phone CPU. It is true.

이에 시각장애인용으로 제안된 보이스아이라는 특수 2차원 바코드 심볼용 코드 리더기는 가로, 세로 1.5cm 크기의 보이스아이 심볼에 책 2 페이지 분량의 정보가 저장되어 원본과 함께 인쇄된 출판물의 정보를 시각장애인 스스로 접할 수 있도록 설계된 하드웨어와 소프트웨어 구성, 녹음 도서를 따로 만들 필요없이 모든 인쇄 및 출판물 문서 작업시 보이스아이 심볼을 만들면 이 심볼에 기기를 대어 음성 출력이 가능토록 되어 있지만 이 또한 보이스아이 심볼이 인쇄되어 있는 문서가 보편적이지 않아 이용에 제한이 있다.The code reader for a special two-dimensional bar code symbol called VoiceA, which is proposed for the visually impaired, stores two pages of information in a voice eye symbol of 1.5cm in width and length, and displays the information of the publication printed with the original. If you create a voice eye symbol for all print and publication documents without having to create a hardware, software configuration, and recording book designed for self-facing, you can use the device to output the voice, but it also prints the voice eye symbol. The existing documents are not universal and there are restrictions on their use.

현재까지 보편적인 한글 문자 인식을 위해서는 전처리 과정을 통해 문자의 여백 등을 추출, 입력 문자 이미지를 형성하는 전처리 이미지 프로세싱을 거쳐, 히스토그램 및 바이널라이즈를 통해 세선화 알고리즘 변형 기술이 적용되어 윤곽선 추출을 통해 수평영역과 수직영역 투영 변환을 실시하고, 최소 인접 다각형 추출 및 배경 세선화를 거쳐 외곽선 분석 추출과 대각선-대각선 영역 투영 변환을 실시하고, 8방향 성분분포 특징 추출 양자화를 통해 끝점, 분기점, 교차점, 굴곡점과 같은 구조적 특징점 들을 추출하고 평활화 샘플링을 거쳐 탬플랫 특징점 데이터베이스를 형성, 만들어둔 문자특징 성분 데이터베이스와 원형접합 및 탄력접합 알고리즘을 통해 인식문자를 추출하는 복잡한 과정으로 수행된다. Up to now, for general character recognition of Korean characters, the preprocessing process extracts the margins of characters and preprocesses image processing to form the input character image, and the thinning algorithm transformation technology is applied through histogram and binarization to extract the contour. Perform horizontal and vertical projection transformations, extract the minimum neighboring polygons and refine the background, perform boundary analysis extraction and diagonal-diagonal region projection transformation, and use eight-way component distribution feature extraction quantization to obtain endpoints, branch points, intersection points, It extracts structural feature points such as bend points, and then performs smoothing sampling to form a template feature point database, which is a complex process of extracting recognition characters through the character feature database and the circular and elastic joint algorithms.

이러한 한글 문자 인식 기술을 이용하여 많은 상품들이 소개되었는데, ‘모바일 리더’라는 제품은 카메라가 장착된 휴대폰, PDA 등 제한된 환경에서 동작하는 영상처리 및 자동인식 정보를 여러 알고리듬을 적용하여 추출하여 문자정보를 판단하는데. 현재 출시한 상용화 제품은 명함 인식 및 전자사전용 문자인식 기능으로 일부 휴대폰에 탑재되었으며, 디오텍사의 모바일 OCR은 문서인식 솔루션으로서 인쇄된 문서 영상을 인식 및 판독하여 텍스트 형태로 변환하는 기술로 접사 촬영 또는 오토 포커스가 지원되는 1M픽셀 이상의 카메라가 장착된 단말기에 적용이 가능하며, 고해상도 카메라 폰의 등장과 함께 활용성이 높아지고 있지만 휴대폰의 CPU 성능 및 카메라센서 해상도 신호처리의 한계로 실제 생활에서 불편하지 않게 사용할 수 있는 필요한 제품으로는 평가받지 못하고 있다. Many products have been introduced using the Hangul character recognition technology, and the product called 'Mobile Reader' extracts text information by applying various algorithms to image processing and automatic recognition information operating in limited environments such as mobile phones and PDAs equipped with cameras. To judge. The commercialized product is currently installed in some mobile phones with business card recognition and electronic character recognition function.Diotec's mobile OCR is a document recognition solution that recognizes and reads printed document images and converts them into text form. It can be applied to a terminal equipped with a camera of 1M pixels or higher that supports autofocus.In addition to the advent of high resolution camera phones, its utilization is increasing. It is not evaluated as a necessary product to use.

퍼셉콤의 문서인식 소프트웨어 ‘아르미’는 거의 국내 최초로 상용화된 문서인식 상품으로 기존 인쇄 자료들을 스캐너 등을 통해 이미지 형태로 읽어 데이터의 내용을 분석, 그림과 글자 영역으로 구분 문서편집기에서 수정, 편집이 가능한 인식 소프트웨어로 인정받아 국내 스캐너 업체 대부분에서 번들 제품으로 사용되었으며, 명함인식기 ‘아르미’도 명함인식 및 관리를 제한된 범위 내에서는 완벽하게 처리함이 증명되어 국내 문자 인식 엔진으로는 현재 최고의 제품으로 인정받아 타 업체에서도 기반 솔루션으로 사용하고 있다.Perceptcom's document recognition software 'Armi' is the first commercialized document recognition product in Korea. It reads the existing printed data in the form of an image through a scanner and analyzes the data and divides the data into picture and text areas. It was recognized as a possible recognition software and was used as a bundled product by most of the domestic scanner companies, and the card reader 'Armi' was also recognized as the best product in the domestic character recognition engine because it was proved to handle card recognition and management perfectly within a limited range. It is also used as a base solution by other companies.

기존 방식에 있어서 문자 인식을 하기 위한 과정은 레이블링을 이용 문자를 추출하고, 정규화를 거쳐, 모폴로지 알고리즘을 거쳐 잡음을 제거하고, Zhang-suen 알고리즘 등을 통해 세선화를 하고, 코너 검출을 통한 특징점들을 찾는 과정으로 이뤄진다. In the conventional method, the character recognition process uses the labeling to extract the character, normalizes it, removes the noise through the morphology algorithm, refines it with the Zhang-suen algorithm, and extracts the feature points through the corner detection. Finding is done.

본 발명은, 상기한 바와 같은 문제점을 해결하기 위해 제안된 것으로 한글은 영어, 일본어 등과 달리 생성 가능한 문자 수가 KSC5601 코드로는 2,350 자에 달하며 문광부 선정 실생활 유효문자도 1,076 자에 이를 정도로 생성 가능한 문자수가 방대하고 비교적 적은 수의 기본 자소들이 하나의 문자를 형성하기 때문에 문자의 유사성(일례로 자음의 경우 초성과 종성으로 사용되는 ‘ㅁ' ’ㅂ' 'ㅍ‘ )이 커서 이를 인식하는데, 특히 복모음과 복잡한 받침의 경우 이를 구분하여 인식하는데 기존에 적용된 알고리즘으로는 많은 어려움이 있는 실정이다. The present invention has been proposed to solve the above problems, and the number of characters that can be generated in Korean is 2,350 characters in KSC5601 code, unlike English, Japanese, and the like. Because of the large and relatively small number of basic phonemes that form a letter, the similarity of letters (eg, 'ㅁ' 'ㅂ' 'ッ', used as a consonant and a trailing consonant in the consonants, is large and is particularly recognized). In the case of complex bearings, there are many difficulties with the existing algorithms.

이에 한글의 구조적인 특성을 이용하는 기존 문자 인식 알고리즘은 전처리 및 단어 사전 검색과 같은 후처리에 많이 의존하는 경향이 있다. Therefore, existing character recognition algorithms using the structural characteristics of Hangul tend to rely heavily on postprocessing such as preprocessing and word dictionary search.

한글 문자는 기본 자소로 구성되고, 기본 자소는 방향을 갖는 기본 선소가 접속되어 구성되어 진다. 따라서 한글 인식에 있어서 이러한 선소들의 접속정보를 효율적으로 이용하는 것이 인식의 관건으로, 90년에 발표된 ’계층구조 획 추출에 의한 한글인식’ 논문에서는 선소들의 정보를 계층적으로 구성하여 좀 더 효율적으로 사용할 수 있는 방법을 제안했는데, 입력 문자를 정규화한 후 이를 4개의 방향 (수직방향, 수평방향, 사선방향, 역사선 방향)에 대하여 직선선분을 강조하여 방향 성분을 추출하였고 4방향 평면에 대하여 각 방향선소의 시작위치에 그 방향선소의 길이를 정보로 저장하고 여기에 대상 영역을 동일 크기의 부영역으로 분할하여 그 부영역에 있어서의 가장 큰 길이 정보를 대표값으로 정하고, 동일 위치의 부영역에 대해서 4방향 성분을 고려하여 그 영역에서의 선소의 연결 형태를 결정하며, 이러한 과정을 거쳐 한 문자당 16 부영역에서의 선소의 연결 형태를 나타내는 특징을 추출 한글을 인식하는 방법도 제시되었다. Hangul characters are composed of basic phonemes, and basic phonemes are composed by connecting basic elements with directions. Therefore, the efficient use of access information of these elements in Hangeul recognition is the key to recognition. In the paper, 'Korean Recognition by Hierarchical Stroke Extraction', published in 1990, the information of elements is hierarchically organized to make it more efficient. We proposed a method that can be used. After normalizing the input characters, it extracts the direction components by emphasizing the straight line segments in four directions (vertical direction, horizontal direction, diagonal direction and inverse direction direction), The length of the direction line is stored as information at the start position of the direction line, and the target area is divided into sub-regions of the same size, and the largest length information in the sub-area is determined as a representative value. Considering the four-way component for, determine the form of linkage of the line elements in the area. A feature representing the connection form of the line element of the proposed method has also been recognized that the extraction Hangul.

본 발명에서 제시하는 방법은 이와 달리 수직선, 수평선, 사선, 원을 단순히 한글글자 이미지를 가로, 세로를 삼등분하여 겹치는 길이에 따라 단, 중, 장 선소로 구분하고 이를 코드화하도록 하여 일차적으로 구분하고, 코드가 동일한 글자들에 대해서는 보완 인식 방법을 적용하면 대부분 한글의 코드를 구분하는 것이 가능하다는 점에서 연구가 이루어지게 되었다.Unlike the method proposed in the present invention, vertical lines, horizontal lines, diagonal lines, and circles are divided into three, horizontally and vertically, and divided into single, middle, and long lines according to overlapping lengths. Most of the research has been conducted in that it is possible to distinguish Korean codes by applying the complementary recognition method to the characters with the same code.

한글에 있어서 자음의 경우 대부분의 자소가 수직선소와 수평선소로 구성이 되나 ㅅ , ㅇ , ㅈ 등은 사선 선소와 원 선소를 가지고 있다. 한글 자소들은 크게 4방향의 직선 선소로 구성되며 자음이 모음에 비해서 좀 더 복잡한 연결 형태를 나타낸다.  In Hangeul, most consonants are composed of vertical line and horizontal line, but ㅅ, ㅇ, ㅈ have diagonal line and original line. Hangul phonemes are composed of straight line elements in four directions, and consonants are more complicated than vowels.

자음에서의 선소들의 연결은 어떠한 형태의 선소의 연결 형태가 존재하는가 하는 것이 자소들을 구분하는데 중요한 역할을 한다. 모음에 있어서는 수직선소와 수평선소의 비교적 단순한 연결 형태를 갖고 있으며 연결 형태만이 아니라 연결위 치가 중요한 정보를 갖게 된다. The concatenation of the elements in the consonant is what form of connection of the elements does play an important role in distinguishing the elements. In vowels, there is a relatively simple connection between vertical and horizontal lines, and the connection location, as well as the connection form, has important information.

즉 자음과 모음은 선으로 이루어지며 이는 방향(수평, 수직, 사선, 역사선, 원)과 길이(장, 중, 단)로 차별화되므로 단순히 각각의 개수를 이용하여 구분 코드화하면 다른 한글인식 알고리즘이 복잡한 형태나 위치를 추출하는 것에 비해 매우 빠르다. In other words, consonants and vowels are composed of lines, which are differentiated into directions (horizontal, vertical, oblique, historical, and circle) and length (long, middle, and short). It is very fast compared to extracting complex shapes or locations.

즉, 1 단계로 획의 방향과 길이에 대한 개수로 코드화하면 각 문자별로 독자적인 코드값을 가진 경우(전체 문자의 36%) 바로 인식이 되며, 겹치는 코드값을 갖는 경우 모음의 위치 방향(일례로 ㅏ 와 ㅓ , ㅗ 와 ㅜ 등 구분)을 간단히 판별하는 알고리즘을 적용하면 전체 한글 문자의 64%까지 구분되며, 나머지는 자음 (일례로 중복 경우를 분석하면 ㅁ, ㅂ, ㅍ, 구분과 ‘옷’과 ‘송’과 같은 경우 구분)을 처리하면 100% 한글 문자 구별이 이루어진다. In other words, if you code the number of stroke direction and length in one step, it is recognized immediately if each character has its own code value (36% of the total characters), and if it has overlapping code values, the position direction of the vowel (for example If you apply the algorithm to easily discriminate between ㅏ and ㅓ, ㅗ and TT, it can distinguish up to 64% of the entire Hangul characters, and the remainder consonants (for example, if analyzing duplicate cases, ㅁ, ㅂ, プ, division and 'cloth') And 'sing', such as 'Song'), make 100% Korean characters distinguish.

즉, 자음의 경우 대부분의 자소가 ㄱ ㄴ ㄷ ㄹ ㅁ ㅂ ㅌ ㅍ 처럼 수직선과 수평선으로 구성되며 ㅅ ㅈ ㅊ ㅋ 은 사선과 역사선을 포함한 형태이며 ㅇ ㅎ 원을 포함한 형태다. That is, in the case of consonants, most of the consonants are composed of vertical lines and horizontal lines, such as ㄱ ㄴ ㄹ ㅁ ㅂ ㅌ ㅅ, ㅅ ㅅ ㅋ ㅋ including the diagonal and history lines and ㅇ ㅎ circle.

즉 ㄱ과 ㄴ은 수평, 수직 각 1개이며(수평의 위치로 쉽게 구분함), ㄷ은 수평 2, 수직 1개이며, ㅌ은 수평 3, 수직 1개이며 ㄹ은 수평 3, 수직 1개다. That is, a and b are one horizontal and one vertical (easily divided into horizontal positions), and c is 2 horizontal and 1 vertical, ㅌ is 3 horizontal and 1 vertical, and d is 3 and 1 vertical.

ㅁ ㅂ ㅍ은 모두 수평, 수직 2이므로 이를 구분하기 위해서는 왼쪽 수직선을 기준으로 위의 시작점과 수평선 왼쪽 시작점이 일치하면 ㅁ , 수평선 시작점이 아래에 있으면 ㅂ 으로 구분하며, 수평선이 수직선보다 위에 있으면 ㅍ 이다. ㅁ ㅂ ッ is all horizontal and vertical 2, so to distinguish it, ㅁ if the starting point on the top and the left side of the horizontal line correspond to the left vertical line ㅁ, and 있으면 if the horizontal starting point is below, and if the horizontal line is above the vertical line. .

이상과 같이 한글의 자음과 모음은 훈민정음 창제 원리에 의해 기본적으로 수직, 수평, 사선, 원으로 이뤄지며 이러한 선소들의 개수와 크기를 같이 코드화시키면 독자적인 패턴이 만들어지지 한다. As mentioned above, the consonants and vowels of Hangeul are basically composed of vertical, horizontal, diagonal, and circle by the principle of Hunminjeongeum, and if the number and size of these elements are coded together, an independent pattern is created.

KS 규격에 의한 한글 2,350 개에서 4가지 선소와 모음에서 ㅏ와 ㅓ를 구분하는 것처럼 코드를 삽입할 경우 64%가 구분이 됨을 전 글자에 대해서 계산을 통해 확인하였다. The calculations confirmed that 64% is distinguished when the code is inserted, as in the 2,350 Korean alphabets according to the KS standard.

이 방식의 이점은 특정 코드에 따라 일례로 ‘밥’, ‘팝’, ‘맙’, ‘맘’, ‘밤’, ‘팜’은 가장 많은 동일 코드를 나타내는데 여기서 초성이 ‘ㅁ'인지를 판별하면 ’맘‘, 맙’ 2 글자중 하나이며 종성을 판별 ‘ㅁ’이면 ‘맘’, 아니면 ‘맙’으로 최대 3단계에서 계산이 대부분 종료된다. The advantage of this method is that 'Bob', 'Pop', 'Madam', 'Mam', 'Night', and 'Palm' represent the most identical codes, depending on the specific code, for example to determine if the consonant is 'ㅁ'. If you are one of the two letters 'mom', thank you for the finality 'ㅁ' If the 'mom', or 'thank' most of the calculation is terminated in the maximum three steps.

이와 함께 후처리 알고리듬에서 단어 검사 등을 통하여 정정할 수 있음은 기존 방식과 동일하다.In addition, the post-processing algorithm can be corrected by checking a word.

최근 디지털 카메라와 휴대폰 및 PDA 카메라가 보편화되면서 휴대용 기기에서의 이미지 획득이 간편하게 이루어지고 있다. Recently, as digital cameras, mobile phones, and PDA cameras have become commonplace, image acquisition from portable devices has been simplified.

획득한 이미지에 포함되어 있는 한글 문자를 빠르고, 정확하게 추출하여 인식한다면 은행전표, 택배전표, 주문서, 신청서 등의 자동입력은 물론 시각장애인의 독서 및 보행 안내, 이동 로봇의 주행 등과 같이 실생활에 유용하게 활용될 수 있다. If the Korean characters included in the acquired image are quickly and accurately extracted and recognized, they are useful for real life such as automatic entry of bank slips, delivery slips, order forms, applications, etc. Can be utilized.

그러나, 기존의 알고리즘은 문서의 기울기, 조도, 카메라 특성에 많은 영향을 받고 복잡한 변환 및 추출, 양자화 과정을 거치므로 계산 시간이 오래 걸려 컴 퓨터에 비해 계산 능력이 떨어지는 PDA 특히 휴대폰에 적용하는 데는 한계가 있고, 인식율이 저하되어 초기에 일부 휴대폰에 명함인식용으로 소개되었지만 소비자의 외면으로 현재는 거의 적용되지 않고 있다. However, the existing algorithms are affected by the tilt, roughness, and camera characteristics of documents and undergo complicated transformations, extractions, and quantizations. Therefore, they are difficult to apply to PDAs, especially mobile phones, which have a long calculation time and are less powerful than computers. In the early days, the recognition rate was lowered, and some mobile phones were initially introduced for business card recognition.

이를 극복하기 위해 문서 환경에 둔감한 본 발명이 이루어졌으며 이를 통해 PDA에 적용하면, 시각장애인용 독서보조기기를 문서를 캡쳐하여 인식하고 이를 TTS로 변환 음성으로 바꿔주는 장치 형태로 만들 수 있다. In order to overcome this problem, the present invention has been made insensitive to a document environment, and when applied to a PDA, a reading aid for the visually impaired person can capture and recognize a document and convert it into a TTS.

이러한 독서보조기기는 시각장애인은 물론 노인 및 난독증 환자들이 사용하여 생활의 불편함 해소는 물론 장애로 인한 정보화 소외로부터 벗어날 수 있다. These reading aids can be used by the elderly and dyslexia patients, as well as visually impaired, to solve the inconvenience of life as well as to escape from the alienation of information caused by the disability.

그동안 이미지에서의 텍스트 추출 연구는 대부분 스캐너로 입력된 문서 이미지나 자막이 포함된 동영상 이미지를 대상으로 수행되었지만, 최근에는 디지털 카메라의 광범위한 보급으로 다양한 조명 및 복잡한 배경을 갖는 이미지에서의 텍스트 영역 추출로 연구가 확대되고 있는데 본 발명을 통해 이러한 연구가 보다 더 활성화되는 계기가 제공될 것으로 기대한다.Most of the text extraction studies on images have been conducted on document images inputted by scanners or moving image images containing subtitles. However, the recent widespread use of digital cameras has led to the extraction of text areas from images with various lighting and complex backgrounds. As research is expanding, the present invention is expected to provide an opportunity for further activation of such research.

상술한 목적, 특징들 및 장점은 첨부한 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하 첨부한 도면을 참조하여 본 발명에 따른 바람직한 일실시 에를 상세히 설명한다.The above objects, features and advantages will become more apparent from the following detailed description taken in conjunction with the accompanying drawings. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1 은 현재 널리 사용되는 한글 문자 인식 알고리듬 및 인식 프로세스 흐름도로서 전처리 과정을 통해 문자의 여백 등을 추출 입력 문자 이미지를 형성하는 전처리 이미지 프로세싱을 거쳐, 히스토그램 및 바이널라이즈를 통해 세선화 알고리즘 변형 기술이 적용하며, 윤곽선 추출을 통해 수평영역과 수직영역 투영 변환을 실시하고, 최소 인접 다각형 추출 및 배경 세선화를 거쳐 외곽선 분석 추출과 대각선-대각선 영역 투영 변환을 실시하고, 8방향 성분분포 특징 추출 양자화를 통해 끝점, 분기점, 교차점, 굴곡점과 같은 구조적 특징점들을 추출하고 평활화, 샘플링을 거쳐 탬플랫 특징점 데이터베이스를 형성, 만들어둔 문자특징 성분 데이터베이스와 원형접합 및 탄력접합 알고리즘을 통해 인식문자를 추출하는 복잡한 과정을 수행하는 방식으로 구성된다.       1 is a flow chart of the Hangul character recognition algorithm and recognition process that is widely used at present. Apply horizontal and vertical projection transformations through contour extraction, perform boundary analysis extraction and diagonal-diagonal region projection transformation through minimum neighboring polygon extraction and background thinning, and extract 8-way component distribution feature quantization. Through the process of extracting structural feature points such as end points, branch points, intersection points, and bend points, smoothing and sampling, forming a template feature point database, and extracting the recognition characters through the character feature database and circular joint and elastic joint algorithm. In a way that does It is sex.

세선화란 대상 물체의 표면을 조금씩 벗겨내어 최종적으로 두께 1을 가지도록 하는 것으로, 문서 인식 초기에 많은 연구자들이 물체를 골격선으로 표시하여 정보의 양을 최대한 압축한 다음 이를 인지하고자 연구되었으며 기본 요건으로 첫째, 골격선 폭은 1이어야 하며 둘째, 골격선의 위치는 선 도형의 중심에 위치해야 하며 셋째, 골격선은 원래의 도형에 있어서의 연결성을 유지해야 하며 넷째, 세선화 과정에서 골격선의 길이는 계속해서 줄어서는 안되며 다섯째, 패턴 윤곽선의 작은 요철로 인한 잡 가지선의 모양이 골격선에 첨가되지 않아야 한다.       Thinning is to peel off the surface of an object little by little and finally have a thickness of 1, and in the early stages of document recognition, many researchers indicated that an object is represented by a skeletal line to compress the amount of information as much as possible and then it was studied. First, the skeletal line width should be 1, second, the location of the skeletal line should be located at the center of the line shape. Third, the skeletal line should maintain the connectivity in the original figure. Fifth, the shape of the miscellaneous lines due to the small irregularities of the pattern outline should not be added to the skeletal line.

세선화는 기본적으로 순차적 처리(sequential processing) 방법과 병렬적 처리(parallel processing) 방법으로 구분할 수 있다. 순차적 처리 방법은 현재의 처리 결과가 과거의 처리 값에 영향을 받음은 물론, 미래의 처리 결과에도 영향을 미치는 것으로 이 방법에서는 대상 화상만 있으면 처리가 가능하다.       Thinning can be basically divided into sequential processing and parallel processing. In the sequential processing method, the current processing result is influenced not only by the past processing value but also by the future processing result. In this method, it is possible to process only the target image.

병렬적 처리 방법은 현재의 처리 결과가 과거나 미래의 처리 결과에 전혀 영 향을 받거나 미치지 않는 것으로써 추가적으로 대상 화상 크기만큼의 버퍼가 필요하며, 현재의 관심 화소(pixel)에 대한 처리 결과를 버퍼에 저장하는 식으로, 전체 화상에 대한 한 차례의 처리가 모두 끝난 다음에 버퍼에 저장되어 있는 처리 결과를 원래의 대상 화상 위에 덮어 쓰게 된다.       The parallel processing method requires a buffer equal to the size of the target image because the current processing result is not influenced or affected at all in the past or in the future, and buffers the processing result for the current pixel of interest. In this manner, after the one-time processing for the entire image is finished, the processing result stored in the buffer is overwritten on the original target image.

널리 대표적으로 사용되는 Zhang Suen 세선화 알고리즘은 1984년에 처음으로 발표한 것으로 병렬적 처리(Parallel Processing)방법의 하나로써 기본적인 알고리즘은 다음과 같다.       Zhang Suen's thinning algorithm, which is widely used, was first published in 1984. It is one of the parallel processing methods. The basic algorithm is as follows.

처리대상인 검은 픽셀 I(i,j)에 대해서 다음과 같은 조건을 만족하면 지워 세선화 한다.      The black pixel I (i, j) to be processed is deleted if the following conditions are satisfied.

① 픽셀 I(i,j)에 대해서 그 주위의 픽셀들의 connectivity가 1이고,      ① for pixel I (i, j) the connectivity of pixels around it is 1,

② 픽셀 I(i,j)에 대해서 그 주위의 픽셀들 중 검은 픽셀이 적어도 2개에서 6개사이에 있어야 하며,      ② For pixel I (i, j), there should be at least 2 to 6 black pixels among the pixels around

③ 적어도 픽셀 I(i,j+1), I(i-1,j), I(i,j-1)중의 하나는 배경 픽셀 즉 0이어야 하며,      At least one of the pixels I (i, j + 1), I (i-1, j), I (i, j-1) must be a background pixel, i.

④ 적어도 픽셀 I(i-1,j), I(i+1,j), I(i,j-1)중의 하나는 배경 픽셀 즉 0이어야 한다.      At least one of the pixels I (i-1, j), I (i + 1, j), I (i, j-1) must be a background pixel, i.

첫번째 subiteration을 만족하면 그다음 다음과 같은 조건에 다시 적용시킨다.      When the first subiteration is satisfied, the next condition is applied again.

① 픽셀 I(i,j)에 대해서 그 주위의 픽셀들의 connectivity가 1이고,      ① for pixel I (i, j) the connectivity of pixels around it is 1,

② 픽셀 I(i,j)에 대해서 그 주위의 픽셀들 중 검은 픽셀이 적어도 2개에서 6개사이에 있어야 하며,      ② For pixel I (i, j), there should be at least 2 to 6 black pixels among the pixels around

③ 적어도 픽셀 I(i-1,j), I(i,j+1), I(i+1,j)중의 하나는 배경 픽셀 즉 0이어야 하며,      At least one of pixels I (i-1, j), I (i, j + 1), and I (i + 1, j) must be a background pixel, or 0,

④ 적어도 픽셀 I(i,j+1), I(i+1,j), I(i,j-1)중의 하나는 배경 픽셀 즉 0이어야 한다.      At least one of the pixels I (i, j + 1), I (i + 1, j), I (i, j-1) must be a background pixel, i.

위의 두 subiteration을 계속하여 더이상 지울 픽셀이 남아 있지 않을때 까지 계속 적용시킨다.      Continue with the two subiterations above until there are no more pixels left to erase.

도 2 는 훈민정음 창제원리에 의한 한글문자 인식을 위한 단계별 흐름도로서, 일단계로 글자의 선소 및 획을 분리하는데 문광부 선정 실생활 유효문자 1,076 자를 대상으로 하는 경우를 기준으로 먼저 입력 문자를 정규화된 이미지(32x32 혹은 62x62 도트 등)를 각각 3등분 하고 4개의 방향성(수직, 수평, 사선, 원)에 대해 획을 추출하고 이 선소들의 길이(장, 중, 단은 총 9개의 셀들 중 선소가 1개의 셀에 들어가면 단, 2개의 셀에 들어가면 중, 3개의 셀에 들어가면 장) 정보를 구분하여 분류하면 1076자 중 385자가 유일한 형태의 코드를 가지게 된다.       2 is a step-by-step flowchart for recognizing Hangul characters according to the principle of Hunminjeongeum. Divide 32x32 or 62x62 dots, etc. into 3 parts and extract strokes for 4 directions (vertical, horizontal, diagonal, and circle), and the length of these elements (long, medium, and short) is 1 cell out of 9 cells. If you enter, however, if you enter into two cells, if you enter into three cells, the information is classified and classified, and 385 out of 1076 characters have a unique code.

이를 통해 단+중+장(수평선소)+단+중+소(수직선소)+단+중+장(사선)+원 형식으로 개수를 써넣으면 각 글자에 대한 1단계 코드 값이 만들어 진다.       Through this, the number of single + medium + long (horizontal line) + short + medium + small (vertical line) + short + middle + long (diagonal) + circle type will create a one-step code value for each letter.

이 경우에는 모음에 대한 구분은 하지 못한다. (ㅏ와 ㅓ, ㅗ와 ㅜ, ㅑ와 ㅕ, ㅛ와 ㅠ 등은 동일하게 인식) 그러나 385자는 유일한 형태의 코드값을 나타내므로 4방향 선소의 개수를 계산하는 것만으로 바로 분류가 이루어진다.       In this case, no distinction is made about vowels. (Those ㅓ and 코드, ㅗ and TT, ㅑ and ㅕ, ㅛ and ㅠ are recognized the same.) However, since 385 characters represent unique code values, they are classified by simply calculating the number of four-way line elements.

4방향 선소를 계산하는 방법으로 수평선 개수는 맨 윗 줄(row)부터 마스크하여 최소 도트수 이상 (32x32 도트의 경우 4개 도트 이상)의 수평선이 체크되면 줄 번호와 도트수를 기록하고, 한줄 더 내려와서 체크 했을 때 거의 동일한 크기(명조체의 경우 1~2도트 차이 발생)이면 같은 수평선으로 판단(세선화하지 않은 경우)한다.       By calculating 4-way line segment, the number of horizontal lines is masked from the top row, and if the horizontal lines of more than the minimum number of dots (more than 4 dots in the case of 32x32 dots) are checked, the line number and the number of dots are recorded. When it comes down and checks, if it is almost the same size (1 ~ 2 dot difference occurs in Myungjo), it is judged as the same horizontal line (if not thinned).

동일 줄에 4도트 이상 떨어진 수평선들이 나타날 때는 이는 별개의 수평선으로 판단한다. 수평선 체크중 카운트가 된 수평선들은 이미지에서 지워나간다. 그러므로 수평선 검색이 끝난 이미지는 수평선 부문이 없어지고 수직선과 사선, 원만 남게 된다.       If horizontal lines appear more than 4 dots apart on the same line, this is considered a separate horizontal line. Horizontal lines that have been counted during horizontal check are removed from the image. Therefore, the image after the horizontal search has no horizontal section and only vertical lines, diagonal lines and circles remain.

다음 과정의 수직선 개수는 맨 왼쪽 열 (column)부터 마스크하여 최소 도트수 이상 (32x32 도트의 경우 4개 도트 이상)의 수직선이 체크되면 열 번호와 도트수를 기록하고, 한열 더 오른쪽으로 이동하여 체크 했을 때 거의 동일한 크기(명조체의 경우 1~2도트 차이 발생, 세선화하지 않은 경우)이면 같은 수직선으로 판단한다.       The number of vertical lines in the next process is masked from the leftmost column, and if the vertical lines of more than the minimum number of dots (more than 4 dots for 32x32 dots) are checked, record the column number and the number of dots, and move them one more column to the right. If it is almost the same size (1 ~ 2 dot difference occurs in case of light body, if not thinned), it is judged as the same vertical line.

동일 열에 4도트 이상 떨어진 수직선들이 나타날 때는 이는 별개의 수직선으로 판단한다. 수직선 체크중 카운트가 된 수직선들은 이미지에서 지워 나간다. 그러므로 수직선 검색이 끝난 이미지는 수직선 부문이 없어지고 사선과 원만 남게 된다.       If vertical lines appear more than 4 dots apart in the same column, this is considered a separate vertical line. Vertical lines that have been counted during vertical line check are deleted from the image. Therefore, after the vertical line search, the vertical line section disappears and only diagonal lines and circles remain.

이와 같이 32x32 도트의 한글 문자 이미지에서 특히 명조체의 경우 3화소 이상의 선폭을 갖는 선소도 존재하는데 이와 같은 경우에 하나의 선소에 2개 이상의 선소가 존재한다고 판단할 수 있다.       As such, in the Hangeul character image of 32x32 dots, there are also line elements having a line width of 3 pixels or more, especially in the case of Myungjo, and in this case, it can be determined that two or more line elements exist in one line element.

그러나 실제는 하나의 선소이므로 위와 같이 판단하여 이러한 오류를 보상해야 한다. 사선 개수는 맨 윗 줄(row) 왼쪽 열부터 45도 간격으로 마스크하여 최소 도트수 이상 (32x32 도트의 경우 4개 도트 이상)의 사선이 체크되면 줄 및 열번호와 도트수를 기록하고, 대각선으로 한 도트 더 내려와서 체크 했을 때 거의 동일한 크기(명조체의 경우 1~2도트 차이 발생, 사선화하지 않은 경우)이면 같은 사선으로 판단한다. 동일 줄에 4도트 이상 떨어진 사선들이 나타날 때는 이는 별개의 사선으로 판단한다.       However, since it is actually a single ship, it is necessary to make the above judgment to compensate for this error. The number of diagonal lines is masked at intervals of 45 degrees from the left column of the top row, and if the diagonal lines of more than the minimum number of dots (more than 4 dots in the case of 32x32 dots) are checked, the line and column numbers and the number of dots are written diagonally. If one more dot comes down and checked, it is judged to be the same diagonal line if the size is almost the same (1 ~ 2 dot difference occurs in case of Myungjo body, if not diagonalized). If diagonal lines appearing more than four dots apart on the same line, this is considered a separate diagonal line.

사선 체크중 카운트가 된 사선들은 이미지에서 지워나간다. 그러므로 사선 검색이 끝난 이미지는 사선 부문이 없어지고 역방향 사선과 원만 남게 된다. 역사선 개수는 맨 윗 줄(row) 오른쪽 열부터 45도 간격으로 마스크하여 최소 도트수 이상 (32x32 도트의 경우 4개 도트 이상)의 역사선이 체크되면 줄 및 열번호와 도트수를 기록하고, 대각선으로 한 도트 더 내려와서 체크 했을 때 거의 동일한 크기(명조체의 경우 1~2도트 차이 발생)이면 같은 역사선으로 판단한다.       The diagonal lines that have been counted during the oblique check are deleted from the image. Therefore, after the diagonal search is completed, the diagonal section disappears and only the reverse diagonal line and circle remain. The number of history lines is masked at 45-degree intervals from the right column of the top row, and when the history lines more than the minimum number of dots (more than 4 dots for 32x32 dots) are checked, the line, column number, and number of dots are recorded. If you check one dot diagonally down and check it, if it is almost the same size (1 ~ 2 dot difference in case of Myungjo), it will be judged as the same history line.

동일 줄에 4도트 이상 떨어진 역사선들이 나타날 때는 이는 별개의 역사선으로 판단한다. 역사선 체크중 카운트가 된 역사선들은 이미지에서 지워나간다. 그러므로 역사선 검색까지 끝난 이미지는 역사선 부문이 없어지고 원만 남게 된다. 수평, 수직, 사선, 역사선을 검색시 원과 구분하는 방법이 필요하다.       When history lines appear more than 4 dots apart on the same line, it is considered a separate history line. History lines that have been counted during the history line check are removed from the image. Therefore, the image that finishes searching the history line is missing the history line section and only the circle remains. We need a way to distinguish horizontal, vertical, oblique, and historical lines from circles when searching.

이런 의미에서 글자 이미지를 4방향 선소를 검색하기 전에 선소를 한 도트의 폭으로 변화하는 세선화를 실시하면 수평, 수직, 사선을 판별할 때 원 구분이 용이 하다.       In this sense, if the thinning is performed by changing the line width to the width of one dot before searching the 4-way line in the letter image, it is easy to distinguish the circle when discriminating horizontal, vertical, and diagonal lines.

즉, 수평선 탐색중 (둥근 원이 아니라 넓은 원의 경우) 줄이 바뀜에 따라 연결되는 도트들의 간격이 커지다가 작아지면 이를 원으로 판단하고 중심과 반지름(수직, 수평)을 기록한다.      In other words, when the horizontal line is changed while the horizontal line is being searched (in the case of a wide circle instead of a round circle), the distance between the connecting dots increases and decreases, and the center and the radius (vertical and horizontal) are recorded.

이단계로 모음의 위치 방향을 (일단계에서는 ㅏ와 ㅓ, ㅗ와 ㅜ, ㅑ와 ㅕ, ㅛ와 ㅠ 등은 동일하게 인식) 판단하여 이를 방향+단+중+장(수평선소)+방향+단+중+소(수직선소)+단+중+장(사선)+원의 형식으로 코드화하여 정렬하면 1076자 중 692자가 고유한 코드값을 가지므로 자동으로 유일하게 분류가 된다.       In this step, judging the position of the vowel (in the first step, 인식 and ㅓ, ㅗ and TT, ㅑ and ㅕ, ㅛ and ㅠ are recognized the same) and judge it as direction + end + middle + long (horizontal line) + direction + end If you sort by sorting + medium + small (vertical line) + short + medium + long (diagonal) + circle, 692 out of 1076 characters have unique code values and are automatically classified.

즉, 일단계에서 코드가 중복이 되는 문자인 경우(예를 들면 ‘아’와 ‘어’) 모음을 구성하는 수평선과 수직선의 위치를 판별 구분토록 구성된다. 이단계를 거치고도 코드값이 중복되는 한글 문자 유형을 구분하면 ㄱ, ㄴ(수평 1, 수직 1)과 ㅁ, ㅂ, ㅍ(수평 2, 수직 2)의 수평 수직 선소의 장/중/단이 일치하는 경우가 대부분으로 중복 개수가 제일 많은 것도 4개로 나타난다.      That is, in the first step, when the code is a duplicate character (for example, '아' and '어'), the horizontal line and the vertical line forming the vowel are distinguished and discriminated. Even after this step, if the Korean character types with duplicate code values are distinguished, the length, middle, and end of the horizontal and vertical lines of a, b (horizontal 1, vertical 1) and ㅁ, ㅂ, ㄴ (horizontal 2, vertical 2) In most cases, the highest number of duplicates appears as four.

삼단계로 ㄱ, ㄴ(수평 1, 수직 1)과 ㅁ, ㅂ, ㅍ(수평 2, 수직 2)을 구분하고 초성과 종성 위치만을 판별하여 방향+단+중+장(수평선소)+방향+단+중+소(수직선소)+단+중+장(사선)+원+(ㄱ ㄴ구분)+(ㅁ ㅂ ㅍ 구분)으로 코드 값을 정의 계산하면 1,076 자 중 1,066 자를 인식 99% 분류가 이루어진다.       In three steps, a, b (horizontal 1, vertical 1) and ㅁ, ㅂ, プ (horizontal 2, vertical 2) are distinguished, and only the initial and final positions are determined, and the direction + end + middle + long (horizontal line) + direction + When the code value is defined as single + middle + small (vertical line) + single + middle + long (diagonal) + one + (a b) + (ㅁ ㅁ ッ division), 1,066 of 1,076 characters are recognized. Is done.

분류되지 않는 10개의 글자는 ‘얻과 엌’, ‘두와 쿠’, ‘도와 코’, ‘송 과 옷’, ‘뤽과 쉴’이다. ‘송과 옷’ 및 ‘륏과 쉴’은 사선의 위치가 위에 있는지 아래에 있는지로 구분하면 되며, ‘도와 코’ 및 ‘두와 쿠’ 및 ‘얻과 엌’은 자음을 구성하는 수직선의 위치 (ㄷ과 ㅋ에서 ㄷ은 수직선이 왼쪽, ㅋ은 오른쪽에 있음)를 게산하여 구분한다. 이를 통해 100% 구분이 이루어지게 된다.      The ten letters that are not categorized are 'Dewa and Kitchen', 'Doo and Ku', 'Dowa Ko', 'Song and Clothes', and '뤽 and Rest'. 'Song and clothes' and '륏 and rest' can be divided into whether the position of the diagonal line is above or below, and 'Dowako', 'Duwawaku', and 'Deuwa Kitchen' are the vertical lines that make up consonants. (C and ㅋ are the vertical lines on the left and ㅋ on the right). This makes 100% classification.

제 3도는 본 발명이 적용되는 훈민정음 창제원리에 의해 코드화한 한글문자 분류도표의 일부로 이러한 형식으로 한글의 각 글씨체에 따른 분류도표 데이터베이스를 구축, 삼단계 비교 과정을 거쳐 99%의 한글문자를 쉽게 구분하고, 마지막으로 10개의 문자에 대해서도 사선의 위치와 수직선의 위치를 가지고 구분이 이루어진다.      3 is a part of the Korean character classification table coded by the Hunminjeongeum Changje principle to which the present invention is applied, and in this format, a classification table database according to each Korean font is constructed, and 99% of Korean characters are easily distinguished through a three-step comparison process. Finally, the 10 characters are divided with the position of the oblique line and the position of the vertical line.

이상에서 설명한 본 발명은, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.      The present invention described above is capable of various substitutions, modifications, and changes without departing from the technical spirit of the present invention for those skilled in the art to which the present invention pertains. It is not limited by the drawings.

도 1은 기존의 한글 문자 인식 알고리듬 및 인식 프로세스 흐름도1 is a flow chart of a conventional Hangul character recognition algorithm and recognition process

도 2는 본 발명이 적용되는 훈민정음 창제원리에 의한 한글문자 인식을 위한 단계별 흐름도      2 is a step-by-step flowchart for the recognition of Hangul characters by the Hunminjeongeum Changje principle to which the present invention is applied

도 3는 본 발명이 적용되는 훈민정음 창제원리에 의해 코드화한 한글문자 분류도표 예      Figure 3 is an example Hangul character classification coded by the Hunminjeongeum Changje principle to which the present invention is applied

* 도면의 주요 부분에 대한 부호의 설명      * Explanation of symbols for the main parts of the drawings

1 : 글자의 선소, 획 분리 2 : 모음의 연결위치 방향 구분       1: Character line, stroke separation 2: Vowel connection location direction division

3 : 초성, 종성 구분 3: initial, final

Claims (9)

문자를 인식하는 방법에 있어서,      In the method of recognizing a character, 한 글자의 문자 이미지를 형성하고,      Form a letter image of a letter, 수평선, 수직선, 사선 들을 해당 문자 이미지에서 추출하여 각각의 특성을 기록하며,     The horizontal lines, vertical lines, and diagonal lines are extracted from the corresponding text image, and each characteristic is recorded. 각각의 갯수를 코드화하여 글자를 나타내는 고유한 코드값을 형성하여      Each number is coded to form a unique code value that represents the letter 선소들의 갯수를 기준으로 계산한 값을 기록한 문자 데이터베이스에서 찾아 비교하여 일치하면 해당 문자로 인식함을 특징으로 하는 선소의 갯수를 계산하여 문자를 인식하는 방법A method of recognizing characters by counting the number of lines, which is characterized by finding and comparing the values calculated based on the number of line elements in the recorded character database and matching them. 1 항에 있어서According to claim 1 한 글자의 문자 이미지를 형성한 후      After forming a letter image of a letter 세선화 과정을 거쳐 해당 문자의 이미지를 골격화한 후 진행함을 특징으로 하는 선소의 갯수를 계산하여 문자를 인식하는 방법A method of recognizing a character by calculating the number of line elements characterized by proceeding after skeletonizing the image of the character through a thinning process 1 항과 같이 일단계로 수평선, 수직선, 사선의 갯수로 비교한 후,Compare the number of horizontal lines, vertical lines, and diagonal lines in one step as shown in paragraph 1, 중복되는 코드값을 가지는 경우      If you have duplicate code values 모음을 나타내는 수직선과 수평선의 방향 성분을 코드화시켜 추가로 구성하여      By constructing additional components by coding the direction components of the vertical and horizontal lines representing the vowel 선소들의 갯수를 기준으로 계산한 값을 기록한 문자 데이터베이스에서 찾아 비교하여 일치하면 해당 문자로 인식함을 특징으로 하는 선소의 갯수와 방향을 계산하여 문자를 인식하는 방법A method of recognizing a character by calculating the number and direction of a line element characterized by recognizing and comparing the value calculated based on the number of line elements in the recorded character database and matching and matching. 3 항에 있어서,According to claim 3, 모음을 나타내는 수직선과 수평선의 방향 성분을 코드화하여 추가로 구성하고도      You can also code the direction components of the vertical and horizontal lines that represent the vowel, 중복된 코드값이 나타나는 경우,      If you see duplicate code values, 기역과 니은을 구분하거나      You can distinguish between the base and the 미음과 비읍, 피읖을 구분하는 성분을 코드화하여 추가로 구성하고      Additional components are coded to distinguish the taste from the rice cakes. 선소들의 갯수를 기준으로 계산한 값을 기록한 문자 데이터베이스에서 찾아 비교하여 일치하면 해당 문자로 인식함을 특징으로 하는 선소의 개수와 자음을 구분하여 문자를 인식하는 방법A method of recognizing a character by distinguishing the number of consonants and the consonants, which are based on the number of the elements, and compares and compares the calculated value in the recorded character database. 4 항에 있어서,The method of claim 4, 모음을 나타내는 수직선과 수평선의 방향 성분을 코드화하여 추가로 구성하고도      You can also code the direction components of the vertical and horizontal lines that represent the vowel, 중복된 코드값이 나타나는 경우,      If you see duplicate code values, 디귿과 키읔을 구분하거나      To distinguish between dishes and keyboards, 사선의 위치를 구분하는 성분을 코드화하여 추가로 구성하고      The component that separates the position of the oblique line is additionally coded. 선소들의 갯수를 기준으로 계산한 값을 기록한 문자 데이터베이스에서 찾아 비교하여 일치하면 해당 문자로 인식함을 특징으로 하는 선소의 개수와 자음을 구분하여 문자를 인식하는 방법A method of recognizing a character by distinguishing the number of consonants and the consonants, which are based on the number of the elements, and compares and compares the calculated value in the recorded character database. 5 항에 있어서,The method of claim 5, 디귿과 키읔을 구분하기 위해서       To distinguish between Dijon and Kiss 자음을 구성하는 수직선의 위치로 구분함을 특징으로 하는 디귿과 티읔 구분 방법     Dividing and teasing method characterized by dividing by the position of the vertical line forming the consonant 4 항에 있어서,The method of claim 4, 기역과 니은을 구분하기 위해서       To distinguish between the base and the 자음을 구성하는 수평선의 위치로 구분함을 특징으로 하는 기역과 니은 구분 방법     How to distinguish the air force and knee is characterized by the location of the horizontal line constituting the consonant 4 항에 있어서,The method of claim 4, 미음과 비읍 및 피읖을 구분하기 위해서       To distinguish between the heart and the mouth and blood 자음을 구성하는 수평선과 수직선의 위치(왼쪽 수직선에 대해 수평선의 위치, 피읍은 위에 있으며 미음은 일치하며 비읍은 중간 정도에 있음)로 구분함을 특징으로 하는 미음과 비읍 및 피읖 구분 방법     How to distinguish between Myeonge and Byeongeup and Peeup, characterized by the horizontal line and the vertical line of the consonant (horizontal position with respect to the left vertical line; 1 항에 있어서,According to claim 1, 선소를 구분하기 위해      To distinguish between 줄(row)과 행(column)을 이동시킬 때      When moving rows and columns 기본 검사하는 대상을 1 도트 이상씩으로 구성(2~3 도트 폭으로 검사, 글자 이미지 해상도에 따라 변화시킴, 32x 32 도트의 경우 2도트로 도트 폭을 설정하면 16단계 영역으로 이동하며 선소 존재를 검사함)하여      Basic target is composed of 1 or more dots (2 ~ 3 dot width, change depending on the resolution of the text image. If the dot width is set to 2 dots for 32x32 dots, it moves to the 16-step area and checks for the presence of line elements. ) 세선화 과정에서 발생하는 직선의 노이즈 부문을 흡수하도록 구성함을 특징으로 하는      Characterized in that it is configured to absorb the noise portion of the straight line generated in the thinning process 문자 이미지에서 1 도트 이상의 폭을 갖는 영역에서의 선소 검사 방법Line Segment Inspection Method in an Area of 1 Dot or More in a Character Image
KR1020080036842A 2008-04-21 2008-04-21 The Optical Character Recognition method and device by the numbers of horizon, vertical and slant lines which is the element of Hanguel KR20090111202A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080036842A KR20090111202A (en) 2008-04-21 2008-04-21 The Optical Character Recognition method and device by the numbers of horizon, vertical and slant lines which is the element of Hanguel

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080036842A KR20090111202A (en) 2008-04-21 2008-04-21 The Optical Character Recognition method and device by the numbers of horizon, vertical and slant lines which is the element of Hanguel

Publications (1)

Publication Number Publication Date
KR20090111202A true KR20090111202A (en) 2009-10-26

Family

ID=41538988

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080036842A KR20090111202A (en) 2008-04-21 2008-04-21 The Optical Character Recognition method and device by the numbers of horizon, vertical and slant lines which is the element of Hanguel

Country Status (1)

Country Link
KR (1) KR20090111202A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101367813B1 (en) * 2013-03-06 2014-02-27 한국과학기술원 Corner detection accelerator based on segment test using string searching
KR101668440B1 (en) * 2016-01-29 2016-10-27 김현식 Pattern recognition apparatus and method using code value
CN107798321A (en) * 2017-12-04 2018-03-13 海南云江科技有限公司 A kind of examination paper analysis method and computing device
CN109256123A (en) * 2018-09-06 2019-01-22 徐喜成 A kind of auxiliary the elderly reading text and anti-real-time, interactive reading system of wandering away

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101367813B1 (en) * 2013-03-06 2014-02-27 한국과학기술원 Corner detection accelerator based on segment test using string searching
KR101668440B1 (en) * 2016-01-29 2016-10-27 김현식 Pattern recognition apparatus and method using code value
CN107798321A (en) * 2017-12-04 2018-03-13 海南云江科技有限公司 A kind of examination paper analysis method and computing device
CN109256123A (en) * 2018-09-06 2019-01-22 徐喜成 A kind of auxiliary the elderly reading text and anti-real-time, interactive reading system of wandering away

Similar Documents

Publication Publication Date Title
Tian et al. Multilingual scene character recognition with co-occurrence of histogram of oriented gradients
Naz et al. The optical character recognition of Urdu-like cursive scripts
Adamek et al. Word matching using single closed contours for indexing handwritten historical documents
Jayadevan et al. Offline recognition of Devanagari script: A survey
Marinai Introduction to document analysis and recognition
Agnihotri Offline handwritten Devanagari script recognition
US20120114245A1 (en) Online Script Independent Recognition of Handwritten Sub-Word Units and Words
Al-Rashaideh Preprocessing phase for Arabic word handwritten recognition
Maloo et al. Support vector machine based Gujarati numeral recognition
Hewavitharana et al. A two stage classification approach to Tamil handwriting recognition
Biswas et al. Writer identification of Bangla handwritings by radon transform projection profile
Roy et al. Date-field retrieval in scene image and video frames using text enhancement and shape coding
Maloo et al. Gujarati script recognition: a review
Thillou et al. An embedded application for degraded text recognition
KR20090111202A (en) The Optical Character Recognition method and device by the numbers of horizon, vertical and slant lines which is the element of Hanguel
Bairagi et al. Optical character recognition for Hindi
Kannan et al. A comparative study of optical character recognition for Tamil script
Aravinda et al. Template matching method for Kannada handwritten recognition based on correlation analysis
Rahiman et al. A detailed study and analysis of ocr research in south indian scripts
Khare et al. Handwritten Devanagari character recognition system: a review
Padma et al. Script Identification from Trilingual Documents using Profile Based Features.
Ajao et al. Yoruba handwriting word recognition quality evaluation of preprocessing attributes using information theory approach
Ding et al. Writer identification based on local contour distribution feature
Dhandra et al. On Separation of English Numerals from Multilingual Document Images.
Pourasad et al. Farsi font recognition using holes of letters and horizontal projection profile

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid