KR101015233B1 - Method, apparatus and computer-readable recording medium for recognizing character included in hangul document - Google Patents

Method, apparatus and computer-readable recording medium for recognizing character included in hangul document Download PDF

Info

Publication number
KR101015233B1
KR101015233B1 KR1020090064687A KR20090064687A KR101015233B1 KR 101015233 B1 KR101015233 B1 KR 101015233B1 KR 1020090064687 A KR1020090064687 A KR 1020090064687A KR 20090064687 A KR20090064687 A KR 20090064687A KR 101015233 B1 KR101015233 B1 KR 101015233B1
Authority
KR
South Korea
Prior art keywords
character recognition
character
recognition
document information
characters
Prior art date
Application number
KR1020090064687A
Other languages
Korean (ko)
Other versions
KR20110007009A (en
Inventor
황준호
양병석
김형태
윤병훈
최원효
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020090064687A priority Critical patent/KR101015233B1/en
Publication of KR20110007009A publication Critical patent/KR20110007009A/en
Application granted granted Critical
Publication of KR101015233B1 publication Critical patent/KR101015233B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/293Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of characters other than Kanji, Hiragana or Katakana

Abstract

이미지로 표현되는 한글 문서에 대해 문자 인식을 수행하기 위한 방법, 장치 및 컴퓨터 판독 가능한 기록 매체가 개시된다. 본 발명에 따르면, 이미지 형식의 한글 문서에 포함된 문자를 인식하기 위한 방법으로서, (a) 이미지에 포함된 문자를 대상으로, 다른 성분과 접합되어 있지 않은 일 이상의 독립된 성분들을 추출하는 단계, (b) 상기 추출된 독립된 성분 중 자소에 해당되는 성분을 인식하는 단계, (c) 상기 인식된 자소를 기초로 하여 1차 문자 인식을 수행하는 단계, (d) 상기 1차 문자 인식 결과로부터 상기 한글 문서에 대한 문서 정보를 파악하는 단계, 및 (e) 상기 파악된 문서 정보를 기초로 상기 1차 문자 인식의 대상이 되지 못한 문자들에 대해 2차 문자 인식을 수행하는 단계를 포함하는 방법이 제공된다. 본 발명에 따르면, 문자 분할의 정확도 향상과 문자 인식의 속도 향상을 꾀할 수 있다.A method, apparatus, and computer readable recording medium for performing character recognition on a Hangul document represented by an image are disclosed. According to the present invention, there is provided a method for recognizing a character included in an Hangul document in an image format, the method comprising: (a) extracting one or more independent components that are not bonded to another component from a character included in an image; b) recognizing a component corresponding to a phoneme among the extracted independent components, (c) performing a primary character recognition based on the recognized phoneme, and (d) the Hangul character from the primary character recognition result Identifying document information for a document, and (e) performing secondary character recognition on characters that are not subject to primary character recognition based on the identified document information. do. According to the present invention, it is possible to improve the accuracy of character division and the speed of character recognition.

문자 분할, 자소 분할, 자소 인식, 문자 인식, 문서 정보 Character segmentation, character segmentation, character recognition, character recognition, document information

Description

한글 문서에 포함된 문자를 인식하기 위한 방법, 장치 및 컴퓨터 판독 가능한 기록 매체{METHOD, APPARATUS AND COMPUTER-READABLE RECORDING MEDIUM FOR RECOGNIZING CHARACTER INCLUDED IN HANGUL DOCUMENT}METHOD, APPARATUS AND COMPUTER-READABLE RECORDING MEDIUM FOR RECOGNIZING CHARACTER INCLUDED IN HANGUL DOCUMENT}

이미지로 표현되는 한글 문서에 대해 문자 인식을 수행하기 위한 방법, 장치 및 컴퓨터 판독 가능한 기록 매체에 관한 것으로, 보다 상세하게는, 문서에 대한 문자 인식을 수행함에 있어서, 확실하게 인식 가능한 자소들을 먼저 인식함으로써 글자들의 유형별 평균 높이와 넓이, 줄 간격 등의 문서 정보를 파악한 후, 이에 기초하여 문자 분할을 수행함으로써, 문자 분할의 정확도를 향상시킬 수 있고, 문자 인식의 속도 향상을 도모할 수 있는 방법, 장치 및 컴퓨터 판독 가능한 기록 매체에 관한 것이다. The present invention relates to a method, an apparatus, and a computer-readable recording medium for performing character recognition on a Hangul document represented by an image. More specifically, in performing character recognition on a document, first, recognizable characters are recognized first. By identifying document information such as average height, width, and line spacing for each type of characters, and performing character segmentation on the basis of this, the accuracy of character segmentation can be improved and the speed of character recognition can be improved. An apparatus and a computer readable recording medium.

최근, 디지털 저장 매체의 급속한 보급에 따라 기존에 지면 상으로 존재하였던 문서들에 대한 디지털화 작업이 활발히 전개되고 있다.  이와 같은 현상은 지면 등에 나타난 문자를 자동으로 인식하는 기술인 광학 문자 인식 기술(Optical Character Recognition : OCR)의 발전에 따라 더욱 더 가속화되고 있는 실정이다. Recently, with the rapid spread of digital storage media, digitalization of documents that existed on the ground has been actively developed. This phenomenon is accelerating with the development of Optical Character Recognition (OCR), which is a technology for automatically recognizing characters appearing on the ground.

이미지로 표현되는 한글 문서에 포함된 문자들을 인식해내기 위해서 종래에 는 한글자 단위로 모델을 만들어 인식하였었다.  즉, 문서 내에 포함되는 글자 각각을 2350 자에 달하는 한글 문자 모델과 비교하여 높은 유사도를 보이는 한글 문자를 해당 글자의 인식 결과로서 출력하였다.  그러나, 이에 따르면, 수 많은 비교 과정을 거쳐야 하기 때문에 문자 인식의 속도가 매우 저하되는 문제점이 있었으며, 2350 자에 달하는 한글 문자들 서로 간의 차이도 확연하지 않기 때문에 오인식으로 인한 인식률 하락이 빈번하게 발생할 수 밖에 없었다. In order to recognize the characters included in the Hangul document represented by the image, in the past, a model was formed and recognized in units of Hangul characters. In other words, each character included in the document is compared with the Korean character model of 2350 characters, and the Korean character with high similarity is output as a result of recognition of the character. However, according to this, there is a problem that the speed of character recognition is very slow because a number of comparison process has to be performed, and the recognition rate decrease may occur frequently due to misrecognition because the difference between 2350 Korean characters is not obvious. There was only.

이러한 문제점을 해결하기 위해서 개발된 방식이 자소 단위 인식 방법이다.  즉, 문서에 포함되는 문자들을 글자 단위로 인식하는 것이 아니라, 자소 단위로 인식하고 이를 다시 조합함으로써 문자 인식을 수행해내는 방식이다.  이에 따르면, 문자에 포함되는 각 자소를 24개 가량의 표준 자소에 대응시키기만 하면 되므로, 자소들을 확실하게 구별할 수 있게 되고 문자 인식의 인식률을 향상시킬 수 있게 되었다.  The method developed to solve this problem is the phoneme unit recognition method. In other words, the characters included in the document are not recognized in units of letters, but are recognized in units of phonemes and combined again to perform character recognition. According to this, since each phoneme included in the letter needs to be corresponded to about 24 standard phonemes, the phonemes can be clearly distinguished and the recognition rate of the character recognition can be improved.

이러한 방식 중 대표적인 방법으로는 문서에 포함되는 문자들을 서로 분할해낸 후 분할된 문자에 대해 자소 분할을 수행하고 분할된 자소를 인식하는 방법을 들 수 있다.  A representative method of these methods is a method of dividing characters included in a document from each other, performing a phoneme division on the divided characters, and recognizing the divided characters.

그러나, 이러한 방식에 따르면, 문자 인식의 가장 첫 단계인 문자 분할 단계에서 오류가 발생하게 되면, 전체 문서의 오인식으로 이어질 수 밖에 없는 문제점이 있었다.  또한, 자소 분할 알고리즘을 수행하지 않고도 쉽게 분할해 낼 수 있는 자소에 대해서도 불필요한 자소 분할 알고리즘을 적용시킴으로써 전체적인 문자 인식의 성능 및 속도가 떨어지게 되는 문제점이 있었다. However, according to this method, if an error occurs in the character division step, which is the first step of character recognition, there is a problem that can lead to misrecognition of the entire document. In addition, there is a problem in that the performance and speed of the overall character recognition are reduced by applying an unnecessary phoneme segmentation algorithm to a phoneme that can be easily segmented without performing the phoneme segmentation algorithm.

따라서, 문자 인식 과정에 있어서 문자 분할의 정확도를 높힘과 동시에 불필요한 자소 분할 알고리즘의 수행을 방지하여 전체적인 문자 인식의 성능 및 속도를 향상시킬 수 있는 기술에 대한 개발이 필요한 실정이다.Therefore, it is necessary to develop a technology that can improve the performance and speed of the overall character recognition by increasing the accuracy of character division in the character recognition process and preventing the unnecessary segmentation algorithm from being performed.

따라서, 본 발명의 목적은, 상기와 같은 종래 기술의 문제점을 모두 해결하기 위하여, 문자 인식을 수행함에 있어서 쉽게 인식이 가능한 자소를 먼저 인식하고 이를 통해 문서 정보를 파악해낸 후, 이에 기초하여 문자 분할을 수행하고 최종적인 문자 인식을 수행함으로써, 문자 분할의 정확도를 향상시켜 전체적인 문자 인식의 오류율을 줄일 수 있도록 하는 것이다. Accordingly, an object of the present invention, in order to solve all the problems of the prior art as described above, the character recognition that can be easily recognized in performing the character recognition first recognize the document information through this, and then based on this character segmentation By performing the method and the final character recognition, the accuracy of character division can be improved to reduce the error rate of the overall character recognition.

또한, 본 발명의 다른 목적은, 다른 자소와 접하고 있지 않아 쉽게 분할이 가능한 자소에 대해서는 별도의 알고리즘을 적용시키지 않고 미리 인식해냄으로써 불필요한 자소 분할 과정을 피할 수 있도록 하고 이에 따라 문자 인식의 속도 향상을 꾀할 수 있도록 하는 것이다.In addition, another object of the present invention is to avoid unnecessary phoneme segmentation process by recognizing the phonemes that are not in contact with other phonemes and can be easily divided without applying a separate algorithm, thereby improving the speed of character recognition. It is to make it possible.

상기한 바와 같은 본 발명의 목적을 달성하고, 후술하는 본 발명의 특징적인 효과를 실현하기 위한, 본 발명의 특징적인 구성은 하기와 같다. The characteristic structure of this invention for achieving the objective of this invention mentioned above, and realizing the characteristic effect of this invention mentioned later is as follows.

본 발명의 일 실시예에 따르면, 이미지 형식의 한글 문서에 포함된 문자를 인식하기 위한 방법으로서, (a) 이미지에 포함된 문자를 대상으로, 다른 성분과 접합되어 있지 않은 일 이상의 독립된 성분들을 추출하는 단계, (b) 상기 추출된 독립된 성분 중 자소에 해당되는 성분을 인식하는 단계, (c) 상기 인식된 자소를 기초로 하여 1차 문자 인식을 수행하는 단계, (d) 상기 1차 문자 인식 결과로부터 상기 한글 문서에 대한 문서 정보를 파악하는 단계, 및 (e) 상기 파악된 문서 정보를 기초로 상기 1차 문자 인식의 대상이 되지 못한 문자들에 대해 2차 문자 인식을 수행하는 단계를 포함하는 방법이 제공된다.According to an embodiment of the present invention, a method for recognizing a character included in an Hangul document in an image format, comprising: (a) extracting one or more independent components that are not joined to another component from a character included in an image; (B) recognizing a component corresponding to a phoneme among the extracted independent components, (c) performing primary character recognition based on the recognized phoneme, (d) recognizing the primary character Identifying document information on the Hangul document from a result; and (e) performing secondary character recognition on characters not subject to the primary character recognition based on the identified document information. A method is provided.

본 발명의 다른 실시예에 따르면, 이미지 형식의 한글 문서에 포함된 문자를 인식하기 위한 장치로서, 이미지에 포함된 문자를 대상으로, 다른 성분과 접합되어 있지 않은 일 이상의 독립된 성분들을 추출하는 독립 성분 추출부, 상기 추출된 독립된 성분 중 자소에 해당되는 성분을 인식하는 독립 성분 인식부, 상기 인식된 자소를 기초로 하여 1차 문자 인식을 수행하고, 상기 1차 문자 인식 결과로부터 상기 한글 문서에 대한 문서 정보를 파악하는 문서 정보 획득부, 상기 파악된 문서 정보를 기초로 상기 1차 문자 인식의 대상이 되지 못한 문자들에 대해 2차 문자 인식을 수행하는 최종 문자 인식부를 포함하는 장치가 제공된다.According to another embodiment of the present invention, an apparatus for recognizing a character included in an Hangul document in an image format, the independent component for extracting one or more independent components that are not bonded to other components of the character included in the image An extraction unit, an independent component recognition unit for recognizing a component corresponding to a phoneme among the extracted independent components, and performing a primary character recognition on the basis of the recognized phoneme, and from the result of the primary character recognition, Provided is a device including a document information acquisition unit for acquiring document information and a final character recognition unit for performing secondary character recognition on characters that are not subject to the primary character recognition based on the identified document information.

본 발명의 또 다른 실시예에 따르면, 이미지 형식의 한글 문서에 포함된 문자를 인식하기 위한 장치로서, 이미지에 포함된 문자를 대상으로, 다른 성분과 접합되어 있지 않은 일 이상의 독립 자소 인식을 통한 1차 문자 인식을 수행한 결과를 기초로 상기 한글 문서에 대한 문서 정보를 파악하는 문서 정보 획득부, 상기 파악된 문서 정보를 기초로 상기 1차 문자 인식의 대상이 되지 못한 문자들에 대해 2차 문자 인식을 수행하는 최종 문자 인식부를 포함하는 장치가 제공된다. According to still another embodiment of the present invention, an apparatus for recognizing a character included in an Hangul document in an image format, comprising: one or more independent character recognitions for characters included in an image, which are not bonded to other components; A document information acquisition unit for acquiring document information about the Hangul document based on a result of performing the second character recognition, and a second character for characters that are not subject to the first character recognition based on the identified document information An apparatus is provided that includes a final character recognition unit that performs recognition.

한편, 이 외에도, 본 발명을 구현하기 위한 다른 방법, 시스템 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하기 위한 컴퓨터 판독 가능한 기록 매체가 더 제공된다.On the other hand, in addition to this, there is further provided a computer readable recording medium for recording another method, system and computer program for executing the method for implementing the present invention.

본 발명에 따르면, 쉽게 인식이 가능한 자소를 통해 줄 간격, 폰트 크기 등과 같은 문서 정보를 획득하고 이를 바탕으로 문자 분할이 수행되기 때문에, 문자 분할의 정확성이 향상될 수 있고, 이에 따라 문자의 인식률 또한 향상될 수 있다. According to the present invention, since document information such as line spacing, font size, etc. is obtained through characterization that can be easily recognized, and character segmentation is performed based on the document information, the accuracy of character segmentation can be improved. Can be improved.

또한, 본 발명에 따르면, 쉽게 인식될 수 있는 자소에 대해서는 불필요한 자소 분할 과정이 적용되지 않기 때문에 전체적인 문자 인식의 속도 향상을 꾀할 수 있다.  In addition, according to the present invention, since unnecessary phoneme segmentation is not applied to the easily recognized phoneme, it is possible to improve the speed of the overall character recognition.

후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다.  이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다.  본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다.  예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다.  또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다.  따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다.  도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다. DETAILED DESCRIPTION The following detailed description of the invention refers to the accompanying drawings that show, by way of illustration, specific embodiments in which the invention may be practiced. These embodiments are described in sufficient detail to enable those skilled in the art to practice the invention. It should be understood that the various embodiments of the present invention are different but need not be mutually exclusive. For example, certain features, structures, and characteristics described herein may be implemented in other embodiments without departing from the spirit and scope of the invention in connection with an embodiment. It is also to be understood that the position or arrangement of the individual components within each disclosed embodiment may be varied without departing from the spirit and scope of the invention. The following detailed description, therefore, is not to be taken in a limiting sense, and the scope of the present invention, if properly described, is defined only by the appended claims, along with the full range of equivalents to which such claims are entitled. Like reference numerals in the drawings refer to the same or similar functions throughout the several aspects.

이하, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다. Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art can easily implement the present invention.

도 1은 본 발명의 일 실시예에 따라 이미지로 표현되는 문서에 대해 문자 인식을 수행하기 위한 장치의 구성을 나타내는 도면이다. 1 is a diagram illustrating a configuration of an apparatus for performing character recognition on a document represented by an image according to an embodiment of the present invention.

도 1에 도시되는 바와 같이, 본 발명의 문자 인식 장치(100)는 이미지 정보 인식부(110), 독립 성분 추출부(120), 독립 성분 인식부(130), 문서 정보 획득부(140), 문자 분할부(150), 최종 문자 인식부(160), 제어부(170) 및 통신부(180)를 포함할 수 있다.  본 발명의 일 실시예에 따르면, 문자 인식 장치(100)는 이미지 정보 인식부(110), 독립 성분 추출부(120), 독립 성분 인식부(130), 문서 정보 획득부(140), 문자 분할부(150), 최종 문자 인식부(160), 제어부(170) 및 통신부(180)는 그 중 적어도 일부가 문자 인식 장치(100)와 통신하는 프로그램 모듈들일 수 있다(다만, 도 1에서는 이미지 정보 인식부(110), 독립 성분 추출부(120), 독립 성분 인식부(130), 문서 정보 획득부(140), 문자 분할부(150), 최종 문자 인식부(160), 제어부(170) 및 통신부(180)가 문자 인식 장치(100)에 포함되어 있는 것으로 예시하고 있다).  이러한 프로그램 모듈들은 운영 시스템, 응용 프로그램 모듈 및 기타 프로그램 모듈로서 자소 분할 장치(100)에 포함될 수 있으며, 물리적으로는 여러 가지 공지의 기억 장치 상에 저장될 수 있다.  또한, 이러한 프로그램 모듈들은 자소 분할 장치(100)와 통신 가능한 원격 기억 장치에 저장될 수도 있다.  한편, 이러한 프로그램 모듈들은 본 발명에 따라 후술할 특정 업무를 수행하거나 특정 추상 데이터 유형을 실행하는 루틴, 서브루틴, 프로그램, 오브젝트, 컴 포넌트, 데이터 구조 등을 포괄하지만, 이에 제한되지는 않는다. 참고로, 본 명세서에서는 문자 인식 장치(100)가 이미지 정보 인식부(110), 독립 성분 추출부(120), 독립 성분 인식부(130), 문서 정보 획득부(140), 문자 분할부(150), 최종 문자 인식부(160), 제어부(170) 및 통신부(180)로 이루어진 경우를 상정하였지만, 반드시 이에 한정되는 것은 아니며, 이미지 정보 인식부(110), 독립 성분 추출부(120), 독립 성분 인식부(130)를 전부 문서 정보 획득부(140)에 포함시켜 구성할 수 있는 등 다양한 변형예를 상정할 수 있음은 물론이라 할 것이다.As shown in FIG. 1, the character recognition apparatus 100 of the present invention includes an image information recognizer 110, an independent component extractor 120, an independent component recognizer 130, a document information acquirer 140, The character divider 150, the final character recognizer 160, the controller 170, and the communicator 180 may be included. According to an embodiment of the present invention, the character recognition apparatus 100 may include an image information recognizer 110, an independent component extractor 120, an independent component recognizer 130, a document information acquirer 140, and a text component. The installment unit 150, the final character recognition unit 160, the control unit 170, and the communication unit 180 may be program modules in which at least some of them are communicated with the character recognition apparatus 100 (however, in FIG. 1, image information). Recognition unit 110, independent component extraction unit 120, independent component recognition unit 130, document information acquisition unit 140, character divider 150, final character recognition unit 160, control unit 170 and The communication unit 180 is illustrated as being included in the character recognition apparatus 100). Such program modules may be included in the phoneme segmentation apparatus 100 as an operating system, an application program module, and other program modules, and may be physically stored on various known storage devices. In addition, these program modules may be stored in a remote storage device that can communicate with the phoneme splitting apparatus 100. Meanwhile, such program modules include, but are not limited to, routines, subroutines, programs, objects, components, data structures, etc. that perform particular tasks or execute particular abstract data types, which will be described later, according to the present invention. For reference, in the present specification, the character recognition apparatus 100 may include an image information recognizer 110, an independent component extractor 120, an independent component recognizer 130, a document information acquirer 140, and a character divider 150. ), The final character recognition unit 160, the control unit 170 and the communication unit 180 is assumed, but is not necessarily limited to this, the image information recognition unit 110, independent component extraction unit 120, independent Various modifications may be assumed, such as the component recognition unit 130 may be included in the document information acquisition unit 140.

본 발명의 일 실시예에 따른 문자 인식 장치(100)는 스캐너, 카메라 등과 같은 화상 데이터 생성 장치에 직접 포함되거나, 화상 데이터 생성 장치와 연결될 수 있을 것이다. The character recognition apparatus 100 according to an exemplary embodiment of the present invention may be directly included in an image data generating apparatus such as a scanner or a camera, or may be connected to the image data generating apparatus.

본 발명의 다른 실시예에 따른 문자 인식 장치(100)는 개인용 컴퓨터(예를 들어, 데스크탑 컴퓨터, 노트북 컴퓨터, 태블릿 컴퓨터, 팜톱 컴퓨터 등), 워크스테이션, PDA, 웹 패드, 이동 전화기 등과 같은 디지털 기기에 포함되거나, 디지털 기기와 통신 네트워크를 통하여 통신할 수도 있다.  여기서, 통신 네트워크는 유선 및 무선 등과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 근거리 통신망(LAN: Local Area Network), 도시권 통신망(MAN: Metropolitan Area Network), 광역 통신망(WAN: Wide Area Network) 등 다양한 통신망으로 구성될 수 있다. Character recognition apparatus 100 according to another embodiment of the present invention is a digital device such as a personal computer (for example, desktop computer, notebook computer, tablet computer, palmtop computer, etc.), workstation, PDA, web pad, mobile phone, etc. It may be included in, or communicate with a digital device through a communication network. Here, the communication network may be configured without regard to communication modes such as wired and wireless, and may include a local area network (LAN), a metropolitan area network (MAN), and a wide area network (WAN). It may be configured with a variety of communication networks.

이하, 도 2에 도시되는 이미지 형태의 원본 문서가 본 발명의 문자 인식 장치(100)에 의해 문자 인식됨을 가정하여, 문자 인식 장치(100)에 포함되는 각 구성요소에 대해 상세히 설명하기로 한다. Hereinafter, assuming that the original document in the form of an image shown in FIG. 2 is text recognized by the text recognition apparatus 100 of the present invention, each component included in the text recognition apparatus 100 will be described in detail.

본 발명의 일 실시예에 따른 이미지 정보 인식부(110)는 스캐너, 카메라 등의 디지털 기기로부터 문자가 포함된 이미지 정보를 수신하고, 수신된 이미지를 인식하는 기능을 수행한다. The image information recognizing unit 110 according to an embodiment of the present invention receives image information including a character from a digital device such as a scanner or a camera, and performs a function of recognizing the received image.

본 발명의 일 실시예에 따른 독립 성분 추출부(120)는 인식된 이미지에 포함되는 문자 정보에 있어서, 별도의 알고리즘을 사용함이 없이 분할 가능한 독립 성분을 분할하고 이를 추출하는 기능을 수행한다.  가령, 도 3은 이미지 정보 인식부(110)에 의해 인식된 문서(도 2의 문서)의 일부에 대해 분할 가능한 독립 성분을 추출하는 예를 나타내는 도면인데, 분할 가능한 독립 성분이라는 것은 다른 성분과의 관계에 있어서 적어도 하나의 접점도 형성하지 않는 성분, 즉, 다른 성분과 접하지 않는 성분을 의미한다.  다른 성분과 접하지 않는 성분은 다른 성분과의 분리 과정 없이도 쉽게 추출될 수 있을 것이다.  The independent component extracting unit 120 according to an embodiment of the present invention performs a function of dividing and extracting an independent component that can be divided in text information included in the recognized image without using a separate algorithm. For example, FIG. 3 is a diagram illustrating an example of extracting an independent component that can be divided into a part of a document (the document of FIG. 2) recognized by the image information recognizing unit 110. It means a component that does not form at least one contact point in the relationship, that is, a component that does not contact other components. Components that are not in contact with other components can be easily extracted without separation from other components.

도 3을 참조하면, 도 2의 문서의 일부에 대해 독립 성분 추출부(120)에 의해 추출이 수행된 결과를 알 수 있다.  예를 들어, "퓨"라는 문자에 포함되는 "ㅍ"이라는 자소와 "ㅠ"라는 자소는 서로 접합되어 있지 않기 때문에, 독립 성분 추출부(120)에 의해 독립 성분으로서 추출될 수 있다.  반면, "커"라는 문자에 있어서는, "ㅋ"과 "ㅓ"가 접합되어 있기 때문에, "커"라는 부분 자체가 독립 성분 추출부(120)에 의해 추출되는 독립 성분이 될 수 있다. Referring to FIG. 3, it can be seen that the extraction is performed by the independent component extractor 120 for a part of the document of FIG. 2. For example, since the letter “t” and the letter “?” Included in the letters “Pew” are not joined to each other, they may be extracted as the independent components by the independent component extracting unit 120. On the other hand, in the letter "ker", since "k" and "k" are joined, the part "ker" itself may be an independent component extracted by the independent component extracting unit 120.

본 발명의 일 실시예에 따른 독립 성분 인식부(130)는 독립 성분 추출부(120)에 의해 추출된 성분들을 인식하는 기능을 수행한다.  이 때, 독립 성분 인식부(130)는 한글 문자에 있어서 음소를 표현하는 최소 단위인 자소에 관한 정보를 저장하고 있는 데이터베이스(미도시됨)를 참조할 수 있다.  즉, 독립 성분 인식부(130)는 독립 성분 추출부(120)에 의해 추출된 독립 성분 각각을 미리 저장되어 있던 자소에 관한 정보와 비교함으로써 자소 인식을 수행한다.  인식의 방법으로서는 추출된 독립 성분과 데이터베이스에 저장되어 있는 일 이상의 자소를 비교하여 소정값 이상의 유사도를 나타내는 자소가 존재한다면 해당 독립 성분을 상기 자소로 인식하는 방법을 이용할 수 있다.  소정값 이상의 유사도를 나타내는 자소가 일 이상 존재한다면 가장 높은 유사도를 나타내는 자소를 해당 독립 성분의 인식 결과로 확정할 수도 있을 것이다.  데이터베이스에는 자소에 관한 정보가 저장되어 있기 때문에, 독립 성분 추출부(120)에 의해 추출된 독립 성분들 중 자소 성분이 독립 성분 인식부(130)에 의해 인식될 수 있게 된다.  The independent component recognition unit 130 according to an embodiment of the present invention performs a function of recognizing components extracted by the independent component extraction unit 120. In this case, the independent component recognizer 130 may refer to a database (not shown) that stores information on phoneme, which is the minimum unit for representing phonemes in Korean characters. That is, the independent component recognition unit 130 performs phoneme recognition by comparing each of the independent components extracted by the independent component extraction unit 120 with information on the phoneme stored in advance. As a method of recognition, if the extracted independent component is compared with one or more phonemes stored in the database and there is a phoneme indicating similarity or more than a predetermined value, a method of recognizing the independent component as the phoneme may be used. If there is more than one phoneme indicating a similarity or more than a predetermined value, the phoneme showing the highest similarity may be determined as the recognition result of the independent component. Since the information on the phoneme is stored in the database, the phoneme component of the independent components extracted by the independent component extractor 120 may be recognized by the independent component recognizer 130.

도 4는 독립 성분 추출부(120)에 의해 추출된 성분들과 이에 대한 독립 성분 인식부(130)의 인식 결과를 나타내는데, 예를 들어, 독립 성분 추출부(120)에 의해 추출된 독립 성분 중 "커"라는 성분의 경우에는 데이터베이스에 저장되어 있는 자소에 관한 정보들 중 유사한 개체가 없으므로 인식이 이루어지지 않게 되고, "ㅁ", "ㅍ", "ㅠ"라는 성분의 경우에는 유사 개체가 있으므로 각각 "ㅁ", "ㅍ", "ㅠ"라는 자소로 인식되게 된다.  도 4에 도시되는 독립 성분 인식 결과에서 흑색으로 표시된 성분들은 인식되지 못한 성분들을 나타내며, 적색으로 표시된 성분들은 독립 성분 인식부(130)에 의해 자소로서 인식된 성분들을 나타낸다. 4 shows components extracted by the independent component extractor 120 and recognition results of the independent component recognizer 130. For example, among the independent components extracted by the independent component extractor 120, FIG. In the case of the component "ker", since there is no similar entity among the information on the phonemes stored in the database, it is not recognized. In the case of the components "ㅁ", "ㄷ", and "ㅠ", there are similar entities. Recognized as "ㅁ", "方", "ㅠ" respectively. In the independent component recognition results shown in FIG. 4, the components indicated in black represent components that are not recognized, and the components indicated in red represent components recognized as a phoneme by the independent component recognition unit 130.

다음으로, 본 발명의 일 실시예에 따른 문서 정보 획득부(140)는 독립 성분 인식부(130)에 의해 인식된 성분들을 조합하여 문자를 만들어냄으로써 문자 인식을 수행하고, 이를 통해 전체 문서에 대한 문서 정보를 파악하는 기능을 수행한다.  여기서, 문서 정보라는 것은 전체 문서에서의 줄 간격, 글자들의 유형별(가령, 글자체에 따른) 평균 높이와 너비 등을 포함하는 개념이다.  Next, the document information acquisition unit 140 according to an embodiment of the present invention performs character recognition by creating a character by combining the components recognized by the independent component recognition unit 130, through which the entire document Function to grasp document information. Here, the document information is a concept including the line spacing in the entire document, the average height and width of each type of letters (for example, font type).

도 5는 독립 성분 인식부(130)에 의해 인식된 결과에 기초하여 문서 정보 획득부(140)가 문자를 만들어내어 문자 인식을 수행하는 과정을 나타내며, 도 6은 이러한 문자 인식의 결과를 통해 전체 문서 정보를 파악하는 과정을 나타낸다.  FIG. 5 illustrates a process in which the document information acquisition unit 140 generates a character based on the result recognized by the independent component recognition unit 130 to perform character recognition. Indicates the process of identifying document information.

도 5에 도시되는 바와 같이, 문서 정보 획득부(140)는 독립 성분 인식부(130)에 의해 인식된 자소들을 조합하여 완성된 문자를 만들어낼 수 있다.  예를 들어, "ㅇ", "ㅡ", "ㄹ" 순으로 인식된 결과가 존재한다면, 문서 정보 획득부(140)는 이들을 조합하여 "을" 이라는 문자를 만들어 낼 수 있게 된다.  이러한 방식으로 문자 인식을 수행하되, 조합이 불가능한 성분들은 그냥 남겨둔다.  예를 들어, "ㅁ", "ㅍ", "ㅠ" 순으로 인식된 결과가 존재한다면, "ㅍ"과 "ㅠ"를 조합하여 "퓨"라는 문자를 만들어내고, 조합이 불가능한 "ㅁ"이라는 성분은 그냥 남겨둔다.  이와 같은 문자 인식이 완료되면, 문서 정보 획득부(140)는 그 결과에 기초하여 글자들의 유형별 평균 높이와 너비 또는 줄 간격 등의 정보를 파악해낸다.  구체적으로는, 도 6에 도시되는 바와 같이, 인식된 문자를 통해 문서에 포함된 글자의 평균 높이와 너비 등을 파악해 낼 수 있다.  예를 들어, "을"로 인식된 문자를 통해서는 초성, 중성, 종성을 모두 포함하는 문자의 높이와 너비 등을 파악해낼 수 있고, "퓨"로 인식된 문자를 통해서는 초성, 중성만을 포함하나는 문자의 높이와 너비 등을 파악해낼 수 있다.  또한, 전체 문서에 있어서 서로 다른 라인에 존재하는 인식 결과 간의 간격을 측정함으로써 문서 전체에 대한 평균 줄 간격 등을 파악해낼 수 있게 된다.  여기서의 문자 높이와 너비 또는 줄 간격은 픽셀 단위일 수 있다. As shown in FIG. 5, the document information acquisition unit 140 may combine the phonemes recognized by the independent component recognition unit 130 to generate a completed character. For example, if there are results recognized in the order of "o", "-a", and "d", the document information acquisition unit 140 may combine them to produce a character of "". Character recognition is performed in this way, but the components that cannot be combined are left alone. For example, if there is a recognized result in order of "ㅁ", "ㄷ", "ㅠ", the combination of "ㅠ" and "ㅠ" produces the character "Pew", and the combination "ㅁ" The ingredients are just left. When the character recognition is completed, the document information acquisition unit 140 grasps information such as average height and width or line spacing for each type of characters based on the result. Specifically, as illustrated in FIG. 6, the averaged height and width of the characters included in the document may be grasped through the recognized characters. For example, a character recognized as "" can be used to determine the height and width of a character that contains both initial, neutral, and trailing characters, and a character recognized as "pew" can only contain initial and neutral. One can figure out the height and width of characters. In addition, the average line spacing of the entire document can be determined by measuring the interval between recognition results existing on different lines in the entire document. The character height and width or line spacing here may be in pixels.

다음으로, 본 발명의 일 실시예에 따른 문자 분할부(150)는 문서 정보 획득부(140)에 의해 획득된 문서 정보를 기초로 하여 아직 인식되지 않은 문자들을 분할하는 기능을 수행한다.  Next, the character dividing unit 150 according to an embodiment of the present invention performs a function of dividing characters not yet recognized based on the document information acquired by the document information obtaining unit 140.

도 7은 문자 분할부(150)에 의해 추가적으로 분할되는 문자들을 나타낸다.  도 7에서 적색 사각형으로 표시된 문자는 독립 성분 추출부(120), 독립 성분 인식부(130), 문서 정보 획득부(140)에 의해 인식된 문자임을 나타내며, 청색 사각형으로 표시된 문자는 문자 분할부(150)에 의해 추가적으로 분할되는 문자임을 나타낸다.  7 shows characters further divided by the character divider 150. In FIG. 7, a letter denoted by a red square represents a character recognized by the independent component extractor 120, the independent component recognizer 130, and the document information acquirer 140, and the character represented by a blue square represents a character divider ( 150 to indicate that the character is additionally divided.

요컨대, 본 발명에 따른 문자 분할은 상기와 같은 일련의 과정을 통해 파악해낸 문서 정보를 기초로 하여 수행되기 때문에 그 정확도가 상당히 높아질 수 있다.  즉, 종래의 자소 분할을 통한 문자 인식은, 문자 분할, 자소 분할, 자소 인식의 과정을 통해 수행되기 때문에, 문자 분할이 문서 전체의 정보에 기반하지 않은 상태에서 이루어지며, 이에 따라 문자 분할의 정확도가 떨어지게 되고, 전체 문자 인식의 오류율이 높아질 수 밖에 없는 문제점을 갖고 있었으나, 본 발명에 따르면 독립 성분들 중 자소만을 인식해내고 이를 조합함으로써 쉽게 인식될 수 있는 문자들을 우선적으로 인식해내며, 이러한 과정을 통해 문서 정보를 파악해낸 후, 이를 기초로 하여 문자 분할을 수행하기 때문에, 문자 분할에 있어서 오류율이 크게 감소될 수 있게 되고, 전체적인 문자 인식의 정확도가 향상될 수 있게 된다. In short, since the character segmentation according to the present invention is performed based on document information obtained through the above series of processes, the accuracy can be considerably increased. That is, the conventional character recognition through the phoneme segmentation is performed through the process of character segmentation, phoneme segmentation, and phoneme recognition, so that the character segmentation is performed based on the information of the entire document, and thus the accuracy of the character segmentation. Has a problem that the error rate of the overall character recognition is inevitably decreased, but according to the present invention, only the phonemes of the independent components are recognized and combined with each other, so that the easily recognizable characters are preferentially recognized. Since the document information is grasped and then the character segmentation is performed based on the document information, the error rate in the character segmentation can be greatly reduced, and the accuracy of the overall character recognition can be improved.

문자 분할부(150)에 의해 추가적으로 문자 분할이 완료되면, 본 발명의 일 실시예에 따른 최종 문자 인식부(160)는 상기 추가적으로 분할된 문자들에 대해 문자 인식을 수행한다.  즉, 도 7에서 청색 사각형으로 표시되는 문자들에 대해 문자 인식을 수행한다.  문자 인식 방법으로서는 통상의 메쉬 인식 또는 자소 분할을 통한 문자 인식 방법이 이용될 수 있다.  메쉬 인식이라는 것은 글자 단위로 통째로 문자를 인식해내는 방식을 의미하는 것이며, 자소 분할을 통한 문자 인식이라는 것은 소정의 방법을 통해 문자 내에 포함되는 자소들을 분할해내고 이를 인식함으로써 문자 인식을 완료하는 방식을 의미한다.  자소 분리와 관련하여, 본 발명이 속하는 기술분야의 당업자는 공지된 기술 문헌인 한국정보과학회의 "1990 가을 학술발표논문집 Vol. 17, No. 2"에 개시된 인쇄체 한글 문자 인식을 위한 자소 분리에 관한 기술 등을 참고할 수 있다.  자소 분할을 통한 문자 인식 방법의 일례를 설명하면 다음과 같다.  먼저, 받침의 존재 여부, 모음의 형태와 대략적인 위치, 연결 성분(연결 성분이란 연결된 1 화소의 집합을 의미함)의 갯수 및 각 연결 성분의 위치와 크기 등을 기준으로 하여 문자의 유형을 분류해낸다.  그 후, 각 유형별로 소정의 알고리즘을 통해 자소를 분할해낸다.  구체적으로는, 연결 성분이 없는 자소를 먼저 분리해내고, 연결 성분이 있는 경우에는, 각 연결 성분의 위치 및 크기 정보 등을 이용하여 자소 분리를 수행해낸다.  이러한 과정을 거쳐 자소 분할이 완료되면 분할된 자소들을 조합함으로써 문자 인식을 완료하는 것이다. When the character division is additionally completed by the character division unit 150, the final character recognition unit 160 according to an embodiment of the present invention performs character recognition for the additionally divided characters. That is, character recognition is performed on characters represented by blue squares in FIG. 7. As the character recognition method, a conventional mesh recognition or a character recognition method through phoneme division may be used. Mesh recognition refers to a method of recognizing a whole character by character unit, and character recognition through phoneme division refers to a method of completing character recognition by dividing the phonemes included in a character through a predetermined method and recognizing it. Means. Regarding the separation of phonemes, those skilled in the art to which the present invention pertains to the separation of letters for printed Hangul character recognition disclosed in the well-known technical literature, the Korean Information Science Society, Vol. 17, No. 2, Technology, and the like. An example of a method of character recognition through phoneme division is as follows. First, classify the character type based on the presence or absence of the base, the shape and the approximate position of the vowel, the number of connected components (the connected component means a set of connected one pixels), and the position and size of each connected component. Do it. Then, the phoneme is divided by a predetermined algorithm for each type. Specifically, the phoneme without a linking component is first separated, and if there is a linking component, the phoneme separation is performed using the position and size information of each linking component and the like. When the phoneme division is completed through this process, character recognition is completed by combining the divided phonemes.

한편, 본 발명의 일 실시예에 따른 제어부(170)는 이미지 정보 인식부(110), 독립 성분 추출부(120), 독립 성분 인식부(130), 문서 정보 획득부(140), 문자 분 할부(150), 최종 문자 인식부(160) 및 통신부(180) 간의 데이터의 흐름을 제어하는 기능을 수행한다. On the other hand, the control unit 170 according to an embodiment of the present invention is an image information recognition unit 110, independent component extraction unit 120, independent component recognition unit 130, document information acquisition unit 140, character divider 150, the function of controlling the flow of data between the final character recognition unit 160 and the communication unit 180.

또한, 본 발명의 일 실시예에 따른 통신부(180)는 본 발명에 따른 문자 인식 장치(100)가 외부 장치 등과 통신할 수 있도록 하는 기능을 수행할 수 있다. In addition, the communication unit 180 according to an embodiment of the present invention may perform a function of allowing the character recognition apparatus 100 according to the present invention to communicate with an external device.

이상 설명된 본 발명에 따른 실시예들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다.  상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.  상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다.  컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.  프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다.  상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다. Embodiments according to the present invention described above may be implemented in the form of program instructions that may be executed by various computer components, and may be recorded in a computer-readable recording medium. The computer-readable recording medium may include program instructions, data files, data structures, etc. alone or in combination. Program instructions recorded on the computer-readable recording medium may be those specially designed and configured for the present invention, or may be known and available to those skilled in the computer software arts. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tape, optical recording media such as CD-ROMs, DVDs, and magneto-optical media such as floptical disks. media), and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like. The hardware device may be configured to operate as one or more software modules to perform the process according to the invention, and vice versa.

이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실 시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명이 상기 실시 예들에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형을 꾀할 수 있다. Although the present invention has been described by specific embodiments and drawings, which are limited to specific matters such as specific components, etc., this is merely provided to help a more general understanding of the present invention, and the present invention is not limited to the above embodiments. Those skilled in the art to which the present invention pertains can make various modifications and variations from this description.

따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.Therefore, the spirit of the present invention should not be construed as being limited to the above-described embodiments, and all of the equivalents or equivalents of the claims, as well as the following claims, I will say.

도 1은 본 발명의 일 실시예에 따라 이미지로 표현되는 문서에 대해 문자 인식을 수행하기 위한 장치의 구성을 나타내는 도면이다. 1 is a diagram illustrating a configuration of an apparatus for performing character recognition on a document represented by an image according to an embodiment of the present invention.

도 2는 본 발명의 일 실시예에 따른 문자 인식 장치에 의해 문자 인식이 되는 문서의 일례를 나타내는 도면이다. 2 is a diagram illustrating an example of a document to be recognized by a character recognition apparatus according to an embodiment of the present invention.

도 3은 본 발명의 일 실시예에 따른 독립 성분 추출부(120)에 의해 문서로부터 독립 성분이 추출되는 과정의 일례를 나타내는 도면이다. 3 is a diagram illustrating an example of a process of extracting an independent component from a document by the independent component extractor 120 according to an exemplary embodiment of the present invention.

도 4는 본 발명의 일 실시예에 따른 독립 성분 추출부(120)에 의해 추출된 독립 성분에 대해 독립 성분 인식부(130)가 자소를 인식하는 과정의 일례를 나타내는 도면이다. 4 is a diagram illustrating an example of a process in which the independent component recognition unit 130 recognizes a phoneme with respect to the independent component extracted by the independent component extraction unit 120 according to an exemplary embodiment of the present invention.

도 5는 본 발명의 일 실시예에 따른 문서 정보 획득부(140)에 의해 문자 인식이 수행되는 과정의 일례를 나타내는 도면이다. 5 is a diagram illustrating an example of a process in which character recognition is performed by the document information acquisition unit 140 according to an embodiment of the present invention.

도 6은 본 발명의 일 실시예에 따른 문서 정보 획득부(140)에 의해 문서 정보가 파악되는 과정의 일례를 나타내는 도면이다. 6 is a diagram illustrating an example of a process of acquiring document information by the document information obtaining unit 140 according to an exemplary embodiment of the present invention.

도 7은 본 발명의 일 실시예에 따른 문자 분할부(150)에 의해 수행되는 문자 분할의 일례를 나타내는 도면이다. 7 is a diagram illustrating an example of character division performed by the character division unit 150 according to an embodiment of the present invention.

<주요 도면부호에 관한 간단한 설명> <Brief description of the major reference numerals>

110: 이미지 정보 인식부 110: image information recognition unit

120: 독립 성분 추출부 120: independent component extraction unit

130: 독립 성분 인식부 130: independent component recognition unit

140: 문서 정보 획득부 140: document information acquisition unit

150: 문자 분할부 150: character division

160: 최종 문자 인식부 160: the final character recognition unit

Claims (21)

이미지 형식의 한글 문서에 포함된 문자를 인식하기 위한 방법으로서, A method for recognizing characters included in Hangul documents in image format. (a) 이미지에 포함된 문자를 대상으로, 다른 성분과 접합되어 있지 않은 일 이상의 독립된 성분들을 추출하는 단계, (a) extracting one or more independent components of the text contained in the image that are not joined to other components; (b) 상기 추출된 독립된 성분 중 자소에 해당되는 성분을 인식하는 단계, (b) recognizing a component corresponding to a phoneme among the extracted independent components, (c) 상기 인식된 자소를 기초로 하여 1차 문자 인식을 수행하는 단계, (c) performing primary character recognition based on the recognized phonemes; (d) 상기 1차 문자 인식 결과로부터 상기 한글 문서에 대한 문서 정보를 파악하는 단계, 및(d) identifying document information on the Hangul document from the first character recognition result, and (e) 상기 파악된 문서 정보를 기초로 상기 1차 문자 인식의 대상이 되지 못한 문자들에 대해 2차 문자 인식을 수행하는 단계 (e) performing secondary character recognition on characters not subject to the primary character recognition based on the identified document information 를 포함하는 방법. How to include. 제1항에 있어서, The method of claim 1, 상기 (b) 단계는, In step (b), 상기 일 이상의 독립된 성분들을 일 이상의 자소와 비교하는 단계, 및 Comparing the one or more independent components with one or more graphemes, and 상기 비교 결과 소정값 이상의 유사도를 보이는 자소를 상기 독립된 성분에 대한 인식의 결과로서 선택하는 단계 Selecting a phoneme that exhibits a similarity or more as a result of the comparison as a result of recognition of the independent component 를 포함하는 방법. How to include. 제2항에 있어서, The method of claim 2, 상기 (b) 단계에서, In step (b), 상기 비교 결과 가장 높은 유사도를 보이는 자소를 상기 독립된 성분에 대한 인식의 결과로서 선택하는 방법. Selecting a phoneme with the highest similarity as a result of the comparison as a result of recognition of the independent component. 제1항에 있어서, The method of claim 1, 상기 (c) 단계는, In step (c), 상기 인식된 자소를 순서대로 조합하여 만들어질 수 있는 글자를 상기 1차 문자 인식의 결과로서 출력하는 단계를 포함하는 방법. Outputting a character that can be produced by combining the recognized phonemes in order as a result of the primary character recognition. 제1항에 있어서, The method of claim 1, 상기 문서 정보는 상기 한글 문서에 포함된 문자의 유형별 평균 높이와 너비, 줄 간격 중 적어도 하나인 방법. And the document information is at least one of an average height, width, and line spacing for each type of characters included in the Korean document. 제1항에 있어서, The method of claim 1, 상기 (e) 단계는, In step (e), 상기 파악된 문서 정보를 기초로 상기 1차 문자 인식의 대상이 되지 못한 각 문자들을 분할하는 단계, 및 Dividing each character not subject to the primary character recognition based on the identified document information; and 상기 분할된 문자에 대해 상기 2차 문자 인식을 수행하는 단계 Performing the secondary character recognition on the divided character 를 포함하는 방법. How to include. 제6항에 있어서, The method of claim 6, 상기 2차 문자 인식은 메쉬 인식 방법을 이용하여 수행되는 방법. The secondary character recognition is performed using a mesh recognition method. 제6항에 있어서, The method of claim 6, 상기 2차 문자 인식을 수행하는 단계는, Performing the second character recognition, 상기 분할된 문자에 대해 자소 분할을 수행하는 단계, 및 Performing a phoneme division on the divided characters, and 상기 자소 분할 결과를 기초로 하여 문자 인식을 수행하는 단계 Performing character recognition based on the phoneme division result 를 포함하는 방법.How to include. 이미지 형식의 한글 문서에 포함된 문자를 인식하기 위한 장치로서, A device for recognizing characters included in a Korean document in image format, 이미지에 포함된 문자를 대상으로, 다른 성분과 접합되어 있지 않은 일 이상의 독립된 성분들을 추출하는 독립 성분 추출부, Independent component extraction unit for extracting one or more independent components for the characters contained in the image, which are not joined to other components, 상기 추출된 독립된 성분 중 자소에 해당되는 성분을 인식하는 독립 성분 인식부, Independent component recognition unit for recognizing a component corresponding to the element of the extracted independent components, 상기 인식된 자소를 기초로 하여 1차 문자 인식을 수행하고, 상기 1차 문자 인식 결과로부터 상기 한글 문서에 대한 문서 정보를 파악하는 문서 정보 획득부, A document information acquisition unit performing primary character recognition based on the recognized phoneme, and grasping document information about the Hangul document from the primary character recognition result; 상기 파악된 문서 정보를 기초로 상기 1차 문자 인식의 대상이 되지 못한 문자들에 대해 2차 문자 인식을 수행하는 최종 문자 인식부 A final character recognition unit for performing a secondary character recognition for the characters that are not the object of the primary character recognition based on the identified document information 를 포함하는 장치./ RTI &gt; 제9항에 있어서, 10. The method of claim 9, 상기 독립 성분 인식부는, 상기 일 이상의 독립된 성분들을 일 이상의 자소와 비교하여, 상기 비교 결과 소정값 이상의 유사도를 보이는 자소를 상기 독립된 성분에 대한 인식의 결과로서 선택하는 장치.And the independent component recognizing unit compares the one or more independent components with one or more phonemes, and selects a phoneme having a similarity or more as a result of the comparison as a result of recognition of the independent component. 제10항에 있어서, The method of claim 10, 상기 독립 성분 인식부는, 상기 비교 결과 가장 높은 유사도를 보이는 자소를 상기 독립된 성분에 대한 인식의 결과로서 선택하는 장치.And the independent component recognizing unit selects a phoneme having the highest similarity as a result of the recognition as a result of recognition of the independent component. 제9항에 있어서, 10. The method of claim 9, 상기 문서 정보 획득부는, 상기 인식된 자소를 순서대로 조합하여 만들어질 수 있는 글자를 상기 1차 문자 인식의 결과로서 출력하는 장치.And the document information acquiring unit outputs, as a result of the primary character recognition, characters that can be formed by combining the recognized phonemes in order. 제9항에 있어서, 10. The method of claim 9, 상기 문서 정보는 상기 한글 문서에 포함된 문자의 유형별 평균 높이와 너비, 줄 간격 중 적어도 하나인 장치.And the document information is at least one of an average height, width, and line spacing for each type of characters included in the Hangul document. 제9항에 있어서, 10. The method of claim 9, 상기 파악된 문서 정보를 기초로 상기 1차 문자 인식의 대상이 되지 못한 각 문자들을 분할하는 문자 분할부를 더 포함하고, The apparatus may further include a character divider configured to divide each character that is not a target of the first character recognition based on the identified document information. 상기 최종 문자 인식부는, 상기 분할된 문자에 대해 상기 2차 문자 인식을 수행하는 장치. The final character recognition unit, the apparatus for performing the secondary character recognition for the divided characters. 제14항에 있어서, The method of claim 14, 상기 2차 문자 인식은 메쉬 인식 방법에 의해 수행되는 장치.The second character recognition is performed by a mesh recognition method. 제14항에 있어서, The method of claim 14, 상기 2차 문자 인식은, 상기 분할된 문자에 대한 자소 분할 및 상기 자소 분할 결과를 기초로 한 문자 인식을 통해 수행되는 장치.The secondary character recognition is performed through character recognition based on the phoneme segmentation and the phoneme segmentation result of the divided character. 이미지 형식의 한글 문서에 포함된 문자를 인식하기 위한 장치로서,A device for recognizing characters included in a Korean document in image format, 이미지에 포함된 문자를 대상으로, 다른 성분과 접합되어 있지 않은 일 이상의 독립 자소 인식을 통한 1차 문자 인식을 수행한 결과를 기초로 상기 한글 문서에 대한 문서 정보를 파악하는 문서 정보 획득부, A document information acquisition unit which grasps document information on the Hangul document based on a result of performing a primary character recognition through recognition of one or more independent characters that are not bonded to other components of a character included in an image; 상기 파악된 문서 정보를 기초로 상기 1차 문자 인식의 대상이 되지 못한 문자들에 대해 2차 문자 인식을 수행하는 최종 문자 인식부A final character recognition unit for performing a secondary character recognition for the characters that are not the object of the primary character recognition based on the identified document information 를 포함하는 장치./ RTI &gt; 제17항에 있어서, The method of claim 17, 상기 1차 문자 인식을 수행한 결과는, 상기 인식된 독립 자소를 순서대로 조합하여 만들어질 수 있는 글자인 장치.The result of performing the primary character recognition is a character that can be created by combining the recognized independent characters in order. 제17항에 있어서, The method of claim 17, 상기 문서 정보는 상기 한글 문서에 포함된 문자의 유형별 평균 높이와 너비, 줄 간격 중 적어도 하나인 장치.And the document information is at least one of an average height, width, and line spacing for each type of characters included in the Hangul document. 제17항에 있어서, The method of claim 17, 상기 파악된 문서 정보를 기초로 상기 1차 문자 인식의 대상이 되지 못한 각 문자들을 분할하는 문자 분할부를 더 포함하고, The apparatus may further include a character divider configured to divide each character that is not a target of the first character recognition based on the identified document information. 상기 최종 문자 인식부는, 상기 분할된 문자에 대해 상기 2차 문자 인식을 수행하는 장치. The final character recognition unit, the apparatus for performing the secondary character recognition for the divided characters. 제1항 내지 제8항 중 어느 한 항에 따른 방법을 실행하기 위한 컴퓨터 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체. A computer readable recording medium having recorded thereon a computer program for executing the method according to any one of claims 1 to 8.
KR1020090064687A 2009-07-15 2009-07-15 Method, apparatus and computer-readable recording medium for recognizing character included in hangul document KR101015233B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090064687A KR101015233B1 (en) 2009-07-15 2009-07-15 Method, apparatus and computer-readable recording medium for recognizing character included in hangul document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090064687A KR101015233B1 (en) 2009-07-15 2009-07-15 Method, apparatus and computer-readable recording medium for recognizing character included in hangul document

Publications (2)

Publication Number Publication Date
KR20110007009A KR20110007009A (en) 2011-01-21
KR101015233B1 true KR101015233B1 (en) 2011-02-18

Family

ID=43613683

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090064687A KR101015233B1 (en) 2009-07-15 2009-07-15 Method, apparatus and computer-readable recording medium for recognizing character included in hangul document

Country Status (1)

Country Link
KR (1) KR101015233B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102215593B1 (en) * 2019-10-24 2021-02-15 주식회사 한글과컴퓨터 Character recognition device that can recognize korean characters in images based on probability and operating method thereof

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990052967A (en) * 1997-12-23 1999-07-15 구자홍 Korean Recognition Method Using Window and Projection Information
KR100285765B1 (en) * 1997-12-13 2001-01-05 Lg Electronics Inc Method for recognizing hangul font
KR100718185B1 (en) * 2006-02-02 2007-05-15 삼성전자주식회사 Apparatus for recognizing character and method for operating the apparatus

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100285765B1 (en) * 1997-12-13 2001-01-05 Lg Electronics Inc Method for recognizing hangul font
KR19990052967A (en) * 1997-12-23 1999-07-15 구자홍 Korean Recognition Method Using Window and Projection Information
KR100718185B1 (en) * 2006-02-02 2007-05-15 삼성전자주식회사 Apparatus for recognizing character and method for operating the apparatus

Also Published As

Publication number Publication date
KR20110007009A (en) 2011-01-21

Similar Documents

Publication Publication Date Title
US8606022B2 (en) Information processing apparatus, method and program
US8345978B2 (en) Detecting position of word breaks in a textual line image
US9563821B2 (en) Method, apparatus and computer readable recording medium for detecting a location of a face feature point using an Adaboost learning algorithm
JP6188976B2 (en) Method, apparatus and computer-readable recording medium for detecting text contained in an image
JP6506770B2 (en) Method and apparatus for recognizing music symbols
JP2006053920A (en) Character recognition program, method and device
KR102121654B1 (en) Deep Learning Based Automatic Gesture Recognition Method and System
KR102655789B1 (en) Face detecting method and apparatus
US20210124976A1 (en) Apparatus and method for calculating similarity of images
KR20100044668A (en) Method, system, and computer-readable recording medium for recognizing characters included in a document by using language model and ocr
JP2016029546A (en) Image processing device, image processing method, and image processing program
US10438097B2 (en) Recognition device, recognition method, and computer program product
EP3869450A1 (en) Information processing device, information processing method, and program
Toyozumi et al. A study of symbol segmentation method for handwritten mathematical formula recognition using mathematical structure information
KR101015233B1 (en) Method, apparatus and computer-readable recording medium for recognizing character included in hangul document
US9684844B1 (en) Method and apparatus for normalizing character included in an image
US10572538B2 (en) Lattice finalization device, pattern recognition device, lattice finalization method, and computer program product
KR102050422B1 (en) Apparatus and method for recognizing character
JP2017084006A (en) Image processor and method thereof
US20210374147A1 (en) Information processing apparatus, information processing method, and storage medium
KR102215593B1 (en) Character recognition device that can recognize korean characters in images based on probability and operating method thereof
El-Hajj et al. Recognition of Arabic handwritten words using contextual character models
KR20140043225A (en) Method for providing of sign information and apparatus thereof
KR20150042674A (en) Multimodal user recognition robust to environment variation
KR102102394B1 (en) Method and apparatus for preprocessing image for recognition of character

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20131231

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20151223

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170117

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20180102

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20190102

Year of fee payment: 9