KR19990015114A - Character Recognizer Using Character Connection Information - Google Patents

Character Recognizer Using Character Connection Information Download PDF

Info

Publication number
KR19990015114A
KR19990015114A KR1019970037019A KR19970037019A KR19990015114A KR 19990015114 A KR19990015114 A KR 19990015114A KR 1019970037019 A KR1019970037019 A KR 1019970037019A KR 19970037019 A KR19970037019 A KR 19970037019A KR 19990015114 A KR19990015114 A KR 19990015114A
Authority
KR
South Korea
Prior art keywords
character
recognizer
image
connection information
information
Prior art date
Application number
KR1019970037019A
Other languages
Korean (ko)
Inventor
조래훈
Original Assignee
구자홍
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 구자홍, 엘지전자 주식회사 filed Critical 구자홍
Priority to KR1019970037019A priority Critical patent/KR19990015114A/en
Publication of KR19990015114A publication Critical patent/KR19990015114A/en

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

본 발명은 문자연결 정보를 이용하여 레퍼런스를 제한함으로서 인식속도를 향상할 수 있는 문자연결 정보를 이용한 문자인식기에 관한 것이다.The present invention relates to a character recognizer using the character connection information that can improve the recognition speed by limiting the reference using the character connection information.

본 발명의 문자연결 정보를 이용한 문자인식기는 화상 이미지가 입력되는 입력수단과, 데이터 베이스 형태로 레퍼런스를 관리하는 레퍼런스 데이터 베이스와, 입력수단과 레퍼런스 데이터 베이스에 공통 접속되어 레퍼런스를 제한함으로서 레퍼런스에 의해 화상 이미지를 결정하는 인식수단과, 인식수단에 직렬 접속되어 화상 이미지의 인식결과를 출력하는 출력수단을 구비한다.The character recognizer using the character connection information of the present invention is connected to the input means for inputting the image image, the reference database for managing the reference in the form of a database, and the input means and the reference database in common to limit the reference. Recognition means for determining an image image, and output means for outputting a recognition result of the image image in series with the recognition means.

본 발명의 문자연결 정보를 이용한 문자인식기는 입력되는 문자의 화상 이미지를 대조하게 되는 레퍼런스의 개수를 줄임으로서 문자인식기의 처리속도를 향상시킬 수 있다.The character recognizer using the character connection information of the present invention can improve the processing speed of the character recognizer by reducing the number of references that contrast the image image of the input character.

Description

문자연결 정보를 이용한 문자인식기Character Recognizer Using Character Connection Information

본 발명은 문자인식기에 관한 것으로, 특히 문자연결 정보를 이용하여 레퍼런스를 제한함으로서 인식속도를 향상할 수 있는 문자연결 정보를 이용한 문자인식기에 관한 것이다.The present invention relates to a character recognizer, and more particularly to a character recognizer using the character connection information that can improve the recognition speed by limiting the reference using the character connection information.

통상 문자인식기는 하나의 문자를 인식하기 위하여 여러 개의 레퍼런스(Reference)를 참조하여 입력 이미지에 나타난 문자가 무엇인지를 결정하게 된다.In general, the character recognizer determines a character in the input image by referring to a plurality of references in order to recognize one character.

도 1을 참조하여 종래 기술에 따른 문자인식기에 대해서 설명하고자 한다.A character recognizer according to the prior art will be described with reference to FIG. 1.

도 1은 종래의 기술에 따른 문자인식기를 나타내는 도면으로써, 도 1의 구성에서 종래의 문자인식기는 데이터 베이스 형태로 구성되어 입력 화상 이미지(2)와 비교되는 레퍼런스 데이터 베이스(Reference DB ; 이하 레퍼런스 DB라 칭함, 4)와, 입력 화상 이미지(2)와 레퍼런스 DB(4)의 레퍼런스를 비교하여 입력된 화상 이미지(2)에 일치된 레퍼런스(Reference)로 입력된 화상 이미지(2)를 결정하는 인식기(6)를 구비한다.1 is a diagram illustrating a character recognizer according to the related art, and in the configuration of FIG. 1, the conventional character recognizer is configured in a database form and is compared with an input image image 2 (Reference DB; The recognizer for comparing the input image image 2 and the reference of the reference DB 4 to determine the input image image 2 as a reference matched to the input image image 2 (6) is provided.

입력 화상 이미지(2)는 인식기(6)에 직렬로 접속된 전송로를 경유하여 인식기(6)에 공급된다. 인식기(6)는 레퍼런스 DB(4)와 직렬 접속되어, 레퍼런스 DB(4)의 레퍼런스를 순차적으로 검색하여 입력 화상 이미지(2)와 일치하는지 비교한다. 인식기(6)는 일치되는 레퍼런스로 입력 화상 이미지(2)를 인식된 결과 문자(8)로서 임의의 출력장치에 출력한다.The input image image 2 is supplied to the recognizer 6 via a transmission path connected in series with the recognizer 6. The recognizer 6 is connected in series with the reference DB 4, sequentially searches for a reference of the reference DB 4, and compares it with the input image image 2 for comparison. The recognizer 6 outputs the input image image 2 as a recognized result character 8 to any output device as a matched reference.

그러나 이러한 구성에 의하여, 종래의 문자인식기는 레퍼런스 DB(4)에 들어있는 모든 레퍼런스를 입력된 문자의 화상 이미지(2)에 대해 비교하여야 하므로 인식 시간이 많이 소요된다는 단점을 수반한다. 이러한 종래 기술의 문제는 궁극적으로 인식기(6)가 입력 화상 이미지(2)에 대하여 일치하는 레퍼런스를 찾기 위하여 레퍼런스 DB(4)에서 모든 레퍼런스를 검색대상으로 하는 것에 기인한다.However, according to this configuration, the conventional character recognizer has a disadvantage in that it takes a lot of recognition time because all the references included in the reference DB 4 must be compared with respect to the image image 2 of the input character. This problem of the prior art is ultimately due to the recognizer 6 making all references in the reference DB 4 searchable in order to find a matching reference to the input image image 2.

따라서, 본 발명의 목적은 검색되는 레퍼런스를 제한함으로서 인식 속도를 향상시킬 수 있는 문자연결 정보를 이용한 문자인식기를 제공하는데 있다.Accordingly, an object of the present invention is to provide a character recognizer using character connection information which can improve the recognition speed by limiting the searched reference.

도 1은 종래의 문자인식기를 개략적으로 나타내는 블럭도.1 is a block diagram schematically showing a conventional character recognizer.

도 2는 본 발명의 실시예에 따른 문자연결 정보를 이용한 문자인식기를 개략적으로 나타낸 블럭도.2 is a block diagram schematically showing a character recognizer using character connection information according to an embodiment of the present invention.

도 3은 본 발명의 실시예에 따른 문자연결 정보를 이용한 문자인식기에서 영어 사전의 구조를 나타내는 도면.3 is a view showing the structure of the English dictionary in the character recognizer using the character connection information according to an embodiment of the present invention.

도 4는 본 발명의 실시예에 따른 문자연결 정보를 이용한 문자인식기의 처리 수순을 단계적으로 나타내는 도면.4 is a view showing step by step the processing procedure of the character recognizer using the character connection information according to an embodiment of the present invention.

*도면의 주요 부분에 대한 부호의 설명** Description of the symbols for the main parts of the drawings *

2, 12 : 입력 화상 이미지4, 14 : 레퍼런스 DB2, 12: input image image 4, 14: reference DB

6, 16 : 인식기8, 18 : 인식 결과 문자6, 16: Recognizer 8, 18: Recognition result character

20 : 사전 검색기22 : 레퍼런스 제한기20: Dictionary Finder 22: Reference Limiter

24 : 영어사전24: English Dictionary

상기 목적을 달성하기 위하여, 본 발명의 문자연결 정보를 이용한 문자인식기는 화상 이미지가 입력되는 입력수단과, 데이터 베이스 형태로 레퍼런스를 관리하는 레퍼런스 데이터 베이스와, 입력수단과 레퍼런스 데이터 베이스에 공통 접속되어 레퍼런스를 제한함으로서 레퍼런스에 의해 화상 이미지를 결정하는 인식수단과, 인식수단에 직렬 접속되어 화상 이미지의 인식결과를 출력하는 출력수단을 구비한다.In order to achieve the above object, the character recognizer using the character connection information of the present invention is commonly connected to the input means for inputting the image image, the reference database for managing the reference in the form of a database, the input means and the reference database Recognition means for determining the image image by reference by limiting the reference, and output means for outputting the recognition result of the image image in series with the recognition means.

본 발명의 문자연결 정보를 이용한 문자인식기는 이미 압력된 부분 문자열에 의한 정보로 화상 이미지를 예측하도록 문자연결 정보를 발생하는 제1 신호 발생수단과, 제1 신호 발생수단과 접속되어 문자연결 정보에 의해 레퍼런스의 개수를 제한하도록 레퍼런스 제한정보를 발생하는 제2 신호 발생수단과, 제2 신호 발생수단과 접속되어 레퍼런스를 제한하는 레퍼런스 제한수단을 구비한다.The character recognizer using the character connection information of the present invention is connected to the first signal generating means and the first signal generating means for generating the character connection information to predict the image image with the information by the substring already pressed. Second signal generating means for generating reference restriction information so as to limit the number of references, and reference limiting means for connecting the second signal generating means to limit the reference.

상기 목적 외에 본 발명의 다른 목적 및 특징들은 첨부도면을 참조한 실시예에 대한 설명을 통하여 명백하게 드러나게 될 것이다.Other objects and features of the present invention in addition to the above objects will become apparent from the description of the embodiments with reference to the accompanying drawings.

이하, 도 2 내지 도 4를 참조하여 본 발명의 바람직한 실시예에 대하여 설명하기로 한다.Hereinafter, exemplary embodiments of the present invention will be described with reference to FIGS. 2 to 4.

도 2는 본 발명의 문자연결 정보를 이용한 문자인식기를 나타내는 개략적인 블록도를 도시한다.2 is a schematic block diagram showing a character recognizer using the character connection information of the present invention.

도 2의 구성에서, 본 발명의 문자연결 정보를 이용한 문자인식기는 레퍼런스를 제한하도록 레퍼런스 제한 정보를 발생하는 사전 검색기(20)와, 트라이(Trie)구조로 구성된 영어사전(24)과, 레퍼런스 제한 정보를 이용하여 레퍼런스의 개수를 제한하는 레퍼런스 제한기(22)를 구비한다.In the configuration of FIG. 2, the character recognizer using the character connection information of the present invention is a dictionary searcher 20 for generating reference restriction information so as to limit a reference, an English dictionary 24 composed of a trie structure, and a reference restriction. A reference limiter 22 is used to limit the number of references using the information.

그리고 본 발명의 문자연결 정보를 이용한 문자인식기는 데이터 베이스 형태로 구성된 레퍼런스 DB(14)와, 입력 화상 이미지(2)와 레퍼런스 DB(4)로부터의 레퍼런스를 비교하여 입력 화상 이미지(12)에 일치된 레퍼런스로 입력된 인식문자를 결정하는 인식기(16)를 구비한다.The character recognizer using the character connection information of the present invention compares the reference DB 14 configured in the form of a database with the reference from the input image image 2 and the reference DB 4 and matches the input image image 12. And a recognizer 16 for determining a recognized character input as a reference.

사전 검색기(20)는 레퍼런스 제한기(22)와 직렬 접속됨과 아울러 제1 노드(1)를 경유하여 인식기(16)의 출력 단자와 접속된다. 레퍼런스 제한기(22)는 레퍼런스 DB(14)와 인식기(16)에 각각 직렬 접속된다. 입력 화상 이미지(12)의 인식 결과는 인식기(16)로부터 제1 노드(1)를 경유하여 사전 검색기(20)로 공급되어 이어져 입력되는 화상 이미지(12)에 대하여 레퍼런스 제한정보의 기초가 된다.The dictionary searcher 20 is connected in series with the reference limiter 22 and with the output terminal of the recognizer 16 via the first node 1. The reference limiter 22 is connected in series to the reference DB 14 and the recognizer 16, respectively. The recognition result of the input image image 12 serves as a basis for reference restriction information on the image image 12 supplied from the recognizer 16 to the pre-searcher 20 via the first node 1 and subsequently input.

사전 검색기(20)는 트라이(Trie) 형태로 구성된 영어 사전을 참조하여 레퍼런스 제한 정보를 발생하여 레퍼런스 제한기(22)에 공급한다. 본 발명에서의 레퍼런스(Reference)는 영어의 각 문자에 대해서 컨투어링(Contouring) 이나 프로젝션(Projection)을 이용하여 각 문자를 결정짓는 특징을 추출해 놓은 것을 의미한다. 레퍼런스 제한정보는 입력 화상 이미지(12)에 해당하는 레퍼런스로 어떤 것이 가능한지를 결정해 주는 정보이다. 이러한 레퍼런스 제한정보로는 문자의 생김새나 구조, 높이, 통계적 정보 등 여러 가지 것이 있을 수 있지만, 본 발명에서는 각 입력 화상 이미지의 독립적인 개개의 문자에서 추출되는 정보가 아니라 영어사전(24) 상에서 개개의 문자들의 연결 정보를 채택한다.The dictionary searcher 20 generates reference limit information by referring to an English dictionary configured in a trie form and supplies the reference limit information to the reference limiter 22. Reference in the present invention means that a feature that determines each character is extracted by using contouring or projection for each character of English. The reference restriction information is information for determining what is possible with a reference corresponding to the input image image 12. Such reference restriction information may include various features such as character appearance, structure, height, and statistical information. However, in the present invention, the information is not extracted from each individual character of each input image image, but separately from the English dictionary 24. Adopt the concatenation information of the characters.

이러한 레퍼런스의 제한정보의 일예를 들어보면, diff로 시작하는 영어 단어에는 difficult, difficulties, difficulty, diffident 등이 있다. 따라서, 인식기(16)에서 이미 diff까지 인식한 상태라면 그 다음에 인식할 문자는 c 나 d가 올 수 있을 것이다.As an example of the limitations of these references, the English words that begin with diff include difficult, difficulties, difficulty, and diffident. Thus, if the recognizer 16 has already recognized diff, the next character to be recognized may be c or d.

사전 검색기(20)가 인식기(16)에서 현재까지 검출된 문자 연결정보에 의해 diffi 다음에는 c, d만이 올 수 있다라는 레퍼런스 제한정보를 레퍼런스 제한기(22)에 공급한다. 레퍼런스 제한기(22)의 레퍼런스 제한정보 값에 따라, 인식기(16)는 레퍼런스 DB(14)로부터 c와 d의 레퍼런스가 레퍼런스 제한기(22)에 공급되어 인식기(16)는 c와 d의 레퍼런스만을 검색하게 된다.The dictionary searcher 20 supplies the reference limiter 22 with reference restriction information that only c and d can come after diffi by the character linkage information detected so far in the recognizer 16. According to the reference restriction value of the reference limiter 22, the recognizer 16 supplies a reference of c and d from the reference DB 14 to the reference limiter 22 so that the recognizer 16 references the c and d. You will search only.

사전 검색기(20)가 사용하는 영한사전(24)은 diffi 다음에 c, d가 온다는 것을 쉽게 알 수 있도록 트라이(Trie) 형태로 구성된다. 이러한 트라이로 구현된 영어 사전을 이용함으로써 영어 단어의 문자 연결정보를 이용할 수 있게 되었다.The English-Korean dictionary 24 used by the dictionary searcher 20 is configured in the form of Tri so that it is easy to know that c and d come after diffi. By using the English dictionary implemented with such a tri, it is possible to use the letter connection information of the English words.

이를 도 3을 참조하여 설명하면, 본 발명의 문자연결 정보를 이용한 문자인식기의 영한사전(24)은 동일한 접두사(Prefix)를 가지는 문자들은 트리(Tree) 상에서 동일한 부모(Parent)를 가지는 노드들로서 구현되도록 트라이(Trie) 형태로 구성된다.Referring to FIG. 3, the English-Korean dictionary 24 of the character recognizer using the character connection information of the present invention implements characters having the same prefix as nodes having the same parent on the tree. It is configured in the form of Tri.

도 3을 참조하면, 트라이(Trie)로 구현된 영어사전에서, 예로든 구성단어(a, an, and, ann, any, bad, base, bob)의 검색수순을 나타내는 영한사전(24)의 예를 도시한다. 영어사전의 구성단어는 동일한 접두사를 갖는 문자들은 동일한 부모를 가지는 노드에서 파생되고 문자 연결정보(단어 끝 정보)와, 자손(child) 노드와 형제(sibling) 노드의 경로를 결정하는 경로 정보에 의해 이후에 올 수 있는 문자를 인식하게 된다.Referring to FIG. 3, an example of an English-Korean dictionary 24 showing a search procedure of an exemplary component word (a, an, and, ann, any, bad, base, bob) in an English dictionary implemented by Tri Shows. The constituent words of the English dictionary are derived from nodes with the same prefix, with the letter linking information (word ending information), and the path information determining the paths of the child and sibling nodes. It will recognize characters that can come later.

영한사전(24)을 트라이 형태로 구현함으로써 얻을 수 있는 이점으로는 영한사전(24) 검색에 소모되는 시간을 줄일 수 있다는 점과, 영한사전(24)의 크기를 줄임으로써 사용 메모리의 점유율을 줄일 수 있다는 것이다.Advantages of implementing the English-Korean dictionary 24 in a tri form include reducing the time spent searching the English-Korean dictionary 24, and reducing the occupancy of the memory used by reducing the size of the English-Korean dictionary 24. Can be.

문자열을 이루는 입력 화상이미지를 인식하는 과정은 각 입력 화상 이미지(12)에 대한 스테이지(stage)로 구분되고, 각 스테이지는 하나의 화상 이미지가 입력되어 인식 결과가 나올 때까지의 과정을 의미한다.The process of recognizing an input image image forming a character string is divided into stages for each input image image 12, and each stage means a process until one image image is input and a recognition result is obtained.

하나의 스테이지 안에서, 본 발명의 문자연결 정보를 이용한 문자인식기의 처리 수순을 살펴보면, 레퍼런스 DB(4)로부터 레퍼런스 제한기(22)로 레퍼런스들이 공급된다. 레퍼런스 제한기(22)는 이전 스테이지에서 구해진 레퍼런스 제한 정보를 이용하여 인식기(16)가 참조할 레퍼런스의 개수를 줄이게 된다.In one stage, referring to the processing procedure of the character recognizer using the character connection information of the present invention, references are supplied from the reference DB 4 to the reference limiter 22. The reference limiter 22 reduces the number of references to be recognized by the recognizer 16 by using the reference limit information obtained in the previous stage.

인식기(16)는 레퍼런스 제한기(22)로부터 공급받은 레퍼런스를 이용해 입력 화상 이미지(12)가 어느 문자의 화상 이미지인지를 결정하여 인식 결과를 사전 검색기(20)에 공급한다.The recognizer 16 uses the reference supplied from the reference limiter 22 to determine which character of the input image image 12 is the image image, and supplies the recognition result to the pre-searcher 20.

사전 검색기(20)는 이전의 스테이지까지 인식된 결과를 가지고 최종 인식 결과 문자가 영어사전(24)에서 어느 노드에 해당하는 것인가에 대한 정보를 가지고 있다. 즉 사전 검색기(20)는 이전 스테이지까지 인식된 인식 결과 문자들로 만들어지는 부분 문자열을 영어사전(24)으로부터 검색한다. 사전 검색기(20)는 현재의 스테이지에서 인식된 결과가 이전 스테이지까지 인식된 결과로 검출된 영어사전 상의 자손 노드(Child node)로부터 입력 화상 이미지와 일치하는 문자를 검색한다.The dictionary searcher 20 has the result recognized up to the previous stage and has information on which node in the English dictionary 24 the final recognition result character corresponds. In other words, the dictionary searcher 20 searches for the substring made from the recognition result characters recognized up to the previous stage from the English dictionary 24. The dictionary searcher 20 searches for a character that matches the input image image from a child node of the English dictionary in which the result recognized at the current stage is detected as a result recognized up to the previous stage.

영어사전(24)의 검색에서 입력 화상 이미지(12)와 일치되는 문자를 검출한 경우, 사전 검색기(20)는 최초의 스테이지부터 현재까지의 인식 결과들로 만들어진 부분 문자열에 대하여 영어사전을 검색한 상태에 있다. 이에 따라, 사전 검색기(20)는 최종적으로 구해진 자손 노드(Child node)들을 검색하여 다음에 인식되어야 할 문자가 무엇인지를 판단한다. 인식기(16)에 의해 현재까지 인식된 부분 문자열의 정보를 사전 검색기(20)에 공급되어, 사전 검색기(20)는 이러한 문자열의 연결 정보를 이용하여 영어사전(24)을 검색함으로서 레퍼런스 제한정보를 발생하여 다음 스테이지의 레퍼런스 제한기(22)에 공급한다.When a character matching the input image image 12 is detected in the search of the English dictionary 24, the dictionary searcher 20 searches the English dictionary for the substring made of the recognition results from the first stage to the present. Is in a state. Accordingly, the dictionary searcher 20 searches for finally obtained child nodes to determine what characters are to be recognized next. The information of the substrings recognized up to now by the recognizer 16 is supplied to the dictionary searcher 20, so that the dictionary searcher 20 searches the English dictionary 24 by using the connection information of the strings to obtain reference restriction information. Is generated and supplied to the reference limiter 22 of the next stage.

영어사전(24)의 검색에서 입력 화상 이미지(12)와 일치되는 문자를 검출하지 못한 경우, 현재 스테이지까지의 인식 결과 문자(18)들 중 하나 이상의 오인식된 문자가 있다는 것이라고 판단 할 수 있다.If the search of the English dictionary 24 does not detect a character that matches the input image image 12, it may be determined that there is at least one misrecognized character among the recognition results characters 18 up to the current stage.

도 4를 참조하면, 본 발명의 문자연결 정보를 이용한 문자인식기에서 영어단어 image를 인식하는 과정이 도시되어 있다.Referring to FIG. 4, a process of recognizing an English word image in a character recognizer using character connection information of the present invention is illustrated.

도 4에 있어서, 본 발명의 문자연결 정보를 이용한 문자인식기를 도시한 도 2를 결부하여 설명하기로 한다.In FIG. 4, the description will be made with reference to FIG. 2, which shows a character recognizer using the character connection information of the present invention.

입력되는 화상 이미지 image를 인식하는 과정은 5개의 스테이지로 이루어지며 각 스테이지는 입력 화상 이미지(12)가 입력되어 인식 결과(18)가 출력될 때 까지의 과정을 나타낸다.The process of recognizing the input image image image is composed of five stages, and each stage represents a process until the input image image 12 is input and the recognition result 18 is output.

입력 화상 이미지 i의 인식수순을 나타내는 제1 스테이지에서, 사전 검색기에서는 인식기(16)로부터 이전까지의 부분 문자열의 인식결과가 공급되지 않는 최초의 상태에 있다. 이에 따라서, 레퍼런스 제한기(22)에는 레퍼런스 제한정보가 공급되지 않고 레퍼런스 제한기(22)는 레퍼런스 DB(14)로부터 공급되는 레퍼런스를 제한하지 않는다. 인식기(6)는 레퍼런스 제한기(22)를 경유한 레퍼런스 DB의 레퍼런스에서 입력 화상 이미지(12) i와 일치하는 레퍼런스를 검출하여 그 인식 결과를 사전 검색기(20)에 공급한다. 사전 검색기(20)는 영어사전(24)으로부터 이러한 문자 연결정보를 공급받아, 이로부터 i 이후에 올 수 있는 문자로 레퍼런스를 제한하는 레퍼런스 제한정보를 이어지는 제2 스테이지의 레퍼런스 제한기(22)에 공급한다. 결과적으로, 영어 단어를 구성하는 최초의 문자는 본 발명의 문자연결 정보를 이용한 문자인식기에서, 종래의 기술과 동일하게 레퍼런스 DB(14)로부터의 레퍼런스를 제한하지 않고 입력되는 최초의 문자와 레퍼런스를 순차적으로 비교하여 일치되는 레퍼런스로 입력되는 최초의 문자를 결정하게 된다.In the first stage indicating the recognition procedure of the input image image i, the dictionary searcher is in an initial state in which the recognition result of the substring from the recognizer 16 to the previous is not supplied. Accordingly, reference limit information is not supplied to the reference limiter 22 and the reference limiter 22 does not limit the reference supplied from the reference DB 14. The recognizer 6 detects a reference matching the input image image 12 i from the reference of the reference DB via the reference limiter 22 and supplies the recognition result to the pre-searcher 20. The dictionary searcher 20 receives such character connection information from the English dictionary 24, and from this to the reference limiter 22 of the second stage, followed by reference restriction information for limiting the reference to the characters that can come after i. Supply. As a result, in the character recognizer using the character connection information of the present invention, the first character constituting the English word, the first character and the reference to be input without limiting the reference from the reference DB 14, as in the prior art A sequential comparison is made to determine the first character entered as a matching reference.

m의 인식수순을 나타내는 제2 스테이지에서, 레퍼런스 제한기(22)에 공급된 제1 스테이지에서의 레퍼런스 제한정보는 i 이후에 올 수 있는 문자가 무엇이다라는 것을 나타내는 것으로서 이 레퍼런스 제한정보를 기초로 하여 레퍼런스 DB(14)로부터의 레퍼런스를 제한한다. 인식기(16)에서는 제한된 레퍼런스에서 입력 화상 이미지(12)와 일치하는 인식 결과(18) m이 출력되면 인식기로부터의 인식 결과는 사전 검색기(20)에 공급된다. 사전 검색기(20)는 영어사전(24)으로부터 문자 연결정보를 공급받아 im 이후에 올 수 있는 문자를 나타내는 레퍼런스 제한정보를 제3 스테이지의 레퍼런스 제한기(22)에 공급한다.In the second stage representing the recognition procedure of m, the reference restriction information in the first stage supplied to the reference limiter 22 indicates what character may come after i and based on this reference restriction information. To limit the reference from the reference DB 14. The recognizer 16 outputs the recognition result 18 m that matches the input image image 12 at the limited reference, and the recognition result from the recognizer is supplied to the pre-searcher 20. The dictionary searcher 20 receives the character connection information from the English dictionary 24 and supplies the reference limit information representing the characters that can come after im to the reference limiter 22 of the third stage.

제3 스테이지에서, 인식기(16)는 im 이후에 올 수 있는 문자가 무엇이다라는 레퍼런스 정보로 레퍼런스 DB(14)의 제한된 레퍼런스로부터 세 번째로 입력되는 화상 이미지(12)를 인식한다. 인식결과가 a로 출력되면 사전 검색기(20)는 ima 다음에 올 수 있는 문자가 무엇이다라는 레퍼런스 제한정보를 제4 스테이지의 레퍼런스 제한기(22)에 공급한다.In the third stage, the recognizer 16 recognizes the image image 12 that is input third from the limited reference of the reference DB 14 with reference information that what character may come after im. If the recognition result is output as a, the dictionary searcher 20 supplies the reference limiter 22 of the fourth stage to the reference limiter information, which is a character that can come after ima.

제4 스테이지에서, 인식기(16)는 ima 이후에 올 수 있는 문자가 무엇이다라는 레퍼런스 정보로 레퍼런스 DB(14)의 제한된 레퍼런스로부터 네 번째로 입력되는 화상 이미지(12)를 인식한다. 인식결과가 g로 출력되면 사전 검색기(20)는 imag 다음에 올 수 있는 문자가 무엇이다라는 레퍼런스 제한정보를 제5 스테이지의 레퍼런스 제한기(22)에 공급한다.In the fourth stage, the recognizer 16 recognizes the image image 12 that is input fourth from the limited reference of the reference DB 14 with reference information that what character may come after ima. When the recognition result is output in g, the dictionary searcher 20 supplies the reference limiter 22 of the fifth stage to the reference limiter, which is a character that can come after imag.

제5 스테이지에서, 인식기(16)는 imag 이후에 올 수 있는 문자가 무엇이다라는 레퍼런스 정보를 이용하여 다섯 번째로 입력되는 화상 이미지(12)를 인식한다. 이 때 레퍼런스 제한기(22)에는 입력된 화상 이미지(120가 단어의 마지막 문자에 해당하는 것이라는 정보가 공급되어 이 정보를 이용하여 imag로 시작하는 문자열에서 다섯 번째 위치에 올 수 있는 문자에 해당하는 레퍼런스만 인식기(16)에 제공하도록 레퍼런스 DB(14)의 레퍼런스를 제한한다.In the fifth stage, the recognizer 16 recognizes the fifth input image image 12 using the reference information of what characters may come after imag. At this time, the reference limiter 22 is supplied with the information indicating that the input image image 120 corresponds to the last character of the word, and thus, the reference limiter 22 uses the information to correspond to the character that can be placed in the fifth position in the string starting with imag. The reference of the reference DB 14 is limited to providing only the reference to the recognizer 16.

이와 같이, 본 발명의 문자연결 정보를 이용한 문자인식기는 문자 연결 정보를 이용하여 인식 과정에서 참조해야 하는 레퍼런스를 제한한다. 그 결과, 입력 화상 이미지와 레퍼런스 비교 시간이 감소하게 되며 그에 따라 인식기의 수행 속도가 향상된다. 그리고 본 발명의 문자연결 정보를 이용한 문자인식기는 레퍼런스 참조 방식을 사용하는 모든 문자인식 알고리즘에 적용할 수 있으며, 부가적으로 인식 과정에서 발생할 수 있는 오인식을 검출할 수 있다.As such, the character recognizer using the character connection information of the present invention uses the character connection information to limit the reference to be referred to in the recognition process. As a result, the input image image and the reference comparison time are reduced, thereby improving the performance of the recognizer. In addition, the character recognizer using the character connection information of the present invention can be applied to all character recognition algorithms using the reference reference method, and can additionally detect false recognition that may occur in the recognition process.

상술한 바와 같이, 본 발명의 문자연결 정보를 이용한 문자인식기는 입력되는 문자의 화상 이미지를 대조하게 되는 레퍼런스의 개수를 줄임으로서 문자인식기의 처리속도를 향상시킬 수 있다.As described above, the character recognizer using the character connection information of the present invention can improve the processing speed of the character recognizer by reducing the number of references that contrast the image image of the input character.

이상 설명한 내용을 통해 당업자라면 본 발명의 기술사상을 일탈하지 아니하는 범위에서 다양한 변경 및 수정이 가능함을 알 수 있을 것이다. 따라서, 본 발명의 기술적 범위는 명세서의 상세한 설명에 기재된 내용으로 한정되는 것이 아니라 특허 청구의 범위에 의해 정하여 져야만 할 것이다.Those skilled in the art will appreciate that various changes and modifications can be made without departing from the technical spirit of the present invention. Therefore, the technical scope of the present invention should not be limited to the contents described in the detailed description of the specification but should be defined by the claims.

Claims (5)

화상 이미지가 입력되는 입력수단과,Input means for inputting an image image, 데이터 베이스 형태로 레퍼런스를 관리하는 레퍼런스 데이터 베이스와,A reference database for managing references in the form of databases; 상기 입력수단과 레퍼런스 데이터 베이스에 공통 접속되어 레퍼런스를 제한함으로서 레퍼런스에 의해 상기 화상 이미지를 결정하는 인식수단과,Recognition means commonly connected to the input means and a reference database to determine the image image by reference by limiting a reference; 상기 인식수단에 직렬 접속되어 화상 이미지의 인식결과를 출력하는 출력수단을 구비하는 것을 특징으로 하는 문자연결 정보를 이용한 문자인식기.And an output means connected in series with said recognition means for outputting a recognition result of an image image. 제 1 항에 있어서,The method of claim 1, 상기 인식수단은 동일한 접두사를 갖는 문자들은 트리(Tree) 구조상에서 동일한 부모 노트(Parent node)를 갖도록 구성된 영어사전부와,The recognition means may include an English dictionary configured to have characters having the same prefix have the same parent node in a tree structure, 상기 입력수단에 직렬접속되어 이전에 입력된 부분 문자열의 문자 연결정보를 발생하는 인식기와,A recognizer for serially connecting the input means to generate character connection information of a previously inputted substring; 상기 영어사전부와 상기 인식기에 공통 접속되어 상기 문자 연결정보와 상기 영어사전부에 의해 레퍼런스 개수를 제한하도록 하는 레퍼런스 제한정보를 발생하는 사전 검색기와,A dictionary searcher which is commonly connected to the English dictionary and the recognizer to generate reference limit information for limiting the number of references by the character connection information and the English dictionary; 상기 사전 검색기와 직렬 접속되어 상기 레퍼런스 제한정보에 의해 상기 레퍼런스를 제한하는 레퍼런스 제한기를 구비한 것을 특징으로 하는 문자연결 정보를 이용한 문자인식기.And a reference limiter connected in series with the dictionary searcher to limit the reference by the reference restriction information. 제 1 항 또는 제 2 항에 있어서,The method according to claim 1 or 2, 상기 영어사전부는 동일한 접두사를 갖는 문자들은 트리(Tree) 구조상에서 동일한 부모 노드를 갖도록 트라이 (Trie) 구조로 되고,The English dictionary has a trie structure so that characters having the same prefix have the same parent node in the tree structure. 상기 문자 연결정보에 의해 검색되는 것을 특징으로 하는 문자연결 정보를 이용한 문자인식기.Character recognizer using the character connection information, characterized in that the search by the character connection information. 화상 이미지와 레퍼런스가 비교되도록 레퍼런스 참조 방식을 사용하는 문자인식기에 있어서,In the character recognizer that uses the reference reference method to compare the image image and the reference, 이미 입력된 부분 문자열에 의한 정보로 상기 화상 이미지를 예측하도록 문자연결 정보를 발생하는 제1 신호 발생수단과,First signal generating means for generating character connection information so as to predict the image image with information by the substring already input; 상기 제1 신호 발생수단과 접속되어 상기 문자연결 정보에 의해 레퍼런스의 개수를 제한하도록 레퍼런스 제한정보를 발생하는 제2 신호 발생수단과,Second signal generating means connected to said first signal generating means for generating reference limit information to limit the number of references by said character connection information; 상기 제2 신호 발생수단과 접속되어 레퍼런스를 제한하는 레퍼런스 제한수단을 구비한 것을 특징으로 하는 문자연결 정보를 이용한 문자인식기.And a reference limiting means connected to said second signal generating means for limiting a reference. 제 4 항에 있어서,The method of claim 4, wherein 상기 제2 신호 발생수단은 동일한 접두사를 갖는 문자들은 트리 구조상에서 동일한 부모 노드를 갖도록 구성되어 상기 문자연결 정보로 검색되는 영어사전부를 구비한 것을 특징으로 하는 문자연결 정보를 이용한 문자인식기.The second signal generating means is a character recognizer using the character connection information, characterized in that the characters having the same prefix is configured to have the same parent node in the tree structure is searched by the character connection information.
KR1019970037019A 1997-08-01 1997-08-01 Character Recognizer Using Character Connection Information KR19990015114A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019970037019A KR19990015114A (en) 1997-08-01 1997-08-01 Character Recognizer Using Character Connection Information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019970037019A KR19990015114A (en) 1997-08-01 1997-08-01 Character Recognizer Using Character Connection Information

Publications (1)

Publication Number Publication Date
KR19990015114A true KR19990015114A (en) 1999-03-05

Family

ID=66000474

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970037019A KR19990015114A (en) 1997-08-01 1997-08-01 Character Recognizer Using Character Connection Information

Country Status (1)

Country Link
KR (1) KR19990015114A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030035248A (en) * 2001-10-30 2003-05-09 주식회사 아이버스 Method for searching by tree-structured words and computer readable medium having stored thereon computer executable instruction for performing the method
US7805168B2 (en) 2004-05-21 2010-09-28 Samsung Electronics Co., Ltd. Portable digital device for providing digital broadcasting information through outer display unit and method thereof
KR101105652B1 (en) * 2010-02-26 2012-01-18 인하대학교 산학협력단 Method of creating directivity graph for search nonsuperstring non-inclusion
KR20180066254A (en) * 2011-06-03 2018-06-18 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 Compression match enumeration

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030035248A (en) * 2001-10-30 2003-05-09 주식회사 아이버스 Method for searching by tree-structured words and computer readable medium having stored thereon computer executable instruction for performing the method
US7805168B2 (en) 2004-05-21 2010-09-28 Samsung Electronics Co., Ltd. Portable digital device for providing digital broadcasting information through outer display unit and method thereof
KR101105652B1 (en) * 2010-02-26 2012-01-18 인하대학교 산학협력단 Method of creating directivity graph for search nonsuperstring non-inclusion
KR20180066254A (en) * 2011-06-03 2018-06-18 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 Compression match enumeration

Similar Documents

Publication Publication Date Title
KR100286501B1 (en) Pre-search apparatus and method for performing a search with Lattice as a key
US6169972B1 (en) Information analysis and method
US5528701A (en) Trie based method for indexing handwritten databases
JPH08194719A (en) Retrieval device and dictionary and text retrieval method
JP2002312365A (en) Document image retrieval device
JPH02299068A (en) Word separation method and apparatus
JP2001291060A (en) Device and method for collating word string
CN109977220B (en) Method for reversely generating abstract based on key sentence and key word
EP0366115A2 (en) String collating system for searching for character string of arbitrary length within a given distance from reference string
KR19990015114A (en) Character Recognizer Using Character Connection Information
Takada A hierarchy of language families learnable by regular language learners
US6757647B1 (en) Method for encoding regular expressions in a lexigon
JP5628365B2 (en) Search device
KR100998291B1 (en) Method and apparatus for structuralize keyword string and searching keyword string
JP2827066B2 (en) Post-processing method for character recognition of documents with mixed digit strings
Lucas Rapid best-first retrieval from massive dictionaries
JP3924899B2 (en) Text search apparatus and text search method
JP2001092830A (en) Device and method for collating character string
JPH10177582A (en) Method and device for retrieving longest match
JP3071745B2 (en) Post-processing method of character recognition result
JPH08180064A (en) Document retrieval method and document filing device
JPH08249427A (en) Method and device for character recognition
US20030187843A1 (en) Method and system for searching for a list of values matching a user defined search expression
JP3241854B2 (en) Automatic word spelling correction device
CN117216179A (en) English word collocation query method based on language model

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application