KR20100103351A - Character recognition apparatus, character recognition program and character recognition method - Google Patents

Character recognition apparatus, character recognition program and character recognition method Download PDF

Info

Publication number
KR20100103351A
KR20100103351A KR1020100010816A KR20100010816A KR20100103351A KR 20100103351 A KR20100103351 A KR 20100103351A KR 1020100010816 A KR1020100010816 A KR 1020100010816A KR 20100010816 A KR20100010816 A KR 20100010816A KR 20100103351 A KR20100103351 A KR 20100103351A
Authority
KR
South Korea
Prior art keywords
character
recognition
category
characters
matching
Prior art date
Application number
KR1020100010816A
Other languages
Korean (ko)
Other versions
KR101078086B1 (en
Inventor
토모요시 아이자와
Original Assignee
오므론 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오므론 가부시키가이샤 filed Critical 오므론 가부시키가이샤
Publication of KR20100103351A publication Critical patent/KR20100103351A/en
Application granted granted Critical
Publication of KR101078086B1 publication Critical patent/KR101078086B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

PURPOSE: A character recognition apparatus, a character recognition program and a character recognition method are provided to recognize image data including a character at a high speed. CONSTITUTION: A ROM(12) stores matching data for text recognition, and an image input unit(3) acquires image data. A CPU(11) recognizes the character within the image data based on the matching data. The matching data includes first and second recognition matching data which are discriminated from each other. The second recognition matching data relate to a second recognition character which has more characters than the first recognition characters.

Description

문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법{CHARACTER RECOGNITION APPARATUS, CHARACTER RECOGNITION PROGRAM AND CHARACTER RECOGNITION METHOD}CHARACTER RECOGNITION APPARATUS, CHARACTER RECOGNITION PROGRAM AND CHARACTER RECOGNITION METHOD}

본 발명은, 예를 들면 화상 데이터에 포함되어 있는 문자를 인식하는 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법에 관한 것이다.The present invention relates to, for example, a character recognition apparatus, a character recognition program, and a character recognition method for recognizing characters contained in image data.

일본어나 중국어의 문자수는, 영어 등에 비하여 매우 많고, 각각 제 1 수준 한자만 3000문자 이상, 제 2 수준 한자도 합치면 6000문자 이상 있다. 이 때문에고, 일본어나 중국어 등의 문자를 인식하려고 하면, 각각의 문자의 인식 처리에서 들 3000 내지 6Q00 이상의 문자라고 대조하는 처리가 필요해진다. 이 결과, CPU에 부하가 걸리는 무거운 처리가 되고, 특히 휴대 기기와 같은 빈약한 CPU 환경하에 있어서, 처리 시간의 장시간화가 심각한 문제로 된다.The number of characters in Japanese and Chinese is much higher than in English, and there are more than 3,000 characters of the first level kanji and more than 6000 characters of the second level kanji, respectively. For this reason, when it is going to recognize characters, such as Japanese and Chinese, the process of matching each character with more than 3000-6Q00 in the recognition process of each character is needed. As a result, heavy processing that puts a load on the CPU becomes a serious problem, and the prolonged processing time becomes a serious problem, especially in a poor CPU environment such as a portable device.

한편, 문자 인식하는 대상으로서, 예를 들면 명함 등, 기재 내용이 어느 정도 정해저 있는 문자 인쇄 매체가 존재하고 있다. 이와 같은 문자 인쇄 매체의 문자를 판독하는 장치로서, 명함의 문자를 인식하는 장치가 제안되어 있다(특허 문헌 1 내지 3 참조).On the other hand, as a character recognition object, there exists a character printing medium in which description content is determined to some extent, such as a business card. As an apparatus for reading the character of such a character printing medium, the apparatus which recognizes the character of a business card is proposed (refer patent documents 1-3).

특허 문헌 1의 명함 인식 장치는, 인식 화상 범위를 유저에게 펜으로 지정시키고, 이 범위의 인식 문자를 어느 속성(이름, 회사명, 주소 등)에 등록하는지 지정시키는 것이다.The business card recognition device of Patent Literature 1 designates a range of recognized images to a user with a pen, and designates to which attribute (name, company name, address, etc.) the recognized characters of this range are registered.

특허 문헌 2의 문자 인식 장치는, 문자 인식이 필요한 에어리어를 템플릿으로서 복수 등록하여 두고, 이 템플릿을 선택시킨 다음, 템플릿으로 정해지는 에어리어 내의 문자를 인식하는 것이다.The character recognition device of Patent Document 2 registers a plurality of areas requiring character recognition as a template, selects this template, and then recognizes the characters in the area determined by the template.

특허 문헌 3의 문자 인식 장치는, 키보드에 의해 인식 대상 영역을 지정시키고, 이 대상 영역에 대해 문자를 인식하는 것이다.The character recognition apparatus of patent document 3 designates a recognition target area | region by a keyboard, and recognizes a character with respect to this target area | region.

어느 장치도, 명함 전체를 한번에 처리하는 것은 아니고, 영역 지정한 카테고리분(分)에 대해서만 처리하는 것이다. 이 때문에, 유저가 소망하는 카테고리분에 대해 신속하게 인식 처리를 할 수 있다. 즉, 인식 처리를 행하는 범위가 유저가 소망하는 카테고리로 좁혀져 있기 때문에, 인식 처리를 빨리 할 수 있고, CPU에 걸리는 부하를 억제할 수 있다.Neither apparatus processes the entire business card at once, but only the categories designated by the area. For this reason, the recognition process can be promptly performed about the category desired by a user. That is, since the range for performing the recognition process is narrowed down to a category desired by the user, the recognition process can be speeded up and the load on the CPU can be suppressed.

그러나, 이와 같은 종래 기술은, 문자 인식 범위를 좁힘으로써 인식 처리에 필요로 하는 시간을 단축하고 있지만, 그 좁힌 범위에서의 문자 인식 처리 그 자체에 관해서는 시간 단축이되어 있지 않다.However, such a prior art shortens the time required for the recognition process by narrowing the character recognition range, but does not shorten the time for the character recognition process itself in the narrow range.

또한, 상기 종래 기술에는, 작업시간을 필요로 하고 번거롭다는 문제점이 있다. 상세히 기술하면, 상기 종래 기술은, 명함 1장마다 문자 인식시키는 범위(또는 템플릿)를 유저에게 지정시키고, 그 범위의 문자를 어느 카테고리에 대응시키는지를 설정할 필요가 있다. 이 때문에, 입력하고 싶은 명함의 수가 많으면 많을수록, 유저에게 있어서 복잡한 작업을 몇번이나 요구하게 된다.In addition, the above-described prior art has a problem that it takes time and is troublesome. In detail, the prior art needs to specify a range (or template) for character recognition for each business card, and set which category the characters in the range correspond to. For this reason, the larger the number of business cards you want to input, the more complicated the work is required from the user.

한편, 단말 장치에 의해 명함을 화상 데이터로서 받아들이고, 받아들인 화상 데이터를 통신 네트워크를 통하여 서버에 송신하고, 서버에서 문자 인식을 행하고, 인식 결과를 서버로부터 재차 통신 네트워크를 통하여 단말 장치에 송신하는 명함 0CR 처리 시스템이 제안되어 있다(특허 문헌 4 참조).On the other hand, a business card which accepts a business card as image data by the terminal device, transmits the received image data to the server via the communication network, performs character recognition at the server, and transmits the recognition result from the server to the terminal device again via the communication network. 0CR treatment system is proposed (refer patent document 4).

이 방법에 의하면, 단말 장치의 CPU가 빈약해도, 서버의 CPU가 처리 능력이 높은 것이라면, 인식 처리에 필요로 하는 시간을 단축할 수 있다.According to this method, even if the CPU of the terminal device is poor, the time required for the recognition processing can be shortened if the CPU of the server is high in processing capacity.

그러나, 이와 같은 통신 네트워크를 이용하는 방법은, 통신 시간이 걸린다. 이 때문에, 회선의 혼잡 정도에 따라서는 통신 시간이 장시간화된다는 문제점이 있다. 또한, 통신하는 것이 필수가 되기 때문에, 예를 들면 휴대 전화기와 같이 무선 통신을 행하는 휴대 단말로는, 지하 등 전파가 도달하지 않는 장소에서 사용할 수 없다는 문제도 생긴다.However, the method using such a communication network takes communication time. For this reason, there is a problem that the communication time becomes longer depending on the degree of congestion of the line. In addition, since communication becomes essential, a problem arises that, for example, a portable terminal that performs wireless communication such as a mobile telephone cannot be used in a place where radio waves do not reach, such as underground.

일본국특개평10-55413호공보Japanese Patent Application Laid-Open No. 10-55413 일본국특개2001-202475호공보Japanese Patent Laid-Open No. 2001-202475 일본국특개평2-240787호공보Japanese Patent Laid-Open No. 2-240787 일본국특개2003-296353호공보Japanese Patent Laid-Open No. 2003-296353

본 발명은, 상술한 문제를 감안하여, 문자가 포함되어 있는 화상 데이터에 대해, 간단한 조작으로 고속의 문자 인식을 실현하는 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법을 제공하고, 이용자의 만족도를 향상시키는 것을 목적으로 하고 있다.SUMMARY OF THE INVENTION In view of the above-described problems, the present invention provides a character recognition device, a character recognition program, and a character recognition method for realizing high-speed character recognition with a simple operation on image data containing characters, and satisfying the user. It aims to improve.

본 발명은, 문자 인식용의 매칭 데이터를 기억하는 기억 수단과, 화상 데이터를 취득하는 화상 데이터 취득 수단과, 상기 매칭 데이터에 의거하여 상기 화상 데이터 내의 문자를 인식하는 문자 인식 수단을 구비하는 문자 인식 장치로서, 상기 매칭 데이터는, 미리 정해진 제 1 인식 문자에 관한 제 1 인식용 매칭 데이터와, 상기 제 1 인식용 문자 이외의 문자를 포함하고 해당 제 1 인식용 문자보다도 문자수가 많은 제 2 인식용 문자에 관한 제 2 인식용 매칭 데이터를 구별 가능하게 구성되고, 상기 문자 인식 수단은, 상기 제 1 인식용 매칭 데이터에 의해 상기 화상 데이터에 관해 문자 인식을 실행하는 제 1 문자 인식 처리와, 해당 제 1 문자 인식 처리의 결과가 재인식 조건에 해당하는지의 여부를 판별하는 재인식 필요여부 판별 처리와, 해당 재인식 필요여부 판별 처리에 의해 재인식을 필요로 한다고 판별한 재인식 대상에 대해, 상기 제 2 인식용 매칭 데이터에 의해 문자 인식을 실행하는 제 2 문자 인식 처리를 실행하는 구성인 문자 인식 장치인 것을 특징으로 한다.The present invention provides a character recognition comprising storage means for storing matching data for character recognition, image data acquisition means for acquiring image data, and character recognition means for recognizing characters in the image data based on the matching data. The apparatus for matching the second data includes: first matching matching data for a first predetermined character and a second recognition character including characters other than the first recognition character and having a larger number of characters than the first recognition character. The second recognition matching data for a character is configured to be distinguishable, and the character recognition means includes a first character recognition process for performing character recognition on the image data by the first recognition matching data, 1 Recognition necessity determination process for determining whether the result of the character recognition process corresponds to the recognition condition, and the corresponding recognition required And a character recognition device configured to execute a second character recognition process for performing character recognition with the second recognition matching data, for a recognizing object determined that re-recognition is required by the presence or absence determination process.

상기 매칭 데이터는, 문자의 특징을 나타내는 특징 데이터로 구성하는 등, 문자 인식의 매칭에 이용하는 데이터로 구성할 수 있다.The matching data can be composed of data used for matching of character recognition, such as configuration of feature data representing the characteristics of characters.

상기 기억 수단은, 하드 디스크나 불휘발성 메모리 등, 데이터를 기억하는 수단으로 구성할 수 있다.The storage means can be constituted by means for storing data such as a hard disk or a nonvolatile memory.

상기 화상 데이터는, 컬러 화상이나 그레이 스케일 화상이나 모노클로 2계조 화상 등, 적절한 화상의 데이터로 할 수 있다.The image data may be data of an appropriate image such as a color image, a gray scale image, or a monoclonal two-tone image.

상기 화상 데이터 취득 수단은, 예를 들면 CCD 카메라나 CMOS 카메라 등의 촬상 수단으로 하는, 또는, 이와 같은 촬상 수단으로 촬상한 문자열 화상의 데이터를 해당 촬상 수단으로부터 수신하는 USB(Universal Serial Bus)나 LAN(Local Area Network) 등의 통신 인터페이스로 하는 등, 화상 데이터를 취득 가능한 적절한 수단으로 구성할 수 있다.The image data acquisition means may be, for example, an imaging device such as a CCD camera or a CMOS camera, or a USB (Universal Serial Bus) or LAN that receives data of a character string image captured by such an imaging device from the imaging device. It can be configured by appropriate means capable of acquiring image data, such as a communication interface such as a (Local Area Network).

상기 문자 인식 수단은, 예를 들면, 화상 데이터 중의 문자 화상으로부터 특징 데이터를 추출하고 해당 특징. 데이터를 매칭 데이터의 특징 데이터와 매칭하고, 어느 문자인지를 인식하는 수단으로 할 수 있다.The character recognition means extracts feature data from, for example, a character image in the image data, and applies the feature. The data may be matched with the feature data of the matching data and used as a means for recognizing which character.

상기 제 1 인식용 문자는, 예를 들면 영수(英數) 문자, 카테고리 판별용 문자, 또는 이들의 복수(複數) 등, 미리 정한 적절의 문자로 할 수 있다.The first recognition character can be, for example, an appropriate character determined in advance, such as an alphanumeric character, a category determination character, or a plurality thereof.

상기 제 2 인식용 문자는, 예를 들면 히라가나, 가타카나, 한자, 또는 이들의 복수 등, 미리 정한 적절한 문자로 할 수 있다.The said 2nd recognition character can be made into the appropriate appropriate character previously determined, for example, hiragana, katakana, kanji, or plural of these.

상기 문자 인식 장치는, 정보 처리를 실행하는 CPU 등의 정보 처리부와 정보 기억을 행하는 메모리 등의 정보 기억부와 외부 장치에 접속하는 접속단자 등의 인터페이스부를 갖는 반도체 칩 등의 장치로 구성하는, 또는, 촬상 수단과 제어 수단과 기억 수단을 구비한 휴대 전화기나 PDA(Porsonal Digital Assistants)나 퍼스널 컴퓨터 등의 정보 처리 단말로 구성하는 등, 적절한 장치로 구성할 수 있다.The character recognition device is constituted by an apparatus such as a semiconductor chip having an information processing unit such as a CPU for executing information processing and an information storage unit such as a memory for storing information and an interface unit such as a connection terminal for connecting to an external device, or And an information processing terminal such as a cellular phone, PDA (Porsonal Digital Assistants), a personal computer, or the like having an imaging means, a control means and a storage means.

본 발명에 의해, 화상 데이터에 대해 간단한 조작으로 고속의 문자 인식을 실현할 수 있고, 이용자의 만족도를 향상시킬 수 있다.According to the present invention, it is possible to realize high-speed character recognition by simple operation on image data, and to improve user's satisfaction.

본 발명의 양태로서, 상기 문자 인식 수단은, 상기 화상 데이터 내의 문자군의 카테고리를 판별하는 카테고리 판별 처리를 실행하는 구성이고, 상기 제 1 인식용 매칭 데이터는, 상기 카테고리 판별에 사용되는 카테고리 판별용 문자가 포함된 구성으로 할 수 있다.As an aspect of the present invention, the character recognition means is configured to perform a category discrimination process for discriminating a category of a character group in the image data, wherein the first recognition matching data is for category discrimination used for the category discrimination. It may be a configuration that includes characters.

상기 카테고리 판별용 문자는,. 예를 들면 E-Mai1」, 「URL」, 「TEL」, 「FAX」, 「우편번호」, 또는 이들의 복수에 사용되는 문자 등, 카테고리 판별에 사용하는 문자로 구성할 수 있다.The category determination character is,. For example, it can be comprised by the character used for category determination, such as E-Mai1 "," URL "," TEL "," FAX "," Postal code ", or the character used for the plurality of these.

이 양태에 의해, 제 1 문자 인식 처리할 때에 카테고리 판별도 실행하는 것이 가능해진다.This aspect makes it possible to also perform category discrimination in the first character recognition process.

또한 본 발명의 양태로서, 상기 제 1 인식용 매칭 데이터는, 상기 카테고리 판별용 문자 중 2 이상의 부품으로 나누어지는 결합 문자에 대해서는 해당 결합를 요소별로 분리한 부품 문자가 포함된 구성으로 할 수 있다.In addition, as an aspect of the present invention, the first recognition matching data may be configured to include a part letter obtained by dividing the corresponding combination by elements for a combination character divided into two or more parts among the category determination characters.

상기 결합 문자는, 문자열 방향이 좌우 방향인 경우에 편(偏)과 방(旁)으로 이루어지는 문자, 또는, 문자열 방향이 상하 방향인 경우에 관(冠))과 각(脚)으로 이루어지는 문자로 할 수 있다. 구체적으로는, 예를 들면 「話(화)」나 「住(주) 나 「所(소)」 등으로 할 수 있다.The combined character is a character consisting of one piece and a room when the direction of the character string is a left and right direction, or a character consisting of a tube and an angle when the character direction is an up and down direction. can do. Specifically, it can be set as "話", "住", "所", and the like.

상기 부품 문자는, 문자열 방향이 좌우 방향인 경우의 상기 결합 문자의 변(偏) 또는 방(旁)에 해당하는 문자, 또는, 문자열 방향이 상하 방향인 경우의 상기 결합 문자의 관(冠) 또는 각(脚)으로 이루어지는 문자로 할 수가 있다. 구체적으로는, 예를 들면 「言(언)」과 「舌(설)」, 「人(인)」과 「主(주)」, 「戶(호)」와 「斤(근)」 등으로 할 수 있다.The part character is a character corresponding to a side or a room of the combined character when the character string direction is in the left and right direction, or a tube of the combined character when the character string direction is in the up and down direction, or It can be set as a letter consisting of squares. Specifically, for example, "言" and "舌", "人", "Master", "Ho", "Geun", etc. can do.

이로써, 1문자의 결합 문자를 2문자의 부품 문자라고 오인식한 경우에도, 그 오인식한 상태에서 카테고리를 올바르게 판별할 수 있다. 상세히 기술하면, 예를 들면 하나의 결합 문자인 「話(화)」를, 2개의 부품 문자 「言(언)」과 「舌(설)」로서 인식하고, 문자열을 「電言舌(전언설)」로 인식한 경우에도, 「전화(電話)」의 카테고리라고 인식할 수 있다.Thereby, even when the combined character of one character is mistaken as a two-letter part character, the category can be correctly determined in the misrecognized state. In detail, for example, a single combination character "話" is recognized as two component letters "言" and "舌", and the character string is "電 言 舌". Can be recognized as a category of "telephone".

또한 본 발명의 양태로서, 상기 문자 인식 수단은, 상기 카테고리 판별 처리에서 카테고리가 판별된 문자군 내에 해당 카테고리에서 사용되지 않아야 할 오인(誤認) 문자가 포함되어 있는지의 여부를 판별하고, 포함되어 있는 경우에 해당 오인 문자를 카테고리에서 사용되는 문자로 보정하는 보정 처리를 실행하는 구성으로 할 수 있다.In addition, as an aspect of the present invention, the character recognition means determines whether or not a mistaken character that should not be used in the category is included in the character group in which the category is determined in the category determination process, and is included. In this case, a correction process for correcting the mistaken character with the character used in the category can be performed.

이로써, 예를 들면 「전화번호」의 카테고리에서 알파벳의 「Z」로 인식한 문자를 숫자의 「2」로 보정한다는 것을 할 수가 있고, 효율 좋게 인식 정밀도를 높일 수가 있다.Thereby, for example, the character recognized by the letter "Z" in the category of "telephone number" can be corrected by "2" of the number, and the recognition accuracy can be improved efficiently.

또본 발명의 양태로서, 상기 보정 처리는, 상기 오인 문자가 포함되어 있는 경우에, 카테고리에서 사용되는 문자만을 인식 대상으로 하여 재차 문자 인식을 실행함에 의해 보정하는 구성으로 할 수 있다.In addition, as an aspect of the present invention, the correction processing can be configured to correct by again performing character recognition, targeting only the characters used in the category when the mistaken characters are included.

이로써, 매칭 데이터중 카테고리에서 사용되는 문자의 데이터만을 이용하여 문자 인식할 수 있기 때문에, 고속이면서 고정밀도로 문자 인식을 실행할 수 있다.As a result, character recognition can be performed using only the data of the character used in the category among the matching data, so that character recognition can be performed at high speed and with high accuracy.

또한 본 발명의 양태로서, 상기 제 1 문자 인식 처리는, 매칭 신뢰도가 높은 것부터 복수의 문자 후보를 구하여 놓아 가장 매칭 신뢰도가 높은 문자를 채용하는 구성이고, 상기 보정 처리는, 상기 오인 문자가 포함되어 있는 경우에, 해당 오인 문자의 문자 후보 중, 해당 카테고리에 사용되는 문자중에서 가장 매칭 신뢰도가 높은 문자로 보정하는 구성으로 할 수가 있다.Moreover, as an aspect of this invention, the said 1st character recognition process is a structure which employ | adopts the letter with the highest matching reliability by obtaining a several character candidate from the thing with high matching reliability, The said correction process contains the said mistaken character When there is a character, the character candidate of the mistaken character is corrected to the character having the highest matching reliability among the characters used in the category.

이로써, 매칭 데이터에 의한 재차의 문자 인식을 실행하지 않고서 올바른 문자로 보정할 수 있고, 고속이면서 고정밀도로 문자 인식을 완료할 수 있다.Thereby, the correct character can be corrected without executing character recognition again by the matching data, and character recognition can be completed at high speed and with high accuracy.

또한 본 발명은, 미리 정하여진 제 1 인식용 문자에 관한 제 1 인식용 매칭 데이터와, 상기 제 1 인식용 문자 이외의 문자를 포함하고 해당 제 1 인식용 문자보다도 문자수가 많은 제 2 인식용 문자에 관한 제 2 인식용 매칭 데이터를 구별 가능하게 구성된 매칭 데이터를 기억 수단에 기억하여 두고, 화상 데이터 취득 수단에 의해 화상 데이터를 취득하는 화상 데이터 취득 스텝과, 상기 제 1 인식용 매칭 데이터에 의해 상기 화상 데이터에 관해 문자 인식 수단에서 문자 인식을 실행하는 제 1 문자 인식 스텝과, 해당 제 1 문자 인식 처리의 결과가 재인식 조건에 해당하는지의 여부를 상기 문자 인식 수단에서 판별하는 재인식 필요여부 판별 스텝과, 해당 재인식 필요여부 판별 처리에 의해 재인식을 필요로 한다고 판별한 재인식 대상에 대해, 상기 제 2 인식용 매칭 데이터에 의해 상기 문해 인식 수단에서 문자 인식을 실행하는 제 2 문자 인식 스텝을 컴퓨터에 실행시키는 문자 인식 프로그램으로 할 수 있다.The present invention further provides a second recognition character including first recognition matching data relating to a predetermined first recognition character and a character other than the first recognition character and having a larger number of characters than the first recognition character. Image data acquiring step of acquiring image data by means of image data acquiring means, and storing matching data configured to discriminate second matching data for recognition in relation to the storage means; A first character recognition step of performing character recognition in the character recognition means with respect to the image data, a re-recognition necessity determination step of determining in the character recognition means whether or not the result of the first character recognition processing corresponds to a recognition condition; The second recognition on the target of the recognizing which has been determined to require the recognizing by the re-recognition necessity determination processing; The character recognition program which causes a computer to execute a 2nd character recognition step which performs character recognition by said literacy recognition means by the dragon matching data is possible.

상기 문자 인식 프로그램은, CD(Commpact Disc), DVD(Digital Versatile Disk), 플렉시블 디스크, 메모리, 칩, 또는 하드 디스크 등, 적절한 기억 매체에 격납할 수 있다.The character recognition program can be stored in a suitable storage medium such as a CD (Commpact Disc), a DVD (Digital Versatile Disk), a flexible disk, a memory, a chip, or a hard disk.

본 발명에 의해, 컴퓨터에 문자 인식 프로그램을 인스톨하면, 화상 데이터에 대해 간단한 조작으로 고속의 장자 인식을 실현할 수 있다.According to the present invention, when a character recognition program is installed in a computer, it is possible to realize high-speed long-term character recognition with a simple operation on image data.

또한 본 발명은, 미리 정해진 제 1 인식용 문자에 관한 제 1 인식용 매칭 데이터와, 상기 제 1 인식용 문자 이외의 문자를 포함하고 해당 제 1 인식용 문자보다도 문자수가 많은 제 2 인식용 문자에 관한 제 2 인식용 매칭 데이터를 구별 가능하게 구성된 매칭 데이터를 기억 수단에 기억하여 두고, 화상 데이터 취득 수단에 의해 화상 데이터를 취득하는 화상 데이터 취득 스텝과, 상기 제 1 인식용 매칭 데이터에 의해 상기 화상 데이터에 관해 문자 인융 수단에서 문자 인식을 실행하는 제 1 문자 인식 스텝과, 해당 제 1 문자 인식 처리의 결과가 재인식 조건에 해당하는지의 여부를 상기 문자 인식 수단에서 판별하는 재인식 필요여부 판별 스텝과, 해당 재인식 여부 판별 처리에 의해 재인식을 필요로 한다고 판별한 재인식 대상에 대해, 상기 제 2 인식용 매칭 데이터에 의해 상기 문자 인식 수단에서 문자 인식을 실행하는 제 2 문자 인식 스텝을 실행하는 문자 인식 방법으로 할 수 있다.The present invention also relates to a first recognition matching data relating to a predetermined first recognition character and a second recognition character that includes characters other than the first recognition character and has a larger number of characters than the first recognition character. Image data acquiring step of acquiring image data by means of image data acquiring means, storing matching data configured to distinguish the second recognition matching data relating to the image recognition means, and the image using the first recognition matching data. A first character recognition step of performing character recognition in the character fusion means on the data, a re-recognition necessity determination step of determining in the character recognition means whether or not the result of the first character recognition process corresponds to a recognition condition; The second recognizing solvent for the recognizing target determined by the recognizing whether or not the recognizing is required by the recognizing process. By the data may be a character recognition method for executing the second character recognition step of executing the character recognition by the character recognition means.

이로써, 화상 데이터에 대해 간단한 조작으로 고속의 문자 인식을 실행할 수 있다. Thereby, high speed character recognition can be performed with respect to image data by simple operation.

본 발명에 의해, 촬영된 명함 화상 등의 화상 데이터에 대해, 간단한 조작으로 고속의 문자 인식을 실현하는 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법을 제공하고, 이용자의 만족도를 향상시킬 수 있다.According to the present invention, it is possible to provide a character recognition device, a character recognition program, and a character recognition method for realizing high-speed character recognition with a simple operation on image data such as a photographed business card image, thereby improving user satisfaction. .

도 1은 휴대 단말의 사시도.
도 2는 휴대 단말의 구성을 도시하는 블록도.
도 3은 사전 데이터의 구성을 설명하는 설명도,
도 4는 문자 인식 프로그램에 의한 문자 인식 처리의 플로우 차트.
도 5는 문자 인식하는 촬영 화상이나 인식 문자의 설명도.
1 is a perspective view of a mobile terminal.
2 is a block diagram showing a configuration of a mobile terminal.
3 is an explanatory diagram for explaining a configuration of dictionary data;
4 is a flowchart of character recognition processing by a character recognition program.
5 is an explanatory diagram of a photographed image and a recognized character for character recognition;

본 발명의 한 실시 형태를 이하 도면과 함께 설명한다.One embodiment of this invention is described with drawing below.

[실시예][Example]

도 1은, 휴대 단말(1)의 사시도를 도시하고, 도 2는, 휴대 단말(1)의 구성의 블록도를 도시하고, 도 3은 사전(辭典) 데이터의 구성도를 도시한다.FIG. 1: shows the perspective view of the portable terminal 1, FIG. 2 shows the block diagram of the structure of the portable terminal 1, and FIG. 3 shows the block diagram of prior data.

휴대 단말(1)은, 도 1에 도시하는 바와 같이, 화상 입력부(3), 조작부(5), 및 화면 표시부(7)가 마련되어 있다. 화상 입력부(3)는, 화상을 촬상하는 디지털 카메라이고, 조작부(5)는, 압하 조작되는 버튼이고, 화면 표시부(7)는, 화상을 표시하는 액정 디스플레이 또는 유기 EL 디스플레이이다.As shown in FIG. 1, the portable terminal 1 is provided with an image input unit 3, an operation unit 5, and a screen display unit 7. The image input unit 3 is a digital camera for capturing an image, the operation unit 5 is a button to be pressed, and the screen display unit 7 is a liquid crystal display or an organic EL display that displays an image.

도 2에 도시하는 바와 같이, 휴대 단말(1)은, 화상 입력부(3), 조작부(5), 및 화면 표시부(7)에 더하여, CPU(11), R0M(12), 및 RAM(13)이, 버스(16)에 접속하여 마련되어 있다.As shown in FIG. 2, the portable terminal 1 includes, in addition to the image input unit 3, the operation unit 5, and the screen display unit 7, a CPU 11, a R0M 12, and a RAM 13. This is connected to the bus 16 and provided.

화상 입력부(3)는, CCD 카메라 또는 CMOS 카메라 등의 디지털 카메라이고, 버스(16)에 접속되어 있다. 화상 입력부(3)가 촬상하여 얻은 촬상 화상은, 디지털 화상 데이터로서 CPU(11)에 송신된다. 이 디지털 화상 데이터는, 최종적으로 별도의 기억 장치(불휘발성 메모리 등)에 기억하여도 좋다. 또한, 화상 입력부(3)는, CPU(11)로부터 촬상 신호를 받아 촬상을 시작한다.The image input unit 3 is a digital camera such as a CCD camera or a CMOS camera and is connected to the bus 16. The picked-up image obtained by picking up the image input part 3 is transmitted to CPU11 as digital image data. This digital image data may be finally stored in a separate storage device (nonvolatile memory or the like). In addition, the image input unit 3 receives an imaging signal from the CPU 11 and starts imaging.

조작부(5)는, 버스(16)에 접속되어 있다. 이 조작부(5)는, 이용자에 의해 압하 조작된 압하 신호를, 버스(16)를 통하여 CPU(11)에 송신한다.The operation unit 5 is connected to the bus 16. This operation part 5 transmits the pressure reduction signal operated by the user to the CPU 11 via the bus 16.

화면 표시부(7)는, 조작 화면을 표시하는 조작 화면 표시부(7a)로서의 기능과, 문자 인식한 인식 결과를 표시하는 인식 결과 표시부(7b)로서의 기능을 갖고 있다, 이 조작 화면 표시부(7)는, 버스(16)에 접속되어 있다. CPU(11)로부터 화상 데이터가 보내 오면, 이 화상 데이터의 화상을 조작 화면 표시부(7a) 또는 인식 결과 표시부(7b)에 표시한다,The screen display unit 7 has a function as an operation screen display unit 7a for displaying an operation screen and a function as a recognition result display unit 7b for displaying character recognition recognition results. Is connected to the bus 16. When image data is sent from the CPU 11, an image of this image data is displayed on the operation screen display unit 7a or the recognition result display unit 7b.

CPU(11)는, R0M(12)에 기억된 프로그램에 따라 RAM(13)을 일시 기억 영역으로 사용하여 각종 동작을 행하는 프로세서이고, 각 부분을 제어하는 제어 기능(21)과, 문자 인식 기능(22)을 갖고 있다,The CPU 11 is a processor that performs various operations by using the RAM 13 as a temporary storage area according to a program stored in the R0M 12, a control function 21 for controlling each part, and a character recognition function ( 22)

이 문자 인식 기능(22)은, 문자열 추출 처리부(31), 문자 추출 처리부(32), 문자 인식 처리부(33), 인식 신뢰도 판정 처리부(34), 카테고리 판별 처리부(35), 및 인식 결과 보정 처리부(36)를 갖고 있다.The character recognition function 22 includes a character string extraction processor 31, a character extraction processor 32, a character recognition processor 33, a recognition reliability determination processor 34, a category determination processor 35, and a recognition result correction processor. Has 36.

문자열 추출 처리부(31)는, 화상 데이터로부터 문자열을 추출하는 처리를 실행한다. 이 문자열의 추출은, 예를 들면 화상 데이터를 2치화하여 사영 데이터를 취득하고, 이 사영 데이터로부터 문자열과 여백을 구별하는 등, 적절한 방법에 의해 실행한다. 구체적으로는, 예를 들면 명함 등의 가로쓰기 문자에 대해 화소행 별(別)의 흑화소수로부터 상하 방향의 히스토그램을 산출하고, 소정수 이상의 흑화소의 행이 연속하여 있는 범위를 문자열로 하는, 또는 엽서의 수신인 등의 세로쓰기 문자에 대해 화소열 별의 흑화소수로부터 좌우 방향의 히스토그램을 산출하고, 소정수 이상의 흑화소의 열이 연속하여 있는 범위를 문자열로 하는 등, 적절한 방법에 의해 실행한다.The character string extraction processing unit 31 performs a process of extracting a character string from the image data. Extraction of the character string is performed by an appropriate method, for example, by binarizing image data to obtain projective data, and distinguishing the character string from the margin from the projective data. Specifically, for example, a histogram in the vertical direction is calculated from a black pixel number for each pixel row for horizontal writing characters such as a business card and the like, and a range in which a predetermined number or more of black pixel rows are contiguous is used as a character string, or A histogram in the left and right directions is calculated from the black pixel number of each pixel column for the vertical writing characters such as the recipients of the postcard, and the execution is performed by an appropriate method such as setting the range in which the columns of the predetermined number or more of black pixels are continuous.

문자 추출 처리부(32)는, 상기 문자열로부터 문자를 추출하는 처리를 실행한다. 이 문자의 추출은, 가로쓰기 문자에 대해 화소열 별의 흑화소수로부터 좌우 방향의 히스토그램을 산출하고, 소정수 이상의 흑화소가 연속하고 있는 범위를 1문자로 하는, 또는 세로쓰기 문자에 대해 화소행 별의 흑화소수로부터 상하 방향의 히스토그램을 산출하고, 소정수 이상의 흑화소가 연속하고 있는 범위를 1문자로 하는 등, 적절한 방법에 의해 실행한다.The character extraction processing part 32 performs the process of extracting a character from the said string. This character extraction calculates a histogram in the left and right directions from the black pixel number of each pixel column with respect to the horizontal writing character, and sets the range in which the predetermined number or more of the black pixels are contiguous to one character or the pixel row for the vertical writing character. A histogram in the vertical direction is calculated from the number of black pixels of a star, and the execution is performed by an appropriate method, such as setting a range in which a predetermined number of black pixels are continuous to one character.

문자 인식 처리부(33)는, 매칭용 사전 데이터(24)의 매칭 정보를 이용하여 어느 문자의 매칭 정보와 일치 또는 근사하는지 판별함으로써 문자를 인식하는 처리와 함께, 매칭 신뢰도를 구하는 처리를 실행한다. 이 문자를 인식하는 처리에는, 영수자(英數字)를 중심으로 하는 특정 문자만을 고속으로 인식하는 특정 문자 인식 처리와, 모든 문자를 인식하는 전(全)문자 인식 처리가 있다.The character recognition processing unit 33 executes a process of recognizing a character and a process of obtaining matching reliability by determining which character matches or approximates matching information using matching information of the matching dictionary data 24. The processing for recognizing these characters includes a specific character recognition process for recognizing only a specific character centered on an alphanumeric character at high speed, and an all-character recognition process for recognizing all characters.

인식 신뢰도 판정 처리부(34)는, 문자 인식 처리부(33)에서 구한 매칭 신뢰도(인식 신뢰도)가 소정의 임계치를 초과하고 있는지의 여부를 판정하는 처리를 실행한다.The recognition reliability determination processing unit 34 executes a process of determining whether or not the matching reliability (recognition reliability) obtained by the character recognition processing unit 33 exceeds a predetermined threshold.

카테고리 판별 처리부(35)는, 카테고리 판별용 사전 데이터(25)를 이용하여 문자열이 어느 카테고리에 속하는지를 판별하는 처리를 실행한다.The category determination processing unit 35 executes a process of determining which category the character string belongs to using the category determination dictionary data 25.

인식 결과 보정 처리부(36)는, 문자열중에 그 카테고리에서 사용되지 않는 문자가 있으면, 이 문자를 카테고리 내에서 사용되는 문자로 보정하는 처리를 실행한다.If there is a character in the character string that is not used in the category, the recognition result correction processing unit 36 executes a process of correcting this character to the character used in the category.

R0M(12)은, 문자 인식 프로그램(23), 매칭용 사전 데이터(24), 및 카테고리 판별용 사전 데이터(25)를 기억하고 있다.The R0M 12 stores the character recognition program 23, the matching dictionary data 24, and the category determination dictionary data 25.

매칭용 사전 데이터(24)는, 도 3(A)에 도시하는 바와 같이, 문자 코드, 매칭 정보, 및 대상 카테고리에 의해 구성되어 있다.As shown in Fig. 3A, the matching dictionary data 24 is composed of a character code, matching information, and a target category.

문자 코드는, 예를 들면 Shift-JIS 등의 적절한 방식의 문자 코드이다.The character code is, for example, a character code of an appropriate method such as Shift-JIS.

매칭 정보는, 문자의 특징 데이터를 문자별로 기억하고 있다.The matching information stores character data of characters for each character.

대상 카테고리는, 하나의 문자에 대해 복수 종류 등록되어 있다. 구체적으로는, 대상 카테고리로서 「E-Mai1」, 「URL」, 「TEL」, 「FAX」, 「우편번호」 등이 등록되어 있다.A plurality of types of target categories are registered for one character. Specifically, "E-Mai1", "URL", "TEL", "FAX", "postal code", etc. are registered as a target category.

이 매칭용 사전 데이터(24)에 기억되어 있는 데이터는, 제 1 인식용 영수 문자부(24a), 제 1 인식용 카테고리 문자부(24b), 및 제 2 인식용 문자부(24c)로 구별 가능하게 기억되어 있다.The data stored in the matching dictionary data 24 can be distinguished by the first recognition alphanumeric character portion 24a, the first recognition category character portion 24b, and the second recognition character portion 24c. Is remembered.

제 1 인식용 영수 문자부(24a)는, 주로 영어, 숫자, 기호 등의 구미계 문자로 구성되어 있다.The first recognition alphanumeric character part 24a mainly consists of Western characters such as English, numbers, and symbols.

제 1 인식용 카테고리 문자부(24b)는, 카테고리의 식별에 사용되는 문자, 즉, 매칭용 사전 데이터(24)의 대상 카테고리로서 등록된 「E-Mai1」, 「URL」, 「TEL」, 「FAX」, 「우편번호」의 어느 하나에서 사용되는 문자로 구성되어 있다.The first recognition category character part 24b is a character used for identification of a category, that is, "E-Mai1", "URL", "TEL", "registered as a target category of the matching dictionary data 24". It consists of characters used in either of "FAX" and "Zip code".

구체적으로는, 대상 카테고리인 것을 나타내는 키 코드가 되는 「メ(메)」, 「-」, 「ル(루)」, 「ホ(호)」, 「ム(무)」, 「ぺ(페)」, 「ジ(지)」, 「電(전)」, 「話(화)」, 「フ(후)」, 「ァ(아)」, 「ッ(추)」, 「ク(쿠)」, 「ス(스)」, 「郵(우)」, 「便(편)」, 「番(번)」, 「ホ(호)」 등의 문자가 포함되어 있다. 또한, 이 문자중 「話(화)」, 「便(편)」 등의 결합 문자에 관해서는, 그 부품으로 되는 변(便)이나 방(旁)을 1문자로 한 「言(언)」, 「舌(설)」, 「人(인)」, 「更(갱)」 등의 부품 문자도 포함되어 있다.Specifically, "メ (me)", "-", "ル (ru)", "ホ (ho)", "mu (no)", and "ぺ (pe) which become a key code indicating that it is a target category. ``, `` Ji '', `` 電 (pre) '', `` (Tue) '', `` (f) '', `` (a) '', `` (chu) '', `` (ku) '' , Characters such as "s", "郵", "便", "番" and "번" are included. In addition, regarding the combined characters such as `` Japanese '' and `` Japanese '' among these characters, `` language '' using a side and a room of the part as one character , Parts characters such as 설, 人, 갱, and gang are also included.

또한, 결합 문자를 분리한 부품 문자는, 적어도 인식하고 싶은 문자열 방향으로 부품 문자가 나열하여 있는 결합 문자로 하는 것이 바람직하다. 이 문자열 방향은, 문자가 종방향으로 나열하여 있으면 종방향, 문자가 횡방향으로 나열하여 있으면 횡방향이라고 하는 등, 문자가 나열하여 있는 적절한 방향으로 할 수 있다.In addition, it is preferable to make the part letter which isolate | separated the combined letter into the combined letter by which the part letter is arranged at least in the direction of the character string to be recognized. This character string direction can be made into the appropriate direction in which the characters are arranged, such as the longitudinal direction if the characters are arranged in the longitudinal direction, and the transverse direction if the characters are arranged in the horizontal direction.

제 2 인식용 문자부(24c)는, 제 1 인식용 영수 문자부(24a)와 제 1 인식용 카테고리 문자부(24b)의 어느 것에도 들어가지 않는 문자(주로 일본어문자)로 구성되어 있다.The 2nd recognition character part 24c is comprised from the character (mainly Japanese character) which does not enter in either of the 1st recognition alphanumeric part 24a and the 1st recognition category character part 24b.

또한, 이 제 2 인식용 문자부(24c)는, 제 1 인식용 카테고리 문자부(24b)를 포함하지 않는 구성으로 하고 있지만, 제 2 인식용 문자부(24c)의 일부를 제 1 식재용 카테고리 문자부(24b)로 하는 구성으로 하여도 좋다.In addition, although this 2nd recognition character part 24c is set as the structure which does not contain the 1st recognition category character part 24b, a part of 2nd recognition character part 24c is used for a 1st planting category It is good also as a structure made into the character part 24b.

카테고리 판별용 사전 데이터(25)는, 도 3(B)에 도시하는 바와 같이, 카테고리별의 복수 파일에 의해 구성되어 있고, 각 파일에는, 그 카테고리로서 판별하는 문자열이 기억되어 있다. 문자열에는, 「電話(전화)」와 「電言舌(전언설)」을 등록하는 등, 결합 문자를 부품 문자로 한 문자열도 기억되어 있다. 또한, 카테고리 판별용 사전 데이터(25)에 기억하는 문자열은, 문자 코드의 나열로 하여도 좋다.As shown in Fig. 3B, the category determination dictionary data 25 is composed of a plurality of files for each category, and a character string for discriminating as a category is stored in each file. In the character string, a character string containing a combination character as a part character, such as "telephone" and "electron word", is also stored. The character string stored in the category determination dictionary data 25 may be a sequence of character codes.

RAM(13)은, CPU(11)가 각종 제어나 연산에 사용하는 데이터를 일시 기억함과 함께, 화상 메모리(14)에 문장열 화상 등의 화상을 기억한다.The RAM 13 temporarily stores data used by the CPU 11 for various controls and calculations, and stores images such as sentence string images in the image memory 14.

또한, 휴대 단말(1)에는, 무선 통신을 행하는 통신 안테나, 음성 출력을 행하는 스피커, 및 집음(集音)을 행하는 마이크로폰 등도 마련되어 있다. 이로써, 휴대 전화기로서 이용할 수 있도록 구성되어 있다.The portable terminal 1 is also provided with a communication antenna for wireless communication, a speaker for audio output, a microphone for sound collection, and the like. Thereby, it is comprised so that it can be used as a portable telephone.

또한, 도 2에 가상선으로 도시하는 바와 같이, CPU(11)과 R0M(12)은, 하나의 칩(15)에 탑재하여 전자 부품으로서 구성하여도 좋다. 이 경우, 칩(15)를 휴대 단말(1)에 구비하면, 간단하게 문자 인식 기능을 추가할 수 있다.In addition, as shown by a virtual line in FIG. 2, CPU11 and R0M12 may be mounted in one chip 15, and may be comprised as an electronic component. In this case, if the chip 15 is provided in the portable terminal 1, the character recognition function can be added easily.

도 4는, 휴대 단말(1)의 CPU(11)가 문자 인식 프로그램(23)에 따라 실행하는 문자 인식 처리의 플로우 차트이고, 도 5는 문자 인식한 촬영 화상이나 인식 문자의 설명도이다.FIG. 4 is a flowchart of character recognition processing executed by the CPU 11 of the portable terminal 1 in accordance with the character recognition program 23. FIG. 5 is an explanatory diagram of a photographed image and a recognized character that have been character recognized.

우선 사전 준비로서, CPU(11)는, 이용자의 조작 입력에 응하여 명함 판독 모드 등의 문자 인식 처리가 선택되면, 화상 입력부(3)에 의해 화상 촬영이 가능한 상태로 하고, 화면 표시부(7)에 도 5(A)에 도시하는 조작 화면 표시부(7a)를 표시한다.First, as a preliminary preparation, when the character recognition processing such as a business card reading mode is selected in response to a user's operation input, the CPU 11 makes a state in which the image can be photographed by the image input unit 3, and the screen display unit 7 The operation screen display unit 7a shown in Fig. 5A is displayed.

이 조작 화면 표시부(7a)에는, 문자 인식을 행하는 화면인 것을 나타내는 인식 화면 표시부(71), 화상 입력부(3)(카메라)에 의해 촬영하고 있는 프레뷰 화상을 동화 표시하는 프레뷰 화상 표시부(72), 앞(前)화면으로 되돌리기 위한 되돌림 버튼(73), 인식 처리를 시작하기 위한 인식 버튼(74), 및 서브메뉴를 표시하기 위한 서브메뉴 버튼(75)가 마련되어 있다.The operation screen display unit 7a includes a recognition screen display unit 71 indicating that the screen is a character recognition screen, and a preview image display unit 72 for displaying a preview image captured by the image input unit 3 (camera). ), A return button 73 for returning to the previous screen, a recognition button 74 for starting the recognition process, and a submenu button 75 for displaying a submenu.

이용자에게 인식 버튼(74)이 선택되면, CPU(11)는, 화상 입력부(3)에 의한 화상 촬영을 실행하여 문자 화상을 취득한다(스텝 S1).When the recognition button 74 is selected by the user, the CPU 11 executes image capturing by the image input unit 3 to obtain a character image (step S1).

CPU(11)는, 문자열 추출 처리부(31)에 의한 문자열 추출 처리를 실행하고, 문자 화상으로부터 문자열을 추출한다(스텝 52). 이 때, 회사명 표시 부분의 문자열, 성명 표시 부분의 문자열, 주소 표시 부분의 문자열 등, 복수의 문자열을 취득한다.The CPU 11 executes a character string extraction process by the character string extraction processing unit 31 to extract a character string from the character image (step 52). At this time, a plurality of character strings such as a character string of the company name display portion, a character string of the name display portion, and a character string of the address display portion are obtained.

CPU(11)는, 변수 「i」에 「0」을 대입하여 초기화하고(스텝 S3), i번째의 추출 문자열에 관해, 문자 인식 처리부(33)에 의해 제 1 문자 인식 처리를 실행한다(스텝 S4). 이 제 1 문자 인식 처리에서는, 문자 추출 처리부(32)에 의해 문자열로부터 추출한 각 문자에 관해, 매친용 사전 데이터(24)중 제 1 인식용 영수 문자부(24a)와 제 1 인식용 카테고리 문자부(24b)만을 이용하여 문자 인식을 실행한다.The CPU 11 initializes by assigning "0" to the variable "i" (step S3), and executes the first character recognition process by the character recognition processing unit 33 on the i-th extracted character string (step) S4). In this first character recognition processing, the first recognition alphanumeric character part 24a and the first recognition category character part of the matching dictionary data 24 are used for each character extracted from the character string by the character extraction processing part 32. Character recognition is performed using only 24b.

또한, 문자 추출 처리부(32)에 의한 문자 추출은, 문자와 문자의 경계를 추출하는 처리에 상당한다. 예를 들면, 문자열 화상에 관해, 문자 부분이 흑(黑)이 되도록 2치화되고, 문자열에 수직 방향으로 흑화소가 사영되고, 그 사영 데이터의 잘린 곳을 문자와 문자의 경계의 후보로 한다.In addition, the character extraction by the character extraction processing part 32 is corresponded to the process which extracts the boundary of a character and a character. For example, with respect to a character string image, the character portion is binarized so that the character portion is black, the black pixel is projected in the direction perpendicular to the character string, and the cutout of the projected data is used as a candidate for the boundary between the character and the character.

제 1 인식용 영수 문자부(24a)은, 영수문자를 중심으로 하여 구성되어 있고, 제 1 인식용 카테고리 문자부(24b)는 카테고리 판별에 사용되는 문자를 중심으로 구성되어 있기 때문에, 매칭용 사전 데이터(24)의 전(全) 문자수에 비하여 매우 양이 적다. 이 때문에, 제 1 문자 인식 처리는, 후에 설명하는 제 2 문자 인식 처리보다도 매우 고속으로 완료한다.Since the first recognition alphanumeric character portion 24a is composed mainly of alphanumeric characters, and the first recognition category character portion 24b is composed mainly of characters used for category determination, a matching dictionary The amount is very small compared to the total number of characters of the data 24. For this reason, the first character recognition process is completed at a much higher speed than the second character recognition process described later.

CPU(11)는, 인식 신뢰도 판정 처리부(34)에 의해 제 1 인식 처리에서의 매칭 신뢰도의 판정을 행한다(스텝 S5). 여기서 매칭 신뢰도의 판정은, 예를 들면 문자 단위의 매칭 신뢰리를 확인하고, 매칭 신뢰도가 가장 낮은 문자에 관해, 그 매칭 신뢰도가 재인식 조건으로서의 소정의 임계치 이상이면 문자열의 매칭 신뢰도를 0K로 하고, 그렇지 않으면 NG로 할 수 있다. 그 밖에도, 문자열 내의 각 문자의 매칭 신뢰도의 평균치를 구하교, 이 평균치가 소정의 재인식 조건으로서의 임계치 이상이면 문자열의 매칭 신뢰도를 0K로 하고, 그렇지 않으면 NG로 할 수도 있다.The CPU 11 determines the matching reliability in the first recognition processing by the recognition reliability determination processing unit 34 (step S5). Here, the determination of the matching reliability checks, for example, the matching reliability in character units, and when the matching reliability is lower than a predetermined threshold as a recognition condition with respect to the character with the lowest matching reliability, the matching reliability of the character string is 0K, Otherwise, it can be NG. In addition, the average value of the matching reliability of each character in the character string is calculated, and if the average value is equal to or greater than a threshold value as a predetermined recognition condition, the matching reliability of the character string may be 0K, otherwise, NG may be set.

또한, 이 매칭 신뢰도의 판정할 때, 각 문자에 관해, 복수의 문자 후보를 매칭 신뢰도가 높은 순서로 소정 개수 기억하여 두어도 좋다.In determining the matching reliability, a predetermined number of character candidates may be stored for each character in the order of high matching reliability.

CPU(11)는, 매칭 신뢰도의 판정이 0K이면(스텝 S6 : Yes), 스텝 S8로 처리를 진행한다.If the determination of the matching reliability is 0K (step S6: Yes), the CPU 11 proceeds to step S8.

매칭 신뢰도의 판정이 NG이면(스텝 S6 : No), CPU(11)는, i번째의 추출 문자열에 관해, 문자 인식 처리부(33)에 의해 제 2 문자 인식 처리를 실행한다(스텝 S7). 이 제 2 문자 인식 처리에서는, 매칭용 사전 데이터(24)의 모든 데이터를 이용하여 문자 인식을 실행한다.If the determination of the matching reliability is NG (step S6: No), the CPU 11 executes the second character recognition process by the character recognition processing unit 33 on the i-th extracted character string (step S7). In this second character recognition process, character recognition is performed using all the data of the matching dictionary data 24.

또한, 제 2 인식용 문자부(24c)만에 의한 문자 인식을 행하고, 제 1 문자 인식 처리에서의 매칭 신뢰도도 포함하여 가장 매칭 신뢰도가 높은 문자를 인식한 문자로 하는 구성으로 하여도 좋다.It is also possible to perform character recognition only by the second recognition character portion 24c, and to configure a character that recognizes the character with the highest matching reliability including the matching reliability in the first character recognition process.

또한, 이 제 2 문자 인식 처리에서는, 문자열로부터 문자를 추출할 때에, 결합 문자를 복수의 부품 문자로 오인식하지 않도록, 문자의 경계 후보를 검토하고, 제 1 문자 인식 처리보다도 1문자를 정밀도 좋게 잘라내는 구성으로 하여도 좋다. 이 경우, 1문자의 문자 길이를 인식하고, 해당 문자 길이 단위로 경계를 인식하면 좋다. 이 문자 길이는, 문자열 방향의 1문자의 길이를 가리키고, 예를 들면 1문자에 있어서의 문자열 방향의 화소수라고 할 수가 있다. 이로써, 문자의 인식 정밀도를 더욱 향상할 수 있다.In this second character recognition process, when extracting a character from a character string, the boundary candidates of the characters are examined so that the combined character is not misrecognized as a plurality of part characters, and one character is cut out more accurately than the first character recognition process. May be configured. In this case, the character length of one character may be recognized, and the boundary may be recognized in units of the corresponding character length. This character length indicates the length of one character in the character string direction and can be said to be, for example, the number of pixels in the character string direction in one character. Thereby, the recognition precision of a character can be improved further.

CPU(11)는, 변수 「i」에 1을 가산하고(스텝 S8), 「i」가 추출 문자열수에 달할 때까지(스텝 S9 : Yes), 스텝 S4로 처리를 되돌려서 반복한다.The CPU 11 adds 1 to the variable "i" (step S8), and repeats the process to step S4 until "i" reaches the number of extracted character strings (step S9: Yes).

「i」가 추출 문자열수에 달하면(스텝 S9 : N0), CPU(11)는, 변수 「i」에 「0」을 대입하여 초기화하고(스텝 S10), i번째의 추출 문자열에 관해 카테고리 판별 처리부(35)에 의해 카테고리 판별 처리를 실행한다(스텝 S11).When "i" reaches the number of extracted strings (step S9: N0), the CPU 11 initializes by assigning "0" to the variable "i" (step S10), and the category discrimination processing unit about the i-th extracted string. (35), category determination processing is executed (step S11).

이 카테고리 판별 처리는, 스텝 S4, S7에서 인식한 문자의 나열이, 카테고리 판별용 사전 데이터(25)에 기억되어 있는 각 카테고리의 문자의 나열과 일치하는지 판별함에 의해 실행한다. 일치하면(매칭 신뢰도가 소정의 임계치보다 높으면), 그 카테고리라고 판별한다.This category determination processing is performed by determining whether the sequence of characters recognized in steps S4 and S7 matches the sequence of characters of each category stored in the category determination dictionary data 25. If they match (when matching reliability is higher than a predetermined threshold), it is determined as that category.

CPU(11)는, 인식 결과 보정 처리부(36)에 의해 인식 결과 보정 처리를 실행한다(스텝 S12). 이 인식 결과 보정 처리는, i번째의 추출 문자열에, 스텝 S11에서 판별한 카테고리에서 사용되지 않는 문자가 포함되어 있지 않은지 판별하고, 포함되어 있으면 보정한다.The CPU 11 performs the recognition result correction processing by the recognition result correction processing unit 36 (step S12). This recognition result correction process determines whether the i-th extraction character string does not contain the characters not used in the category determined in step S11, and corrects if it contains.

이 보정을 행하는 인식 결과 보정 처리부(36)은, 스텝 S5 삶고 기억하고 있던 복수의 문자 후보의 매칭 신액도를 기초로, 그 카테고리에서 사용되는 문자로 가장 매칭 신뢰도가 높은 문자로 보정한다. 그 카테고리에서 사용되는 문자로 매칭 신뢰도가 높은 문자가 없으면, 그 카테고리에서 사용되는 문자만을 대상으로 하여 재차 문자 인식 처리를 행하고, 인식한 문자로 보정한다.The recognition result correction processing unit 36 that performs this correction corrects the characters used in the category with the characters having the highest matching reliability, based on the matching new amount of the plurality of character candidates stored in step S5. If there is no character with high matching reliability in the character used in the category, character recognition processing is performed again for only the character used in the category, and the character is corrected.

또한, 이 보정은, 매칭용 사전 데이터(24)중 그 카테고리의 문자만을 사용하여 재차 문자 인식 처리를 실행하는 등, 적절한 방법에 의해 실행하면 좋다.In addition, this correction | amendment may be performed by a suitable method, such as performing character recognition process again using only the character of the category among the matching dictionary data 24. FIG.

CPU(11)는, 변수 「i」에 1을 가산하고(스텝 S13), 「i」가 추출 문자열수에 달할 때까지(스텝 S14 : Yes), 스텝 S11로 처리를 되돌려서 반복한다. 「i」가 추출 문자열수에 달하면(스텝 S14 : N0), CPU(11)는, 도 5(B)에 도시하는 인식 결과 표시부(7b)를 화면 표시부 7에 표시하고 처리를 종료한다.The CPU 11 adds 1 to the variable "i" (step S13), and repeats the process to step S11 until "i" reaches the number of extracted character strings (step S14: Yes). When "i" reaches the number of extracted character strings (step S14: NO), the CPU 11 displays the recognition result display unit 7b shown in Fig. 5B on the screen display unit 7 and ends the processing.

이 문자 인식 처리에 의해, 도 5에 도시한 예이라면, 다음과 같이 처리된다.By this character recognition process, if it is the example shown in FIG. 5, it processes as follows.

우선, 문자열 추출 처리(스텝 S2)에 의해, 도 5(B)에 도시하는 바와 같이, (1) 내지 (9)의 각 문자열이 인식된다.First, each character string of (1)-(9) is recognized by character string extraction process (step S2), as shown to FIG. 5 (B).

이 (1) 내지 (9)의 각 문자열에 대해 순번대로 제 1 문자 인식 처리(스텝 S4)를 실행함으로써, 제 1 인식용 영기문자부(24a)와 제 1 인식용 카테고리 문자부(24b)에서 문자 인식할 수 있는 카테고리의 문자 인식을 할 수 있다. 즉, (4)의 우편번호, (6)의 전화 번호, (7)의 FAX, (8)의 E-mai1, 및 (9)의 URL를 인식할 수 있다.By executing the first character recognition processing (step S4) in this order for each character string of (1) to (9), the character is recognized in the first character recognition character portion 24a and the first character category character portion 24b. Character recognition of recognizable categories can be performed. That is, the postal code of (4), the telephone number of (6), the FAX of (7), the E-mai1 of (8), and the URL of (9) can be recognized.

이 때, 제 1 인식용 카테고리 문자부(24b)에는, 결합 문자를 부품으로 분리한 부품 문자도 등록하고 있기 때문에, 도 5(C)에 도시하는 바와 같이, 정함 문자 「話(화)」를 「言(언)」과 「舌(설)」로 분리하여 문자를 잘라내고 있던 경우에도, 그대로 「言(언)」과 「舌(설)」로서 인식한다.At this time, since the part letters obtained by separating the combined characters into parts are also registered in the first character category 24b for recognition, as shown in Fig. 5C, the definite characters "話 (hwa)" Even when characters are separated by "言" and "舌", they are recognized as "言" and "舌".

도 5(B)의 (1) (2) (3) (5)는 매칭 신뢰도가 낮기 때문에, 제 2 문자 인식 처리(스텝 S7)를 실행하여 모든 문자를 사용한 문자 인식을 행한다. 이로써, 도 5(B)의 (1) (2) (3) (5)에관해서도 문자 인식을 할 수 있다,Since (1) (2) (3) and (5) of FIG. 5B have low matching reliability, the second character recognition process (step S7) is executed to perform character recognition using all characters. Thereby, the character recognition can be performed also with respect to (1) (2) (3) (5) of FIG.

그 후, 카테고리 판별 처리(스텝 S11)에 의해, 각 문자열의 카테고리를 판별할 수 있다. 이 카테고리 판별시에, 「電話(전화)」와 같이 결합 문자가 포함되는 카테고리는, 「電言舌(전언설)」과 같이 결합 문자를 부품 문자로 한 문자열도 카테고리 판별용 사전 데이터(25)에 등록되어 있기 때문에, 올바른 카테고리를 정밀도 좋게 용이하게 인식할 수 있다.Thereafter, the category of each character string can be determined by the category discrimination process (step S11). At the time of this category discrimination, the category in which the combined character is included, such as "電話 (telephone)", is also a character string containing the combined character as a part character, as in "電 言 舌". Since it is registered in, the correct category can be easily recognized with high accuracy.

즉, 가령 결합 문자를 정확하게 인식하려고 하면, 문자 추출할 때에 2문자로 하여 버리지 않기 위해 문자의 경계 후보를 검토하는 처리가 필요하게 되어 계산량이 많아진다. 그러나, 이와 같은 처리를 하지 않아도, 2문자로 하여 그대로 인식하여 카테고리를 판별하기 때문에, 문자의 경계가 대충 정해지고, 그만큼 고속으로 처리할 수 있다. 이 경계 처리의 시간 삭감량은, 결합 문자를 부품 문자의 모임이라고 인식하기 위한 비교 대상의 증가에 의한 시간 증가량보다 훨씬 크기 때문에, 전체의 처리 시간을 단축할 수 있다.That is, for example, if the combined character is to be correctly recognized, a process of examining the boundary candidates of the characters is required in order to avoid making them into two characters when extracting the characters, resulting in a large amount of calculation. However, even if such processing is not carried out, since two letters are recognized as they are and categories are determined, the boundary of the letters is roughly determined, and the processing can be performed at such a high speed. Since the time reduction amount of this boundary process is much larger than the time increase amount by the increase of the comparison target for recognizing the combined characters as a collection of parts characters, the overall processing time can be shortened.

또한, 인식 결과 보정 처리(스텝 S12)에 의해, 판별한 카테고리의 문자열에 대해, 그 카테고리에서 사용되지 않는 문자를 배제한 인식으로 보정하기 때문에, 정밀도가 좋은 문자 인식을 할 수 있다.In addition, the recognition result correction process (step S12) corrects the character string of the determined category by the recognition excluding the character not used in the category, so that character recognition with high precision can be performed.

구체적으로는, 예를 들면, 도 5(B)의 (6)의 「電話(전화) ; (075) 1234-5678」는, 카테고리가 「TEL」의 문자열이다. 이것을, 제 1 문자 인식 처리에 「電話(전화) : (075)1Z34-5678」로 오인식한 경우, 「Z」는 카테고리 「TEL」에서는 사용되는 일가 없는 문자이기 때문에, 이에 대해 보정 처리를 행하고, 카테고리 「TEL」에서 사용되는 「2」로 보정한다. 이로서 인식 정밀도를 향상함과 함께, 유저가 위화감을 느끼는 인식 결과의 출력을 억제할 수 있다.Specifically, for example, the "telephone (telephone)" of (6) of FIG. (075) 1234-5678 "is a character string whose category is" TEL. " When this is misidentified as "電話: (075) 1Z34-5678" in the first character recognition processing, since "Z" is a character that is not used in the category "TEL", correction processing is performed on this. Correction is made to "2" used in the category "TEL". As a result, the accuracy of the recognition can be improved, and the output of the recognition result in which the user feels discomfort can be suppressed.

이상의 구성 및 동작에 의해, 화상 데이터에 대해 간단한 조작으로 고속의 문자 인식을 실현할 수 있고, 이용자의 만족도를 향상시킬 수 있다.By the above configuration and operation, it is possible to realize high-speed character recognition by simple operation on image data, and to improve user's satisfaction.

한정된 문자로의 제 1 문자 인식 처리를 실행한 후에, 매칭 신뢰도가 임계치보다 낮은 문자열만 제 2 문자 인식 처리를 실행하기 때문에, 연산 처리의 부하를 경감할 수 있고, 일본어나 중국어라는 문자수가 많은 언어라도 전체로서 고속으로 문자 인식할 수 있다. 특히, 빈약한 CPU라도 충분히 고속으로 문자 인식할 수 있다.After executing the first character recognition process with limited characters, the second character recognition process is executed only for the character strings whose matching reliability is lower than the threshold value, so that the load of arithmetic processing can be reduced and a language having a large number of characters such as Japanese or Chinese. Even a character can be recognized at high speed as a whole. In particular, even a poor CPU can recognize characters sufficiently fast.

상세히 기술하면, 제 1 문자 인식 처리에서는, 제 1 인식용 영수 문자부(24a)로서 영어, 숫자, 기호 등의 구미계의 문자만(약 100문자)과, 더욱 적은 제 1 인식용 카테고리 문자부(24b)만을 이용하기 때문에, 전(全)문자에서의 대조를 행하는 경우보다도 수배 이상 고속으로 처리할 수 있다.In detail, in the first character recognition processing, as the first recognition alphanumeric character portion 24a, only Western characters (about 100 characters) such as English, numbers, and symbols, and fewer first character recognition characters Since only (24b) is used, the processing can be performed several times or more faster than the case where the matching is performed on all characters.

또한, 명함의 판독에서는, 「E-Mail」, 「URL」, 「TEL」, 「FAX」 , 「우편번호」를 나타내는 문자열은, 대강 영어, 삭우, 기호 등의 구미계의 문자로 구성되어 있다. 그 중 특히 「E-Mail」, 「URL」는, 「성명」, 「회사명」 등 다른 것을 나타내는 문자열과 비교하여, 길은 문자열인 것이 많다. 따라서, 명함중에 있어서, 영어, 숫자, 기호 등의 구미계의 문자가 차지하는 비율이 큰 것이 일반적이다. 이 비율이 큰 영어, 숫자, 기호 등의 구미계의 문자만을 대상으로 한 가벼운 제 1 문자 인식 처리를 최초에 실행함에 의해, 그들의 문자로 구성되는 「E-Mail」, 「URL」, 「TEL」, 「FAX」, 「우편번호」를 나타내는 문자열을 확정하여 버릴 수 있다. 그리고, 그 밖의 문자열에 관해서만, 일본어나 중국어 등도 대상으로 한 무거운 제 2 문자 인식 처리를 함으로써, 결과, 전체로서 명함 판독의 처리 속도를 향상할 수 있다.In addition, in the reading of a business card, a character string indicating "E-Mail", "URL", "TEL", "FAX", and "Postal code" is composed of characters of Western and American systems such as rough English, beef, and symbols. . Among them, in particular, "E-Mail" and "URL" are often strings compared with character strings representing other things such as "full name" and "company name". Therefore, among the business cards, it is common that a large percentage of Western and American characters such as English, numbers, and symbols occupy. The first E-Mail, URL, and TEL composed of these characters are executed by first performing a lightweight first character recognition process targeting only Western characters such as English, numbers, and symbols with a large ratio. , The character strings indicating "FAX" and "zip code" can be determined. As for the other character strings only, by performing the heavy second character recognition processing targeting Japanese, Chinese, etc., as a result, the processing speed of the card reading as a whole can be improved.

또한, 제 1 문자 인식 처리에서, 제 1 인식용 카테고리 문자부(24b)에 의해, 카테고리를 나타내는 키워드의 문자도 대상으로 하기 때문에, 「E-Mail」, 「URL」, 「TEL」, !FAX」, 「우편번호」를 나타내는 문자열을 제 1 문자 인식 처리에서 확실하게 인식할 수 있다.In the first character recognition process, the first character category character part 24b also targets the characters of the keyword representing the category. Therefore, "E-Mail", "URL", "TEL",! FAX "," The zip code "can be reliably recognized in the first character recognition process.

상세히 기술하면, 「E-Mai1」, 「URL」, 「TEL」, 「FAX」, 「우편번호」 등의 카테고리를 나타내는 키워드로서, 「メ(메)」, 「-」, 「ル(루)」, 「ホ(호)」,In detail, as a keyword indicating a category such as "E-Mai1", "URL", "TEL", "FAX", "Postal code", etc., "メ (Me)", "-", "ル" "," ホ (ho) ",

「ム(무)」, 「ぺ(페)」, 「ジ(지)」와 같은 구미계 이외의 문자가 명함에 포함되어 있는 경우가 있다. 예를 들면, 「メ-ル(메일) : abc@****,co.jp」, 「ホ-ムぺ-ジ(홈페이지) : http;//www,****,co.jp」 등이 해당한다.The card may contain characters other than the Western system such as "mu", "페", and "ジ". For example, "Me- ル (e-mail): abc @ ****, co.jp", "ホ-ム ぺ-ジ (homepage): http; // www, ****, co.jp" And the like.

이 때문에, 가령 제 1 문자 인식 처리할 때에 제 1 인식용 카테고리 문자부(24b)의 문자가 없으면, 인식할 때의 매칭 신뢰도가 나빠지고, 「E-Mai1」, 「URL」, 「TEL」, 「FAX」, 「우편번호」를 나타내는 문자열을 최초에 확정할 수가 없는 경우가 발생한다. 이에 대해, 제 1 인식용 카테고리 문자부(24b)를 이용함으로써, 이 문제를 해소할 수 있다.For this reason, if there is no character of the 1st recognition category character part 24b at the time of a 1st character recognition process, the matching reliability at the time of recognition will worsen, and "E-Mai1", "URL", "TEL", The case where the character strings indicating "FAX" and "zip code" cannot be determined at first. On the other hand, this problem can be solved by using the 1st category character part 24b for recognition.

또한, 문자의 경계를 검토할 필요성을 삭감하고, 처리를 고속으로 할 수 있다. 상세히 기술하면, 편(偏)과 방(旁)으로 이루어지는 「화(話)」 등의 결합 문자에 관해서는, 올바르게 인식하려고 하면, 일반적으로 각각의 부품으로 분리한 부품 문자 「言(언)」 「혀」의 2문자로서 인식하지 않도록 경계를 검토하는 처리가 필요해진다. 그러나, 영어, 삭우, 기호 등의 구미계의 문자는, 이와 같은 결합 문자가 없기 때문에, 경계를 검토할 필요가 없음에도 불구하고 「E-Mai1」, 「URL」, 「TEL」, 「FAX」, 「우편번호」라는 카테고리의 문자를 인식하기 위해, 드물게 섞이는 일이 있는 「電話(전화)」 등의 결합 문자를 위해, 모든 문자에 대해 경계 검토의 처리를 실행한다면 처리 시간이 길어진다.In addition, the necessity of examining the boundary of characters can be reduced, and the processing can be speeded up. In detail, when it tries to recognize correctly the combined characters, such as "hwa", which consists of a piece and a room, it is generally a part character "language" divided into individual parts. The process of examining a boundary is necessary so that it may not be recognized as two characters of "tongue". However, in the case of Western and American characters such as English, beef, and symbols, there is no such combined character, so even though it is not necessary to examine the boundary, "E-Mai1", "URL", "TEL", "FAX" In order to recognize characters in the category of "postal code", the processing time becomes longer if the boundary examination processing is performed on all characters for the combined characters such as "telephone" which are rarely mixed.

이에 대해, 제 1 문자 인식 처리에서는, 결합 문자를 부품에 분리한 부품 문자도 등록하고 있기 때문에, 문자의 경계를 검토할 필요가 없고, 고속으로 처리할 수 있다.On the other hand, in the first character recognition process, since the part character obtained by separating the combined character into parts is also registered, it is not necessary to examine the boundary of the character, and the processing can be performed at high speed.

특히, 결합 문자가 포함되는 것은, 예를 들면 「電話(전화)」나 「우편번호」의 표시 등, 카테고리를 나타내는 표시 부분으로 한정되고, 카테고리의 내용의 정보(실제의 전화번호나 우편번호 등)에는 포함되어 있지 않다. 그리고, 이 카테고리의 표시 부분은, 「電言舌(전언설)」로 인식하여도, 「電話(전화)」카테고리인 것으로 인식할 수 있다면 좋다. 이 특성을 이용하여, 결합 문자를 분리한 부품 문자도 등록하여 인식하고 있기 때문에, 결합 문자를 부품 문자로서 인식함에 의한 폐해를 발생시키는 일 없이(예를 들면 「電言舌(전언설)」로 인식하여도 문자 「電言舌(전언설)」을 등록하는 것이 아니다), 고속으로 처리할 수 있다.In particular, the inclusion of the combined characters is limited to display parts indicating categories such as the display of "telephone" or "zip code", for example, and information of the contents of the category (actual phone number or postal code, etc.). ) Is not included. The display portion of this category may be recognized as being in the "telephone" category even if it is recognized as "electronic speech". By using this property, the part text that separates the combined text is also registered and recognized. Therefore, without causing the harm caused by recognizing the combined text as the part text (for example, `` Del. Even if it recognizes it, it does not register the letter "電 言 舌", and it can process it at high speed.

또한, 카테고리를 인식한 문자열에 관해서는, 남정 처리를 실행할 수 있기 때문에, 인식 정밀도를 향상함과 함께, 유저가 위화감을 느끼는 인식 결과의 출력을 억제할 수 있다.In addition, since the male character recognition can be performed with respect to the character string which recognized the category, the recognition accuracy can be improved, and the output of the recognition result in which the user feels discomfort can be suppressed.

또한, 문자열 추출 처리부(31)에 의해 문자열을 추출하고, 카테고리 판별 처리부(35)에서 카테고리까지 판별하기 때문에, 이용자가 문자 인식 영역을 조작에 의해 지정하는 수고나, 지정한 영역의 카테고리를 선택 조작하는 수고를 삭감할 수 있고, 편리성을 향상할 수 있다.In addition, since the character string extraction processing unit 31 extracts the character string and determines the category from the category determination processing unit 35 to the category, the user designates the character recognition area by operation or selects and operates the category of the specified area. The labor can be reduced and the convenience can be improved.

또한, 문자 인식 프로그램(23)은, 인터넷 등의 전기통신 회선에 접속된 서버의 기억 수단에 기억하여 두고, 전기통신 회선을 통하여 다운코드 가능하게 하는, 또는 전기통신 회선을 통하여 ASP(App1imtim Service Provider)의 서비스로서 이용 가능하게 하는 구성으로 하는 것도 가능하다. 이 경우, 통신 부하가 걸리지만, 서버의 연산 처리의 부하를 경감할 수 있다.In addition, the character recognition program 23 is stored in a storage means of a server connected to a telecommunication line such as the Internet, and can be downcoded via a telecommunication line or an ASP (App1imtim Service Provider) via a telecommunication line. It is also possible to set it as the structure which can be used as a service. In this case, although a communication load is applied, the load of the arithmetic processing of a server can be reduced.

본 발명의 구성과, 상술한 실시 형태의 대응에 있어서,In the configuration of the present invention and the correspondence of the above-described embodiment,

본 발명의 문자 인식 장치 및 컴퓨터는, 실시 형태의 휴대단말(1)에 대응하고,The character recognition apparatus and the computer of the present invention correspond to the mobile terminal 1 of the embodiment.

이하 마찬가지로,Likewise below,

화상 데이터 취득 수단은, 화상 입력부(3)에 대응하고,The image data acquisition means corresponds to the image input unit 3,

문자 인식 수단은, CPU(11)에 대응하고,The character recognition means corresponds to the CPU 11,

기억 수단은, R0M(12)에 대응하고,The storage means corresponds to R0M 12,

매칭 데이터는, 매칭용 사전 데이터(24)에 대응하고,The matching data corresponds to the matching dictionary data 24,

제 1 인식용 매칭 데이터는, 제 1 인식용 영수 문자부(24a) 및 제 1 인식용 카테고리 문자부(24b)에 대응하고,The first recognition matching data corresponds to the first recognition alphanumeric character portion 24a and the first recognition category character portion 24b,

제 2 인식용 매칭 데이터는, 제 1 인식용 영수 문자부(24a), 제 1 인식용 카테고리 문자부(24b), 및 제 2 인식용 문자부(24c)에 대응하고,The second recognition matching data corresponds to the first recognition alphanumeric character portion 24a, the first recognition category character portion 24b, and the second recognition character portion 24c,

카테고리 판별용 문자은, 제 1 인식용 카테고리 문자부(24b)에 대응하고,The character for category determination corresponds to the first category character portion 24b for recognition,

화상 데이터제 취들 스텝은, 스텝 S1에 대응하고,The image data taking step corresponds to step S1,

제 1 문자 인식 처리 및 제 1 문자 인식 스텝은, 스텝 S4에 대응하고,The first character recognition processing and the first character recognition step correspond to step S4,

재인식 필요여부 판별 처리 및 재인식 필요여부 판별 스텝은, 스텝 S5 내지 S6에 대응하고,The recognition necessity determination process and the recognition necessity determination step correspond to steps S5 to S6,

제 2 문자 인식 처리 및 제 2 문자 인식 스텝은, 스텝 S7에 대응하고,The second character recognition processing and the second character recognition step correspond to step S7,

카테고리 판별 처리는, 스텝 S11에 대응하고,The category determination process corresponds to step S11,

보정 처리는, 스텝 S12에 대응하고,The correction process corresponds to step S12,

제 1 인식용 문자는, 영어, 숫자, 기호, 카테고리용 문자에 대응하고,The first character for recognition corresponds to English, numbers, symbols, characters for categories,

제 2 인직용 문자는, 전문자에 대응하지만,The second person character supports the expert,

본 발명은, 상술한 실시 형태의 구성만으로 한정되는 것이 아니고, 많은 실시의 형태를 얻을 수 있다.This invention is not limited only to the structure of embodiment mentioned above, Many embodiment can be obtained.

본 발명은, 문자를 인식하는 장치에 이용할 수 있고, 특히, 명함의 판독, 엽서나 봉투의 수신자 명의 판독 등, 어느 정도 기재 항목(카테고리)이 정해져 있는 문자 표시 매체로부터 문자를 인식하는 장치에 이용할 수 있다.INDUSTRIAL APPLICABILITY The present invention can be used for an apparatus for recognizing a character, and in particular, for an apparatus for recognizing a character from a character display medium in which description items (categories) are determined to some extent, such as reading a business card, reading a recipient name of a postcard or an envelope. Can be.

1 : 휴대 단말
3 : 화상 입력부
11 : CPU
13 : RAM
2 요 : 문자 인식 프로그램
24 : 매칭용 사전 데이터
24a : 제 1 인식용 영수 문자부
24b : 제 1 인식용 카테고리 문자부
24c : 제 2 인식용 문자부
1: mobile terminal
3: image input unit
11: CPU
13: RAM
2 yo: character recognition program
24: Dictionary data for matching
24a: first alphanumeric character part for recognition
24b: Category character part for first recognition
24c: second character for recognition

Claims (8)

문자 인식용의 매칭 데이터를 기억하는 기억 수단과,
화상 데이터를 취득한 화상 데이터 취득 수단과,
상기 매칭 데이터에 의거하여 상기 화상 데이터 내의 문자를 인식하는 문자 인식 수단을 구비한 문자 인식 장치로서,
상기 매칭 데이터는,
미리 정해진 제 1 인식용 문자에 관한 제 1 인식용 매칭 데이터와,
상기 제 1 인식용 문자 이외의 문자를 포함하고 해당 제 1 인식용 문자보다도 문자수가 많은 제 2 인식용 문자에 관한 제 2 인식용 매칭 데이터를 구별 가능하게 구성되고,
상기 문자 인식 수단은,
상기 제 1 인식용 매칭 데이터에 의해 상기 화상 데이터에 관해 문자 인식을 실행하는 제 1 문자 인식 처리와,
해당 제 1 문자 인식 처리의 결과가 재인식 조건에 해당하는지의 여부를 판별하는 재인식 필요여부 판별 처리와,
해당 재인식 필요여부 판별 처리에 의해 재인식을 필요로 한다고 판별한 재인식 대상에 대해, 상기 제 2 인식용 매칭 데이터에 의해 문자 인식을 실행하는 제 2 문자인 식 처리를 실행하는 구성인 것을 특징으로 하는 문자 인식 장치.
Storage means for storing matching data for character recognition;
Image data acquiring means for acquiring image data;
A character recognition apparatus comprising character recognition means for recognizing a character in said image data based on said matching data,
The matching data,
First matching data for recognition relating to a first predetermined character for recognition,
A second recognition matching data relating to a second recognition character including characters other than the first recognition character and having a larger number of characters than the first recognition character, is configured to be distinguishable
The character recognition means,
First character recognition processing for performing character recognition on the image data by the first recognition matching data;
Re-recognition necessity determination processing for determining whether the result of the first character recognition processing corresponds to a re-recognition condition, and
A character characterized in that it is a structure which performs the recognition process which is the 2nd character which performs character recognition with the said 2nd recognition matching data with respect to the recognition object determined by the said recognition necessity determination process by the said recognition necessity. Recognition device.
제 1항에 있어서,
상기 문자 인식 수단은, 상기 화상 데이터 내의 문자군의 카테고리를 판별하는 카테고리 판별 처리를 실행하는 구성이고,
상기 제 1 인식용 매칭 데이터는, 상기 카테고리 판별에 사용되는 카테고리 판별용 문자가 포함된 구성인 것을 특징으로 하는 문자 인식 장치.
The method of claim 1,
The character recognition means is configured to perform category determination processing for determining a category of a character group in the image data,
And the first recognition matching data is configured to include a category determination character used for the category determination.
제 2항에 있어서,
상기 제 1 인식용 매칭 데이터는, 상기 카테고리 판별용 문자중 2 이상의 부품으로 나누어지는 결합 문자에 관해서는 해당 결합을 요소별로 분리한 부품 문자가 포함된 구성인 것을 특징으로 하는 문자 인식 장치
The method of claim 2,
The first recognition matching data is a character recognition device comprising a part letter obtained by dividing a corresponding part by element for a combined character divided into two or more parts among the category determination characters.
제 2항 또는 제 3항에 있어서,
상기 문자 인식 수단은,
상기 카테고리 판별 처리에서 카테고리가 판별된 문자군 내에 해당 카테고리에서 사용되지 않아야 할 오인 문자가 포함되어 있는지의 여부를 판별하고, 포함되어 있는 경우에 해당 오인 문자를 카테고리에서 사용되는 문자로 보정하는 보정 처리를 실행하는 구성으로 한 것을 특징으로 하는 문자 인식 장치.
4. The method according to claim 2 or 3,
The character recognition means,
A correction process of determining whether or not a mistake character is to be used in the category in the character group in which the category is determined in the category determination process, and correcting the misinterpretation character to the character used in the category if it is included. Character recognition apparatus characterized in that the configuration for executing.
제 4항에 있어서,
상기 보정 처리는,
상기 오인 문자가 포함되어 있는 경우에, 카테고리에서 사용되는 문자만을 인식 대상으로 하여 재차 문자 인식을 실행함에 의해 보정하는 구성인 것을 특징으로 하는 문자 인식 장치.
The method of claim 4, wherein
The correction process,
And a character that is corrected by performing character recognition again, targeting only the characters used in the category when the mistaken character is included.
제 4항에 있어서,
상기 제 1 문자 인식 처리는, 매칭 신뢰도가 높은 것부터 복수의 문자 후보를 구하여 놓아 가장 매칭 신뢰도가 높은 문자를 채용하는 구성이고,
상기 보정 처리는,
상기 오인 문자가 포함되어 있는 경우에, 해당 오인 문자의 문자 후보 중, 해당 카테고리에 사용되는 문자중에서 가장 매칭 신뢰도가 높은 문자로 보정하는 구성인 것을 특징으로 하는 문자 인식 장치.
The method of claim 4, wherein
The first character recognition process is a configuration in which a plurality of character candidates are obtained from a high matching reliability, and a character having the highest matching reliability is adopted.
The correction process,
And when the mistake character is included, correcting the character with the highest matching reliability among characters used in the category among character candidates of the mistake character.
미리 정해진 제 1 인식용 문자에 관한 제 1 인식용 매칭 데이터와, 상기 제 1 인식용 문자 이외의 문자를 포함하고 해당 제 1 인식용 문자보다도 문자수가 많은 제 2 인식용 문자에 관한 제 2 인식용 매칭 데이터를 구별 가능하게 구성된 매칭 데이터를 기억 수단에 기억하여 두고,
화상 데이터 취득 수단에 의해 회상 데이터를 취득하는 화상 데이터 취득 스텝과,
상기 제 1 인식용 매칭 데이터에 의해 상기 화상 데이터에 관해 문자 인식 수단에서 문자 인식을 실행하는 제 1 문자 인식 스텝과,
해당 제 1 문자 인식 처리의 결과가 재인식 조건에 해당하는지의 여부를 상기 문자 인식 수단에서 판별하는 재인식 필요여부 판별 스텝과,
해당 재인식 필요여부 판별 처리에 의해 재인식을 필요로 한다고 판별한 재양식 대상에 대해, 상기 제 2 인식용 매칭 데이터에 의해 상기 문자 인식 수단에서 문자 인식을 실행하는 제 2 문자 인식 스텝을 컴퓨터에 실행시키는 것을 특징으로 하는 문자 인식 프로그램.
First recognition matching data relating to a first predetermined character for recognition and second recognition for a second character for recognition including characters other than the first character for recognition and having more characters than the first character for recognition. Matching data configured to distinguish the matching data is stored in the storage means;
An image data acquisition step of acquiring recall data by the image data acquisition means,
A first character recognition step of performing character recognition in character recognition means on said image data by said first recognition matching data;
A re-recognition necessity determining step of judging by the character recognizing means whether or not the result of the first character recognition process corresponds to a re-recognition condition;
Causing the computer to execute a second character recognition step of performing character recognition in the character recognition means by the second recognition matching data on the re-formation target determined by the re-recognition necessity determination process; Character recognition program, characterized in that.
미리 정해진 제 1 인식용 문자에 관한 제 1 인식용 매칭 데이터와, 상기 제 1 인식용 문자 이외의 문자를 포함하고 해당 제 1 인식용 문자보다도 문자수가 많은 제 2 인식용 문자에 관한 제 2 인식용 매칭 데이터를 구별 가능하게 구성된 매칭 데이터를 기억 수단에 기억하여 두고,
화상 데이터 취득 수단에 의해 화상 데이터를 취득하는 화상 데이터 취득 스텝과,
상기 제 1 인식용 매칭 데이터에 의해 상기 화상 데이터에 관해 문자 인식 수단에서 문자 인식을 실행하는 제 1 문자 인식 스텝과,
해당 제 1 문자 인식 처리의 결과가 재인식 조건에 해당하는지의 여부를 상기 문자 인식 수전에서 판별하는 재인식 필요여부 판별 스텝과,
해당 재인식 필요여부 판별 처리에 의해 재인식을 필요로 한다고 판별한 재인식 대상에 대해, 상기 제 2 인식용 매칭 데이터에 의해 상기 문자 인식 수단에서 문자 인식을 실행하는 제 2 문자 인식 스텝을 실행하는 것을 특징으로 하는 문자 인식 방법.
First recognition matching data relating to a first predetermined character for recognition and second recognition for a second character for recognition including characters other than the first character for recognition and having more characters than the first character for recognition. Matching data configured to distinguish the matching data is stored in the storage means;
An image data acquisition step of acquiring image data by the image data acquisition means,
A first character recognition step of performing character recognition in character recognition means on said image data by said first recognition matching data;
A re-recognition necessity determining step of judging in the character recognition faucet whether or not the result of the first character recognition process corresponds to a re-recognition condition;
And a second character recognition step of executing character recognition in said character recognition means by said second recognition matching data, for the recognizing object that has been determined to require re-recognition by said re-recognition necessity determination process. Character recognition method.
KR1020100010816A 2009-03-13 2010-02-05 Character recognition apparatus, character recognition program and character recognition method KR101078086B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009061148A JP2010217996A (en) 2009-03-13 2009-03-13 Character recognition device, character recognition program, and character recognition method
JPJP-P-2009-061148 2009-03-13

Publications (2)

Publication Number Publication Date
KR20100103351A true KR20100103351A (en) 2010-09-27
KR101078086B1 KR101078086B1 (en) 2011-10-28

Family

ID=42717725

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100010816A KR101078086B1 (en) 2009-03-13 2010-02-05 Character recognition apparatus, character recognition program and character recognition method

Country Status (3)

Country Link
JP (1) JP2010217996A (en)
KR (1) KR101078086B1 (en)
CN (1) CN101833661A (en)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102860018A (en) * 2011-04-20 2013-01-02 株式会社东芝 Image processing device and image processing method
JP6472218B2 (en) * 2014-11-17 2019-02-20 株式会社日立情報通信エンジニアリング Character recognition system and character recognition method
CN106372634A (en) * 2015-07-21 2017-02-01 无锡天脉聚源传媒科技有限公司 Method and apparatus for identifying original complex Chinese character
JP6878034B2 (en) 2017-02-10 2021-05-26 キヤノン株式会社 Information processing equipment, control methods, and programs
CN110135425B (en) * 2018-02-09 2021-02-26 北京世纪好未来教育科技有限公司 Sample labeling method and computer storage medium
GB2571530B (en) 2018-02-28 2020-09-23 Canon Europa Nv An image processing method and an image processing system
CN108564079B (en) * 2018-05-08 2022-07-19 东华大学 Portable character recognition device and method
JP7338158B2 (en) * 2019-01-24 2023-09-05 富士フイルムビジネスイノベーション株式会社 Information processing device and program
JP7274322B2 (en) * 2019-03-25 2023-05-16 東芝テック株式会社 Program and character recognition method

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1055413A (en) 1996-08-09 1998-02-24 Matsushita Electric Ind Co Ltd Name card recognizing device
JP3452774B2 (en) * 1997-10-16 2003-09-29 富士通株式会社 Character recognition method
JP2001202475A (en) 2000-01-19 2001-07-27 Sharp Corp Character recognizer and its control method
JP4704601B2 (en) * 2000-11-01 2011-06-15 富士通株式会社 Character recognition method, program, and recording medium
JP4597644B2 (en) * 2003-11-28 2010-12-15 シャープ株式会社 Character recognition device, program and recording medium
JP2006065477A (en) * 2004-08-25 2006-03-09 Fuji Xerox Co Ltd Character recognition device
JP4759963B2 (en) * 2004-09-22 2011-08-31 沖電気工業株式会社 Character recognition device using multiple recognition dictionaries
JP4800144B2 (en) * 2006-08-08 2011-10-26 シャープ株式会社 Character string determination device, character string determination method, character string determination program, and computer-readable recording medium

Also Published As

Publication number Publication date
CN101833661A (en) 2010-09-15
KR101078086B1 (en) 2011-10-28
JP2010217996A (en) 2010-09-30

Similar Documents

Publication Publication Date Title
KR101078086B1 (en) Character recognition apparatus, character recognition program and character recognition method
US11170248B2 (en) Video capture in data capture scenario
US9589198B2 (en) Camera based method for text input and keyword detection
US8965126B2 (en) Character recognition device, character recognition method, character recognition system, and character recognition program
JP4364914B2 (en) Image document processing apparatus, image document processing method, program, and recording medium
US8208765B2 (en) Search and retrieval of documents indexed by optical character recognition
US8160402B2 (en) Document image processing apparatus
TWI231920B (en) Character recognition apparatus and method
US20050268231A1 (en) Method and device for inputting Chinese phrases
CN108564079B (en) Portable character recognition device and method
US20150213333A1 (en) Method and device for realizing chinese character input based on uncertainty information
CN110909740A (en) Information processing apparatus and storage medium
JP4597644B2 (en) Character recognition device, program and recording medium
JP4800144B2 (en) Character string determination device, character string determination method, character string determination program, and computer-readable recording medium
CN112560849B (en) Neural network algorithm-based grammar segmentation method and system
US20210182477A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
CN112347831A (en) Information processing apparatus and table identification method
JP5298830B2 (en) Image processing program, image processing apparatus, and image processing system
JP2010218043A (en) Character information acquisition device, character information acquisition program and character information acquisition method
JP5277750B2 (en) Image processing program, image processing apparatus, and image processing system
US11210564B2 (en) Information processing apparatus for character recognition and non-transitory computer readable medium
JP7268316B2 (en) Information processing device and program
JP4431335B2 (en) String reader
CN113850175A (en) Document identification method, device, equipment and storage medium
US20190318190A1 (en) Information processing apparatus, and non-transitory computer readable medium

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20141007

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150917

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160921

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170920

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20181004

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20191002

Year of fee payment: 9