JPH0528305A - Device and method for image recognition - Google Patents

Device and method for image recognition

Info

Publication number
JPH0528305A
JPH0528305A JP3184242A JP18424291A JPH0528305A JP H0528305 A JPH0528305 A JP H0528305A JP 3184242 A JP3184242 A JP 3184242A JP 18424291 A JP18424291 A JP 18424291A JP H0528305 A JPH0528305 A JP H0528305A
Authority
JP
Japan
Prior art keywords
character
character string
characters
candidate
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3184242A
Other languages
Japanese (ja)
Inventor
Junichi Koizumi
潤一 小泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP3184242A priority Critical patent/JPH0528305A/en
Publication of JPH0528305A publication Critical patent/JPH0528305A/en
Withdrawn legal-status Critical Current

Links

Abstract

PURPOSE:To improve recognition ratio by extracting character strings as candidate character strings, evaluating the recognition result of the constituting characters of respective candidate character strings and feeding the evaluation result back to determine whether or not the character string constitution is proper. CONSTITUTION:An input means 1 reading an image 5, and a character string extraction part 2 extracting plural character strings as the candidate character strings when respective character elements are integrated in accordance with environmental conditions and when the character elements can be integrated into plural character strings, are provided. A character recognition part 3 segmenting the constituting characters of the candidate character strings, preparing a normalized image of the constituting characters corresponding to their tilt, extracting the features of the normalized image, checking the features with the features of the standard pattern of a dictionary and recognizing the constituting characters, is provided. A character string evaluation part 4 outputting the candidate character strings in which the recognition inavailable ratio of the plural candidate character strings is minimized, as the recognition result, is also provided.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文字列の方向とその文
字列を構成する各文字の底辺が基本的に平行である書式
に従った各種設計図や地図の如き文字と図形が混在する
原稿(以下画像と称する)を読み取る画像認識装置に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention mixes characters and figures such as various design drawings and maps according to a format in which the direction of a character string and the bases of the characters constituting the character string are basically parallel. The present invention relates to an image recognition device that reads a document (hereinafter referred to as an image).

【0002】CAD/CAM、コンピュータ・マッピン
グの普及に伴い、過去に作成した設計図面、地図などの
画像をディジタル化する手段として、光学式読み取り装
置を用いた画像の自動入力がある。
With the spread of CAD / CAM and computer mapping, there is automatic image input using an optical reader as a means for digitizing images such as design drawings and maps created in the past.

【0003】これに伴い、画像を読み取り、読み取った
画像を正しく認識することが重要視されている。
Along with this, it is important to read an image and correctly recognize the read image.

【0004】[0004]

【従来の技術】図7は画像認識装置の文字列抽出部を示
す図である。図8は画像認識装置の文字認識部を示す図
である。
2. Description of the Related Art FIG. 7 is a diagram showing a character string extraction unit of an image recognition apparatus. FIG. 8 is a diagram showing a character recognition unit of the image recognition device.

【0005】図11は従来例を示す図である。図12、
図13は従来例のフローチャートである。図14はベク
ターのグループ化を示す図である。
FIG. 11 is a diagram showing a conventional example. 12,
FIG. 13 is a flowchart of a conventional example. FIG. 14 is a diagram showing grouping of vectors.

【0006】図15は文字列の作成例を示す図である。
図11において、スキャナ201より文字と図面が混在
した画像を読み込み、ラスター・データ化しフレームメ
モリ209に格納する(図12のS1)。
FIG. 15 is a diagram showing an example of creating a character string.
In FIG. 11, an image in which characters and drawings are mixed is read by the scanner 201, converted into raster data, and stored in the frame memory 209 (S1 in FIG. 12).

【0007】その際のスキャナ201の制御、並びにフ
レームメモリ209へのラスター・データの格納はスキ
ャナ制御部202により行われる。フレームメモリ20
9のラスター・データに対して、ラスター=ベクター変
換部(R=V変換部) 203がラスター・データを細線
化、折線近似等の手段により、ベクター・データを発生
させ、結果を図形情報テーブル211に格納する(図1
2のS2)。
At this time, the scanner controller 202 controls the scanner 201 and stores the raster data in the frame memory 209. Frame memory 20
For the raster data of No. 9, the raster = vector conversion unit (R = V conversion unit) 203 generates vector data by means of thinning the raster data, approximation of broken lines, etc., and outputs the result to the graphic information table 211. Stored in (Fig. 1
2 S2).

【0008】図形情報テーブル211の各ベクターに対
して、文字・図形分離部204で相互に連続なベクター
をグループ化し(図12のS3)、文字は比較的小さな
領域を持ち、他の図形・文字から孤立しているという特
徴を使って、全グループの計測が終了するまで(図12
のS4)各グループの大きさを調べ(図12のS5)、
グループの大きさが文字サイズに適合すれば(図12の
S6)文字要素として抽出し(図12のS7)、また、
文字要素以外のグループを図形要素として抽出する。
(図12のS8)。
For each vector in the graphic information table 211, the character / graphic separation unit 204 groups mutually continuous vectors (S3 in FIG. 12), and the character has a relatively small area, and the other graphic / character Until the measurement of all groups is completed using the feature of being isolated from (Fig. 12
S4) Check the size of each group (S5 in FIG. 12),
If the size of the group matches the character size (S6 in FIG. 12), it is extracted as a character element (S7 in FIG. 12).
Extract groups other than character elements as graphic elements.
(S8 of FIG. 12).

【0009】分離された文字要素は文字情報テーブル2
12に格納される。従って、図14に示すようにグルー
プ101及びグループ102は文字要素、グループ10
3は図形要素となる。
The separated character elements are the character information table 2
Stored in 12. Therefore, as shown in FIG. 14, the groups 101 and 102 are character elements, group 10
3 is a graphic element.

【0010】図7に示すように文字情報テーブル212
に格納された文字要素に対して(図13のS10)、文
字列抽出部205の周辺探索部401で注目する文字要
素の周辺に他の文字要素が存在するかどうか探索する
(図13のS11)。
As shown in FIG. 7, a character information table 212
With respect to the character element stored in (S10 of FIG. 13), the surrounding search unit 401 of the character string extraction unit 205 searches for other character elements around the focused character element (S11 of FIG. 13). ).

【0011】探索した結果、文字要素が存在する場合は
(図13のS12)、注目する文字要素の重心と探索さ
れた任意の他の文字要素の重心の距離を距離計算部40
4が計算し、任意の他の文字要素の傾きと任意の他の文
字要素に注目する文字要素を統合したときの傾きとの差
を角度計算部405が計算し、その得られた距離および
角度より統合評価部402において文字列として統合で
きる可能性を評価値として表し、距離および角度が小さ
ければ小さい程高い評価値が与えられる。
If a character element exists as a result of the search (S12 in FIG. 13), the distance calculation unit 40 calculates the distance between the center of gravity of the character element of interest and the center of gravity of any other searched character element.
4 calculates, the angle calculation unit 405 calculates the difference between the inclination of any other character element and the inclination when the character element of interest to any other character element is integrated, and the obtained distance and angle are calculated. The possibility of being integrated as a character string in the integrated evaluation unit 402 is represented as an evaluation value, and the smaller the distance and the angle, the higher the evaluation value.

【0012】但し、角度と距離の評価の重みは距離の重
みの方が高いようになっている。周辺探索部401によ
って複数の文字要素が探索された場合には(図13のS
13)、探索された任意の文字要素を探索された他の文
字要素に変え、前述の処理を同様に行う。
However, the weight of the evaluation of the angle and the distance is higher than the weight of the distance. When a plurality of character elements are searched by the peripheral search unit 401 (S in FIG. 13).
13), the searched arbitrary character element is changed to another searched character element, and the above-mentioned processing is performed in the same manner.

【0013】以上の処理を上記注目する文字要素につい
て探索された全ての文字要素に対して行い、それぞれの
評価値を求める。判定部403は、文字要素の統合が1
つしか存在しない場合には、その文字要素の統合を(図
13のS14)、また、文字要素の統合が複数存在する
場合には、求められた評価値から最も高い評価値をもつ
文字要素の統合を文字列として基本的に抽出する(図1
3のS15)。
The above processing is performed for all the character elements searched for the noted character element to obtain respective evaluation values. The determination unit 403 determines that the integration of character elements is 1
If there is only one, the character element is integrated (S14 in FIG. 13). If there are multiple character element integrations, the character element having the highest evaluation value from the obtained evaluation values is selected. The integration is basically extracted as a character string (Fig. 1
3 S15).

【0014】但し、最も高い評価値であってもその評価
値が予め定められたレベル値より低い場合はその注目す
る文字要素は独立している、つまり、どこにも統合しな
いものとして抽出する。
However, even if the evaluation value is the highest, if the evaluation value is lower than the predetermined level value, the character element of interest is extracted as independent, that is, it is not integrated anywhere.

【0015】即ち、従来は評価値がレベル値以上で且つ
最大のものを抽出する。この文字列抽出の処理を文字情
報テーブル212に格納されている全ての文字要素に対
して行う(図13のS9)。
That is, conventionally, the evaluation value that is equal to or higher than the level value and is maximum is extracted. This character string extraction processing is performed on all the character elements stored in the character information table 212 (S9 in FIG. 13).

【0016】例えば、図15のように注目する文字要素
104に対して、統合可能範囲に文字列105と文字列
106というような複数の文字列が存在する場合は、文
字要素104の重心に対して両文字列の最近傍文字の重
心との距離L1、L2を距離計算部404が計測する。
For example, when there are a plurality of character strings such as a character string 105 and a character string 106 in the integrable range for the character element 104 of interest as shown in FIG. The distance calculation unit 404 measures the distances L1 and L2 from the center of gravity of the nearest characters of both character strings.

【0017】また、文字列105の傾きと文字列105
に文字要素104を統合したときの傾きとの差と、文字
列106の傾きと文字列106に文字要素104を統合
したときの傾きとの差を角度計算部405が計測する。
Further, the inclination of the character string 105 and the character string 105
The angle calculation unit 405 measures the difference between the inclination when the character element 104 is integrated with the character string 104 and the difference between the inclination of the character string 106 and the inclination when the character element 104 is integrated with the character string 106.

【0018】そして、統合評価部402において距離計
算部404および角度計算部405で計算された距離、
角度によりそれぞれ評価値を求め、判定部403でこの
2つの評価値により文字要素104を文字列105に統
合するか、文字列106に統合するか、または何れにも
統合しないかを決定する。
Then, in the integrated evaluation unit 402, the distance calculated by the distance calculation unit 404 and the angle calculation unit 405,
An evaluation value is obtained from each angle, and the determination unit 403 determines whether to integrate the character element 104 into the character string 105, the character string 106, or neither of them by the two evaluation values.

【0019】文字列抽出の結果は、文字情報テーブル2
12に格納される。図8に示すように文字情報テーブル
212に格納された文字列の傾き情報及び各文字の位置
情報に基づき、文字認識部206の画像切り出し部50
1はフレームメモリ209より一文字分の画像を切り出
す(図13のS17)。
The result of the character string extraction is the character information table 2
Stored in 12. As shown in FIG. 8, the image cutout unit 50 of the character recognition unit 206 is based on the inclination information of the character string and the position information of each character stored in the character information table 212.
1 cuts out an image for one character from the frame memory 209 (S17 in FIG. 13).

【0020】切り出された文字画像を認識するために
は、文字画像の特徴と辞書505の標準パターンの特徴
と照合する。その際、文字の特徴と辞書505の標準パ
ターンの特徴との照合の方向性を合わせるために図8に
示す画像回転部502によって文字列の傾きに応じた回
転処理を切り出された文字画像に施して正規化画像を作
成し、特徴抽出部503によって特徴を抽出した後、そ
の正規化画像の特徴と辞書505の標準パターンの特徴
を特徴照合部504で照合し文字の認識結果を得る(図
13のS18)。
In order to recognize the cut out character image, the characteristics of the character image are compared with the characteristics of the standard pattern in the dictionary 505. At that time, in order to match the direction of collation between the character feature and the feature of the standard pattern of the dictionary 505, a rotation process according to the inclination of the character string is applied to the clipped character image by the image rotation unit 502 shown in FIG. After the normalized image is created by the feature extracting unit 503, the feature extracting unit 503 extracts the feature, and the feature matching unit 504 matches the feature of the normalized image with the feature of the standard pattern of the dictionary 505 to obtain a character recognition result (FIG. 13). S18).

【0021】以上の文字列を構成する文字の認識処理を
全文字列について行い(図13のS16)、得られた文
字の認識結果は文字情報テーブル212に格納される
(図13のS19)。
The recognition processing of the characters constituting the above character string is performed for all character strings (S16 in FIG. 13), and the obtained character recognition result is stored in the character information table 212 (S19 in FIG. 13).

【0022】一方、図形情報テーブル212の図形要素
に対しては、ベクター演算部207において、直線・円
・円弧等の図形プリミティブ認識が以下のように行われ
る。まず、ベクターの長さと連続する2本のベクター間
の角度から、円弧の候補となるベクターを検索する。
On the other hand, with respect to the graphic elements of the graphic information table 212, graphic primitive recognition of straight lines, circles, arcs, etc. is performed in the vector operation unit 207 as follows. First, a vector that is a candidate for a circular arc is searched from the length of the vector and the angle between two consecutive vectors.

【0023】次に検索されたベクターから、可能性のあ
る円弧の半径と中心の候補を求め、得られた候補のう
ち、与えられたしきい値内で最も多くのベクターからな
るものを円、円弧の抽出結果とする。
Next, from the searched vectors, candidates for the radius and center of a possible arc are obtained, and among the obtained candidates, the one consisting of the largest number of vectors within a given threshold is circled, This is the extraction result of the arc.

【0024】円、円弧以外のベクターを直線の候補と
し、その中で誤差がしきい値以下で、ある一定以上の長
さを持つベクターの並びを直線とする。図形プリミティ
ブ認識が行われた結果は再び図形情報テーブル211に
格納される。
Vectors other than circles and arcs are set as straight line candidates, and among them, an array of vectors whose error is less than or equal to a threshold value and which has a certain length or more is set as a straight line. The result of the graphic primitive recognition is stored in the graphic information table 211 again.

【0025】以上により画像の認識が終了し、図形情報
テーブル211及び文字情報テーブル212の認識結果
が通信制御部208を経由してホストコンピュータ21
4へ出力される。
The image recognition is completed as described above, and the recognition results of the graphic information table 211 and the character information table 212 are transferred to the host computer 21 via the communication control unit 208.
4 is output.

【0026】ホストコンピュータ214では、認識結果
を表示してオペレータによる確認・修正作業が行われた
後、CAD図面データベースあるいはマッピング・デー
タベースへ格納され、CADシステムにて、例えば図面
を作成する際に情報として用いられる。
In the host computer 214, after the recognition result is displayed and confirmation / correction work is performed by the operator, the recognition result is stored in the CAD drawing database or the mapping database, and the information is created when the CAD system creates a drawing, for example. Used as.

【0027】[0027]

【発明が解決しようとする課題】しかしながら、従来で
は文字要素を統合し文字列として抽出を行う時点におい
て、複数の文字列への統合可能な場合でも、周囲状況の
みから文字列の統合を行うため誤った文字列の抽出が成
され、認識不能となるという問題を生じていた。
However, in the prior art, when the character elements are integrated and extracted as a character string, the character strings are integrated only from the surrounding situation even if they can be integrated into a plurality of character strings. There was a problem that the character string was erroneously extracted and it became unrecognizable.

【0028】即ち、文字と図形の混在する設計図等の画
像では、前記した文字列の方向とその文字列を構成する
各文字の底辺が基本的に平行であるという書式に従い、
且つ任意の傾きをもって文字列が記入される。
That is, in an image such as a design drawing in which characters and figures are mixed, according to the format that the direction of the character string and the bases of the characters forming the character string are basically parallel,
In addition, the character string is written with an arbitrary inclination.

【0029】その文字列を構成する各文字を認識する場
合は、まず、文字列を構成する文字を切り出し、辞書の
標準パターンの特徴と照合させる際、照合の方向性を合
わせるため文字列の傾きに応じて文字に回転処理を施し
た正規化画像を作成し、その正規化画像の特徴抽出を行
う必要がある。
When recognizing each character forming the character string, first, when the character forming the character string is cut out and collated with the characteristics of the standard pattern of the dictionary, the inclination of the character string is aligned to match the direction of the collation. It is necessary to create a normalized image in which characters are rotated according to the above, and to extract the features of the normalized image.

【0030】そのため、誤った文字列の抽出を行うと、
その文字列を構成する各文字に誤った回転処理を施した
正規化画像が作成され、その正規化画像の特徴と辞書の
標準パターンの特徴を照合するため、文字列内の多くの
文字の認識が正常に行われず、抽出された文字列は認識
不能となる可能性が大きい。
Therefore, if an incorrect character string is extracted,
A normalization image is created by performing an incorrect rotation process on each character that makes up the character string, and the characteristics of the normalization image are compared with the characteristics of the standard pattern in the dictionary. Is not normally performed, and the extracted character string is likely to be unrecognizable.

【0031】従って、本発明は、文字列の方向とその文
字列を構成する各文字の底辺が基本的に平行であるとい
う書式に従った画像を読み取り、文字列を抽出する際、
文字要素が複数の文字列に統合可能な場合、複数の候補
文字列を挙げ、各候補文字列内の個々の文字の認識結果
を評価して文字列構成の適否へフィードバックすること
により、誤った文字列の抽出を削減し、認識度を向上さ
せることができる画像認識装置を提供することを目的と
する。
Therefore, according to the present invention, when an image is read according to a format in which the direction of the character string and the bases of the characters forming the character string are basically parallel, and the character string is extracted,
When a character element can be integrated into multiple character strings, multiple candidate character strings are listed, the recognition result of each character in each candidate character string is evaluated, and feedback is given to the propriety of the character string configuration. An object of the present invention is to provide an image recognition device capable of reducing the extraction of character strings and improving the degree of recognition.

【0032】[0032]

【課題を解決するための手段】図1は本発明の第1の原
理図である。図中、1は入力手段であり、少なくとも所
定の書式に従って書かれた文字を有する画像5を読み取
るものである。
FIG. 1 is a diagram showing the first principle of the present invention. In the figure, reference numeral 1 is an input means for reading an image 5 having at least characters written according to a predetermined format.

【0033】2は文字列抽出部であり、個々の文字を統
合し文字列として抽出する際に、複数の文字列へ統合可
能な場合はその複数の統合可能な文字列を候補文字列と
して抽出するものである。
Reference numeral 2 denotes a character string extraction unit that, when individual characters are integrated and extracted as a character string, and if they can be integrated into a plurality of character strings, the plurality of integrable character strings are extracted as candidate character strings. To do.

【0034】3は文字認識部であり、文字列抽出部2で
抽出された各候補文字列の構成要件である文字列の傾
き、文字位置に従って、各文字を切り出し認識するもの
である。
A character recognition unit 3 cuts out and recognizes each character according to the inclination and the character position of the character string which are the constituent requirements of each candidate character string extracted by the character string extraction unit 2.

【0035】4は文字列評価部であり、文字認識部3で
認識した各候補文字列内の文字要素の認識不能文字数を
計数し、認識不能率(候補文字列を構成する全文字数と
その候補文字列の認識不能文字数の割合)が最小である
候補文字列を認識結果として出力するものである。
A character string evaluation unit 4 counts the number of unrecognizable characters of the character elements in each candidate character string recognized by the character recognition unit 3, and recognizes the unrecognizable rate (the total number of characters forming the candidate character string and its candidates). The candidate character string having the smallest ratio of the number of unrecognizable characters of the character string) is output as the recognition result.

【0036】図2は本発明の第2の原理図である。図
中、1は入力手段、2は文字列抽出部、3は文字認識部
であって、前述の図1と同様であるため、その具体的な
説明を省略する。
FIG. 2 is a second principle diagram of the present invention. In the figure, 1 is an input unit, 2 is a character string extraction unit, and 3 is a character recognition unit, which are the same as those in FIG. 1 described above, so a detailed description thereof will be omitted.

【0037】6は文字列選択部であり、文字認識部3で
認識した各候補文字列内の文字要素の認識不能文字数を
計数し、認識不能率が設定基準を満たす候補文字列を全
て認識結果として出力し、その何れかを選択させるもの
である。
A character string selecting unit 6 counts the number of unrecognizable characters of the character elements in each candidate character string recognized by the character recognizing unit 3 and recognizes all candidate character strings whose unrecognizable rate satisfies the setting criterion. Is output, and any one of them is selected.

【0038】[0038]

【作用】本発明の請求項1では、文字列抽出部2におい
て、文字列の抽出を行う時点で文字要素が複数の文字列
に統合可能な場合、その複数の統合可能な文字列を候補
文字列として全て抽出する。
According to the first aspect of the present invention, when the character element can be integrated into a plurality of character strings at the time of extracting the character string in the character string extracting unit 2, the plurality of the character strings that can be integrated are candidate characters. Extract all as columns.

【0039】その文字列抽出部2によって抽出された複
数の候補文字列の構成文字を文字列の傾き、文字位置に
従って切り出し、文字認識部3で辞書の標準パターンの
特徴と照合できるようにするために、文字列の傾きに応
じて切り出された文字に回転処理を施した正規化画像を
作成し特徴抽出を行った後、その正規化画像の特徴と辞
書の標準パターンの特徴とを照合し、認識処理を行う。
In order to make the constituent characters of the plurality of candidate character strings extracted by the character string extraction unit 2 cut out according to the inclination and character position of the character string, and to allow the character recognition unit 3 to collate with the characteristics of the standard pattern of the dictionary. In addition, after creating a normalized image obtained by performing rotation processing on the characters cut out according to the inclination of the character string and performing feature extraction, the features of the normalized image and the features of the standard pattern of the dictionary are collated, Perform recognition processing.

【0040】斜めまたは垂直方向の文字列を所定の書式
に従って書くと、その文字列を構成する個々の文字は文
字列の方向と各文字の底辺が平行になるように傾く(文
字の底辺と平行な方向を文字の方向とする)。
When a character string in an oblique or vertical direction is written according to a predetermined format, the individual characters forming the character string are inclined so that the direction of the character string is parallel to the base of each character (parallel to the base of the character. And the direction of the character is).

【0041】そのため、文字列を構成する各文字を認識
するためには、文字列の方向を文字の方向とみなし、傾
いた状態で文字を切り出す。一方、文字の特徴と辞書の
標準パターンの特徴の照合を行う際、照合の方向性を合
わせる必要があるため、傾いた状態で切り出された文字
の方向と辞書の標準パターンの方向とを一致させるよう
に切り出した文字を回転させる正規化を行わなければな
らない。
Therefore, in order to recognize each character forming the character string, the direction of the character string is regarded as the direction of the character, and the character is cut out in an inclined state. On the other hand, when matching the characteristics of the character with the characteristics of the standard pattern of the dictionary, it is necessary to match the directionality of the matching. Therefore, the direction of the character cut out in an inclined state matches the direction of the standard pattern of the dictionary. Normalization must be done to rotate the cut out characters.

【0042】そのため、誤った文字列抽出を行うと、文
字列の方向とその文字列を構成する各文字の方向が一致
しない。従って、抽出された文字列の構成文字を切り出
し、文字の方向と標準パターンの方向を一致させるため
に切り出された文字を回転する正規化を行い、照合を行
ったとしても認識不能となる可能性が大きい。
Therefore, if the wrong character string is extracted, the direction of the character string does not match the direction of each character forming the character string. Therefore, the constituent characters of the extracted character string may be cut out, and the cut out characters may be rotated in order to match the direction of the character with the direction of the standard pattern. Is big.

【0043】しかし、本発明では文字要素が複数の文字
列に統合可能な場合、その複数の統合可能な文字列を候
補文字列として全て抽出し、その抽出された候補文字列
を構成する文字の認識を行った後、文字列評価部4にお
いて、各候補文字列について認識不能文字数を計数し、
認識不能率が最小である候補文字列を認識結果として出
力するようにしたため、抽出されるべき文字列が出力さ
れる可能性が大きい。
However, in the present invention, when a character element can be integrated into a plurality of character strings, all of the plurality of character strings that can be integrated are extracted as candidate character strings, and the characters constituting the extracted candidate character strings are extracted. After recognition, the character string evaluation unit 4 counts the number of unrecognizable characters for each candidate character string,
Since the candidate character string having the smallest unrecognizable rate is output as the recognition result, there is a high possibility that the character string to be extracted is output.

【0044】これらのことにより、誤った文字列抽出に
よる文字の誤認識及び認識不能を削減することができ、
高精度の認識結果を得ることができる。本発明の請求項
2では、候補文字列を構成する各文字を認識した後、文
字列選択部6において、各候補文字列の認識不能文字数
を計数し、認識不能率が設定基準を満たす候補文字列を
全て認識結果として出力し、その何れかを選択させるよ
うにしている。
Due to the above, it is possible to reduce erroneous recognition and unrecognizable character due to erroneous character string extraction,
It is possible to obtain a highly accurate recognition result. According to claim 2 of the present invention, after recognizing each character forming the candidate character string, the character string selecting unit 6 counts the number of unrecognizable characters of each candidate character string, and the unrecognizable rate satisfies the setting criterion. All columns are output as recognition results, and any one of them is selected.

【0045】よって、請求項2の手段を用いると、請求
項1によって出力される認識結果を含む複数の候補文字
列の中から認識結果を選択できるため、請求項1よりさ
らに高精度の認識結果を得ることができる。
Therefore, when the means of claim 2 is used, the recognition result can be selected from a plurality of candidate character strings including the recognition result output by claim 1, so that the recognition result with higher accuracy than that of claim 1 is obtained. Can be obtained.

【0046】[0046]

【実施例】まず、第1の実施例について説明する。図3
は本発明の第1の実施例を示す図である。
EXAMPLE First, a first example will be described. Figure 3
FIG. 3 is a diagram showing a first embodiment of the present invention.

【0047】図4、図5、図12にそのフローチャート
を示す。図6は本実施例の候補文字列の抽出例を示す図
である。図7は画像認識装置の文字列抽出部を示す図で
ある。
The flowcharts are shown in FIGS. 4, 5 and 12. FIG. 6 is a diagram showing an example of extracting candidate character strings in this embodiment. FIG. 7 is a diagram showing a character string extraction unit of the image recognition device.

【0048】図8は画像認識装置の文字認識部を示す図
である。画像の読み込み、ベクター・データの発生、ベ
クターのグループ化および文字要素と図形要素の分離は
前記従来例のように行うため、その詳細な説明は省略す
る(図12参照)。
FIG. 8 is a diagram showing a character recognition unit of the image recognition apparatus. Since the image reading, vector data generation, vector grouping, and character element / graphic element separation are performed as in the conventional example, detailed description thereof is omitted (see FIG. 12).

【0049】図7に示すように文字情報テーブル212
に格納された文字要素に対して(図4のS21)、文字
列抽出部205の周辺探索部401は注目する文字要素
の周辺に他の文字要素が存在するかどうか探索する(図
4のS22)。
As shown in FIG. 7, the character information table 212
For the character element stored in (S21 in FIG. 4), the peripheral search unit 401 of the character string extraction unit 205 searches for another character element around the target character element (S22 in FIG. 4). ).

【0050】探索した結果、文字要素が存在する場合は
(図4のS23)、注目する文字要素の重心と探索され
た任意の他の文字要素の重心の距離を距離計算部404
が計算し、任意の他の文字要素の傾きと任意の他の文字
要素に注目する文字要素を統合したときの傾きとの差を
角度計算部405が計算し、その得られた距離および角
度より統合評価部402において文字列として統合でき
る可能性を評価値として表し、距離および角度が小さけ
れば小さい程高い評価値が与えられる。
If a character element exists as a result of the search (S23 in FIG. 4), the distance calculation unit 404 calculates the distance between the center of gravity of the character element of interest and the center of gravity of any other searched character element.
Is calculated by the angle calculation unit 405, and the angle calculation unit 405 calculates the difference between the inclination of any other character element and the inclination when the character element of interest to the other arbitrary character element is integrated, and from the obtained distance and angle. The possibility of being integrated as a character string in the integrated evaluation unit 402 is represented as an evaluation value, and the smaller the distance and the angle, the higher the evaluation value.

【0051】但し、角度と距離の評価の重みは距離の重
みの方が高いようになっている。周辺探索部401によ
って複数の文字要素が探索された場合には、探索された
任意の文字要素を探索された他の文字要素に変え、前述
の処理を同様に行う。
However, the weight of the evaluation of the angle and the distance is higher than the weight of the distance. When a plurality of character elements are searched by the peripheral search unit 401, the searched arbitrary character element is changed to another searched character element, and the above-described processing is similarly performed.

【0052】以上の処理を上記注目する文字要素につい
て探索された全ての文字要素に対して行い、それぞれの
評価値を求める。判定部403でしきい値を設定し、統
合評価部402によって得られた評価値の中からしきい
値より大きい評価値をもつ全ての文字要素の統合を候補
文字列として抽出する。
The above processing is performed for all the character elements searched for the noted character element to obtain respective evaluation values. The determination unit 403 sets a threshold value, and from the evaluation values obtained by the integrated evaluation unit 402, the integration of all character elements having an evaluation value larger than the threshold value is extracted as a candidate character string.

【0053】このため、ある文字要素が複数の文字列へ
統合可能な場合が存在する。この文字列抽出の処理を文
字情報テーブル212の全ての文字要素に対して行う
(図4のS20)。
Therefore, there is a case where a certain character element can be integrated into a plurality of character strings. This character string extraction processing is performed for all the character elements of the character information table 212 (S20 of FIG. 4).

【0054】図6のように文字要素が複数の文字列に統
合可能な場合(図4のS24)は、その複数の文字列を
候補文字列(図6(a)のT41、T42、T43と
(b)のTTT、444、123)として抽出し(図4
のS25)、各候補文字列の構成文字及び文字を共有す
る他の候補文字列をリンク情報として各候補文字列に付
与する。
When the character elements can be integrated into a plurality of character strings as shown in FIG. 6 (S24 in FIG. 4), the plurality of character strings are regarded as candidate character strings (T41, T42, T43 in FIG. 6A). (B) TTT, 444, 123) and extracted (FIG. 4).
S25), the constituent characters of each candidate character string and other candidate character strings sharing the character are added to each candidate character string as link information.

【0055】また、文字要素が1つの文字列のみに統合
可能な場合は独立文字列(ある文字列の構成文字が他の
文字列の構成文字とならない文字列)としてに抽出する
(図4のS26)。
When a character element can be integrated into only one character string, it is extracted as an independent character string (a character string in which the constituent characters of one character string do not become the constituent characters of another character string) (see FIG. 4). S26).

【0056】文字列抽出の結果及びリンク情報は、文字
情報テーブル212に格納される。文字情報テーブル2
12に格納された独立文字列または候補文字列の傾き情
報及び各文字の位置情報に基づき、文字認識部206の
画像切り出し部501はフレームメモリ209より一文
字分の画像を切り出す(図4のS28)。
The result of the character string extraction and the link information are stored in the character information table 212. Character information table 2
The image cutout unit 501 of the character recognition unit 206 cuts out an image of one character from the frame memory 209 based on the inclination information of the independent character string or the candidate character string stored in 12 and the position information of each character (S28 in FIG. 4). .

【0057】切り出された文字画像を認識するために
は、文字画像の特徴と辞書505の標準パターンの特徴
と照合する。その際、文字の特徴と辞書505の標準パ
ターンの特徴との照合の方向性を合わせるために図8に
示す画像回転部502によって独立文字列または候補文
字列の傾きに応じた回転処理を切り出された各文字画像
に施して正規化画像を作成し、特徴抽出部503によっ
て特徴を抽出した後、その正規化画像の特徴と辞書50
5の標準パターンの特徴を特徴照合部504で照合し文
字の認識結果を得る(図4のS29)。
In order to recognize the cut out character image, the characteristics of the character image are compared with the characteristics of the standard pattern in the dictionary 505. At that time, in order to match the direction of collation between the character feature and the feature of the standard pattern of the dictionary 505, the image rotation unit 502 shown in FIG. 8 cuts out rotation processing according to the inclination of the independent character string or the candidate character string. The normalized image is created by applying it to each character image, the features are extracted by the feature extraction unit 503, and then the features of the normalized image and the dictionary 50 are extracted.
The characteristics of the standard pattern of No. 5 are collated by the characteristic collating unit 504 to obtain a character recognition result (S29 in FIG. 4).

【0058】この認識処理を全ての独立文字列及び候補
文字列について行い、得られた文字の認識結果は文字情
報テーブル212に格納する(図4のS27)。文字列
評価部301は、複数の候補文字列(図6(a)と
(b)、矢印は文字列の方向)を持つ文字群が存在する
場合に、その文字群の複数の候補文字列の各々につい
て、認識結果を評価する。
This recognition processing is performed for all the independent character strings and candidate character strings, and the obtained character recognition result is stored in the character information table 212 (S27 in FIG. 4). When a character group having a plurality of candidate character strings (FIGS. 6 (a) and 6 (b), the arrow indicates the direction of the character string) is present, the character string evaluation unit 301 determines whether or not a plurality of candidate character strings of the character group are present. For each, the recognition result is evaluated.

【0059】具体的には、候補文字列を構成する文字の
認識不能文字数を計数して(図4のS31)、リンク情
報に基づいた全候補文字列の認識不能文字数を計数後
(図4のS30)、認識不能率が最小である候補文字列
を正解として出力し、文字情報テーブル212の他の候
補文字列についてはこれを削除する(図5のS32)。
Specifically, the number of unrecognizable characters of the characters forming the candidate character string is counted (S31 of FIG. 4), and the number of unrecognizable characters of all candidate character strings based on the link information is counted (see FIG. 4). S30), the candidate character string having the smallest unrecognizable rate is output as a correct answer, and the other candidate character strings in the character information table 212 are deleted (S32 in FIG. 5).

【0060】図6(a)における候補文字列の文字列方
向は水平であるため、候補文字列を構成する各文字に回
転処理を施し正規化を行う必要はない。そして、その候
補文字列を構成する各文字の特徴を抽出し、辞書505
の標準パターンの特徴と照合すると、各文字は正方向で
あるため正しく認識される。
Since the character string direction of the candidate character string in FIG. 6A is horizontal, it is not necessary to perform rotation processing on each character forming the candidate character string for normalization. Then, the feature of each character that constitutes the candidate character string is extracted, and the dictionary 505 is extracted.
When compared with the features of the standard pattern of, each character is correctly recognized because it is in the positive direction.

【0061】一方、同図(b)における候補文字列の文
字列方向は垂直であるため、その候補文字列を構成する
各文字に90度の回転処理を施した正規化画像を作成す
る。しかし、その正規化画像から特徴を抽出し、辞書5
05の標準パターンの特徴と照合したとしても、候補文
字列を構成する各文字は正方向でないため認識不能また
は誤認識となる。
On the other hand, since the character string direction of the candidate character string in FIG. 6B is vertical, a normalized image is created by rotating each character forming the candidate character string by 90 degrees. However, the features are extracted from the normalized image, and the dictionary 5
Even if the characters of the standard pattern of No. 05 are matched, each character forming the candidate character string is not in the normal direction, and thus cannot be recognized or is erroneously recognized.

【0062】従って、図6(a)と(b)に示される各
候補文字列の認識不能率を比較すると、(a)に示され
る候補文字列の認識不能率のほうが低いため、(a)に
示される候補文字列が認識結果として出力され、(b)
に示される候補文字列は削除される。
Therefore, comparing the unrecognizable rates of the candidate character strings shown in FIGS. 6A and 6B, the unrecognizable rate of the candidate character strings shown in FIG. 6A is lower. The candidate character string shown in is output as a recognition result, and (b)
The candidate character string shown in is deleted.

【0063】次に第2の実施例について説明する。図9
は本発明の第2の実施例を示す図である。図4、図1
0、図12にそのフローチャートを示す。
Next, the second embodiment will be described. Figure 9
FIG. 6 is a diagram showing a second embodiment of the present invention. 4 and 1
0, the flowchart is shown in FIG.

【0064】第2の実施例が第1の実施例と異なる点
は、文字列評価部301に代えて文字列選択部302に
した点である。尚、第1の実施例と同様の処理を行うと
ころはその説明を省略する(図12及び図4参照)。
The second embodiment differs from the first embodiment in that the character string evaluation unit 301 is replaced by a character string selection unit 302. Incidentally, the description of the same processing as that of the first embodiment will be omitted (see FIGS. 12 and 4).

【0065】文字列選択部302において各候補文字列
の認識不能文字数を計数し(図4のS31)、計数し終
わった後(図4のS30)、文字情報テーブル212の
候補文字列のうち、設定基準(例えば、認識不能率が1
/3以下など)を満たさない候補文字列は削除し、設定
基準を満たしている候補文字列は通信制御部208を経
由してホストコンピュータ214に送り、ホストコンピ
ュータ214の制御に基づきディスプレイ(DP)21
5に表示される(図10のS33)。
In the character string selection unit 302, the number of unrecognizable characters of each candidate character string is counted (S31 in FIG. 4), and after counting (S30 in FIG. 4), among the candidate character strings in the character information table 212, Setting criteria (for example, the unrecognizable rate is 1
/ 3 or less) is deleted, and the candidate character string satisfying the setting criterion is sent to the host computer 214 via the communication control unit 208, and the display (DP) is controlled under the control of the host computer 214. 21
5 is displayed (S33 in FIG. 10).

【0066】ディスプレイ215に表示された候補文字
列をホストコンピュータ214に接続されるマンマシン
インターフェース(MMI)216でオペレータに何れ
かの選択を行わせるが、表示された候補文字列が認識さ
れるべき画像と異なるとオペレータが判断した場合、リ
ンク情報に基づき他の候補文字列を表示し選択させる
(図10のS34)。
The man-machine interface (MMI) 216 connected to the host computer 214 allows the operator to select one of the candidate character strings displayed on the display 215, but the displayed candidate character string should be recognized. If the operator determines that the image is different from the image, another candidate character string is displayed and selected based on the link information (S34 in FIG. 10).

【0067】一方、第1および第2の実施例における図
形情報テーブル211の図形要素に対しては、ベクター
演算部207において、従来同様、直線・円・円弧等の
図形プリミティブ認識が行われ、結果は再び図形情報テ
ーブル211に格納される。
On the other hand, with respect to the graphic elements of the graphic information table 211 in the first and second embodiments, in the vector operation unit 207, graphic primitives such as straight lines, circles and arcs are recognized as in the conventional case, and the result is obtained. Are again stored in the graphic information table 211.

【0068】以上により画像の認識が終了し、図形情報
テーブル211及び文字情報テーブル212の認識結果
が通信制御部208を経由してCADプログラムまた
は、マッピング・プログラムを有するワークステーショ
ン等のホストコンピュータ214へ出力される。
The image recognition is completed as described above, and the recognition results of the graphic information table 211 and the character information table 212 are passed to the host computer 214 such as a workstation having a CAD program or a mapping program via the communication control unit 208. Is output.

【0069】ホストコンピュータ214では、認識結果
を表示してオペレータによる確認・修正作業が行われた
後、CAD図面データベースあるいはマッピング・デー
タベースへ格納され、CADシステムにて、例えば図面
を作成する際に情報として用いられる。
In the host computer 214, after the recognition result is displayed and confirmation / correction work is performed by the operator, the recognition result is stored in the CAD drawing database or the mapping database, and information is created when the CAD system creates a drawing, for example. Used as.

【0070】[0070]

【発明の効果】以上説明したように、本発明によれば、
文字列の方向とその文字列を構成する各文字の底辺が基
本的に平行である書式に従った画像を読み取る画像認識
装置において、精度の高い文字認識機能を提供すること
が可能であり、設計図面・地図等のデータ・ベース作成
の効率化に寄与するところが大きい。
As described above, according to the present invention,
It is possible to provide a highly accurate character recognition function in an image recognition device that reads an image according to a format in which the direction of a character string and the bases of the characters that make up the character string are basically parallel. It greatly contributes to the efficiency of data base creation such as drawings and maps.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の第1の原理図である。FIG. 1 is a first principle diagram of the present invention.

【図2】本発明の第2の原理図である。FIG. 2 is a second principle diagram of the present invention.

【図3】本発明の第1の実施例である。FIG. 3 is a first embodiment of the present invention.

【図4】本発明の第1及び第2の実施例のフローチャー
トである。
FIG. 4 is a flowchart of the first and second embodiments of the present invention.

【図5】本発明の第1の実施例のフローチャートであ
る。
FIG. 5 is a flowchart of the first embodiment of the present invention.

【図6】本実施例の候補文字列抽出例を示す図である。FIG. 6 is a diagram showing an example of candidate character string extraction according to the present embodiment.

【図7】画像認識装置の文字列抽出部を示す図である。FIG. 7 is a diagram showing a character string extraction unit of the image recognition device.

【図8】画像認識装置の文字認識部を示す図である。FIG. 8 is a diagram showing a character recognition unit of the image recognition device.

【図9】本発明の第2の実施例である。FIG. 9 is a second embodiment of the present invention.

【図10】本発明の第2の実施例のフローチャートであ
る。
FIG. 10 is a flow chart of a second embodiment of the present invention.

【図11】従来例を示す図である。FIG. 11 is a diagram showing a conventional example.

【図12】従来例のフローチャート(その1)である。FIG. 12 is a flowchart (part 1) of a conventional example.

【図13】従来例のフローチャート(その2)である。FIG. 13 is a flowchart (part 2) of a conventional example.

【図14】ベクターのグループ化を示す図である。FIG. 14 is a diagram showing grouping of vectors.

【図15】文字列の作成例を示す図である。FIG. 15 is a diagram showing an example of creating a character string.

【符号の説明】[Explanation of symbols]

1 入力手段 2 文字列抽出部 3 文字認識部 4 文字列評価部 5 画像 6 文字列選択部 1 Input means 2 Character string extractor 3 Character recognition part 4 Character string evaluation section 5 images 6 Character string selection section

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 少なくとも所定の書式に従って書かれた
文字を有する画像(5)を読み取り、該文字から抽出し
た特徴と辞書の標準パターンの特徴を比較して、当該文
字の認識を行う画像認識装置において、 前記画像(5)のうち少なくとも前記文字を読み取る入
力手段(1)と、 個々の文字を周囲条件により統合し文字列として抽出す
る際に、文字が複数の文字列へ統合可能な場合に該複数
の文字列を候補文字列として抽出する文字列抽出部
(2)と、 前記候補文字列の構成文字を切り出し、該候補文字列の
傾きに応じ該構成文字の正規化画像を作成し、該正規化
画像の特徴と辞書の標準パターンの特徴との照合を行い
該構成文字を認識する文字認識部(3)と、 前記複数の候補文字列の認識不能文字数を計数し、該複
数の候補文字列の認識不能率が最小である候補文字列を
認識結果として出力する文字列評価部(4)を有するこ
とを特徴とする画像認識装置。
1. An image recognition device for recognizing a character by reading an image (5) having a character written according to at least a predetermined format and comparing the feature extracted from the character with the feature of a standard pattern in a dictionary. In the case where the characters can be integrated into a plurality of character strings when the character is integrated by the input means (1) for reading at least the character in the image (5) and extracted as a character string according to ambient conditions. A character string extraction unit (2) for extracting the plurality of character strings as a candidate character string, cutting out the constituent characters of the candidate character string, and creating a normalized image of the constituent characters according to the inclination of the candidate character string, A character recognition unit (3) for recognizing the constituent characters by matching the characteristics of the normalized image with the characteristics of the standard pattern of the dictionary, counting the number of unrecognizable characters of the plurality of candidate character strings, and calculating the plurality of candidates. String of Image recognition apparatus characterized by having a character string evaluation unit 識不 efficiency is output as the recognition result candidate character string is a minimum (4).
【請求項2】 少なくとも所定の書式に従って書かれた
文字を有する画像(5)を読み取り、該文字から抽出し
た特徴と辞書の標準パターンの特徴を比較して、当該文
字の認識を行う画像認識装置において、 前記画像(5)のうち少なくとも前記文字を読み取る入
力手段(1)と、 個々の文字を周囲条件により統合し文字列として抽出す
る際に、文字が複数の文字列へ統合可能な場合に該複数
の文字列を候補文字列として抽出する文字列抽出部
(2)と、 前記候補文字列の構成文字を切り出し、該候補文字列の
傾きに応じ該構成文字の正規化画像を作成し、該正規化
画像の特徴と辞書の標準パターンの特徴との照合を行い
該構成文字を認識する文字認識部(3)と、 前記複数の候補文字列の認識不能文字数を計数し、該複
数の候補文字列の認識不能率が設定基準を満たす候補文
字列を全て認識結果として出力し、該認識結果の何れか
を選択させる文字列選択部(6)を有することを特徴と
する画像認識装置。
2. An image recognition apparatus for recognizing a character by reading an image (5) having a character written according to at least a predetermined format, comparing the feature extracted from the character with the feature of a standard pattern of a dictionary. In the case where the characters can be integrated into a plurality of character strings when the character is integrated by the input means (1) for reading at least the character in the image (5) and extracted as a character string according to ambient conditions. A character string extraction unit (2) for extracting the plurality of character strings as a candidate character string, cutting out the constituent characters of the candidate character string, and creating a normalized image of the constituent characters according to the inclination of the candidate character string, A character recognition unit (3) for recognizing the constituent characters by matching the characteristics of the normalized image with the characteristics of the standard pattern of the dictionary, counting the number of unrecognizable characters of the plurality of candidate character strings, and calculating the plurality of candidates. String of Output as all recognition result candidate character string 識不 efficiency meets the set criteria, the image recognition apparatus characterized by having character string selection unit for selecting one of said recognition result (6).
【請求項3】 少なくとも所定の書式に従って書かれた
文字を有する画像を読み取り、該文字から抽出した特徴
と辞書の標準パターンの特徴を比較して、当該文字の認
識を行う認識方法において、 前記画像のうち少なくとも前記文字を読み取り、 個々の文字を周囲条件により統合し文字列として抽出す
る際に、文字が複数の文字列へ統合可能な場合に該複数
の文字列を候補文字列として抽出し、 前記候補文字列の構成文字を切り出し、該候補文字列の
傾きに応じ該構成文字の正規化画像を作成し、該正規化
画像の特徴と辞書の標準パターンの特徴との照合を行い
該構成文字を認識し、 前記複数の候補文字列の認識不能文字数を計数し、該複
数の候補文字列の認識不能率が最小である候補文字列を
認識結果として出力することを特徴とする認識方法。
3. A recognition method for recognizing a character by reading an image having at least a character written according to a predetermined format, comparing the feature extracted from the character with the feature of a standard pattern of a dictionary, and recognizing the character. Of at least the above characters are read, and when the individual characters are integrated according to ambient conditions and extracted as a character string, when the characters can be integrated into a plurality of character strings, the plurality of character strings are extracted as candidate character strings, The constituent characters of the candidate character string are cut out, a normalized image of the constituent characters is created according to the inclination of the candidate character string, and the characteristics of the normalized image and the characteristics of the standard pattern of the dictionary are compared to perform the constituent characters. Is recognized, the number of unrecognizable characters of the plurality of candidate character strings is counted, and the candidate character string having the smallest unrecognizable rate of the plurality of candidate character strings is output as a recognition result. Method.
【請求項4】 少なくとも所定の書式に従って書かれた
文字を有する画像を読み取り、該文字から抽出した特徴
と辞書の標準パターンの特徴を比較して、当該文字の認
識を行う認識方法において、 前記画像のうち少なくとも前記文字を読み取り、 個々の文字を周囲条件により統合し文字列として抽出す
る際に、文字が複数の文字列へ統合可能な場合に該複数
の文字列を候補文字列として抽出し、 前記候補文字列の構成文字を切り出し、該候補文字列の
傾きに応じ該構成文字の正規化画像を作成し、該正規化
画像の特徴と辞書の標準パターンの特徴との照合を行い
該構成文字を認識し、 前記複数の候補文字列の認識不能文字数を計数し、該複
数の候補文字列の認識不能率が設定基準を満たす候補文
字列を全て認識結果として出力し、該認識結果の何れか
を選択させることを特徴とする認識方法。
4. A recognition method for recognizing a character by reading an image having at least a character written according to a predetermined format, comparing the feature extracted from the character with the feature of a standard pattern in a dictionary, and recognizing the character. Of at least the above characters are read, and when the individual characters are integrated according to ambient conditions and extracted as a character string, when the characters can be integrated into a plurality of character strings, the plurality of character strings are extracted as candidate character strings, The constituent characters of the candidate character string are cut out, a normalized image of the constituent characters is created according to the inclination of the candidate character string, and the characteristics of the normalized image and the characteristics of the standard pattern of the dictionary are compared to perform the constituent characters. Is recognized, the number of unrecognizable characters of the plurality of candidate character strings is counted, all candidate character strings whose unrecognizable rate of the plurality of candidate character strings satisfy a setting criterion are output as a recognition result, and the recognition result is obtained. Recognition method for causing selected one of.
JP3184242A 1991-07-24 1991-07-24 Device and method for image recognition Withdrawn JPH0528305A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3184242A JPH0528305A (en) 1991-07-24 1991-07-24 Device and method for image recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3184242A JPH0528305A (en) 1991-07-24 1991-07-24 Device and method for image recognition

Publications (1)

Publication Number Publication Date
JPH0528305A true JPH0528305A (en) 1993-02-05

Family

ID=16149872

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3184242A Withdrawn JPH0528305A (en) 1991-07-24 1991-07-24 Device and method for image recognition

Country Status (1)

Country Link
JP (1) JPH0528305A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000062243A1 (en) * 1999-04-14 2000-10-19 Fujitsu Limited Character string extracting device and method based on basic component in document image

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000062243A1 (en) * 1999-04-14 2000-10-19 Fujitsu Limited Character string extracting device and method based on basic component in document image

Similar Documents

Publication Publication Date Title
JP2003308480A (en) On-line handwritten character pattern recognizing editing device and method, and computer-aided program to realize method
EP1374148B1 (en) Method and device for recognition of a handwritten pattern
JP6900164B2 (en) Information processing equipment, information processing methods and programs
US20190379795A1 (en) Image processing device, image processing method, image processing program, and recording medium storing program
JPH08167000A (en) Device and method for character recognition
US6035062A (en) Character recognition method and apparatus
JP2016170677A (en) Program for document image processing and image processor and character recognition device using the program
KR101486495B1 (en) Shape clustering in post optical character recognition processing
JP4208566B2 (en) Document image search apparatus and method, document image search system, and program
JPH0528305A (en) Device and method for image recognition
JP3319203B2 (en) Document filing method and apparatus
JPH08263587A (en) Method and device for document input
JP3727422B2 (en) Character recognition apparatus and method
JP4221960B2 (en) Form identification device and identification method thereof
JP2001147990A (en) Device and method for processing image data and storage medium to be utilized therefor
JP3419251B2 (en) Character recognition device and character recognition method
JP4697387B2 (en) Document image determination apparatus, document image determination method and program thereof
TWI773444B (en) Image recognition system and method
US20210381837A1 (en) Apparatus and method of setting navigation destination
JPS61239378A (en) Discrimination processor
JP2622004B2 (en) Character recognition device
JP3428504B2 (en) Character recognition device
JPH07107698B2 (en) Character recognition method
JP2851865B2 (en) Character recognition device
JP2918363B2 (en) Character classification method and character recognition device

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19981008