JPH07282199A - Picture pattern identifying and recognizing method - Google Patents

Picture pattern identifying and recognizing method

Info

Publication number
JPH07282199A
JPH07282199A JP6291794A JP29179494A JPH07282199A JP H07282199 A JPH07282199 A JP H07282199A JP 6291794 A JP6291794 A JP 6291794A JP 29179494 A JP29179494 A JP 29179494A JP H07282199 A JPH07282199 A JP H07282199A
Authority
JP
Japan
Prior art keywords
pattern
image pattern
binary
binary mask
mask pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6291794A
Other languages
Japanese (ja)
Other versions
JP3301467B2 (en
Inventor
Norihiro Hagita
紀博 萩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP29179494A priority Critical patent/JP3301467B2/en
Publication of JPH07282199A publication Critical patent/JPH07282199A/en
Application granted granted Critical
Publication of JP3301467B2 publication Critical patent/JP3301467B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

PURPOSE:To reduce the burden of the correcting work on a user in the case of erroneous recognition, and simultaneously, to easily add a recognized pattern to a dictionary so that the identification and the addition of the said pattern can be executed hereafter. CONSTITUTION:A binary image pattern storage circuit 1 stores the binary image pattern of the character or the graphic of an object to be identified or recognized. A binary mask pattern storage circuit 3 stores the standard dictionary of the binary mask pattern of a character or a graphic category. A normalization processing circuit 2 inputs the image pattern of the binary image pattern storage circuit 1, and executes the normalization of a position or side. An identification.recognition judgement circuit 4 collates the normalized image pattern and the binary mask pattern classified by category with each other, and executes identification, rejection or recognition processing. A binary mask pattern generation circuit 5 generates the binary mask pattern from the image pattern recognized erroneously or not yet learnt, and executes the addition and the alteration of the contents of the binary mask pattern storage circuit 3.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は入力パターンが白または
黒で表わされる2値パターンの画像パターン同定・認識
方法に関する。2値パターンの代表例である印刷漢字、
手書き漢字、英数字、記号、数式、図形など多くの文字
・図形カテゴリを対象とする場合には、かすれ、つぶれ
などの雑音が加わった画像、縞模様などからなるデザイ
ン処理を施した文字画像、さらには白抜き文字などを認
識する文字認識方法に適用できる。また災害、医療など
で用いる多項目の診断結果をもとに、システムで起きる
複数の障害や病気のカテゴリを認識する方法にも適用で
きる。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image pattern identification / recognition method for a binary pattern in which an input pattern is represented by white or black. Printed kanji, which is a typical example of a binary pattern,
When targeting many character / graphic categories such as handwritten Chinese characters, alphanumeric characters, symbols, mathematical expressions, and graphics, images with noise such as faintness and crushing, character images that have undergone design processing consisting of striped patterns, etc. Further, the present invention can be applied to a character recognition method for recognizing white characters. It can also be applied to a method of recognizing a plurality of categories of disorders and diseases that occur in a system based on the diagnostic results of many items used in disasters, medical care, and the like.

【0002】[0002]

【従来の技術】従来、漢字OCR(Optical Characte
r Reader)などの文字認識処理装置や図面認識装置で
は、文字や図形パターンから認識のための特徴をベクト
ルの形で抽出し、予め作成してある標準辞書内の各カテ
ゴリの標準パターンベクトルとの間で類似度または相違
度などの識別関数を求めて、もっとも類似した文字また
は図形カテゴリを認識結果とする方法が知られている。
従来の文字認識などの特徴ベクトルの要素には、文字線
の方向や接続関係、位置関係などの文字線構造を反映し
た特徴量が広く用いられているが、特異なテキスチャで
構成されているデザイン文字や、かすれ、つぶれ、文字
背景雑音などが激しい画像に対して、これらの特徴量が
大きく変動してしまい、十分な認識精度を得ることがほ
とんど不可能であった。
2. Description of the Related Art Traditionally, Kanji OCR (Optical Character)
In a character recognition processing device such as r Reader) or a drawing recognition device, a feature for recognition is extracted in the form of a vector from a character or a graphic pattern, and the feature pattern is compared with a standard pattern vector of each category in a standard dictionary created in advance. A method is known in which a discriminant function such as similarity or dissimilarity is obtained, and the most similar character or figure category is used as the recognition result.
Characteristic quantities that reflect character line structures such as character line direction, connection relationships, and positional relationships are widely used for the elements of conventional feature vectors such as character recognition, but a design with a unique texture. It was almost impossible to obtain sufficient recognition accuracy because these feature values fluctuate greatly with respect to an image with severe characters, faintness, blurring, character background noise, and the like.

【0003】また、従来の文字認識で入力の白黒パター
ンを特徴ベクトルの要素とし、予め作成してある標準辞
書内の各カテゴリの標準パターンベクトル(特徴ベクト
ルと同様に2値パターンで表現)との間で共に黒画素と
なる数をもとにした識別関数として、単純類似度が知ら
れている。しかし、この方法では、特異なテキスチャで
構成されているデザイン文字や文字背景雑音などが激し
い画像に対して、標準パターンベクトルの黒画素数が多
いカテゴリに誤認識してしまう問題があった。
In the conventional character recognition, an input / output black-and-white pattern is used as an element of a feature vector, and a standard pattern vector (represented by a binary pattern similar to the feature vector) of each category in a standard dictionary created in advance. A simple similarity is known as a discriminant function based on the number of black pixels between the pixels. However, with this method, there is a problem in that an image having a design texture or a character background noise that is composed of a peculiar texture is erroneously recognized as a category having a large number of black pixels in the standard pattern vector.

【0004】[0004]

【発明が解決しようとする課題】上記のように、従来の
OCRをはじめとする認識技術は、デザイン文字、かす
れ、つぶれ、文字背景雑音、白ぬき文字混在などによっ
て誤認識となる文字などを正しく認識できる手法が十分
に確立していないという問題点があった。本発明の目的
は、デザイン文字やかすれ、つぶれなどの激しい文字変
形、白ぬき文字が混在した文字列などに対処できる認識
機能をもつ画像パターンの同定・認識方法を提供するこ
とにある。
As described above, the conventional recognition technology such as OCR correctly recognizes characters which are erroneously recognized due to design characters, faintness, crushing, character background noise, and non-white characters. There was a problem that the recognizable method was not fully established. It is an object of the present invention to provide an image pattern identification / recognition method having a recognition function capable of coping with design characters, severe character deformation such as faint and crushed characters, and character strings in which blank characters are mixed.

【0005】[0005]

【課題を解決するための手段】第一の方法として、入力
2値画像パターンの黒部が、ある認識カテゴリAの2値
マスクパターンの黒部に含まれ、かつ、この入力2値画
像パターンの黒部が、その認識カテゴリAの2値マスク
パターンの黒部とそれとは別の他の認識カテゴリBの2
値マスクパターンの黒部との重複部分だけに含まれるも
のでない場合に、その入力2値画像パターンは認識カテ
ゴリAに属すると同定する方法がある。さらに、こうし
た手順での認識カテゴリが存在しない場合、入力2値画
像パターンの黒部が認識カテゴリAの2値マスクパター
ンの黒部とそれとは別の他の認識カテゴリBの2値マス
クパターンの黒部との重複部分だけに含まれる場合には
棄却するように構成してもよい。これらの方法では黒部
に着目しているが、白部に着目して同様な手順を構成し
てもよい。
As a first method, a black part of an input binary image pattern is included in a black part of a binary mask pattern of a certain recognition category A, and the black part of the input binary image pattern is included. , The black part of the binary mask pattern of the recognition category A and the other two of the other recognition category B different from that.
There is a method of identifying that the input binary image pattern belongs to the recognition category A when it is not included only in the overlapping portion with the black portion of the value mask pattern. Furthermore, when there is no recognition category in such a procedure, the black part of the input binary image pattern is the black part of the binary mask pattern of the recognition category A and the black part of the other binary mask pattern of the recognition category B. If it is included only in the overlapping portion, it may be rejected. Although these methods focus on the black part, the same procedure may be configured by focusing on the white part.

【0006】第二の方法として、2値画像パターンと2
値マスクパターンが、共に黒画素となる数をもとにして
第一の一致度を、共に白画素となる数をもとにして第二
の一致度を、2値画像パターンが白画素となり2値マス
クパターンが黒画素となる数をもとにして第一の不一致
度を、2値画像パターンが黒画素となり2値マスクパタ
ーンが白画素となる数をもとにして第二の不一致度を求
め、第一の一致度と第二の一致度をもとにして第三の一
致度を求め、第一の不一致度と第二の不一致度をもとに
して第三の不一致度を求め、第三の一致度と第三の不一
致度をもとにして2値画像パターンと2値マスクパター
ンの類似度を求め、その類似度が最大となる認識カテゴ
リにその2値画像パターンは属すると認識する方法があ
る。この方法による場合、パターン内の位置すべてを用
いずとも、パターン内の位置を予め複数個選択してお
き、その複数個の位置においてこれらの一致度と不一致
度を求めるように手順を構成してもよい。
As a second method, binary image patterns and 2
The value mask pattern has a first degree of matching based on the number of black pixels, and the second degree of matching with a number of white pixels on the binary mask pattern. The first degree of disagreement is based on the number of black pixels in the value mask pattern, and the second degree of disagreement is based on the number of black pixels in the binary image pattern and white pixels in the binary mask pattern. Then, the third degree of coincidence is obtained based on the first degree of coincidence and the second degree of coincidence, and the third degree of disagreement is obtained based on the first degree of disagreement and the second degree of disagreement. The similarity between the binary image pattern and the binary mask pattern is calculated based on the third degree of coincidence and the third degree of disagreement, and the binary image pattern is recognized as belonging to the recognition category having the highest degree of similarity. There is a way to do it. In this method, even if not all positions in the pattern are used, a plurality of positions in the pattern are selected in advance, and the procedure is configured to obtain the degree of coincidence and the degree of disagreement at the plurality of positions. Good.

【0007】第三の方法として、予め各認識カテゴリの
各2値マスクパターン毎にしきい値を設定しておき、2
値画像パターンと各2値マスクパターンとの上記類似度
を求め、ただ一つの認識カテゴリに対してのみ、2値画
像パターンとその認識カテゴリの2値マスクパターンと
の上記類似度がその2値マスクパターンのしきい値以上
となる場合に、2値画像パターンはその認識カテゴリに
属すると同定する方法がある。さらに、この手順によっ
ては入力2値画像パターンがいずれの認識カテゴリにも
属せず、かつ二以上の認識カテゴリに対してこの2値画
像パターンとその認識カテゴリの2値マスクパターンと
の上記類似度がその2値マスクパターンのしきい値以上
となる場合には、入力2値画像パターンを棄却するよう
構成してもよい。
As a third method, a threshold value is set in advance for each binary mask pattern of each recognition category and 2
The similarity between the binary image pattern and each binary mask pattern is obtained, and the similarity between the binary image pattern and the binary mask pattern of the recognition category is the binary mask for only one recognition category. There is a method of identifying a binary image pattern as belonging to the recognition category when it is equal to or larger than the threshold value of the pattern. Further, according to this procedure, the input binary image pattern does not belong to any recognition category, and for two or more recognition categories, the degree of similarity between this binary image pattern and the binary mask pattern of the recognition category is the same. May be configured to reject the input binary image pattern when is greater than or equal to the threshold value of the binary mask pattern.

【0008】そして、第一の方法ないし第三の方法を組
み合わせてもよい。
The first method to the third method may be combined.

【0009】なお、第一の方法ないし第三の方法におい
て、入力2値画像パターンの黒部または白部の情報をも
とに所定の類似度を用いて、反復学習により2値マスク
パターンを新規作成、追加、または更新してもよい。
In the first method to the third method, a binary mask pattern is newly created by iterative learning using a predetermined similarity based on the information on the black part or the white part of the input binary image pattern. , May be added or updated.

【0010】[0010]

【作用】上記構成によれば、入力された2値画像パター
ンと、予め作成済みの認識カテゴリ毎の各2値マスクパ
ターンを照合して、該2値画像パターンが属する認識カ
テゴリを効率よく同定、認識または棄却することができ
る。また、入力画像パターンの情報をもとに、反復学習
によって2値マスクパターンを新規作成、追加、または
更新することができる。
According to the above configuration, the input binary image pattern is collated with each binary mask pattern created in advance for each recognition category to efficiently identify the recognition category to which the binary image pattern belongs, Can be recognized or rejected. Further, a binary mask pattern can be newly created, added, or updated by iterative learning based on the information of the input image pattern.

【0011】[0011]

【実施例】以下、本発明の一実施例について図面により
説明する。図1は本発明の方法を適用する画像パターン
同定・認識処理装置の構成例を示すブロック図で、1は
2値画像パターン記憶回路、2は正規化処理回路、3は
2値マスクパターン記憶回路、4は同定・認識判定回
路、5は2値マスクパターン作成回路、6は画像入出力
装置である。2値画像パターン記憶回路1は、同定また
は認識する文字や図形の2値画像パターンを記憶してい
る。該2値画像パターンはn画素からなり、例えば白画
素は“0”、黒画素は“1”である。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing a configuration example of an image pattern identification / recognition processing device to which the method of the present invention is applied. 1 is a binary image pattern storage circuit, 2 is a normalization processing circuit, 3 is a binary mask pattern storage circuit. Reference numeral 4 is an identification / recognition determination circuit, 5 is a binary mask pattern creation circuit, and 6 is an image input / output device. The binary image pattern storage circuit 1 stores binary image patterns of characters or figures to be identified or recognized. The binary image pattern consists of n pixels, for example, white pixels are "0" and black pixels are "1".

【0012】正規化処理回路2は、2値画像パターン記
憶回路1から取り出されたn画素からなる2値画像パタ
ーンを入力し、例えば、従来から知られている重心と2
次モーメントを用いて位置および大きさの正規化処理を
行う。2値マスクパターン記憶回路3は、入力画像パタ
ーンの同定および認識判定に用いる各カテゴリの2値マ
スクパターンを、あらかじめ各カテゴリ毎に一つあるい
は複数(一般には複数)記憶している。
The normalization processing circuit 2 inputs a binary image pattern consisting of n pixels extracted from the binary image pattern storage circuit 1, and, for example, the conventionally known center of gravity and 2
Position and size are normalized using the second moment. The binary mask pattern storage circuit 3 stores in advance one or a plurality (generally a plurality) of binary mask patterns of each category used for identification and recognition determination of an input image pattern.

【0013】同定・認識判定回路4は、正規化処理回路
2からn画素の2値画像パターンを入力し、2値マスク
パターン記憶回路3の各カテゴリの2値マスクパターン
と照合して、例えば、入力画像パターンの黒部(または
白部)が特定のカテゴリの2値マスクパターンの黒部
(または白部)に含まれ、かつ、その2値マスクパター
ン黒部(または白部)と他のカテゴリの2値マスクパタ
ーン黒部(または白部)との重複部分だけに含まれてい
なければ、その特定のカテゴリであると同定、認識し、
入力画像パターンの黒部(または白部)がその重複部分
だけに含まれている場合は棄却し、それ以外の場合は入
力画像パターンの白部または黒部の情報をもとに、公知
の類似度等の識別関数または白ぬき文字などを高精度に
認識する識別関数による認識または棄却を行い、認識結
果を出力する。
The identification / recognition determination circuit 4 inputs the binary image pattern of n pixels from the normalization processing circuit 2, collates it with the binary mask pattern of each category of the binary mask pattern storage circuit 3, and, for example, The black part (or white part) of the input image pattern is included in the black part (or white part) of the binary mask pattern of a specific category, and the black part (or white part) of the binary mask pattern and the binary of another category If it is not included only in the overlapping part with the mask pattern black part (or white part), it is identified and recognized as that particular category,
If the black part (or white part) of the input image pattern is included only in the overlapping part, it is rejected. In other cases, based on the information of the white part or the black part of the input image pattern, the known similarity degree, etc. The identification function or the identification function for recognizing a white-colored character with high accuracy is recognized or rejected, and the recognition result is output.

【0014】2値マスクパターン作成回路5は、画像入
出力装置6から出力される画像情報および正規化処理回
路2から追加・更新または新規作成カテゴリの正規化さ
れた2値画像パターンを入力し、2値マスクパターンを
作成する。該2値マスクパターン作成回路5で作成され
た2値マスクパターンが、2値マスクパターン記憶回路
3に新規に登録、あるいは、該2値マスクパターン記憶
回路3の内容に追加・更新される。
The binary mask pattern creating circuit 5 receives the image information output from the image input / output device 6 and the normalized binary image pattern of the addition / update or newly created category from the normalization processing circuit 2, Create a binary mask pattern. The binary mask pattern created by the binary mask pattern creation circuit 5 is newly registered in the binary mask pattern storage circuit 3, or added / updated to the contents of the binary mask pattern storage circuit 3.

【0015】画像入出力装置6は、同定・認識判定回路
4から出力される文字または図形カテゴリ番号、識別関
数値、2値画像パターンなどの分類結果の情報を入力
し、該情報を表示し、また、例えば、キーボードやマウ
スなどによって画像情報を入力し、表示する。さらに、
該画像入出力装置6は2値マスクパターン作成回路5に
2値マスクパターンの新規作成または更新に必要となる
情報を送出する。
The image input / output device 6 inputs the information of the classification result such as the character or figure category number, the discrimination function value, and the binary image pattern output from the identification / recognition determination circuit 4, and displays the information. Further, for example, the image information is input and displayed by a keyboard or a mouse. further,
The image input / output device 6 sends to the binary mask pattern creating circuit 5 information necessary for new creation or update of the binary mask pattern.

【0016】初めに、図1を参照して、入力画像パター
ンの同定および認識処理について説明する。2値画像パ
ターン記憶回路1から同定・認識対象文字の2値画像パ
ターンが読み出され、正規化処理回路2において該文字
画像パターンに対して位置および大きさの正規化が行わ
れた後、同定・認識判定回路4に入力される。ここで、
正規化処理回路2で正規化された文字画像パターンを正
規化文字パターンXと呼ぶことにする。正規化文字パタ
ーンXは、X=(x1,x2,…,xi,…xn)なるn個
の要素をもつベクトルで表現でき、各要素xiは画像位
置i(=1,2,…,n)の画素値(例えばxi
“0”を白点、xi=“1”を黒点とする)を表す。
First, the input image pattern identification and recognition processing will be described with reference to FIG. After the binary image pattern of the character to be identified / recognized is read from the binary image pattern storage circuit 1, the position and size of the character image pattern are normalized in the normalization processing circuit 2, and then the character image pattern is identified. -It is input to the recognition determination circuit 4. here,
The character image pattern normalized by the normalization processing circuit 2 will be referred to as a normalized character pattern X. The normalized character pattern X can be expressed by a vector having n elements such that X = (x 1 , x 2 , ..., X i , ... X n ), and each element x i is an image position i (= 1, 2, 1. , ..., N) pixel values (eg, x i =
“0” is a white dot, and x i = “1” is a black dot).

【0017】同定・認識判定回路4は、正規化文字パタ
ーンXに対して、2値マスクパターン記憶回路3の第j
文字カテゴリ(j=1,2,…,J)のk番目(k=
1,2,…,Kj)の2値マスクパターンMjkと照合す
る。MjkはMjk=(m1,m2,…mi,…,mnjkで表
すと、各miは2値をとり、例えばmi=“0”ならば白
点、mi=“1”なら黒点を表す。
The identification / recognition determination circuit 4 operates on the jth character of the binary mask pattern storage circuit 3 for the normalized character pattern X.
Character category (j = 1, 2, ..., J) kth (k =
1, 2, ..., K j ) binary mask pattern M jk . When M jk is expressed as M jk = (m 1 , m 2 , ... M i , ..., M n ) jk , each m i takes a binary value, for example, if m i = “0”, a white point, m i = “1” indicates a black dot.

【0018】照合の例として、正規化文字パターンXと
2値マスクパターンMjkとを照合する場合を説明する。
図2に、処理フローチャートの一例を示す。はじめに、
正規化文字パターンXの要素xiと2値マスクパターン
jkの要素miとの間で、(a)xi=“1”となる個数
Aと、(b)mi=“1”となる個数Bjkと、(c)xi
=“1”かつmi=“1”となる個数Cjkと、(d)xi
=“1”かつmi=“0”となる個数Djkと、を計数す
る(ステップ101)。
As an example of collation, a case where the normalized character pattern X and the binary mask pattern M jk are collated will be described.
FIG. 2 shows an example of a processing flowchart. First,
Between the element x i of the normalized character pattern X and the element m i of the binary mask pattern M jk , (a) x i = “1”, the number A, and (b) m i = “1”, B jk and (c) x i
The number C jk such that = "1" and m i = "1", and (d) x i
The number D jk for which "= 1" and m i = "0" is counted (step 101).

【0019】次に、以下に示す条件(1)から条件
(3)まで、順に判定処理を行い、同定、棄却、認識を
判定する(ステップ102)。 条件(1):もし、Cjk≦BjkかつA=Cjkを満たす文
字カテゴリjがただ1個のカテゴリしか存在しない場
合、入力文字は文字カテゴリjに同定できたと判定する
(ステップ110)。 条件(2):もし、Cjk≦BjkかつA=Cjkを満たす文
字カテゴリjが2個以上存在する場合、入力文字は棄却
と判定する(ステップ120)。 条件(3):条件(1)、条件(2)を満す文字カテゴ
リが1個もない場合は、正規化文字パターンXと2値マ
スクパターンMjkとの間で、背景雑音の激しい文字や白
抜き文字を認識する識別関数あるいは公知の識別関数を
用いて認識処理を行い(ステップ103)、認識または
棄却を判定する(ステップ104)。そして、認識され
た場合、その文字カテゴリを候補カテゴリとする(ステ
ップ130)。
Next, determination processing is performed in order from the following condition (1) to condition (3), and identification, rejection, and recognition are determined (step 102). Condition (1): If there is only one character category j satisfying C jk ≦ B jk and A = C jk , it is determined that the input character can be identified as the character category j (step 110). Condition (2): If there are two or more character categories j satisfying C jk ≦ B jk and A = C jk , it is determined that the input character is rejected (step 120). Condition (3): When there is no character category that satisfies the conditions (1) and (2), characters with a lot of background noise or between the normalized character pattern X and the binary mask pattern M jk or A recognition process is performed using a discriminant function for recognizing white characters or a known discriminant function (step 103), and recognition or rejection is determined (step 104). If recognized, the character category is set as a candidate category (step 130).

【0020】ここで、条件(3)の場合の認識処理(ス
テップ103)の一実施例として、識別関数に本発明に
よる新しい類似度SH(X,Mjk)を用いる場合につい
て説明する。即ち、正規化文字パターンXの黒画素数A
に対して、次式で表す類似度SH(X,Mjk)を計算す
る。
Here, as an example of the recognition processing (step 103) in the case of the condition (3), the case where the new similarity S H (X, M jk ) according to the present invention is used for the discriminant function will be described. That is, the number of black pixels A of the normalized character pattern X
Then, the similarity S H (X, M jk ) represented by the following equation is calculated.

【0021】[0021]

【数1】 [Equation 1]

【0022】認識の判定結果としては、最大の類似度を
もつ文字カテゴリjを第1位に認識した文字カテゴリと
して出力する。この場合、類似度SH(X,Mjk)は文
字線の方向や接続関係などの文字線構造に関する特徴量
を抽出しなくてすむため、特徴抽出の処理が簡易にな
り、しかも、かすれ、つぶれ、文字背景の雑音などによ
って、これらの文字線構造が変形しても認識性能に影響
を受けにくい特長を持っている。なお、条件(3)の場
合の認識処理では、上記類似度SH(X,Mjk)の絶対
値|SH(X,Mjk)|を識別関数に用いてもよい。
As the recognition determination result, the character category j having the maximum similarity is output as the first recognized character category. In this case, since the similarity S H (X, M jk ) does not need to extract the feature amount related to the character line structure such as the direction of the character line and the connection relationship, the feature extraction process is simplified, and the blurring Even if these character line structures are deformed due to crushing, noise in the character background, etc., the recognition performance is not easily affected. In the recognition processing in the case of the condition (3) is the similarity S H (X, M jk) the absolute value of | S H (X, M jk ) | may be used to identify the function.

【0023】次に、同定・認識・棄却判定処理の具体的
な処理を図3を参照して説明する。図3は、n=16
(画素)、2文字カテゴリ(j=1,2)、K1=1,
2=2の場合の正規化文字パターンXと2値マスクパ
ターンMjkとの例を示したものである。11は2値マス
クパターンM11(第1文字カテゴリの第1番目の2値マ
スクパターン)で、mi=“1”となる個数B11=8で
ある。12は2値マスクパターンM21(第2文字カテゴ
リの第1番目の2値マスクパターン)で、mi=“1”
となる個数B21=7である。 13は2値マスクパター
ンM22(第2文字カテゴリの第2番目の2値マスクパタ
ーン)で、mi=“1”となる個数B22=8である。2
1〜26は正規化文字パターンXの6つのパターン例で
ある。なお、正規化文字パターン25は正規化文字パタ
ーン24の正規化文字パターンを白黒反転した白抜き文
字パターンを示したものである。
Next, a specific process of the identification / recognition / rejection determination process will be described with reference to FIG. In FIG. 3, n = 16
(Pixel), two-character category (j = 1, 2), K 1 = 1,
It shows an example of a normalized character pattern X and a binary mask pattern M jk when K 2 = 2. Reference numeral 11 denotes a binary mask pattern M 11 (first binary mask pattern of the first character category), and the number B 11 = 8 for mi = “1”. 12 is a binary mask pattern M 21 (first binary mask pattern in the second character category), and m i = “1”
Therefore, the number B 21 = 7. Reference numeral 13 is a binary mask pattern M 22 (second binary mask pattern of the second character category), and the number B 22 = 8 where m i = “1”. Two
1 to 26 are six pattern examples of the normalized character pattern X. The normalized character pattern 25 is a white-out character pattern obtained by inverting the normalized character pattern of the normalized character pattern 24 in black and white.

【0024】初めに、正規化文字パターン21の正規化
文字パターンXと2値マスクパターン11〜13の各2
値マスクパターンMjkとを照合する場合を説明する。x
i=“1”となる個数A=5で、xi=“1”かつmi
“1”となる個数はそれぞれC11=5,C21=4,C22
=3となり、2値マスクパターン11の2値マスクパタ
ーンM11だけが、条件(1)を満たすため、正規化文字
パターン21の正規化文字パターンXは、第1文字カテ
ゴリに同定される。
First, each of the normalized character pattern X of the normalized character pattern 21 and each of the binary mask patterns 11 to 13 is used.
A case of matching with the value mask pattern M jk will be described. x
When the number A is 5 where i = “1”, x i = “1” and m i =
The numbers of "1" are C 11 = 5, C 21 = 4 and C 22 respectively.
= 3 and only the binary mask pattern M 11 of the binary mask pattern 11 satisfies the condition (1), so the normalized character pattern X of the normalized character pattern 21 is identified in the first character category.

【0025】次に、正規化文字パターン22の正規化文
字パターンXの場合は、A=6で、xi=“1”かつmi
=“1”となる個数はそれぞれC11=5,C21=6,C
22=5となり、2値マスクパターンM21だけが、条件
(1)を満たすため、正規化文字パターン22の正規化
文字パターンXは、第2文字カテゴリに同定される。
Next, in the case of the normalized character pattern X of the normalized character pattern 22, A = 6, x i = “1” and m i
The numbers for which “= 1” are C 11 = 5, C 21 = 6, and C, respectively.
Since 22 = 5 and only the binary mask pattern M 21 satisfies the condition (1), the normalized character pattern X of the normalized character pattern 22 is identified as the second character category.

【0026】次に、正規化文字パターン23の正規化文
字パターンXの場合は、A=4で、xi=“1”かつmi
=“1”となる個数はそれぞれC11=4,C21=4,C
22=3となり、2値マスクパターン11の2値マスクパ
ターンM11と2値マスクパターン12の2値マスクパタ
ーンM21が、条件(2)を満たすため、正規化文字パタ
ーン23の正規化文字パターンXは、棄却される。
Next, in the case of the normalized character pattern X of the normalized character pattern 23, A = 4, x i = “1” and m i
= 11 are the numbers of C 11 = 4, C 21 = 4, C
22 = 3, and the binary mask pattern M 11 of the binary mask pattern 11 and the binary mask pattern M 21 of the binary mask pattern 12 satisfy the condition (2). Therefore, the normalized character pattern 23 is the normalized character pattern 23. X is rejected.

【0027】また、正規化文字パターン24の正規化文
字パターンXの場合は、A=7で、xi=“1”かつmi
=“1”となる個数はそれぞれC11=5,C21=6,C
22=6となり、2値マスクパターン11〜13のいずれ
の2値マスクパターンも、条件(1)および(2)を満
たさないため、条件(3)の識別関数が実行される。
In the case of the normalized character pattern X of the normalized character pattern 24, A = 7, x i = "1" and m i.
The numbers for which “= 1” are C 11 = 5, C 21 = 6, and C, respectively.
Since 22 = 6 and none of the binary mask patterns 11 to 13 satisfy the conditions (1) and (2), the discrimination function of the condition (3) is executed.

【0028】この場合、正規化文字パターン24の正規
化文字パターンXと2値マスクパターン11〜13の各
2値マスクパターンMjkとの類似度SHは、
In this case, the similarity S H between the normalized character pattern X of the normalized character pattern 24 and each of the binary mask patterns M jk of the binary mask patterns 11 to 13 is

【0029】[0029]

【数2】 [Equation 2]

【0030】となり、2値マスクパターン12の2値マ
スクパターンM21が最も類似度が高くなり、第2文字カ
テゴリが第1位の認識結果となる。
Then, the binary mask pattern M 21 of the binary mask pattern 12 has the highest similarity, and the second character category is the first recognition result.

【0031】最後に、正規化パターン25の正規化パタ
ーンX、すなわち正規化文字パターン24を白黒反転し
た白ぬき文字パターンの場合は、A=9で、xi
“1”かつmi=“1”となる個数は、それぞれC11
3,C21=1,C22=2となり、2値マスクパターン1
1〜13のいずれの2値マスクパターンMjkも条件
(1)および(2)を満たさないため、条件(3)の識
別関数が実行される。ここで、識別関数として、上記の
類似度SH(X,Mjk)に代えて、その絶対値|S
H(X,Mjk)|を用いた場合、正規化文字パターン2
5の正規化文字パターンXと2値マスクパターン11〜
13の各2値マスクパターンMjkとの類似度|SH
は、
Finally, in the case of a normalized pattern X of the normalized pattern 25, that is, a white character pattern in which the normalized character pattern 24 is reversed in black and white, A = 9 and x i =
The numbers of "1" and m i = "1" are C 11 =
3, C 21 = 1 and C 22 = 2, and binary mask pattern 1
Since none of the binary mask patterns M jk of 1 to 13 satisfy the conditions (1) and (2), the discriminant function of the condition (3) is executed. Here, as the discriminant function, instead of the similarity S H (X, M jk ), the absolute value | S
When H (X, M jk ) | is used, the normalized character pattern 2
5 normalized character pattern X and binary mask patterns 11 to 11
Each binary mask pattern M jk and similarity of 13 | S H |
Is

【0032】[0032]

【数3】 [Equation 3]

【0033】となり、2値マスクパターン12の2値マ
スクパターンM21が最も類似度が高くなり、正規化文字
パターン24の白黒反転パターンである正規化文字パタ
ーン25に対しても、同様に第2文字カテゴリが第1位
の認識結果となる。
Then, the binary mask pattern M 21 of the binary mask pattern 12 has the highest degree of similarity, and similarly for the normalized character pattern 25, which is the black-and-white inverted pattern of the normalized character pattern 24, the second The character category is the first recognition result.

【0034】次に、上述した条件(3)の認識処理(ス
テップ103)の他の実施例を説明する。次の実施例で
は、条件(3)の場合の認識処理における識別関数とし
て、下式に示す本発明による他の新規な類似度S
c(X,Mjk)を用いる。
Next, another embodiment of the recognition process (step 103) for the above-mentioned condition (3) will be described. In the following example, as the discriminant function in the recognition process under the condition (3), another novel similarity S according to the present invention shown in the following formula
c (X, M jk ) is used.

【0035】[0035]

【数4】 [Equation 4]

【0036】この新規の類似度Sc(X,Mjk)の分子
の項は、入力と2値マスクパターンで、 xi=“1”か
つmi=“1”となる個数Cjkとxi=“0”かつmi
“0”となる個数(n−Bjk−Djk)との積から、xi
=“0”かつmi=“1”となる個数(Bjk−Cjk)と
i=“1”かつmi=“0”となる個数Djkとの積を差
し引いた値から、 Cjk(n−Bjk−Djk)−(Bjk−Cjk)・Djk=n・
jk−A・Bjk と導いたものである。図3に示す正規化文字パターン2
4の正規化文字パターンXと各2値マスクパターン11
〜13の各2値マスクパターンMjkとの類似度Scは、
The numerator term of this new similarity S c (X, M jk ) is the number C jk and x where x i = “1” and m i = “1” in the input and the binary mask pattern. i = "0" and m i =
From the product with the number of “0” (n−B jk −D jk ), x i
= "0" and the value obtained by subtracting the product of the m i = "1" and becomes the number (B jk -C jk) and x i = "1" and m i = "0" becomes the number D jk, C jk (n−B jk −D jk ) − (B jk −C jk ) · D jk = n ·
It is derived from C jk- A · B jk . Normalized character pattern 2 shown in FIG.
4 normalized character pattern X and each binary mask pattern 11
The similarity S c with each binary mask pattern M jk of

【0037】[0037]

【数5】 [Equation 5]

【0038】となり、類似度SH(X,Mjk)を用いた
場合と同様に、2値マスクパターン12の2値マスクパ
ターンM21が最も類似度が高くなり、第2文字カテゴリ
が第1位の認識結果となる。
As in the case of using the similarity S H (X, M jk ), the binary mask pattern M 21 of the binary mask pattern 12 has the highest similarity and the second character category is the first. It becomes the recognition result of rank.

【0039】また、正規化文字パターン24を白黒反転
した白抜き文字パターンである正規化文字パターン25
の正規化文字パターンXの場合に、条件(3)の識別関
数の実行において、識別関数として類似度Sc(X,M
jk)の絶対値|Sc(X,Mj k)|を用いたとき、正規
化文字パターン25と各2値マスクパターン11〜13
との類似度|Sc|は、
Further, a normalized character pattern 25, which is an outline character pattern obtained by inverting the normalized character pattern 24 in black and white.
In the case of the normalized character pattern X of, the similarity S c (X, M
jk ) absolute value | S c (X, M j k ) | is used, the normalized character pattern 25 and each binary mask pattern 11 to 13
And the similarity | S c |

【0040】[0040]

【数6】 [Equation 6]

【0041】となり、2値マスクパターン12の2値マ
スクパターンM21が最も類似度が高くなり、正規化文字
パターン24の場合と同様に、正規化文字パターン25
に対しても、第2文字カテゴリが第1位の認識結果とな
る。
Then, the binary mask pattern M 21 of the binary mask pattern 12 has the highest similarity, and the normalized character pattern 25 is the same as the case of the normalized character pattern 24.
Also, the second character category is the first recognition result.

【0042】次に、同定・棄却判定処理の他の方法を説
明する。この方法では、上記の条件(1)〜(3)の判
定において、識別関数に前述した新規の類似度S
c(X,Mj k)を用い処理を行う。なお、以下の説明で
は、上記の条件(1)〜(3)に対応する条件を、それ
ぞれ条件(1a)〜(3a)とする。
Next, another method of the identification / rejection determination processing will be described. In this method, in the determination of the above conditions (1) to (3), the new similarity S described above for the discriminant function is used.
Processing is performed using c (X, M j k ). In the following description, the conditions corresponding to the above conditions (1) to (3) will be referred to as conditions (1a) to (3a), respectively.

【0043】この同定・認識・棄却判定処理では、正規
化文字パターンXの要素xiと2値マスクパターンMjk
の要素miとの間で、前記のA、Bjk、Cjkを計数し
(ステップ101参照)、類似度Sc(X,Mjk)を計
算し、予め2値マスクパターン記憶回路3に格納された
各2値マスクパターンの同定しきい値tjkを用いて、以
下に示す条件(1a)〜(3a)の処理を順次行う(ス
テップ102参照)。なお、2値マスクパターンの同定
しきい値tjkの設定方法の詳細については、後述する。
In this identification / recognition / rejection determination processing, the element x i of the normalized character pattern X and the binary mask pattern M jk
A, B jk , and C jk are counted with the element m i of the above (see step 101), and the similarity S c (X, M jk ) is calculated, and stored in the binary mask pattern storage circuit 3 in advance. Using the stored identification threshold value t jk of each binary mask pattern, the processes of the following conditions (1a) to (3a) are sequentially performed (see step 102). The details of the method of setting the identification threshold value t jk of the binary mask pattern will be described later.

【0044】条件(1a):Sc(X,Mjk)≧tjk
満たす文字カテゴリjがただ1個のカテゴリしか存在し
ない場合、入力文字は文字カテゴリjに同定できたと判
定する(ステップ110参照)。
Condition (1a): When there is only one character category j satisfying S c (X, M jk ) ≧ t jk , it is determined that the input character can be identified in the character category j (step 110). reference).

【0045】条件(2a):Sc(X,Mjk)≧tjk
満たす文字カテゴリjが2個以上存在する場合、入力文
字は棄却と判定する(ステップ120参照)。
Condition (2a): When there are two or more character categories j satisfying S c (X, M jk ) ≧ t jk , it is determined that the input character is rejected (see step 120).

【0046】条件(3a):条件(1a)または条件
(2a)を満す文字カテゴリが1個もない場合は、正規
化文字パターンXと2値マスクパターンMjkとの間で、
類似度Scを識別関数として用いて認識処理を行い(ス
テップ103参照)、類似度Sc(X,Mjk)≧ujk
満たす文字カテゴリjが存在する場合は、最も類似度が
高い、2値マスクパターンMjkの文字カテゴリを第1位
の認識結果として出力する(ステップ130参照)。他
方、類似度Sc(X,Mjk)≧ujkを満たす文字カテゴ
リjが存在しない場合、すなわち、すべての2値マスク
パターンMjkについて類似度Sc(X,Mjk)<ujk
なる場合は、認識棄却と判定する(ステップ120参
照)。なお、変数ujkは、各2値マスクパターンMjk
ついて、予め設定してある棄却判定のためのしきい値で
あり、同定しきい値tjkよりもさらに小さい値(uj k
jk)に設定されている。
Condition (3a): When there is no character category satisfying condition (1a) or condition (2a), between the normalized character pattern X and the binary mask pattern M jk ,
The recognition process is performed using the similarity S c as a discriminant function (see step 103), and when there is a character category j that satisfies the similarity S c (X, M jk ) ≧ u jk , the similarity is highest. The character category of the binary mask pattern M jk is output as the first recognition result (see step 130). On the other hand, when there is no character category j that satisfies the similarity S c (X, M jk ) ≧ u jk , that is, the similarity S c (X, M jk ) <u jk for all the binary mask patterns M jk. If so, it is determined to be recognition rejection (see step 120). The variable u jk is a preset threshold value for rejection determination for each binary mask pattern M jk , and is a value smaller than the identification threshold value t jk (u j k <
t jk ).

【0047】ここで、同定、棄却判定処理の具体的な処
理を再び図3を参照して説明する。初めに、正規化文字
パターン22の正規化文字パターンXと2値マスクパタ
ーン11〜13の各2値マスクパターンMjkと照合する
場合を説明する。正規化文字パターン22と各2値マス
クパターン11〜13との類似度Sc
Here, the specific processing of the identification / rejection determination processing will be described with reference to FIG. 3 again. First , a case where the normalized character pattern X of the normalized character pattern 22 is compared with each binary mask pattern M jk of the binary mask patterns 11 to 13 will be described. The similarity S c between the normalized character pattern 22 and each of the binary mask patterns 11 to 13 is

【0048】[0048]

【数7】 [Equation 7]

【0049】となり、2値マスクパターンM21だけが条
件(1a)を満たすため、正規化文字パターン22の正
規化文字パターンXは第2文字カテゴリに同定される。
次に、正規化文字パターン26の場合は、2値マスクパ
ターン11〜13の各2値マスクパターンとの類似度S
cは、
Since only the binary mask pattern M 21 satisfies the condition (1a), the normalized character pattern X of the normalized character pattern 22 is identified as the second character category.
Next, in the case of the normalized character pattern 26, the similarity S with each binary mask pattern of the binary mask patterns 11 to 13 is S.
c is

【0050】[0050]

【数8】 [Equation 8]

【0051】となり、2値マスクパターン11の2値マ
スクパターンM11と2値マスクパターン12の2値マス
クパターンM21が条件(2a)を満たすため、26の正
規化文字パターンXは棄却される。また、正規化文字パ
ターン23の場合は、各2値マスクパターン11〜13
との類似度Scは、
Since the binary mask pattern M 11 of the binary mask pattern 11 and the binary mask pattern M 21 of the binary mask pattern 12 satisfy the condition (2a), 26 normalized character patterns X are rejected. . Further, in the case of the normalized character pattern 23, each of the binary mask patterns 11 to 13
And the similarity S c is

【0052】[0052]

【数9】 [Equation 9]

【0053】となり、2値マスクパターン11〜13の
いずれの2値マスクパターンも条件(1a)及び条件
(2a)を満たさないため、条件(3a)の類似度Sc
の識別関数が実行される。条件(3a)では、2値マス
クパターン12の2値マスクパターンM21が最も類似度
が高いので、第2文字カテゴリが第1位の認識結果とな
る。
Since none of the binary mask patterns 11 to 13 satisfy the condition (1a) and the condition (2a), the similarity S c of the condition (3a) is satisfied.
The discriminant function of is executed. Under the condition (3a), since the binary mask pattern M 21 of the binary mask pattern 12 has the highest similarity, the second character category is the first recognition result.

【0054】次に、誤認識した文字や未学習の文字等か
ら2値マスクパターンを新規に作成し、2値マスクパタ
ーン記憶回路3の内容を追加・更新する処理について、
二、三の実施例を説明する。
Next, regarding the processing for newly creating a binary mask pattern from a character that has been erroneously recognized or an unlearned character, and adding / updating the contents of the binary mask pattern storage circuit 3,
A few examples will be described.

【0055】<実施例1>これは、入力画像パターンの
黒部または白部の情報をもとに、公知の識別関数として
次式に示す類似度Sを用いて、反復学習により2値マス
クパターンを作成する例である。
<Embodiment 1> This is a binary mask pattern obtained by iterative learning using the similarity S shown in the following equation as a known discriminant function based on the information on the black portion or the white portion of the input image pattern. This is an example of creating.

【0056】[0056]

【数10】 [Equation 10]

【0057】まず、画像入出力装置6から、追加・更新
または新規に作成(ここでは追加とする)すべき文字カ
テゴリ(第j文字カテゴリとする)に関する情報が2値
マスクパターン作成回路5に入力される。2値マスクパ
ターン作成回路5は、追加すべき入力画像に対して、正
規化処理回路2から得られる、学習すべき第j文字カテ
ゴリに属するN個の入力画像パターン(正規化文字パタ
ーン)X1,X2,…,XNについて、以下のステップで
新しい2値マスクパターンMj(k+1)を作成する。
First, the image input / output device 6 inputs information on a character category (jth character category) to be added / updated or newly created (added here) to the binary mask pattern creation circuit 5. To be done. The binary mask pattern creation circuit 5 receives N input image patterns (normalized character patterns) X 1 belonging to the j-th character category to be learned, which are obtained from the normalization processing circuit 2 for the input image to be added. , X 2 , ..., X N , a new binary mask pattern M j (k + 1) is created in the following steps.

【0058】(ステップ1)N個の入力画像パターンX
1,X2,…,XNについて、xi=“1”となる個数Aの
合計ATと画素位置iでxi=“1”となる入力画像パタ
ーンXの合計個数Aiを計数する。Aiを大きい順に並べ
替え、その列をA’1,A’2,…,A’l,…,A’n
おくと、予め設定したしきい値a(0<a<1)に対し
(Step 1) N input image patterns X
1, X 2, ..., the X N, which counts the total number A i of the input image pattern X as the x i = "1" a total of A T and the pixel position i of the number A of the x i = "1" . When A i is rearranged in descending order and the columns are set as A ′ 1 , A ′ 2 , ..., A ′ l , ..., A ′ n, with respect to a preset threshold value a (0 <a <1) hand

【0059】[0059]

【数11】 [Equation 11]

【0060】を満すLを求める。ただし、Nが小さい場
合、たとえばN=1の場合はa=1とする。
L that satisfies the above condition is determined. However, when N is small, for example, when N = 1, a = 1 is set.

【0061】(ステップ2)l=1,2,…,Lの各順
位に対応する画像位置iについて、2値マスクパターン
j(k+1)の要素をmi=“1”とし、それ以外の画像位
置iをmi=“0”に設定する。
(Step 2) For the image position i corresponding to each rank of l = 1, 2, ..., L, the element of the binary mask pattern M j (k + 1) is set to m i = "1", and The image position i other than is set to m i = “0”.

【0062】(ステップ3)N個の入力画像パターンX
1,X2,…,XNの各画像Xtとステップ2で作成した2
値マスクパターンMj(k+1)との間で類似度S(Xt,M
j(k+1))を計算し、最大類似度となる画像Xtを求め、
その画像Xtを新しい2値マスクパターンMj ( k+1)に置
き換える。
(Step 3) N input image patterns X
Each image X t of 1 , X 2 , ..., X N and 2 created in step 2
The similarity S (X t , M ) with the value mask pattern M j (k + 1)
j (k + 1) ) is calculated to find the image X t having the maximum similarity,
The image X t is replaced with a new binary mask pattern M j ( k + 1) .

【0063】(ステップ4)再度、N個の入力画像
1,X2,…,XNについて、各画像Xlと、すでに2値
マスクパターン記憶回路3に記憶されているすべての2
値マスクパターンMjkおよびステップ3で作成した2値
マスクパターンMj(k+1)との間で類似度Sを計算し、認
識する。もし、N個の画像すべてが第j文字カテゴリに
認識されればステップ6へ、さもなければステップ5へ
いく。
(Step 4) Again, for each of the N input images X 1 , X 2 , ..., X N , each image X l and all the two images already stored in the binary mask pattern storage circuit 3 are input.
The similarity S between the value mask pattern M jk and the binary mask pattern M j (k + 1) created in step 3 is calculated and recognized. If all N images are recognized in the jth character category, go to step 6, otherwise go to step 5.

【0064】(ステップ5)第j文字カテゴリに正しく
認識されたM(<N)個の画像について、ステップ1お
よびステップ2と同様の手順で2値マスクパターンM
j(k+1)を作成し、2値マスクパターン記憶回路3に記憶
する。残りの(N−M)個の画像については、k=k+
1、N=N−Mとしてステップ1へもどる。
(Step 5) For M (<N) images correctly recognized in the jth character category, the binary mask pattern M is processed in the same procedure as in Steps 1 and 2.
j (k + 1) is created and stored in the binary mask pattern storage circuit 3. For the remaining (N−M) images, k = k +
1, N = NM, and the process returns to step 1.

【0065】(ステップ6)ステップ1およびステップ
2と同様の手順で2値マスクパターンMj(k+1)を作成
し、2値マスクパターン記憶回路3に記憶して終了とす
る。
(Step 6) A binary mask pattern M j (k + 1) is created in the same procedure as in Steps 1 and 2, and is stored in the binary mask pattern storage circuit 3 to end the process.

【0066】<実施例2>これは、入力画像パターン
(サンプルパターン)の黒部または白部の情報をもと
に、類似度SHを用いて、反復学習により新規に各文字
カテゴリの2値マスクパターンおよび同定しきい値を作
成する例である。
<Embodiment 2> This is a new binary mask for each character category by iterative learning using the similarity S H based on the information of the black part or white part of the input image pattern (sample pattern). It is an example of creating a pattern and an identification threshold.

【0067】まず、画像入出力装置6から、新規に作成
すべき文字カテゴリ(第j文字カテゴリとする)に関す
る情報が2値マスクパターン作成回路5に入力される。
2値マスクパターン作成回路5は入力画像に対して、正
規化処理回路2から得られる、新規に作成すべき文字カ
テゴリj=1,2,…,Jの各文字カテゴリについて、
以下のステップでKj個の2値マスクパターンMj1,M
j2,…,Mjk,…,Mj k jを作成する。
First, the image input / output device 6 inputs information on a new character category (j-th character category) to be created to the binary mask pattern creation circuit 5.
The binary mask pattern creation circuit 5 obtains from the normalization processing circuit 2 for each input image, for each character category j = 1, 2, ..., J to be newly created,
In the following steps, K j binary mask patterns M j1 , M
Create j2 , ..., M jk , ..., M j k j .

【0068】(ステップ1a)新規に作成すべき第j文
字カテゴリの2値マスクパターンの個数をKj=1とす
る。第j文字カテゴリに属するNj個の入力画像パター
ン(正規化文字パターン)X1,X2,…XNjについて、
i=“1”となる個数ATと画素位置iでxi=“1”
となる個数Aiを計数する。そして、画素位置iのxi
“1”となる個数の割合Ai/Njと全画素のxi
“1”となる個数の割合AT/(nNj)を次式のように
比べて、2値マスクパターンMj1を作成する。もし、A
i/Nj≧AT/(nNj)ならば、 Mj1の要素をmi=“1”に設定 さもなければ、 Mj1の要素をmi=“0”に設定 また、入力画像パターン(正規化文字パターン)X1
2,…,XNjに対して2値マスクパターンMj1の作成
に用いたパターンとしてラベルj1を割り当てる。新規
に作成すべき文字カテゴリすべてについて、上記処理を
行う。
(Step 1a) Let K j = 1 be the number of binary mask patterns of the jth character category to be newly created. For N j input image patterns (normalized character patterns) X 1 , X 2 , ... X Nj belonging to the jth character category,
In x i = "1" Piece A T and the pixel position i x i = "1"
Then, the number A i is calculated. Then, at the pixel position i, x i =
The ratio of the number of “1” s A i / N j and x i of all pixels =
The binary mask pattern M j1 is created by comparing the ratio AT / (nN j ) of the number of “1” as in the following equation. If A
If i / N j ≧ A T / (nN j ), set the element of M j1 to m i = "1", otherwise set the element of M j1 to m i = "0" (Normalized character pattern) X 1 ,
A label j1 is assigned to X 2 , ..., X Nj as the pattern used to create the binary mask pattern M j1 . The above process is performed for all character categories to be newly created.

【0069】(ステップ2a)新規に作成すべき全入力
画像パターンXtについて、全文字カテゴリの全2値マ
スクパターンMjkとの間で類似度SH(Xt,Mjk)を計
算し、最大類似度をもつMlhを求める。いま、すでに入
力画像パターンXtにラベルjkが割り当てられている
とする。もし、l=jならば、Xtは第j文字カテゴリ
に正しく認識できたと判定して、新たにラベルjhを割
り当てる。さもなければ、Xtは誤認識したと判定し
て、新たにラベルjeを割り当てる。この処理終了後
に、もし、全入力画像パターンXtについて、誤認識し
たと判定するXtがなければ、ステップ4aへ進む。さ
もなければ、ステップ3aへ進む。
(Step 2a) For all input image patterns X t to be newly created, the similarity S H (X t , M jk ) with all binary mask patterns M jk of all character categories is calculated, Find M lh with the maximum similarity. Now, it is assumed that the label jk is already assigned to the input image pattern X t . If l = j, X t is determined to be correctly recognized in the j-th character category, and a new label jh is assigned. Otherwise, X t is determined to have been erroneously recognized, and a new label je is assigned. After this process is completed, if for all input image patterns X t, unless erroneous recognized and determines X t is, the flow proceeds to step 4a. Otherwise, go to step 3a.

【0070】(ステップ3a)新規に作成すべき第j文
字カテゴリについてh=1とおく。ラベルjkが割り当
てられているすべての入力画像パターンについて、も
し、入力画像パターンが1つ以上存在すれば、ステップ
1aと同様の手順で新しい2値マスクパターンMjhを作
成し、h=h+1とおく。第j文字カテゴリのKj個の
ラベルすべてについて、この判定処理を行う。次に、も
し、ラベルjeを割り当てられている入力画像パターン
が1つ以上存在するならば、それらの入力画像パターン
tすべてについて、ステップ1aと同様の手順で、一
時的な2値マスクパターンMjeを作成し、すべてのXt
とMjeとの間で類似度SH(Xt,Mje)を計算し、最大
類似度をもつ入力画像パターンXSを新規の2値マスク
パターンMjhとし、h=h+1とおく。第j文字カテゴ
リについて新しい2値マスクパターンの個数をKj=h
とおく。新規に作成すべきすべての文字カテゴリについ
て、この処理を繰り返し、新しい2値マスクパターンを
2値マスクパターン記憶回路3に記憶する。そして、ス
テップ2aへ戻る。
(Step 3a) Set h = 1 for the jth character category to be newly created. For all input image patterns to which the label jk is assigned, if there is one or more input image patterns, a new binary mask pattern M jh is created by the same procedure as in step 1a, and h = h + 1 is set. . This determination process is performed for all K j labels in the j-th character category. Next, if there is one or more input image patterns to which the label je is assigned, the temporary binary mask pattern M is processed for all of these input image patterns X t in the same procedure as in step 1a. create je and all X t
The similarity S H (X t , M je ) is calculated between M je and M je, and the input image pattern X S having the maximum similarity is set as a new binary mask pattern M jh, and h = h + 1. Let K j = h be the number of new binary mask patterns for the jth character category.
far. This process is repeated for all the new character categories to be created, and new binary mask patterns are stored in the binary mask pattern storage circuit 3. Then, the process returns to step 2a.

【0071】(ステップ4a)各2値マスクパターンM
jkと第j文字カテゴリ以外の全入力画像パターンXt
の間で、類似度SH(Xt,Mjk)を計算し、各2値マス
クパターンMjkについての最大類似度tjkを求め、この
最大類似度を2値マスクパターンMjkの同定しきい値t
jkに割り当て、これを2値マスクパターン記憶回路3に
記憶する。全2値マスクパターンについて、これらの処
理が終われば終了する。
(Step 4a) Each binary mask pattern M
jk and between all the input image patterns X t other than the j character category, the similarity S H (X t, M jk ) was calculated to obtain the maximum similarity t jk for each binary mask pattern M jk , The maximum similarity is the identification threshold t of the binary mask pattern M jk.
It is assigned to jk and stored in the binary mask pattern storage circuit 3. When these processes are completed for all binary mask patterns, the process ends.

【0072】<実施例3>これは、類似度SHを用いる
ことは実施例2と同様であるが、誤認識した文字や未学
習文字の画像パターンを用いて2値マスクパターンおよ
び同定しきい値を更新する例である。まず、画像入出力
装置6から、更新すべき文字カテゴリ(第j文字カテゴ
リとする)に関する情報が2値マスクパターン作成回路
5に入力される。2値マスクパターン作成回路5は入力
画像に対して、正規化処理回路2から得られる、更新す
べき文字カテゴリj=1,2,…,Jの各文字カテゴリ
について、以下のステップで2値マスクパターンを更新
する。
<Third Embodiment> This is similar to the second embodiment in that the similarity S H is used, but the binary mask pattern and the identification threshold are determined by using the image pattern of the erroneously recognized character or the unlearned character. It is an example of updating a value. First, the image input / output device 6 inputs information about a character category to be updated (referred to as a j-th character category) to the binary mask pattern creation circuit 5. The binary mask pattern creation circuit 5 performs a binary mask on the input image in the following steps for each of the character categories j = 1, 2, ..., J to be updated, which are obtained from the normalization processing circuit 2. Update the pattern.

【0073】(ステップ1b)更新前の第j文字カテゴ
リの2値マスクパターンの個数をKjとする。更新すべ
き全入力画像パターンXtについて、全文字カテゴリの
全2値マスクパターンMjk(j=1,2…,J)(k=
1,2…,Kj)との間で類似度SH(Xt,Mjk)を計
算し、最大類似度をもつMlhを求める。いま、入力画像
パターンXtが第j文字カテゴリに属するとする。も
し、l≠jならば、Xtは誤認識したと判定して、新た
にラベルjeを割り当てる。更新すべき全文字カテゴリ
について、この処理終了後に、もし、全入力画像パター
ンXtについて、誤認識したと判定するXtがなければ、
ステップ3bへ進む。さもなければ、ステップ2bへ進
む。
(Step 1b) Let K j be the number of binary mask patterns in the j-th character category before updating. For all input image patterns X t to be updated, all binary mask patterns M jk (j = 1, ..., J) (k =
1, 2, ..., K j ) and the similarity S H (X t , M jk ) is calculated to obtain M lh having the maximum similarity. Now, it is assumed that the input image pattern X t belongs to the j-th character category. If l ≠ j, it is determined that X t is erroneously recognized, and a label je is newly assigned. For all character categories to be updated, after this process is completed, if for all input image patterns X t, unless erroneous recognized and determines X t is,
Go to step 3b. Otherwise, go to step 2b.

【0074】(ステップ2b)ラベルjeが割り当てら
れた入力画像パターンXtすべてについて、実施例2の
ステップ1aと同様の手順で、一時的な2値マスクパタ
ーンMjeを作成し、すべてのXtとMjeとの間で類似度
H(Xt,Mje)を計算し、最大類似度をもつ入力画像
パターンXsを追加すべき2値マスクパターンMj(Kj+1)
として2値マスクパターン記憶回路3に記憶する。ま
た、Kj=Kj+1とおき、ステップ1bへ戻る。
(Step 2b) With respect to all the input image patterns X t to which the label je is assigned, a temporary binary mask pattern M je is created by the same procedure as in step 1a of the second embodiment, and all X t. and M similarity S H (X t, M je ) between je was calculated, binary mask pattern should be added to the input image pattern X s having the maximum similarity M j (Kj + 1)
Is stored in the binary mask pattern storage circuit 3. In addition, K j = K j +1 Distant, returns to step 1b.

【0075】(ステップ3b)各2値マスクパターンM
jkと第j文字カテゴリ以外の全入力画像パターンXt
あれば、そのXtとの間で類似度SH(Xt,Mjk)を計
算し、各2値マスクパターンMjkについての最大類似度
t’jkを求め、この最大類似度がすべて2値マスクパタ
ーン記憶回路3に記憶されている同定しきい値tjk(新
規に作成される場合はtjk=−n)よりも大きい場合
は、2値マスクパターンMjkの同定しきい値tjk=t'
jkに更新し、新しい値を2値マスクパターン記憶回路3
に記憶する。全2値マスクパターンについて、これらの
処理が終われば終了する。
(Step 3b) Each binary mask pattern M
If there is jk and all the input image patterns X t other than the j character category, the similarity S H (X t, M jk ) was calculated between the X t, the maximum for each binary mask pattern M jk When the similarity t ′ jk is obtained and the maximum similarity is greater than the identification threshold t jk (t jk = −n when newly created) stored in the binary mask pattern storage circuit 3, Is the identification threshold value t jk = t ′ of the binary mask pattern M jk.
Updated to jk and set new value to binary mask pattern storage circuit 3
Remember. When these processes are completed for all binary mask patterns, the process ends.

【0076】ここで、第2および第3の実施例では、識
別関数に類似度SHを用いた場合を述べたが、識別関数
として、類似度SHの絶対値を用いることも可能であ
る。
Here, in the second and third embodiments, the case where the similarity S H is used as the discriminant function is described, but it is also possible to use the absolute value of the similarity S H as the discriminant function. .

【0077】また、2値マスクパターンを作成する方法
としては、これ以外にも公知の統計的推論による方法
(たとえば「統計学」鈴木哲夫著(朝倉書店)や「Pat
tern classification and scence analysis」 R.O.
Duda and P.E.Hart著(John Wiley & Sons I
ns.))による方法を用いることも可能である。また、
第1の実施例においても、どの文字カテゴリにも含まれ
ない画像パターンがあった場合にも、その画像パターン
を用いて新たな文字カテゴリの2値マスクパターンを作
成することが可能である。
As a method of creating a binary mask pattern, other known methods by statistical inference (for example, "Statistics" by Tetsuo Suzuki (Asakura Shoten) and "Pat") are used.
tern classification and scence analysis ”R.I. O.
Duda and P.D. E. By Hart (John Wiley & Sons I)
ns.)) method can also be used. Also,
Also in the first embodiment, even if there is an image pattern that is not included in any character category, it is possible to create a new binary mask pattern of the character category using the image pattern.

【0078】さらに、以上の説明では文字を中心に示し
たが、図形などの一般の2値画像についても同様に処理
可能である。一例として、医療などで用いる多項目の診
断結果をもとに、病気のカテゴリを認識する方法に適用
する場合を、以下、簡単に説明する。例えば、複数の診
断項目の結果を、図3に示すような2値画像パターンと
してチェックシート上に表し(例えば、血圧の項目であ
れば、血圧が高ければ“1”、低ければ“0”としてそ
の項目に該当する位置に“黒”または“白”で表
す。)、このチェックシート上のパターンを2値画像パ
ターンとして入力し、各病名のカテゴリの典型的な診断
データに基づいて、予め記憶させておいた2値マスクパ
ターンとの照合をとり、病名のカテゴリを認識する。こ
のように、認識対象を2値画像化した後、上記の実施例
のようにして認識することによって、病名のカテゴリの
認識性能を向上させることができる。
Further, in the above description, characters are mainly shown, but general binary images such as figures can be processed in the same manner. As an example, a case where the method is applied to a method for recognizing a category of a disease based on the diagnostic results of many items used in medical treatment will be briefly described below. For example, the results of a plurality of diagnostic items are displayed on a check sheet as a binary image pattern as shown in FIG. 3 (for example, for a blood pressure item, "1" is given if the blood pressure is high, and "0" if it is low. "Black" or "white" is displayed at the position corresponding to that item.) The pattern on this check sheet is input as a binary image pattern and stored in advance based on typical diagnostic data of each disease category. The category of the disease name is recognized by matching with the binary mask pattern that has been set. In this way, the recognition performance of the disease name category can be improved by converting the recognition target into a binary image and then recognizing it as in the above-described embodiment.

【0079】[0079]

【発明の効果】以上説明したようにこの発明によれば、
入力画像パターンと標準辞書に予め記憶してある2値マ
スクパターンとを比較して入力画像を同定・棄却または
認識することにより、OCRの利用者が誤認識やリジェ
クトパターンを逐次、目視により再検査し修正していく
作業において、同定された画像については再検査する必
要が不要となり、仕事の負担が軽減される利点がある。
また、従来の文字認識法では、認識特徴の1要素が深さ
n(n>1)ビットで記憶する場合が多いが、本発明で
は2値マスクパターンの各要素は1ビットで表現できる
ので、記憶容量が1/nに削減できる。さらに、公知の
画像符号化法を併用することで、2値マスクパターンの
記憶容量を更に削減でき、処理効率が高く、辞書容量が
コンパクトですむという利点を持つ。
As described above, according to the present invention,
By identifying, rejecting, or recognizing the input image by comparing the input image pattern with the binary mask pattern stored in advance in the standard dictionary, the OCR user sequentially re-inspects the erroneous recognition and reject pattern by visual inspection. However, it is not necessary to re-examine the identified images in the correction work, which is advantageous in reducing the work load.
In the conventional character recognition method, one element of the recognition feature is often stored with a depth of n (n> 1) bits. However, in the present invention, each element of the binary mask pattern can be represented by one bit. The storage capacity can be reduced to 1 / n. Further, by using the known image encoding method together, the storage capacity of the binary mask pattern can be further reduced, the processing efficiency is high, and the dictionary capacity is compact.

【0080】また、課題を解決する手段の欄で述べた第
一の方法、第二の方法又は第三の方法のいずれの方法に
よっても、文字線の方向や接続関係などの文字線構造に
関する特徴量を抽出しなくてすむため、特徴抽出の処理
が簡易になり、しかも、かすれ、つぶれ、文字背景の雑
音などによって、これらの文字構造が変形しても認識性
能に影響を受けにくい利点がある。かすれ、つぶれ、文
字背景の雑音だけでなく、文字部を黒点、背景を白点と
して構成される画像パターンから作成した2値マスクパ
ターンを用いても、文字部が白点、背景が黒点として構
成される、いわゆる白抜き文字についてのかすれ、つぶ
れ、文字背景の雑音などに対しても高い認識性能をもつ
利点ある。
In addition, according to any one of the first method, the second method, and the third method described in the section of means for solving the problem, the characteristics relating to the character line structure such as the direction of the character line and the connection relation. Since there is no need to extract the amount, there is an advantage that the feature extraction process is simple and the recognition performance is not easily affected even if these character structures are deformed due to blurring, crushing, noise in the character background, etc. . Not only faintness, crushing, and noise in the character background, but also using a binary mask pattern created from an image pattern composed of the character part as black dots and the background as white dots, the character part is configured as white dots and the background as black dots. There is an advantage of having a high recognition performance even with respect to so-called white characters, such as fading, crushing, and background noise.

【0081】なお、第一の方法によれば入力画像パター
ンと標準辞書に予め記憶してある2値マスクパターンと
を比較して入力画像を同定・棄却または認識することに
より、OCRの利用者が誤認識やリジェクトパターンを
逐次、目視により再検査し修正していく作業において、
認識された画像については再検査する必要が不要とな
り、仕事の負担が軽減される利点もある。
According to the first method, the input image pattern is compared with the binary mask pattern stored in advance in the standard dictionary to identify, reject or recognize the input image. In the work of successively re-inspecting and correcting misrecognition and reject patterns,
There is also an advantage that it is not necessary to re-examine the recognized image, and the work load is reduced.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明による画像パターンの同定・認識処理装
置の構成例を示すブロック図である。
FIG. 1 is a block diagram showing a configuration example of an image pattern identification / recognition processing device according to the present invention.

【図2】本発明による同定・棄却・認識の判定処理の一
例のフローチャートである。
FIG. 2 is a flowchart of an example of identification / rejection / recognition determination processing according to the present invention.

【図3】同定・棄却・認識の具体的判定処理を説明する
ためのパターン例を示す図である。
FIG. 3 is a diagram showing a pattern example for explaining a specific determination process of identification / rejection / recognition.

【符号の説明】[Explanation of symbols]

1 2値画像パターン記憶回路 2 正規化処理回路 3 2値マスクパターン記憶回路 4 認識判定回路 5 2値マスクパターン作成回路 6 画像入出力装置 1 binary image pattern storage circuit 2 normalization processing circuit 3 binary mask pattern storage circuit 4 recognition determination circuit 5 binary mask pattern creation circuit 6 image input / output device

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 入力された2値画像パターンに対して、
予め作成済みの認識カテゴリ毎の各2値マスクパターン
と照合して該2値画像パターンが属する認識カテゴリを
決定する画像パターン同定・認識方法であって、 前記入力2値画像パターンの黒部が、第一の認識カテゴ
リの2値マスクパターンの黒部に含まれ、かつ前記入力
2値画像パターンの黒部が、該第一の認識カテゴリの2
値マスクパターンの黒部といずれか別の第二の認識カテ
ゴリの2値マスクパターンの黒部との重複部分だけに含
まれるものでない場合に、前記入力2値画像パターンは
前記第一の認識カテゴリに属すると同定する第一の手順
を有することを特徴とする画像パターン同定・認識方
法。
1. For an input binary image pattern,
An image pattern identification / recognition method for determining a recognition category to which a binary image pattern belongs by collating with a binary mask pattern for each previously created recognition category, wherein a black part of the input binary image pattern is The black part of the input binary image pattern included in the black part of the binary mask pattern of the first recognition category is 2 of the first recognition category.
The input binary image pattern belongs to the first recognition category if the input binary image pattern is not included only in the overlapping portion of the black part of the value mask pattern and the black part of the binary mask pattern of any other second recognition category. An image pattern identification / recognition method having a first procedure of identifying
【請求項2】 前記第一の手順によっては前記入力2値
画像パターンがいずれの認識カテゴリにも属せず、かつ
前記入力2値画像パターンの黒部が前記該第一の認識カ
テゴリの2値マスクパターンの黒部といずれか別の前記
第二の認識カテゴリの2値マスクパターンの黒部との重
複部分だけに含まれる場合に前記入力2値画像パターン
を棄却する第二の手順を有することを特徴とする請求項
1記載の画像パターン同定・認識方法。
2. The input binary image pattern does not belong to any recognition category according to the first procedure, and the black part of the input binary image pattern is a binary mask of the first recognition category. A second step of rejecting the input binary image pattern when it is included only in an overlapping portion of a black portion of a pattern and a black portion of a binary mask pattern of the second recognition category that is different from any one of the other; The image pattern identification / recognition method according to claim 1.
【請求項3】 入力された2値画像パターンに対して、
予め作成済みの認識カテゴリ毎の各2値マスクパターン
と照合して該2値画像パターンが属する認識カテゴリを
決定する画像パターン同定・認識方法であって、 前記入力2値画像パターンの白部が、第一の認識カテゴ
リの2値マスクパターンの白部に含まれ、かつ前記入力
2値画像パターンの白部が、該第一の認識カテゴリの2
値マスクパターンの白部といずれか別の第二の認識カテ
ゴリの2値マスクパターンの白部との重複部分だけに含
まれるものでない場合に、前記入力2値画像パターンは
前記第一の認識カテゴリに属すると同定する第三の手順
を有することを特徴とする画像パターン同定・認識方
法。
3. With respect to the input binary image pattern,
An image pattern identification / recognition method for determining a recognition category to which a binary image pattern belongs by collating with a binary mask pattern for each previously created recognition category, wherein a white part of the input binary image pattern is The white part of the input binary image pattern included in the white part of the binary mask pattern of the first recognition category is 2 of the first recognition category.
The input binary image pattern is not included only in the overlapping part of the white part of the value mask pattern and the white part of the binary mask pattern of any other second recognition category, and the input binary image pattern is the first recognition category. An image pattern identification / recognition method characterized by having a third step of identifying that the image pattern belongs to.
【請求項4】 前記第三の手順によっては前記入力2値
画像パターンがいずれの認識カテゴリにも属せず、かつ
前記入力2値画像パターンの黒部が前記該第一の認識カ
テゴリの2値マスクパターンの白部といずれか別の前記
第二の認識カテゴリの2値マスクパターンの白部との重
複部分だけに含まれる場合に前記入力2値画像パターン
を棄却する第四の手順を有することを特徴とする請求項
3記載の画像パターン同定・認識方法。
4. The input binary image pattern does not belong to any recognition category according to the third procedure, and the black portion of the input binary image pattern is a binary mask of the first recognition category. A fourth step of rejecting the input binary image pattern when it is included only in the overlapping part of the white part of the pattern and the white part of the binary mask pattern of the second recognition category of any other The image pattern identification / recognition method according to claim 3, characterized in that
【請求項5】 入力された2値画像パターンに対して、
予め作成済みの認識カテゴリ毎の各2値マスクパターン
と照合して該2値画像パターンが属する認識カテゴリを
決定する画像パターン同定・認識方法であって、 パターン内の複数の所定位置において前記2値画像パタ
ーンと該2値マスクパターンが共に黒画素となる数をも
とにした第一の一致度と、該複数の所定位置において前
記2値画像パターンと前記2値マスクパターンが共に白
画素となる数をもとにした第二の一致度と、前記複数の
所定位置において前記2値画像パターンが白画素となり
前記2値マスクパターンが黒画素となる数をもとにした
第一の不一致度と、前記複数の所定位置において前記2
値画像パターンが黒画素となり前記2値マスクパターン
が白画素となる数をもとにした第二の不一致度とを求
め、該第一の一致度と該第二の一致度をもとに第三の一
致度を求め、該第一の不一致度と該第二の不一致度をも
とに第三の不一致度を求め、該第三の一致度と該第三の
不一致度をもとにして前記2値画像パターンと前記2値
マスクパターンの類似度を求める第五の手順と、該類似
度が最大の認識カテゴリに前記2値画像パターンは属す
ると認識する第六の手順を有することを特徴とする画像
パターン同定・認識方法。
5. With respect to the input binary image pattern,
An image pattern identification / recognition method for determining a recognition category to which the binary image pattern belongs by collating with a binary mask pattern for each previously created recognition category, wherein the binary value is used at a plurality of predetermined positions in the pattern. A first degree of matching based on the number of black pixels in both the image pattern and the binary mask pattern, and the binary image pattern and the binary mask pattern both become white pixels at the plurality of predetermined positions. A second degree of coincidence based on a number, and a first degree of disagreement based on the number of white pixels in the binary image pattern and black pixels in the binary mask pattern at the plurality of predetermined positions. , 2 at the plurality of predetermined positions
A second degree of disagreement is obtained based on the number in which the value image pattern becomes a black pixel and the binary mask pattern becomes a white pixel, and a second degree of disagreement is obtained based on the first degree of coincidence and the second degree of coincidence. The third degree of coincidence is obtained, the third degree of disagreement is obtained based on the first degree of disagreement and the second degree of disagreement, and based on the third degree of coincidence and the third degree of disagreement. It has a fifth procedure for obtaining a similarity between the binary image pattern and the binary mask pattern, and a sixth procedure for recognizing that the binary image pattern belongs to a recognition category having the maximum similarity. Image pattern identification and recognition method.
【請求項6】 前記パターン内の複数の所定位置として
該パターン内の位置すべてを用いることを特徴とする請
求項5記載の画像パターン同定・認識方法。
6. The image pattern identification / recognition method according to claim 5, wherein all positions in the pattern are used as a plurality of predetermined positions in the pattern.
【請求項7】 入力された2値画像パターンに対して、
予め作成済みの認識カテゴリ毎の各2値マスクパターン
と照合して該2値画像パターンが属する認識カテゴリを
決定する画像パターン同定・認識方法であって、 予め前記各認識カテゴリの前記各2値マスクパターン毎
にしきい値を設定しておく第七の手順と、 パターン内の複数の所定位置において前記2値画像パタ
ーンと該2値マスクパターンが共に黒画素となる数をも
とにした第一の一致度と、該複数の所定位置において前
記2値画像パターンと前記2値マスクパターンが共に白
画素となる数をもとにした第二の一致度と、前記複数の
所定位置において前記2値画像パターンが白画素となり
前記2値マスクパターンが黒画素となる数をもとにした
第一の不一致度と、前記複数の所定位置において前記2
値画像パターンが黒画素となり前記2値マスクパターン
が白画素となる数をもとにした第二の不一致度とを求
め、該第一の一致度と該第二の一致度をもとに第三の一
致度を求め、該第一の不一致度と該第二の不一致度をも
とに第三の不一致度を求め、該第三の一致度と該第三の
不一致度をもとにして前記2値画像パターンと前記2値
マスクパターンの類似度を求める第五の手順と、 ただ一つの認識カテゴリに対してのみ、前記2値画像パ
ターンとその認識カテゴリの2値マスクパターンとの前
記第五の手順における前記類似度がその2値マスクパタ
ーンのしきい値以上となる場合に、前記2値画像パター
ンはその認識カテゴリに同定するとする第八の手順を有
することを特徴とする画像パターン同定・認識方法。
7. The input binary image pattern,
An image pattern identification / recognition method for determining a recognition category to which the binary image pattern belongs by collating with a previously created binary mask pattern for each recognition category. A seventh procedure for setting a threshold value for each pattern, and a first procedure based on the number of black pixels in both the binary image pattern and the binary mask pattern at a plurality of predetermined positions in the pattern. The degree of coincidence, a second degree of coincidence based on the number of white pixels in both the binary image pattern and the binary mask pattern at the plurality of predetermined positions, and the binary image at the plurality of predetermined positions The first degree of disagreement based on the number of patterns that become white pixels and the binary mask pattern that becomes black pixels,
A second degree of disagreement is obtained based on the number in which the value image pattern becomes a black pixel and the binary mask pattern becomes a white pixel, and a second degree of disagreement is obtained based on the first degree of coincidence and the second degree of coincidence. The third degree of coincidence is obtained, the third degree of disagreement is obtained based on the first degree of disagreement and the second degree of disagreement, and based on the third degree of coincidence and the third degree of disagreement. A fifth step of obtaining the degree of similarity between the binary image pattern and the binary mask pattern; and the fifth step of comparing the binary image pattern and the binary mask pattern of the recognition category with respect to only one recognition category. Image pattern identification, which comprises an eighth step of identifying the binary image pattern in the recognition category when the degree of similarity in the fifth step is equal to or greater than the threshold value of the binary mask pattern. -Recognition method.
【請求項8】 前記第八の手順によっては前記入力2値
画像パターンがいずれの認識カテゴリにも属せず、かつ
二つ以上の認識カテゴリに対して前記2値画像パターン
とその認識カテゴリの2値マスクパターンとの前記第五
の手順における前記類似度がその2値マスクパターンの
しきい値以上となる場合に、前記入力2値画像パターン
を棄却する第九の手順を有することを特徴とする請求項
7記載の画像パターン同定・認識方法。
8. The input binary image pattern does not belong to any recognition category according to the eighth procedure, and the binary image pattern and its recognition category are classified into two categories for two or more recognition categories. A ninth step of rejecting the input binary image pattern when the similarity to the value mask pattern in the fifth step is equal to or more than the threshold value of the binary mask pattern. The image pattern identification / recognition method according to claim 7.
【請求項9】 前記入力2値画像パターンの黒部または
白部の情報をもとに所定の類似度を用いて、反復学習に
より2値マスクパターンを新規作成、追加、または更新
する第十の手順を有することを特徴とする請求項1〜8
のいずれか1項に記載の画像パターン同定・認識方法。
9. A tenth procedure for newly creating, adding, or updating a binary mask pattern by iterative learning using a predetermined similarity based on information on a black part or a white part of the input binary image pattern. 1 to 8 are included.
The image pattern identification / recognition method according to any one of 1.
JP29179494A 1993-12-02 1994-11-25 Image pattern identification and recognition method Expired - Fee Related JP3301467B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP29179494A JP3301467B2 (en) 1993-12-02 1994-11-25 Image pattern identification and recognition method

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP30250793 1993-12-02
JP6-20682 1994-02-17
JP5-302507 1994-02-17
JP2068294 1994-02-17
JP29179494A JP3301467B2 (en) 1993-12-02 1994-11-25 Image pattern identification and recognition method

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2002066019A Division JP3657565B2 (en) 1993-12-02 2002-03-11 Image pattern identification and recognition method

Publications (2)

Publication Number Publication Date
JPH07282199A true JPH07282199A (en) 1995-10-27
JP3301467B2 JP3301467B2 (en) 2002-07-15

Family

ID=27283136

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29179494A Expired - Fee Related JP3301467B2 (en) 1993-12-02 1994-11-25 Image pattern identification and recognition method

Country Status (1)

Country Link
JP (1) JP3301467B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013190911A (en) * 2012-03-13 2013-09-26 Hitachi Computer Peripherals Co Ltd Character recognition device, recognition dictionary generation device and normalization method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013190911A (en) * 2012-03-13 2013-09-26 Hitachi Computer Peripherals Co Ltd Character recognition device, recognition dictionary generation device and normalization method

Also Published As

Publication number Publication date
JP3301467B2 (en) 2002-07-15

Similar Documents

Publication Publication Date Title
Denker et al. Neural network recognizer for hand-written zip code digits
US6687401B2 (en) Pattern recognizing apparatus and method
US7327883B2 (en) Character recognition system and method
US20100014758A1 (en) Method for detecting particular object from image and apparatus thereof
WO2010092952A1 (en) Pattern recognition device
US20020154815A1 (en) Character recognition device and a method therefore
Sajedi Handwriting recognition of digits, signs, and numerical strings in Persian
Kefali et al. Evaluation of several binarization techniques for old Arabic documents images
JP5003051B2 (en) Automatic mail sorting machine and automatic mail sorting method
JP2007058882A (en) Pattern-recognition apparatus
EP0656602B1 (en) Image pattern identification/recognition method
Chhabra et al. High-order statistically derived combinations of geometric features for handprinted character recognition
JP3301467B2 (en) Image pattern identification and recognition method
Shi et al. An invoice recognition system using deep learning
JP3657565B2 (en) Image pattern identification and recognition method
Sajedi et al. Persian handwritten number recognition using adapted framing feature and support vector machines
Begum et al. Deep Learning Networks for Handwritten Bangla Character Recognition.
Aktaruzzaman et al. Improved low-cost recognition system for handwritten Bengali numerals
JP3463255B2 (en) Multi-valued image pattern recognition processing method
JPH0562021A (en) Optical type character recognition (ocr) system for recognizing standard font and user assigned custom font
JP2007026470A (en) Pattern recognition device
CA2421673C (en) Character recognition system and method
Bobade et al. Character Recognition Technique using Neural Network
JPH06223232A (en) Processor for identifying/recognizing image pattern
Chhabra Anatomy of a hand-filled form reader

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090426

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090426

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100426

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100426

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110426

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120426

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130426

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees