JP2579413B2 - Character recognition method and device - Google Patents
Character recognition method and deviceInfo
- Publication number
- JP2579413B2 JP2579413B2 JP5015599A JP1559993A JP2579413B2 JP 2579413 B2 JP2579413 B2 JP 2579413B2 JP 5015599 A JP5015599 A JP 5015599A JP 1559993 A JP1559993 A JP 1559993A JP 2579413 B2 JP2579413 B2 JP 2579413B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- pel
- vector
- pattern
- origin
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 32
- 239000013598 vector Substances 0.000 claims description 79
- 230000005855 radiation Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 31
- 238000007792 addition Methods 0.000 description 16
- 238000013528 artificial neural network Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 9
- 238000012549 training Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000005259 measurement Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000007723 transport mechanism Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- TVEXGJYMHHTVKP-UHFFFAOYSA-N 6-oxabicyclo[3.2.1]oct-3-en-7-one Chemical compound C1C2C(=O)OC1C=CC2 TVEXGJYMHHTVKP-UHFFFAOYSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Description
【0001】[0001]
【産業上の利用分野】本発明は、走査されドット・パタ
ーンにデジタル化された文書の文字を認識するための方
法及び装置に関するものである。更に特定すれば、本発
明は、いかなる文字認識タスクにも適用可能であるが、
例えば銀行小切手に手書きされた文字のような手書き文
字を認識するのに特に有用なものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method and apparatus for recognizing characters of a document which has been scanned and digitized in a dot pattern. More specifically, the present invention is applicable to any character recognition task,
It is particularly useful for recognizing handwritten characters, such as, for example, characters handwritten on bank checks.
【0002】[0002]
【従来の技術】過去における文字認識技術は、文字をテ
ンプレート又は走査した文字のキー(key)領域と照
合し、文字を識別するキーとなる文字特徴を捜すもので
あった。これらの技術は、認識対象となる文字が特定の
形状又はキーとなる特徴に制限されている限りにおいて
は、うまく動作する。手書き文字の場合のように、この
制限を緩めると、文字のテンプレート及びキーとなる特
徴を解析する際の成功率は低くなってしまう。2. Description of the Related Art In the past, character recognition technology has collated a character with a template or a key area of a scanned character, and searched for a character feature serving as a key for identifying the character. These techniques work well as long as the characters to be recognized are limited to particular shapes or key features. If this restriction is relaxed, as in the case of handwritten characters, the success rate in analyzing character templates and key features will decrease.
【0003】手書き文字を扱うための1つの技術が米国
特許第4、757、551号明細書に教示されている。
同米国特許は、文字ストロークの傾斜を検出し、2つの
異なる文字ライブラリに記憶された情報と文字情報とを
比較することによって、手書き文字を処理するようにし
たものである。2つの文字ライブラリは、ライブラリ内
の基準文字の傾斜を基準として異なるものである。前記
米国特許は、文字の輪郭ペルに対して方向性コードを用
いる。方向性コードは、単に所与の文字の1つのペルか
ら該文字の次の隣接するペルまでの方向を示すものであ
る。これらの方向性コードのヒストグラムを当該文字の
複数の部分について取り、基準文字の特徴のヒストグラ
ムのライブラリと照合して文字を認識する。One technique for handling handwritten characters is taught in US Pat. No. 4,757,551.
The patent treats handwritten characters by detecting the slope of a character stroke and comparing the character information with information stored in two different character libraries. The two character libraries are different based on the slope of the reference character in the library. The US patent uses directional codes for character outline pels. The directional code simply indicates the direction from one pel of a given character to the next adjacent pel of the character. The histogram of these directional codes is obtained for a plurality of portions of the character, and the character is recognized by comparing it with a library of histograms of the characteristics of the reference character.
【0004】この米国特許の技術で困難なのは、これが
基本的にテンプレート照合技術であり、文字特徴ヒスト
グラムを照合しなくてはならない膨大な数のテンプレー
ト(基準ヒストグラム)を必要とすることである。した
がって、この技術は大きな記憶容量を必要とし、実行に
も非常に時間がかかる。The difficulty with the technique of this US patent is that it is essentially a template matching technique, which requires a huge number of templates (reference histograms) which must match the character feature histogram. Therefore, this technique requires a large storage capacity and is very time consuming to execute.
【0005】[0005]
【発明が解決しようとする課題】本発明の目的は、文字
認識の精度を改善することであり、特に制約の少ない機
械印刷(オムニ(omni))文字又は手書き文字の認
識精度を改善することである。SUMMARY OF THE INVENTION An object of the present invention is to improve the accuracy of character recognition, particularly by improving the accuracy of machine-printed (omni) characters or handwritten characters with less restrictions. is there.
【0006】本発明の別の目的は、文字、特にオムニ又
は手書き文字を正確に認識するのに必要な時間を短縮す
ることである。It is another object of the present invention to reduce the time required to accurately recognize characters, especially omni or handwritten characters.
【0007】[0007]
【課題を解決するための手段】本発明によれば、上述の
目的は、文字のデジタル化されたドット・パターンにお
いて、選択されたペルからの複数の放射方向パターン
(radial view pattern)を用い
て、その文字の遠隔ストローク(remote str
okes)の存在を検出することによって達成される。
更に特定すれば、この放射方向パターンは、2つ以上の
放射方向に遠隔ストローク情報を含む2放射方向パター
ンである。選択されるペルは、当該文字の全てのペル、
文字の輪郭を形成するペル、又は文字ストロークの内側
を表すコア・ペル(core pel)である。1つの
ペルからの放射方向パターンは、8つの放射方向を含ん
でいる。更に、各放射方向に対して、反時計方向に45
度回転した方向が加えられる。パターンの符号化の各々
において、ある特定の方向における遠隔ストロークまで
のストローク長即ち距離は、反時計方向の隣接する方向
における遠隔ストロークまでのストローク長即ち距離と
比較される。この比較は、当該ペルを含むストローク又
は遠隔ストローク・セグメントのいずれかの方向の指示
を与える。このように、ペル毎の2放射方向パターン
は、文字ストローク情報の放射方向成分と文字ストロー
ク情報の回転方向成分とを含んでおり、したがって2放
射方向パターンと名付けられる。SUMMARY OF THE INVENTION In accordance with the present invention, the above object is achieved by using a plurality of radial view patterns from a selected pel in a digitized dot pattern of a character. , The remote stroke of the character (remote str)
okes).
More specifically, the radial pattern is a two radial pattern that includes remote stroke information in more than one radial direction. The selected pels are all pels of the character,
A pel that forms the outline of a character, or a core pel that represents the inside of a character stroke. The radiation pattern from one pel includes eight radiation directions. Furthermore, for each radial direction, 45
A direction rotated by degrees is added. In each of the encodings of the pattern, the stroke length or distance to a remote stroke in one particular direction is compared to the stroke length or distance to a remote stroke in an adjacent counterclockwise direction. This comparison gives an indication of the direction of either the stroke or the remote stroke segment containing the pel. Thus, the two radial direction patterns for each pel include the radial direction component of the character stroke information and the rotational direction component of the character stroke information, and are therefore named two radial direction patterns.
【0008】文字のペルからの同じ放射方向パターンの
計数値が蓄積される。放射方向パターンによる計数値は
文字ベクトルを形成する。次に、文字ベクトルは、線形
判定ネットワーク又はニューラル・ネットワークで解析
され、文字ベクトルが表す文字を決定する。放射方向パ
ターンの計数値は加重され、特定の文字形状に対する文
字ベクトルが、同様に加重された和を有する方向に集ま
るように加算される。こうして、線形判定ネットワーク
は各文字を区別することができる。ニューラル・ネット
ワークは、同じ文字特徴に対して加重された和を1つ以
上のサブクラスタに集めるのに用いられる。これらの中
間的な加重和は更に加重され、再び加算されて、同じ和
を1つの認識可能なクラスに、それに関連する文字とし
て分類する。[0008] Counts of the same radial pattern from the character pel are accumulated. The counts from the radial pattern form a character vector. Next, the character vector is analyzed by a linear decision network or a neural network to determine the character represented by the character vector. The radial pattern counts are weighted and added so that the character vectors for a particular character shape converge in a direction that also has a weighted sum. Thus, the linear decision network can distinguish each character. Neural networks are used to collect weighted sums for the same character feature into one or more subclusters. These intermediate weighted sums are further weighted and added again to classify the same sum into one recognizable class as its associated characters.
【0009】[0009]
【作用】本発明の大きな利点は、2放射方向パターンの
符号化における比較が文字ストロークの方向についての
情報を含んでいるため、それが強力であることである。
2放射方向パターンにおける付加的な回転成分が、同じ
2放射方向パターンの蓄積と組み合わされ、所与の文字
に共通な文字の特徴を示す。更にまた、線形判定ネット
ワーク又はニューラル・ネットワークによって、文字ベ
クトルは文字クラスタへ迅速に処理される。したがっ
て、時間を要する文字特徴の基準パターンとの照合を行
なう必要がない。A major advantage of the present invention is that it is powerful because the comparison in encoding two radial patterns contains information about the direction of the character stroke.
The additional rotational component in the two radial patterns is combined with the accumulation of the same two radial patterns to show character features common to a given character. Furthermore, character vectors are quickly processed into character clusters by linear decision networks or neural networks. Therefore, there is no need to perform time-consuming matching of the character feature with the reference pattern.
【0010】[0010]
【実施例】図1は、アイビーエム社のモデル3890
Image Plus HighPerformanc
e Transactionシステムのような文書画像
処理システム11における画像獲得システム10を示
す。このようなシステムは、典型的には、搬送機構13
を用いて、プログラム制御下にある文書からその通過の
際に読み出された情報の内容を基に、一度に1枚の割合
で文書12を入力ホッパ(図示せず)から順に複数の他
の処理ステーションを通って若干の出力ホッパ又はポケ
ットの1つヘ移動させる。この搬送機構13は文書を高
速に移動させることができる(モデル3890では毎秒
750cm(300インチ)以上であり、システムは毎
分2400枚の文書を処理することができる)。FIG. 1 shows a model 3890 from IBM Corporation.
Image Plus HighPerformance
1 illustrates an image acquisition system 10 in a document image processing system 11 such as an eTransaction system. Such systems typically include a transport mechanism 13
, The documents 12 are read one by one at a time from the input document (not shown) based on the contents of the information read at the time of passage from the document under the program control. Move through the processing station to one of several output hoppers or pockets. This transport mechanism 13 is capable of moving documents at high speed (model 3890 is at least 750 cm (300 inches) per second, and the system can process 2400 documents per minute).
【0011】レンズ15を備えた光学系14は、文書の
白黒又はグレイ特性を基に、細長いアレイ17を用いて
文書の各ライン16の電気的表現を獲得する。系の解像
度は設計及び構成要素に依存するが、一例では、水平及
び垂直方向の各々において、2.5cm(1インチ)は
240個の画素(ペル又はピクセル)に分割される。An optical system 14 with a lens 15 uses an elongated array 17 to obtain an electrical representation of each line 16 of the document based on the black and white or gray characteristics of the document. The resolution of the system depends on the design and components, but in one example, in each of the horizontal and vertical directions, 2.5 cm (1 inch) is divided into 240 pixels (pels or pixels).
【0012】アレイ17は、レティコン社のような種々
の製造会社から入手可能であり、各センサに入射した光
の光量に比例した電気信号を発生する電荷結合素子であ
る。この電気信号は線18を通ってアナログ/デジタル
変換器19に達し、しきい値により各ペルはデジタル表
現に変換される。これを、蓄積及び/又は所望であれば
更に処理するために、メモリ20に記憶する。画像獲得
処理システムの詳細については、米国特許第4、88
8、812号明細書を参照されたい。Array 17 is a charge-coupled device, available from various manufacturers such as Reticon, which generates an electrical signal proportional to the amount of light incident on each sensor. This electrical signal reaches an analog-to-digital converter 19 via a line 18 where each pel is converted to a digital representation by a threshold. This is stored in memory 20 for storage and / or further processing if desired. For details of the image acquisition processing system, see US Pat.
See U.S. Pat. No. 8,812.
【0013】文書12は種々の指標を含んでおり、これ
らの指標は印刷されていたり、手書きであったりする。
他の文書は、タイプライタで打たれた文字又は機械で印
刷された文字を含むこともある。この指標は、日付領域
22、支払い者のライン24、金額領域26(殆どの場
合、文字ではなく数字を含んでいる)、文字により金額
を書き込む領域28、署名30及びMICRコード・ラ
イン32を含んでいる。The document 12 contains various indices, which may be printed or handwritten.
Other documents may include typewritten or machine printed characters. The indicator includes a date area 22, a payer line 24, an amount area 26 (which, in most cases, includes numbers rather than letters), an area 28 for writing the amount in letters, a signature 30, and a MICR code line 32. In.
【0014】図2は、図1の文書12から金額領域26
を拡大して示したものである。この金額領域26は、参
照番号30で識別された「$」と金額領域をその中に有
するボックス32とから成る。番号34で参照された点
線は、金額領域をどのように区分したかを示している。
この区分化は任意の公知技術によって行なうことができ
る。FIG. 2 shows the document 12 of FIG.
Is enlarged. This money area 26 is composed of a “$” identified by reference numeral 30 and a box 32 having a money area therein. The dotted line referenced by the number 34 indicates how the money area is divided.
This partitioning can be performed by any known technique.
【0015】区分化の結果として、各文字は、可能であ
れば、別個に識別され、本発明の文字認識アルゴリズム
にされる。As a result of the segmentation, each character is identified separately, if possible, and subjected to the character recognition algorithm of the present invention.
【0016】この場合、参照番号36は、小数点の後で
あって1の前に生じた金額領域内の0を識別する。特に
図4、5及び9に関連して、認識過程におけるこの文字
の使用法について、後に論ずることにする。In this case, reference numeral 36 identifies a zero in the monetary area that occurred after the decimal point and before the one. 4, 5 and 9, the use of this character in the recognition process will be discussed later.
【0017】放射方向パターン 図3は、放射方向パターンを用いて文字を識別するため
の論理即ち流れを示したものである。ブロック50で、
金額領域のような領域が識別される。所望ならば、当該
区画を個別の小領域に複写して更に処理を進めることが
できる。これは、領域発見に関する前記の特許によって
行なうのが有利である。次に、ブロック52で、画像を
「$」、小数点等の認識すべき個々の文字のような認識
対象の個々の文字又は指標に区分する。これは、任意の
公知の文字区分方法によって行なうことができる。 Radial Pattern FIG. 3 illustrates the logic or flow for identifying a character using a radial pattern. At block 50,
An area such as a money area is identified. If desired, the section can be copied to individual sub-regions for further processing. This is advantageously done by the above mentioned patent on region finding. Next, at block 52, the image is segmented into individual characters or indices to be recognized, such as individual characters to be recognized, such as "@", decimal point, and the like. This can be done by any known character classification method.
【0018】次に、ブロック54で画像を正規化し、ブ
ロック56で放射方向パターンを計算する。これら全て
については、図6〜図9(特に図6)に関連して後に詳
述する。好適実施例におけるこれらの放射方向パターン
は、ブロック54からの正規化された画像における黒い
ペルの各々において放射方向パターンを取る処理を含ん
でいる。Next, the image is normalized at block 54, and the radial pattern is calculated at block 56. All of these are described in more detail below in connection with FIGS. 6-9 (especially FIG. 6). These radial patterns in the preferred embodiment include the process of taking the radial pattern in each of the black pels in the normalized image from block 54.
【0019】次に、ブロック58で、この放射方向パタ
ーンが使用される。トレーニング・セットが、発生され
たベクトルの各々に対する確率を発生する(図8参
照)。トレーニング・モードでは、これらの放射方向パ
ターンは、ルックアップ・テーブルを発生するために用
いられる。Next, at block 58, the radial pattern is used. A training set generates probabilities for each of the generated vectors (see FIG. 8). In training mode, these radial patterns are used to generate a look-up table.
【0020】未知の文字Xの放射方向パターンは、既に
作成された表に入力され、所与のベクトル(図8)が文
字セット内の文字の各々と関連する確率が調べられる。The radial pattern of the unknown character X is entered into a previously created table and the probability that a given vector (FIG. 8) is associated with each of the characters in the character set is examined.
【0021】図4は、図2の金額領域から取った文字0
を示したものである。この図に示すように、複数の水平
行(R0−R25)と複数の列(C0−C22)があ
り、文字0を含むものとして識別された長方形の配列
(アレイ)を構成している。FIG. 4 shows the character 0 taken from the money area of FIG.
It is shown. As shown in this figure, there are a plurality of horizontal rows (R0-R25) and a plurality of rows (C0-C22), forming a rectangular array identified as containing the character 0.
【0022】次いで、この文字を正規化し、行(R0−
R9)と列(C0−C7)とを含む図5の画像を形成す
る。Next, the character is normalized, and the line (R0-
R9) and the columns (C0-C7) to form the image of FIG.
【0023】図6には、円で囲まれた中央ペル60を有
する別の文字(数字の7)及び8本の識別されたコンパ
ス方位の各々に向かう8本の放射線61〜68が図示さ
れている。即ち、線61はペル60から北に、線62は
北東に、線63は東に向いており、以下同様で、線68
は北西に向いている。問題は、文字ボックス全体を貫通
するこれらの線の各々に沿って、黒いペルがその経路上
にあるか否か、あるのならばどこにあるか、ということ
である。FIG. 6 illustrates another letter (number 7) having a central pel 60 in a circle and eight rays 61-68 directed to each of the eight identified compass orientations. I have. That is, line 61 faces north from Pell 60, line 62 faces northeast, line 63 faces east, and so on.
Is facing northwest. The problem is, along each of these lines that penetrate the entire character box, whether or not, and if so, where, the black pel is.
【0024】図7に示すように、いずれかの特定方向を
向いている任意の所与のペルからのパターンの記述は、
その経路上に黒いペルがない(この場合、0のパターン
番号が割り当てられる)、その経路における隣接するペ
ルが黒である(この場合、1のパターン番号が割り当て
られる)、又は、隣接するペルが白であり最終的にその
経路において黒がある(この場合、2のパターン番号が
割り当てられる)のいずれかである。パターン番号2
は、2本の黒線の間を対角線が通過する場合にも、割り
当てられる。これらのパターン番号及びパターンの記述
は任意に割り当てられるものであり、他の記述及び番号
付け技術を用いても効果的である。As shown in FIG. 7, the description of a pattern from any given pel pointing in any particular direction is:
There are no black pels on the path (in this case, a pattern number of 0 is assigned), adjacent pels on the path are black (in this case, a pattern number of 1 is assigned), or adjacent pels are Either white and finally black on the path (in this case, a pattern number of 2 is assigned). Pattern number 2
Is also assigned when a diagonal passes between two black lines. These pattern numbers and pattern descriptions are arbitrarily assigned, and it is effective to use other description and numbering techniques.
【0025】このようにして、図8においては、図6に
おけるペル60に対する放射方向パターンが識別され
る。即ち、ペル60から北に向いている線61に沿った
方向において、隣接したペルは白であり、それに隣接し
て黒いペルが続き、パターン番号2が得られる。線62
に沿った北東方向では、隣接するペルは黒であるので、
北東方向にはパターン番号1が割り当てられることにな
る。線63に沿った東方向では、ペル60から文字の東
縁への経路に黒いペルがなく、したがって、パターン番
号は0である。同様に、南東方向では、ここでも線65
に沿った南方向の場合と同様に、黒いペルが経路中にな
い。ペル60から南西に向かう線66に沿って、隣接す
るペルは黒であり、パターン番号1が割り当てられるこ
とになる。ペル60から西の方向には、経路中に黒いペ
ルがないので、パターン番号は0となり、線68に沿っ
た北西方向では、隣接する白いペルがあり、最終的に黒
いペルが続くので、北西方向に対してはパターン番号が
2となる。Thus, in FIG. 8, the radial pattern for the pel 60 in FIG. 6 is identified. That is, in the direction along the line 61 facing north from the pel 60, the adjacent pel is white, followed by the black pel adjacent thereto, and the pattern number 2 is obtained. Line 62
In the northeast direction along, the adjacent pel is black,
Pattern number 1 will be assigned to the northeast direction. In the east direction along line 63, there is no black pel in the path from pel 60 to the eastern edge of the character, so the pattern number is zero. Similarly, in the southeast direction, here again line 65
As in the south direction along, there is no black pel in the path. Along the line 66 going southwest from the pel 60, the adjacent pel is black and will be assigned pattern number 1. In the direction west of pel 60, there is no black pel in the path, so the pattern number is 0, and in the northwest direction along line 68, there is an adjacent white pel, and finally a black pel, The pattern number is 2 for the direction.
【0026】この技術を図5のパターンに適用すると、
図9に示す表が作成される。この表では、位置R1、C
5に対応する行番号1は、それぞれ北、北東、東、南
東、南、南西、西及び北西の方向の「0012210
0」のベクトルを有する。Applying this technique to the pattern of FIG.
The table shown in FIG. 9 is created. In this table, positions R1, C
The row number 1 corresponding to No. 5 is “0012210” in the directions of north, northeast, east, southeast, south, southwest, west, and northwest, respectively.
0 "vector.
【0027】行2は、R1、C6に位置する次の黒いペ
ルに対する同様の放射方向パターンである。これは、黒
いペル毎に続けられるが、それらのうちの数個のみをこ
こに掲げてある。Row 2 is a similar radial pattern for the next black pel located at R1, C6. This continues for each black pel, but only a few of them are listed here.
【0028】作成されたベクトル(例えば、行1のベク
トル00122100)の各々に対して、既に確立され
た生起確率が存在しルックアップ・テーブルに記憶され
ている。当該ベクトルは、走査された文字のパターンを
表している。数字の集合に対しては、許容される文字は
数字の0〜9であるが、金額領域はそれ以外の文字、例
えば、「$」、小数点等の許容され且つ認識されるべき
記号を含み得る。For each vector created (eg, vector 10012100 in row 1), an established probability of occurrence exists and is stored in the look-up table. The vector represents the pattern of the scanned character. For a set of numbers, the allowed characters are the digits 0-9, but the monetary area may contain other characters, for example, symbols that are allowed and recognized, such as "$", decimal point, etc. .
【0029】行1からNまでに対する全ての確率が決定
された後、この確率は数字の集合の中の各文字について
予め判っているベクトルの生起確率と照合される。照合
されるのは識別すべき文字の個々のベクトルの生起確率
の積である。これが数字の集合の各文字に対して、その
ベクトル生起確率の積と照合される。図9において数字
の集合の各文字の生起確率がP1、P2、P3、・・・
で示されており、例えば集合の最初の文字の生起確率は
A1×B1×C1×D1×E1×・・・×I1である。
この文字が集合内の2番目の文字である確率は、A2×
B2×・・・×I2である。After all probabilities for rows 1 through N have been determined, the probabilities are checked against the known probability of occurrence of the vector for each character in the set of numbers. What is matched is the product of the probability of occurrence of the individual vectors of the character to be identified. This is checked against the product of its vector occurrence probabilities for each character in the set of numbers. In FIG. 9, the occurrence probability of each character in the set of numbers is P1, P2, P3,.
For example, the probability of occurrence of the first character of the set is A1 × B1 × C1 × D1 × E1 ×... × I1.
The probability that this character is the second character in the set is A2 ×
.. × I2.
【0030】これらの積を次に正規化することができ、
1つの要素である未知の文字の確率を、次の要素である
確率と比較することができる。次に、適切な認識アルゴ
リズムを用いて文字を首尾よく認識したとみなすには、
どれくらいの大きさの絶対値での確率が必要であるか、
第2に、近くなりすぎて呼び出しできなくならないよう
に、第1の候補が第2の候補よりどれくらい大きくなけ
ればならないかに関して、しきい値の限度が設定され
る。These products can then be normalized:
The probability of an unknown character, one element, can be compared to the probability of the next element. Then, to consider a character successfully recognized using the appropriate recognition algorithm,
How large the absolute value probability is needed,
Second, a threshold limit is set on how large the first candidate must be to prevent it from being too close to be called.
【0031】2放射方向パターン 図3の論理即ち流れは、上述のように、文字認識を達成
するのに非常に有効であるが、この論理即ち流れは、2
放射方向パターンを用いることによって更に強化するこ
とができる。図10は、2放射方向パターンを用いるた
めの論理/流れ図である。図10の流れ図への入力は、
図3の「正規化(随意である)」のブロック54の後で
ある。図1に記載したように、文字の画像はペルにデジ
タル化される。図11は、数字3のデジタル化された画
像と、文字即ち数字3の中心付近の黒いペル80からの
及び数字3の頂部のペル84からのコンパス方位で識別
された8つの放射状パターンとを示すものである。 Two Radial Patterns The logic or flow of FIG. 3, as described above, is very effective in achieving character recognition, but the logic or flow is
Further enhancement can be achieved by using radial patterns. FIG. 10 is a logic / flow diagram for using a two radial pattern. The input to the flowchart of FIG.
After block 54 of "Normalize (optional)" in FIG. As described in FIG. 1, the image of the character is digitized into pels. FIG. 11 shows a digitized image of the digit 3 and eight radial patterns identified by compass orientation from the black pel 80 near the center of the letter or digit 3 and from the pel 84 at the top of the digit 3. Things.
【0032】ブロック72において、選択されたペルに
対する2放射方向パターン(図12及び図13を参照し
て後述する)を決定する。好適実施例における選択され
たペルは、文字の輪郭即ち外形を形成するペルである。
全ての黒いペルに対して2放射方向パターンを得ること
によって、解析のための殆どの情報が与えられる。しか
しながら、このプロセスを実行する方が、輪郭のペルの
みを用いる場合よりもかなり多くの計算機時間を必要と
する。第2の代替案は、図3におけるように、文字を正
規化し、その文字のコアとして1つのペルの幅の輪郭を
用いることである。更に別の代替案は、文字の内部のペ
ル(文字の輪郭ペルを除く全てのペル)を用いることで
ある。At block 72, a two radial pattern (described below with reference to FIGS. 12 and 13) for the selected pel is determined. The pel selected in the preferred embodiment is the pel that forms the outline or outline of the character.
Obtaining two radial patterns for all black pels gives most of the information for analysis. However, performing this process requires significantly more computer time than using only contour pels. A second alternative is to normalize the character, as in FIG. 3, and use a single pel-wide contour as the core of the character. Yet another alternative is to use pels inside the character (all pels except the outline pel of the character).
【0033】ブロック72で2放射方向パターンが輪郭
のペル毎に発生された後、ブロック74は2放射方向パ
ターンから文字ベクトルを発生する。この文字ベクトル
は、当該文字のペルに対する2放射方向パターンの計数
値リスト又はヒストグラムである。After the two radial patterns are generated for each pel of the contour in block 72, block 74 generates a character vector from the two radial patterns. This character vector is a count list or histogram of two radial patterns for the pel of the character.
【0034】文字ベクトルは、図10にブロック76と
して示した任意の数のプロセスによっても解析すること
ができる。本発明の好適実施例では、線形判定ネットワ
ーク又はニューラル・ネットワークのいずれかが用いら
れる。線形ネットワークの場合、文字の各2放射方向パ
ターンの計数値に加重がされ、他の加重された2放射方
向パターンの計数値と加算される。加重は、数千もの文
字サンプルでネットワークをトレーニングすることによ
って決定される。ネットワークは各々の可能性のある文
字に対して、文字ベクトルから加重和を生成する。各文
字に対する和は次いで比較され、加重和の最も大きい値
を有する文字を被認識文字として識別する。加重和から
文字を認識するための任意の数のアルゴリズムを使用す
ることができる。簡素なアルゴリズムは、しきい値より
大きな和を最も大きい和とする。別のアルゴリズムは、
最大の和と次に大きい和との間の差が第2のしきい値よ
り大きい場合に、第1のしきい値より大きな和を最大と
する。線形判定ネットワークによる解析については、図
18及び19を参照して後に詳述する。A character vector can also be analyzed by any number of processes, shown as block 76 in FIG. In the preferred embodiment of the present invention, either a linear decision network or a neural network is used. In the case of a linear network, the count of each two radial pattern of the character is weighted and added to the count of the other weighted two radial patterns. The weight is determined by training the network with thousands of character samples. The network generates a weighted sum from the character vector for each possible character. The sum for each character is then compared to identify the character with the highest value of the weighted sum as the recognized character. Any number of algorithms for recognizing characters from weighted sums can be used. A simple algorithm makes the sum greater than the threshold the largest sum. Another algorithm is
If the difference between the largest sum and the next largest sum is greater than a second threshold, the sum greater than the first threshold is maximized. The analysis by the linear determination network will be described later in detail with reference to FIGS.
【0035】ブロック76をニューラル・ネットワーク
として実施するとき、文字ベクトルから2放射方向パタ
ーンの計数値を加重し、加算することによって生成され
る加算値の中間層がある。この中間的な和は、同様のグ
ループ内で生じる(即ち集合する)傾向がある文字特徴
を表す。これらの中間的な加算値に制限を加えて加重
し、もう一度制限を加えて加算すると、文字集合内の各
可能性のある文字に対してゼロ又は1に近い加算値が生
じる。1つのクラスの和のみが1に近い値を持つべきで
ある。そのクラスが、文字ベクトルから認識された文字
を識別する。When block 76 is implemented as a neural network, there is an intermediate layer of added values generated by weighting and adding the two radial pattern counts from the character vector. This intermediate sum represents character features that tend to occur (ie, aggregate) within similar groups. Restricting and weighting these intermediate additions and adding the restriction again results in an addition near zero or one for each possible character in the character set. Only the sum of one class should have a value close to one. That class identifies the recognized character from the character vector.
【0036】2放射方向パターンが文字認識を強化する
ためにどのように動作するかを理解するためには、ま
ず、各放射方向に対して可能性がある4つの2放射方向
パターン・コード0、1、2及び3の符号化動作を理解
する必要がある。所与のパターン・コードを満足するの
に必要な条件が図12〜図15の論理図に図示されてお
り、以下のとおりである。次に掲げる用語は、そのパタ
ーン・コードに対して定義される; 「V」は、所与の放射方向である; 「V−45」は、Vから反時計方向に45度回転された
放射方向である; 「Lv」は、放射方向におけるストローク長、即ち、最
初の白いペルに到達するまでに横切る黒いペルの数であ
る; 「Lv-45」は、V−45方向におけるストローク長であ
る; 「Dv」は、V方向における遠隔ストローク迄の距離、
即ち、遠隔ストロークの最初の黒いペルに到達するまで
に横切る黒いペル(もしあれば)及び白いペルの数であ
る; 「Dv-45」は、V−45方向における遠隔ストローク迄
の距離である。To understand how the two-radiation pattern works to enhance character recognition, first consider the four possible two-radiation pattern codes 0, It is necessary to understand the encoding operations 1, 2, and 3. The conditions necessary to satisfy a given pattern code are illustrated in the logic diagrams of FIGS. 12-15 and are as follows. The following terms are defined for that pattern code; "V" is the given radial direction; "V-45" is the radial direction rotated 45 degrees counter-clockwise from V. " Lv " is the stroke length in the radial direction, i.e., the number of black pels traversing to reach the first white pel; " Lv-45 " is the stroke length in the V-45 direction. "D v " is the distance to the remote stroke in the V direction,
That is, the number of black pels (if any) and white pels traversed to reach the first black pel of the remote stroke; "D v-45 " is the distance to the remote stroke in the V-45 direction. .
【0037】パターン・コードの定義は以下の通りであ
る; パターン・コード0; V方向には遠隔ストロークがなく、且つ; V−45方向に遠隔ストロークがなく、且つ; V方向におけるストローク長の方がV−45方向におけ
るストローク長より小さい; 又は、遠隔ストロークがV−45方向に存在し、且つ; V方向におけるストローク長が、遠隔ストローク迄の距
離より小さい。The definition of the pattern code is as follows: pattern code 0; no remote stroke in the V direction; and no remote stroke in the V-45 direction; and the stroke length in the V direction. Is smaller than the stroke length in the V-45 direction; or the remote stroke is in the V-45 direction; and the stroke length in the V direction is smaller than the distance to the remote stroke.
【0038】パターン・コード1; V方向には遠隔ストロークがなく、且つ; V−45方向に遠隔ストロークがなく、且つ; V方向のストローク長の方がV−45方向のストローク
長より大きいか等しい; 又は、遠隔ストロークがV−45方向に存在し、且つ; V方向のストローク長の方がV−45方向の遠隔ストロ
ーク迄の距離より大きいか等しい。Pattern code 1; no remote stroke in the V direction; and no remote stroke in the V-45 direction, and the stroke length in the V direction is greater than or equal to the stroke length in the V-45 direction. Or the remote stroke is in the V-45 direction; and the stroke length in the V direction is greater than or equal to the distance to the remote stroke in the V-45 direction.
【0039】パターン・コード2; 遠隔ストロークがV方向に存在し、且つ; V−45方向に遠隔ストロークが存在せず、且つ; V方向の遠隔ストローク迄の距離の方がV−45方向の
ストローク長より小さい; 又は、V−45方向に遠隔ストロークが存在し、且つ; V方向の遠隔ストローク迄の距離の方がV−45方向の
遠隔ストローク迄の距離より小さい。Pattern code 2: remote stroke exists in the V direction; and no remote stroke exists in the V-45 direction; and the distance to the remote stroke in the V direction is the stroke in the V-45 direction. Less than the length; or there is a remote stroke in the V-45 direction; and the distance to the remote stroke in the V direction is less than the distance to the remote stroke in the V-45 direction.
【0040】パターン・コード3; 遠隔ストロークがV方向に存在し、且つ; V−45方向には遠隔ストロークが存在せず、且つ; V方向の遠隔ストローク迄の距離の方がV−45方向の
ストローク長より大きいか等しい; 又は、遠隔ストロークがV−45方向に存在し、且つ; V方向の遠隔ストローク迄の距離の方がV−45方向の
遠隔ストローク迄の距離より大きいか等しい。Pattern code 3: remote stroke exists in the V direction; and no remote stroke exists in the V-45 direction; and the distance to the remote stroke in the V direction is greater in the V-45 direction. Greater than or equal to the stroke length; or the remote stroke is in the V-45 direction; and the distance to the remote stroke in the V direction is greater than or equal to the distance to the remote stroke in the V-45 direction.
【0041】上述のパターン・コードの定義を念頭に置
き、図11の文字3に対する放射方向パターンを決定す
るプロセスが、距離Lv、Lv-45、Dv及びDv-45の測定
から開始される。次に、これらの距離を図12〜図15
の論理において用いて、正しい2放射方向パターン・コ
ードを選択する。With the above definition of the pattern code in mind, the process of determining the radial pattern for character 3 in FIG. 11 begins with measuring the distances Lv , Lv-45 , Dv, and Dv-45. Is done. Next, these distances are shown in FIGS.
To select the correct two radial pattern code.
【0042】2放射方向パターン・コードの決定法を説
明するために、図11のペル80に対するパターン番号
が発生される。パターンーを眺めるペルは、ここでは起
点ペルと呼ばれる。北の放射方向では、図16における
決定90は「肯定」側へ分岐してブロック92及び94
に進み、それぞれ、V(北)方向に沿った最初の遠隔ス
トロークのペル81の位置を検出し、起点ペル80から
ペル81までの距離を測定する。図11に示すように、
距離Dv-45は5ペルである。To illustrate the method of determining the two radial pattern codes, a pattern number for pel 80 in FIG. 11 is generated. The pel looking at the pattern is called the starting pel here. In the north radial direction, decision 90 in FIG. 16 branches to the “positive” side to block 92 and 94
, The position of the pel 81 of the first remote stroke along the V (north) direction is detected, and the distance from the origin pel 80 to the pel 81 is measured. As shown in FIG.
The distance D v-45 is 5 pels.
【0043】次に、決定96はV−45方向の遠隔スト
ロークを試験する。ペル80はNW方向に遠隔ストロー
クを有するので、この決定は「肯定」側へ分岐してブロ
ック98及び100に至る。ブロック98では、V−4
5(NW)方向の最初の遠隔ストロークのペル82の位
置を検出する。ブロック100はペル80とペル82と
の間の距離を測定する。この距離Dは5ペルである。Next, decision 96 tests the remote stroke in the V-45 direction. Since pel 80 has a remote stroke in the NW direction, this decision branches to the “Yes” side to blocks 98 and 100. In block 98, V-4
The position of the pel 82 in the first remote stroke in the 5 (NW) direction is detected. Block 100 measures the distance between pels 80 and 82. This distance D is 5 pels.
【0044】図16で決定した遠隔ストローク情報は図
12〜図15の論理流れ図に適用することにより、北方
向における起点ペル80からの2放射方向パターン・コ
ードを決定することができる。放射方向Vに遠隔ストロ
ークがあることはRSv、ないことはNRSVで示され、
V−45方向に遠隔ストロークがあることはRSv-45、
ないことはNRSV-45で示される。放射方向には遠隔ス
トロークがあるので(RSv)、図14又は図15の論
理流れ図が適用可能である。更に、北西方向に遠隔スト
ロークがあるので(RSv-45)、アンド・ゲート102
及び104がイネーブルされる。しかしながら、Dv=
Dv-45(双方の距離が5ペルである)が成り立つので、
アンド・ゲート104のみが出力を有する。アンド・ゲ
ート104からの出力は、オア・ゲート106及びアン
ド・ゲート108を通過する。したがって、北方向のパ
ターンに対する2放射方向パターン・コードは「3」で
ある。The remote stroke information determined in FIG. 16 can be applied to the logic flow diagrams of FIGS. 12-15 to determine the two radial pattern codes from the origin pel 80 in the north direction. The presence of a remote stroke in the radial direction V is indicated by RS v , the absence is indicated by NRS V ,
Having a remote stroke in the V-45 direction is RS v-45 ,
The absence is indicated by NRS V-45 . Since there is a remote stroke in the radial direction (RS v ), the logic flow diagram of FIG. 14 or FIG. 15 is applicable. In addition, because there is a remote stroke in the northwest direction (RS v-45 ), AND gate 102
And 104 are enabled. However, D v =
D v-45 (the distance between them is 5 pels) holds,
Only AND gate 104 has an output. The output from AND gate 104 passes through OR gate 106 and AND gate 108. Therefore, the two radial pattern code for the northward pattern is "3".
【0045】図12〜図15に示す論理流れ図は、ソフ
トウエアで実施するのが好ましい。勿論、これらの論理
/流れ図並びに本発明のその他の論理/流れ図は、ハー
ドウエア論理ブロック、プログラマブル・アレイ・ロジ
ック又はソフトウエアで実施することができる。いずれ
の場合であれ、好適実施例は、ソフトウエア、即ち、コ
ンピュータ又はデータ処理システム上で実行されるコン
ピュータ・プログラムである。The logic flow diagrams shown in FIGS. 12-15 are preferably implemented in software. Of course, these logic / flow diagrams, as well as other logic / flow diagrams of the present invention, can be implemented in hardware logic blocks, programmable array logic, or software. In each case, the preferred embodiment is software, i.e., a computer program running on a computer or data processing system.
【0046】図11のペル80に対する2放射方向パタ
ーンを決定するのに必要な距離及び遠隔ストローク情報
は、図17の表にまとめられている。各欄の最下部は、
ペル80からの当該方向のパターンに対する2放射方向
パターン・コードである。距離及び放射方向パターン・
コードは、図16及び図12〜図15に対する前記のプ
ロセスを通ることによって到達することができる。The distance and remote stroke information required to determine the two radial patterns for pel 80 of FIG. 11 is summarized in the table of FIG. The bottom of each column,
Two radial pattern codes for the pattern in that direction from pel 80. Distance and radial pattern
The code can be reached by going through the process described above for FIGS. 16 and 12-15.
【0047】所与の起点ペルに対する2放射方向パター
ンは、当該ペルに対して得られた8個の2放射方向パタ
ーン・コードの組み合わせとして定義される。北から時
計方向に2放射方向パターン・コードをリストアップす
ることによって得られたペル80に対する2放射方向パ
ターン(SVP)は、31033203である。起点ペ
ル80に対する各2放射方向パターン・コードを二進数
に変換すると、2放射方向パターンは16ビット(各パ
ターンに2ビット)の数即ち110100111110
0011となる。The two radial pattern for a given origin pel is defined as the combination of the eight two radial pattern codes obtained for that pel. The two radial pattern (SVP) for pel 80 obtained by listing the two radial pattern codes clockwise from north is 31033203. Converting each bi-directional pattern code for origin pel 80 to binary, the bi-radial pattern is a 16-bit number (2 bits for each pattern) or 110100111110.
0011.
【0048】好適実施例では、2放射方向パターンは文
字の輪郭上の各ペルに対して決定される。2放射方向パ
ターンの決定の第2の例として、図11の起点ペル84
に対する2放射方向パターン・コードがここで発生され
る。In the preferred embodiment, two radial patterns are determined for each pel on the character outline. (2) As a second example of the determination of the radial direction pattern, the starting point
Are generated here.
【0049】このプロセスは図16に示されており、北
西のパターンに対しては、ペル84の北西に遠隔ストロ
ークがないので、決定90は流れを右へ分岐させ、ブロ
ック110及び112に至る。北西のパターンにおいて
は、ブロック110は、ペル84のすぐ隣りにある背景
ペルの位置を検出する。したがって、ブロック112は
Lをゼロのペルとして測定する。次に、決定96は、V
−45パターン(西)における遠隔ストロークを調べ
る。西方向には遠隔ストロークがないので、流れはブロ
ック114及び116の方へ分岐する。ブロック114
はV−45方向の最初の背景ペルの位置を検出する。ブ
ロック116は、その方向におけるストローク長を測定
する。即ち、Lv-45は8ペルである。この情報を図12
〜図15の論理流れ図に適用することにより、図12の
論理が満足される。V−45方向には遠隔ストロークが
なく(NRSv-45)、Lv(ゼロのペル)はLv-45(8
ペル)より小さいので、アンド・ゲート118は出力を
有する。アンド・ゲート118からの信号は、オア・ゲ
ート120及びアンド・ゲート122を通過する。アン
ド・ゲート122は北西の放射方向に遠隔ストロークが
ないこと(NRSv)によってイネーブルされる。した
がって、ペル84からNWパターンに対する2放射方向
パターン・コードは「0」となる。This process is shown in FIG. 16 and for the northwest pattern, since there is no remote stroke northwest of pel 84, decision 90 branches the flow to the right, leading to blocks 110 and 112. In the northwest pattern, block 110 detects the location of the background pel immediately adjacent to pel 84. Therefore, block 112 measures L as a zero pel. Next, decision 96 determines that V
Examine the remote stroke in the -45 pattern (west). Since there is no remote stroke in the west direction, the flow branches to blocks 114 and 116. Block 114
Detects the position of the first background pel in the V-45 direction. Block 116 measures the stroke length in that direction. That is, L v-45 is 8 pels. This information is shown in FIG.
By applying to the logic flow chart of FIG. 15 to FIG. 15, the logic of FIG. 12 is satisfied. There is no remote stroke in the V-45 direction (NRS v-45 ), and L v (zero pel) is L v-45 (8
(Pel), and AND gate 118 has an output. The signal from AND gate 118 passes through OR gate 120 and AND gate 122. AND gate 122 is enabled by the absence of a remote stroke radial northwest (NRS v). Therefore, the two radial pattern codes for the NW pattern from pel 84 are "0".
【0050】図18は、ペル84に対する距離、2放射
方向ストローク情報及び2放射方向パターンSVPを表
にしたものである。北方向のパターンから時計回りにリ
ストされているとき、ペル84に対する2放射方向パタ
ーンは11123010である。ペル84に対する各2
放射方向パターン・コードを二進数に変換すると、2放
射方向パターンは16ビットの数、即ち0101011
011000100となる。FIG. 18 is a table showing the distance to the pel 84, the two radial stroke information, and the two radial pattern SVP. When listed clockwise from the northward pattern, the two radial pattern for pel 84 is 11123010. 2 each for pel 84
Converting the radial pattern code to binary, the two radial pattern is a 16-bit number, ie, 010111
011000100.
【0051】起点ペル84からの別の1つのパターン
は、2つの遠隔ストロークを含むので注目に値する。こ
のパターンはペル84からの南方向のパターンである。
このパターンは、図11の数字3の中央及び下部のスト
ロークと交差する。この状況において、第1又は第2の
遠隔ストローク迄を測定することができる。本発明の好
適実施例では、この測定はペル84からの南方向のパタ
ーンにおいて7ペルの距離である第1の遠隔ストローク
について行われる。Another pattern from the origin pel 84 is notable because it includes two remote strokes. This pattern is a pattern in the south direction from the pel 84.
This pattern intersects the middle and lower strokes of number 3 in FIG. In this situation, up to the first or second remote stroke can be measured. In the preferred embodiment of the present invention, this measurement is made for a first remote stroke that is a distance of 7 pels in a southward pattern from pel 84.
【0052】図12〜図16のプロセスの結果は、文字
の輪郭上の各ペルに対する16ビットの数である。この
16ビット数は、そのペルに対する2放射方向パターン
である。したがって、000000000000000
0から1111111111111111まで、即ち、
0から65535(64k)迄の2個の可能な2放射方
向パターンがある。2放射方向パターンが認識対象文字
のペルに対して決定されるので、これらのパターンには
用いられないものも、1回以上反復されるものもある。The result of the process of FIGS. 12-16 is a 16 bit number for each pel on the character outline. This 16 bit number is the two radial pattern for that pel. Therefore, 0000000000000000000
0 to 111111111111111, ie
There are two possible bi-directional patterns from 0 to 65535 (64k). Since two radial patterns are determined for the pel of the character to be recognized, some of these patterns are not used and some are repeated one or more times.
【0053】図10の文字認識プロセスにおける次のブ
ロックは、ブロック74、即ち2放射方向パターンから
の文字ベクトルの発生である。このブロックは、図19
により詳細に具体化されている。図19のブロック12
4及び126は、解析中の文字における各2放射方向パ
ターンの計数を行なうものである。ブロック124は文
字の共通の2放射方向パターンを識別し、ブロック12
6は同一の2放射方向パターンを有する全てのペルの数
を累算する。各2放射方向パターンに対する反復の計数
が完了すると、ブロック128で、パターン0からパタ
ーン65535まで連続的に計数値を表にすることによ
って、文字ベクトルを作る。一般化した形状では、文字
ベクトルは C=(c0、c1、c2、...、cN、...、c65535) で表され、ここでcNは2放射方向パターンNに対する
計数値である。The next block in the character recognition process of FIG. 10 is block 74, the generation of the character vector from the two radial patterns. This block is shown in FIG.
In more detail. Block 12 in FIG.
Numerals 4 and 126 are used to count two radial patterns in the character under analysis. Block 124 identifies a common bi-radial pattern of characters and block 12
6 accumulates the number of all pels having the same two radial patterns. Upon completion of the iteration count for each of the two radial patterns, block 128 creates a character vector by tabulating the counts sequentially from pattern 0 to pattern 65535. In the generalized shape, the character vector is represented by C = (c0, c1, c2,..., CN,..., C65535), where cN is a count value for two radial patterns N.
【0054】図10のブロック76は、文字ベクトルを
解析して文字を識別するものである。解析のブロック7
6の実行例の1つは図20の線形判定ネットワークであ
る。線形判定ネットワークのタスクは、文字が所定の文
字であることを文字ベクトルが示す範囲を指示すること
である。各2放射方向パターンの計数値は図20の関連
する入力レジスタにロードされる。2放射方向パターン
1の計数値c1は入力レジスタ130にロードされる。
同様に、計数値c2から計数値c65535までがレジ
スタにロードされる。c2及びc65535に対する入
力レジスタ132及び134のみが図示されている。c
0に対する計数値は強制的に0にされており、1の計数
値がレジスタ129にロードされる。線形判定ネットワ
ークは、レジスタ129が定数(この場合1の計数値)
でロードされることを必要とする。放射方向パターンの
ゼロは生じ得ないので、この要件は認識プロセスに悪影
響を及ぼすものではない。Block 76 in FIG. 10 identifies a character by analyzing a character vector. Analysis Block 7
One of the execution examples of No. 6 is the linear decision network of FIG. The task of the linear decision network is to indicate the range indicated by the character vector indicating that the character is a predetermined character. The counts for each of the two radial patterns are loaded into the associated input registers of FIG. The count value c1 of the two radial patterns 1 is loaded into the input register 130.
Similarly, the registers from the count value c2 to the count value c65535 are loaded into the registers. Only input registers 132 and 134 for c2 and c65535 are shown. c
The count value for 0 is forcibly set to 0, and the count value of 1 is loaded into the register 129. In the linear judgment network, the register 129 is a constant (in this case, the count value of 1).
Need to be loaded in. This requirement does not adversely affect the recognition process since no radial pattern zero can occur.
【0055】計数値の各々に加重係数を乗算し、この加
重された計数値を、各可能性のある文字識別に対して加
算する。例えば、出力値が可能性のある分類を数字
「0」として示す加算回路136は、以下のような加算
を実行する。Each of the counts is multiplied by a weighting factor, and this weighted count is added to each possible character identification. For example, the addition circuit 136 that indicates a classification whose output value is possible as a number “0” performs the following addition.
【0056】[0056]
【数1】 クラス0の和=1×W(0,0)+c2×W(0,1)+・・・+cN×W (0,N)+・・・+c65535×W(0,65535) ここで、「cN」は2放射方向パターンNに対する計数
値であり、「W(0、N)」は分類0におけるcNに対
する加重係数である。## EQU1 ## Sum of class 0 = 1 × W (0,0) + c2 × W (0,1) +... + CN × W (0, N) +... + C65535 × W (0,65535) Where “cN” is a count value for the two radial patterns N, and “W (0, N)” is a weighting factor for cN in classification 0.
【0057】実際、加算回路136からのクラス0の和
を表す出力は、文字ベクトルとクラス0に対する加重係
数ベクトルとの内積である。同様に、加算回路138、
140及び142からのクラス1、2及び3の和は、文
字ベクトルとそれぞれクラス1、2及び3に対する加重
係数ベクトルとの内積である。文字集合のパターン、即
ち文字ベクトルが分類又は認識される文字パターンと同
数の加算回路及び加重係数ベクトルが設けられる。In fact, the output representing the sum of class 0 from the adder circuit 136 is the inner product of the character vector and the weight coefficient vector for class 0. Similarly, an adder circuit 138,
The sum of classes 1, 2 and 3 from 140 and 142 is the inner product of the character vector and the weighting coefficient vector for classes 1, 2 and 3, respectively. The same number of adder circuits and weighting coefficient vectors as character set patterns, that is, character patterns in which character vectors are classified or recognized, are provided.
【0058】図21は、数字0、1、2及び3に対する
クラスの和が、どのように入力計数値cN−1及びcN
に対して集合するかを示した単純な分散図である。言い
替えれば、X軸がcN−1で、Y軸がcNである二次元
空間において、数字1のパターンに対するcN−1、c
N座標は、図21で「1」であるところに集合する傾向
がある。同様に、数字0、2及び3に対するcN−1、
cN座標も集合する傾向がある。次に、加重係数を用い
て、数字のベクトル解析において生じた計数値cN−1
及びcNから、数字の各々に対する別個のクラスの和を
生成する。図21の簡単な例では、計数値cN−1、c
Nに加重係数W(0、1)、W(0、2)を用いること
により、その計数値が数字ゼロの文字パターンからのも
のであれば、クラス0の和は増加され、また、その計数
値が別の文字パターンのいずれかからのものであれば、
クラス0の和は減少する。FIG. 21 shows how the sum of the classes for the numbers 0, 1, 2 and 3 shows how the input counts cN-1 and cN
FIG. 4 is a simple dispersion diagram showing whether or not a set is gathered. In other words, in a two-dimensional space in which the X axis is cN-1 and the Y axis is cN, cN-1, c
The N coordinates tend to aggregate where they are "1" in FIG. Similarly, cN-1, for the numbers 0, 2, and 3,
The cN coordinates also tend to aggregate. Next, using the weighting factor, the count value cN-1 generated in the vector analysis of the number is calculated.
And cN to generate a separate class sum for each of the numbers. In the simple example of FIG. 21, the count values cN−1, cN
By using the weighting factors W (0,1) and W (0,2) for N, if the count is from a character pattern with the number zero, the sum of class 0 is increased and the sum is calculated. If the number is from one of the other character patterns,
The sum of class 0 decreases.
【0059】図式的に、分散図内の各クラスタは、1本
の線によって他のクラスタから分離することができる。
線形判定ネットワークでは、この線は加重係数によって
引かれる。勿論、文字ベクトルに対する完全な分散図
は、64k次元を有する。このような空間を図示するこ
とができれば、クラスタが未だ存在し、それらはハイパ
ープレーン(hyperplane)(64k次元空間
の面)によって分離することができる。線形判定ネット
ワークに用いられる加重係数ベクトルは、文字又は記号
のパターンの分類のためにクラスタを分離するように、
これらのハイパープレーンを描くことになる。Schematically, each cluster in the scattergram can be separated from other clusters by one line.
In a linear decision network, this line is drawn by a weighting factor. Of course, the complete variance diagram for a character vector has 64k dimensions. If such a space can be illustrated, clusters still exist and they can be separated by a hyperplane (a plane in a 64k dimensional space). The weighting factor vector used in the linear decision network is to separate clusters for classification of character or symbol patterns,
You will draw these hyperplanes.
【0060】図20の加重係数は、数千もの文字集合の
トレーニング・セットの使用に到達しなければならな
い。トレーニングに用いられる文字の各々はペルにデジ
タル化され、輪郭のペルに対して2放射方向パターンが
決定され、文字ベクトルが発生される。文字ベクトルの
各計数値cNは、公知のように、文字識別のための和を
増加させるサンプル加重係数を発生させると共に、他の
全ての文字又は記号パターンに対する和を減少させる加
重係数を発生させるために用いられる。The weighting factors of FIG. 20 must reach the use of a training set of thousands of character sets. Each of the characters used for training is digitized into pels, two radial patterns are determined for the pels of the contour, and a character vector is generated. Each count cN of the character vector, as is known, generates a sample weighting factor that increases the sum for character identification and a weighting factor that reduces the sum for all other character or symbol patterns. Used for
【0061】図22は、線形判定ネットワークに基づい
た文字解析の最後の部分の論理/流れ図である。最後の
プロセスは、図20からのクラス和に基づいた文字認識
である。流れ図のブロック144及び146は、図20
の加算回路から最大の及び2番目に大きいクラス和(C
S1及びCS2)を得る。同時に、ブロック144は最
大のクラス和CS1を有する文字クラスCを識別する。
次に、判定のブロック148は最大の和CS1が最少絶
対しきい値TH1より大きいか否かを見る試験を行う。
CS1がTH1より大きくない場合、ブロック150は
パターン又は文字が認識できないことを表示し、流れは
ディジタル化された文字に対するプロセスを終了し、そ
れから出る。FIG. 22 is a logic / flow diagram of the last part of character analysis based on the linear decision network. The final process is character recognition based on the class sum from FIG. Blocks 144 and 146 of the flow chart correspond to FIG.
Of the largest and second largest class sum (C
S1 and CS2) are obtained. At the same time, block 144 identifies the character class C having the largest class sum CS1.
Next, decision block 148 tests to see if the maximum sum CS1 is greater than the minimum absolute threshold TH1.
If CS1 is not greater than TH1, block 150 indicates that the pattern or character is not recognizable, and flow terminates the process for digitized characters and exits.
【0062】CS1が最少のしきい値値TH1より大き
い場合、CS1によって表される文字は、走査された文
字として識別することができる。しかしながら、一層高
い精度のために、図22のブロック152で、CS1と
CS2との間の差を取る。次に、判定のブロック154
で、この差を最少デルタしきい値TH2と突き合わせる
試験を行なう。差がTH2より小さければ、流れはブロ
ック150へ分岐し、文字は認識不可なものとして表示
される。差がTH2より大きい場合、ブロック156は
文字を「C」、即ち最大の和CS1を有するクラスによ
って表される文字として識別する。ここで、文字認識は
首尾よく完了する。If CS1 is greater than the minimum threshold value TH1, the character represented by CS1 can be identified as a scanned character. However, for greater accuracy, the difference between CS1 and CS2 is taken at block 152 in FIG. Next, decision block 154
Then, a test for comparing this difference with the minimum delta threshold value TH2 is performed. If the difference is less than TH2, flow branches to block 150 and the character is displayed as unrecognizable. If the difference is greater than TH2, block 156 identifies the character as "C", the character represented by the class with the largest sum CS1. Here, character recognition is successfully completed.
【0063】認識対象の文字が、自由な手書き印刷又は
形状自由の機械印刷(オムニ文字)におけるように、形
状に制約が殆どない場合、各クラス内での変化はかなり
多い。例えば数字3の上部は湾曲していたり平坦だった
りし、4の右側は開いていたり閉じていたりする。これ
らの場合、文字のためのクラスに対する計数値のサブク
ラスタが形成される。図23は、ペル・放射方向パター
ンN−1及びNの計数値cN−1及びcNの分散図であ
る。この分散図では、若干の文字ベクトルに対する計数
値は2つのサブクラスタを有する(図23の文字
「1」、「2」及び「3」からの計数値に対する二重ク
ラスタを参照されたい)。所与のクラスに対するこれら
のサブクラスタは、一対のものとして線形的に分離する
ことは不可能である。したがって、図20にあるような
線形判定ネットワークの代りに、図24に示すフィード
・フォーワード・ニューラル・ネットワークを用いて解
析が行われる。When the characters to be recognized have almost no restrictions on the shape, such as in free handwriting printing or shape-free machine printing (omni characters), there are considerable changes within each class. For example, the upper part of the number 3 is curved or flat, and the right side of the number 4 is open or closed. In these cases, a sub-cluster of counts for the class for the character is formed. FIG. 23 is a dispersion diagram of the count values cN-1 and cN of the pel / radial direction patterns N-1 and N. In this scatter diagram, the counts for some character vectors have two subclusters (see double clusters for counts from characters "1", "2" and "3" in FIG. 23). These subclusters for a given class cannot be separated linearly as a pair. Therefore, the analysis is performed using the feed forward neural network shown in FIG. 24 instead of the linear decision network as shown in FIG.
【0064】ニューラル・ネットワークの機能は線形判
定ネットワークと同様であるが、2つの重大な相違があ
る。第1に、入力計数値レジスタと最終分類用加算回路
との間に中間の加算回路層が存在することであり、第2
に、加算回路は加算値をゼロと1との間に制限するリミ
ッタを備えていることである。中間層の機能はサブクラ
スタ即ち文字の特徴を分類することである。サブクラス
タのクラスに対する出力の和は、加重され制限されて文
字認識の最終分類に到達する。実際、中間層は文字ベク
トルとサブクラスタ加重係数ベクトルとの内積であり、
サブクラスタ・ベクトル又は文字特徴ベクトルを生成す
る。その後、最終加算層は、加重係数ベクトルとサブク
ラスタ・ベクトルとの内積であるサブクラスタ・ベクト
ル又は特徴ベクトルを文字クラスに分類する。The function of a neural network is similar to a linear decision network, but with two significant differences. First, there is an intermediate addition circuit layer between the input count value register and the final classification addition circuit.
In addition, the addition circuit has a limiter for limiting the addition value between zero and one. The function of the hidden layer is to classify sub-clusters or character features. The sum of the outputs for the classes of subclusters is weighted and restricted to arrive at the final classification of character recognition. In fact, the hidden layer is the inner product of the character vector and the subcluster weighting coefficient vector,
Generate a subcluster vector or a character feature vector. Thereafter, the final addition layer classifies the subcluster vector or feature vector, which is the inner product of the weighting coefficient vector and the subcluster vector, into a character class.
【0065】図24において、入力レジスタ159〜1
61は、2放射方向パターンの計数値即ち文字ベクトル
を、図20の入力レジスタと同じように受け取る。再
び、計数値c0の入力レジスタには1の計数値がロード
される。他の全ての計数値c1〜c65535は、それ
らの夫々のレジスタにロードされる(c1、c2及びc
65535のレジスタのみが図示されている)。これら
の計数値の各々は、クラスタ加算/制限回路162、1
63及び164の各々と関連する加重係数によって加重
される。3つのサブクラスタ制限回路のみが図示されて
いる。サブクラスタの各々に対して、サブクラスタ加算
器が存在する。各サブクラスタ加算/制限回路は、ステ
ップ関数に近似する機能を有する制限回路を備えてい
る。言い替えれば、サブクラスタ回路162〜164の
出力はゼロ又は1に近い。Referring to FIG. 24, input registers 159 to 1
Numeral 61 receives the count value of two radial patterns, that is, a character vector, in the same manner as the input register of FIG. Again, a count value of 1 is loaded into the input register of the count value c0. All other counts c1-c65535 are loaded into their respective registers (c1, c2 and c
Only 65535 registers are shown). Each of these counts is applied to a cluster addition / limitation circuit 162, 1
Weighted by a weighting factor associated with each of 63 and 164. Only three sub-cluster limiting circuits are shown. For each sub-cluster, there is a sub-cluster adder. Each subcluster addition / limitation circuit includes a limiter having a function approximating a step function. In other words, the outputs of the sub-cluster circuits 162-164 are close to zero or one.
【0066】同様に、クラス加算/制限回路165〜1
68の各々は、加算回路と非線形ステップ関数近似回路
との組み合わせである。クラス0回路165は、サブク
ラスタ・ベクトルとクラス0の加重係数ベクトルとの内
積を求め、その結果をゼロ又は1の近傍に制限する。回
路166、167及び168は、各々、クラス1、2及
び3に対して同一の機能を奏する。勿論、文字認識集合
のパターン又は文字と同数のクラス加算/制限回路が設
けられている。唯一のクラス加算/制限回路が1に近い
出力値を有し、他の全てのクラス加算/制限回路がゼロ
に近い出力値を有する場合、文字ベクトルが分類される
(文字が認識される)。そうでなければ、文字は認識さ
れなかったものとして拒絶される。Similarly, the class addition / limitation circuits 165-1
Each of 68 is a combination of an addition circuit and a nonlinear step function approximation circuit. The class 0 circuit 165 finds the inner product of the subcluster vector and the weight coefficient vector of class 0, and limits the result to near zero or one. Circuits 166, 167 and 168 perform the same function for classes 1, 2 and 3, respectively. Of course, the same number of class addition / restriction circuits as character recognition set patterns or characters are provided. If only one class adder / limiter circuit has an output value near 1 and all other class adder / limiter circuits have output values near zero, the character vector is classified (character is recognized). Otherwise, the character is rejected as unrecognized.
【0067】図24の加重係数ベクトルに用いた加重
は、代表的なトレーニング・セットから標準ニューラル
・ネットワーク・トレーニング技術によって発生され
る。このような技術は以下の2件の文献に教示されてい
る; 1.デビッド・ラメルハート(Devid Rumel
hart)外1名著、「並列分散処理」、第1巻、MI
Tプレス、(c)1988年、pp.322〜330; 2.サラ・ソーラ(Sara Solla)外著「階層
ニューラル・ネットワークにおける加速学習」、コンプ
レックス・システム、第II巻、No.6、コンプレッ
クス・システム・パブリケーション社、(c)1988
年、pp.625〜639。The weights used for the weighting factor vectors of FIG. 24 are generated from a representative training set by standard neural network training techniques. Such techniques are taught in the following two documents: David Ramelhart
hart) One other author, "Parallel distributed processing", Volume 1, MI
T Press, (c) 1988, pp. 322 to 330; Sara Sola et al., "Accelerated Learning in Hierarchical Neural Networks," Complex Systems, Vol. 6. Complex System Publication, (c) 1988
Year, pp. 625-639.
【0068】[0068]
【発明の効果】以上、この発明の実施例を参照して詳細
に説明したところから明らかなとおり、この発明は、特
に機械印刷文字や手書き文字等の自由度の高い文字の認
識を短時間に行うことができ、しかも、その精度を向上
させることができるという格別の効果を奏する。As is apparent from the above description with reference to the embodiments of the present invention, the present invention can recognize characters with high flexibility such as machine-printed characters and handwritten characters in a short time. It can be performed, and furthermore, it has a special effect that its accuracy can be improved.
【図1】本発明の環境、即ち画像文書処理システムを示
す図である。FIG. 1 is a diagram showing an environment of the present invention, that is, an image document processing system.
【図2】図1のサンプルの小切手からの金額領域を示す
図である。FIG. 2 is a diagram showing a money area from a check of the sample of FIG. 1;
【図3】文字認識のための放射方向パターンを用いる論
理の流れ図である。FIG. 3 is a logic flow diagram using radial patterns for character recognition.
【図4】図2の金額領域からの1つの文字のペル成分の
マトリクスを示す図である。FIG. 4 is a diagram showing a matrix of a pel component of one character from the money amount area of FIG. 2;
【図5】図4の文字をスケルトン化し正規化したものを
示す図である。FIG. 5 is a diagram showing a skeletonized and normalized version of the character of FIG. 4;
【図6】所与のペルから見られる全ての多方向ベクトル
を発生するのに有用な放射方向パターン認識システムを
示す図である。FIG. 6 illustrates a radial pattern recognition system useful for generating all the multi-directional vectors seen from a given pel.
【図7】特定のペルからの特定の方向の観測結果を記載
すると共に、その観測結果にパターン番号を割り当てた
表を示す図である。FIG. 7 is a diagram showing a table in which observation results in a specific direction from a specific pel are described and pattern numbers are assigned to the observation results.
【図8】図6の1つのペルに対するサンプルのベクトル
を示す図である。FIG. 8 shows a vector of samples for one pel of FIG. 6;
【図9】図5の文字に対するパターン・ベクトルと確率
とを含む表を示す図である。FIG. 9 is a diagram showing a table including pattern vectors and probabilities for the characters of FIG. 5;
【図10】画像文書システムにおいて2放射方向パター
ンを実施する本発明のための論理/流れ図である。FIG. 10 is a logic / flow diagram for the present invention implementing a two radial pattern in an image document system.
【図11】文字の中心付近の文字ペル及び文字の最上部
の文字ペルからの8つのパターンを示すデジタル化され
た文字の一例を示す図である。FIG. 11 is a diagram showing an example of a digitized character showing eight patterns from a character pel near the center of the character and a character pel at the top of the character.
【図12】2放射方向パターン・コードを決定するため
の論理/流れ図である。FIG. 12 is a logic / flow diagram for determining a two radial pattern code.
【図13】2放射方向パターン・コードを決定するため
の論理/流れ図である。FIG. 13 is a logic / flow diagram for determining a two radial pattern code.
【図14】2放射方向パターン・コードを決定するため
の論理/流れ図である。FIG. 14 is a logic / flow diagram for determining a two radial pattern code.
【図15】2放射方向パターン・コードを決定するため
の論理/流れ図である。FIG. 15 is a logic / flow diagram for determining a two radial pattern code.
【図16】図12〜図15における2放射方向パターン
・コード決定論理によって用いられるストロークの特徴
を測定するための論理/流れ図である。FIG. 16 is a logic / flow diagram for measuring stroke features used by the two radial pattern code determination logics in FIGS.
【図17】図11のペル80に対するストローク測定及
び2放射方向パターンの表を示す図である。FIG. 17 shows a table of stroke measurements and two radial patterns for pel 80 of FIG. 11;
【図18】図11のペル84に対するストローク測定及
び2放射方向パターンの表を示す図である。18 shows a table of stroke measurements and two radial patterns for the pel 84 of FIG. 11;
【図19】図10において必要とされる2放射方向パタ
ーン、文字ベクトル決定のための論理/流れ図である。FIG. 19 is a logic / flow diagram for the two radial pattern, character vector determination required in FIG.
【図20】図10において必要とされる文字ベクトル解
析のための線形判定ネットワークの論理/流れ図であ
る。FIG. 20 is a logic / flow diagram of a linear decision network for the character vector analysis required in FIG.
【図21】数字0、1、2及び3に対する文字ベクトル
における2つの計数値の分散図である。FIG. 21 is a scatter diagram of two counts in a character vector for the numbers 0, 1, 2, and 3.
【図22】図21の線形判定ネットワークによって各文
字候補に対して生成される加重和から文字を認識するた
めの論路/流れ図である。FIG. 22 is a logic / flowchart for recognizing a character from a weighted sum generated for each character candidate by the linear determination network of FIG. 21;
【図23】手書き文字又は制約の少ない機械印刷文字の
ような、制約の殆どない文字に対する文字ベクトルのク
ラスタ図である。FIG. 23 is a cluster diagram of character vectors for characters with few restrictions, such as hand-written characters or machine-printed characters with few restrictions.
【図24】図10で必要とされる文字ベクトル解析用ニ
ューラル・ネットワークの論理/流れ図であり、ニュー
ラル・ネットワークは、文字ベクトルが図23における
ように集合されるときに文字識別に力を発揮する。FIG. 24 is a logic / flow diagram of the neural network for character vector analysis required in FIG. 10; the neural network exerts power in character identification when character vectors are aggregated as in FIG. 23; .
【符号の説明】 11;文書画像処理システム 10;画像獲得システム 13;搬送機構 12;文書 14;光学システム 15;レンズ 17;アレイ 19;アナログ/デジタル変換器 20;メモリ 22;日付領域 24;支払い者ライン 26;金額領域 159〜161;入力レジスタ 162、163、164;クラスタ加算制限回路 165〜168;クラス加算/制限回路DESCRIPTION OF SYMBOLS 11; document image processing system 10; image acquisition system 13; transport mechanism 12; document 14; optical system 15; lens 17; array 19; analog / digital converter 20; memory 22; date area 24; User line 26; amount of money 159 to 161; input register 162, 163, 164; cluster addition limiting circuit 165 to 168; class addition / limiting circuit
───────────────────────────────────────────────────── フロントページの続き (72)発明者 テリー・アンソニー・ウィル アメリカ合衆国28215、ノース・カロラ イナ州 シャーロット、フォレスト・マ ナー・コート 9217番地 (56)参考文献 特開 昭56−59374(JP,A) 特開 昭62−287386(JP,A) 特開 平2−299085(JP,A) ────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Terry Anthony Will 9217, Forest Manor Court, Charlotte, North Carolina, USA 28215 (56) References JP-A-56-59374 (JP, A) JP-A-62-287386 (JP, A) JP-A-2-29085 (JP, A)
Claims (9)
号を発生するスキャナと、前記画像信号をペルによる文
字パターンにデジタル化する画像デジタイザとを有する
文字認識システムにおける文字認識方法であって、 前記スキャナにより文字を走査して画像信号を発生する
ステップと、 前記画像信号を前記デジタイザによりペルのパターンに
デジタル化するステップと、 前記文字パターンのペルの内複数の起点ペルを選択し、
その各々について、起点ペルから複数の放射方向に沿っ
たペルのパターンのストロークを調べて、第1放射方向
において前記起点ペルから測定された最初のストローク
の長さ、前記第1放射方向に隣接する放射方向において
起点ペルから測定された最初のストロークの長さ、前記
第1放射方向において測定された前記起点ペルから遠隔
ストロークまでの距離、および前記第1放射方向に隣接
する放射方向において測定された前記起点ペルから遠隔
ストロークまでの距離、を測定するステップと、 前記起点ペルの各々について、前記2つのストロークの
長さ、および2つの距離を相互に比較し、その比較結果
に従って各起点ペルからの2放射方向パターンを特徴づ
けるベクトルを発生するステップと、 前記ベクトルを論理ネットワークにて解析し、前記走査
された文字を分類し、その分類に基づいて、前記走査さ
れた文字を所定の文字集合内の文字として識別するステ
ップと、 を含むことを特徴とする文字認識方法。1. A character recognition method in a character recognition system, comprising: a scanner that scans a character and generates an image signal of the scanned character; and an image digitizer that digitizes the image signal into a pel character pattern. Scanning a character by the scanner to generate an image signal; digitizing the image signal into a pel pattern by the digitizer; selecting a plurality of starting pels from the pels of the character pattern;
For each of them, examine the stroke of the pattern of pels along the plurality of radial directions from the origin pel, and measure the length of the first stroke measured from the origin pel in the first radial direction, adjacent to the first radial direction The length of the initial stroke measured from the origin pel in the radial direction, the distance from the origin pel to the remote stroke measured in the first radial direction, and measured in the radial direction adjacent to the first radial direction Measuring the distance from the origin pel to a remote stroke; and, for each of the origin pels, comparing the length of the two strokes and the two distances with each other, and according to the comparison result, the distance from each origin pel. (2) generating a vector characterizing the radiation direction pattern; and solving the vector in a logical network. And classifies the scanned character, on the basis of that classification, character recognition method, which comprises identifying the said scanned character as a character of a predetermined character in the set.
生する前記ステップは、 前記走査されている文字において発生されたベクトルの
内、同じ値のベクトルの数の計数値を発生するステップ
と、 前記走査されている文字の全ての起点に対して、前記計
数値をヒストグラムとして表し、これによりベクトルを
形成するステップと、 を含むことを特徴とする方法。2. The method of claim 1, wherein the step of generating a vector comprises: generating a count of the number of vectors having the same value among vectors generated in the scanned character. Representing said counts as a histogram for all origins of the character being scanned, thereby forming a vector.
ルを解析する前記ステップは、 文字集合内の各文字に関して定められた加重係数ベクト
ルと前記ベクトルの内積を発生するステップと、 最も大きい内積をしきい値と比較し、該しきい値を超え
ているとき、前記走査された文字を、前記最も大きい内
積と関連する文字として識別するステップと、を含むこ
とを特徴とする方法。3. The method of claim 1, wherein analyzing the vector comprises: generating a dot product of the vector with a weighted coefficient vector defined for each character in the character set; Comparing to a threshold and, when the threshold is exceeded, identifying the scanned character as a character associated with the largest dot product.
クトルを解析する前記ステップは、 前記文字ベクトルと、文字集合内の文字における各サブ
クラスタに対するサブクラスタ加重係数ベクトルとのサ
ブクラスタ内積を発生するステップと、 前記サブクラスタ内積の各々をゼロ又は1の近傍の値に
制限し、前記制限されたサブクラスタ内積の全てからサ
ブクラスタ・ベクトルを形成するステップと、 前記サブクラスタ・ベクトルと文字集合内の各文字に対
する加重係数ベクトルとの文字内積を発生するステップ
と、 前記文字内積の各々をゼロ又は1の近傍の値に制限する
ステップと、 他の全ての制限された内積がゼロの近傍であるとき、1
の近傍の値を有する単一の制限された文字内積に関連す
る文字として、前記走査された文字を識別するステップ
と、 を含むことを特徴とする方法。4. The method of claim 1, wherein the step of analyzing a character vector comprises generating a subcluster inner product of the character vector and a subcluster weighting coefficient vector for each subcluster in a character in the character set. Limiting each of the subcluster inner products to values near zero or one and forming a subcluster vector from all of the restricted subcluster inner products; and Generating a character inner product with a weighting coefficient vector for each character in the following: limiting each of the character inner products to a value near zero or one; and all other restricted inner products near zero. Once, 1
Identifying the scanned character as a character associated with a single restricted character dot product having a value in the vicinity of.
するスキャナと、 前記画像信号を前記デジタイザによりペルのパターンに
デジタル化する手段と、 前記文字パターンのペルの内複数の起点ペルを選択し、
その各々について、起点ペルから複数の放射方向に沿っ
たペルのパターンのストロークを調べて、第1放射方向
において前記起点ペルから測定された最初のストローク
の長さ、前記第1放射方向に隣接する放射方向において
起点ペルから測定された最初のストロークの長さ、前記
第1放射方向において測定された前記起点ペルから遠隔
ストロークまでの距離、および前記第1放射方向に隣接
する放射方向において測定された前記起点ペルから遠隔
ストロークまでの距離、を測定する手段と、 前記起点ペルの各々について、前記2つのストロークの
長さ、および2つの距離を相互に比較し、その比較結果
に従って各起点ペルからの2放射方向パターンを特徴づ
けるベクトルを発生する手段と、 前記ベクトルを論理ネットワークにて解析し、前記走査
された文字を分類し、その分類に基づいて、前記走査さ
れた文字を所定の文字集合内の文字として識別する手段
と、 を含むことを特徴とする文字認識装置。5. A scanner which scans a recognized character to generate an image signal, means for digitizing the image signal into a pel pattern by the digitizer, and a plurality of starting pels among the pels of the character pattern. Selected,
For each of them, examine the stroke of the pattern of pels along the plurality of radial directions from the origin pel, and measure the length of the first stroke measured from the origin pel in the first radial direction, adjacent to the first radial direction The length of the initial stroke measured from the origin pel in the radial direction, the distance from the origin pel to the remote stroke measured in the first radial direction, and measured in the radial direction adjacent to the first radial direction Means for measuring a distance from the origin pel to a remote stroke; and, for each of the origin pels, comparing the lengths of the two strokes and the two distances with each other and according to the comparison result, (2) means for generating a vector characterizing the radiation direction pattern, and analyzing the vector with a logical network, Classifies the scanned character, on the basis of that classification, the character recognition apparatus characterized by comprising, means for identifying the scanned character as a character of a predetermined character in the set.
て、前記選択された起点ペルは、前記走査した文字の輪
郭のペルであることを特徴とする装置。6. The character recognition apparatus according to claim 5, wherein the selected starting point pel is a pel of the outline of the scanned character.
て、前記選択された起点ペルは、前記走査された文字の
コア・ペルであることを特徴とする装置。7. The character recognition device according to claim 5, wherein the selected starting point pel is a core pel of the scanned character.
て、前記選択された起点ペルは、前記走査された文字の
全てのペルであることを特徴とする装置。8. The character recognition device according to claim 5, wherein the selected origin pel is all pels of the scanned character.
て、ベクトルを発生する前記手段は、 前記走査されている文字において発生されたベクトルの
内、同じ値のベクトルの数の計数値を発生する手段と、 前記走査されている文字の全ての起点に対して、前記計
数値をヒストグラムとして表し、これによりベクトルを
形成する手段と、 を含むことを特徴とする装置。9. The character recognition apparatus according to claim 5, wherein the means for generating a vector generates a count value of the number of vectors having the same value among the vectors generated in the character being scanned. Means for displaying the counts as a histogram for all origins of the scanned character, thereby forming a vector.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US07/865,608 US5303311A (en) | 1990-03-12 | 1992-04-09 | Method and apparatus for recognizing characters |
| US865608 | 1992-04-09 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0684011A JPH0684011A (en) | 1994-03-25 |
| JP2579413B2 true JP2579413B2 (en) | 1997-02-05 |
Family
ID=25345872
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5015599A Expired - Fee Related JP2579413B2 (en) | 1992-04-09 | 1993-02-02 | Character recognition method and device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2579413B2 (en) |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5951033B2 (en) * | 1979-10-18 | 1984-12-12 | 日本電信電話株式会社 | Basic figure element extraction device |
| JPS62287386A (en) * | 1986-06-06 | 1987-12-14 | Matsushita Electric Ind Co Ltd | Feature extraction device |
| JPH02299085A (en) * | 1989-05-12 | 1990-12-11 | Sharp Corp | Character recognition method |
-
1993
- 1993-02-02 JP JP5015599A patent/JP2579413B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0684011A (en) | 1994-03-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5303311A (en) | Method and apparatus for recognizing characters | |
| Srikantan et al. | Gradient-based contour encoding for character recognition | |
| US4259661A (en) | Apparatus and method for recognizing a pattern | |
| US6118890A (en) | System and method for broad classification of biometric patterns | |
| US4028674A (en) | Automated signature verification system | |
| US5359671A (en) | Character-recognition systems and methods with means to measure endpoint features in character bit-maps | |
| CN109740606B (en) | Image identification method and device | |
| Hamida et al. | A novel feature extraction system for cursive word vocabulary recognition using local features descriptors and gabor filter | |
| US5825925A (en) | Image classifier utilizing class distribution maps for character recognition | |
| Awaidah et al. | A multiple feature/resolution scheme to Arabic (Indian) numerals recognition using hidden Markov models | |
| Singh et al. | Cursive digit and character recognition in CEDAR database | |
| Vyas et al. | Classification of handwritten Gujarati numerals | |
| Ghadhban et al. | Segments interpolation extractor for finding the best fit line in Arabic offline handwriting recognition words | |
| US5105470A (en) | Method and system for recognizing characters | |
| CN108960005B (en) | Method and system for establishing and displaying object visual label in intelligent visual Internet of things | |
| Sathya Narayanan et al. | RETRACTED ARTICLE: An efficient recognition system for preserving ancient historical documents of English characters | |
| JP2579413B2 (en) | Character recognition method and device | |
| Miciak | Radon Transformation and Principal Component Analysis Method Applied in Postal Address Recognition Task. | |
| Halder et al. | Individuality of isolated Bangla numerals | |
| Sonavane et al. | Review on optical character recognition-based applications of industrial iot | |
| Abaynarh et al. | ENHANCED FEATURE EXTRACTION OF HANDWRITTEN CHARACTERS AND RECOGNITION USING ARTIFICIAL NEURAL NETWORKS. | |
| Fazilov et al. | State of the art of writer identification | |
| Chakraborty et al. | Baseline detection of multi-lingual unconstrained handwritten text lines | |
| Ramesh et al. | KHDR: Kannada handwritten digit recognition using PCA and SVM classifier | |
| Tou et al. | Automatic recognition of handwritten characters via feature extraction and multi-level decision |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |