JPH05506115A - Correlation masking process for deskewing, filtering and recognition of vertically segmented characters - Google Patents

Correlation masking process for deskewing, filtering and recognition of vertically segmented characters

Info

Publication number
JPH05506115A
JPH05506115A JP91504482A JP50448291A JPH05506115A JP H05506115 A JPH05506115 A JP H05506115A JP 91504482 A JP91504482 A JP 91504482A JP 50448291 A JP50448291 A JP 50448291A JP H05506115 A JPH05506115 A JP H05506115A
Authority
JP
Japan
Prior art keywords
image
mask
vertical
histogram
recognition device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP91504482A
Other languages
Japanese (ja)
Inventor
ガボウスキ,ロジャー・スティーヴン
Original Assignee
イーストマン・コダック・カンパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by イーストマン・コダック・カンパニー filed Critical イーストマン・コダック・カンパニー
Publication of JPH05506115A publication Critical patent/JPH05506115A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • G06V30/2247Characters composed of bars, e.g. CMC-7

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Macromolecular Compounds Obtained By Forming Nitrogen-Containing Linkages In General (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。 (57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 垂直方向にセグメント化されたキャラクタのデヌ牛ユーイングろ波及び認識のt ζめの相関マスキング処理元型の背量 挾血云野 本発明は 垂直方向にセグメント化されたキャラクタを認識する光学式文字認識 装置に関する。[Detailed description of the invention] Denu cow Ewing filtering and recognition of vertically segmented characters The amount of correlation masking processing archetype of ζ Hanketsu Yunno The present invention is an optical character recognition system that recognizes vertically segmented characters. Regarding equipment.

貨−探術 垂直方向にセグメント化されたキャラクタは、肉眼で読み取り可能であると共に 、機械的に読み取り可能なシンボルを必要とする 例えば銀行小切手のような書 類上に印刷される。一つのキャラクタにおいて、垂直方向のセグメントは、その キャラクタが肉眼で読み取り可能となるように、特定シンボルの輪郭に一致させ る。一方、そのキャラクタにおいて 垂直方向に異なるセグメント間で水平方向 に異なる間隔のパターンは特定のシンボルを固有に定めるので キャラクタは機 械的に読み取り可能なものとなる。この考えは、ファイセル(Fei+5ell 他に対する米国特許第3.309.667号、及びルイエール(L’hilli erlに対する米国特許第3.688.955号に開示されている。Currency - Exploration Vertically segmented characters are readable to the naked eye and , documents that require machine-readable symbols, such as bank checks. printed on the class. For one character, the vertical segment is its Match the outline of a particular symbol so that the character is readable to the naked eye. Ru. On the other hand, in that character, between vertically different segments, horizontally The different spacing patterns uniquely define a particular symbol, so the character Become machine-readable. This idea is based on Fei + 5ell No. 3,309,667 to et al., and L'hilli et al. No. 3,688,955 to erl.

ハンチエフ) (Haoche111他に対する米国特許第3,539,989 号、及びラフエベールズ(Lateマers)他に対する米国特許第4.053 .737号に開示されているように 周知の技術では、文書から垂直方向にセグ メント化されたキャラクタを読み込むために、ピーク検出を採用している1文書 イメージ・データは狭い垂直方向の窓により水平方向に走査され、窓におけるビ クセル密度が寥の水平方向位置の関数としてプロットされる。プロットにおける ピークはピーク検出器により位置決めされ ピーク間のスペースのパターンは既 知シンボルのパターンと比較される。この技術の一つの利点は 垂直窓の狭さが 文書上に印刷された垂直方向のセグメントの厚さにおける変動からの影響を最小 化させることである。(U.S. Patent No. 3,539,989 to Haoche 111 et al. No. 4.053, and U.S. Patent No. 4.053 to Latemers et al. .. As disclosed in No. 737, well-known techniques include vertically segmenting a document A document that employs peak detection to read characterized characters. The image data is scanned horizontally through a narrow vertical window; The density of cells is plotted as a function of the horizontal position of the pig. in the plot The peaks are located by a peak detector, and the pattern of the spaces between the peaks is already It is compared with the pattern of knowledge symbols. One advantage of this technology is that the vertical window is narrow. Minimizes the impact from variations in the thickness of vertical segments printed on documents It is to make it possible.

一つの問題は、文書そのものがスキニーを持ったり、又は湾曲して印刷されたた めに、垂直方向にセグメント化されたキャラクタのイメージがそのイメージの平 面上で歪められたり、又は回転されることがあるということにある。スキューを 持ったイメージは垂直方向にセグメント化されたキャラクタの認識を妨げること がある。特に、スキニーの角度が増加するに従って4 ピーク検出器により検出 されるピークが拡散又は幅広となる。更に、このことはピーク間の距離を測定し て既知のシンボルのパターンと一致するパターンを形成できるようにする精度を 低下させる。更にスキューの角度が増加するに従い、ある点でピークが広げられ 、かつ低いものとなるので ピーク間の距離を確実に測定できず、従って与えら れたキャラクタにおける間隔)<ターンを正確に定められず、キャラクタを互い に区別することができない。One problem is that the document itself has skinny or curved prints. For example, a vertically segmented character image is The problem is that it can be distorted or rotated on the surface. skew Images that have been segmented vertically may impede recognition of characters There is. In particular, as the skinny angle increases, detected by the 4 peak detector peaks become diffuse or broad. Furthermore, this allows us to measure the distance between peaks. accuracy that allows the formation of patterns that match patterns of known symbols. lower. Furthermore, as the skew angle increases, the peak broadens at a certain point. , and will be low, so the distance between the peaks cannot be reliably measured, and therefore the given (distance between characters) cannot be distinguished.

従って、本発明の目的は、スキニーが存在しても信頼性を低下させることなく垂 直方向にセグメント化されたキャラクタを識別することにある。Therefore, it is an object of the present invention to improve the performance of the present invention without reducing reliability even in the presence of skinny. The purpose is to identify vertically segmented characters.

発男Ω開示 垂直方向にセグメント化されたキャラクタは、光学式文字認識のために、短い空 間周波数を有する平行な複数の垂直ラインからなるマスクによる畳み込みにより 前処理される。セグメント化された各キャラクタに対するマスクの水平方向アラ イメントは、最大相互相関が得られるまで調整される1次いで、マスクとキャラ クタ・イメージの積が形成される。マスクの各垂直ラインに沿った積イメージに おける「オン」画素数のヒストグラムは、このような既知シンボルのヒストグラ ムのライブラリと比較され、最良の一致によりキャラクタ・イメージにより表わ されているシンボルを識別する。Male birth Ω disclosure Vertically segmented characters have short blanks for optical character recognition. By convolution with a mask consisting of parallel vertical lines with frequencies between Pre-processed. Horizontal alignment of the mask for each segmented character The mask and character are adjusted in the first order until the maximum cross-correlation is obtained. A product of vector images is formed. to the product image along each vertical line of the mask. The histogram of the number of “on” pixels in The best match represents the character image. identify the symbol being used.

好ましい実施例において、マスクにおける垂直ラインの間隔は1画素であるがい ずれの場合であっても垂直方向にセグメント化されたキャラクタのうちの種々の キャラクタのパターンに採用された、あり得る全ての画素間隔の共通約数でなけ ればならない、好ましい実施例において、マスクにおける垂直ラインの厚さは1 画素であるが 垂直方向のセグメントの厚さが多数画素である場合に、厚さを更 に厚くすることができる。In a preferred embodiment, the vertical lines in the mask are spaced one pixel apart. Even in case of misalignment, various of the vertically segmented characters Must be a common divisor of all possible pixel spacings used in the character's pattern. In the preferred embodiment, the thickness of the vertical lines in the mask is 1 pixel, but if the vertical segment thickness is many pixels, change the thickness. It can be made thicker.

最大相互相関点においてマスクを水平方向に位置決めすることの利点は、キャラ クタが未知量のスキューを持っていてもキャラクタにおける垂直方向のセグメン トを対応する垂直マスク ラインのキャラクタ上に中心付けることである。マス ク・イメージとキャラクタ イメージとの積をめる利点は、キャラクタにおいて 垂直方向のセグメントの厚さの変動を結果として得られる積イメージから除去さ れることにある。垂直マスク ラインに沿って「オン」画素のヒストグラムを計 算することの利点は、キャラクタ・イメージにスキューが存在していても、異な るキャラクタの間隔パターン間の区別を確実にすることにである。このことは  複数の垂直マスク・ラインがそれぞれ1垂直キヤラクタ・セグメント以上と交差 するものであっても成立する。The advantage of positioning the mask horizontally at the point of maximum cross-correlation is that vertical segments in the character even if the character has an unknown amount of skew. centering the mark on the character of the corresponding vertical mask line. trout The advantage of multiplying the character image by the character image is that Vertical segment thickness variations are removed from the resulting product image. It's about being able to do something. Vertical Mask Plans the histogram of “on” pixels along the line. The advantage of calculating is that even if there is skew in the character image, different The objective is to ensure differentiation between character spacing patterns. This thing is Multiple vertical mask lines each intersect one or more vertical character segments It holds true even if it is.

2血の間車l認朋 添付する図を参照して本発明を以下で詳細に説明する。2 Bloody Car Licensed Tomo The invention will be explained in more detail below with reference to the accompanying figures.

第1図は機械により読み取り可能 かつ肉眼により読み取り可能な垂直方向にセ グメント化された従来技術のキャラクタであって 本発明を含む装置により読み 出されるべきキャラクタの例示的文書イメージを示す図であり第2図は本発明を 含み 第1図のキャラクタを読み出すシステムのブロック図であり 第3図は第1図のイメージから垂直方向にセグメント化されたキャラクタと、垂 直方向に配列されたマスクとについて第2図のシステムにより実行される畳み込 みを示す図であり。Figure 1 is a machine-readable and eye-readable vertical orientation. Characters of the prior art that have been made into FIG. 2 is a diagram showing an exemplary document image of characters to be displayed; FIG. This is a block diagram of a system for reading out the characters shown in Figure 1. Figure 3 shows a character segmented vertically from the image in Figure 1 and a vertically segmented character. Convolution performed by the system of Figure 2 with orthogonally aligned masks This is a diagram showing the details.

第4図は第3図の畳み込みの積の図であり、第5図は第4図の積の「オン」画素 のヒストグラムを示す図であり、第6図は第5図に対応する図であり 第5図の ヒストグラムから構築された二進数の符号ワードを示す図である。Figure 4 is an illustration of the convolution product of Figure 3, and Figure 5 is an illustration of the "on" pixel of the product of Figure 4. FIG. 6 is a diagram corresponding to FIG. 5, and FIG. FIG. 3 illustrates a binary code word constructed from a histogram.

杢光叫の去施倒 第1図を参照すると ファイセル(Fe+5ell他に対する米国特許第3.3 09,667号に開示されている型式の垂直方向にセグメント化されたキャラク タは それぞれ肉眼により読み取り可能なシンボルの内輪郭と外輪郭との間に位 置する垂直方向に平行なセグメントを構成する1例えば、数字の「6」は文書イ メージ100内で垂直方向のセグメン)looa、100b、100c・・によ り表わされ 各セグメントの終端は数字の「6」の内輪郭及び外輪郭に接してい る。このように 各セグメントの長さはキャラクタを肉眼により読み取り得るよ うに選択されている。隣接するセグメント間で水平方向に測定される間隔は異な っており 各シンボルに固有な線形のシーケンス即ち間隔のパターンを定めてい る。従って、数字の「6」の場合に、第1対のセグメント100a、100b間 の間隔は、第2対のセグメン)100bと 1000との間の間隔より広く、一 方策3対のセグメン)100cと、100dとの間の間隔は前記2つのものより 太きい0間隔パターンは容易に確認され、これを簡単な装置により一組の2知の パターンと合せられる。従って、隣接するセグメントの各対間における間隔はキ ャラクタを機械により読み取り得るように選択される。Mokkou's death Referring to FIG. 1, U.S. Patent No. 3.3 to Fe+5ell et al. Vertically segmented characters of the type disclosed in No. 09,667 Each symbol is located between the inner and outer contours of the symbol that can be read by the naked eye. For example, the number "6" is Vertical segment within image 100) looa, 100b, 100c... The end of each segment touches the inner and outer contours of the number "6". Ru. In this way, the length of each segment is such that the character can be read with the naked eye. The sea urchin has been selected. The spacing measured horizontally between adjacent segments is different It defines a unique linear sequence or pattern of intervals for each symbol. Ru. Therefore, in the case of the number "6", between the first pair of segments 100a and 100b is wider than the spacing between the second pair of segments) 100b and 1000; The interval between 100c and 100d (segments of 3 pairs of strategies) is larger than the above two. The thick 0-interval pattern is easily confirmed and can be detected using a simple device. Matches the pattern. Therefore, the spacing between each pair of adjacent segments is The character is selected to be machine readable.

本発明により第1図のキャラクタを読み取るシステムを第2図に示す、スキャナ 101は第1図に示す型式のキャラクタの文書を走査し、文書イメージを発生す る。この文書イメージは、好ましくは 画素が垂直な列及び水平な行に編成され た二進数のデータ ブロックであって、その文書イメージにおいて各二進ビット が2値トーン画素を表わしている。相関器102は、スキャナ101からの文書 イメージと、第2図のメモリ104に記憶され、第3図に示す平行な垂直ライン を除外してなるマスク イメージ300との積を計算する。マスク・イメージ3 00は 好ましくは 画素が垂直な列及び水平な行に編成された他の二進数のデ ータ・ブロックであって、各二進ビットがこのマスク イメージ300における 画素を表わしている。A system for reading the characters of FIG. 1 according to the present invention is shown in FIG. 2, using a scanner. 101 scans a character document of the type shown in FIG. 1 and generates a document image. Ru. This document image preferably has pixels organized into vertical columns and horizontal rows. A block of binary data that represents each binary bit in the document image. represents a binary tone pixel. The correlator 102 receives the document from the scanner 101. image and parallel vertical lines stored in memory 104 of FIG. 2 and shown in FIG. Calculate the product with the mask image 300 excluding . mask image 3 00 is preferably another binary number whose pixels are organized in vertical columns and horizontal rows. data block, where each binary bit is It represents a pixel.

第3図に示すように、マスク・イメージ300における各垂直マスク・ライン3 00a、300b、300C−・は、厚さが1イメ一ジ画素である。垂直マスク ・ライン300a、300b、300c・・は 全で第1図のキャラクタにおい て隣接する垂直方向のセグメント間の最小インターバルに等しい距離dにより均 一に隔てられている。その代りに、マスク インターバルdは、第1図に対応し 。As shown in FIG. 3, each vertical mask line 3 in the mask image 300 00a, 300b, 300C-. have a thickness of one image pixel. vertical mask ・The lines 300a, 300b, 300c, etc. all correspond to the characters in Figure 1. by a distance d equal to the minimum interval between adjacent vertical segments. are separated by one. Instead, the mask interval d corresponds to FIG. .

セグメント化された全てのキャラクタ・セットに採用された異なる全てのインタ ーバルA、B、C・−の共通除数でもよい、更に、他の実施例として、垂直マス ク・ライン300a、300b、300C・・の輻は、第1図のキャラクタの各 垂直方向におけるセグメントの厚さTが多数のイメージ画素である場合に 1イ メ一ン画素より大きくてもよい。All different interfaces adopted for all segmented character sets In addition, as another embodiment, the vertical mass The convergence of the lines 300a, 300b, 300C, etc. of each character in FIG. If the thickness of the segment in the vertical direction T is a number of image pixels, It may be larger than the main pixel.

文書イメージ100とマスク イメージ300との積を有効にするためには、ま ず文書イメージ100に対してマスク イメージ300の正しい水平位置を見出 す必要がある。垂直セグメントがマスク ラインに対して一平行でなく一スキュ ーを持っていても、正しい水平位置は各垂直セグメント100a、10100b 100が垂直マスク ライン300a、300b、300cmのうちで対応する 一つに中心付けされたものである。スキューを持った垂直セグメントが垂直マス ク ライン上に中心付けられることを第3図に、屯線により示す、マスク・イメ ージ300のこの正しい水平位置を見出すために、相関器102はマスク イメ ージ300を増分ステップにより文書イメージ100上を水平方向に移動させ各 ステップにおいて文書イメージ100とマスク イメージ300との画素毎の積 を計算する0文書イメージ100に対するマスク イメージ300の移動方向は 、特に文書イメージ100が第3図に示すようにスキューを持っているときは文 書イメージ100における水平画素行の方向と平行であってはならないことに注 意すべきである。好ましくは、各増分ステップの長さは、垂直マスク・ライン間 の距離dの一部分である。To enable the product of document image 100 and mask image 300, First, find the correct horizontal position of the mask image 300 relative to the document image 100. It is necessary to If the vertical segment is not parallel to the mask line but one skew The correct horizontal position is for each vertical segment 100a, 10100b. 100 corresponds to vertical mask lines 300a, 300b, 300cm It is centered on one thing. A vertical segment with skew is a vertical mass The mask image is centered on the square line, which is shown in Figure 3 by the tomb line. To find this correct horizontal position of image 300, correlator 102 uses a mask image. page 300 is moved horizontally over document image 100 in incremental steps. In the step, the pixel-by-pixel product of the document image 100 and the mask image 300 is The moving direction of the mask image 300 for the document image 100 is , especially when the document image 100 has a skew as shown in FIG. Note that it must not be parallel to the direction of the horizontal pixel rows in the image 100. should be taken into consideration. Preferably, the length of each incremental step is between vertical mask lines. is a part of the distance d.

このようにして、相関器102により発生した積イメージ400の例を第4図に 示す、第4図の積イメージ400は 文書イメージ100における各画素の二進 値をマスク−イメージ300において対応する画素と掛算することにより、発生 したものである。従って 積イメージ400は垂直マスク・ライン300a30 0b、300C・の画素位置に沿って配置された「オン」画素を有する。第4図 の積イメージ400は文書イメージ100に対するマスク・イメージ300の「 正しい」水平位置に一致して対応しており 文書イメージ100において各垂直 キャラクタ セグメント100a、100b・・は対応する垂直マスク ライン 300a、300b 上に中心付けられている。しかし、この点において文書イ メージ100の正しい水平位置は達成され得るとは限らないことを理解すべきで ある。An example of a product image 400 generated by the correlator 102 in this manner is shown in FIG. The product image 400 shown in FIG. 4 is the binary representation of each pixel in the document image 100. generated by multiplying the value by the corresponding pixel in the mask-image 300. This is what I did. Therefore, product image 400 is vertical mask line 300a30 It has "on" pixels located along pixel positions 0b, 300C. Figure 4 The product image 400 is the product image 400 of the mask image 300 for the document image 100. Each vertical position in the document image 100 corresponds to the correct horizontal position. Character segments 100a, 100b... are the corresponding vertical mask lines It is centered on 300a, 300b. However, the document It should be understood that the correct horizontal position of the image 100 may not always be achieved. be.

マスク イメージ300の各増分ステップにおいて相関器+02が発生する各積 イメージ400のために、加算器103はマスク イメージの各垂直マスクライ ン300a、300b、300cに沿い「オン」画素の数の総和を計算する。Each product generated by the correlator +02 at each incremental step of the mask image 300 For image 400, adder 103 adds each vertical mask line of the mask image. The sum of the number of "on" pixels along lines 300a, 300b, 300c is calculated.

相関器102が文書イメージ100上のマスク イメージ300を増分的にステ ップするに従って プロセッサ105は各増分ステップにより加算器103が計 算した全垂直マスク ライン300a、300b についての総和を対応するメ モリ ビンに格納して、各増分ステップについて第5図に示すようなヒストグラ ムを形成する。プロセンサ105は、垂直キャラクタ・セグメン)100cと1 00dとの間で少なくとも最長のインターバルC(第3図)を覆う多数の増分ス テップを完了した後に、格納した総和を調べ どの増分ステップにおいて加算器 103が最大の総和を発生したかを判断する。加算器103が最大の総和を発生 した増分ステップは1文書イメージ10oの「正しい」水平位lてあり、そこで は各垂直キャラクタ セグメントが、第3図に示すように、垂直マスク・ライン のうちの対応する一つの上に中心付けられている。Correlator 102 incrementally steps mask image 300 over document image 100. With each incremental step, processor 105 adds The sum of the calculated vertical mask lines 300a and 300b is calculated using the corresponding menu. For each incremental step, a histogram like the one shown in Figure 5 is created. form a system. The prosensor 105 has vertical character segments) 100c and 1 00d, covering at least the longest interval C (Fig. 3). After completing a step, examine the stored sum and at which incremental step the adder 103 to determine whether the maximum sum has been generated. Adder 103 generates the maximum sum The incremental steps taken are at the "correct" horizontal position of the document image 10o, where is a vertical mask line where each vertical character segment is shown in Figure 3. centered on the corresponding one of the two.

このようにして、プロセッサ105は、「正しい」水平位置を識別すると直ちに 、乗算器106に指令して、スキャナから受け取る文書イメージ100に対して 正しい増分ステップでメモリ104からのマスク イメージ300を配置させか つイメージを互いに掛算させて第4図の積イメージを発生させ1次いでこれをメ モリ107に記憶させる。加算器108は第4図の積イメージから第5図のヒス トグラムを計算する。他の実施例において 乗算器106及び加算器108は省 略される。当該他の実施例において、プロセッサ105は、マスク・イメージ3 00の全ての増分ステップについて格納した全てのヒストグラムからそのビンが 最高の総和を有するヒストグラム500を選択すると共に、このヒストグラムを 出力する。最高の総和を有するヒストグラムはマスク・イメージ位置の増分ステ ップに対応しており、この位置では文書イメージ100の垂直キャラクタ セグ メントがマスク イメージ300の対応する垂直マスク・ライン上に中心付けら れている。In this way, as soon as processor 105 identifies the "correct" horizontal position, , for the document image 100 received from the scanner. Place the mask image 300 from memory 104 in the correct incremental steps. The two images are multiplied together to generate the product image shown in Figure 4. It is stored in the memory 107. The adder 108 converts the histogram in FIG. 5 from the product image in FIG. Calculate the totogram. In other embodiments, multiplier 106 and adder 108 may be omitted. Omitted. In such other embodiments, processor 105 may include mask image 3 From all histograms stored for all incremental steps of 00, that bin is Select the 500 histograms with the highest sum and set this histogram to Output. The histogram with the highest sum is the incremental step of the mask image position. This position corresponds to the vertical character segment of document image 100. center on the corresponding vertical mask line of the mask image 300. It is.

好ましい実施例において加算器108により発生した。又は他の実施例において プロセッサ105により選択されたヒストグラムは、プロセッサ109に入力さ れる。プロセッサ109は 0又は非常に小さな値を有する連続的なビンを検索 することにより、隣接するキャラクタのヒストグラムから個別的なキャラクタの ヒストグラムを分離する。これらのビンは文書イメージ100において隣接す較 器110に送信する。比較器110は、当該技術分野において周知のパターン一 致技術を用いて ヒストグラムとメモリ111に記憶されている基準ヒストグラ ムのライブラリのうちの各一つとの間の相互相関各計算する。比較器110は最 高相関を有する基準ヒストグラムを「勝者」と宣言し、従ってこのキャラクタ・ イメージを識別するものである。generated by adder 108 in the preferred embodiment. or in other embodiments The histogram selected by processor 105 is input to processor 109. It will be done. Processor 109 searches for consecutive bins with 0 or very small values. By Separate histograms. These bins correspond to adjacent bins in the document image 100. 110. Comparator 110 uses a pattern well known in the art. The histogram and the reference histogram stored in the memory 111 are Each calculates the cross-correlation between each one of the program libraries. The comparator 110 Declare the reference histogram with a high correlation as the “winner” and therefore It identifies the image.

基準ヒストグラムのライブラリは スキャナ101に既知のシンボルの連続的な イメージを供給して、プロセッサ109が受け取ったヒストグラムをメモリ11 1に対応するシンボルの識別と共に格納することにより、第2図のシステムの「 プログラムコモードにより発生される。The library of reference histograms consists of a series of symbols known to the scanner 101. The histogram received by the processor 109 is stored in the memory 11. By storing the symbol with the identification corresponding to 1, the system of FIG. Generated by program commode.

本発明の他の実施例において プロセッサ109は、個別的な各キャラクタのヒ ストグラムを比較器110の代わりに符号ワード変換器112に送信する。符号 ワード変換器112は、「オン」画素カウントが0でない第5図のヒストグラム 500の各ビン500a、500b、500c・・に二進数の「1」を割り付け 。In another embodiment of the invention, the processor 109 is configured to The stogram is sent to codeword converter 112 instead of comparator 110. sign Word converter 112 converts the histogram of FIG. Assign a binary number "1" to each of the 500 bins 500a, 500b, 500c... .

「オン画素カウントが0の各ビンに二進数の「0」を割り付ける0次いで、符号 ワード変換器112は連続する1及びOを配列して第6図に示す符号ワードを形 成する比較器113は符号ワードをメモリ114に格納されている基準符号ワー ドのライブラリと比較する。比較器113は、符号ワード変換器112により形 成された符号ワードに対しで最高の相関を有する基準符号ワードを「勝者」であ ると宣言し、これによって対応するキャラクタを識別する。``Assign a binary ``0'' to each bin with an on pixel count of 0.0 then sign Word converter 112 arranges consecutive 1's and O's to form the code word shown in FIG. Comparator 113 converts the code word into a reference code word stored in memory 114. Compare with the code library. The comparator 113 is configured by the code word converter 112. The “winner” is the reference codeword with the highest correlation to the codewords created. , and identify the corresponding character.

基準符号ワードのライブラリは、スキャナ101に既知のキャラクタの連続的な イメージを供給して 符号ワード変換器112により形成される符号ワードをメ モリ114に格納するCとにより、「プログラム」モードにおいて第2図のシス テムにより発生される。The library of reference code words consists of a sequence of characters known to the scanner 101. the code word formed by the code word converter 112. C stored in the memory 114 allows the system shown in FIG. generated by the system.

タ び のr 本発明は 肉眼により読み取り可能、かつ機械により読み取り可能な型式の垂直 方向にセグメント化されたキャラクタのイメージについてデスキューし ろ渡し て読み取るシステムとして有用である。Tabi no r The present invention provides a visually readable and machine readable type vertical Deskew the image of the character segmented in the direction It is useful as a reading system.

口にセグメント されたキャラクタのデスキューイングろ びUのための マス キング几理 炙−約−1 光学式文字認識のために1画素の空間周波数を有する平行な垂直ラインからなる マスクによる畳き込みによってスキュー及び雑音を除くように、垂直方向にセグ メント化されたキャラクタを前処理する。各セグメント化キャラクタに対するマ スクの水平方向アライメントは、最大相互相関を見出すまで調整される0次いで 、マスクとキャラクタ イメージとの積が形成される。マスクの各垂直ラインに 沿って積イメージにおける画素数のヒストグラムを既知のシンボルのヒストグラ ムのライブラリと比較し、最良の一致によりキャラクタ イメージにより表わさ れたシンボルを識別する。その代りに、前記ヒストグラムを二進数の符号ワード に変換しこれを一組の既知のシンボルに対応する符号ワードのライブラリと比較 する。Mass for deskewing and U of characters segmented into mouth King 几り Roasted - about -1 Consisting of parallel vertical lines with a spatial frequency of 1 pixel for optical character recognition Segment vertically to remove skew and noise by convolution with a mask. Preprocessing the mentized character. The map for each segmented character The horizontal alignment of the cross-correlation is adjusted by zero-order until finding the maximum cross-correlation , the product of the mask and the character image is formed. for each vertical line of the mask The histogram of the number of pixels in the product image along with the histogram of known symbols character image with the best match. Identifies the symbol. Instead, the histogram can be expressed as a binary code word and compare this with a library of codewords corresponding to a set of known symbols do.

手続補正書彷炙 平成 5年ケ月、修′日≦Procedural amendment report 1993 month, school day ≦

Claims (20)

【特許請求の範囲】[Claims] 1.平行な画素の水平行及び垂直列の文書イメージから垂直方向にセグメント化 されたキャラクタを読み取る光学式文字認識装置において、平行な複数の垂直ラ インを備えたマスク・イメージを定める手段と、複数の増分ステップのうちの一 つで前記文書イメージに関して前記マスク・イメージを配置させて、前記文書イ メージと前記マスク・イメージとの間で異なる画素対を相関させる増分マスク・ ステツピング手段と、前記文書イメージと前記マスク・イメージとの対応す画素 対を互いに乗算することにより積イメージを発生する手段と、前記ステップのう ちのいずれが前記文書イメージと前記マスタ・イメージとの間の最大相関に対応 するのかを判断する手段と、前記文書イメージと前記マスタ・イメージとの間で 最大相関を有する増分ステッブに対応した前記積イメージのヒストグラムを発生 する手段と、前記ヒストグラムから前記文書イメージにおける個別的なキャラク タの識別を判断する手段と により特徴付けられた光学式文字認識装置。1. Segment vertically from a document image in horizontal and vertical rows of parallel pixels In an optical character recognition device that reads characters that are means for defining a mask image with a mask image and one of a plurality of incremental steps; positioning the mask image with respect to the document image to an incremental mask that correlates different pixel pairs between the image and the mask image; stepping means and corresponding pixels of said document image and said mask image; means for generating a product image by multiplying the pairs together; which corresponds to the maximum correlation between the document image and the master image between the document image and the master image; Generate a histogram of the product image corresponding to the incremental step with maximum correlation means for determining individual characters in the document image from the histogram; means to determine the identity of the An optical character recognition device characterized by: 2.ヒストグラムを発生する前記手段は前記積イメージにおける複数の垂直列に おける「オン」画素の総和を計算する手段により特徴付けられた請求項1記載の 光学式文字認識装置。2. The means for generating a histogram is arranged in a plurality of vertical columns in the product image. 2. The method according to claim 1, characterized by means for calculating the sum of "on" pixels in the Optical character recognition device. 3.積イメージを発生する前記手段は前記各増分ステップについて積イメージを 発生し、ヒストグラムを発生する前記手段は前記各増分ステップの積イメージか らヒストグラムを発生し、かつ最大の相関を判断する前記手段は、前記増分ステ ップのうちのいずれが、「オン」画素の総和を計算する前記手段により計算され た最大の総和に対応するのかを判断する手段により特徴付けられた請求項2記載 の光学式文字認識装置。3. Said means for generating a product image generates a product image for each said incremental step. and the means for generating the histogram is the product image of each of the incremental steps. said means for generating a histogram from said incremental steps and determining a maximum correlation; which of the pixels is calculated by said means of calculating the sum of "on" pixels. Claim 2 characterized by a means for determining whether the invention corresponds to the maximum sum of optical character recognition device. 4.前記増分マスク・ステツピング手段は前記マスク・イメージを前記平行な垂 直マスク・ラインに対して水平方向に前記文書イメージ上で移動させ、前記垂直 マスク・ライン及び前記垂直キャラクタ・セグメントがスキュー角度内で少なく ともほぼ平行であることにより特徴付けられた請求項1記載の光学式文字認識装 置。4. The incremental mask stepping means steps the mask image in the parallel vertical direction. Directly move on the document image horizontally with respect to the mask line and vertically The mask line and the vertical character segment are less within the skew angle. 2. The optical character recognition device according to claim 1, wherein the optical character recognition device is substantially parallel to the optical character recognition device. Place. 5.前記垂直キャラクタ・セグメントのうちの隣接するものについて異なる複数 対は異なる分離長により分離されており、前記垂直マスク・ラインは前記異なる 分離長の共通除数である空間的なインターバルdで配置され、前記各増分ステッ ブはdの一部分であり、前記全増分ステップは少なくともdに等しい距離をカバ ーすることにより特徴付けられた請求項4記載の光学式文字認識装置。5. a plurality of different adjacent ones of said vertical character segments; the pairs are separated by different separation lengths, and the vertical mask lines are separated by different separation lengths. Each incremental step is arranged at a spatial interval d that is a common divisor of the separation length. is a fraction of d, and the total incremental step covers a distance at least equal to d. 5. The optical character recognition device according to claim 4, characterized by: 6.前記垂直マスク・ラインの厚さは前記垂直キャラクタ・セグメントの厚さよ り薄いことにより特徴付けられた請求項5記載の光学式文字認識装置。6. The thickness of the vertical mask line is less than the thickness of the vertical character segment. 6. The optical character recognition device according to claim 5, wherein the optical character recognition device is characterized by being thin. 7.前記垂直マスク・ラインは1画素に等しい厚さを有し、前記垂直マスク・ラ インの前記空間的なインターバルdは1画素であることにより特徴付けられた請 求項6記載の光学式文字認識装置。7. The vertical mask line has a thickness equal to one pixel, and the vertical mask line The spatial interval d of in is characterized by being one pixel. The optical character recognition device according to claim 6. 8.前記キャラクタの前記識別を判断する手段は、一組の基準ヒストグラムを格 納する手段と、前記最大相関に対応する各ヒストグラムを前記一組の基準ヒスト グラムと比較して最大の相関を有する基準ヒストグラムを識別する手段とにより 特徴付けられた請求項1記載の光学式文字認識装置。8. The means for determining the identity of the character stores a set of reference histograms. means for storing each histogram corresponding to the maximum correlation in the set of reference histograms; and by means of identifying the reference histogram with the greatest correlation compared to the gram. An optical character recognition device according to claim 1, characterized in that: 9.前記キャラクタの前記識別を判断する手段は、前記最大相関に対応する前記 各ヒストグラムにおける各総和を二進数ビットに変換し、かつ1ヒストグラムに 対応する二進数ビットのイメージ符号ワードを形成する手段と、 一組の基準符号ワードを格納する手段と、前記イメージ符号ワードを前記一組の 基準ヒストグラムと比較し、かつ最大の相関を有する基準符号ワードを識別する 手段とにより特徴付けられた請求項1記載の光学式文字認識装置。9. The means for determining the identity of the character is configured to determine the identity of the character corresponding to the maximum correlation. Convert each summation in each histogram to binary bits and create one histogram. means for forming an image code word of corresponding binary bits; means for storing a set of reference code words; and means for storing said image code words in said set of reference code words; Compare with the reference histogram and identify the reference code word with the greatest correlation 2. An optical character recognition device according to claim 1, characterized by: 10.二進数ビットに変換する前記手段は、各総和を、前記総和が0でないか0 であるかに従って1又は0に変換することにより特徴付けられた請求項9記載の 光学式文字認識装置。10. Said means for converting each sum into binary bits converts each sum into binary bits if said sum is not zero or zero. according to claim 9, characterized by converting to 1 or 0 according to whether Optical character recognition device. 11.前記ヒストグラムの前記総和を計算する前記複数の垂直列は、前記垂直マ スク・ラインにより特徴付けられた請求項2記載の光学式文字認識装置。11. The plurality of vertical columns for calculating the summation of the histogram are 3. The optical character recognition device according to claim 2, characterized by screen lines. 12.光学式文字認識方法において、平行な画素の水平行及び垂直列の文書イメ ージから垂直方向にセグメント化されたキャラクタを読み取る方法であって、複 数の平行な垂直ラインにより特徴付けられたマスク・イメージを定めるステッブ と、 前記文書イメージに対して複数の増分ステップのうちの一つで前記マスク・イメ ージを配置させて前記文書イメージと前記マスク・イメージとの間で異なる画素 対を相関させるステップと、 前記文書イメージ及び前記マスク・イメージの対応する画素対を一緒に乗算する ことにより積イメージを発生するステップと、前記ステップのうちのいずれが前 記文書イメージと前記マスク・イメージとの間の最大相関に対応するのかを判断 するステップと、前記文書イメージと前記マスク・イメージとの間で最大相関を 有する増分ステッブに対応する前記積イメージのヒストグラムを発生するステッ プと、前記ヒストグラムから前記文書イメージにおける個別的なキャラクタの識 別を判断するステップと により特徴付けられた垂直方向にセグメント化されたキャラクタを読み取る方法 。12. In optical character recognition methods, document images in horizontal and vertical rows of parallel pixels are A method for reading vertically segmented characters from a Steps defining a mask image characterized by a number of parallel vertical lines and, forming the mask image on the document image in one of a plurality of incremental steps; the document image and the mask image. correlating the pairs; multiplying corresponding pixel pairs of the document image and the mask image together; a step of generating a product image by Determine whether the correspondence corresponds to the maximum correlation between the document image and the mask image. a maximum correlation between the document image and the mask image; generating a histogram of the product image corresponding to the incremental step of and identify individual characters in the document image from the histogram. The step of determining the difference How to read vertically segmented characters characterized by . 13.ヒストグラムを発生する前記ステップは、更に、前記積イメージの複数の 垂直列における「オン」画素の総和を計算するステップにより特徴付けられた請 求項12記載の方法。13. Said step of generating a histogram further includes a plurality of said product images. A request characterized by the step of calculating the sum of "on" pixels in a vertical column. The method according to claim 12. 14.積イメージを発生する前記ステップは、更に、前記増分ステップの各一つ のための積イメージを発生することにより特徴付けられ、ヒストグラムを発生す る前記ステップは前記各増分ステップの積イメージからヒストグラムを発生する ことにより特徴付けられ、かつ最大の相関を判断する前記ステップは、前記増分 ステップのうちのいずれが、「オン」画素の総和を計算する前記ステッブにより 計算された最大の総和に対応するのかを判断するステップにより特徴付けられた 請求項13記載の方法。14. Said step of generating a product image further includes each one of said incremental steps. It is characterized by generating a product image for and generating a histogram. The step generates a histogram from the product image of each incremental step. said step of determining the maximum correlation characterized by said increment Which of the steps calculates the sum of "on" pixels? characterized by the step of determining whether the calculated sum corresponds to the largest sum. 14. The method according to claim 13. 15.前記増分マスクを配置させるステップは、更に前記文書イメージ上で前記 平行な垂直マスク・ラインに対して水平方向に前記マスク・イメージを移動させ 、前記垂直マスク・ライン及び前記垂直キャラクタ・セグメントはスキュー角度 内で平行であることにより特徴付けられた請求項12記載の方法。15. The step of placing the incremental mask further includes placing the incremental mask on the document image. moving said mask image horizontally with respect to parallel vertical mask lines; , the vertical mask line and the vertical character segment have a skew angle 13. The method according to claim 12, characterized by being parallel within. 16.前記垂直キャラクタ・セグメントのうちで隣接する異なる複数対は異なる 分離長により分離され、前記垂直マスク・ラインは前記異なる分離長の共通除数 である空間的なインターバルdで配置され、前記各増分ステップはdの一部分で あり、前記全増分ステップは少なくともdに等しい距離をカバーすることにより 特徴付けられた請求項15記載の方法。16. adjacent pairs of vertical character segments are different; separated by separation lengths, and the vertical mask lines are a common divisor of the different separation lengths. , and each incremental step is a fraction of d. , and the total incremental step is by covering a distance at least equal to d. 16. The method of claim 15 characterized. 17.前記垂直マスク・ラインはその厚さが前記垂直キャラクタ・セグメントの 厚さより薄いことにより特徴付けられた請求項16記載の方法。17. The vertical mask line has a thickness equal to that of the vertical character segment. 17. The method of claim 16, characterized by being thinner than thick. 18.前記垂直マスク・ラインは1画素に等しい厚さを有し、前記垂直マスク・ ラインの前記空間的なインターバルdは1画素であることにより特徴付けられた 請求項17記載の方法。18. The vertical mask line has a thickness equal to one pixel, and the vertical mask line has a thickness equal to one pixel. The spatial interval d of the line was characterized by being one pixel. 18. The method according to claim 17. 19.前記キャラクタの前記識別を判断する前記ステップは、一組の基準ヒスト グラムを格納するステップと、前記最大相関に対応する各ヒストグラムを前記一 組の基準ヒストグラムと比較し、最大の相関を有する基準ヒストグラムを識別す るステップとにより特徴付けられた請求項12記載の光学式文字認識装置。19. Said step of determining said identity of said character comprises a set of reference histories. storing each histogram corresponding to the maximum correlation. A set of reference histograms is compared to identify the reference histogram with the greatest correlation. 13. The optical character recognition device according to claim 12, characterized by the step of: 20.前記キャラクタの前記識別を判断する前記ステップは、前記最大相関に対 応する前記各ヒストグラムにおける各総和を二進数ビットに変換して、1ヒスト グラムに対応する二進数ビットのイメージ符号ワードを形成するステップと、 一組の基準符号ワードを格納するステップと、前記イメージ符号ワードを前記一 組の基準ヒストグラムと比較して、最大の相関を有する基準符号ワードを識別す るステップとにより特徴付けられた請求項12記載の方法。20. The step of determining the identity of the character is based on the maximum correlation. Convert each summation in each corresponding histogram into binary bits to obtain one histogram. forming an image code word of binary bits corresponding to the gram; storing a set of reference code words; and storing the image code words in the set of reference code words; identify the reference codeword with the greatest correlation by comparing it with a set of reference histograms. 13. The method according to claim 12, characterized by the step of:
JP91504482A 1990-02-02 1991-01-31 Correlation masking process for deskewing, filtering and recognition of vertically segmented characters Pending JPH05506115A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US474,606 1990-02-02
US07/474,606 US5052044A (en) 1990-02-02 1990-02-02 Correlated masking process for deskewing, filtering and recognition of vertically segmented characters
PCT/US1991/000652 WO1991011780A1 (en) 1990-02-02 1991-01-31 Correlated masking process for deskewing, filtering and recognition of vertically segmented characters

Publications (1)

Publication Number Publication Date
JPH05506115A true JPH05506115A (en) 1993-09-02

Family

ID=23884263

Family Applications (1)

Application Number Title Priority Date Filing Date
JP91504482A Pending JPH05506115A (en) 1990-02-02 1991-01-31 Correlation masking process for deskewing, filtering and recognition of vertically segmented characters

Country Status (4)

Country Link
US (1) US5052044A (en)
EP (1) EP0513171A1 (en)
JP (1) JPH05506115A (en)
WO (1) WO1991011780A1 (en)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5265173A (en) * 1991-03-20 1993-11-23 Hughes Aircraft Company Rectilinear object image matcher
US5367578A (en) * 1991-09-18 1994-11-22 Ncr Corporation System and method for optical recognition of bar-coded characters using template matching
US5481619A (en) * 1992-07-07 1996-01-02 Schwartz; Nira Inspection method using templates images, unique histogram analysis, and multiple gray levels correlated to addresses of template images
US5357093A (en) * 1993-02-01 1994-10-18 Storage Technology Corporation System and method for converting bar code scan line data into machine-readable code
US6252980B1 (en) 1993-11-24 2001-06-26 Nira Schwartz Additional dynamic fluid level and bubble inspection for quality and process control
US5414778A (en) * 1993-11-24 1995-05-09 Schwartz; Nira Dynamic fluid level and bubble inspection for quality and process control
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
US6005255A (en) * 1994-05-18 1999-12-21 Symbol Technologies, Inc. Timing synchronization for image scanning
US5959286A (en) * 1994-05-18 1999-09-28 Symbol Technologies, Inc. Method and apparatus for raster scanning of images
JP2730665B2 (en) * 1994-12-15 1998-03-25 北陸先端科学技術大学院大学長 Character recognition apparatus and method
US5893668A (en) * 1996-07-02 1999-04-13 Telesis Technologies, Inc. Method for optimizing font marking
US6097839A (en) * 1997-03-10 2000-08-01 Intermec Ip Corporation Method and apparatus for automatic discriminating and locating patterns such as finder patterns, or portions thereof, in machine-readable symbols
US6128414A (en) * 1997-09-29 2000-10-03 Intermec Ip Corporation Non-linear image processing and automatic discriminating method and apparatus for images such as images of machine-readable symbols
US6678393B1 (en) * 1997-12-23 2004-01-13 Intel Corporation Image selection based on image content
US7474780B2 (en) * 2003-08-30 2009-01-06 Opex Corp. Method and apparatus for determining unknown magnetic ink characters
GB2428506A (en) * 2005-07-18 2007-01-31 Hewlett Packard Development Co Masking an image to prevent obscuration of a coded pattern

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR1225428A (en) * 1959-05-26 1960-06-30 Bull Sa Machines Improvements to data recording
NL253925A (en) * 1959-07-17
NL127547C (en) * 1960-07-26
US3423730A (en) * 1965-03-01 1969-01-21 Singer General Precision Character recognition apparatus having signal enhancing means
US3539989A (en) * 1966-05-31 1970-11-10 Gen Electric Symbol reading system
FR2044025A5 (en) * 1969-05-06 1971-02-19 Thomson Csf
US3688955A (en) * 1969-11-24 1972-09-05 Automatisme Cie Gle Character-reading apparatus incorporating electronic scanning circuitry
US3717848A (en) * 1970-06-02 1973-02-20 Recognition Equipment Inc Stored reference code character reader method and system
US4053737A (en) * 1976-06-25 1977-10-11 Recognition Equipment Incorporated Magnetic reader for bar encoded characters
JPS5451733A (en) * 1977-10-03 1979-04-23 Toshiba Corp Character reading system
US4239151A (en) * 1979-04-19 1980-12-16 International Business Machines Corporation Method and apparatus for reducing the number of rejected documents when reading bar codes
US4282426A (en) * 1979-05-30 1981-08-04 Ncr Corporation Slot scanning system
US4513440A (en) * 1982-06-29 1985-04-23 Harris Corporation Hardware median filter
US4567610A (en) * 1982-07-22 1986-01-28 Wayland Research Inc. Method of and apparatus for pattern recognition
US4736437A (en) * 1982-11-22 1988-04-05 View Engineering, Inc. High speed pattern recognizer
US4806741A (en) * 1986-07-16 1989-02-21 Telesis Controls Corporation Electronic code enhancement for code readers
US4809344A (en) * 1987-05-11 1989-02-28 Nippon Sheet Glass Co., Ltd. Apparatus for preprocessing of character recognition
US4949392A (en) * 1988-05-20 1990-08-14 Eastman Kodak Company Document recognition and automatic indexing for optical character recognition

Also Published As

Publication number Publication date
EP0513171A1 (en) 1992-11-19
US5052044A (en) 1991-09-24
WO1991011780A1 (en) 1991-08-08

Similar Documents

Publication Publication Date Title
JPH05506115A (en) Correlation masking process for deskewing, filtering and recognition of vertically segmented characters
CN104112128B (en) Digital image processing system and method applied to bill image character recognition
US5077805A (en) Hybrid feature-based and template matching optical character recognition system
US5434932A (en) Line alignment apparatus and process
JP5591578B2 (en) Character string recognition apparatus and character string recognition method
US4910787A (en) Discriminator between handwritten and machine-printed characters
Fujinaga Staff detection and removal
EP0669593A2 (en) Two-dimensional code recognition method
JPS6077279A (en) Initiation of character image
van Beusekom et al. Distortion measurement for automatic document verification
US20090022405A1 (en) System and method for video object identification
KR102094234B1 (en) Serial number recognition Apparatus and method for paper money
US7082225B2 (en) Two dimensional image recording and reproducing scheme using similarity distribution
EP0651337A1 (en) Object recognizing method, its apparatus, and image processing method and its apparatus
JPH08287258A (en) Color image recognition device
US6198846B1 (en) Character recognition system
JPH07182448A (en) Character recognition method
US5790701A (en) Character recognition apparatus using edge images
RU2707320C1 (en) Method of recognizing a symbol on a banknote and a coprocessor for a computing system of a banknote processing device
JP4221960B2 (en) Form identification device and identification method thereof
CN116363492B (en) Anti-counterfeiting identification method and identification system for file files based on OCR
CN117115844B (en) Intelligent data entry method for entity document
CN113903018B (en) Neural network-based container number identification method
Xiao et al. Staff lines detection and removal for camera-based music scores
EP0477040A2 (en) Method for checking marks