JPH05506115A - Correlation masking process for deskewing, filtering and recognition of vertically segmented characters - Google Patents
Correlation masking process for deskewing, filtering and recognition of vertically segmented charactersInfo
- Publication number
- JPH05506115A JPH05506115A JP91504482A JP50448291A JPH05506115A JP H05506115 A JPH05506115 A JP H05506115A JP 91504482 A JP91504482 A JP 91504482A JP 50448291 A JP50448291 A JP 50448291A JP H05506115 A JPH05506115 A JP H05506115A
- Authority
- JP
- Japan
- Prior art keywords
- image
- mask
- vertical
- histogram
- recognition device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 12
- 238000001914 filtration Methods 0.000 title description 2
- 230000000873 masking effect Effects 0.000 title description 2
- 238000012015 optical character recognition Methods 0.000 claims description 20
- 238000000926 separation method Methods 0.000 claims 5
- 238000010586 diagram Methods 0.000 description 4
- 241000257465 Echinoidea Species 0.000 description 1
- 241000277331 Salmonidae Species 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/224—Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
- G06V30/2247—Characters composed of bars, e.g. CMC-7
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Macromolecular Compounds Obtained By Forming Nitrogen-Containing Linkages In General (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。 (57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.
Description
【発明の詳細な説明】 垂直方向にセグメント化されたキャラクタのデヌ牛ユーイングろ波及び認識のt ζめの相関マスキング処理元型の背量 挾血云野 本発明は 垂直方向にセグメント化されたキャラクタを認識する光学式文字認識 装置に関する。[Detailed description of the invention] Denu cow Ewing filtering and recognition of vertically segmented characters The amount of correlation masking processing archetype of ζ Hanketsu Yunno The present invention is an optical character recognition system that recognizes vertically segmented characters. Regarding equipment.
貨−探術 垂直方向にセグメント化されたキャラクタは、肉眼で読み取り可能であると共に 、機械的に読み取り可能なシンボルを必要とする 例えば銀行小切手のような書 類上に印刷される。一つのキャラクタにおいて、垂直方向のセグメントは、その キャラクタが肉眼で読み取り可能となるように、特定シンボルの輪郭に一致させ る。一方、そのキャラクタにおいて 垂直方向に異なるセグメント間で水平方向 に異なる間隔のパターンは特定のシンボルを固有に定めるので キャラクタは機 械的に読み取り可能なものとなる。この考えは、ファイセル(Fei+5ell 他に対する米国特許第3.309.667号、及びルイエール(L’hilli erlに対する米国特許第3.688.955号に開示されている。Currency - Exploration Vertically segmented characters are readable to the naked eye and , documents that require machine-readable symbols, such as bank checks. printed on the class. For one character, the vertical segment is its Match the outline of a particular symbol so that the character is readable to the naked eye. Ru. On the other hand, in that character, between vertically different segments, horizontally The different spacing patterns uniquely define a particular symbol, so the character Become machine-readable. This idea is based on Fei + 5ell No. 3,309,667 to et al., and L'hilli et al. No. 3,688,955 to erl.
ハンチエフ) (Haoche111他に対する米国特許第3,539,989 号、及びラフエベールズ(Lateマers)他に対する米国特許第4.053 .737号に開示されているように 周知の技術では、文書から垂直方向にセグ メント化されたキャラクタを読み込むために、ピーク検出を採用している1文書 イメージ・データは狭い垂直方向の窓により水平方向に走査され、窓におけるビ クセル密度が寥の水平方向位置の関数としてプロットされる。プロットにおける ピークはピーク検出器により位置決めされ ピーク間のスペースのパターンは既 知シンボルのパターンと比較される。この技術の一つの利点は 垂直窓の狭さが 文書上に印刷された垂直方向のセグメントの厚さにおける変動からの影響を最小 化させることである。(U.S. Patent No. 3,539,989 to Haoche 111 et al. No. 4.053, and U.S. Patent No. 4.053 to Latemers et al. .. As disclosed in No. 737, well-known techniques include vertically segmenting a document A document that employs peak detection to read characterized characters. The image data is scanned horizontally through a narrow vertical window; The density of cells is plotted as a function of the horizontal position of the pig. in the plot The peaks are located by a peak detector, and the pattern of the spaces between the peaks is already It is compared with the pattern of knowledge symbols. One advantage of this technology is that the vertical window is narrow. Minimizes the impact from variations in the thickness of vertical segments printed on documents It is to make it possible.
一つの問題は、文書そのものがスキニーを持ったり、又は湾曲して印刷されたた めに、垂直方向にセグメント化されたキャラクタのイメージがそのイメージの平 面上で歪められたり、又は回転されることがあるということにある。スキューを 持ったイメージは垂直方向にセグメント化されたキャラクタの認識を妨げること がある。特に、スキニーの角度が増加するに従って4 ピーク検出器により検出 されるピークが拡散又は幅広となる。更に、このことはピーク間の距離を測定し て既知のシンボルのパターンと一致するパターンを形成できるようにする精度を 低下させる。更にスキューの角度が増加するに従い、ある点でピークが広げられ 、かつ低いものとなるので ピーク間の距離を確実に測定できず、従って与えら れたキャラクタにおける間隔)<ターンを正確に定められず、キャラクタを互い に区別することができない。One problem is that the document itself has skinny or curved prints. For example, a vertically segmented character image is The problem is that it can be distorted or rotated on the surface. skew Images that have been segmented vertically may impede recognition of characters There is. In particular, as the skinny angle increases, detected by the 4 peak detector peaks become diffuse or broad. Furthermore, this allows us to measure the distance between peaks. accuracy that allows the formation of patterns that match patterns of known symbols. lower. Furthermore, as the skew angle increases, the peak broadens at a certain point. , and will be low, so the distance between the peaks cannot be reliably measured, and therefore the given (distance between characters) cannot be distinguished.
従って、本発明の目的は、スキニーが存在しても信頼性を低下させることなく垂 直方向にセグメント化されたキャラクタを識別することにある。Therefore, it is an object of the present invention to improve the performance of the present invention without reducing reliability even in the presence of skinny. The purpose is to identify vertically segmented characters.
発男Ω開示 垂直方向にセグメント化されたキャラクタは、光学式文字認識のために、短い空 間周波数を有する平行な複数の垂直ラインからなるマスクによる畳み込みにより 前処理される。セグメント化された各キャラクタに対するマスクの水平方向アラ イメントは、最大相互相関が得られるまで調整される1次いで、マスクとキャラ クタ・イメージの積が形成される。マスクの各垂直ラインに沿った積イメージに おける「オン」画素数のヒストグラムは、このような既知シンボルのヒストグラ ムのライブラリと比較され、最良の一致によりキャラクタ・イメージにより表わ されているシンボルを識別する。Male birth Ω disclosure Vertically segmented characters have short blanks for optical character recognition. By convolution with a mask consisting of parallel vertical lines with frequencies between Pre-processed. Horizontal alignment of the mask for each segmented character The mask and character are adjusted in the first order until the maximum cross-correlation is obtained. A product of vector images is formed. to the product image along each vertical line of the mask. The histogram of the number of “on” pixels in The best match represents the character image. identify the symbol being used.
好ましい実施例において、マスクにおける垂直ラインの間隔は1画素であるがい ずれの場合であっても垂直方向にセグメント化されたキャラクタのうちの種々の キャラクタのパターンに採用された、あり得る全ての画素間隔の共通約数でなけ ればならない、好ましい実施例において、マスクにおける垂直ラインの厚さは1 画素であるが 垂直方向のセグメントの厚さが多数画素である場合に、厚さを更 に厚くすることができる。In a preferred embodiment, the vertical lines in the mask are spaced one pixel apart. Even in case of misalignment, various of the vertically segmented characters Must be a common divisor of all possible pixel spacings used in the character's pattern. In the preferred embodiment, the thickness of the vertical lines in the mask is 1 pixel, but if the vertical segment thickness is many pixels, change the thickness. It can be made thicker.
最大相互相関点においてマスクを水平方向に位置決めすることの利点は、キャラ クタが未知量のスキューを持っていてもキャラクタにおける垂直方向のセグメン トを対応する垂直マスク ラインのキャラクタ上に中心付けることである。マス ク・イメージとキャラクタ イメージとの積をめる利点は、キャラクタにおいて 垂直方向のセグメントの厚さの変動を結果として得られる積イメージから除去さ れることにある。垂直マスク ラインに沿って「オン」画素のヒストグラムを計 算することの利点は、キャラクタ・イメージにスキューが存在していても、異な るキャラクタの間隔パターン間の区別を確実にすることにである。このことは 複数の垂直マスク・ラインがそれぞれ1垂直キヤラクタ・セグメント以上と交差 するものであっても成立する。The advantage of positioning the mask horizontally at the point of maximum cross-correlation is that vertical segments in the character even if the character has an unknown amount of skew. centering the mark on the character of the corresponding vertical mask line. trout The advantage of multiplying the character image by the character image is that Vertical segment thickness variations are removed from the resulting product image. It's about being able to do something. Vertical Mask Plans the histogram of “on” pixels along the line. The advantage of calculating is that even if there is skew in the character image, different The objective is to ensure differentiation between character spacing patterns. This thing is Multiple vertical mask lines each intersect one or more vertical character segments It holds true even if it is.
2血の間車l認朋 添付する図を参照して本発明を以下で詳細に説明する。2 Bloody Car Licensed Tomo The invention will be explained in more detail below with reference to the accompanying figures.
第1図は機械により読み取り可能 かつ肉眼により読み取り可能な垂直方向にセ グメント化された従来技術のキャラクタであって 本発明を含む装置により読み 出されるべきキャラクタの例示的文書イメージを示す図であり第2図は本発明を 含み 第1図のキャラクタを読み出すシステムのブロック図であり 第3図は第1図のイメージから垂直方向にセグメント化されたキャラクタと、垂 直方向に配列されたマスクとについて第2図のシステムにより実行される畳み込 みを示す図であり。Figure 1 is a machine-readable and eye-readable vertical orientation. Characters of the prior art that have been made into FIG. 2 is a diagram showing an exemplary document image of characters to be displayed; FIG. This is a block diagram of a system for reading out the characters shown in Figure 1. Figure 3 shows a character segmented vertically from the image in Figure 1 and a vertically segmented character. Convolution performed by the system of Figure 2 with orthogonally aligned masks This is a diagram showing the details.
第4図は第3図の畳み込みの積の図であり、第5図は第4図の積の「オン」画素 のヒストグラムを示す図であり、第6図は第5図に対応する図であり 第5図の ヒストグラムから構築された二進数の符号ワードを示す図である。Figure 4 is an illustration of the convolution product of Figure 3, and Figure 5 is an illustration of the "on" pixel of the product of Figure 4. FIG. 6 is a diagram corresponding to FIG. 5, and FIG. FIG. 3 illustrates a binary code word constructed from a histogram.
杢光叫の去施倒 第1図を参照すると ファイセル(Fe+5ell他に対する米国特許第3.3 09,667号に開示されている型式の垂直方向にセグメント化されたキャラク タは それぞれ肉眼により読み取り可能なシンボルの内輪郭と外輪郭との間に位 置する垂直方向に平行なセグメントを構成する1例えば、数字の「6」は文書イ メージ100内で垂直方向のセグメン)looa、100b、100c・・によ り表わされ 各セグメントの終端は数字の「6」の内輪郭及び外輪郭に接してい る。このように 各セグメントの長さはキャラクタを肉眼により読み取り得るよ うに選択されている。隣接するセグメント間で水平方向に測定される間隔は異な っており 各シンボルに固有な線形のシーケンス即ち間隔のパターンを定めてい る。従って、数字の「6」の場合に、第1対のセグメント100a、100b間 の間隔は、第2対のセグメン)100bと 1000との間の間隔より広く、一 方策3対のセグメン)100cと、100dとの間の間隔は前記2つのものより 太きい0間隔パターンは容易に確認され、これを簡単な装置により一組の2知の パターンと合せられる。従って、隣接するセグメントの各対間における間隔はキ ャラクタを機械により読み取り得るように選択される。Mokkou's death Referring to FIG. 1, U.S. Patent No. 3.3 to Fe+5ell et al. Vertically segmented characters of the type disclosed in No. 09,667 Each symbol is located between the inner and outer contours of the symbol that can be read by the naked eye. For example, the number "6" is Vertical segment within image 100) looa, 100b, 100c... The end of each segment touches the inner and outer contours of the number "6". Ru. In this way, the length of each segment is such that the character can be read with the naked eye. The sea urchin has been selected. The spacing measured horizontally between adjacent segments is different It defines a unique linear sequence or pattern of intervals for each symbol. Ru. Therefore, in the case of the number "6", between the first pair of segments 100a and 100b is wider than the spacing between the second pair of segments) 100b and 1000; The interval between 100c and 100d (segments of 3 pairs of strategies) is larger than the above two. The thick 0-interval pattern is easily confirmed and can be detected using a simple device. Matches the pattern. Therefore, the spacing between each pair of adjacent segments is The character is selected to be machine readable.
本発明により第1図のキャラクタを読み取るシステムを第2図に示す、スキャナ 101は第1図に示す型式のキャラクタの文書を走査し、文書イメージを発生す る。この文書イメージは、好ましくは 画素が垂直な列及び水平な行に編成され た二進数のデータ ブロックであって、その文書イメージにおいて各二進ビット が2値トーン画素を表わしている。相関器102は、スキャナ101からの文書 イメージと、第2図のメモリ104に記憶され、第3図に示す平行な垂直ライン を除外してなるマスク イメージ300との積を計算する。マスク・イメージ3 00は 好ましくは 画素が垂直な列及び水平な行に編成された他の二進数のデ ータ・ブロックであって、各二進ビットがこのマスク イメージ300における 画素を表わしている。A system for reading the characters of FIG. 1 according to the present invention is shown in FIG. 2, using a scanner. 101 scans a character document of the type shown in FIG. 1 and generates a document image. Ru. This document image preferably has pixels organized into vertical columns and horizontal rows. A block of binary data that represents each binary bit in the document image. represents a binary tone pixel. The correlator 102 receives the document from the scanner 101. image and parallel vertical lines stored in memory 104 of FIG. 2 and shown in FIG. Calculate the product with the mask image 300 excluding . mask image 3 00 is preferably another binary number whose pixels are organized in vertical columns and horizontal rows. data block, where each binary bit is It represents a pixel.
第3図に示すように、マスク・イメージ300における各垂直マスク・ライン3 00a、300b、300C−・は、厚さが1イメ一ジ画素である。垂直マスク ・ライン300a、300b、300c・・は 全で第1図のキャラクタにおい て隣接する垂直方向のセグメント間の最小インターバルに等しい距離dにより均 一に隔てられている。その代りに、マスク インターバルdは、第1図に対応し 。As shown in FIG. 3, each vertical mask line 3 in the mask image 300 00a, 300b, 300C-. have a thickness of one image pixel. vertical mask ・The lines 300a, 300b, 300c, etc. all correspond to the characters in Figure 1. by a distance d equal to the minimum interval between adjacent vertical segments. are separated by one. Instead, the mask interval d corresponds to FIG. .
セグメント化された全てのキャラクタ・セットに採用された異なる全てのインタ ーバルA、B、C・−の共通除数でもよい、更に、他の実施例として、垂直マス ク・ライン300a、300b、300C・・の輻は、第1図のキャラクタの各 垂直方向におけるセグメントの厚さTが多数のイメージ画素である場合に 1イ メ一ン画素より大きくてもよい。All different interfaces adopted for all segmented character sets In addition, as another embodiment, the vertical mass The convergence of the lines 300a, 300b, 300C, etc. of each character in FIG. If the thickness of the segment in the vertical direction T is a number of image pixels, It may be larger than the main pixel.
文書イメージ100とマスク イメージ300との積を有効にするためには、ま ず文書イメージ100に対してマスク イメージ300の正しい水平位置を見出 す必要がある。垂直セグメントがマスク ラインに対して一平行でなく一スキュ ーを持っていても、正しい水平位置は各垂直セグメント100a、10100b 100が垂直マスク ライン300a、300b、300cmのうちで対応する 一つに中心付けされたものである。スキューを持った垂直セグメントが垂直マス ク ライン上に中心付けられることを第3図に、屯線により示す、マスク・イメ ージ300のこの正しい水平位置を見出すために、相関器102はマスク イメ ージ300を増分ステップにより文書イメージ100上を水平方向に移動させ各 ステップにおいて文書イメージ100とマスク イメージ300との画素毎の積 を計算する0文書イメージ100に対するマスク イメージ300の移動方向は 、特に文書イメージ100が第3図に示すようにスキューを持っているときは文 書イメージ100における水平画素行の方向と平行であってはならないことに注 意すべきである。好ましくは、各増分ステップの長さは、垂直マスク・ライン間 の距離dの一部分である。To enable the product of document image 100 and mask image 300, First, find the correct horizontal position of the mask image 300 relative to the document image 100. It is necessary to If the vertical segment is not parallel to the mask line but one skew The correct horizontal position is for each vertical segment 100a, 10100b. 100 corresponds to vertical mask lines 300a, 300b, 300cm It is centered on one thing. A vertical segment with skew is a vertical mass The mask image is centered on the square line, which is shown in Figure 3 by the tomb line. To find this correct horizontal position of image 300, correlator 102 uses a mask image. page 300 is moved horizontally over document image 100 in incremental steps. In the step, the pixel-by-pixel product of the document image 100 and the mask image 300 is The moving direction of the mask image 300 for the document image 100 is , especially when the document image 100 has a skew as shown in FIG. Note that it must not be parallel to the direction of the horizontal pixel rows in the image 100. should be taken into consideration. Preferably, the length of each incremental step is between vertical mask lines. is a part of the distance d.
このようにして、相関器102により発生した積イメージ400の例を第4図に 示す、第4図の積イメージ400は 文書イメージ100における各画素の二進 値をマスク−イメージ300において対応する画素と掛算することにより、発生 したものである。従って 積イメージ400は垂直マスク・ライン300a30 0b、300C・の画素位置に沿って配置された「オン」画素を有する。第4図 の積イメージ400は文書イメージ100に対するマスク・イメージ300の「 正しい」水平位置に一致して対応しており 文書イメージ100において各垂直 キャラクタ セグメント100a、100b・・は対応する垂直マスク ライン 300a、300b 上に中心付けられている。しかし、この点において文書イ メージ100の正しい水平位置は達成され得るとは限らないことを理解すべきで ある。An example of a product image 400 generated by the correlator 102 in this manner is shown in FIG. The product image 400 shown in FIG. 4 is the binary representation of each pixel in the document image 100. generated by multiplying the value by the corresponding pixel in the mask-image 300. This is what I did. Therefore, product image 400 is vertical mask line 300a30 It has "on" pixels located along pixel positions 0b, 300C. Figure 4 The product image 400 is the product image 400 of the mask image 300 for the document image 100. Each vertical position in the document image 100 corresponds to the correct horizontal position. Character segments 100a, 100b... are the corresponding vertical mask lines It is centered on 300a, 300b. However, the document It should be understood that the correct horizontal position of the image 100 may not always be achieved. be.
マスク イメージ300の各増分ステップにおいて相関器+02が発生する各積 イメージ400のために、加算器103はマスク イメージの各垂直マスクライ ン300a、300b、300cに沿い「オン」画素の数の総和を計算する。Each product generated by the correlator +02 at each incremental step of the mask image 300 For image 400, adder 103 adds each vertical mask line of the mask image. The sum of the number of "on" pixels along lines 300a, 300b, 300c is calculated.
相関器102が文書イメージ100上のマスク イメージ300を増分的にステ ップするに従って プロセッサ105は各増分ステップにより加算器103が計 算した全垂直マスク ライン300a、300b についての総和を対応するメ モリ ビンに格納して、各増分ステップについて第5図に示すようなヒストグラ ムを形成する。プロセンサ105は、垂直キャラクタ・セグメン)100cと1 00dとの間で少なくとも最長のインターバルC(第3図)を覆う多数の増分ス テップを完了した後に、格納した総和を調べ どの増分ステップにおいて加算器 103が最大の総和を発生したかを判断する。加算器103が最大の総和を発生 した増分ステップは1文書イメージ10oの「正しい」水平位lてあり、そこで は各垂直キャラクタ セグメントが、第3図に示すように、垂直マスク・ライン のうちの対応する一つの上に中心付けられている。Correlator 102 incrementally steps mask image 300 over document image 100. With each incremental step, processor 105 adds The sum of the calculated vertical mask lines 300a and 300b is calculated using the corresponding menu. For each incremental step, a histogram like the one shown in Figure 5 is created. form a system. The prosensor 105 has vertical character segments) 100c and 1 00d, covering at least the longest interval C (Fig. 3). After completing a step, examine the stored sum and at which incremental step the adder 103 to determine whether the maximum sum has been generated. Adder 103 generates the maximum sum The incremental steps taken are at the "correct" horizontal position of the document image 10o, where is a vertical mask line where each vertical character segment is shown in Figure 3. centered on the corresponding one of the two.
このようにして、プロセッサ105は、「正しい」水平位置を識別すると直ちに 、乗算器106に指令して、スキャナから受け取る文書イメージ100に対して 正しい増分ステップでメモリ104からのマスク イメージ300を配置させか つイメージを互いに掛算させて第4図の積イメージを発生させ1次いでこれをメ モリ107に記憶させる。加算器108は第4図の積イメージから第5図のヒス トグラムを計算する。他の実施例において 乗算器106及び加算器108は省 略される。当該他の実施例において、プロセッサ105は、マスク・イメージ3 00の全ての増分ステップについて格納した全てのヒストグラムからそのビンが 最高の総和を有するヒストグラム500を選択すると共に、このヒストグラムを 出力する。最高の総和を有するヒストグラムはマスク・イメージ位置の増分ステ ップに対応しており、この位置では文書イメージ100の垂直キャラクタ セグ メントがマスク イメージ300の対応する垂直マスク・ライン上に中心付けら れている。In this way, as soon as processor 105 identifies the "correct" horizontal position, , for the document image 100 received from the scanner. Place the mask image 300 from memory 104 in the correct incremental steps. The two images are multiplied together to generate the product image shown in Figure 4. It is stored in the memory 107. The adder 108 converts the histogram in FIG. 5 from the product image in FIG. Calculate the totogram. In other embodiments, multiplier 106 and adder 108 may be omitted. Omitted. In such other embodiments, processor 105 may include mask image 3 From all histograms stored for all incremental steps of 00, that bin is Select the 500 histograms with the highest sum and set this histogram to Output. The histogram with the highest sum is the incremental step of the mask image position. This position corresponds to the vertical character segment of document image 100. center on the corresponding vertical mask line of the mask image 300. It is.
好ましい実施例において加算器108により発生した。又は他の実施例において プロセッサ105により選択されたヒストグラムは、プロセッサ109に入力さ れる。プロセッサ109は 0又は非常に小さな値を有する連続的なビンを検索 することにより、隣接するキャラクタのヒストグラムから個別的なキャラクタの ヒストグラムを分離する。これらのビンは文書イメージ100において隣接す較 器110に送信する。比較器110は、当該技術分野において周知のパターン一 致技術を用いて ヒストグラムとメモリ111に記憶されている基準ヒストグラ ムのライブラリのうちの各一つとの間の相互相関各計算する。比較器110は最 高相関を有する基準ヒストグラムを「勝者」と宣言し、従ってこのキャラクタ・ イメージを識別するものである。generated by adder 108 in the preferred embodiment. or in other embodiments The histogram selected by processor 105 is input to processor 109. It will be done. Processor 109 searches for consecutive bins with 0 or very small values. By Separate histograms. These bins correspond to adjacent bins in the document image 100. 110. Comparator 110 uses a pattern well known in the art. The histogram and the reference histogram stored in the memory 111 are Each calculates the cross-correlation between each one of the program libraries. The comparator 110 Declare the reference histogram with a high correlation as the “winner” and therefore It identifies the image.
基準ヒストグラムのライブラリは スキャナ101に既知のシンボルの連続的な イメージを供給して、プロセッサ109が受け取ったヒストグラムをメモリ11 1に対応するシンボルの識別と共に格納することにより、第2図のシステムの「 プログラムコモードにより発生される。The library of reference histograms consists of a series of symbols known to the scanner 101. The histogram received by the processor 109 is stored in the memory 11. By storing the symbol with the identification corresponding to 1, the system of FIG. Generated by program commode.
本発明の他の実施例において プロセッサ109は、個別的な各キャラクタのヒ ストグラムを比較器110の代わりに符号ワード変換器112に送信する。符号 ワード変換器112は、「オン」画素カウントが0でない第5図のヒストグラム 500の各ビン500a、500b、500c・・に二進数の「1」を割り付け 。In another embodiment of the invention, the processor 109 is configured to The stogram is sent to codeword converter 112 instead of comparator 110. sign Word converter 112 converts the histogram of FIG. Assign a binary number "1" to each of the 500 bins 500a, 500b, 500c... .
「オン画素カウントが0の各ビンに二進数の「0」を割り付ける0次いで、符号 ワード変換器112は連続する1及びOを配列して第6図に示す符号ワードを形 成する比較器113は符号ワードをメモリ114に格納されている基準符号ワー ドのライブラリと比較する。比較器113は、符号ワード変換器112により形 成された符号ワードに対しで最高の相関を有する基準符号ワードを「勝者」であ ると宣言し、これによって対応するキャラクタを識別する。``Assign a binary ``0'' to each bin with an on pixel count of 0.0 then sign Word converter 112 arranges consecutive 1's and O's to form the code word shown in FIG. Comparator 113 converts the code word into a reference code word stored in memory 114. Compare with the code library. The comparator 113 is configured by the code word converter 112. The “winner” is the reference codeword with the highest correlation to the codewords created. , and identify the corresponding character.
基準符号ワードのライブラリは、スキャナ101に既知のキャラクタの連続的な イメージを供給して 符号ワード変換器112により形成される符号ワードをメ モリ114に格納するCとにより、「プログラム」モードにおいて第2図のシス テムにより発生される。The library of reference code words consists of a sequence of characters known to the scanner 101. the code word formed by the code word converter 112. C stored in the memory 114 allows the system shown in FIG. generated by the system.
タ び のr 本発明は 肉眼により読み取り可能、かつ機械により読み取り可能な型式の垂直 方向にセグメント化されたキャラクタのイメージについてデスキューし ろ渡し て読み取るシステムとして有用である。Tabi no r The present invention provides a visually readable and machine readable type vertical Deskew the image of the character segmented in the direction It is useful as a reading system.
口にセグメント されたキャラクタのデスキューイングろ びUのための マス キング几理 炙−約−1 光学式文字認識のために1画素の空間周波数を有する平行な垂直ラインからなる マスクによる畳き込みによってスキュー及び雑音を除くように、垂直方向にセグ メント化されたキャラクタを前処理する。各セグメント化キャラクタに対するマ スクの水平方向アライメントは、最大相互相関を見出すまで調整される0次いで 、マスクとキャラクタ イメージとの積が形成される。マスクの各垂直ラインに 沿って積イメージにおける画素数のヒストグラムを既知のシンボルのヒストグラ ムのライブラリと比較し、最良の一致によりキャラクタ イメージにより表わさ れたシンボルを識別する。その代りに、前記ヒストグラムを二進数の符号ワード に変換しこれを一組の既知のシンボルに対応する符号ワードのライブラリと比較 する。Mass for deskewing and U of characters segmented into mouth King 几り Roasted - about -1 Consisting of parallel vertical lines with a spatial frequency of 1 pixel for optical character recognition Segment vertically to remove skew and noise by convolution with a mask. Preprocessing the mentized character. The map for each segmented character The horizontal alignment of the cross-correlation is adjusted by zero-order until finding the maximum cross-correlation , the product of the mask and the character image is formed. for each vertical line of the mask The histogram of the number of pixels in the product image along with the histogram of known symbols character image with the best match. Identifies the symbol. Instead, the histogram can be expressed as a binary code word and compare this with a library of codewords corresponding to a set of known symbols do.
手続補正書彷炙 平成 5年ケ月、修′日≦Procedural amendment report 1993 month, school day ≦
Claims (20)
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US474,606 | 1990-02-02 | ||
US07/474,606 US5052044A (en) | 1990-02-02 | 1990-02-02 | Correlated masking process for deskewing, filtering and recognition of vertically segmented characters |
PCT/US1991/000652 WO1991011780A1 (en) | 1990-02-02 | 1991-01-31 | Correlated masking process for deskewing, filtering and recognition of vertically segmented characters |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH05506115A true JPH05506115A (en) | 1993-09-02 |
Family
ID=23884263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP91504482A Pending JPH05506115A (en) | 1990-02-02 | 1991-01-31 | Correlation masking process for deskewing, filtering and recognition of vertically segmented characters |
Country Status (4)
Country | Link |
---|---|
US (1) | US5052044A (en) |
EP (1) | EP0513171A1 (en) |
JP (1) | JPH05506115A (en) |
WO (1) | WO1991011780A1 (en) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5265173A (en) * | 1991-03-20 | 1993-11-23 | Hughes Aircraft Company | Rectilinear object image matcher |
US5367578A (en) * | 1991-09-18 | 1994-11-22 | Ncr Corporation | System and method for optical recognition of bar-coded characters using template matching |
US5481619A (en) * | 1992-07-07 | 1996-01-02 | Schwartz; Nira | Inspection method using templates images, unique histogram analysis, and multiple gray levels correlated to addresses of template images |
US5357093A (en) * | 1993-02-01 | 1994-10-18 | Storage Technology Corporation | System and method for converting bar code scan line data into machine-readable code |
US6252980B1 (en) | 1993-11-24 | 2001-06-26 | Nira Schwartz | Additional dynamic fluid level and bubble inspection for quality and process control |
US5414778A (en) * | 1993-11-24 | 1995-05-09 | Schwartz; Nira | Dynamic fluid level and bubble inspection for quality and process control |
US5588072A (en) * | 1993-12-22 | 1996-12-24 | Canon Kabushiki Kaisha | Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks |
US6005255A (en) * | 1994-05-18 | 1999-12-21 | Symbol Technologies, Inc. | Timing synchronization for image scanning |
US5959286A (en) * | 1994-05-18 | 1999-09-28 | Symbol Technologies, Inc. | Method and apparatus for raster scanning of images |
JP2730665B2 (en) * | 1994-12-15 | 1998-03-25 | 北陸先端科学技術大学院大学長 | Character recognition apparatus and method |
US5893668A (en) * | 1996-07-02 | 1999-04-13 | Telesis Technologies, Inc. | Method for optimizing font marking |
US6097839A (en) * | 1997-03-10 | 2000-08-01 | Intermec Ip Corporation | Method and apparatus for automatic discriminating and locating patterns such as finder patterns, or portions thereof, in machine-readable symbols |
US6128414A (en) * | 1997-09-29 | 2000-10-03 | Intermec Ip Corporation | Non-linear image processing and automatic discriminating method and apparatus for images such as images of machine-readable symbols |
US6678393B1 (en) * | 1997-12-23 | 2004-01-13 | Intel Corporation | Image selection based on image content |
US7474780B2 (en) * | 2003-08-30 | 2009-01-06 | Opex Corp. | Method and apparatus for determining unknown magnetic ink characters |
GB2428506A (en) * | 2005-07-18 | 2007-01-31 | Hewlett Packard Development Co | Masking an image to prevent obscuration of a coded pattern |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR1225428A (en) * | 1959-05-26 | 1960-06-30 | Bull Sa Machines | Improvements to data recording |
NL253925A (en) * | 1959-07-17 | |||
NL127547C (en) * | 1960-07-26 | |||
US3423730A (en) * | 1965-03-01 | 1969-01-21 | Singer General Precision | Character recognition apparatus having signal enhancing means |
US3539989A (en) * | 1966-05-31 | 1970-11-10 | Gen Electric | Symbol reading system |
FR2044025A5 (en) * | 1969-05-06 | 1971-02-19 | Thomson Csf | |
US3688955A (en) * | 1969-11-24 | 1972-09-05 | Automatisme Cie Gle | Character-reading apparatus incorporating electronic scanning circuitry |
US3717848A (en) * | 1970-06-02 | 1973-02-20 | Recognition Equipment Inc | Stored reference code character reader method and system |
US4053737A (en) * | 1976-06-25 | 1977-10-11 | Recognition Equipment Incorporated | Magnetic reader for bar encoded characters |
JPS5451733A (en) * | 1977-10-03 | 1979-04-23 | Toshiba Corp | Character reading system |
US4239151A (en) * | 1979-04-19 | 1980-12-16 | International Business Machines Corporation | Method and apparatus for reducing the number of rejected documents when reading bar codes |
US4282426A (en) * | 1979-05-30 | 1981-08-04 | Ncr Corporation | Slot scanning system |
US4513440A (en) * | 1982-06-29 | 1985-04-23 | Harris Corporation | Hardware median filter |
US4567610A (en) * | 1982-07-22 | 1986-01-28 | Wayland Research Inc. | Method of and apparatus for pattern recognition |
US4736437A (en) * | 1982-11-22 | 1988-04-05 | View Engineering, Inc. | High speed pattern recognizer |
US4806741A (en) * | 1986-07-16 | 1989-02-21 | Telesis Controls Corporation | Electronic code enhancement for code readers |
US4809344A (en) * | 1987-05-11 | 1989-02-28 | Nippon Sheet Glass Co., Ltd. | Apparatus for preprocessing of character recognition |
US4949392A (en) * | 1988-05-20 | 1990-08-14 | Eastman Kodak Company | Document recognition and automatic indexing for optical character recognition |
-
1990
- 1990-02-02 US US07/474,606 patent/US5052044A/en not_active Expired - Lifetime
-
1991
- 1991-01-31 WO PCT/US1991/000652 patent/WO1991011780A1/en not_active Application Discontinuation
- 1991-01-31 JP JP91504482A patent/JPH05506115A/en active Pending
- 1991-01-31 EP EP91904073A patent/EP0513171A1/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
EP0513171A1 (en) | 1992-11-19 |
US5052044A (en) | 1991-09-24 |
WO1991011780A1 (en) | 1991-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH05506115A (en) | Correlation masking process for deskewing, filtering and recognition of vertically segmented characters | |
CN104112128B (en) | Digital image processing system and method applied to bill image character recognition | |
US5077805A (en) | Hybrid feature-based and template matching optical character recognition system | |
US5434932A (en) | Line alignment apparatus and process | |
JP5591578B2 (en) | Character string recognition apparatus and character string recognition method | |
US4910787A (en) | Discriminator between handwritten and machine-printed characters | |
Fujinaga | Staff detection and removal | |
EP0669593A2 (en) | Two-dimensional code recognition method | |
JPS6077279A (en) | Initiation of character image | |
van Beusekom et al. | Distortion measurement for automatic document verification | |
US20090022405A1 (en) | System and method for video object identification | |
KR102094234B1 (en) | Serial number recognition Apparatus and method for paper money | |
US7082225B2 (en) | Two dimensional image recording and reproducing scheme using similarity distribution | |
EP0651337A1 (en) | Object recognizing method, its apparatus, and image processing method and its apparatus | |
JPH08287258A (en) | Color image recognition device | |
US6198846B1 (en) | Character recognition system | |
JPH07182448A (en) | Character recognition method | |
US5790701A (en) | Character recognition apparatus using edge images | |
RU2707320C1 (en) | Method of recognizing a symbol on a banknote and a coprocessor for a computing system of a banknote processing device | |
JP4221960B2 (en) | Form identification device and identification method thereof | |
CN116363492B (en) | Anti-counterfeiting identification method and identification system for file files based on OCR | |
CN117115844B (en) | Intelligent data entry method for entity document | |
CN113903018B (en) | Neural network-based container number identification method | |
Xiao et al. | Staff lines detection and removal for camera-based music scores | |
EP0477040A2 (en) | Method for checking marks |