JP2000163511A - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JP2000163511A
JP2000163511A JP10333096A JP33309698A JP2000163511A JP 2000163511 A JP2000163511 A JP 2000163511A JP 10333096 A JP10333096 A JP 10333096A JP 33309698 A JP33309698 A JP 33309698A JP 2000163511 A JP2000163511 A JP 2000163511A
Authority
JP
Japan
Prior art keywords
dropout
character
image
color
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10333096A
Other languages
Japanese (ja)
Inventor
Yoshifumi Chimoto
良史 地本
Takeyuki Sugimoto
建行 杉本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP10333096A priority Critical patent/JP2000163511A/en
Publication of JP2000163511A publication Critical patent/JP2000163511A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PROBLEM TO BE SOLVED: To read mixture of documents different in drop-out colors. SOLUTION: A recognition part is arranged which recognizes characters as symbols based on picture data obtained by reflected light from a document corresponding to plural color light sources, and when character symbols are recognized based on reflected light from the form corresponding to plural light sources are recognized, character recognition results corresponding to plural colors are compared with each other, and recognition characters are discriminated based on comparison results. This comparison utilizes the characteristic that noise springs out in pictures read out by light sources different in drop-out colors, and both pictures from blue/blur drop-out colors are discriminated by the degree of correct or erroneous read (step 62), the degree of similarity per character (step 63), and the difference in overall area of black picture element components in a read field (step 64), and the degree of similarity per character (step 65) is used as a factor.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、ドロップアウトカ
ラーが記載された帳票の画像データから文字記号を読み
取る光学文字読取装置に係り、特にドロップアウトカラ
ーの違う帳票を混在して読み取った画像データから帳票
のドロップアウトカラーを識別し、文字の読取りを行う
光学文字読取装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optical character reader for reading characters and symbols from image data of a form on which a dropout color is described, and more particularly to an optical character reading apparatus for reading a form having different dropout colors. The present invention relates to an optical character reader that identifies a dropout color of a form and reads characters.

【0002】[0002]

【従来の技術】一般に光学文字読取装置は、帳票の特定
の読取範囲を記入者他に示すために特定の箇所を色枠に
よって囲み、この枠を読み出さないために枠色の光源を
用い、これからの反射光による画像データを基に文字を
認識している。この読み出さないための枠の色は、ドロ
ップアウトカラーと呼ばれる。
2. Description of the Related Art In general, an optical character reader uses a color frame to surround a specific portion of a form with a color frame in order to indicate a specific reading range of the form to a writer or the like. The character is recognized based on the image data by the reflected light. The color of the frame not to be read is called a dropout color.

【0003】しかしながら前記ドロップアウトカラーは
帳票の種類によって異なり、従来技術による光学文字読
取装置は、ドロップアウトカラーの異なる帳票を混在し
て読み取ることができないと言う不具合があった。
[0003] However, the dropout color differs depending on the type of form, and the conventional optical character reading apparatus has a drawback that forms with different dropout colors cannot be mixedly read.

【0004】また、特開平5−28313号公報におい
ては、文字と図形を区別して読み取るために文字と図形
とを赤色と青色に区別したドロップアウトカラーにより
記載し、赤ドロップアウトと青ドロップアウトの光源を
付け、赤ドロップアウト画像と青ドロップアウト画像を
取り、文字認識と図形読取りを行うものが提案されてい
る。この方式では、文字認識はどちらの画像で行い、図
形読取りはどちらの画像で行いかを指定して処理を行っ
ている。
In Japanese Patent Application Laid-Open No. Hei 5-28313, characters and figures are described with red and blue dropout colors to distinguish between characters and figures. There has been proposed an apparatus in which a light source is attached, a red dropout image and a blue dropout image are taken, and character recognition and graphic reading are performed. In this method, character recognition is performed on which image and figure reading is performed on which image.

【0005】[0005]

【発明が解決しようとする課題】前述の従来技術による
単色のドロップアウトカラーが設定された光学文字読取
装置は、例えば赤色をドロップアウトカラーとした帳票
と青色をドロップアウトカラーとした帳票とを混在した
状態で読み取った場合、帳票に書かれているドロップア
ウトの色と光源の色が違う場合には得られた画像にはド
ロップアウトカラーによる枠等が湧き出る、即ち本来は
消えるはずのドロップアウトカラーにより記載された枠
等がノイズとして湧き出てしまい、正確な文字認識が困
難であると言う不具合があった。
The optical character reading apparatus in which a single color dropout color is set according to the prior art described above, for example, includes a form in which red is a dropout color and a form in which blue is a dropout color. If the color of the light source is different from the color of the dropout written on the form when read in the state where it was read, the frame etc. by the dropout color will spring up in the obtained image, that is, the dropout color that should originally disappear Frame, etc., described above, erupts as noise, and there is a problem that accurate character recognition is difficult.

【0006】また光源色を複数持つ光学文字読取装置に
おいては、読み取る個々の帳票に対してドロップアウト
カラーを予め指定し、この指定されたドロップアウトカ
ラーの光源により文字読取を行う必要があると言う不具
合があった。即ち、従来装置は、どちらの画像で読取り
を行なうかを予め指定しておかなければならず、光源に
対応した画像から帳票のドロップアウトカラーを識別
し、文字読取りを行なうことはできないと言う不具合が
あった。
In an optical character reader having a plurality of light source colors, it is necessary to designate a dropout color for each form to be read in advance, and to perform character reading using the light source of the designated dropout color. There was a defect. That is, in the conventional apparatus, it is necessary to specify in advance which image is to be read, and it is not possible to identify the dropout color of the form from the image corresponding to the light source and perform character reading. was there.

【0007】本発明の目的は、前記従来技術による光学
文字読取装置の不具合を除去することであり、ドロップ
アウトカラーの違う帳票を混在して読み取った画像情報
から帳票のドロップアウトカラーを識別し、文字の読取
りを行うことができる光学文字読取装置を提供すること
である。
SUMMARY OF THE INVENTION An object of the present invention is to eliminate the disadvantages of the above-mentioned conventional optical character reader, and to identify a drop-out color of a form from image information obtained by mixing forms having different drop-out colors. An object of the present invention is to provide an optical character reading device capable of reading characters.

【0008】[0008]

【課題を解決する為の手段】前記目的を達成するために
本発明は、ドロップアウトカラーが記載された帳票の画
像データから文字記号を読み取る光学文字読取装置にお
いて、複数色の光源と、該複数色の光源に対応した帳票
からの反射光による画像データを基に文字記号を認識す
る認識部とを備え、複数色の光源に対応した帳票からの
反射光から文字記号を認識する際、複数色に対応の文字
認識画像を比較し、この比較画像を基に認識する画像デ
ータを判定することを第1の特徴とする。
According to the present invention, there is provided an optical character reading apparatus for reading a character symbol from image data of a form on which a dropout color is described, comprising: a light source having a plurality of colors; A recognition unit for recognizing character symbols based on image data based on reflected light from a form corresponding to a color light source. The first feature is to compare character recognition images corresponding to and to determine image data to be recognized based on the comparison image.

【0009】更に本発明は、前記第1の特徴の光学文字
読取装置において、前記複数色に対応した文字認識画像
の判定を文字認識率により行い、該認識率が高いドロッ
プアウトカラーの画像を選定することを第2の特徴と
し、前記第1及び第2のの特徴の光学文字読取装置にお
いて、前記複数色に対応した文字認識画像の判定を、読
み取り範囲内の黒画素成分総面積が小さいドロップアウ
トカラーの画像を選定することを第3の特徴とする。
Further, according to the present invention, in the optical character reading apparatus according to the first aspect, a character recognition image corresponding to the plurality of colors is determined based on a character recognition rate, and a dropout color image having a high recognition rate is selected. And the determination of the character recognition image corresponding to the plurality of colors is performed by determining whether the total area of the black pixel components in the reading range is small, in the optical character reading device according to the first and second characteristics. A third feature is that an out-color image is selected.

【0010】[0010]

【発明の実施の形態】以下、本発明の一実施形態による
光学文字読取装置を説明するものであるが、まず原理を
説明する。本発明は、従来ではドロップアウトの色で帳
票をえり分けていたのを、ドロップアウトの色に関係な
く、混在して読取りを行うようにすることを目的とし、
このためにドロップアウトカラーの違う光源から、それ
ぞれ画像を採取し、それぞれの画像データから読取りを
行い、その読取り結果を用いて帳票に対応したドロップ
アウトカラーの画像の認識結果を判定する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, an optical character reader according to an embodiment of the present invention will be described. First, the principle will be described. The present invention aims at performing reading in a mixed manner irrespective of the color of the dropout, whereas the form is conventionally sorted by the color of the dropout,
For this purpose, images are respectively taken from light sources having different dropout colors, read from each image data, and the recognition result of the image of the dropout color corresponding to the document is determined using the read results.

【0011】この判定は、正しくドロップアウトカラー
が消えている画像が読取り率が良く、逆にドロップアウ
トのわき出している画像は、わき出している成分がノイ
ズとなり、読取り率が低下すると言う特性があり、これ
を利用して行う。具体的にはドロップアウトカラーのわ
き出しが、正読率及び類似度に反映し、(1)正読率の良
い画像及び(2)認識する際に得られた類似度が良い画像
はドロップアウトカラーのわき出していない画像と見な
すことができ、かつ、ドロップアウトカラーがわき出せ
ば、読取りフィールド内の認識対象成分の総面積も大き
くなり、(3)読取りフィールド内の読取り対象成分の面
積が小さいものはドロップアウトカラーの消えている画
像と見なすことができる特性を利用する。
This determination is based on the characteristic that an image in which the dropout color has been correctly erased has a good reading rate, and an image in which the dropout is protruding has a characteristic that the protruding components become noise and the reading rate decreases. There is a way to do this. Specifically, the visibility of the dropout color reflects on the correct reading rate and similarity, and (1) images with good readability and (2) images with good similarity obtained during recognition are dropped out. If the image can be regarded as an image in which the color is not exposed, and if the dropout color is exposed, the total area of the components to be recognized in the reading field becomes large, and (3) the area of the component to be read in the reading field becomes large. Small ones take advantage of a property that can be considered a missing image of the dropout color.

【0012】以下、実施形態を図面を参照して詳細に説
明する。図1は本発明の対象となる光学文字読取装置を
説明するめたの図であり、この光学文字読取装置は、デ
ィスプレイ1、キーボード2、マウス3及び演算装置4
からなる光学文字読取装置本体と、この光学文字読取装
置本体とデータ転送ケーブル9を介して接続され、複数
の帳票を積層するためのスタッカ6と、該積層した帳票
を一枚ずつ分離して搬送し、搬送した帳票の光学画像を
とるための光源部7及び読み取った帳票の排出部8とか
ら成る読取部とから構成される。また前記光源部7には
赤光源と青光源の2種類があるものとする。
Hereinafter, embodiments will be described in detail with reference to the drawings. FIG. 1 is a diagram for explaining an optical character reading apparatus to which the present invention is applied. This optical character reading apparatus includes a display 1, a keyboard 2, a mouse 3, and an arithmetic unit 4.
And a stacker 6 connected to the main body of the optical character reading apparatus via a data transfer cable 9 for stacking a plurality of forms, and separating and conveying the stacked forms one by one. And a reading unit including a light source unit 7 for taking an optical image of the conveyed form and a discharging unit 8 for the read form. It is assumed that the light source section 7 has two types of light sources, a red light source and a blue light source.

【0013】ここで本実施形態において読み取る帳票
は、図2に示す如く、赤色のドロップアウトカラーにて
枠囲いされた帳票識別番号10a及び該帳票識別番号1
0aにより場所を指定され、同様に赤色のドロップアウ
トカラーにて枠囲いされた読取部11aを持つ帳票12
と、青色のドロップアウトカラーにて枠囲いされた帳票
識別番号10b及び該帳票識別番号10bにより場所指
定され、同様に青色ドロップアウトカラーにて枠囲いさ
れた読取部11bを持つ帳票13と、赤色のドロップア
ウトカラーにて枠囲いされた帳票識別番号10c及び該
帳票識別番号10cにより場所指定され、同様に赤色ド
ロップアウトカラーにて枠囲いされた読取部11cを持
つ帳票14とがあるものとする。また前記帳票識別番号
10a〜10cは、帳票の先端、後端のどちらかからの
垂直位置、左端、右端のどちらかからの水平位置が同じ
位置に配置され、この帳票識別番号は帳票の種類を表し
ている。帳票識別番号が同じならば、帳票のドロップア
ウトの色、読取り位置、文字種など読取り情報が同じで
ある。
As shown in FIG. 2, the form to be read in this embodiment is a form identification number 10a and a form identification number 1 surrounded by a red dropout color.
A form 12 having a reading unit 11a whose location is designated by 0a and which is similarly surrounded by a red dropout color
And a form 13 having a reading unit 11b which is also designated by the form identification number 10b and the form identification number 10b which are framed by a blue dropout color and which is similarly framed by a blue dropout color; It is assumed that there is a form identification number 10c surrounded by a dropout color and a form 14 having a reading part 11c similarly designated by the place and designated by the form identification number 10c and also surrounded by a red dropout color. . In addition, the form identification numbers 10a to 10c are arranged at the same vertical position from either the leading end or the rear end of the form, and the horizontal position from the left end or the right end, and the form identification number indicates the type of the form. Represents. If the form identification numbers are the same, the read information such as the dropout color, read position, and character type of the form is the same.

【0014】本実施形態においては、この図2で示した
2種類(赤/青ドロップカラー)の帳票を図1の読取部
のスタッカ6に積層し、光学文字読取装置本体からの指
示により帳票を一枚ずつ分離して搬送し、搬送した帳票
の光学画像を光源部7が赤光源と青光源の2種により別
個に画像データを読み取る。
In the present embodiment, the two types (red / blue drop color) of the form shown in FIG. 2 are stacked on the stacker 6 of the reading unit of FIG. 1, and the form is formed by an instruction from the optical character reading apparatus main body. The sheet is separated and transported one by one, and the light image of the transported form is separately read by the light source unit 7 using two types of red light source and blue light source.

【0015】この読み取った画像データ等を図3及び4
を参照して説明する。まず、図3に示す赤色のドロップ
アウトカラーの帳票12の読取フィールド14を赤色の
光源により読み取った場合は矢印15で示した如く画像
データは赤色の枠が見えず、中の数字「123」が明瞭
な画像となり、同様に青色の光源により読み取った場合
は矢印16で示した如く画像データは赤色の枠が湧き出
て、中の数字「123」の周りに縦及び横線のノイズN
が含まれたものとなる。
FIGS. 3 and 4 show the read image data and the like.
This will be described with reference to FIG. First, when the read field 14 of the red dropout color form 12 shown in FIG. 3 is read by a red light source, the image data does not show a red frame as indicated by an arrow 15 and the numeral “123” is displayed inside. A clear image is obtained. Similarly, when the image data is read by a blue light source, the image data has a red frame as shown by an arrow 16, and noises N of vertical and horizontal lines around a numeral "123" in the image data.
Is included.

【0016】次に図4に示す青色のドロップアウトカラ
ーの帳票13の読取フィールド14を青色の光源により
読み取った場合は矢印19で示した如く画像データは青
色の枠が見えず、中の文字「456」が明瞭な画像とな
り、同様に赤色の光源により読み取った場合は矢印18
で示した如く画像データは青色の枠が湧き出て、中の数
字「456」の周りに縦及び横線のノイズNが含まれた
ものとなる。
Next, when the reading field 14 of the form 13 of blue dropout color shown in FIG. 4 is read by a blue light source, the image data does not show a blue frame as indicated by an arrow 19, and the character " 456 "becomes a clear image. Similarly, when the image is read with a red light source, an arrow 18
As shown in the figure, the image data has a blue frame and a vertical and horizontal line noise N is included around the number “456” in the image data.

【0017】図5は、赤及び青光源によりそれぞれ読み
取った2つの画像データに対する処理の概略を示す。こ
の処理は、各画像データの先端/後端/左辺/右辺をバ
ックの黒画像に対して検出し(帳票基準辺計算ステップ
21)、目標とする前記読取フィールド14の読取り位
置を計算する(読取り位置計算22)。これは、帳票の
基準辺付近にドロップアウトカラーがあり、どちらかの
画像で色がわき出し、帳票の基準辺の検出が間違ってい
ないかをチェックするためである。次いで本処理は、読
み取った2つの画像に対して、文字認識/基準の文字パ
ターンとの類似度/黒画素の総ドット数の算出を行い、
これらの値を基に前記赤及び青光源によりそれぞれ読み
取った2つの画像データの内、どちらを選別するかの判
定を行う(認識結果判定ステップ23)。
FIG. 5 shows an outline of processing for two image data read by the red and blue light sources, respectively. In this process, the leading / rear / left / right sides of each image data are detected for the background black image (form reference side calculation step 21), and the target reading position of the reading field 14 is calculated (reading). Position calculation 22). This is to check whether there is a dropout color near the reference side of the form, the color is revealed in either image, and the detection of the reference side of the form is correct. Next, this processing calculates character recognition / similarity with a reference character pattern / total number of black pixels for the two read images,
Based on these values, it is determined which of the two image data read by the red and blue light sources is to be selected (recognition result determination step 23).

【0018】この判定の手法を図6を参照して説明す
る。まず本判定は、赤ドロップカラーによめ文字認識
(ステップ60)と青ドロップカラーによる文字認識
(ステップ61)とを行い、各々の認識結果が正読か誤
読かの判定を行う(ステップ62)。この正読とは例え
ば公知のパターンマッチング法により文字を認識した際
に、前記パターンが3文字中で3字を認識できたときに
正読、1字でも認識不能な場合を誤読として判定する。
例えば帳票の読取フィールド14内の文字「123」を
認識した場合、図7(a)の如く赤ドロップアウトでの
認識結果25(文字「123」)が正読、青ドロップア
ウトでの認識結果26(文字「1?3」,「2」が読め
ない場合)が誤読、図7(b)の如く赤ドロップアウト
での認識結果28(文字「123」)と青ドロップアウ
トでの認識結果29(文字「123」)共に正読、図7
(c)の如く赤ドロップアウトでの認識結果31(文字
「1?3」)と青ドロップアウトでの認識結果32(文
字「1?3」)が共に誤読と判定する。
The method of this determination will be described with reference to FIG. First, in this determination, character recognition is performed using a red drop color (step 60) and character recognition is performed using a blue drop color (step 61), and it is determined whether each recognition result is correct or incorrect (step 62). For example, when a character is recognized by a well-known pattern matching method, when the pattern can recognize three characters out of three characters, a case where even one character cannot be recognized is determined as an erroneous reading.
For example, when the character "123" in the read field 14 of the form is recognized, the recognition result 25 (character "123") in the red dropout as shown in FIG. (When characters “1? 3” and “2” cannot be read) are erroneously read, as shown in FIG. 7B, the recognition result 28 (character “123”) in the red dropout and the recognition result 29 (blue) in the blue dropout. Characters "123") are both correct, FIG.
As shown in (c), the recognition result 31 (character “1? 3”) in the red dropout and the recognition result 32 (character “1? 3”) in the blue dropout are both determined to be misread.

【0019】このステップ62において、一方が正読、
他方が誤読なら、一方の画像のドロップアウトカラーが
所定のものと一致しており、他方の画像のドロップアウ
トカラーが所定のものとの不一致により図4に示したノ
イズが湧き出ていることを意味するために、正読した画
像データから読み込んだ文字が正しいと判定し、これを
出力する(ステップ66)。
In this step 62, one of them is a correct reading,
If the other is misread, it means that the dropout color of one image matches the predetermined one, and the noise shown in FIG. 4 gushes out due to the mismatch of the dropout color of the other image with the predetermined one. In order to do so, it is determined that the character read from the correctly read image data is correct, and this is output (step 66).

【0020】前記ステップ62において、両画像が正読
(ノイズの沸き出しが少ない)又は誤読(両者とも許容
範囲を超えた不一致)の場合、一文字当たりの類似度を
算出し、この類似度の差が大きいか否かを判定する(ス
テップ63)。この類似度は、図8に示す如く例えば基
準文字1文字当たりの黒画素の集合と読み込んだ画像の
黒画素の集合とを比較して行う。このステップ63にお
いて前記類似度の差が大きい場合、即ち一方の類似度が
他方に比べて大きい場合は、この類似度の大きい画像デ
ータから読み込んだ文字が正しいと判定し、これを出力
する(ステップ67)。
In step 62, if both images are read correctly (the noise is less pronounced) or erroneously read (both do not match the allowable range), the similarity per character is calculated, and the difference between the similarities is calculated. It is determined whether or not is larger (step 63). This similarity is determined by comparing, for example, a set of black pixels per reference character and a set of black pixels of the read image as shown in FIG. If the difference between the similarities is large in step 63, that is, if one of the similarities is larger than the other, it is determined that the character read from the image data having the large similarity is correct, and this is output (step 63). 67).

【0021】前記ステップ63において類似度の差が小
さい場合、本処理は、読取フィールド14内の黒画素成
分の総面積を検出し、この差が大きいか否かを判定し
(ステップ64)、黒画素成分の総面積が小さい画像デ
ータから読み込んだ文字が正しいと判定し、これを出力
する(ステップ68)。この判定は、ドロップアウトカ
ラーが不一致の画像がノイズの沸き出しが大きく、不一
致である可能性が高いと言う特性を利用したものであ
る。即ち、図9に示す如く赤ドロップアウト帳票の赤ド
ロップアウトカラーでの読み取りフィールドの1文字
(数字1)36の黒画素数(ドット数)38がノイズが
ないために所定の数であるのに対し、赤ドロップアウト
帳票の青ドロップアウトカラーでの読み取りフィールド
の1文字の黒画素画数は枠のノイズ成分により黒画素数
がノイズにより増加し、ドロップアウトカラーが不一致
の画像がノイズの沸き出しが大きく、不一致である可能
性が高いと言う特性を利用したものである。
If the difference between the similarities is small in step 63, this process detects the total area of the black pixel components in the read field 14 and determines whether this difference is large (step 64). It is determined that the character read from the image data having the small total area of the pixel components is correct, and this is output (step 68). This determination makes use of the characteristic that an image in which the dropout colors do not match has a large amount of noise, and is likely to have a mismatch. That is, as shown in FIG. 9, the black pixel number (dot number) 38 of one character (number 1) 36 of the read field in the red dropout color of the red dropout form is a predetermined number because there is no noise. On the other hand, the number of black pixels per character in the reading field in the blue dropout color of the red dropout form increases due to noise due to the noise component of the frame, and images with mismatched dropout colors are likely to have noise. This is based on the characteristic that there is a large possibility that there is a mismatch.

【0022】次に本処理は、ステップ64における黒画
素成分の総面積の差が大きくない場合、1文字当たりの
類似度を計算し、類似度が大きい画像データから読み込
んだ文字が正しいと判定し、これを出力する(ステップ
65)。この判定は、前述のステップ62,63,64
における判定が付かない場合に、1文字当たりの類似度
のみをファクターとして判定するものである。また、本
装置にて文字認識が不明により文字の修正を行う場合
は、ドロップアウトカラーの有り、無しの指定に従い、
ディスプレイに画像を出力し、修正を行う。
Next, in the present process, if the difference in the total area of the black pixel components in step 64 is not large, the similarity per character is calculated, and it is determined that the character read from the image data having the large similarity is correct. Is output (step 65). This determination is made in steps 62, 63, and 64 described above.
In the case where the judgment in is not given, only the degree of similarity per character is judged as a factor. In addition, when correcting characters due to unknown character recognition in this device, specify whether or not there is a dropout color,
Output the image to the display and make corrections.

【0023】この様に本発明による光学文字読取装置
は、ドロップアウトカラーの違う光源を複数準備し、色
光源の異なるドロップアウトカラーの帳票を混在して、
ドロップアウトカラーの指定なしで、画像情報から帳票
のドロップアウトカラーの消えている画像を識別し、文
字の読取りを行うことができる。また、修正を行なう場
合のディスプレイに表示される画像は、記入枠がドロッ
プアウトで書かれている場合などドロップアウトカラー
が消えている場合が良い場合も有り、また、生年月日の
項目がドロップアウトカラーで書かれている場合などド
ロップアウトカラーの文字が項目を表している場合は、
残っていた方が修正がやりやすい場合も有るため、ドロ
ップアウトカラー有り、なしの指定を行い、画面に表示
する画像をドロップアウトカラー判定を使って表示する
ことが好ましい。
As described above, the optical character reading apparatus according to the present invention prepares a plurality of light sources having different dropout colors, and mixes the forms of the dropout colors having different color light sources.
Without specifying the dropout color, the image in which the dropout color of the form has disappeared can be identified from the image information and the character can be read. In addition, the image displayed on the display when making corrections may be good if the dropout color has disappeared, such as when the entry frame is written in dropout, and the item of date of birth may be dropped. If the character of the dropout color represents an item, such as when it is written in outcolor,
In some cases, it is easier to correct the remaining part, so it is preferable to specify whether or not there is a dropout color and display the image to be displayed on the screen using the dropout color determination.

【0024】尚、本発明による光学文字読取装置は、次
に述べる実施形態としても表すことができる。 <実施形態1> 帳票を送る搬送機能を持ち、帳票に書
かれている特定の色の情報を削除して帳票の画像情報を
採取するための光源が有り、違う色を削除するため光源
が複数あり、それぞれの光源から画像データを採取する
機構を持ち、光源の違いによって、特定の色のドロップ
アウトした画像データが複数存在し、それらの画像デー
タから帳票のドロップアウトカラーに対応している光源
の画像を識別し、文字認識を行う認識機能を有すること
を特徴とする光学文字読取り装置。 <実施形態2> 前記実施形態1の機構を有するもの
で、ドロップアウト帳票の色を指定しないで、違う色の
ドロップアウトカラーの帳票を、色でえり分けることな
く、混在して読取りを行うことを特徴とする光学文字読
取り装置。 <実施形態3> 前記実施形態1及び2の機構を有する
もので、修正を行う場合に画面に表示されるイメージ情
報がドロップアウト情報ありか、ドロップアウト情報な
しを指定し、ドロップアウト情報ありの場合は、ドロッ
プアウト情報ありの画面を、ドロップアウト情報なしの
場合はドロップアウト情報なしの画面を表示することを
特徴とする光学文字読取り装置。
Incidentally, the optical character reading apparatus according to the present invention can be represented as the following embodiment. <Embodiment 1> There is a light source for collecting the image information of a form by deleting information of a specific color written on the form, and has a plurality of light sources for deleting different colors. There is a mechanism to collect image data from each light source, and depending on the light source, there are multiple drop-out image data of a specific color, and the light source corresponding to the dropout color of the form from those image data An optical character reader having a recognition function of identifying an image of the image and performing character recognition. <Embodiment 2> Having the mechanism of Embodiment 1 described above, without specifying the color of the dropout form, reading different forms of the dropout color in a mixed manner without selecting colors. An optical character reader characterized by the above-mentioned. <Third Embodiment> The third embodiment has the mechanism of the first and second embodiments, and specifies whether image information to be displayed on a screen has dropout information or no dropout information when performing a correction, An optical character reader characterized by displaying a screen with dropout information in the case, and displaying a screen without dropout information in the absence of the dropout information.

【0025】[0025]

【発明の効果】以上説明した如く本発明による光学文字
読取装置は、複数色の光源に対応した帳票からの反射光
による画像データを基に文字を記号認識する認識部とを
備え、複数色の光源に対応した帳票からの反射光から文
字記号を認識する際、複数色に対応の文字認識結果を比
較し、比較結果を基に認識文字を判定することにより、
ドロップアウトカラーの違う帳票を混在して読み取った
画像情報から帳票のドロップアウトカラーを識別し、文
字の読取りを行うことができる。
As described above, the optical character reading apparatus according to the present invention is provided with the recognition section for recognizing characters on the basis of the image data by the reflected light from the form corresponding to the light sources of a plurality of colors. When recognizing character symbols from reflected light from a form corresponding to the light source, character recognition results corresponding to multiple colors are compared, and recognition characters are determined based on the comparison result,
It is possible to identify a dropout color of a form from image information obtained by mixing forms having different dropout colors and read characters.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施形態による光学文字読取装置の
構成を示す図。
FIG. 1 is a diagram showing a configuration of an optical character reading device according to an embodiment of the present invention.

【図2】ドロップアウト色の違う帳票を示す図。FIG. 2 is a diagram showing forms having different dropout colors.

【図3】赤ドロップアウト帳票を赤ドロップアウトと青
ドロップアウトでとった画像を説明するための図。
FIG. 3 is a diagram for explaining an image obtained by taking a red dropout form with a red dropout and a blue dropout.

【図4】青ドロップアウト帳票を赤ドロップアウトと青
ドロップアウトでとった画像を説明するための図。
FIG. 4 is a view for explaining an image obtained by taking a blue dropout form with a red dropout and a blue dropout.

【図5】本実施形態による認識方式の概略を説明するた
めの図。
FIG. 5 is an exemplary view for explaining an outline of a recognition method according to the embodiment;

【図6】本実施形態による認識した結果からの判定方法
を説明するための図。
FIG. 6 is an exemplary view for explaining a determination method from a recognized result according to the embodiment;

【図7】本実施形態による文字認識結果の正読/誤読か
ら判定を説明するための図。
FIG. 7 is an exemplary view for explaining determination from correct reading / misread of a character recognition result according to the embodiment;

【図8】本実施形態による文字の類似度からの判定方法
を説明するための図。
FIG. 8 is an exemplary view for explaining a determination method from character similarity according to the embodiment;

【図9】本実施形態による読取りフィールドの総ドット
数からの判定方法を説明するための図。
FIG. 9 is an exemplary view for explaining a determination method based on the total number of dots in a read field according to the embodiment;

【符号の説明】[Explanation of symbols]

1:ディスプレイ、2:キーボード、3:マウス、4:
演算装置、5:光学文字読取装置、6:帳票を置くスタ
ッカ、7:帳票の画像をとるための光源部、8:帳票の
排出部、9:データ転送ケーブル、10:帳票識別番
号、11:帳票識別番号に対応した読取り部、12:赤
ドロップアウト帳票、13:青ドロップアウト帳票、1
4:読取りフィールド、15:赤ドロップアウト帳票を
赤ドロップアウトで取り込んだ画像、16:赤ドロップ
アウト帳票を青ドロップアウトで取り込んだ画像、1
7:赤ドロップアウトの線がわき出したもの、18:青
ドロップアウト帳票を赤ドロップアウトで取り込んだ画
像、19:青ドロップアウト帳票を青ドロップアウトで
取り込んだ画像、20:青ドロップアウトの線がわき出
したもの、21:帳票基準辺計算、22:読取り位置計
算。
1: display, 2: keyboard, 3: mouse, 4:
Arithmetic unit, 5: optical character reading device, 6: stacker for placing a form, 7: light source unit for taking a form image, 8: form discharge unit, 9: data transfer cable, 10: form identification number, 11: form identification number Reading unit corresponding to the form identification number, 12: red dropout form, 13: blue dropout form, 1
4: read field, 15: image captured by red dropout form with red dropout, 16: image captured by red dropout form with blue dropout, 1
7: Image of red dropout line exposed, 18: Image of blue dropout form imported by red dropout, 19: Image of blue dropout form imported by blue dropout, 20: Blue dropout line Exposed, 21: form reference side calculation, 22: reading position calculation.

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 ドロップアウトカラーが記載された帳票
の画像データから文字記号を読み取る光学文字読取装置
において、複数色の光源と、該複数色の光源に対応した
帳票からの反射光による画像データを基に文字記号を認
識する認識部とを備え、複数色の光源に対応した帳票か
らの反射光から文字記号を認識する際、複数色に対応の
文字認識画像を比較し、この比較画像を基に認識する画
像データを判定することを特徴とする光学文字読取装
置。
An optical character reading apparatus for reading a character symbol from image data of a form on which a dropout color is described, wherein a plurality of color light sources and image data by reflected light from a form corresponding to the plurality of color light sources are provided. A recognition unit for recognizing character symbols based on the reflected light from a form corresponding to a light source of a plurality of colors. An optical character reading device for determining image data to be recognized.
【請求項2】 前記複数色に対応した文字認識画像の判
定を文字認識率により行い、該認識率が高いドロップア
ウトカラーの画像を選定することを特徴とする請求項1
記載の光学文字読取装置。
2. The method according to claim 1, wherein a character recognition image corresponding to the plurality of colors is determined based on a character recognition rate, and a dropout color image having a high recognition rate is selected.
The optical character reader according to the above.
【請求項3】 前記複数色に対応した文字認識画像の判
定を、読み取り範囲内の黒画素成分総面積が小さいドロ
ップアウトカラーの画像を選定することを特徴とする請
求項2記載の光学文字読取装置。
3. The optical character reading apparatus according to claim 2, wherein the character recognition image corresponding to the plurality of colors is determined by selecting a dropout color image having a small total black pixel component area within the reading range. apparatus.
JP10333096A 1998-11-24 1998-11-24 Optical character reader Pending JP2000163511A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10333096A JP2000163511A (en) 1998-11-24 1998-11-24 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10333096A JP2000163511A (en) 1998-11-24 1998-11-24 Optical character reader

Publications (1)

Publication Number Publication Date
JP2000163511A true JP2000163511A (en) 2000-06-16

Family

ID=18262242

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10333096A Pending JP2000163511A (en) 1998-11-24 1998-11-24 Optical character reader

Country Status (1)

Country Link
JP (1) JP2000163511A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009265751A (en) * 2008-04-22 2009-11-12 Oki Electric Ind Co Ltd Character recognition device, optical character recognition system and character recognition program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009265751A (en) * 2008-04-22 2009-11-12 Oki Electric Ind Co Ltd Character recognition device, optical character recognition system and character recognition program

Similar Documents

Publication Publication Date Title
JP2575539B2 (en) How to locate and identify money fields on documents
US8306325B2 (en) Text character identification system and method thereof
US9836665B2 (en) Management system, list production device, method, computer readable recording medium, data structure, and printed label
US7194144B1 (en) Document image processing device, document image merging method, and storage medium recording a document image merging program
US6345130B1 (en) Method and arrangement for ensuring quality during scanning/copying of images/documents
US6959121B2 (en) Document image processing device, document image processing method, and memory medium
EP0723247A1 (en) Document image assessment system and method
EP1755327B1 (en) Detection of document security marks using run profiles
EP0472313A2 (en) Image processing method and apparatus therefor
US8200043B2 (en) Page orientation detection based on selective character recognition
JP4574503B2 (en) Image processing apparatus, image processing method, and program
JPS6077279A (en) Initiation of character image
US20230061533A1 (en) Inspection apparatus capable of reducing inspection workload, method of controlling inspection apparatus, and storage medium
JP5887242B2 (en) Image processing apparatus, image processing method, and program
JP5041775B2 (en) Character cutting method and character recognition device
JP2000163511A (en) Optical character reader
JP2003087562A (en) Image processor and image processing method
JPH06131495A (en) Image information extraction system
JP3412441B2 (en) Image processing device
US6049637A (en) System and method for automated data capture of sequential form numbers at a collator/press assembly machine using an optical reader which does not capture an image of the form number
JPH10207978A (en) Character pattern collating method and device therefor
JP2828013B2 (en) Passbook printer
JPH08202014A (en) Plate inspecting device
US20240029238A1 (en) Inspection apparatus, method of controlling the same, inspection system, and storage medium
US20170200383A1 (en) Automated review of forms through augmented reality

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060711

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061023

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070206