JP2005092543A - Form reader - Google Patents
Form reader Download PDFInfo
- Publication number
- JP2005092543A JP2005092543A JP2003325409A JP2003325409A JP2005092543A JP 2005092543 A JP2005092543 A JP 2005092543A JP 2003325409 A JP2003325409 A JP 2003325409A JP 2003325409 A JP2003325409 A JP 2003325409A JP 2005092543 A JP2005092543 A JP 2005092543A
- Authority
- JP
- Japan
- Prior art keywords
- image
- color
- imprint
- black
- binary image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 claims description 27
- 238000012937 correction Methods 0.000 claims description 17
- 238000001514 detection method Methods 0.000 claims description 14
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 239000002131 composite material Substances 0.000 abstract description 2
- 238000000034 method Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 9
- 238000007796 conventional method Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 4
- 241000282412 Homo Species 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
- Character Input (AREA)
- Image Processing (AREA)
Abstract
Description
本発明は赤色の印鑑が押印された帳票から印影を除去した画像を生成して文字を読み取る帳票読取り装置に関する。 The present invention relates to a form reading apparatus that generates an image from which a seal is removed from a form with a red seal stamp and reads characters.
帳票の画像をスキャナで採取し文字認識を行なう場合、帳票中の印影が文字と重なり文字認識の邪魔になることがある。そこで、文字認識の障害となる帳票中の印影を除去する必要がある。従来、特開平5−28313号公報(特許文献1)では、印影を除去する方法として、赤色フィルタと青色フィルタを併設し、赤色フィルタによって赤色の印影がドロップアウト(脱落)することが記載されている。また、従来、特開平8−212294号公報(特許文献2)では、印影読取りモードと文字読取りモードを設け、印影の色成分のみを有効なドットとして印影色イメージデータを生成することが記載されている。また、従来、特開平9−81666号公報(特許文献3)、特開2002−183661号公報(特許文献4)では、印鑑の色と記入文字の色が異なる場合、色分離により印鑑の色部分のみを取り出して、取り消し線が記載された位置を基に印鑑が存在するかどうかの判定を行なうことが記載されている。また、従来、特開2000−251072号公報(特許文献5)では、押印と同色のプレ印刷を含む帳票画像からプレ印刷画像を除去して印影を抽出することが記載されている。従来、特開2002−269547号公報(特許文献6)では、白黒画像の黒ランを用いて、角印と捺印欄枠とを区別して印影を抽出することが記載されている。また、従来、特開平8−221507号公報(特許文献7)では、文末に押印された印影部分を文字認識結果と文末に出現する可能性のある単語と比較して検証し、文字認識結果に含まれる印影部分を除去することが記載されている。 When a form image is collected by a scanner and character recognition is performed, an imprint in the form may overlap with characters and interfere with character recognition. Therefore, it is necessary to remove the imprint in the form that becomes an obstacle to character recognition. Conventionally, in Japanese Patent Laid-Open No. 5-28313 (Patent Document 1), as a method for removing an imprint, a red filter and a blue filter are provided together, and the red imprint is dropped out by the red filter. Yes. Conventionally, JP-A-8-212294 (Patent Document 2) describes that an imprint reading mode and a character reading mode are provided, and imprint color image data is generated using only the color component of the imprint as effective dots. Yes. Conventionally, in Japanese Patent Application Laid-Open No. 9-81666 (Patent Document 3) and Japanese Patent Application Laid-Open No. 2002-183661 (Patent Document 4), when the color of the seal is different from the color of the written character, the color portion of the seal is separated by color separation. It is described that it is determined whether or not a seal is present based on the position where the strikethrough is written. Conventionally, Japanese Patent Laid-Open No. 2000-251072 (Patent Document 5) describes that a pre-printed image is removed from a form image including pre-printing of the same color as that of a stamp and a stamp is extracted. Conventionally, Japanese Patent Laid-Open No. 2002-269547 (Patent Document 6) describes that a black and white image is used to distinguish a square mark from a stamped column frame and extract a seal image. Conventionally, in Japanese Patent Application Laid-Open No. 8-221507 (Patent Document 7), an imprinted part stamped at the end of a sentence is verified by comparing it with a character recognition result and a word that may appear at the end of the sentence. It is described that an imprinted part included is removed.
しかしながら、赤色フィルタによって赤色の印影をドロップアウトする従来方法や、印影の色成分のみを有効なドットとして印影色イメージデータを生成する従来方法では、赤色の記入文字、即ち、印影と同色の記入文字は消去されるので、印影と同色の記入文字を読み取ることはできないという問題がある。また、取り消し線が記載された位置を基に印鑑が存在するかどうかを判定する従来方法では、取り消し線がなく任意の位置に押印された印影を抽出することが考慮されていないという問題がある。また、角印と捺印欄枠とを区別して印影を抽出する従来方法では、捺印欄枠の付近に押印されていることが前提であり、帳票の任意の位置に押印された印影を抽出することが考慮されていないという問題がある。また、帳票画像からプレ印刷画像を除去して印影を抽出する従来方法では、予めプレ印刷画像を用意しておく必要があり、帳票のレイアウトが微妙に変わっている帳票に対して、すべてプレ印刷画像を具備させることは煩雑になるという問題がある。また、文末に押印された印影部分を文字認識結果と文末に出現する可能性のある単語と比較して検証し、文字認識結果に含まれる印影部分を除去する従来方法では、印影と文字との重なりを考慮しておらず、もし、印影と文字が重なった場合、文末に出現する可能性のある単語と比較して印影部分を除去することは困難であるという問題がある。 However, in the conventional method in which the red imprint is dropped out by the red filter and the imprint color image data is generated using only the color component of the imprint as effective dots, the red character, that is, the character of the same color as the imprint Is erased, there is a problem that it is impossible to read the same characters as the seal. Further, in the conventional method for determining whether or not a seal exists on the basis of a position where a strikethrough is described, there is a problem that extraction of a seal imprinted at an arbitrary position without a strikethrough is not considered. . In addition, the conventional method of extracting imprints by distinguishing between square marks and stamped field frames is based on the premise that the stamps are stamped in the vicinity of the stamped field frames, and the stamps imprinted at arbitrary positions on the form are extracted. There is a problem that is not considered. In addition, in the conventional method of extracting a stamp image by removing a pre-printed image from a form image, it is necessary to prepare a pre-printed image in advance. There is a problem that providing images is complicated. In addition, the conventional method of verifying an imprinted part stamped at the end of a sentence by comparing the character recognition result with a word that may appear at the end of the sentence, and removing the imprinted part included in the character recognition result, The overlap is not considered, and if the seal and the character overlap, there is a problem that it is difficult to remove the seal portion compared to a word that may appear at the end of the sentence.
本発明は、上記問題点に鑑みてなされたものであり、その目的は、任意の位置に印鑑が押印された帳票に対して、印影色と異なった記入文字と印影が重なった帳票の読取りにおいて、印影色と同色で記入された文字列をドロップアウトすることなく、印影をドロップアウトして、印影と重なった異色の記入文字および印影と重ならない同色の記入文字を正確に読み取る帳票読取り装置を提供することである。 The present invention has been made in view of the above-mentioned problems, and its purpose is to read a form in which a seal stamp is stamped at an arbitrary position and a form in which an input character different from an imprint color and an imprint are overlapped. , Without dropping out the character string written in the same color as the imprint color, drop out the imprint, and the form reading device that accurately reads the different colored input characters that overlap the imprint and the same color that does not overlap the imprint Is to provide.
本発明は、印鑑が押印された印影領域を検出し、印影領域のカラー画像から印影を消去した2値画像を生成し、入力された白黒2値画像に当該印影を消去した2値画像を貼り付け合成し、合成した2値画像を基に文字を認識するようにしている。 The present invention detects an imprint area where a seal is stamped, generates a binary image in which the imprint is erased from the color image of the imprint area, and pastes the binary image from which the imprint has been erased on the input black and white binary image. The character is recognized based on the combined binary image.
また、本発明は、印鑑が押印された印影領域を検出するため、カラー画像から印鑑色と同じ系統の画素を抽出し、当該画素の塊を連結成分として抽出し、当該連結成分の外接矩形を求め、外接矩形のサイズまたは外接矩形内の赤色画素の密度を検出し、当該サイズまたは密度をもとに外接矩形を印影領域として抽出するようにしている。 Further, in order to detect an imprinted region where the seal is imprinted, the present invention extracts pixels of the same system as the seal color from the color image, extracts a block of the pixels as a connected component, and defines a circumscribed rectangle of the connected component. The size of the circumscribed rectangle or the density of red pixels in the circumscribed rectangle is detected, and the circumscribed rectangle is extracted as an imprint area based on the size or density.
また、本発明は、印影領域のカラー画像から印影を消去した2値画像を生成するため、カラー画像の三原色成分から一つの原色成分を選択し、当該原色成分を濃度値とみなして各画素を白黒2値化し、もし注目画素の2値化結果が黒色となった場合、当該注目画素を色識別して、色識別結果が選択した原色系であると判断される注目画素を白色反転するようにしている。 Further, the present invention generates a binary image in which the imprint is erased from the color image in the imprint region, so that one primary color component is selected from the three primary color components of the color image, and each pixel is regarded as the density value. When the binarization result of the pixel of interest becomes black, the pixel of interest is color-identified, and the pixel of interest determined to be the primary color system selected by the color identification result is inverted to white. I have to.
また、本発明は、入力された白黒2値画像に印影を消去した部分2値画像を貼り付け合成した白黒2値画像を読取りフィールドごとに表示する手段と、入力されたカラー画像を読取りフィールドごとに表示する手段と、読取りフィールドごとに上記合成した白黒2値画像またはカラー画像をフィールドごとに切り替える手段とを備え、読取りフィールドと印影領域との重なりの有無を検出し、読取りフィールドが印影領域と重なるフィールドにおいて、入力されたカラー画像を表示するようにしている。 The present invention also provides means for displaying, for each reading field, a black and white binary image obtained by pasting and synthesizing a partial binary image from which an imprint has been deleted to the input black and white binary image, and reading the input color image for each reading field. And a means for switching the composite black-and-white binary image or color image for each reading field for each field, detecting the presence or absence of overlap between the reading field and the imprint area, and the reading field as an imprint area. The input color image is displayed in the overlapping field.
本発明によれば、印影色と同色の記入文字を含む帳票から印影領域を検出することができるため、印影と同色の記入文字を有する帳票を読み取ることができ、多様な帳票を読取り対象とできるという効果がある。 According to the present invention, it is possible to detect an imprint area from a form including characters of the same color as the seal color. Therefore, it is possible to read a form having an entry character of the same color as the seal and to read various forms. There is an effect.
また、本発明によれば、印影領域を抽出して当該領域の印影を除去した2値部分画像を生成し、元ぼ白黒2値画像に貼り付け合成することができるため、印影を除去した白黒2値画像で印影と重なった文字を正確に読み取ることができるという効果がある。 In addition, according to the present invention, a binary partial image in which an imprint area is extracted and the imprint of the area is removed can be generated and pasted and synthesized on the original black and white binary image. There is an effect that a character overlapped with an imprint can be accurately read in a binary image.
また、本発明によれば、印影領域をサイズや赤色画素の密度により限定して検出しているため、部分的に赤色の枠線や赤色の記入文字があっても、除去されることなく、印影のみを除去するという効果がある。 In addition, according to the present invention, since the imprint region is limited and detected by the size and the density of red pixels, even if there is a partial red border or red entry character, it is not removed, This has the effect of removing only the imprint.
また、本発明によれば、読取り結果を画面を介して修正する場合、表示するカラー画像と2値画像を印影の重なり有無によって切り替えることができるため、人間が読取りにくい印影と文字が重なった部分があるような帳票であっても、正確に読取り結果を修正することができるという効果がある。 Further, according to the present invention, when the reading result is corrected via the screen, the color image to be displayed and the binary image can be switched depending on whether or not the imprint is overlapped. There is an effect that the read result can be corrected accurately even if the form has a certain form.
以下、本発明の一実施例を図面に従い説明する。
図1は、本発明の一実施例である帳票読取り装置の構成図である。カラー画像入力部100では帳票の表面画像をカラー画像110および白黒2値画像111の2面の画像として採取する。ここで、白黒2値画像111は、各画素において3原色成分の最小値を濃淡画像とする画像から、2値化処理により生成される。3原色成分の最小値を濃淡画像として2値化するため、色付きの画素および黒色の濃い画素はすべて、2値化画像では黒色となる。従って、印影部分や印影と同色の記入文字や異色の記入文字、罫線は黒色の2値画像となる。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
FIG. 1 is a configuration diagram of a form reading apparatus according to an embodiment of the present invention. The color
画像処理部101は、印影の領域座標を検出する印影領域検出部103、印影領域内のカラー画像を切出して印影色をドロップアウトして2値化画像を生成する領域カラー画像2値化部104、領域内のカラー画像2値化結果を白黒2値画像111に貼り付ける画像貼り付け合成部102からなる。採取したカラー画像110は、印影領域検出部103において、任意の位置に押印された印影に対して、印影領域の座標を抽出する。そして、当該領域座標を基に、領域カラー画像2値化部104において、カラー画像を2値化する。ここでは、各画素ごとに、印影色を有する画素をドロップアウトして白色に、その他の色を有する画素を黒色にするカラー2値化を行なう。画像貼り付け合成部102では、白黒2値画像111の内部で抽出された印影領域内を上記領域カラー画像2値化結果である部分画像で置き換えて貼り付けることにより、新しい白黒2値画像112を生成する。この合成された白黒2値画像112は、印影領域は印影色がドロップアウトされた2値画像であり、それ以外の部分は3原色成分の最小値を濃淡画像として2値化された2値画像となる。
The
画像処理部101から出力された合成された白黒2値画像112は、文字認識部105において文字が読み取られ文字コードに変換される。文字修正部106では、文字認識部105で読み取られた文字認識結果の修正を画面に帳票の画像を表示して行なう。印影領域においては、印影と異色の記入文字は黒色となり、印影はドロップされ白色となるので、印影と重なった記入文字を黒色として正確に文字認識部105において読むことができるという効果がある。また、印影とは重ならない同色、又は異色の記入文字は黒色となり、正確に文字認識部105において読むことができるという効果がある。
Characters of the synthesized black and white
これらの処理を行う帳票読取り装置は、カラー画像入力部、画像処理部、文字認識部、文字修正部からなる。カラー画像入力部は、光学読取装置のスキャナを入力部に持つ。画像処理部は入力部で読み取られた画像データをもとに印影領域の検出、領域カラー画像2値化、および部分画像の貼り付け合成の処理を行う。また、文字認識部で文字を読み取る。これら、画像処理部、文字認識部は小型の計算機のプログラムにより構成される。このプログラムは、帳票読取装置のハードディスクや、CD−ROMなどの記憶装置に記憶される。また、文字修正部は、その結果を表示するCRTなどの表示装置から構成される。 A form reading apparatus that performs these processes includes a color image input unit, an image processing unit, a character recognition unit, and a character correction unit. The color image input unit has a scanner of the optical reading device as an input unit. The image processing unit performs processing of detecting an imprint region, binarizing a region color image, and pasting and combining partial images based on image data read by the input unit. In addition, the character recognition unit reads the character. These image processing unit and character recognition unit are configured by a small computer program. This program is stored in a storage device such as a hard disk of a form reading device or a CD-ROM. In addition, the character correction unit is composed of a display device such as a CRT that displays the result.
図2は、本発明の対象としたカラーの帳票画像の一例である。帳票画像200はカラー画像110の一例であり、文字列201、203、204、205、206と印影207、及び枠線202からなる。印影色は、印影207に示すように赤色であり、記入文字色は赤色と黒色である。印影と重ならない記入された文字列201は赤色である。また、印影と重なっている記入文字列204、206の色は黒色である。金額の右端部分と、支払い者の右端部分が印影と重なっている。
FIG. 2 is an example of a color form image targeted by the present invention. The
図3は、本発明の対象とした白黒画像の一例であり、カラー画像入力部100により2面同時に採取される画像の内の一面の画像である。白黒画像300は、各画素において3原色成分の最小値を濃淡画像とする画像から2値化処理により生成される白黒2値画像111の一例である。文字列301、303、304、305、306および枠線302は黒色である。また、印影307も同じく黒色である。記入文字列304、306が印影307と重なっており、従来法のように、当該白黒画像300を直接、文字認識部105で読み取ると、印影307が障害となって正確に文字を読み取ることが困難である。そのため、カラー情報を用いて印影領域を検出し、検出した印影領域にカラー2値化処理を行なう。
FIG. 3 is an example of a black and white image that is the subject of the present invention, and is an image of one of the two images simultaneously collected by the color
図4は、印影領域の検出結果を説明する図である。カラー画像200に対して、印影領域を抽出した結果画像を400で示す。印影領域検出部103において検出した印影領域を407で示す。印影領域は矩形の頂点座標で出力される。
FIG. 4 is a diagram for explaining the detection result of the seal impression area. A result image obtained by extracting an imprint region with respect to the
図5は、印影領域のカラー画像を2値化した結果の2値画像である。領域カラー画像2値化部104において印影領域407内部のカラー画像を切出し、切り出した部分カラー画像に対して赤色をドロップアウトして2値化して結果画像500である。印影部分が消去されて白色となっており、記入文字列の部分および枠線が黒色となっている。
FIG. 5 is a binary image obtained as a result of binarizing the color image of the seal impression area. The area color
図6は、画像処理部101によって合成された白黒2値画像112の一例であり、白黒2値画像111の内部で抽出された印影領域内に、上記領域カラー画像2値化結果である部分画像を貼り付けた新しい白黒2値画像である。領域カラー画像2値化結果である部分画像を貼り付けた新しい白黒2値画像を600で示す。赤色の記入文字列601が黒色となっている。また、黒色の記入文字列604、606には重なっていた印影が消えており、全文字が黒色となっている。このように、印影と重ならない同色の文字列が消去されず黒色となり、かつ印影の重なる異色の文字列が消去されず黒色となっており、印影が重なった文字列を正確に読み取ることができるという効果がある。
FIG. 6 shows an example of the black and white
図7は、印影領域検出部103の処理過程を説明する図である。入力はカラー画像の三原色成分であり、出力は印影領域の座標である。先ず、ステップ700で印影領域検出処理が開始され、ステップ701で三原色成分を入力する。次いで、ステップ702で赤色画素を抽出する。ここで、各画素の三原色成分の大きさの比較により、赤色成分の大きい画素を赤色画素とする。ステップ703で帳票画像の全面で当該赤色画素の個数を計数し、ステップ704で赤色画素の個数が所定値より大きいかどうかを判定する。所定値より赤色画素の個数が大きい場合、ステップ705で本印影領域検出の処理はリジェクトとして、ステップ706で終了する。一方、赤色画素の個数が所定値より小さい場合、ステップ707で赤色画素を黒色、それ以外の画素を白色とする2値画像に対して黒色画素の塊を融合して連結成分として抽出する。融合した連結成分の外接矩形が印影領域の候補となる。次いで、ステップ708で連結成分の外接矩形のサイズ検定を行なう。ここでは、予め決められた印影のサイズの範囲をもとに、連結成分の外接矩形のサイズが所定サイズ条件を満たすかどうかの検定をおこなう。本ステップにより、赤色記入文字列のように横に長い領域は印影領域ではないと判定される。さらに、赤色記入文字のように小さい領域は印影領域ではないと判定される。本ステップでは、印影と同色の記入文字であっても、印影領域の候補としないようにしているので、印影と重ならない同色の記入文字は消去されることは無いという効果がある。さらに、ステップ709で連結成分の外接矩形内の画素密度を計測し、画素密度の小さい領域は印影領域候補ではないとする。一方、矩形内の画素密度が大きい領域は印影領域候補とする。ステップ710で複数個または単数の印影領域候補の座標を出力して、ステップ711で印影領域検出処理を終了する。このように、印影領域の検出処理において、候補領域を求め、候補領域のサイズおよび候補領域内の画素密度を基に候補領域に対する検定を行なっているので、印影領域と同色の文字領域との区別をつけることができ、印影領域のみを検出するという効果がある。
FIG. 7 is a diagram for explaining the process of the seal impression
図8は、領域カラー画像2値化部104の処理過程を説明する図である。ステップ800で印影領域内のカラー画像を2値化する処理を開始する。先ず、ステップ801で印影領域候補の座標を入力する。領域の座標としては、矩形の頂点座標でよい。ステップ802で、領域内のカラー画像を部分画像として切出し、ステップ803でカラーの部分画像の三原色成分から赤色成分画像を選択し、2値化対象の濃淡画像とみなす。ステップ804で画像の縦方向の走査、ステップ805で画像の横方向の走査を繰り返し、ステップ806で注目画素の濃淡画像値を2値化する。ここでは、黒色が濃淡値が暗い、白色が濃淡値が明るいとして、注目画素を白色または黒色に2値化する。ステップ807では、注目画素が黒色か白色かを判定し、もし、注目画素が黒色の場合、ステップ808で注目画素の色識別を行なう。ここでは、注目画素の三原色成分を基に、赤色成分の値を他の二原色成分、即ち、青色成分、緑色成分の値と比較し、もし、赤色成分の値が他の原色成分の値より大きい場合、注目画素は赤色と判定する。そして、ステップ809で、注目画素が赤色の場合、ステップ810で注目画素を白化、即ち、白色に置き換える。本処理過程の出力はビット詰めされた白黒2値画像の形式とするため、ステップ811で白黒画素を8個単位で1バイトの画像データにビット詰めを行なう。ステップ812で領域カラー画像2値化処理を終了する。本処理過程では、ステップ803、ステップ806で三原色成分のうちの赤色成分を選択して濃淡画像として2値化するだけでなく、さらに、ステップ810で注目画素が赤色であれば、注目画素を白化するという処理を行なっており、帳票画像の赤色をより正確にドロップアウトすることができるという効果がある。このため、赤色の印影がドロップアウトされ白色となり、記入文字や枠線が黒色となる。記入文字や枠線に印影が重なっている箇所は、三原色成分の値の比較結果より赤色とは判断されないことでドロップアウトされず、2値化処理の結果、黒色となる。
FIG. 8 is a diagram for explaining the processing steps of the area color
図9は、画像貼り付け合成部102の処理過程を説明する図である。ここでは、白黒2値画像111と部分画像である印影領域カラー画像の2値化画像とを貼り合わせ、合成された白黒2値画像112を生成する。ステップ900で画像貼り付け合成処理が開始される。先ず、ステップ901で印影領域の左上頂点座標を入力する。そして、ステップ902で印影領域の横幅、高さを入力する。ステップ903で画像を縦方向に走査し、ステップ904で画像を横方向に走査しながら、ステップ905から908までの処理を繰り返す。先ず、ステップ905で、貼り付け先の画素位置を算出する。次いで、ステップ906で貼り付け元の画素位置を算出する。ステップ907で貼り付け元の注目画素の値を読取り、ステップ908で貼り付け先の画素に上記注目画素の値を埋め込む。以上の処理を、縦方向、横方向に注目画素を移動させながら行なう。ステップ909で画像貼り付け合成処理を終了する。このように、印影領域の部分画像のみ赤色をドロップアウトした2値画像を貼り付けるため、赤色の記入文字列がドロップアウトすることはないという効果がある。
FIG. 9 is a diagram for explaining the process of the image pasting / combining
図10は、読取りフィールドと印鑑領域の重なりを説明する図である。帳票画像1000は白黒2値画像111の一例である。帳票画像1000において、文字を読み取る読取りフィールドは、1001、1002、1003である。また、印影領域は1004である。読取りフィールドは、定型的な帳票の場合、予め書式として与えることができる。また、レイアウトが微妙に異なる準定型的な帳票の場合、枠線を抽出して枠の配置から読取りフィールドを検出することができる。印影領域1004は、印影領域検出部103により検出することができる。本実施例では、読取りフィールド1002と1003が印影領域1004と部分的に重なっている。この印影と読取りフィールドが重なっている場合、読取り結果の誤りやリジェクトを人間が修正するため、当該白黒画像1000を画面に表示しても、読取りフィールド1002、1003に記入された文字列のある文字が目視によっても読み取ることが困難である。一方、カラー画像110では、印影と重なった文字列であっても、人間が目視で文字を読み取ることは容易である。そこで、文字修正部106では、読取りフィールドの画面表示を白黒画像とカラー画像の2種類に切り替えて、印影が重なった文字列であっても、人間が目視で容易に確認、修正できるようにする。
FIG. 10 is a diagram for explaining the overlap between the reading field and the seal area. The
図11は、文字修正部106のフィールド画像表示の処理過程を説明する図である。ステップ1100でフィールド画像表示の処理を開始する。ステップ1101でカラー画像110を入力し、ステップ1102で白黒画像110または112を入力する。ステップ1103でフィールド情報として読取り領域の位置座標を入力する。また、ステップ1104で印影領域の位置座標を入力する。フィールドの画面表示は、ステップ1105で順次、フィールドが尽きるまで行なわれる。先ず、ステップ1106で注目フィールド座標が設定され、ステップ1107で印影領域と注目フィールドとの重なりの有無を判定する。そして、ステップ1108で、印影領域と注目フィールドが重なっている場合、ステップ1107で注目フィールドをカラー画像で表示する。一方、ステップ1108で、印影領域と注目フィールドが重なっていない場合、ステップ1110で注目フィールドを白黒画像で表示する。これらの画面表示によって人間が画面を目視で観察しながら、帳票の読取り結果の修正を行ない、ステップ1105でフィールドが尽きれば、当該帳票の画面を介した読取り結果の修正はステップ1111で終了する。本発明の文字修正処理により、印影と重なった文字列で人間が目視で読取りが困難な白黒画像の場合でも、カラー画像を切り替えて表示するため、容易に文字を観察できるという効果がある。
FIG. 11 is a diagram for explaining the process of field image display processing by the
102…画像貼り付け合成部、103…印影領域検出部、104…領域カラー画像2値化部、105…文字認識部、106…文字修正部、110…カラー画像、111…白黒2値画像、112…貼り付け合成後の白黒2値画像、200…カラー帳票画像、201…赤色記入文字、204…黒色記入文字、206…黒色記入文字、207…赤色印影、300…白黒2値帳票画像、407…検出した印影領域、500…印影領域のカラー2値化結果画像、600…貼り付け合成後の白黒2値帳票画像、707…融合した連結成分抽出処理ステップ、708…連結成分の外接矩形のサイズ検定処理ステップ、709…連結成分の外接矩形内の画素密度検定、803…赤色成分画像の選択、808…注目画素の色識別、1002…読取りフィールド、1004…印影領域、1107…印影領域と注目フィールドの重なり判定。
DESCRIPTION OF
Claims (8)
該認識部は、上記入力された画像データからカラー画像と白黒2値画像とを生成し、上記カラー画像から印鑑が押印された印影領域を検出し、
上記印影領域のカラー画像から印影を消去した2値画像を生成し、
上記白黒2値画像に当該印影を消去した2値画像を貼り付け合成し、
前記合成した2値画像を基に文字を認識することを特徴とする帳票読取り装置。 In a form reading apparatus having an image input unit for inputting image data, a recognition unit for recognizing characters from the input image data, and an output unit for outputting the recognition result,
The recognition unit generates a color image and a black and white binary image from the input image data, detects an imprint area where a seal is imprinted from the color image,
Generate a binary image in which the imprint is erased from the color image of the imprint area,
Pasting and synthesizing the binary image with the imprint deleted on the black and white binary image,
A form reading apparatus for recognizing characters based on the synthesized binary image.
上記表示部は、入力された白黒2値画像に印影を消去した部分2値画像を貼り付け合成した白黒2値画像または入力されたカラー画像をフィールドごとに切り替えて表示し、
上記修正処理部は、読取りフィールドと印影領域との重なりの有無を検出し、該読取りフィールドが印影領域と重なるフィールドについては、該印影領域を修正したカラー画像を生成して上記表示部に該カラー画像を表示させることを特徴とする帳票読取り装置。 In an image data correction apparatus having an image input unit for inputting image data, a correction processing unit for correcting an imprint region from the input image data, and a display unit for displaying the correction processing result,
The display unit displays a black-and-white binary image obtained by pasting and combining a partial binary image from which an imprint has been deleted on an input black-and-white binary image or an input color image by switching for each field.
The correction processing unit detects whether or not the reading field overlaps with the imprint region, and generates a color image in which the imprint region is corrected for the field where the reading field overlaps with the imprint region, and displays the color on the display unit. A form reading apparatus characterized by displaying an image.
上記入力された画像データからカラー画像と白黒2値画像とを生成する第1のステップと、
上記カラー画像から印鑑が押印された印影領域を検出する第2のステップと、
上記印影領域のカラー画像から印影を消去した2値画像を生成する第3のステップと、
上記白黒2値画像に当該印影を消去した2値画像を貼り付け合成する第4のステップと、
前記合成した2値画像を基に文字を認識する第5のステップとを実行させることを特徴とするプログラム。 In the recognition unit of the form reading apparatus having an image input unit for inputting image data, a recognition unit for recognizing a form from the input image data, and an output unit for outputting the recognition result,
A first step of generating a color image and a black and white binary image from the input image data;
A second step of detecting an imprinted region where a seal is imprinted from the color image;
A third step of generating a binary image in which the imprint is erased from the color image of the imprint region;
A fourth step of pasting and synthesizing the binary image from which the imprint has been deleted to the monochrome binary image;
And a fifth step of recognizing a character based on the synthesized binary image.
上記カラー画像から印鑑色と同じ系統の画素を抽出するステップと、当該画素の塊を連結成分として抽出するステップと、当該連結成分の外接矩形を求めるステップと、外接矩形のサイズまたは外接矩形内の赤色画素の密度を検出するステップと、当該サイズまたは密度をもとに上記外接矩形を印影領域として抽出するステップとを含むことを特徴とするプログラム。 6. The program according to claim 5, wherein the second step includes
Extracting a pixel of the same system as the seal color from the color image, extracting a block of the pixel as a connected component, obtaining a circumscribed rectangle of the connected component, a size of the circumscribed rectangle or a circumscribed rectangle A program comprising: detecting a density of red pixels; and extracting the circumscribed rectangle as an imprint area based on the size or density.
上記カラー画像の三原色成分から一つの原色成分を選択するステップと、当該原色成分を濃度値とみなして各画素を白黒2値化するステップと、注目画素の2値化結果が黒色となった場合に、当該注目画素を色識別するステップと、該色識別結果が選択した原色系であると判断される注目画素を白色反転するステップとを含むことを特徴とするプログラム。 6. The program according to claim 5, wherein the third step includes
A step of selecting one primary color component from the three primary color components of the color image, a step of considering each primary color component as a density value and binarizing each pixel into black and white, and a binarization result of a target pixel is black The program further includes a step of color-identifying the pixel of interest, and a step of reversing the pixel of interest determined to be the selected primary color system by white.
上記修正処理部に、読み取りフィールドごとに該読取りフィールドと印影領域との重なりの有無を検出するステップと、該読取りフィールドが印影領域と重なるフィールドについては、該印影領域を修正したカラー画像を生成するステップとを実行させ、
上記表示部に、入力された白黒2値画像に印影を消去した部分2値画像を貼り付け合成した白黒2値画像または入力されたカラー画像をフィールドごとに切り替えて表示させ、該読取りフィールドが印影領域と重なるフィールドについては、上記修正したカラー画像を表示するステップを実行させることを特徴とするプログラム。
In an image data correction apparatus having an image input unit for inputting image data, a correction processing unit for correcting an imprint region from the input image data, and a display unit for displaying the correction processing result,
The correction processing unit detects the presence / absence of an overlap between the reading field and the imprint area for each reading field, and generates a color image in which the imprint area is corrected for the field where the reading field overlaps the imprint area. Step and
The display unit displays a black and white binary image obtained by pasting and combining a partial binary image from which an imprint has been deleted on the input black and white binary image or an input color image for each field. A program for executing the step of displaying the corrected color image for a field overlapping with an area.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003325409A JP4300083B2 (en) | 2003-09-18 | 2003-09-18 | Form reader |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003325409A JP4300083B2 (en) | 2003-09-18 | 2003-09-18 | Form reader |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005092543A true JP2005092543A (en) | 2005-04-07 |
JP4300083B2 JP4300083B2 (en) | 2009-07-22 |
Family
ID=34455857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003325409A Expired - Fee Related JP4300083B2 (en) | 2003-09-18 | 2003-09-18 | Form reader |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4300083B2 (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007233900A (en) * | 2006-03-03 | 2007-09-13 | Fuji Xerox Co Ltd | Information processor, information processing method, and computer program |
JP2008071173A (en) * | 2006-09-14 | 2008-03-27 | Fujitsu Ltd | Character recognition program, character recognition method and character recognition device |
JP2012234345A (en) * | 2011-04-28 | 2012-11-29 | Fujitsu Frontech Ltd | Form reader, square seal detection method, and square seal detection program |
CN106808849A (en) * | 2016-11-07 | 2017-06-09 | 广东乐惠购网络科技有限公司 | A kind of smart color pen |
JP2018124705A (en) * | 2017-01-31 | 2018-08-09 | 日本Ics株式会社 | Voucher management program |
JP2021099752A (en) * | 2019-12-23 | 2021-07-01 | キヤノン株式会社 | Device for processing image, program, and image processing method |
US11790493B2 (en) | 2018-09-28 | 2023-10-17 | Pfu Limited | Image processing device, control method, and control program |
-
2003
- 2003-09-18 JP JP2003325409A patent/JP4300083B2/en not_active Expired - Fee Related
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007233900A (en) * | 2006-03-03 | 2007-09-13 | Fuji Xerox Co Ltd | Information processor, information processing method, and computer program |
JP4631749B2 (en) * | 2006-03-03 | 2011-02-16 | 富士ゼロックス株式会社 | Information processing apparatus, information processing method, and computer program |
US7925082B2 (en) | 2006-03-03 | 2011-04-12 | Fuji Xerox Co., Ltd. | Information processing apparatus, information processing method, computer readable medium, and computer data signal |
JP2008071173A (en) * | 2006-09-14 | 2008-03-27 | Fujitsu Ltd | Character recognition program, character recognition method and character recognition device |
JP2012234345A (en) * | 2011-04-28 | 2012-11-29 | Fujitsu Frontech Ltd | Form reader, square seal detection method, and square seal detection program |
CN106808849A (en) * | 2016-11-07 | 2017-06-09 | 广东乐惠购网络科技有限公司 | A kind of smart color pen |
JP2018124705A (en) * | 2017-01-31 | 2018-08-09 | 日本Ics株式会社 | Voucher management program |
US11790493B2 (en) | 2018-09-28 | 2023-10-17 | Pfu Limited | Image processing device, control method, and control program |
JP2021099752A (en) * | 2019-12-23 | 2021-07-01 | キヤノン株式会社 | Device for processing image, program, and image processing method |
JP7433887B2 (en) | 2019-12-23 | 2024-02-20 | キヤノン株式会社 | Devices, programs, and image processing methods for processing images |
US11935314B2 (en) | 2019-12-23 | 2024-03-19 | Canon Kabushiki Kaisha | Apparatus for generating a binary image into a white pixel, storage medium, and method |
Also Published As
Publication number | Publication date |
---|---|
JP4300083B2 (en) | 2009-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4323328B2 (en) | System and method for identifying and extracting character string from captured image data | |
JP2864137B2 (en) | Document processing system | |
JP4857173B2 (en) | Image processing apparatus, image processing method, and image processing program | |
US8331692B2 (en) | Image processing system and computer readable medium | |
JP2010157107A (en) | Business document processor | |
JP2012083990A (en) | Difference detecting apparatus, difference output apparatus, and program | |
JP4300083B2 (en) | Form reader | |
US20070047815A1 (en) | Image recognition apparatus, image recognition method, and image recognition program | |
KR101513856B1 (en) | Braille-to-Voice Translation System | |
JP2008077201A (en) | Writing medium, writing information detection device, writing information detection method, program, and recording medium | |
JP3268552B2 (en) | Area extraction method, destination area extraction method, destination area extraction apparatus, and image processing apparatus | |
JP4842872B2 (en) | Form processing device | |
JP2009223612A (en) | Image recognition device and program | |
JP3955467B2 (en) | Image processing program and image processing apparatus | |
JP2007140703A (en) | Method for reading insurance policy, system thereof, and insurance policy recognition system | |
JP5673277B2 (en) | Image processing apparatus and program | |
JP2009200794A (en) | Document alteration detection program and alteration detection apparatus | |
JP2016181111A (en) | Image processing apparatus and image processing program | |
JP2004094427A (en) | Slip image processor and program for realizing the same device | |
US20170200383A1 (en) | Automated review of forms through augmented reality | |
JPH06111057A (en) | Optical character reader | |
JP2006277509A (en) | Dot texture superposition notation part shape restoration method and program therefor | |
JP2015046001A (en) | Character recognition device, character recognition system, character recognition method and character recognition program | |
JP2022167414A (en) | Image processing device, image processing method, and program | |
JP2004178107A (en) | Slip processor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051206 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20060512 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060512 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080610 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090407 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090420 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4300083 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120424 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120424 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130424 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130424 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140424 Year of fee payment: 5 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313115 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |