JP2013084071A - Form recognition method and form recognition device - Google Patents

Form recognition method and form recognition device Download PDF

Info

Publication number
JP2013084071A
JP2013084071A JP2011222452A JP2011222452A JP2013084071A JP 2013084071 A JP2013084071 A JP 2013084071A JP 2011222452 A JP2011222452 A JP 2011222452A JP 2011222452 A JP2011222452 A JP 2011222452A JP 2013084071 A JP2013084071 A JP 2013084071A
Authority
JP
Japan
Prior art keywords
color
image
stamp
date
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011222452A
Other languages
Japanese (ja)
Other versions
JP5830338B2 (en
Inventor
Juichi Takahashi
寿一 高橋
Hiroshi Shinjo
広 新庄
Kazuki Nakajima
和樹 中島
Hirobumi Kimura
博文 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information and Telecommunication Engineering Ltd
Original Assignee
Hitachi Computer Peripherals Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Computer Peripherals Co Ltd filed Critical Hitachi Computer Peripherals Co Ltd
Priority to JP2011222452A priority Critical patent/JP5830338B2/en
Publication of JP2013084071A publication Critical patent/JP2013084071A/en
Application granted granted Critical
Publication of JP5830338B2 publication Critical patent/JP5830338B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

PROBLEM TO BE SOLVED: To drop out pixels of colors other than colors of a character and a ruled line while leaving pixels of the character in a situation that the colors of the character and ruled line are indefinite and the color of the character shades or varies.SOLUTION: Pixels of an input image are color-clustered to find colors of a background and a character from the numbers of pixels in clusters. A representative value of the character color is detected from a distribution of colors in the image, and pixels of the character color are selected while taking a variation width of the character color into consideration to generate a binary image. If noise of a ruled line etc., other than the color of the character is present, the character and the noise are discriminated to generate a binary image of the character having the noise dropped out. Character recognition is carried out by using two drop-out images, and an image having a higher recognition score is output. Character recognition on the binary image by two drop-out methods is performed to improve recognition precision against both color unevenness and the noise of the ruled line etc.

Description

本発明は、OCR(Optical Character Reader:光学式文字読取装置)等の画像の処理技術に関し、特に文字の色に濃淡差があり、除去対象の色が文字色と同系色の場合などに、文字の色のみを残すドロップアウト技術に関する。   The present invention relates to an image processing technology such as an OCR (Optical Character Reader) and the like, and in particular, when a character color has a difference in density and the color to be removed is similar to the character color, the character Related to dropout technology that leaves only the color of the.

カラー画像から白黒2値画像を生成する2値化処理は、帳票OCRの前処理として基本的な処理である。帳票にはプレ印刷と呼ばれる予め印刷された罫線や文字があり、読取対象の文字を認識する際の障害となる。したがって、帳票画像の2値化処理でプレ印刷部分を消去、すなわち白化する処理は、読取の精度向上のために必須の機能である。色情報を用いたプレ印刷の白化はカラードロップアウトと呼ばれる。   A binarization process for generating a monochrome binary image from a color image is a basic process as a pre-process for a form OCR. The form has pre-printed ruled lines and characters called pre-printing, which becomes an obstacle when recognizing characters to be read. Therefore, the process of erasing, that is, whitening, the preprinted part in the binarization process of the form image is an essential function for improving the reading accuracy. Whitening of pre-printing using color information is called color dropout.

カラードロップアウト処理の代表的な従来技術として、特許文献1には、カラー画像を撮像し、RBGの3つの色のうち、ノイズ成分の輝度が最も高くなる色を選択した後、その色における画素の濃淡値を用いて2値化する方式が記載されている。また、特許文献2には、帳票ごとに異なる押印色とプレ印刷色に対応するため、押印の文字色を推定した後、文字色のみを抽出する方式が記載されている。また、その他の方法として、ノイズ成分として赤系もしくは青系のいずれかを指定し、ノイズ成分と同系色の光源で撮像した画像を文字認識に用いる方法がある。例えば、文字が黒で罫線が赤い帳票を赤系の光源で撮像すると、罫線部分が画像に現れなくなる。青系でも同様である。   As a typical prior art of color dropout processing, Patent Document 1 discloses that a color image is picked up, a color having the highest noise component luminance is selected from the three colors of RBG, and then a pixel in that color is selected. The method of binarizing using the gray value of the is described. Patent Document 2 describes a method of extracting only the character color after estimating the character color of the stamp so as to correspond to a different stamp color and pre-print color for each form. As another method, there is a method in which either red or blue is designated as a noise component, and an image captured with a light source having the same color as the noise component is used for character recognition. For example, if a form with black characters and red ruled lines is imaged with a red light source, the ruled line portions do not appear in the image. The same applies to the blue system.

特開2003−196592号公報JP 2003-196292 A 特開2010−244372号公報JP 2010-244372 A

カラードロップアウト処理が必要な帳票の例として、領収伝票がある。領収伝票には罫線や文字等のプレ印刷があり、活字文字や手書き文字が記載され、入出金の証明として日付印が押印されている。このうち、日付印の文字を読取るには、カラードロップアウト処理において通常の記載文字とは異なる課題がある。日付印のインク色は帳票ごとに赤や青、黒など異なるうえ、多様な色や形状のプレ印刷との交差が多く発生する。   An example of a form that requires color dropout processing is a receipt slip. Receipt slips have preprints such as ruled lines and characters, printed characters and handwritten characters are written, and date stamps are stamped as proof of deposit and withdrawal. Of these, reading date stamp characters has a problem that differs from normal written characters in color dropout processing. The ink color of the date stamp differs from red to blue to black for each form, and many crossings with pre-prints of various colors and shapes occur.

さらに、日付印のインクの付け方や押し方の影響により、日付印内の文字は、帳票に記載される通常の文字に比べて濃淡差が大きい。そのうえ、日付印はプレ印刷と同系色のインクで押印されることも多い。文字の濃淡差と同系色のプレ印刷は二律背反の関係にある。通常、文字色の濃淡差を許容するには、文字の薄い箇所を抽出するために、ドロップアウトの閾値を下げる。これはノイズ成分なども同時に抽出する可能性があるため、プレ印刷との分離を困難にする。一方、同系色のプレ印刷をドロップアウトするには、閾値を厳しくすることになり、濃淡差が大きな文字を抽出できない。   Furthermore, due to the influence of how to apply and push the date stamp, the characters in the date stamp have a greater density difference than the normal characters written on the form. In addition, date stamps are often imprinted with inks of the same color as pre-printing. There is a trade-off between the difference in density of characters and pre-printing of similar colors. In general, in order to allow a difference in density of the character color, the dropout threshold is lowered in order to extract a thin portion of the character. This may cause noise components and the like to be extracted at the same time, making separation from pre-printing difficult. On the other hand, in order to drop out preprints of similar colors, the threshold value becomes strict, and characters with large shade differences cannot be extracted.

特許文献1に記載の方法では、文字とプレ印刷が異なる色であることを前提としているため、文字とプレ印刷が同系色の場合には適用できない。また、特許文献2に記載の方法では、ドロップアウトの閾値を動的に求めているものの、濃淡差が大きな文字と同系色の罫線が混在する場合には対応できない。また、ノイズ成分として赤系もしくは青系のいずれかを指定し、ノイズ成分と同系色の光源で撮像した画像を文字認識に用いる方法では、押印色やプレ印刷色が異なる帳票が混在する場合には適用できない。   The method described in Patent Document 1 is based on the premise that characters and pre-printing are different colors, and therefore cannot be applied when characters and pre-printing have similar colors. In addition, the method described in Patent Document 2 dynamically determines a dropout threshold, but cannot cope with a case where a character with a large shade difference and a ruled line of the same color coexist. In addition, when either red or blue is specified as the noise component and an image captured with a light source of the same color as the noise component is used for character recognition, when forms with different stamp colors and pre-print colors are mixed Is not applicable.

上述したような従来技術における問題点に鑑み、本発明の目的は、色むらが大きい場合に対するドロップアウトにおいて、インクの量が薄い画素の文字を正しく抽出すること、さらに、文字の周辺にプレ印刷が存在する帳票と、文字の濃淡差が大きな帳票が混在しても、適切にドロップアウトして文字認識することにある。   In view of the problems in the conventional technology as described above, the object of the present invention is to correctly extract a character of a pixel with a small amount of ink in dropout for a case where color unevenness is large, and to perform pre-printing around the character. Even if there is a form with a large number of characters and a form with a large difference in density of characters, it is to drop out appropriately and recognize characters.

ここで「色むら」とは、例えば日付印を帳票等に押印する際に、文字等の色がインクの量や力の加減等により、滲んだりかすれたりして、濃淡差が大きい状態をいう。   Here, “color unevenness” refers to a state in which, for example, when a date stamp is imprinted on a form or the like, the color of characters or the like blurs or fades due to the amount of ink or the amount of power, and the difference in shade is large. .

本発明に係る画像処理方法では、処理対象画像から文字成分のみ残すドロップアウトの画像処理方法であって、処理対象画像を入力するステップと、処理対象画像の画素を色クラスタリングするステップと、色クラスタリングに基づいて背景色を選択するステップと、処理対象画像の画素から押印色を選択するステップと、処理対象画像の画素を色空間変換するステップと、処理対象画像の画素から色むら対応用の濃淡画像生成するステップと、濃淡画像の傾きを補正するステップと、傾き補正した濃淡画像を2値化するステップを有する。   The image processing method according to the present invention is a dropout image processing method that leaves only character components from the processing target image, the step of inputting the processing target image, the step of color clustering the pixels of the processing target image, and the color clustering A background color based on the image, a step of selecting a stamp color from the pixels of the processing target image, a color space conversion of the pixels of the processing target image, and a shading for dealing with color unevenness from the pixels of the processing target image An image generating step; a step of correcting the gradient of the grayscale image; and a step of binarizing the grayscale image subjected to the gradient correction.

本発明における、文字成分色とノイズ成分色が不定である帳票に対するドロップアウトでは、色むらが大きい場合でも、正しく文字色を残すことができる。このため、日付文字列も正しく抽出することができる。   In the present invention, in the dropout for a form in which the character component color and the noise component color are indefinite, even if the color unevenness is large, the character color can be correctly left. For this reason, the date character string can also be correctly extracted.

本発明の実施形態の画像処理装置の構成図である。1 is a configuration diagram of an image processing apparatus according to an embodiment of the present invention. 従来の実施形態のドロップアウト処理の概略を示す図である。It is a figure which shows the outline of the dropout process of conventional embodiment. 本発明の実施形態のドロップアウト処理の概略を示す図である。It is a figure which shows the outline of the dropout process of embodiment of this invention. 本発明の実施形態の押印日付読取りの処理の一例を示す図である。It is a figure which shows an example of the process of a stamp date reading of embodiment of this invention. 本発明の実施形態の色むら対応用2値画像を出力するドロップアウト処理を示すフローチャートである。It is a flowchart which shows the dropout process which outputs the binary image for color nonuniformity of embodiment of this invention. 本発明の実施形態の押印色選択処理を示すフローチャートである。It is a flowchart which shows the stamp color selection process of embodiment of this invention. 従来の押印色選択におけるドロップアウト処理により日付印がドロップアウトしてしまう例を示す図である。It is a figure which shows the example which a date stamp drops out by the dropout process in the conventional stamp color selection. 本発明の実施形態の円周色選択処理を示すフローチャートである。It is a flowchart which shows the circumference color selection process of embodiment of this invention. 本発明の実施形態の押印色決定処理を示すフローチャート。The flowchart which shows the stamp color determination process of embodiment of this invention. 本発明の実施形態の色むら対応用の濃淡画像生成処理を示すフローチャートである。It is a flowchart which shows the grayscale image production | generation process for color unevenness of embodiment of this invention. 日付印の色相頻度分布と日付印色相許容範囲の概略を示す図である。It is a figure which shows the outline of the hue frequency distribution of a date stamp, and a date stamp hue tolerance | permissible_range. 本発明の実施形態の押印色が無彩色の場合の注目する画素における色むら対応用画素分類の判定処理を示すフローチャートである。It is a flowchart which shows the determination process of the pixel classification for color nonuniformity in the pixel of interest when the stamp color of the embodiment of the present invention is an achromatic color. 本発明の実施形態の押印色が有彩色の場合の注目する画素における色むら対応用画素分類の判定処理を示すフローチャートである。It is a flowchart which shows the determination process of the pixel classification for color nonuniformity in the pixel to which attention is paid when the stamp color is a chromatic color according to the embodiment of the present invention. 本発明の実施形態の2値化処理の概略を示す図である。It is a figure which shows the outline of the binarization process of embodiment of this invention. 本発明の実施形態の押印日付読取りの第2の処理を示すフローチャートである。It is a flowchart which shows the 2nd process of stamp date reading of embodiment of this invention. 本発明の実施形態のプレ印刷・地紋除去用2値画像を出力するドロップアウト処理を示すフローチャートである。It is a flowchart which shows the dropout process which outputs the binary image for pre-printing / background pattern removal of embodiment of this invention. 本発明の実施形態のプレ印刷・地紋除去用の濃淡画像生成処理を示すフローチャートである。It is a flowchart which shows the grayscale image production | generation process for pre-printing and a background pattern removal of embodiment of this invention. 本発明の実施形態の押印色が無彩色の場合の注目する画素におけるプレ印刷・地紋除去用画素分類の判定処理を示すフローチャートである。It is a flowchart which shows the determination process of the pixel classification for pre-printing / background pattern removal in the pixel of interest when the stamp color is an achromatic color according to the embodiment of the present invention. 本発明の実施形態の押印色が有彩色の場合の注目する画素におけるプレ印刷・地紋除去用画素分類の判定処理を示すフローチャートである。It is a flowchart which shows the determination process of the pixel classification for pre-printing / background pattern removal in the pixel of interest when the stamp color is a chromatic color according to the embodiment of the present invention. 本発明の実施形態の日付印が同系色の罫線の上に押印した場合の罫線除去有無による2値画像出力結果の概略を示す図である。It is a figure which shows the outline of the binary image output result by the presence or absence of ruled line removal when the date stamp of embodiment of this invention is stamped on the ruled line of similar color. 本発明の実施形態の押印日付読取りの第3の処理を示すフローチャートである。It is a flowchart which shows the 3rd process of stamp date reading of embodiment of this invention. 本発明の実施形態の色むら対応用2値画像およびプレ印刷・地紋除去用2値画像の2つの2値画像を出力するドロップアウト処理を示すフローチャートである。It is a flowchart which shows the dropout process which outputs the two binary images of the binary image for color unevenness of embodiment of this invention, and the binary image for pre-printing / background pattern removal. 本発明の実施形態の押印日付読取りの第4の処理を示すフローチャートである。It is a flowchart which shows the 4th process of stamp date reading of embodiment of this invention. 本発明の実施形態の押印日付読取りの第5の処理を示すフローチャートである。It is a flowchart which shows the 5th process of stamp date reading of embodiment of this invention. 本発明の実施形態の押印日付読取りの第6の処理を示すフローチャートである。It is a flowchart which shows the 6th process of stamp date reading of embodiment of this invention. 本発明の実施形態の押印日付読取りの第7の処理を示すフローチャートである。It is a flowchart which shows the 7th process of stamp date reading of embodiment of this invention. 本発明の実施形態の押印日付読取りの第8の処理を示すフローチャートである。It is a flowchart which shows the 8th process of stamp date reading of embodiment of this invention. 本発明の実施形態の押印日付読取り結果の確認および修正するユーザーインタフェースの第1の例を示す図である。It is a figure which shows the 1st example of the user interface which confirms and corrects the stamp date reading result of embodiment of this invention. 本発明の実施形態の押印日付読取り結果の確認および修正するユーザーインタフェースの第2の例を示す図である。It is a figure which shows the 2nd example of the user interface which confirms and corrects the stamp date reading result of embodiment of this invention. 本発明の実施形態の押印日付読取り結果の確認および修正するユーザーインタフェースの第3の例を示す図である。It is a figure which shows the 3rd example of the user interface which confirms and corrects the stamp date reading result of embodiment of this invention.

<第一の実施形態>
本発明の実施形態を、図面を用いて説明する。なお、本発明は、以下の説明によって限定されるものではない。
<First embodiment>
Embodiments of the present invention will be described with reference to the drawings. In addition, this invention is not limited by the following description.

図1は、本発明の実施形態の帳票認識システムの構成を示す図である。帳票認識システムは、入力装置10、画像入力装置20、画像処理装置30、辞書40、表示装置50、及び画像データベース(DB)60を備える。入力装置10は、画像処理装置30にコマンド及びコードデータ等を入力するためのキーボード及びマウス等の装置である。画像入力装置20は、帳票を画像データとして、画像処理装置30に入力するためのスキャナ等の装置である。画像処理装置30は、画像入力装置20によって入力された帳票の読み取り領域を検出してドロップアウト処理をする計算機であって、図示しないCPU、メモリ、及び記憶装置を備える。画像処理装置では、ドロップアウト画像の文字認識などの処理も実行することができる。辞書40は、画像処理装置30が帳票を認識する際に参照する辞書データベースである。辞書40は、具体的には、画像処理装置30が文字認識する際に参照する文字認識辞書や、文字列照合を行う際に参照する知識辞書や、帳票の読み取り領域を検出する際に参照する帳票情報等を格納する。表示装置50は、画像処理装置30によって帳票が認識された結果を表示するディスプレイ等の装置である。画像DB60は、画像入力装置20によって画像処理装置30に入力された画像データを格納する。また、画像DB60には、画像入力装置20によって画像処理装置30が認識する対象となる画像データが予め格納されていてもよい。   FIG. 1 is a diagram showing a configuration of a form recognition system according to an embodiment of the present invention. The form recognition system includes an input device 10, an image input device 20, an image processing device 30, a dictionary 40, a display device 50, and an image database (DB) 60. The input device 10 is a device such as a keyboard and a mouse for inputting commands and code data to the image processing device 30. The image input device 20 is a device such as a scanner for inputting a form as image data to the image processing device 30. The image processing apparatus 30 is a computer that detects a reading area of a form input by the image input apparatus 20 and performs a dropout process, and includes a CPU, a memory, and a storage device (not shown). The image processing apparatus can also execute processing such as character recognition of the dropout image. The dictionary 40 is a dictionary database that is referred to when the image processing apparatus 30 recognizes a form. Specifically, the dictionary 40 is referred to when a character recognition dictionary that is referred to when the image processing apparatus 30 recognizes characters, a knowledge dictionary that is referred to when character string matching is performed, or a form reading area. Stores form information and the like. The display device 50 is a device such as a display that displays the result of the form recognized by the image processing device 30. The image DB 60 stores image data input to the image processing device 30 by the image input device 20. The image DB 60 may store in advance image data to be recognized by the image processing apparatus 30 by the image input apparatus 20.

なお、本発明は、画像処理装置30と同じ機能を備えるソフトウェアによって通常の計算機に実装されてもよい。   The present invention may be implemented in a normal computer by software having the same function as the image processing apparatus 30.

本発明で実現するドロップアウト方式の具体例を示す前に、従来のドロップアウトの処理結果の概要を図2に、本発明の色むら対応の処理結果の概要を図3にそれぞれ示す。   Before showing a specific example of the dropout method realized by the present invention, an outline of a conventional dropout processing result is shown in FIG. 2, and an outline of a processing result for color unevenness of the present invention is shown in FIG.

図2は,例えば特許文献2に示すような従来のドロップアウトの処理結果の概要を示す図である。図2(a)はプレ印刷の上に色むらがほぼなく一様に押印された入力画像である。201は処理対象の領域、202は色むらがなく一様に押された日付印、203は帳票上の罫線等のプレ印刷や地紋を表す。図2(a)の入力画像から押印色以外のプレ印刷や地紋の色をドロップアウトすることにより、押印の色成分204のみが残ったカラードロップアウト画像(図2(b))が生成される。図2(b)のカラードロップアウト画像から傾き等の画像補正、2値化、日付行抽出を行うと、日付行成分205のみの日付行2値画像(図2(c))が生成される。   FIG. 2 is a diagram showing an outline of a conventional dropout processing result as shown in Patent Document 2, for example. FIG. 2A shows an input image that is almost uniformly printed on the pre-print and is stamped uniformly. Reference numeral 201 denotes a region to be processed, 202 denotes a date stamp that is uniformly pressed without color unevenness, and 203 denotes pre-printing such as a ruled line on a form or a background pattern. A color dropout image (FIG. 2 (b)) in which only the color component 204 of the stamp remains is generated by dropping out pre-printing and ground pattern colors other than the stamp color from the input image of FIG. 2 (a). . When image correction such as tilt, binarization, and date row extraction are performed from the color dropout image of FIG. 2B, a date row binary image (FIG. 2C) having only the date row component 205 is generated. .

図2(d)は色むらがある入力画像である。処理対象領域206内の日付印207は薄い画素208や濃い画素209があり,日付印全体としては色むらが大きい。この図2(d)の入力画像に対してドロップアウトを行うと,薄い画素が押印色でないと判定されるため,薄い画素がドロップアウトされて濃い画素210のみが残ったカラードロップアウト画像(図2(e))が生成される。図2(e)のカラードロップアウト画像から傾き等の画像補正、2値化、日付行抽出を行うと、日付の一部が欠落した日付行成分211のみの日付行2値画像(図2(f))が生成される。   FIG. 2D shows an input image with uneven color. The date stamp 207 in the processing target area 206 includes a thin pixel 208 and a dark pixel 209, and the date stamp as a whole has large color unevenness. When dropout is performed on the input image of FIG. 2D, it is determined that the thin pixel is not the stamp color, so that the color dropout image (FIG. 2) in which the thin pixel is dropped out and only the dark pixel 210 remains. 2 (e)) is generated. When image correction such as inclination is performed from the color dropout image of FIG. 2E, binarization, and date line extraction are performed, a date line binary image with only the date line component 211 missing a part of the date (FIG. 2 ( f)) is generated.

このように、従来のドロップアウトでは、色むらが大きい場合に文字成分が欠落してしまうという問題があった。ここで、本発明の第1の課題は、このような色むらが大きい場合に対してもドロップアウトによって成分が欠落することなく正しく日付文字行を抽出することである。これを実現するために、本発明における課題の解決策についての概要を説明する。詳細については図4以降で説明する。   As described above, the conventional dropout has a problem in that character components are lost when color unevenness is large. Here, the first problem of the present invention is to correctly extract a date character line without missing components due to dropout even when such color unevenness is large. In order to realize this, an outline of a solution to the problem in the present invention will be described. Details will be described with reference to FIG.

(1)押印色選択:従来方式では、背景色の次に多い画素数のクラスタを押印色とするため,処理対象領域に対してプレ印刷や地紋色の画素数が日付印色の画素数より多い場合に,プレ印刷や地紋色を押印色としてしまうことがある。本発明では、まず、日付印の円周付近の画素の色のみで色クラスタリングを行い、背景色とは近くなく、最も頻度が多いクラスタを円周色として選択する。次に、押印の中の領域で色クラスタリングを行い、この結果のクラスタの中で、ある程度の頻度があり、かつ円周色に最も近いクラスタの色を押印色とする。この方法により、プレ印刷や地紋の色を押印色に誤選択しないようにできる。   (1) Stamp color selection: In the conventional method, the cluster having the next largest number of pixels after the background color is used as the stamp color. In many cases, pre-printing or copy-forgery-inhibited pattern color may be used as the stamp color. In the present invention, first, color clustering is performed using only the colors of the pixels near the circumference of the date stamp, and the cluster that is not close to the background color and has the highest frequency is selected as the circumferential color. Next, color clustering is performed in the region within the stamp, and among the resulting clusters, the color of the cluster having a certain frequency and closest to the circumferential color is set as the stamp color. By this method, it is possible to prevent erroneous selection of preprinted or tint block colors as stamp colors.

(2)カラードロップアウト:従来方式では、画素のRGB情報だけなくHSV色空間も用いてプレ印刷や地紋をドロップアウトするための閾値が厳しいため、色むらが大きい場合には押印のインク色が薄い個所の画素がドロップアウトして欠落してしまう。本発明では、処理対象領域内の色相の頻度分布からRGB情報とこれを変換したHSY色空間において、色相や彩度や輝度の許容範囲を動的に求めることで、色むらが大きい場合であっても、文字色を残すことができる。   (2) Color dropout: In the conventional method, the threshold value for pre-printing or dropping out the background pattern using not only the RGB information of the pixel but also the HSV color space is severe, so if the color unevenness is large, the ink color of the stamp is Thin pixels are dropped out and lost. In the present invention, in the HSY color space obtained by converting the RGB information and the hue frequency distribution in the processing target area, the hue, saturation, and luminance allowable range are dynamically obtained, and thus the color unevenness is large. However, it can leave the character color.

(3)2値化:従来方式では、色むらが大きい場合には,押印のインク色が薄い個所の画素が白画素となり欠落してしまい,文字がかすれたりする。本発明では、日付行領域内の部分領域ごとに2値化閾値を求めて2値化すると,押印のインク色が薄い画素が多い部分領域においては,薄い画素も黒画素化することができ、部分領域ごとに2値化した全ての2値画像の論理和の2値画像を生成することで日付行領域の2値画像は,色むらが大きい場合であっても,文字の欠落を抑制できる。   (3) Binarization: In the conventional method, when the color unevenness is large, the pixel where the ink color of the stamp is light becomes a white pixel and is lost, and the character is blurred. In the present invention, when the binarization threshold is obtained for each partial area in the date line area and binarized, in a partial area where there are many pixels with a light ink color of the seal, thin pixels can be converted to black pixels, By generating a binary image of the logical sum of all binary images binarized for each partial area, the binary image in the date line area can suppress missing characters even if the color unevenness is large. .

図3は、本発明の色むら対応のドロップアウトの処理結果の概要を示す図である。図3(a)は,図2(d)と同じ色むらがある入力画像である。色むら対応のカラードロップアウトでは,薄い画素302もドロップアウトせず残ったカラードロップアウト画像(図3(b))が生成される。図3(b)のカラードロップアウト画像から傾き等の画像補正、色むら対応の2値化、日付行抽出を行うと、文字成分が欠落しない日付行成分302日付行2値画像(図3(c))が生成される。   FIG. 3 is a diagram showing an outline of the processing result of dropout corresponding to uneven color according to the present invention. FIG. 3A shows an input image having the same color unevenness as FIG. In the color dropout corresponding to the color unevenness, the color dropout image (FIG. 3B) is generated without the thin pixel 302 being dropped out. When image correction such as inclination, binarization corresponding to color unevenness, and date line extraction are performed from the color dropout image of FIG. 3B, a date line component 302 date line binary image (FIG. c)) is generated.

図3(d)は図2(a)と同じプレ印刷の上に色むらがほぼなく一様に押印された入力画像である。この図3(d)の入力画像に色むら対応のカラードロップアウトを行うと,プレ印刷の罫線や文字303も残ったカラードロップアウト画像(図3(e))が生成される。図3(e)のカラードロップアウト画像から傾き等の画像補正、色むら対応の2値化、日付行抽出を行うと、プレ印刷の罫線や文字成分305が残った日付行成分304の日付行2値画像(図3(f))が生成される。   FIG. 3 (d) shows an input image which is uniformly stamped with almost no color unevenness on the same pre-print as in FIG. 2 (a). When color dropout corresponding to uneven color is performed on the input image of FIG. 3D, a color dropout image (FIG. 3E) in which pre-printed ruled lines and characters 303 remain is generated. When image correction such as inclination, binarization corresponding to color unevenness, and date line extraction are performed from the color dropout image of FIG. 3E, the date line of the date line component 304 in which preprinted ruled lines and character components 305 remain is obtained. A binary image (FIG. 3F) is generated.

このように、色むらに対応することで、従来ドロップアウトにて除去していた罫線や地紋成分が残ってしまうという問題がある。ここで、本発明における第2の課題は、色むらが大きい場合や同系色のプレ印刷・地紋がある場合が混在して入力されても、どちらの場合でも正しく日付文字行を抽出することである。これを実現するために、本発明では以下のような方式をとる。第1の方式は、ドロップアウトを、色むら対応用ドロップアウトとプレ印刷・地紋除去用のドロップアウトを状況により選択して日付文字行2値画像を出力することである。第2の方式は、ドロップアウトは、色むら対応用とプレ印刷・地紋除去用の2種類の日付文字行2値画像を出力することである。詳細については、図15以降で説明する。   As described above, there is a problem that the ruled line and the background pattern component that have been removed by the dropout are left by dealing with the color unevenness. Here, the second problem in the present invention is that the date character line is correctly extracted in both cases even when the color unevenness is large or the case where there is a pre-print / background pattern of similar colors is mixed. is there. In order to realize this, the present invention adopts the following method. The first method is to select a dropout for color unevenness and a dropout for pre-printing / background pattern removal according to the situation and output a date character line binary image. The second method is to output two types of date character line binary images for dropout and for pre-printing / background pattern removal. Details will be described with reference to FIG.

以下、本発明を適用した押印日付読取り方法および押印日付読取り装置の一実施形態について説明する。これは、日付印の押印に色むらが大きい場合においても、押印のインク色が薄い個所の画素が残すことができる。   Hereinafter, an embodiment of a stamp date reading method and a stamp date reader to which the present invention is applied will be described. This is because even when the color imperfection of the date stamp is large, pixels of the light ink color of the stamp can be left.

図4は、本発明である色むら対応のカラードロップアウトを適用した押印日付読取りの処理フローを示す図である。これは、画像処理装置(CPU)30にて実行される。通常はCPUで実行されるプログラムとして実現され、このようなプログラムは各種記録媒体に格納することができ、メモリに格納されてCPUで実行される。   FIG. 4 is a diagram showing a processing flow of reading a stamp date to which the color dropout corresponding to color unevenness according to the present invention is applied. This is executed by the image processing apparatus (CPU) 30. Usually, it is realized as a program executed by the CPU, and such a program can be stored in various recording media, stored in a memory and executed by the CPU.

画像入力401において対象のカラー画像を入力し、日付印検知402において日付印の領域を検出する。   The target color image is input in the image input 401, and the date stamp area is detected in the date stamp detection 402.

日付印検知402にて検出した日付印の数だけ403は、404〜406を繰り返す。色むら対応用2値画像を出力するカラードロップアウト404において、注目する日付印の領域を含めた処理対象領域から、日付行2値画像を抽出し、日付文字列認識405において辞書40に含まれる文字識別辞書および日付表記辞書等により日付文字列認識を行う。405において日付文字列認識結果を406にてセットして注目する日付印の読取り処理を終える。403において検出した全ての日付印の読取を終えたら、407にて結果を出力し、押印日付読取り処理を終了する。色むら対応用2値画像を出力するカラードロップアウト404について、図5で説明する。   Steps 404 to 406 are repeated for the number 403 of date stamps detected by the date stamp detection 402. In the color dropout 404 for outputting the color unevenness-corresponding binary image, the date line binary image is extracted from the processing target area including the target date stamp area, and is included in the dictionary 40 in the date character string recognition 405. Date character string recognition is performed using a character identification dictionary and a date notation dictionary. At 405, the date character string recognition result is set at 406, and the reading processing of the date stamp of interest is finished. When all date stamps detected in 403 have been read, the result is output in 407, and the stamp date reading process is terminated. A color dropout 404 for outputting a color unevenness-compatible binary image will be described with reference to FIG.

図5は、本発明である色むら対応用2値画像を出力するカラードロップアウト処理のフローを示す図である。このカラードロップアウトの処理は、処理対象領域から押印色のみを残した濃淡画像を生成して、これを2値化して2値画像を生成する。     FIG. 5 is a diagram showing a flow of color dropout processing for outputting a color unevenness-compatible binary image according to the present invention. In this color dropout process, a grayscale image in which only the stamp color is left is generated from the processing target area, and this is binarized to generate a binary image.

処理領域選択処理501は、画像中から読取り対象の日付印を含む領域を選択する処理である。この処理領域は、日付印検知402で求めた日付印の中心座標と半径を用いて決定する。   The processing area selection process 501 is a process for selecting an area including a date stamp to be read from an image. This processing area is determined using the center coordinates and radius of the date stamp obtained by the date stamp detection 402.

色クラスタリング処理502は、処理領域中の各画素を色クラスタリングする処理である。色クラスタリングは、画像中の各画素を色空間上にマッピングした後、あらかじめ決められた基準に基づいて近い色同士を同じクラスタとする。色クラスタリングの具体的な例としては、特許文献2の方式などを使うことができる。以降の処理を容易にするために、色クラスタリングの結果は、クラスタの画素数が多い順番にソートしてもよい。   The color clustering process 502 is a process for color clustering each pixel in the processing area. In color clustering, each pixel in an image is mapped on a color space, and then colors close to each other are set to the same cluster based on a predetermined criterion. As a specific example of color clustering, the method disclosed in Patent Document 2 can be used. In order to facilitate subsequent processing, the result of color clustering may be sorted in the order of the number of pixels in the cluster.

背景色選択処理503は色クラスタリングした結果から、背景色を選択する処理である。背景色は色クラスタリングした結果の中で、最も画素数(頻度)が多い色を背景色とする。背景色を含むクラスタの選択基準の一例としては、最も画素数が多いクラスタを採用する。この理由は、処理対象領域内では、日付印、罫線、ノイズ、背景の中で、一般的には背景の面積が最も多いからである。背景色を含むクラスタの選択基準の他の例としては、最も輝度が高いクラスタを選択することである。この理由は、紙の色は日付印の色に比べて輝度が高いためである。クラスタの輝度としては、クラスタに含まれる画素の平均の輝度や、分布のピークまたは中心の輝度を用いることができる。輝度YはRGBの各色に異なる重みを付けており、Y=0.29891R+0.58661G+0.11448Bとして計算する。一方、日付印内の背景色を含むクラスタより、日付印の色を含むクラスタの頻度の方が多い場合、上記の方式では日付印の色を背景色と誤判定することがある。これを防ぐため、日付印の領域の外側の画素のみを色クラスタリングした結果から上記の基準例に従って背景色を選択してもよい。   Background color selection processing 503 is processing for selecting a background color from the result of color clustering. As the background color, the color having the largest number of pixels (frequency) among the color clustering results is set as the background color. As an example of a selection criterion for a cluster including a background color, a cluster having the largest number of pixels is employed. This is because the area of the background is generally the largest among the date stamp, ruled line, noise, and background in the processing target area. Another example of a selection criterion for clusters including a background color is to select a cluster having the highest luminance. This is because the paper color has a higher brightness than the date stamp color. As the brightness of the cluster, the average brightness of the pixels included in the cluster or the brightness of the peak or center of the distribution can be used. Luminance Y is calculated as Y = 0.29891R + 0.58661G + 0.11448B with different weights assigned to RGB colors. On the other hand, when the frequency of the cluster including the date stamp color is higher than the cluster including the background color in the date stamp, the date stamp color may be erroneously determined as the background color in the above method. In order to prevent this, the background color may be selected according to the above reference example from the result of color clustering only the pixels outside the date stamp area.

日付印の押印色選択処理504は色クラスタリングした結果から、日付印の押印色を選択する処理である。押印色選択処理については図6〜図9で説明する。   The date stamp color selection process 504 is a process for selecting a date stamp color from the result of color clustering. The stamp color selection process will be described with reference to FIGS.

色空間変換処理505は、色むら対応濃淡画像生成処理506に利用するために、処理対象の画素を入力装置から得られるRGB色空間からHSY空間に変換する処理である。HSY空間とは、色の種類の指標である色相(H)と鮮やかさの指標である彩度(S)、および明るさの指標である輝度(Y)で色を表現するものである。HとSについては、広く利用されているHSV色空間と同じ計算式で算出する。本発明でHSY色空間を用いた理由は、一般に、色相、彩度、明るさ用いた色の表現は、RGBを用いる表現に比べて人間の色の知覚方法と類似しているためである。明るさの指標として、明度(V)ではなく輝度(Y)を用いた理由は、輝度の方が人間の明るさの知覚方法に近いためである。なお、色空間の変換はHSVやHSYだけでなく、HSV色空間やHSL色空間などを用いてもよい。その他にも、印刷の過程で利用する減法混色の表現であるCMY色空間やCMYK色空間などを利用してもよい。   The color space conversion process 505 is a process for converting the pixel to be processed from the RGB color space obtained from the input device to the HSY space for use in the color unevenness gray image generation process 506. The HSY space expresses a color with hue (H) that is an index of color type, saturation (S) that is an index of vividness, and luminance (Y) that is an index of brightness. H and S are calculated by the same calculation formula as the widely used HSV color space. The reason why the HSY color space is used in the present invention is that the expression of colors using hue, saturation, and brightness is generally similar to the human color perception method compared to the expression using RGB. The reason for using the luminance (Y) instead of the lightness (V) as the brightness index is that the luminance is closer to a human brightness perception method. The color space conversion may use not only HSV and HSY, but also HSV color space, HSL color space, and the like. In addition, a CMY color space or a CMYK color space, which is a subtractive color expression used in the printing process, may be used.

このように、RGB以外の次元を用いることにより、後述する画素分類処理や等の処理が高精度となる。上記の例では、一括して色空間の変換を行ってから、次の処理を行ったが、色空間の変換は、画素を利用する際にその都度、RGBからHやS等を計算して処理を行ってもよい。   In this way, by using dimensions other than RGB, pixel classification processing, which will be described later, and the like become highly accurate. In the above example, the color space conversion is performed collectively and then the following processing is performed. However, the color space conversion is performed by calculating H, S, etc. from RGB each time a pixel is used. Processing may be performed.

色むら対応用濃淡画像生成処理506は、押印色選択504によって選択した押印色に対して処理対象領域から色むらに適した色のみを残し、濃淡画像を生成する。色むら対応用濃淡画像生成処理については、図10〜図13で説明する。   The color unevenness gray image generation processing 506 generates a gray image by leaving only the color suitable for color unevenness from the processing target area for the stamp color selected by the stamp color selection 504. The color unevenness gray image generation process will be described with reference to FIGS.

傾き補正507は、濃淡画像生成処理506によって生成された濃淡画像に対して、日付領域の上限にある線を検知して傾きを求め、この傾きを正立するように補正する。傾き補正をここで行うメリットは、2値化後の画像に比べて濃淡画像では傾き補正後に量子化誤差が発生しにくいことである。具体的には、斜めの線や曲線を含む画像を補正した際に、線上にギザギザが発生しにくくなる。傾き補正手法の例としては、バイナリア法やバイキュービック法を利用することができる。なお、傾き補正のためには、傾きを検出する必要がある。これは、例えば日付行の上下にある線を検知して求めることができるが、他の方法で求めてもよい。また傾きの検出は、傾き補正507内で検出も、他の処理で検出してもよい。   The tilt correction 507 detects the line at the upper limit of the date area for the grayscale image generated by the grayscale image generation processing 506, obtains the tilt, and corrects this tilt to be upright. The merit of performing the inclination correction here is that a quantization error is less likely to occur after the inclination correction in the grayscale image as compared to the binarized image. Specifically, when an image including an oblique line or curve is corrected, a jagged line is hardly generated on the line. As an example of the inclination correction method, a binary method or a bicubic method can be used. In order to correct the inclination, it is necessary to detect the inclination. This can be obtained by detecting lines above and below the date line, for example, but may be obtained by other methods. The tilt may be detected within the tilt correction 507 or by other processing.

2値化処理508は、傾き補正507で傾き補正した濃淡画像から日付行の領域のみ2値化し、2値画像を生成する。2値化処理507は図14で説明する。   The binarization processing 508 binarizes only the date line area from the grayscale image that has been tilt-corrected by the tilt correction 507, and generates a binary image. The binarization process 507 will be described with reference to FIG.

押印色選択処理504について図6〜図9を用いて説明する。図6は押印色選択の処理フローである。押印色選択は、プレ印刷や地紋の色に誤って押印色としないために、まず円周色選択処理601によって円周色を選択し、次に押印色決定処理602によって押印色を決定する。従来の方式では、背景色の次に多い画素数のクラスタを押印色とするため,処理対象領域に対してプレ印刷や地紋色の画素数が日付印色の画素数より多い場合に,プレ印刷や地紋色を押印色としてしまうことがある。この理由を図7で後述する。本発明では、まず、日付印の円周付近の画素の色のみで色クラスタリングを行い、背景色とは近くなく、最も頻度が多いクラスタを円周色として選択する。円周付近の画素を用いる理由は、円周付近が最も押印色に近い色が密にあるためである。次に、押印の中の領域で色クラスタリングを行い、この結果のクラスタの中で、ある程度の頻度があり、かつ円周色に最も近いクラスタの色を押印色とする。この方法により、プレ印刷や地紋の色を押印色に誤選択しないようにできる。円周色選択処理601を図8に、押印色決定処理602を図9で説明する。   The stamp color selection processing 504 will be described with reference to FIGS. FIG. 6 is a processing flow for selecting a stamp color. In the selection of the stamp color, in order not to mistakenly set the color of the pre-print or the background pattern, the circle color is first selected by the circle color selection process 601, and then the stamp color is determined by the stamp color determination process 602. In the conventional method, the cluster with the next largest number of pixels after the background color is used as the stamp color, so if the number of pre-printed or tint block color pixels is greater than the number of date stamp pixels for the processing target area, pre-printing is performed. And the background color may be used as the seal color. The reason for this will be described later with reference to FIG. In the present invention, first, color clustering is performed using only the colors of the pixels near the circumference of the date stamp, and the cluster that is not close to the background color and has the highest frequency is selected as the circumferential color. The reason why pixels near the circumference are used is that there are dense colors closest to the seal color around the circumference. Next, color clustering is performed in the region within the stamp, and among the resulting clusters, the color of the cluster having a certain frequency and closest to the circumferential color is set as the stamp color. By this method, it is possible to prevent erroneous selection of preprinted or tint block colors as stamp colors. The circumferential color selection processing 601 will be described with reference to FIG. 8, and the seal color determination processing 602 will be described with reference to FIG.

図7は、押印色がプレ印刷や地紋の色に間違う例を示す。図7の入力画像(a)はカラー画像から対象領域選択処理501によって選択された領域である。例えば、日付印701は輝度の高い緑色、プレ印刷702は輝度が低い茶色、地紋703は輝度が高い茶色であるとする。また、色クラスタリングした結果の中で、日付印の緑色のクラスタより、プレ印刷や地紋の茶色のクラスタの頻度が多い場合がある。この場合、押印色は色クラスタリングの結果の中で、背景色以外で最も頻度が高いクラスタの色とするため、プレ印刷702や地紋703の色を押印色として間違ってしまう。以降の処理である画素判定では、この間違った押印色を中心とした色のみを残し、これを元に濃淡画像を生成すると図7(b)のようになり、濃淡画像はプレ印刷704および地紋705の濃淡画素のみが残る。この濃淡画像を2値化および日付行抽出を行った結果、プレ印刷や地紋706の画素が黒画素としてのこった日付文字行2値画像図7(c)が生成される。以上のように、押印色を間違って選択すると、日付印がドロップアウトされてしまう。   FIG. 7 shows an example in which the stamp color is wrong with the color of pre-printing or background pattern. The input image (a) in FIG. 7 is an area selected by the target area selection processing 501 from the color image. For example, date stamp 701 is green with high luminance, pre-print 702 is brown with low luminance, and tint block 703 is brown with high luminance. In addition, in the result of color clustering, the frequency of pre-printing and ground pattern brown clusters may be higher than the date-marked green clusters. In this case, the stamp color is the color of the most frequently clustered color other than the background color in the result of color clustering, so the preprint 702 and the background pattern 703 are erroneously used as the stamp colors. In pixel determination, which is a subsequent process, only a color centered on the wrong stamp color is left, and a grayscale image is generated based on this color, and the grayscale image is as shown in FIG. 7B. Only 705 shade pixels remain. As a result of binarization and date line extraction of this grayscale image, a date character line binary image shown in FIG. As described above, if the stamp color is selected by mistake, the date stamp is dropped out.

図8は、円周色選択の処理フローを示す図である。ステップ801は半径rにマージンαを持たせた大きさを指定する。rinは半径rよりα小さく、routは半径rよりα大きく設定する。これは、日付印検知によって要られた半径rの値および中心座標が押印の歪みや量子化誤差等によりずれ、また、日付印の外側の縁の幅の分を考慮している。ステップ802は対象領域のy座標分、ステップ803は対象領域のx座標分の繰り返しを行い、対象領域の画素を走査する。ステップ804は対象領域の座標の中で、画素が日付印の半径にマージンを持たせた範囲であれば、この画素の色をステップ805にて円周色リストへ追加する。対象領域の中で日付印の半径にマージンを持たせた範囲の画素の色を全て登録し終わったら、ステップ806にて円周色リストに対して色クラスタリングを行う。ステップ807において、色クラスタリングの結果から最も頻度が多いクラスタの代表色を円周色の初期値としてセットする。ステップ808において、この色クラスタリングの結果のクラスタ数分かつ円周色と背景色の色距離が閾値未満の場合、ステップ809において、注目するクラスタの代表色を選択し、ステップ810において、円周色は注目するクラスタの代表色に置き換える。 FIG. 8 is a diagram illustrating a processing flow of circumferential color selection. Step 801 designates the size of the radius r with a margin α. R in is set to be α smaller than the radius r, and r out is set to be larger than the radius r. This takes into account the radius r and center coordinates required for date stamp detection due to stamp distortion, quantization error, etc., and the width of the outer edge of the date stamp. Step 802 repeats the y coordinate of the target area, and step 803 scans the pixel of the target area by repeating the x coordinate of the target area. Step 804 adds the color of this pixel to the circumferential color list in Step 805 if the pixel is in a range in which the margin of the date stamp radius is included in the coordinates of the target area. When all the colors of the pixels in the range in which the margin of the date stamp radius is provided in the target area have been registered, color clustering is performed on the circumferential color list in step 806. In step 807, the representative color of the cluster with the highest frequency from the result of color clustering is set as the initial value of the circumferential color. In step 808, if the color distance between the circumferential color and the background color is less than the threshold value for the number of clusters as a result of the color clustering, a representative color of the cluster of interest is selected in step 809. In step 810, the circumferential color is Replace with the representative color of the cluster of interest.

このようにして選択した円周色を押印色としない理由は、日付印は押印の仕方によって色むらが生じる場合がある。日付印全体で最も円周色に近い色を押印色とするためである。   The reason why the circumferential color selected in this way is not used as the stamp color is that the date stamp may have uneven color depending on the method of stamping. This is because the color closest to the circumferential color in the entire date stamp is used as the stamp color.

図9は、押印色決定の処理フローを示す図である。ステップ901は対象領域のy座標分、ステップ902は対象領域のx座標分の繰り返しを行い、対象領域の画素を走査する。ステップ903において、座標x、yが日付印の半径内
であれば、この座標の画素の色を押印色リストへ追加する。この時、背景色に近い色であれば押印色リストへ追加せずに次の座標に移動するという処理を加えてもよい。これは、押印色は背景色とは異なるため、押印色リストへ登録する必要がないためである。
FIG. 9 is a diagram showing a processing flow for determining the seal color. Step 901 is repeated for the y coordinate of the target area, and step 902 is performed for the x coordinate of the target area to scan the pixels of the target area. In step 903, if the coordinates x and y are within the radius of the date stamp, the color of the pixel at this coordinate is added to the stamp color list. At this time, if the color is close to the background color, a process of moving to the next coordinate without adding it to the stamp color list may be added. This is because the stamp color is different from the background color and does not need to be registered in the stamp color list.

対象領域を全て走査して得られた押印色リストに対して、ステップ905において色クラスタリングを行う。ステップ906において、この色クラスタリングの結果から最も頻度が多いクラスタの色を押印色の初期値としてセットする。ステップ907において、押印色の色リストのクラスタリングのクラスタ数分、ステップ908〜912を繰り返す。ステップ908は注目するクラスタの代表色を選択する。ステップ909において、注目するクラスタの画素数が閾値より少ない場合は、ステップ910においてループ脱出する。クラスタの画素数が閾値より少ないというのは、日付印の色とは異なるためである。ステップ910は、色クラスタリングの結果がクラスタの画素数によってソートされている場合にはループ脱出するが、ソートされていなければ次のクラスタに移動する。ステップ911において、注目するクラスタの代表色と円周色選択601で得られた円周色との距離が、現在セットしている押印色と円周色との距離未満であれば、押印色は注目するクラスタの代表色に置き換える。以上の処理で押印色を決定する。   In step 905, color clustering is performed on the stamp color list obtained by scanning the entire target area. In step 906, the color of the cluster with the highest frequency is set as the initial value of the stamp color from the result of the color clustering. In step 907, steps 908 to 912 are repeated for the number of clusters in the clustering of the stamp color list. Step 908 selects the representative color of the cluster of interest. If the number of pixels of the cluster of interest is smaller than the threshold value in step 909, the loop exits in step 910. The reason why the number of pixels in the cluster is smaller than the threshold value is that it is different from the color of the date stamp. Step 910 exits the loop if the result of color clustering is sorted by the number of pixels in the cluster, but moves to the next cluster if not sorted. In step 911, if the distance between the representative color of the cluster of interest and the circumferential color obtained by the circumferential color selection 601 is less than the distance between the currently set stamp color and the circumferential color, the stamp color is Replace with the representative color of the cluster of interest. The stamp color is determined by the above processing.

次に色むら対応用の濃淡画像生成処理506について、図10〜図13で説明する。   Next, the grayscale image generation processing 506 for dealing with color unevenness will be described with reference to FIGS.

図10は、色むら対応用濃淡画像生成の処理フローを示す図である。従来の方式では、画素のRGB情報だけなくHSV色空間も用いてプレ印刷や地紋をドロップアウトするための閾値が厳しいため、色むらが大きい場合には押印のインク色が薄い個所の画素がドロップアウトして欠落してしまう。本発明では、処理対象領域内の色相の頻度分布からRGB情報とこれを変換したHSY色空間において、色相や彩度や輝度の許容範囲を動的に求めることで、色むらが大きい場合であっても、文字色を残すことができる。この処理では、押印色が無彩色か有彩色かで処理を切り替える。無彩色とは、彩度値が低い色であり、白や灰色、黒などの色を指す。有彩色とは彩度が一定値以上の色を指す。無彩色と有彩色とに分ける理由は、無彩色と有彩色とでは色の判別の基準が異なるためである。無彩色の識別では輝度と彩度を基準とする。これに対し、有彩色では色相が最も優先度が高く、輝度や彩度がそれに続く基準となる。   FIG. 10 is a diagram showing a processing flow for generating a gray image for dealing with uneven color. In the conventional method, the threshold for dropping out preprints and background patterns using not only the RGB information of the pixels but also the HSV color space is severe, so if the color unevenness is large, the pixels where the ink color of the stamp is light is dropped. Out and missing. In the present invention, in the HSY color space obtained by converting the RGB information and the hue frequency distribution in the processing target area, the hue, saturation, and luminance allowable range are dynamically obtained, and thus the color unevenness is large. However, it can leave the character color. In this process, the process is switched depending on whether the stamp color is an achromatic color or a chromatic color. An achromatic color is a color with a low saturation value and refers to a color such as white, gray, or black. A chromatic color refers to a color whose saturation is equal to or greater than a certain value. The reason for dividing achromatic colors into chromatic colors is that the criteria for color discrimination differ between achromatic colors and chromatic colors. The identification of achromatic colors is based on luminance and saturation. On the other hand, in chromatic colors, hue has the highest priority, followed by luminance and saturation.

まず1001において、押印色をHSY色空間変換する。以降の処理では、押印色のRGB値とHSY色空間によって処理を行う。判定1002において、押印色が有彩色か無彩色かの判定を行う。   First, at 1001, the seal color is converted to HSY color space. In the subsequent processing, processing is performed using the RGB value of the stamp color and the HSY color space. In determination 1002, it is determined whether the stamp color is a chromatic color or an achromatic color.

有彩色か無彩色かの判定は、押印色の彩度がスライド彩度閾値未満であれば無彩色とする(1003)。押印色の彩度がスライド彩度閾値以上であれば有彩色とする(1005)。ここでスライド彩度閾値とは、輝度によって彩度の閾値を変更する閾値設定である。一般的に輝度が低い場合より輝度が高い場合の方が同じ彩度であっても色の変化が大きく見える。このため、輝度が高くなるにつれて彩度の閾値は低くするように設定する。   Whether the chromatic color or the achromatic color is determined is determined as an achromatic color when the saturation of the stamp color is less than the slide saturation threshold (1003). If the saturation of the stamp color is equal to or greater than the slide saturation threshold, a chromatic color is set (1005). Here, the slide saturation threshold is a threshold setting for changing the saturation threshold according to the luminance. In general, when the luminance is higher than when the luminance is low, the color change appears larger even if the saturation is the same. For this reason, the saturation threshold is set lower as the luminance increases.

押印の半径内の各画素について色むら対応用の画素分類(無彩色用)1004において、押印の半径内の各画素について、ドロップアウトする画素等を分類する。画素分類処理とは、ドロップアウトを目的として領域内の各画素を押印色や背景色との距離に応じて4種類に分類する処理である。従来の画素分類処理は特許文献2に記載されているとおりである。本発明における、無彩色用の画素分類1004については図12で説明する。   In the pixel classification (for achromatic color) 1004 for dealing with color unevenness for each pixel within the radius of the stamp, the pixels to be dropped out are classified for each pixel within the radius of the stamp. The pixel classification process is a process for classifying each pixel in the area into four types according to the distance from the stamp color and the background color for the purpose of dropout. The conventional pixel classification process is as described in Patent Document 2. The achromatic pixel classification 1004 in the present invention will be described with reference to FIG.

色むら対応用の色相許容範囲計算処理1006は、画素分類の判別基準である色相の許容範囲を計算する。有彩色の押印色の判別であるため、判別基準に色相を用いる。押印領域内にプレ印刷がある場合と、色むらがある場合とで色相の許容範囲を変えなければならない。この理由を、図11を用いて説明する。   A hue tolerance range calculation process 1006 for dealing with unevenness in color calculates a hue tolerance range that is a discrimination criterion for pixel classification. Since it is the discrimination of the chromatic stamp color, the hue is used as the discrimination criterion. The allowable range of hue must be changed depending on whether there is pre-printing in the stamped area or uneven color. The reason for this will be described with reference to FIG.

図11(a)はプレ印刷・地紋がある場合の色相の頻度分布である。カラー画像中で画素の色相の頻度分布をとると、日付印は、押印色の色相1101を中心に頻度分布1102のように色相が広がり、プレ印刷・地紋は色相1103を中心に頻度分布1104のようになるとする。プレ印刷・地紋等を日付印と分離するには、押印色の色相1101を中心に許容範囲1105で区切る必要がある。1105の許容範囲の計算の一例として、頻度分布1102は色相1101を中心とした正規分布と扱い、偏差βσ以内(例えばβ=1)となる色相までを許容範囲としてもよい。また計算量を削減するために、色相1101の頻度から頻度が1/m(例えばm=2)以下になるまでを許容範囲としてもよい。   FIG. 11A shows the frequency distribution of hues when there is pre-printing / background patterns. When the frequency distribution of the hue of the pixel is taken in the color image, the date spreads like a frequency distribution 1102 around the hue 1101 of the stamp color, and the pre-print / background pattern has a frequency distribution 1104 around the hue 1103. Suppose that In order to separate the pre-print / background pattern from the date stamp, it is necessary to divide the stamp color hue 1101 in the allowable range 1105. As an example of the calculation of the allowable range 1105, the frequency distribution 1102 may be treated as a normal distribution centered on the hue 1101, and the allowable range may be a hue that is within a deviation βσ (for example, β = 1). In order to reduce the calculation amount, the allowable range may be from the frequency of the hue 1101 until the frequency becomes 1 / m (for example, m = 2) or less.

一方、図11(b)は色むらがある場合の色相の頻度分布である。色むらがある場合の頻度分布1106において日付印の一部は色相1103付近にも固まってある場合がある。範囲1105では、色相1103付近に固まってある成分はドロップアウトされることになる。そのために、色むらがある場合には許容範囲を1107まで広げる。許容範囲の広げ方の一例として、頻度分布1106は色相1101を中心とした正規分布と扱い、偏差ασ以内(例えばα=3)となる色相までを許容範囲としてもよい。また計算量を削減するために、色相1101の頻度から頻度が1/n(例えばn=10)以下になるまでを許容範囲としてもよい。これらの許容範囲の計算において、色相1101と色相1103の間に頻度が0または色相1101の頻度から頻度が1/n(例えばn=10)以下になる色相がある場合もあるため、頻度分布1106は移動平均等で馴らしてもよい。   On the other hand, FIG. 11B shows a frequency distribution of hues when there is color unevenness. In the frequency distribution 1106 in the case where there is color unevenness, a part of the date mark may be hardened in the vicinity of the hue 1103 in some cases. In the range 1105, the component solidified in the vicinity of the hue 1103 is dropped out. Therefore, when there is uneven color, the allowable range is expanded to 1107. As an example of how to expand the allowable range, the frequency distribution 1106 may be treated as a normal distribution centered on the hue 1101 and the allowable range may be a hue that is within a deviation ασ (for example, α = 3). In order to reduce the calculation amount, the allowable range may be from the frequency of the hue 1101 until the frequency becomes 1 / n (for example, n = 10) or less. In the calculation of these allowable ranges, there may be a hue between the hue 1101 and the hue 1103 that has a frequency of 0 or a frequency that is less than 1 / n (for example, n = 10) from the frequency of the hue 1101. May be adapted by moving averages.

図10の押印の半径内の各画素について色むら対応用の画素分類(有彩色用)1007において、押印の半径内の各画素について、ドロップアウトする画素等を分類する。有彩色用の画素分類1007については図13で説明する。濃淡値変換処理1008は、画素分類1004または1007によって分類された各画素について特許文献2の図8〜図11の説明で示す方法により、画素の輝度値に基づく濃淡値画像を生成する。この濃淡値画像では、押印色以外の色をドロップアウトしやすくするため、背景およびプレ印刷と判断される画素の輝度値が、入力画像の輝度地よりも高い値になる。押印色以外であるとの判定には、押印色と背景色との距離、および隣接画素との関係を用いている。   In the pixel classification (for chromatic color) 1007 corresponding to color unevenness for each pixel within the radius of the stamp in FIG. 10, the pixel to be dropped out is classified for each pixel within the radius of the stamp. The pixel classification 1007 for chromatic colors will be described with reference to FIG. The gray value conversion processing 1008 generates a gray value image based on the luminance value of the pixel for each pixel classified by the pixel classification 1004 or 1007 by the method shown in the description of FIGS. In this gray value image, in order to make it easy to drop out colors other than the stamp color, the luminance values of the pixels determined to be the background and pre-printing are higher than the luminance area of the input image. For the determination that the color is other than the stamp color, the distance between the stamp color and the background color and the relationship with the adjacent pixels are used.

図12と図13は、画素分類の判定フローを示す図であり、図12が無彩色の場合、図13が有彩色の場合を示している。画素分類は、対象領域内の画素を、背景色や押印色との距離などを基準に、「背景」、「文字」、「除去候補」、「文字候補」の4種類に分類する。このうち、除去候補は、プレ印刷や地紋などを想定しており、明らかに押印とは異なる色を指す。文字候補は、押印と同系色のプレ印刷などを想定しており、押印色と近いために、この段階では文字か除去候補かを決定できない色を指す。この分類結果は、後段の濃淡画像生成に利用される。   12 and 13 are diagrams showing a pixel classification determination flow. FIG. 12 shows an achromatic color case and FIG. 13 shows a chromatic color case. In the pixel classification, the pixels in the target area are classified into four types of “background”, “character”, “removal candidate”, and “character candidate” based on the distance from the background color and the stamp color. Among these, the removal candidate assumes pre-printing or a background pattern, and clearly indicates a color different from the stamp. The character candidate is assumed to be pre-printed in the same color as the stamp, and is close to the stamp color, and therefore cannot be determined as a character or a removal candidate at this stage. This classification result is used to generate a gray image in the subsequent stage.

図12は、押印色が無彩色の場合の色むら対応用の画素分類の判定フローである。押印半径内の各画素について、この判定フローに従い画素分類を行う。画素の色と押印色との距離が閾値以上または画素の輝度が背景色の輝度より高いと判定(1201)した場合は、この画素について背景フラグをセット(1202)して戻る(1203)。画素の色と押印色との距離が閾値より近いと判定(1204)した場合は、この画素について文字フラグをセット(1205)して戻る(1206)。画素の彩度が画素のスライド彩度閾値以下でかつ押印色との輝度差が色むら対応用の輝度差の閾値以下と判定(1207)した場合も、この画素について文字フラグをセット(1208)して戻る(1209)。これらの判定以外の場合は、この画素について除去候補フラグをセット(1210)して終了する。   FIG. 12 is a determination flow of pixel classification for dealing with color unevenness when the stamp color is an achromatic color. For each pixel within the stamp radius, pixel classification is performed according to this determination flow. If it is determined (1201) that the distance between the color of the pixel and the stamp color is equal to or greater than the threshold or the luminance of the pixel is higher than the luminance of the background color, the background flag is set (1202) for this pixel and the processing returns (1203). If it is determined that the distance between the pixel color and the stamp color is closer than the threshold (1204), the character flag is set (1205) for this pixel and the process returns (1206). When it is determined that the pixel saturation is equal to or less than the pixel slide saturation threshold and the luminance difference from the stamp color is equal to or less than the luminance difference threshold for uneven color (1207), a character flag is set for this pixel (1208). Then return (1209). In cases other than these determinations, a removal candidate flag is set (1210) for this pixel, and the process ends.

図13は、押印色が有彩色の場合の色むら対応用の画素分類の判定フローである。押印半径内の各画素について、この判定フローに従い画素分類を行う。画素の色と押印色との距離が閾値以上または画素の輝度が背景色の輝度より高いと判定(1301)した場合は、この画素について背景フラグをセット(1302)して戻る(1303)。画素の色と押印色との距離が閾値より近いと判定(1304)した場合は、この画素について文字フラグをセット(1305)して戻る(1306)。画素の色相が色むら対応用の色相許容範囲計算処理1005によって得られた許容範囲と判定(1306)した場合、画素と押印色の彩度差によって分類する(1307)して戻る(1311)。押印色との彩度差が色むら対応用の閾値より低い場合は文字フラグをセット(1308)する。押印色との彩度差が色むら対応用の閾値の一定範囲内の場合は文字候補フラグをセット(1309)する。彩度差が一定範囲より大きい場合は除外候補フラグをセット(1310)する。画素と押印色の距離が閾値以内または色相が閾値以内と判定(1312)した場合は、文字候補フラグをセット(1313)して戻る(1314)。これら判定以外の場合は、この画素について除去候補フラグをセット(1315)して終了する。   FIG. 13 is a determination flow of pixel classification for color unevenness when the stamp color is a chromatic color. For each pixel within the stamp radius, pixel classification is performed according to this determination flow. If it is determined that the distance between the pixel color and the stamp color is equal to or greater than the threshold value or the luminance of the pixel is higher than the luminance of the background color (1301), the background flag is set for this pixel (1302) and the process returns (1303). If it is determined that the distance between the pixel color and the stamp color is closer than the threshold (1304), the character flag is set (1305) for this pixel and the process returns (1306). If the hue of the pixel is determined to be the allowable range obtained by the hue allowable range calculation processing 1005 for dealing with uneven color (1306), the pixel is classified according to the chroma difference between the pixel and the stamp color (1307) and returned (1311). If the saturation difference from the stamp color is lower than the threshold for dealing with uneven color, a character flag is set (1308). If the saturation difference from the stamp color is within a certain range of the threshold for dealing with uneven color, a character candidate flag is set (1309). If the saturation difference is larger than a certain range, an exclusion candidate flag is set (1310). If it is determined that the distance between the pixel and the stamp color is within the threshold or the hue is within the threshold (1312), the character candidate flag is set (1313) and returned (1314). In cases other than these determinations, a removal candidate flag is set (1315) for this pixel, and the process ends.

図14は、2値化処理の概要図である。図14(a)は、日付行の全領域に対する2値化の例である。2値化の手法としては、固定閾値を用いる方法や、動的に閾値を変える手法など多くの手法が提案されている。代表的な手法としては、大津の2値化手法がある。この手法では、濃淡画像に対して、各画素が2つのクラス(白化画素と黒化画素)のどちらに属するかを判別するための閾値を、判別分析法を用いて算出する。閾値は、クラス内分散最小、かつクラス間分散最大となる値とする。傾き補正処理507によって補正された濃淡画像1401の日付領域1402を大津の2値化手法で2値化すると日付領域2値画像1403が生成される。しかし、色むらがある日付領域全体に対する大津の2値化では、輝度が高い画素は閾値によって白化画素となる場合があるという問題がある。この問題を解決するための方法として、本発明では、日付領域内の複数の部分領域で2値化し、複数の部分領域の2値画像の論理和によって日付領域全体の2値画像とする。部分領域にする理由は、その部分領域の文字成分の輝度が高い画素は、大津の2値化を用いた場合でも2値化閾値が高くなるため、黒画素化とすることができる。   FIG. 14 is a schematic diagram of binarization processing. FIG. 14A shows an example of binarization for the entire area of the date line. As a binarization method, many methods such as a method using a fixed threshold and a method of dynamically changing the threshold have been proposed. As a representative method, there is a binarization method of Otsu. In this method, a threshold for discriminating which of the two classes (whitened pixel or blackened pixel) each pixel belongs to a grayscale image is calculated using a discriminant analysis method. The threshold value is a value that minimizes the intra-class variance and maximizes the inter-class variance. When the date area 1402 of the grayscale image 1401 corrected by the inclination correction processing 507 is binarized by the binarization method of Otsu, a date area binary image 1403 is generated. However, in the binarization of Otsu for the entire date area with uneven color, there is a problem that a pixel with high luminance may become a whitened pixel depending on a threshold value. As a method for solving this problem, in the present invention, binarization is performed on a plurality of partial areas in the date area, and a binary image of the entire date area is obtained by logical sum of the binary images of the plurality of partial areas. The reason why the partial area is selected is that a pixel having a high luminance of the character component in the partial area has a high binarization threshold even when Otsu's binarization is used.

図14(b)は、本発明である複数の部分領域論理和を用いた2値化の例である。部分領域1404は日付領域の左端から指定の大きさをとった領域で、この部分領域のみを例えば大津の2値化を用いて2値化すると2値画像2値画像1405になる。部分領域の取り方はこの方法に限らない。また、2値化の方法も大津の2値化に限る必要はない。2値画像1406は日付領域全体の2値画像になるが、ここではまだ部分領域1404に対してのみ2値化しただけのため、2値画像1405と同じである。部分領域1407は部分領域1404の幅の1/2だけX座標にずらした領域である。部分領域1407を同様に2値化した結果、2値画像1408となる。日付領域全体の2値画像は、日付領域全体2値画像1406と2値画像1408の論理和(1409)である2値画像1410となる。同様に部分領域をまた1/2だけX座標にずらした部分領域1411に対して2値化する。日付領域の右端に到達するまで部分領域1412をずらすことを繰り返し、日付領域全体の2値画像1413を得る。   FIG. 14B is an example of binarization using a plurality of partial area ORs according to the present invention. The partial area 1404 is an area having a specified size from the left end of the date area. When only this partial area is binarized using, for example, binarization of Otsu, a binary image binary image 1405 is obtained. The method of taking the partial area is not limited to this method. Also, the binarization method need not be limited to Otsu's binarization. Although the binary image 1406 becomes a binary image of the entire date area, here, it is the same as the binary image 1405 because only the partial area 1404 is binarized. The partial area 1407 is an area shifted to the X coordinate by ½ of the width of the partial area 1404. As a result of binarizing the partial area 1407 in the same manner, a binary image 1408 is obtained. The binary image of the entire date area is a binary image 1410 that is a logical sum (1409) of the entire date area binary image 1406 and the binary image 1408. Similarly, the partial area is binarized with respect to the partial area 1411 shifted to the X coordinate by ½. The shifting of the partial area 1412 is repeated until the right end of the date area is reached, and a binary image 1413 of the entire date area is obtained.

以上のようにして得られた2値画像に対して、文字列認識処理405を行う。
<第二の実施形態>
次に、本発明を適用した押印日付読取り方法および押印日付読取り装置の第2の実施形態について説明する。本実施形態では、ドロップアウトの方法を、色むら対応用とプレ印刷・地紋除去用のいずれかに指定することができる。入力される画像の押印が、色むらが大きい場合は色むら対応用を、プレ印刷や地紋が多い場合はプレ印刷・地紋除去用のドロップアウトを用いることで、どちらの場合にでも対応できる。
Character string recognition processing 405 is performed on the binary image obtained as described above.
<Second Embodiment>
Next, a second embodiment of a stamp date reading method and a stamp date reader to which the present invention is applied will be described. In the present embodiment, the dropout method can be designated as one for dealing with uneven color and for pre-printing / background pattern removal. The input image can be dealt with in any case by using a color unevenness countermeasure when the color unevenness is large, or using a preprint / background pattern removal dropout when there are many preprints or ground patterns.

図15は、本発明である色むら対応のカラードロップアウトを適用した押印日付読取りの第2の実施形態の処理フローを示す別の図である。図4と同じ番号がついている処理は図4と同じである。この例では、カラードロップアウトの方式指定処理1501において、カラードロップアウトの方式を指定する。カラードロップアウトの方式の判定1502において、方式指定処理1501で指定した方式が、色むら対応用であれば、色むら対応用2値画像を出力するカラードロップアウト処理404を行う。その他の場合は、プレ印刷・地紋除去2値画像を出力するカラードロップアウト1503を行う。なお1501の処理はこの位置に限らない。プレ印刷・地紋除去2値画像を出力するカラードロップアウト1503について、図16で説明する。   FIG. 15 is another diagram showing a processing flow of the second embodiment of reading the stamp date to which the color dropout corresponding to the color unevenness according to the present invention is applied. The processes with the same numbers as in FIG. 4 are the same as those in FIG. In this example, the color dropout method is designated in the color dropout method designation processing 1501. In the color dropout method determination 1502, if the method specified in the method specifying process 1501 is for color unevenness, color dropout processing 404 for outputting a color unevenness corresponding binary image is performed. In other cases, color dropout 1503 for outputting a pre-printed / background pattern removed binary image is performed. Note that the processing of 1501 is not limited to this position. A color dropout 1503 for outputting a pre-printed / background pattern removed binary image will be described with reference to FIG.

図16は、本発明であるプレ印刷・地紋除去用2値画像を出力するカラードロップアウト処理のフローを示す図である。図5と同じ番号がついている処理は図5と同じである。このカラードロップアウトの処理は、処理対象領域からプレ印刷や地紋を正しく除去し、押印色のみを残した濃淡画像を生成して、これを2値化して2値画像を生成する。図5との違いは、色むら対応用濃淡画像生成処理506が、プレ印刷・地紋除去用濃淡画像生成処理1601に置き換わっている。プレ印刷・地紋除去用濃淡画像生成処理1601を図17で説明する。   FIG. 16 is a diagram showing a flow of a color dropout process for outputting a pre-print / background pattern removal binary image according to the present invention. The processes with the same numbers as in FIG. 5 are the same as those in FIG. In this color dropout process, pre-printing and a background pattern are correctly removed from the processing target area, a grayscale image in which only the stamp color is left is generated, and this is binarized to generate a binary image. The difference from FIG. 5 is that the color unevenness gray image generation process 506 is replaced with a pre-print / background pattern removal gray image generation process 1601. The pre-print / background pattern removal gray-scale image generation processing 1601 will be described with reference to FIG.

図17は、プレ印刷・地紋除去用濃淡画像生成処理のフローを示す図である。図10と同じ番号が付いている処理は、図10と同じである。押印の半径内の各画素についてプレ印刷・地紋除去用の画素分類(無彩色用)1701は、図18で説明する。プレ印刷・地紋除去用の色相許容閾値計算1702では、例えば、図11の許容範囲1105を用いる。プレ印刷・地紋除去用の許容範囲の計算の一例として、頻度分布1102は色相1101を中心とした正規分布と扱い、偏差βσ以内(例えばβ=1)となる色相までを許容範囲としてもよい。また計算量を削減するために、色相1101の頻度から頻度が1/m(例えばm=2)以下になるまでを許容範囲としてもよい。
プレ印刷・地紋除去用の画素分類(有彩色用) 1703は、図19で説明する。
FIG. 17 is a diagram showing the flow of the pre-print / background pattern removal gray image generation process. The processes with the same numbers as those in FIG. 10 are the same as those in FIG. The pixel classification (for achromatic color) 1701 for pre-printing / background pattern removal for each pixel within the radius of the stamp will be described with reference to FIG. In the hue allowable threshold calculation 1702 for pre-printing / background pattern removal, for example, the allowable range 1105 in FIG. 11 is used. As an example of calculation of the allowable range for pre-printing / background pattern removal, the frequency distribution 1102 may be treated as a normal distribution centered on the hue 1101 and the allowable range may be a hue within a deviation βσ (for example, β = 1). In order to reduce the calculation amount, the allowable range may be from the frequency of the hue 1101 until the frequency becomes 1 / m (for example, m = 2) or less.
The pixel classification (for chromatic color) 1703 for pre-printing / background pattern removal will be described with reference to FIG.

プレ印刷の罫線等が押印色と同系色である場合や罫線付近に偽色が発生して押印色と同系色になる場合に、画素分類1701または1703において文字フラグとして残る場合がある。これに対して罫線除去1704を行う。罫線除去1704を図20で説明する。なお、罫線除去1704は図10の1005と1006の間に入れてもよい。   When the pre-printed ruled line or the like has a color similar to the stamp color, or when a false color occurs near the ruled line and becomes a color similar to the stamp color, it may remain as a character flag in the pixel classification 1701 or 1703. In response to this, ruled line removal 1704 is performed. The ruled line removal 1704 will be described with reference to FIG. The ruled line removal 1704 may be inserted between 1005 and 1006 in FIG.

図18は、押印色が無彩色の場合のプレ印刷・地紋除去用の画素分類の判定フローである。図12と同じ番号については、図12と同じである。図12との違いは、判定(1207)が判定(1801)に代わっている。判定(1801)は画素の彩度が画素のスライド彩度閾値以下でかつ押印色との輝度差がプレ印刷・地紋除去用の輝度差の閾値以下でかつ輝度が押印色の輝度より低い場合に文字フラグセット(1205)して戻る(1206)。   FIG. 18 is a determination flow of pixel classification for pre-printing / background pattern removal when the stamp color is an achromatic color. The same numbers as those in FIG. 12 are the same as those in FIG. The difference from FIG. 12 is that the determination (1207) is replaced with the determination (1801). Judgment (1801) is when the pixel saturation is equal to or lower than the slide saturation threshold of the pixel, the luminance difference from the stamp color is equal to or lower than the luminance difference threshold for pre-printing / background pattern removal, and the luminance is lower than the luminance of the stamp color. The character flag set (1205) and the process returns (1206).

図19は、押印色が有彩色の場合のプレ印刷・地紋除去用の画素分類の判定フローである。図13と同じ番号については、図13と同じである。押印色との距離が閾値より近いと判定(1901)した場合は、文字フラグをセット(1902)して戻る(1903)。押印色との色相差が閾値より近いかつ輝度が押印色の輝度より低いと判定(1904)した場合は、文字フラグをセット(1905)して戻る(1906)。色相がプレ印刷・地紋除去用の色相許容範囲内であると判定(1907)した場合、彩度差による判定(1908)を行う。判定(1908)において、彩度差がプレ印刷・地紋除去用の閾値より低い場合は文字フラグをセット(1909)する。彩度差がプレ印刷・地紋除去用の一定の閾値範囲内の場合は文字候補フラグをセット(1910)する。それ以外は除去候補フラグをセット(1911)して戻る(1912)。   FIG. 19 is a determination flow of pixel classification for pre-printing / background pattern removal when the seal color is a chromatic color. The same numbers as those in FIG. 13 are the same as those in FIG. If it is determined that the distance from the stamp color is closer than the threshold (1901), the character flag is set (1902) and returned (1903). If it is determined that the hue difference from the stamp color is closer than the threshold and the luminance is lower than the luminance of the stamp color (1904), the character flag is set (1905) and returned (1906). When it is determined that the hue is within the allowable hue range for pre-printing / background pattern removal (1907), a determination based on the saturation difference (1908) is performed. In the determination (1908), if the saturation difference is lower than the pre-print / background pattern removal threshold, a character flag is set (1909). If the saturation difference is within a predetermined threshold range for pre-printing / background pattern removal, a character candidate flag is set (1910). Otherwise, the removal candidate flag is set (1911) and the process returns (1912).

図20は、罫線除去の概要を示す。上記の画素判定によって、プレ印刷の罫線等が押印色と同系色である場合や罫線付近に偽色が発生して押印色と同系色になる場合に、これらが文字フラグとしてセットされ、ドロップアウトされない場合がある。この場合、2値化によっても罫線成分が残ってしまう可能性があり、罫線が混入した日付行となる。これを解決するために、例えば3×3画素のフィルタリング処理を行い、細い縦線および横線を罫線成分を除去する。   FIG. 20 shows an outline of ruled line removal. If the pre-printed ruled line is similar to the stamp color or a false color is generated near the ruled line due to the above pixel determination, these are set as a character flag and dropped out. May not be. In this case, there is a possibility that ruled line components may remain even after binarization, and the date line is mixed with ruled lines. In order to solve this, for example, filtering processing of 3 × 3 pixels is performed, and ruled line components are removed from thin vertical lines and horizontal lines.

図20(a)は入力画像であり、日付印2001は罫線2002の上に押印されているとする。罫線2002が日付印の押印色と同系色である場合に、濃淡画像を生成した結果が図20(b)のようになり、図20(c)の2値化および日付行抽出結果は罫線ノイズ2003が残る。罫線除去を行う方法の一例として、横・縦罫線検出フィルタリング処理2004を行う。画素分類1701または1703において分類された画素のフラグが文字フラグの場合に、この画素を中心とした8近傍の3×3画素を生成する。各画素のフラグにおいて、文字フラグ2005と、それ以外のフラグ2006とした3×3画素が、横罫線2007か縦罫線2008のフィルタと一致する画素の座標のフラグを、文字フラグから除去候補フラグもしくは文字候補フラグに変換する。   FIG. 20A shows an input image, and the date stamp 2001 is stamped on the ruled line 2002. When the ruled line 2002 is a color similar to the stamp color of the date stamp, the result of generating a gray image is as shown in FIG. 20B, and the binarization and date line extraction result of FIG. 2003 remains. As an example of a method for removing ruled lines, horizontal / vertical ruled line detection filtering processing 2004 is performed. If the flag of the pixel classified in the pixel classification 1701 or 1703 is a character flag, 3 × 3 pixels in the vicinity of 8 centering on this pixel are generated. In the flag of each pixel, the character flag 2005 and the flag of the pixel coordinates corresponding to the filter of the horizontal ruled line 2007 or the vertical ruled line 2008 of the 3 × 3 pixel set as the other flag 2006 are removed from the character flag or Convert to character candidate flag.

全ての画素において上記の横・縦罫線検出フィルタリング処理を行って濃淡画像を生成した結果が図20(d)のようになり、図20(e)の2値化および日付行抽出結果は罫線が除去された日付文字行となる。
<第三の実施形態>
次に、本発明を適用した押印日付読取り方法および押印日付読取り装置の第3の実施形態について説明する。本実施形態では、ドロップアウトにおいて、色むら対応用とプレ印刷・地紋除去用の両方のドロップアウト画像を生成することで、色むらが大きい場合は色むら対応用の2値画像で、プレ印刷や地紋が多い場合はプレ印刷・地紋除去用の2値画像で、どちらかが正しい日付文字行を抽出できるため、入力画像に依存しないで、日付文字列読取りができる。
The result of performing the above horizontal / vertical ruled line detection filtering processing on all the pixels to generate a grayscale image is as shown in FIG. 20D, and the binarization and date line extraction result of FIG. The removed date character line.
<Third embodiment>
Next, a third embodiment of a stamp date reading method and a stamp date reader to which the present invention is applied will be described. In this embodiment, by generating dropout images for both color unevenness and pre-printing / background pattern removal in dropout, when color unevenness is large, a binary image for color unevenness is pre-printed. If there are many background patterns, a date image string can be read without depending on the input image because a correct date character line can be extracted from one of the binary images for pre-printing / background pattern removal.

図21は、本発明である色むら対応のカラードロップアウトを適用した押印日付読取りの第3の実施形態の処理フローを示す別の図である。図4と同じ番号がついている処理は図4と同じである。色むら対応用2値画像およびプレ印刷・地紋除去用2値画像の2つの2値画像を出力するカラードロップアウト処理2101において、色むら対応用2値画像およびプレ印刷・地紋除去用2値画像の2つの2値画像を出力する。色むら対応用2値画像およびプレ印刷・地紋除去用2値画像の2つの2値画像を出力するカラードロップアウト処理2101については図22で説明する。1つ目の2値画像に対する日付文字列認識処理2102で、1つ目の2値画像に対して日付文字列認識を行う。2つ目の2値画像に対する日付文字列認識処理2102で、2つ目の2値画像に対して日付文字列認識を行う。2つの日付文字列認識結果においてスコアが高い認識結果を2104にてセットする。色むら対応用の2値画像と、プレ印刷・地紋除去用の2値画像の、どちらを1つ目とするかは特に決まりはない。   FIG. 21 is another diagram showing a processing flow of the third embodiment of reading a stamp date to which the color dropout corresponding to uneven color is applied according to the present invention. The processes with the same numbers as in FIG. 4 are the same as those in FIG. In a color dropout process 2101 for outputting two binary images for dealing with color unevenness and a binary image for preprinting / background pattern removal, a binary image for dealing with color unevenness and a binary image for preprinting / background pattern removal The two binary images are output. A color dropout process 2101 for outputting two binary images, one for dealing with uneven color and the other for pre-printing / background pattern removal, will be described with reference to FIG. In a date character string recognition process 2102 for the first binary image, date character string recognition is performed for the first binary image. In a date character string recognition process 2102 for the second binary image, date character string recognition is performed for the second binary image. A recognition result having a high score in the two date character string recognition results is set in 2104. There is no particular rule as to which of the binary image for color unevenness and the binary image for pre-printing / background pattern removal is the first.

図22は、むら対応用2値画像およびプレ印刷・地紋除去用2値画像の2つの2値画像を出力するカラードロップアウトの処理フローを示す図である。図4および図16と同じ番号がついている処理は図4および図16と同じである。ここでは、色むら対応用とプレ印刷・地紋除去用で共通の処理501〜505を行った後に、まず色むら対応用の2値画像を生成する(506〜508)。次にプレ印刷・地紋除去用の2値画像を生成する(1601、507〜508)この2つの2値画像を出力する。
<第四の実施形態>
次に、本発明を適用した押印日付読取り方法および押印日付読取り装置の第4の実施形態について説明する。本実施形態では、ドロップアウトにおいて、色むら対応用とプレ印刷・地紋除去用の両方のドロップアウト画像を生成することで、色むらが大きい場合は色むら対応用の2値画像で、プレ印刷や地紋が多い場合はプレ印刷・地紋除去用の2値画像で、どちらかが正しい日付文字行を抽出できるため、入力画像に依存しないで、日付文字列読取りができる。1つ目の2値画像に対する日付文字列読取が成功すれば、その時点で注目する日付印の読取を終わらせることで、第3の実施形態に比べて処理時間の削減ができる。
FIG. 22 is a diagram showing a color drop-out processing flow for outputting two binary images, a non-uniformity binary image and a preprint / background pattern removal binary image. The processes with the same numbers as those in FIGS. 4 and 16 are the same as those in FIGS. Here, after performing common processing 501 to 505 for color unevenness correspondence and pre-printing / background pattern removal, first, binary images for color unevenness correspondence are generated (506 to 508). Next, binary images for pre-printing / background pattern removal are generated (1601, 507 to 508), and these two binary images are output.
<Fourth embodiment>
Next, a fourth embodiment of a stamp date reading method and a stamp date reader to which the present invention is applied will be described. In this embodiment, by generating dropout images for both color unevenness and pre-printing / background pattern removal in dropout, when color unevenness is large, a binary image for color unevenness is pre-printed. If there are many background patterns, a date image string can be read without depending on the input image because a correct date character line can be extracted from one of the binary images for pre-printing / background pattern removal. If the date character string reading with respect to the first binary image is successful, the reading of the date stamp of interest at that time is terminated, so that the processing time can be reduced as compared with the third embodiment.

図23は、本発明である色むら対応のカラードロップアウトを適用した押印日付読取りの第4の実施形態の処理フローを示す別の図である。図4および図21と同じ番号がついている処理は図4および図21と同じである。図21との違いは、1つ目の2値画像に対する日付文字列認識処理2102の後に、1つ目の2値画像に対する日付文字列認識処理2102の結果において、認識結果のスコアが閾値以上であると判定(2301)した場合に、認識結果をセット(2302)して、次の日付印へ処理を戻す(2303)。
<第五の実施形態>
次に、本発明を適用した押印日付読取り方法および押印日付読取り装置の第5の実施形態について説明する。本実施形態では、ドロップアウトを、色むら対応用とプレ印刷・地紋除去用で個別に行い、それぞれのドロップアウト後に日付文字列認識を行う方法である。
FIG. 23 is another diagram showing a processing flow of the fourth embodiment of reading a stamp date to which the color dropout corresponding to uneven color according to the present invention is applied. The processes with the same numbers as those in FIGS. 4 and 21 are the same as those in FIGS. The difference from FIG. 21 is that the result of the date character string recognition processing 2102 for the first binary image after the date character string recognition processing 2102 for the first binary image has a recognition result score that is greater than or equal to the threshold value. If it is determined that there is (2301), the recognition result is set (2302), and the process is returned to the next date stamp (2303).
<Fifth embodiment>
Next, a fifth embodiment of a stamp date reading method and a stamp date reader to which the present invention is applied will be described. In the present embodiment, dropout is performed separately for color unevenness handling and preprinting / background pattern removal, and date character string recognition is performed after each dropout.

図24は、本発明である色むら対応のカラードロップアウトを適用した押印日付読取りの第5の実施形態の処理フローを示す別の図である。図4、図15、図21と同じ番号がついている処理は図4、図15、図21と同じである。ここでは、色むら対応用の2値画像を生成するカラードロップアウト処理404を行い、これを1つ目の2値画像として日付文字列認識処理2102を行い、次に、プレ印刷・地紋除去用2値画像を出力するカラードロップアウト処理1503を行い、これを2つ目の2値画像として日付文字列認識処理2103を行い、スコアが高い認識結果をセット(2104)する。なお、図24の中の404と1503は入れ替えてもよい。
<第六の実施形態>
次に、本発明を適用した押印日付読取り方法および押印日付読取り装置の第6の実施形態について説明する。本実施形態では、ドロップアウトを、色むら対応用とプレ印刷・地紋除去用で個別に行い、それぞれのドロップアウト後に日付文字列読取りを行う。一つ目のドロップアウトによる日付文字列認識の結果が得られれば、その時点で注目する日付印の読取を終わらせることで、第5の実施形態に比べて、カラードロップの処理時間と日付文字列認識の処理時間が削減できる。
FIG. 24 is another diagram showing a processing flow of the fifth embodiment of reading the stamp date to which the color dropout corresponding to uneven color is applied according to the present invention. The processes with the same numbers as those in FIGS. 4, 15, and 21 are the same as those in FIGS. Here, a color dropout process 404 for generating a binary image for color unevenness is performed, and a date character string recognition process 2102 is performed using this as a first binary image, and then for pre-printing / background pattern removal. A color dropout process 1503 for outputting a binary image is performed, a date character string recognition process 2103 is performed using this as a second binary image, and a recognition result having a high score is set (2104). Note that 404 and 1503 in FIG. 24 may be interchanged.
<Sixth embodiment>
Next, a sixth embodiment of a stamp date reading method and a stamp date reader to which the present invention is applied will be described. In this embodiment, dropout is performed separately for color unevenness handling and pre-printing / background pattern removal, and the date character string is read after each dropout. When the result of date string recognition by the first dropout is obtained, the reading of the date stamp of interest at that time is terminated, so that the color drop processing time and date characters are compared with the fifth embodiment. Processing time for column recognition can be reduced.

図25は、本発明である色むら対応のカラードロップアウトを適用した押印日付読取りの第6の実施形態の処理フローを示す別の図である。図4、図15、図21、図23と同じ番号がついている処理は図4、図15、図21、図23と同じである。図24との違いは、1つ目の2値画像に対する日付文字列認識処理2102の後に、1つ目の2値画像に対する日付文字列認識処理2102の結果において、認識結果のスコアが閾値以上であると判定(2301)した場合に、認識結果をセット(2302)して、次の日付印へ処理を戻す(2303)。
<第七の実施形態>
次に、本発明を適用した押印日付読取り方法および押印日付読取り装置の第7の実施形態について説明する。本実施形態では、カラードロップアウトを様々な閾値で行い、それに基づいた複数の2値画像を生成し、日付文字列認識することにより、正しく認識できる2値画像があることを期待できる。
FIG. 25 is another diagram showing a processing flow of the sixth embodiment of reading the stamp date to which the color dropout corresponding to uneven color is applied according to the present invention. The processes with the same numbers as those in FIGS. 4, 15, 21, and 23 are the same as those in FIGS. 4, 15, 21, and 23. The difference from FIG. 24 is that the result of the date character string recognition processing 2102 for the first binary image after the date character string recognition processing 2102 for the first binary image has a recognition result score that is greater than or equal to the threshold value. If it is determined that there is (2301), the recognition result is set (2302), and the process is returned to the next date stamp (2303).
<Seventh embodiment>
Next, a seventh embodiment of a stamp date reading method and a stamp date reader to which the present invention is applied will be described. In this embodiment, it is expected that there is a binary image that can be correctly recognized by performing color dropout with various threshold values, generating a plurality of binary images based on the threshold, and recognizing the date character string.

図26は、複数の2値画像を出力するカラードロップアウトを適用した押印日付読取りの第7の実施形態の処理フローを示す別の図である。図4、図23と同じ番号がついている処理は図4、図23と同じである。複数の2値画像を出力するカラードロップアウト処理2601は図5〜図19にある様々な閾値を段階的に変動させた2値画像を生成し、2値画像の数だけ(2602)、日付文字列認識処理405を行い、認識結果のスコアが以上と判定(2301)すれば、認識結果をセット(2302)して次の日付印へ処理を戻す(2303)。
<第八の実施形態>
次に、本発明を適用した押印日付読取り方法および押印日付読取り装置の第8の実施形態について説明する。本実施形態では、カラードロップアウトを様々な閾値で行い、それに基づいた複数の2値画像を生成し、全ての2値画像に対して日付文字列認識し、最も精度が高い結果を得ることができる。
FIG. 26 is another diagram showing a processing flow of the seventh embodiment of reading a stamp date to which a color dropout for outputting a plurality of binary images is applied. The processes with the same numbers as those in FIGS. 4 and 23 are the same as those in FIGS. A color drop-out process 2601 for outputting a plurality of binary images generates binary images in which various threshold values shown in FIGS. 5 to 19 are changed stepwise, and the number of binary images (2602) includes date characters. Column recognition processing 405 is performed, and if the recognition result score is determined to be above (2301), the recognition result is set (2302) and the processing returns to the next date stamp (2303).
<Eighth embodiment>
Next, an eighth embodiment of a stamp date reading method and stamp date reader to which the present invention is applied will be described. In this embodiment, color dropout is performed with various threshold values, a plurality of binary images are generated based on the threshold values, date character strings are recognized for all the binary images, and a result with the highest accuracy can be obtained. it can.

図27は、複数の2値画像を出力するカラードロップアウトを適用した押印日付読取りの第8の実施形態の処理フローを示す別の図である。図4、図26と同じ番号がついている処理は図4、図26と同じである。図26との違いは、2602にて全ての2値画像に対して日付文字列認識405を行った後で、全ての認識結果の中でスコアが最も高い認識結果をセット(2701)する。また、2701の代わりに、全ての認識結果の中で認識した日付文字列の多数決を取って、最も多い認識結果をセットしてもよい。   FIG. 27 is another diagram showing a processing flow of the eighth embodiment of reading a stamp date to which a color dropout for outputting a plurality of binary images is applied. The processes with the same numbers as those in FIGS. 4 and 26 are the same as those in FIGS. The difference from FIG. 26 is that, after date character string recognition 405 is performed on all binary images in 2602, the recognition result having the highest score among all the recognition results is set (2701). Further, instead of 2701, the majority of date character strings recognized among all the recognition results may be taken to set the most recognition results.

次に、本発明を適用した押印日付読取り方法および押印日付読取り装置による認識結果の確認・修正を行う表示画面について説明する。なお、表示する内容は以下の説明によって限定されるものではない。   Next, a display screen for confirming and correcting the recognition result by the stamp date reading method and the stamp date reader to which the present invention is applied will be described. The contents to be displayed are not limited by the following description.

図28は、図21、図23、図24、図25の日付印読取処理の結果を確認および修正する画面の表示例である。表示装置50は画面2801を表示する。日付印読取処理の結果・確認を2802で表示するウィンドウである。入力画像表示ウィンドウ2803はカラー画像2804を表示する。日付印検知により検知した日付印2805を含む日付印読取処理の処理対象領域2806を表示する。帳票IDを2807にて表示する。現在確認・修正を行っているカラー画像が全処理カラー画像中の何番目かを示す番号を2808にて表示する。2809は本発明である色むら対応用とプレ印刷・地紋除去用それぞれのカラードロップアウト処理内の濃淡画像生成結果を表示する。2810に2値化および日付行抽出を行った結果の2値画像を色むら対応用とプレ印刷・地紋除去用のそれぞれを表示する。2812に日付読取りの結果の日付文字列を表示する。2813は日付読取り結果の修正を行うエディタである。2814および2815は同じカラー画像中に別の日付印があれば、別の日付印の認識結果等の表示に切り替えるボタンである。2816は別のカラー画像に対する日付印の認識結果等の表示に切り替えるスクロールバーである。   FIG. 28 is a display example of a screen for confirming and correcting the result of the date stamp reading process of FIGS. 21, 23, 24, and 25. The display device 50 displays a screen 2801. This is a window for displaying the result / confirmation of the date stamp reading process in 2802. The input image display window 2803 displays a color image 2804. A processing target area 2806 of the date stamp reading process including the date stamp 2805 detected by the date stamp detection is displayed. The form ID is displayed in 2807. A number 2808 is displayed to indicate the number of the color image currently being confirmed / corrected among all the processed color images. 2809 displays grayscale image generation results in the color dropout processing for color unevenness and pre-printing / background pattern removal according to the present invention. A binary image obtained as a result of binarization and date row extraction is displayed in 2810 for color unevenness correspondence and pre-printing / background pattern removal. A date character string as a result of the date reading is displayed in 2812. Reference numeral 2813 denotes an editor for correcting the date reading result. Reference numerals 2814 and 2815 denote buttons for switching to display of the recognition result of another date stamp if there is another date stamp in the same color image. Reference numeral 2816 denotes a scroll bar for switching to display of a date stamp recognition result for another color image.

図29は、図4または図15の日付印読取処理の結果を確認および修正する画面の別の表示例である。この表示は、日付印読取結果が不読等の結果の場合に、カラードロップアウト等の様々な閾値を変動した際に読取結果が得られるかを確認する。または、カラードロップアウト等の様々な閾値を自動で変動して、読取結果が得られるまで調整することで、日付印読取結果が不読等の結果の場合の修正も自動で行える。表示装置50は画面2901を表示する。日付印読取処理の結果・確認を2902で表示するウィンドウである。入力画像表示ウィンドウ2903はカラー画像2904を表示する。日付印検知により検知した日付印2905を含む日付印読取処理の処理対象領域2906を表示する。帳票IDを2907にて表示する。現在確認・修正を行っているカラー画像が全処理カラー画像中の何番目かを示す番号を2908にて表示する。2909は処理対象領域2906をカラー画像から抽出した日付印領域画像である。2910は図4または図15の処理においてカラードロップアウト処理内の濃淡画像生成結果と、2値化および日付行抽出を行った結果の2値画像と、日付読取りの結果の日付文字列を表示する。2911は2912および2913のタイトルである。2912は2910の認識結果が不読等の場合に、カラードロップアウトの処理における様々な閾値を手動または自動で変更し、その閾値を用いた図4または図5の処理を行い、日付読取り結果が得られるかを調整する。2913は2912の閾値調整の調整変更による図4または図5の処理結果を表示する。2914および2915は同じカラー画像中に別の日付印があれば、別の日付印の認識結果等の表示に切り替えるボタンである。2916は別のカラー画像に対する日付印の認識結果等の表示に切り替えるスクロールバーである。   FIG. 29 is another display example of a screen for confirming and correcting the result of the date stamp reading process of FIG. 4 or FIG. This display confirms whether the reading result is obtained when various threshold values such as color dropout are changed when the date stamp reading result is a non-reading result. Alternatively, by automatically varying various threshold values such as color dropout and adjusting until a reading result is obtained, correction when the date stamp reading result is a non-reading result can be automatically performed. The display device 50 displays a screen 2901. This is a window for displaying 2902 the result / confirmation of the date stamp reading process. An input image display window 2903 displays a color image 2904. A processing target area 2906 of the date stamp reading process including the date stamp 2905 detected by the date stamp detection is displayed. The form ID is displayed in 2907. A number 2908 is displayed to indicate the number of the color image currently being confirmed / corrected in all the processed color images. Reference numeral 2909 denotes a date stamp area image obtained by extracting the processing target area 2906 from the color image. 2910 displays a grayscale image generation result in the color dropout processing in the processing of FIG. 4 or FIG. 15, a binary image resulting from binarization and date row extraction, and a date character string as a result of date reading. . 2911 is a title of 2912 and 2913. 2912 changes various threshold values in the color dropout processing manually or automatically when the recognition result of 2910 is unread, etc., and performs the processing of FIG. 4 or FIG. Adjust what you get. 2913 displays the processing result of FIG. 4 or FIG. 5 by the adjustment change of the threshold adjustment of 2912. FIG. Reference numerals 2914 and 2915 are buttons for switching to the display of the recognition result of another date stamp if there is another date stamp in the same color image. Reference numeral 2916 denotes a scroll bar for switching to display of a date stamp recognition result for another color image.

図30は、図26または図27の日付印読取処理の結果を確認および修正する画面の別の表示例である。表示装置50は画面3001を表示する。日付印読取処理の結果・確認を3002で表示するウィンドウである。入力画像表示ウィンドウ3003はカラー画像2904を表示する。日付印検知により検知した日付印3005を含む日付印読取処理の処理対象領域3006を表示する。帳票IDを3007にて表示する。現在確認・修正を行っているカラー画像が全処理カラー画像中の何番目かを示す番号を3008にて表示する。3009は、図26または図27のカラードロップアウトの処理結果で得られる複数の、カラードロップアウト処理内の濃淡画像生成結果または2値化および日付行抽出を行った結果の2値画像またはその両方を、全てないし一部を表示する。3010は、日付読取り結果でアクセプトした画像に対して強調枠を表示する。3011は入力装置等で選択した画像に対するカラードロップアウト等のパラメータの値を表示するウィンドウである。3012は日付読取り結果の修正を行うエディタである。3013および3014は同じカラー画像中に別の日付印があれば、別の日付印の認識結果等の表示に切り替えるボタンである。3015は別のカラー画像に対する日付印の認識結果等の表示に切り替えるスクロールバーである。   FIG. 30 is another display example of a screen for confirming and correcting the result of the date stamp reading process of FIG. 26 or 27. The display device 50 displays a screen 3001. This is a window for displaying the result / confirmation of the date stamp reading process at 3002. The input image display window 3003 displays a color image 2904. The processing target area 3006 of the date stamp reading process including the date stamp 3005 detected by the date stamp detection is displayed. The form ID is displayed at 3007. A number indicating the number of the color image currently being confirmed / corrected in all the processed color images is displayed at 3008. Reference numeral 3009 denotes a plurality of grayscale image generation results in the color dropout processing obtained from the color dropout processing results of FIG. 26 or FIG. 27, or binary images resulting from binarization and date row extraction, or both Are displayed in whole or in part. Reference numeral 3010 displays a highlight frame for an image accepted as a result of date reading. A window 3011 displays parameter values such as color dropout for an image selected by an input device or the like. Reference numeral 3012 denotes an editor for correcting the date reading result. Reference numerals 3013 and 3014 denote buttons for switching to display of a recognition result or the like of another date stamp if another date stamp exists in the same color image. Reference numeral 3015 denotes a scroll bar for switching to display of a date stamp recognition result for another color image.

続いて、前述した各実施の形態によって得られるネットワーク制御システムの特徴的な構成について、以下に列記する。   Subsequently, characteristic configurations of the network control system obtained by the above-described embodiments will be listed below.

(1)日付印が押印されたカラー画像からの押印日付読取り方法であって、
上記カラー画像を入力するステップと、
上記カラー画像から日付印を検知するステップと、
ドロップアウト方法を指定するステップと、
上記指定したドロップアウト方法が色むら対応用であるかプレ印刷・地紋除去用であるか判定するステップと、
上記指定したドロップアウト方法が色むら対応用であれば、上記検知した日付印に対して日付文字行2値画像を出力する請求項1の画像処理方法と、
上記指定したドロップアウト方法が色むら対応用以外であれば、上記検知した日付印に対して日付文字行2値画像を出力する請求項2の画像処理方法と
2値画像に対して日付文字列を認識するステップと、
上記認識結果をセットするステップと、
結果を出力するステップを有する第2の押印日付読取り方法。
(1) A method for reading a stamp date from a color image stamped with a date stamp,
Inputting the color image;
Detecting a date stamp from the color image;
A step to specify the dropout method;
Determining whether the specified dropout method is for color unevenness or pre-printing / background pattern removal;
The image processing method according to claim 1, wherein if the specified dropout method is for color unevenness, a date character line binary image is output for the detected date stamp;
3. The image processing method according to claim 2, wherein a date character line binary image is output for the detected date stamp if the specified dropout method is other than for color unevenness, and a date character string for the binary image. The step of recognizing
Setting the recognition result;
A second stamp date reading method comprising the step of outputting a result.

(2)処理対象画像から文字成分のみ残すドロップアウトの画像処理方法であって、
上記処理対象画像を入力するステップと、
上記処理対象画像の画素を色クラスタリングするステップと、上記色クラスタリングに基づいて背景色を選択するステップと、
上記処理対象画像の画素から押印色を選択するステップと、
上記処理対象画像の画素を色空間変換するステップと、
上記処理対象画像の画素から色むら対応用の濃淡画像生成するステップと、
上記色むら対応用の濃淡画像の傾きを補正するステップと、
上記色むら対応用の濃淡画像を傾き補正した濃淡画像を2値化するステップと、
上記処理対象画像の画素からプレ印刷・地紋除去用の濃淡画像生成するステップと、
上記プレ印刷・地紋除去用の濃淡画像を傾き補正するステップと、
上記プレ印刷・地紋除去用の濃淡画像を傾き補正した濃淡画像を2値化するステップを有する第3の画像処理方法。
(2) A dropout image processing method that leaves only character components from the processing target image,
Inputting the processing target image;
Color clustering the pixels of the image to be processed, selecting a background color based on the color clustering,
Selecting a stamp color from the pixels of the processing target image;
Color space conversion of pixels of the processing target image;
Generating a gray image corresponding to color unevenness from pixels of the processing target image;
Correcting the gradient of the grayscale image for color unevenness,
Binarizing a grayscale image obtained by correcting inclination of the grayscale image for color unevenness;
Generating a gray image for pre-printing / background pattern removal from pixels of the processing target image;
Tilt correcting the gray image for pre-printing / background pattern removal;
A third image processing method comprising a step of binarizing the grayscale image obtained by correcting the inclination of the grayscale image for pre-printing / background pattern removal.

(3)日付印が押印されたカラー画像からの押印日付読取り方法であって、
上記カラー画像を入力するステップと、
上記カラー画像から日付印を検知するステップと、
上記検知した日付印に対して、色むら対応用2値画像およびプレ印刷除去用2値画像の2つの2値画像を出力する請求項16の画像処理方法と、
1つ目の2値画像に対して日付文字列を認識するステップと、
2つ目の2値画像に対して日付文字列を認識するステップと、
上記2つの認識結果のスコアが高い方の認識結果をセットするステップと、
結果を出力するステップを有する第3の押印日付読取り方法。
(3) A method of reading a stamp date from a color image on which a date stamp is stamped,
Inputting the color image;
Detecting a date stamp from the color image;
The image processing method according to claim 16, wherein two binary images, a binary image for color unevenness and a binary image for preprint removal, are output for the detected date stamp;
Recognizing a date string for the first binary image;
Recognizing a date character string for the second binary image;
Setting a recognition result having a higher score of the above two recognition results;
A third imprint date reading method comprising a step of outputting a result.

(4)日付印が押印されたカラー画像からの押印日付読取り方法であって、
上記カラー画像を入力するステップと、
上記カラー画像から日付印を検知するステップと、
上記検知した日付印に対して、色むら対応用2値画像およびプレ印刷・地紋除去用2値画像の2つの2値画像を出力する請求項16の画像処理方法と、
上記1つ目の2値画像に対して日付文字列を認識するステップと、
上記1つ目の2値画像に対する日付文字列結果のスコアを判定するステップと、
上記判定でスコアが閾値以上の場合に認識結果をセットするステップと、
上記判定でスコアが閾値以上の場合に認識結果をセットした後に次の日付印へ処理を移動するステップと、
2つ目の2値画像に対して日付文字列を認識するステップと、
上記2つの認識結果のスコアが高い方の認識結果をセットするステップと、
結果を出力するステップを有する第4の押印日付読取り方法。
(4) A method for reading a stamp date from a color image on which a date stamp is stamped,
Inputting the color image;
Detecting a date stamp from the color image;
The image processing method according to claim 16, wherein two binary images, a binary image for color unevenness and a binary image for pre-printing / background pattern removal, are output for the detected date stamp;
Recognizing a date character string for the first binary image;
Determining a score of a date string result for the first binary image;
A step of setting a recognition result when the score is equal to or greater than a threshold in the above determination;
A step of moving the processing to the next date stamp after setting the recognition result when the score is equal to or greater than a threshold in the above determination;
Recognizing a date character string for the second binary image;
Setting a recognition result having a higher score of the above two recognition results;
A fourth stamp date reading method comprising a step of outputting a result.

(5)日付印が押印されたカラー画像からの押印日付読取り方法であって、
上記カラー画像を入力するステップと、
上記カラー画像から日付印を検知するステップと、
上記検知した日付印に対して、色むら対応用2値画像を出力する請求項1の画像処理方法と、
上記出力した2値画像に対して、1つ目の2値画像に対して日付文字列を認識するステップと
上記検知した日付印に対して、プレ印刷・地紋除去用2値画像を出力する請求項10の画像処理方法と、
上記出力した2値画像に対して、2つ目の2値画像に対して日付文字列を認識するステップと
上記2つの認識結果のスコアが高い方の認識結果をセットするステップと、
結果を出力するステップを有する第5の押印日付読取り方法。
(5) A method for reading a stamp date from a color image on which a date stamp is stamped,
Inputting the color image;
Detecting a date stamp from the color image;
2. An image processing method according to claim 1, wherein a binary image for color unevenness is output for the detected date stamp;
A step of recognizing a date character string for the first binary image and outputting a binary image for preprint / background pattern removal for the detected date stamp for the output binary image Item 10 image processing method;
A step of recognizing a date character string with respect to a second binary image with respect to the output binary image, and a step of setting a recognition result having a higher score of the two recognition results;
A fifth stamp date reading method comprising a step of outputting a result.

(6)前記(5)記載のドロップアウトの順番は、色むら対応用とプレ印刷・地紋除去用は順不同であることを特徴とする請求項19の押印日付読取り方法。   (6) The stamp date reading method according to claim 19, characterized in that the order of dropout described in (5) is not the same for color unevenness handling and for pre-printing / background pattern removal.

(7)日付印が押印されたカラー画像からの押印日付読取り方法であって、
上記カラー画像を入力するステップと、
上記カラー画像から日付印を検知するステップと、
上記検知した日付印に対して、色むら対応用2値画像を出力する請求項1の画像処理方法と、
上記出力した2値画像に対して、1つ目の2値画像に対して日付文字列を認識するステップと
上記1つ目の2値画像に対する日付文字列結果のスコアを判定するステップと、
上記判定でスコアが閾値以上の場合に認識結果をセットするステップと、
上記判定でスコアが閾値以上の場合に認識結果をセットした後に次の日付印へ処理を移動するステップと、
上記検知した日付印に対して、プレ印刷・地紋除去用2値画像を出力する請求項10の画像処理方法と、
上記出力した2値画像に対して、2つ目の2値画像に対して日付文字列を認識するステップと
上記2つの認識結果のスコアが高い方の認識結果をセットするステップと、
結果を出力するステップを有する第6の押印日付読取り方法。
(7) A method of reading a stamp date from a color image on which a date stamp is stamped,
Inputting the color image;
Detecting a date stamp from the color image;
2. An image processing method according to claim 1, wherein a binary image for color unevenness is output for the detected date stamp;
Recognizing a date character string for the first binary image and determining a date character string result score for the first binary image for the output binary image;
A step of setting a recognition result when the score is equal to or greater than a threshold in the above determination;
A step of moving the processing to the next date stamp after setting the recognition result when the score is equal to or greater than a threshold in the above determination;
The image processing method according to claim 10, wherein a binary image for pre-printing / background pattern removal is output for the detected date stamp;
A step of recognizing a date character string with respect to a second binary image with respect to the output binary image, and a step of setting a recognition result having a higher score of the two recognition results;
A sixth imprint date reading method comprising a step of outputting a result.

(7)前記(6)記載のドロップアウトの順番は、色むら対応用とプレ印刷・地紋除去用は順不同であることを特徴とする請求項21の押印日付読取り方法。   (7) The stamp date reading method according to claim 21, characterized in that the order of dropouts described in (6) is not the same for color unevenness correspondence and preprint / background pattern removal.

(8)日付印が押印されたカラー画像からの押印日付読取り方法であって、
上記カラー画像を入力するステップと、
上記カラー画像から日付印を検知するステップと、
上記検知した日付印に対して、複数の2値画像を出力するカラードロップアウトを行うステップと、
上記出力した2値画像に対して、日付文字列を認識するステップと
上記2値画像に対する日付文字列の認識結果のスコアを判定するステップと、
上記判定でスコアが閾値以上の場合に認識結果をセットするステップと、
上記判定でスコアが閾値以上の場合に認識結果をセットした後に次の日付印へ処理を移動するステップと、
結果を出力するステップを有する第7の押印日付読取り方法。
(8) A method for reading a stamp date from a color image on which a date stamp is stamped,
Inputting the color image;
Detecting a date stamp from the color image;
Performing a color dropout for outputting a plurality of binary images to the detected date stamp;
Recognizing a date character string for the output binary image and determining a score of a date character string recognition result for the binary image;
A step of setting a recognition result when the score is equal to or greater than a threshold in the above determination;
A step of moving the processing to the next date stamp after setting the recognition result when the score is equal to or greater than a threshold in the above determination;
A seventh imprint date reading method comprising a step of outputting a result.

(9)日付印が押印されたカラー画像からの押印日付読取り方法であって、
上記カラー画像を入力するステップと、
上記カラー画像から日付印を検知するステップと、
上記検知した日付印に対して、複数の2値画像を出力するカラードロップアウトを行うステップと、
上記出力した全ての2値画像に対して、日付文字列を認識するステップと
上記全ての2値画像に対する日付文字列認識の結果の中で、最もスコアが高い認識結果をセットするステップと、
結果を出力するステップを有する第8の押印日付読取り方法。
(9) A method for reading a stamp date from a color image on which a date stamp is stamped,
Inputting the color image;
Detecting a date stamp from the color image;
Performing a color dropout for outputting a plurality of binary images to the detected date stamp;
A step of recognizing a date character string for all the output binary images and a step of setting a recognition result having the highest score among the results of date character string recognition for all the binary images;
An eighth stamp date reading method comprising a step of outputting a result.

(10)前記(9)記載の認識結果をセットするステップにおいて、認識結果の文字列の頻度を数えて、最も頻度が多い認識文字列を認識結果としてセットすることも可能な請求項24の押印日付読取り方法。   (10) The stamp according to claim 24, wherein in the step of setting the recognition result according to (9), the frequency of the character string of the recognition result is counted, and the most frequently recognized character string can be set as the recognition result. Date reading method.

10…入力装置、20…画像入力装置、30…CPU、40…辞書、50…表示装置、60…画像DB、210…色むら対応用カラードロップアウト2値画像、404…色むら対応用2値画像を出力するカラードロップアウト処理、405、日付文字列認識処理、502…カラークラスタリング処理、503…背景色選択処理、504、押印色選択処理、506…色むら対応用濃淡画像生成処理、507…傾き補正処理、508…2値化処理、1503…プレ印刷・地紋除去用2値画像を出力するカラードロップアウト処理、1601…プレ印刷・地紋除去用濃淡画像生成処理、2101…色むら対応用2値画像およびプレ印刷・地紋除去用2値画像の2つの2値画像を出力するカラードロップアウト処理 DESCRIPTION OF SYMBOLS 10 ... Input device, 20 ... Image input device, 30 ... CPU, 40 ... Dictionary, 50 ... Display device, 60 ... Image DB, 210 ... Color dropout binary image for uneven color, 404 ... Binary for uneven color Color dropout processing for outputting an image, 405, date character string recognition processing, 502... Color clustering processing, 503... Background color selection processing, 504, Stamp color selection processing, 506. Inclination correction processing, 508..., Binarization processing, 1503... Color dropout processing for outputting a pre-print / background pattern removal binary image, 1601... Pre-print / background pattern removal grayscale image generation processing, 2101. Color dropout processing that outputs two binary images: a binary image and a binary image for pre-printing / background pattern removal

Claims (15)

処理対象画像から文字成分のみ残すドロップアウトの画像処理方法であって、
上記処理対象画像を入力するステップと、
上記処理対象画像の画素を色クラスタリングするステップと、上記色クラスタリングに基づいて背景色を選択するステップと、
上記処理対象画像の画素から押印色を選択するステップと、
上記処理対象画像の画素を色空間変換するステップと、
上記処理対象画像の画素から色むら対応用の濃淡画像生成するステップと、
上記濃淡画像の傾きを補正するステップと、
上記傾き補正した濃淡画像を2値化するステップを有する第1の画像処理方法。
A dropout image processing method that leaves only character components from a processing target image,
Inputting the processing target image;
Color clustering the pixels of the image to be processed, selecting a background color based on the color clustering,
Selecting a stamp color from the pixels of the processing target image;
Color space conversion of pixels of the processing target image;
Generating a gray image corresponding to color unevenness from pixels of the processing target image;
Correcting the gradient of the grayscale image;
A first image processing method including a step of binarizing the grayscale image subjected to the tilt correction.
上記押印色を選択するステップにおいて、
上記処理対象画像の押印の円周付近の画素の円周色を選択する手段と、
上記処理対象画像の押印の領域内の画素から上記選択された円周色に最も近い色を押印色として決定する手段により押印色を選択することを特徴とする請求項1記載の画像処理方法。
In the step of selecting the stamp color,
Means for selecting a circumferential color of pixels near the circumference of the imprint of the image to be processed;
2. The image processing method according to claim 1, wherein a seal color is selected by means for determining a color closest to the selected circumferential color from pixels in the seal area of the processing target image.
上記色むら対応用の濃淡画像生成ステップにおいて、
上記押印色を色空間変換する手段と、
上記色空間変換によって得た押印色の彩度と輝度から無彩色か有彩色に判定する手段と、
上記判定結果で無彩色である場合は、無彩色用の色むら対応用の画素分類を行う手段と、
上記判定結果で有彩色である場合は、色むら対応用の色相許容範囲計算する手段と、
有彩色用の色むら対応用の画素分類を行う手段と、
画素分類の結果から濃淡値に変換する手段を有する請求項1記載の画像処理方法。
In the gray image generation step for dealing with color unevenness,
Means for converting the stamp color into a color space;
Means for determining from the saturation and luminance of the stamp color obtained by the color space conversion to an achromatic or chromatic color;
If the determination result is an achromatic color, means for performing pixel classification for achromatic unevenness for achromatic color,
If the determination result is a chromatic color, means for calculating a hue tolerance range for color unevenness,
Means for performing pixel classification for color unevenness for chromatic colors;
The image processing method according to claim 1, further comprising means for converting the result of pixel classification into a gray value.
上記無彩色用の色むら対応用の画素分類手段において、
上記処理対象画像内の各画素を、上記選択された押印色、背景色、当該画素の彩度および輝度を用いて、背景、文字、および除去候補に弁別する請求項3記載の画像処理方法。
In the pixel classification means for dealing with uneven color for the achromatic color,
The image processing method according to claim 3, wherein each pixel in the processing target image is discriminated into a background, a character, and a removal candidate using the selected stamp color, background color, saturation and luminance of the pixel.
上記色むら対応用の色相許容範囲計算手段において、
請求項3記載の色空間変換した押印色の色相と、請求項1記載の色空間変換による上記処理対象画像の画素の色相の頻度分布を用いて、頻度分布は押印色の色相を中心とした正規分布として扱い、偏差ασになるまでの色相範囲を色むら用の色相許容範囲とする請求項3の画像処理方法。
In the hue tolerance calculation means for dealing with the color unevenness,
The frequency distribution is centered on the hue of the stamp color using the hue of the stamp color converted by the color space according to claim 3 and the frequency distribution of the hue of the pixel of the processing target image by the color space conversion according to claim 1. The image processing method according to claim 3, wherein the image processing method is treated as a normal distribution, and a hue range up to a deviation ασ is set as a hue tolerance range for color unevenness.
上記色むら対応用の色相許容範囲計算手段において、
請求項3記載の色空間変換した押印色の色相と、請求項1記載の色空間変換による上記処理対象画像の画素の色相の頻度分布を用いて、頻度分布において押印色の色相の頻度の所定閾値以下になるまでの色相範囲を色むら用の色相許容範囲とする請求項3の画像処理方法。
In the hue tolerance calculation means for dealing with the color unevenness,
Using the hue of the stamp color after color space conversion according to claim 3 and the frequency distribution of the hue of pixels of the image to be processed by the color space conversion according to claim 1, the frequency of the hue of the stamp color in the frequency distribution is determined. 4. The image processing method according to claim 3, wherein a hue range up to a threshold value or less is set as a hue tolerance range for color unevenness.
上記有彩色用の色むら対応用の画素分類手段において、
上記処理対象画像内の各画素を、上記選択された押印色、背景色、当該画素の色相および彩度を用いて、背景、文字、文字候補、および除去候補に弁別する請求項3記載の画像処理方法。
In the pixel classification means for color unevenness for the chromatic color,
The image according to claim 3, wherein each pixel in the processing target image is discriminated into a background, a character, a character candidate, and a removal candidate using the selected stamp color, background color, hue and saturation of the pixel. Processing method.
上記2値化するステップにおいて、
2値化は上記傾き補正した濃淡画像における日付領域の部分領域を、それぞれの部分領域の2値化閾値に従って2値化して2値画像を生成し、それぞれの部分領域2値画像の論理和をとることで、日付領域の2値画像とすることを特徴とする請求項1の画像処理方法。
In the binarization step,
In the binarization, a partial area of the date area in the grayscale image subjected to the inclination correction is binarized according to a binarization threshold value of each partial area to generate a binary image, and a logical sum of each partial area binary image is calculated. The image processing method according to claim 1, wherein a binary image of a date area is obtained by taking the image.
日付印が押印されたカラー画像からの押印日付読取り方法であって、
上記カラー画像を入力するステップと、
上記カラー画像から日付印を検知するステップと、
上記検知した日付印に対して日付文字行2値画像を出力する請求項1の画像処理方法と、
2値画像に対して日付文字列を認識するステップと、
上記認識結果をセットするステップと、
結果を出力するステップを有する第1の押印日付読取り方法。
A method for reading a stamp date from a color image on which a date stamp is stamped,
Inputting the color image;
Detecting a date stamp from the color image;
2. An image processing method according to claim 1, wherein a date character line binary image is output for the detected date stamp;
Recognizing date strings for binary images;
Setting the recognition result;
A first stamp date reading method comprising a step of outputting a result.
処理対象画像から文字成分のみ残すドロップアウトの画像処理方法であって、
上記処理対象画像を入力するステップと、
上記処理対象画像の画素を色クラスタリングするステップと、上記色クラスタリングに基づいて背景色を選択するステップと、
上記処理対象画像の画素から押印色を選択するステップと、
上記処理対象画像の画素を色空間変換するステップと、
上記処理対象画像の画素からプレ印刷・地紋除去用の濃淡画像生成するステップと、
上記濃淡画像の傾きを補正するステップと、
上記傾き補正した濃淡画像を2値化するステップを有する第2の画像処理方法。
A dropout image processing method that leaves only character components from a processing target image,
Inputting the processing target image;
Color clustering the pixels of the image to be processed, selecting a background color based on the color clustering,
Selecting a stamp color from the pixels of the processing target image;
Color space conversion of pixels of the processing target image;
Generating a gray image for pre-printing / background pattern removal from pixels of the processing target image;
Correcting the gradient of the grayscale image;
A second image processing method including a step of binarizing the grayscale image subjected to the tilt correction.
上記プレ印刷・地紋除去用の濃淡画像生成ステップにおいて、
上記押印色を色空間変換する手段と、
上記色空間変換によって得た押印色の彩度と輝度から無彩色か有彩色に判定する手段と、
上記判定結果で無彩色である場合は、無彩色用のプレ印刷・地紋除去用の画素分類を行う手段と、
上記判定結果で有彩色である場合は、プレ印刷・地紋除去用の色相許容範囲計算する手段と、
有彩色用のプレ印刷・地紋除去用の画素分類を行う手段と、
画素分離の結果から罫線を除去する手段と、
画素分類の結果から濃淡値に変換する手段を有する請求項10記載の画像処理方法。
In the gray image generation step for pre-printing / background pattern removal,
Means for converting the stamp color into a color space;
Means for determining from the saturation and luminance of the stamp color obtained by the color space conversion to an achromatic or chromatic color;
If the determination result is an achromatic color, means for performing pixel classification for achromatic color pre-printing / background pattern removal;
If the determination result is a chromatic color, means for calculating a hue tolerance range for pre-printing / background pattern removal;
Means for performing pixel classification for pre-printing / background pattern removal for chromatic colors;
Means for removing ruled lines from the result of pixel separation;
11. The image processing method according to claim 10, further comprising means for converting the result of pixel classification into a gray value.
上記無彩色用のプレ印刷・地紋除去用の画素分類手段において、
上記処理対象画像内の各画素を、上記選択された押印色、背景色、当該画素の彩度および輝度を用いて、背景、文字、および除去候補に弁別する請求項11記載の画像処理方法。
In the achromatic color pre-printing / background pattern removing pixel classification means,
The image processing method according to claim 11, wherein each pixel in the processing target image is distinguished into a background, a character, and a removal candidate using the selected stamp color, background color, saturation and luminance of the pixel.
上記プレ印刷・地紋除去用の色相許容範囲計算手段において、
請求項11記載の色空間変換した押印色の色相と、請求項10記載の色空間変換による上記処理対象画像の画素の色相の頻度分布を用いて、頻度分布は押印色の色相を中心とした正規分布として扱い、偏差βσになるまでの色相範囲を色むら用の色相許容範囲とする請求項11の画像処理方法。
In the hue tolerance range calculation means for pre-printing / background pattern removal,
The frequency distribution is centered on the hue of the stamp color using the hue of the stamp color after the color space conversion according to claim 11 and the frequency distribution of the hue of the pixel of the processing target image by the color space conversion according to claim 10. The image processing method according to claim 11, wherein the hue range until the deviation βσ is handled as a normal distribution is set as a hue tolerance range for uneven color.
上記有彩色用のプレ印刷・地紋除去用の画素分類手段において、
上記処理対象画像内の各画素を、上記選択された押印色、背景色、当該画素の色相および彩度を用いて、背景、文字、文字候補、および除去候補に弁別する請求項11記載の画像処理方法。
In the pixel classification means for pre-printing / background pattern removal for the chromatic color,
The image according to claim 11, wherein each pixel in the processing target image is discriminated into a background, a character, a character candidate, and a removal candidate using the selected stamp color, background color, hue and saturation of the pixel. Processing method.
上記罫線を除去する手段において、
画素分類で文字に弁別された画素において、8近傍の弁別された画素で3×3画素のフィルタリングを行うことを特徴とした請求項11記載の画像処理方法。
In the means for removing the ruled line,
The image processing method according to claim 11, wherein 3 × 3 pixel filtering is performed on pixels that are discriminated by characters in the pixel classification in the vicinity of 8 pixels.
JP2011222452A 2011-10-07 2011-10-07 Form recognition method and form recognition apparatus Active JP5830338B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011222452A JP5830338B2 (en) 2011-10-07 2011-10-07 Form recognition method and form recognition apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011222452A JP5830338B2 (en) 2011-10-07 2011-10-07 Form recognition method and form recognition apparatus

Publications (2)

Publication Number Publication Date
JP2013084071A true JP2013084071A (en) 2013-05-09
JP5830338B2 JP5830338B2 (en) 2015-12-09

Family

ID=48529218

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011222452A Active JP5830338B2 (en) 2011-10-07 2011-10-07 Form recognition method and form recognition apparatus

Country Status (1)

Country Link
JP (1) JP5830338B2 (en)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015064107A1 (en) * 2013-10-31 2015-05-07 日本電気株式会社 Management system, list production device, data structure, and printed label
JP5992567B1 (en) * 2015-03-20 2016-09-14 株式会社Pfu Date identification device
JP2016181211A (en) * 2015-03-25 2016-10-13 日本電気株式会社 Label area detection device, label area detection method, label area detection program, and label area detection system
JP2018132894A (en) * 2017-02-14 2018-08-23 株式会社Pfu Date identification device, date identification method, and date identification program
JP2019504430A (en) * 2016-01-25 2019-02-14 アリババ グループ ホウルディング リミテッド Image processing method and device
JP2020504809A (en) * 2016-11-11 2020-02-13 ヘンケル・アクチェンゲゼルシャフト・ウント・コムパニー・コマンディットゲゼルシャフト・アウフ・アクチェンHenkel AG & Co. KGaA Method and apparatus for determining hair color uniformity
EP3757886A1 (en) 2019-06-25 2020-12-30 Ricoh Company, Ltd. Image processing device, image forming apparatus, and image processing method
EP3758352A1 (en) 2019-06-25 2020-12-30 Ricoh Company, Ltd. Image processing device, image forming apparatus, and image processing method
JP2021005234A (en) * 2019-06-26 2021-01-14 日立オムロンターミナルソリューションズ株式会社 Form recognition device, form recognition method, and form recognition system
WO2021129121A1 (en) * 2019-12-25 2021-07-01 北京同邦卓益科技有限公司 Table recognition method and device, and computer-readable storage medium

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02137079A (en) * 1988-11-18 1990-05-25 Fujitsu Ltd Color identifying circuit
JPH057304A (en) * 1991-06-26 1993-01-14 Canon Inc Color picture color separating device
JP2000181992A (en) * 1998-12-11 2000-06-30 Fujitsu Ltd Color document image recognition device
JP2008198157A (en) * 2007-02-16 2008-08-28 Fujitsu Ltd Table recognition program, method, and device
JP2009266189A (en) * 2008-04-21 2009-11-12 Sharp Corp Image determination apparatus, image search apparatus, image search program and recording medium
JP2010244372A (en) * 2009-04-08 2010-10-28 Hitachi Computer Peripherals Co Ltd Method and apparatus for recognizing form

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02137079A (en) * 1988-11-18 1990-05-25 Fujitsu Ltd Color identifying circuit
JPH057304A (en) * 1991-06-26 1993-01-14 Canon Inc Color picture color separating device
JP2000181992A (en) * 1998-12-11 2000-06-30 Fujitsu Ltd Color document image recognition device
JP2008198157A (en) * 2007-02-16 2008-08-28 Fujitsu Ltd Table recognition program, method, and device
JP2009266189A (en) * 2008-04-21 2009-11-12 Sharp Corp Image determination apparatus, image search apparatus, image search program and recording medium
JP2010244372A (en) * 2009-04-08 2010-10-28 Hitachi Computer Peripherals Co Ltd Method and apparatus for recognizing form

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2015064107A1 (en) * 2013-10-31 2017-03-09 日本電気株式会社 Management system, list creation device, data structure and print label
US9836665B2 (en) 2013-10-31 2017-12-05 Nec Corporation Management system, list production device, method, computer readable recording medium, data structure, and printed label
WO2015064107A1 (en) * 2013-10-31 2015-05-07 日本電気株式会社 Management system, list production device, data structure, and printed label
JP5992567B1 (en) * 2015-03-20 2016-09-14 株式会社Pfu Date identification device
CN105989359A (en) * 2015-03-20 2016-10-05 株式会社Pfu Date identification apparatus
US9594985B2 (en) 2015-03-20 2017-03-14 Pfu Limited Date identification apparatus
CN105989359B (en) * 2015-03-20 2019-06-18 株式会社Pfu Date recognition device
JP2016181211A (en) * 2015-03-25 2016-10-13 日本電気株式会社 Label area detection device, label area detection method, label area detection program, and label area detection system
JP2019504430A (en) * 2016-01-25 2019-02-14 アリババ グループ ホウルディング リミテッド Image processing method and device
JP2020504809A (en) * 2016-11-11 2020-02-13 ヘンケル・アクチェンゲゼルシャフト・ウント・コムパニー・コマンディットゲゼルシャフト・アウフ・アクチェンHenkel AG & Co. KGaA Method and apparatus for determining hair color uniformity
JP7165130B2 (en) 2016-11-11 2022-11-02 ヘンケル・アクチェンゲゼルシャフト・ウント・コムパニー・コマンディットゲゼルシャフト・アウフ・アクチェン Method and apparatus for determining hair color uniformity
US10380416B2 (en) 2017-02-14 2019-08-13 Pfu Limited Date identifying apparatus, date identifying method, and computer-readable recording medium
JP2018132894A (en) * 2017-02-14 2018-08-23 株式会社Pfu Date identification device, date identification method, and date identification program
EP3757886A1 (en) 2019-06-25 2020-12-30 Ricoh Company, Ltd. Image processing device, image forming apparatus, and image processing method
EP3758352A1 (en) 2019-06-25 2020-12-30 Ricoh Company, Ltd. Image processing device, image forming apparatus, and image processing method
US11170243B2 (en) 2019-06-25 2021-11-09 Ricoh Company, Ltd. Image processing device, image forming apparatus, and image processing method
US11190666B2 (en) 2019-06-25 2021-11-30 Ricoh Company, Ltd. Image processing device, image forming apparatus, image processing method, and non-transitory computer-readable storage medium
JP2021005234A (en) * 2019-06-26 2021-01-14 日立オムロンターミナルソリューションズ株式会社 Form recognition device, form recognition method, and form recognition system
JP7267854B2 (en) 2019-06-26 2023-05-02 日立チャネルソリューションズ株式会社 Form recognition device, form recognition method, and form recognition system
WO2021129121A1 (en) * 2019-12-25 2021-07-01 北京同邦卓益科技有限公司 Table recognition method and device, and computer-readable storage medium

Also Published As

Publication number Publication date
JP5830338B2 (en) 2015-12-09

Similar Documents

Publication Publication Date Title
JP5830338B2 (en) Form recognition method and form recognition apparatus
KR100625755B1 (en) Character recognition apparatus, character recognition method, medium processing method and computer readable recording medium having character recognition program
KR100339691B1 (en) Apparatus for recognizing code and method therefor
CN110008954B (en) Complex background text image extraction method and system based on multi-threshold fusion
US6865290B2 (en) Method and apparatus for recognizing document image by use of color information
US8306325B2 (en) Text character identification system and method thereof
JP4857173B2 (en) Image processing apparatus, image processing method, and image processing program
US20070253040A1 (en) Color scanning to enhance bitonal image
JP2011154698A (en) Method of discriminating color of color based image code
JP5337563B2 (en) Form recognition method and apparatus
US9171224B2 (en) Method of improving contrast for text extraction and recognition applications
WO2007139836A2 (en) Optical mark reader
JP2011008549A (en) Image processor, image reader, multifunctional machine, image processing method, program, and recording medium
CN111766248A (en) Steel seal on-line detection system and method based on color CCD
Fernández-Caballero et al. Display text segmentation after learning best-fitted OCR binarization parameters
JP5887242B2 (en) Image processing apparatus, image processing method, and program
JP5929282B2 (en) Image processing apparatus and image processing program
JP5601027B2 (en) Image processing apparatus and image processing program
US10523848B2 (en) Image processing apparatus for processing marked regions
JP2008287414A (en) Optical recognition code recognition system, method, and program
Ouji et al. Chromatic/achromatic separation in noisy document images
JP3955467B2 (en) Image processing program and image processing apparatus
JP2003087562A (en) Image processor and image processing method
JP2013090262A (en) Document character difference detection device
Sherkat et al. Use of colour for hand-filled form analysis and recognition

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20130823

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140521

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140521

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150310

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150410

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150929

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151026

R150 Certificate of patent or registration of utility model

Ref document number: 5830338

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250