JP2003196592A - Program for processing image, and image processor - Google Patents

Program for processing image, and image processor

Info

Publication number
JP2003196592A
JP2003196592A JP2001397674A JP2001397674A JP2003196592A JP 2003196592 A JP2003196592 A JP 2003196592A JP 2001397674 A JP2001397674 A JP 2001397674A JP 2001397674 A JP2001397674 A JP 2001397674A JP 2003196592 A JP2003196592 A JP 2003196592A
Authority
JP
Japan
Prior art keywords
color
image
character
unit
preprinted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001397674A
Other languages
Japanese (ja)
Other versions
JP2003196592A5 (en
JP3955467B2 (en
Inventor
Yoshihiro Shima
好博 嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Information and Telecommunication Engineering Ltd
Original Assignee
Hitachi Computer Peripherals Co Ltd
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Computer Peripherals Co Ltd, Hitachi Ltd filed Critical Hitachi Computer Peripherals Co Ltd
Priority to JP2001397674A priority Critical patent/JP3955467B2/en
Publication of JP2003196592A publication Critical patent/JP2003196592A/en
Publication of JP2003196592A5 publication Critical patent/JP2003196592A5/ja
Application granted granted Critical
Publication of JP3955467B2 publication Critical patent/JP3955467B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)
  • Image Analysis (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To erase a preprint and to generate a binary image where a entered character is left, so as to realize highly precise character recognition, even when the entered characters come into contact with the preprint to overlap each other. <P>SOLUTION: This image processor is provided with a binalized image generating means 105 for binalizing the minimum value of primary color components based on a color image within a field, and a means 102 for generating a binalized image in which a preprint color is dropped out from the color image within the field, a character reader 107 is made to read the binalized image from the binalized image generating means for binalizing the minimum value of the primary color components, and made to try again to read out the binalized image from the means for generating the binalized image in which the preprint color is dropped out from the color image when a result read hereinbefore by the character reader 107 is rejected. <P>COPYRIGHT: (C)2003,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、画像処理プログラ
ム及び画像処理装置に係り、特に、帳票の表面画像を光
学的に読み取り、この読み取った画像の所定の領域を認
識する光学的文字読取装置(以下、OCRという)に読
み取らせるために使用して好適な画像処理プログラム及
び画像処理装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image processing program and an image processing apparatus, and more particularly, to an optical character reading apparatus which optically reads a surface image of a form and recognizes a predetermined area of the read image ( The present invention relates to an image processing program and an image processing apparatus that are suitable for being read by an OCR.

【0002】[0002]

【従来の技術】従来、帳票等に手書き等によって記入さ
れた記入文字は、OCRにより光学的に読み取られ認識
されて処理されているいる。一般に、帳票には、記入す
る枠や金額単位の円等の読み取りに不要な文字(プレ印
刷という)が印刷されている。これらの枠や印刷文字等
のプレ印刷は、読み取りには不要であり、OCRで白色
と判定される色、すなわち、ドロップアウトカラーと呼
ばれる予め決められた色が使用されていた。このドロッ
プアウトカラーは、光電変換部において使用される光源
あるいは光学的フィルタの波長に応じて固定的にかつ厳
密に決定されている。このため、帳票のプレ印刷に使用
することができる色は、制限されており、OCRで従来
入力対象としていないカラー帳票のように、指定された
色以外で印刷された帳票に対してプレ印刷をドロップす
ることは困難であった。
2. Description of the Related Art Conventionally, a written character written by handwriting on a form or the like has been optically read, recognized and processed by an OCR. Generally, a form is printed with characters (referred to as pre-printing) that are not necessary for reading a frame to be filled, a yen in a unit of money, or the like. Preprinting of these frames and print characters is not necessary for reading, and a color determined to be white by OCR, that is, a predetermined color called a dropout color has been used. The dropout color is fixedly and strictly determined according to the wavelength of the light source or the optical filter used in the photoelectric conversion unit. For this reason, the colors that can be used for preprinting the form are limited, and preprinting can be performed on a form printed in a color other than the specified color, such as a color form that has not been conventionally input by OCR. It was difficult to drop.

【0003】指定された色以外で印刷された帳票に対し
てプレ印刷をドロップすることができる従来技術とし
て、例えば、特開平6−176194号公報等に記載さ
れた技術が知られている。この従来技術は、カラー画像
を出力することが可能な光電変換部を設け、基準帳票の
画像を基に、処理対象とする帳票画像から除くべき部分
を色識別によって予め用意しておくことにより、処理対
象とする帳票のプレ印刷部分をドロップするというもの
である。この従来技術は、これにより、帳票のプレ印刷
に用いられる色の制限をなくして、記入文字を読み取っ
てOCRにより認識させることができるが、文字の記入
されていない基準帳票を予め用意しておく必要がある。
また、この従来技術は、枠線等のプレ印刷と記入文字と
が接触、重なった場合について、記入文字がその重なり
部分で消えないようにすることについての配慮がなされ
ていないものであった。
As a conventional technique capable of dropping preprinting on a form printed in a color other than a designated color, for example, a technique described in Japanese Patent Laid-Open No. 6-176194 is known. This prior art is provided with a photoelectric conversion unit capable of outputting a color image, and based on the image of the reference form, a portion to be excluded from the form image to be processed is prepared in advance by color identification. The pre-printed part of the form to be processed is dropped. According to this conventional technique, therefore, it is possible to read the entered characters and recognize them by OCR without the limitation of colors used for preprinting the forms, but a reference form in which no characters are entered is prepared in advance. There is a need.
Further, in this prior art, when preprinting such as a frame line and the written character come into contact with and overlap with each other, no consideration is given to preventing the written character from being erased at the overlapping portion.

【0004】また、OCRに読み取らせるための画像処
理に関する従来技術として、特開平6−195509号
公報等に記載された技術が知られている。この従来技術
は、記入文字色が黒色であることを前提として、多色刷
り画像から、各画素の原色成分(赤、緑、青)を与える
光電変換部を設け、それら原色成分の最大値を有する信
号を出力してカラーを除去して記入文字だけを抽出する
というものである。しかし、この従来技術は、小切手等
の文書の多色刷りの背景からカラーを除去することが目
的であり、記入文字が色付きの場合、例えば、青色の記
入文字の場合、カラーを除去することにより記入文字も
除去されてしまうという問題点を有している。
As a conventional technique relating to image processing for reading by OCR, a technique described in Japanese Patent Laid-Open No. 6-195509 is known. This prior art is provided with a photoelectric conversion unit that gives the primary color components (red, green, blue) of each pixel from a multicolor image on the assumption that the written character color is black, and has the maximum value of those primary color components. It outputs a signal, removes the color, and extracts only the written characters. However, this prior art is intended to remove color from the multicolored background of a document such as a check, and when the written characters are colored, for example, in the case of blue written characters, the color is removed by removing the color. There is a problem that characters are also removed.

【0005】また、さらに、他の従来技術として、例え
ば、特開平10−27213号公報等に記載された技術
が知られている。この従来技術は、赤鉛筆、赤色ボール
ペン、青色ボールペン等の有彩色で記入された文字を無
彩色の文字と同様に読み取ることができるように、光電
変換部から赤、緑、青の3つの原色成分を入力し、その
画素の色が無彩色、赤系色、緑系色、青系色のうちのい
ずれのカラーグループに属するかを判定し、その画素が
予め指定している文字色の場合、3原色成分の最大値を
その画素の白黒輝度信号として出力するというものであ
る。もし、文字色でない場合、背景レベルをその画素の
白黒輝度信号として出力する。そして、その画素の白黒
輝度信号に変換する。すなわち、多値のイメージデータ
から2値のイメージデータに変換する。しかし、この従
来技術は、枠線等のプレ印刷と記入文字とが接触、重な
った場合について、記入文字を残し、プレ印刷をドロッ
プし、重なり部分が消えないようにすることについての
配慮がなされていない。
Further, as another conventional technique, for example, a technique described in Japanese Patent Laid-Open No. 10-27213 is known. In this conventional technology, the red, green, and blue primary colors can be read from the photoelectric conversion unit so that characters written in chromatic colors such as red pencils, red ballpoint pens, and blue ballpoint pens can be read in the same way as achromatic characters. Input a component, determine whether the color of the pixel belongs to the color group of achromatic color, red-based color, green-based color, or blue-based color, and if the pixel is the character color specified in advance The maximum value of the three primary color components is output as a black and white luminance signal of the pixel. If it is not the character color, the background level is output as a black and white luminance signal of the pixel. Then, the pixel is converted into a monochrome luminance signal. That is, multivalued image data is converted into binary image data. However, in this conventional technology, when preprinting such as a border line and the written characters contact and overlap, consideration is given to leaving the written characters and dropping the preprint so that the overlapping part does not disappear. Not not.

【0006】さらに、他の従来技術として、特開平6−
290302号公報等に記載された技術が知られてい
る。この従来技術は、枠線等のプレ印刷と記入文字とが
接触、重なった場合、入力画像データに対して暫定的な
色分離を行い、この暫定的に色分離された各部分を構成
する画素の幾何学的な情報と、前記各部分及びバックグ
ラウンドの濃度情報とを併用して最終的な色分離を決定
するものである。しかし、この従来技術は、2値画像バ
ッファと、グレー画像バッファ、カラー画像バッファと
を備え、2値画像を対象とした文字を切り出し、文字認
識を行うに際して、入力画像の特定部分、例えば、文字
ストローク中の穴の空いている部分や罫線と文字の接触
部分を再チェックする場合に、前述のグレー画像バッフ
ァ、カラー画像バッファを参照して文字を切り出して文
字認識を実行するものである。
Further, as another prior art, Japanese Patent Laid-Open No. 6-
The technique described in Japanese Patent Publication No. 290302 is known. In this conventional technique, when preprinting such as a frame line and the written characters come into contact with each other and overlap each other, provisional color separation is performed on the input image data, and pixels forming each of the provisionally color-separated portions are separated. The final color separation is determined by using the geometrical information of (3) and the density information of each of the portions and the background. However, this conventional technique is provided with a binary image buffer, a gray image buffer, and a color image buffer, and when a character for a binary image is cut out and character recognition is performed, a specific portion of the input image, for example, a character When re-checking a holed portion in a stroke or a contact portion between a ruled line and a character, the character is cut out by referring to the gray image buffer and the color image buffer, and character recognition is executed.

【0007】このため、この従来技術は、文字切り出し
部や文字認識部等の処理部毎にグレー画像やカラー画像
にアクセスする必要が生じ、制御が複雑になるという問
題点を有している。また、この従来技術は、プレ印刷を
消去し、記入文字を残した2値画像を生成して出力して
おらず、読み取り結果の修正のためにプレ印刷を除去
し、記入文字を残した2値画像を画面に表示することに
ついて配慮されていない。さらに、この従来技術は、同
一色とみなせる領域を成長させるというような直線幾何
学的な情報を用いているが、直線部分や文字の曲線部分
における領域の輪郭の乱れや、色ずれに対する領域成長
の信頼性に配慮されていない。
Therefore, this conventional technique has a problem in that it is necessary to access a gray image or a color image for each processing unit such as a character cutout unit and a character recognition unit, which makes control complicated. Further, in this conventional technique, the preprint is erased, the binary image in which the written characters are left is not generated and output, and the preprint is removed and the written characters are left in order to correct the reading result. No consideration is given to displaying the value image on the screen. Further, this conventional technique uses linear geometric information such as growing a region that can be regarded as the same color, but the region growth due to the disturbance of the contour of the region in the straight line portion or the curved portion of the character or the color misregistration. The reliability of is not considered.

【0008】[0008]

【発明が解決しようとする課題】前述で説明した従来技
術は、それぞれの従来技術の説明と共に説明したよう
に、種々の問題点を有している。
The prior arts described above have various problems as explained together with the description of the respective prior arts.

【0009】本発明の目的は、前述した従来技術の問題
点を解決し、処理対象とするカラー帳票において、枠線
等のプレ印刷の色と記入文字の色とが異なるような帳票
画像に対して、プレ印刷と記入文字とが接触あるいは重
なっていても、プレ印刷を消去し、記入文字を残した2
値画像を生成することができ、精度の高い文字認識を行
わせることができる画像処理プログラム及び画像処理装
置を提供することにある。
An object of the present invention is to solve the above-mentioned problems of the prior art, and for a color image to be processed, for a form image in which the color of preprinting such as a frame line and the color of the entered character are different. Then, even if the preprint and the written character touched or overlapped, the preprint was erased and the written character was left. 2
An object of the present invention is to provide an image processing program and an image processing device that can generate a value image and can perform highly accurate character recognition.

【0010】[0010]

【課題を解決するための手段】本発明によれば前記目的
は、入力された帳票画像のプレ印刷色と記入文字色とを
設定するステップと、前記プレ印刷色と前記記入文字色
とに基づいて2値化する色を判別するステップと、前記
帳票画像かせ前記プレ印刷色をドロップアウトするステ
ップと、前記ドロップアウト後の画像を前記判別された
色で2値化するするステップと、前記2値化された画像
に対して文字認識を行うステップとを情報機器に実行さ
せることにより達成される。
According to the present invention, the above object is based on a step of setting a preprint color and a written character color of an input form image, and based on the preprint color and the written character color. Determining the color to be binarized, dropping out the preprinted color from the form image, binarizing the image after the dropout with the determined color, This is achieved by causing the information device to perform the step of performing character recognition on the binarized image.

【0011】また、前記目的は、入力された帳票画像を
3原色成分の最小値に対して2値化を行うステップと、
前記2値化画像の文字認識を行うステップと、前記認識
文字がリジェクトされた場合に、前記帳票画像のプレ印
刷色をドロップアウトして再度文字認識を行うステップ
とを情報機器に実行させることにより達成される。
Further, the object is to binarize the input form image with respect to the minimum values of the three primary color components,
By causing the information device to perform the character recognition of the binarized image and the step of performing character recognition again by dropping out the pre-printed color of the form image when the recognized character is rejected. To be achieved.

【0012】さらに、前記目的は、入力された帳票画像
についての文字認識を行う手段と、前記文字認識がリジ
ェクトされた場合に、前記帳票画像の文字記入色とプレ
印刷色とを判定する手段と、前記帳票画像の文字記入色
とプレ印刷色とから2値化する原色成分を判定する手段
と、前記帳票画像から判定されたプレ印刷色をドロップ
アウトし、前記原色成分を2値化する手段と、前記2値
化画像の文字認識を行う手段とを有することにより達成
される。
[0012] Further, the above-mentioned object is means for performing character recognition for an input form image, and means for determining a character entry color and a preprint color of the form image when the character recognition is rejected. Means for determining the primary color component to be binarized from the character entry color and the pre-print color of the form image; and means for dropping out the pre-print color determined from the form image to binarize the primary color component And a means for performing character recognition of the binarized image.

【0013】[0013]

【発明の実施の形態】以下、本発明による画像処理装置
及び文字読み取りシステムの一実施形態を図面により詳
細に説明する。
BEST MODE FOR CARRYING OUT THE INVENTION An embodiment of an image processing apparatus and a character reading system according to the present invention will be described in detail below with reference to the drawings.

【0014】図1は本発明の一実施形態による画像処理
装置を含む文字読み取りシステムの構成を示すブロック
図である。図1において、100はカラー画像スキャ
ナ、101は画像処理部、102は色識別ドロップアウ
ト2値化部、103はプレ印刷・記入文字の色識別部、
104はプレ印刷ドロップアウト2値化部、105は3
原色成分最小値2値化部、106は制御部、107は文
字読み取り部、108は画像蓄積部、109はネットワ
ークである。
FIG. 1 is a block diagram showing the arrangement of a character reading system including an image processing apparatus according to an embodiment of the present invention. In FIG. 1, 100 is a color image scanner, 101 is an image processing unit, 102 is a color identification dropout binarization unit, 103 is a color identification unit for preprinting / written characters,
104 is a pre-printing dropout binarization unit, and 105 is 3
A primary color component minimum value binarization unit, 106 is a control unit, 107 is a character reading unit, 108 is an image storage unit, and 109 is a network.

【0015】本発明の一実施形態による文字読み取りシ
ステムは、帳票表面のカラー画像を採取するカラー画像
スキャナ100と、該カラー画像スキャナ100からの
カラー画像情報を白黒に2値化する画像処理部104
と、2値化された画像データを読み取るOCR等の文字
読み取り部107と、画像蓄積部108とがネットワー
ク109により接続されて構成されている。
A character reading system according to an embodiment of the present invention includes a color image scanner 100 for collecting a color image on the surface of a form, and an image processing unit 104 for binarizing color image information from the color image scanner 100 into black and white.
A character reading unit 107 such as an OCR that reads binarized image data and an image storage unit 108 are connected by a network 109.

【0016】画像処理部101は、カラー画像スキャナ
100から入力される画像データの3原色成分の最小
値、すなわち、3原色成分の最も濃い部分のデータ部分
を選択して白黒2値化処理を行う3原色成分最小値2値
化部105と、プレ印刷の色を識別し、その色をドロッ
プアウト処理する色識別ドロップアウト2値化部102
と、これらの処理の選択及び実行を制御する制御部10
6とにより構成される。3原色成分最小値2値化部10
5は、入力されたカラー画像の3原色成分の内の最小値
を選択し、その原色成分を濃淡値として白黒2値化す
る。濃淡値を2値化する方法としては、例えば、特開平
11−120333号公報に開示されているように、注
目画素とその周辺の画素とのそれぞれの濃淡値より2値
化閾値を決定する方法であってもよい。
The image processing unit 101 selects the minimum value of the three primary color components of the image data input from the color image scanner 100, that is, the data portion of the darkest portion of the three primary color components, and performs the monochrome binarization process. Three primary color component minimum value binarization unit 105 and a color identification dropout binarization unit 102 that identifies a preprinted color and performs a dropout process on the color.
And a control unit 10 that controls selection and execution of these processes
6 and. Minimum value of three primary color components Binarization unit 10
Reference numeral 5 selects the minimum value of the three primary color components of the input color image and binarizes the primary color component as a gray value. As a method of binarizing the grayscale value, for example, as disclosed in Japanese Patent Laid-Open No. 11-120333, a method of determining a binarization threshold value based on the grayscale value of each of the pixel of interest and its surrounding pixels. May be

【0017】色識別ドロップアウト2値化部102は、
プレ印刷や記入文字の色識別を行う色識別部103と色
識別結果を用いてプレ印刷色をドロップアウトする2値
化部104とにより構成される。文字読み取り部107
は、画像処理部101から送られてきた2値画像からの
文字切り出しと文字認識とを行い、また、画像蓄積部1
08は、文字読み取り部107に送られる2値画像を保
管する。
The color identification dropout binarization unit 102
A color identification unit 103 that performs preprinting and color identification of written characters and a binarization unit 104 that drops out a preprinted color using a color identification result. Character reading unit 107
Performs character segmentation and character recognition from the binary image sent from the image processing unit 101, and the image storage unit 1
Reference numeral 08 stores the binary image sent to the character reading unit 107.

【0018】図2は図1に示す文字読み取りシステムに
おける画像処理部101及び文字読み取り部107での
処理動作を説明するフローチャートであり、次に、これ
について説明する。図2に示す処理が開始される前に、
カラー画像スキャナ100は、文字読み取りを行う帳票
をスキャンして、帳票のカラー画像を採取し、その画像
を画像処理部101に転送する。この画像は、カラー画
像スキャナ100あるいは画像処理部101内に設けら
れる図示しないバッファに一時的に格納保持される。
FIG. 2 is a flow chart for explaining the processing operation in the image processing unit 101 and the character reading unit 107 in the character reading system shown in FIG. 1. Next, this will be explained. Before the process shown in FIG. 2 is started,
The color image scanner 100 scans a form for reading characters, collects a color image of the form, and transfers the image to the image processing unit 101. This image is temporarily stored and held in a buffer (not shown) provided in the color image scanner 100 or the image processing unit 101.

【0019】(1)画像処理部101内の3原色成分の
最小値の2値化部105は、カラー画像スキャナ100
からの画像について、3原色成分の最小値、すなわち、
3原色成分の最も濃い部分のデータ部分を選択し白黒2
値化処理した結果の2値画像を制御部106を介してネ
ットワーク109に送信する(ステップ200)。
(1) The minimum value binarization unit 105 of the three primary color components in the image processing unit 101 is a color image scanner 100.
Image, the minimum of the three primary color components, ie,
3 Select the data part of the darkest part of the primary color component and black and white 2
The binary image resulting from the binarization processing is transmitted to the network 109 via the control unit 106 (step 200).

【0020】(2)文字読み取り部107は、3原色成
分最小値2値化部105において2値化された画像を入
力し、読み取る領域、すなわち、フィールドを指定す
る。フィールドの指定は、予め帳票の書式(フォーマッ
ト)としてフィールドの座標を登録しておき、そのフォ
ーマットを読み取るときに選択してフィールドを指定す
るという方法によっても、あるいは、帳票の枠線を抽出
し、枠の並び、配置から読み取る領域を決定する方法に
よってもよい(ステップ201、202)。
(2) The character reading unit 107 inputs the image binarized by the three-primary-color component minimum value binarizing unit 105, and designates an area to be read, that is, a field. The field can be specified by registering the coordinates of the field as a form format in advance and selecting the field when reading the format, or by extracting the frame line of the form. A method of determining the area to be read from the arrangement and arrangement of the frames may be used (steps 201 and 202).

【0021】(3)次に、文字読み取り部107は、フ
ィールド内の文字を切り出して文字認識を実行すること
によりフィールド内の文字読み取りを行う。次いで、フ
ィールド内の文字読み取りの結果がアクセプトかリジェ
クトかを判定する。この判定の結果、もし、アクセプト
の場合、読み取り結果を統合処理して単純に出力する
(ステップ203、204、209)。
(3) Next, the character reading unit 107 cuts out characters in the field and executes character recognition to read characters in the field. Then, it is determined whether the result of reading the character in the field is accept or reject. If the result of this determination is that it is an accept, the read results are integrated and simply output (steps 203, 204, 209).

【0022】(4)ステップ204の判定で、文字読み
取りの結果がリジェクトであった場合、カラー画像スキ
ャナ100で獲得されていたカラー画像を、色識別ドロ
ップアウト2値化部102のプレ印刷・記入文字の色識
別部103に入力する(ステップ205)。
(4) If it is determined in step 204 that the result of character reading is reject, the color image acquired by the color image scanner 100 is preprinted / filled in by the color identification dropout binarization unit 102. The characters are input to the color identification unit 103 (step 205).

【0023】(5)色識別部103は、入力されたカラ
ー画像から帳票の枠線やガイド用文字列等のプレ印刷部
分の色識別と記入文字の色識別とを行う(ステップ20
6)。
(5) The color identification section 103 performs color identification of the preprinted portion such as the frame line of the form and the guide character string and the color identification of the entered character from the input color image (step 20).
6).

【0024】(6)次に、プレ印刷ドロップアウト2値
化部104は、色識別部103からのプレ印刷の色を利
用してその色をドロップアウトして2値画像を生成す
る。なお、プレ印刷と記入文字とが同色であり、ドロッ
プアウト2値化が不成功と判断された場合、プレ印刷ド
ロップアウト2値化部104は、リジェクトを出力する
(ステップ207)。
(6) Next, the pre-print dropout binarization unit 104 drops out the color using the pre-printed color from the color identification unit 103 to generate a binary image. If the preprint and the entered characters have the same color and it is determined that the dropout binarization is unsuccessful, the preprint dropout binarization unit 104 outputs a reject (step 207).

【0025】(7)文字読み取り部107は、プレ印刷
ドロップアウト2値化部104からネットワーク109
に伝送されてきた2値画像に対してフィールド内の文字
読み取りを行い、読み取り結果を統合処理して出力する
(ステップ208、209)。
(7) The character reading unit 107 moves from the pre-print dropout binarization unit 104 to the network 109.
The characters in the field are read from the binary image transmitted to the computer, and the read results are integrated and output (steps 208 and 209).

【0026】前述したように、本発明の実施形態による
文字読み取りシステムは、ステップ204の処理で先の
フィールド内文字読み取りの結果がアクセプトかリジェ
クトかを判定して、リジェクトの場合、プレ印刷をドロ
ップアウトした2値画像に対して文字読み取りを行って
いるので、プレ印刷部分が文字認識の障害になることを
防止することができ、文字読み取りの信頼性を向上させ
ることができる。
As described above, the character reading system according to the embodiment of the present invention determines whether the result of the previous character reading in the field is Accept or Reject in the process of step 204, and if it is reject, preprint is dropped. Since character reading is performed on the binary image that has been output, it is possible to prevent the preprinted portion from interfering with character recognition, and improve the reliability of character reading.

【0027】図3は色識別ドロップアウト2値化部10
2の構成を示すブロック図、図8はフィールド内のプレ
印刷と記入文字との色を識別する領域を説明する図、図
10は図3における原色成分選択部305の構成を示す
図である。図3、図10において、301はプレ印刷色
識別部、302は記入文字色識別部、303は色成分選
択判定部、305は原色成分選択部、306は成分値の
濃化・淡化部、307は2値化部、308は画素識別部
であり、他の符号は図1の場合と同一である。
FIG. 3 shows the color identification dropout binarization unit 10.
2 is a block diagram showing the configuration of FIG. 2, FIG. 8 is a diagram for explaining a region for identifying the colors of preprinting and written characters in the field, and FIG. 10 is a diagram showing the configuration of the primary color component selection unit 305 in FIG. In FIGS. 3 and 10, reference numeral 301 is a pre-print color identification unit, 302 is a written character color identification unit, 303 is a color component selection determination unit, 305 is a primary color component selection unit, 306 is a component value thickening / lightening unit, and 307. Is a binarization unit, 308 is a pixel identification unit, and other symbols are the same as those in FIG.

【0028】色識別部103は、プレ印刷色識別部30
1と、記入文字色識別部302と、色成分選択判定部3
03とにより構成され、プレ印刷や記入文字の色識別を
行う。そして、カラー画像スキャナ100からのカラー
画像の青色成分310、緑色成分311、赤色成分31
2がプレ印刷色識別部301及び記入文字色識別部30
2に入力される。プレ印刷色識別部301は、フィール
ド内の部分的なカラー画像に対して識別用の処理領域を
設定し、その領域内にある画素の色の出現分布を検出し
てプレ印刷の色を識別する。なお、プレ印刷の色は、1
つの色に限定するものではなく、複数の色であってもよ
く、例えば、赤色と緑色との2色をプレ印刷の色として
抽出してもよい。
The color identification section 103 is a preprinted color identification section 30.
1, a written character color identification unit 302, and a color component selection determination unit 3
03, and performs preprinting and color identification of written characters. Then, the blue component 310, the green component 311, and the red component 31 of the color image from the color image scanner 100.
2 is a pre-print color identification unit 301 and a written character color identification unit 30
Entered in 2. The pre-print color identification unit 301 sets a processing region for identification for a partial color image in the field, detects the color distribution of pixels in the region, and identifies the pre-print color. . The pre-print color is 1
The number of colors is not limited to one, and a plurality of colors may be used. For example, two colors, red and green, may be extracted as the preprinted colors.

【0029】次に、図8を参照して、フィールド内のプ
レ印刷と記入文字との色を識別する領域について説明す
る。図8(a)、図8(b)において、フィールド80
2内の枠線800は、色付きであり、例えば、赤色や青
色の線である。また、記入文字801は、読み取り対象
であり、黒色や色付きの文字である。そして、プレ印刷
の枠線800と記入文字801とが重なった状態で記入
されているものとして示している。枠線の色と記入文字
の色とが異なる場合、枠線をドロップアウトすることが
できる。
Next, referring to FIG. 8, an area for identifying the colors of the preprint and the written character in the field will be described. In FIG. 8A and FIG. 8B, the field 80
The frame line 800 in 2 is colored, for example, a red or blue line. Further, the written character 801 is a reading target and is a black or colored character. The preprinted frame line 800 and the entry character 801 are shown as being overlaid. If the color of the border and the color of the entered characters are different, the border can be dropped out.

【0030】枠線等のプレ印刷の色を識別するため、図
8(a)に示すように、色識別の処理領域803、80
4が設定される。この処理領域において、画素の色識別
が行われて、色画素の分布を求め、プレ印刷の色が決定
される。また、記入文字の色を識別するため、図8
(b)に示すように、色識別の処理領域813が設定さ
れる。この処理領域において、画素の色識別が行われ
と、色画素の分布を求め、記入文字の色が決定される。
In order to identify the preprinted color such as the frame line, as shown in FIG. 8A, the color identification processing areas 803, 80 are provided.
4 is set. In this processing area, pixel color identification is performed, the color pixel distribution is obtained, and the pre-printing color is determined. In addition, in order to identify the color of the written characters, FIG.
As shown in (b), a color identification processing area 813 is set. In this processing area, when the color of the pixel is identified, the distribution of the color pixel is obtained and the color of the written character is determined.

【0031】図3の説明に戻って、記入文字色識別部3
02は、フィールド内の部分的なカラー画像に対して識
別用の処理領域、例えば、領域813を設定し、その領
域内にある画素の色の出現分布を検出して記入文字の色
を識別する。また、色成分選択判定部303は、識別さ
れたプレ印刷色と記入文字色とを用いて、三原色成分の
内、2値化対象の濃淡画像として選択する原色成分を判
定する。例えば、もし、プレ印刷色が赤色と識別され、
記入文字色が青色と識別された場合、赤色成分を選択す
べき原色成分と判定する。また、もし、プレ印刷色が緑
色と識別され、記入文字色が黒色と識別された場合、緑
色成分を選択すべき原色成分と判定する。そして、色成
分選択判定部303は、プレ印刷色をドロップアウト2
値化部104の原色成分選択部305に対して出力し、
また、プレ印刷色と記入文字色との情報320をドロッ
プアウト2値化部104の成分値の濃化・淡化部306
に対して出力する。
Returning to the description of FIG. 3, the entered character color identification unit 3
Reference numeral 02 sets a processing area for identification for a partial color image in the field, for example, an area 813, and detects the appearance distribution of the color of pixels in the area to identify the color of the written character. . Further, the color component selection determination unit 303 uses the identified preprinted color and the entered character color to determine which of the three primary color components is the primary color component to be selected as the grayscale image to be binarized. For example, if the preprint color is identified as red,
When the written character color is identified as blue, the red component is determined to be the primary color component to be selected. If the preprinted color is identified as green and the entered character color is identified as black, the green component is determined to be the primary color component to be selected. Then, the color component selection determination unit 303 drops the pre-printed color into the dropout 2
Output to the primary color component selection unit 305 of the binarization unit 104,
In addition, the information 320 of the preprinted color and the entered character color is converted into the component value thickening / lightening unit 306 of the dropout binarizing unit 104.
Output to.

【0032】前述した色識別部103における処理は、
1つのフィールドのカラー画像について行われて色の識
別を行う。そして、前述の色識別が行われた後、次に説
明するドロップアウト2値化部104により、同一のフ
ィールドのカラー画像のデータを用いて、プレ印刷色を
ドロップアウトした白黒の2値画像を生成する処理が行
われる。
The processing in the color identification section 103 described above is
Color identification is performed on the color image of one field. Then, after the above-described color identification is performed, the dropout binarization unit 104 described below uses the color image data of the same field to create a black-and-white binary image with the preprinted color dropped out. Processing to generate is performed.

【0033】図3に示すように、ドロップアウト2値化
部104は、原色成分選択部305、成分値の濃化・淡
化部306、画素色識別部308、濃淡2値化部307
から構成されている。原色成分選択部305は、色成分
選択判定部303の結果に従って、三原色成分、すなわ
ち、入力される各画素毎に青色成分310、緑色成分3
11、赤色成分312の中から1つの原色成分を単純に
選択してその濃淡値を出力する。
As shown in FIG. 3, the dropout binarization unit 104 includes a primary color component selection unit 305, a component value darkening / lightening unit 306, a pixel color identifying unit 308, and a grayscale binarizing unit 307.
It consists of According to the result of the color component selection determination unit 303, the primary color component selection unit 305 determines the three primary color components, that is, the blue component 310 and the green component 3 for each input pixel.
11. One primary color component is simply selected from the red component 312 and the gray value is output.

【0034】原色成分選択部305は、図10に示すよ
うに、入力された青色成分310、緑色成分311、赤
色成分312のうちから、色成分選択判定部303から
出力された色の種類情報1104に従って1つの原色成
分を選択して濃淡値1105として出力する。ここで
は、色の種類情報1104が赤色であれば、赤色成分3
10を濃淡値1105として出力する。また、もし、色
の種類情報1104が緑色であれば、緑色成分311を
濃淡値1105として出力する。さらに、もし、色の種
類情報1104が青色であれば、青色成分311を濃淡
値1105として出力する。
As shown in FIG. 10, the primary color component selection unit 305 selects from the input blue component 310, green component 311, and red component 312 the color type information 1104 output from the color component selection determination unit 303. Then, one primary color component is selected according to the above, and is output as a gray value 1105. Here, if the color type information 1104 is red, the red component 3
10 is output as the gray value 1105. If the color type information 1104 is green, the green component 311 is output as the gray value 1105. Further, if the color type information 1104 is blue, the blue component 311 is output as the gray value 1105.

【0035】なお、前述において、色成分選択判定部3
03から出力された色の種類情報1104が、プレ印刷
色として三原色成分のうち、例えば、赤色と青色との2
色を示している場合、原色成分選択部305は、入力さ
れる各画素の赤色成分と青色成分との最大値を選択し、
その最大値を濃淡値として出力してもよい。
In the above description, the color component selection determination unit 3
The color type information 1104 output from the printer 03 is, for example, 2 of red and blue among the three primary color components as preprinted colors.
When the color is indicated, the primary color component selection unit 305 selects the maximum value of the red component and the blue component of each input pixel,
The maximum value may be output as the gray value.

【0036】成分値の濃化・淡化部306は、入力され
た色の濃淡値の大きさを小さく(濃化)または大きく
(淡化)する処理を行う。このとき、画素色識別部30
8は、注目画素の色を識別し、該当する色の種類322
を濃化・淡化部306に送出する。濃化・淡化部306
は、プレ印刷色、記入文字色、注目画素の色が入力さ
れ、これらの入力された色の種類に従って、注目画素の
濃淡値の濃化または淡化を行う。例えば、もし、プレ印
刷色が赤色で、記入文字色が青色であって、注目画素が
赤色であれば、その注目画素を淡化する。すなわち、注
目画素の濃淡値を大きくし、白色に近づける。濃化・淡
化部306の出力である濃化・淡化された濃淡値は濃淡
2値化部307に入力され、2値画像に生成される。こ
の濃淡2値化部307は、例えば、特開平11−120
333号公報に開示されている方法により実現すること
ができる。
The component value darkening / lightening unit 306 performs processing for reducing (darkening) or increasing (lightening) the magnitude of the gray value of the input color. At this time, the pixel color identification unit 30
Reference numeral 8 identifies the color of the pixel of interest, and the corresponding color type 322
Is sent to the thickening / lightening section 306. Thickening / lightening section 306
The pre-printed color, the written character color, and the color of the pixel of interest are input, and the gray value of the pixel of interest is darkened or lightened according to the type of the input color. For example, if the preprinted color is red, the entered character color is blue, and the pixel of interest is red, the pixel of interest is dimmed. That is, the gray value of the pixel of interest is increased so that it becomes closer to white. The darkened / lightened gray value output from the darkening / lightening unit 306 is input to the light / dark binarization unit 307, and is generated as a binary image. The gradation binarization unit 307 is disclosed in, for example, Japanese Patent Laid-Open No. 11-120.
It can be realized by the method disclosed in Japanese Patent No. 333 publication.

【0037】図4は図2により説明したフローにおける
ステップ206でのプレ印刷・記入文字の色識別の処理
動作を説明する図であり、次に、これについて説明す
る。この処理は、プレ印刷の色識別、記入文字の色識別
のそれぞれについて、領域を設定して別々に実行され
る。
FIG. 4 is a diagram for explaining the processing operation of the color identification of the preprinted / written characters in step 206 in the flow described with reference to FIG. 2. Next, this will be described. This processing is performed separately by setting the area for each of the color identification of the preprint and the color identification of the written character.

【0038】(1)まず、フィールド内のカラー画像に
おける探索範囲を設定する。探索範囲は、例えば、図8
により説明したように、プレ印刷色の識別に用いる処理
領域803、804や記入文字色の識別に用いる処理領
域813である(ステップ400)。
(1) First, the search range in the color image in the field is set. The search range is, for example, FIG.
As described above, the processing areas 803 and 804 are used to identify the preprinted color and the processing area 813 is used to identify the written character color (step 400).

【0039】(2)次に、フィールド内に設定された領
域内の画像を走査する。走査の手順は、注目画素を横方
向、次いで、縦方向に走査し、画像を走査しながら、次
に説明するステップ403からステップ407までの処
理を繰り返して行われる(ステップ401)。
(2) Next, the image in the area set in the field is scanned. The scanning procedure is performed by scanning the pixel of interest in the horizontal direction and then in the vertical direction, and repeating the processing from step 403 to step 407 described below while scanning the image (step 401).

【0040】(3)画像を走査しながら、まず、注目画
素の色を判定する。ここでは、注目画素の色の種類とし
て、青色系、緑色系、赤色系、黒色系の4種類について
色識別を行って色の種類を求める(ステップ403)。
(3) While scanning the image, first, the color of the pixel of interest is determined. Here, as the color type of the pixel of interest, color identification is performed with respect to four types of blue type, green type, red type, and black type to obtain the type of color (step 403).

【0041】(4)次に、ステップ403で判定された
画素の色の個数を計数する。すなわち、ステップ403
で注目画素が青色と判定された場合、青色画素の個数を
1個増加させ、ステップ403で注目画素が緑色と判定
された場合、緑色画素の個数を1個増加させる。同様
に、ステップ403で注目画素が赤色、黒色と判定され
た場合、赤色画素の個数、黒色画素の個数を1個増加さ
せる(ステップ404〜407)。
(4) Next, the number of colors of pixels determined in step 403 is counted. That is, step 403
If the pixel of interest is determined to be blue in step 1, the number of blue pixels is increased by one, and if the pixel of interest is determined to be green in step 403, the number of green pixels is increased by one. Similarly, when it is determined in step 403 that the pixel of interest is red or black, the number of red pixels and the number of black pixels are increased by 1 (steps 404 to 407).

【0042】(5)次に、計数した青色画素、緑色画
素、赤色画素のそれぞれの個数に基づいて、プレ印刷や
記入文字の色種を決定する。ここでは、青色画素、緑色
画素、赤色画素、黒色画素の個数の内、最大の個数を有
する色を対象の色種と決定し、処理を終了する(ステッ
プ402)。
(5) Next, the color type of pre-printing or written characters is determined based on the counted numbers of blue pixels, green pixels, and red pixels. Here, the color having the maximum number among the blue pixel, the green pixel, the red pixel, and the black pixel is determined as the target color type, and the process ends (step 402).

【0043】図5は文字読み取り部107における文字
読み取りの処理動作を説明する図であり、次に、これに
ついて説明す。
FIG. 5 is a diagram for explaining a character reading processing operation in the character reading unit 107, which will be described next.

【0044】(1)まず、設定されたフィールド内の2
値画像を入力し、文字の並びである文字行を抽出する、
そして、文字を切り出す(ステップ500〜502)。 (2)切り出した文字の文字認識を行い、知識処理を行
う。知識処理は、予め、住所や姓名の辞書を用意してお
き、文字認識結果と辞書中の住所や姓名との突き合わせ
を行い、認識精度を向上させる処理である(ステップ5
03、504)。
(1) First, 2 in the set field
Input the value image and extract the character line that is the sequence of characters.
Then, the character is cut out (steps 500 to 502). (2) Character recognition of the cut out characters is performed and knowledge processing is performed. The knowledge process is a process of preparing a dictionary of addresses and surnames in advance and matching the character recognition result with the addresses and surnames in the dictionary to improve the recognition accuracy (step 5).
03, 504).

【0045】図6は処理対象であるカラー帳票の例を説
明する図であり、次に、これについて説明する。
FIG. 6 is a diagram for explaining an example of a color form to be processed, which will be described next.

【0046】カラー帳票600には、例えば、図6に示
すように、枠601、603、608が印刷されてお
り、図示例では、枠601に文字602が記入されてい
る。また、枠603にプレ印刷文字604、605が予
め印刷され、また、文字606、607が記入されてい
る。さらに、枠608に文字609が記入されている。
図に示す例のように、記入文字とプレ印刷とが接触して
いる帳票や、重なっている帳票がある。例えば、図に示
す例では、記入文字602と枠601とが重なってい
る。また、記入文字606、607とプレ印刷604、
605とが重なっている。プレ印刷と記入文字とが接触
している場合や、重なっている場合、文字読み取りの障
害となる。そのため、プレ印刷をドロップアウトする必
要がある。
For example, as shown in FIG. 6, frames 601, 603, and 608 are printed on the color form 600, and in the illustrated example, characters 602 are written in the frame 601. Further, preprinted characters 604 and 605 are printed in advance in the frame 603, and characters 606 and 607 are entered. Further, a character 609 is entered in the frame 608.
As in the example shown in the figure, there are forms in which written characters are in contact with preprints, and forms that overlap. For example, in the example shown in the figure, the written character 602 and the frame 601 overlap. In addition, the input characters 606 and 607 and the preprint 604,
It overlaps with 605. If the preprint and the written characters are in contact with each other or if they overlap, the reading of characters will be hindered. Therefore, it is necessary to drop out the preprint.

【0047】ここで、一例として、枠601が赤色で、
記入文字602が青色であるフィールドや、枠603と
プレ印刷604、605が緑色であるフィールドにおい
て、プレ印刷である枠601、603、プレ印刷文字6
04、605をドロップアウトし、すなわち白色とし、
記入文字602、606、607を黒色とする。なお、
枠608の色と記入文字609の色とが同色の場合、本
発明の実施形態での色情報を利用したプレ印刷のドロッ
プアウトの適用対象外である。記入文字609の色とプ
レ印刷の枠608の色とが同色の例として、記入文字6
09が緑色でプレ印刷の枠608が緑色の場合や、記入
文字609が黒色でプレ印刷の枠608が黒色の場合が
ある。このように、同色の場合、プレ印刷のドロップア
ウトを行うことは困難であり、同色の場合、図2により
説明したフローのステップ207の処理で、プレ印刷、
記入文字とも黒色として出力され。
Here, as an example, the frame 601 is red,
In the field in which the input character 602 is blue or the field in which the frame 603 and the preprints 604 and 605 are green, the preprinted frames 601 and 603 and the preprint character 6
04 and 605 are dropped out, that is, white,
The written characters 602, 606, 607 are black. In addition,
When the color of the frame 608 and the color of the written character 609 are the same, the preprint dropout using the color information in the embodiment of the present invention is not applicable. As an example in which the color of the entered character 609 and the color of the preprinted frame 608 are the same, the entered character 6
In some cases, 09 is green and the preprinted frame 608 is green, or the entered characters 609 are black and the preprinted frame 608 is black. As described above, in the case of the same color, it is difficult to perform the preprint dropout, and in the case of the same color, the preprint is performed by the process of step 207 of the flow described with reference to FIG.
The entered characters are output as black.

【0048】図7は本発明の実施形態による画像処理を
行って得られる結果としての2値画像の例を説明する図
である。この図7に示す例は、図6により説明したカラ
ー帳票600のカラー画像からプレ印刷をドロップアウ
トした結果の2値画像を700として示している。図示
の2値画像700は、図6における記入文字602、6
06、607が、記入文字701、702、703とし
て黒色に処理され、プレ印刷601、603、604、
605がドロップアウトされ白色となっている。一方、
プレ印刷608、記入文字609は、同色のため2値画
像700ではドロップアウトされず、どちらも黒色に表
現される。
FIG. 7 is a diagram illustrating an example of a binary image as a result obtained by performing image processing according to the embodiment of the present invention. In the example shown in FIG. 7, the binary image resulting from the preprinting dropout from the color image of the color form 600 described with reference to FIG. 6 is shown as 700. The binary image 700 shown in the figure is the input characters 602, 6 in FIG.
06 and 607 are processed as black as the written characters 701, 702 and 703, and preprinted 601, 603 and 604,
605 is dropped out and is white. on the other hand,
Since the preprint 608 and the written character 609 have the same color, they are not dropped out in the binary image 700, and both are represented in black.

【0049】図9は図4により説明した画素の色判定の
ステップ403での処理動作の詳細を説明するフローチ
ャートであり、次に、これについて説明する。
FIG. 9 is a flow chart for explaining the details of the processing operation in step 403 of the pixel color judgment described with reference to FIG. 4, and this will be described next.

【0050】(1)まず、注目画素の3原色成分、すな
わち、赤色成分値R、緑色成分値G、青色成分値Bを入
力する。なお、一般に、画素の色成分は、8ビットの情
報でその大きさが表現され、R、G、Bのそれぞれの
は、0〜225の値をとる(ステップ900)。
(1) First, the three primary color components of the target pixel, that is, the red component value R, the green component value G, and the blue component value B are input. Generally, the size of the color component of a pixel is represented by 8-bit information, and each of R, G, and B takes a value of 0 to 225 (step 900).

【0051】(2)次に、赤色成分値Rと他の成分値と
の大小を比較し、R>a・G、かつ、R>a・Bの条件
を満たしているか否かを判定し、条件を満たしている場
合、その注目画素を赤色として登録する。なお、上式に
おいて、aは1以上の予め定めて定数であり、以後のス
テップにおいても、同様である。そして、この定数aを
大きな値に設定すると純粋な色、この場合純粋な赤だけ
が赤として判定される(ステップ901、902)。
(2) Next, the magnitudes of the red component value R and other component values are compared to determine whether or not the conditions of R> a · G and R> a · B are satisfied, If the condition is satisfied, the pixel of interest is registered as red. In the above equation, a is a predetermined constant of 1 or more, and the same applies to subsequent steps. When this constant a is set to a large value, pure color, in this case only pure red, is determined as red (steps 901 and 902).

【0052】(3)ステップ901の判定で、条件を満
たしていなかった場合、次に、緑色成分値Gと他の成分
値との大小を比較し、G>a・R、かつ、G>a・Bの
条件を満たしているか否かを判定し、条件を満たしてい
る場合、その注目画素を緑色として登録する(ステップ
903、904)。
(3) If the condition is not satisfied in the judgment of step 901, then the green component value G is compared with the other component values to determine G> a · R and G> a. It is determined whether or not the condition B is satisfied, and if the condition is satisfied, the pixel of interest is registered as green (steps 903 and 904).

【0053】(4)ステップ903の判定で、条件を満
たしていなかった場合、前述と同様に、青色成分値Bと
他の成分値との大小を比較し、B>a・R、かつ、B>
a・Gの条件を満たしているか否かを判定し、条件を満
たしている場合、その注目画素を青色として登録する
(ステップ905、906)。
(4) If the condition is not satisfied in the determination in step 903, the blue component value B is compared with the other component values in the same manner as described above, and B> a · R and B >
It is determined whether or not the condition of a · G is satisfied, and if the condition is satisfied, the pixel of interest is registered as blue (steps 905 and 906).

【0054】(5)さらに、ステップ905の判定で、
条件を満たしていなかった場合、次に、赤色成分値R、
緑色成分値G、青色成分値Bが共に、予め定めた所定値
cより小さく(R、G、B<c)、かつ、赤色成分値
R、緑色成分値G、青色成分値Bの最大値が最小値にあ
る定数dを乗じた値より小さい(Max(R,G,B)
<d・Min(R,G,B))か否か、すなわち、3原
色成分値が共に小さく、かつ、それらの値がほぼ同じで
あるか否かを判定し、3原色成分値が共に小さく、か
つ、それらの値がほぼ同じである場合に、その注目画素
を黒色として登録して処理を終了する(ステップ90
7、908)。
(5) Further, in the judgment of step 905,
If the condition is not satisfied, then the red component value R,
Both the green component value G and the blue component value B are smaller than a predetermined value c (R, G, B <c), and the maximum values of the red component value R, the green component value G, and the blue component value B are Less than the value obtained by multiplying the minimum value by a constant d (Max (R, G, B)
<D · Min (R, G, B)), that is, whether the values of the three primary color components are both small, and those values are substantially the same, and the values of the three primary color components are both small. , And if those values are substantially the same, the pixel of interest is registered as black and the process ends (step 90).
7, 908).

【0055】図11は図3における成分値の濃化・淡化
部306の構成を示すブロック図、図12は濃化・淡化
処理種類の決定に使用する濃化・淡化処理決定用の参照
テーブルの例を説明する図であり、次に、これらについ
て説明する。図11において、1200は濃化・淡化処
理種類の決定部、1201は濃化用乗算部、1202は
淡化用乗算部、1203は選択部である。
FIG. 11 is a block diagram showing the structure of the component value thickening / lightening unit 306 in FIG. 3, and FIG. 12 is a reference table for thickening / lightening process determination used to determine the type of thickening / lightening process. It is a figure explaining an example, and these are explained next. In FIG. 11, reference numeral 1200 is a darkening / lightening processing type determining unit, 1201 is a darkening multiplying unit, 1202 is a lightening multiplying unit, and 1203 is a selecting unit.

【0056】成分値の濃化・淡化部306は、図11に
示すように、濃化・淡化処理種類の決定部1200と、
濃化用乗算部1201と、淡化用乗算部1202と、選
択部1203とを備えて構成される。そして、原色成分
選択部305からの出力である濃淡値321と、色成分
選択判定部303からの記入文字色及びプレ印刷色の情
報320と、画素色識別部308からの注目画素の色情
報322とが図11に示す成分値の濃化・淡化部306
に入力される。
As shown in FIG. 11, the component value thickening / lightening unit 306 includes a thickening / lightening processing type determining unit 1200.
It includes a thickening multiplication unit 1201, a lightening multiplication unit 1202, and a selection unit 1203. Then, the gray value 321 output from the primary color component selection unit 305, the written character color and preprinted color information 320 from the color component selection determination unit 303, and the color information 322 of the pixel of interest from the pixel color identification unit 308. Is a component value thickening / lightening unit 306 shown in FIG.
Entered in.

【0057】濃化・淡化処理種類の決定部1200は、
プレ印刷色及び記入色の情報320、注目画素の色情報
322を用いて、入力された濃淡値321の濃化出力ま
たは淡化出力、あるいは、入力と同値を出力のいずれを
選択するかを濃化・淡化処理決定用の参照テーブル13
00を参照して決定する。
The darkening / lightening processing type determining unit 1200
Using the information 320 of the preprinted color and the entered color and the color information 322 of the pixel of interest, the darkening or lightening output of the input gray value 321 or the darkening of the selection of the same value as the input is output. .Reference table 13 for determining thinning processing
00 to determine.

【0058】濃化・淡化処理種類の決定部1200にお
いて使用する濃化・淡化処理決定用の参照テーブルは、
図12に示すように構成されており、横の項目1340
は、プレ印刷色の種類を示し、プレ印刷色が赤色130
1、緑色1302、青色1303、黒色1304の場合
を示す。また、縦の項目1342は、記入文字色の種類
を示し、記入文字色が赤色1305、緑色1306、青
色1307、黒色1308の場合を示す。さらに、縦の
細分項目1341は、注目画素色の種類を示し、記入文
字色のそれぞれに対して、注目画素の色が赤色131
0、緑色1311、青色1312、黒色1313の場合
がある。
The reference table for determining the darkening / lightening processing used in the darkening / lightening processing type determination unit 1200 is
It is configured as shown in FIG. 12 and has a horizontal item 1340.
Indicates the type of pre-print color, and the pre-print color is red 130
The case of 1, green 1302, blue 1303, and black 1304 is shown. The vertical item 1342 indicates the type of the written character color, and shows the case where the written character color is red 1305, green 1306, blue 1307, and black 1308. Further, the vertical subdivision item 1341 indicates the type of the target pixel color, and the color of the target pixel is red 131 for each of the entered character colors.
0, green 1311, blue 1312, and black 1313 in some cases.

【0059】そして、図示参照テーブル1300には、
プレ印刷色、記入文字色、注目画素色のそれぞれの組の
場合に、濃化、淡化、同値の3種類を示す内容が予め、
記憶格納されている。例えば、プレ印刷色1304が緑
色1302で記入文字色1342が赤色1305の場
合、もし注目画素色が赤色1310の場合、1320に
示す濃化処理を濃化・淡化処理の種類として選択する。
また、もし、注目画素色が緑色1311の場合、132
1に示す淡化処理を濃化・淡化処理の種類として選択す
る。もし、注目画素色が青色1312、または、黒色1
313の場合、濃化・淡化処理の種類として同値、即
ち、濃化、淡化は行わず、そのままの値を出力するよう
決定する。
Then, in the illustrated lookup table 1300,
In the case of each set of the preprinted color, the entered character color, and the pixel color of interest, the contents indicating three types of darkening, lightening, and the same value are set in advance.
Stored in memory. For example, if the preprinted color 1304 is green 1302 and the entered character color 1342 is red 1305, and if the pixel color of interest is red 1310, the thickening processing indicated by 1320 is selected as the type of darkening / lightening processing.
If the pixel color of interest is green 1311, 132
The lightening process shown in 1 is selected as the type of the darkening / lightening process. If the target pixel color is blue 1312 or black 1
In the case of 313, it is determined that the same value as the type of the thickening / lightening processing, that is, the thickening / lightening is not performed and the value is output as it is.

【0060】濃化用乗算部1201は、入力された濃淡
値321に所定の値を乗算し、濃淡値を小さく、すなわ
ち、濃い濃度を出力する。また、淡化用乗算部1202
は、入力された濃淡値321に所定の値を乗算し、濃淡
値を大きく、すなわち、淡い濃度を出力する。選択部1
203は、濃化・淡化処理種類の決定部1200の結果
出力に従って、入力された濃淡値321の濃化出力また
は淡化出力、あるいは、入力と同値を出力のいずれかを
選択して1213として出力する。
The darkening multiplication unit 1201 multiplies the inputted gray value 321 by a predetermined value to reduce the gray value, that is, outputs a dark density. Further, the thinning multiplication unit 1202
Multiplies the input gray value 321 by a predetermined value to increase the gray value, that is, output a light density. Selector 1
Reference numeral 203 designates either the thickened output or the lightened output of the inputted gray value 321 or the same value as the input according to the result output of the darkening / lightening processing type determination unit 1200, and outputs it as 1213. .

【0061】前述までに説明した本発明の実施形態は、
読み取るべき帳票のプレ印刷色、記入文字色を自動的に
識別して処理を行うものとして説明したが、本発明は、
プレ印刷色、記入文字色を予め読み取り帳票の種類を示
す帳票識別番号に含ませておき、帳票識別番号を読み取
って読み取り帳票の種類を設定することもできる。この
場合、図1に示す色識別ドロップアウト2値化部102
をプレ印刷ドロップアウト2値化部104だけで構成す
ることができる。
The embodiment of the present invention described above is
Although it has been described that the preprinted color and the written character color of the form to be read are automatically identified and processed, the present invention is
It is also possible to include the preprinted color and the entered character color in advance in the form identification number indicating the type of the read form, and read the form identification number to set the type of the read form. In this case, the color identification dropout binarization unit 102 shown in FIG.
Can be configured only by the pre-print dropout binarization unit 104.

【0062】図13は帳票識別番号を読み取って読み取
り帳票の種類を設定する場合の本発明の他の実施形態に
よる文字読み取りシステムにおける画像処理部101及
び文字読み取り部107での処理動作を説明するフロー
チャートであり、次に、これについて説明する。なお、
この処理は、図2により説明したフローにおけるステッ
プ204の処理でリジェクトと判定された後に行われる
ことになる。
FIG. 13 is a flowchart for explaining the processing operation in the image processing unit 101 and the character reading unit 107 in the character reading system according to another embodiment of the present invention when the form identification number is read and the type of the read form is set. Then, this will be described below. In addition,
This process is performed after it is determined to be rejected in the process of step 204 in the flow described with reference to FIG.

【0063】(1)まず、対象となるの帳票の種類を設
定する。ここでは、帳票に記載されている帳票識別番号
を読み取って帳票の種類を設定してもよく、あるいは、
帳票画像から枠線の配置を抽出し、予め用意している枠
線の配置と照合する帳票識別とにより、帳票の種類を設
定してもよい(ステップ1000)。
(1) First, the type of target form is set. Here, the form identification number written on the form may be read to set the form type, or
The layout of frame lines may be extracted from the form image, and the type of form may be set based on the layout of the frame lines prepared in advance and the form identification to be compared (step 1000).

【0064】(2)次に、ステップ1000で設定した
帳票の種類毎に予め用意されている書式情報、すなわ
ち、フォーマット情報を入力する。フォーマット情報と
しては、フィールドの位置座標、プレ印刷色や記入色等
が予め、帳票毎に用意されているものを用いる(ステッ
プ1001)。
(2) Next, the format information prepared in advance for each form type set in step 1000, that is, the format information is input. As the format information, the position coordinates of the field, the preprint color, the entry color, and the like are prepared in advance for each form (step 1001).

【0065】(3)次に、フォーマット情報として設定
されているフィールドが尽きるまで、次に説明するステ
ップ1003〜ステップ1008までの処理を繰り返し
て、処理を終了する(ステップ1002)。
(3) Next, the processes from step 1003 to step 1008 described below are repeated until the fields set as the format information are exhausted, and the process ends (step 1002).

【0066】(4)フォーマット情報からそのフィール
ドの位置座標を設定し、また、フォーマット情報からそ
のフィールドのプレ印刷色を設定する。さらに、フォー
マット情報からそのフィールドの記入文字色を設定する
(ステップ1003〜1005)。
(4) The position coordinates of the field are set from the format information, and the pre-printing color of the field is set from the format information. Further, the written character color of the field is set from the format information (steps 1003 to 1005).

【0067】(5)次に、フィールド内のカラー画像を
入力し、先に設定したプレ印刷色と記入文字色とを用い
てプレ印刷色をドロップアウトする2値化処理を行う。
そして、2値化画像に対してフィールド内の文字読み取
りを行う(ステップ1006〜1008)。
(5) Next, the color image in the field is input, and binarization processing is performed to drop out the pre-print color using the pre-print color and the entered character color set previously.
Then, the characters in the field are read from the binarized image (steps 1006 to 1008).

【0068】前述した本発明の実施形態による処理は、
処理プログラムとして構成することができ、この処理プ
ログラムは、HD、DAT、FD、MO、DVD−RO
M、CD−ROM等の記録媒体に格納して提供すること
ができる。
The processing according to the embodiment of the present invention described above is
It can be configured as a processing program, and this processing program is HD, DAT, FD, MO, DVD-RO.
It can be provided by being stored in a recording medium such as an M or a CD-ROM.

【0069】前述したように、本発明の実施形態によれ
ば、フィールド内のカラー画像からプレ印刷・記入文字
の色を識別する手段と、識別したプレ印刷色をドロップ
アウトした2値化画像を生成する手段とを備え、ドロッ
プアウトした2値化画像に対して文字読み取りを再試行
しているので、プレ印刷と記入文字とが重なったフィー
ルドでの文字読み取りの信頼性を向上させることができ
る。また、プレ印刷色をドロップアウトした2値化画像
を生成する手段のみを備えるより処理時間の軽減を図る
ことができる。
As described above, according to the embodiment of the present invention, the means for identifying the color of the preprinted / written character from the color image in the field and the binarized image in which the identified preprinted color is dropped out are provided. Since the character reading is retried for the dropped-out binarized image, the reliability of the character reading in the field where the preprint and the written character overlap can be improved. . Further, it is possible to reduce the processing time by providing only a unit for generating a binarized image in which the preprinted color is dropped out.

【0070】また、本発明の実施形態によれば、帳票内
のフィールドのプレ印刷色と記入文字色を設定する手段
を備えているため、帳票毎、また、フィールド毎にプレ
印刷色が異なっている帳票でもプレ印刷をドロップアウ
トすることができ、文字読み取りの信頼性を向上させる
ことができる。さらに、プレ印刷色を基にカラー画像の
3原色成分から単色成分または複数成分の最大値を選択
して濃淡画像を生成する手段と、プレ印刷色と記入文字
色と注目画素色とを基に当該濃淡画像を濃化または淡化
する手段とを備えているため、単色のカラードロップア
ウトや、複数色、例えば、赤色と青色との同時ドロップ
アウトに濃淡値を用いることができ、カラードロップア
ウト画像の画質を向上させることができる。
Further, according to the embodiment of the present invention, since the means for setting the preprinted color and the entered character color of the field in the form are provided, the preprinted color is different for each form and each field. Pre-printing can be dropped out even on the existing forms, and the reliability of character reading can be improved. Further, based on the preprinted color, the written character color, and the target pixel color, means for generating a grayscale image by selecting the maximum value of a single color component or a plurality of components from the three primary color components of the color image based on the preprinted color. Since a means for darkening or lightening the grayscale image is provided, a grayscale value can be used for a single color color dropout or a plurality of colors, for example, simultaneous dropout of red and blue, and a color dropout image The image quality of can be improved.

【0071】また、本発明の実施形態によれば、帳票画
像のフィールド毎に、プレ印刷色または記入文字色を帳
票書式として予め登録する手段と、フィールド毎に、登
録しているフィールドのプレ印刷色または記入文字色を
読み出す手段を備えているため、書式が既知である帳票
に対して、カラードロップアウト画像の画質を向上させ
ることができる。
Further, according to the embodiment of the present invention, means for pre-registering the pre-printing color or the entered character color as the form format for each field of the form image, and the pre-printing of the registered field for each field Since the means for reading out the color or the written character color is provided, it is possible to improve the image quality of the color dropout image for a form whose format is known.

【0072】さらに、本発明の実施形態によれば、帳票
画像のフィールド毎に、フィールド内に探索領域を複数
個設定する手段と、所定の探索領域内でプレ印刷色を識
別する手段、または、別の所定の探索領域内で記入文字
色を識別する手段を備えているため、プレ印刷色に関す
る書式が未知である帳票に対しても、カラードロップア
ウトができるという効果を得ることができる。
Further, according to the embodiment of the present invention, means for setting a plurality of search areas in each field of the form image, means for identifying the preprinted color in the predetermined search area, or Since the means for identifying the written character color in another predetermined search area is provided, it is possible to obtain the effect that color dropout can be performed even for a form whose format relating to the preprinted color is unknown.

【0073】なお、前述までに説明した本発明の他の実
施の態様を記せば、次の通りである。
The other embodiments of the present invention described above are as follows.

【0074】1.帳票画像のフィールドから文字読み取
りのための白黒2値化画像を生成する画像処理装置にお
いて、フィールド内のカラー画像から3原色成分の最小
値に対する2値化を行う2値化画像生成手段と、フィー
ルド内のカラー画像からプレ印刷色をドロップアウトし
た2値化画像を生成する手段とを備えたことを特徴とす
る画像処理装置。
1. In an image processing apparatus for generating a black-and-white binary image for reading characters from a field of a form image, a binary image generating means for binarizing a minimum value of three primary color components from a color image in the field, and the field And a unit for generating a binarized image in which a preprinted color is dropped out from the color image in the image processing apparatus.

【0075】2.帳票画像のフィールドから文字読み取
りのための白黒2値化画像を生成する画像処理装置にお
いて、フィールド内のカラー画像から3原色成分の最小
値に対する2値化を行う2値化画像生成手段と、フィー
ルド内のカラー画像からプレ印刷色をドロップアウトし
た2値化画像を生成する手段とを備え、前記フィールド
内のカラー画像からプレ印刷色をドロップアウトした2
値化画像を生成する手段は、帳票フィールド内のプレ印
刷色または記入文字色を設定する手段と、プレ印刷色を
基にカラー画像の3原色成分から単色成分または複数成
分の最大値を選択して濃淡画像を生成する手段と、プレ
印刷色と記入文字色と注目画素色とを基に前記濃淡画像
を濃化または淡化する手段と、濃化または淡化した濃淡
画像を閾値により白黒2値化する手段とにより構成され
ることを特徴とする画像処理装置。
2. In an image processing apparatus for generating a black-and-white binary image for reading characters from a field of a form image, a binary image generating means for binarizing a minimum value of three primary color components from a color image in the field, and the field Means for generating a binarized image in which the preprinted color is dropped out from the color image in the field, and the preprinted color is dropped out from the color image in the field.
A means for generating a binarized image is a means for setting a preprinted color or a written character color in a form field, and selecting the maximum value of a single color component or a plurality of components from three primary color components of a color image based on the preprinted color. Means for generating a grayscale image, a means for darkening or graying the grayscale image based on the preprinted color, the written character color and the pixel color of interest, and a binarization of the grayscale image which has been darkened or darkened with a threshold value. And an image processing device.

【0076】3.前記帳票のプレ印刷色または記入文字
色を設定する手段は、帳票画像のフィールド毎に、プレ
印刷色または記入文字色を帳票書式として予め登録する
手段と、フィールド毎に、登録している当該フィールド
のプレ印刷色または記入文字色を読み出す手段とにより
構成されることを特徴とする請求項2記載の画像処理装
置。
3. The means for setting the preprinted color or the entered character color of the form is a means for preregistering the preprinted color or the entered character color as a form format for each field of the form image, and the registered field for each field. 3. The image processing apparatus according to claim 2, further comprising means for reading out the preprinted color or the written character color.

【0077】4.前記帳票のプレ印刷色または記入文字
色を設定する手段は、帳票画像のフィールド毎に、フィ
ールド内に探索領域を複数個設定する手段と、所定の探
索領域内でプレ印刷色を識別する手段、または、別の所
定の探索領域内で記入文字色を識別する手段とにより構
成されることを特徴とする請求項2記載の画像処理装
置。
4. The means for setting the preprinted color or the entered character color of the form, for each field of the form image, means for setting a plurality of search areas in the field, means for identifying the preprinted color in the predetermined search area, 3. The image processing apparatus according to claim 2, further comprising means for identifying a written character color in another predetermined search area.

【0078】5.帳票画像のフィールドから生成された
白黒2値化画像を読み取る文字読み取り装置と、帳票画
像のフィールドから白黒2値化画像を生成する画像処理
装置とを備えた文字読み取りシステムにおいて、前記画
像処理装置は、フィールド内のカラー画像から3原色成
分の最小値に対する2値化を行う2値化画像生成手段
と、フィールド内のカラー画像からプレ印刷色をドロッ
プアウトした2値化画像を生成する手段と、前記文字読
み取り装置に、前記3原色成分の最小値に対する2値化
を行う2値化画像生成手段からの2値化画像の読み取り
を行わせ、その結果がリジェクトであった場合に、前記
カラー画像からプレ印刷色をドロップアウトした2値化
画像を生成する手段からの2値化画像の読み取りを再試
行させる手段とを備えたことを特徴とする文字読み取り
システム。
5. In a character reading system including a character reading device for reading a black-and-white binary image generated from a field of a form image and an image processing device for generating a black-and-white binary image from a field of the form image, the image processing device comprises: , A binarized image generating means for binarizing the minimum value of the three primary color components from the color image in the field, and means for generating a binarized image in which the preprinted color is dropped out from the color image in the field, The character reading device is caused to read the binarized image from the binarized image generating means for binarizing the minimum value of the three primary color components, and when the result is reject, the color image is read. And a means for retrying the reading of the binarized image from the means for generating the binarized image in which the preprinted color is dropped out. Character reading system that.

【0079】[0079]

【発明の効果】以上説明したように本発明によれば、処
理対象とするカラー帳票において、枠線等のプレ印刷の
色と記入文字の色とが異なるような帳票画像に対して、
プレ印刷と記入文字とが接触あるいは重なっていても、
プレ印刷を消去し、記入文字を残した2値画像を生成す
ることができ、精度の高い文字認識を行わせることがで
きる。
As described above, according to the present invention, in the color form to be processed, the form image in which the color of the preprint such as a frame line and the color of the written character are different,
Even if the preprint and the written characters touch or overlap,
Pre-printing can be erased and a binary image in which the written characters are left can be generated, and highly accurate character recognition can be performed.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施形態による画像処理装置を含む
文字読み取りシステムの構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of a character reading system including an image processing apparatus according to an embodiment of the present invention.

【図2】図1に示す文字読み取りシステムにおける画像
処理部及び文字読み取り部での処理動作を説明するフロ
ーチャートである。
FIG. 2 is a flowchart illustrating a processing operation in an image processing unit and a character reading unit in the character reading system shown in FIG.

【図3】色識別ドロップアウト2値化部の構成を示すブ
ロック図である。
FIG. 3 is a block diagram showing a configuration of a color identification dropout binarization unit.

【図4】図2により説明したフローにおけるステップ2
06でのプレ印刷・記入文字の色識別の処理動作を説明
する図である。
FIG. 4 is step 2 in the flow described with reference to FIG.
It is a figure explaining the processing operation of the color identification of the preprinting / writing character in 06.

【図5】文字読み取り部における文字読み取りの処理動
作を説明する図である。
FIG. 5 is a diagram illustrating a character reading processing operation in a character reading unit.

【図6】処理対象であるカラー帳票の例を説明する図で
ある。
FIG. 6 is a diagram illustrating an example of a color form to be processed.

【図7】本発明の実施形態による画像処理を行って得ら
れる結果としての2値画像の例を説明する図である。
FIG. 7 is a diagram illustrating an example of a binary image as a result obtained by performing image processing according to the embodiment of the present invention.

【図8】フィールド内のプレ印刷と記入文字との色を識
別する領域を説明する図である。
FIG. 8 is a diagram illustrating an area for identifying a color of a preprint and a written character in a field.

【図9】図4により説明した画素の色判定のステップ4
03での処理動作の詳細を説明するフローチャートであ
る。
FIG. 9: Step 4 of pixel color determination described with reference to FIG.
3 is a flowchart for explaining the details of the processing operation in 03.

【図10】図3における原色成分選択部の構成を示す図
である。
10 is a diagram showing a configuration of a primary color component selection unit in FIG.

【図11】図3における成分値の濃化・淡化部の構成を
示すブロック図である。
11 is a block diagram showing a configuration of a component value thickening / lightening unit in FIG. 3;

【図12】濃化・淡化処理種類の決定に使用する濃化・
淡化処理決定用の参照テーブルの例を説明する図であ
る。
[FIG. 12] Concentration used to determine the type of thickening / lightening
It is a figure explaining the example of the reference table for lightening process determination.

【図13】本発明の他の実施形態による文字読み取りシ
ステムにおける処理動作を説明するフローチャートであ
る。
FIG. 13 is a flowchart illustrating a processing operation in a character reading system according to another embodiment of the present invention.

【符号の説明】[Explanation of symbols]

100 カラー画像スキャナ 101 画像処理部 102 色識別ドロップアウト2値化部 103 プレ印刷・記入文字の色識別部 104 プレ印刷ドロップアウト2値化部 105 3原色成分最小値2値化部 106 制御部 107 文字読み取り部 108 画像蓄積部 109 ネットワーク 301 プレ印刷色識別部 302 記入文字色識別部 303 色成分選択判定部 305 原色成分選択部 306 成分値の濃化・淡化部 307 2値化部 308 画素識別部 1200 濃化・淡化処理種類の決定部 1201 濃化用乗算部 1202 淡化用乗算部 1203 選択部 100 color image scanner 101 image processing unit 102 Color identification dropout binarization unit 103 Pre-printing / coloring character identification area 104 Pre-print dropout binarization unit 105 3 primary color component minimum value binarization unit 106 control unit 107 character reading unit 108 image storage unit 109 network 301 Pre-print color identification section 302 Input color color identification section 303 Color component selection judgment unit 305 Primary color component selection section 306 Component value darkening / lightening part 307 binarization unit 308 pixel identification unit 1200 Densation / lightening processing type determination unit 1201 Concentration multiplication unit 1202 Lightening multiplication unit 1203 Selector

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 1/60 H04N 1/46 Z Fターム(参考) 5B029 CC26 5B050 BA06 BA16 BA20 CA07 DA02 DA04 DA06 EA02 EA04 EA09 5B057 AA11 BA02 BA11 CA01 CA08 CA12 CA16 CB01 CB06 CB08 CB12 CB16 CE12 CE16 DB02 DB06 DB09 DC25 5C077 LL20 MP08 PP21 PP32 PQ22 RR02 5C079 HB01 LA02 LA34 LA39 MA01 NA29 ─────────────────────────────────────────────────── ─── Continuation of front page (51) Int.Cl. 7 Identification code FI theme code (reference) H04N 1/60 H04N 1/46 ZF term (reference) 5B029 CC26 5B050 BA06 BA16 BA20 CA07 DA02 DA04 DA06 EA02 EA04 EA09 5B057 AA11 BA02 BA11 CA01 CA08 CA12 CA16 CB01 CB06 CB08 CB12 CB16 CE12 CE16 DB02 DB06 DB09 DC25 5C077 LL20 MP08 PP21 PP32 PQ22 RR02 5C079 HB01 LA02 LA34 LA39 MA01 NA29

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 入力された帳票画像のプレ印刷色と記入
文字色とを設定するステップと、前記プレ印刷色と前記
記入文字色とに基づいて2値化する色を判別するステッ
プと、前記帳票画像かせ前記プレ印刷色をドロップアウ
トするステップと、前記ドロップアウト後の画像を前記
判別された色で2値化するするステップと、前記2値化
された画像に対して文字認識を行うステップとを情報機
器に実行させることを特徴とするプログラム。
1. A step of setting a preprint color and a written character color of an input form image; a step of discriminating a color to be binarized based on the preprinted color and the written character color; Form image skeleton Dropping out the preprinted color, binarizing the image after the dropout with the determined color, and performing character recognition on the binarized image A program that causes an information device to execute and.
【請求項2】 前記プレ印刷色と前記記入文字色とは、
前記帳票画像のフィールド毎に設定されることを特徴と
する請求項1記載のプログラム。
2. The preprinted color and the written character color are
The program according to claim 1, which is set for each field of the form image.
【請求項3】 前記帳票のプレ印刷色または記入文字色
の設定は、帳票画像のフィールド毎に、プレ印刷色また
は記入文字色を帳票書式として予め登録し、フィールド
毎に、登録している当該フィールドのプレ印刷色または
記入文字色を読み出して行われることを特徴とする請求
項2記載のプログラム。
3. The preprinted color or the entered character color of the form is set in advance by registering the preprinted color or the entered character color as a form format for each field of the form image. 3. The program according to claim 2, which is executed by reading out a preprinted color or a written character color of the field.
【請求項4】 入力された帳票画像を3原色成分の最小
値に対して2値化を行うステップと、前記2値化画像の
文字認識を行うステップと、前記認識文字がリジェクト
された場合に、前記帳票画像のプレ印刷色をドロップア
ウトして再度文字認識を行うステップとを情報機器に実
行させることを特徴とするプログラム。
4. A step of binarizing an input form image with respect to a minimum value of three primary color components, a step of recognizing a character of the binarized image, and a case of recognizing the recognized character. A program for causing an information device to execute the step of dropping out a preprinted color of the form image and performing character recognition again.
【請求項5】 入力された帳票画像についての文字認識
を行う手段と、前記文字認識がリジェクトされた場合
に、前記帳票画像の文字記入色とプレ印刷色とを判定す
る手段と、前記帳票画像の文字記入色とプレ印刷色とか
ら2値化する原色成分を判定する手段と、前記帳票画像
から判定されたプレ印刷色をドロップアウトし、前記原
色成分を2値化する手段と、前記2値化画像の文字認識
を行う手段とを有することを特徴とする画像処理装置。
5. A means for performing character recognition on an input form image, a means for determining a character entry color and a pre-print color of the form image when the character recognition is rejected, and the form image. Means for determining a primary color component to be binarized from the character entry color and the preprinted color, means for dropping out the preprinted color determined from the form image, and binarizing the primary color component; An image processing apparatus, comprising: means for recognizing a character of a binarized image.
JP2001397674A 2001-12-27 2001-12-27 Image processing program and image processing apparatus Expired - Lifetime JP3955467B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001397674A JP3955467B2 (en) 2001-12-27 2001-12-27 Image processing program and image processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001397674A JP3955467B2 (en) 2001-12-27 2001-12-27 Image processing program and image processing apparatus

Publications (3)

Publication Number Publication Date
JP2003196592A true JP2003196592A (en) 2003-07-11
JP2003196592A5 JP2003196592A5 (en) 2005-03-03
JP3955467B2 JP3955467B2 (en) 2007-08-08

Family

ID=27603395

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001397674A Expired - Lifetime JP3955467B2 (en) 2001-12-27 2001-12-27 Image processing program and image processing apparatus

Country Status (1)

Country Link
JP (1) JP3955467B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006146741A (en) * 2004-11-24 2006-06-08 Hitachi Computer Peripherals Co Ltd Method of reading printing data
JP2007329795A (en) * 2006-06-09 2007-12-20 Fuji Xerox Co Ltd Image processing system, commodity order system and image processing program
US7324692B2 (en) 2004-03-10 2008-01-29 Fujitsu Limited Character recognition method
JP2008193681A (en) * 2007-02-02 2008-08-21 Toshiba Corp Image processing apparatus, and image processing method
JP2010244372A (en) * 2009-04-08 2010-10-28 Hitachi Computer Peripherals Co Ltd Method and apparatus for recognizing form
JP7480560B2 (en) 2020-03-31 2024-05-10 大日本印刷株式会社 Text extraction device and program

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7324692B2 (en) 2004-03-10 2008-01-29 Fujitsu Limited Character recognition method
JP2006146741A (en) * 2004-11-24 2006-06-08 Hitachi Computer Peripherals Co Ltd Method of reading printing data
JP4585837B2 (en) * 2004-11-24 2010-11-24 日立コンピュータ機器株式会社 Print data reading method, print data reading device, print data reading program
JP2007329795A (en) * 2006-06-09 2007-12-20 Fuji Xerox Co Ltd Image processing system, commodity order system and image processing program
JP4720633B2 (en) * 2006-06-09 2011-07-13 富士ゼロックス株式会社 Image processing system and image processing program
JP2008193681A (en) * 2007-02-02 2008-08-21 Toshiba Corp Image processing apparatus, and image processing method
JP2010244372A (en) * 2009-04-08 2010-10-28 Hitachi Computer Peripherals Co Ltd Method and apparatus for recognizing form
JP7480560B2 (en) 2020-03-31 2024-05-10 大日本印刷株式会社 Text extraction device and program

Also Published As

Publication number Publication date
JP3955467B2 (en) 2007-08-08

Similar Documents

Publication Publication Date Title
KR100927528B1 (en) Electronic watermark embedding device and detection device
JP3258122B2 (en) Image processing device
JP5830338B2 (en) Form recognition method and form recognition apparatus
KR101461233B1 (en) Image processing device, image processing method and recording medium
JP2001297303A (en) Method and device for recognizing document image and computer readable recording medium
WO2007127085A1 (en) Generating a bitonal image from a scanned colour image
JP2002099915A (en) Color document interpretation
KR100691651B1 (en) Automatic Recognition of Characters on Structured Background by Combination of the Models of the Background and of the Characters
JP2000207489A (en) Character extracting method and device and record medium
CN108877030B (en) Image processing method, device, terminal and computer readable storage medium
JPH11110481A (en) Form rendering and character extracting method
IL98293A (en) Method of discriminating between text and graphics
US20110206281A1 (en) Method for fast up-scaling of color images and method for interpretation of digitally acquired documents
JP3955467B2 (en) Image processing program and image processing apparatus
JP5887242B2 (en) Image processing apparatus, image processing method, and program
JP5929282B2 (en) Image processing apparatus and image processing program
JP3268552B2 (en) Area extraction method, destination area extraction method, destination area extraction apparatus, and image processing apparatus
JP2003087562A (en) Image processor and image processing method
JPH06203204A (en) Character recognition device
JP3276555B2 (en) Format recognition device and character reader
JPH08123901A (en) Character extraction device and character recognition device using this device
RU2249251C2 (en) Automatic recognition of symbols on structural background by combination of models of symbols and background
JPH0981743A (en) Character and graphic processor and method therefor
JP2022167414A (en) Image processing device, image processing method, and program
JP4218179B2 (en) Pattern detection apparatus and method

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040326

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040326

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070424

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070502

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3955467

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110511

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110511

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120511

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120511

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130511

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130511

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term