JP2000181988A - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JP2000181988A
JP2000181988A JP10358222A JP35822298A JP2000181988A JP 2000181988 A JP2000181988 A JP 2000181988A JP 10358222 A JP10358222 A JP 10358222A JP 35822298 A JP35822298 A JP 35822298A JP 2000181988 A JP2000181988 A JP 2000181988A
Authority
JP
Japan
Prior art keywords
image
character
mask
pixels
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10358222A
Other languages
Japanese (ja)
Inventor
Kazuhiro Kushima
和弘 九嶋
Nobuyuki Takakuwa
信行 高桑
Hideharu Hattori
英春 服部
Masatoshi Kurata
正敏 倉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP10358222A priority Critical patent/JP2000181988A/en
Publication of JP2000181988A publication Critical patent/JP2000181988A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To perform a highly accurate masking processing or a masking processing for not erasing anything other than an entered character by utilizing an optical character reader. SOLUTION: A slip 15 is optically scanned on the slip 15 in an image input part 1, image data converted to a binarized pattern are stored in an image pattern storage memory 2 and the coordinate information of a read area is generated through a slip extraction part 9 and a character extraction part 7 based on format information stored in a format information storage memory 4 beforehand. At the time, correction is performed based on correction information stored in a slip extension/contraction correction learning value storage memory 5. To the image data of the corrected masking row area, by turning the pixels of the entire masking row area or the character pixels of only secret characters to the same color as a background color, the masking processing of a secret term character area in an image pattern is performed by the information of the read area extension/contraction corrected from a slip image and the highly accurate masking processing is made possible.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、図等の画像及び文
字情報を読み取るイメージ処理機能を持つ光学文字読取
装置に係り、特に守秘項目が存在する帳票を読み取る光
学文字読取装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optical character reading apparatus having an image processing function for reading images and character information such as figures, and more particularly to an optical character reading apparatus for reading a form having a confidential item.

【0002】[0002]

【従来の技術】一般に文字及び図形等が混在する帳票を
電子ファイルとして読み込む光学文字読取装置は、例え
ば特開平6−290251号公報に記載されている様
に、個人識別番号等の守秘項目が記載された帳票イメー
ジを自動登録する際、前記守秘項目の情報も読み込まれ
るのを防止するため、予め指定された守秘項目の書式情
報から守秘項目が記載された領域を算出し、この領域に
対して画像マスクパターンを生成および合成し、画像デ
ータの表示や印刷を行うものが提案されている。この従
来技術による光学文字読取装置は、表示及び印字時には
前記守秘項目のマスクを行うものの、登録した画像デー
タ事体には守秘項目を含むものであった。
2. Description of the Related Art In general, an optical character reader for reading a form in which characters and figures are mixed as an electronic file describes a confidential item such as a personal identification number as described in, for example, JP-A-6-290251. When automatically registering the created form image, in order to prevent the information of the confidential item from being read, a region in which the confidential item is described is calculated from format information of the confidential item specified in advance, and for this region, A device that generates and combines an image mask pattern and displays or prints image data has been proposed. The optical character reading device according to this prior art masks the confidential item during display and printing, but the registered image data object includes the confidential item.

【0003】[0003]

【発明が解決しようとする課題】前述の従来技術による
光学文字読取装置は、守秘項目のマスクを行う際に予め
位置が指定された特定領域に対してマスクパターンに置
換するため、例えば原稿のスキュー等により守秘項目の
位置が本来の位置から外れて読み込まれた場合、マスク
位置が守秘項目位置とズレが生じ、正確に守秘項目を隠
すことができにない場合があると言う不具合があった。
また本来隠すべき守秘項目のみを隠すことができないと
言う不具合があった。
The above-described optical character reading apparatus according to the prior art described above, when masking a confidential item, replaces a specific area whose position is designated in advance with a mask pattern. For example, if the position of the confidential item is read out of the original position, the mask position may deviate from the confidential item position, and the confidential item may not be able to be hidden accurately.
In addition, there is a problem that only the confidential items that should be hidden cannot be hidden.

【0004】特にスキャナやFAX等から取込んだ背景
の無いイメージ情報から特定領域を抽出する際、帳票の
伸縮補正やスキュー補正を行なえないため、帳票上の特
定領域を正確にマスクすることができないと言う不具合
があった。
In particular, when a specific area is extracted from image information without a background captured by a scanner, a facsimile, or the like, since the expansion / contraction correction and skew correction of the form cannot be performed, the specific area on the form cannot be accurately masked. There was a problem that said.

【0005】また従来の装置は、守秘項目もデータとし
ては読み込むため、前記守秘項目の保護が十分とは言い
難いものであった。
Further, in the conventional apparatus, since the confidential item is also read as data, it is difficult to say that the confidential item is sufficiently protected.

【0006】本発明の目的は、前記従来技術による不具
合を除去することであり、帳票の守秘項目を正確にマス
クして隠すことができる光学文字読取装置を提供するこ
とである。本発明の他の目的は、守秘項目のデータ読込
を防止することができる光学文字読取装置を提供するこ
とである。
SUMMARY OF THE INVENTION An object of the present invention is to eliminate the above-mentioned disadvantages of the prior art, and to provide an optical character reading device capable of masking and hiding confidential items of a form accurately. Another object of the present invention is to provide an optical character reading device capable of preventing data reading of confidential items.

【0007】[0007]

【課題を解決するための手段】前記目的を達成するため
に本発明は、守秘文字を背景色上に記載したマスク領域
を持つ帳票から画像イメージを読み取り、該画像イメー
ジから文字データを認識する光学文字読取装置におい
て、前記画像イメージから帳票の傾きおよび帳票の伸縮
を補正し、この補正後の帳票上のマスク領域画素全体を
同一色の画素に変換することにより、マスク領域全体を
マスクして守秘文字を隠すことを第1の特徴とする。
According to the present invention, there is provided an optical system for reading an image from a form having a mask area in which a confidential character is described on a background color and recognizing character data from the image. In the character reading device, the inclination of the form and the expansion and contraction of the form are corrected from the image image, and the entire mask area pixels on the corrected form are converted into pixels of the same color, thereby masking the entire mask area and keeping confidentiality. Hiding characters is a first feature.

【0008】更に本発明は、前記光学文字読取装置にお
いて、前記画像イメージから帳票の傾きおよび帳票の伸
縮を補正し、この補正後の帳票上の守秘文字の画素のみ
を前記背景色と同一にすることを特徴とすることによ
り、守秘文字のみをマスクして守秘文字を隠すことを第
2の特徴とする。
Further, in the optical character reading apparatus according to the present invention, the inclination of the form and the expansion and contraction of the form are corrected from the image image, and only the pixels of the confidential character on the form after the correction are made the same as the background color. The second feature is to mask only the confidential characters and hide the confidential characters.

【0009】また本発明は、前記光学文字読取装置にお
いて、前記画像イメージから帳票の傾きおよび帳票の伸
縮を補正し、この補正後の帳票上のマスク領域全体の画
素をマスクする画像マスクパターンを生成し、該画像マ
スクパターンをマスク領域の画素に変換することを第3
の特徴とする。
Further, according to the present invention, in the optical character reading device, an image mask pattern for correcting a tilt of a form and expansion and contraction of the form from the image image and masking all pixels in a mask area on the form after the correction is generated. The conversion of the image mask pattern into pixels in a mask area is performed in a third step.
The feature of.

【0010】[0010]

【発明の実施の形態】以下、本発明の一実施形態による
光学文字読取装置を図面を参照して詳細に説明する。図
1は本実施形態による光学文字読取装置を説明するため
の図、図2は本実施形態の読み取り対象となる帳票を示
す図、図3は守秘領域を領域マスク指定した際の画像イ
メージを示す図、図4は守秘領域を文字マスク指定した
際の画像イメージを示す図、図5はマスク処理を行う画
像イメージの修正画面を説明するための図である。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, an optical character reader according to an embodiment of the present invention will be described in detail with reference to the drawings. FIG. 1 is a view for explaining an optical character reading apparatus according to the present embodiment, FIG. 2 is a view showing a form to be read in the present embodiment, and FIG. 3 is an image image when a confidential area is designated as an area mask. FIG. 4 is a diagram showing an image image when a confidential area is designated by a character mask, and FIG. 5 is a diagram for explaining a correction screen of an image image to be subjected to mask processing.

【0011】本実施形態の対象となる光学文字読取装置
は、その基本機能として、予め帳票の読み取り時の送り
速度の違いによる伸縮補正量の固有差と、帳票を斜めに
搬送した場合の傾き補正量とを学習し、記憶しておくこ
とができ、この記憶した伸縮補正量及び傾き補正量とを
用いて読み込んだ帳票の画像データに対して伸縮補正及
び傾き補正を行った後に文字認識及び図形等の画像デー
タの読み取りを行うことができるものとする。
The optical character reading apparatus according to the present embodiment has, as its basic functions, an inherent difference in expansion and contraction correction amount due to a difference in feed speed when reading a form, and a tilt correction when the form is conveyed obliquely. After learning the amount, the image data of the form read using the stored expansion / contraction correction amount and inclination correction amount is subjected to expansion / contraction correction and inclination correction, and then character recognition and graphics are performed. And the like can be read.

【0012】また本実施形態の対象となる帳票101
は、図2に示す如く、背景色(例えば白色)上に黒色の
文字データが記載されたデータ行103と、図形等が描
かれた図形エリア104と、使用者の守秘文字(項目)
である個人認識情報が黒色の記載されたマスク領域であ
るマスク行102とから構成される。
A form 101 to which the present embodiment is applied
As shown in FIG. 2, a data line 103 in which black character data is described on a background color (for example, white), a graphic area 104 in which a graphic or the like is drawn, and a user's confidential character (item)
Is composed of a mask row 102 which is a mask area in which black is described.

【0013】さて、本実施形態による光学文字読取装置
は、図1に示す如く、帳票15の画像イメージを読み取
るイメージ入力部1と、該イメージ入力部1から入力し
た画像イメージを一時的に格納するイメージパターン格
納メモリ2と、読み込む対象となる複数の帳票に対応し
た書式情報、例えば帳票幅/高さ、帳票厚さ、読み取る
文字の位置や種類、イメージ切り出し位置や大きさ、マ
スク処理方法(領域指定/文字指定)、マスク対象フィ
ールド位置、編集対象となるイメージパターンとを格納
する書式情報格納メモリ4と、前記帳票の伸縮補正量等
を記憶するための格納メモリ5と、読み込み且つ伸縮等
が補正された画像イメージから背景と比して帳票の画像
イメージを抽出する帳票抽出部9と、この抽出した帳票
の画像イメージから文字等の座標を抽出する座標抽出部
8と、この座標位置から文字の画像イメージを抽出する
文字抽出部7と、この画像イメージから文字を認識する
文字認識部6と、これらを制御する文字認識制御部3
と、前記文字の認識結果を格納する認識結果情報格納メ
モリ10と、文字パターンを格納する文字パターン格納
メモリ11と、操作者の指令を入力すると共に後述する
編集画面他を表示する表示/入力部13と、文字及び領
域マスク用に生成したイメージパターンを格納するイメ
ージ編集パターンメモリ14と、文字修正後の読み取り
データおよびイメージデータを記憶するハードディスク
等の補助記憶部16と、これらを制御する装置制御部1
2とを備える。
As shown in FIG. 1, the optical character reading apparatus according to the present embodiment temporarily stores an image input unit 1 for reading an image of a form 15 and an image input from the image input unit 1. The image pattern storage memory 2 and format information corresponding to a plurality of forms to be read, for example, form width / height, form thickness, position and type of characters to be read, image cutout position and size, mask processing method (area Format information storage memory 4 for storing a mask target field position, an image pattern to be edited, a storage memory 5 for storing the expansion / contraction correction amount of the form, and the like. A form extracting unit 9 for extracting a form image image from the corrected image image in comparison with the background, and determining whether the extracted form image image is A coordinate extracting unit 8 for extracting coordinates of characters and the like; a character extracting unit 7 for extracting a character image from the coordinate position; a character recognizing unit 6 for recognizing characters from the image; Control unit 3
A recognition result information storage memory 10 for storing the character recognition result, a character pattern storage memory 11 for storing a character pattern, and a display / input unit for inputting an operator's command and displaying an edit screen and the like to be described later. 13, an image editing pattern memory 14 for storing image patterns generated for characters and area masks, an auxiliary storage unit 16 such as a hard disk for storing read data and image data after character correction, and a device control for controlling these. Part 1
2 is provided.

【0014】この様に構成した光学文字読取装置は、操
作者が帳票の書式情報(帳票幅/高さ、帳票厚さ、読み
取る文字の位置や種類、イメージ切り出し位置や大き
さ、マスク処理方法(領域指定/文字指定)、マスク対
象フィールド位置、編集対象となるイメージパターン)
を入力/表示部13入力から入力し、書式情報格納メモ
リに格納すると共に、この対象となるイメージ切り出し
位置内にマスクするフィールド(マスク行102)が含
まれていることをチェックしておく。
In the optical character reading apparatus thus configured, the operator can use the form information (form width / height, form thickness, position and type of characters to be read, image cutout position and size, mask processing method ( Area specification / character specification), mask target field position, image pattern to be edited)
Is input from the input / display unit 13 and stored in the format information storage memory, and it is checked that a field (mask line 102) to be masked is included in the target image cutout position.

【0015】次に本装置は、装置制御部12からの帳票
読み込み指示により、イメージ入力部1により帳票15
上を光学的に走査し、帳票イメージ(画像データ)を2
値化パターンに変換し、イメージパターン格納メモリ2
に格納する。
Next, in response to a form reading instruction from the apparatus control section 12, the image input section 1 forms the form 15
The top is optically scanned and the form image (image data) is
Converts to a digitized pattern and stores it in image pattern storage memory 2.
To be stored.

【0016】続いて装置制御部12が、文字認識制御部
3に対して文字読み取り指示を発行し、これにより文字
認識制御部3がイメージパターン格納メモリ2に格納さ
れた帳票イメージより予め書式情報格納メモリ4に格納
された書式に従い帳票抽出部9にて背景を含む画像デー
タから帳票の画像データを切り出す。この帳票の画像デ
ータは、前述の予め格納された帳票伸縮補正学習値格納
メモリ5内の帳票伸縮補正値を参照し、伸縮補正を行
う。
Subsequently, the device control unit 12 issues a character reading instruction to the character recognition control unit 3, whereby the character recognition control unit 3 stores format information in advance from the form image stored in the image pattern storage memory 2. In accordance with the format stored in the memory 4, the form extracting unit 9 cuts out image data of the form from the image data including the background. The image data of this form is subjected to expansion / contraction correction with reference to the form expansion / contraction correction value stored in the form expansion / contraction correction learning value storage memory 5 previously stored.

【0017】次いで本発明本装置は、文字抽出部8が、
帳票抽出部9より切り出された帳票イメージの座標を元
に書式情報格納メモリ4に格納された書式に従い、文字
およびイメージパターンの切り出しを行い、認識結果情
報格納メモリ10に文字位置及びイメージ位置の座標情
報を出力する。このデータも、前記同様に帳票伸縮補正
学習値格納メモリ5内の帳票伸縮補正値を参照し、伸縮
補正を行う。
Next, according to the present invention, the character extracting unit 8 comprises:
According to the format stored in the format information storage memory 4, characters and image patterns are cut out based on the coordinates of the form image cut out by the form extraction unit 9, and the coordinates of the character position and the image position are stored in the recognition result information storage memory 10. Output information. This data also performs expansion / contraction correction with reference to the form expansion / contraction correction value in the form expansion / contraction correction learning value storage memory 5 as described above.

【0018】次いで文字認識部6が、文字抽出部8で切
り出された文字パターンから文字認識処理を行い、認識
結果を認識結果情報格納メモリ10に格納した後、文字
認識制御部3を経由して装置制御部12に出力する。
Next, the character recognizing section 6 performs a character recognizing process from the character pattern cut out by the character extracting section 8 and stores the recognition result in the recognition result information storage memory 10. Output to the device control unit 12.

【0019】装置制御部12は、認識結果情報格納メモ
リ10に格納されている読み取ったフィールド座標情報
および書式指定にて特定位置を指定されたイメージの座
標情報を元にイメージパターン格納メモリ2より読取り
フィールドのイメージパターンおよびイメージ切り出し
指示されたイメージパターンを生成し、イメージ編集パ
ターン格納メモリ14に格納し、その中で書式情報格納
メモリ10に格納されている書式にマスク指示が存在し
た場合、マスクタイプが領域指定なのか文字指定なのか
判定する。この指定は予め操作者により指定されてい
る。
The apparatus control unit 12 reads from the image pattern storage memory 2 based on the read field coordinate information stored in the recognition result information storage memory 10 and the coordinate information of the image whose specific position is specified by the format specification. A field image pattern and an image pattern instructed to cut out the image are generated and stored in the image editing pattern storage memory 14, and if a mask instruction is present in the format stored in the format information storage memory 10, the mask type It is determined whether is a region specification or a character specification. This specification is specified in advance by the operator.

【0020】前記マスク指示が領域指定のマスク指示の
場合、即ち守秘項目が記載された領域全体をマスクする
マスク指示の場合、制御部12は、マスク対象フィール
ドの座標情報を認識結果情報格納メモリ4から読み出
し、さらに書式情報格納メモリ10から帳票内イメージ
パターン切り出し座標を読み出し、イメージ切り出し座
標からのマスク領域座標の相対値を求めた後、イメージ
切り出し座標情報を元にイメージパターン格納メモリ2
のイメージパターンから切り出し、続いてその切り出し
たイメージパターンからマスク領域内を全て白ビットに
変換し、イメージ編集パターン格納メモリ14に出力す
る。
If the mask instruction is a mask instruction for specifying an area, that is, a mask instruction for masking the entire area in which the confidential item is described, the control unit 12 stores the coordinate information of the mask target field in the recognition result information storage memory 4. From the format information storage memory 10, read out the coordinates of the image pattern in the form from the format information storage memory 10, find the relative value of the mask area coordinates from the image cut out coordinates, and then read the image pattern storage memory 2 based on the image cut out coordinate information.
Then, the entire mask area is converted into white bits from the extracted image pattern and output to the image editing pattern storage memory 14.

【0021】このメモリ14に格納した画像イメージパ
ターン201は、図3に示す如く、データ行203及び
図形エリア204のイメージは目視可能に残し、マスク
行202に対しては該マスク行202内のデータを全て
白ビットに変換したことにより目視不可の形式とする。
即ち本実施形態によれば、背景色が白に黒色で記載され
た守秘文字を記載したエリア全体を白色の画素に変換す
ることにより、守秘文字を含むマスク行内全体を隠すこ
とができる。尚、前記マスク行全体のマスクは、マスク
行をマスクする画像マスクパターンを生成し、この画像
マスクパターンを前記マスク行202内のデータと変換
しても良い。この画像マスクパターンは同一色であって
も良いし、所定の文字又は模様を施したものであっても
良い。
As shown in FIG. 3, in the image pattern 201 stored in the memory 14, the image of the data row 203 and the graphic area 204 is left visible, and the data in the mask row 202 is replaced with the mask row 202. Are converted into white bits to make the format invisible.
That is, according to the present embodiment, the entire area including the confidential character can be hidden by converting the entire area in which the confidential character whose background color is described in black on white into white pixels. The mask of the entire mask row may generate an image mask pattern for masking the mask row, and convert the image mask pattern to data in the mask row 202. This image mask pattern may be the same color or may be a pattern on which a predetermined character or pattern is applied.

【0022】前記マスク指示が文字指定のマスク指示の
場合、即ち、文字のみをマスクするマスク指示の場合、
制御部12は、文字認識制御部3に対し文字パターンの
座標情報取得を要求してマスク対象フィールドの文字パ
ターンの座標情報を取得し、座標抽出部8によりマスク
対象フィールド位置を入力情報として文字パターンのフ
ィールド内での座標情報の抽出処理を行い、抽出された
文字パターンの座標情報は文字パターン格納メモリ11
に格納する。次いで制御部12は、文字パターン格納メ
モリ11の情報と、書式情報格納メモリ10から帳票内
イメージパターン切り出し座標を読み出し、イメージ切
り出し座標からのマスク領域座標の相対値を求めた後、
イメージ切り出し座標情報を元にイメージパターン格納
メモリ2のイメージパターンから切り出し、続いてその
切り出したイメージパターンからマスク領域内の文字パ
ターンの座標を全て白ビットに変換し、イメージ編集パ
ターン格納メモリ14に出力する。
When the mask instruction is a mask instruction for specifying a character, that is, a mask instruction for masking only characters,
The control unit 12 requests the character recognition control unit 3 to obtain the coordinate information of the character pattern, obtains the coordinate information of the character pattern of the field to be masked, and the coordinate extracting unit 8 uses the position of the field to be masked as input information for the character pattern. The coordinate information extraction process is performed in the field of the character pattern storage memory 11.
To be stored. Next, the control unit 12 reads the information in the character pattern storage memory 11 and the image pattern cutout coordinates in the form from the format information storage memory 10, and calculates the relative value of the mask area coordinates from the image cutout coordinates.
Based on the image cutout coordinate information, cut out from the image pattern in the image pattern storage memory 2, and subsequently convert all the coordinates of the character patterns in the mask area from the cutout image pattern into white bits and output them to the image edit pattern storage memory 14. I do.

【0023】このメモリ14に格納した画像イメージパ
ターン301は、図4に示す如く、データ行303及び
図形エリア304のイメージは目視可能に残し、マスク
行302に対しては該マスク行302内の文字部分の画
素のみを全て白ビットに変換したことにより目視不可の
形式とする。尚、図4においては文字部分のみを消去し
たことを示すために文字を破線で表している。即ち本実
施形態によれば、背景色が白に黒色で記載された守秘文
字を記載したエリア内の文字の画素のみを白色の画素に
変換することにより、守秘文字のみを隠すことができ
る。従って図4の例においては図3と比して「ID」の
文字が残る形となる。
As shown in FIG. 4, in the image pattern 301 stored in the memory 14, the data line 303 and the image of the graphic area 304 are left visible, and the mask line 302 is replaced with the characters in the mask line 302. All the pixels in the portion are converted into white bits, so that they are invisible. In FIG. 4, characters are indicated by broken lines to indicate that only the character portions have been deleted. That is, according to the present embodiment, only the pixels of the characters in the area in which the confidential character whose background color is described in black on white are described are converted into white pixels, so that only the confidential character can be hidden. Therefore, in the example of FIG. 4, the character of “ID” remains as compared with FIG.

【0024】また装置制御部12は、読取り結果に読み
取り不能文字が含まれている場合、表示/入力部13に
修正画面を表示し、オペレータに修正を促す。この時、
イメージ編集パターン格納メモリに格納されているイメ
ージパターンをも一緒に表示する。この修正画面は、図
5に示す如く、読み込んだ画像データ且つマスクされた
マスク行402を含むのイメージパターン画像401
と、該イメージパターン401内の文字データが記載さ
れたデータ行(図2の符号103)の認識結果「ABC
D〜」を表示する読取り結果画像406と、る個人認識
情報が記載されたマスク行(図2の符号102)の認識
結果を表示する読取り結果画像404と、該マスク行の
読み取った画像イメージそのものを表示するフィールド
イメージ画像405とから構成し、前記読取り結果画像
404の認識不可文字(「?」で示す)が「4」である
ことを操作者がフィールドイメージ画像405を参照し
て読取り、結果画像404の認識文字として「4」とし
て修正することにより、装置による文字認識ができない
場合であっても帳票を見ずに修正を行うことができる。
When the read result contains unreadable characters, the device control unit 12 displays a correction screen on the display / input unit 13 to urge the operator to make correction. At this time,
The image pattern stored in the image editing pattern storage memory is also displayed. As shown in FIG. 5, the correction screen includes an image pattern image 401 including read image data and a masked mask row 402.
And a recognition result "ABC of a data line (reference numeral 103 in FIG. 2) in which character data in the image pattern 401 is described.
D ~ ", a read result image 404 displaying a recognition result of a mask row (reference numeral 102 in Fig. 2) in which personal recognition information is described, and a read image image of the mask row itself Is displayed by the operator with reference to the field image image 405 to determine that the unrecognizable character (indicated by “?”) In the read result image 404 is “4”. By correcting the recognition character of the image 404 as “4”, the correction can be performed without looking at the form even if the character cannot be recognized by the apparatus.

【0025】この修正を行った光学文字読取装置は、帳
票を基にした読み取りデータおよびイメージデータをハ
ードディスク等補助記憶装置16に記憶するものである
が、この時、マスク指定されているフィールドの修正に
おいて、読み取りデータの修正イメージについては、マ
スク処理していないイメージが表示されるが、領域して
いるイメージはマスク処理したイメージを記憶する。
The optical character reading device that has made the correction stores the read data and the image data based on the form in the auxiliary storage device 16 such as a hard disk. At this time, the correction of the field designated by the mask is performed. In (2), an unmasked image is displayed for the corrected image of the read data, but the masked image is stored for the area image.

【0026】尚、前記実施形態においては、白色の背景
色上に黒色の文字等を記載した帳票を読み取る光学文字
読取装置について説明したが、本発明はこのモノクロの
ものに限られるものではなく、帳票の背景色に対して文
字が認識できない様にマスク処理、例えば領域指定によ
るマスク処理の際には同一色の画素にマスク行の画素を
一括変換することや、文字指定によるマスク処理の際に
は文字画素のみを背景色の画素に変換することにより、
カラーの光学文字読取装置に対しても適用することがで
きる。
In the above embodiment, the optical character reading apparatus for reading a form in which black characters and the like are described on a white background color has been described. However, the present invention is not limited to this monochrome type. Mask processing so that characters cannot be recognized with respect to the background color of the form, for example, at the time of mask processing by specifying the area, collectively convert the pixels of the mask row to pixels of the same color, or at the time of mask processing by specifying characters, Converts only text pixels to background pixels,
The present invention can also be applied to a color optical character reading device.

【0027】この様に本実施形態による光学文字読取装
置は、画像イメージから帳票の傾きおよび帳票の伸縮を
補正し、この補正後の帳票上のマスク領域画素全体を同
一色の画素に変換することによりマスク領域全体をマス
クして守秘文字を隠す、又は帳票上の守秘文字の画素の
みを前記背景色と同一にすることにより、帳票の守秘項
目を正確にマスクして隠すことができる。
As described above, the optical character reading apparatus according to the present embodiment corrects the inclination of the form and the expansion and contraction of the form from the image image, and converts the entire mask area pixels on the form after correction into pixels of the same color. By masking the confidential characters by masking the entire mask area, or by making only the pixels of the confidential characters on the form the same as the background color, the confidential items of the form can be accurately masked and hidden.

【0028】尚、本発明は次に述べる実施形態としても
表すことができる。
Note that the present invention can be represented as the following embodiments.

【0029】<実施形態1> イメージを入力する機能
を有する光学文字読取装置において、読込んだイメージ
/文字を表示および出力する手段と、入力されたイメー
ジより帳票の傾きおよび帳票の伸縮を計算し、帳票上の
文字位置を正確に座標情報へ変換可能な手段と、入力し
た文字のイメージ情報(縦/横方向の黒画素数)の算出
手段と、マスキングしたい文字/フィールドの情報を入
力する手段と、特定のイメージ情報(縦/横方向の黒画
素数)と異なるイメージ情報(縦/横方向の白画素数)
に置換可能な手段とを具備し、予め指定された文字/フ
ィールドに対し、入力された文字のイメージ情報の黒画
素数に対してのみ白画素数に置換したイメージを表示ま
たは出力することを特徴とする光学文字読取装置。
<Embodiment 1> In an optical character reading apparatus having a function of inputting an image, means for displaying and outputting the read image / character, and calculating the inclination of the form and expansion / contraction of the form from the input image. Means for accurately converting a character position on a form into coordinate information, means for calculating image information (the number of black pixels in the vertical / horizontal direction) of an input character, and means for inputting information on a character / field to be masked And image information (the number of white pixels in the vertical / horizontal direction) different from the specific image information (the number of black pixels in the vertical / horizontal direction)
Means for replacing a character / field designated in advance, and displaying or outputting an image in which only the number of black pixels of the image information of the input character is replaced with the number of white pixels. Optical character reading device.

【0030】<実施形態2> カラーのイメージを入力
可能な手段と読込んだイメージ/文字を表示および出力
する手段とカラーのイメージ情報から2値のイメージ情
報への変換手段を有した光学文字読取装置において、入
力された2値のイメージより帳票の傾きおよび帳票の伸
縮を計算し、帳票上の文字位置を正確に座標情報へ変換
可能な手段と2値のイメージ情報より文字パターン情報
(縦/横方向の黒画素数)の算出手段とマスキングした
い文字/フィールドの情報を入力する手段と特定のイメ
ージ情報(縦/横方向の黒画素数)と異なるイメージ情
報(縦/横方向の白画素数)に置換可能な手段とを具備
し、予め指定された文字/フィールドに対し、入力され
た文字のイメージ情報の黒画素数に対してのみ白画素数
に置換したイメージを表示または出力することを特徴と
する光学文字読取装置。
<Embodiment 2> An optical character reader having means for inputting a color image, means for displaying and outputting a read image / character, and means for converting color image information into binary image information The apparatus calculates the inclination of the form and the expansion and contraction of the form from the input binary image, and converts the character position on the form into coordinate information accurately. The character pattern information (vertical / vertical) is obtained from the binary image information. Means for calculating the number of black pixels in the horizontal direction, means for inputting information on characters / fields to be masked, and image information different from specific image information (number of black pixels in the vertical / horizontal direction) (number of white pixels in the vertical / horizontal direction) ) Is provided, and for a previously specified character / field, only the number of black pixels in the image information of the input character is replaced with the number of white pixels. An optical character reading device for displaying or outputting

【0031】<実施形態3> イメージを入力すること
の可能な光学文字読取装置において、読込んだイメージ
/文字を表示および出力する手段とマスキングしたい文
字/フィールドの情報を入力する手段と入力されたイメ
ージより帳票の傾きおよび帳票の伸縮を計算し、帳票上
の文字位置を正確に座標情報へ変換可能な手段と、読み
込んだイメージのうち特定領域の画像マスクパターンを
生成可能な手段とを具備し、予め指定された文字/フィ
ールドに対し、入力されたイメージのうち帳票上の正確
な領域に対して画像マスクパターンを生成し表示または
出力することを特徴とする光学文字読取装置。
<Third Embodiment> In an optical character reading apparatus capable of inputting an image, a means for displaying and outputting the read image / character and a means for inputting information of a character / field to be masked are input. It has means for calculating the inclination of the form and expansion / contraction of the form from the image and accurately converting the character position on the form into coordinate information, and means for generating an image mask pattern of a specific area in the read image. An optical character reading apparatus for generating and displaying or outputting an image mask pattern for an accurate area on a form in an input image for a predetermined character / field.

【0032】[0032]

【発明の効果】以上述べた如く本発明による光学文字読
取装置は、画像イメージから帳票の傾きおよび帳票の伸
縮を補正し、この補正後の帳票上のマスク領域画素全体
を同一色の画素に変換することによりマスク領域全体を
マスクして守秘文字を隠す、又は帳票上の守秘文字の画
素のみを前記背景色と同一にすることにより、帳票の守
秘項目を正確にマスクして隠すことができる。
As described above, the optical character reading apparatus according to the present invention corrects the inclination of the form and the expansion and contraction of the form from the image image, and converts the entire mask area pixels on the form after correction into pixels of the same color. By doing so, the confidential character is masked to hide the confidential character, or only the pixels of the confidential character on the form are made the same as the background color, whereby the confidential item of the form can be masked and hidden accurately.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施形態による光学文字読取装置を
説明するための図。
FIG. 1 is a diagram for explaining an optical character reading device according to an embodiment of the present invention.

【図2】本実施形態の読み取り対象となる帳票を示す
図。
FIG. 2 is a view showing a form to be read according to the embodiment;

【図3】守秘領域を領域マスク指定した際の画像イメー
ジを示す図。
FIG. 3 is a diagram showing an image image when a confidential area is designated as an area mask.

【図4】守秘領域を文字マスク指定した際の画像イメー
ジを示す図。
FIG. 4 is a diagram showing an image image when a confidential area is designated by a character mask.

【図5】マスク処理を行う画像イメージの修正画面を説
明するための図。
FIG. 5 is a view for explaining a correction screen of an image image to be subjected to mask processing.

【符号の説明】[Explanation of symbols]

1…イメージ入力部、2…イメージパターン格納メモ
リ、3…文字認識制御部、4…書式情報格納メモリ、5
…帳票伸縮補正学習値格納メモリ、6…文字認識部、7
…文字抽出部、8…座標抽出部、9…帳票抽出部、10
…認識結果情報格納メモリ、11…文字パターン格納メ
モリ、12…装置制御部、13…表示/入力装置、14
…イメージ編集パターン格納メモリ、15…帳票、16
…補助記憶装置101…帳票、102…マスク行、10
3…データ行、201…イメージパターン、202…マ
スク行、203…データ行、301…イメージパター
ン、302…マスク行、303…データ行、401…イ
メージパターン、402…マスク行、403…修正画
面、404…読取り結果1、405…フィールドイメー
ジ、406…読取り結果2。
DESCRIPTION OF SYMBOLS 1 ... Image input part, 2 ... Image pattern storage memory, 3 ... Character recognition control part, 4 ... Format information storage memory, 5
... Form expansion / contraction correction learning value storage memory, 6.
... Character extraction unit, 8 ... Coordinate extraction unit, 9 ... Form extraction unit, 10
... Recognition result information storage memory, 11 ... Character pattern storage memory, 12 ... Device control unit, 13 ... Display / input device, 14
... Image editing pattern storage memory, 15 ... Form, 16
... Auxiliary storage device 101 ... Form, 102 ... Mask line, 10
3 data line, 201 image pattern, 202 mask line, 203 data line, 301 image pattern, 302 mask line, 303 data line, 401 image pattern, 402 mask line, 403 correction screen, 404: read result 1, 405: field image, 406: read result 2.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 服部 英春 神奈川県小田原市国府津2880番地 株式会 社日立製作所ストレージシステム事業部内 (72)発明者 倉田 正敏 神奈川県小田原市国府津2880番地 株式会 社日立製作所ストレージシステム事業部内 Fターム(参考) 5B029 AA01 BB02 CC27 EE04 EE15 5B064 AA01 BA01 CA07 CA08 EA05 FA05  ──────────────────────────────────────────────────続 き Continuing on the front page (72) Inventor Hideharu Hattori 2880 Kozu, Odawara-shi, Kanagawa Prefecture Storage Systems Division, Hitachi, Ltd. (72) Masatoshi Kurata 2880 Kozu, Kozu, Odawara-shi, Kanagawa Hitachi, Ltd. F term in the storage system division (reference) 5B029 AA01 BB02 CC27 EE04 EE15 5B064 AA01 BA01 CA07 CA08 EA05 FA05

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 守秘文字を背景色上に記載したマスク領
域を持つ帳票から画像イメージを読み取り、該画像イメ
ージから文字データを認識する光学文字読取装置におい
て、前記画像イメージから帳票の傾きおよび帳票の伸縮
を補正し、この補正後の帳票上のマスク領域画素全体を
同一色の画素に変換することを特徴とする光学文字読取
装置。
1. An optical character reader for reading an image from a form having a mask area in which a confidential character is described on a background color and recognizing character data from the image, wherein the inclination of the form and the form An optical character reader which corrects expansion and contraction and converts all the pixels of the mask area on the form after the correction into pixels of the same color.
【請求項2】 守秘文字を背景色上に記載したマスク領
域を持つ帳票から画像イメージを読み取り、該画像イメ
ージから文字データを認識する光学文字読取装置におい
て、前記画像イメージから帳票の傾きおよび帳票の伸縮
を補正し、この補正後の帳票上の守秘文字の画素のみを
前記背景色と同一にすることを特徴とする光学文字読取
装置。
2. An optical character reading apparatus for reading an image from a form having a mask area in which a confidential character is described on a background color and recognizing character data from the image, the inclination of the form and the form An optical character reading device, wherein expansion and contraction is corrected, and only pixels of confidential characters on the form after the correction are made the same as the background color.
【請求項3】 守秘文字を背景色上に記載したマスク領
域を持つ帳票から画像イメージを読み取り、該画像イメ
ージから文字データを認識する光学文字読取装置におい
て、前記画像イメージから帳票の傾きおよび帳票の伸縮
を補正し、この補正後の帳票上のマスク領域全体の画素
をマスクする画像マスクパターンを生成し、該画像マス
クパターンをマスク領域の画素に変換することを特徴と
する光学文字読取装置。
3. An optical character reader for reading an image from a form having a mask area in which a confidential character is described on a background color and recognizing character data from the image, wherein the inclination of the form and the form An optical character reading device for correcting an expansion / contraction, generating an image mask pattern for masking pixels in the entire mask area on the form after the correction, and converting the image mask pattern into pixels in the mask area.
JP10358222A 1998-12-16 1998-12-16 Optical character reader Pending JP2000181988A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10358222A JP2000181988A (en) 1998-12-16 1998-12-16 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10358222A JP2000181988A (en) 1998-12-16 1998-12-16 Optical character reader

Publications (1)

Publication Number Publication Date
JP2000181988A true JP2000181988A (en) 2000-06-30

Family

ID=18458177

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10358222A Pending JP2000181988A (en) 1998-12-16 1998-12-16 Optical character reader

Country Status (1)

Country Link
JP (1) JP2000181988A (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007313662A (en) * 2006-05-23 2007-12-06 Fuji Xerox Co Ltd Printer, printing control program, and method for controlling printing
JP2007334679A (en) * 2006-06-15 2007-12-27 Oki Electric Ind Co Ltd Operator terminal and transaction system
US8270718B2 (en) 2008-09-23 2012-09-18 International Business Machines Corporation Manipulating an image by applying a de-identification process
JP2012234344A (en) * 2011-04-28 2012-11-29 Fujitsu Frontech Ltd Character recognition device for recognizing character on business form, mask processing method, and mask processing program
JP6077625B1 (en) * 2015-10-23 2017-02-08 株式会社ヒメナ・アンド・カンパニー Scanner system and computer program that can protect personal information
US9679217B2 (en) 2014-08-26 2017-06-13 Kabushiki Kaisha Toshiba Information processing apparatus, information processing system, information processing method and storage medium
US9819860B2 (en) 2015-03-09 2017-11-14 Kabushiki Kaisha Toshiba Data processor, data processing method and storage medium
US10121086B2 (en) 2015-07-14 2018-11-06 Kabushiki Kaisha Toshiba Information processing apparatus and information processing method

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007313662A (en) * 2006-05-23 2007-12-06 Fuji Xerox Co Ltd Printer, printing control program, and method for controlling printing
JP2007334679A (en) * 2006-06-15 2007-12-27 Oki Electric Ind Co Ltd Operator terminal and transaction system
US8270718B2 (en) 2008-09-23 2012-09-18 International Business Machines Corporation Manipulating an image by applying a de-identification process
JP2012234344A (en) * 2011-04-28 2012-11-29 Fujitsu Frontech Ltd Character recognition device for recognizing character on business form, mask processing method, and mask processing program
US9679217B2 (en) 2014-08-26 2017-06-13 Kabushiki Kaisha Toshiba Information processing apparatus, information processing system, information processing method and storage medium
US9819860B2 (en) 2015-03-09 2017-11-14 Kabushiki Kaisha Toshiba Data processor, data processing method and storage medium
US10121086B2 (en) 2015-07-14 2018-11-06 Kabushiki Kaisha Toshiba Information processing apparatus and information processing method
JP6077625B1 (en) * 2015-10-23 2017-02-08 株式会社ヒメナ・アンド・カンパニー Scanner system and computer program that can protect personal information

Similar Documents

Publication Publication Date Title
JP2812982B2 (en) Table recognition method
JP4655335B2 (en) Image recognition apparatus, image recognition method, and computer-readable recording medium on which image recognition program is recorded
JPH08289094A (en) Document image scanning method and its device
JPH11272871A (en) Processor and method for image processing and record medium
JP2006270418A (en) Image processor, and processing method
JP2010021771A (en) Image processing unit and image processing program
JP2002298122A (en) Information disclosure system
JP2000181988A (en) Optical character reader
JP4159505B2 (en) Image forming apparatus and verification apparatus
JP2008131381A (en) Form generating device, form generating method, program and record medium
JP4143655B2 (en) Image processing apparatus, image processing method, program, storage medium, and system
US5854860A (en) Image filing apparatus having a character recognition function
JP2006259795A (en) Business form for character recognition, and character recognition device, program, and method
JP3171626B2 (en) Character recognition processing area / processing condition specification method
JP3255503B2 (en) Form image processing device
JP2003046746A (en) Method and apparatus for processing image
JP2000029198A (en) Color proof device, image processor and recording medium
JPH05292294A (en) Digital copying machine
JP2009141525A (en) Apparatus and method of processing image
JP4055966B2 (en) Scanner device, document scanning method, and recording medium recording scan program
JP3720748B2 (en) Image processing apparatus, control method therefor, computer program, and recording medium
JP3761923B2 (en) Image processing apparatus and method
JP2000029196A (en) Color proof device
JP2006261772A (en) Image forming apparatus and image forming method
JP3157534B2 (en) Table recognition method

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061023

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061212

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070821