JPH06290251A - Document image processing method of electronic file device - Google Patents

Document image processing method of electronic file device

Info

Publication number
JPH06290251A
JPH06290251A JP5073348A JP7334893A JPH06290251A JP H06290251 A JPH06290251 A JP H06290251A JP 5073348 A JP5073348 A JP 5073348A JP 7334893 A JP7334893 A JP 7334893A JP H06290251 A JPH06290251 A JP H06290251A
Authority
JP
Japan
Prior art keywords
document
image
memory
area
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5073348A
Other languages
Japanese (ja)
Inventor
Kazuyuki Kodama
和行 児玉
Tatsuya Murakami
達也 村上
Yoshitsugu Ikuno
尚嗣 生野
Hidekazu Hatano
英一 羽田野
Masaaki Fujinawa
雅章 藤縄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP5073348A priority Critical patent/JPH06290251A/en
Publication of JPH06290251A publication Critical patent/JPH06290251A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To display image data while masking only a secret item entry area even if the document format is different by making the secret item entry area of the image data according to coordinate values and displaying the data other than the area in the state of the original image. CONSTITUTION:A main memory MM stores the program of a microprocessor and also stores image data, etc., outputted from a scanner SCN temporarily. An optical disk OD stores with image data which are inputted from the scanner SCN and compressed by an image processing processor IPU and document indexes converted into text data by a character recognition part ORC, i.e., key words for document retrieval correlatingly. For registration, the document structure is analyzed to extract tfi entry item of a secret item, whose coordinate values are stored on the optical disk OD together with the image data. Then, when a document image is used, an image mask pattern corresponding to position information on the secret item entry area is generated to display or print a document image wherein, the area is hidden.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文書イメージからイン
デックスを認識することにより、大量の文書を自動的に
登録する電子ファイル装置に関する。特に守秘項目が存
在する文書を対象とし、誤認識したインデックスを修正
する上で、守秘項目をマスクした画像表示をするに好適
な文書画像処理方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an electronic file device for automatically registering a large number of documents by recognizing an index from a document image. In particular, the present invention relates to a document image processing method suitable for displaying an image in which a confidential item is masked in correcting a misrecognized index for a document having a confidential item.

【0002】[0002]

【従来の技術】文書自動登録を目的とした従来技術とし
て、例えば、特開昭61−59568号公報記載の「文
書理解方式」では、文書画像から枠部分を抽出して書式
情報を作成し、書式情報を用いて文書上の文字を読み取
る方式が開示されている。また、特開昭60−1016
81号公報記載の「文字読取方式」では、文字記入欄毎
に記述した書式情報を利用して認識方式を制御すること
により、多様な字種の存在する文書の認識精度を高める
技術が開示されている。
2. Description of the Related Art As a conventional technique for automatic document registration, for example, in the "Document Understanding Method" described in Japanese Patent Laid-Open No. 61-59568, frame information is extracted from a document image to create format information. A method of reading characters on a document using format information is disclosed. Also, JP-A-60-1016
In "Character reading method" described in Japanese Patent Publication No. 81, there is disclosed a technology for increasing recognition accuracy of a document having various character types by controlling the recognition method by using the format information described for each character entry field. ing.

【0003】また、機密保護に関しては、例えば、特開
昭61−285578号公報記載の「フアリング方式」
では、文書画像全面に網かけ等特定のパターンを重畳し
て出力する方式が開示されている。
Regarding security protection, for example, the "faring system" described in Japanese Patent Laid-Open No. 61-285578.
Discloses a method in which a specific pattern such as halftone dot is superimposed and output on the entire surface of the document image.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、自動登
録した文書を精度良く検索するために、認識結果を修正
しておく必要があり、この修正作業は、登録文書数の増
加、文書書式の多様化にともない、文書管理部門以外で
行なう場合が多くなっている。ここに、多様な書式を有
する文書を対象として、インデックス記載領域の画像は
鮮明に、部外秘項目記載領域の画像はマスクして(覆い
隠して)表示する必要が新たに生じている。
However, in order to accurately search the automatically registered documents, it is necessary to correct the recognition result. This correction work increases the number of registered documents and diversifies the document format. Along with this, there are many cases where it is performed outside the document management department. Here, for documents having various formats, it is necessary to display the image of the index writing area clearly and the image of the confidential item writing area with masking (covering).

【0005】本発明は、上記事情に鑑みてなされたもの
で、その目的とするところは、文書イメージからインデ
ックスを認識することにより、大量の文書を自動的に登
録する電子ファイル装置に関し、特に守秘項目が存在す
る文書を対象として、守秘項目記載領域をマスクして出
力する文書画像処理方法を提供することにある。さら
に、誤認識したインデックスを修正する上で、守秘項目
領域のみをマスクして出力する文書画像処理方法を提供
することにある。
The present invention has been made in view of the above circumstances, and an object of the present invention is to provide an electronic file device for automatically registering a large number of documents by recognizing an index from a document image, and in particular, confidentiality. An object of the present invention is to provide a document image processing method for masking and outputting a confidential item description area for a document having an item. Further, another object of the present invention is to provide a document image processing method for masking and outputting only the confidential item area in correcting an index that is erroneously recognized.

【0006】[0006]

【課題を解決するための手段】本発明による文書画像処
理方法は、帳票に代表される表形式の文書を電子ファイ
ル装置へ自動的に登録する方法、および登録した文書を
表示する方法ものである。
A document image processing method according to the present invention is a method for automatically registering a tabular document represented by a form in an electronic file device, and a method for displaying the registered document. .

【0007】具体的には、紙面上の文書イメージを光
電変換するスキャナと、該変換されたイメージを一時
記憶する第一のメモリと、該メモリに記憶されたイメ
ージ情報から文書の書式を同定して、インデックス記載
領域および守秘項目記載領域を抽出する文書構造解析部
と、上記インデックス記載領域のイメージ情報を第一
のメモリから読み出し、文字パターンを認識してテキス
トコードに変換するとともに、該パターン認識の類似度
を出力する文字認識部と、多数の文書イメージとその
インデックスを格納する大容量の第二のメモリとを具備
した電子ファイル装置であって、(a)上記第一のメモリ
に記憶された文書イメージと、文書構造解析で抽出した
インデックス記載領域および守秘項目記載領域の位置情
報と、文字認識したインデックスのテキストコード(と
類似度)を関連付けて第二のメモリへ格納し、(b)格納
した文書イメージを使用するに際し、守秘項目記載領域
の位置情報に対応した画像マスクパターンを生成し、該
領域を覆い隠した文書イメージの表示あるいは印刷を行
なう、または、(b)'格納した文書イメージを用いてイ
ンデックスを修正するに際し、類似度があらかじめ設定
した値以下の文書データを第二のメモリから検索して読
み出し、守秘項目記載領域の位置情報に対応した画像マ
スクパターンを生成し、該領域を覆い隠した文書イメー
ジの表示あるいは印刷を行なう、ことを特徴とする。
Specifically, a scanner for photoelectrically converting a document image on paper, a first memory for temporarily storing the converted image, and a document format are identified from the image information stored in the memory. And a document structure analysis unit for extracting the index entry area and the confidential item entry area, and reading the image information of the index entry area from the first memory, recognizing a character pattern and converting it into a text code, and recognizing the pattern. An electronic filing device comprising a character recognition unit for outputting the similarity of the above, and a large-capacity second memory for storing a large number of document images and their indexes, and (a) is stored in the first memory. Document image, the position information of the index entry area and confidential item entry area extracted by the document structure analysis, and the character recognition index. (B) When using the stored document image, the image mask pattern corresponding to the position information of the confidential item description area is generated, When displaying or printing a document image with the area covered, or when correcting the index using the document image stored in (b) ', the document data whose similarity is equal to or less than the preset value is stored in the second memory. It is characterized in that the image mask pattern corresponding to the position information of the confidential item description area is generated by searching and reading, and the document image covering the area is displayed or printed.

【0008】[0008]

【作用】本発明による文書画像処理方法の代表的な作用
は、以下の通りである。まず、登録においては、あらか
じめ作成した書式情報を利用して文書構造を解析し、守
秘項目の記載領域を抽出して、その座標値を、画像デー
タとともに第二メモリへ格納する。
The typical operation of the document image processing method according to the present invention is as follows. First, in registration, the document structure is analyzed using the format information created in advance, the confidential item description area is extracted, and the coordinate values thereof are stored in the second memory together with the image data.

【0009】次に、文書イメージの使用に際しては、守
秘項目記載領域の位置情報に対応した画像マスクパター
ンを生成し、その領域を覆い隠した文書イメージの表示
あるいは印刷を行なう。
Next, when using the document image, an image mask pattern corresponding to the position information of the confidential item description area is generated, and the document image with the area covered is displayed or printed.

【0010】また、インデックス修正のための表示で
は、第二メモリへ格納された守秘項目記載領域の座標値
を読み出し、該領域に対応した画像マスクパターンを生
成し、画像データと該マスクパターンとの論理演算をし
た後、ディスプレイに表示する。この方法により、登録
対象とする文書の書式が相違しても、守秘領域のみを覆
い隠した画像の表示が可能になる。
In the display for index correction, the coordinate values of the confidential item description area stored in the second memory are read, an image mask pattern corresponding to the area is generated, and the image data and the mask pattern are combined. After performing a logical operation, display it on the display. By this method, even if the format of the document to be registered is different, it is possible to display the image in which only the confidential area is covered.

【0011】[0011]

【実施例】以下、本発明の実施例を図面により詳細に説
明する。まず、図8に、電子ファイル装置(電子ファイ
リング装置ともいう)への自動登録の対象とする文書の
書式例を示す。同図は報酬明細書の例で、罫線Lx、L
y等で囲まれた領域F1、F2、F4、およびFnに
は、文書のインデックス、換言すれば文書検索のキーワ
ードになる項目f1、f2、f4、およびfnが記載さ
れている。具体的には、f1は「報酬明細書平成5年3
月分」等の日付、f2は被報酬者の個人識別番号、f4
は従事日数、fnは合計金額である。領域F3には、報
酬支払関係者以外には見せてはならない守秘項目f3
(被報酬者氏名)が記載されている。また、本報酬明細
書には、発行事業所毎に領域Fの位置および大きさが少
しずつ相違している、項目fの書体が異なるという特徴
がある。
Embodiments of the present invention will now be described in detail with reference to the drawings. First, FIG. 8 shows a format example of a document to be automatically registered in an electronic file device (also referred to as an electronic filing device). The figure is an example of a remuneration statement, and the ruled lines Lx, L
In the areas F1, F2, F4, and Fn surrounded by y and the like, document indexes, in other words, items f1, f2, f4, and fn that are keywords for document search are described. Specifically, f1 is "Compensation statement 1993 3
Date such as "month", f2 is the personal identification number of the payee, f4
Is the number of working days, and fn is the total amount. In the area F3, a confidential item f3 that should not be shown to anyone other than the person concerned with the payment of rewards
(Name of payee) is listed. Further, the present remuneration statement is characterized in that the position and size of the area F are slightly different for each issuing business, and the typeface of the item f is different.

【0012】次に、図9を用いて、本発明が適用される
文書自動登録機能を有する電子ファイリング装置の構成
を説明する。同図中、SCNは、図8で示した書式の文
書を1インチ当たり200または400ドットの画素数
で光学的に読み取り、1画素当たり1ビットに2値化し
て画像を出力するイメージスキャナを示す。SCCは、
後述するマイクロプロセッサμPの命令により、スキャ
ナSCNとバスとを接続する制御部を示す。
Next, the configuration of an electronic filing apparatus having a document automatic registration function to which the present invention is applied will be described with reference to FIG. In the figure, SCN indicates an image scanner which optically reads the document of the format shown in FIG. 8 with a pixel number of 200 or 400 dots per inch and binarizes 1 bit per pixel to output an image. . SCC is
A control unit for connecting the scanner SCN and the bus by an instruction of a microprocessor μP described later is shown.

【0013】MMはメインメモリを示し、マイクロプロ
セッサのプログラムを蓄え、スキャナから出力された画
像データ等を一時的に蓄える。MMは4MB(メガバイ
ト)の半導体メモリで構成されている。
Reference numeral MM denotes a main memory, which stores a microprocessor program and temporarily stores image data output from the scanner. The MM is composed of a 4 MB (megabyte) semiconductor memory.

【0014】FORは、文書構造解析部を示し、スキャ
ナから入力した画像データの罫線の長さ、始点座標等の
特徴を分析し、磁気ディスクDKにあらかじめ蓄積した
書式情報と照合することにより入力文書の書式を同定
し、インデックス記載領域の座標値を求める。OCR
は、文字認識部を示し、上記FORで求めたインデック
ス記載領域の座標値に基づいて画像データを切り出し、
その領域内の文字パターンを認識してテキストデータに
変換する。
FOR indicates a document structure analysis unit, which analyzes characteristics such as ruled line lengths and start point coordinates of image data input from a scanner, and collates with the format information stored in advance on the magnetic disk DK to input document. Format is identified and the coordinate value of the index description area is calculated. OCR
Indicates a character recognition unit, which cuts out image data based on the coordinate values of the index writing area obtained by the FOR,
The character pattern in the area is recognized and converted into text data.

【0015】IPUは、画像処理プロセッサを示し、
メインメモリMMから読み出された2値画像を、MMR
符号化方式を用いて圧縮し、光ディスクに転送する、
逆に、圧縮した画像を伸張し、表示用ビットマップメモ
リへ送出する、画像を部分的にマスクする(覆い隠
す)パターンを生成する、伸張した画像データとマス
クパターンとのオア演算をする、といった画像処理機能
を有する。
IPU stands for Image Processor,
The binary image read from the main memory MM is converted into MMR.
Compress using encoding method and transfer to optical disc,
On the contrary, the compressed image is decompressed and sent to the display bitmap memory, the pattern for partially masking (covering) the image is generated, or the decompressed image data and the mask pattern are ORed. Has image processing function.

【0016】ODは、1枚当たり600MBの記憶容量
を持つ光ディスクとその駆動装置を示し、スキャナS
CNから入力され、画像処理プロセッサIPUで圧縮さ
れた画像データと、文字認識部OCRでテキストデー
タに変換された文書インデックス、すなわち文書検索用
のキーワードを関連付けて蓄積する。ODCは、マイク
ロプロセッサμPの命令に応じて、光ディスクODの読
み出し/書き込み制御を行なう光ディスク制御部であ
り、最大100枚の光ディスクを制御することができ
る。なお、スキャナSCNで読み取った文書画像データ
は効率良く圧縮されるので、1枚の光ディスクに3万枚
程度の文書を登録することが可能である。
OD indicates an optical disk having a storage capacity of 600 MB per sheet and its drive unit, and the scanner S
The image data input from the CN and compressed by the image processor IPU is associated with the document index converted into text data by the character recognition unit OCR, that is, the keyword for document search is stored. The ODC is an optical disk control unit that controls reading / writing of the optical disk OD according to a command from the microprocessor μP, and can control a maximum of 100 optical disks. Since the document image data read by the scanner SCN is efficiently compressed, it is possible to register about 30,000 documents on one optical disc.

【0017】マイクロプロセッサμPは、キーボードK
Bから入力されるユーザの処理要求に応じて、スキャナ
SCN、文書構造解析部FOR、文字認識部OCR,画
像処理プロセッサIPU、光ディスクOD等の動作を制
御する。BUSは、32ビット幅のデータバスである。
CRTは、装置の操作ガイダンス、文書インデックス、
および文書画像を表示するディスプレイである。BM
は、ビットマップメモリで、CRTに表示する画像デー
タが蓄えられる。DCは、マイクロプロセッサμPの表
示データと画像処理プロセッサIPUから出力される画
像データとを合成してビットマップメモリBMへ書き込
む表示制御部を示す。KBは装置への処理要求、検索条
件等を入力するためのキーボード、KBCはキーボード
制御部である。
The microprocessor μP has a keyboard K
The scanner SCN, the document structure analysis unit FOR, the character recognition unit OCR, the image processing processor IPU, the optical disc OD, and the like are controlled in accordance with the user's processing request input from B. BUS is a 32-bit wide data bus.
CRT is a device operation guidance, document index,
And a display for displaying a document image. BM
Is a bitmap memory in which image data to be displayed on the CRT is stored. DC denotes a display control unit that synthesizes the display data of the microprocessor μP and the image data output from the image processing processor IPU and writes the combined data in the bitmap memory BM. KB is a keyboard for inputting processing requests to the apparatus, search conditions, etc., and KBC is a keyboard control unit.

【0018】次に、文書登録時に、光ディスクの所定の
セクタに書込まれるキーワード情報の構成を図10に示
す。図は、1文書当たりのキーワード情報を示したもの
で、情報の長さKは512B(バイト)である。文書の
インデックス、すなわちキーワードは、いくつかの項目
(項目K1、項目K2、…、項目Kn)について付与す
ることができる。これらの項目の例としては、報酬明細
書の場合には、日付、個人番号、従事日数、合計金額等
が挙げられる。キーワード構成情報フィールドPには、
項目数、各項目名、各項目のデータ長が書かれ、各項目
フィールドQには、文字認識部OCRの出力であるキー
ワードが書込まれる。光ディスク管理情報フィールドR
には、文書画像データが蓄積された番地と画像データ長
が書かれる。
Next, FIG. 10 shows the structure of the keyword information written in a predetermined sector of the optical disc when the document is registered. The figure shows the keyword information per document, and the information length K is 512B (bytes). A document index, that is, a keyword can be attached to some items (item K1, item K2, ..., Item Kn). In the case of a remuneration statement, examples of these items include date, personal number, number of days worked, total amount, and the like. In the keyword configuration information field P,
The number of items, each item name, and the data length of each item are written, and in each item field Q, a keyword output from the character recognition unit OCR is written. Optical disc management information field R
In, the address where the document image data is stored and the image data length are written.

【0019】本発明による文書画像自動登録、修正表
示、および検索表示方法を図1〜図7を用いて説明す
る。特徴は、登録においては、文書構造解析により求
めた守秘項目記載領域の座標値を、画像データおよび文
字認識部で認識したインデックスとともに光ディスクに
蓄積し、修正・検索表示では、光ディスクから読み出
した画像の守秘項目記載領域をマスクして表示すること
により、守秘部分の適正な表示を実現したものである。
以下、登録、修正、および検索方法毎に詳細に説明す
る。
A document image automatic registration, correction display, and search display method according to the present invention will be described with reference to FIGS. The feature is that in registration, the coordinate values of the confidential item description area obtained by the document structure analysis are stored on the optical disk together with the image data and the index recognized by the character recognition unit, and in the correction / search display, the image read from the optical disk is stored. By appropriately masking the confidential item description area, the confidential portion can be properly displayed.
Hereinafter, each registration, correction, and search method will be described in detail.

【0020】(1)文書自動登録方法 まず、図6に、書式情報を示す。書式情報は、入力され
た文書の書式を同定し、各項目が記載された領域の座標
値等を求める上で必要である。図は、書式を定量的に記
述する方法を示したもので、文書インデックスが記載さ
れた領域、および守秘項目が記載された領域を(Xij,
Yij)、ΔXij、ΔYijで、各項目の属性をaij、sij
で記述する。ここに、 (Xij,Yij):領域Fiを形成する罫線の始点座標の値 ΔXij :領域Fiを形成する罫線のX方向の長さ ΔYij :領域Fiを形成する罫線のY方向の長さ aij :領域Fiに記載された項目fiの文字の
種類が 機械書き数字のとき、aij=0 機械書き漢字のとき、aij=1 手書き数字のとき、 aij=2 手書き漢字のとき、 aij=3 (機械とは、ワードプロセッサ等を言う) sij :領域Fiに記載された項目fiが 守秘項目でないとき、sij=0 守秘項目のとき、 sij=1 である。なお、添字jは、書式番号を表わす。これは、
報酬明細書の発行事業所毎に書式、すなわち領域Fiの
位置および大きさ、項目fiの文字の書体が相違するた
めである。
(1) Automatic Document Registration Method First, FIG. 6 shows format information. The format information is necessary to identify the format of the input document and obtain the coordinate value of the area in which each item is described. The figure shows the method to describe the format quantitatively. The area in which the document index is written and the area in which confidential items are written (Xij,
Yij), ΔXij, ΔYij, and the attribute of each item is aij, sij
Described in. Where (Xij, Yij): the value of the starting point coordinates of the ruled line forming the area Fi ΔXij: the length in the X direction of the ruled line forming the area Fi ΔYij: the length in the Y direction of the ruled line forming the area Fi aij: When the character type of the item fi described in the area Fi is machine-written numbers, aij = 0 machine-written kanji, aij = 1 handwritten numbers, aij = 2 handwritten kanji, aij = 3 (machine and Is a word processor or the like) sij: sij = 0 when the item fi described in the area Fi is not a confidential item, and sij = 1 when the item is a confidential item. The subscript j represents a format number. this is,
This is because the format, that is, the position and size of the area Fi, and the typeface of the characters of the item fi are different for each issuing establishment of the remuneration statement.

【0021】このようにして、図7に示すように、いく
つかの書式(書式1〜m)に対して書式情報をあらかじ
め作成し、書式情報ファイルとして磁気ディスクに用意
しておく。
In this way, as shown in FIG. 7, format information is prepared in advance for several formats (Format 1 to m) and prepared as a format information file on the magnetic disk.

【0022】次に、図1により、文書画像の登録方法を
説明する。同図で、キーボードKBから「文書登録」要
求が入力されると、 手順JINTで、マイクロプロセッサμPは、入力文
書番号jを1に設定し、次の手順SCNでスキャナを起
動する。スキャナは、手順IMGで文書画像を光学的に
読み取り、2値化する。μPは、画像データimgjを
メインメモリMM上のM1番地に書き込む。
Next, a method of registering a document image will be described with reference to FIG. In the figure, when a "document registration" request is input from the keyboard KB, the microprocessor μP sets the input document number j to 1 in step JINT, and activates the scanner in the next step SCN. The scanner optically reads the document image in the procedure IMG and binarizes it. The μP writes the image data imgj to the address M1 on the main memory MM.

【0023】次に、手順FORで、文書構造解析部
は、画像データimgjの罫線の長さ、始点座標等の特
徴を分析し、磁気ディスクDKにあらかじめ用意した書
式情報TFORと照合することにより入力文書の書式を
同定し、該当した書式mの項目記載領域の座標データ
(Xim,Yim)、ΔXim、およびΔYim(これらを総称し
てsecijと言う)と、項目の属性データaim、sim
(それぞれaij、sijと言う)をメインメモリのM2番
地に転送する。
Next, in step FOR, the document structure analysis unit analyzes the features such as the length of the ruled line and the starting point coordinates of the image data imgj, and inputs them by collating them with the format information TFOR prepared in advance on the magnetic disk DK. The document format is identified, and the coordinate data (Xim, Yim), ΔXim, and ΔYim (these are collectively referred to as secij) of the item description area of the corresponding format m, and the item attribute data aim, sim.
(Referred to as aij and sij, respectively) are transferred to the M2 address of the main memory.

【0024】書式同定の具体的な方法は、 a)入力画像imgjに存在する連続した黒画素を追跡
し、閉じた罫線枠を抽出する。 b)該罫線枠の始点座標(Xk,Yk)と、長さΔXk、Δ
Ykを求める。 c)書式情報ファイルから((Xim,Yim)、ΔXim、Δ
Yim)を読み出す。 d)各書式ごとに、((Xk,Yk)、ΔXk、ΔYk)と
((Xim,Yim)、ΔXim、ΔYim)を対応付ける。すな
わち、すべての領域iに対して
The specific method of format identification is as follows: a) Track consecutive black pixels existing in the input image imgj and extract a closed ruled line frame. b) The starting point coordinates (Xk, Yk) of the ruled line frame and the lengths ΔXk, Δ
Find Yk. c) From the format information file ((Xim, Yim), ΔXim, Δ
Yim) is read. d) For each format, ((Xk, Yk), ΔXk, ΔYk) is associated with ((Xim, Yim), ΔXim, ΔYim). That is, for all regions i

【0025】[0025]

【数1】 min[(Xim−Xk)2+(Yim−Yk)2] …(数1) k(k=1〜n) となるkを求め、領域kの((Xk,Yk)、ΔXk、ΔYk)
を((Xi,Yi)、ΔXi、ΔYi)に置き換える。 e)次に、各書式に対して、
## EQU1 ## min [(Xim-Xk) 2 + (Yim-Yk) 2 ] (Equation 1) k which satisfies k (k = 1 to n) is obtained, and ((Xk, Yk), ΔXk of the region k is obtained. , ΔYk)
Is replaced by ((Xi, Yi), ΔXi, ΔYi). e) Next, for each format

【0026】[0026]

【数2】 [Equation 2]

【0027】[0027]

【数3】 [Equation 3]

【0028】[0028]

【数4】 ΔPm=ΔNm+ΔLm …(数4) を計算する。 f)数4のΔPmを最小とする書式mが、入力された文
書の書式と同一である。
## EQU4 ## ΔPm = ΔNm + ΔLm (Equation 4) is calculated. f) The format m that minimizes ΔPm in Equation 4 is the same as the format of the input document.

【0029】g)書式mの((Xim,Yim)、ΔXim、Δ
Yim)、aim、およびsimを書式情報ファイルから読み
出し、メインメモリへ転送する。
G) ((Xim, Yim), ΔXim, Δ of format m
Yim), aim, and sim are read from the format information file and transferred to the main memory.

【0030】次に、手順SECで、文字認識部は、s
ij=0(領域iが守秘項目でない)ならば、上記FOR
により求めたインデックス記載領域の座標データsec
ijで規定される範囲の画像データをメインメモリのM1
番地から読み出し(画像切り出し)、手順OCRで、該
画像中の文字パターンを認識してテキストデータind
ijに変換する(文字認識)。OCRでは、同時に、パ
ターン照合の類似度likijも出力する。
Next, in step SEC, the character recognition unit s
If ij = 0 (area i is not a confidential item), the above FOR
Coordinate data sec of the index entry area obtained by
Image data in the range specified by ij is stored in M1 of the main memory.
Read out from the address (cut out the image) and recognize the character pattern in the image by the procedure OCR to detect the text data ind.
ij (character recognition). At the same time, the OCR also outputs the pattern matching similarity likij.

【0031】なお、文字認識では、項目の属性データa
ijに基づいて、最適な認識方式を選択駆動することによ
り、認識精度の向上を図ることが可能である。
In the character recognition, the item attribute data a
It is possible to improve recognition accuracy by selectively driving the optimum recognition method based on ij.

【0032】手順FILでは、画像データimgjを
メインメモリのM1番地から読み出し、画像処理プロセ
ッサIPUで圧縮した後、光ディスクODに蓄積(ファ
イリング)する。各項目記載領域の座標データseci
j、守秘項目であるか否かの情報sijも画像データと同
様に光ディスクに蓄積する。上述OCRの出力であるイ
ンデックステキストデータindij、および類似度l
ikijは、光ディスクのキーワードフィールド(図1
0でK1、K2、…、Kn)に書き込む。
In the procedure FIL, the image data imgj is read from the address M1 in the main memory, compressed by the image processor IPU, and then stored (filing) in the optical disc OD. Coordinate data seci of each item description area
The information sij indicating whether the item is a confidential item or not is also stored in the optical disc in the same manner as the image data. The index text data indij which is the output of the above-mentioned OCR and the similarity l
ikij is a keyword field of the optical disc (see FIG.
At 0, write to K1, K2, ..., Kn).

【0033】なお、手順IINT、IEND、および
IINCは、一文書について所定数の領域の画像切り出
し、および文字認識処理を繰り返して行なうことを示
す。また、手順JINT、JEND、およびJINC
は、スキャナにセットされたすべての文書に対して、S
CNからFILまでの一連の登録処理を繰り返して行な
うことを示す。
Note that steps IINT, IEND, and IINC indicate that image clipping of a predetermined number of areas and character recognition processing are repeated for one document. Also, the procedures JINT, JEND, and JINC.
Returns S for all documents set in the scanner.
It indicates that a series of registration processing from CN to FIL is repeated.

【0034】(2)文書インデックス修正表示方法 一般に、自動登録では、インデックス記載領域の文字パ
ターンを認識してテキストデータに変換し、光ディスク
に検索用キーワードとして書き込む。しかし、文字を1
00%正しく認識することは非常に困難であるので、精
度の高い検索を行なうためには、認識結果を修正してお
く必要がある。修正は、原画像と認識結果とを同時に表
示し、両者を見比べながら、誤認識文字については、キ
ーボードから正しい文字を入力することにより行なう
が、登録する文書数が膨大なため、修正作業を文書管理
部門以外の専門部に依頼する場合が多く、守秘項目はマ
スクして画像表示する必要が生じている。
(2) Document Index Correction Display Method Generally, in automatic registration, a character pattern in the index writing area is recognized, converted into text data, and written as a search keyword on the optical disk. But the character 1
Since it is very difficult to recognize it with the accuracy of 00%, it is necessary to correct the recognition result in order to perform a highly accurate search. The correction is performed by displaying the original image and the recognition result at the same time, comparing the two, and inputting the correct character from the keyboard for misrecognized characters, but the correction work is performed because the number of documents to be registered is huge. In many cases, a specialized department other than the management department is requested, and it is necessary to mask confidential items and display them as images.

【0035】図2により、文書インデックス(検索用キ
ーワード)修正のための、画像表示方法を説明する。同
図で、キーボードKBから「修正開始」要求を入力した
後、 手順THINで、修正者はKBから類似度閾値Lth
を入力する。これは、認識誤りの可能性が大きいインデ
ックスほど、類似度が低いという事実を利用して、修正
が必要な文書を選定するためである。
An image display method for correcting the document index (search keyword) will be described with reference to FIG. In the same figure, after inputting a "correction start" request from the keyboard KB, in step THIN, the corrector changes the KB from the similarity threshold Lth.
Enter. This is to select a document that needs to be corrected by utilizing the fact that the index having a higher possibility of recognition error has a lower similarity.

【0036】次に、手順SRHで、光ディスクのキー
ワードフィールド(図10、Ki)から、類似度lik
ijを読み出し、
Next, in step SRH, the similarity lik is calculated from the keyword field (Ki in FIG. 10) of the optical disk.
read ij,

【0037】[0037]

【数5】 likij≦Lth …(数5) なる文書を検索する。## EQU00005 ## Documents such as likij.ltoreq.Lth ... (Equation 5) are searched.

【0038】手順PATでは、キーワード情報の光デ
ィスク管理情報フィールドRを参照することにより、s
ij=1なる領域(守秘項目が記載されている領域)の座
標データsecijを光ディスクODから読み出し、該領
域部分のみ”0”の値を持つマスクパターンを生成す
る。
In the procedure PAT, by referring to the optical disc management information field R of the keyword information, s
The coordinate data secij of the area where ij = 1 (area where confidential items are written) is read from the optical disc OD, and a mask pattern having a value of "0" only in the area portion is generated.

【0039】手順MSKおよびDSPで、ODから文
書全体の画像データimgjを読み出して画像処理プロ
セッサで伸張し、上記マスクパターンを重畳してディス
プレイに表示する。
In steps MSK and DSP, the image data imgj of the entire document is read from the OD, expanded by the image processor, and the mask pattern is superimposed and displayed on the display.

【0040】具体的には、Imgjを伸張後の原画像、
Mijをマスクパターン(secij、 すなわち(Xim,
Yim)、ΔXim、およびΔYimで規定される範囲はMij
=0、 以外の範囲ではMij=1)として、
Specifically, the original image after Imgj is expanded,
Mij is mask pattern (secij, that is, (Xim,
Yim), ΔXim, and ΔYim are defined by Mij
= 0, and Mij = 1) in the range other than

【0041】[0041]

【数6】 Dspj=Imgj∧Mij …(数6) を演算し(∧は論理積演算子を表わす)、Dspjを表示
する。また、守秘領域が複数ある場合には、
[Equation 6] Dspj = Imgj∧Mij (Equation 6) is calculated (∧ represents a logical product operator), and Dspj is displayed. If there are multiple confidential areas,

【0042】[0042]

【数7】 Dspj=((Imgj∧M1j)∧M2j)∧M3j … …(数7) を表示する。[Equation 7] Dspj = ((Imgj∧M1j) ∧M2j) ∧M3j ... (Equation 7) is displayed.

【0043】以上の手順による表示画面例を、図4に示
す。図で、CRTはディスプレイ画面を、WINは画像
表示用のウィンドウを示す。DOCは数6の演算による
文書画像Dspjを表示した結果である。領域F3に守
秘項目が記載されている場合で、F3の領域をマスク
し、文字f3を覆い隠して表示している。
An example of a display screen according to the above procedure is shown in FIG. In the figure, CRT indicates a display screen, and WIN indicates a window for displaying an image. DOC is the result of displaying the document image Dspj by the operation of Equation 6. In the case where the confidential item is described in the area F3, the area F3 is masked and the character f3 is covered and displayed.

【0044】ここでは省略したが、別なウィンドウに
は、項目f1、f2、f4、およびfnをOCRで認識
した結果(indij)と、KBから入力した修正文字
列を表示する。
Although omitted here, in another window, the result (indij) of recognizing the items f1, f2, f4, and fn by the OCR and the corrected character string input from the KB are displayed.

【0045】図2手順REVでは、修正者は図4の画
面を見ながら認識誤りがある場合は文書インデックスを
修正する。手順ENTでは、修正したインデックスを再
びODのキーワードフィールドに書き込む(旧インデッ
クスを書き替える)。
In the procedure REV of FIG. 2, the corrector corrects the document index when there is a recognition error while looking at the screen of FIG. In the procedure ENT, the corrected index is written again in the keyword field of the OD (the old index is rewritten).

【0046】手順JINT、JEND、およびJIN
Cにより、likij≦Lthなる文書がODに存在し
なくなるまで、SRHからENTまでの一連の修正処理
を繰り返す。
Procedures JINT, JEND, and JIN
By C, a series of correction processing from SRH to ENT is repeated until a document satisfying likij ≦ Lth does not exist in the OD.

【0047】(3)文書検索表示方法 図3により、文書検索での画像表示方法を説明する。同
図で、キーボードKBから「検索開始」要求を入力した
後、 手順PWINで、使用者はKBからパスワードPWを
入力する。
(3) Document Retrieval Display Method An image display method in document retrieval will be described with reference to FIG. In the figure, after inputting a "search start" request from the keyboard KB, the user inputs the password PW from the KB in step PWIN.

【0048】手順TMINで、使用者はKBから検索
ターム(検索条件)TMを入力する。
In the procedure TMIN, the user inputs a search term (search condition) TM from the KB.

【0049】次に、手順SRHでは、光ディスクのキ
ーワードフィールド(図10でK1、K2、…、Kn)
を読み出し、検索タームTMに一致するインデックスを
持つ文書、すなわち、
Next, in the procedure SRH, the keyword field of the optical disk (K1, K2, ..., Kn in FIG. 10).
Documents that have an index that matches the search term TM, that is,

【0050】[0050]

【数8】 indij=TM …(数8) なる文書を検索する。## EQU00008 ## Documents indij = TM ... (Equation 8) are searched.

【0051】手順PCHKでは、PWINで入力され
たパスワードPWと、あらかじめ電子ファイリング装置
に検索者登録したパスワードPWoとを照合し、それら
が一致すれば手順IMG、手順DSPにより文書画像表
示する。この手順による表示画面を図5に示す。同図
で、文書画像DOCは、守秘領域をマスクせずに、 全
領域を表示している。
In the procedure PCHK, the password PW entered in PWIN is compared with the password PWo registered in advance in the electronic filing device as a searcher. If they match, the document image is displayed by the procedure IMG and the procedure DSP. A display screen according to this procedure is shown in FIG. In the figure, the document image DOC displays the entire area without masking the confidential area.

【0052】PW≠PWoの場合は、手順PAT、MS
K、およびDSPにより、図4と同様に守秘領域をマス
クした表示を行なう。方法は、前述した修正表示と同一
である。
If PW ≠ PWo, the procedure PAT, MS
By K and DSP, the confidential area is masked and displayed as in FIG. The method is the same as the correction display described above.

【0053】手順SENDで、検索終了がKBから入
力されない場合は、手順TWINに戻って、次の文書検
索処理を行なう。
In step SEND, if the end of search is not input from KB, the process returns to step TWIN and the next document search process is performed.

【0054】なお、以上の実施例においては、電子ファ
イリング装置に自動登録して、修正検索する文書とし
て、報酬明細書を取り挙げ、書式(項目記載領域の位
置、大きさ等)が少しずつ相違している文書例を説明し
たが、書式情報は登録する文書に対応して作成するの
で、表形式文書であるならば報酬明細書、履歴書、勤務
表等、様式の相違する文書が混在してもよい。
In the above embodiment, the remuneration statement is taken as a document to be automatically registered in the electronic filing apparatus and corrected and retrieved, and the formats (position of the item description area, size, etc.) are slightly different. Although the example of the document is explained, since the format information is created corresponding to the document to be registered, if it is a tabular document, documents with different formats such as remuneration statement, resume, work table, etc. will be mixed. May be.

【0055】また、メインメモリに格納し、画像マスク
に用いる守秘項目記載領域の座標値は、書式情報ファイ
ルの値ではなく、文書構造解析値(図1で説明した、手
順b)における((Xk,Yk)、ΔXk、ΔYk))であっ
てもよい。さらに、書式情報ファイルの値による領域
と、文書構造解析値による領域の和であってもよい。
The coordinate value of the confidential item description area stored in the main memory and used for the image mask is not the value of the format information file, but the document structure analysis value (procedure b described in FIG. 1) ((Xk , Yk), ΔXk, ΔYk)). Further, it may be the sum of the area based on the value of the format information file and the area based on the document structure analysis value.

【0056】[0056]

【発明の効果】以上述べた如く、本発明によれば、電子
ファイリング装置において表形式文書を自動登録し、修
正表示、および検索する上で、 登録においては、文書構造解析で抽出した守秘項目記
載領域の座標値を、画像データおよび文字認識部で認識
したインデックスとともに光ディスクに蓄積し、 修正・検索では、光ディスクから読み出した画像デー
タの守秘項目記載領域は上記座標値にもとづいてマスク
し、該領域以外は原画像の状態で表示するので、文書書
式が相違しても、守秘項目記載領域のみをマスクして表
示できるという効果を奏するものである。
As described above, according to the present invention, in automatically registering a tabular document in the electronic filing apparatus, displaying the correction, and searching, in registration, the confidential item description extracted by the document structure analysis is described. The coordinate values of the area are stored on the optical disk together with the image data and the index recognized by the character recognition unit, and in the correction / search, the confidential item description area of the image data read from the optical disk is masked based on the coordinate value, and the area Other than that, since it is displayed in the state of the original image, even if the document format is different, only the confidential item description area can be masked and displayed.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の実施例における文書画像の登録方法を
示す図。
FIG. 1 is a diagram showing a document image registration method according to an embodiment of the present invention.

【図2】実施例における文書インデックス修正のための
画像表示方法を示す図。
FIG. 2 is a diagram showing an image display method for correcting a document index in the embodiment.

【図3】実施例における文書検索での画像表示方法を示
す図。
FIG. 3 is a diagram showing an image display method in a document search according to the embodiment.

【図4】実施例における守秘領域をマスクした文書画像
の表示画面を示す図。
FIG. 4 is a diagram showing a display screen of a document image in which a confidential area is masked in the embodiment.

【図5】実施例における文書画像の全領域を表示した画
面を示す図。
FIG. 5 is a diagram showing a screen displaying the entire area of the document image in the embodiment.

【図6】実施例における書式を定量的に記述した、書式
情報を示す図。
FIG. 6 is a diagram showing format information in which a format in the embodiment is quantitatively described.

【図7】実施例における書式情報ファイルを示す図。FIG. 7 is a diagram showing a format information file in the embodiment.

【図8】電子ファイリング装置で自動登録の対象とする
文書の書式例を示す図。
FIG. 8 is a diagram showing a format example of a document to be automatically registered by the electronic filing device.

【図9】本発明が適用される文書自動登録機能を有する
電子ファイリング装置の構成を示す図。
FIG. 9 is a diagram showing a configuration of an electronic filing apparatus having a document automatic registration function to which the present invention is applied.

【図10】本発明が適用される電子ファイリング装置で
の光ディスクのキーワード情報の構成を示す図。
FIG. 10 is a diagram showing a structure of keyword information of an optical disc in an electronic filing device to which the present invention is applied.

【符号の説明】[Explanation of symbols]

SCN…スキャナ、FOR…文書構造解析部、OCR…
文字認識部、IPU…画像処理プロセッサ、OD…光デ
ィスク、DK…磁気ディスク、MM…メインメモリ、μ
P…マイクロプロセッサ、Fi…インデックスまたは守
秘項目記載領域、fi…インデックスまたは守秘項目、
secij…インデックスまたは守秘項目記載領域座標
データ、aij…インデックス記載領域の属性、sij…
守秘項目識別情報、imgj…文書画像データ、ind
ij…文字認識したインデックス、likij…文字認識
の類似度、DOC…文書画像、MSK…画像マスク、T
M…検索ターム、Ki…キーワード。
SCN ... Scanner, FOR ... Document structure analysis unit, OCR ...
Character recognition unit, IPU ... Image processor, OD ... Optical disc, DK ... Magnetic disc, MM ... Main memory, μ
P ... Microprocessor, Fi ... Index or confidential item entry area, fi ... Index or confidential item,
secij ... Index or confidential item description area coordinate data, aij ... Index description area attribute, sij ...
Confidential item identification information, imgj ... document image data, ind
ij ... Character recognition index, likij ... Character recognition similarity, DOC ... Document image, MSK ... Image mask, T
M ... Search term, Ki ... Keyword.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 羽田野 英一 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 藤縄 雅章 神奈川県小田原市国府津2880番地 株式会 社日立製作所ストレージシステム事業部内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Eiichi Hatano 1-280 Higashi Koigokubo, Kokubunji, Tokyo Inside Central Research Laboratory, Hitachi, Ltd. (72) Inventor Masaaki Fujinawa 2880, Kozu, Odawara-shi, Kanagawa Hitachi, Ltd. Storage System Division

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】紙面上の文書イメージを光電変換するスキ
ャナと、 該変換されたイメージを一時記憶する第一のメモリと、 該メモリに記憶されたイメージ情報から文書の書式を同
定して、インデックス記載領域および守秘項目記載領域
を抽出する文書構造解析部と、 上記インデックス記載領域のイメージ情報を第一のメモ
リから読み出し、文字パターンを認識してテキストコー
ドに変換する文字認識部と、 多数の文書イメージとそのインデックスを格納する大容
量の第二のメモリとを具備し、表形式の文書を登録し、
登録した文書を出力する電子ファイル装置であって、 (a)上記第一のメモリに記憶された文書イメージと、文
書構造解析で抽出した守秘項目記載領域の位置情報と、
文字認識したインデックスのテキストコードを関連付け
て第二のメモリへ格納し、 (b)格納した文書イメージを使用するに際し、上記守秘
項目記載領域の位置情報に対応した領域を覆い隠した文
書イメージの表示あるいは印刷をすることを特徴とする
電子ファイル装置の文書画像処理方法。
1. A scanner for photoelectrically converting a document image on a paper surface, a first memory for temporarily storing the converted image, a document format based on the image information stored in the memory, and an index. A document structure analysis unit that extracts the description area and confidential item description area, a character recognition unit that reads the image information of the index description area from the first memory, recognizes a character pattern, and converts it into a text code, and a large number of documents. It has an image and a large-capacity second memory for storing its index, and registers a tabular document,
An electronic file device for outputting a registered document, comprising: (a) the document image stored in the first memory, the position information of the confidential item description area extracted by the document structure analysis,
The text code of the character recognition index is stored in association with the second memory, and (b) when the stored document image is used, the display of the document image in which the area corresponding to the position information of the confidential item description area is covered Alternatively, a document image processing method for an electronic file device, which comprises printing.
【請求項2】電子ファイル装置使用者が入力するパスワ
ードにより、格納した文書イメージの全領域を表示ある
いは印刷する動作モードと、守秘項目記載領域を覆い隠
した文書イメージを表示あるいは印刷する動作モードと
を切り替えることを特徴とする請求項1記載の電子ファ
イル装置の文書画像処理方法。
2. An operation mode for displaying or printing the entire area of a stored document image and an operation mode for displaying or printing a document image in which a confidential item description area is covered by a password input by a user of the electronic file device. 2. The document image processing method for an electronic file device according to claim 1, wherein
【請求項3】紙面上の文書イメージを光電変換するスキ
ャナと、 該変換されたイメージを一時記憶する第一のメモリと、 該メモリに記憶されたイメージ情報から文書の書式を同
定して、インデックス記載領域および守秘項目記載領域
を抽出する文書構造解析部と、 上記インデックス記載領域のイメージ情報を第一のメモ
リから読み出し、文字パターンを認識してテキストコー
ドに変換するとともに、該パターン認識の類似度を出力
する文字認識部と、 多数の文書イメージとそのインデックスを格納する大容
量の第二のメモリとを具備し、表形式の文書を登録し、
登録した文書を出力する電子ファイル装置であって、 (a)上記第一のメモリに記憶された文書イメージと、文
書構造解析で抽出したインデックス記載領域および守秘
項目記載領域の位置情報と、文字認識したインデックス
のテキストコードと類似度を関連付けて第二のメモリへ
格納し、 (b)格納した文書イメージを用いてインデックスを修正
するに際し、類似度があらかじめ設定した値以下の文書
イメージを第二のメモリから検索して読み出し、上記守
秘項目記載領域の位置情報に対応した領域を覆い隠した
文書イメージの表示あるいは印刷を行なう、ことを特徴
とする電子ファイル装置の文書画像処理方法。
3. A scanner for photoelectrically converting a document image on paper, a first memory for temporarily storing the converted image, a document format identified from the image information stored in the memory, and an index. A document structure analysis unit that extracts the description area and the confidential item description area, reads the image information of the index description area from the first memory, recognizes the character pattern and converts it into a text code, and the degree of similarity of the pattern recognition. It is equipped with a character recognition unit that outputs a, a large-capacity second memory that stores a large number of document images and their indexes, and registers a tabular document,
An electronic file device for outputting a registered document, comprising: (a) the document image stored in the first memory, the position information of the index entry area and the confidential item entry area extracted by the document structure analysis, and character recognition. The text code of the index is stored in the second memory in association with the similarity, and (b) when correcting the index using the stored document image, the document image having the similarity equal to or less than a preset value is stored in the second memory. A document image processing method for an electronic file device, comprising: searching and reading from a memory, displaying or printing a document image in which an area corresponding to the position information of the confidential item description area is covered and hidden.
【請求項4】請求項3記載の電子ファイル装置におい
て、 (a)認識の類似度があらかじめ設定した閾値以上の場
合、すなわち認識の信頼度が高い場合には、認識したイ
ンデックスのテキストコードを第二のメモリへ格納し、
認識の類似度が閾値以下の場合には、第一のメモリに
記憶された文書イメージと、文書構造解析で抽出したイ
ンデックス記載領域および守秘項目記載領域の位置情報
と、認識したインデックスのテキストコードを関連付け
て第二のメモリへ格納し、 (b)格納した文書イメージを用いてインデックスを修正
するに際し、上記守秘項目記載領域の位置情報に対応し
た領域を覆い隠した文書イメージの表示あるいは印刷を
行なう、ことを特徴とする電子ファイル装置の文書画像
処理方法。
4. The electronic file device according to claim 3, wherein (a) when the similarity of recognition is equal to or more than a preset threshold, that is, when the reliability of recognition is high, the text code of the recognized index is Stored in the second memory,
If the recognition similarity is less than or equal to the threshold value, the document image stored in the first memory, the position information of the index entry area and confidential item entry area extracted by the document structure analysis, and the text code of the recognized index are displayed. Stored in association with the second memory, and (b) when correcting the index using the stored document image, display or print the document image in which the area corresponding to the position information of the confidential item description area is covered. A document image processing method for an electronic file device, comprising:
JP5073348A 1993-03-31 1993-03-31 Document image processing method of electronic file device Pending JPH06290251A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5073348A JPH06290251A (en) 1993-03-31 1993-03-31 Document image processing method of electronic file device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5073348A JPH06290251A (en) 1993-03-31 1993-03-31 Document image processing method of electronic file device

Publications (1)

Publication Number Publication Date
JPH06290251A true JPH06290251A (en) 1994-10-18

Family

ID=13515571

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5073348A Pending JPH06290251A (en) 1993-03-31 1993-03-31 Document image processing method of electronic file device

Country Status (1)

Country Link
JP (1) JPH06290251A (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030089778A (en) * 2002-05-18 2003-11-28 에스케이 텔레콤주식회사 Customer Information Acquisition and Management Method in moblie communication system
JP2006318100A (en) * 2005-05-11 2006-11-24 Oki Electric Ind Co Ltd Collation confirmation method, document data integration device and document data integration system
JP2007535771A (en) * 2004-04-30 2007-12-06 ザ・ボーイング・カンパニー Document information mining tool
WO2008007597A1 (en) * 2006-07-12 2008-01-17 Olympus Corporation Analysis system
JP2008146358A (en) * 2006-12-11 2008-06-26 Fuji Xerox Co Ltd Image formation system and image formation program
JP2012234344A (en) * 2011-04-28 2012-11-29 Fujitsu Frontech Ltd Character recognition device for recognizing character on business form, mask processing method, and mask processing program
US8769406B2 (en) 2006-08-14 2014-07-01 Konica Minolta, Inc. Image display apparatus capable of displaying image while retaining confidentiality
JP6077625B1 (en) * 2015-10-23 2017-02-08 株式会社ヒメナ・アンド・カンパニー Scanner system and computer program that can protect personal information

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030089778A (en) * 2002-05-18 2003-11-28 에스케이 텔레콤주식회사 Customer Information Acquisition and Management Method in moblie communication system
JP2007535771A (en) * 2004-04-30 2007-12-06 ザ・ボーイング・カンパニー Document information mining tool
JP4808705B2 (en) * 2004-04-30 2011-11-02 ザ・ボーイング・カンパニー Document information mining tool
JP2006318100A (en) * 2005-05-11 2006-11-24 Oki Electric Ind Co Ltd Collation confirmation method, document data integration device and document data integration system
WO2008007597A1 (en) * 2006-07-12 2008-01-17 Olympus Corporation Analysis system
US8769406B2 (en) 2006-08-14 2014-07-01 Konica Minolta, Inc. Image display apparatus capable of displaying image while retaining confidentiality
JP2008146358A (en) * 2006-12-11 2008-06-26 Fuji Xerox Co Ltd Image formation system and image formation program
JP2012234344A (en) * 2011-04-28 2012-11-29 Fujitsu Frontech Ltd Character recognition device for recognizing character on business form, mask processing method, and mask processing program
JP6077625B1 (en) * 2015-10-23 2017-02-08 株式会社ヒメナ・アンド・カンパニー Scanner system and computer program that can protect personal information

Similar Documents

Publication Publication Date Title
KR100412317B1 (en) Character recognizing/correcting system
WO1997005561A1 (en) Medium processor and medium processing method
JPH05143707A (en) Method and device for processing coded image data
JP2005173730A (en) Business form ocr program, method, and device
JPH06290251A (en) Document image processing method of electronic file device
US5854860A (en) Image filing apparatus having a character recognition function
JP3448895B2 (en) Transaction processing equipment
JP3185170B2 (en) Data entry system
JPH08263587A (en) Method and device for document input
JP3727422B2 (en) Character recognition apparatus and method
JP4347675B2 (en) Form OCR program, method and apparatus
JP3979288B2 (en) Document search apparatus and document search program
JP3946043B2 (en) Form identification device and identification method
JPH10187751A (en) Recognition data processor and its program recording medium
JPH06103402A (en) Business card recognizing device
JPH0619884A (en) Name input system
JP3360030B2 (en) Character recognition device, character recognition method, and recording medium recording character recognition method in program form
JPH0757040A (en) Filing device provided with ocr
JP2931485B2 (en) Character extraction device and method
JP2746345B2 (en) Post-processing method for character recognition
JPH05210635A (en) Input device
JP3243389B2 (en) Document identification method
JPH0589279A (en) Character recognizing device
JP3251704B2 (en) Recognition processing device
JPH04158478A (en) Retrieval method for information and information storage device