JP2008282091A - Document processing device - Google Patents

Document processing device Download PDF

Info

Publication number
JP2008282091A
JP2008282091A JP2007123561A JP2007123561A JP2008282091A JP 2008282091 A JP2008282091 A JP 2008282091A JP 2007123561 A JP2007123561 A JP 2007123561A JP 2007123561 A JP2007123561 A JP 2007123561A JP 2008282091 A JP2008282091 A JP 2008282091A
Authority
JP
Japan
Prior art keywords
image
attachment
data
identified
filing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007123561A
Other languages
Japanese (ja)
Inventor
Keiko Nakanishi
恵子 中西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2007123561A priority Critical patent/JP2008282091A/en
Publication of JP2008282091A publication Critical patent/JP2008282091A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Facsimiles In General (AREA)
  • Storing Facsimile Image Data (AREA)
  • Processing Or Creating Images (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To discriminate between a document and an attached file, to integrate the document and the attached file together, to automatically perform filing more accurately, and to efficiently carry out correction when the document and its attached file are input together. <P>SOLUTION: In this document processing device, a document type of an input image is identified, then, it is determined whether the following input image is an attached file or not based on attached file presence/absence information of the identified document type, and the image for which the document type is identified and the image to be determined as the attached file are filed as a pair of data. The number of sheets of the attached file is counted, and based on the counting result, a warning on a pair data, in which a read error may occur, is given. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、帳票を処理するための帳票処理装置、帳票処理方法に関する。   The present invention relates to a form processing apparatus and form processing method for processing a form.

従来、1枚の帳票や複数枚の帳票を登録し、帳票だけの文書をファイリングすることができた。   Previously, it was possible to register a single form or multiple forms and file a document containing only the form.

それに対し、特許文献1では、フォーマットの決まっている定型文書とフォーマットの決まっていない非定型の添付資料を1つのデータとしてファイリングするファイリング方法が開示されている。
特開2001−5831号公報
On the other hand, Patent Document 1 discloses a filing method for filing a fixed document with a fixed format and an atypical attachment with a fixed format as one data.
JP 2001-5831 A

しかしながら、特許文献1では、帳票識別して、識別不能な画像が全て添付資料と判断され、実際に識別不能な不明帳票である場合も添付資料となってしまうという問題点がある。また、添付資料として誤識別された場合、修正に時間がかかってしまうという問題点もある。   However, Patent Document 1 has a problem in that a form is identified and all images that cannot be identified are determined as attachments, and even an unknown form that cannot be actually identified becomes attachments. In addition, if it is erroneously identified as an attached material, there is a problem that correction takes time.

本発明は、添付資料がついた帳票でも、帳票と添付資料を識別し、帳票と添付資料を統合して、自動的に、より正確にファイリングし、効率よく修正もできることを目的とする。   An object of the present invention is to identify a form and an attached material even in a form with an attached material, integrate the form and the attached material, and automatically and more accurately file and efficiently correct the form.

上記課題を解決する為に、本発明の帳票処理装置は、帳票とその帳票の添付資料とを1組のデータとしてファイリングする帳票処理装置であって、複数の画像を連続入力する入力手段と、入力された画像の帳票種類を識別する帳票識別手段と、前記識別された帳票種類の添付資料有無情報に基づいて、次に入力された画像が添付資料であるか否かを判断する添付資料判断手段と、前記帳票識別手段で帳票種類が識別された画像と、前記添付資料判断手段で添付資料と判断された画像とを1組のデータとしてファイリングするファイリング手段と、を有することを特徴とする。   In order to solve the above problems, a form processing apparatus of the present invention is a form processing apparatus for filing a form and an attached material of the form as a set of data, and an input means for continuously inputting a plurality of images; Form identification means for identifying the form type of the input image, and attachment determination for determining whether the next input image is an attachment based on the attachment presence / absence information of the identified form type And filing means for filing an image whose form type is identified by the form identifying means and an image determined as an attached material by the attached material determining means as a set of data. .

更に、前記添付資料判断手段で添付資料と判断された場合に、当該添付資料の枚数をカウントするカウント手段と、前記カウント手段によりカウントされた結果に基づいて、読み取りミスが生じた可能性のある組のデータを警告する警告手段と、を有することを特徴とする。   Further, there is a possibility that a reading error has occurred based on the counting means for counting the number of the attached materials and the result counted by the counting means when the attached material judging means judges the attached material. And warning means for warning a set of data.

本発明によれば、添付資料がついた帳票でも、自動的に、より正確にファイリングし、修正も効率よくできるようになる。   According to the present invention, even a form with an attached material can be automatically and more accurately filed and corrected efficiently.

(実施例1)
次に本発明に係る帳票認識装置の一実施形態を図面に基づいて説明する。
Example 1
Next, an embodiment of a form recognition apparatus according to the present invention will be described with reference to the drawings.

図1は、本発明に係る帳票処理装置の一実施形態を示すブロック図、図2は、複数の画像をファイリングさせるときの入力例を示す図、図3は、帳票に添付資料有無情報を登録した情報を示す図である。   FIG. 1 is a block diagram showing an embodiment of a form processing apparatus according to the present invention, FIG. 2 is a view showing an example of input when filing a plurality of images, and FIG. FIG.

図1において、帳票処理装置は、スキャナ、カメラ、あるいはファイル読み込み装置などの画像入力手段11を有し、この画像入力手段11から1頁または複数頁の帳票や添付資料を画像データとして入力する。本実施例では、画像入力手段としてADF(Auto Document Feeder:自動原稿送り装置)を備えたドキュメントスキャナを用いるものとする。   In FIG. 1, the form processing apparatus has an image input means 11 such as a scanner, a camera, or a file reading apparatus, and a one-page or multiple-page form or attached material is input from the image input means 11 as image data. In this embodiment, it is assumed that a document scanner including an ADF (Auto Document Feeder) is used as an image input unit.

画像入力手段11はバス17に接続され、バス17を介して帳票処理の処理を実行するプロセッサ12に接続されている。   The image input means 11 is connected to the bus 17, and is connected to the processor 12 that executes a form processing process via the bus 17.

バス17にはさらにキーボード13、ディスク14、メモリ15、出力手段16が接続されている。   A keyboard 13, a disk 14, a memory 15, and output means 16 are further connected to the bus 17.

メモリ15は、プロセッサ12において処理制御情報を作成する際の一時データ記憶、あるいは画像入力手段11で読み込んだ画像データを蓄積する。また、登録帳票の添付資料有無情報を含む登録帳票データ(帳票の種類を識別するためのデータ)等が、ディスク14等から読み込まれて、保持される。また、後述するフローチャートに対応するような処理をコンピュータに実行させるための制御プログラム15cが格納される。なお、これらのコンピュータ読み取り可能な制御プログラムは、コンピュータ読み取り可能な記憶媒体により供給されるものであってもよいし、ネットワーク等を介して供給されるものであってもよい。   The memory 15 stores temporary data when the processor 12 creates processing control information, or stores image data read by the image input means 11. Also, registered form data (data for identifying the form type) including the attached document presence / absence information of the registered form is read from the disk 14 and held. In addition, a control program 15c for causing a computer to execute processing corresponding to a flowchart described later is stored. Note that these computer-readable control programs may be supplied by a computer-readable storage medium, or may be supplied via a network or the like.

プロセッサ12は、メモリ15に格納された制御プログラム15cを実行することにより、帳票登録手段12a、帳票識別手段12b、ファイリング手段12cとして機能する。   The processor 12 functions as a form registration unit 12a, a form identification unit 12b, and a filing unit 12c by executing a control program 15c stored in the memory 15.

キーボード13は、帳票の登録や識別などの指示操作を行い、ディスク14は、補助記憶装置として機能する。   The keyboard 13 performs instruction operations such as registration and identification of forms, and the disk 14 functions as an auxiliary storage device.

出力手段16は、ディスプレイ、プリンタ等であり、識別結果等の各種情報を出力する。   The output means 16 is a display, a printer, or the like, and outputs various information such as identification results.

画像入力手段11で読み取った帳票の画像は、帳票画像15bとしてメモリ15に格納される。帳票画像15bはプロセッサ12に設けられた画像処理手段(図示せず。)等により2値化処理されて、帳票登録手段12a、帳票識別手段12bに送られる。   The form image read by the image input means 11 is stored in the memory 15 as a form image 15b. The form image 15b is binarized by an image processing means (not shown) provided in the processor 12 and sent to the form registration means 12a and the form identification means 12b.

そして、黒ドットのヒストグラムを取るなどして帳票画像に含まれる領域を識別し、帳票画像15bに含まれる領域をテーブル、テキスト、ピクチャ等に属性分類し、さらに解像度、各領域の位置情報、大きさ情報等を抽出し、入力帳票データを生成し、メモリ11およびディスク14に保存する。   Then, the area included in the form image is identified by taking a histogram of black dots, etc., and the area included in the form image 15b is attributed to table, text, picture, etc., and the resolution, position information of each area, The information is extracted, input form data is generated, and stored in the memory 11 and the disk 14.

図2は、帳票と添付資料で構成される画像をファイリングさせるときの入力の例を示す図である。最初の帳票A(201)には添付資料3枚(202〜204)、次の帳票B(205)は添付資料なし、その次の帳票A(206)には添付資料2枚(207、208)、その次の帳票C(209)は添付資料3枚(210〜212)で構成されている。このような状態で、オートドキュメントフィーダーから連続入力されるとする。   FIG. 2 is a diagram illustrating an example of input when filing an image composed of a form and an attached material. The first form A (201) has three attached materials (202 to 204), the next form B (205) has no attached material, and the next form A (206) has two attached materials (207, 208). The next form C (209) is composed of three attached materials (210 to 212). In this state, it is assumed that continuous input is performed from the auto document feeder.

図3は帳票A、帳票B、帳票Cの添付資料有無情報を示す図である。帳票の種類として帳票A、帳票B、帳票Cが登録されており、帳票の種類それぞれに対し、添付資料が付く可能性があるかどうかを示す添付資料有無情報が対応付けられて登録されている。3の例では、帳票Aは「有り」、帳票Bは「無し」、帳票Cは「有り」で登録されている。なお、この添付資料有無情報が「有り」とされている場合でも、添付資料の枚数指定はされておらず、添付資料は0枚〜複数枚のいずれかとなる。添付資料有無情報は、ユーザが予め指定する。また、帳票の種類は、ユーザが指定してもよいし、自動で割り付けてもよい。また、各帳票の種類を識別する際に用いる特徴データも各帳票種類に対応付けて登録されている。帳票識別処理は、これらの特徴データを用いて比較が行われる。   FIG. 3 is a diagram showing attachment presence / absence information of the form A, the form B, and the form C. Form A, form B, and form C are registered as form types, and attached material presence / absence information indicating whether or not there is a possibility of attaching attached materials is registered in association with each form type. . In the example 3, the form A is registered as “present”, the form B is registered as “not present”, and the form C is registered as “present”. Even when the presence / absence information of the attached material is “present”, the number of attached materials is not specified, and the number of attached materials is one of 0 to plural. The attached material presence / absence information is designated in advance by the user. The type of form may be designated by the user or may be automatically assigned. Also, feature data used when identifying the type of each form is registered in association with each form type. The form identification process is compared using these feature data.

そして、図2のような順に画像が入力されたとする。まず、1番目の画像(201)を帳票識別して、帳票種別Aと識別されたとすると、この帳票201は、添付資料有無情報から添付資料がつく可能性が有ると判断される。次に、2番目の画像(202)を読み込んで、帳票識別して、類似する帳票種別が無い(帳票種別が不明である)と判断されたとすると、直前に読み込んで識別できた帳票201の添付資料有無情報が「有り」なので、2番目の画像202は、直前に識別された帳票201の添付資料であると判断する。3番目の画像(203)と4番目の画像(204)も同様に帳票種別が不明であり、5番目の画像(205)は、帳票Bと識別されたものとする。そこで、帳票201の添付資料有無情報が「有り」で、その次に読み込んだ3枚の画像202〜204が不明帳票として連続しているので、画像202〜204は帳票201の添付資料であると判断し、最初の4枚(201〜204)をまとめて、1組のデータにファイリングする。5番目の画像は、帳票Bと識別され、添付資料有無情報から添付資料はなしと判断される。そこで、5番目の画像のみで、ファイリングする。そして、次の画像(206)を読み込み、帳票識別すると、帳票Aと識別され、同様にして、次の2枚の不明帳票(207、208)が添付資料と判断され、3枚(206〜208)で1組のデータとしてファイリングされ、次の1枚(209)は帳票Cと識別され、次の3枚(210〜212)が添付資料と判断され、1組のデータ(209〜212)にファイリングされる。   Assume that images are input in the order shown in FIG. First, if the first image (201) is identified as a form and identified as a form type A, it is determined that there is a possibility that an attached material is attached to the form 201 from the attached material presence / absence information. Next, when the second image (202) is read and the forms are identified and it is determined that there is no similar form type (the form type is unknown), the attachment of the form 201 that can be read and identified immediately before is attached. Since the material presence / absence information is “present”, it is determined that the second image 202 is an attached material of the form 201 identified immediately before. Similarly, it is assumed that the form type of the third image (203) and the fourth image (204) is unknown, and the fifth image (205) is identified as the form B. Therefore, since the attached document presence / absence information of the form 201 is “present” and the three images 202 to 204 read next are continuous as unknown forms, the images 202 to 204 are attached to the form 201. Judging and filing the first four sheets (201 to 204) together into one set of data. The fifth image is identified as form B, and it is determined that there is no attached material from the attached material presence / absence information. Therefore, filing is performed using only the fifth image. When the next image (206) is read and identified as a form, it is identified as form A. Similarly, the next two unknown forms (207, 208) are determined as attachments, and three (206-208). ) Is filed as a set of data, the next sheet (209) is identified as form C, and the next three sheets (210-212) are determined as attachments, and the set of data (209-212). Filed.

このように添付資料の枚数が変動するような帳票でも、帳票毎に自動的にファイリングすることができる。   Thus, even a form in which the number of attached materials fluctuates can be automatically filed for each form.

図4は、帳票識別の際に利用する登録帳票を登録する際の帳票登録処理の例を示すフローチャートである。後述する帳票識別処理(図5)では、図4で登録された登録帳票データを用いて、識別対象となる入力画像の帳票種類を識別することになる。   FIG. 4 is a flowchart showing an example of a form registration process when registering a registered form used for form identification. In a form identification process (FIG. 5) described later, the form type of the input image to be identified is identified using the registered form data registered in FIG.

ステップS41:帳票を画像入力手段11から読み込み、画像データとしてメモリに転送する。   Step S41: The form is read from the image input means 11 and transferred to the memory as image data.

ステップS42:オペレータがキーボード13から帳票の種類を入力する。   Step S42: The operator inputs the form type from the keyboard 13.

ステップS43:オペレータがキーボード13から帳票に添付資料がつく可能性があるかないかを入力する。   Step S43: The operator inputs from the keyboard 13 whether there is a possibility that an attached material is attached to the form.

ステップS44:ステップS41で読み込んだ画像から特徴量を抽出して書式データ作成等の処理を実行し、ステップS42で入力された帳票の種類、ステップS43で入力された添付資料がつく可能性があるかないかを示す添付資料有無情報とともに、図3に示すように登録する。   Step S44: A feature amount is extracted from the image read in step S41, and processing such as creation of format data is executed. The form type input in step S42 and the attached material input in step S43 may be attached. The information is registered as shown in FIG.

ステップS45:登録する画像が終わりか否かを判断する。登録する画像がまだあるときは、ステップS41に戻り、終わりのときは、そのまま処理を終了する。   Step S45: It is determined whether the registered image is over. If there are still images to be registered, the process returns to step S41.

図5は、本実施例における帳票識別処理の例を示すフローチャートである。   FIG. 5 is a flowchart illustrating an example of the form identification process in the present embodiment.

ステップS501:入力された画像から1番目の画像を読み込み、メモリに転送する。   Step S501: The first image is read from the input image and transferred to the memory.

ステップS502:画像から特徴量を抽出し、帳票特徴データを作成し、図3で登録されている登録帳票の特徴データと比較することにより、帳票識別を行う。   Step S502: A feature amount is extracted from an image, form feature data is created, and form identification is performed by comparing with feature data of a registered form registered in FIG.

ステップS503:帳票識別して、登録帳票に類似したかどうかを判断する。ここで、登録帳票と類似した場合は、該画像が帳票であると判断してステップS504に進み、類似する登録帳票がなかった場合は、ステップS506に進む。   Step S503: The form is identified, and it is determined whether it is similar to the registered form. If it is similar to the registered form, it is determined that the image is a form, and the process proceeds to step S504. If there is no similar registered form, the process proceeds to step S506.

ステップS504:ステップS503で類似する登録帳票があると判断した場合、該画像についてのファイリング情報を「帳票」と設定しておく。そして、ステップS505に進む。   Step S504: If it is determined in step S503 that there is a similar registered form, the filing information for the image is set as “form”. Then, the process proceeds to step S505.

ステップS505:ステップS503で類似すると判断された登録帳票に対応付けられている添付資料有無情報を得て、該画像と関連付けて保存しておく。すると、ステップS509に進み、新たな帳票ファイルとしてファイリングされることになる。   Step S505: Attached material presence / absence information associated with the registration form determined to be similar in step S503 is obtained and stored in association with the image. In step S509, the file is filed as a new form file.

ステップS506:ステップS503で処理対象の入力画像に類似する登録帳票がないと判断した場合は、ステップS506に進み、直前に識別された帳票ファイルの添付資料有無情報が「有り」か「無し」かに基づいて、添付資料かどうかを判断する。添付資料有無情報が「有り」の場合は、当該画像を直前の帳票ファイルの添付資料であると判断し、ステップS507で、「添付資料」という情報を設定する。添付資料有無情報が「無し」の場合は、不明であると判断し、ステップS508で、「不明」という情報を設定する。   Step S506: If it is determined in step S503 that there is no registered form similar to the input image to be processed, the process proceeds to step S506, and whether the attached material presence / absence information of the form file identified immediately before is “present” or “not present”. To determine whether it is an attachment. If the attached material presence / absence information is “present”, it is determined that the image is an attached material of the immediately preceding form file, and information “attached material” is set in step S507. If the attached material presence / absence information is “none”, it is determined that it is unknown, and information “unknown” is set in step S508.

ステップS509:画像に設定されたファイリング情報が「帳票」、「添付資料」、「不明」のいずれであるかに基づいて、ファイリングを行う。「帳票」である場合は、新しい帳票ファイルを作成する(もしくは新しい帳票格納用フォルダ内に格納する)。「添付資料」の場合は、その直前に作成された帳票ファイルの添付資料として、該帳票ファイルに結合して保存する(もしくは直前に作成された帳票格納用フォルダ内に添付資料として格納する)。「不明」の場合は、不明の画像として、不明画像格納用フォルダ等に保存しておく。ユーザは、不明画像格納用フォルダを後から調べ、手動で仕分けを行なったり、新たな登録帳票として登録したりすることができる。   Step S509: Filing is performed based on whether the filing information set in the image is “form”, “attached material”, or “unknown”. If it is “form”, a new form file is created (or stored in a new form storage folder). In the case of “attached material”, it is combined with the form file and stored as an attached material of the form file created immediately before (or stored as an attached material in the form storage folder created immediately before). In the case of “unknown”, an unknown image is stored in an unknown image storage folder or the like. The user can check the unknown image storage folder later and manually sort it or register it as a new registration form.

ステップS510:連続して入力されてきた画像が終わりか否か判断する。未処理の画像が存在するときは、ステップS501に戻り、すべての画像の処理が完了していたときは、終了する。   Step S510: It is determined whether or not the continuously input images are finished. If there is an unprocessed image, the process returns to step S501. If all the images have been processed, the process ends.

以上述べたように、本実施例によれば、帳票を登録するときに添付資料有無情報を指定して登録することにより、帳票を識別するときにその情報を見て識別することにより、添付資料がついている帳票も1組のデータに統合して、ファイリングすることができ、不明帳票も後で、修正しやすくすることができる。   As described above, according to this embodiment, by specifying and registering attachment presence / absence information when registering a form, by identifying and checking the information when identifying the form, the attached material Forms with can be integrated into a set of data and filed, and unknown forms can be easily modified later.

(実施例2)
図6は、実施例2に係る帳票処理装置の一実施形態を示すブロック図である。
(Example 2)
FIG. 6 is a block diagram illustrating an embodiment of a form processing apparatus according to the second embodiment.

図6において、帳票処理装置は、実施例1の構成とほぼ同様であるので共通の部分の説明は省略する。実施例2のプロセッサ12は、メモリ15に格納された制御プログラム15cを実行することにより、帳票登録手段12a、帳票識別手段12b、添付資料判断手段12c、添付資料枚数計数手段12d、ファイリング手段12eとして機能する。   In FIG. 6, the form processing apparatus is substantially the same as the configuration of the first embodiment, and thus description of common parts is omitted. The processor 12 according to the second embodiment executes a control program 15c stored in the memory 15, thereby forming a form registration unit 12a, a form identification unit 12b, an attached material determination unit 12c, an attached material number counting unit 12d, and a filing unit 12e. Function.

図7は、帳票と添付資料で構成される画像をファイリングさせるときの入力の例を示す図である。最初の帳票A(701)には添付資料3枚(702〜704)、次の帳票B(705)は添付資料なし、その次の帳票A(706)には添付資料2枚(707、708)、その次の帳票C(709)は添付資料3枚(710〜712)、その次の帳票A(713)は添付資料3枚(714〜716)で構成されている。このような状態で、オートドキュメントフィーダー等から入力されるとする。   FIG. 7 is a diagram showing an example of input when filing an image composed of a form and an attached material. The first form A (701) has three attachments (702 to 704), the next form B (705) has no attachments, and the next form A (706) has two attachments (707, 708). The next form C (709) is composed of three attached materials (710 to 712), and the next form A (713) is composed of three attached materials (714 to 716). In this state, it is assumed that an input is made from an auto document feeder or the like.

各帳票種類(帳票A、帳票B、帳票C)の添付資料有無情報は、実施例1と同様に図3のようなテーブルで保持されているものとする。   The attached material presence / absence information of each form type (form A, form B, form C) is assumed to be held in a table as shown in FIG.

そして、図7のような順でオートドキュメントフィーダーに原稿を載せ、画像の読み取りを行うが、ここで、9番目の画像:帳票C(709)が重送され、読み取りミスしたとする。   Then, the document is placed on the auto document feeder in the order as shown in FIG. 7 and the image is read. Here, it is assumed that the ninth image: form C (709) is double-fed and a reading error occurs.

まず、1番目の画像(701)を帳票識別して、帳票Aと識別されたとすると、この帳票は、添付資料有無情報から添付資料がつく可能性が有りと判断される。次に、2番目の画像(702)を読み込んで、帳票識別して、登録帳票に類似しないと判断されたとすると、直前の帳票Aの添付資料無情報が有りなので、添付資料と判断し、添付資料枚数をカウントする。同様に3番目の画像(703)、4番目の画像(704)も添付資料と判断する。そして、5番目の画像(705)は、帳票Bと識別される。そこで、最初の4枚(701〜704)をまとめて、1組のデータにファイリングすることができる。この結果、1組目の帳票データは帳票種類が帳票Aで、添付資料枚数3枚となる。   First, if the first image (701) is identified as a form and is identified as a form A, it is determined that there is a possibility that an attached material is attached from the attached material presence / absence information. Next, if the second image (702) is read, the form is identified, and it is determined that it is not similar to the registered form, there is no attached material information on the immediately preceding form A. Count the number of documents. Similarly, the third image (703) and the fourth image (704) are also determined as attachments. The fifth image (705) is identified as form B. Therefore, the first four sheets (701 to 704) can be collectively filed into a set of data. As a result, the form data of the first set is the form A and the number of attached materials is 3.

次に、5番目の画像は、帳票Bと識別され、添付資料有無情報から添付資料はなしと判断される。そこで、5番目の画像のみを2組目の帳票データとしてファイリングし、添付資料枚数は0枚となる。   Next, the fifth image is identified as a form B, and it is determined that there is no attached material from the attached material presence / absence information. Therefore, only the fifth image is filed as the second set of form data, and the number of attached materials is zero.

そして、6番目の画像(706)を読み込み、帳票識別すると、帳票Aと識別され、7番目、8番目の画像(707、708)は同様にして、添付資料と判断される。ここで、本来の9番目の画像(709:帳票C)が読み取りミスされた(原稿708と一緒に重送されてしまった)とする。この場合、次の帳票Cの添付資料(710)が9番目となる。そして、この画像は、帳票識別すると、登録帳票に類似しないので、帳票A(706)の添付資料と判断される。そして、10番目、11番目(711、712)も同様に添付資料と判断される。そして、12番目の画像(713)は、帳票Aと識別される。この結果、3組目の帳票データ(706〜708、710〜712)は帳票種類が帳票Aで、添付資料5枚となる。   Then, when the sixth image (706) is read and the form is identified, it is identified as form A, and the seventh and eighth images (707, 708) are similarly determined as attachments. Here, it is assumed that the original 9th image (709: form C) has been missed (doubled with the original 708). In this case, the attached material (710) of the next form C is the ninth. Then, when the form is identified, this image is not similar to the registered form, and is thus determined to be attached to the form A (706). Similarly, the tenth and eleventh (711, 712) are also determined as attachments. The twelfth image (713) is identified as a form A. As a result, the third set of form data (706 to 708, 710 to 712) has the form type of form A and five attached materials.

13、14、15番目(714〜716)は同様にして帳票Aの添付資料となる。そこで、4組目のデータ(713〜716)は帳票Aで添付資料3枚となる。   The thirteenth, fourteenth and fifteenth (714 to 716) are similarly attached to the form A. Therefore, the fourth set of data (713 to 716) is a form A with three attached materials.

この例では、このファイリングした結果のデータ毎の添付資料枚数を計数した枚数が、図8のように表示される。このように、1組のデータ毎に識別した帳票の種類、添付資料枚数が識別されて表示される。   In this example, the number of attachments for each data as a result of filing is displayed as shown in FIG. In this way, the form type and the number of attached materials identified for each set of data are identified and displayed.

ここで、例えば、帳票Aの添付資料枚数の最頻値を求めると、3枚となる。1組目データ、4組目データは、差が0だが、3組目データは差が2枚となる。そこで、3組目データに警告表示をする。例えば、3組目データの行の色を変えて表示する。   Here, for example, when the mode value of the number of attached materials of the form A is obtained, it becomes three. The first group data and the fourth group data have a difference of 0, but the third group data has two differences. Therefore, a warning is displayed on the third set of data. For example, the color of the row of the third set data is changed and displayed.

ユーザは、3組目データの原稿を検証することにより、ミスがあることがわかり、その部分の画像データを再読み取りして、正しくファイリングできる。   The user can verify that there is a mistake by verifying the document of the third set of data, and can re-read the image data of that portion and file it correctly.

このように添付資料の枚数をカウントした際に、最適値と差があるものを警告することにより、読み取りミスのある箇所を見つけ、修正しやすくすることができる。   In this way, when the number of attached materials is counted, by warning the difference between the optimum value, it is possible to easily find and correct a portion having a reading error.

実施例2における帳票登録処理は、実施例1で説明した図4のフローチャートと同様に行われるが、ステップS43,44の処理が一部異なる。   The form registration process in the second embodiment is performed in the same manner as the flowchart of FIG. 4 described in the first embodiment, but the processes in steps S43 and S44 are partially different.

ステップS41:帳票を画像入力手段11から読み込み、画像データとしてメモリに転送する。   Step S41: The form is read from the image input means 11 and transferred to the memory as image data.

ステップS42:オペレータがキーボード13から帳票の種類を入力する。   Step S42: The operator inputs the form type from the keyboard 13.

ステップS43:オペレータがキーボード13から帳票に添付資料がつく可能性があるかないかを入力する。ここで、本実施例2では、添付資料の平均枚数を入力するものとする。(なお、別の実施例としては、平均枚数ではなく、添付資料の最小枚数と最大枚数を入力するようにしてもよい。)
ステップS44:ステップS41で読み込んだ画像から特徴量を抽出して書式データ(特徴データ)作成等の処理を実行し、ステップS42で入力された帳票の種類、ステップS43で入力された添付資料がつく可能性があるかないかを示す添付資料有無情報、平均枚数とを対応付けて登録する。(なお、平均枚数の代わりに、添付資料の最小枚数と最大枚数が入力された場合は、それらを対応付けて登録する。)
ステップS45:登録する画像が終わりか否かを判断する。登録する画像がまだあるときは、ステップS41に戻り、終わりのときは、そのまま処理を終了する。
Step S43: The operator inputs from the keyboard 13 whether there is a possibility that an attached material is attached to the form. Here, in the second embodiment, the average number of attached materials is input. (In another embodiment, the minimum and maximum number of attached materials may be input instead of the average number.)
Step S44: The feature amount is extracted from the image read in step S41 and processing such as format data (feature data) creation is executed, and the form type input in step S42 and the attached material input in step S43 are attached. Attached material presence / absence information indicating whether or not there is a possibility and an average number of sheets are registered in association with each other. (If the minimum and maximum number of attached materials are entered instead of the average number, they are registered in association with each other.)
Step S45: It is determined whether the registered image is over. If there are still images to be registered, the process returns to step S41.

図9は、実施例2における帳票識別処理の例を示すフローチャートである。   FIG. 9 is a flowchart illustrating an example of form identification processing according to the second embodiment.

ステップS601:入力された画像から1番目の画像を読み込み、メモリに転送する。   Step S601: The first image is read from the input image and transferred to the memory.

ステップS602:画像から特徴量を抽出し、帳票特徴データを作成し、登録されている帳票の特徴データと比較することにより、帳票識別を行う。   Step S602: Feature identification is performed by extracting feature values from the image, creating form feature data, and comparing it with feature data of the registered form.

ステップS603:帳票識別して、登録帳票に類似したかどうかを判断する。ここで、登録帳票と類似した場合は、該画像が帳票であると判断してステップS604に進み、類似する登録帳票がなかった場合は、ステップS606に進む。   Step S603: Identify the form and determine whether it is similar to the registered form. If it is similar to the registered form, it is determined that the image is a form, and the process proceeds to step S604. If there is no similar registered form, the process proceeds to step S606.

ステップS604:ステップS603で類似する登録帳票があると判断した場合、該画像についてのファイリング情報を「帳票」と設定しておく。そして、ステップS605に進む。   Step S604: If it is determined in step S603 that there is a similar registered form, the filing information for the image is set as “form”. Then, the process proceeds to step S605.

ステップS605:ステップS603で類似すると判断された登録帳票に対応付けられている添付資料有無情報を得て、該画像と関連付けて保存しておく。すると、ステップS609に進み、新たな帳票ファイルとしてファイリングが行われることになる。   Step S605: Attached material presence / absence information associated with the registered form determined to be similar in step S603 is obtained and stored in association with the image. In step S609, filing is performed as a new form file.

ステップS606:ステップS603で処理対象の入力画像に類似する登録帳票がないと判断した場合は、ステップS606に進み、直前に識別された帳票ファイルの添付資料有無情報が「有り」か「無し」かに基づいて、添付資料かどうかを判断する。添付資料有無情報が「有り」の場合は、当該画像を直前の帳票ファイルの添付資料であると判断し、ステップS607で、ファイリング情報に「添付資料」という情報を設定する。添付資料有無情報が「無し」の場合は、不明であると判断し、ステップS608で、ファイリング情報に「不明」という情報を設定する。   Step S606: If it is determined in step S603 that there is no registered form similar to the input image to be processed, the process proceeds to step S606, and whether the attached material presence / absence information of the form file identified immediately before is “present” or “not present”. To determine whether it is an attachment. If the attached material presence / absence information is “present”, it is determined that the image is an attached material of the immediately preceding form file, and information “attached material” is set in the filing information in step S607. If the attached material presence / absence information is “none”, it is determined that the information is unknown, and information “unknown” is set in the filing information in step S608.

ステップS609:画像に設定されたファイリング情報が「帳票」、「添付資料」、「不明」であるかに基づいて、ファイリングを行う。「帳票」である場合は、新しい帳票ファイルを作成する(もしくは新しい帳票格納用フォルダ内に格納する)。「添付資料」の場合は、その直前に作成された帳票ファイルの添付資料として、該帳票ファイルに結合して保存する(もしくは直前に作成された帳票格納用フォルダ内に添付資料として格納する)。「不明」の場合は、不明の画像として、不明画像格納用フォルダ等に保存しておく。不明画像格納用フォルダを後から調べ、手動で仕分けを行なったり、新たな登録帳票として登録したりすることができる。   Step S609: Filing is performed based on whether the filing information set in the image is “form”, “attached material”, or “unknown”. If it is “form”, a new form file is created (or stored in a new form storage folder). In the case of “attached material”, it is combined with the form file and stored as an attached material of the form file created immediately before (or stored as an attached material in the form storage folder created immediately before). In the case of “unknown”, an unknown image is stored in an unknown image storage folder or the like. The unknown image storage folder can be examined later, and can be manually sorted or registered as a new registration form.

ステップS610:ファイリング情報が「添付資料」であるときは、添付資料の枚数をデータ毎(帳票ファイル毎)にカウントする。   Step S610: When the filing information is “attached material”, the number of attached materials is counted for each data (for each form file).

ステップS611:連続して入力されてきた画像が終わりか否か判断する。未処理の画像が存在するときは、ステップS601に戻り、すべての画像の処理が完了していたときは、ステップS612に進む。   Step S611: It is determined whether or not the continuously input images are over. If there is an unprocessed image, the process returns to step S601, and if all the images have been processed, the process proceeds to step S612.

ステップS612:すべての画像の処理が完了したら、ファイリングしたデータ毎に帳票種類、添付資料枚数を表示する。   Step S612: When all the images have been processed, the form type and the number of attached materials are displayed for each filed data.

ステップS613:帳票種類毎に添付資料枚数の最適枚数を取得する。取得した添付資料枚数の最適枚数とデータの添付資料枚数を比較し、差がある場合は、そのデータを警告表示する。例えば、添付資料の枚数をデータ毎に表示し、差が大きいと判断したデータは、色を変えて表示する。この最適枚数は、連続して入力した際に識別された各帳票種類の添付資料枚数の最頻値に基づいて決定してもよいし、帳票を登録する際に登録した際に入力した平均値や範囲を用いても良い。これらのいずれを用いるかは予め決定されているものとする。例えば、予め登録されている平均値を用いる場合、当該平均値と識別された添付資料枚数とを比較して、ある値以上の差があるデータを警告表示する。また、予め登録されている最小枚数と最大枚数とを用いる場合、これらの範囲外であるデータを警告表示する。   Step S613: The optimum number of attached materials is acquired for each form type. The optimum number of acquired attachments is compared with the number of attachments of data, and if there is a difference, the data is displayed as a warning. For example, the number of attached materials is displayed for each data, and data determined to have a large difference is displayed with a different color. This optimum number of sheets may be determined based on the mode value of the number of attached materials of each form type identified when continuously entered, or the average value entered when registering the form Or a range may be used. Which of these is used is determined in advance. For example, when an average value registered in advance is used, the average value is compared with the number of identified attached materials, and data having a difference of a certain value or more is displayed as a warning. In addition, when using the minimum number and the maximum number registered in advance, a warning is displayed for data outside these ranges.

以上の述べたように、本実施例によれば、添付資料がついている帳票を1組ずつのデータに統合してファイリングするとき、添付資料枚数を計数して保存しておき、データ毎に添付資料枚数を表示、また、帳票種類毎の最適枚数と比較して、差が大きいものを警告することにより、読み込みミス等が発生した場合でも、発生した箇所を発見しやすくすることができる。   As described above, according to the present embodiment, when filing a form with attached materials into one set of data, the number of attached materials is counted and stored, and attached for each data. By displaying the number of documents and warning the difference between the optimum number for each form type, it is possible to easily find the place where the error occurred even if a reading error occurs.

なお、上述した帳票処理装置は、画像から特徴量を抽出して、登録帳票データで生成して、帳票登録、帳票識別を行ったが、ある領域の文字を読み取って帳票の識別を行う等、他の帳票識別の方法で実現してもよい。   Note that the above-described form processing apparatus extracts feature amounts from the image, generates the registered form data, and performs form registration and form identification.However, the form is identified by reading characters in a certain area, etc. It may be realized by another form identification method.

本発明に係る帳票処理装置の一実施形態を示すブロック図である。It is a block diagram which shows one Embodiment of the form processing apparatus which concerns on this invention. 複数の画像をファイリングさせるときの入力の例を示す図である。It is a figure which shows the example of an input when filing a some image. 帳票に添付資料有無情報を登録した例を示す図である。It is a figure which shows the example which registered attachment presence / absence information on the form. 帳票登録処理の一実施形態を示すフローチャートである。It is a flowchart which shows one Embodiment of a form registration process. ファイリング処理の一実施形態を示すフローチャートである。6 is a flowchart illustrating an embodiment of a filing process. 実施例2の帳票処理装置のブロック図である。FIG. 10 is a block diagram of a form processing apparatus according to a second embodiment. 複数の画像をファイリングさせるときの入力の例を示す図である。It is a figure which shows the example of an input when filing a some image. 画像をファイリングし、添付資料枚数をカウントした結果を示す図である。It is a figure which shows the result of filing an image and counting the number of attached materials. 実施例2のファイリング処理の一実施形態を示すフローチャートである。10 is a flowchart illustrating an embodiment of a filing process according to the second embodiment.

Claims (10)

帳票とその帳票の添付資料とを1組のデータとしてファイリングする帳票処理装置であって、
複数の画像を連続入力する入力手段と、
入力された画像の帳票種類を識別する帳票識別手段と、
前記識別された帳票種類の添付資料有無情報に基づいて、次に入力された画像が添付資料であるか否かを判断する添付資料判断手段と、
前記帳票識別手段で帳票種類が識別された画像と、前記添付資料判断手段で添付資料と判断された画像とを1組のデータとしてファイリングするファイリング手段と、
を有することを特徴とする帳票処理装置。
A form processing device for filing a form and its attached material as a set of data,
Input means for continuously inputting a plurality of images;
Form identification means for identifying the form type of the input image;
Attachment determination means for determining whether or not the next input image is an attachment based on the attachment presence / absence information of the identified form type;
Filing means for filing an image whose form type is identified by the form identifying means and an image judged as an attached material by the attached material judging means as a set of data;
A form processing apparatus characterized by comprising:
前記添付資料判断手段で添付資料と判断された場合に、当該添付資料の枚数をカウントするカウント手段と、
前記カウント手段によりカウントされた結果に基づいて、読み取りミスが生じた可能性のある組のデータを警告する警告手段と、
を更に有することを特徴とする請求項1に記載の帳票処理装置。
A counting means for counting the number of attachments when the attachment determination means determines that the attachment is an attachment;
Warning means for warning a set of data that may have caused a reading error based on the result counted by the counting means;
The form processing apparatus according to claim 1, further comprising:
前記警告手段は、前記添付資料の枚数の最頻値と前記カウント手段によりカウントされた結果とに基づいて、読み取りミスが生じた可能性のある組のデータを警告することを特徴とする請求項2に記載の帳票処理装置。   The warning means warns a set of data in which a reading error may have occurred, based on a mode value of the number of attached materials and a result counted by the counting means. The form processing apparatus according to 2. 前記警告手段は、予め登録された添付資料枚数の平均値と前記カウント手段によりカウントされた結果とに基づいて、読み取りミスが生じた可能性のある組のデータを警告することを特徴とする請求項2に記載の帳票処理装置。   The warning means warns a set of data in which a reading error may occur based on an average value of the number of attached materials registered in advance and a result counted by the counting means. Item 3. The form processing apparatus according to Item 2. 前記警告手段は、予め登録された添付資料枚数の最大値および最小値と前記カウント手段によりカウントされた結果とに基づいて、読み取りミスが生じた可能性のある組のデータを警告することを特徴とする請求項2に記載の帳票処理装置。   The warning means warns a set of data in which a reading error may have occurred, based on a maximum value and a minimum value of the number of attached materials registered in advance and a result counted by the counting means. The form processing apparatus according to claim 2. 前記添付資料判断手段は、前記次に入力された画像が前記帳票識別手段により帳票種類が判断されなかった場合に、前記添付資料有無情報に基づいて、前記次に入力された画像が添付資料であるか否かを判断することを特徴とする請求項1に記載の帳票処理装置。   The attachment determination unit determines whether the next input image is an attachment based on the attachment presence / absence information when the form identification unit does not determine the form type of the next input image. The form processing apparatus according to claim 1, wherein it is determined whether or not it exists. 前記帳票識別手段により帳票種類が判断されず、且つ、前記添付資料判断手段により添付資料と判断されなかった画像を、不明画像として判断する不明画像判断手段を更に有することを特徴とする請求項1に記載の帳票処理装置。   2. The apparatus according to claim 1, further comprising an unknown image determination unit that determines, as an unknown image, an image whose form type is not determined by the form identification unit and is not determined as an attachment by the attachment determination unit. The form processing device described in 1. 帳票とその帳票の添付資料とを1組のデータとしてファイリングする帳票処理装置の帳票処理方法であって、
複数の画像を連続入力する入力工程と、
入力された画像の帳票種類を識別する帳票識別工程と、
前記識別された帳票種類の添付資料有無情報に基づいて、次に入力された画像が添付資料であるか否かを判断する添付資料判断工程と、
前記帳票識別工程で帳票種類が識別された画像と、前記添付資料判断工程で添付資料と判断された画像とを1組のデータとしてファイリングするファイリング工程と、
を有することを特徴とする帳票処理装置の帳票処理方法。
A form processing method for a form processing apparatus for filing a form and an attached material of the form as a set of data,
An input process for continuously inputting a plurality of images;
Form identification process for identifying the form type of the input image,
An attachment determination step for determining whether the next input image is an attachment based on the attachment presence / absence information of the identified form type;
A filing step of filing the image in which the form type is identified in the form identification step and the image determined to be an attachment in the attachment determination step as a set of data;
A form processing method for a form processing apparatus, comprising:
帳票処理装置に、帳票とその帳票の添付資料とを1組のデータとしてファイリングさせるためのコンピュータプログラムであって、
前記帳票処理装置のコンピュータに、
入力された画像の帳票種類を識別する帳票識別手順と、
前記識別された帳票種類の添付資料有無情報に基づいて、次に入力された画像が添付資料であるか否かを判断する添付資料判断手順と、
前記帳票識別手順で帳票種類が識別された画像と、前記添付資料判断手順で添付資料と判断された画像とを1組のデータとしてファイリングするファイリング手順と、
を実行させるためのコンピュータプログラム。
A computer program for causing a form processing apparatus to file a form and an attached material of the form as a set of data,
In the computer of the form processing apparatus,
Form identification procedure for identifying the form type of the input image,
An attachment determination procedure for determining whether or not the next input image is an attachment based on the attachment presence / absence information of the identified form type;
A filing procedure for filing an image whose form type is identified in the form identifying procedure and an image determined as an attached material in the attached material determining procedure as a set of data;
A computer program for running.
請求項9に記載のプログラムを格納した、コンピュータ読み取り可能な記憶媒体。   A computer-readable storage medium storing the program according to claim 9.
JP2007123561A 2007-05-08 2007-05-08 Document processing device Pending JP2008282091A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007123561A JP2008282091A (en) 2007-05-08 2007-05-08 Document processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007123561A JP2008282091A (en) 2007-05-08 2007-05-08 Document processing device

Publications (1)

Publication Number Publication Date
JP2008282091A true JP2008282091A (en) 2008-11-20

Family

ID=40142877

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007123561A Pending JP2008282091A (en) 2007-05-08 2007-05-08 Document processing device

Country Status (1)

Country Link
JP (1) JP2008282091A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010226387A (en) * 2009-03-23 2010-10-07 Oki Electric Ind Co Ltd Slip image filing system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010226387A (en) * 2009-03-23 2010-10-07 Oki Electric Ind Co Ltd Slip image filing system

Similar Documents

Publication Publication Date Title
US9626738B2 (en) Image processing apparatus, image processing method, and storage medium
US8159717B2 (en) Image processing apparatus
US20200128135A1 (en) Image inspection apparatus and image inspection program
US10142499B2 (en) Document distribution system, document distribution apparatus, information processing method, and storage medium
JP2007116469A (en) Medium treatment method, copying device, and data filing device
US10757290B2 (en) Image processing apparatus being able to simultaneously read and extract image data
JP2007241413A (en) Page error inspection device and page error inspection method
JP2021043775A (en) Information processing device and program
US9854126B2 (en) System and method for handling blank pages during document printing or copying
US11436733B2 (en) Image processing apparatus, image processing method and storage medium
JP2005217805A (en) Image processing apparatus
JP2008282091A (en) Document processing device
JP2015219056A (en) Print inspection device and print inspection method
JP6700705B2 (en) Distribution system, information processing method, and program
JP4347256B2 (en) Image processing apparatus, image processing method, image processing program, and computer-readable recording medium recorded with the same
JP7171269B2 (en) Image matching system, image matching method, and program
EP2106118A1 (en) Adding image quality indications to a list of thumbnail images
JP2017208655A (en) Information processing system, information processing method and program
JP6613871B2 (en) Information processing apparatus, image reading apparatus, and program
JP2019161352A (en) Information processing device and information processing program
JP2007194793A (en) Image forming apparatus
JP7183623B2 (en) Image processing device, image processing method and image processing program
JP2019129357A (en) Image processing apparatus
US11354890B2 (en) Information processing apparatus calculating feedback information for partial region of image and non-transitory computer readable medium storing program
JP7486954B2 (en) Form processing program, form processing device, and form processing method

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100201