JP2008282091A - Document processing device - Google Patents
Document processing device Download PDFInfo
- Publication number
- JP2008282091A JP2008282091A JP2007123561A JP2007123561A JP2008282091A JP 2008282091 A JP2008282091 A JP 2008282091A JP 2007123561 A JP2007123561 A JP 2007123561A JP 2007123561 A JP2007123561 A JP 2007123561A JP 2008282091 A JP2008282091 A JP 2008282091A
- Authority
- JP
- Japan
- Prior art keywords
- image
- attachment
- data
- identified
- filing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Facsimiles In General (AREA)
- Storing Facsimile Image Data (AREA)
- Processing Or Creating Images (AREA)
Abstract
Description
本発明は、帳票を処理するための帳票処理装置、帳票処理方法に関する。 The present invention relates to a form processing apparatus and form processing method for processing a form.
従来、1枚の帳票や複数枚の帳票を登録し、帳票だけの文書をファイリングすることができた。 Previously, it was possible to register a single form or multiple forms and file a document containing only the form.
それに対し、特許文献1では、フォーマットの決まっている定型文書とフォーマットの決まっていない非定型の添付資料を1つのデータとしてファイリングするファイリング方法が開示されている。
しかしながら、特許文献1では、帳票識別して、識別不能な画像が全て添付資料と判断され、実際に識別不能な不明帳票である場合も添付資料となってしまうという問題点がある。また、添付資料として誤識別された場合、修正に時間がかかってしまうという問題点もある。 However, Patent Document 1 has a problem in that a form is identified and all images that cannot be identified are determined as attachments, and even an unknown form that cannot be actually identified becomes attachments. In addition, if it is erroneously identified as an attached material, there is a problem that correction takes time.
本発明は、添付資料がついた帳票でも、帳票と添付資料を識別し、帳票と添付資料を統合して、自動的に、より正確にファイリングし、効率よく修正もできることを目的とする。 An object of the present invention is to identify a form and an attached material even in a form with an attached material, integrate the form and the attached material, and automatically and more accurately file and efficiently correct the form.
上記課題を解決する為に、本発明の帳票処理装置は、帳票とその帳票の添付資料とを1組のデータとしてファイリングする帳票処理装置であって、複数の画像を連続入力する入力手段と、入力された画像の帳票種類を識別する帳票識別手段と、前記識別された帳票種類の添付資料有無情報に基づいて、次に入力された画像が添付資料であるか否かを判断する添付資料判断手段と、前記帳票識別手段で帳票種類が識別された画像と、前記添付資料判断手段で添付資料と判断された画像とを1組のデータとしてファイリングするファイリング手段と、を有することを特徴とする。 In order to solve the above problems, a form processing apparatus of the present invention is a form processing apparatus for filing a form and an attached material of the form as a set of data, and an input means for continuously inputting a plurality of images; Form identification means for identifying the form type of the input image, and attachment determination for determining whether the next input image is an attachment based on the attachment presence / absence information of the identified form type And filing means for filing an image whose form type is identified by the form identifying means and an image determined as an attached material by the attached material determining means as a set of data. .
更に、前記添付資料判断手段で添付資料と判断された場合に、当該添付資料の枚数をカウントするカウント手段と、前記カウント手段によりカウントされた結果に基づいて、読み取りミスが生じた可能性のある組のデータを警告する警告手段と、を有することを特徴とする。 Further, there is a possibility that a reading error has occurred based on the counting means for counting the number of the attached materials and the result counted by the counting means when the attached material judging means judges the attached material. And warning means for warning a set of data.
本発明によれば、添付資料がついた帳票でも、自動的に、より正確にファイリングし、修正も効率よくできるようになる。 According to the present invention, even a form with an attached material can be automatically and more accurately filed and corrected efficiently.
(実施例1)
次に本発明に係る帳票認識装置の一実施形態を図面に基づいて説明する。
Example 1
Next, an embodiment of a form recognition apparatus according to the present invention will be described with reference to the drawings.
図1は、本発明に係る帳票処理装置の一実施形態を示すブロック図、図2は、複数の画像をファイリングさせるときの入力例を示す図、図3は、帳票に添付資料有無情報を登録した情報を示す図である。 FIG. 1 is a block diagram showing an embodiment of a form processing apparatus according to the present invention, FIG. 2 is a view showing an example of input when filing a plurality of images, and FIG. FIG.
図1において、帳票処理装置は、スキャナ、カメラ、あるいはファイル読み込み装置などの画像入力手段11を有し、この画像入力手段11から1頁または複数頁の帳票や添付資料を画像データとして入力する。本実施例では、画像入力手段としてADF(Auto Document Feeder:自動原稿送り装置)を備えたドキュメントスキャナを用いるものとする。 In FIG. 1, the form processing apparatus has an image input means 11 such as a scanner, a camera, or a file reading apparatus, and a one-page or multiple-page form or attached material is input from the image input means 11 as image data. In this embodiment, it is assumed that a document scanner including an ADF (Auto Document Feeder) is used as an image input unit.
画像入力手段11はバス17に接続され、バス17を介して帳票処理の処理を実行するプロセッサ12に接続されている。
The image input means 11 is connected to the
バス17にはさらにキーボード13、ディスク14、メモリ15、出力手段16が接続されている。
A
メモリ15は、プロセッサ12において処理制御情報を作成する際の一時データ記憶、あるいは画像入力手段11で読み込んだ画像データを蓄積する。また、登録帳票の添付資料有無情報を含む登録帳票データ(帳票の種類を識別するためのデータ)等が、ディスク14等から読み込まれて、保持される。また、後述するフローチャートに対応するような処理をコンピュータに実行させるための制御プログラム15cが格納される。なお、これらのコンピュータ読み取り可能な制御プログラムは、コンピュータ読み取り可能な記憶媒体により供給されるものであってもよいし、ネットワーク等を介して供給されるものであってもよい。
The
プロセッサ12は、メモリ15に格納された制御プログラム15cを実行することにより、帳票登録手段12a、帳票識別手段12b、ファイリング手段12cとして機能する。
The
キーボード13は、帳票の登録や識別などの指示操作を行い、ディスク14は、補助記憶装置として機能する。
The
出力手段16は、ディスプレイ、プリンタ等であり、識別結果等の各種情報を出力する。 The output means 16 is a display, a printer, or the like, and outputs various information such as identification results.
画像入力手段11で読み取った帳票の画像は、帳票画像15bとしてメモリ15に格納される。帳票画像15bはプロセッサ12に設けられた画像処理手段(図示せず。)等により2値化処理されて、帳票登録手段12a、帳票識別手段12bに送られる。
The form image read by the image input means 11 is stored in the
そして、黒ドットのヒストグラムを取るなどして帳票画像に含まれる領域を識別し、帳票画像15bに含まれる領域をテーブル、テキスト、ピクチャ等に属性分類し、さらに解像度、各領域の位置情報、大きさ情報等を抽出し、入力帳票データを生成し、メモリ11およびディスク14に保存する。
Then, the area included in the form image is identified by taking a histogram of black dots, etc., and the area included in the form image 15b is attributed to table, text, picture, etc., and the resolution, position information of each area, The information is extracted, input form data is generated, and stored in the
図2は、帳票と添付資料で構成される画像をファイリングさせるときの入力の例を示す図である。最初の帳票A(201)には添付資料3枚(202〜204)、次の帳票B(205)は添付資料なし、その次の帳票A(206)には添付資料2枚(207、208)、その次の帳票C(209)は添付資料3枚(210〜212)で構成されている。このような状態で、オートドキュメントフィーダーから連続入力されるとする。 FIG. 2 is a diagram illustrating an example of input when filing an image composed of a form and an attached material. The first form A (201) has three attached materials (202 to 204), the next form B (205) has no attached material, and the next form A (206) has two attached materials (207, 208). The next form C (209) is composed of three attached materials (210 to 212). In this state, it is assumed that continuous input is performed from the auto document feeder.
図3は帳票A、帳票B、帳票Cの添付資料有無情報を示す図である。帳票の種類として帳票A、帳票B、帳票Cが登録されており、帳票の種類それぞれに対し、添付資料が付く可能性があるかどうかを示す添付資料有無情報が対応付けられて登録されている。3の例では、帳票Aは「有り」、帳票Bは「無し」、帳票Cは「有り」で登録されている。なお、この添付資料有無情報が「有り」とされている場合でも、添付資料の枚数指定はされておらず、添付資料は0枚〜複数枚のいずれかとなる。添付資料有無情報は、ユーザが予め指定する。また、帳票の種類は、ユーザが指定してもよいし、自動で割り付けてもよい。また、各帳票の種類を識別する際に用いる特徴データも各帳票種類に対応付けて登録されている。帳票識別処理は、これらの特徴データを用いて比較が行われる。 FIG. 3 is a diagram showing attachment presence / absence information of the form A, the form B, and the form C. Form A, form B, and form C are registered as form types, and attached material presence / absence information indicating whether or not there is a possibility of attaching attached materials is registered in association with each form type. . In the example 3, the form A is registered as “present”, the form B is registered as “not present”, and the form C is registered as “present”. Even when the presence / absence information of the attached material is “present”, the number of attached materials is not specified, and the number of attached materials is one of 0 to plural. The attached material presence / absence information is designated in advance by the user. The type of form may be designated by the user or may be automatically assigned. Also, feature data used when identifying the type of each form is registered in association with each form type. The form identification process is compared using these feature data.
そして、図2のような順に画像が入力されたとする。まず、1番目の画像(201)を帳票識別して、帳票種別Aと識別されたとすると、この帳票201は、添付資料有無情報から添付資料がつく可能性が有ると判断される。次に、2番目の画像(202)を読み込んで、帳票識別して、類似する帳票種別が無い(帳票種別が不明である)と判断されたとすると、直前に読み込んで識別できた帳票201の添付資料有無情報が「有り」なので、2番目の画像202は、直前に識別された帳票201の添付資料であると判断する。3番目の画像(203)と4番目の画像(204)も同様に帳票種別が不明であり、5番目の画像(205)は、帳票Bと識別されたものとする。そこで、帳票201の添付資料有無情報が「有り」で、その次に読み込んだ3枚の画像202〜204が不明帳票として連続しているので、画像202〜204は帳票201の添付資料であると判断し、最初の4枚(201〜204)をまとめて、1組のデータにファイリングする。5番目の画像は、帳票Bと識別され、添付資料有無情報から添付資料はなしと判断される。そこで、5番目の画像のみで、ファイリングする。そして、次の画像(206)を読み込み、帳票識別すると、帳票Aと識別され、同様にして、次の2枚の不明帳票(207、208)が添付資料と判断され、3枚(206〜208)で1組のデータとしてファイリングされ、次の1枚(209)は帳票Cと識別され、次の3枚(210〜212)が添付資料と判断され、1組のデータ(209〜212)にファイリングされる。
Assume that images are input in the order shown in FIG. First, if the first image (201) is identified as a form and identified as a form type A, it is determined that there is a possibility that an attached material is attached to the
このように添付資料の枚数が変動するような帳票でも、帳票毎に自動的にファイリングすることができる。 Thus, even a form in which the number of attached materials fluctuates can be automatically filed for each form.
図4は、帳票識別の際に利用する登録帳票を登録する際の帳票登録処理の例を示すフローチャートである。後述する帳票識別処理(図5)では、図4で登録された登録帳票データを用いて、識別対象となる入力画像の帳票種類を識別することになる。 FIG. 4 is a flowchart showing an example of a form registration process when registering a registered form used for form identification. In a form identification process (FIG. 5) described later, the form type of the input image to be identified is identified using the registered form data registered in FIG.
ステップS41:帳票を画像入力手段11から読み込み、画像データとしてメモリに転送する。 Step S41: The form is read from the image input means 11 and transferred to the memory as image data.
ステップS42:オペレータがキーボード13から帳票の種類を入力する。
Step S42: The operator inputs the form type from the
ステップS43:オペレータがキーボード13から帳票に添付資料がつく可能性があるかないかを入力する。
Step S43: The operator inputs from the
ステップS44:ステップS41で読み込んだ画像から特徴量を抽出して書式データ作成等の処理を実行し、ステップS42で入力された帳票の種類、ステップS43で入力された添付資料がつく可能性があるかないかを示す添付資料有無情報とともに、図3に示すように登録する。 Step S44: A feature amount is extracted from the image read in step S41, and processing such as creation of format data is executed. The form type input in step S42 and the attached material input in step S43 may be attached. The information is registered as shown in FIG.
ステップS45:登録する画像が終わりか否かを判断する。登録する画像がまだあるときは、ステップS41に戻り、終わりのときは、そのまま処理を終了する。 Step S45: It is determined whether the registered image is over. If there are still images to be registered, the process returns to step S41.
図5は、本実施例における帳票識別処理の例を示すフローチャートである。 FIG. 5 is a flowchart illustrating an example of the form identification process in the present embodiment.
ステップS501:入力された画像から1番目の画像を読み込み、メモリに転送する。 Step S501: The first image is read from the input image and transferred to the memory.
ステップS502:画像から特徴量を抽出し、帳票特徴データを作成し、図3で登録されている登録帳票の特徴データと比較することにより、帳票識別を行う。 Step S502: A feature amount is extracted from an image, form feature data is created, and form identification is performed by comparing with feature data of a registered form registered in FIG.
ステップS503:帳票識別して、登録帳票に類似したかどうかを判断する。ここで、登録帳票と類似した場合は、該画像が帳票であると判断してステップS504に進み、類似する登録帳票がなかった場合は、ステップS506に進む。 Step S503: The form is identified, and it is determined whether it is similar to the registered form. If it is similar to the registered form, it is determined that the image is a form, and the process proceeds to step S504. If there is no similar registered form, the process proceeds to step S506.
ステップS504:ステップS503で類似する登録帳票があると判断した場合、該画像についてのファイリング情報を「帳票」と設定しておく。そして、ステップS505に進む。 Step S504: If it is determined in step S503 that there is a similar registered form, the filing information for the image is set as “form”. Then, the process proceeds to step S505.
ステップS505:ステップS503で類似すると判断された登録帳票に対応付けられている添付資料有無情報を得て、該画像と関連付けて保存しておく。すると、ステップS509に進み、新たな帳票ファイルとしてファイリングされることになる。 Step S505: Attached material presence / absence information associated with the registration form determined to be similar in step S503 is obtained and stored in association with the image. In step S509, the file is filed as a new form file.
ステップS506:ステップS503で処理対象の入力画像に類似する登録帳票がないと判断した場合は、ステップS506に進み、直前に識別された帳票ファイルの添付資料有無情報が「有り」か「無し」かに基づいて、添付資料かどうかを判断する。添付資料有無情報が「有り」の場合は、当該画像を直前の帳票ファイルの添付資料であると判断し、ステップS507で、「添付資料」という情報を設定する。添付資料有無情報が「無し」の場合は、不明であると判断し、ステップS508で、「不明」という情報を設定する。 Step S506: If it is determined in step S503 that there is no registered form similar to the input image to be processed, the process proceeds to step S506, and whether the attached material presence / absence information of the form file identified immediately before is “present” or “not present”. To determine whether it is an attachment. If the attached material presence / absence information is “present”, it is determined that the image is an attached material of the immediately preceding form file, and information “attached material” is set in step S507. If the attached material presence / absence information is “none”, it is determined that it is unknown, and information “unknown” is set in step S508.
ステップS509:画像に設定されたファイリング情報が「帳票」、「添付資料」、「不明」のいずれであるかに基づいて、ファイリングを行う。「帳票」である場合は、新しい帳票ファイルを作成する(もしくは新しい帳票格納用フォルダ内に格納する)。「添付資料」の場合は、その直前に作成された帳票ファイルの添付資料として、該帳票ファイルに結合して保存する(もしくは直前に作成された帳票格納用フォルダ内に添付資料として格納する)。「不明」の場合は、不明の画像として、不明画像格納用フォルダ等に保存しておく。ユーザは、不明画像格納用フォルダを後から調べ、手動で仕分けを行なったり、新たな登録帳票として登録したりすることができる。 Step S509: Filing is performed based on whether the filing information set in the image is “form”, “attached material”, or “unknown”. If it is “form”, a new form file is created (or stored in a new form storage folder). In the case of “attached material”, it is combined with the form file and stored as an attached material of the form file created immediately before (or stored as an attached material in the form storage folder created immediately before). In the case of “unknown”, an unknown image is stored in an unknown image storage folder or the like. The user can check the unknown image storage folder later and manually sort it or register it as a new registration form.
ステップS510:連続して入力されてきた画像が終わりか否か判断する。未処理の画像が存在するときは、ステップS501に戻り、すべての画像の処理が完了していたときは、終了する。 Step S510: It is determined whether or not the continuously input images are finished. If there is an unprocessed image, the process returns to step S501. If all the images have been processed, the process ends.
以上述べたように、本実施例によれば、帳票を登録するときに添付資料有無情報を指定して登録することにより、帳票を識別するときにその情報を見て識別することにより、添付資料がついている帳票も1組のデータに統合して、ファイリングすることができ、不明帳票も後で、修正しやすくすることができる。 As described above, according to this embodiment, by specifying and registering attachment presence / absence information when registering a form, by identifying and checking the information when identifying the form, the attached material Forms with can be integrated into a set of data and filed, and unknown forms can be easily modified later.
(実施例2)
図6は、実施例2に係る帳票処理装置の一実施形態を示すブロック図である。
(Example 2)
FIG. 6 is a block diagram illustrating an embodiment of a form processing apparatus according to the second embodiment.
図6において、帳票処理装置は、実施例1の構成とほぼ同様であるので共通の部分の説明は省略する。実施例2のプロセッサ12は、メモリ15に格納された制御プログラム15cを実行することにより、帳票登録手段12a、帳票識別手段12b、添付資料判断手段12c、添付資料枚数計数手段12d、ファイリング手段12eとして機能する。
In FIG. 6, the form processing apparatus is substantially the same as the configuration of the first embodiment, and thus description of common parts is omitted. The
図7は、帳票と添付資料で構成される画像をファイリングさせるときの入力の例を示す図である。最初の帳票A(701)には添付資料3枚(702〜704)、次の帳票B(705)は添付資料なし、その次の帳票A(706)には添付資料2枚(707、708)、その次の帳票C(709)は添付資料3枚(710〜712)、その次の帳票A(713)は添付資料3枚(714〜716)で構成されている。このような状態で、オートドキュメントフィーダー等から入力されるとする。 FIG. 7 is a diagram showing an example of input when filing an image composed of a form and an attached material. The first form A (701) has three attachments (702 to 704), the next form B (705) has no attachments, and the next form A (706) has two attachments (707, 708). The next form C (709) is composed of three attached materials (710 to 712), and the next form A (713) is composed of three attached materials (714 to 716). In this state, it is assumed that an input is made from an auto document feeder or the like.
各帳票種類(帳票A、帳票B、帳票C)の添付資料有無情報は、実施例1と同様に図3のようなテーブルで保持されているものとする。 The attached material presence / absence information of each form type (form A, form B, form C) is assumed to be held in a table as shown in FIG.
そして、図7のような順でオートドキュメントフィーダーに原稿を載せ、画像の読み取りを行うが、ここで、9番目の画像:帳票C(709)が重送され、読み取りミスしたとする。 Then, the document is placed on the auto document feeder in the order as shown in FIG. 7 and the image is read. Here, it is assumed that the ninth image: form C (709) is double-fed and a reading error occurs.
まず、1番目の画像(701)を帳票識別して、帳票Aと識別されたとすると、この帳票は、添付資料有無情報から添付資料がつく可能性が有りと判断される。次に、2番目の画像(702)を読み込んで、帳票識別して、登録帳票に類似しないと判断されたとすると、直前の帳票Aの添付資料無情報が有りなので、添付資料と判断し、添付資料枚数をカウントする。同様に3番目の画像(703)、4番目の画像(704)も添付資料と判断する。そして、5番目の画像(705)は、帳票Bと識別される。そこで、最初の4枚(701〜704)をまとめて、1組のデータにファイリングすることができる。この結果、1組目の帳票データは帳票種類が帳票Aで、添付資料枚数3枚となる。 First, if the first image (701) is identified as a form and is identified as a form A, it is determined that there is a possibility that an attached material is attached from the attached material presence / absence information. Next, if the second image (702) is read, the form is identified, and it is determined that it is not similar to the registered form, there is no attached material information on the immediately preceding form A. Count the number of documents. Similarly, the third image (703) and the fourth image (704) are also determined as attachments. The fifth image (705) is identified as form B. Therefore, the first four sheets (701 to 704) can be collectively filed into a set of data. As a result, the form data of the first set is the form A and the number of attached materials is 3.
次に、5番目の画像は、帳票Bと識別され、添付資料有無情報から添付資料はなしと判断される。そこで、5番目の画像のみを2組目の帳票データとしてファイリングし、添付資料枚数は0枚となる。 Next, the fifth image is identified as a form B, and it is determined that there is no attached material from the attached material presence / absence information. Therefore, only the fifth image is filed as the second set of form data, and the number of attached materials is zero.
そして、6番目の画像(706)を読み込み、帳票識別すると、帳票Aと識別され、7番目、8番目の画像(707、708)は同様にして、添付資料と判断される。ここで、本来の9番目の画像(709:帳票C)が読み取りミスされた(原稿708と一緒に重送されてしまった)とする。この場合、次の帳票Cの添付資料(710)が9番目となる。そして、この画像は、帳票識別すると、登録帳票に類似しないので、帳票A(706)の添付資料と判断される。そして、10番目、11番目(711、712)も同様に添付資料と判断される。そして、12番目の画像(713)は、帳票Aと識別される。この結果、3組目の帳票データ(706〜708、710〜712)は帳票種類が帳票Aで、添付資料5枚となる。 Then, when the sixth image (706) is read and the form is identified, it is identified as form A, and the seventh and eighth images (707, 708) are similarly determined as attachments. Here, it is assumed that the original 9th image (709: form C) has been missed (doubled with the original 708). In this case, the attached material (710) of the next form C is the ninth. Then, when the form is identified, this image is not similar to the registered form, and is thus determined to be attached to the form A (706). Similarly, the tenth and eleventh (711, 712) are also determined as attachments. The twelfth image (713) is identified as a form A. As a result, the third set of form data (706 to 708, 710 to 712) has the form type of form A and five attached materials.
13、14、15番目(714〜716)は同様にして帳票Aの添付資料となる。そこで、4組目のデータ(713〜716)は帳票Aで添付資料3枚となる。 The thirteenth, fourteenth and fifteenth (714 to 716) are similarly attached to the form A. Therefore, the fourth set of data (713 to 716) is a form A with three attached materials.
この例では、このファイリングした結果のデータ毎の添付資料枚数を計数した枚数が、図8のように表示される。このように、1組のデータ毎に識別した帳票の種類、添付資料枚数が識別されて表示される。 In this example, the number of attachments for each data as a result of filing is displayed as shown in FIG. In this way, the form type and the number of attached materials identified for each set of data are identified and displayed.
ここで、例えば、帳票Aの添付資料枚数の最頻値を求めると、3枚となる。1組目データ、4組目データは、差が0だが、3組目データは差が2枚となる。そこで、3組目データに警告表示をする。例えば、3組目データの行の色を変えて表示する。 Here, for example, when the mode value of the number of attached materials of the form A is obtained, it becomes three. The first group data and the fourth group data have a difference of 0, but the third group data has two differences. Therefore, a warning is displayed on the third set of data. For example, the color of the row of the third set data is changed and displayed.
ユーザは、3組目データの原稿を検証することにより、ミスがあることがわかり、その部分の画像データを再読み取りして、正しくファイリングできる。 The user can verify that there is a mistake by verifying the document of the third set of data, and can re-read the image data of that portion and file it correctly.
このように添付資料の枚数をカウントした際に、最適値と差があるものを警告することにより、読み取りミスのある箇所を見つけ、修正しやすくすることができる。 In this way, when the number of attached materials is counted, by warning the difference between the optimum value, it is possible to easily find and correct a portion having a reading error.
実施例2における帳票登録処理は、実施例1で説明した図4のフローチャートと同様に行われるが、ステップS43,44の処理が一部異なる。 The form registration process in the second embodiment is performed in the same manner as the flowchart of FIG. 4 described in the first embodiment, but the processes in steps S43 and S44 are partially different.
ステップS41:帳票を画像入力手段11から読み込み、画像データとしてメモリに転送する。 Step S41: The form is read from the image input means 11 and transferred to the memory as image data.
ステップS42:オペレータがキーボード13から帳票の種類を入力する。
Step S42: The operator inputs the form type from the
ステップS43:オペレータがキーボード13から帳票に添付資料がつく可能性があるかないかを入力する。ここで、本実施例2では、添付資料の平均枚数を入力するものとする。(なお、別の実施例としては、平均枚数ではなく、添付資料の最小枚数と最大枚数を入力するようにしてもよい。)
ステップS44:ステップS41で読み込んだ画像から特徴量を抽出して書式データ(特徴データ)作成等の処理を実行し、ステップS42で入力された帳票の種類、ステップS43で入力された添付資料がつく可能性があるかないかを示す添付資料有無情報、平均枚数とを対応付けて登録する。(なお、平均枚数の代わりに、添付資料の最小枚数と最大枚数が入力された場合は、それらを対応付けて登録する。)
ステップS45:登録する画像が終わりか否かを判断する。登録する画像がまだあるときは、ステップS41に戻り、終わりのときは、そのまま処理を終了する。
Step S43: The operator inputs from the
Step S44: The feature amount is extracted from the image read in step S41 and processing such as format data (feature data) creation is executed, and the form type input in step S42 and the attached material input in step S43 are attached. Attached material presence / absence information indicating whether or not there is a possibility and an average number of sheets are registered in association with each other. (If the minimum and maximum number of attached materials are entered instead of the average number, they are registered in association with each other.)
Step S45: It is determined whether the registered image is over. If there are still images to be registered, the process returns to step S41.
図9は、実施例2における帳票識別処理の例を示すフローチャートである。 FIG. 9 is a flowchart illustrating an example of form identification processing according to the second embodiment.
ステップS601:入力された画像から1番目の画像を読み込み、メモリに転送する。 Step S601: The first image is read from the input image and transferred to the memory.
ステップS602:画像から特徴量を抽出し、帳票特徴データを作成し、登録されている帳票の特徴データと比較することにより、帳票識別を行う。 Step S602: Feature identification is performed by extracting feature values from the image, creating form feature data, and comparing it with feature data of the registered form.
ステップS603:帳票識別して、登録帳票に類似したかどうかを判断する。ここで、登録帳票と類似した場合は、該画像が帳票であると判断してステップS604に進み、類似する登録帳票がなかった場合は、ステップS606に進む。 Step S603: Identify the form and determine whether it is similar to the registered form. If it is similar to the registered form, it is determined that the image is a form, and the process proceeds to step S604. If there is no similar registered form, the process proceeds to step S606.
ステップS604:ステップS603で類似する登録帳票があると判断した場合、該画像についてのファイリング情報を「帳票」と設定しておく。そして、ステップS605に進む。 Step S604: If it is determined in step S603 that there is a similar registered form, the filing information for the image is set as “form”. Then, the process proceeds to step S605.
ステップS605:ステップS603で類似すると判断された登録帳票に対応付けられている添付資料有無情報を得て、該画像と関連付けて保存しておく。すると、ステップS609に進み、新たな帳票ファイルとしてファイリングが行われることになる。 Step S605: Attached material presence / absence information associated with the registered form determined to be similar in step S603 is obtained and stored in association with the image. In step S609, filing is performed as a new form file.
ステップS606:ステップS603で処理対象の入力画像に類似する登録帳票がないと判断した場合は、ステップS606に進み、直前に識別された帳票ファイルの添付資料有無情報が「有り」か「無し」かに基づいて、添付資料かどうかを判断する。添付資料有無情報が「有り」の場合は、当該画像を直前の帳票ファイルの添付資料であると判断し、ステップS607で、ファイリング情報に「添付資料」という情報を設定する。添付資料有無情報が「無し」の場合は、不明であると判断し、ステップS608で、ファイリング情報に「不明」という情報を設定する。 Step S606: If it is determined in step S603 that there is no registered form similar to the input image to be processed, the process proceeds to step S606, and whether the attached material presence / absence information of the form file identified immediately before is “present” or “not present”. To determine whether it is an attachment. If the attached material presence / absence information is “present”, it is determined that the image is an attached material of the immediately preceding form file, and information “attached material” is set in the filing information in step S607. If the attached material presence / absence information is “none”, it is determined that the information is unknown, and information “unknown” is set in the filing information in step S608.
ステップS609:画像に設定されたファイリング情報が「帳票」、「添付資料」、「不明」であるかに基づいて、ファイリングを行う。「帳票」である場合は、新しい帳票ファイルを作成する(もしくは新しい帳票格納用フォルダ内に格納する)。「添付資料」の場合は、その直前に作成された帳票ファイルの添付資料として、該帳票ファイルに結合して保存する(もしくは直前に作成された帳票格納用フォルダ内に添付資料として格納する)。「不明」の場合は、不明の画像として、不明画像格納用フォルダ等に保存しておく。不明画像格納用フォルダを後から調べ、手動で仕分けを行なったり、新たな登録帳票として登録したりすることができる。 Step S609: Filing is performed based on whether the filing information set in the image is “form”, “attached material”, or “unknown”. If it is “form”, a new form file is created (or stored in a new form storage folder). In the case of “attached material”, it is combined with the form file and stored as an attached material of the form file created immediately before (or stored as an attached material in the form storage folder created immediately before). In the case of “unknown”, an unknown image is stored in an unknown image storage folder or the like. The unknown image storage folder can be examined later, and can be manually sorted or registered as a new registration form.
ステップS610:ファイリング情報が「添付資料」であるときは、添付資料の枚数をデータ毎(帳票ファイル毎)にカウントする。 Step S610: When the filing information is “attached material”, the number of attached materials is counted for each data (for each form file).
ステップS611:連続して入力されてきた画像が終わりか否か判断する。未処理の画像が存在するときは、ステップS601に戻り、すべての画像の処理が完了していたときは、ステップS612に進む。 Step S611: It is determined whether or not the continuously input images are over. If there is an unprocessed image, the process returns to step S601, and if all the images have been processed, the process proceeds to step S612.
ステップS612:すべての画像の処理が完了したら、ファイリングしたデータ毎に帳票種類、添付資料枚数を表示する。 Step S612: When all the images have been processed, the form type and the number of attached materials are displayed for each filed data.
ステップS613:帳票種類毎に添付資料枚数の最適枚数を取得する。取得した添付資料枚数の最適枚数とデータの添付資料枚数を比較し、差がある場合は、そのデータを警告表示する。例えば、添付資料の枚数をデータ毎に表示し、差が大きいと判断したデータは、色を変えて表示する。この最適枚数は、連続して入力した際に識別された各帳票種類の添付資料枚数の最頻値に基づいて決定してもよいし、帳票を登録する際に登録した際に入力した平均値や範囲を用いても良い。これらのいずれを用いるかは予め決定されているものとする。例えば、予め登録されている平均値を用いる場合、当該平均値と識別された添付資料枚数とを比較して、ある値以上の差があるデータを警告表示する。また、予め登録されている最小枚数と最大枚数とを用いる場合、これらの範囲外であるデータを警告表示する。 Step S613: The optimum number of attached materials is acquired for each form type. The optimum number of acquired attachments is compared with the number of attachments of data, and if there is a difference, the data is displayed as a warning. For example, the number of attached materials is displayed for each data, and data determined to have a large difference is displayed with a different color. This optimum number of sheets may be determined based on the mode value of the number of attached materials of each form type identified when continuously entered, or the average value entered when registering the form Or a range may be used. Which of these is used is determined in advance. For example, when an average value registered in advance is used, the average value is compared with the number of identified attached materials, and data having a difference of a certain value or more is displayed as a warning. In addition, when using the minimum number and the maximum number registered in advance, a warning is displayed for data outside these ranges.
以上の述べたように、本実施例によれば、添付資料がついている帳票を1組ずつのデータに統合してファイリングするとき、添付資料枚数を計数して保存しておき、データ毎に添付資料枚数を表示、また、帳票種類毎の最適枚数と比較して、差が大きいものを警告することにより、読み込みミス等が発生した場合でも、発生した箇所を発見しやすくすることができる。 As described above, according to the present embodiment, when filing a form with attached materials into one set of data, the number of attached materials is counted and stored, and attached for each data. By displaying the number of documents and warning the difference between the optimum number for each form type, it is possible to easily find the place where the error occurred even if a reading error occurs.
なお、上述した帳票処理装置は、画像から特徴量を抽出して、登録帳票データで生成して、帳票登録、帳票識別を行ったが、ある領域の文字を読み取って帳票の識別を行う等、他の帳票識別の方法で実現してもよい。 Note that the above-described form processing apparatus extracts feature amounts from the image, generates the registered form data, and performs form registration and form identification.However, the form is identified by reading characters in a certain area, etc. It may be realized by another form identification method.
Claims (10)
複数の画像を連続入力する入力手段と、
入力された画像の帳票種類を識別する帳票識別手段と、
前記識別された帳票種類の添付資料有無情報に基づいて、次に入力された画像が添付資料であるか否かを判断する添付資料判断手段と、
前記帳票識別手段で帳票種類が識別された画像と、前記添付資料判断手段で添付資料と判断された画像とを1組のデータとしてファイリングするファイリング手段と、
を有することを特徴とする帳票処理装置。 A form processing device for filing a form and its attached material as a set of data,
Input means for continuously inputting a plurality of images;
Form identification means for identifying the form type of the input image;
Attachment determination means for determining whether or not the next input image is an attachment based on the attachment presence / absence information of the identified form type;
Filing means for filing an image whose form type is identified by the form identifying means and an image judged as an attached material by the attached material judging means as a set of data;
A form processing apparatus characterized by comprising:
前記カウント手段によりカウントされた結果に基づいて、読み取りミスが生じた可能性のある組のデータを警告する警告手段と、
を更に有することを特徴とする請求項1に記載の帳票処理装置。 A counting means for counting the number of attachments when the attachment determination means determines that the attachment is an attachment;
Warning means for warning a set of data that may have caused a reading error based on the result counted by the counting means;
The form processing apparatus according to claim 1, further comprising:
複数の画像を連続入力する入力工程と、
入力された画像の帳票種類を識別する帳票識別工程と、
前記識別された帳票種類の添付資料有無情報に基づいて、次に入力された画像が添付資料であるか否かを判断する添付資料判断工程と、
前記帳票識別工程で帳票種類が識別された画像と、前記添付資料判断工程で添付資料と判断された画像とを1組のデータとしてファイリングするファイリング工程と、
を有することを特徴とする帳票処理装置の帳票処理方法。 A form processing method for a form processing apparatus for filing a form and an attached material of the form as a set of data,
An input process for continuously inputting a plurality of images;
Form identification process for identifying the form type of the input image,
An attachment determination step for determining whether the next input image is an attachment based on the attachment presence / absence information of the identified form type;
A filing step of filing the image in which the form type is identified in the form identification step and the image determined to be an attachment in the attachment determination step as a set of data;
A form processing method for a form processing apparatus, comprising:
前記帳票処理装置のコンピュータに、
入力された画像の帳票種類を識別する帳票識別手順と、
前記識別された帳票種類の添付資料有無情報に基づいて、次に入力された画像が添付資料であるか否かを判断する添付資料判断手順と、
前記帳票識別手順で帳票種類が識別された画像と、前記添付資料判断手順で添付資料と判断された画像とを1組のデータとしてファイリングするファイリング手順と、
を実行させるためのコンピュータプログラム。 A computer program for causing a form processing apparatus to file a form and an attached material of the form as a set of data,
In the computer of the form processing apparatus,
Form identification procedure for identifying the form type of the input image,
An attachment determination procedure for determining whether or not the next input image is an attachment based on the attachment presence / absence information of the identified form type;
A filing procedure for filing an image whose form type is identified in the form identifying procedure and an image determined as an attached material in the attached material determining procedure as a set of data;
A computer program for running.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007123561A JP2008282091A (en) | 2007-05-08 | 2007-05-08 | Document processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007123561A JP2008282091A (en) | 2007-05-08 | 2007-05-08 | Document processing device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008282091A true JP2008282091A (en) | 2008-11-20 |
Family
ID=40142877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007123561A Pending JP2008282091A (en) | 2007-05-08 | 2007-05-08 | Document processing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008282091A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010226387A (en) * | 2009-03-23 | 2010-10-07 | Oki Electric Ind Co Ltd | Slip image filing system |
-
2007
- 2007-05-08 JP JP2007123561A patent/JP2008282091A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010226387A (en) * | 2009-03-23 | 2010-10-07 | Oki Electric Ind Co Ltd | Slip image filing system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9626738B2 (en) | Image processing apparatus, image processing method, and storage medium | |
US8159717B2 (en) | Image processing apparatus | |
US20200128135A1 (en) | Image inspection apparatus and image inspection program | |
US10142499B2 (en) | Document distribution system, document distribution apparatus, information processing method, and storage medium | |
JP2007116469A (en) | Medium treatment method, copying device, and data filing device | |
US10757290B2 (en) | Image processing apparatus being able to simultaneously read and extract image data | |
JP2007241413A (en) | Page error inspection device and page error inspection method | |
JP2021043775A (en) | Information processing device and program | |
US9854126B2 (en) | System and method for handling blank pages during document printing or copying | |
US11436733B2 (en) | Image processing apparatus, image processing method and storage medium | |
JP2005217805A (en) | Image processing apparatus | |
JP2008282091A (en) | Document processing device | |
JP2015219056A (en) | Print inspection device and print inspection method | |
JP6700705B2 (en) | Distribution system, information processing method, and program | |
JP4347256B2 (en) | Image processing apparatus, image processing method, image processing program, and computer-readable recording medium recorded with the same | |
JP7171269B2 (en) | Image matching system, image matching method, and program | |
EP2106118A1 (en) | Adding image quality indications to a list of thumbnail images | |
JP2017208655A (en) | Information processing system, information processing method and program | |
JP6613871B2 (en) | Information processing apparatus, image reading apparatus, and program | |
JP2019161352A (en) | Information processing device and information processing program | |
JP2007194793A (en) | Image forming apparatus | |
JP7183623B2 (en) | Image processing device, image processing method and image processing program | |
JP2019129357A (en) | Image processing apparatus | |
US11354890B2 (en) | Information processing apparatus calculating feedback information for partial region of image and non-transitory computer readable medium storing program | |
JP7486954B2 (en) | Form processing program, form processing device, and form processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100201 |