JP2001005831A - Filing method and recording medium storing the method - Google Patents

Filing method and recording medium storing the method

Info

Publication number
JP2001005831A
JP2001005831A JP11177599A JP17759999A JP2001005831A JP 2001005831 A JP2001005831 A JP 2001005831A JP 11177599 A JP11177599 A JP 11177599A JP 17759999 A JP17759999 A JP 17759999A JP 2001005831 A JP2001005831 A JP 2001005831A
Authority
JP
Japan
Prior art keywords
document
filing
documents
fixed
integrated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11177599A
Other languages
Japanese (ja)
Inventor
Mitsugi Matsushita
貢 松下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP11177599A priority Critical patent/JP2001005831A/en
Publication of JP2001005831A publication Critical patent/JP2001005831A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To automatically file plural sets of documents including routine documents as one piece of data. SOLUTION: In this filing method, the image of an original to be registered is read by an image input part 6 and sent to a document identifying part 8. The document identifying part 8 identifies the kind of a document registering the sent image in a document information registering part 7 and the page of that document, and sends it to a document registering part 9. The document registering part 9 merges plural documents as one piece of data on the basis of the document information registered in the document information registering part 7 and the identified result of the document identifying part 8, and registers the document in a filing part 10.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明は、文書画像認識技
術を利用し文書をファイリングするファイリング方法及
びそれを格納した記録媒体に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a filing method for filing a document using a document image recognition technique and a recording medium storing the method.

【0002】[0002]

【従来の技術】文書をコンピュータ上のデータベースと
してファイリングしたいという要望は多く、各種のファ
イリング方法が実現されている。例えば特開平10−9
7606号公報に示された文書画像認識技術を利用した
ファイリング方法は、紙媒体に記録された内容をイメー
ジにより読み取ってイメージファイルを作成するととも
に、OCR装置でイメージ中に含まれる文字について文
字認識処理を施してテキストファイルを作成し、作成さ
れたイメージファイルとテキストファイルとを読み込ん
で体系的にファイリングするようにしている。
2. Description of the Related Art There are many demands for filing documents as a database on a computer, and various filing methods have been realized. For example, JP-A-10-9
The filing method using the document image recognition technology disclosed in Japanese Patent Application Laid-Open No. 7606 reads a content recorded on a paper medium by using an image to create an image file, and performs character recognition processing on characters included in the image using an OCR device. To create a text file, read the created image file and text file, and systematically file it.

【0003】[0003]

【発明が解決ようとする課題】一般にファイリングした
い文書の種類も多種多様であり、伝票や申請書などの定
型文書や一般文書のような非定型文書あるいは1枚の文
書や複数枚の文書などが存在する。しかしながら従来の
ファイリング方法は個々の文書を認識してファイリング
する方法であり、複数枚の文書を自動的に1つの文書と
して統合して処理することはできなかった。このため複
数枚の文書をファイリングする場合には、画像入力した
後に手動で複数枚組をリンク付けしたり、画像入力する
際に文書を手動で仕分けして複数枚組毎に画像入力する
など、登録する際に必ず手動で処理する必要があり、処
理が容易でないとう短所があった。
Generally, there are various types of documents to be filed, such as a fixed form document such as a slip or an application, an irregular form document such as a general document, or a single document or a plurality of documents. Exists. However, the conventional filing method is a method of recognizing and filing individual documents, and it has not been possible to automatically integrate and process a plurality of documents as one document. For this reason, when filing multiple documents, manually linking multiple sets after inputting images, manually sorting documents when inputting images, and inputting images for each set of multiple documents, etc. There is a disadvantage that the process must be performed manually when registering, and the process is not easy.

【0004】この発明はかかる短所を改善し、定型文書
を含む複数枚組の文書を自動的に一つのデータとしてフ
ァイリングすることができるファイリング方法とそれを
格納した記憶媒体を提供することを目的とするものであ
る。
SUMMARY OF THE INVENTION An object of the present invention is to provide a filing method capable of automatically filing a plurality of documents including a fixed form document as one data, and a storage medium storing the filing method. Is what you do.

【0005】[0005]

【課題を解決するための手段】この発明のファイリング
方法は、紙媒体などに記録された内容を画像情報として
保存し、ファイリングするファイリング方法において、
入力された画像情報とあらかじめ登録された文書の種類
に関する情報とを比較して入力された画像情報の種類を
識別し、同じ種類の文書を1つのデータに統合処理して
ファイリングすることを特徴とする。
A filing method according to the present invention is directed to a filing method for storing and filing contents recorded on a paper medium or the like as image information.
The input image information is compared with information on the type of document registered in advance, the type of the input image information is identified, and the same type of document is integrated into one piece of data for filing. I do.

【0006】上記文書を統合するとき、フォーマットの
決まっている定型の表紙1枚とフォーマットの決まって
いない非定型の添付資料を1つのデータとしてファイリ
ングする場合、表紙の1枚のみを識別し、識別した表紙
と非定型の添付資料を統合する。
[0006] When filing the above-mentioned documents, when filing one fixed cover sheet with a fixed format and an unfixed attached document with no fixed format as one data, only one cover sheet is identified and identified. Integrate the cover and the irregular attachment.

【0007】また、文書を統合するとき、フォーマット
の決まっている定型文書とフォーマットの決まっていな
い非定型の添付資料を1つのデータとしてファイリング
する場合、非定型の添付資料を定型文書に添付して統合
する。
[0007] In addition, when filing a fixed-form document having a fixed format and an unfixed attached material having an undefined format as one piece of data when integrating documents, the non-fixed attached material is attached to the fixed-form document. Integrate.

【0008】さらに、上記文書を統合するとき、複数枚
の文書に保存された内容をOCRを使ってデータ化し、
データ化したデータも統合すると良い。
Further, when the above documents are integrated, the contents stored in a plurality of documents are converted into data using OCR,
It is advisable to integrate data that has been converted into data.

【0009】また、上記文書を統合するときに、文書の
統合が指示されたときに統合処理を行うことが望まし
い。
[0009] When integrating the documents, it is desirable to perform the integration process when the integration of the documents is instructed.

【0010】また、入力された画像情報の種類を識別し
た結果を表示し、識別した結果が修正された場合に、修
正された識別結果により統合処理を行うと良い。
Further, it is preferable that the result of identifying the type of the input image information is displayed, and when the identified result is corrected, an integration process is performed based on the corrected identification result.

【0011】さらに、文書を統合するとき、統合が正し
く行われなかった場合に、その内容を表示することが望
ましい。
Further, when integrating documents, if the integration is not performed correctly, it is desirable to display the contents.

【0012】また、文書を統合するとき、レイアウトが
異なるが記載事項が同じである文書を同じ種類の文書と
して統合すると良い。
When documents are integrated, it is preferable to integrate documents having different layouts but the same description as the same type of document.

【0013】さらに、ファイリング方法のプログラムを
CD−ROM等の記録媒体に格納して、記録媒体に格納
したファイリングプログラムをコンピュータで読み出
し、読み出したファイリングプログラムによりが入力し
た文書を識別し、統合するようにしても良い。
Further, a filing method program is stored in a recording medium such as a CD-ROM, the filing program stored in the recording medium is read out by a computer, and a document input by the read out filing program is identified and integrated. You may do it.

【0014】[0014]

【発明の実施の形態】この発明のファイリング装置は、
CPUとROMとRAMとキーボードと表示部と画像入
力部と文書情報登録部と帳票識別部と文書登録部とファ
イリング部及び検索部を有する。文書情報登録部にはフ
ァイリングのために登録される文書の種類に関する情報
があらかじめ登録されている。
BEST MODE FOR CARRYING OUT THE INVENTION
It has a CPU, a ROM, a RAM, a keyboard, a display unit, an image input unit, a document information registration unit, a form identification unit, a document registration unit, a filing unit, and a search unit. Information on the type of document registered for filing is registered in the document information registration unit in advance.

【0015】このファイリング装置で文書等を登録する
ときは、登録する原稿の画像を画像入力部で読み取り帳
票識別部に送る。帳票識別部は送られた画像が文書情報
登録部に登録されたどの種類の文書の中のどのページの
文書かを識別して文書登録部に送る。文書登録部は文書
情報登録部に登録された文書情報と帳票識別部の識別結
果を基に複数枚の文書を1つのデータとして複数枚統合
処理してファイリング部に文書登録する。検索部はファ
イリング部に登録された文書を検索し表示部に表示す
る。
When a document or the like is registered by the filing apparatus, the image of the document to be registered is read by the image input unit and sent to the form identification unit. The form identification unit identifies which page of the type of document registered in the document information registration unit is the transmitted image, and sends the document to the document registration unit. The document registration unit integrates a plurality of documents as one data based on the document information registered in the document information registration unit and the identification result of the form identification unit, and registers the data in the filing unit. The search unit searches for a document registered in the filing unit and displays it on the display unit.

【0016】[0016]

【実施例】図1は、この発明の一実施例のファイリング
装置の構成を示すブロック図である。図に示すように、
ファイリング装置は装置全体を管理するCPU1とRO
M2とRAM3とキーボード4と表示部5と画像入力部
6と文書情報登録部7と帳票識別部8と文書登録部9と
ファイリング部10及び検索部11を有する。画像入力
部6はスキャナ等からなり登録する文書の画像を入力す
る。文書情報登録部7にはファイリングのために登録さ
れる文書の種類に関する情報があらかじめ登録されてい
る。例えば文書Aと文書Bという2種類の文書があり、
文書AはA1という定型の表紙が1枚に非定型の文書が
添付される形で構成され、文書Bは3種類の定形文書B
1,B2,B3の3枚で構成されているという文書情報
があらかじめ登録されている。帳票識別部8は画像入力
部6から入力された画像が文書情報登録部7に登録され
たどの種類の文書の中のどのページの文書かを識別す
る。文書登録部9は文書情報登録部7に登録された文書
情報と帳票識別部8の帳票識別結果を基に複数枚の文書
を1つのデータと統合処理してファイリング部10に文
書登録する。検索部11はファイリング部10に登録さ
れた文書を検索し表示部5に表示する。
FIG. 1 is a block diagram showing the configuration of a filing apparatus according to one embodiment of the present invention. As shown in the figure,
The filing device has a CPU 1 and an RO for managing the entire device.
M2, RAM 3, keyboard 4, display unit 5, image input unit 6, document information registration unit 7, form identification unit 8, document registration unit 9, filing unit 10, and search unit 11. The image input unit 6 includes a scanner or the like and inputs an image of a document to be registered. In the document information registration unit 7, information on the type of document registered for filing is registered in advance. For example, there are two types of documents, Document A and Document B,
Document A is composed of a fixed cover of A1 and a non-standard document attached to one sheet. Document B is composed of three types of standard document B.
Document information that the document is composed of three sheets, namely, B1, B2, and B3 is registered in advance. The form identification unit 8 identifies which page of the type of document registered in the document information registration unit 7 is the image input from the image input unit 6. The document registration unit 9 integrates a plurality of documents with one data based on the document information registered in the document information registration unit 7 and the form identification result of the form identification unit 8 and registers the data in the filing unit 10. The search unit 11 searches for a document registered in the filing unit 10 and displays it on the display unit 5.

【0017】上記のように構成されたファイリング装置
で文書等を登録するときの動作を図2のフローチャート
を参照して説明する。
The operation of registering a document or the like in the filing apparatus configured as described above will be described with reference to the flowchart of FIG.

【0018】文書等を登録するとき、オペレータは登録
する内容が文書の種類に関する文書情報か紙媒体などに
記録された画像や文書かを判断し(ステップS1)、文
書情報を登録するときは、キーボード4で登録する文書
情報を入力して文書情報登録部7に登録する(ステップ
S2)。また、登録する内容が紙媒体などに記録された
画像や文書の場合には、その原稿の画像を画像入力部6
で読み取り帳票識別部8に送る(ステップS3)。帳票
識別部8は送られた画像が文書情報登録部7に登録され
たどの種類の文書の中のどのページの文書かを識別す
る。例えば、特開平11−25215号公報に示すよう
に、処理対象の帳票画像とあらかじめ登録した画像の対
応点を検出し、パターンマッチングを利用して識別した
り、帳票に印刷されている帳票IDなどを利用して識別
して、識別した結果を文書登録部4に送る(ステップS
4)。例えば、定型の表紙A1と非定型の文書からなる
文書Aと3枚の定形文書B1,B2,B3からなる文書
Bを登録するときに、画像入力部6から1番目に定型の
表紙A1が入力され、2番目に非定型の文書が入力さ
れ、3番目から5番目に定形文書B1,B2,B3が順
次入力され、6番目に定型の表紙A1が入力され、7番
目に非定型の文書が入力された場合、帳票識別部8は定
型の表紙A1は「1」と「6」、定形文書B1は
「3」、定形文書B2は「4」、定形文書B3は
「5」、識別不能は「2」と「7」と識別する。文書登
録部9は文書情報登録部7に登録された文書情報と帳票
識別部8の帳票識別結果を基に複数枚の文書を1つのデ
ータとして複数枚統合処理してファイリング部10に文
書登録する(ステップS5,S6)。このように文書登
録部9で文書を登録するときに、登録するタイミングを
CPU1から指示することにより、不要なタイミングで
登録することを防ぐことができる。
When registering a document or the like, the operator determines whether the content to be registered is document information relating to the type of document or an image or document recorded on a paper medium or the like (step S1). The document information to be registered is input using the keyboard 4 and registered in the document information registration unit 7 (step S2). If the content to be registered is an image or a document recorded on a paper medium or the like, the image of the document is input to the image input unit 6.
Is sent to the read form identification unit 8 (step S3). The form identification unit 8 identifies which page of the type of document registered in the document information registration unit 7 is the transmitted image. For example, as shown in Japanese Patent Application Laid-Open No. H11-25215, a corresponding point between a form image to be processed and an image registered in advance is detected and identified using pattern matching, a form ID printed on the form, and the like. And sends the identified result to the document registration unit 4 (step S
4). For example, when registering a document A including a fixed cover A1, a non-fixed document, and a document B including three fixed documents B1, B2, and B3, the first fixed cover A1 is input from the image input unit 6. Then, an atypical document is input second, a standard document B1, B2, B3 is sequentially input third to fifth, a standard cover A1 is input sixth, and an atypical document is input seventh. When input, the form identification unit 8 sets the standard cover A1 to "1" and "6", the standard document B1 to "3", the standard document B2 to "4", the standard document B3 to "5", Identify "2" and "7". The document registration unit 9 integrates a plurality of documents as one data based on the document information registered in the document information registration unit 7 and the form identification result of the form identification unit 8 and registers the documents in the filing unit 10. (Steps S5 and S6). As described above, when a document is registered by the document registration unit 9, by instructing the registration timing from the CPU 1, it is possible to prevent registration at unnecessary timing.

【0019】このように文書を登録するとき、例えば、
帳票識別部8で定型の表紙A1は「1」と「6」、定形
文書B1は「3」、定形文書B2は「4」、定形文書B
3は「5」、識別不能は「2」と「7」と識別した場
合、文書登録部9は識別不能となった非定型の文書をそ
の直前に入力された定型の表紙A1の添付文書とし、連
続して入力された定形文書B1,B2,B3のなかで定
形文書B2,B3は最初に入力した定形文書B1に統合
し、文書Aを「1」,「2」と「6」,「7」の2組、
文書Bを「3」と「4」と「5」の1組の合計3組の文
書として仕分けして文書登録を行う。
When registering a document in this way, for example,
In the form identification unit 8, the standard cover A1 is "1" and "6", the standard document B1 is "3", the standard document B2 is "4", and the standard document B
In the case where 3 is identified as “5” and the indistinguishable is identified as “2” or “7”, the document registration unit 9 regards the unidentified atypical document as the attached document of the standard cover A1 input immediately before. Of the continuously input fixed-form documents B1, B2, and B3, the fixed-form documents B2 and B3 are integrated into the fixed-form document B1 input first, and the document A is combined with "1,""2,""6," and "6." 7 ”,
Document B is sorted and registered as a total of three documents of one set of “3”, “4”, and “5”.

【0020】また、画像入力部6から1番目に定型の表
紙A1が入力され、2番目に非定型の文書が入力され、
3番目に定型の表紙A1が入力され、4番目に非定型の
文書が入力され、5番目に非定型の文書が入力され、6
番目に定型の表紙A1が入力され、7番目に非定型の文
書が入力され、帳票識別部8で定型の表紙A1は「1」
と「3」と「6」、識別不能は「2」と「4」と「5」
と「7」と識別したときに、文書登録部9は文書Aを
「1」,「2」と、「3」,「4」,「5」と、
「6」,「7」の3組の文書として仕分ける。また、画
像入力部6から定形文書BがB1,B2,B3,B1,
B2,B3の順に入力した場合には、帳票識別部8で定
形文書B2,B3は最初に入力した定形文書B1に統合
して「1」,「2」,「3」と、「4」,「5」,
「6」の2組に仕分ける。
A standard cover A1 is input first from the image input unit 6, an atypical document is input second, and
Third, a fixed cover A1 is input, fourth, an atypical document is input, fifth, an atypical document is input, and
The standard cover A1 is input first, the non-standard document is input seventh, and the form cover A1 is "1" in the form identification unit 8.
And "3" and "6", and indistinguishable "2", "4" and "5"
When the document registration unit 9 identifies the document A as “1”, “2”, “3”, “4”, “5”,
The documents are sorted as three sets of documents “6” and “7”. Also, from the image input unit 6, the fixed form document B becomes B1, B2, B3, B1,
In the case where B2 and B3 are input in the order, the form identification unit 8 integrates the fixed form documents B2 and B3 into the fixed form document B1 which is input first, and outputs "1", "2", "3", "4", and "4". "5",
Sort into two sets of "6".

【0021】また、例えばA,B,Cという3種類の文
書があり、文書情報登録部7に文書AはA1という定型
の表紙1枚に非定型の文書が添付される形で構成され、
文書BはB1,B2,B3という3種類の定型の文書3
枚で構成され、文書CはC1,C2という2種類の定型
文書2枚に非定型の文書が添付される形で構成されてい
るてという情報が格納されているときに、画像入力部6
から1番目に定型の表紙A1、2番目に非定型の文書、
3番目に定型の文書B1、4番目に定型の文書B2、5
番目に定型の文書B3、6番目に定型の文書C1、7番
目に定型の文書C2、8番目に非定型の文書が入力した
場合、帳票識別部8は定型の表紙A1は「1」、定形文
書B1は「3」、定形文書B2は「4」、定形文書B3
は「5」、定形文書C1は「6」、定形文書C2は
「7」、識別不能は「2」と「8」と識別する。そこで
文書登録部9は文書Aを「1」,「2」の1組、文書B
を「3」,「4」,「5」の1組、文書Cを「6」,
「7」の1組の合計3組の文書として仕分けして文書登
録を行う。
Further, for example, there are three types of documents A, B, and C, and the document A is configured in the document information registration unit 7 in such a manner that a non-standard document is attached to one standard cover of A1.
Document B has three types of standard documents 3 of B1, B2, and B3.
When the information indicating that the document C is composed of two types of standard documents C1 and C2 and an atypical document attached thereto is stored, the image input unit 6
From the first fixed cover A1, the second non-standard document,
Third fixed document B1, fourth fixed document B2,5
If a standard document B3 is input first, a standard document C1 is input sixth, a standard document C2 is input seventh, and a non-standard document is input eighth, the form identification unit 8 sets the standard cover A1 to "1", The document B1 is “3”, the standard document B2 is “4”, the standard document B3
Is identified as "5", the fixed document C1 is identified as "6", the fixed document C2 is identified as "7", and the unidentifiable is identified as "2" and "8". Therefore, the document registration unit 9 sets the document A as a set of “1” and “2” and the document B
Is a set of “3”, “4”, “5”, and document C is “6”,
Documents are sorted and sorted as a total of three documents, one set of “7”.

【0022】このようにして従来は手動で仕分けしなけ
ればならなかった複数枚組の文書を自動で仕分けして1
つのデータとして文書登録することができる。
As described above, a document of a plurality of sheets, which had conventionally been required to be manually sorted, is automatically sorted to 1
Documents can be registered as one set of data.

【0023】次ぎに、複数枚の文書に保存された内容を
OCRを使ってデータ化し、そのデータも1つのデータ
として処理する第2の実施例について説明する。
Next, a description will be given of a second embodiment in which the contents stored in a plurality of documents are converted into data using OCR, and the data is processed as one data.

【0024】図3は第2の実施例のファイリング装置の
構成を示すブロック図である。図に示すように、第2の
実施例のファイリング装置は第1の実施例のファイリン
グ装置にOCR部12を有する。文書情報登録部7に
は、例えば文書BはB1とB2とB3という3種類の定
型の文書3枚で構成されているという情報と、B1では
OCR項目としてB1−1,B1−2の2項目が、B2
ではOCR項目としてB2−1,B2−2の2項目が、
B3ではOCR項目としてB3−1,B3−2の2項目
の合計6項目をOCR項目として処理するという情報が
あらかじめ登録してある。OCR部12は画像入力部6
から入力された画像をOCRで文字認識してテキストデ
ータ化するものであり、汎用のOCR装置を利用すれば
良い。
FIG. 3 is a block diagram showing the configuration of the filing apparatus of the second embodiment. As shown in the figure, the filing apparatus of the second embodiment has an OCR unit 12 in the filing apparatus of the first embodiment. The document information registration unit 7 stores, for example, information that the document B is composed of three types of standard documents of three types B1, B2, and B3, and B1 has two items, B1-1 and B1-2, as OCR items. But B2
In OCR items, B2-1 and B2-2 are two items,
In B3, information indicating that a total of six items of two items B3-1 and B3-2 are processed as OCR items is registered in advance as OCR items. The OCR unit 12 is an image input unit 6
The image input from is converted into text data by character recognition using OCR, and a general-purpose OCR device may be used.

【0025】このOCR部12を有するファイリング装
置で文書をファイリングするときの動作を図4のフロー
チャートを参照して説明する。
The operation of filing a document with the filing apparatus having the OCR unit 12 will be described with reference to the flowchart of FIG.

【0026】文書等を登録するとき、オペレータは登録
する内容が文書の種類に関する文書情報か紙媒体などに
記録された画像や文書かを判断し(ステップS11)、
文書情報を登録するときは、キーボード4で登録する文
書情報を入力して文書情報登録部7に登録する(ステッ
プS12)。また、登録する内容が紙媒体などに記録さ
れた画像や文書の場合には、その原稿の画像を画像入力
部6で読み取り帳票識別部8に送る(ステップS1
3)。帳票識別部8は送られた画像が文書情報登録部7
に登録されたどの種類の文書の中のどのページの文書か
を識別する(ステップS14)。例えば、文書Bとして
(B1+B2+B3)の3枚の文書を2種類登録すると
きに、画像入力部6から1番目にB1が入力し、2番目
にB2、3番目にB3、4番目にB1、5番目にB2、
6番目にB3が入力した場合、帳票識別部8はB1を
「1」,「4」、B2を「2」,「5」、B3を
「3」,「6」と識別する。一方、OCR部12は画像
入力部6から入力された画像をOCRで文字認識してテ
キストデータ化する(ステップS15)。文書登録部9
はCPU1が指示した所定の登録タイミングで文書情報
登録部7に登録されている文書情報を利用して、B2、
B3と識別された文書は、その直前に入力された1枚目
であるB1の表紙に統合するようにして、「1」,
「2」,「3」と「4」,「5」,「6」の合計2組の
文書として仕分けした後、OCR部12で認識したOC
R項目の認識結果を利用して、文書1組毎にB1−1,
B1−2,B2−1,B2−2,B3−1,B3−2の
OCR項目6項目のデータも1つのデータとして統合し
てファイリング部10に文書登録する(ステップS1
6,S17)。
When registering a document or the like, the operator determines whether the content to be registered is document information relating to the type of document or an image or document recorded on a paper medium or the like (step S11).
When registering the document information, the user inputs the document information to be registered with the keyboard 4 and registers it in the document information registration unit 7 (step S12). If the content to be registered is an image or a document recorded on a paper medium or the like, the image of the document is read by the image input unit 6 and sent to the form identification unit 8 (step S1).
3). The form identification unit 8 stores the transmitted image in the document information registration unit 7.
It identifies which page of which type of document is registered in step S14. For example, when registering two types of three documents (B1 + B2 + B3) as document B, B1 is input first from the image input unit 6, B2 second, B3 third, and B1,5 fourth. Second, B2,
When B3 is input sixth, the form identification unit 8 identifies B1 as "1" and "4", B2 as "2" and "5", and B3 as "3" and "6". On the other hand, the OCR unit 12 converts the image input from the image input unit 6 into text data by character recognition using the OCR (step S15). Document registration unit 9
Using the document information registered in the document information registration unit 7 at a predetermined registration timing designated by the CPU 1, B2,
The document identified as B3 is integrated with the cover of B1, which is the first sheet input immediately before, so that "1",
After sorting as a total of two sets of documents “2” and “3” and “4”, “5” and “6”, the OC recognized by the OCR unit 12
Using the recognition result of the R item, B1-1, B1-1,
The data of the six OCR items B1-2, B2-1, B2-2, B3-1, and B3-2 are also integrated as one data and registered in the filing unit 10 as a document (step S1).
6, S17).

【0027】このようにしてOCRによりテキスト化さ
れたデータも同時に複数組を1つのデータとして文書登
録することができる。
As described above, a plurality of sets of data converted to text by the OCR can be simultaneously registered as a single document.

【0028】上記実施例は文書登録部9は帳票識別部8
で識別した識別結果をそのまま使用して文書を統合処理
して登録する場合についた説明したが、帳票識別部8で
識別した識別結果やOCRによりテキスト化されたデー
タを表示部5に表示し、オペレータが認識結果を確認
し、認識誤りがあった場合にキーボード4を使用して認
識結果を修正し、修正した認識結果により文書を統合す
るようにしても良い。このように認識結果を修正するこ
とにより、複数の文書を統合するときエラーを少なくす
ることができる。
In the above embodiment, the document registration unit 9 is the form identification unit 8
As described above, the document is integrated and registered by using the identification result identified in the above as it is, but the identification result identified by the form identification unit 8 and the data converted into text by OCR are displayed on the display unit 5, The operator may confirm the recognition result, correct the recognition result using the keyboard 4 when there is a recognition error, and integrate the documents based on the corrected recognition result. By correcting the recognition result in this way, errors can be reduced when integrating a plurality of documents.

【0029】また、帳票識別部8で識別した結果、入力
した文書が正しい順番で入力されていない等のため統合
処理が正しく行えない場合、表示部5に統合エラーを表
示すると良い。例えば画像入力部6から1番目に定形文
書B3が入力され、2番目に定形文書B2、3番目に定
形文書B3、4番目に定形文書B1、5番目に定形文書
B2、6番目に定形文書B2が入力して、先頭に文書B
1がなかったり、文書B2が2枚続いていたりして、正
しい順番で入力されていないため複数枚の統合処理が正
しく行えないとき統合エラーとその内容を表示すること
により、オペレータはエラーの内容を認識して正しく修
正することができる。
If the integration process cannot be performed correctly because the input document is not input in the correct order as a result of the identification by the form identification unit 8, an integration error may be displayed on the display unit 5. For example, the standard document B3 is input first from the image input unit 6, the standard document B2 is second, the standard document B3 is third, the standard document B1 is fourth, the standard document B2 is fifth, and the standard document B2 is sixth. Is entered, and document B
When there is no “1” or two documents B2 continue and the input processing is not performed in the correct order, and the integration processing of a plurality of sheets cannot be performed correctly, the integration error and its contents are displayed. Can be correctly corrected.

【0030】また、文書情報登録部7に例えば、文書B
と文書Dという2種類の文書があらかじめ登録するとき
に、文書BはB1,B2,B3という3種類の定型の文
書3枚で構成され、文書DもD1,D2,D3という3
種類の定型の文書3枚で構成されており、文書Bと文書
Dはレイアウトなどのフォーマットは異なるが、記入さ
れている項目は同じものである場合、その情報も文書情
報登録部7に登録しておく。そして例えば画像入力部6
から1番目に定形文書B1が入力され、2番目に定形文
書B2、3番目に定形文書B3、4番目に定形文書D
1、5番目に定形文書D2、6番目に定形文書D3が入
力して、帳票識別部8でB1を「1」、B2を「2」、
B3を「3」、D1を「4」、D2を「5」、D3を
「6」と識別し、文書登録部9で文書Bとして「1」,
「2」,「3」と文書Dを「4」,「5」,「6」と2
組の文書に仕分けした後、文書情報登録部7に文書Bと
文書Dは同じ項目が記入されているという情報を利用し
て、文書Bと文書Dを同じ種類の文書として文書登録を
行う。このようにして定型のフォーマットのバージョン
の違いなどにより、レイアウトが異なるが記載事項が同
じである文書を同じ種類の文書として文書登録すること
ができる。
The document information registration unit 7 stores, for example, a document B
When two types of documents D and D are registered in advance, the document B is composed of three fixed types of documents B1, B2, and B3, and the document D is also D1, D2, and D3.
The document B and the document D have different formats such as layouts. However, when the entered items are the same, the information is also registered in the document information registration unit 7. Keep it. Then, for example, the image input unit 6
, The fixed document B1 is input first, the fixed document B2 is second, the fixed document B3 is third, and the fixed document D is fourth.
First, the fixed form document D2 is input fifth, the fixed form document D3 is input sixth, and the form identification unit 8 sets B1 to "1", B2 to "2",
B3 is identified as “3”, D1 is identified as “4”, D2 is identified as “5”, and D3 is identified as “6”.
"2", "3" and document D are "4", "5", "6" and 2
After sorting the documents into a set of documents, the document B and the document D are registered as the same type of document by using the information that the same items are entered in the document B and the document D in the document information registration unit 7. In this way, documents having different layouts but the same description items can be registered as the same type of document due to a difference in the version of the standard format.

【0031】上記各実施例は入力した文書を帳票識別部
8で識別し、識別結果により文書登録部9で統合して登
録する場合について説明したが、図5に示すように、帳
票識別部8や文書登録部9の機能を示すファイリングプ
ログラムをCD−ROM等の外部記録媒体13に格納し
ておき、外部記録媒体13に格納したファイリングプロ
グラムを記録媒体ドライバ14を介して読み出し、ハー
ドディスク15に登録したファイリングのための文書の
種類に関する情報と読み出したファイリングプログラム
によりCPU1が入力した文書を識別し、統合して登録
するようにしても良い。
In each of the above embodiments, a case has been described in which the input document is identified by the form identification unit 8 and integrated and registered by the document registration unit 9 based on the identification result. However, as shown in FIG. And a filing program indicating the function of the document registration unit 9 are stored in an external recording medium 13 such as a CD-ROM, and the filing program stored in the external recording medium 13 is read out via a recording medium driver 14 and registered in a hard disk 15. The document input by the CPU 1 may be identified based on the information on the type of document for filing and the read filing program, and integrated and registered.

【0032】[0032]

【発明の効果】この発明は以上説明したように、入力さ
れた画像情報とファイリングのためにあらかじめ登録さ
れた文書の種類に関する情報とを比較して入力された画
像情報の種類を識別し、同じ種類の文書を1つのデータ
に統合処理してファイリングするから、従来、手動で仕
分けしなければならなかった複数枚組の文書を自動的に
仕分けして1つのデータとして文書登録することができ
る。
As described above, according to the present invention, the type of input image information is identified by comparing the input image information with information relating to the type of document registered in advance for filing. Since various types of documents are integrated into one piece of data for filing, a plurality of sets of documents, which had to be manually sorted in the past, can be automatically sorted and registered as one piece of data.

【0033】また、文書を統合するとき、フォーマット
の決まっている定型の表紙1枚とフォーマットの決まっ
ていない非定型の添付資料を1つのデータとしてファイ
リングする場合、表紙の1枚のみを識別し、識別した表
紙と非定型の添付資料を統合するから、非定型の添付資
料も自動的に表紙とまとめてファイリングすることがで
きる。
Also, when integrating documents, when filing one fixed cover sheet with a fixed format and an unfixed attached document without fixed format as one data, only one cover sheet is identified. Since the identified cover and the atypical attachment are integrated, the atypical attachment can also be automatically filed together with the cover.

【0034】また、フォーマットの決まっている定型文
書とフォーマットの決まっていない非定型の添付資料を
ファイリングする場合、非定型の添付資料を定型文書に
添付して統合するから、従来は手動で仕分ける必要があ
った定形文書と非定型の添付資料も自動的に1つのデー
タに統合して文書登録することができる。
In addition, when filing a fixed-form document with a fixed format and an unfixed attached material without a fixed format, the non-fixed attached materials are attached to the fixed-form document and integrated. The fixed form document and the non-standard form attached document can be automatically integrated into one data and registered.

【0035】さらに、文書を統合するとき、複数枚の文
書に保存された内容をOCRを使ってデータ化し、デー
タ化したデータも統合するから、OCRによりテキスト
化されたデータも同時に1つにまとめて文書登録するこ
とができる。
Furthermore, when documents are integrated, the contents stored in a plurality of documents are converted into data using OCR, and the converted data is also integrated, so that the data converted into text by OCR is also integrated into one. Can be registered as a document.

【0036】また、文書を統合するときに、文書の統合
が指示されたときに統合処理を行うことにより、不要な
タイミングでの処理をなくすことができる。
Further, when the documents are integrated, by performing the integration process when the document integration is instructed, it is possible to eliminate the process at unnecessary timing.

【0037】また、入力された画像情報の種類を識別し
た結果を表示し、識別した結果が修正された場合に、修
正された識別結果により統合処理を行ったり、統合が正
しく行われなかった場合に、その内容を表示することに
より、統合時のエラーを少なくすることができる。
Also, the result of identifying the type of the input image information is displayed. If the identified result is corrected, the integration process is performed based on the corrected identification result, or the integration is not performed correctly. In addition, by displaying the contents, errors during integration can be reduced.

【0038】さらに、文書を統合するとき、レイアウト
が異なるが記載事項が同じである文書を同じ種類の文書
として統合することにより、ファイリングした文書の検
索を容易にすることができる。
Furthermore, when documents are integrated, documents having different layouts but the same description items are integrated as the same type of document, thereby making it possible to easily search for a filed document.

【0039】また、ファイリング方法のプログラムをC
D−ROM等の記録媒体に格納し、記録媒体に格納した
ファイリングプログラムをコンピュータで読み出し、読
み出したファイリングプログラムによりが入力した文書
を識別し、統合することにより、簡単な構成で複数枚組
の文書を自動的に仕分けして1つのデータとして文書登
録することができる。
The filing method program is C
A filing program stored in a recording medium such as a D-ROM is read by a computer, and a document input by the read filing program is identified and integrated, so that a plurality of sets of documents can be configured with a simple configuration. Can be automatically sorted and registered as a single document.

【図面の簡単な説明】[Brief description of the drawings]

【図1】この発明の実施例のファイリング装置の構成を
示すブロック図である。
FIG. 1 is a block diagram showing a configuration of a filing apparatus according to an embodiment of the present invention.

【図2】上記実施例の動作を示すフローチャートであ
る。
FIG. 2 is a flowchart showing the operation of the embodiment.

【図3】第2の実施例のファイリング装置の構成を示す
ブロック図である。
FIG. 3 is a block diagram illustrating a configuration of a filing apparatus according to a second embodiment.

【図4】第2の実施例の動作を示すフローチャートであ
る。
FIG. 4 is a flowchart showing the operation of the second embodiment.

【図5】ソフトウェアによりファイリング方法を実現す
るファイリングの構成を示すブロック図である。
FIG. 5 is a block diagram illustrating a configuration of filing that implements a filing method using software.

【符号の説明】[Explanation of symbols]

1;CPU、4;キーボード、5;表示部、6;画像入
力部、7;文書情報登録部、8;帳票識別部、9;文書
登録部、10;ファイリング部、11;検索部、12O
CR部、13;記録媒体。
Reference Signs List 1; CPU, 4; keyboard, 5; display unit, 6; image input unit, 7; document information registration unit, 8; form identification unit, 9; document registration unit, 10; filing unit, 11;
CR unit 13; recording medium.

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 紙媒体などに記録された内容を画像情報
として保存し、ファイリングするファイリング方法にお
いて、 入力された画像情報とあらかじめ登録された文書の種類
に関する情報とを比較して入力された画像情報の種類を
識別し、同じ種類の文書を1つのデータに統合処理して
ファイリングすることを特徴とするファイリング方法。
1. A filing method for storing content recorded on a paper medium or the like as image information and filing the image, wherein the input image information is compared with information on a document type registered in advance. A filing method comprising: identifying a type of information; and integrating and processing documents of the same type into one data for filing.
【請求項2】 上記文書を統合するとき、フォーマット
の決まっている定型の表紙1枚とフォーマットの決まっ
ていない非定型の添付資料を1つのデータとしてファイ
リングする場合、表紙の1枚のみを識別し、識別した表
紙と非定型の添付資料を統合する請求項1記載のファイ
リング方法。
2. When combining the above documents, when filing one fixed cover sheet with a fixed format and an unfixed attached document with no fixed format as one data, only one cover sheet is identified. 2. The filing method according to claim 1, wherein the identified cover and the irregular attachment are integrated.
【請求項3】 上記文書を統合するとき、フォーマット
の決まっている定型文書とフォーマットの決まっていな
い非定型の添付資料を1つのデータとしてファイリング
する場合、非定型の添付資料を定型文書に添付して統合
する請求項1記載のファイリング方法。
3. When integrating the above-mentioned documents, when filing a fixed-form document having a fixed format and an unfixed attached material having no fixed format as one data, the non-fixed attached document is attached to the fixed-form document. The filing method according to claim 1, wherein the filing is performed.
【請求項4】 上記文書を統合するとき、複数枚の文書
に保存された内容をOCRを使ってデータ化し、データ
化したデータも統合する請求項1,2又は3記載のファ
イリング方法。
4. The filing method according to claim 1, wherein when the documents are integrated, the contents stored in a plurality of documents are converted into data using an OCR, and the converted data is also integrated.
【請求項5】 上記文書を統合するときに、文書の統合
が指示されたときに統合処理を行う請求項1乃至4のい
ずれかに記載のファイリング方法。
5. The filing method according to claim 1, wherein when the documents are integrated, an integration process is performed when an instruction to integrate the documents is issued.
【請求項6】 上記入力された画像情報の種類を識別し
た結果を表示し、識別した結果が修正された場合に、修
正された識別結果により統合処理を行う請求項1乃至5
のいずれかに記載のファイリング方法。
6. The method according to claim 1, wherein a result of identifying the type of the input image information is displayed, and when the identified result is corrected, integration processing is performed based on the corrected identification result.
The filing method according to any one of the above.
【請求項7】 上記文書を統合するとき、統合が正しく
行われなかった場合に、その内容を表示する請求項1乃
至6のいずれかに記載のファイリング方法。
7. The filing method according to claim 1, wherein, when the documents are integrated, if the integration is not performed correctly, the content is displayed.
【請求項8】 上記文書を統合するとき、レイアウトが
異なるが記載事項が同じである文書を同じ種類の文書と
して統合する請求項1乃至7のいずれかに記載のファイ
リング方法。
8. The filing method according to claim 1, wherein when the documents are integrated, documents having different layouts but the same description are integrated as the same type of document.
【請求項9】 請求項1乃至8に記載のファイリング方
法を格納したコンピュータが読み取り可能な記録媒体。
9. A computer-readable recording medium in which the filing method according to claim 1 is stored.
JP11177599A 1999-06-24 1999-06-24 Filing method and recording medium storing the method Pending JP2001005831A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11177599A JP2001005831A (en) 1999-06-24 1999-06-24 Filing method and recording medium storing the method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11177599A JP2001005831A (en) 1999-06-24 1999-06-24 Filing method and recording medium storing the method

Publications (1)

Publication Number Publication Date
JP2001005831A true JP2001005831A (en) 2001-01-12

Family

ID=16033823

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11177599A Pending JP2001005831A (en) 1999-06-24 1999-06-24 Filing method and recording medium storing the method

Country Status (1)

Country Link
JP (1) JP2001005831A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003085187A (en) * 2001-09-11 2003-03-20 Canon Inc Document registering system, method, program and storage medium
US8107728B2 (en) 2006-09-19 2012-01-31 Sharp Kabushiki Kaisha Image processing apparatus, image forming apparatus, image processing system, computer program and recording medium
US8144994B2 (en) 2006-11-13 2012-03-27 Sharp Kabushiki Kaisha Image processing method, image processing apparatus, image reading apparatus, image forming apparatus, and recording medium
US8320683B2 (en) 2007-02-13 2012-11-27 Sharp Kabushiki Kaisha Image processing method, image processing apparatus, image reading apparatus, and image forming apparatus

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003085187A (en) * 2001-09-11 2003-03-20 Canon Inc Document registering system, method, program and storage medium
US8107728B2 (en) 2006-09-19 2012-01-31 Sharp Kabushiki Kaisha Image processing apparatus, image forming apparatus, image processing system, computer program and recording medium
US8144994B2 (en) 2006-11-13 2012-03-27 Sharp Kabushiki Kaisha Image processing method, image processing apparatus, image reading apparatus, image forming apparatus, and recording medium
US8320683B2 (en) 2007-02-13 2012-11-27 Sharp Kabushiki Kaisha Image processing method, image processing apparatus, image reading apparatus, and image forming apparatus

Similar Documents

Publication Publication Date Title
JP5623079B2 (en) Automatic generation of form definitions from hardcopy forms
JP2001126026A (en) Information input device
US9740692B2 (en) Creating flexible structure descriptions of documents with repetitive non-regular structures
JP2003316548A (en) Variable data printing dynamic imposition template
JP2013509663A (en) System and method using dynamic variation network
JP2008145611A (en) Information processor and program
US20110106823A1 (en) System and method of using dynamic variance networks
JP2973913B2 (en) Input sheet system
JP2006301695A (en) Document processing device and program
JP4360211B2 (en) Document processing device
JP2007005950A (en) Image processing apparatus and network system
JP2001005831A (en) Filing method and recording medium storing the method
US7844138B2 (en) History control apparatus
JP2021033831A (en) Workflow support device, workflow support system, and program
JP2011107966A (en) Document processor
JP2004166062A (en) Document reader
US20100328685A1 (en) Image-processing device and image-processing method
JP3732254B2 (en) Format information generation method and format information generation apparatus
JP4833134B2 (en) Individual image data generation apparatus and individual image data generation program
JPH11282956A (en) Slip identification method, its device and storage medium
JPH07152856A (en) Optical character reader
JP2002358506A (en) Device and method for filing document and recording medium
JP3928739B2 (en) Document filing system
JP2006134079A (en) Image processing device and program
US10397417B1 (en) Methods and systems for printing selective portions of documents

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041109

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050308