JP5393582B2 - Document management program, document management method, and document management apparatus - Google Patents
Document management program, document management method, and document management apparatus Download PDFInfo
- Publication number
- JP5393582B2 JP5393582B2 JP2010099964A JP2010099964A JP5393582B2 JP 5393582 B2 JP5393582 B2 JP 5393582B2 JP 2010099964 A JP2010099964 A JP 2010099964A JP 2010099964 A JP2010099964 A JP 2010099964A JP 5393582 B2 JP5393582 B2 JP 5393582B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- index
- image data
- representative form
- representative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
文書を電子化して管理する文書管理プログラム、文書管理方法及び文書管理装置に関する。 The present invention relates to a document management program, a document management method, and a document management apparatus for digitizing and managing a document.
従来、書類や帳票等の文書を電子化し、記憶装置に格納して管理する文書管理装置がある。この文書管理装置は、関連のある複数枚の書類や帳票を有する文書の登録機能と検索機能を有する。登録時には、書類や帳票のイメージデータを文書単位にまとめ、1つのインデックスを付与して記憶装置に格納する。検索時には、インデックスを用いて記憶装置に格納される文書単位のイメージデータを抽出する。 2. Description of the Related Art Conventionally, there is a document management apparatus that digitizes documents such as documents and forms and stores them in a storage device for management. This document management apparatus has a registration function and a search function for documents having a plurality of related documents and forms. At the time of registration, image data of documents and forms is collected in units of documents, and one index is assigned and stored in the storage device. At the time of search, image data for each document stored in the storage device is extracted using an index.
しかし、文書には、1文書に複数のインデックスが含まれるものがある。例えば、団体保険の申込書類では、1文書で複数の契約者が登録される。そして、1文書は、団体保険の申込書類と、契約者別の契約関連書類とを有する。この場合、文書全体ばかりでなく、契約者それぞれに対応する書類にインデックスを付与して管理することが好ましい。図18は、従来の複数インデックスを含む文書の管理の一例を示した図である。管理対象の申込文書910は、申込書類ABC911と、添付書類(A)912、添付書類(B)913及び添付書類(C)914を有する。申込書類ABC911には、それぞれ添付書類を識別するインデックスとなる「証券番号A」、「証券番号B」、「証券番号C」が記載されている。「証券番号A」は添付書類(A)912、「証券番号B」は添付書類(B)913、「証券番号C」は添付書類(C)914にそれぞれ対応する。以下、このように添付書類のインデックスが記載される書類を代表帳票、代表帳票に記載されるインデックスによって代表帳票に関連付けられる添付書類を付帯帳票とする。 However, some documents include a plurality of indexes in one document. For example, in a group insurance application document, a plurality of contractors are registered in one document. One document includes group insurance application documents and contract-related documents for each contractor. In this case, it is preferable to manage by assigning an index to the document corresponding to each contractor as well as the entire document. FIG. 18 is a diagram illustrating an example of management of a document including a plurality of conventional indexes. The application document 910 to be managed includes an application document ABC911, an attached document (A) 912, an attached document (B) 913, and an attached document (C) 914. In the application document ABC911, “securities number A”, “securities number B”, and “securities number C”, which are indexes for identifying the attached documents, are described. “Securities number A” corresponds to the attached document (A) 912, “Securities number B” corresponds to the attached document (B) 913, and “Securities number C” corresponds to the attached document (C) 914, respectively. Hereinafter, the document in which the index of the attached document is described is referred to as a representative form, and the attached document associated with the representative form by the index described in the representative form is referred to as an incidental form.
従来の文書管理装置900では、申込文書910に含まれる全書類のイメージデータ931をイメージデータベース(以下、DBとする)930に格納し、1つのインデックスを付与する。図18の例では、申込文書910のイメージデータを文字認識してインデックス項目の先頭の「証券番号A」を抽出し、インデックスとしている。インデックス「証券番号A」は、イメージデータ931が格納されるアドレスに対応づけてインデックスDB920に登録する。「証券番号B」による検索を可能とするため、「証券番号B」についてインデックスを生成したい場合がある。この場合、オペレータは再度申込書類ABC911のイメージデータを用いて文書管理装置900に上記と同様の処理を行わせる。文書管理装置900は、申込書類ABCのイメージデータ932をイメージDB930に格納し、インデックス「証券番号A」を抽出する。そこで、オペレータが、手動で「証券番号A」を「証券番号B」に付け替える。「証券番号C」についてもオペレータが同様の処理を行う。こうして、イメージDB930には、インデックス「証券番号A」に対応付けられた申込文書910の全イメージデータ931と、インデックス「証券番号B」に対応付けられた申込書類ABCのイメージデータ932と、インデックス「証券番号C」に対応付けられた申込書類ABCのイメージデータ933と、が格納される。
In the conventional
なお、画像データ、音声データ、テキストデータ等、種類の異なる情報データの集合体であるマルチメディア情報の管理では、マルチメディア情報に1つのインデックスではなく、含まれる情報データに応じた属性インデックスを付与し、検索を容易にする方法がある(例えば、特許文献1参照)。 In the management of multimedia information, which is a collection of different types of information data such as image data, audio data, text data, etc., an attribute index corresponding to the included information data is assigned to the multimedia information instead of one index. However, there is a method for facilitating the search (see, for example, Patent Document 1).
従来の文書管理では、複数のインデックスが含まれる文書の管理が容易ではないという問題点があった。
上述のように、1つの文書に複数のインデックスが含まれる文書を複数のインデックスで管理するためには、オペレータが、登録したいインデックスの数だけ代表帳票を読み込ませ、得られたインデックスの付け替えを行わなければならず、オペレータの負担が大きかった。図18の例では、「証券番号B」「証券番号C」について申込書類ABC911の読み取りを繰り返すとともに、得られたインデックスの付け替えを行う必要があった。この操作はオペレータの手作業で行われるため、登録ミスが発生する可能性も高かった。さらに、記憶装置には、インデックスの数の代表帳票のイメージデータを重複して格納しなければならず、インデックスが多くなると、記憶装置の保管用量を圧迫してしまうという問題もある。
Conventional document management has a problem that it is not easy to manage a document including a plurality of indexes.
As described above, in order to manage a document in which a single document includes a plurality of indexes with a plurality of indexes, the operator reads as many representative forms as the number of indexes to be registered, and replaces the obtained indexes. The burden on the operator was great. In the example of FIG. 18, it is necessary to repeatedly read the application document ABC911 for “security number B” and “security number C” and to replace the obtained index. Since this operation is performed manually by the operator, there is a high possibility that a registration error will occur. Furthermore, the storage device has to store the image data of the representative forms corresponding to the number of indexes, and there is a problem that if the number of indexes increases, the storage amount of the storage device is compressed.
検索時においても、付加したインデックスについては、直接イメージデータを取得できないという問題点があった。図18の例では、「証券番号B」の添付書類(B)を確認したいときは、まず、「証券番号B」を指定して申込書類ABCのイメージデータ932を取得する。しかし、添付書類のイメージデータはない。そこで、表示装置に表示される申込書類ABCのイメージデータ932に基づき、インデックスの先頭の「証券番号A」を確認し、「証券番号A」を指定して全体のイメージデータ931を取得する。このように、検索時にも煩雑な操作が必要であった。
Even in the search, there is a problem that image data cannot be directly acquired for the added index. In the example of FIG. 18, when it is desired to confirm the attached document (B) of “Securities No. B”, first, “Securities No. B” is specified and the
このような点に鑑み、本願発明は、複数のインデックスが含まれる文書の文書管理を容易にすることが可能な文書管理プログラム、文書管理方法及び文書管理装置を提供することを目的とする。 In view of such a point, an object of the present invention is to provide a document management program, a document management method, and a document management apparatus capable of facilitating document management of a document including a plurality of indexes.
上記課題を解決するために、文書を電子化して管理する文書管理処理を行うコンピュータを機能させる文書管理プログラムが提供される。この文書管理プログラムは、コンピュータを、認識手段、登録手段及び検索手段として機能させる。認識手段は、代表帳票と代表帳票に添付される付帯帳票とを有し、代表帳票に関連付けられる付帯帳票を識別するインデックスが代表帳票に記載される文書を電子化したイメージデータを取得する。そして、代表帳票のイメージデータに文字認識を行って代表帳票に記載されるインデックスを全て抽出する。登録手段は、取得した文書のイメージデータをイメージデータ記憶手段に格納し、文書のイメージデータを格納したアドレスをこの文書の代表帳票から抽出したインデックスに対応付けてインデックス管理情報に登録する。検索手段は、検索対象のインデックスが指定されたときは、指定されたインデックスに基づいてインデックス管理情報を検索し、指定されたインデックスに対応する文書のイメージデータを抽出する。 In order to solve the above problems, a document management program is provided that allows a computer that performs document management processing to digitize and manage documents to function. This document management program causes a computer to function as a recognition unit, a registration unit, and a search unit. The recognizing unit has a representative form and an incidental form attached to the representative form, and acquires image data obtained by digitizing a document in which an index for identifying the incidental form associated with the representative form is described in the representative form. Then, character recognition is performed on the image data of the representative form to extract all indexes described in the representative form. The registration unit stores the acquired document image data in the image data storage unit, and registers the address storing the document image data in the index management information in association with the index extracted from the representative form of the document. When a search target index is specified, the search means searches the index management information based on the specified index, and extracts document image data corresponding to the specified index.
また、上記課題を解決するために、上記の文書管理プログラムを実行するコンピュータと同様の処理手順を実行する文書管理方法及び文書管理装置が提供される。 In order to solve the above problems, there are provided a document management method and a document management apparatus that execute the same processing procedure as that of a computer that executes the document management program.
開示の文書管理プログラム、文書管理方法及び文書管理装置によれば、文書の登録時、インデックスを全て抽出し、抽出したインデックスを文書のイメージデータに対応付ける。このように、1度のイメージデータ読込みでインデックスが全て抽出されるため、オペレータの登録時の作業効率を向上させることができる。また、検索時には、インデックスに基づいて文書のイメージデータを容易に取得することができ、検索時の作業効率も向上できる。 According to the disclosed document management program, document management method, and document management apparatus, when a document is registered, all indexes are extracted, and the extracted indexes are associated with document image data. In this way, since all the indexes are extracted by reading the image data once, it is possible to improve the work efficiency when registering the operator. Further, at the time of retrieval, document image data can be easily acquired based on the index, and work efficiency at the time of retrieval can be improved.
以下、本発明の実施の形態を、図面を参照して説明する。図1は、実施の形態に適用される発明の概念図である。
文書管理装置1は、読取手段1a、認識手段1b、登録手段1c及び検索手段1dを有し、インデックスを生成して文書5のイメージデータを登録する登録系の処理と、登録した文書5のイメージデータを検索する検索系の処理を行う。
Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a conceptual diagram of the invention applied to the embodiment.
The
管理対象の文書5は、代表帳票5aと、代表帳票5aに添付されているN枚(Nは、N≧0の整数)の付帯帳票5bとを有する。ここで、帳票は、所定の様式で情報が記載された文書を指すとする。代表帳票5aには、付帯帳票5bを識別する情報がインデックスとして記載されている。また、代表帳票5aには、文書5に対して1つのインデックスが設定される通常帳票と、複数のインデックスが設定される包括帳票とがある。通常帳票の場合、文書5は、1つのインデックスが記載される代表帳票5aと、そのインデックスに関連する1つの付帯帳票5bを有する。包括帳票の場合、文書5は、M(Mは、M≧0の整数)個のインデックスが記載される代表帳票5aと、それぞれのインデックスに関連付けられるM種類の付帯帳票5bとを有する。
The document 5 to be managed has a
読取手段1aは、例えば、スキャナを制御し、管理対象の文書5の画像イメージを読み取り、そのイメージデータを生成する。読取手段1aは、文書5に含まれる代表帳票5a及び付帯帳票5bの画像イメージを順次読み取り、読み取った順にイメージデータを認識手段1bに出力する。ここで、文書5は、代表帳票5aを先頭に、代表帳票5aに記載されているインデックスの配列順に従って付帯帳票5bが並べられているとする。読み取ったイメージデータは、代表帳票5aのイメージデータ、先頭に記載されたインデックスに対応する付帯帳票のイメージデータ、次に記載されたインデックスに対応する付帯帳票のイメージデータ、という順に出力される。なお、読取手段1aは、文書5について既に電子化されたイメージデータを外部から入力するとしてもよい。
The
認識手段1bは、読取手段1aが取得した文書5のイメージデータの代表帳票5aのイメージデータからインデックスを抽出する。認識手段1bは、読取手段1aから取得したイメージデータの帳票種別を判定し、代表帳票5aであれば、インデックスを抽出する。このとき、代表帳票5aが通常帳票であれば、1つのインデックスを抽出し、包括帳票であれば、代表帳票5aに記載された全てのインデックスを抽出する。例えば、帳票ごとに予め決められたデータの領域定義に基づいて、インデックスが記載されている領域を検出し、そのイメージデータを抽出する。そして、抽出したイメージデータに文字認識処理を施し、得られた語をインデックスとして抽出する。読取手段1aから取得したイメージデータと、抽出したインデックスは、登録手段1cへ出力する。
The recognizing
登録手段1cは、読取手段1aが読み取ったイメージデータを文書単位にまとめ、その文書単位のイメージデータ3cを記憶装置3に格納するとともに、個別インデックス及び文書インデックスを生成して管理する。文書単位のイメージデータ3cは、読み取り順に従って、代表帳票イメージデータ、付帯帳票イメージデータの順に配列されている。文書インデックスは、文書を識別する識別情報であり、1文書単位のイメージデータの記憶領域に対応付けられる。図1の例では、文書5を識別する文書インデックスを生成し、記憶装置3に格納された文書5のイメージデータ3cのアドレスに対応付けられる。生成した文書インデックスと、対応付けられた文書5の文書単位のイメージデータ3cのアドレスは、文書インデックス管理情報3bに登録する。文書インデックスは、代表帳票5aが、通常帳票であっても包括帳票であっても同じになる。個別インデックスは、認識手段1bで抽出した代表帳票5aに記載されたインデックスである。帳票のイメージデータは、文書単位のイメージデータ3cが1つ格納されるので、どのインデックスで検索する場合であっても、抽出するのは文書単位のイメージデータ3cになる。そこで、個別インデックスは、文書単位のイメージデータ3cの格納アドレスに対応付ける。ここでは、文書インデックスが文書単位のイメージデータ3cに対応付けられているので、個別インデックスに記載された文書の文書インデックスを対応付ける。登録手段1c、認識手段1bが抽出した個別インデックスに文書インデックスを対応付け、個別インデックス管理情報3aに登録する。
The
検索手段1dは、ユーザ等によってインデックスが指定されたとき、指定されたインデックスに対応する付帯帳票を含む文書のイメージデータを抽出し、ユーザに提供する。まず、指定されたインデックスに基づいて個別インデックス管理情報3aを検索し、このインデックスに対応する文書インデックスを検出する。続いて検出した文書インデックスに基づいて、文書インデックス管理情報3bを検索し、この文書の文書単位のイメージデータが記憶されているアドレスを検出する。そして、検出されたアドレスに基づき、指定されたインデックスの付帯帳票を含む文書単位のイメージデータ3cを読み出し、文書イメージデータ7として要求元に提供する。
When an index is designated by the user or the like, the
文書管理装置1の動作について説明する。文書の登録処理では、代表帳票5aと付帯帳票5bを有する文書5が指定されると、読取手段1aは文書5の各帳票のイメージデータを順次取得し、認識手段1bへ出力する。イメージデータは、代表帳票5aのイメージデータを先頭に、帳票の並び順に入力される。認識手段1bは、順次入力するイメージデータの帳票種別を判別し、代表帳票5aであるときは、インデックスを抽出する。代表帳票5aが通常帳票であれば、1つのインデックスを抽出する。代表帳票5aが包括帳票であれば、記載される全てのインデックスを抽出する。インデックスは、予め定義された領域のイメージデータを抽出し、文字認識を行って抽出する。登録手段1cは、読取手段1aが読み取った文書5のイメージデータをまとめた文書単位のイメージデータ3cを記憶装置3の所定の記憶領域に格納する。そして、文書5を識別する文書インデックスに関連付けて、文書単位のイメージデータ3cが格納されるアドレスに対応付け、文書インデックス管理情報3bに登録する。次に、認識手段1bが認識した代表帳票5aに記載されていたインデックスを用いて個別インデックスを生成し、文書5の文書インデックスを対応づけて個別インデックス管理情報3aに登録する。
The operation of the
文書の検索処理は、インデックスが指定され、検索を開始する。検索手段1dは、指定されたインデックスに基づいて個別インデックス管理情報3aを検索し、指定されたインデックスの付帯帳票が含まれる文書の文書インデックスを検出する。そして、検出した文書インデックスに基づいて文書インデックス管理情報3bを検索し、この文書の文書単位のイメージデータ3cが格納されるアドレスを検出する。そして、検出したアドレスに基づいて、記憶装置3に格納されるイメージデータ3cを抽出し、文書のイメージデータ7として検索の要求元に出力する。
In the document search process, an index is designated and the search is started. The
このように、登録時には、代表帳票5aに記載されるインデックスを一括して読み込み、認識された個別インデックスに文書単位のイメージデータを対応付ける。このため、包括帳票であっても、繰り返し代表帳票5aの読み出しを行なう作業が必要なくなり、オペレータの負担を軽減し、作業効率を向上させることができる。また、文書に複数設定される個別インデックスは、文書のイメージデータに対応付けられているので、検索時に個別インデックスを指定すれば対象文書のイメージデータが抽出される。このため、所望のデータを得るために検索を繰り返す必要がなくなり、検索の効率を上げることができる。この結果、複数のインデックスを含む文書の登録処理及び検索処理の効率が向上し、文書管理を容易にすることが可能となる。
As described above, at the time of registration, the indexes described in the
次に、図1に示した文書管理装置を保険の申込書類と、その添付書類の管理に適用した場合を例に図面を参照して詳細に説明する。
図2は、第1の実施の形態の文書管理システムの一例を示した図である。文書管理システムは、文書管理装置100、スキャナ200、文書データ記憶装置300及びモニタ600を有し、対象の文書500を電子化して管理する。
Next, the document management apparatus shown in FIG. 1 will be described in detail with reference to the drawings, taking as an example the case where the document management apparatus is applied to the management of insurance application documents and attached documents.
FIG. 2 is a diagram illustrating an example of a document management system according to the first embodiment. The document management system includes a
文書管理装置100は、スキャナ200が読み取った文書500のイメージデータを取得し、インデックスを付与してインデックス管理情報に設定し、文書500のイメージデータとともに文書データ記憶装置300に格納する。また、検索要求に応じて文書データ記憶装置300に格納された文書のイメージデータを検索して抽出する。スキャナ200は、文書500に含まれる代表帳票と付帯帳票を順次読み取り、読み取った順にイメージデータを生成して文書管理装置100に出力する。文書データ記憶装置300は、インデックス管理情報と、文書500のイメージデータとを記憶する。モニタ600は、文書管理装置100に従って表示データを表示する。
The
次に、文書管理装置100について説明する。図3は、文書管理装置のハードウェアの構成例を示す図である。文書管理装置100は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101には、バス109を介してRAM(Random Access Memory)102と複数の周辺機器が接続されている。
Next, the
RAM102は、文書管理装置100の主記憶装置として使用される。RAM102には、CPU101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に必要な各種データが格納される。
The
バス109に接続されている周辺機器としては、ハードディスクドライブ(HDD:Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105、光学ドライブ装置106、スキャナ制御装置107及び通信インタフェース108がある。
Peripheral devices connected to the bus 109 include a hard disk drive (HDD) 103, a
HDD103は、内蔵したディスクに対して、磁気的にデータの書き込みおよび読み出しを行う。HDD103は、文書管理装置100の二次記憶装置として使用される。HDD103には、OSのプログラム、アプリケーションプログラム、および各種データが格納される。文書データ記憶装置300として機能するとしてもよい。なお、二次記憶装置としては、フラッシュメモリなどの半導体記憶装置を使用することもできる。
The
グラフィック処理装置104には、モニタ600が接続されている。グラフィック処理装置104は、CPU101からの命令に従って、画像をモニタ600の画面に表示させる。モニタ600としては、CRT(Cathode Ray Tube)を用いた表示装置や液晶表示装置などがある。
A monitor 600 is connected to the
入力インタフェース105には、キーボード601とマウス602とが接続されている。入力インタフェース105は、キーボード601やマウス602から送られてくる信号をCPU101に送信する。なお、マウス602は、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル、タブレット、タッチパッド、トラックボールなどがある。
A keyboard 601 and a mouse 602 are connected to the
光学ドライブ装置106は、レーザ光などを利用して、光ディスク603に記録されたデータの読み取りを行う。光ディスク603は、光の反射によって読み取り可能なようにデータが記録された可搬型の記録媒体である。光ディスク603には、DVD(Digital Versatile Disc)、DVD−RAM、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)などがある。
The
スキャナ制御装置107は、スキャナ200に接続し、CPU101からの命令に従ってスキャナ200に画像の読み取りを指示するとともに、スキャナ200から取得したイメージデータをCPU101に送信する。
The
通信インタフェース108は、ネットワーク604に接続されている。通信インタフェース108は、ネットワーク604を介して、他のコンピュータまたは通信機器との間でデータの送受信を行う。
The
また、文書データ記憶装置300を外部に設けるときは、内部バス109に接続するインタフェースを介して、または、ネットワーク604を介して文書管理装置100に接続させることができる。以上のようなハードウェア構成によって、本実施の形態の処理機能を実現することができる。
When the document
次に、文書管理装置100のソフトウェア構成について説明する。図4は、文書管理装置のソフトウェア構成を示したブロック図である。文書管理装置100は、読取部110、認識部120、点検部130、登録部140、検索部150及び表示部160を有する。また、文書データ記憶装置300には、個別インデックスDB310、文書インデックスDB320及びイメージDB330が設けられている。
Next, the software configuration of the
読取部110は、スキャナ200の動作を制御し、スキャナ200が読み取った文書500のイメージデータを取得する。取得したイメージデータは、読み取った順に認識部120に出力する。
The
認識部120は、帳票判別部121及び文字認識部122を有する。帳票判別部121は、読取部110から入力する帳票の種別が、代表帳票であるのか付帯帳票であるのか、また代表帳票であれば、通常文書であるのか、包括帳票であるのかを判別する。例えば、帳票上の所定の位置に記載された帳票種別を読み出して判別する。また、予め各帳票の特徴を定義しておき、読み取ったイメージデータから得られる特徴と照合して帳票を判別するとしてもよい。イメージデータが、付帯帳票であれば、そのまま点検部130へ出力する。代表帳票を検出したときは、代表帳票が通常帳票か包括帳票かを判別し、判別結果とともに文字認識部122へ出力する。文字認識部122は、代表帳票のイメージデータに記載されているインデックスを抽出する。インデックスは、代表帳票に添付される付帯帳票を識別する情報で、代表帳票に記載されている項目のうち、どれをインデックスとするかは予め決められている。また、インデックスが記載されている領域も予め定義されている。代表帳票が通常帳票の場合、予め定義されている領域のイメージデータに文字認識処理を行い、1個のインデックスを抽出する。代表帳票が包括帳票の場合は、予め定義されている領域のイメージデータに対し文字認識処理を施し、M個のインデックスを抽出する。代表帳票のイメージデータと、抽出したインデックスは、点検部130に出力する。
The
点検部130は、読取部110が読み取った文書500のイメージデータ、認識部120が抽出したインデックス等を表示部160に表示し、オペレータによる点検を受ける。オペレータは、表示部160に表示されたイメージデータを見て、読み取った文書の順序や、読み取り誤りをチェックする。また、認識部120が抽出したインデックスを確認し、正しく文字認識ができたか、抜けはないか等を確認する。こうしたオペレータの点検を経たイメージデータ及びインデックスは、登録部140に出力する。
The
登録部140は、オペレータによる点検が終了した文書のイメージデータを文書単位に分割してイメージDBに格納する。また、文書インデックスと個別インデックスを生成し、それぞれ文書インデックスDB320、個別インデックスDB310に格納する。
The
検索部150は、イメージDB330に格納した文書のイメージデータの検索依頼を受け取ると、指定された検索キーワードを用いて個別インデックスDB310、文書インデックスDB320を検索し、指定されたキーワードに対応する文書のイメージデータを抽出する。そして、抽出したイメージデータを、例えば、表示部160に表示する。なお、抽出したイメージデータは、印刷装置に出力して印刷したり、外部記憶装置に出力したりすることもできる。
Upon receiving a search request for image data of a document stored in the
表示部160は、点検部130及び検索部150からの指示に応じて、イメージデータに基づく文書500の画像や、インデックス等を表示画面に表示する。
個別インデックスDB310は、イメージDB330に格納した文書のイメージデータ検索の際に用いる個別インデックス管理情報を管理する。
The
The
文書インデックスDB320は、1文書を識別する文書インデックスと、この文書に対するイメージデータが格納されるアドレスとを対応づけた文書インデックス管理情報を管理する。
The
イメージDB330には、文書単位のイメージデータが格納される。
以下、文書500の具体例を用いて、文書管理装置100の動作を説明する。図5は、文書の一例を示した図である。文書管理装置100は、文書ABC510、文書D520、文書E530及び文書F540のイメージデータの登録及び管理を行う。図5に示した文書は、証券番号をインデックスとして文書管理を行うとする。
The
Hereinafter, the operation of the
文書ABC510は、代表帳票である申込書類ABC511と、付帯帳票である添付書類(A)512、添付書類(B)513及び添付書類(C)514を有する。申込書類ABC511は、包括帳票であり、複数の契約者の証券番号として「A」、「B」、「C」が記載されている。この証券番号は、申込書類ABC511に添付される各契約者の添付書類(A)512、添付書類(B)513及び添付書類(C)514を識別するための識別情報でもある。例えば、文書ABC510は、申込書類ABC511を先頭として、申込書類ABC511に記載された証券番号の並び順に、各証券番号に対応する添付書類が並べられている。図5の例では、証券番号について、「A」に対応する添付書類(A)512、「B」に対応する添付書類(B)513及び「C」に対応する添付書類(C)514を有する。 The document ABC 510 includes an application document ABC 511 that is a representative form, an attached document (A) 512, an attached document (B) 513, and an attached document (C) 514 that are incidental forms. The application document ABC511 is a comprehensive form, in which “A”, “B”, and “C” are described as securities numbers of a plurality of contractors. This security number is also identification information for identifying the attached document (A) 512, attached document (B) 513, and attached document (C) 514 of each contractor attached to the application document ABC 511. For example, the document ABC 510 has the application documents ABC 511 at the top, and the attached documents corresponding to the respective securities numbers are arranged in the order of the securities numbers described in the application documents ABC 511. In the example of FIG. 5, the securities number has an attached document (A) 512 corresponding to “A”, an attached document (B) 513 corresponding to “B”, and an attached document (C) 514 corresponding to “C”. .
文書D520は、代表帳票である申込書類D521と、付帯帳票である添付書類(D)522を有する。申込書類D521は、通常帳票であり、1名の契約者の証券番号「D」のみが記載されている。また、「D」に対応する添付書類(D)522を有する。文書E530は、代表帳票である申込書類E531と、付帯帳票である添付書類(E)532を有する。文書F540は、代表帳票である申込書類F541と、付帯帳票である添付書類(F)542を有する。 The document D520 includes an application document D521 that is a representative form and an attached document (D) 522 that is an accompanying form. The application document D521 is a normal form, and only the securities number “D” of one contractor is described. Further, it has an attached document (D) 522 corresponding to “D”. The document E530 includes an application document E531 that is a representative form and an attached document (E) 532 that is an accompanying form. The document F540 includes an application document F541 that is a representative form and an attached document (F) 542 that is an accompanying form.
次に、文書管理装置100の文書ABC510、文書D520、文書E530及び文書F540の登録処理について説明する。まず、包括帳票を有する文書ABC510の登録処理について説明し、続いて通常帳票を有する文書D520、文書E530及び文書F540の登録処理について説明する。
Next, registration processing of the document ABC 510, the
図6は、代表帳票が包括帳票の場合の文書登録処理を示した図である。文書ABC510は、代表帳票が包括帳票の文書であり、代表帳票である申込書類ABC511と、添付書類(A)512、添付書類(B)513、及び添付書類(C)514を有する。 FIG. 6 is a diagram showing document registration processing when the representative form is a comprehensive form. The document ABC 510 is a document in which a representative form is a comprehensive form, and includes an application document ABC 511 that is a representative form, an attached document (A) 512, an attached document (B) 513, and an attached document (C) 514.
読取部110は、申込書類ABC511、添付書類(A)512、添付書類(B)513、添付書類(C)514の順に画像を読み取り、そのイメージデータを生成する。認識部120は、読取部110が読み取ったイメージデータの帳票を判別し、帳票が代表帳票であるときは、インデックスを抽出する。図6の例では、まず、申込書類ABC511を代表帳票かつ包括帳票と認識し、N個のインデックスを抽出する。ここでは、証券番号について「A」、「B」、「C」の3個のインデックス1201を抽出する。添付書類(A)512、添付書類(B)513及び添付書類(C)514は、付帯帳票と判別し、認識処理は行わない。
The
各帳票のイメージデータと、インデックス1201は、点検部130に引き渡される。点検部130は、イメージデータを表示部160に表示し、オペレータの点検を待つ。インデックス1201も表示部160に表示する。オペレータの点検を受けた申込書類ABCのイメージデータ5111、添付書類(A)のイメージデータ5121、添付書類(B)のイメージデータ5131、添付書類(C)のイメージデータ5141及びインデックス1201は、登録部140へ引き渡される。
The image data of each form and the
登録部140は、イメージデータを文書単位に分割し、文書単位のイメージデータをイメージDB330に格納する。図6の例では、申込書類ABCのイメージデータ5111、添付書類(A)のイメージデータ5121、添付書類(B)のイメージデータ5131及び添付書類(C)のイメージデータ5141をこの順に配列し、イメージDB330に格納する。また、文書ABC510に関する文書インデックス「INDEX−A」を生成し、イメージDB330の文書ABC510のイメージデータの格納アドレスに対応付け、文書インデックス管理情報に登録し、文書インデックスDB320に設定する。そして、申込書類ABC511から抽出したインデックス1201に基づいて、個別インデックスを生成する。図6の例では、認識部120が抽出したインデックス1201の「A」、「B」、「C」をそれぞれ文書510のイメージデータを示す文書インデックス「INDEX−A」に対応付けて個別インデックス管理情報に登録し、個別インデックスDB310に設定する。なお、個別インデックスを先に生成し、後から文書インデックスを生成することもできる。
The
図7は、代表帳票が通常帳票の場合の文書登録処理を示した図である。文書D520及び文書E530は、代表帳票が通常帳票の文書であり、それぞれ申込書類D521と添付書類(D)522、申込書類E531と添付書類(E)532を有する。図7の例では省略しているが、文書F540についても同様である。 FIG. 7 is a diagram showing document registration processing when the representative form is a normal form. The document D520 and the document E530 are documents in which the representative form is a normal form, and includes an application document D521 and an attached document (D) 522, and an application document E531 and an attached document (E) 532, respectively. Although omitted in the example of FIG. 7, the same applies to the document F540.
読取部110は、申込書類D521、添付書類(D)522、申込書類E531、添付書類(E)532の順に画像を読み取り、そのイメージデータを生成する。認識部120は、読取部110が読み取ったイメージデータの帳票を判別し、帳票が代表帳票であるときは、インデックスを抽出する。図7の例では、まず、申込書類D521を代表帳票かつ通常帳票と認識し、1個のインデックスを抽出する。ここでは、証券番号について「D」というインデックス1202を抽出する。添付書類(D)522については、付帯帳票と判別し、認識処理は行わない。次の申込書類E531は代表帳票かつ通常帳票と認識し、1個のインデックスを抽出する。ここでは、「E」というインデックス1203を抽出する。添付書類(E)532については、付帯帳票と判別し、認識処理は行わない。
The
各帳票のイメージデータと、インデックス1202,1203は、点検部130に引き渡される。点検部130は、イメージデータを表示部160に表示し、オペレータの点検を待つ。インデックス1202,1203も表示部160に表示する。オペレータの点検を受けた申込書類Dのイメージデータ5211、添付書類(D)のイメージデータ5221、申込書類Eのイメージデータ5311、添付書類(E)のイメージデータ5321及びインデックス1202,1203は、登録部140へ引き渡される。
The image data of each form and the
登録部140は、イメージデータを文書単位に分割し、文書単位のイメージデータをまとめてイメージDB330に格納する。図7の例では、申込書類Dのイメージデータ5211と添付書類(D)のイメージデータ5221という文書単位と、申込書類Eのイメージデータ5311と添付書類(E)のイメージデータ5321という文書単位と、に分割し、この順を保持してイメージDB330に格納する。また、文書D520に対応する文書インデックス「INDEX−D」を生成し、文書D520のイメージデータが格納される領域に対応付けて文書インデックスDB320に格納される文書インデックス管理情報に登録する。文書E530についても同様に、文書E530に対応するインデックス「INDEX−E」を生成し、文書E530のイメージデータが格納される領域に対応付けて文書インデックスDB320に格納される文書インデックス管理情報に登録する。そして、申込書類D521から抽出したインデックス1202の個別インデックスを生成する。図7の例では、認識部120が抽出したインデックス1202の「D」を文書インデックス「INDEX−D」に対応付け、個別インデックスDB310に格納される個別インデックス管理情報に登録する。同様に、インデックス1203の「E」を文書インデックス「INDEX−E」に対応付け、個別インデックス管理情報に登録する。個別インデックス管理情報は、個別インデックスDB310で管理する。
The
図8は、インデックスの関係を示した図である。個別インデックス311は、代表帳票である申込書類ABC511、申込書類D521、申込書類E531及び申込書類F541から抽出した証券番号「A」、「B」、「C」、「D」、「E」、「F」である。また、この個別インデックス311は、それぞれが属する文書の文書インデックス321にリンクされている。図8の例では、文書ABC510の申込書類ABC511から抽出した個別インデックス「A」、「B」、「C」は、文書ABC510の文書インデックス「INDEX−A」に対応付けられる。文書D520の申込書類D521から抽出した個別インデックス「D」は、文書D520の文書インデックス「INDEX−D」に対応付けられる。文書E530の申込書類E531から抽出した個別インデックス「E」は、文書E530の文書インデックス「INDEX−E」に対応付けられる。そして、文書F540の申込書類F541から抽出した個別インデックス「F」は、文書F540の文書インデックス「INDEX−F」に対応付けられる。 FIG. 8 is a diagram showing the relationship of indexes. The individual index 311 includes the application number ABC511, the application document D521, the application document E531, and the securities number “A”, “B”, “C”, “D”, “E”, “E” extracted from the application document F541. F ". The individual index 311 is linked to the document index 321 of the document to which each belongs. In the example of FIG. 8, the individual indexes “A”, “B”, and “C” extracted from the application document ABC511 of the document ABC510 are associated with the document index “INDEX-A” of the document ABC510. The individual index “D” extracted from the application document D521 of the document D520 is associated with the document index “INDEX-D” of the document D520. The individual index “E” extracted from the application document E531 of the document E530 is associated with the document index “INDEX-E” of the document E530. The individual index “F” extracted from the application document F541 of the document F540 is associated with the document index “INDEX-F” of the document F540.
文書インデックス321は、それぞれの文書のイメージデータ331が格納される記憶領域を示すアドレス、例えば、イメージDB330における文書単位のイメージデータが記憶される記憶領域の先頭アドレスに対応付けられる。図8の例では、文書ABC510の文書インデックス「INDEX−A」は、申込書類ABCイメージ、添付書類(A)イメージ、添付書類(B)イメージ及び添付書類(C)イメージを有する文書ABCのイメージデータの記憶領域に対応付けられる。文書D520の文書インデックス「INDEX−D」は、申込書類Dイメージ及び添付書類(D)イメージを有する文書D520のイメージデータの記憶領域に対応付けられる。文書E530の文書インデックス「INDEX−E」は、申込書類Eイメージ及び添付書類(E)イメージを有する文書Eのイメージデータの記憶領域に対応付けられる。文書F540の文書インデックス「INDEX−F」は、申込書類Fイメージ及び添付書類(F)イメージを有する文書Fのイメージデータの記憶領域に対応付けられる。
The document index 321 is associated with an address indicating a storage area in which image data 331 of each document is stored, for example, a head address of a storage area in which image data in units of documents in the
このように、個別インデックスを文書インデックスに対応付けることにより、文書インデックスとイメージデータとの間は1:1の関係になる。また、個別インデックスと文書インデックスとの関係は、N:1になる。すなわち、1つの文書に複数のインデックスが含まれる場合であっても、代表帳票のイメージデータは1つでよくなる。従来のように、個別インデックスに合わせて代表帳票を再度読み込む必要がなくなり、読み取りの効率化及び記憶領域の利用の効率化を図ることができる。また、検索においても、代表帳票の先頭に記載されていない個別インデックスも付帯帳票も含む文書のイメージデータに対応付けられているため、再検索が必要なくなり、検索効率を上げることができるという利点もある。 As described above, by associating the individual index with the document index, the relationship between the document index and the image data is 1: 1. The relationship between the individual index and the document index is N: 1. That is, even if a single document includes a plurality of indexes, only one image data of the representative form is required. As in the prior art, there is no need to read the representative form again in accordance with the individual index, and the reading efficiency and the storage area utilization efficiency can be improved. Also, in the search, since the individual index that is not described at the top of the representative form is associated with the image data of the document including the incidental form, there is an advantage that the re-search is not necessary and the search efficiency can be improved. is there.
図9は、インデックス管理情報の一例を示した図である。(A)は個別インデックス管理情報、(B)は文書インデックス管理情報を示している。
(A)個別インデックス管理情報3100には、対象文書の代表帳票から抽出した個別インデックス3101に対応付けて、参照先文書インデックス3102が登録されている。例えば、文書ABC510の申込書類ABC511から抽出された個別インデックス、「A」、「B」、「C」には、「INDEX−A」を参照先の文書インデックスとすることが登録されている。同様に、「D」には「INDEX−D」、「E」には「INDEX−E」、「F」には「INDEX−F」を参照先の文書インデックスとすることが登録されている。
FIG. 9 is a diagram illustrating an example of index management information. (A) shows individual index management information, and (B) shows document index management information.
(A) In the individual
(B)文書インデックス管理情報3200には、対象文書の文書インデックス3201に対応付けて、参照先イメージデータ3202が登録されている。例えば、文書インデックス「INDEX−A」は、「申込書類ABCイメージ」を参照先のイメージデータとすることが登録されている。同様に、「INDEX−D」には「申込書類Dイメージ」、「INDEX−E」には「申込書類Eイメージ」、「INDEX−F」には「申込書類Fイメージ」を参照先の文書イメージデータとすることが登録されている。例えば、各イメージデータが格納される記憶領域を示すアドレスが登録される。
(B) In the document
なお、図9の例では、インデックスとその参照先とをテーブル形式の個別インデックス管理情報と、文書インデックス管理情報とによって管理するとしているが、本願発明はこれに限定されない。図8に示したインデックスの関係が表現できれば、どのような表現形式で設定してもよい。 In the example of FIG. 9, the index and the reference destination thereof are managed by the table-type individual index management information and the document index management information, but the present invention is not limited to this. Any expression format may be used as long as the index relationship shown in FIG. 8 can be expressed.
次に、イメージDB330に格納される文書ABC510、文書D520、文書E530及び文書F540のイメージデータの検索処理について説明する。まず、代表帳票が包括帳票の場合について説明し、続いて代表帳票が通常帳票の場合について説明する。
Next, search processing of image data of the document ABC 510, the
図10は、代表帳票が包括帳票の場合の検索処理を示した図である。個別インデックスDB310には、それぞれが文書インデックスに対応付けられた個別インデックス「A」、「B」、「C」が登録されている。文書インデックスDB320には、文書ABC510のイメージデータの記憶領域に対応付けられた文書インデックス「INDEX−A」が登録されている。イメージDB330には、文書ABC510のイメージデータが文書単位に格納されている。
FIG. 10 is a diagram showing search processing when the representative form is a comprehensive form. In the
検索部150は、指定された検索キーワードに基づいてインデックスを検索し、イメージデータが格納される記憶領域の先頭アドレスを検出する。図10の例では、検索キーワード「A」1501が指定されると、検索部150は、個別インデックスDB310の個別インデックス管理情報を検索し、「A」を検出する。個別インデックス「A」は、文書インデックス「INDEX−A」に対応付けられているので、文書インデックスDB320の文書インデックス管理情報を検索し、「申込書類ABC」、「添付書類(A)」、「添付書類(B)」及び「添付書類(C)」を有する文書ABC510のイメージデータが記憶される記憶領域の先頭アドレスを検出する。検索部150は、検索キーワード「A」1501の応答として、文書ABC510のイメージデータ1511を返す。これにより、ユーザは、指定された証券番号「A」の資料として、代表帳票である申込書類ABCのイメージデータと、添付書類(A)のイメージデータとを取得し、内容を確認することができる。
The
次に、検索キーワード「B」1502が指定されたとする。検索部150は、個別インデックスDB310の個別インデックス管理情報を検索し、「B」を検出する。個別インデックス「B」は、文書インデックス「INDEX−A」に対応付けられているので、文書インデックスDB320の文書インデックス管理情報を検索し、「申込書類ABC」、「添付書類(A)」、「添付書類(B)」及び「添付書類(C)」を有する文書ABC510のイメージデータが記憶される記憶領域の先頭アドレスを検出する。検索部150は、検索キーワード「B」1502の応答として、文書ABCのイメージデータ1512を返す。これにより、ユーザは、指定された証券番号「B」の資料として、代表帳票である申込書類ABCのイメージデータと、添付書類(B)のイメージデータとを取得し、内容を確認することができる。
Next, it is assumed that the search keyword “B” 1502 is designated. The
図11は、代表帳票が通常帳票の場合の検索処理を示した図である。個別インデックスDB310には、それぞれが文書インデックスに対応付けられた個別インデックス「D」、「E」が登録されている。文書インデックスDB320には、イメージデータに対応付けられた文書インデックス「INDEX−D」、「INDEX−E」が登録されている。イメージDB330には、文書のイメージデータが文書単位に格納されている。
FIG. 11 is a diagram showing search processing when the representative form is a normal form. In the
図11の例では、検索キーワード「D」1503が指定されると、検索部150は、個別インデックスDB310の個別インデックス管理情報を検索し、「D」を検出する。個別インデックス「D」は、文書インデックス「INDEX−D」に対応付けられているので、文書インデックスDB320の文書インデックス管理情報を検索し、「申込書類D」及び「添付書類(D)」を有する文書Dのイメージデータ格納領域を検出する。検索部150は、検索キーワード「D」1503の応答として、文書D520のイメージデータ1513を返す。これにより、ユーザは、指定された証券番号「D」の資料として、代表帳票である申込書類Dのイメージデータと、添付書類(D)のイメージデータとを取得し、内容を確認することができる。同様に、検索キーワード「E」1504が指定されたときは、応答として、文書Eのイメージデータ1514を返す。これにより、ユーザは、指定された証券番号「E」の資料として、代表帳票である申込書類Eのイメージデータと、添付書類(E)のイメージデータとを取得し、内容を確認することができる。
In the example of FIG. 11, when the search keyword “D” 1503 is designated, the
次に、文書管理装置の処理手順及び文書管理方法を、フローチャートを用いて説明する。まず、文書登録時の読取・認識処理と点検・登録処理について説明し、次に文書検索時の検索処理について説明する。 Next, a processing procedure and a document management method of the document management apparatus will be described using a flowchart. First, reading / recognition processing and inspection / registration processing at the time of document registration will be described, and then search processing at the time of document search will be described.
図12は、文書管理装置の文書登録時の読取・認識処理の手順を示したフローチャートである。対象文書がスキャナ200にセットされ、登録が指示されて処理が開始される。
[ステップS01] 読み取り部110は、スキャナ200にセットされる文書ABC510、文書D520、文書E530及び文書F540、それぞれの文書のイメージデータを順次読み取り、イメージデータを生成する。
FIG. 12 is a flowchart showing a procedure of reading / recognition processing at the time of document registration of the document management apparatus. The target document is set in the
[Step S01] The
[ステップS02] 認識部120は、読取部110が読み取ったイメージデータを取得し、帳票の種別を判別する。例えば、予め定義される所定の位置に記載される帳票種別コード等を読み出し、帳票の種別を検出する。
[Step S02] The recognizing
[ステップS03] 認識部120は、ステップS02で検出した帳票の種別が代表帳票であるか否かを判定する。代表帳票であるときは、処理をステップS04に進める。代表帳票でない時は、処理をステップS07に進め、認識処理を行わない。
[Step S03] The recognizing
[ステップS04] 認識部120は、帳票の種別が代表帳票であるときは、この代表帳票が通常帳票であるか、包括帳票であるかを判定する。包括帳票であれば、処理をステップS05に進める。包括帳票でないときは、処理をステップS06に進める。
[Step S04] When the type of the form is a representative form, the recognizing
[ステップS05] 認識部120は、帳票の種別が代表帳票かつ包括帳票であるときは、文字認識処理を行って代表帳票に含まれるM個のインデックスを全て抽出する。例えば、予めインデックスとする項目が記載されているイメージデータ上の位置を定義しておき、その位置定義に基づいて、代表帳票のイメージデータを文字認識する。また、インデックスに対応する項目の記載欄がすべて埋まっているとは限らない。指定された全領域の文字認識を行い、記載なしと判定したときは、インデックスに含めない。こうして記載された全てのインデックスを抽出し、処理をステップS07に進める。
[Step S05] When the form type is a representative form and a comprehensive form, the
[ステップS06] 認識部120は、帳票の種別が代表帳票かつ通常帳票であるときは、文字認識処理を行って代表帳票に含まれる1個のインデックスを抽出する。予めインデックスとする項目が記載されているイメージデータ上の位置を定義しておき、その位置定義に基づいて、代表帳票のイメージデータを文字認識する。
[Step S06] When the type of the form is a representative form and a normal form, the recognizing
[ステップS07] 認識部120は、ステップS01で読み取った全ての文書のイメージデータについて、認識処理が終了したかどうかを判定する。終了していないと判定したときは、処理をステップS02に進め、次の帳票のイメージデータの認識処理を行う。終了したと判定したときは、処理を図13に示す結合子Aへ処理を進め、点検・登録処理を行う。
[Step S07] The recognizing
図13は、文書管理装置の文書登録時の点検・登録処理の手順を示したフローチャートである。図12に示す結合子Aまでの処理を実行した後、以下の処理手順を実行する。
[ステップS08] 点検部130は、前段までの処理で取得した文書のイメージデータと、抽出したインデックス等の情報を表示部160に表示し、オペレータによる点検作業を待つ。オペレータの確認の終了が通知されたとき、点検されたイメージデータ及びインデックスを登録部140へ引き渡し、次のステップへ処理を進める。
FIG. 13 is a flowchart showing a procedure of inspection / registration processing at the time of document registration of the document management apparatus. After the processing up to the connector A shown in FIG. 12 is executed, the following processing procedure is executed.
[Step S08] The
[ステップS09] 登録部140は、取得した文書のイメージデータを文書単位に分割する。例えば、イメージデータの帳票種別を配列順に従って順に調査し、代表帳票を検出する。そして、代表帳票が検出されてから、次に検出された代表帳票の1つ前の帳票までを1つの文書単位とする。また、代表帳票に、文書に含まれる帳票の枚数が記載されていれば、これを利用して文書単位の区切りを検出するとしてもよい。そして、検出した区切りを用いて、イメージデータを文書単位に分割する。
[Step S09] The
[ステップS10] 登録部140は、文書単位に分割した文書のイメージデータをイメージDB330に格納する。
[ステップS11] 登録部140は、文書を識別する文書インデックスを生成し、イメージDB330に格納した文書単位のイメージデータの記憶領域のアドレスと対応付け、文書インデックス管理情報に登録する。文書インデックスは、文書単位ごとに、ユニークな値を設定する。例えば、イメージDB330に格納される文書のイメージデータの位置や、代表帳票から抽出した文書を特徴づける見出し語等を設定する。設定した文書インデックス管理情報は、文書インデックスDB320に設定する。
[Step S <b> 10] The
[Step S11] The
[ステップS12] 登録部140は、認識部120が抽出したインデックスに基づいて、個別インデックスを生成する。個別インデックスは、それぞれが属する文書インデックスに対応付けて個別インデックス管理情報に登録し、個別インデックスDB310に設定する。
[Step S12] The
[ステップS13] 登録部140は、全文書の処理が終了したかどうかを判定する。終了していない場合は、ステップS10に戻り、次の文書の登録処理を行う。
以上の処理手順が実行され、図8に示したような関係を有する個別インデックスと文書インデックスが生成され、文書のイメージデータ管理に用いられる。
[Step S13] The
The above processing procedure is executed, and an individual index and a document index having the relationship shown in FIG. 8 are generated and used for document image data management.
図14は、文書管理装置の文書検索処理の手順を示したフローチャートである。
ユーザより検索指示を受け、処理を開始する。
[ステップS21] 検索部150は、検索指示を受けると、検索指示とともに指定された検索キーワードを入力する。
FIG. 14 is a flowchart showing a document search process procedure of the document management apparatus.
A search instruction is received from the user, and the process is started.
[Step S21] Upon receiving the search instruction, the
[ステップS22] 検索部150は、入力した検索キーワードを用いて個別インデックスDB310の個別インデックス管理情報を検索する。検索キーワードに指定された語と一致するインデックスを検索し、検出されたときはインデックスに対応付けられている文書インデックスを抽出する。検索キーワードに指定された語が検出されなかったときは、未検出とする。
[Step S22] The
[ステップS23] 検索部150は、ステップS22の個別インデックスDB310の個別インデックス管理情報の検索の結果、指定された検索キーワードに該当する個別インデックスが検出されたか否かを判定する。検出された時は、処理をステップS24に進める。検出されなかったときは、処理をステップS27に進める。
[Step S23] The
[ステップS24] 検索部150は、個別インデックスが検出されたときは、個別インデックスに対応付けられている文書インデックスを抽出する。そして、この文書インデックスを用いて文書インデックスDB320の文書インデックス管理情報を検索し、文書インデックスに対応付けられている文書単位のイメージデータが記憶されるイメージDB330のアドレスを抽出する。
[Step S24] When an individual index is detected, the
[ステップS25] 検索部150は、ステップS24で抽出された対象文書の文書単位のイメージデータが記憶されるアドレスに基づいてイメージDB330を検索し、該当する記憶領域に格納されているイメージデータを読み出す。
[Step S25] The
[ステップS26] 検索部150は、ステップS25で読み出したイメージデータを表示部160に表示し、処理を終了する。
[ステップS27] 検索部150は、入力したキーワードに一致する個別インデックスが検出されなかったときは、表示部160にエラー画面を表示するなどしてエラーを通知し、処理を終了する。
[Step S26] The
[Step S27] When the individual index matching the input keyword is not detected, the
以上の処理手順が実行されることにより、指定した検索キーワードに関連する文書のイメージデータが表示部160に表示される。また、付帯帳票が含まれる検索キーワードが指定された場合であっても、1回の検索で付帯帳票のイメージデータを表示部160に表示させることができる。
By executing the above processing procedure, the image data of the document related to the designated search keyword is displayed on the
次に、第2の実施の形態について説明する。第1の実施の形態では、包括帳票から抽出された個別インデックスを文書単位の文書インデックスに対応付け、各付帯帳票に対応する個別インデックスが指定されたとき、文書単位のイメージデータを抽出して表示するとした。このように、文書単位のイメージデータを抽出し、表示部160に表示すれば、先頭の代表帳票の内容を確認し、続いて、所望の付帯帳票まで画面をスクロールさせて、付帯帳票を確認することができる。しかし、包括帳票に多くのインデックスが記載されている場合等、文書単位のイメージデータを取得しても所望の付帯帳票を探し出すことが大変な場合もある。そこで、第2の実施の形態では、検索時に、文書単位のイメージデータから指定された個別インデックスに対応する付帯帳票のイメージデータを抽出し、代表帳票とともに表示する。
Next, a second embodiment will be described. In the first embodiment, the individual index extracted from the comprehensive form is associated with the document unit document index, and when the individual index corresponding to each supplementary form is designated, the document unit image data is extracted and displayed. Then. In this way, when image data in units of documents is extracted and displayed on the
なお、第2の実施の形態における文書管理装置が有する処理機能の構成は、図2〜4に示した第1の実施の形態の構成要素と同様である。そこで、図2〜4に示した構成要素の符号を用いて、第2の実施の形態における機能を説明する。 Note that the configuration of the processing functions of the document management apparatus in the second embodiment is the same as the components of the first embodiment shown in FIGS. Therefore, functions in the second embodiment will be described using the reference numerals of the components shown in FIGS.
第2の実施の形態の文書管理装置における登録処理及び検索処理について説明する。なお、代表帳票が通常帳票であるときの処理は、第1の実施の形態と同様であるので、以下の説明では、代表帳票が包括帳票である場合について説明する。 Registration processing and search processing in the document management apparatus according to the second embodiment will be described. Note that the processing when the representative form is a normal form is the same as that in the first embodiment, and therefore, in the following description, the case where the representative form is a comprehensive form will be described.
図15は、第2の実施の形態の代表帳票が包括帳票の場合の文書登録処理を示した図である。文書ABC550は、包括帳票である申込書類ABC551と、添付書類(A)552、添付書類(B)553及び添付書類(C)554と、を有する。申込書類ABC551には、インデックスとする証券番号「A」、「B」、「C」に対応付けて、それぞれの証券番号に対応する添付書類の枚数が記載されている。図15の例では、証券番号「A」に対応する添付書類(A)552は1枚、証券番号「B」に対応する添付書類(B)553は2枚、及び証券番号「C」に対応する添付書類(C)554は1枚、が申込書類ABC551に添付されることが記載されている。 FIG. 15 is a diagram illustrating document registration processing when the representative form of the second embodiment is a comprehensive form. The document ABC550 includes an application document ABC551 that is a comprehensive form, an attached document (A) 552, an attached document (B) 553, and an attached document (C) 554. In the application document ABC551, the number of attached documents corresponding to each security number is described in association with the security numbers “A”, “B”, and “C” as indexes. In the example of FIG. 15, one attached document (A) 552 corresponding to the security number “A”, two attached documents (B) 553 corresponding to the security number “B”, and corresponding to the security number “C”. It is described that one attached document (C) 554 is attached to the application document ABC551.
読取部110は、申込書類ABC551、添付書類(A)552、添付書類(B)553、添付書類(C)554の順に画像を読み取り、そのイメージデータを生成する。認識部170は、読取部110が読み取ったイメージデータの帳票を判別し、帳票が代表帳票であるときは、インデックスと、それぞれのインデックスに対応する付帯帳票の枚数とを抽出する。付帯帳票の枚数についても、予め定義された領域のイメージデータを抽出し、このイメージデータに対して文字認識を行うことによって取得する。インデックスと付帯帳票の枚数は、例えば、イメージデータ上のインデックスの位置と、付帯帳票の枚数の位置とを定義しておき、定義に基づいて抽出したイメージデータを文字認識して得る。図15の例では、申込書類ABC551を代表帳票かつ包括帳票と認識し、M個のインデックスと、枚数とを抽出する。ここでは、認識情報1701として、「A」、「B」、「C」の3個の個別インデックスと、それぞれの個別インデックスに対応する付帯帳票の枚数「1」、「2」、「1」を抽出する。添付書類(A)552、添付書類(B)553及び添付書類(C)554は、付帯帳票と判別し、認識処理は行わない。各帳票のイメージデータと、認識情報1701は、点検部130に引き渡される。点検部130の処理は、第1の実施の形態と同様であるので説明は省略する。
The
登録部180は、イメージデータを文書単位に分割し、文書単位のイメージデータをイメージDB330cに格納する。図15の例では、申込書類ABCのイメージデータ5511、添付書類(A)のイメージデータ5521、添付書類(B)のイメージデータ5531及び添付書類(C)のイメージデータ5541をこの順に配列し、イメージDB330cに格納する。また、文書ABC550に関する文書インデックス「INDEX−A」を生成し、インデックスDB320cに格納する。そして、申込書類ABC551から抽出した認識情報1701に基づき、個別インデックスを生成する。図15の例では、認識部170が抽出した「A」、「B」、「C」をそれぞれ文書ABCのイメージデータを示す文書インデックス「INDEX−A」に対応付け、個別インデックスDB310cの個別インデックス管理情報に登録する。また、このとき、付帯帳票情報として、「位置」と「枚数」を個別インデックスに対応付けて記憶する。「枚数」は、個別インデックスとともに文字認識して得られた申込書類ABC551に記載された数値である。「位置」は、「枚数」に基づき、個別インデックスに対応する付帯帳票が代表帳票から何枚目にあるかを示すデータである。位置情報は、帳票の配列が1つ前の個別インデックスの「位置」に、前の個別インデックスに対応する「枚数」を加算して得られる。例えば、申込書類ABC551に続く添付書類(A)552の「位置」は、代表帳票の次に当たるので「1」になる。添付書類(A)552の次に配置される添付書類(B)553の位置は、添付書類(A)552の位置「1」に、添付書類(A)552の枚数「1」を加算した「2」になる。こうして、順次、個別インデックスに対応する付帯帳票について、代表帳票である申込書類ABC551からの枚数を算出し、個別インデックスに関連付け、個別インデックスDB310cの個別インデックス管理情報に登録する。
The
図16は、第2の実施の形態のインデックス管理情報の一例を示した図である。(A)は、個別インデックス管理情報である。なお、文書インデックス管理情報については、図9に示した文書インデックス管理情報3200と同様であるので説明は省略する。
FIG. 16 is a diagram illustrating an example of index management information according to the second embodiment. (A) is individual index management information. The document index management information is the same as the document
個別インデックス管理情報3110は、対象文書の代表帳票から抽出した個別インデックス3111に対応付けて、参照先の文書インデックス3112、添付書類位置31133及び添付書類枚数3114が登録されている。参照先の文書インデックス3112は、個別インデックスに対応付けた文書を示す。例えば、文書ABC550の申込書類551から抽出された個別インデックス、「A」、「B」、「C」には、「INDEX−A」を参照先の文書インデックスとすることが登録されている。添付書類位置3113には、個別インデックスに対応する付帯帳票について、この文書の先頭の代表帳票からの位置、ここでは、代表帳票から何枚目にあるかが登録されている。添付書類枚数3114には、個別インデックスに対応する付帯帳票の枚数が登録されている。例えば、インデックス「B」に対応する添付書類(B)553については、文書インデックスは「INDEX−A」、添付書類位置は「2」、添付書類枚数は「2」が登録されている。
In the individual
なお、図15,16の例では、代表帳票に付帯帳票の枚数が記載されているとしたが、例えば、目次のように対応する付帯帳票が先頭の帳票から何番目にあるかを示す位置情報が予め代表帳票に記載されていてもよい。この場合は、文字認識によって読み出した位置情報が、添付書類位置313に登録される。また、別途、オペレータ等によって位置情報が定義されているとしてもよい。 In the examples of FIGS. 15 and 16, it is assumed that the number of supplementary forms is described in the representative form. For example, as shown in the table of contents, position information indicating the position of the corresponding supplementary form from the top form. May be described in the representative form in advance. In this case, the position information read by character recognition is registered in the attached document position 313. In addition, position information may be defined separately by an operator or the like.
このようなインデックス管理情報3110に基づき、検索処理が行われる。
図17は、第2の実施の形態の代表帳票が包括帳票の場合の文書検索処理を示した図である。個別インデックスDB310cには、それぞれが文書インデックスに対応付けられた個別インデックス「A」、「B」、「C」が、位置(付帯書類位置)及び枚数(付帯書類枚数)とともに登録されている。文書インデックスDB320cには、イメージデータに対応付けられた文書インデックス「INDEX−A」が登録されている。イメージDB330cには、文書のイメージデータが文書単位に格納されている。
A search process is performed based on such
FIG. 17 is a diagram illustrating document search processing when the representative form according to the second embodiment is a comprehensive form. In the
検索部190は、指定された検索キーワードに基づいてインデックスを検索し、イメージデータが格納される記憶領域の先頭アドレスを検出する。図17の例では、検索キーワード「A」1901が指定されると、検索部190は、個別インデックスDB310cの個別インデックス管理情報を検索し、個別インデックス「A」を検出する。このとき、「位置=1」、「枚数=1」も取得する。個別インデックス「A」は、文書インデックス「INDEX−A」に対応付けられているので、文書インデックスDB320cを検索し、「申込書類ABC」、「添付書類(A)」、「添付書類(B)」及び「添付書類(C)」を有する文書ABCのイメージデータ格納領域を検出する。検索部190は、インデックス「A」に対応する「位置=1」及び「枚数=1」に基づいて、インデックス「A」に対応する付帯帳票である添付書類(A)のイメージデータは、代表帳票である申込書類ABCから1枚目の位置にある1枚の書類であることを特定する。そして、添付書類(A)分のイメージデータを抽出し、代表帳票である申込書類ABCのイメージデータと合わせたイメージデータ1911を生成し、検索キーワード「A」1901の応答として返す。これにより、ユーザは、指定した証券番号「A」について、代表帳票である申込書類ABCのイメージデータと、添付書類(A)のイメージデータとを取得し、内容を確認することができる。続いて、検索キーワード「B」1902が指定されたとする。検索部190は、個別インデックスDB310cの個別インデックス管理情報を検索し、個別インデックス「B」を検出する。このとき、「位置=2」、「枚数=2」も取得する。個別インデックス「B」は、文書インデックス「INDEX−A」に対応付けられているので、文書インデックスDB320cを検索し、「申込書類ABC」、「添付書類(A)」、「添付書類(B)」及び「添付書類(C)」を有する文書ABCのイメージデータ格納領域を検出する。さらに、インデックス「B」に対応する「位置=2」及び「枚数=2」に基づいて、インデックス「B」に対応する付帯帳票である添付書類(B)のイメージデータは、代表帳票である申込書類ABCから2枚目の位置にある2枚の書類であることを特定する。そして、添付書類(B)分のイメージデータを抽出し、代表帳票である申込書類ABCのイメージデータと合わせたイメージデータ1912を生成し、検索キーワード「B」1902の応答として返す。これにより、ユーザは、指定した証券番号「B」の資料として、代表帳票である申込書類ABCのイメージデータと、添付書類(B)のイメージデータとを取得し、内容を確認することができる。
The
なお、第2の実施の形態では、登録処理時に枚数に基づいて位置を算出し、個別インデックスに関連付けて登録しておくとしていたが、枚数だけを登録しておき、位置の算出処理は検索処理で行うとすることもできる。 In the second embodiment, the position is calculated based on the number of sheets and registered in association with the individual index during the registration process. However, only the number of sheets is registered, and the position calculation process is a search process. You can also do it.
第2の実施の形態によれば、代表帳票が包括帳票である文書について、代表帳票と、検索キーワードで指定したインデックスに対応する付帯帳票のみを選択的に抽出することができる。このため、文書単位に抽出された多くのイメージデータから所望の付帯帳票を探し出す手間が省け、検索効率をさらに向上させることができる。 According to the second embodiment, for a document whose representative form is a comprehensive form, only the representative form and the incidental form corresponding to the index specified by the search keyword can be selectively extracted. For this reason, it is possible to save the trouble of searching for a desired incidental form from a lot of image data extracted in units of documents, and the search efficiency can be further improved.
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、文書管理装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記憶装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記憶装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、DVD、DVD−RAM、CD−ROM/RWなどがある。光磁気記録媒体には、MO(Magneto-Optical disk)などがある。 The above processing functions can be realized by a computer. In that case, a program describing the processing contents of the functions that the document management apparatus should have is provided. By executing the program on a computer, the above processing functions are realized on the computer. The program describing the processing contents can be recorded on a computer-readable recording medium. Examples of the computer-readable recording medium include a magnetic storage device, an optical disk, a magneto-optical recording medium, and a semiconductor memory. Examples of the magnetic storage device include a hard disk device (HDD), a flexible disk (FD), and a magnetic tape. Optical discs include DVD, DVD-RAM, CD-ROM / RW, and the like. Magneto-optical recording media include MO (Magneto-Optical disk).
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。 When distributing the program, for example, a portable recording medium such as a DVD or a CD-ROM in which the program is recorded is sold. It is also possible to store the program in a storage device of a server computer and transfer the program from the server computer to another computer via a network.
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、ネットワークを介して接続されたサーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。 The computer that executes the program stores, for example, the program recorded on the portable recording medium or the program transferred from the server computer in its own storage device. Then, the computer reads the program from its own storage device and executes processing according to the program. The computer can also read the program directly from the portable recording medium and execute processing according to the program. In addition, each time a program is transferred from a server computer connected via a network, the computer can sequentially execute processing according to the received program.
また、上記の処理機能の少なくとも一部を、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)などの電子回路で実現することもできる。 In addition, at least a part of the above processing functions can be realized by an electronic circuit such as a DSP (Digital Signal Processor), an ASIC (Application Specific Integrated Circuit), or a PLD (Programmable Logic Device).
1 文書管理装置
1a 読取手段
1b 認識手段
1c 登録手段
1d 検索手段
3 記憶装置
3a 個別インデックス管理情報
3b 文書インデックス管理情報
3c イメージデータ
5 文書
5a 代表帳票
5b 付帯帳票
7 文書イメージデータ
DESCRIPTION OF
Claims (6)
前記コンピュータを、
代表帳票と前記代表帳票に添付される付帯帳票とを有し、前記代表帳票に関連付けられる前記付帯帳票を識別するインデックスが前記代表帳票に記載される文書を電子化したイメージデータを取得し、前記代表帳票のイメージデータに文字認識を行って前記代表帳票に記載される前記インデックスを全て抽出する認識手段、
取得した前記文書のイメージデータをイメージデータ記憶手段に格納し、前記文書のイメージデータを格納したアドレスを該文書の前記代表帳票から抽出した前記インデックスに対応付けてインデックス管理情報に登録する登録手段、
検索対象のインデックスが指定されたときは、指定されたインデックスに基づいて前記インデックス管理情報を検索し、前記指定されたインデックスに対応する前記文書のイメージデータを抽出する検索手段、
として機能させることを特徴とする文書管理プログラム。 In a document management program that causes a computer that performs document management processing to digitize and manage documents to function,
The computer,
An image that has a representative form and an incidental form attached to the representative form, and an index for identifying the incidental form associated with the representative form is obtained by digitizing a document described in the representative form, and Recognizing means for performing character recognition on image data of a representative form and extracting all the indexes described in the representative form;
Registration means for storing the acquired image data of the document in image data storage means, and registering the address storing the image data of the document in index management information in association with the index extracted from the representative form of the document;
When a search target index is specified, search means for searching the index management information based on the specified index, and extracting image data of the document corresponding to the specified index,
Document management program characterized by functioning as
前記登録手段は、前記文書イメージデータを格納したアドレスを前記文書の文書インデックスに対応付けて前記文書インデックス管理情報に登録し、前記代表帳票から抽出した前記インデックスを前記代表帳票が含まれる前記文書の文書インデックスに対応付けて前記個別インデックス管理情報に登録し、
前記検索手段は、前記指定されたインデックスに基づいて前記個別インデックス管理情報を検索して前記指定されたインデックスに対応する文書インデックスを検出し、検出した前記文書インデックスに基づいて前記文書インデックス管理情報を検索して前記文書インデックスに対応する前記文書のイメージデータを格納したアドレスを検出し、前記文書のイメージデータを抽出する、
ことを特徴とする請求項1記載の文書管理プログラム。 The index management information includes document index management information that associates an address of image data of the document with a document index that identifies the document, and individual index management information that associates the index with a document index of a document including the representative form. Have
The registration means registers the address storing the document image data in the document index management information in association with the document index of the document, and extracts the index extracted from the representative form of the document including the representative form. Register to the individual index management information in association with the document index,
The search means searches the individual index management information based on the specified index to detect a document index corresponding to the specified index, and determines the document index management information based on the detected document index. Searching and detecting an address storing the image data of the document corresponding to the document index, and extracting the image data of the document;
The document management program according to claim 1, wherein:
前記登録手段は、抽出した前記付帯帳票の位置情報を前記インデックスに対応付けて前記インデックス管理情報に登録し、
前記検索手段は、前記指定されたインデックスに基づいて前記インデックス管理情報を検索して前記指定されたインデックスに対応する前記文書のイメージデータが格納されるアドレスと前記付帯帳票の位置情報を取得し、取得した前記文書のイメージデータが格納されるアドレスと前記付帯帳票の位置情報とに基づいて、前記インデックスに対応する前記付帯帳票のイメージデータが格納されるアドレスを検出し、該付帯帳票のイメージデータを抽出する、
ことを特徴とする請求項1記載の文書管理プログラム。 The recognizing means extracts the position information of the auxiliary form together with the index by character recognition when the position information of the auxiliary form in the document to which the auxiliary form belongs is described in the representative form,
The registration unit registers the extracted position information of the incidental form in the index management information in association with the index,
The search means searches the index management information based on the specified index to obtain an address where the image data of the document corresponding to the specified index is stored and position information of the incidental form, Based on the acquired address where the image data of the document is stored and the position information of the incidental form, the address where the image data of the incidental form corresponding to the index is stored is detected, and the image data of the incidental form is detected. Extract,
The document management program according to claim 1, wherein:
前記登録手段は、前記文書のイメージデータから抽出した前記文書に含まれる前記付帯帳票の枚数と、前記文書における前記付帯帳票の配列順とに基づいて、前記付帯帳票ごとに前記文書の先頭の帳票からの枚数を算出し、算出した枚数を位置情報として前記付帯帳票に対応する前記インデックスに対応付けて前記インデックス管理情報に登録する、
ことを特徴とする請求項3記載の文書管理プログラム。 The recognizing means extracts the number of the attached forms described in the representative form as the position information of the accompanying form;
The registration means includes a first form of the document for each supplementary form based on the number of the supplementary forms included in the document extracted from the image data of the document and the arrangement order of the supplementary forms in the document. Calculating the number of sheets from and registering the calculated number of sheets as position information in the index management information in association with the index corresponding to the supplementary form.
The document management program according to claim 3.
コンピュータが、
代表帳票と前記代表帳票に添付される付帯帳票とを有し、前記代表帳票に関連付けられる前記付帯帳票を識別するインデックスが前記代表帳票に記載される文書を電子化したイメージデータを取得し、前記代表帳票のイメージデータに文字認識を行って前記代表帳票に記載される前記インデックスを全て抽出し、
取得した前記文書のイメージデータをイメージデータ記憶手段に格納し、前記文書のイメージデータを格納したアドレスを該文書の前記代表帳票から抽出した前記インデックスに対応付けてインデックス管理情報に登録し、
検索対象のインデックスが指定されたときは、指定されたインデックスに基づいて前記インデックス管理情報を検索し、前記指定されたインデックスに対応する前記文書のイメージデータを抽出する、
手順を実行することを特徴とする文書管理方法。 In a document management method for performing document management processing for digitizing and managing documents,
Computer
An image that has a representative form and an incidental form attached to the representative form, and an index for identifying the incidental form associated with the representative form is obtained by digitizing a document described in the representative form, and Perform character recognition on the image data of the representative form to extract all the indexes described in the representative form,
The acquired image data of the document is stored in an image data storage unit, and the address storing the image data of the document is registered in the index management information in association with the index extracted from the representative form of the document,
When an index to be searched is specified, the index management information is searched based on the specified index, and image data of the document corresponding to the specified index is extracted.
A document management method characterized by executing a procedure.
代表帳票と前記代表帳票に添付される付帯帳票とを有し、前記代表帳票に関連付けられる前記付帯帳票を識別するインデックスが前記代表帳票に記載される文書を電子化したイメージデータを取得し、前記代表帳票のイメージデータに文字認識を行って前記代表帳票に記載される前記インデックスを全て抽出する認識手段と、
取得した前記文書のイメージデータをイメージデータ記憶手段に格納し、前記文書のイメージデータを格納したアドレスを該文書の前記代表帳票から抽出した前記インデックスに対応付けてインデックス管理情報に登録する登録手段と、
検索対象のインデックスが指定されたときは、指定されたインデックスに基づいて前記インデックス管理情報を検索し、前記指定されたインデックスに対応する前記文書のイメージデータを抽出する検索手段と、
を有することを特徴とする文書管理装置。 In a document management apparatus that performs document management processing for digitizing and managing documents,
An image that has a representative form and an incidental form attached to the representative form, and an index for identifying the incidental form associated with the representative form is obtained by digitizing a document described in the representative form, and Recognition means for performing character recognition on the image data of the representative form and extracting all the indexes described in the representative form;
Registration means for storing the acquired image data of the document in an image data storage means, and registering the address storing the image data of the document in index management information in association with the index extracted from the representative form of the document; ,
When an index to be searched is specified, search means for searching the index management information based on the specified index and extracting image data of the document corresponding to the specified index;
A document management apparatus comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010099964A JP5393582B2 (en) | 2010-04-23 | 2010-04-23 | Document management program, document management method, and document management apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010099964A JP5393582B2 (en) | 2010-04-23 | 2010-04-23 | Document management program, document management method, and document management apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011232811A JP2011232811A (en) | 2011-11-17 |
JP5393582B2 true JP5393582B2 (en) | 2014-01-22 |
Family
ID=45322088
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010099964A Expired - Fee Related JP5393582B2 (en) | 2010-04-23 | 2010-04-23 | Document management program, document management method, and document management apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5393582B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103678384A (en) * | 2012-09-18 | 2014-03-26 | 鸿富锦精密工业(深圳)有限公司 | Sequential index generating system and sequential index generating method |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2862551B2 (en) * | 1989-02-06 | 1999-03-03 | 株式会社東芝 | Character reader |
JPH06251083A (en) * | 1993-02-25 | 1994-09-09 | Hitachi Ltd | Method and system for registering image data on optical disk |
JPH07200634A (en) * | 1993-12-28 | 1995-08-04 | Toshiba Corp | Image reading device |
JP2001202464A (en) * | 2000-01-18 | 2001-07-27 | Toshiba Corp | Electronic filing system |
JP2004151973A (en) * | 2002-10-30 | 2004-05-27 | Toppan Printing Co Ltd | Slip image data management device, slip image data management method and slip image data management program |
JP3491636B2 (en) * | 2003-03-05 | 2004-01-26 | 株式会社日立製作所 | Form processing method and system |
JP2008165386A (en) * | 2006-12-27 | 2008-07-17 | Canon It Solutions Inc | Document management device, document management method and document management program |
JP5280156B2 (en) * | 2008-11-06 | 2013-09-04 | 株式会社Pfu | Electronic document management apparatus and electronic document management method |
-
2010
- 2010-04-23 JP JP2010099964A patent/JP5393582B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011232811A (en) | 2011-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8959079B2 (en) | Method and system for providing relationships in search results | |
JP2009187414A (en) | Analytic attribute entry extraction program, analytic attribute entry extracting method, and information analyzing device | |
JP2007272548A (en) | Information retrieval program, information retrieval method and information retrieval device | |
US11113137B2 (en) | Error incident fingerprinting with unique static identifiers | |
KR101103126B1 (en) | Information processing apparatus, information processing method, and computer program | |
US11244109B2 (en) | Information processing device and information processing method | |
JP2007304796A (en) | Database analysis system, database analysis method and program | |
US20160098473A1 (en) | Grouping method and apparatus | |
JP5393582B2 (en) | Document management program, document management method, and document management apparatus | |
JP2010092383A (en) | Electronic document file search device, electronic document file search method, and computer program | |
JP6017055B2 (en) | Data linkage support apparatus and data linkage support method | |
JP6340990B2 (en) | Message display method, message display device, and message display program | |
JP2021056704A (en) | Data extracting method and data extracting program | |
JP4925711B2 (en) | Batch registration information generation apparatus, batch registration information generation method, and batch registration information generation program | |
JP4728783B2 (en) | Log browsing system | |
JP5723257B2 (en) | Document management program, information processing apparatus, and document management method | |
JP2004288017A (en) | Database retrieval system and method | |
JP5076621B2 (en) | Patent analysis program, patent analysis method and patent analysis apparatus | |
JP2010097296A (en) | Electronic document file retrieval device, electronic document file retrieval method, and computer program | |
JP6849904B2 (en) | Search program, search device and search method | |
JP2007011721A (en) | Document retrieval device | |
JP2006228067A (en) | Document management system and document management method | |
JP2000181927A (en) | Electronic filing system and file retrieval method applied to the same | |
JP6743470B2 (en) | Image storage device and image storage program | |
JP2022056573A (en) | Information processing program, information processing method, and information processing apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130927 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131008 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131015 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5393582 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |