JP2008046850A - Document type determination device, and document type determination program - Google Patents
Document type determination device, and document type determination program Download PDFInfo
- Publication number
- JP2008046850A JP2008046850A JP2006221634A JP2006221634A JP2008046850A JP 2008046850 A JP2008046850 A JP 2008046850A JP 2006221634 A JP2006221634 A JP 2006221634A JP 2006221634 A JP2006221634 A JP 2006221634A JP 2008046850 A JP2008046850 A JP 2008046850A
- Authority
- JP
- Japan
- Prior art keywords
- form data
- workflow
- document type
- created
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、文書種類判別装置及び文書種類判別プログラムにかかり、特に、帳票などの文書において同種の文書を判別する文書種類判別装置及び文書種類判別プログラムに関する。 The present invention relates to a document type discriminating apparatus and a document type discriminating program, and more particularly to a document type discriminating apparatus and a document type discriminating program for discriminating documents of the same type in a document such as a form.
多量の帳票データ等の文書データを取り扱う際には、扱う文書の構成ロジック(以下、スキーマという)が類似したものは、同一のものとして処理されることが望ましい。しかしながら、帳票などの文書はそれぞれの用途や制作者によって独自のフォーマットで構成されている場合が多く、計算機による処理で同種の帳票を判定することが難しい。 When handling a large amount of document data such as form data, it is desirable that documents having similar configuration logic (hereinafter referred to as schema) of the documents to be handled are processed as the same. However, a document such as a form is often configured in a unique format depending on each application or creator, and it is difficult to determine the same type of form by processing by a computer.
そこで、文書の種別を判別する技術として、特許文献1、2に記載の技術が提案されている。
Therefore, techniques described in
特許文献1に記載の技術では、構造化文書を入力した時に、システムに予め記憶されている文書型定義のタグ名や木構造と、その構造化文書を定義している文書型定義のタグ名や木構造とを比較して類似度を計算して、最も類似している文書種別を判別することが提案されている。
In the technique described in
また、特許文献2に記載の技術では、ランダムで入力される文書画像を複数の論理モデルを用いて文書種類を識別して、フォルダ分けして保存しておき、識別結果を閲覧・編集するときに、入力文書アイコンをあるカテゴリの論理モデルフォルダにドロップすることで、そのモデルのみを用いて入力文書の識別処理を行うことが提案されている。 In the technique described in Patent Document 2, when a document image input at random is identified by using a plurality of logical models, the document types are classified into folders, stored, and the identification result is viewed / edited. In addition, it is proposed that an input document icon is dropped into a certain category of logical model folder to perform an input document identification process using only that model.
一方、特許文献3に記載の技術には、ワークフローで定義された文書の文書保管指示に応じて、各文書についての属性項目を抽出し、抽出した属性項目の属性値を抽出し、保管する各文書の属性として登録して文書を保管することが提案されている。このように文書を保管することによって検索する際には属性値を用いて文書検索を行うことができる。
しかしながら、特許文献1に記載の技術では、構成が類似しているが別種である場合などが考えられ、文書種別の判定精度が不十分な場合がある。
However, in the technique described in
また、特許文献2に記載の技術においても、同種でもレイアウトが一致しない場合があり、文書種別の判別精度が不十分である。 In the technique described in Patent Document 2, the layout may not match even for the same type, and the document type discrimination accuracy is insufficient.
さらに、特許文献3に記載の技術では、属性項目の属性値を保存しておいて、属性値を用いて文書検索を行うが、文書種類の判別については提案されていない。
Furthermore, in the technique described in
本発明は、上記事実を考慮して成されたもので、文書種別を容易に判別することを目的とする。 The present invention has been made in view of the above facts, and an object thereof is to easily determine the document type.
上記目的を達成するために請求項1に記載の文書種類判別装置は、所定の業務処理の流れに沿って発生する帳票を表す帳票データの発生順序が定められた業務処理手順を複数種類予め記憶する記憶手段と、前記記憶手段に記憶された複数種類の前記業務処理手順の中から、現在まで作成した前記帳票データの作成順序と一致または類似する前記業務処理手順を検索する検索手段と、前記検索手段の検索結果に基づいて、現在まで作成した前記帳票データに対して作成順序が前後する帳票データの種類を判別する判別手段と、を備えることを特徴としている。 In order to achieve the above object, the document type determination apparatus according to claim 1 stores in advance a plurality of types of business processing procedures in which the generation order of the form data representing the forms generated along a predetermined business processing flow is determined. Storing means, search means for searching for the business process procedure that matches or is similar to the creation order of the form data created up to now, from among a plurality of types of business process procedures stored in the storage means, And a discriminating unit that discriminates the type of the form data whose order of creation is changed with respect to the form data created up to now based on the search result of the search unit.
請求項1に記載の発明によれば、記憶手段には、所定の業務処理の流れに沿って発生する帳票を表す帳票データの発生順序が定められた業務処理手順が複数種類予め記憶される。 According to the first aspect of the present invention, the storage means stores in advance a plurality of types of business process procedures in which the generation order of the form data representing the forms generated along the flow of the predetermined business process is determined.
検索手段では、記憶手段に記憶された複数種類の業務処理手順の中から、現在まで作成した帳票データの作成順序と一致または類似する業務処理手順が検索され、判別手段では、検索手段の検索結果に基づいて、現在まで作成した帳票データに対して作成順序が前後する帳票データの種類が判別される。すなわち、現在まで作成した帳票データの作成順序を用いて、業務処理の流れが類似する業務処理手順を記憶手段から検索し、一致または類似する業務処理手順から現在まで作成した帳票の前に作成した帳票データの種類や次に作成する帳票データの種類を判別することができる。従って、帳票の作成順序を用いて帳票の種類を判別することができるので、文書種別を容易に判別することができる。 In the search means, a business process procedure that matches or resembles the creation order of the form data created up to the present is searched from a plurality of types of business process procedures stored in the storage means, and in the discrimination means, the search result of the search means Based on the above, the type of the form data whose order of creation is changed with respect to the form data created up to now is determined. In other words, using the creation order of the form data created up to now, a business process procedure with a similar business process flow is searched from the storage means, and created before the form created from the same or similar business process procedure to the present. It is possible to determine the type of form data and the type of form data to be created next. Accordingly, the form type can be determined using the form creation order, so that the document type can be easily determined.
なお、請求項2に記載の発明のように、検索手段は、現在まで作成した帳票データの作成順序と一致または類似する業務処理手順が記憶手段に複数記憶されている場合に、帳票データを更に解析して、現在まで作成した帳票データの作成順序と一致または類似する業務処理手順を検索するようにしてもよい。すなわち、帳票の作成順序が類似する業務処理手順が記憶手段に複数記憶されている場合には、帳票データを更に解析して絞り込むようにしてもよい。 As in the invention described in claim 2, the search means further stores the form data when the storage means stores a plurality of business processing procedures that match or are similar to the creation order of the form data created up to now. Analysis may be performed to search for a business process procedure that matches or resembles the creation order of the form data created up to now. That is, when a plurality of business processing procedures with similar form creation orders are stored in the storage means, the form data may be further analyzed and narrowed down.
また、請求項3に記載の発明のように、帳票を作成する毎に作成した帳票データに作成順序を識別可能な情報を付属して登録する登録手段を更に備えて、検索手段が、登録手段に登録されている帳票データの作成順序と一致または類似する業務処理手順を検索するようにしてもよい。すなわち、現在まで作成した帳票データを順番が分かるように登録しておいて、登録手段に登録された帳票の作成順序に一致または類似するものを検索手段で検索するようにしてもよい。
In addition, as in the invention described in
また、請求項4に記載の発明のように、検索手段によって検索された業務処理手順に含まれる帳票データから次に作成すべき帳票に流用可能な部分を抽出すると共に、抽出した流用部分に対応する情報を現在まで作成した帳票データから抽出する抽出手段を更に備えるようにしてもよい。これによって、抽出手段によって抽出された情報を流用して次の帳票データ等を作成することが可能となり、業務処理に沿った帳票の作成を容易にすることができる。 Further, as in the invention described in claim 4, a portion that can be diverted to the next form to be created is extracted from the form data included in the business processing procedure searched by the search means, and the extracted diversion portion is supported. Extraction means for extracting the information to be extracted from the form data created up to the present time may be further provided. As a result, it is possible to create the next form data by using the information extracted by the extracting means, and it is possible to easily create the form in accordance with the business process.
なお、抽出手段は、請求項5に記載の発明のように、流用部分に対応する情報を現在まで作成した帳票データから抽出する際に、予め制限された内容以外を抽出するようにしてもよい。すなわち、秘匿情報等を予め流用制限として設定しておくことによって、流用されては困る情報の流用を防止することが可能となる。 Note that, as in the invention described in claim 5, the extracting means may extract contents other than those previously limited when extracting information corresponding to the diverted portion from the form data created up to now. . That is, by setting secret information or the like in advance as a diversion limit, it is possible to prevent the diversion of information that is difficult to divert.
一方、請求項6に記載の文書種類判別プログラムは、コンピュータに以下の文書種類判別処理を実行させる文書種類判別プログラムであって、前記文書種類判別処理は、所定の業務処理の流れに沿って発生する帳票を表す帳票データの発生順序が定められた業務処理手順を複数種類予め記憶する記憶手段に記憶された複数種類の前記業務処理手順の中から、現在まで作成した前記帳票データの作成順序と一致または類似する前記業務処理手順を検索する検索ステップと、前記検索ステップの検索結果に基づいて、現在まで作成した前記帳票データに対して作成順序が前後する帳票データの種類を判別する判別ステップと、を含むことを特徴としている。 On the other hand, the document type determination program according to claim 6 is a document type determination program that causes a computer to execute the following document type determination process, and the document type determination process occurs in accordance with a flow of a predetermined business process. A plurality of types of business processing procedures stored in a storage means for storing in advance a plurality of types of business processing procedures in which the generation order of the form data representing the forms to be generated is created. A search step for searching for the same or similar business processing procedure; and a determination step for determining the type of form data whose order of creation is before and after the form data created so far based on the search result of the search step; It is characterized by including.
請求項6に記載の発明によれば、所定の業務処理の流れに沿って発生する帳票を表す帳票データの発生順序が定められた業務処理手順を、記憶手段に複数種類予め記憶しておく。そして、検索ステップは、記憶手段に記憶された複数種類の業務処理手順の中から、現在まで作成した帳票データの作成順序と一致または類似する業務処理手順を検索し、判別手段は、検索ステップの検索結果に基づいて、現在まで作成した帳票データに対して作成順序が前後する帳票データの種類を判別する。すなわち、現在まで作成した帳票データの作成順序を用いて、業務処理の流れが類似する業務処理手順を記憶手段から検索し、一致または類似する業務処理手順から現在まで作成した帳票の前に作成した帳票データの種類や次に作成する帳票データの種類を判別することができる。従って、帳票の作成順序を用いて帳票の種類を判別することができるので、文書種別を容易に判別することができる。 According to the sixth aspect of the present invention, a plurality of types of business process procedures in which the generation order of form data representing a form generated along a predetermined business process flow is determined are stored in the storage means in advance. The search step searches for a business process procedure that matches or is similar to the creation order of the form data created up to the present from among a plurality of types of business process procedures stored in the storage means. Based on the search result, the type of the form data whose order of creation is changed with respect to the form data created up to now is determined. In other words, using the creation order of the form data created up to now, a business process procedure with a similar business process flow is searched from the storage means, and created before the form created from the same or similar business process procedure to the present. It is possible to determine the type of form data and the type of form data to be created next. Accordingly, the form type can be determined using the form creation order, so that the document type can be easily determined.
なお、請求項7に記載の発明のように、検索ステップは、現在まで作成した帳票データの作成順序と一致または類似する業務処理手順が記憶手段に複数記憶されている場合に、帳票データを更に解析して、現在まで作成した帳票データの作成順序と一致または類似する業務処理手順を検索するようにしてもよい。すなわち、帳票の作成順序が類似する業務処理手順が記憶手段に複数記憶されている場合には、帳票データを更に解析して絞り込むようにしてもよい。 Note that, as in the invention described in claim 7, the search step further stores the form data when a plurality of business processing procedures that match or are similar to the creation order of the form data created up to now are stored in the storage means. Analysis may be performed to search for a business process procedure that matches or resembles the creation order of the form data created up to now. That is, when a plurality of business processing procedures with similar form creation orders are stored in the storage means, the form data may be further analyzed and narrowed down.
また、請求項8に記載の発明のように、帳票を作成する毎に作成した帳票データに作成順序を識別可能な情報を付属して登録する登録ステップを更に含むようにして、検索ステップが、登録ステップで登録された帳票データの作成順序と一致または類似する業務処理手順を検索するようにしてもよい。すなわち、現在まで作成した帳票データを順番が分かるように登録しておいて、登録ステップで登録された帳票の作成順序に一致または類似するものを検索ステップで検索するようにしてもよい。 In addition, as in the invention described in claim 8, the search step further includes a registration step of registering the form data created every time a form is created with information that can identify the creation order, and registering the registration step. It is also possible to search for a business process procedure that matches or resembles the creation order of the form data registered in. In other words, the form data created up to now may be registered so that the order can be understood, and the search step may search for a form that matches or resembles the creation order of the forms registered in the registration step.
また、請求項9に記載の発明のように、検索ステップで検索した業務処理手順に含まれる帳票データから次に作成すべき帳票に流用可能な部分を抽出すると共に、抽出した流用部分に対応する情報を現在まで作成した帳票データから抽出する抽出ステップを更に含むようにしてもよい。これによって、抽出ステップで抽出した情報を流用して次の帳票データ等を作成することが可能となり、業務処理に沿った帳票の作成を容易にすることができる。 Further, as in the invention described in claim 9, a portion that can be diverted to a form to be created next is extracted from the form data included in the business processing procedure searched in the search step, and corresponds to the extracted diversion part. You may make it further include the extraction step which extracts information from the form data produced until now. As a result, it is possible to create the next form data by using the information extracted in the extraction step, and it is possible to easily create the form according to the business process.
なお、抽出ステップは、請求項10に記載の発明のように、流用部分に対応する情報を現在まで作成した帳票データから抽出する際に、予め制限された内容以外を抽出するようにしてもよい。すなわち、秘匿情報等を予め流用制限として設定しておくことによって、流用されては困る情報の流用を防止することが可能となる。
In the extraction step, as in the invention described in
以上説明したように本発明によれば、所定の業務処理の流れに沿って発生する帳票を表す帳票データの発生順序が定められた業務処理手順を複数種類予め記憶しておいて、記憶された複数種類の業務処理手順の中から、現在まで作成した帳票データの作成順序と一致または類似する業務処理手順を検索し、検索結果に基づいて、現在まで作成した帳票データに対して作成順序が前後する帳票データの種類を判別することによって、帳票の作成順序を用いて帳票の種類を判別することができるので、文書種別を容易に判別することができる、という効果がある。 As described above, according to the present invention, a plurality of types of business process procedures in which the generation order of form data representing a form generated along a predetermined business process flow is determined are stored in advance. Search for a business process procedure that matches or resembles the creation order of the form data created up to now from multiple types of business process procedures, and based on the search results, the creation order for the form data created so far By discriminating the type of form data to be performed, the form type can be discriminated using the form creation order, so that the document type can be easily discriminated.
以下、図面を参照して本発明の実施の形態の一例を詳細に説明する。図1は、本発明の実施の形態に係わる文書種類判別装置を含む文書管理システムの概略構成を示すブロック図である。 Hereinafter, an example of an embodiment of the present invention will be described in detail with reference to the drawings. FIG. 1 is a block diagram showing a schematic configuration of a document management system including a document type discrimination device according to an embodiment of the present invention.
ビジネスシーンで帳票を扱う場合、ある程度決まった順序で帳票を作成することが多い。このある程度決まった順序で帳票を作成することをワークフローというが、本実施の形態に係わる文書管理システム10では、このワークフローを利用して、帳票の種類判別や判別補助を行うものである。
When dealing with forms in business scenes, forms are often created in a certain order. Creating a form in a certain order is called a workflow. In the
本発明の実施の形態に係わる文書管理システム10は、図1に示すように、複数のコンピュータ12及び本発明の文書種類判別装置としてのデータベース管理システム(以下ではDB管理システムと称す)14がネットワーク16に接続されて構成されている。
As shown in FIG. 1, a
なお、本実施の形態では、コンピュータ12をネットワーク16に複数接続したものを示すがこれに限るものではなく、コンピュータ12の代わりに、スキャナ、ファクシミリ、複写機、これらを複合した複合機、メールサーバ、画像処理装置等を接続するようにしてもよい。また、ネットワーク16は、各種ネットワークを適用することができ、各コンピュータ12及びDB管理システム14は、CPU、ROM、RAM、及びキーボードやマウス等の入力装置を備えた一般的なコンピュータを適用することができる。
In the present embodiment, a plurality of
DB管理システム14には、帳票の発生する順序と共に帳票の構成ロジック(スキーマ)等をワークフローとして記憶するデータベース(以下ではDBと称す)18が接続されている。
Connected to the
各コンピュータ12は、例えば、図1に示すように、帳票A〜Cの順で各帳票を作成する毎に、ネットワーク16及びDB管理システム14を介してDB18に各帳票を登録しながら帳票作成を行う。コンピュータ12からDB18に帳票を作成して登録する際には、DB18内の登録先(後述する所属ワークフローを識別するための情報(以下、IDと称す))と共に、帳票データをネットワーク16を介してDB管理システム14に送信することによって登録を行う。なお、各帳票は、単一のコンピュータ12で作成するようにしてもよいし、複数のコンピュータ12で順次作成するようにしてもよい。また、各コンピュータ12は、それぞれ異なる会社のコンピュータ12とすることもできる。
For example, as shown in FIG. 1, each
図2は、DB管理システム14に接続されたDB18の詳細な構成の一例を示す図である。
FIG. 2 is a diagram illustrating an example of a detailed configuration of the
DB18内には、種々の業務処理等に従って発生する帳票を表す帳票データが発生順序と共に所属ワークフローとして登録される登録データ群20と、帳票のスキーマ等を含む帳票データを帳票発生順に従って予め登録した定型ワークフロー群22と、を記憶する領域を有しており、DB18は、DB管理システム14によって管理が行われる。
In the
登録データ群20には、ネットワーク16に接続された各コンピュータ12で作成された帳票が作成される毎に帳票が登録される。この時、所属ワークフローを特定するためのIDに対応する所属ワークフローに対して時間情報等のログ情報を同時に記憶することによって帳票の発生順序を特定することができるようになっている。
A form is registered in the
定型ワークフロー群22には、帳票の発生順序と共に、各帳票のスキーマ等を含む帳票データが予め記憶されている。なお、定型ワークフロー群22への登録は、コンピュータ12やDB管理システム14によって行われる。また、帳票データとしては、例えば、XML(Extensible Markup Language)等の構造化文書で記述されたものを適用することができる。
The fixed
例えば、図2では、登録データ群20には、3つの所属ワークフローが登録されている例を示し、ID=1〜3によって各所属ワークフローを特定することができるようになっており、ID=1に対応する所属ワークフローには、帳票A、帳票B、帳票Cの順で帳票が登録され、ID=2に対応する所属ワークフローには、帳票D、帳票E、帳票F、帳票Aの順で帳票が登録され、ID=3に対応する所属ワークフローには、帳票A、帳票C、帳票Fの順で帳票が登録されている例を示す。また、定型ワークフロー群22には、5種類の帳票発生順序及びその帳票データが記憶されている例を示す。5種類の帳票発生順序からなる定型ワークフローとしては、図2では、帳票A、帳票B、帳票C、帳票Eの順のワークフロー、帳票D、帳票E、帳票F、帳票A、帳票Cの順のワークフロー、帳票A、帳票B、帳票C、帳票D、帳票Eの順のワークフロー、帳票D、帳票E、帳票F、帳票Gの順のワークフロー、帳票E、帳票C、帳票A、帳票Bの順の定型ワークフローが記憶されている例を示す。
For example, FIG. 2 shows an example in which three affiliation workflows are registered in the
図3は、DB管理システム14の構成を示すブロック図である。なお、図3では、DB18の登録データ群20及び定型ワークフロー群22に登録されたデータは、図2よりも具体的な一例としたものを示す。
FIG. 3 is a block diagram showing the configuration of the
DB管理システム14は、定型ワークフロー管理部24、登録データ管理部26、及び類似解析部28を備えている。
The
定型ワークフロー管理部24は、帳票の発生順序や帳票データをDB18の定型ワークフロー群22に予め登録する処理を行う。定型ワークフロー管理部24によるDB18への登録処理は、コンピュータ12からネットワーク16を介して登録するようにしてもよいし、DB管理システム14のキーボード等の入力装置を介して登録するようにしてもよい。
The standard
登録データ管理部26は、コンピュータ12から送信されてきたIDに対応する所属ワークフローに対して、コンピュータ12から送信されてきた帳票データを時間情報等と共に登録すると共に、これまでに登録された帳票を含む所属ワークフローを読み出して、類似解析部28へ送信する。
The registered
類似解析部28は、登録データ管理部26から送信される所属ワークフローに類似または一致する定型ワークフローを定型ワークフロー群22から検索して取得し、該当する定型ワークフローを登録データ管理部26へ出力する。詳細には、一致するワークフローがある場合には一致するワークフローを定型ワークフロー群22から読み出して登録データ管理部26へ出力し、一致するワークフローがない場合には、既知の技術のように構造化文書の構造解析や自然言語処理等を用いて定型ワークフロー群22から最も妥当なものを選択し、優先順位を付けて登録データ管理部26へ出力する。これらの処理によって、最も妥当だと思われる定型ワークフローを取得することができ、その定型ワークフローの内容から、現在扱っている帳票の種類や、次に扱われると予測される帳票の種類を推定することが可能となる。
The
また、類似解析部28は、所属ワークフローに類似する定型ワークフロー内において各帳票間で流用可能な部分を抽出し、抽出した流用可能部分に対応するデータを所属ワークフローから抽出することが可能とされている。これによって、次の帳票作成時等にデータを流用することが可能となる。なお、帳票間のデータを流用する際には、秘匿情報等が流用されてしまう可能性があるため、登録データ群20の所属ワークフローに作成した帳票を登録する際に、流用制限が可能なようにしてもよいし、流用可能部分を抽出する際に、予め定めたデータ内容(例えば、会社名や住所等)のみを抽出するようにしてもよい。
Further, the
続いて、上述のように構成された本発明の実施の形態に係わる文書管理システムで行われる文書種類判別について説明する。 Next, document type determination performed by the document management system according to the embodiment of the present invention configured as described above will be described.
まず始めに、DB18の定型ワークフロー群22に対して定型ワークフローを予め登録しておく。すなわち、DB18の定型ワークフロー群22に対して、どのような順序で帳票が発生するかを予め登録する。この時、帳票の発生順序と共に帳票データ等をDB18の定型ワークフロー群22に予め登録する。例えば、図3に示すように、購入申請書、納品書、検収書の順で帳票が発生するワークフロー、見積依頼書、見積書、購入申請書、納品書、検収書の順で帳票が発生するワークフロー、見積依頼書、見積書、購入申請書、稟議書、納品書の順で帳票が発生するワークフローなどを定型ワークフローとして定型ワークフロー群22に予め登録する。
First, a fixed workflow is registered in advance with respect to the fixed
そして、コンピュータ12等で作成した帳票を登録データ群22に所属ワークフローとして順次登録する。この時、DB管理システム14は、所属ワークフローに登録された帳票の順番に対応する、定型ワークフロー群22に登録された定型ワークフローを検索することによって、帳票の種類や次に作成する帳票の種類を予測判別する。
Then, the forms created by the
ここで、DB管理システム14で行われる詳細な処理について説明する。図4は、DB管理システム14で行われる処理の流れの一例を示すフローチャートである。なお、図4のフローチャートはDB管理システム14内のハードウエア処理としてもよいし、ソフトウエアー処理としてもよい。
Here, detailed processing performed in the
コンピュータ12等によって帳票が作成されてネットワーク16を介してDB管理システム14に所属ワークフローを示すID及び帳票を表す帳票データが送信されて、IDに対応する所属ワークフローに帳票データの登録が指示されると、ステップ100では、コンピュータ12から送信された、所属ワークフローを示すデータ(ID)と帳票を表す帳票データが登録データ管理部26によって受信されてステップ102へ移行する。
A form is created by the
ステップ102では、受信した所属ワークフローがあるか否か登録データ管理部26によって判定される。該判定は、帳票データと共に受信した所属ワークフローを識別するためのIDが登録データ群20に登録されているか否かを判定し、該判定が否定された場合にはステップ104へ移行し、肯定された場合にはステップ106へ移行する。
In
ステップ104では、DB登録データ管理部26によってDB18の登録データ群20に所属ワークフローの登録スペースが確保されてステップ106へ移行する。なお、このときDB登録データ管理部26は、所属ワークフローを識別するためのIDを付与して、ネットワーク16を介して、IDをコンピュータ12に返信する。これによって、コンピュータ12側では作成した帳票を登録した所属ワークフローを特定することが可能となる。
In
ステップ106では、DB登録データ管理部26によってDB18の登録データ群20のIDに対応する所属ワークフローに対して、登録順序が分かる情報が帳票に付属されて登録される。例えば、帳票がスキャンされた時間や作成された時間、或いはタイムスタンプ等の記録時間を登録順序が分かるログ情報として登録する。
In
次に、ステップ108では、登録順序が分かる情報より現在の所属ワークフロー上の帳票発生順序がDB登録データ管理部26によって把握されてステップ110へ移行する。例えば、図3に示すように、IDに対応する所属ワークフローに登録された帳票が、見積依頼書、見積書、購入申請書の順のワークフローであることがDB登録データ管理部26によって把握される。
Next, at
ステップ110では、所属ワークフローの帳票登録順に対応する定型ワークフローが類似解析部28によって検索されてステップ112へ移行する。すなわち、類似解析部28は、登録データ管理部26から転送される、これまでの所属ワークフローに登録されたワークフローの帳票発生順序と、一致あるいは類似する定型ワークフローを定型ワークフロー群22から検索する。
In
ステップ112では、対応する定型ワークフローが単一か否か類似解析部28によって判定され、該判定が否定された場合にはステップ114へ移行し、肯定された場合にはステップ120へ移行する。なお、定型ワークフロー群22に所属ワークフローの帳票発生順序と一致または類似する定型ワークフローが全くない場合には以下の処理が実行できないので当該処理を終了する。
In
ステップ114では、ワークフローの構造解析で妥当な定型ワークフローが類似解析部28によって算出されてステップ116へ移行する。すなわち、既知の技術を利用して、帳票データを構造解析することによって定型ワークフロー群22内から複数の定型ワークフローのうち妥当な定型ワークフローが算出される。例えば、XML等の構造化文書のタグ名や木構造等を解析することによって、最も類似する定型ワークフローを検索する。
In
ステップ116では、対応する定型ワークフローが単一か否か類似解析部28によって判定され、該判定が否定された場合にはステップ118へ移行し、肯定された場合にはステップ120へ移行する。
In
ステップ118では、ワークフローの構成要素が類似解析部28によって解析され、妥当な定型ワークフローが判別されてステップ120へ移行する。すなわち、自然言語処理等の既知の技術を用いて、ワークフロー内の各帳票の構成要素を解析して類似する定型ワークフローを妥当な定型ワークフローとして判別する。例えば、文字列の並び等を解析することによって、最も類似する定型ワークフローを検索する。
In
ステップ120では、妥当な定型ワークフローとして判別した定型ワークフローから帳票の種類や次帳票の種類が類似解析部28によって判別されてステップ122へ移行し、次の帳票に流用可能なデータが類似解析部28によって抽出される。例えば、類似解析部28によって判別した定型ワークフロー内の各帳票から流用可能な部分を抽出すると共に、当該流用可能部分に対応するデータを登録データ群20の所属ワークフローに既に登録されている帳票から抽出する。なお、ステップ114やステップ118によって類似する定型ワークフローを絞り込んでも1つに絞り込めない場合は、コンピュータ12に絞り込んだ全ての定型ワークフローを送信して、コンピュータ12側で選択させた後に、ステップ120以降を実行するようにしてもよい。
In
そして、ステップ124では、ステップ120で判別した次の帳票の種類(スキーマ等の構造データを含む)及びステップ122で抽出した流用可能なデータが登録データ管理部26によって出力されて一連の処理を終了する。なお、次の帳票の種類や流用可能なデータの出力は、ネットワーク16を介して次の帳票を作成するコンピュータ12等の要求に応じて出力するようにしてもよいし、DB管理システム14内に所属ワークフローに次に登録されるべき帳票を作成するために必要なデータとして保存するようにしてもよい。
In
すなわち、本実施の形態では、所定の業務処理の流れに沿って発生する帳票を表す帳票データの発生順序が定められたワークフローを複数種類予め定型ワークフローとして記憶しておいて、記憶された複数種類の定型ワークフローの中から、現在まで作成した所属ワークフローと一致または類似する定型ワークフローを検索し、検索結果に基づいて、現在まで作成した帳票データに対して作成順序が前後する帳票データの種類を判別することによって、帳票の作成順序を用いて作成した帳票の前後の帳票の種類を判別することができるので、文書種別を容易に判別することができる
また、流用可能な部分を抽出するようにしたので、次の帳票作成時に流用することができ、帳票のスキーマ等の構成ロジックをワークフロー内で自然に統一することが可能となる。
That is, in this embodiment, a plurality of types of workflows in which the generation order of the form data representing the forms generated along a predetermined business process flow is determined are stored in advance as standard workflows. Search for a workflow that matches or resembles the workflow that you have created so far, and determine the type of report data whose order of creation is different for the report data created so far, based on the search results By doing so, it is possible to determine the type of the form before and after the form created using the form creation order, so the document type can be easily identified. Also, the divertable part is extracted. Therefore, it can be used when creating the next form, and the structure logic such as the form schema is naturally unified in the workflow. It becomes possible.
なお、上記の実施の形態では、コンピュータ12で作成した帳票データをネットワーク16を介してDB管理システム14に送信して、DB管理システム14がDB18の登録データ群20に登録するようにしたが、これに限るものではなく、例えば、コンピュータ12で作成した帳票データを次に帳票を作成するコンピュータ12に対して作成順序が分かる情報と共に順次送信するようにして、帳票を作成する際にコンピュータ12が現在までのワークフローをDB管理システム14に送信することで、DB管理システム14が類似する定型ワークフローを検索すると共に、次に作成する帳票に流用可能な情報を抽出してコンピュータ12に返信するようにしてもよい。
In the above embodiment, the form data created by the
また、上記の実施の形態で取り扱う帳票等は、例えば、XML(Extensible Markup Language)等の構造化文書で記述された帳票が好ましいが、他の言語を用いることも可能である。 In addition, the form and the like handled in the above embodiment is preferably a form described in a structured document such as XML (Extensible Markup Language), but other languages can also be used.
10 文書管理システム
12 コンピュータ
14 DB管理システム
16 ネットワーク
18 DB
20 登録データ群
22 定型ワークフロー群
24 定型ワークフロー管理部
26 登録データ管理部
28 類似解析部
10
20
Claims (10)
前記記憶手段に記憶された複数種類の前記業務処理手順の中から、現在まで作成した前記帳票データの作成順序と一致または類似する前記業務処理手順を検索する検索手段と、
前記検索手段の検索結果に基づいて、現在まで作成した前記帳票データに対して作成順序が前後する帳票データの種類を判別する判別手段と、
を備えた文書種類判別装置。 Storage means for storing in advance a plurality of types of business process procedures in which the generation order of form data representing a form generated along a predetermined business process flow is determined;
Search means for searching for the business process procedure that matches or is similar to the creation order of the form data created up to the present from among a plurality of types of the business process procedures stored in the storage means;
A discriminating unit that discriminates the type of form data whose order of creation is around for the form data created up to now based on the search result of the search unit;
A document type discrimination device.
前記文書種類判別処理は、
所定の業務処理の流れに沿って発生する帳票を表す帳票データの発生順序が定められた業務処理手順を複数種類予め記憶する記憶手段に記憶された複数種類の前記業務処理手順の中から、現在まで作成した前記帳票データの作成順序と一致または類似する前記業務処理手順を検索する検索ステップと、
前記検索ステップの検索結果に基づいて、現在まで作成した前記帳票データに対して作成順序が前後する帳票データの種類を判別する判別ステップと、
を含むことを特徴とする文書種類判別プログラム。 A document type discrimination program for causing a computer to execute the following document type discrimination process,
The document type determination process includes:
From among a plurality of types of business processing procedures stored in a storage means that stores in advance a plurality of types of business processing procedures in which the order of generation of form data representing a form generated in accordance with a predetermined business processing flow is determined. A search step for searching for the business process procedure that matches or is similar to the creation order of the form data created up to
Based on the search result of the search step, a determination step of determining the type of form data whose order of creation is around the form data created up to now,
A document type discriminating program comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006221634A JP2008046850A (en) | 2006-08-15 | 2006-08-15 | Document type determination device, and document type determination program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006221634A JP2008046850A (en) | 2006-08-15 | 2006-08-15 | Document type determination device, and document type determination program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008046850A true JP2008046850A (en) | 2008-02-28 |
Family
ID=39180542
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006221634A Withdrawn JP2008046850A (en) | 2006-08-15 | 2006-08-15 | Document type determination device, and document type determination program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008046850A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012243268A (en) * | 2011-05-24 | 2012-12-10 | Nec Corp | Business flow retrieval device, business flow retrieval method and program |
CN102902739A (en) * | 2012-09-13 | 2013-01-30 | 杭州电子科技大学 | Workflow flow construction method for uncertain data sources under cloud computing environment |
-
2006
- 2006-08-15 JP JP2006221634A patent/JP2008046850A/en not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012243268A (en) * | 2011-05-24 | 2012-12-10 | Nec Corp | Business flow retrieval device, business flow retrieval method and program |
CN102902739A (en) * | 2012-09-13 | 2013-01-30 | 杭州电子科技大学 | Workflow flow construction method for uncertain data sources under cloud computing environment |
CN102902739B (en) * | 2012-09-13 | 2015-09-02 | 杭州电子科技大学 | Towards the workflow view building method in uncertain data source under cloud computing environment |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7991709B2 (en) | Method and apparatus for structuring documents utilizing recognition of an ordered sequence of identifiers | |
US9372721B2 (en) | System for processing data received from various data sources | |
US20160239504A1 (en) | Method for entity enrichment of digital content to enable advanced search functionality in content management systems | |
US9025890B2 (en) | Information classification device, information classification method, and information classification program | |
JP2005018678A (en) | Form data input processing device, form data input processing method, and program | |
KR20130095171A (en) | Forensic system and forensic method, and forensic program | |
KR20120051419A (en) | Apparatus and method for extracting cascading style sheet | |
JP2012198684A (en) | Information processing device, business form type estimation method, and business form type estimation program | |
US20120046937A1 (en) | Semantic classification of variable data campaign information | |
US8180799B1 (en) | Dynamically creating tables to store received data | |
US20070185832A1 (en) | Managing tasks for multiple file types | |
CN110188207B (en) | Knowledge graph construction method and device, readable storage medium and electronic equipment | |
JPH11184894A (en) | Method for extracting logical element and record medium | |
US20210295033A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP2011065255A (en) | Data processing apparatus, data name generation method and computer program | |
JP4811133B2 (en) | Image forming apparatus and image processing apparatus | |
JP7272037B2 (en) | Information processing device and program | |
JP2008046850A (en) | Document type determination device, and document type determination program | |
US20050154703A1 (en) | Information partitioning apparatus, information partitioning method and information partitioning program | |
TWI793432B (en) | Document management method and system for engineering project | |
JP2006227914A (en) | Information search device, information search method, program and storage medium | |
CN114743012A (en) | Text recognition method and device | |
CN114417860A (en) | Information detection method, device and equipment | |
JP5217513B2 (en) | An information analysis processing method, an information analysis processing program, an information analysis processing device, an information registration processing method, an information registration processing program, an information registration processing device, an information registration analysis processing method, and an information registration analysis processing program. | |
JP2008123423A (en) | Audit system for storing/retrieving telegram data, audit method for storing/retrieving telegram data, and audit program for storing/retrieving telegram data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090212 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20100712 |