JP2008046850A - Document type determination device, and document type determination program - Google Patents

Document type determination device, and document type determination program Download PDF

Info

Publication number
JP2008046850A
JP2008046850A JP2006221634A JP2006221634A JP2008046850A JP 2008046850 A JP2008046850 A JP 2008046850A JP 2006221634 A JP2006221634 A JP 2006221634A JP 2006221634 A JP2006221634 A JP 2006221634A JP 2008046850 A JP2008046850 A JP 2008046850A
Authority
JP
Japan
Prior art keywords
form data
workflow
document type
created
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006221634A
Other languages
Japanese (ja)
Inventor
Hironari Konno
裕也 今野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2006221634A priority Critical patent/JP2008046850A/en
Publication of JP2008046850A publication Critical patent/JP2008046850A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To easily determine a document type. <P>SOLUTION: The device comprises a fixed workflow management part 24 for preliminarily registering an occurrence order of forms or form data in a fixed workflow group 22 of a DB 18; a registration data management part 26 for registering form data transmitted from a computer to a registered workflow corresponding to an ID transmitted from the computer together with time information, and reading and transmitting the registered workflow including the form to a similarity analysis part 28; and the similarity analysis part 28 for retrieving and acquiring a fixed workflow similar to or matched with the registered workflow transmitted from the registration data management part 26 from the fixed work flow group 22, outputting the corresponding fixed workflow to the registration data management part 26, further extracting a part usable in both forms within the fixed workflow similar to the registered workflow, and extracting data corresponding to the extracted usable part from the registered workflow. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、文書種類判別装置及び文書種類判別プログラムにかかり、特に、帳票などの文書において同種の文書を判別する文書種類判別装置及び文書種類判別プログラムに関する。   The present invention relates to a document type discriminating apparatus and a document type discriminating program, and more particularly to a document type discriminating apparatus and a document type discriminating program for discriminating documents of the same type in a document such as a form.

多量の帳票データ等の文書データを取り扱う際には、扱う文書の構成ロジック(以下、スキーマという)が類似したものは、同一のものとして処理されることが望ましい。しかしながら、帳票などの文書はそれぞれの用途や制作者によって独自のフォーマットで構成されている場合が多く、計算機による処理で同種の帳票を判定することが難しい。   When handling a large amount of document data such as form data, it is desirable that documents having similar configuration logic (hereinafter referred to as schema) of the documents to be handled are processed as the same. However, a document such as a form is often configured in a unique format depending on each application or creator, and it is difficult to determine the same type of form by processing by a computer.

そこで、文書の種別を判別する技術として、特許文献1、2に記載の技術が提案されている。   Therefore, techniques described in Patent Documents 1 and 2 have been proposed as techniques for determining the type of document.

特許文献1に記載の技術では、構造化文書を入力した時に、システムに予め記憶されている文書型定義のタグ名や木構造と、その構造化文書を定義している文書型定義のタグ名や木構造とを比較して類似度を計算して、最も類似している文書種別を判別することが提案されている。   In the technique described in Patent Document 1, when a structured document is input, a tag name or tree structure of a document type definition stored in advance in the system, and a tag name of a document type definition that defines the structured document It has been proposed to compare the degree of similarity with a tree structure and determine the most similar document type.

また、特許文献2に記載の技術では、ランダムで入力される文書画像を複数の論理モデルを用いて文書種類を識別して、フォルダ分けして保存しておき、識別結果を閲覧・編集するときに、入力文書アイコンをあるカテゴリの論理モデルフォルダにドロップすることで、そのモデルのみを用いて入力文書の識別処理を行うことが提案されている。   In the technique described in Patent Document 2, when a document image input at random is identified by using a plurality of logical models, the document types are classified into folders, stored, and the identification result is viewed / edited. In addition, it is proposed that an input document icon is dropped into a certain category of logical model folder to perform an input document identification process using only that model.

一方、特許文献3に記載の技術には、ワークフローで定義された文書の文書保管指示に応じて、各文書についての属性項目を抽出し、抽出した属性項目の属性値を抽出し、保管する各文書の属性として登録して文書を保管することが提案されている。このように文書を保管することによって検索する際には属性値を用いて文書検索を行うことができる。
特開2003−162518号公報 特開2000−67065号公報 特開平10−187841号公報
On the other hand, the technique described in Patent Document 3 extracts attribute items for each document in accordance with the document storage instruction for the document defined in the workflow, extracts attribute values of the extracted attribute items, and stores them. It has been proposed to store documents by registering them as document attributes. When searching by storing the document in this way, the document search can be performed using the attribute value.
JP 2003-162518 A JP 2000-67065 A JP-A-10-187841

しかしながら、特許文献1に記載の技術では、構成が類似しているが別種である場合などが考えられ、文書種別の判定精度が不十分な場合がある。   However, in the technique described in Patent Document 1, there are cases where the configuration is similar but the type is different, and the document type determination accuracy may be insufficient.

また、特許文献2に記載の技術においても、同種でもレイアウトが一致しない場合があり、文書種別の判別精度が不十分である。   In the technique described in Patent Document 2, the layout may not match even for the same type, and the document type discrimination accuracy is insufficient.

さらに、特許文献3に記載の技術では、属性項目の属性値を保存しておいて、属性値を用いて文書検索を行うが、文書種類の判別については提案されていない。   Furthermore, in the technique described in Patent Document 3, an attribute value of an attribute item is stored and a document search is performed using the attribute value. However, no document type discrimination has been proposed.

本発明は、上記事実を考慮して成されたもので、文書種別を容易に判別することを目的とする。   The present invention has been made in view of the above facts, and an object thereof is to easily determine the document type.

上記目的を達成するために請求項1に記載の文書種類判別装置は、所定の業務処理の流れに沿って発生する帳票を表す帳票データの発生順序が定められた業務処理手順を複数種類予め記憶する記憶手段と、前記記憶手段に記憶された複数種類の前記業務処理手順の中から、現在まで作成した前記帳票データの作成順序と一致または類似する前記業務処理手順を検索する検索手段と、前記検索手段の検索結果に基づいて、現在まで作成した前記帳票データに対して作成順序が前後する帳票データの種類を判別する判別手段と、を備えることを特徴としている。   In order to achieve the above object, the document type determination apparatus according to claim 1 stores in advance a plurality of types of business processing procedures in which the generation order of the form data representing the forms generated along a predetermined business processing flow is determined. Storing means, search means for searching for the business process procedure that matches or is similar to the creation order of the form data created up to now, from among a plurality of types of business process procedures stored in the storage means, And a discriminating unit that discriminates the type of the form data whose order of creation is changed with respect to the form data created up to now based on the search result of the search unit.

請求項1に記載の発明によれば、記憶手段には、所定の業務処理の流れに沿って発生する帳票を表す帳票データの発生順序が定められた業務処理手順が複数種類予め記憶される。   According to the first aspect of the present invention, the storage means stores in advance a plurality of types of business process procedures in which the generation order of the form data representing the forms generated along the flow of the predetermined business process is determined.

検索手段では、記憶手段に記憶された複数種類の業務処理手順の中から、現在まで作成した帳票データの作成順序と一致または類似する業務処理手順が検索され、判別手段では、検索手段の検索結果に基づいて、現在まで作成した帳票データに対して作成順序が前後する帳票データの種類が判別される。すなわち、現在まで作成した帳票データの作成順序を用いて、業務処理の流れが類似する業務処理手順を記憶手段から検索し、一致または類似する業務処理手順から現在まで作成した帳票の前に作成した帳票データの種類や次に作成する帳票データの種類を判別することができる。従って、帳票の作成順序を用いて帳票の種類を判別することができるので、文書種別を容易に判別することができる。   In the search means, a business process procedure that matches or resembles the creation order of the form data created up to the present is searched from a plurality of types of business process procedures stored in the storage means, and in the discrimination means, the search result of the search means Based on the above, the type of the form data whose order of creation is changed with respect to the form data created up to now is determined. In other words, using the creation order of the form data created up to now, a business process procedure with a similar business process flow is searched from the storage means, and created before the form created from the same or similar business process procedure to the present. It is possible to determine the type of form data and the type of form data to be created next. Accordingly, the form type can be determined using the form creation order, so that the document type can be easily determined.

なお、請求項2に記載の発明のように、検索手段は、現在まで作成した帳票データの作成順序と一致または類似する業務処理手順が記憶手段に複数記憶されている場合に、帳票データを更に解析して、現在まで作成した帳票データの作成順序と一致または類似する業務処理手順を検索するようにしてもよい。すなわち、帳票の作成順序が類似する業務処理手順が記憶手段に複数記憶されている場合には、帳票データを更に解析して絞り込むようにしてもよい。   As in the invention described in claim 2, the search means further stores the form data when the storage means stores a plurality of business processing procedures that match or are similar to the creation order of the form data created up to now. Analysis may be performed to search for a business process procedure that matches or resembles the creation order of the form data created up to now. That is, when a plurality of business processing procedures with similar form creation orders are stored in the storage means, the form data may be further analyzed and narrowed down.

また、請求項3に記載の発明のように、帳票を作成する毎に作成した帳票データに作成順序を識別可能な情報を付属して登録する登録手段を更に備えて、検索手段が、登録手段に登録されている帳票データの作成順序と一致または類似する業務処理手順を検索するようにしてもよい。すなわち、現在まで作成した帳票データを順番が分かるように登録しておいて、登録手段に登録された帳票の作成順序に一致または類似するものを検索手段で検索するようにしてもよい。   In addition, as in the invention described in claim 3, the registration unit further includes registration means for registering the form data created every time a form is created with information identifying the creation order, and the search means includes the registration means. It is also possible to search for a business processing procedure that matches or is similar to the creation order of the form data registered in. In other words, the form data created up to now may be registered so that the order can be understood, and the search means may search for data that matches or resembles the creation order of the forms registered in the registration means.

また、請求項4に記載の発明のように、検索手段によって検索された業務処理手順に含まれる帳票データから次に作成すべき帳票に流用可能な部分を抽出すると共に、抽出した流用部分に対応する情報を現在まで作成した帳票データから抽出する抽出手段を更に備えるようにしてもよい。これによって、抽出手段によって抽出された情報を流用して次の帳票データ等を作成することが可能となり、業務処理に沿った帳票の作成を容易にすることができる。   Further, as in the invention described in claim 4, a portion that can be diverted to the next form to be created is extracted from the form data included in the business processing procedure searched by the search means, and the extracted diversion portion is supported. Extraction means for extracting the information to be extracted from the form data created up to the present time may be further provided. As a result, it is possible to create the next form data by using the information extracted by the extracting means, and it is possible to easily create the form in accordance with the business process.

なお、抽出手段は、請求項5に記載の発明のように、流用部分に対応する情報を現在まで作成した帳票データから抽出する際に、予め制限された内容以外を抽出するようにしてもよい。すなわち、秘匿情報等を予め流用制限として設定しておくことによって、流用されては困る情報の流用を防止することが可能となる。   Note that, as in the invention described in claim 5, the extracting means may extract contents other than those previously limited when extracting information corresponding to the diverted portion from the form data created up to now. . That is, by setting secret information or the like in advance as a diversion limit, it is possible to prevent the diversion of information that is difficult to divert.

一方、請求項6に記載の文書種類判別プログラムは、コンピュータに以下の文書種類判別処理を実行させる文書種類判別プログラムであって、前記文書種類判別処理は、所定の業務処理の流れに沿って発生する帳票を表す帳票データの発生順序が定められた業務処理手順を複数種類予め記憶する記憶手段に記憶された複数種類の前記業務処理手順の中から、現在まで作成した前記帳票データの作成順序と一致または類似する前記業務処理手順を検索する検索ステップと、前記検索ステップの検索結果に基づいて、現在まで作成した前記帳票データに対して作成順序が前後する帳票データの種類を判別する判別ステップと、を含むことを特徴としている。   On the other hand, the document type determination program according to claim 6 is a document type determination program that causes a computer to execute the following document type determination process, and the document type determination process occurs in accordance with a flow of a predetermined business process. A plurality of types of business processing procedures stored in a storage means for storing in advance a plurality of types of business processing procedures in which the generation order of the form data representing the forms to be generated is created. A search step for searching for the same or similar business processing procedure; and a determination step for determining the type of form data whose order of creation is before and after the form data created so far based on the search result of the search step; It is characterized by including.

請求項6に記載の発明によれば、所定の業務処理の流れに沿って発生する帳票を表す帳票データの発生順序が定められた業務処理手順を、記憶手段に複数種類予め記憶しておく。そして、検索ステップは、記憶手段に記憶された複数種類の業務処理手順の中から、現在まで作成した帳票データの作成順序と一致または類似する業務処理手順を検索し、判別手段は、検索ステップの検索結果に基づいて、現在まで作成した帳票データに対して作成順序が前後する帳票データの種類を判別する。すなわち、現在まで作成した帳票データの作成順序を用いて、業務処理の流れが類似する業務処理手順を記憶手段から検索し、一致または類似する業務処理手順から現在まで作成した帳票の前に作成した帳票データの種類や次に作成する帳票データの種類を判別することができる。従って、帳票の作成順序を用いて帳票の種類を判別することができるので、文書種別を容易に判別することができる。   According to the sixth aspect of the present invention, a plurality of types of business process procedures in which the generation order of form data representing a form generated along a predetermined business process flow is determined are stored in the storage means in advance. The search step searches for a business process procedure that matches or is similar to the creation order of the form data created up to the present from among a plurality of types of business process procedures stored in the storage means. Based on the search result, the type of the form data whose order of creation is changed with respect to the form data created up to now is determined. In other words, using the creation order of the form data created up to now, a business process procedure with a similar business process flow is searched from the storage means, and created before the form created from the same or similar business process procedure to the present. It is possible to determine the type of form data and the type of form data to be created next. Accordingly, the form type can be determined using the form creation order, so that the document type can be easily determined.

なお、請求項7に記載の発明のように、検索ステップは、現在まで作成した帳票データの作成順序と一致または類似する業務処理手順が記憶手段に複数記憶されている場合に、帳票データを更に解析して、現在まで作成した帳票データの作成順序と一致または類似する業務処理手順を検索するようにしてもよい。すなわち、帳票の作成順序が類似する業務処理手順が記憶手段に複数記憶されている場合には、帳票データを更に解析して絞り込むようにしてもよい。   Note that, as in the invention described in claim 7, the search step further stores the form data when a plurality of business processing procedures that match or are similar to the creation order of the form data created up to now are stored in the storage means. Analysis may be performed to search for a business process procedure that matches or resembles the creation order of the form data created up to now. That is, when a plurality of business processing procedures with similar form creation orders are stored in the storage means, the form data may be further analyzed and narrowed down.

また、請求項8に記載の発明のように、帳票を作成する毎に作成した帳票データに作成順序を識別可能な情報を付属して登録する登録ステップを更に含むようにして、検索ステップが、登録ステップで登録された帳票データの作成順序と一致または類似する業務処理手順を検索するようにしてもよい。すなわち、現在まで作成した帳票データを順番が分かるように登録しておいて、登録ステップで登録された帳票の作成順序に一致または類似するものを検索ステップで検索するようにしてもよい。   In addition, as in the invention described in claim 8, the search step further includes a registration step of registering the form data created every time a form is created with information that can identify the creation order, and registering the registration step. It is also possible to search for a business process procedure that matches or resembles the creation order of the form data registered in. In other words, the form data created up to now may be registered so that the order can be understood, and the search step may search for a form that matches or resembles the creation order of the forms registered in the registration step.

また、請求項9に記載の発明のように、検索ステップで検索した業務処理手順に含まれる帳票データから次に作成すべき帳票に流用可能な部分を抽出すると共に、抽出した流用部分に対応する情報を現在まで作成した帳票データから抽出する抽出ステップを更に含むようにしてもよい。これによって、抽出ステップで抽出した情報を流用して次の帳票データ等を作成することが可能となり、業務処理に沿った帳票の作成を容易にすることができる。   Further, as in the invention described in claim 9, a portion that can be diverted to a form to be created next is extracted from the form data included in the business processing procedure searched in the search step, and corresponds to the extracted diversion part. You may make it further include the extraction step which extracts information from the form data produced until now. As a result, it is possible to create the next form data by using the information extracted in the extraction step, and it is possible to easily create the form according to the business process.

なお、抽出ステップは、請求項10に記載の発明のように、流用部分に対応する情報を現在まで作成した帳票データから抽出する際に、予め制限された内容以外を抽出するようにしてもよい。すなわち、秘匿情報等を予め流用制限として設定しておくことによって、流用されては困る情報の流用を防止することが可能となる。   In the extraction step, as in the invention described in claim 10, when information corresponding to the diverted portion is extracted from the form data created up to the present time, contents other than the previously restricted contents may be extracted. . That is, by setting secret information or the like in advance as a diversion limit, it is possible to prevent the diversion of information that is difficult to divert.

以上説明したように本発明によれば、所定の業務処理の流れに沿って発生する帳票を表す帳票データの発生順序が定められた業務処理手順を複数種類予め記憶しておいて、記憶された複数種類の業務処理手順の中から、現在まで作成した帳票データの作成順序と一致または類似する業務処理手順を検索し、検索結果に基づいて、現在まで作成した帳票データに対して作成順序が前後する帳票データの種類を判別することによって、帳票の作成順序を用いて帳票の種類を判別することができるので、文書種別を容易に判別することができる、という効果がある。   As described above, according to the present invention, a plurality of types of business process procedures in which the generation order of form data representing a form generated along a predetermined business process flow is determined are stored in advance. Search for a business process procedure that matches or resembles the creation order of the form data created up to now from multiple types of business process procedures, and based on the search results, the creation order for the form data created so far By discriminating the type of form data to be performed, the form type can be discriminated using the form creation order, so that the document type can be easily discriminated.

以下、図面を参照して本発明の実施の形態の一例を詳細に説明する。図1は、本発明の実施の形態に係わる文書種類判別装置を含む文書管理システムの概略構成を示すブロック図である。   Hereinafter, an example of an embodiment of the present invention will be described in detail with reference to the drawings. FIG. 1 is a block diagram showing a schematic configuration of a document management system including a document type discrimination device according to an embodiment of the present invention.

ビジネスシーンで帳票を扱う場合、ある程度決まった順序で帳票を作成することが多い。このある程度決まった順序で帳票を作成することをワークフローというが、本実施の形態に係わる文書管理システム10では、このワークフローを利用して、帳票の種類判別や判別補助を行うものである。   When dealing with forms in business scenes, forms are often created in a certain order. Creating a form in a certain order is called a workflow. In the document management system 10 according to the present embodiment, the type of form is determined and assistance is made using this workflow.

本発明の実施の形態に係わる文書管理システム10は、図1に示すように、複数のコンピュータ12及び本発明の文書種類判別装置としてのデータベース管理システム(以下ではDB管理システムと称す)14がネットワーク16に接続されて構成されている。   As shown in FIG. 1, a document management system 10 according to an embodiment of the present invention includes a plurality of computers 12 and a database management system (hereinafter referred to as a DB management system) 14 as a document type discrimination device of the present invention. 16 is connected.

なお、本実施の形態では、コンピュータ12をネットワーク16に複数接続したものを示すがこれに限るものではなく、コンピュータ12の代わりに、スキャナ、ファクシミリ、複写機、これらを複合した複合機、メールサーバ、画像処理装置等を接続するようにしてもよい。また、ネットワーク16は、各種ネットワークを適用することができ、各コンピュータ12及びDB管理システム14は、CPU、ROM、RAM、及びキーボードやマウス等の入力装置を備えた一般的なコンピュータを適用することができる。   In the present embodiment, a plurality of computers 12 connected to the network 16 are shown, but the present invention is not limited to this. Instead of the computer 12, a scanner, a facsimile, a copying machine, a complex machine combining these, a mail server. Alternatively, an image processing device or the like may be connected. Various networks can be applied to the network 16, and each computer 12 and the DB management system 14 can be applied to a general computer having a CPU, ROM, RAM, and input devices such as a keyboard and a mouse. Can do.

DB管理システム14には、帳票の発生する順序と共に帳票の構成ロジック(スキーマ)等をワークフローとして記憶するデータベース(以下ではDBと称す)18が接続されている。   Connected to the DB management system 14 is a database (hereinafter referred to as a DB) 18 that stores the form generation logic (schema) and the like as a workflow together with the order in which the forms are generated.

各コンピュータ12は、例えば、図1に示すように、帳票A〜Cの順で各帳票を作成する毎に、ネットワーク16及びDB管理システム14を介してDB18に各帳票を登録しながら帳票作成を行う。コンピュータ12からDB18に帳票を作成して登録する際には、DB18内の登録先(後述する所属ワークフローを識別するための情報(以下、IDと称す))と共に、帳票データをネットワーク16を介してDB管理システム14に送信することによって登録を行う。なお、各帳票は、単一のコンピュータ12で作成するようにしてもよいし、複数のコンピュータ12で順次作成するようにしてもよい。また、各コンピュータ12は、それぞれ異なる会社のコンピュータ12とすることもできる。   For example, as shown in FIG. 1, each computer 12 creates a form while registering each form in the DB 18 via the network 16 and the DB management system 14 every time the forms A to C are created. Do. When creating and registering a form in the DB 18 from the computer 12, the form data is registered via the network 16 together with a registration destination in the DB 18 (information for identifying a belonging workflow (to be described later) (hereinafter referred to as ID)). Registration is performed by transmitting to the DB management system 14. Each form may be created by a single computer 12 or sequentially by a plurality of computers 12. Further, each computer 12 may be a computer 12 of a different company.

図2は、DB管理システム14に接続されたDB18の詳細な構成の一例を示す図である。   FIG. 2 is a diagram illustrating an example of a detailed configuration of the DB 18 connected to the DB management system 14.

DB18内には、種々の業務処理等に従って発生する帳票を表す帳票データが発生順序と共に所属ワークフローとして登録される登録データ群20と、帳票のスキーマ等を含む帳票データを帳票発生順に従って予め登録した定型ワークフロー群22と、を記憶する領域を有しており、DB18は、DB管理システム14によって管理が行われる。   In the DB 18, a registered data group 20 in which form data representing forms generated in accordance with various business processes and the like is registered as a belonging workflow together with the generation order, and form data including a form schema and the like are registered in advance according to the form generation order. The standard workflow group 22 is stored, and the DB 18 is managed by the DB management system 14.

登録データ群20には、ネットワーク16に接続された各コンピュータ12で作成された帳票が作成される毎に帳票が登録される。この時、所属ワークフローを特定するためのIDに対応する所属ワークフローに対して時間情報等のログ情報を同時に記憶することによって帳票の発生順序を特定することができるようになっている。   A form is registered in the registration data group 20 every time a form created by each computer 12 connected to the network 16 is created. At this time, the generation order of the forms can be specified by simultaneously storing log information such as time information for the belonging workflow corresponding to the ID for identifying the belonging workflow.

定型ワークフロー群22には、帳票の発生順序と共に、各帳票のスキーマ等を含む帳票データが予め記憶されている。なお、定型ワークフロー群22への登録は、コンピュータ12やDB管理システム14によって行われる。また、帳票データとしては、例えば、XML(Extensible Markup Language)等の構造化文書で記述されたものを適用することができる。   The fixed form workflow group 22 stores form data including the order of the forms and the schema of each form in advance. Registration in the routine workflow group 22 is performed by the computer 12 or the DB management system 14. As the form data, for example, data described in a structured document such as XML (Extensible Markup Language) can be applied.

例えば、図2では、登録データ群20には、3つの所属ワークフローが登録されている例を示し、ID=1〜3によって各所属ワークフローを特定することができるようになっており、ID=1に対応する所属ワークフローには、帳票A、帳票B、帳票Cの順で帳票が登録され、ID=2に対応する所属ワークフローには、帳票D、帳票E、帳票F、帳票Aの順で帳票が登録され、ID=3に対応する所属ワークフローには、帳票A、帳票C、帳票Fの順で帳票が登録されている例を示す。また、定型ワークフロー群22には、5種類の帳票発生順序及びその帳票データが記憶されている例を示す。5種類の帳票発生順序からなる定型ワークフローとしては、図2では、帳票A、帳票B、帳票C、帳票Eの順のワークフロー、帳票D、帳票E、帳票F、帳票A、帳票Cの順のワークフロー、帳票A、帳票B、帳票C、帳票D、帳票Eの順のワークフロー、帳票D、帳票E、帳票F、帳票Gの順のワークフロー、帳票E、帳票C、帳票A、帳票Bの順の定型ワークフローが記憶されている例を示す。   For example, FIG. 2 shows an example in which three affiliation workflows are registered in the registration data group 20, and each affiliation workflow can be specified by ID = 1 to 3, and ID = 1. Forms A, Form B, Form C are registered in the order of the workflow corresponding to, and Form D, Form E, Form F, Form A are listed in the order of the workflow corresponding to ID = 2. Is registered, and in the belonging workflow corresponding to ID = 3, a form is registered in the order of form A, form C, and form F. In addition, the fixed workflow group 22 shows an example in which five types of form generation orders and their form data are stored. In FIG. 2, as a standard workflow composed of five types of form generation order, in the order of form A, form B, form C, form E, form D, form E, form F, form A, form C Workflow, form A, form B, form C, form D, form E, workflow in order, form D, form E, form F, form G, workflow in order, form E, form C, form A, form B An example in which a fixed workflow is stored is shown.

図3は、DB管理システム14の構成を示すブロック図である。なお、図3では、DB18の登録データ群20及び定型ワークフロー群22に登録されたデータは、図2よりも具体的な一例としたものを示す。   FIG. 3 is a block diagram showing the configuration of the DB management system 14. In FIG. 3, the data registered in the registered data group 20 and the routine workflow group 22 in the DB 18 is a more specific example than in FIG. 2.

DB管理システム14は、定型ワークフロー管理部24、登録データ管理部26、及び類似解析部28を備えている。   The DB management system 14 includes a routine workflow management unit 24, a registered data management unit 26, and a similarity analysis unit 28.

定型ワークフロー管理部24は、帳票の発生順序や帳票データをDB18の定型ワークフロー群22に予め登録する処理を行う。定型ワークフロー管理部24によるDB18への登録処理は、コンピュータ12からネットワーク16を介して登録するようにしてもよいし、DB管理システム14のキーボード等の入力装置を介して登録するようにしてもよい。   The standard workflow management unit 24 performs a process of registering in advance the form generation order and form data in the standard workflow group 22 of the DB 18. The registration process to the DB 18 by the routine workflow management unit 24 may be registered from the computer 12 via the network 16 or may be registered via an input device such as a keyboard of the DB management system 14. .

登録データ管理部26は、コンピュータ12から送信されてきたIDに対応する所属ワークフローに対して、コンピュータ12から送信されてきた帳票データを時間情報等と共に登録すると共に、これまでに登録された帳票を含む所属ワークフローを読み出して、類似解析部28へ送信する。   The registered data management unit 26 registers the form data transmitted from the computer 12 with the time information and the like for the belonging workflow corresponding to the ID transmitted from the computer 12 and also registers the forms registered so far. The affiliation workflow including it is read out and transmitted to the similarity analysis unit 28.

類似解析部28は、登録データ管理部26から送信される所属ワークフローに類似または一致する定型ワークフローを定型ワークフロー群22から検索して取得し、該当する定型ワークフローを登録データ管理部26へ出力する。詳細には、一致するワークフローがある場合には一致するワークフローを定型ワークフロー群22から読み出して登録データ管理部26へ出力し、一致するワークフローがない場合には、既知の技術のように構造化文書の構造解析や自然言語処理等を用いて定型ワークフロー群22から最も妥当なものを選択し、優先順位を付けて登録データ管理部26へ出力する。これらの処理によって、最も妥当だと思われる定型ワークフローを取得することができ、その定型ワークフローの内容から、現在扱っている帳票の種類や、次に扱われると予測される帳票の種類を推定することが可能となる。   The similarity analysis unit 28 searches for and acquires a fixed workflow similar to or belonging to the belonging workflow transmitted from the registered data management unit 26 from the fixed workflow group 22, and outputs the corresponding fixed workflow to the registered data management unit 26. More specifically, if there is a matching workflow, the matching workflow is read from the standard workflow group 22 and output to the registered data management unit 26. If there is no matching workflow, a structured document as in a known technique is obtained. The most appropriate workflow is selected from the routine workflow group 22 using structural analysis, natural language processing, and the like, prioritized, and output to the registered data management unit 26. With these processes, you can get the most appropriate fixed workflow, and estimate the type of form currently handled and the type of form that is expected to be handled next from the contents of the fixed workflow. It becomes possible.

また、類似解析部28は、所属ワークフローに類似する定型ワークフロー内において各帳票間で流用可能な部分を抽出し、抽出した流用可能部分に対応するデータを所属ワークフローから抽出することが可能とされている。これによって、次の帳票作成時等にデータを流用することが可能となる。なお、帳票間のデータを流用する際には、秘匿情報等が流用されてしまう可能性があるため、登録データ群20の所属ワークフローに作成した帳票を登録する際に、流用制限が可能なようにしてもよいし、流用可能部分を抽出する際に、予め定めたデータ内容(例えば、会社名や住所等)のみを抽出するようにしてもよい。   Further, the similarity analysis unit 28 can extract a portion that can be diverted between forms in a standard workflow similar to the belonging workflow, and can extract data corresponding to the extracted divertable portion from the belonging workflow. Yes. As a result, the data can be diverted when the next form is created. In addition, since secret information may be diverted when diverting data between forms, it is possible to restrict diversion when registering a form created in the workflow to which the registered data group 20 belongs. Alternatively, only the predetermined data contents (for example, company name, address, etc.) may be extracted when extracting the divertable portion.

続いて、上述のように構成された本発明の実施の形態に係わる文書管理システムで行われる文書種類判別について説明する。   Next, document type determination performed by the document management system according to the embodiment of the present invention configured as described above will be described.

まず始めに、DB18の定型ワークフロー群22に対して定型ワークフローを予め登録しておく。すなわち、DB18の定型ワークフロー群22に対して、どのような順序で帳票が発生するかを予め登録する。この時、帳票の発生順序と共に帳票データ等をDB18の定型ワークフロー群22に予め登録する。例えば、図3に示すように、購入申請書、納品書、検収書の順で帳票が発生するワークフロー、見積依頼書、見積書、購入申請書、納品書、検収書の順で帳票が発生するワークフロー、見積依頼書、見積書、購入申請書、稟議書、納品書の順で帳票が発生するワークフローなどを定型ワークフローとして定型ワークフロー群22に予め登録する。   First, a fixed workflow is registered in advance with respect to the fixed workflow group 22 of the DB 18. That is, the order in which forms are generated is registered in advance with respect to the routine workflow group 22 of the DB 18. At this time, the form data and the like are registered in advance in the routine workflow group 22 of the DB 18 together with the order in which the forms are generated. For example, as shown in FIG. 3, a workflow is generated in the order of purchase application form, delivery note, and receipt, and a request is generated in the order of request for quotation, estimate, purchase application, delivery note, and receipt. A workflow in which a form is generated in the order of a workflow, a request for quotation, an estimate, a purchase application, an approval document, and a delivery note is registered in advance in the fixed workflow group 22 as a fixed workflow.

そして、コンピュータ12等で作成した帳票を登録データ群22に所属ワークフローとして順次登録する。この時、DB管理システム14は、所属ワークフローに登録された帳票の順番に対応する、定型ワークフロー群22に登録された定型ワークフローを検索することによって、帳票の種類や次に作成する帳票の種類を予測判別する。   Then, the forms created by the computer 12 or the like are sequentially registered in the registration data group 22 as belonging workflows. At this time, the DB management system 14 searches the standard workflow registered in the standard workflow group 22 corresponding to the order of the forms registered in the belonging workflow, thereby determining the type of the form and the type of the form to be created next. Determine the prediction.

ここで、DB管理システム14で行われる詳細な処理について説明する。図4は、DB管理システム14で行われる処理の流れの一例を示すフローチャートである。なお、図4のフローチャートはDB管理システム14内のハードウエア処理としてもよいし、ソフトウエアー処理としてもよい。   Here, detailed processing performed in the DB management system 14 will be described. FIG. 4 is a flowchart showing an example of the flow of processing performed in the DB management system 14. Note that the flowchart of FIG. 4 may be hardware processing in the DB management system 14 or software processing.

コンピュータ12等によって帳票が作成されてネットワーク16を介してDB管理システム14に所属ワークフローを示すID及び帳票を表す帳票データが送信されて、IDに対応する所属ワークフローに帳票データの登録が指示されると、ステップ100では、コンピュータ12から送信された、所属ワークフローを示すデータ(ID)と帳票を表す帳票データが登録データ管理部26によって受信されてステップ102へ移行する。   A form is created by the computer 12 or the like, and an ID indicating the belonging workflow and form data representing the form are transmitted to the DB management system 14 via the network 16, and registration of the form data is instructed to the belonging workflow corresponding to the ID. In step 100, the data (ID) indicating the belonging workflow and the form data representing the form transmitted from the computer 12 are received by the registered data management unit 26, and the process proceeds to step 102.

ステップ102では、受信した所属ワークフローがあるか否か登録データ管理部26によって判定される。該判定は、帳票データと共に受信した所属ワークフローを識別するためのIDが登録データ群20に登録されているか否かを判定し、該判定が否定された場合にはステップ104へ移行し、肯定された場合にはステップ106へ移行する。   In step 102, the registered data management unit 26 determines whether or not there is a received affiliation workflow. The determination is made as to whether or not an ID for identifying the belonging workflow received together with the form data is registered in the registered data group 20, and if the determination is negative, the process proceeds to step 104 and affirmed. If YES, go to step 106.

ステップ104では、DB登録データ管理部26によってDB18の登録データ群20に所属ワークフローの登録スペースが確保されてステップ106へ移行する。なお、このときDB登録データ管理部26は、所属ワークフローを識別するためのIDを付与して、ネットワーク16を介して、IDをコンピュータ12に返信する。これによって、コンピュータ12側では作成した帳票を登録した所属ワークフローを特定することが可能となる。   In step 104, a registration space for the belonging workflow is secured in the registration data group 20 of the DB 18 by the DB registration data management unit 26, and the process proceeds to step 106. At this time, the DB registration data management unit 26 assigns an ID for identifying the belonging workflow, and sends the ID back to the computer 12 via the network 16. Thereby, the computer 12 side can specify the belonging workflow in which the created form is registered.

ステップ106では、DB登録データ管理部26によってDB18の登録データ群20のIDに対応する所属ワークフローに対して、登録順序が分かる情報が帳票に付属されて登録される。例えば、帳票がスキャンされた時間や作成された時間、或いはタイムスタンプ等の記録時間を登録順序が分かるログ情報として登録する。   In step 106, the DB registration data management unit 26 registers information indicating the registration order with respect to the belonging workflow corresponding to the ID of the registration data group 20 of the DB 18 along with the form. For example, a time when a form is scanned, a time when the form is created, or a recording time such as a time stamp is registered as log information indicating the registration order.

次に、ステップ108では、登録順序が分かる情報より現在の所属ワークフロー上の帳票発生順序がDB登録データ管理部26によって把握されてステップ110へ移行する。例えば、図3に示すように、IDに対応する所属ワークフローに登録された帳票が、見積依頼書、見積書、購入申請書の順のワークフローであることがDB登録データ管理部26によって把握される。   Next, at step 108, the DB registration data management unit 26 grasps the form generation order on the current affiliation workflow from the information indicating the registration order, and the process proceeds to step 110. For example, as illustrated in FIG. 3, the DB registration data management unit 26 recognizes that the form registered in the belonging workflow corresponding to the ID is a workflow in the order of a request for quotation, a quotation, and a purchase application. .

ステップ110では、所属ワークフローの帳票登録順に対応する定型ワークフローが類似解析部28によって検索されてステップ112へ移行する。すなわち、類似解析部28は、登録データ管理部26から転送される、これまでの所属ワークフローに登録されたワークフローの帳票発生順序と、一致あるいは類似する定型ワークフローを定型ワークフロー群22から検索する。   In step 110, the standard workflow corresponding to the form registration order of the belonging workflow is searched by the similarity analysis unit 28, and the process proceeds to step 112. That is, the similarity analysis unit 28 searches the fixed workflow group 22 for a fixed workflow that matches or resembles the form generation order of the workflow registered in the previous belonging workflow transferred from the registered data management unit 26.

ステップ112では、対応する定型ワークフローが単一か否か類似解析部28によって判定され、該判定が否定された場合にはステップ114へ移行し、肯定された場合にはステップ120へ移行する。なお、定型ワークフロー群22に所属ワークフローの帳票発生順序と一致または類似する定型ワークフローが全くない場合には以下の処理が実行できないので当該処理を終了する。   In step 112, the similarity analysis unit 28 determines whether or not there is only one corresponding fixed workflow. If the determination is negative, the process proceeds to step 114. If the determination is affirmative, the process proceeds to step 120. If there is no fixed workflow that matches or resembles the form generation order of the belonging workflow in the fixed workflow group 22, the following processing cannot be executed and the processing is terminated.

ステップ114では、ワークフローの構造解析で妥当な定型ワークフローが類似解析部28によって算出されてステップ116へ移行する。すなわち、既知の技術を利用して、帳票データを構造解析することによって定型ワークフロー群22内から複数の定型ワークフローのうち妥当な定型ワークフローが算出される。例えば、XML等の構造化文書のタグ名や木構造等を解析することによって、最も類似する定型ワークフローを検索する。   In step 114, the standard workflow appropriate for the workflow structure analysis is calculated by the similarity analysis unit 28, and the process proceeds to step 116. That is, by using a known technique to analyze the structure of the form data, an appropriate standard workflow among a plurality of standard workflows is calculated from the standard workflow group 22. For example, the most similar fixed workflow is searched by analyzing the tag name and tree structure of a structured document such as XML.

ステップ116では、対応する定型ワークフローが単一か否か類似解析部28によって判定され、該判定が否定された場合にはステップ118へ移行し、肯定された場合にはステップ120へ移行する。   In step 116, the similarity analysis unit 28 determines whether or not there is only one corresponding fixed workflow. If the determination is negative, the process proceeds to step 118. If the determination is affirmative, the process proceeds to step 120.

ステップ118では、ワークフローの構成要素が類似解析部28によって解析され、妥当な定型ワークフローが判別されてステップ120へ移行する。すなわち、自然言語処理等の既知の技術を用いて、ワークフロー内の各帳票の構成要素を解析して類似する定型ワークフローを妥当な定型ワークフローとして判別する。例えば、文字列の並び等を解析することによって、最も類似する定型ワークフローを検索する。   In step 118, the components of the workflow are analyzed by the similarity analysis unit 28, an appropriate routine workflow is determined, and the process proceeds to step 120. That is, using a known technique such as natural language processing, the constituent elements of each form in the workflow are analyzed, and similar fixed workflows are determined as appropriate fixed workflows. For example, the most similar fixed workflow is searched by analyzing the arrangement of character strings.

ステップ120では、妥当な定型ワークフローとして判別した定型ワークフローから帳票の種類や次帳票の種類が類似解析部28によって判別されてステップ122へ移行し、次の帳票に流用可能なデータが類似解析部28によって抽出される。例えば、類似解析部28によって判別した定型ワークフロー内の各帳票から流用可能な部分を抽出すると共に、当該流用可能部分に対応するデータを登録データ群20の所属ワークフローに既に登録されている帳票から抽出する。なお、ステップ114やステップ118によって類似する定型ワークフローを絞り込んでも1つに絞り込めない場合は、コンピュータ12に絞り込んだ全ての定型ワークフローを送信して、コンピュータ12側で選択させた後に、ステップ120以降を実行するようにしてもよい。   In step 120, the type of form or the type of the next form is determined by the similarity analysis unit 28 from the standard workflow determined as an appropriate standard workflow, and the process proceeds to step 122. Data that can be used for the next form is converted to the similarity analysis unit 28. Extracted by For example, a portion that can be diverted is extracted from each form in the standard workflow determined by the similarity analysis unit 28, and data corresponding to the portion that can be diverted is extracted from a form already registered in the workflow to which the registered data group 20 belongs. To do. If it is not possible to narrow down the similar standard workflows in step 114 or step 118, all the standard workflows narrowed down to the computer 12 are transmitted and selected on the computer 12 side. May be executed.

そして、ステップ124では、ステップ120で判別した次の帳票の種類(スキーマ等の構造データを含む)及びステップ122で抽出した流用可能なデータが登録データ管理部26によって出力されて一連の処理を終了する。なお、次の帳票の種類や流用可能なデータの出力は、ネットワーク16を介して次の帳票を作成するコンピュータ12等の要求に応じて出力するようにしてもよいし、DB管理システム14内に所属ワークフローに次に登録されるべき帳票を作成するために必要なデータとして保存するようにしてもよい。   In step 124, the type of the next form determined in step 120 (including structure data such as a schema) and the divertable data extracted in step 122 are output by the registered data management unit 26, and the series of processing ends. To do. Note that the type of the next form and the divertable data may be output in response to a request from the computer 12 or the like that creates the next form via the network 16, or within the DB management system 14. You may make it preserve | save as data required in order to produce the form which should be registered into an affiliated workflow next.

すなわち、本実施の形態では、所定の業務処理の流れに沿って発生する帳票を表す帳票データの発生順序が定められたワークフローを複数種類予め定型ワークフローとして記憶しておいて、記憶された複数種類の定型ワークフローの中から、現在まで作成した所属ワークフローと一致または類似する定型ワークフローを検索し、検索結果に基づいて、現在まで作成した帳票データに対して作成順序が前後する帳票データの種類を判別することによって、帳票の作成順序を用いて作成した帳票の前後の帳票の種類を判別することができるので、文書種別を容易に判別することができる
また、流用可能な部分を抽出するようにしたので、次の帳票作成時に流用することができ、帳票のスキーマ等の構成ロジックをワークフロー内で自然に統一することが可能となる。
That is, in this embodiment, a plurality of types of workflows in which the generation order of the form data representing the forms generated along a predetermined business process flow is determined are stored in advance as standard workflows. Search for a workflow that matches or resembles the workflow that you have created so far, and determine the type of report data whose order of creation is different for the report data created so far, based on the search results By doing so, it is possible to determine the type of the form before and after the form created using the form creation order, so the document type can be easily identified. Also, the divertable part is extracted. Therefore, it can be used when creating the next form, and the structure logic such as the form schema is naturally unified in the workflow. It becomes possible.

なお、上記の実施の形態では、コンピュータ12で作成した帳票データをネットワーク16を介してDB管理システム14に送信して、DB管理システム14がDB18の登録データ群20に登録するようにしたが、これに限るものではなく、例えば、コンピュータ12で作成した帳票データを次に帳票を作成するコンピュータ12に対して作成順序が分かる情報と共に順次送信するようにして、帳票を作成する際にコンピュータ12が現在までのワークフローをDB管理システム14に送信することで、DB管理システム14が類似する定型ワークフローを検索すると共に、次に作成する帳票に流用可能な情報を抽出してコンピュータ12に返信するようにしてもよい。   In the above embodiment, the form data created by the computer 12 is transmitted to the DB management system 14 via the network 16 so that the DB management system 14 registers it in the registration data group 20 of the DB 18. However, the present invention is not limited to this. For example, when the form 12 is created by sending the form data created by the computer 12 together with information indicating the creation order to the computer 12 that creates the form next, the computer 12 creates the form. By sending the workflow up to now to the DB management system 14, the DB management system 14 searches for a similar standard workflow, extracts information that can be used for the next form to be created, and sends it back to the computer 12. May be.

また、上記の実施の形態で取り扱う帳票等は、例えば、XML(Extensible Markup Language)等の構造化文書で記述された帳票が好ましいが、他の言語を用いることも可能である。   In addition, the form and the like handled in the above embodiment is preferably a form described in a structured document such as XML (Extensible Markup Language), but other languages can also be used.

本発明の実施の形態に係わる文書種類判別装置を含む文書管理システムの概略構成を示すブロック図である。1 is a block diagram showing a schematic configuration of a document management system including a document type discrimination device according to an embodiment of the present invention. DB管理システムに接続されたDBの詳細な構成の一例を示す図である。It is a figure which shows an example of the detailed structure of DB connected to DB management system. DB管理システムの構成を示すブロック図である。It is a block diagram which shows the structure of DB management system. DB管理システムで行われる処理の流れの一例を示すフローチャートである。It is a flowchart which shows an example of the flow of the process performed in DB management system.

符号の説明Explanation of symbols

10 文書管理システム
12 コンピュータ
14 DB管理システム
16 ネットワーク
18 DB
20 登録データ群
22 定型ワークフロー群
24 定型ワークフロー管理部
26 登録データ管理部
28 類似解析部
10 Document Management System 12 Computer 14 DB Management System 16 Network 18 DB
20 registration data group 22 routine workflow group 24 routine workflow management unit 26 registration data management unit 28 similarity analysis unit

Claims (10)

所定の業務処理の流れに沿って発生する帳票を表す帳票データの発生順序が定められた業務処理手順を複数種類予め記憶する記憶手段と、
前記記憶手段に記憶された複数種類の前記業務処理手順の中から、現在まで作成した前記帳票データの作成順序と一致または類似する前記業務処理手順を検索する検索手段と、
前記検索手段の検索結果に基づいて、現在まで作成した前記帳票データに対して作成順序が前後する帳票データの種類を判別する判別手段と、
を備えた文書種類判別装置。
Storage means for storing in advance a plurality of types of business process procedures in which the generation order of form data representing a form generated along a predetermined business process flow is determined;
Search means for searching for the business process procedure that matches or is similar to the creation order of the form data created up to the present from among a plurality of types of the business process procedures stored in the storage means;
A discriminating unit that discriminates the type of form data whose order of creation is around for the form data created up to now based on the search result of the search unit;
A document type discrimination device.
前記検索手段は、現在まで作成した前記帳票データの作成順序と一致または類似する前記業務処理手順が前記記憶手段に複数記憶されている場合に、前記帳票データを更に解析して、現在まで作成した前記帳票データの作成順序と一致または類似する前記業務処理手順を検索することを特徴とする請求項1に記載の文書種類判別装置。   The search means further analyzes the form data and creates it up to the present when a plurality of business processing procedures that match or are similar to the creation order of the form data created up to now are stored in the storage means The document type determination apparatus according to claim 1, wherein the task processing procedure that matches or resembles the creation order of the form data is searched. 帳票を作成する毎に作成した前記帳票データに作成順序を識別可能な情報を付属して登録する登録手段を更に備え、前記検索手段は、前記登録手段に登録されている前記帳票データの作成順序と一致または類似する前記業務処理手順を検索することを特徴とする請求項1又は請求項2に記載の文書種類判別装置。   A registration means for registering the form data created each time a form is created with information identifying the creation order attached thereto; and the search means creates the form data created in the registration means The document type determination apparatus according to claim 1, wherein the job processing procedure that matches or resembles the job processing procedure is searched. 前記検索手段によって検索された前記業務処理手順に含まれる帳票データから次に作成すべき帳票に流用可能な流用部分を抽出すると共に、前記流用部分に対応する情報を現在まで作成した前記帳票データから抽出する抽出手段を更に備えることを特徴とする請求項1乃至請求項3の何れか1項に記載の文書種類判別装置。   Extracting the diversion part that can be diverted to the next form to be created from the form data included in the business processing procedure searched by the search means, and the information corresponding to the diversion part from the form data created up to the present The document type discrimination device according to any one of claims 1 to 3, further comprising extraction means for extracting. 前記抽出手段は、前記流用部分に対応する情報を現在まで作成した帳票データから抽出する際に、予め制限された内容以外を抽出することを特徴とする請求項4に記載の文書種類判別装置。   5. The document type determination apparatus according to claim 4, wherein the extraction unit extracts information other than a previously restricted content when extracting information corresponding to the diverted part from form data created up to now. コンピュータに以下の文書種類判別処理を実行させる文書種類判別プログラムであって、
前記文書種類判別処理は、
所定の業務処理の流れに沿って発生する帳票を表す帳票データの発生順序が定められた業務処理手順を複数種類予め記憶する記憶手段に記憶された複数種類の前記業務処理手順の中から、現在まで作成した前記帳票データの作成順序と一致または類似する前記業務処理手順を検索する検索ステップと、
前記検索ステップの検索結果に基づいて、現在まで作成した前記帳票データに対して作成順序が前後する帳票データの種類を判別する判別ステップと、
を含むことを特徴とする文書種類判別プログラム。
A document type discrimination program for causing a computer to execute the following document type discrimination process,
The document type determination process includes:
From among a plurality of types of business processing procedures stored in a storage means that stores in advance a plurality of types of business processing procedures in which the order of generation of form data representing a form generated in accordance with a predetermined business processing flow is determined. A search step for searching for the business process procedure that matches or is similar to the creation order of the form data created up to
Based on the search result of the search step, a determination step of determining the type of form data whose order of creation is around the form data created up to now,
A document type discriminating program comprising:
前記検索ステップは、現在まで作成した前記帳票データの作成順序と一致または類似する前記業務処理手順が前記記憶手段に複数記憶されている場合に、前記帳票データを更に解析して、現在まで作成した前記帳票データの作成順序と一致または類似する前記業務処理手順を検索することを特徴とする請求項6に記載の文書種類判別プログラム。   In the search step, when a plurality of the business processing procedures that match or are similar to the creation order of the form data created up to now are stored in the storage means, the form data is further analyzed and created up to the present The document type determination program according to claim 6, wherein the job processing procedure that matches or resembles the creation order of the form data is searched. 帳票を作成する毎に作成した前記帳票データに作成順序を識別可能な情報を付属して登録する登録ステップを更に含み、前記検索ステップは、前記登録ステップで登録されている前記帳票データの作成順序と一致または類似する前記業務処理手順を検索することを特徴とする請求項6又は請求項7に記載の文書種類判別プログラム。   A registration step of registering the form data created each time a form is attached with information identifying the creation order is further included, and the search step includes the creation order of the form data registered in the registration step. The document type determination program according to claim 6 or 7, wherein the job processing procedure that matches or resembles the job search procedure is searched. 前記検索ステップで検索された前記業務処理手順に含まれる帳票データから次に作成すべき帳票に流用可能な流用部分を抽出すると共に、前記流用部分に対応する情報を現在まで作成した前記帳票データから抽出する抽出ステップを更に含むことを特徴とする請求項6乃至請求項8の何れか1項に記載の文書種類判別プログラム。   Extracting the diversion part that can be diverted to the next form to be created from the form data included in the business processing procedure searched in the search step, and the information corresponding to the diversion part from the form data created up to the present The document type determination program according to claim 6, further comprising an extraction step of extracting. 前記抽出ステップは、前記流用部分に対応する情報を現在まで作成した帳票データから抽出する際に、予め制限された内容以外を抽出することを特徴とする請求項9に記載の文書種類判別プログラム。   10. The document type determination program according to claim 9, wherein, in the extraction step, when information corresponding to the diverted portion is extracted from the form data created up to the present time, contents other than those previously limited are extracted.
JP2006221634A 2006-08-15 2006-08-15 Document type determination device, and document type determination program Withdrawn JP2008046850A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006221634A JP2008046850A (en) 2006-08-15 2006-08-15 Document type determination device, and document type determination program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006221634A JP2008046850A (en) 2006-08-15 2006-08-15 Document type determination device, and document type determination program

Publications (1)

Publication Number Publication Date
JP2008046850A true JP2008046850A (en) 2008-02-28

Family

ID=39180542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006221634A Withdrawn JP2008046850A (en) 2006-08-15 2006-08-15 Document type determination device, and document type determination program

Country Status (1)

Country Link
JP (1) JP2008046850A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012243268A (en) * 2011-05-24 2012-12-10 Nec Corp Business flow retrieval device, business flow retrieval method and program
CN102902739A (en) * 2012-09-13 2013-01-30 杭州电子科技大学 Workflow flow construction method for uncertain data sources under cloud computing environment

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012243268A (en) * 2011-05-24 2012-12-10 Nec Corp Business flow retrieval device, business flow retrieval method and program
CN102902739A (en) * 2012-09-13 2013-01-30 杭州电子科技大学 Workflow flow construction method for uncertain data sources under cloud computing environment
CN102902739B (en) * 2012-09-13 2015-09-02 杭州电子科技大学 Towards the workflow view building method in uncertain data source under cloud computing environment

Similar Documents

Publication Publication Date Title
US7991709B2 (en) Method and apparatus for structuring documents utilizing recognition of an ordered sequence of identifiers
US9372721B2 (en) System for processing data received from various data sources
US20160239504A1 (en) Method for entity enrichment of digital content to enable advanced search functionality in content management systems
US9025890B2 (en) Information classification device, information classification method, and information classification program
JP2005018678A (en) Form data input processing device, form data input processing method, and program
KR20130095171A (en) Forensic system and forensic method, and forensic program
KR20120051419A (en) Apparatus and method for extracting cascading style sheet
JP2012198684A (en) Information processing device, business form type estimation method, and business form type estimation program
US20120046937A1 (en) Semantic classification of variable data campaign information
US8180799B1 (en) Dynamically creating tables to store received data
US20070185832A1 (en) Managing tasks for multiple file types
CN110188207B (en) Knowledge graph construction method and device, readable storage medium and electronic equipment
JPH11184894A (en) Method for extracting logical element and record medium
US20210295033A1 (en) Information processing apparatus and non-transitory computer readable medium
JP2011065255A (en) Data processing apparatus, data name generation method and computer program
JP4811133B2 (en) Image forming apparatus and image processing apparatus
JP7272037B2 (en) Information processing device and program
JP2008046850A (en) Document type determination device, and document type determination program
US20050154703A1 (en) Information partitioning apparatus, information partitioning method and information partitioning program
TWI793432B (en) Document management method and system for engineering project
JP2006227914A (en) Information search device, information search method, program and storage medium
CN114743012A (en) Text recognition method and device
CN114417860A (en) Information detection method, device and equipment
JP5217513B2 (en) An information analysis processing method, an information analysis processing program, an information analysis processing device, an information registration processing method, an information registration processing program, an information registration processing device, an information registration analysis processing method, and an information registration analysis processing program.
JP2008123423A (en) Audit system for storing/retrieving telegram data, audit method for storing/retrieving telegram data, and audit program for storing/retrieving telegram data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090212

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20100712