JP5339657B2 - Document registration system, method, program, and storage medium - Google Patents

Document registration system, method, program, and storage medium Download PDF

Info

Publication number
JP5339657B2
JP5339657B2 JP2001275067A JP2001275067A JP5339657B2 JP 5339657 B2 JP5339657 B2 JP 5339657B2 JP 2001275067 A JP2001275067 A JP 2001275067A JP 2001275067 A JP2001275067 A JP 2001275067A JP 5339657 B2 JP5339657 B2 JP 5339657B2
Authority
JP
Japan
Prior art keywords
document
index
worksheet
area
registration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001275067A
Other languages
Japanese (ja)
Other versions
JP2003085187A (en
Inventor
雅史 矢原
知史 吉田
伸治 戸高
直之 松本
康徳 佐竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2001275067A priority Critical patent/JP5339657B2/en
Publication of JP2003085187A publication Critical patent/JP2003085187A/en
Application granted granted Critical
Publication of JP5339657B2 publication Critical patent/JP5339657B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

PROBLEM TO BE SOLVED: To solve a problem wherein a user must index document images by looking at the document images each time, and easily causes an input error when a plurality of input document images have different forms. SOLUTION: This invention discriminates the forms coincident with the respective document images even when inputting the document images having a plurality of different forms, and automatically indexes and registers the respective document images on the basis of an area set in the coincident forms.

Description

本発明は、複数の画像データにインデックスをつけて文書管理部へ登録する文書登録システム、方法、プログラム及び記憶媒体に関するものである。  The present invention relates to a document registration system, method, program, and storage medium for indexing a plurality of image data and registering them in a document management unit.

従来の文書登録システムは、スキャナから読み取った入力画像を、一旦画面上に表示し、ユーザはその画面を見ながら手動でインデックスを付加して、該入力画像とともに文書管理部に登録するものであった。  In a conventional document registration system, an input image read from a scanner is once displayed on a screen, and a user manually adds an index while viewing the screen and registers the input image together with the input image in a document management unit. It was.

発明が解決しようとする課題Problems to be solved by the invention

しかしながら、入力される文書画像とそのフォーム種類が増えてくると、ユーザは、文書画像のどの位置を見てインデックスとして取り出せばいいのか、判断するのに非常に労力がかかり、また、インデックス情報の入力ミスも増えてくるという問題点があった。  However, as the number of input document images and types of forms increases, the user takes a lot of effort to determine which position in the document image should be taken out as an index. There was a problem that input errors also increased.

課題を解決するための手段Means for solving the problem

【課題を解決するための手段】
上記課題を解決するために、本発明の文書登録システムは、文書画像にインデックスをつけて管理する文書管理部に対して、ネットワークを介して接続された文書登録システムであって、それぞれにエリアが設定される複数の異なるフォームを格納するフォーム格納手段と、前記文書管理部のインデックス構造を取得し、当該取得したインデックス構造に基づいて、入力された文書画像に関する情報とインデックス項目とを有するワークシートを作成するための、テンプレートを作成するテンプレート作成手段と、前記テンプレートから、前記文書管理部に複数の文書画像とインデックス情報とを一括して登録する際に使用するための、入力された文書画像に関する情報とインデックス項目とを有するワークシートを作成するワークシート作成手段と、複数の異なるフォームそれぞれについて、該フォームのエリアに、そのエリアから抽出されるインデックス情報が入力される前記ワークシートのインデックス項目を設定するエリア設定手段と、入力された複数の文書画像それぞれに対して、一致するフォームを識別するフォーム識別手段と、前記複数の文書画像それぞれに一致するフォームに設定されているエリアに基づいて、該文書画像それぞれのインデックス情報を抽出して、該エリアに対応付けられているインデックス項目に基づき、前記ワークシートにおける該文書画像それぞれのインデックス項目に該文書画像それぞれのインデックス情報を入力するインデックス情報抽出手段と、前記ワークシートで管理されている前記入力された複数の文書画像と、該文書画像それぞれのインデックス情報とを、前記ネットワークを介して接続されている前記文書管理部に一括して登録する登録手段とを有することを特徴とする。
[Means for Solving the Problems]
In order to solve the above problems, a document registration system according to the present invention is a document registration system that is connected via a network to a document management unit that indexes and manages document images, each having an area. Form storage means for storing a plurality of different forms to be set, an index structure of the document management unit, and a worksheet having information and index items relating to the input document image based on the acquired index structure A template creation means for creating a template , and an input document image used for collectively registering a plurality of document images and index information from the template to the document management unit worksheet work to create a worksheet with the information and the index item on Means, for each of a plurality of different forms, to the said form area, and area setting means for setting an index item of the worksheet index information extracted from the area is input, a plurality of document images respectively inputted On the other hand, based on the form identifying means for identifying the matching form and the area set in the form matching each of the plurality of document images, the index information of each document image is extracted, Index information extracting means for inputting the index information of each document image to the index item of each document image in the worksheet based on the associated index item, and the input managed by the worksheet Multiple document images and the document images Les and the index information, and having a registration means for registering at once in the document management unit that is connected via the network.

図1は、本実施形態におけるシステム構成図を示す。  FIG. 1 shows a system configuration diagram in the present embodiment.

ここでは、ネットワーク上に、ユーザ端末(100、101、102)、ファックス・スキャナ・プリンタ・コピー機能を有するMFP(マルチファンクションペリフェラル)(110)、文書登録システム(120)、ファイルサーバ(130)、文書管理システム(140)が接続されている。  Here, on a network, a user terminal (100, 101, 102), an MFP (multifunction peripheral) (110) having a fax / scanner / printer / copy function, a document registration system (120), a file server (130), A document management system (140) is connected.

各ユーザ端末は、ファイルサーバ130、文書管理システム140を用いて、各種文書の共有を図っている。文書の種類としては、一般的な文書作成アプリケーションによって作成される文書、スキャナで読みこまれた文書、ファクス受信された文書等各種混在している。  Each user terminal uses the file server 130 and the document management system 140 to share various documents. There are various types of documents such as a document created by a general document creation application, a document read by a scanner, and a document received by fax.

また、本実施形態では、文書入力デバイスとして、複数の機能を有するMFP110を用いることとしたが、MFPの代わりにスキャナ装置やファクシミリ装置など、単機能のデバイスであってもよい。  In this embodiment, the MFP 110 having a plurality of functions is used as the document input device. However, a single-function device such as a scanner device or a facsimile device may be used instead of the MFP.

ファイルサーバ130は、一時的に格納される文書を中心に管理する。例えば、MFP110のスキャナ部で読み取った文書画像を一時的に格納して、ユーザ端末や文書登録システム120が該文書画像を取得することができる。  The file server 130 manages mainly documents stored temporarily. For example, a document image read by the scanner unit of the MFP 110 can be temporarily stored, and the user terminal or the document registration system 120 can acquire the document image.

文書管理システム140では、長期に渡って保存が必要な文書を中心に管理するもので、文書登録システムから送信された文書をインデックスとともに格納し、ユーザ端末から所望の文書を送信するよう依頼された場合、インデックス等に基いて該文書を検索して送信できるようになっている。また、文書管理システムでは、1つの文書に対して複数のインデックスをつけることができ、また、これら複数のインデックスは、インデックス項目毎に分類されて管理されている。なお、本実施形態では、文書管理システム140は1台の文書管理装置で構成されるものとするが、複数の機器の組合せで構成されるようにしても良い。また、文書管理システム140が複数存在するようにしてもよい。  The document management system 140 mainly manages documents that need to be stored for a long period of time. The document transmitted from the document registration system is stored together with an index, and a user terminal is requested to transmit a desired document. In this case, the document can be searched and transmitted based on an index or the like. In the document management system, a plurality of indexes can be attached to one document, and the plurality of indexes are classified and managed for each index item. In the present embodiment, the document management system 140 is configured by a single document management apparatus, but may be configured by a combination of a plurality of devices. A plurality of document management systems 140 may exist.

文書登録システム120は、MFP110やユーザ端末で生成される文書(ファックス受信文書画像、スキャナ読取文書画像等)や、ファイルサーバに格納されている文書を、自動的もしくは手動で指定して取得し、該文書を取得した時の情報や該文書を解析して得られる情報をもとに該文書のインデックス(属性情報・検索情報)を自動的に作成して、該文書とインデックスとを一緒にして文書管理システム140(の所望のディレクトリ)に登録する機能を有する。また、ユーザが手入力した各種インデックスを付加して文書管理システムに文書を登録させる機能や、すでに文書管理システムに登録された文書の属性情報等を再編集できる機能等も有している。なお、本実施形態では、文書登録システム120は1台の文書登録装置で構成されるものとするが、複数の機器の組合せで構成されるようにしてもよい。また、複数人のユーザでインデックス付けや確認などの作業が行えるように、複数台の文書登録装置を用い、各装置毎に処理を行う権限を与えて、複数台の文書登録装置で協調処理を行うことで文書登録システムを構成するようにしてもよい。  The document registration system 120 automatically or manually specifies and acquires a document (fax received document image, scanner-read document image, etc.) generated by the MFP 110 or a user terminal, or a document stored in a file server. An index (attribute information / search information) of the document is automatically created based on information obtained when the document is acquired or information obtained by analyzing the document, and the document and the index are combined. It has a function of registering in the document management system 140 (desired directory). In addition, it has a function of adding various indexes manually entered by the user and registering the document in the document management system, a function of re-editing attribute information of the document already registered in the document management system, and the like. In the present embodiment, the document registration system 120 is configured by a single document registration apparatus, but may be configured by a combination of a plurality of devices. In addition, using multiple document registration devices and giving authority to perform processing for each device so that multiple users can perform indexing and confirmation operations, etc., coordinate processing with multiple document registration devices By doing so, the document registration system may be configured.

なお、本実施形態では、文書登録装置は、実際の処理演算を行うCPU、プログラムを読み込んでワークエリアとして用いるRAM、後述するフローチャートに対応する処理を実行するためのプログラムや各種データを格納するための記憶媒体(ハードディスク、ROM、リムーバブルディスク(フロッピーディスク、CD−ROM等)など)、各種操作を行うためのキーボードやポインティングデバイス、処理対象の文書等を表示するためのディスプレイ、ネットワークと接続するためのネットワークインターフェースなどで構成されるコンピュータである。CPUに実行させるための該プログラムは、前記記憶媒体から供給されるものであってもよいし、ネットワークを介して外部装置から読み込むものであってもよい。なお、本実施形態はコンピュータがプログラムを実行することにより実現するものとするが、その一部又は全てをハードウェアで構成するようにしても構わない。  In the present embodiment, the document registration apparatus stores a CPU that performs actual processing operations, a RAM that reads a program and uses it as a work area, a program for executing processing corresponding to a flowchart to be described later, and various data. Storage media (hard disk, ROM, removable disk (floppy disk, CD-ROM, etc.)), keyboard and pointing device for performing various operations, display for displaying documents to be processed, and network connection It is a computer configured with a network interface. The program to be executed by the CPU may be supplied from the storage medium or may be read from an external device via a network. In addition, although this embodiment shall be implement | achieved when a computer runs a program, you may make it comprise the one part or all by hardware.

図2は、文書登録システム120の構造を示すブロック図である。  FIG. 2 is a block diagram showing the structure of the document registration system 120.

<文書登録システムへの文書入力処理>
まず、文書登録システム120への文書入力処理(文書登録システムによる文書取得処理)について説明する。
<Document input processing to the document registration system>
First, document input processing to the document registration system 120 (document acquisition processing by the document registration system) will be described.

デバイス制御部210は、ファックス機能やスキャナ機能などを有するデバイス(MFP)110から文書データを得て後段の処理に入力する。なお、デバイス制御部210では、デバイスを定期的に監視するなどして文書データを吸い上げたり、デバイス側からプッシュ式で送信される文書データを受信したりする処理がなされる。  The device control unit 210 obtains document data from a device (MFP) 110 having a fax function, a scanner function, and the like, and inputs it to subsequent processing. Note that the device control unit 210 performs processing to download document data by periodically monitoring the device or to receive document data transmitted by the push method from the device side.

130はファイルサーバ等における文書が格納されたフォルダ(記憶装置)であり、フォルダ制御部212は該ファイルサーバのフォルダ内の文書データを取得する。例えば、フォルダ制御部212は、ファイルサーバの所定のフォルダを定期的に監視して、新しい文書がある場合に該文書の取得処理などを行う。  Reference numeral 130 denotes a folder (storage device) in which a document in a file server or the like is stored, and the folder control unit 212 acquires document data in the folder of the file server. For example, the folder control unit 212 periodically monitors a predetermined folder on the file server, and performs processing for acquiring the document when there is a new document.

201は本システムにおける操作部となっており、各種システムの設定、操作を行えるようになっており、さらに、文書登録システムを操作するユーザが文書を指定することにより、ユーザ端末やファイルサーバなどから文書データをインポート(取得)して、ファイル制御部214を介して、該手動指定で取得した文書データの入力処理をすることができるようになっている。  Reference numeral 201 denotes an operation unit in this system, which can set and operate various systems. Further, when a user operating the document registration system designates a document, the user terminal or file server can be used. The document data can be imported (acquired), and input processing of the document data acquired by the manual designation can be performed via the file control unit 214.

220は入力制御部であり、デバイス制御部210、フォルダ制御部212、ファイル制御部214などからの入力を統括制御できるようになっている。  An input control unit 220 can control the input from the device control unit 210, the folder control unit 212, the file control unit 214, and the like.

<文書登録システムの内部処理>
次に、文書登録システム内の処理について説明する。
221は、ジョブ制御部であり、後述するジョブに関する制御を行う。
222は、文書データ処理部であり、画像フォーマット変換処理等を行う。
223は、インデックス処理部であり、後述するインデックス処理に関する制御を行う。
224は、データ管理部であり、後述するテンプレート、ワークシート、ジョブ等に関するデータを250のデータ記憶エリアに保存、管理する。
225は、OCR制御部であり、辞書データ251を用いて文字認識を行う。
226は、フォーム(帳票)解析部であり、登録フォームデータ252を用いて、各種フォーム、例えば帳票ファーマットを自動的に識別できるようになっている。
240は、メール処理部であり、主に、自動的に文書を取得して登録処理を行うようにしている場合に、該自動処理が行われると、あらかじめ登録された宛て先にその結果を通知するために使用される。
<Internal processing of document registration system>
Next, processing in the document registration system will be described.
Reference numeral 221 denotes a job control unit that performs control related to a job to be described later.
A document data processing unit 222 performs an image format conversion process and the like.
Reference numeral 223 denotes an index processing unit that performs control related to index processing to be described later.
A data management unit 224 saves and manages data on templates, worksheets, jobs, and the like, which will be described later, in a data storage area 250.
Reference numeral 225 denotes an OCR control unit that performs character recognition using the dictionary data 251.
A form (form) analysis unit 226 can automatically identify various forms such as a form format using the registered form data 252.
Reference numeral 240 denotes a mail processing unit. When the automatic processing is performed when the document is automatically acquired and the registration processing is performed, the result is notified to a destination registered in advance. Used to do.

<文書登録システムにおける文書管理システムへのアクセス処理>
続いて、文書登録システムにおける文書管理システムとのインターフェースについて説明する。
<Access processing to the document management system in the document registration system>
Next, an interface with the document management system in the document registration system will be described.

227は、文書管理システム制御部であり、文書管理システム140の種類に応じて提供されているアクセス制御部230を介して、文書及びインデックスの登録や、すでに文書管理システムに登録されている文書のインデックス変更などの処理を行う。  Reference numeral 227 denotes a document management system control unit, which registers documents and indexes, and documents already registered in the document management system via the access control unit 230 provided according to the type of the document management system 140. Perform processing such as index change.

253は、文書管理システムにアクセスするにあたって必要なアクセスデータを格納するデータベースであり、254は、文書管理システムへ登録するデータを一時的に保存するデータエリアであり、文書登録時に、所定の画像変換等の文書データ処理が必要な場合、このエリアをバッファとして使用する。  A database 253 stores access data necessary for accessing the document management system. A data area 254 temporarily stores data to be registered in the document management system. This area is used as a buffer when document data processing is required.

<<文書登録システムの基本フロー(図3)>>
図3は、文書登録システム120における基本フロー図である。
<< Basic Flow of Document Registration System (Fig. 3) >>
FIG. 3 is a basic flowchart in the document registration system 120.

まず、手動で文書(画像)を取得し、その後、インデックス(属性情報)の入力を行い、その文書とインデックスを文書管理システムに登録する際の処理フローを説明する。  First, a processing flow when a document (image) is manually acquired, an index (attribute information) is input, and the document and the index are registered in the document management system will be described.

ステップS100で、文書管理システムのデータベースのインデックス構造を取得して、該インデックス構造からワークシートを作成するためのテンプレート(雛型)を作成する。このテンプレートには、該文書管理システムへのアクセス情報と、インデックス構造から作成されたスキーマ情報(インデックスとして用いることができる項目情報)とが含まれている。テンプレート作成処理の詳細は、図4を用いて後述する。  In step S100, the index structure of the database of the document management system is acquired, and a template (model) for creating a worksheet is created from the index structure. This template includes access information to the document management system and schema information (item information that can be used as an index) created from the index structure. Details of the template creation processing will be described later with reference to FIG.

ステップS101では、テンプレートからワークシートを作成する。この作成処理は図5に詳述する。このワークシートにおいて、実際にインデックス情報の登録を行うフィールド(項目)等を設定する。また、本実施形態においては、取得した文書の管理、文書に対して付加するインデックス情報等は、このワークシート単位で(管理テーブルとして)一連の処理が実行、管理されるようになっている。なお、ここではステップS100で作成されたテンプレートからワークシートを作成することとするが、ステップS100を省略して予め作成・保存されているテンプレートを選択し、選択されたテンプレートからワークシートを作成するようにしてもよい。  In step S101, a worksheet is created from the template. This creation process is described in detail in FIG. In this worksheet, fields (items) and the like for actually registering index information are set. In the present embodiment, management of acquired documents, index information added to the documents, and the like are performed and managed in a series of processes (as a management table) in units of the worksheets. In this example, a worksheet is created from the template created in step S100. However, step S100 is omitted, a template created and stored in advance is selected, and a worksheet is created from the selected template. You may do it.

また、既に作成・登録されているワークシートを選択して、そのワークシートに文書情報とインデックス情報とを入力することも可能である。この場合、ステップS110で、データエリア250に格納されているワークシートの中からユーザによって選択されたワークシートを取り出し、ステップS102に進む。  It is also possible to select a worksheet that has already been created / registered and input document information and index information to the worksheet. In this case, in step S110, the worksheet selected by the user is extracted from the worksheets stored in the data area 250, and the process proceeds to step S102.

ステップS102では、ステップS101で作成されたワークシート、もしくはステップS110で選択されたワークシートをディスプレイに表示させる。  In step S102, the worksheet created in step S101 or the worksheet selected in step S110 is displayed on the display.

ステップS103で、デバイスから取得した文書を入力する。  In step S103, the document acquired from the device is input.

ステップS104で、ワークシートにその文書情報が登録される。具体的には、ワークシートの文書名(文書ID)の項目(スキーマ情報)に、入力された文書名(文書ID)が登録され、そのワークシートに登録される文書の識別が可能になる。  In step S104, the document information is registered in the worksheet. Specifically, the input document name (document ID) is registered in the item (schema information) of the document name (document ID) of the worksheet, and the document registered in the worksheet can be identified.

ステップS105で、該ワークシートの各項目に、必要なインデックス(属性)情報の入力、管理を行う。このインデックス情報の入力は、ユーザの手入力で行われても良いし、文書に対して自動的にOCRなどを行って得た情報が入力されるようにしてもよい。インデックス情報入力の詳細は、図10で後述する。  In step S105, necessary index (attribute) information is input and managed for each item of the worksheet. The index information may be input manually by the user, or information obtained by automatically performing OCR or the like on the document may be input. Details of the index information input will be described later with reference to FIG.

ステップS106で、更に他の文書の入力を行う必要がある場合は、ステップS103に戻る。  If it is necessary to input another document in step S106, the process returns to step S103.

ステップS107で、以上の処理で取得・設定したワークシート内のデータを、文書管理システムヘリリース処理(登録処理)する。リリース処理の詳細は、図11を用いて後述する。  In step S107, the data in the worksheet acquired / set by the above processing is released (registered) into the document management system. Details of the release process will be described later with reference to FIG.

次に、文書入力処理をGUI(グラフィカル・ユーザ・インターフェース)上の入力起動ボタンに予め設定(図8)しておき、該入力起動ボタンが押下されると該処理が実行されるようにした場合の処理を説明する。  Next, when a document input process is set in advance on an input activation button on a GUI (graphical user interface) (FIG. 8) and the input activation button is pressed, the process is executed. The process will be described.

ステップS120で、入力起動ボタンが押下されたことを検知すると、該ボタンに予め設定されている処理を判断し、ステップS121で、該設定されている条件に応じた文書取得処理(例えば、予め指定されているフォルダに新たに格納されている文書を取得する処理や、予め指定されているスキャナに原稿を読み取らせて文書画像を取得する処理)を実行し、予め設定されているワークシートに登録する。入力起動ボタン処理の実行は図9で後述する。  If it is detected in step S120 that the input activation button has been pressed, a process preset for the button is determined. In step S121, a document acquisition process corresponding to the set condition (for example, specified in advance) is determined. Process to acquire a document newly stored in the specified folder, or to acquire a document image by reading a document with a scanner specified in advance, and register it in a preset worksheet To do. The execution of the input activation button process will be described later with reference to FIG.

ステップS122で、該ワークシートにインデックスを入力する。インデックス入力処理の詳細は図10で後述する。  In step S122, an index is input to the worksheet. Details of the index input process will be described later with reference to FIG.

ステップS123で、以上の処理で取得・設定したワークシート内のデータを、文書管理システムヘリリース処理(登録処理)する。リリース処理の詳細は、図11を用いて後述する。  In step S123, the data in the worksheet acquired / set by the above processing is released (registered) into the document management system. Details of the release process will be described later with reference to FIG.

また、予め、文書取得設定、インデックス設定、リリース設定を指定してジョブとして作成・保存しておき、保存されている複数のジョブの中からユーザに選択(ステップS130)されたジョブを実行する(ステップS131)こともできる。ジョブの選択・実行処理の詳細は、図13を用いて後述する。  In addition, a document acquisition setting, index setting, and release setting are designated and created and saved as a job in advance, and the job selected by the user from the plurality of saved jobs (step S130) is executed (step S130). Step S131) can also be performed. Details of the job selection / execution process will be described later with reference to FIG.

また、詳細は後述するが、ステップS105及びS122でのインデックス入力の際に、フォームを用いて自動的にインデックス入力を行うことも可能である。ステップS140で、このフォームを登録する処理を行い、ステップS141で、フォームにエリアを設定する。フォーム登録処理の詳細は図6を用いて、エリア登録処理の詳細は図7を用いて後述する。  Although details will be described later, it is also possible to automatically input an index using a form when inputting an index in steps S105 and S122. In step S140, processing for registering the form is performed, and in step S141, an area is set in the form. Details of the form registration process will be described later with reference to FIG. 6, and details of the area registration process will be described later with reference to FIG.

ステップS150では、以上のような処理を実行するための各種設定処理(ジョブ設定処理(図12)、入力起動ボタン設定処理(図8)など)を行う。  In step S150, various setting processes (job setting process (FIG. 12), input activation button setting process (FIG. 8), etc.) for executing the above processes are performed.

以上述べた処理を以下に詳述する。  The processing described above will be described in detail below.

<テンプレート作成処理(図4)>
図4を用いて、テンプレート作成処理(ステップS100)を詳述する。
<Template creation process (FIG. 4)>
The template creation process (step S100) will be described in detail with reference to FIG.

ステップS200で、まず文書登録先の文書管理システムへ接続する。  In step S200, a connection is first made to the document management system of the document registration destination.

ステップS201で、文書管理システム内のデータベースのインデックス構造(文書を格納させるフォルダ等に設定されているスキーマ情報(検索用インデックスとして運用可能な情報)など)を取得する。  In step S201, an index structure of a database in the document management system (schema information (information that can be used as a search index) set in a folder in which a document is stored) is acquired.

ステップS202で、文書管理システムへの接続情報と、スキーマ情報とを一括管理するテンプレートを作成し、作成したテンプレートを識別するための識別情報(テンプレート名)を付加して保存する。  In step S202, a template that collectively manages connection information to the document management system and schema information is created, and identification information (template name) for identifying the created template is added and saved.

<ワークシート作成処理(図5)>
図5を用いて、保存されているテンプレートからワークシートを作成するワークシート作成処理(ステップS101)を詳述する。
<Worksheet creation process (FIG. 5)>
The worksheet creation process (step S101) for creating a worksheet from a saved template will be described in detail with reference to FIG.

ステップS300において、まず、文書登録先の文書管理システムに対応するテンプレートをユーザに選択させる。なお、図4で作成されたテンプレートから直接ワークシートを作成する場合は、この選択ステップは省略してもよい。  In step S300, first, the user is allowed to select a template corresponding to the document management system of the document registration destination. Note that this selection step may be omitted when a worksheet is created directly from the template created in FIG.

ステップS301で、テンプレートに保存されている文書管理システムのスキーマ情報に対して、インデックス入力する必要のないものがあれば、そのスキーマ情報に対応するフィールドを入力対象として選択する等の編集を行なうかどうかの指示がされたか判断する。  In step S301, if the schema information of the document management system stored in the template does not need to be indexed, is editing such as selecting a field corresponding to the schema information as an input target? Judge whether the instruction was given.

フィールド編集を行うと判断された場合は、ステップS302で、そのフィールド編集作業を行う。基本的には、スキーマ情報として用いることのできるテンプレートの項目領域(フィールド)の中から、必要なフィールドを選択する操作であるが、場合によっては、領域(フィールド)の拡張を指示できる。  If it is determined that field editing is to be performed, the field editing operation is performed in step S302. Basically, this is an operation for selecting a necessary field from item areas (fields) of a template that can be used as schema information. In some cases, an extension of the area (field) can be instructed.

ステップS303で、フィールドの編集など、所定の設定を確認して、該選択されたテンプレートからワークシートを作成する。  In step S303, a predetermined setting such as field editing is confirmed, and a worksheet is created from the selected template.

ステップS304で、作成したワークシートを識別するための識別情報(ワークシート名)を付加して保存する。  In step S304, identification information (worksheet name) for identifying the created worksheet is added and saved.

<フォーム登録処理(図6)>
図6を用いて、入力された文書を識別するための処理や、インデックスとして画像から情報を抽出する処理などで用いるためのフォームを登録するフォーム登録処理(ステップS140)について詳述する。
<Form registration process (Fig. 6)>
A form registration process (step S140) for registering a form for use in a process for identifying an input document and a process for extracting information from an image as an index will be described in detail with reference to FIG.

ステップS400で、フォーム解析時の基準とするイメージデータを取得する。  In step S400, image data used as a reference at the time of form analysis is acquired.

ステップS401で、各種フォームを管理するフォーム管理シートに、先に入手したイメージデータを登録する。  In step S401, the previously obtained image data is registered in a form management sheet for managing various forms.

ステップS402で、フォーム解析処理(フォームを構成する枠・表に関する位置及び大きさの情報や、記載されている文字情報などを解析)をするフォーム解析部226に該イメージデータを渡して、該イメージデータのフォーム解析処理を行い、該フォーム解析結果を該イメージデータと対応づけてフォーム管理シートに登録し、登録フォームデータ252として管理する。  In step S402, the image data is passed to the form analysis unit 226 that performs form analysis processing (analyzes position and size information about the frames and tables constituting the form, written character information, etc.) Data form analysis processing is performed, the form analysis result is registered in the form management sheet in association with the image data, and managed as registered form data 252.

ステップS403で、新規追加された登録フォームデータを識別情報(フォーム登録名)を付加して保存する。  In step S403, the newly added registration form data is added with identification information (form registration name) and saved.

<エリア登録処理(図7)>
図7を用いて、登録フォーム上に、文字認識やバーコード認識などを行うエリアを設定するエリア登録処理(ステップS141)について詳述する。このエリアは、文書にインデックスをつける際に、登録フォームに設定されているエリアに対応する文書の領域内を認識処理して、認識結果をインデックスとしてワークシートに登録するために用いられるものである。
<Area registration processing (FIG. 7)>
The area registration process (step S141) for setting an area for performing character recognition, barcode recognition, etc. on the registration form will be described in detail with reference to FIG. This area is used for recognizing the document area corresponding to the area set in the registration form and registering the recognition result as an index in the worksheet when indexing the document. .

ステップS500では、まずエリアを設定するフォームをユーザに選択させる。  In step S500, the user first selects a form for setting an area.

ステップS501では、フォーム解析対象エリアとする領域をユーザに指定させる。  In step S501, the user is allowed to specify an area to be a form analysis target area.

ステップS502では、そのエリアの解析モードを指定する。解析モードとして、認識率を向上させるための詳細な条件を設定する。例えば、英数字文字認識、仮名漢字文字認識の指定や、バーコード認識等の解析エンジンの指定等も、エリア毎に指定可能である。また、ここでエリアとテンプレートの項目(ワークシートの項目)との対応づけ設定を行っておくことができ、文書画像を解析・登録する際には、各エリアの認識結果を対応するワークシートの項目にインデックスとして入力される。なお、エリアとワークシートの項目(テンプレートの項目)との対応付けは、インデックス入力処理を行う際に変更できるようにしてもよい。  In step S502, the analysis mode of the area is designated. Detailed conditions for improving the recognition rate are set as the analysis mode. For example, designation of alphanumeric character recognition, kana / kanji character recognition, analysis engine such as barcode recognition, and the like can be designated for each area. You can also set the correspondence between areas and template items (worksheet items) here. When analyzing and registering document images, the recognition results for each area are displayed in the corresponding worksheet. The item is entered as an index. The association between the area and the worksheet item (template item) may be changed when the index input process is performed.

ステップS503では、他にエリアを設定する指示がなされたか判断し、更に他のエリアを設定する場合はステップS501に戻り、エリア設定が終了ならばステップS504に進む。  In step S503, it is determined whether another area setting instruction has been issued. If another area is set, the process returns to step S501. If the area setting is completed, the process proceeds to step S504.

ステップS504では、設定されたエリアに関する設定情報を、登録フォームデータに対する付加情報として登録する。  In step S504, the setting information regarding the set area is registered as additional information for the registration form data.

<入力起動ボタン設定(図8)>
図8を用いて、入力起動ボタンの設定処理(ステップS150)を詳述する。入力起動ボタンは、押下されると、各種データソース(フォルダやスキャナなど)からの入力処理を一括処理させるためのものである。
<Input activation button setting (FIG. 8)>
The input activation button setting process (step S150) will be described in detail with reference to FIG. When the input activation button is pressed, input processing from various data sources (folders, scanners, etc.) is performed at once.

ステップS600では、入力起動ボタンが押下された場合に設定されたデータソースから取得した文書を登録するためのワークシートをユーザに選択させる。  In step S600, the user is allowed to select a worksheet for registering a document acquired from the set data source when the input activation button is pressed.

ステップS601では、文書データの取得先となるデータソース(フォルダやスキャナなど)をユーザに選択させる。  In step S601, the user is made to select a data source (folder, scanner, etc.) from which document data is acquired.

ステップS602では、スキャナがデータソースとして指定されているか判断し、スキャナが指定されている場合は、ステップS603でスキャナの読み取りモード(読み取り解像度、読み取り領域など)を設定する。  In step S602, it is determined whether the scanner is designated as the data source. If the scanner is designated, the scanner reading mode (reading resolution, reading area, etc.) is set in step S603.

ステップS604では、フォルダがデータソースとして指定されているか判断し、フォルダが指定されている場合は、ステップS605でフォルダのアクセス設定(アクセス権の設定などのアクセス条件)を行う。  In step S604, it is determined whether the folder is designated as a data source. If a folder is designated, folder access settings (access conditions such as access right settings) are performed in step S605.

ステップS610では、設定された条件を入力起動ボタンに対応付けて登録し、該入力起動ボタンをGUIとして表示する。また、設定条件に応じて、ボタン名や形状を変えるなどして、複数の入力起動ボタンを登録・表示させることができる。  In step S610, the set condition is registered in association with the input activation button, and the input activation button is displayed as a GUI. Also, a plurality of input activation buttons can be registered and displayed by changing the button name and shape according to the setting conditions.

<入力起動ボタン実行処理(図9)>
図9を用いて、入力起動ボタンが押下されたときの実行処理(ステップS121)を詳述する。
<Input activation button execution processing (FIG. 9)>
The execution process (step S121) when the input activation button is pressed will be described in detail with reference to FIG.

ステップS700では、押下された入力起動ボタンに設定されている条件(設定モード)を読み出す。  In step S700, the condition (setting mode) set for the pressed input activation button is read.

ステップS710で、スキャナ指定されているか判断し、スキャナが設定されている場合は、ステップS711に進んで設定モードとして設定されているスキャナ読み取り条件に従ったスキャンを行って文書画像を取得し、ステップS712で該文書をワークシートに保存する。  In step S710, it is determined whether the scanner is designated. If the scanner is set, the process proceeds to step S711 to perform scanning according to the scanner reading condition set as the setting mode to obtain a document image. In step S712, the document is saved in the worksheet.

ステップS720で、フォルダからの文書取得が設定されているかどうか判断し、フォルダからの取得が設定されている場合、ステップ721へ進み、フォルダからの文書取得の条件(例えば、新たに入力された文書を取得するような条件や、所定のフォーマットの文書を取得するような条件)に従って、フォルダの内容のチェックを行い、ステップS722で該条件を満たす文書が存在するかどうか判断し、存在する場合は、ステップS723で該文書の取得を行い、ステップS724でワークシートへ該文書を保存する。一方、ステップS722で条件を満たす文書が存在しないと判断した場合は、ステップS725へ進む。  In step S720, it is determined whether or not document acquisition from a folder is set. If acquisition from a folder is set, the process proceeds to step 721, and a condition for acquiring a document from the folder (for example, a newly input document) In step S722, the content of the folder is checked. In step S722, whether there is a document satisfying the condition is determined. In step S723, the document is acquired, and in step S724, the document is stored in the worksheet. On the other hand, if it is determined in step S722 that no document satisfies the condition, the process proceeds to step S725.

ステップS725は、定期的にフォルダの確認(ポーリング)を行って文書を取得するような条件が設定されているときに用いられる判断処理であり、定期的フォルダ確認の中止が指示された場合もしくは元々定期的フォルダ確認の設定条件が為されていなかった場合は、処理を終了し、そうでなければ、再度ステップS721に戻り、定期的に指定フォルダの内容を確認処理する。  Step S725 is a determination process used when a condition for acquiring a document by periodically checking (polling) the folder is set, and when the cancellation of the periodic folder check is instructed or originally. If the setting conditions for periodic folder confirmation have not been made, the process ends. If not, the process returns to step S721 again to periodically confirm the contents of the designated folder.

<インデックス入力処理(図10)>
図10を用いて、ワークシートに文書のインデックスを入力するインデックス入力処理(S105、S122、S1121など)を詳述する。
<Index input process (FIG. 10)>
The index input process (S105, S122, S1121, etc.) for inputting a document index to the worksheet will be described in detail with reference to FIG.

ステップS800では、ジョブなどの自動処理を実行するように指定されたか判断し、自動処理の場合は、ステップS815へ処理を遷移させ、そうでない場合は、順次ワークシート、フォームの選択をする。  In step S800, it is determined whether or not automatic processing such as a job has been specified. If automatic processing is selected, the processing proceeds to step S815. If not, worksheets and forms are sequentially selected.

自動処理でない場合、ステップS801で、ユーザがワークシートを指定することにより、該ワークシートを選択する。  If it is not automatic processing, in step S801, the user selects the worksheet by designating the worksheet.

ステップS802で、インデックスの入力をユーザの手入力で行うか、登録フォームを用いてインデックスの入力を行うかを判断する。ユーザにより手動でインデックス情報を入力すると指示された場合、ステップS803で手動でのインデックス入力を行い、その後、ステップS804でまだ処理すべき文書が他にあるかどうか判断し、他の文書がある場合はステップS800に戻り、なければ処理を終了する。  In step S802, it is determined whether the index is input manually by the user or the index is input using a registration form. When it is instructed by the user to manually input index information, manual index input is performed in step S803, and then it is determined in step S804 whether there are other documents to be processed, and there are other documents. Returns to step S800, and if not, the process ends.

一方、ステップS802で登録フォームを用いてインデックス入力を行うよう指示されたと判断された場合、ステップS810に進み、自動フォーム検出機能を利用するか否かの判断を行う。自動フォーム検出機能を利用が指示されたと判断した場合、ステップS811で、登録されている複数の登録フォームの中から、入力された文書と一致するフォームを検出するフォーム検出処理を行う。フォーム検出処理により一致するフォームが検出された場合はステップS812からステップS820に進み、一致するフォームが検出されなかった場合はステップS812からステップS813に進む。一方、ステップS810で自動フォーム検出機能の利用が指示されずに手動でのフォーム選択が指示されたと判断した場合、ステップS813に進む。ステップS813では、複数の登録フォームの中からユーザの指示によって手動で所望のフォームを選択する。  On the other hand, if it is determined in step S802 that an instruction to input an index using the registered form has been given, the process proceeds to step S810 to determine whether to use the automatic form detection function. If it is determined that the use of the automatic form detection function has been instructed, in step S811, a form detection process for detecting a form that matches the input document from a plurality of registered forms is performed. If a matching form is detected by the form detection process, the process proceeds from step S812 to step S820. If a matching form is not detected, the process proceeds from step S812 to step S813. On the other hand, if it is determined in step S810 that use of the automatic form detection function is not instructed and manual form selection is instructed, the process proceeds to step S813. In step S813, a desired form is manually selected from a plurality of registered forms according to a user instruction.

ステップS820で、自動検出又は手動で選択された登録フォームに設定されているエリアを検索する。  In step S820, an area set in the registration form selected automatically or manually is searched.

ステップS821で、当該文書において、登録フォームに設定された全てのエリアに対応する領域内の情報を用いたインデックス付け処理が終了したか判断し、終了している場合はステップS804に進んで次文書があるかの判断を行い、一方、終了していない場合はステップS822に進む。  In step S821, it is determined whether or not the indexing process using the information in the area corresponding to all areas set in the registration form has been completed in the document. If the indexing process has been completed, the process proceeds to step S804. On the other hand, if not completed, the process proceeds to step S822.

ステップS822で、登録フォームに設定されているエリアの解析条件に従ってエリア解析する。なお、ここで、エリアの解析条件として設定された領域範囲を、ユーザが能動的に領域範囲を調整することも可能である。この領域範囲の調整は、入力された文書画像を表示している状態で、設定されているエリアの解析条件として設定されている領域範囲を所定の色の矩形を重ねて表示し、ユーザはこの矩形を調整することで該領域範囲を調整することができる。更に、領域範囲に従って切り出された画像データに対して文字画像のスムージング処理(黒画素塊のエッジのスムージング処理)を施す。ここでいう文字画像には、バーコードデータ、絵文字等ビットマップのビット配列の形状で意味を伝達するもの全てが含まれる。なお、この文字画像のスムージング処理は、OCR制御部225にライブラリソフトウェアという形態で包括される。このスムージング処理を施すことにより、傾き補正、ずれ補正、変倍補正などの画像処理をおこなった際に生じるジャギー(ドットばらつき)が低減され、文字認識処理の認識率の向上が図れる。  In step S822, area analysis is performed according to the area analysis conditions set in the registration form. Here, it is also possible for the user to actively adjust the area range set as the area analysis condition. The adjustment of the area range is performed by displaying the area range set as the analysis condition of the set area in a state where the input document image is displayed, with a rectangle of a predetermined color superimposed. The area range can be adjusted by adjusting the rectangle. Further, the character image smoothing process (black pixel block edge smoothing process) is performed on the image data cut out in accordance with the region range. The character image here includes all of the meanings transmitted in the form of the bit arrangement of the bitmap such as barcode data and pictographs. The smoothing process of the character image is included in the OCR control unit 225 in the form of library software. By performing this smoothing process, jaggies (dot variations) that occur when image processing such as tilt correction, shift correction, and magnification correction is performed are reduced, and the recognition rate of the character recognition process can be improved.

ステップS823では、エリア解析処理に異常が発生することなく成功したかどうか判断する。異常終了した場合は、ステップS824に進み、自動処理モードかを判断して、自動処理モードでなければステップS825でユーザにインデックスの手動入力をさせ、自動処理モードの場合はステップS826で暫定処理を行う。ここで、暫定処理とは、例えばエリア解析が不成功であったことを示すNGマークをつけたり、その他のデフォルトとして規定した値をインデックスとして出力したりする処理である。  In step S823, it is determined whether the area analysis process has succeeded without any abnormality. If the process ends abnormally, the process proceeds to step S824, where it is determined whether the process is in the automatic process mode. If the process is not in the automatic process mode, the user manually inputs an index in step S825. Do. Here, the provisional process is, for example, a process of adding an NG mark indicating that the area analysis is unsuccessful, or outputting a value defined as another default as an index.

ステップS830では、エリアの解析処理した結果をワークシートへ保存し、ステップS820に戻って他の未処理のエリアを検索する。  In step S830, the result of area analysis processing is saved in the worksheet, and the process returns to step S820 to search for another unprocessed area.

一方、ステップS800でジョブなどの自動処理が指定されたと判断された場合、ステップS815において、該自動処理に対応付けられているワークシートを選択して、自動インデクス付け処理の前処理を行う。ここで、該自動処理には、ワークシートがあらかじめ設定されていることを前提としている。該自動処理に登録フォームもあらかじめ指定されている場合は、そのままステップS816でフォームが検出されているとしてステップS820に進む。また、該自動処理に登録フォームを自動的に検出して選択させる設定になっている場合は、この前処理において、ステップS811と同様のフォーム検出処理を行い、一致する登録フォームが検出された場合は、ステップS816でフォームが検出されたとしてステップS820に進み、一方、登録フォームが定まらなかった場合は、ステップS817の後処理に進み、処理ができなかった文書として、ワークシート上に当該文書が管理されて、ステップS804に進んで次文書の処理を行うか判断される。  On the other hand, if it is determined in step S800 that automatic processing such as a job has been designated, in step S815, a worksheet associated with the automatic processing is selected, and preprocessing for automatic indexing processing is performed. Here, the automatic processing is premised on that a worksheet is set in advance. If the registration form is also designated in advance in the automatic processing, the process proceeds to step S820 assuming that the form is detected in step S816. If the setting is such that the registration form is automatically detected and selected in the automatic process, the form detection process similar to step S811 is performed in this pre-process, and a matching registration form is detected. If the form is detected in step S816, the process proceeds to step S820. On the other hand, if the registered form cannot be determined, the process proceeds to post-processing in step S817, and the document is displayed on the worksheet as a document that could not be processed. In step S804, it is determined whether to process the next document.

<リリース(データ登録)処理(図11)>
図11を用いて、ワークシートで管理されているデータ(文書情報及びインデックス情報)を、文書管理システムにリリース(登録)する処理(S107、S123、S1131等)を詳述する。
<Release (data registration) processing (FIG. 11)>
A process (S107, S123, S1131, etc.) for releasing (registering) data (document information and index information) managed in the worksheet in the document management system will be described in detail with reference to FIG.

ステップS900で、自動リリースが指定されているか判断し、自動リリースであると判断された場合はステップS901に進み、自動リリースでないと判断された場合はステップS910に進む。  In step S900, it is determined whether automatic release is designated. If it is determined that the release is automatic release, the process proceeds to step S901. If it is determined that the automatic release is not performed, the process proceeds to step S910.

自動リリースの場合、ステップS901で、まず自動リリースの設定情報(登録先の文書管理システムへの接続情報や登録先のフォルダ情報など)をワークシートから取得し、ステップS902で、該文書管理システムの格納フォルダへ接続処理を行い、ステップS920に進んでリリースするデータの準備を行う。  In the case of automatic release, in step S901, automatic release setting information (connection information to the registration destination document management system, registration destination folder information, etc.) is first acquired from the worksheet, and in step S902, the document management system A connection process to the storage folder is performed, and the process proceeds to step S920 to prepare data to be released.

自動リリースでない場合、ステップS910で、まずワークシートで管理されている文書から、登録対象の文書の選択や、文書管理システムへ登録後に文書登録システムに格納されている文書の扱い(削除など)の設定ができるようになっている。登録対象の文書の選択は、ワークシートで管理されている複数の登録対象の文書IDとそれぞれの文書に対応するインデックスとを、ワークシートの表形式で表示し、ユーザにその中から登録処理する文書を選択させることができる。なお、選択処理時には、ワークシート上で選択された文書ID及びインデックスをハイライト表示し、選択されていることが分かりやすいようにする。  If it is not automatic release, in step S910, first, from the document managed in the worksheet, the selection of the document to be registered and the handling (deletion) of the document stored in the document registration system after registration in the document management system are performed. It can be set. To select a document to be registered, a plurality of registration target document IDs managed in the worksheet and an index corresponding to each document are displayed in a table format of the worksheet, and a registration process is performed from the list. A document can be selected. During the selection process, the document ID and index selected on the worksheet are highlighted so that the user can easily understand that the document is selected.

ステップS911で、登録先とする文書管理システムへログイン処理し、文書を格納するフォルダを指定する。  In step S911, login processing is performed to the document management system as a registration destination, and a folder for storing the document is designated.

ステップS912で、文書登録時のオプション設定ができるようになっており、文書登録処理に関する実行ログをとる設定をしたり、文書登録時の文書フォーマットの変換設定をしたりできるようになっている。  In step S912, options can be set at the time of document registration, and an execution log related to document registration processing can be set, and conversion settings for the document format at the time of document registration can be set.

ステップS920では、文書管理システムへ登録する文書情報等を一旦内部の出力用データエリア254に保存して登録準備を行う。  In step S920, document information to be registered in the document management system is temporarily stored in the internal output data area 254 to prepare for registration.

ステップS930では、登録する文書画像のフォーマット変換、もしくは、文書画像をOCR解析した結果を付加する処理等が指示されているか判断し、指示されていると判断した場合はステップS931で、該指示に従って画像処理を行う。  In step S930, it is determined whether a format conversion of the document image to be registered or a process for adding a result of OCR analysis of the document image is instructed. If it is determined that the instruction is instructed, in step S931, according to the instruction. Perform image processing.

ステップS940で、準備された文書データ等を、登録先の文書管理システムのフォルダへ登録処理を行う。  In step S940, the prepared document data and the like are registered in the folder of the registration destination document management system.

ステップS950において、文書管理システムへの文書登録後に、文書登録システム内に格納されている該文書の削除が指示されているか判断し、削除指示が為されている場合はステップS951で該文書の削除処理を行い、リリース処理を終了する。  In step S950, it is determined whether deletion of the document stored in the document registration system is instructed after registration of the document in the document management system. If deletion is instructed, deletion of the document is performed in step S951. The process is performed and the release process is terminated.

<ジョブ作成処理(図12)>
図12を用いて、文書取得処理、インデックス処理、リリース処理の各設定を定めて、1つのジョブとして作成する処理(S150)を詳述する。
<Job creation processing (FIG. 12)>
With reference to FIG. 12, a process (S150) for defining each setting of the document acquisition process, the index process, and the release process and creating it as one job will be described in detail.

ステップS1000で、自動文書取得のジョブ設定が指定されたか判断し、設定する場合は、ステップS1001に進み、使用するワークシートの設定、ならびにソースデバイスとしてのスキャナやフォルダの指定などを行って、文書取得のための設定を行う。  In step S1000, it is determined whether automatic document acquisition job settings have been specified. If so, the process proceeds to step S1001 to set a worksheet to be used, specify a scanner or folder as a source device, and the like. Set for acquisition.

ステップS1010で、インデックス入力の自動処理の設定が指示されたか判断し、設定する場合は、ステップS1011において、使用するワークシートの設定、登録フォームの指定又は登録フォームの自動検索の指定など、インデックス処理を自動的に処理するために必要な項目を設定する。  In step S1010, it is determined whether setting of automatic processing for index input has been instructed. If setting is made, in step S1011, index processing such as setting of a worksheet to be used, specification of a registered form or automatic search of a registered form is performed. Set the items required to automatically process

ステップS1020で、自動リリース(文書登録)の設定が指示されたか判断し、設定する場合は、ステップS1021において、処理の対象となるワークシート、文書登録先(文書管理システム、フォルダ)、登録後の文書の扱いなど、自動リリース処理するために必要な情報を設定する。  In step S1020, it is determined whether an automatic release (document registration) setting has been instructed, and if so, in step S1021, the worksheet to be processed, the document registration destination (document management system, folder), the post-registration Set information necessary for automatic release processing such as document handling.

ステップS1030では、ステップS1001、S1011、S1021で設定された設定情報を、識別情報(ジョブ名)を付加して保存する。  In step S1030, the setting information set in steps S1001, S1011, and S1021 is added with identification information (job name) and stored.

なお、各種設定を組み合わせたジョブを複数登録・保存することが可能である。  It is possible to register and save a plurality of jobs combining various settings.

<ジョブ実行処理(図13)>
図13を用いて、ジョブ実行処理(S130,131)を詳述する。
<Job execution processing (FIG. 13)>
The job execution process (S130, 131) will be described in detail with reference to FIG.

ステップS1100で、まず登録保存されている複数のジョブの中から、ユーザが所望するジョブを選択する。  In step S1100, the user selects a desired job from a plurality of registered and stored jobs.

ステップS1101で、その選択されたジョブに設定されている条件を読出してジョブ実行処理を開始する。  In step S1101, the conditions set for the selected job are read and job execution processing is started.

ステップS1110で、自動文書取得のジョブが設定されているかどうか判断し、設定されていると判断した場合、ステップS1111で設定に従ってデバイスから文書取得処理を行い、ステップS1112で、取得した文書をワークシートで管理し、保存する。  In step S1110, it is determined whether an automatic document acquisition job is set. If it is determined that a job is set, in step S1111, document acquisition processing is performed from the device according to the setting. In step S1112, the acquired document is converted into a worksheet. Manage and save with.

ステップS1120で、インデックス入力の自動処理が設定されているかどうか判断し、設定されていると判断した場合、ステップS1121において、設定された条件に従って自動インデクス処理を実行する。この自動インデックス処理において、自動フォーム検出を行う場合、各種変倍、位置ズレ補正等の画像処理を施し、さらにエリア(領域)の設定に従い、画像上に記載されている情報を取得する。さらにその画像情報にスムージング処理を施した上で文字認識(OCR)処理を行うことでテキストデータによるインデックスデータが自動作成できる。  In step S1120, it is determined whether or not automatic index input processing is set. If it is determined that index input is set, automatic index processing is executed in step S1121 according to the set conditions. In the automatic index processing, when automatic form detection is performed, image processing such as various zooming and misalignment correction is performed, and information described on the image is acquired according to area (region) settings. Further, by performing smoothing processing on the image information and performing character recognition (OCR) processing, index data based on text data can be automatically created.

ステップS1130で、自動リリース(文書登録)処理が設定されているかどうか判断し、設定されていると判断した場合、ステップS1131において、設定された条件に従って文書管理システムへ自動リリース処理をする。  In step S1130, it is determined whether automatic release (document registration) processing is set. If it is determined that it is set, in step S1131, automatic release processing is performed to the document management system according to the set conditions.

文書取得から、文書登録までをジョブに設定することで、一連の処理を一括処理させることが可能になっている。  By setting a job from document acquisition to document registration as a job, a series of processing can be performed at once.

<拡張されたデバイス制御部(図14)>
本実施形態では、更に図2のデバイス制御を行って、デバイスから文書を取得する方式として、複数の形態に対応できるように拡張することが可能である。図14を用いて、この拡張したデバイス制御を説明する。
<Extended device control unit (FIG. 14)>
In the present embodiment, the device control shown in FIG. 2 is further performed, and the method for acquiring a document from the device can be extended to support a plurality of forms. The extended device control will be described with reference to FIG.

デバイス制御部A(210)は、文書登録システムからデバイス側にアクセスして、文書を取得する。この制御部Aを用いて、同等のアクセス取得方式に対応した複数デバイス(110、111)から文書データを取得することが可能である。  The device control unit A (210) accesses the device side from the document registration system and acquires a document. Using this control unit A, it is possible to acquire document data from a plurality of devices (110, 111) compatible with an equivalent access acquisition method.

デバイス制御部B(211)は、文書登録システムからのアクセスではなく、デバイス側からアクセスされて、送信されてきた文書を取得する。この場合も、同等のアクセス方式に対応した、複数のデバイス(112、113)から、文書を取得することが可能である。  The device control unit B (211) obtains a transmitted document by accessing from the device side, not from the document registration system. Also in this case, it is possible to acquire a document from a plurality of devices (112, 113) corresponding to the equivalent access method.

また、デバイス制御部Bには、独自にデータフォルダ300を設けて、複数のデバイスからの同時の文書転送処理に対応している。更には、このデータフォルダを、階層を有するフォルダとして構成することを可能としておき、デバイス側からフォルダパスを指定しての文書転送処理も可能とする。なお、この場合のアクセスプロトコルとして、汎用的なファイル転送プロトコルを採用することにより、デバイス側の対応を容易にし、一般のコンピュータから文書転送させることも可能になる。  In addition, the device control unit B is provided with a data folder 300 to support simultaneous document transfer processing from a plurality of devices. Furthermore, this data folder can be configured as a folder having a hierarchy, and document transfer processing by designating a folder path from the device side is also possible. By adopting a general-purpose file transfer protocol as an access protocol in this case, the device side can be easily handled and a document can be transferred from a general computer.

更には、文書データを取得する際に、文書画像以外にも、当該文書データに関連した付加(属性)情報(例えば、各文書のオーナー情報、ファクス受信文書なら送信元情報、接続デバイスに関する情報等)を取得し、そのデータをシステム内で利用できる手段も有する。  Furthermore, when acquiring document data, in addition to the document image, additional (attribute) information related to the document data (for example, owner information of each document, transmission source information in the case of a fax reception document, information on a connected device, etc. ) And the data can be used in the system.

入力制御部220は、各デバイス制御部で取得された文書データを混同しないよう、統括してハンドリングできるようになっている。  The input control unit 220 can handle the document data acquired by each device control unit so as not to be confused.

<拡張された文書管理システム制御部(図15)>
本実施形態では、様々な異なる形式で文書を管理する複数の文書管理システムに対して、デバイス等から取得される文書データならびにそのインデックス(付加情報)を登録できるように拡張できる。図15は、ネットワーク上に、異なる形式で文書を管理する文書管理システムAと文書管理システムBとが混在した場合の対応を説明する図である。
<Extended Document Management System Control Unit (FIG. 15)>
In the present embodiment, it is possible to expand so that document data acquired from a device or the like and its index (additional information) can be registered in a plurality of document management systems that manage documents in various different formats. FIG. 15 is a diagram for explaining the correspondence when the document management system A and the document management system B that manage documents in different formats coexist on the network.

ここでは、文書管理システムの種類によって、そのアクセス手段や、扱える文書のファイル形式が異なっているのが一般的なので、文書管理システムA(140)に対しては、アクセス制御部A(230)、文書管理システムB(141)に対しては、アクセス制御部B(231)を提供する。そして、文書登録システム120は、登録先の文書管理システムに応じて、利用するアクセス制御部を変えることにより、異なる形式で文書を管理する複数の文書管理システムが混在する場合に対応できる。  Here, the access means and the file format of a document that can be handled are generally different depending on the type of the document management system. Therefore, for the document management system A (140), the access control unit A (230), An access control unit B (231) is provided for the document management system B (141). The document registration system 120 can cope with a case where a plurality of document management systems that manage documents in different formats coexist by changing the access control unit to be used according to the document management system of the registration destination.

なお、各文書管理システムヘアクセスなど行う際に必要な情報を、管理データ253として保持し、必要に応じて取り出して使用する。  Information necessary for accessing each document management system is stored as management data 253, and is extracted and used as necessary.

<図11のリリース処理の補足(図16)>
図16を用いて、文書管理システムへのリリース(登録)処理(ステップS940)に関する補足を述べる。
<Supplement to Release Process in FIG. 11 (FIG. 16)>
A supplement regarding the release (registration) processing (step S940) to the document management system will be described with reference to FIG.

ステップS1200で、リリース処理を開始するにあたっての設定処理であり、終了通知の要否の確認、終了通知先の情報取得処理等を行う。  Step S1200 is a setting process for starting the release process, and confirms whether or not an end notification is necessary, and obtains an end notification destination information acquisition process.

ステップS1210では、文書管理システムへ登録すべき残りのデータの有無の確認処理であり、登録すべき全てのデータが送信されていなければステップS1211へ進み、残りが無ければステップS1220へ進む。  Step S1210 is a process for confirming whether there is any remaining data to be registered in the document management system. If all the data to be registered has not been transmitted, the process proceeds to step S1211, and if there is no remaining data, the process proceeds to step S1220.

ステップS1211で、文書管理システムへ登録すべきデータを送信して登録する登録処理である。  In step S1211, registration processing is performed for transmitting and registering data to be registered in the document management system.

ステップS1212で、該送信したデータが登録されたかどうか判断し、登録されたのが確認されたならばステップS1210へ戻り、登録に失敗した場合はステップS1213へ進む。  In step S1212, it is determined whether or not the transmitted data is registered. If it is confirmed that the data has been registered, the process returns to step S1210. If the registration fails, the process proceeds to step S1213.

ステップS1213は、文書管理システムへのデータ登録がエラーした場合の処理であり、所定のワークシートに、登録エラーを起こした文書に関するデータを登録エラー文書データとして登録し、その後、手動による再登録処理ができるようになっている。  Step S1213 is processing in the case where an error occurs in data registration in the document management system. Data relating to a document in which a registration error has occurred is registered as a registration error document data in a predetermined worksheet, and then manual re-registration processing is performed. Can be done.

ステップS1220では、S1200での設定に基き、ユーザに登録終了通知を行う必要があるか判断し、必要なければ処理を終了する。  In step S1220, based on the setting in S1200, it is determined whether it is necessary to notify the user of registration completion. If not, the process ends.

終了通知を行う必要があると判断した場合、ステップS1221で、データ登録処理の結果にエラーがあるか判断し、エラーがなければステップS1222で、あらかじめ登録された登録通知のメールアドレスへ新規文書が登録された旨のメール通知処理を行い、一方、エラーが発生していると判断された場合は、ステップS1223で、あらかじめ登録されたエラー通知のメールアドレスへ、エラー情報をメール通知処理されるようになっている。  If it is determined that it is necessary to notify the end, in step S1221, it is determined whether there is an error in the result of the data registration process. If there is no error, in step S1222, a new document is sent to the pre-registered registration notification mail address. If it is determined that an error has occurred, an error information is sent to the pre-registered error notification e-mail address in step S1223. It has become.

<デバイスから送信された文書の自動文書登録処理(図17)>
図17は、デバイスから送られてくる文書データを、自動的に文書登録までの処理をさせるフローに関して説明する。なお、この図17では、文書管理システムへの文書登録自動処理および、登録フォームとして文書登録システムへのフォーム登録自動処理を記載している。
<Automatic Document Registration Processing for Documents Sent from Device (FIG. 17)>
FIG. 17 describes a flow for automatically processing the document data sent from the device until the document registration. In FIG. 17, document registration automatic processing to the document management system and form registration automatic processing to the document registration system are described as registration forms.

ステップS1300で、自動文書処理を実行するにあたって必要となる各種項目の設定を事前に行い、この設定された自動文書処理の起動を行う。  In step S1300, various items necessary for executing automatic document processing are set in advance, and the set automatic document processing is activated.

ここで行う設定項目には、文書入力処理に関する設定、フォーム登録処理用に運用されるフォルダ、使用する属性情報の設定、ならびに各属性に対応した処理を行うためのワークシートの設定、自動インデックス入力を行うために使用されるフォームの設定等がある。  The setting items here include settings related to document input processing, folders used for form registration processing, setting of attribute information to be used, setting of worksheets for processing corresponding to each attribute, automatic index input There is a setting of the form used for performing.

なお、属性情報の例としては、以下のものがある。属性情報は自動処理の判別、およびインデックス入力などに使用される。  Examples of attribute information include the following. The attribute information is used for automatic processing discrimination and index input.

・デバイスの種類
・フォルダパス(ファイルサーバ130、デバイス制御部用データフォルダ300)
・文書のオーナー情報
・FAX受信文書における送信元情報
・エリア解析結果、など
ステップS1301では、文書入力されたかどうか検知し、文書入力があるとステップS1302に進む。本実施形態では、デバイスからデバイス制御部経由で入力される文書データ、デバイスからフォルダ制御部経由で入力される文書データを統括して扱えるようになっている。本実施形態では、デバイスからプッシュ式で送信されてきた文書はデバイス制御部のデータフオルダを介して入力されるものとする。なお、フォルダに新たな文書が入力されたかどうかの検知は、図9のS721〜S725と同様に定期的にフォルダをチェックすることによって為される。
-Device type-Folder path (file server 130, device controller data folder 300)
-Document owner information-Transmission source information in FAX received document-Area analysis result, etc. In step S1301, it is detected whether or not a document has been input, and if there is a document input, the process proceeds to step S1302. In the present embodiment, document data input from a device via a device control unit and document data input from a device via a folder control unit can be collectively handled. In the present embodiment, it is assumed that a document transmitted by a push method from a device is input via a data folder of the device control unit. Whether or not a new document has been input to the folder is detected by periodically checking the folder in the same manner as in S721 to S725 in FIG.

ステップS1302で、入力された文書が、どのルートで入ってきたかを確認する。  In step S1302, the route through which the input document has entered is confirmed.

ステップS1310で、フォーム登録用フォルダを経由して入力された文書であるか判断し、該フォーム登録用フォルダを経由して入力されたと判断されれば、ステップS1311で、自動的にフォーム登録用処理部を起動し、入力された文書をフォームとして登録する。  In step S1310, it is determined whether the document is input via the form registration folder. If it is determined that the document is input via the form registration folder, the form registration process is automatically performed in step S1311. The document entered is registered as a form.

ステップS1320では、各種属性情報の解析をし、得られた属性情報に対応した処理が定義されているか否かを確認する。例えば、所定のフォルダAを介して入力された文書や、所定のデバイスから入力された文書が、所定の文書管理システムのフォルダXへ登録する自動処理を行うと定義されているものとする。  In step S1320, various attribute information is analyzed, and it is confirmed whether or not a process corresponding to the obtained attribute information is defined. For example, it is assumed that a document input via a predetermined folder A or a document input from a predetermined device is defined to perform automatic processing for registering in a folder X of a predetermined document management system.

なお、属性情報としては、入力制御部220で得られるデバイスやフォルダなどに関する情報と、この段階で自動インデックス処理に相当する処理を呼んで、フォーム解析してターゲットとする所定のエリアから得られる情報などがある。  As attribute information, information on devices, folders, and the like obtained by the input control unit 220, and information obtained from a predetermined area targeted by form analysis by calling a process corresponding to automatic index processing at this stage and so on.

ステップS1321では、当該入力された文書の属性情報に対応する自動処理が検出されたかどうか判断し、検出されなかった場合は、ステップS1323に進んで当該入力された文書を一時保存し、後でユーザが手動で処理できるようになっている。  In step S1321, it is determined whether or not automatic processing corresponding to the attribute information of the input document has been detected. If not, the process proceeds to step S1323 to temporarily store the input document. Can be handled manually.

一方、対応する処理が検出された場合(例えば所定の文書管理システムのフォルダXへの登録処理が検出された場合)は、ステップS1324に進み、自動インデックス処理および自動リリース処理に必要な情報を読出し、ステップS1330で、必要に応じてフォームに対応するエリア情報等を用いて自動インデックス入力を行い、ステップS1340で、該文書とインデックスとを文書管理システムに登録する自動リリース処理を行う。  On the other hand, when the corresponding process is detected (for example, when the registration process to the folder X of the predetermined document management system is detected), the process proceeds to step S1324, and information necessary for the automatic index process and the automatic release process is read. In step S1330, automatic index input is performed using area information corresponding to the form as necessary, and in step S1340, automatic release processing for registering the document and index in the document management system is performed.

ステップS1350で、自動文書処理の終了要求がなされたか判断し、なされていれば処理を終了させ、そうでなければ、ステップS1301に戻り、処理を継続する。  In step S1350, it is determined whether a request to end automatic document processing has been made. If so, the processing is terminated. If not, the processing returns to step S1301, and the processing is continued.

<複数の登録フォームを用いた登録(図18〜21)>
更に、本実施形態では、異なるフォームを有する複数の文書画像を、一括して、フォーム解析を行い、1つのワークシートにインデックスをつけて入力・管理でき、そして、そのワークシートで管理されている文書画像とインデックスとを、文書管理システムへ登録することができる。つまり、このような形態では、複数の登録フォームの各エリアを、1つのワークシートの各項目に対応づけることが可能である。
<Registration using multiple registration forms (FIGS. 18 to 21)>
Furthermore, in this embodiment, a plurality of document images having different forms can be collectively analyzed, indexed to one worksheet, input and managed, and managed by the worksheet. Document images and indexes can be registered in the document management system. That is, in such a form, each area of a plurality of registration forms can be associated with each item of one worksheet.

図18は、複数の登録フォームを用いて、1つのワークシート404への入力処理を示す模式図である。複数の文書画像(400A、400B)は、互いに異なるフォームを有し、スキャナ等に混載して読み取り処理されて、文書登録システムに一括して入力されてくる。これらの文書画像それぞれに対して複数の登録フォームから一致する登録フォームを検出し、その登録フォームに予め設定されているエリア(文書名称のインデックスとして用いられるエリア401、地域のインデックスとして用いられるエリア402、地区のインデックスとして用いられるエリア403)内の画像に対して文字認識処理を行い、ワークシート404のインデックスとして取り込んだ例を示す。つまり、文書画像によって、一致する登録フォームが異なり、インデックス入力に用いられるエリアの位置も異なるが、それぞれの文書画像で一致する登録フォームを識別して、それぞれの登録フォームのエリアに基づきインデックス入力するので、複数の文書画像を1つのワークシートへ一括して入力することができる。(なお、図18では、煩雑にならないように、日付のインデックスとして用いられるエリアについては記載を省略している。)
このような文書管理システムでは、まず、図6に示すようなフォーム登録を繰り返して、複数のフォームをフォーム管理シートに登録する。
FIG. 18 is a schematic diagram showing an input process to one worksheet 404 using a plurality of registration forms. The plurality of document images (400A, 400B) have different forms, are read together with a scanner or the like, and are input to the document registration system all at once. For each of these document images, a matching registration form is detected from a plurality of registration forms, and areas preset in the registration form (an area 401 used as a document name index, an area 402 used as a regional index) An example is shown in which character recognition processing is performed on an image in an area 403) used as a district index and is captured as an index of the worksheet 404. That is, matching registration forms differ depending on the document image, and the position of the area used for index input also differs. However, a matching registration form is identified in each document image, and an index is input based on the area of each registration form Therefore, it is possible to input a plurality of document images to one worksheet at a time. (In FIG. 18, the description of the area used as the date index is omitted to avoid complication.)
In such a document management system, first, form registration as shown in FIG. 6 is repeated to register a plurality of forms in the form management sheet.

そして、更に、検索対象の登録フォームを絞り、且つ1つのワークシートにインデックス入力するための、フォーム登録バッチを保存することも可能である。図19は、複数の登録フォームをフォーム登録バッチに登録するときのフローチャートである。ステップS1400で、複数の登録フォームを登録するためのフォーム登録バッチを指定する。ステップS1401で、このフォーム登録バッチに登録したい登録フォームをユーザが選択し、ステップS1402にてこの登録フォームをバッチに追加登録する。ステップS1403で、さらに追加したい登録フォームがあるかどうか判断し、追加登録するときにはステップS1401に戻って処理を繰り返す。フォーム登録バッチに登録したい登録フォームをすべて登録した場合には、ステップS1404にて、複数の登録フォームを登録したフォーム登録バッチを保存して作成処理を終了する。このフォーム登録バッチは、文書画像に一致するフォームを検索するフォーム識別処理を行うときに、予め保存しておいた登録バッチを指定すると、検索対象とする登録フォームを、該指定された登録バッチに登録されている登録フォームに限定することができる。  Further, it is also possible to save a form registration batch for narrowing down a registration form to be searched and inputting an index into one worksheet. FIG. 19 is a flowchart for registering a plurality of registration forms in the form registration batch. In step S1400, a form registration batch for registering a plurality of registration forms is designated. In step S1401, the user selects a registration form to be registered in the form registration batch, and in step S1402, the registration form is additionally registered in the batch. In step S1403, it is determined whether there is a registration form to be further added, and when additional registration is performed, the process returns to step S1401 to repeat the process. If all the registration forms to be registered in the form registration batch are registered, in step S1404, the form registration batch in which a plurality of registration forms are registered is saved, and the creation process ends. In this form registration batch, if a registered batch that has been stored in advance is specified when performing a form identification process for searching for a form that matches a document image, the registration form to be searched is designated as the specified registration batch. It can be limited to registered forms.

図20は、ワークシートの項目と、複数のフォームのエリアとを対応付ける、複数エリア登録処理を示すフローチャートである。  FIG. 20 is a flowchart showing a multiple area registration process for associating worksheet items with a plurality of form areas.

ステップS1500において、ワークシートの項目(又はテンプレートの項目)に対して、対応づけるエリアを登録するためのフォームを指定する。  In step S1500, a form for registering an area to be associated with a worksheet item (or template item) is designated.

ステップS1501において、該指定したフォーム上のエリアの範囲指定を行い、ステップS1502ではそのエリア範囲を登録する。ステップS1503では、追加登録したエリアに対する解析モードと、対応するワークシートの項目の設定を行う。ステップS1504において、さらにエリアを追加するか判断し、追加するならステップS1501に戻る。追加が無ければステップS1505で、当該フォームに設定されたエリアに関する情報を保存する。ステップS1506において、当該ワークシートに対して、対応づける他のフォームがあるか判断し、他のフォームがあれば、ステップS1500に戻り、なければ終了する。  In step S1501, an area range on the designated form is designated, and in step S1502, the area range is registered. In step S1503, the analysis mode for the additionally registered area and the corresponding worksheet item are set. In step S1504, it is determined whether to add more areas. If so, the process returns to step S1501. If there is no addition, information regarding the area set in the form is stored in step S1505. In step S1506, it is determined whether there is another form to be associated with the worksheet. If there is another form, the process returns to step S1500, and if not, the process ends.

図21は、デバイスから一括して入力された複数の文書画像に対して、1つのワークシートで自動インデキシングする処理を示すフローチャートである。ここでは、図21の処理を行う前に、フォーム登録バッチが指定されて、登録に用いるワークシートも決定されているものとする。  FIG. 21 is a flowchart showing a process of automatically indexing a plurality of document images input from the device in a single worksheet. Here, it is assumed that a form registration batch is designated and a worksheet to be used for registration is determined before performing the processing of FIG.

ステップS1600で、まず入力された文書画像を解析して特徴を取り出し、ステップS1601で、指定されたフォーム登録バッチにおける複数の登録フォームの特徴と順次比較を行う。ステップS1602で、S1601での比較対象の登録フォームと一致するか判断し、一致しないときにはステップS1603にて、次に比較対象となる次登録フォームがあるか判断し、あればステップS1601に戻って比較を続け、なければ処理を終了する。このようにステップS1601からS1603を繰り返しながら、フォーム登録バッチにおいて、一致するフォームを検索する。  In step S1600, the input document image is first analyzed to extract features, and in step S1601, the features of a plurality of registered forms in the designated form registration batch are sequentially compared. In step S1602, it is determined whether or not the registration form matches with the comparison form in S1601, and if not, in step S1603, it is determined whether there is a next registration form to be compared next, and if there is, the process returns to step S1601 for comparison. If not, the process ends. In this way, while repeating steps S1601 to S1603, a matching form is searched in the form registration batch.

一方、ステップS1602で一致するフォームがあったとき、ステップS1604で、そのフォームに設定されている最初のエリアに対応する文書画像の領域画像を切り出し、ステップS1605ではそのエリアの認識処理(文字認識処理、バーコード認識処理など予め指定されている認識)を行い、文字列として取り出した情報をステップS1606でワークシートの対応する項目にインデックスとして保存する。ステップS1607では、該一致したフォームに登録されている全てのエリアの処理が終わったか判断し、まだならば、ステップS1608に進んで次のエリアを抽出してステップS1605へと戻る。ステップS1607で全てのエリアの処理が終了したと判断した場合には、当該文書画像のインデックス入力が終了したとして、ステップS1608に進み、全ての文書画像の処理が終わったか判断して、他の文書画像が残っていればステップS1600に戻って次の文書画像に対して処理を行う。  On the other hand, when there is a matching form in step S1602, in step S1604, a region image of the document image corresponding to the first area set in the form is cut out, and in step S1605, the area recognition processing (character recognition processing) is performed. In step S1606, information extracted as a character string is stored as an index in a corresponding item in the worksheet. In step S1607, it is determined whether all areas registered in the matched form have been processed. If not, the process proceeds to step S1608 to extract the next area, and the process returns to step S1605. If it is determined in step S1607 that all areas have been processed, it is determined that index input for the document image has been completed, and the process advances to step S1608 to determine whether all document images have been processed, and other documents. If an image remains, the process returns to step S1600 to process the next document image.

以上のようにして、異なるフォームを有する複数の文書画像に対しても、一括して、1つのワークシートを介してインデックスをつけて、文書管理システムに登録することができる。  As described above, even a plurality of document images having different forms can be collectively registered and registered in the document management system via one worksheet.

以上説明したように、文書管理システムにおいて、文書画像に一致する登録フォームの検出を行い、画像と一致するフォームが存在したときには、予めそのフォームに対して設定してあるエリアの文字認識などの解析を行い、その結果をインデックス情報として保存することによって、複数の文書画像を1つのワークシートを使って一括して文書管理システムへ登録したいときでも自動的にそれぞれの文書画像に適応した領域のインデキシングを行うことができるので、文書画像のフォームをユーザが判断する必要が無くなり、インデックス入力作業の効率が大幅に向上し、インデックス入力のミスを防止することができる。  As described above, in the document management system, a registered form that matches the document image is detected, and when a form that matches the image exists, analysis such as character recognition in an area set in advance for the form is performed. And storing the results as index information, it is possible to automatically index a region that is adapted to each document image even when multiple document images are to be registered in the document management system using a single worksheet. Therefore, it is not necessary for the user to determine the form of the document image, the efficiency of index input work is greatly improved, and an error in index input can be prevented.

発明の効果Effect of the invention

以上説明したように、本実施形態によれば、異なるフォームを有する複数の文書画像が入力されてきても、自動的にフォームを識別し、該フォームのエリアに対応するインデックス項目へ、インデックスを自動的に入力することができるので、インデックス入力作業の効率があがる。  As described above, according to this embodiment, even when a plurality of document images having different forms are input, the form is automatically identified, and the index is automatically assigned to the index item corresponding to the area of the form. Therefore, the index input work can be efficiently performed.

また、フォームバッチを使って、フォーム識別対象とする登録フォームを絞ることができるので、フォーム識別率を高くすることができる。  In addition, since the registered forms that are subject to form identification can be narrowed down using form batches, the form identification rate can be increased.

また、複数の異なるフォームを使って、1つのワークシートへインデックス入力できるので、入力文書画像のフォームが混在していても一緒に処理することができる。  In addition, since a plurality of different forms can be used for index input into one worksheet, input document image forms can be mixed and processed together.

本発明の実施形態のシステム構成図  System configuration diagram of an embodiment of the present invention 文書登録システム120の構造を示すブロック図  Block diagram showing the structure of the document registration system 120 文書登録システムの基本フロー  Basic flow of document registration system テンプレート作成処理  Template creation process ワークシート作成処理  Worksheet creation process フォーム登録処理  Form registration process エリア登録処理  Area registration process 入力起動ボタン設定  Input start button setting 入力起動ボタン実行処理  Input start button execution processing インデックス入力処理  Index input processing リリース(データ登録)処理  Release (data registration) processing ジョブ作成処理  Job creation process ジョブ実行処理  Job execution processing 拡張されたデバイス制御部  Extended device control 拡張された文書管理システム制御部  Extended document management system controller リリース処理の補足  Release processing supplement デバイスから送信された文書の自動文書登録処理  Automatic document registration process for documents sent from the device ワークシートへ複数の異なるフォームを有する文書を登録する例  Example of registering a document with multiple different forms in a worksheet バッチ登録処理図  Batch registration process diagram 複数フォームのエリア登録  Multiple form area registration 複数文書の一括登録  Batch registration of multiple documents

100〜102 ユーザ端末
110 MFP
120 文書登録システム
130 ファイルサーバ
140 文書管理システム
100 to 102 User terminal 110 MFP
120 Document Registration System 130 File Server 140 Document Management System

Claims (7)

文書画像にインデックスをつけて管理する文書管理部に対して、ネットワークを介して接続された文書登録システムであって、
それぞれにエリアが設定される複数の異なるフォームを格納するフォーム格納手段と、
前記文書管理部のインデックス構造を取得し、当該取得したインデックス構造に基づいて、入力された文書画像に関する情報とインデックス項目とを有するワークシートを作成するための、テンプレートを作成するテンプレート作成手段と、
前記テンプレートから、前記文書管理部に複数の文書画像とインデックス情報とを一括して登録する際に使用するための、入力された文書画像に関する情報とインデックス項目とを有するワークシートを作成するワークシート作成手段と、
複数の異なるフォームそれぞれについて、該フォームのエリアに、そのエリアから抽出されるインデックス情報が入力される前記ワークシートのインデックス項目を設定するエリア設定手段と、
入力された複数の文書画像それぞれに対して、一致するフォームを識別するフォーム識別手段と、
前記複数の文書画像それぞれに一致するフォームに設定されているエリアに基づいて、該文書画像それぞれのインデックス情報を抽出して、該エリアに対応付けられているインデックス項目に基づき、前記ワークシートにおける該文書画像それぞれのインデックス項目に該文書画像それぞれのインデックス情報を入力するインデックス情報抽出手段と、
前記ワークシートで管理されている前記入力された複数の文書画像と、該文書画像それぞれのインデックス情報とを、前記ネットワークを介して接続されている前記文書管理部に一括して登録する登録手段と
を有することを特徴とする文書登録システム。
A document registration system connected via a network to a document management unit that indexes and manages document images,
Form storage means for storing a plurality of different forms each having an area set;
A template creation means for creating a template for obtaining an index structure of the document management unit and creating a worksheet having information and index items related to the input document image based on the obtained index structure;
A worksheet for creating a worksheet having information about an input document image and index items to be used when registering a plurality of document images and index information in the document management unit from the template. Creating means;
For each of a plurality of different forms, an area setting means for setting an index item of the worksheet in which index information extracted from the area is input to the area of the form;
Form identification means for identifying a matching form for each of a plurality of input document images,
Based on the area that is set in the form that matches each of the plurality of document images, to extract the document image each index information, based on the index items associated with the area, it said in the worksheet Index information extraction means for inputting the index information of each document image to the index item of each document image;
Registration means for collectively registering the plurality of input document images managed in the worksheet and index information of each of the document images in the document management unit connected via the network ; A document registration system comprising:
更に、前記フォーム格納手段に格納されている複数の異なるフォームの中から、所望のフォームを複数選択して、フォームバッチとしてグループ設定するバッチ設定手段を有し、
前記フォーム識別手段は、指定された前記フォームバッチに属するフォームの中から、前記入力された複数の文書画像それぞれに対して、一致するフォームを識別することを特徴とする請求項1に記載の文書登録システム。
Furthermore, it has a batch setting means for selecting a plurality of desired forms from a plurality of different forms stored in the form storage means, and setting a group as a form batch,
2. The document according to claim 1, wherein the form identifying unit identifies a matching form for each of the plurality of inputted document images from among the forms belonging to the designated form batch. Registration system.
前記エリアは、1つのフォームに対して複数設定され、該エリアそれぞれに異なるインデックス項目が対応付けられることを特徴とする請求項1又は2のいずれかに記載の文書登録システム。
3. The document registration system according to claim 1, wherein a plurality of the areas are set for one form, and different index items are associated with each area.
前記インデックス情報抽出手段で抽出されるインデックス情報は、前記文書画像の該エリアに対応する領域画像を文字認識処理することにより得た情報であることを特徴とする請求項1乃至3のいずれかに記載の文書登録システム。
4. The index information extracted by the index information extraction unit is information obtained by performing character recognition processing on a region image corresponding to the area of the document image. Document registration system described.
前記インデックス情報抽出手段で抽出されるインデックス情報は、前記文書画像の該エリアに対応する領域画像をバーコード認識処理することにより得た情報であることを特徴とする請求項1乃至4のいずれかに記載の文書登録システム。
5. The index information extracted by the index information extraction unit is information obtained by performing barcode recognition processing on a region image corresponding to the area of the document image. Document registration system described in 1.
文書画像にインデックスをつけて管理する文書管理部に対してネットワークを介して接続されたコンピュータを、
それぞれにエリアが設定される複数の異なるフォームを格納するフォーム格納手段、
前記文書管理部のインデックス構造を取得し、当該取得したインデックス構造に基づいて、入力された文書画像に関する情報とインデックス項目とを有するワークシートを作成するための、テンプレートを作成するテンプレート作成手段、
前記テンプレートから、前記文書管理部に複数の文書画像とインデックス情報とを一括して登録する際に使用するための、入力された文書画像に関する情報とインデックス項目とを有するワークシートを作成するワークシート作成手段、
複数の異なるフォームそれぞれについて、該フォームのエリアに、そのエリアから抽出されるインデックス情報が入力される前記ワークシートのインデックス項目を設定するエリア設定手段、
入力された複数の文書画像それぞれに対して、一致するフォームを識別するフォーム識別手段、
前記複数の文書画像それぞれに一致するフォームに設定されているエリアに基づいて、該文書画像それぞれのインデックス情報を抽出して、該エリアに対応付けられているインデックス項目に基づき、前記ワークシートにおける該文書画像それぞれのインデックス項目に該文書画像それぞれのインデックス情報を入力するインデックス情報抽出手段、
前記ワークシートで管理されている前記入力された複数の文書画像と、該文書画像それぞれのインデックス情報とを、前記ネットワークを介して接続されている前記文書管理部に一括して登録する登録手段、
として機能させるためのコンピュータ実行可能なプログラム。
A computer connected via a network to a document management unit that indexes and manages document images .
Form storage means for storing multiple different forms, each with an area set
A template creation means for creating a template for obtaining an index structure of the document management unit and creating a worksheet having information and index items related to an input document image based on the obtained index structure;
A worksheet for creating a worksheet having information about an input document image and index items to be used when registering a plurality of document images and index information in the document management unit from the template. Creation means,
For each of a plurality of different forms, an area setting means for setting an index item of the worksheet into which index information extracted from the area is input,
Form identification means for identifying a matching form for each of a plurality of input document images,
Based on the area set in the form matching each of the plurality of document images, the index information of each document image is extracted, and based on the index item associated with the area, Index information extraction means for inputting the index information of each document image to the index item of each document image;
A registration unit that collectively registers the plurality of input document images managed in the worksheet and index information of each of the document images in the document management unit connected via the network;
A computer-executable program that functions as a computer.
請求項6に記載のプログラムを格納した、コンピュータ読み取り可能な記憶媒体。 A computer-readable storage medium storing the program according to claim 6 .
JP2001275067A 2001-09-11 2001-09-11 Document registration system, method, program, and storage medium Expired - Fee Related JP5339657B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001275067A JP5339657B2 (en) 2001-09-11 2001-09-11 Document registration system, method, program, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001275067A JP5339657B2 (en) 2001-09-11 2001-09-11 Document registration system, method, program, and storage medium

Publications (2)

Publication Number Publication Date
JP2003085187A JP2003085187A (en) 2003-03-20
JP5339657B2 true JP5339657B2 (en) 2013-11-13

Family

ID=19099997

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001275067A Expired - Fee Related JP5339657B2 (en) 2001-09-11 2001-09-11 Document registration system, method, program, and storage medium

Country Status (1)

Country Link
JP (1) JP5339657B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021140562A (en) 2020-03-06 2021-09-16 富士フイルムビジネスイノベーション株式会社 Information processing apparatus and information processing program

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04153879A (en) * 1990-10-18 1992-05-27 Fujitsu Ltd Automatic retrieval system for document control information
US5448375A (en) * 1992-03-20 1995-09-05 Xerox Corporation Method and system for labeling a document for storage, manipulation, and retrieval
JP3153536B2 (en) * 1992-10-02 2001-04-09 キヤノン株式会社 Image storage control device
US6002798A (en) * 1993-01-19 1999-12-14 Canon Kabushiki Kaisha Method and apparatus for creating, indexing and viewing abstracted documents
JPH08263511A (en) 1995-03-24 1996-10-11 Toshiba Corp Image filing device and title information registering method
JPH10105654A (en) 1996-09-30 1998-04-24 Aibitsukusu Kk Character recognition device for form
JPH10171841A (en) 1996-12-12 1998-06-26 Canon Inc Device for managing document information and method therefor
JP3598711B2 (en) * 1997-02-21 2004-12-08 三菱電機株式会社 Document filing device
JPH11144027A (en) 1997-11-04 1999-05-28 Canon Inc System and method for file management and record medium
JPH11191112A (en) * 1997-12-25 1999-07-13 Ebara Corp Character extracting method by template
JP2001005831A (en) * 1999-06-24 2001-01-12 Ricoh Co Ltd Filing method and recording medium storing the method
JP2001084254A (en) * 1999-09-10 2001-03-30 Toshiba Corp Electronic filing system and filing method
JP2001147922A (en) 1999-11-18 2001-05-29 Canon Inc Device and method for managing document and storage medium

Also Published As

Publication number Publication date
JP2003085187A (en) 2003-03-20

Similar Documents

Publication Publication Date Title
JP4235411B2 (en) Document registration system, method, program, and storage medium
JP4261783B2 (en) Document registration system, method, program, and storage medium
JP5020781B2 (en) Setting takeover system and setting takeover method
US20100118344A1 (en) Image reader, image reading system and image reading method
US8593664B2 (en) Image processing apparatus, image processing system, and program for specifying destinations for image data transmission
US8810828B2 (en) Image forming device, image data control method, and program therefor
US9262112B2 (en) Image processing apparatus having file server function, and control method and storage medium therefor
KR20240020719A (en) Information processing apparatus, storage medium, and storing method
EP3890296B1 (en) Server, information processing method, and storage medium
EP2393275A1 (en) Information processing system, information processing apparatus, control method thereof, and program
JP4948641B1 (en) Information processing apparatus, transmission destination designation method, and program thereof
JP2006209261A (en) Method, apparatus, and program for displaying job of received business form
JP2018005295A (en) Program and mobile terminal
JP5969860B2 (en) Document management apparatus, control method thereof, and program
JP2016212568A (en) Document management system, document management method and program
JP5339657B2 (en) Document registration system, method, program, and storage medium
EP3143491B1 (en) Information processing system, information processing apparatus and information processing method
JP4147014B2 (en) Document processing system, method, program, and storage medium
JP2003085076A (en) System, method and program for document registration and storage medium
JP2006311184A (en) Fax data management system, method for controlling the same, program, and recording medium
JP2003087484A (en) Document processing system, method, program and storage medium
JP2003085195A (en) Document registering system, method, program and storage medium
US20110235106A1 (en) Information processing apparatus, information processing method, and storage medium
JP5988670B2 (en) Data processing apparatus, data processing method, and program
US20200021697A1 (en) Information processing apparatus, control method, and storage medium thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080903

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100201

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20100630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110517

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110719

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110920

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130806

LAPS Cancellation because of no payment of annual fees