JP2004171199A - Document management system and computer program - Google Patents

Document management system and computer program Download PDF

Info

Publication number
JP2004171199A
JP2004171199A JP2002335192A JP2002335192A JP2004171199A JP 2004171199 A JP2004171199 A JP 2004171199A JP 2002335192 A JP2002335192 A JP 2002335192A JP 2002335192 A JP2002335192 A JP 2002335192A JP 2004171199 A JP2004171199 A JP 2004171199A
Authority
JP
Japan
Prior art keywords
document
distribution
folder
distribution destination
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002335192A
Other languages
Japanese (ja)
Inventor
Akiko Kitayama
暁子 北山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2002335192A priority Critical patent/JP2004171199A/en
Publication of JP2004171199A publication Critical patent/JP2004171199A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Discrimination (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To simplify a user operation at the time of storing a scanner input document in a designated folder, and to introduce an automatic distributing function for executing proper document management. <P>SOLUTION: At the time of using an automatic distributing function, a user selects a distribution destination automatic selection folder 104 as distribution destination, and inputs an original document(whose predetermined area is applied with distribution destination folder information) from a scanner 20. The inputted document image file is temporarily stored through a distribution processing part 102 in the distribution destination automatic selection folder. The distribution destination folder applied to stored images is transmitted through an OCR processing part 105 and recognized as text data.The image data file is retransmitted to a distribution processing part with the recognition result as the distribution destination and redistributed to a distribution destination folder 103. Also, this system is provided with a procedure for executing automatic distribution suitable for the case that the scanner 20 is operated in the continuous reading mode of a plurality of originals. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明は、スキャナ(原稿読取装置)入力文書の管理に関し、より特定すると、スキャナにより読み取った文書画像を文書蓄積サーバー内の指定のフォルダに配信する際に、配信を自動化するための手段を備えた文書管理システム、該文書管理システムにおいて自動配信を実行するためのコンピュータプログラム及び該コンピュータプログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
従来からスキャナ(原稿読取装置)で読み取った文書画像を大容量の記憶手段に蓄積し、蓄積文書のデータベースを構築して、文書を管理するシステムが知られている。
このような文書管理システムとして、例えば、下記特許文献1,2を例示することができる。
【0003】
【特許文献1】
特開2002−163263号公報
【特許文献2】
特開平8−137971号公報
【0004】
特許文献1(文書管理システム)には、概略次の構成のシステムが示されている。文書をスキャナで読取り、読取ったイメージデータをOCR部でコードデータ(OCRデータ)に変換する。システム全体を制御する処理部は、イメージデータとこれに関連するOCRデータをあわせて文書データベースに記憶する。ユーザーは、入力部より、検索ワード(OCRデータを含むワード)を入力することによって、該当するデータのイメージデータを文書データベースから検索することができる。
特許文献2(光ディスク自動ファイリング方式および帳票データ管理装置)には、概略次の構成のシステムが示されている。帳票の画像を光学的に読取り、読取りデータを処理するOCRスキャナ部で、読み取った帳票画像に対し文字認識を行い、認識された文字データをコード変換し検索タイトルとして抽出し、一方、OCRスキャナ部で生成したデータを受け取るファイリング装置では、受け取った検索タイトル及び検索タイトルと対応付けられた文字以外のイメージデータをそれぞれのデータ保管場所(光ディスクなど)に登録し、帳票データを管理可能とする。
【0005】
ところで、原稿読取装置で読み取った文書画像を大容量の記憶手段に蓄積する際に、蓄積文書のデータベースをフォルダ構成により構築する場合がある。このようなシステムでは、原稿読取装置からの入力文書を指定のフォルダに格納する際に、従来からの方式では、文書読取り時にユーザーが配信先のフォルダを指定する入力操作を行う必要がある。また、この操作は、一つの文書に対して配信先を一つしか指定できないので、複数のフォルダに格納する場合には、配信先を変えるたびに配信先を指定し直す必要があり、例えば、10文書を10の配信先へ配信したい場合、ユーザーは「配信先の指定」と「読取」のための操作をそれぞれ10回ずつ行う必要があり、ユーザーにとって大変手間がかかる方法によらなければならない。
なお、上記特許文献1,2に示した文書管理システムでは、いずれも、読み取った文書画像に対しOCR処理を行い、OCR処理により得られた文字情報を蓄積文書に関連付けて管理情報として登録し、この文字情報を用いて蓄積文書の検索を可能にするとしており、OCR処理によって検索用のデータ(検索タイトルなど)をキー入力により行う場合の手間を省くことを意図したものである。
【0006】
【発明が解決しようとする課題】
しかしながら、上記特許文献1,2はいずれも検索用のデータの入力を自動化することを意識したもので、原稿読取装置からの入力文書を指定のフォルダに格納する際に、ユーザーが「配信先の指定」と「読取」のために行っていた上記した手間のかかる操作を解消することをねらいとするものではない。従って、原稿読取装置からの入力文書を指定のフォルダに格納する際の配信の自動化に対する期待に応えることができない。
本発明は、上述の従来技術の問題点に鑑みてなされたもので、その目的は、原稿読取装置からの入力文書を指定のフォルダに格納する際の配信の自動化により手間のかかるユーザー操作を無くし、適切な文書管理を行うことを可能にするための手段を備えた文書管理システム、該文書管理システムにおいて自動配信を実行するためのコンピュータプログラム及び該コンピュータプログラムを記録した記録媒体を提供することにある。
【0007】
【課題を解決するための手段】
請求項1の発明は、原稿読取装置と文書蓄積サーバーを通信インターフェースを介して接続し、前記原稿読取装置により読み取った文書画像を文書蓄積サーバー内の指定のフォルダに配信する手段を有する文書管理システムであって、前記配信手段は、原稿から読み取られた文書の特定の領域をOCR処理し、OCR処理により得られたテキスト情報により配信先フォルダを指定する機能を備えたことを特徴とする文書管理システムである。
【0008】
請求項2の発明は、請求項1に記載された文書管理システムにおいて、前記配信手段は、読み取り文書に対する指示の有無によりOCR処理の対象画像であるか否かを判断し、OCR処理の対象画像であると判断された読み取り文書だけに前記OCR処理を行い、OCR処理の対象画像でないと判断された画像に対しては、直前の対象画像と同じ配信先フォルダを指定する機能を備えたことを特徴とするものである。
【0009】
請求項3の発明は、請求項1に記載された文書管理システムにおいて、前記配信手段は、読み取り入力が原稿か又は配信の指示を行うための仕切り紙かを判断し、仕切り紙であると判断された読み取り文書だけに前記OCR処理を行い、仕切り紙ではないと判断された画像に対しては、直前の仕切り紙に指示されたと同じ配信先フォルダを指定する機能を備えたことを特徴とするものである。
【0010】
請求項4の発明は、原稿読取装置により読み取った文書画像を文書蓄積サーバー内の指定のフォルダに配信するためのコンピュータプログラムであって、原稿から読み取られた文書の特定の領域をOCR処理し、OCR処理により得られたテキスト情報により配信先フォルダを指定する手順を備えたことを特徴とするコンピュータプログラムである。
【0011】
請求項5の発明は、請求項4に記載されたコンピュータプログラムであって、読み取り文書に対する指示の有無によりOCR処理の対象画像であるか否かを判断し、OCR処理の対象画像であると判断された読み取り文書だけに前記OCR処理を行い、OCR処理の対象画像でないと判断された画像に対しては、直前の対象画像と同じ配信先フォルダを指定する手順を備えたことを特徴とするコンピュータプログラムである。
【0012】
請求項6の発明は、請求項4に記載されたコンピュータプログラムであって、読み取り入力が原稿か又は配信の指示を行うための仕切り紙かを判断し、仕切り紙であると判断された読み取り文書だけに前記OCR処理を行い、仕切り紙ではないと判断された画像に対しては、直前の仕切り紙に指示されたと同じ配信先フォルダを指定する手順を備えたことを特徴とするコンピュータプログラムである。
【0013】
請求項7の発明は、請求項4乃至6のいずれかに記載されたコンピュータプログラムを記録した記録媒体である。
【0014】
【発明の実施の形態】
本発明を添付する図面とともに示す以下の実施形態に基づき説明する。
文書管理システムに係わる実施形態として、ここでは原稿読取装置と文書蓄積サーバーをネットワーク接続し、文書蓄積サーバー内に原稿読取装置からの入力文書を自動配信する機能を備えるシステム構成を例示する。
図1は、本発明の実施形態に係わる文書管理システムの構成を示すブロック図である。
図1に示すように、本実施形態の文書管理システムは、文書蓄積サーバー10、原稿読取装置(スキャナ)20、クライアントコンピュータ30をシステム要素とし、これらをネットワーク50に接続することによりシステムを構成する。
図1に示す文書管理システムでは、システムに入力される文書を文書蓄積サーバー10の文書管理データベース102に蓄積し、クライアントコンピュータ30からの取得要求により蓄積文書を供給する。文書蓄積サーバー10は、配信処理部101を有し、配信処理部101を介して、入力装置の一つである原稿読取装置20から配信先を指定して送られて来る文書を受け入れ、文書管理データベース102の配信先フォルダ103に蓄積し、蓄積された文書を管理し、クライアントコンピュータ30からの取得要求に応える。また、本発明に特有の自動配信機能(スキャン画像データの蓄積フォルダへの自動配信機能)を実現するために、文書蓄積サーバー10には、OCR処理部105と、文書管理データベース102内に配信先自動選択フォルダ104を備える。
【0015】
この文書管理システムにおける自動配信機能は、原稿読取装置20からの入力文書を文書蓄積サーバー10内に構築する文書管理データベースの指定フォルダに配信するためのもので、自動配信機能を動作させるためには、その指示を必要とする。具体的には、原稿を原稿読取装置20にセットし処理動作を開始するときに、自動配信の対象とする原稿とするか否かをユーザーが指示することにより実施する方法を採用する。例えば、原稿読取装置20の操作パネルに対話方式の入力操作部を備え、そこで原稿読取文書を自動配信するか、蓄積すべきフォルダを指定して配信するかを選択するキー操作を行うことにより指示する。なお、他の例として、原稿読取装置20の操作パネルのキー操作による指示と同等の機能を、文書蓄積サーバー10側が持つ自動配信機能による後述するOCR処理で行うようにすることも可能であるが、ここでは、原稿読取装置20側のキー操作により、自動配信を指示する方法による。
また、自動配信を選択する場合、配信先フォルダを指定する必要がある。本発明では、配信先フォルダの指定を、原稿文書にフォルダ情報を記載しておく方法をとり、システム側では文書に記された文字等で表現されたフォルダ情報から配信先フォルダを認識することにより、システムの動作条件として取り込む。本実施形態では、この配信先フォルダを認識する処理を、スキャナ読取文書に対するOCR処理により実施する。ここでは、このOCR処理による認識を正確かつ効率よく行うために、原稿文書の特定の領域(ここでは、矩形領域とする)を定め、そこにフォルダ識別情報を表す文字等を記載する。従って、自動配信を選択してスキャナ入力される原稿文書には、原則として文書の特定の領域には、予め配信先フォルダの識別情報が示されている。
【0016】
次に、上記文書管理システム(図1)における自動配信機能に係わる実施形態を下記[実施形態1]〜「実施形態3」に詳細に説明する。
「実施形態1」
本実施形態は、配信先を指定するフォルダ情報を原稿文書に記載し、スキャナにより読取った原稿文書に対するOCR処理により配信先フォルダを認識し(テキスト情報として)、認識したフォルダへの配信処理を実現する基本的な自動配信機能を示すものである。
図2は、本実施形態における自動配信機能の動作時の配信処理フローを示す図である。なお、図2に示す配信処理によるデータのフローは、図1のシステムブロック図の矢印(破線)にて示す。
図2を参照して実施システムにおける本実施形態の自動配信機能による配信処理を説明すると、先ず、ユーザーが原稿読取装置(スキャナ)20の操作パネルのキー操作を行って自動配信を選択し、原稿をスキャナ20にセットした後にスタートボタンを押すと、スキャナ20が読み取り動作を開始し、読み取った文書画像(画像データファイル)をネットワーク経由で文書蓄積サーバー10の配信処理部101に送信する(Step11)。なお、このときにユーザーにより行われる自動配信の選択操作は、配信先フォルダとして配信先自動選択フォルダ104を指定して配信する指示を行うことに相当する(自動配信を選択しない場合には、特定の配信先フォルダ103を指定する入力操作を行うことになる)。また、スキャナ20はADF(自動原稿搬送装置)を装備しており、原稿トレイに複数枚の原稿を受け入れ、受け入れた複数枚の原稿を自動で連続して(一度の動作で)読み取ることが可能である。連続モードで読み取る場合に、特定の配信先フォルダ103を指定した場合には、セットした複数枚の原稿全てがそのフォルダに配信されるが、自動配信を選択した場合には、各原稿文書の特定の領域に記載されたそれぞれの配信先フォルダに、以下の処理フローに従って自動配信する。
【0017】
次に、文書蓄積サーバー10の配信処理部101は、Step11の処理によりスキャナ20から配信先フォルダを指定して送信されてくる蓄積要求を受け取る(Step12)。配信処理部101は、受け取った蓄積要求を解読し、その要求に示されている配信先フォルダに画像データファイルを配信し、格納する。即ち、スキャナ20の操作入力による指定が、特定のフォルダである場合には直ちにそこに指定された配信先フォルダ103に、他方、自動配信である場合には配信先自動選択フォルダ104に一旦格納する(Step13)。
この後、自動配信の対象として一旦配信先自動選択フォルダ104に格納された画像データファイルに対する自動配信処理を以下の手順で行う。
自動配信処理は、配信先自動選択フォルダ104に対象とするファイルがあることを確認し(Step14−yes)、ファイルごとに自動配信のために必要となる一連の処理ステップを実行していく。その処理ステップの始めに、OCR処理部105により対象画像データ(原稿文書)に対するOCR処理を行う(Step15)。
このOCR処理では、原稿文書(スキャナ読取画像)の特定の矩形領域を切り出し、そこに配信先フォルダを指定するために予め記されることになっている文字等の認識処理を行う。このOCR処理による認識結果は、テキストデータの形式で得られるようにしておき、こうして得られたデータを配信先のフォルダ情報を表すデータとして用いる。
【0018】
本例の処理フローによれば、次いで、OCR処理により抽出・認識されたテキストデータを吟味し、その結果、配信先が特定できたか、否かをチェックする(Step16)。ここで、配信先が特定できた場合には、OCR処理により抽出されたテキストデータを配信先として設定する(Step17)。
この後、配信先が設定された画像データファイルは、再度、配信処理部101へ送られ、これを受け取る配信処理部101は、上述のスキャナ20からの蓄積要求に対すると同様に、受け取った要求を解読し、その要求に示されている配信先フォルダ(OCR処理を経て設定し直された配信先)103に画像データファイルを配信し、格納する(Step19)。
一方、OCR処理により抽出・認識されたテキストデータを吟味した結果、配信先が特定できなかった場合には(Step16−NO)、予め配信先フォルダ103の一つとして用意しておいた未転送フォルダを配信先として設定する(Step18)。なお、未転送フォルダを設けた理由は、OCR処理による認識率は完全ではないので、認識結果から配信先が特定できない場合が生じる可能性があり、このような場合を想定して配信先が特定できないファイルを一旦格納し、その後の対応を可能にするためである。
配信先を未転送フォルダに設定された画像データファイルは、再度、配信処理部101を経由して、上述のスキャナ20からの蓄積要求に対すると同様に、設定された未転送フォルダに配信、格納される(Step19)。
Step14〜Step19の処理ステップは、自動配信の対象として配信先自動選択フォルダ104に格納された画像データ(原稿文書)ファイルの全てに行うので、対象となる一枚のファイルに対する処理後に、Step14に戻して、次のファイルの処理を行う。ファイルがなければ(Step14−NO)、本フローの処理を終了する。
【0019】
「実施形態2」
本実施形態は、配信先を指定するフォルダ情報を原稿文書に記載し、スキャナにより読取った原稿文書に対するOCR処理によりテキスト情報として認識した配信先フォルダへの配信処理を実現するという点で上記「実施形態1」と同様であるが、本実施形態では、1文書が複数枚の原稿からなる場合に、先頭の原稿に対する自動配信の指定のみで、複数枚からなる文書全体に対して指定の配信を行うことを意図するものである。
図3は、本実施形態における自動配信機能の動作時の配信処理フローを示す図である。なお、本例の配信処理によるデータのフローは、図1のシステムブロック図の矢印(破線)にて示す。
図3を参照して実施システムにおける本実施形態の自動配信機能による配信処理を説明すると、先ず、ユーザーが原稿読取装置(スキャナ)20の操作パネルのキー操作を行って自動配信を選択し、原稿をスキャナ20にセットした後にスタートボタンを押すと、スキャナ20が読み取り動作を開始し、読み取った文書画像(画像データファイル)をネットワーク経由で文書蓄積サーバー10の配信処理部101に送信する(Step21)。なお、このときにユーザーにより行われる自動配信の選択操作は、配信先フォルダとして配信先自動選択フォルダ104を指定して配信する指示を行うことに相当する(自動配信を選択しない場合には、特定の配信先フォルダ103を指定する入力操作を行うことになる)。また、スキャナ20はADF(自動原稿搬送装置)を装備しており、原稿トレイに複数枚の原稿を受け入れ、受け入れた複数枚の原稿を自動で連続して(一度の動作で)読み取ることが可能である。連続モードを用いる場合には、連続モードで読み取る複数枚の原稿の全体を一つの文書とみなして扱うようにするので、先頭の画像データ(文書原稿)に対して自動配信を選択したときには、一つの文書として扱われる複数枚の原稿から読み取られた各々の画像データ(文書原稿)に対して自動配信の設定をして、配信処理部101に送信する。
【0020】
次に、文書蓄積サーバー10の配信処理部101は、Step21の処理によりスキャナ20から複数枚の原稿を一つの文書とみなし自動配信の設定をして、送信されてくる蓄積要求を受け取る(Step22)。配信処理部101は、受け取った蓄積要求を解読し、その要求に示されている配信先フォルダに画像データファイルを配信し、格納する。ここでは、一つの文書とみなされた複数枚の原稿から読み取られた各々の画像データ(文書原稿)に対して自動配信、即ち、配信先フォルダとして配信先自動選択フォルダ104が指定されているので、このフォルダに一旦格納する(Step23)。
この後、自動配信の対象として一旦配信先自動選択フォルダ104に格納された画像データファイルに対する自動配信処理を以下の手順で行う。
自動配信処理は、配信先自動選択フォルダ104に対象とするファイルがあることを確認し(Step24−yes)、ファイルごとに自動配信のために必要となる一連の処理ステップを実行していく。
この自動配信処理ステップの始めに、配信先フォルダのデフォルト設定を行う(Step25)。これは、複数枚の原稿からなる一つの文書の先頭の画像データのみに自動配信先のフォルダを指示するだけで2枚目以降の原稿に対する指示を省略できるような処理を可能にするために必要な処理であり、デフォルト配信先フォルダとして、前回のファイルに対して設定したフォルダを設定する。
この後、OCR処理部105により対象画像データ(原稿文書)に対するOCR処理を行うが、本実施形態では先頭の画像データのみにOCR処理を適用すればよいので、処理に先立ち、OCR処理の対象画像であるか否かをチェックし(Step26)、処理を分岐する。
OCR処理の対象画像である場合(Step26−yes)、OCR処理部105により対象画像データ(原稿文書)に対するOCR処理を行う(Step27)。このOCR処理では、原稿文書(スキャナ読取画像)の特定の矩形領域を切り出し、そこに配信先フォルダを指定するために予め記されることになっている文字等の認識処理を行う。このOCR処理による認識結果は、配信先のフォルダ情報をテキストデータ形式のデータとして得る。
【0021】
次いで、OCR処理により抽出・認識されたテキストデータを吟味し、その結果、配信先が特定できたか、否かをチェックする(Step28)。配信先が特定できた場合には、OCR処理により抽出されたテキストデータを配信先として設定する(Step29)。
この後、配信先が設定された画像データファイルは、再度、配信処理部101へ送られ、これを受け取る配信処理部101は、上述のスキャナ20からの蓄積要求に対すると同様に、受け取った要求を解読し、その要求に示されている配信先フォルダ(OCR処理を経て設定し直された配信先)103に画像データファイルを配信し、格納する(Step31)。
一方、OCR処理により抽出・認識されたテキストデータを吟味した結果、配信先が特定できなかった場合には(Step28−NO)、予め配信先フォルダ103の一つとして用意しておいた未転送フォルダを配信先として設定する(Step30)。なお、未転送フォルダを設けた理由は、OCR処理による認識率は完全ではないので、認識結果から配信先が特定できない場合が生じる可能性があり、このような場合を想定して配信先が特定できないファイルを一旦格納し、その後の対応を可能にするためである。
配信先を未転送フォルダに設定された画像データファイルは、再度、配信処理部101を経由して、上述のスキャナ20からの蓄積要求に対すると同様に、設定された未転送フォルダに配信、格納される(Step31)。
【0022】
他方、Step26で対象画像が連続モードで読み取られた2枚目以降の原稿画像データ(文書の特定の矩形領域に配信先フォルダを指定していない画像データ)、即ちOCR処理の対象画像データではない場合(Step26−yes)、この画像データは、何の処理もされることなく、Step25でデフォルト設定された配信先フォルダへ配信、格納される(Step31)。
Step24〜Step31の処理ステップは、自動配信の対象として配信先自動選択フォルダ104に格納された画像データ(原稿文書)ファイルの全てに行うので、対象となる一枚のファイルに対する処理後に、Step14に戻して、次のファイルの処理を行う。ここに、先頭ファイル以外のファイルに対してはOCR処理をせず、Step25でデフォルト設定された配信先フォルダ、つまり前回のファイルに対して設定したフォルダを適用するので、結果的として、先頭ファイルと同じ配信先ファイルに複数枚からなる文書全体が配信されることになる。
配信先自動選択フォルダ104に格納された画像データファイルがなくなれば(Step24−NO)、本フローの処理を終了する。
【0023】
「実施形態3」
本実施形態は、配信先を指定するフォルダ情報を原稿文書に記載し、スキャナにより読取った原稿文書に対するOCR処理によりテキスト情報として認識した配信先フォルダへの配信処理を実現するという点で上記「実施形態1」と同様であるが、本実施形態では、1文書が複数枚の原稿からなる場合に、対象となる文書とは別に仕切り紙よりなる原稿をスキャン入力する文書の先頭に挿入し、仕切り紙に対して自動配信を指定するだけで、文書全体を配信することを意図するものである。
図4は、本実施形態における自動配信機能の動作時の配信処理フローを示す図である。なお、本例の配信処理によるデータのフローは、図1のシステムブロック図の矢印(破線)にて示す。
図4を参照して実施システムにおける本実施形態の自動配信機能による配信処理を説明すると、先ず、ユーザーが原稿読取装置(スキャナ)20の操作パネルのキー操作を行って自動配信を選択し、原稿(本例における原稿は、先頭の仕切り紙と実際に蓄積する文書とからなる)をスキャナ20にセットした後にスタートボタンを押すと、スキャナ20が読み取り動作を開始し、読み取った文書画像(画像データファイル)をネットワーク経由で文書蓄積サーバー10の配信処理部101に送信する(Step41)。なお、このときにユーザーにより行われる自動配信の選択操作は、配信先フォルダとして配信先自動選択フォルダ104を指定して配信する指示を行うことに相当する(自動配信を選択しない場合には、特定の配信先フォルダ103を指定する入力操作を行うことになる)。また、スキャナ20はADF(自動原稿搬送装置)を装備しており、原稿トレイに複数枚の原稿を受け入れ、受け入れた複数枚の原稿を自動で連続して(一度の動作で)読み取ることが可能である。連続モードを用いる場合には、連続モードで読み取る複数枚の原稿の全体を一つの文書とみなして扱うようにするので、先頭の画像データ(仕切り紙原稿)に対して自動配信を選択したときには、一つの文書として扱われる複数枚の原稿から読み取られた各々の画像データ(文書原稿)に対して自動配信の設定をして、配信処理部101に送信する。
【0024】
次に、文書蓄積サーバー10の配信処理部101は、Step41の処理によりスキャナ20から複数枚の原稿を一つの文書とみなし自動配信の設定をして、送信されてくる蓄積要求を受け取る(Step42)。配信処理部101は、受け取った蓄積要求を解読し、その要求に示されている配信先フォルダに画像データファイルを配信し、格納する。ここでは、一つの文書とみなされた複数枚の原稿から読み取られた各々の画像データ(文書原稿)に対して自動配信、即ち、配信先フォルダとして配信先自動選択フォルダ104が指定されているので、このフォルダに一旦格納する(Step43)。
この後、自動配信の対象として一旦配信先自動選択フォルダ104に格納された画像データファイルに対する自動配信処理を以下の手順で行う。
自動配信処理は、配信先自動選択フォルダ104に対象とするファイルがあることを確認し(Step44−yes)、ファイルごとに自動配信のために必要となる一連の処理ステップを実行していく。
この自動配信処理ステップの始めに、配信先フォルダのデフォルト設定を行う(Step45)。これは、複数枚の原稿からなる一つの文書の先頭の画像データ(仕切り紙)のみに自動配信先のフォルダを指示するだけで2枚目以降の原稿に対する指示を省略できるような処理を可能にするために必要な処理であり、デフォルト配信先フォルダとして、前回のファイルに対して設定したフォルダを設定する。
この後、OCR処理部105により対象画像データに対するOCR処理を行うが、本実施形態では仕切り紙の画像データのみにOCR処理を適用すればよいので、処理に先立ち、OCR処理が必要な仕切り紙の画像であるか否かをチェックし(Step46)、処理を分岐する。
OCR処理の必要な仕切り紙の画像である場合(Step46−yes)、OCR処理部105により対象画像データ(原稿文書)に対するOCR処理を行う(Step47)。このOCR処理では、仕切り紙のスキャナ読取画像の特定の矩形領域を切り出し、そこに配信先フォルダを指定するために予め記されることになっている文字等の認識処理を行う。なお、仕切り紙には、仕切り紙であることを認識するための情報と、配信先フォルダを指定するための情報を担持させるだけでよい。このOCR処理による認識結果は、配信先のフォルダ情報をテキストデータ形式のデータとして得る。
【0025】
次いで、OCR処理により抽出・認識されたテキストデータを吟味し、その結果、配信先が特定できたか、否かをチェックする(Step48)。配信先が特定できた場合には、OCR処理により抽出されたテキストデータを配信先として設定する(Step49)。
一方、OCR処理により抽出・認識されたテキストデータを吟味した結果、配信先が特定できなかった場合には(Step48−NO)、予め配信先フォルダ103の一つとして用意しておいた未転送フォルダを配信先として設定する(Step50)。なお、未転送フォルダを設けた理由は、OCR処理による認識率は完全ではないので、認識結果から配信先が特定できない場合が生じる可能性があり、このような場合を想定して配信先が特定できないファイルを一旦格納し、その後の対応を可能にするためである。
配信先フォルダの設定処理を終えた後、配信先自動選択フォルダ104に格納された仕切り紙ファイルを削除する(Step49)。仕切り紙ファイルは、自動配信処理の対象とするファイルの一つとして配信先自動選択フォルダ104に一旦格納されたもので、配信先フォルダの設定用に専ら用いられるファイルであり、実際に蓄積を必要とするデータを持っていないので、使用後に削除し、配信の対象から除外する。
【0026】
仕切り紙データファイルを削除後、Step44に戻り、連続モードでスキャン入力された文書の次の画像データファイルの配信処理に移行する。この配信処理においても始めに、配信先フォルダのデフォルト設定を行う(Step45)。このときには、上述したように、前回のファイルに対して設定したフォルダを設定するので、仕切り紙ファイルに対するOCR処理を経由して設定された配信先フォルダが設定される。
この後、Step46で対象画像が仕切り紙の画像であるか否かがチェックされるが、仕切り紙以外は配信対象画像として扱われる(Step46−NO)。配信先が設定された自動配信の対象となる画像データファイルは、再度、配信処理部101へ送られ、これを受け取る配信処理部101は、上述のスキャナ20からの蓄積要求に対すると同様に、受け取った要求を解読し、その要求に示されている配信先フォルダ(仕切り紙で指定された配信先フォルダ、もしくは未転送フォルダで設定し直された配信先)103に画像データファイルを配信し、格納する(Step52)。
Step44→Step45→Step46→Step52の処理ステップは、自動配信の対象として配信先自動選択フォルダ104に格納された画像データ(原稿文書)ファイルの仕切り紙以外の全てに行うので、対象となる一枚のファイルに対する処理後に、Step44に戻して、次のファイルの処理を行う。このループ処理の対象となるファイルに対してはOCR処理をせず、Step45でデフォルト設定された配信先フォルダ、つまり前回のファイルに対して設定したフォルダを適用するので、結果的として、仕切り紙で指定された配信先フォルダ、もしくは未転送フォルダへ複数枚からなる文書全体が配信されることになる。
配信先自動選択フォルダ104に格納された画像データファイルがなくなれば(Step44−NO)、本フローの処理を終了する。
【0027】
上述の実施形態(図1)に示したように、本発明に係わる文書管理システムは、文書蓄積サーバー10、原稿読取装置20、クライアントコンピュータをネットワーク50に接続するシステム構成で実施することができるが、この実施形態のシステム構成に限らず、原稿読取機能と文書蓄積サーバー機能を一つの装置内に組み込んだ構成のファイリング装置として実施することや、文書管理データベースから自動配信機能を独立させ、それぞれをネットワークに接続するシステム構成をとるようにしても良い。
さらに、このような実施形態で本発明に係わる文書管理システムを構成する場合、システムに装備する自動配信機能(図1においては、構成要素を機能ブロック図として示し、図2乃至4の処理フローにて配信処理手順を示した)を実現するための情報処理手段としてコンピュータを用いることが可能である。コンピュータを用いて実施システムを構成する場合、構成要素としてCPUと、メモリと、ハードディスクドライブと、スキャナ、キーボード、マウス等を要素とする入力装置、CD−ROMドライブと、ディスプレイと、フレキシブルディスクドライブと、通信装置などを用意し、これらをバス接続したコンピュータシステムとして構成することができる。コンピュータシステムにより構成する場合、記憶手段としてのメモリ、ハードディスクドライブ、CD−ROMドライブ、フレキシブルディスクドライブが用いる記憶媒体の一部には、本発明に係わる自動配信機能を実現するための手順(図2乃至4の処理フロー、参照)を示したプログラム(ソフトウェア)を記録する。
【0028】
【発明の効果】
(1) 請求項1,4の発明に対応する効果
原稿から読み取られた文書の特定の領域をOCR処理し、OCR処理により得られたテキスト情報により配信先フォルダを指定する機能を備えたことにより、システムの利用時にユーザーが行う原稿読取装置に対する操作入力を簡略化することが可能になり、例えば複数枚の原稿をADFによる連続モードで入力する場合にも、1回の自動配信の指示操作入力を行うだけで、全部の原稿をそれぞれの指定配信先フォルダに配信することができるようになるので、ユーザーの手間が大幅に削減され、システムの性能を向上させることが可能になる。
(2) 請求項2,5の発明に対応する効果
OCR処理の対象画像であると判断された読み取り文書だけにOCR処理を行い、OCR処理の対象画像でないと判断された画像に対しては、直前の対象画像と同じ配信先フォルダを指定する機能を備えたことにより、1文書が複数枚の原稿からなる場合に、先頭の原稿に対する自動配信の指定のみで、2枚目以降を添付資料として扱う(配信先フォルダの指定なし)ことが可能になり、OCR処理等を含め手順が簡略化され、システムの性能を向上させることが可能になる。
(3) 請求項3,6の発明に対応する効果
仕切り紙であると判断された読み取り文書だけにOCR処理を行い、仕切り紙ではないと判断された画像に対しては、直前の仕切り紙に指示されたと同じ配信先フォルダを指定する機能を備えたことにより、仕切り紙から配信先を取得し、仕切り紙に間に挟まれた文書は、前の仕切り紙から取得した配信先自動的に配信されるので、蓄積文書に対する配信先フォルダの指定を行うことなく、仕切り紙をはさんだ文書をまとめて1度だけ自動配信の指示操作を行えばよいので、ユーザーの手間が大幅に削減され、システムの性能を向上させることが可能になる。
(4) 請求項7の発明に対応する効果
請求項4乃至6のいずれかに記載されたコンピュータプログラムを記録した記録媒体を介して該プログラムをコンピュータにインストールすることにより、上記(1)〜(3)の効果を容易に実現することが可能になる。
【図面の簡単な説明】
【図1】本発明の実施形態に係わる文書管理システムの構成を示すブロック図である。
【図2】図1の文書管理システムにおける自動配信機能(実施形態1)の動作時の配信処理フローを示す図である。
【図3】図1の文書管理システムにおける自動配信機能(実施形態2)の動作時の配信処理フローを示す図である。
【図4】図1の文書管理システムにおける自動配信機能(実施形態3)の動作時の配信処理フローを示す図である。
【符号の説明】
10…文書蓄積サーバー、 20…原稿読取装置(スキャナ)、
101…配信処理部、 102…文書管理データベース、
103…配信先フォルダ、 104…配信先自動選択フォルダ、
105…OCR処理部。
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to management of a document input by a scanner (document reading device), and more specifically, includes means for automating the delivery when delivering a document image read by the scanner to a designated folder in a document storage server. Document management system, a computer program for executing automatic distribution in the document management system, and a recording medium on which the computer program is recorded.
[0002]
[Prior art]
2. Description of the Related Art Conventionally, there has been known a system for storing document images read by a scanner (document reading device) in a large-capacity storage unit, constructing a database of stored documents, and managing documents.
Patent Documents 1 and 2 below can be exemplified as such a document management system.
[0003]
[Patent Document 1]
JP 2002-163263 A
[Patent Document 2]
JP-A-8-137971
[0004]
Patent Document 1 (document management system) discloses a system having the following configuration. The document is read by a scanner, and the read image data is converted into code data (OCR data) by an OCR unit. A processing unit that controls the entire system stores the image data and the associated OCR data together in the document database. By inputting a search word (a word including OCR data) from the input unit, the user can search for image data of the corresponding data from the document database.
Patent Literature 2 (automatic optical disc filing method and form data management device) discloses a system having the following configuration. An OCR scanner unit that optically reads an image of a form and processes the read data, performs character recognition on the read form image, converts the recognized character data into a code, and extracts it as a search title. The filing apparatus that receives the data generated in step (1) registers the received search title and the image data other than the characters associated with the search title in the respective data storage locations (such as optical disks) so that the form data can be managed.
[0005]
When a document image read by a document reading device is stored in a large-capacity storage unit, a database of stored documents may be constructed in a folder configuration. In such a system, when storing an input document from a document reading apparatus in a designated folder, in a conventional method, a user needs to perform an input operation to designate a destination folder when reading a document. In addition, since this operation can specify only one distribution destination for one document, when storing in a plurality of folders, it is necessary to specify the distribution destination each time the distribution destination is changed. For example, In order to distribute 10 documents to 10 distribution destinations, the user needs to perform the operations of “designating the distribution destination” and “reading” 10 times each, and the user must use a method that is very troublesome. .
In each of the document management systems disclosed in Patent Documents 1 and 2, OCR processing is performed on a read document image, and character information obtained by the OCR processing is registered as management information in association with a stored document. The retrieval of stored documents is made possible by using this character information, and is intended to save the trouble of performing retrieval data (such as a retrieval title) by key input through OCR processing.
[0006]
[Problems to be solved by the invention]
However, the above Patent Documents 1 and 2 are both conscious of automating the input of search data, and when storing an input document from a document reading device in a designated folder, the user is prompted to enter a "delivery destination". It is not intended to eliminate the troublesome operation described above for “designation” and “reading”. Therefore, it cannot meet the expectation for automation of distribution when storing an input document from a document reading device in a specified folder.
SUMMARY OF THE INVENTION The present invention has been made in view of the above-described problems of the related art, and has as its object to eliminate troublesome user operations by automating distribution when an input document from a document reading device is stored in a specified folder. To provide a document management system having means for enabling appropriate document management, a computer program for executing automatic distribution in the document management system, and a recording medium on which the computer program is recorded. is there.
[0007]
[Means for Solving the Problems]
The document management system according to claim 1, further comprising means for connecting the document reading device and the document storage server via a communication interface, and distributing a document image read by the document reading device to a designated folder in the document storage server. Wherein the distribution means has a function of performing an OCR process on a specific area of the document read from the document and designating a distribution destination folder based on text information obtained by the OCR process. System.
[0008]
According to a second aspect of the present invention, in the document management system according to the first aspect, the distribution unit determines whether or not the image is a target image of the OCR process based on presence / absence of an instruction for the read document. The above-mentioned OCR processing is performed only on the read document determined to be the same, and for the image determined not to be the target image of the OCR processing, a function of designating the same destination folder as the immediately preceding target image is provided. It is a feature.
[0009]
According to a third aspect of the present invention, in the document management system according to the first aspect, the distribution unit determines whether the read input is a document or a partition sheet for giving a distribution instruction, and determines that the input is a partition sheet. The OCR process is performed only on the read document, and for an image determined not to be a partition sheet, a function of designating the same distribution destination folder as instructed on the immediately preceding partition sheet is provided. Things.
[0010]
According to a fourth aspect of the present invention, there is provided a computer program for delivering a document image read by a document reading device to a designated folder in a document storage server, wherein a specific area of the document read from the document is subjected to OCR processing, A computer program characterized by comprising a procedure for specifying a distribution destination folder based on text information obtained by OCR processing.
[0011]
According to a fifth aspect of the present invention, there is provided the computer program according to the fourth aspect, wherein it is determined whether or not the image is a target image of the OCR process based on the presence / absence of an instruction for the read document, and is determined as the target image of the OCR process. A computer which performs the OCR process only on the read document obtained, and designates the same destination folder as the immediately preceding target image for an image determined not to be the target image of the OCR process. It is a program.
[0012]
According to a sixth aspect of the present invention, there is provided the computer program according to the fourth aspect, wherein the read input is determined to be a document or a partition sheet for giving a distribution instruction, and the read document determined to be a partition sheet is determined. A computer program for performing the OCR process only for the image and determining, for an image determined not to be a partition sheet, the same distribution destination folder as instructed on the immediately preceding partition sheet. .
[0013]
A seventh aspect of the present invention is a recording medium recording the computer program according to any one of the fourth to sixth aspects.
[0014]
BEST MODE FOR CARRYING OUT THE INVENTION
The present invention will be described based on the following embodiments shown in the accompanying drawings.
As an embodiment relating to the document management system, a system configuration having a function of connecting a document reading device and a document storage server over a network and automatically distributing an input document from the document reading device to the document storage server will be exemplified here.
FIG. 1 is a block diagram illustrating a configuration of a document management system according to an embodiment of the present invention.
As shown in FIG. 1, the document management system according to the present embodiment includes a document storage server 10, a document reading device (scanner) 20, and a client computer 30 as system elements, and connects them to a network 50 to configure the system. .
In the document management system shown in FIG. 1, a document input to the system is stored in the document management database 102 of the document storage server 10, and the stored document is supplied in response to an acquisition request from the client computer 30. The document storage server 10 has a distribution processing unit 101, receives a document transmitted from the document reading device 20 which is one of the input devices by designating a distribution destination via the distribution processing unit 101, and performs document management. It accumulates in the distribution destination folder 103 of the database 102, manages the accumulated documents, and responds to an acquisition request from the client computer 30. Further, in order to realize an automatic distribution function (automatic distribution function of scan image data to a storage folder) unique to the present invention, the document storage server 10 includes an OCR processing unit 105 and a distribution destination in the document management database 102. An automatic selection folder 104 is provided.
[0015]
The automatic distribution function in this document management system is for distributing an input document from the document reading device 20 to a designated folder of a document management database constructed in the document storage server 10. To operate the automatic distribution function, Need that instruction. Specifically, when a document is set on the document reading apparatus 20 and a processing operation is started, a method is employed in which a user instructs whether or not to set the document as a target of automatic distribution. For example, the operation panel of the document reading device 20 is provided with an interactive input operation unit, and instructed by performing a key operation to select whether to automatically distribute the document reading document or to specify a folder to be stored and to distribute the document. I do. As another example, a function equivalent to an instruction by a key operation on the operation panel of the document reading device 20 may be performed by an OCR process described later using an automatic distribution function of the document storage server 10. Here, a method of instructing automatic distribution by a key operation on the document reading device 20 is used.
When automatic distribution is selected, it is necessary to specify a distribution destination folder. In the present invention, a method of designating a distribution destination folder is described in which folder information is described in a manuscript document, and the system recognizes the distribution destination folder from folder information expressed by characters or the like described in the document by As operating conditions of the system. In the present embodiment, the process of recognizing the distribution destination folder is performed by the OCR process on the document read by the scanner. Here, in order to perform the recognition by the OCR process accurately and efficiently, a specific area (here, a rectangular area) of the original document is determined, and characters or the like representing the folder identification information are described therein. Therefore, in the original document input by the scanner after selecting the automatic distribution, the identification information of the distribution destination folder is indicated in advance in a specific area of the document in principle.
[0016]
Next, embodiments relating to the automatic distribution function in the document management system (FIG. 1) will be described in detail in [Embodiment 1] to [Embodiment 3].
"Embodiment 1"
In the present embodiment, the folder information specifying the distribution destination is described in the original document, the distribution folder is recognized (as text information) by OCR processing on the original document read by the scanner, and the distribution processing to the recognized folder is realized. 3 shows a basic automatic distribution function to be performed.
FIG. 2 is a diagram illustrating a distribution processing flow during the operation of the automatic distribution function according to the present embodiment. The data flow by the distribution processing shown in FIG. 2 is indicated by an arrow (broken line) in the system block diagram of FIG.
The distribution processing by the automatic distribution function of the present embodiment in the embodiment system will be described with reference to FIG. 2. First, the user operates the key of the operation panel of the document reading device (scanner) 20 to select automatic distribution, and When the start button is pressed after the scanner 20 is set on the scanner 20, the scanner 20 starts a reading operation and transmits the read document image (image data file) to the distribution processing unit 101 of the document storage server 10 via the network (Step 11). . Note that the automatic distribution selection operation performed by the user at this time is equivalent to instructing distribution by specifying the distribution destination automatic selection folder 104 as the distribution destination folder. An input operation for designating the distribution destination folder 103 is performed.) The scanner 20 is equipped with an ADF (automatic document feeder), which can receive a plurality of documents in a document tray, and can automatically read the received plurality of documents continuously (in one operation). It is. When reading in the continuous mode, if a specific distribution destination folder 103 is specified, all the set originals are distributed to that folder. However, if automatic distribution is selected, each original document is identified. Are automatically distributed to the respective distribution destination folders described in the area of the above in accordance with the following processing flow.
[0017]
Next, the distribution processing unit 101 of the document storage server 10 receives the storage request transmitted by specifying the distribution destination folder from the scanner 20 by the processing of Step 11 (Step 12). The distribution processing unit 101 decodes the received accumulation request, distributes the image data file to the distribution destination folder indicated in the request, and stores the image data file. That is, when the designation by the operation input of the scanner 20 is a specific folder, the folder is immediately stored in the designated destination folder 103 immediately. (Step 13).
Thereafter, an automatic distribution process is performed on the image data file once stored in the distribution destination automatic selection folder 104 as an automatic distribution target in the following procedure.
In the automatic distribution process, it is confirmed that there is a target file in the distribution destination automatic selection folder 104 (Step 14-yes), and a series of processing steps necessary for automatic distribution are executed for each file. At the beginning of the processing step, OCR processing is performed on the target image data (original document) by the OCR processing unit 105 (Step 15).
In the OCR process, a specific rectangular area of the original document (scanner-read image) is cut out, and a character or the like that is to be preliminarily written in order to specify a distribution destination folder is performed there. The recognition result by the OCR processing is obtained in the form of text data, and the data thus obtained is used as data representing folder information of the distribution destination.
[0018]
According to the processing flow of the present example, next, the text data extracted and recognized by the OCR processing is examined, and as a result, it is checked whether or not the distribution destination has been specified (Step 16). Here, if the distribution destination can be specified, the text data extracted by the OCR process is set as the distribution destination (Step 17).
Thereafter, the image data file to which the distribution destination is set is sent to the distribution processing unit 101 again, and the distribution processing unit 101 which receives the image data file processes the received request in the same manner as the above-described accumulation request from the scanner 20. The image data file is decrypted, and the image data file is distributed and stored in the distribution destination folder (the distribution destination reset through the OCR process) 103 indicated in the request (Step 19).
On the other hand, as a result of examining the text data extracted and recognized by the OCR processing, if the distribution destination cannot be specified (Step 16-NO), the untransferred folder prepared in advance as one of the distribution destination folders 103 is determined. Is set as the distribution destination (Step 18). The reason why the untransferred folder is provided is that the recognition rate by the OCR process is not perfect, and there is a possibility that the distribution destination cannot be specified from the recognition result, and in such a case, the distribution destination is specified. This is to temporarily store the file that cannot be used, and to enable subsequent correspondence.
The image data file whose delivery destination is set to the untransferred folder is again delivered and stored in the set untransferred folder via the delivery processing unit 101 in the same manner as in response to the storage request from the scanner 20 described above. (Step 19).
The processing steps from Step 14 to Step 19 are performed on all the image data (original document) files stored in the distribution destination automatic selection folder 104 as a target of automatic distribution, and therefore, the processing returns to Step 14 after processing one target file. To process the next file. If there is no file (Step 14-NO), the processing of this flow ends.
[0019]
"Embodiment 2"
The present embodiment is characterized in that the folder information specifying the distribution destination is described in the original document, and the distribution process to the distribution destination folder recognized as text information by the OCR process on the original document read by the scanner is realized. However, in the present embodiment, when one document is composed of a plurality of documents, the designated distribution is performed for the entire document composed of a plurality of documents only by specifying the automatic distribution for the leading document. It is intended to do so.
FIG. 3 is a diagram illustrating a distribution processing flow during the operation of the automatic distribution function according to the present embodiment. Note that the flow of data by the distribution processing of this example is indicated by an arrow (dashed line) in the system block diagram of FIG.
The distribution processing by the automatic distribution function according to the present embodiment in the execution system will be described with reference to FIG. 3. First, the user performs a key operation on the operation panel of the document reading device (scanner) 20 to select automatic distribution, and When the start button is pressed after the scanner 20 is set on the scanner 20, the scanner 20 starts a reading operation and transmits the read document image (image data file) to the distribution processing unit 101 of the document storage server 10 via the network (Step 21). . Note that the automatic distribution selection operation performed by the user at this time is equivalent to instructing distribution by specifying the distribution destination automatic selection folder 104 as the distribution destination folder. An input operation for designating the distribution destination folder 103 is performed.) The scanner 20 is equipped with an ADF (automatic document feeder), which can receive a plurality of documents in a document tray, and can automatically read the received plurality of documents continuously (in one operation). It is. When the continuous mode is used, the entirety of a plurality of documents read in the continuous mode is treated as one document, so if automatic delivery is selected for the first image data (document document), Automatic distribution is set for each image data (document original) read from a plurality of originals treated as one document, and transmitted to the distribution processing unit 101.
[0020]
Next, the distribution processing unit 101 of the document storage server 10 sets automatic distribution by treating the plurality of documents as one document from the scanner 20 by the processing of Step 21 and receives the transmitted storage request (Step 22). . The distribution processing unit 101 decodes the received accumulation request, distributes the image data file to the distribution destination folder indicated in the request, and stores the image data file. Here, automatic distribution is performed for each image data (document document) read from a plurality of documents regarded as one document, that is, the distribution destination automatic selection folder 104 is designated as the distribution destination folder. Is temporarily stored in this folder (Step 23).
Thereafter, an automatic distribution process is performed on the image data file once stored in the distribution destination automatic selection folder 104 as an automatic distribution target in the following procedure.
In the automatic distribution process, it is confirmed that there is a target file in the distribution destination automatic selection folder 104 (Step 24-yes), and a series of processing steps necessary for automatic distribution are executed for each file.
At the beginning of the automatic distribution processing step, default setting of the distribution destination folder is performed (Step 25). This is necessary in order to enable a process in which the instruction for the automatic distribution destination can be omitted only for the first image data of one document including a plurality of originals and the instruction for the second and subsequent originals can be omitted. It sets the folder set for the previous file as the default distribution destination folder.
Thereafter, the OCR processing is performed on the target image data (original document) by the OCR processing unit 105. In this embodiment, the OCR processing may be applied only to the first image data. Is checked (Step 26), and the process branches.
If the image is a target image for OCR processing (Step 26-yes), the OCR processing unit 105 performs OCR processing on the target image data (document document) (Step 27). In the OCR process, a specific rectangular area of the original document (scanner-read image) is cut out, and a character or the like that is to be preliminarily written in order to specify a distribution destination folder is performed there. As a result of the recognition by the OCR process, the folder information of the distribution destination is obtained as text data format data.
[0021]
Next, the text data extracted and recognized by the OCR process is examined, and as a result, it is checked whether or not the distribution destination has been specified (Step 28). If the distribution destination can be specified, the text data extracted by the OCR process is set as the distribution destination (Step 29).
Thereafter, the image data file to which the distribution destination is set is sent to the distribution processing unit 101 again, and the distribution processing unit 101 which receives the image data file processes the received request in the same manner as the above-described accumulation request from the scanner 20. The image data file is decrypted, and the image data file is distributed and stored in the distribution destination folder (the distribution destination reset through the OCR process) 103 indicated in the request (Step 31).
On the other hand, as a result of examining the text data extracted and recognized by the OCR process, if the distribution destination cannot be specified (Step 28-NO), the non-transfer folder prepared as one of the distribution destination folders 103 in advance is determined. Is set as the distribution destination (Step 30). The reason why the untransferred folder is provided is that the recognition rate by the OCR process is not perfect, and there is a possibility that the distribution destination cannot be specified from the recognition result, and in such a case, the distribution destination is specified. This is to temporarily store the file that cannot be used, and to enable subsequent correspondence.
The image data file whose delivery destination is set to the untransferred folder is again delivered and stored in the set untransferred folder via the delivery processing unit 101 in the same manner as in response to the storage request from the scanner 20 described above. (Step 31).
[0022]
On the other hand, the second and subsequent original image data (image data in which a distribution destination folder is not specified in a specific rectangular area of the document), ie, the target image data of the OCR process, are not read in the continuous mode in Step 26. In this case (Step 26-yes), the image data is distributed and stored in the distribution destination folder set as the default in Step 25 without any processing (Step 31).
Since the processing steps of Steps 24 to 31 are performed on all the image data (original document) files stored in the distribution destination automatic selection folder 104 as a target of automatic distribution, the processing returns to Step 14 after the processing of one target file. To process the next file. Here, the OCR process is not performed on files other than the first file, and the distribution destination folder set as the default in Step 25, that is, the folder set for the previous file is applied. The whole document including a plurality of sheets is distributed to the same distribution destination file.
When there is no more image data file stored in the distribution destination automatic selection folder 104 (Step 24 -NO), the processing of this flow ends.
[0023]
"Embodiment 3"
The present embodiment is characterized in that the folder information specifying the distribution destination is described in the original document, and the distribution process to the distribution destination folder recognized as text information by the OCR process on the original document read by the scanner is realized. In the present embodiment, when one document is composed of a plurality of documents, a document made of a partition paper is inserted at the head of the document to be scanned and input separately from the target document. It is intended to distribute the entire document simply by specifying automatic distribution for paper.
FIG. 4 is a diagram illustrating a distribution processing flow during the operation of the automatic distribution function according to the present embodiment. Note that the flow of data by the distribution processing of this example is indicated by an arrow (dashed line) in the system block diagram of FIG.
The distribution processing by the automatic distribution function of the present embodiment in the embodiment system will be described with reference to FIG. 4. First, the user performs a key operation on the operation panel of the document reading device (scanner) 20 to select automatic distribution, and When the start button is pressed after setting the original (the original in the present example is composed of the leading partition paper and the document to be actually stored) on the scanner 20, the scanner 20 starts a reading operation, and the read document image (image data The file is transmitted to the distribution processing unit 101 of the document storage server 10 via the network (Step 41). Note that the automatic distribution selection operation performed by the user at this time is equivalent to instructing distribution by specifying the distribution destination automatic selection folder 104 as the distribution destination folder. An input operation for designating the distribution destination folder 103 is performed.) The scanner 20 is equipped with an ADF (automatic document feeder), which can receive a plurality of documents in a document tray, and can automatically read the received plurality of documents continuously (in one operation). It is. In the case of using the continuous mode, a plurality of originals read in the continuous mode are treated as a single document. Therefore, when automatic distribution is selected for the first image data (separator original), Automatic distribution is set for each image data (document original) read from a plurality of originals treated as one document, and transmitted to the distribution processing unit 101.
[0024]
Next, the distribution processing unit 101 of the document storage server 10 sets a plurality of originals as one document and sets automatic distribution from the scanner 20 by the processing of Step 41, and receives the transmitted storage request (Step 42). . The distribution processing unit 101 decodes the received accumulation request, distributes the image data file to the distribution destination folder indicated in the request, and stores the image data file. Here, automatic distribution is performed for each image data (document document) read from a plurality of documents regarded as one document, that is, the distribution destination automatic selection folder 104 is designated as the distribution destination folder. Is temporarily stored in this folder (Step 43).
Thereafter, an automatic distribution process is performed on the image data file once stored in the distribution destination automatic selection folder 104 as an automatic distribution target in the following procedure.
In the automatic distribution process, it is confirmed that there is a target file in the distribution destination automatic selection folder 104 (Step 44-yes), and a series of processing steps necessary for automatic distribution are executed for each file.
At the beginning of the automatic distribution processing step, default setting of the distribution destination folder is performed (Step 45). This makes it possible to omit the instruction for the second and subsequent documents only by specifying the folder of the automatic delivery destination only for the first image data (partition paper) of one document composed of a plurality of documents. This is necessary processing to set the folder set for the previous file as the default distribution destination folder.
Thereafter, the OCR processing is performed on the target image data by the OCR processing unit 105. In this embodiment, since the OCR processing may be applied only to the image data of the partition paper, the OCR processing of the partition paper requiring the OCR processing is performed prior to the processing. It is checked whether the image is an image (Step 46), and the process branches.
If the image is a partition paper image requiring OCR processing (Step 46-yes), the OCR processing unit 105 performs OCR processing on the target image data (original document) (Step 47). In this OCR processing, a specific rectangular area of a scanner-read image of a partition sheet is cut out, and recognition processing of characters or the like to be written in advance in order to specify a distribution destination folder is performed. Note that the partition paper only needs to carry information for recognizing the partition paper and information for specifying the distribution destination folder. As a result of the recognition by the OCR process, the folder information of the distribution destination is obtained as text data format data.
[0025]
Next, the text data extracted and recognized by the OCR process is examined, and as a result, it is checked whether or not the distribution destination has been specified (Step 48). If the distribution destination can be specified, the text data extracted by the OCR process is set as the distribution destination (Step 49).
On the other hand, as a result of examining the text data extracted and recognized by the OCR process, if the distribution destination cannot be specified (Step 48-NO), the untransferred folder prepared in advance as one of the distribution destination folders 103 is determined. Is set as the distribution destination (Step 50). The reason why the untransferred folder is provided is that the recognition rate by the OCR process is not perfect, and there is a possibility that the distribution destination cannot be specified from the recognition result, and in such a case, the distribution destination is specified. This is to temporarily store the file that cannot be used, and to enable subsequent correspondence.
After the setting of the distribution destination folder is completed, the partition paper file stored in the distribution destination automatic selection folder 104 is deleted (Step 49). The partition paper file is temporarily stored in the distribution destination automatic selection folder 104 as one of the files to be subjected to automatic distribution processing, and is a file exclusively used for setting the distribution destination folder. Since it does not have data, delete it after use and exclude it from distribution.
[0026]
After the partition paper data file is deleted, the process returns to Step 44 and shifts to the distribution processing of the image data file next to the document scanned and input in the continuous mode. In this distribution process, first, the default setting of the distribution destination folder is performed (Step 45). At this time, as described above, since the folder set for the previous file is set, the distribution destination folder set via the OCR process for the partition paper file is set.
Thereafter, whether or not the target image is a partition paper image is checked in Step 46, but other than the partition paper is treated as a distribution target image (Step 46-NO). The image data file to be automatically distributed with the distribution destination set is transmitted to the distribution processing unit 101 again, and the distribution processing unit 101 receiving the image data file receives the image data file in the same manner as in response to the storage request from the scanner 20 described above. The request is decrypted, and the image data file is distributed to the distribution destination folder 103 (the distribution destination folder specified by the partition sheet or the distribution destination reset by the untransferred folder) 103 and stored. Yes (Step 52).
Since the processing steps of Step 44 → Step 45 → Step 46 → Step 52 are performed on all of the image data (original document) files stored in the distribution destination automatic selection folder 104 other than the partition paper as the target of automatic distribution, one target sheet After the process for the file, the process returns to Step 44 to process the next file. The OCR processing is not performed on the file to be subjected to the loop processing, and the distribution destination folder set as the default in Step 45, that is, the folder set for the previous file is applied. The entire document including a plurality of sheets is distributed to the designated distribution destination folder or the untransferred folder.
If there are no more image data files stored in the automatic distribution destination selection folder 104 (Step 44-NO), the processing of this flow is terminated.
[0027]
As shown in the above-described embodiment (FIG. 1), the document management system according to the present invention can be implemented with a system configuration in which the document storage server 10, the document reading device 20, and the client computer are connected to the network 50. However, the present invention is not limited to the system configuration of this embodiment, and can be implemented as a filing device having a configuration in which the document reading function and the document storage server function are incorporated in one device. A system configuration for connecting to a network may be adopted.
Further, when the document management system according to the present invention is configured in such an embodiment, an automatic distribution function provided in the system (in FIG. 1, the components are shown as functional block diagrams, and the processing flow in FIGS. A computer can be used as information processing means for implementing the distribution processing procedure. When configuring the implementation system using a computer, a CPU, a memory, a hard disk drive, an input device including a scanner, a keyboard, a mouse, and the like as components, a CD-ROM drive, a display, a flexible disk drive , A communication device, etc., and these can be configured as a computer system connected to a bus. When configured by a computer system, a procedure for realizing the automatic distribution function according to the present invention (FIG. 2) is provided in a part of a storage medium used by a memory as a storage unit, a hard disk drive, a CD-ROM drive, and a flexible disk drive. (Refer to processing flows 4 to 4) are recorded.
[0028]
【The invention's effect】
(1) Effects corresponding to the first and fourth aspects of the invention
OCR processing of a specific area of a document read from a manuscript, and a function of designating a distribution destination folder based on text information obtained by the OCR processing are provided, so that an operation input to a manuscript reading device performed by a user when using the system Can be simplified. For example, when a plurality of originals are input in the continuous mode by the ADF, all the originals can be set to the respective designated destinations by simply inputting an instruction operation for automatic distribution once. Since the data can be distributed to the folder, the labor of the user is greatly reduced, and the performance of the system can be improved.
(2) Effects corresponding to the inventions of claims 2 and 5
The OCR process is performed only on the read document determined to be the target image of the OCR process, and for the image determined not to be the target image of the OCR process, a function of designating the same distribution destination folder as the immediately preceding target image is provided. With this arrangement, if one document consists of a plurality of originals, it is possible to handle the second and subsequent sheets as attachments (without specifying the destination folder) only by specifying automatic distribution for the first original. , The OCR process and the like are simplified, and the performance of the system can be improved.
(3) Effects corresponding to the inventions of claims 3 and 6
OCR processing is performed only on the scanned document that is determined to be a partition paper, and for an image that is determined not to be a partition paper, a function is provided to specify the same distribution destination folder as specified on the immediately preceding partition paper. Accordingly, the distribution destination is obtained from the partition paper, and the document sandwiched between the partition papers is automatically distributed to the distribution destination obtained from the previous partition paper, so that the distribution destination folder for the stored document is specified. Without having to do so, it is only necessary to perform the automatic distribution instruction operation once for the documents sandwiching the partition paper, so that the user's labor is greatly reduced and the performance of the system can be improved.
(4) Effects corresponding to the invention of claim 7
By installing the computer program via a recording medium storing the computer program according to any one of claims 4 to 6, the effects (1) to (3) can be easily realized. become.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a document management system according to an embodiment of the present invention.
FIG. 2 is a diagram showing a distribution processing flow when an automatic distribution function (first embodiment) in the document management system of FIG. 1 operates.
FIG. 3 is a diagram showing a distribution processing flow when an automatic distribution function (second embodiment) in the document management system of FIG. 1 operates.
FIG. 4 is a diagram showing a distribution processing flow when an automatic distribution function (third embodiment) in the document management system of FIG. 1 operates.
[Explanation of symbols]
10 document storage server, 20 document reading device (scanner),
101: distribution processing unit 102: document management database
103: distribution destination folder 104: distribution destination automatic selection folder
105 OCR processing unit.

Claims (7)

通信インターフェースを介して原稿読取装置と文書蓄積サーバーを接続し、前記原稿読取装置により読み取った文書画像を文書蓄積サーバー内の指定のフォルダに配信する手段を有する文書管理システムであって、前記配信手段は、原稿から読み取られた文書の特定の領域をOCR処理し、OCR処理により得られたテキスト情報により配信先フォルダを指定する機能を備えたことを特徴とする文書管理システム。A document management system comprising: a document reading device connected to a document storage server via a communication interface; and a means for delivering a document image read by the document reading device to a designated folder in the document storage server. Is a document management system having a function of performing OCR processing on a specific area of a document read from a document and specifying a distribution destination folder based on text information obtained by the OCR processing. 請求項1に記載された文書管理システムにおいて、前記配信手段は、読み取り文書に対する指示の有無によりOCR処理の対象画像であるか否かを判断し、OCR処理の対象画像であると判断された読み取り文書だけに前記OCR処理を行い、OCR処理の対象画像でないと判断された画像に対しては、直前の対象画像と同じ配信先フォルダを指定する機能を備えたことを特徴とする文書管理システム。2. The document management system according to claim 1, wherein the distribution unit determines whether or not the image is a target image of the OCR process based on presence / absence of an instruction for the read document, and determines whether the image is a target image of the OCR process. A document management system comprising: a function of performing the OCR process only on a document and designating the same destination folder as an immediately preceding target image for an image determined not to be the target image of the OCR process. 請求項1に記載された文書管理システムにおいて、前記配信手段は、読み取り入力が原稿か又は配信の指示を行うための仕切り紙かを判断し、仕切り紙であると判断された読み取り文書だけに前記OCR処理を行い、仕切り紙ではないと判断された画像に対しては、直前の仕切り紙に指示されたと同じ配信先フォルダを指定する機能を備えたことを特徴とする文書管理システム。2. The document management system according to claim 1, wherein the distribution unit determines whether the read input is a manuscript or a partition sheet for giving a distribution instruction, and only the read document determined to be a partition sheet receives the document. A document management system having a function of performing an OCR process and designating the same distribution destination folder as that specified for the immediately preceding partition sheet for an image determined not to be a partition sheet. 原稿読取装置により読み取った文書画像を文書蓄積サーバー内の指定のフォルダに配信するためのコンピュータプログラムであって、原稿から読み取られた文書の特定の領域をOCR処理し、OCR処理により得られたテキスト情報により配信先フォルダを指定する手順を備えたことを特徴とするコンピュータプログラム。A computer program for distributing a document image read by a document reading device to a designated folder in a document storage server. The computer program performs an OCR process on a specific area of the document read from the document and obtains a text obtained by the OCR process. A computer program comprising a procedure for designating a distribution destination folder based on information. 請求項4に記載されたコンピュータプログラムであって、読み取り文書に対する指示の有無によりOCR処理の対象画像であるか否かを判断し、OCR処理の対象画像であると判断された読み取り文書だけに前記OCR処理を行い、OCR処理の対象画像でないと判断された画像に対しては、直前の対象画像と同じ配信先フォルダを指定する手順を備えたことを特徴とするコンピュータプログラム。5. The computer program according to claim 4, wherein it is determined whether or not the image is a target image of the OCR process based on the presence or absence of an instruction for the read document. A computer program characterized by comprising a procedure of performing an OCR process and designating the same destination folder as an immediately preceding target image for an image determined not to be the target image of the OCR process. 請求項4に記載されたコンピュータプログラムであって、読み取り入力が原稿か又は配信の指示を行うための仕切り紙かを判断し、仕切り紙であると判断された読み取り文書だけに前記OCR処理を行い、仕切り紙ではないと判断された画像に対しては、直前の仕切り紙に指示されたと同じ配信先フォルダを指定する手順を備えたことを特徴とするコンピュータプログラム。5. The computer program according to claim 4, wherein it is determined whether the read input is a manuscript or a partition sheet for giving a distribution instruction, and the OCR process is performed only on the read document determined to be the partition sheet. A computer program comprising a procedure for designating, for an image determined not to be a partition sheet, the same distribution destination folder as instructed on the immediately preceding partition sheet. 請求項4乃至6のいずれかに記載されたコンピュータプログラムを記録した記録媒体。A recording medium on which the computer program according to claim 4 is recorded.
JP2002335192A 2002-11-19 2002-11-19 Document management system and computer program Pending JP2004171199A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002335192A JP2004171199A (en) 2002-11-19 2002-11-19 Document management system and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002335192A JP2004171199A (en) 2002-11-19 2002-11-19 Document management system and computer program

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008186737A Division JP2008293523A (en) 2008-07-18 2008-07-18 Image management device and computer program

Publications (1)

Publication Number Publication Date
JP2004171199A true JP2004171199A (en) 2004-06-17

Family

ID=32699391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002335192A Pending JP2004171199A (en) 2002-11-19 2002-11-19 Document management system and computer program

Country Status (1)

Country Link
JP (1) JP2004171199A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008097586A (en) * 2006-09-15 2008-04-24 Ricoh Co Ltd Information processing device, image forming apparatus, and process control system, method and program
EP2015554A1 (en) 2007-07-13 2009-01-14 Ricoh Company, Ltd. User interface generating method, image forming apparatus, and computer program product
JP2010238218A (en) * 2009-03-13 2010-10-21 Ricoh Co Ltd Image processor, system, image processing method, program and recording medium
JP2021019244A (en) * 2019-07-18 2021-02-15 キヤノン株式会社 Image processing system, image formation apparatus, method of controlling image processing system, method of controlling image formation apparatus, and program

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008097586A (en) * 2006-09-15 2008-04-24 Ricoh Co Ltd Information processing device, image forming apparatus, and process control system, method and program
US8179542B2 (en) 2006-09-15 2012-05-15 Ricoh Company, Ltd. Information processing device, image forming apparatus, and process control system
EP2015554A1 (en) 2007-07-13 2009-01-14 Ricoh Company, Ltd. User interface generating method, image forming apparatus, and computer program product
US8468213B2 (en) 2007-07-13 2013-06-18 Ricoh Company, Limited Screen generating method, image forming apparatus, and computer program product
US9489348B2 (en) 2007-07-13 2016-11-08 Ricoh Company, Limited Screen generating method, image forming apparatus, and computer program product
JP2010238218A (en) * 2009-03-13 2010-10-21 Ricoh Co Ltd Image processor, system, image processing method, program and recording medium
JP2021019244A (en) * 2019-07-18 2021-02-15 キヤノン株式会社 Image processing system, image formation apparatus, method of controlling image processing system, method of controlling image formation apparatus, and program
JP7282625B2 (en) 2019-07-18 2023-05-29 キヤノン株式会社 Program, information processing method and information processing apparatus
US11711472B2 (en) 2019-07-18 2023-07-25 Canon Kabushiki Kaisha Image processing system enabling easy checking of OCR error image data, image forming apparatus, method of controlling image processing system, method of controlling image forming apparatus, and storage medium
JP7490858B2 (en) 2019-07-18 2024-05-27 キヤノン株式会社 Image processing system, image forming apparatus, control method for image processing system, control method for image forming apparatus, and program

Similar Documents

Publication Publication Date Title
US8352581B2 (en) Data transmission apparatus indicating transmission status, transmission control method indicating transmission status, and program thereof
US6947182B1 (en) Network system and control method of the same
JP4925969B2 (en) Information processing apparatus, processing control method, and program
US8347308B2 (en) Information processing apparatus, information processing method, and storage medium
CN101231576B (en) Image processing apparatus, digital multifunctional apparatus and control method thereof
JP5057546B2 (en) Document search apparatus and document search method
US20090044283A1 (en) Document management apparatus, document management system and method, and computer-readable medium
CN101207762B (en) Image processing apparatus and image processing method
US20060075334A1 (en) Information processing apparatus, history file generation method and program
JPH06297781A (en) Job printing method
US20090195817A1 (en) Document processing system, control method for the same, program, and storage medium
JP2007158601A (en) Conference support system, input board, its control method, and program
JPH11196247A (en) File system and recording medium recording program used for the system
JP2009111612A (en) Image processor, and workflow registration method
JP2010003198A (en) Document management system, document management device, and program
JP4724428B2 (en) Image reading apparatus and image processing method
JPH11143907A (en) File system and recording medium recording program used to the system
US8867091B2 (en) Image processing system, image processing apparatus, image scanning apparatus, and control method and program for image processing system
US20070061377A1 (en) Document management system and control method thereof
CN101226529B (en) Information-processing apparatus, information-processing system, information-processing method
JP2004171199A (en) Document management system and computer program
US20080239363A1 (en) Copier device capable of electronically storing and recalling copied documents
JP2004357305A (en) System, method, and program for managing and storing document
JP2008293523A (en) Image management device and computer program
JP5217815B2 (en) Information processing apparatus, processing control system, processing control method, program, and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050311

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080402

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080520