JP2008165386A

JP2008165386A - 文書管理装置、文書管理方法、文書管理プログラム

Info

Publication number: JP2008165386A
Application number: JP2006352551A
Authority: JP
Inventors: Shinichiro Ohira; 慎一郎大平; Yuuko Yoshimura; 裕興吉村; Naoyuki Kameoka; 直行亀岡
Original assignee: Canon IT Solutions Inc
Current assignee: Canon IT Solutions Inc
Priority date: 2006-12-27
Filing date: 2006-12-27
Publication date: 2008-07-17

Abstract

【課題】登録シートから文書属性を判断できるようにし、以ってユーザの作業の負担を軽減することを可能とする文書管理システムを提供する。
【解決手段】文書管理サーバに記録されている文書属性に応じた文書保存先情報を記載した登録シートを印刷し、その登録シートを含む紙書類をスキャンすることで電子化されたイメージ文書を作成する。次にこのイメージ文書から登録シートを抽出した上で、ＯＣＲ処理を行い、この結果を用いて文書属性の判定処理をする。さらに、この文書属性に対応してイメージ文書をページ毎に体裁を整えるための整理処理、および、イメージ文書を分割し、文書管理サーバの所定の場所に記録する。
【選択図】図１２

Description

本発明は、コンピュータを利用した文書管理システムに関する技術であって、詳しくは、提案書、報告書、各種申請書等の紙文書を、スキャナ等で読み込んで対応付したイメージ文書を、属性情報（文書名、作成者、顧客、作成日時など、以下、文書属性）からコンピュータの記憶装置の所定の場所に保存するための技術に関する。

会社等の種々の機関では、一般に、提案書、報告書、各種申請書等の紙文書を、スキャナ等に読み込ませてスキャンイメージ（以下、イメージ文書と言う）にして、コンピュータに入力し管理することが行なわれる。このとき、各イメージ文書は文書名や目的等各文書属性に対応した、コンピュータの記憶装置の所定の場所に記録される。

イメージ文書をコンピュータの記憶装置の所定の場所に記録するためには、イメージ文書毎に文書属性を付与する必要があるが、これは、紙文書に記載されている文書内容をユーザが読み取り文書属性を判断してキー操作で付与する方法がある。或いは、ＯＣＲ（Optical Character Reader）帳票と称される文書属性付与用の紙（登録シート）を用意し、その登録シートの所定位置に所定の文書属性を手で記入して（所定位置に記入できれば印刷でも可）、記入したその用紙を紙文書の表紙にし、紙文書と共にスキャナ等に読込ませることで付与する方法がある。特に、自動原稿送り機能を有するスキャナ等を利用すれば、複数枚の紙書類を一括して、処理することも可能になる。この場合は、コンピュータ又はスキャナ等に搭載されるＯＣＲソフト（ＯＣＲ機能を持つアプリケーションソフト）が、紙文書の１枚目を登録シートとみなして、その紙の各所定位置から記入内容を抽出して認識し、認識した記入内容を文書属性としてイメージ文書に付与する。さらに、複数種類の紙書類を、それぞれの種類ごとに登録シートを用意し、一括して処理することも可能になる。このようにして付与された属性情報に基づき、イメージ文書はコンピュータの記憶装置の所定の場所に記録される。

このとき、登録シートを用いたとしても、文書読み取りミスのために付与する属性情報の間違いが発生する場合があるが、この問題を解決する技術として、例えば、特許文献１が提案されている。この方法は、文書管理サーバにあらかじめ文書管理番号を含む文書属性データを登録しておき、この情報を元に登録シートを印刷する一方で、ＯＣＲで読み取った結果から文書管理番号に対応する文書属性を付与するものである。
特開２００５−１２２３２４号公報

しかしながら、特許文献１の技術ではスキャナ等の自動原稿送り装置の動作不良に起因した読み取りミスや、登録シートを表裏逆にセットしたことによるユーザの操作ミスに起因した登録シートの読み飛ばしが発生する場合がある。この場合、ユーザの意図通りの文書属性とならないばかりか、失敗を認識できないまま処理は終了するため、ユーザによる発見が遅れるのとともに、誤った処理の特定のための調査や再処理などの事後処理の負荷がかえって増大するといった問題がある。

また、ユーザの操作ミスに起因した登録シートを含め紙書類の原稿を上下逆にセットしてしまう場合もある。この場合、イメージ文書は上下逆に記録されてしまうため、ユーザが記録されたイメージ文書の各ページを確認しながら、回転処理などの体裁を整える処理が必要である。さらに、ユーザの操作ミスに起因した紙書類の原稿を裏表逆にセットしてしまう場合もある。この場合も、ユーザが記録されたイメージ文書の各ページを確認しながら、ページ入替処理をするなどが必要であり、結局、ユーザの負荷が軽減されないといった問題がある。

さらに、両面読み取り機能を有するスキャナ等を利用した場合、登録シートおよびその裏面についても、通常はイメージ文書として記録されてしまう。この場合、上記同様ユーザが記録されたイメージ文書の各ページを確認しながら、削除処理などの体裁を整える処理が必要で、結局、ユーザの負荷が軽減されないといった問題がある。

従って、本発明の目的は、コンピュータを利用した文書管理において、登録シートから文書属性を判断できるようにし、以ってユーザの作業の負担を軽減することを目的とする。

上記課題を解決するために、請求項1記載の文書管理装置は、紙文書から電子化して作成したイメージ文書の属性情報に基づき保存先を決定する文書管理装置において、紙書類をスキャンし電子化したイメージ文書を作成するイメージ文書作成手段と、前記イメージ文書から属性を決定させるための属性識別用書類を抽出する属性識別用書類抽出手段と、前記イメージ文書中の前記属性識別用書類から文書属性情報を抽出する文書属性情報抽出手段と、前記文書属性情報に応じて前記イメージ文書をページ毎に体裁を整えるための整理処理する整理手段と、前記文書属性情報に基づいて前記イメージ文書を所定の場所に保存する保存手段とを備えることを特徴とする。

請求項２記載の文書管理装置は、請求項1記載の文書管理装置において、前記属性識別用書類抽出手段により抽出された属性識別用書類の位置を区切りとして、前記イメージ文書を分割する分割手段を備えることを特徴とする。

請求項３記載の文書管理装置は、請求項1または2記載の文書管理装置において、前記保存手段は、文書属性情報に基づいて文書名を付与し、特定される保存先に前記イメージ文書を保存することを特徴とする。

請求項４記載の文書管理装置は、請求項1または2記載の文書管理装置において、前記文書属性識別情報から上下区分が逆である場合は、前記整理手段はイメージ文書をページ毎に上下反転処理を行うことを特徴とする。

請求項５記載の文書管理装置は、請求項1または2記載の文書管理装置において、前記文書属性識別情報から裏表区分が裏である場合は、前記整理手段はイメージ文書を前のページと入れ替える処理を行うことを特徴とする。

請求項６記載の文書管理装置は、請求項1または2記載の文書管理装置において、前記文書属性識別情報からスキャン分が両面である場合は、前記整理手段はイメージ文書の属性識別用書類とその次のページとを削除する処理を行うことを特徴とする。

請求項７記載の文書管理装置は、請求項1または2記載の文書管理装置において、前記文書属性情報のシート順が、前のイメージ文書の文書属性情報のシート順に連続していない場合は、前記イメージ文書をエラーフォルダに保存することを特徴とする。

上記課題を解決するために、請求項８記載の文書管理方法は、紙文書から電子化して作成したイメージ文書の属性情報に基づき保存先を決定する文書管理方法において、紙書類をスキャンし電子化したイメージ文書を作成するイメージ文書ステップと、前記イメージ文書から属性を決定させるための属性識別用書類を抽出する属性識別用書類抽出ステップと、前記イメージ文書中の前記属性識別用書類から文書属性情報を抽出する文書属性情報抽出ステップと、前記文書属性情報に応じて前記イメージ文書をページ毎に体裁を整えるための整理処理する整理ステップと、前記文書属性情報に基づいて前記イメージ文書を所定の場所に保存する保存ステップとを備えることを特徴とする。

上記課題を解決するために、請求項９記載の文書プログラムは、紙文書から電子化して作成したイメージ文書の属性情報に基づき保存先を決定する文書管理方法をコンピュータに実行させるプログラムであって、紙書類をスキャンし電子化したイメージ文書を作成するイメージ文書モジュールと、前記イメージ文書から属性を決定させるための属性識別用書類を抽出する属性識別用書類抽出モジュールと、前記イメージ文書中の前記属性識別用書類から文書属性情報を抽出する文書属性情報抽出モジュールと、前記文書属性情報に応じて前記イメージ文書をページ毎に体裁を整えるための整理処理する整理モジュールと、前記文書属性情報に基づいて前記イメージ文書を所定の場所に保存する保存モジュールとを備えることを特徴とする。

本発明によれば、登録シートから文書属性を判断でき、以ってユーザの作業の負担を軽減しながらイメージ文書の管理をすることが可能となる。

以下、図面を参照して本発明の実施の形態を詳細に説明する。

図１は、本発明の一実施形態に係るシステムの全体構成を示すブロック図である。

図１において、文書管理システム１０１は、紙書類からイメージを読取る画像読取装置１０２と、作成された、例えばＰＤＦ形式のイメージデータであるイメージ文書を記録しておく文書管理サーバ１０３と、作成されたイメージ文書のイメージデータにＯＣＲ処理を行い、紙書類の文書属性を示す文書属性データを付与し、イメージ文書の記録先を振り分けする振分サーバ１０４と、文書管理システム１０１のユーザが検索や閲覧のために操作する利用者端末１０５とを備え、これらの各装置を互いに接続するネットワーク１０６から構成される。

ここでの画像読取装置１０２は印刷機能を有した複合機を例として説明する。ユーザからの指示があれば、紙文書のイメージをスキャンする機能と共に、登録シート（識別用書類）を印刷する機能を有するものである。登録シートの例を図２に示すが、これは、シート名“文書登録シート“と共に、登録シートのタイトル２０２、登録シート番号２０３、文書名を記載した文書名領域２０６、保存先を記入した保存先領域２０７、さらに、ユーザが記入する領域のシート順２０４、スキャンの区分２０５、イメージ文書や保存先指定するチェックボックス２０６−１、２０７−１があり、それぞれの情報が記載されている。

また、画像読取装置１０２は、ユーザが行う作業を軽減するための自動原稿送り機能や両面スキャン機能を有するものである。さらに、ＰＤＦ形式やＴＩＦＦ形式などのイメージデータであるイメージ文書を作成する機能を有したものとして説明するが、この機能は、文書管理サーバ１０３や振分サーバ１０４など別の装置に有ってもよい。

文書管理サーバ１０３は、画像読取装置１０２で作成されたイメージ文書を一時的に記録するとともに、文書属性に応じて振り分けられたイメージ文書を記録しておくものである。

文書管理サーバ１０３の構成を図１７示す。なお、振分サーバ１０４も利用者端末１０５も同様の構成を有するので、それらの説明は省略する。

図１７において、文書管理サーバ１０３は、プログラムを実行するＣＰＵ１１と、ＣＰＵ１１の主メモリやワークエリア等として機能するＲＡＭ１２と、ＣＰＵ１１が動作するためのプログラムが格納されているＲＯＭ１３と、記憶装置としてのＨＤＤ１４と、脱着自在な記録媒体にデータを記録可能な記録装置１５と、表示機能を提供するビデオアダプタ１６及び表示装置（不図示）と、入力装置としてのキーボード（Ｋ／Ｂ）１７及びマウス１８と、ネットワークに接続すると共に通信するデータを電気信号に変換するためのネットワークインターフェースカード（ＮＩＣ：Network Inter face Card）１９とを備える。

また、ＨＤＤ１４のイメージ文書を記憶する領域は、例えば図１１に示すフォルダの構成である。一時フォルダ１１０１は、画像読取装置１０２で作成されたイメージ文書を一時的に記憶しておく領域である。保存先フォルダ１１０２は、この例では、出張清算書フォルダ１１０２−１や通勤定期代申請書フォルダ１１０２−２などのサブフォルダーを有し、文書属性に応じて振り分けられたイメージ文書を記憶しておく領域である。エラーフォルダ１１０３は、後述する振分処理においてエラーが発生されたイメージ文書を記憶しておく領域である。

振分サーバ１０４は、文書管理サーバ１０３が一時的に記憶しているイメージ文書に対してＯＣＲ処理を行い、紙書類の文書属性を示す文書属性データを付与するアプリケーションソフトを備える。また、振分サーバ１０４は、振分処理に必要となる登録シートを作成する等のための振分情報をＨＤＤ１４に記憶している。

具体的な例としては、図８に示すユニークな登録シート番号に対応した登録シート名を定義した登録シートテーブル（ＴＳ）と、図９に示す登録シート番号毎に文書名記載領域２０６に記載する場合のポジションと文書名を定義した登録シート文書名テーブル（ＴＢ）と、図１０に示す登録シート番号毎に保存先記載領域２０７に記載する場合のポジションとサーバ１０３に記憶する領域を特定する情報を定義した登録シート保存先テーブル（ＴＨ）である。

さらに、振分サーバ１０４は振分処理の結果である文書属性データをＨＤＤ１４に記憶している。具体的な例としては、図４に示すＯＣＲ処理の結果を記憶したシステムコントロールテーブル（ＳＣ）と、図６に示す文書名および保存先を記憶した振分データテーブル（ＦＤ）と、図５に示すシート毎に区分を記憶したスキャンデータテーブル（ＳＤ）、および、図７に示すエラーが発生したイメージ文書を記憶するエラーチェックテーブル（ＥＣ）、および、図８に示す登録シート番号に対応した登録シート名を記憶した登録シートテーブル（ＴＳ）である。

なお、後述する振分処理ができるのであれば、ここに例示したそれぞれのテーブルおよびテーブル構成以外でもよく、さらに、ネットワーク１０６を通じて各装置間でデータの送受信が可能であるため、振分サーバ１０４以外の他の装置に記憶されたものであってもよい。

また、振分サーバ１０４は、ＯＣＲ処理を行う領域を切り出すために必要となる画像切り出し位置情報（例えば、図３に示す３０１、３０２、３０２，３０４）とOCR処理結果を対応付けるデータ項目（例えば、「登録シート番号.」、「シート順」、「両面スキャン」など）とを記憶している。

利用者端末１０５は、文書管理サーバ１０３に記憶されているイメージ文書を表示したり、プリンター（不図示）による印刷を行ったりするためのものである。なお、エラーが発生したイメージ文書をユーザの指示を受け付けて編集したり、移動させたりする処理も行う。

ネットワーク１０６は、ＬＡＮを例として説明するが、有線でも無線でもよいし、インターネットや公衆回線を利用したものでもよく、情報を送受信することができる通信回線であればよい。

図１２は、文書管理システム全体によって実行させる処理のフローチャートである。

図１２において、まず、読取装置１０２はステップＳ１５０１で、ユーザからの指示に基づき登録シート（図３）を印刷する処理を行い、ステップＳ１５０２でユーザによってセットされた紙書類をスキャンし、その結果のイメージ文書を文書管理サーバ１０３に一時的に記録する。次に、振分サーバ１０４はステップＳ１５０３で一時的に記憶されているイメージ文書から登録シートを抽出、ＯＣＲ処理など行い、文書属性を判定する。さらに、ステップＳ１５０４で文書属性に応じて、シート毎に体裁を整えるための整理処理をした上、ステップＳ１５０５でイメージ文書を分割し、文書管理サーバ１０３の所定の場所に記録する分割保存処理をするものである。それぞれの処理について詳細を以下に説明する。

ステップＳ１５０１の登録シート作成処理は、画像読取装置１０２がユーザからの指示入力があれば、振分サーバ１０４に対して、登録シート番号「ＮＯ＝１５」を含んだ登録シート作成要求を出す。振分サーバ１０４はこの要求に対して、登録シートテーブル（ＴＳ）と登録シート文書名テーブル（ＴＢ）と登録シート保存先テーブル（ＴＨ）を参照して、登録シート番号「ＮＯ＝１５」に対応する登録シート名「経理部用シート」と、記載するポジションと文書名「０１：出張精算費、０２：通勤定期代申請」など、および、保存先「０１：経理部￥経理関連、０２：経理部その他」などの印刷シート作成情報を抽出する。次に、この情報から図３に示す様式で登録シートを作成し、印刷ジョブとして画像読取装置１０２に返す。画像読取装置１０２は、この印刷ジョブに対応して印刷処理をすることで、登録シートが作成される。

なお、本処理は、画像読取装置１０２がユーザからの指示入力を受け付け処理を開始するものとし説明したが、これは、利用者端末１０５がユーザからの指示入力を受け付け処理を開始するものであってもよい。

図１３によりステップＳ１５０２のスキャン処理を説明する。ステップＳ１５０２のスキャン処理では、上記で作成された登録シートは、ユーザにより紙書類の一枚目に置かれ、読取装置１０２の自動原稿送り装置にセットされた後、スキャンの指示入力があれば、処理を開始する。

ステップＳ１６０１は、自動原稿送り装置により原稿が送り込まれると原稿をスキャンし、読取装置１０２内のメモリ（不図示）に記録する。なお、ユーザから両面原稿読み取り処理要求があれば、両面についてスキャンするものである。ここで、スキャンが正常に終了すれば、つまりステップＳ１６０２でＹＥＳであればステップＳ１６０３に進むが、異常が発生すれば、つまりステップＳ１６０２でＮＯであればユーザに対して警告情報を表示し、正常にスキャンできるまで繰り返す。

ステップＳ１６０３で自動原稿送り装置にセットされた原稿の有無を判断して、次の原稿が存在する場合、つまりステップＳ１６０３でＮＯであればステップＳ１６０１に戻り、すべての原稿のスキャンが終了し次の原稿が存在しない場合、つまりステップＳ１６０３でＹＥＳであればステップＳ１６０４に進む。

ステップＳ１６０４ではメモリ（不図示）に記録されたイメージデータを１つのＰＤＦ形式のイメージ文書ファイルに変換する処理をして、文書管理サーバ１０３の一時フォルダ１１０１に、日時分秒から作成したファイル名を付与し記録する。

なお、ファイル名はユニークなものであれば、ほかのルールに基づき作成するものであってもよい。最後に、ステップＳ１６０５で、読取装置１０２は振分サーバ１０４に対してファイル名を含んだ登録シート判定処理要求を送信しスキャン処理は終了する。

図１４−１および図１４−２によりステップＳ１５０３の登録シート判定処理を説明する。ステップＳ１５０３の登録シート判定処理は、ステップＳ１６０５で読取装置１０２が送信した登録シート判定処理要求を、振分サーバ１０４が受信した時点で開始する。また本処理は、振分サーバ１０４のＨＤＤ１４に記録されているプログラムによる制御に従ってＣＰＵ１１が行うものである。

先ず、振分サーバ１０４はステップＳ１７０１で、システムコントロールテーブル（ＳＣ）、スキャンデータテーブル（ＳＤ）、振分データテーブル（ＦＤ）、エラーチェックテーブル（ＥＣ）の各テーブルのデータを削除し、イニシャライズ処理する。

次にステップＳ１７０２で、先に受信したファイル名からイメージ文書ファイルを文書管理サーバ１０３の一時フォルダ１１０１から読み込み、ＲＡＭ１２に記録する。あわせて、総ページ数を得るために最終ページ番号を取得し、この値でシステムコントロールテーブル（ＳＣ）の最終ページ番号を更新する。

次に、ステップＳ１７０３で現在のページ番号を示すｎを“０”に更新し初期化し、ステップＳ１７０４で、ｎをインクリメントした上で（ｎ＝１）、ステップＳ１７０５で、スキャンデータテーブル（ＳＤ）にページ番号“１”のレコードを作成する。このとき、現在のページが最終ページであるかを判断するため、ステップＳ１７０６でｎをシステムコントロールテーブル（ＳＣ）の最終ページ番号と比較し、同一であればＹＥＳの方向に進み、ステップＳ１７０７でシステムコントロールテーブル（ＳＣ）の最終ページ区分のデータを“１”に更新した上で、次のＳ１７０８の処理に進む。

次に、ステップＳ１７０６でイメージ文書のｎ（＝１）ページ目のイメージデータのみを切り出し、ＲＡＭ１２に記録する。次に、このイメージデータに対して、ＯＣＲ処理をするために、さらに、画像切り出し位置情報（例えば、図３に示す３０１、３０２、３０２，３０４）に基づきイメージデータを切り出す。

なお、イメージデータは上下が逆の場合もあるので、切り出す位置も上下が逆の位置に相当する部分も切り出し、ＲＡＭ１２にさらに記録する。次に、切り出されたそれぞれのイメージデータに対してＯＣＲ処理を行い、その結果を位置情報と共にＲＡＭ１２に記録する。例えば、切出位置３０１のOCR処理結果は“文書登録シート”、切出位置３０２のOCR処理結果は、“１５“と記録する。なお、ここで行うＯＣＲ処理は、周知の技術を利用したものである。

この結果から、ステップＳ１７１０で文書登録シートであるかを判断する。つまりシート名位置のイメージデータのＯＣＲ結果データに“文書登録シート”と同じデータがあるかを検索し、無ければ、つまりステップＳ１７１０でＮＯの場合、ステップＳ１７２２に進む。

ステップＳ１７２２では、白紙か実紙かを判断する。つまりＯＣＲ処理の結果のいずれかがデータ“なし”でない場合、つまりステップＳ１７２２でＮＯの場合、ステップＳ１７２４に進み、スキャンデータテーブル（ＳＤ）のシート区分を２（実紙）としレコードを追加する。また、ＯＣＲ処理の結果が全てデータ“なし”である場合、つまりステップＳ１７２２でＹＥＳの場合、白紙と判断してステップＳ１７２３に進みスキャンデータテーブル（ＳＤ）のシート区分を０（白紙）としレコードを更新し、後述するステップＳ１８０７に進む。

一方、ステップＳ１７１０の処理でＹＥＳの場合、当該ページが登録シートであると判断した場合、ステップＳ１７１１の処理でスキャンデータテーブル（ＳＤ）のシート区分データを１（登録シート）としレコードを更新する。

次に、ステップＳ１７１２で原稿がユーザのミスにより上下逆でスキャンされたかを判断する。つまり文書登録シートのデータがあった切出し位置が上下正常の位置のものであれば、つまりステップＳ１７１２でNOの場合はステップＳ１７１４に進む。逆に、上下逆の位置のものであれば、つまりステップＳ１７１２でＹＥＳの場合、ステップＳ１７１３に進み、システムコントロールテーブル（ＳＣ）の上下区分データを１（逆）に更新する。

また、ステップS１７１４で原稿が両面読取装置を利用し読み取られたかを判断する。つまり両面スキャン情報位置のイメージデータのＯＣＲ結果データに、“レ”が有るかをステップＳ１７１４で検索し、無ければ、つまりステップＳ１７１４でＮＯの場合、ステップＳ１７１８に進むが、有れば、つまりステップＳ１７１４でＹＥＳの場合、当該原稿が両面読取装置を利用してスキャンされたデータであると判断し、ステップＳ１７１５でスキャンデータテーブル（ＳＤ）のスキャン区分データを“１”に更新する。

なお、ここでは、登録シートにユーザが記載し、そのイメージデータを利用しＯＣＲ処理して判断するものとし説明したが、ステップＳ１６０５で、読取装置１０２が振分サーバ１０４に対してファイル名を含んだ登録シート判定処理要求を送信するとき、両面スキャンかどうかの情報を送信し、この情報から振分サーバ１０４が判断するものであっても良いし、設定情報をイメージ文書に埋め込み、この情報から振分サーバ１０４が判断するものであっても良い。

また、ステップＳ１７１６で登録シートがユーザのミスで裏面にセットされたかを判断する。つまり現在のページ番号を２で除算をし、余りがあれば、つまりステップＳ１７１６でＮＯの場合、Ｓ１７１８に進むが、偶数であれば、つまりＳ１７１６でＹＥＳの場合、裏面にセットされたと判断してステップＳ１７１７でシステムコントロールテーブル（ＳＣ）の表裏区分を１（裏）に更新する。

さらに、ステップＳ１７１８で登録シートが自動原稿送り装置の不具合による読み取りミスやユーザの原稿セットミスなどがなかったかを判断する。つまりシステムコントロールテーブル（ＳＣ）のシーケンス番号をインクリメントして、シート順情報位置のイメージデータのＯＣＲ結果データと一致している場合、つまりステップＳ１７１８でNOの場合、ステップＳ１７２０に進み、一致していない場合、つまりステップＳ１７１８でYESの場合、読み取りミスなどが発生したと判断して、ステップＳ１７１９でエラーチェックテーブル（ＥＣ）の登録シート番号とシーケンス番号のデータを、ＯＣＲ結果である登録シート番号およびシート順のデータとしてレコードを追加する。

なお、ステップS１７１９の処理をする時点でシステムコントロールテーブル（ＳＣ）に記憶されているシーケンス番号は、イニシャル値、または、前に処理をした分割イメージ文書のシーケンス番号である。

そのため、エラーチェックテーブルに追加されるシーケンス番号は、上記シーケンス番号となる。つまり、このような処理とすることで、エラー処理の対象は、登録シートを読み飛ばしたりしたときは、不要なデータを含んでいる可能性のある、前に処理をした分割イメージ文書にすることが可能となる。さらに、以降の分割イメージ文書について同様の処理を繰り返すことで、正常なシーケンス番号が続くのであれば、それらはいずれもエラー処理の対象にならいないこととすることが可能となる。

次に、ステップＳ１７２０でイメージ文書の記録先を特定するためのデータを作成する処理について説明する。OCR結果から、登録シート番号とシーケンス番号を読み出すと共に、文書名と保存先でチェックされたポジションを読み出し、それぞれの組み合わせを満たすデータセットを作成した上で、振分データテーブル（ＦＤ）に新しいレコードとして追加する。

そして、ステップＳ１７２１で、システムコントロールテーブル（ＳＣ）の登録シート番号、シーケンス番号をＯＣＲ処理結果のデータで更新し、登録シート判定処理を終了する。

なお、今回の説明では、“文書登録シート”というタイトルについて判定するものとし説明したが、これは、登録シートと登録すべき紙書類とが区別できるものなら、どのような文字、図形、記号などでも良いことはいうまでもなく、同様に“レ”で両面スキャンやポジションを判断するものと説明したが、データの有無を判断できるものであればよい。

さらに、ステップＳ１７０８で全ての切出しデータについて、ＯＣＲ処理をするものとして説明したが、一旦、登録シートか否かを判断した後、登録シートである場合のみ、他の領域の切出イメージデータについてもＯＣＲ処理するものとしても良い。

更に、ＯＣＲ処理による結果を用いるものとして説明したが、これが、パターンマッチング技術を利用するものであっても良い。

図１５によりステップＳ１５０４の整理処理を説明する。ステップＳ１５０４の整理処理は、ステップＳ１５０３の登録シート判定処理が終了した時点で開始する。また本処理は、振分サーバ１０４のＨＤＤ１４に記録されているプログラムによる制御に従ってＣＰＵ１１が行うものである。

先ず、ステップＳ１８０１で、ステップＳ１７２１で更新したシステムコントロールテーブル（ＳＣ）の表裏区分、上下区分、最終ページ区分の各データを読み込み、ＲＡＭ１２に記録する。

ここで、上下区分のデータが“１”であるかを判断し、“０”の場合、つまりステップＳ１８０２でＮＯの場合はステップＳ１８０４に進み、“１”の場合、つまりステップＳ１８０２でＹＥＳの場合は、ステップＳ１８０３でＲＡＭ１２に記録されているイメージ文書のｎページ目のイメージデータに対して上下反転処理をした上でステップＳ１８０４に進む。

次に、表裏区分のデータが“１”であるかを判断し、“０”の場合、つまりステップＳ１８０４でＮＯの場合はステップＳ１８０７に進み、“１”の場合、つまりステップＳ１８０４でＹＥＳの場合、さらに偶数ページかをステップＳ１７１６同様の処理でページ番号から判断し、偶数ページでない場合、つまりステップＳ１８０５でＮＯの場合はステップＳ１８０７に進み、偶数ページの場合、つまりステップＳ１８０５でＹＥＳの場合は、ステップＳ１８０６で、ステップＳ１８０３でＲＡＭ１２に記録されているイメージ文書の前（ｎ−１）ページ目のイメージデータとｎページ目のイメージデータとを入れ替える処理をする。なお、ここで行う上下反転処理およびページ入替処理は、周知の技術を利用したものである。

上記の処理を全てのページに対して行うために、ステップＳ１８０７で、最終ページ区分が“１”であるかを判断し、“０”の場合、つまりステップＳ１８０７でＮＯの場合はステップＳ１７０４に戻り次のページの処理を開始するが、“１”の場合、つまりステップＳ１８０７でＹＥＳの場合は、整理処理を終了する。

図１６によりステップＳ１５０５の分割保存処理を説明する。ステップＳ１５０５の分割保存処理は、ステップＳ１５０４の整理処理が終了した時点で開始する。また本処理は、振分サーバ１０４のＨＤＤ１４に記録されているプログラムによる制御に従ってＣＰＵ１１が行うものである。

先ず、ステップＳ１９０１でスキャンデータテーブル（SD）を読み出し、シート区分が“１”となるページ番号の前のページごとに、イメージ文書を分割する。その結果の分割イメージ文書ファイルをステップＳ１９０２で、仮ファイル名を付与した上で、ＲＡＭ１２に記録する。ここで仮ファイル名は、ユニークなものであれば良いが、ここでは登録シート番号とシート順と時分秒で作成するものとして説明する。

次に、ステップＳ１９０３で、スキャンデータテーブル（SD）のシート区分が“０（白紙）”、または“１（登録シート）”である不要なページデータを削除する処理を行う。さらに、両面スキャンした場合は登録シートの裏面が不要であるため、ステップＳ１９０４で、スキャン区分が“１”であるかを判断し、“０”の場合、つまりステップＳ１９０４でＮＯの場合はステップＳ１９０６に進み、“１”の場合、つまりステップＳ１９０４でＹＥＳの場合は、シート区分が“１”となる次のページデータについても削除する。なお、ここでページ単位で行う削除処理は、周知の技術を利用したものである。

次に、エラーの発生した分の分割イメージ文書ファイルについての処理になるが、ステップＳ１９０６でエラーチェックテーブル（ＥＣ）にデータが無い場合、つまりステップＳ１９０６でＮＯの場合はステップＳ１９０８に進むが、エラーのデータがある場合、つまりステップＳ１９０６でＹＥＳの場合ステップＳ１９０７に進む。

また、ステップＳ１５０２で読み取りミスなどがあった分割イメージ文書ファイルかを判断するため、ステップＳ１９０７でエラーチェックテーブル（ＥＣ）のシーケンス番号と振分データテーブル（ＦＤ）のシーケンス番号を比較し、一致している場合、つまりステップＳ１９０７でＮＯの場合、ステップＳ１９１１の処理に進むが、一致していない場合、つまりステップＳ１９０７でＹＥＳの場合、ステップＳ１９０８に進む。さらに保存先の指定がされていないかを判断するが、ステップＳ１９０８で振分データテーブル（ＦＤ）の文書名、または保存先のポジションＮＯが“０”の場合、つまりステップＳ１９０８でＮＯの場合はステップＳ１９１１の処理に進み、ステップＳ１９０８で振分データテーブル（ＦＤ）の文書名、および保存先のポジションＮＯがともに“０”でない場合、つまりステップＳ１９０８でＹＥＳの場合はステップＳ１９０９の処理に進む。

次のステップＳ１９０９で、振分データテーブル（ＦＤ）の文書名および保存先のポジションＮＯから、登録文書文書名テーブル（ＴＢ）、および登録シートテーブル（ＴＨ）を検索した結果に応じて、ステップＳ１９１０でそれぞれに対応する保存先に、文書名をつけて文書管理サーバ１０３の保存先フォルダ１１０２に記録し、ステップＳ１９１３に進む。

なお、エラー処理の対象となる分割イメージ文書ファイルについては、ステップＳ１９１１で文書管理サーバ１０３のエラーフォルダ１１０３に記録した上で、ステップＳ１９１２でエラーチェックテーブル（ＥＣ）の対応するレコードを削除し、ステップＳ１９１３に進む。

ステップ１９１３で、ＲＡＭ１２から処理対象の分割イメージ文書ファイルを削除する。

上記の処理を全ての分割イメージ文書ファイルに対して行うために、ステップＳ１９１４で、ＲＡＭ１２に分割イメージ文書ファイルあるかを判断し、“ある”の場合、つまりステップＳ１９１４でＹＥＳの場合はステップＳ１９０６に戻り次の分割イメージ文書ファイルの処理を開始するが、“ない”の場合、つまりステップＳ１９１４でＮＯの場合は、分割保存処理を終了する。

上記の処理を終えて振り分けられた分割イメージ文書ファイルは、利用者端末１０５から検索が可能であり、検索後は分割イメージ文書ファイルの閲覧・印刷・修正・削除を行うことを可能とする。また本処理は、利用者端末１０５のＨＤＤ１４に記録されているプログラムによる制御に従ってＣＰＵ１１が行うものである。

分割イメージ文書ファイルを検索する場合、利用者端末１０５がユーザからのファイル検索指示があれば文書管理サーバ１０３に対して、分割イメージ文書ファイルの一覧情報要求を送信する。このとき、日時(タイムスタンプ)・文書名・保存先など検索範囲を限定するための条件を付加しても良い。

次に、要求に対する結果を受信し、表示装置（不図示）に一覧情報を表示する。次に、ユーザから指定された分割イメージ文書ファイルの表示要求があれば、ＰＤＦ形式のファイルを表示するアプリケーションソフトを起動し、文書管理サーバ１０３から分割イメージ文書ファイルを受信の上、表示装置（不図示）に表示する。なお、ここで利用するアプリケーションソフトは汎用的なブラウザであってもよい。

また、検索対象の分割イメージ文書ファイルとしては、正常に振り分けられた分割イメージ文書ファイルだけでなく、エラーとして処理され、ステップＳ１９１１でエラーフォルダ１１０３に振り分けられた分割イメージ文書ファイルも含むものであってもよい。

上記同様、表示された一覧情報について、ユーザから指定された分割イメージ文書ファイルの表示要求があれば、ＰＤＦ形式のファイルを表示するアプリケーションソフトを起動し、文書管理サーバ１０３から分割イメージ文書ファイルを受信の上、表示装置（不図示）に表示する。さらに、修正・削除の処理を行ったり、ファイルの名前を変え文書管理サーバ１０３の所定フォルダに保存する処理を行ったりする。ここでのファイルの検索・閲覧・印刷・修正・削除機能は、周知の技術を利用したものである。

なお、本発明は、上記実施の形態に例示したものに限定されるものではなく、本発明の要旨を逸脱しない範囲において適宜変更可能である。

また、本発明の目的は、以下の処理を実行することによって達成される。即ち、上述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ（またはＣＰＵやＭＰＵ等）が記憶媒体に格納されたプログラムコードを読み出す処理である。

この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施の形態の機能を実現することになり、そのプログラムコード及び該プログラムコードを記憶した記憶媒体は本発明を構成することになる。

また、プログラムコードを供給するための記憶媒体としては、次のものを用いることができる。例えば、フロッピー（登録商標）ディスク、ハードディスク、光磁気ディスク、ＣＤ−ＲＯＭ、ＣＤ−Ｒ、ＣＤ−ＲＷ、ＤＶＤ−ＲＯＭ、ＤＶＤ−ＲＡＭ、ＤＶＤ−ＲＷ、ＤＶＤ＋ＲＷ、磁気テープ、不揮発性のメモリカード、ＲＯＭ等である。または、プログラムコードをネットワークを介してダウンロードしてもよい。

また、コンピュータが読み出したプログラムコードを実行することにより、上記実施の形態の機能が実現される場合も本発明に含まれる。加えて、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているＯＳ（オペレーティングシステム）等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれる。

更に、前述した実施形態の機能が以下の処理によって実現される場合も本発明に含まれる。即ち、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるＣＰＵ等が実際の処理の一部または全部を行う場合である。

なお、図１８に、上述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体のメモリマップを示す。

本発明の実施形態に係る文書管理装置の構成を示す図である。図１２のステップ１５０１で作成される登録シートの一例を示す図である。図１４−１のステップ１７０８で行うＯＣＲ処理のする部分を説明する図である。実施形態のシステムコントロールテーブルのテーブル構造の一例を示す図である。実施形態のスキャンデータテーブルのテーブル構造の一例を示す図である。実施形態の振分データテーブルのテーブル構造の一例を示す図である。実施形態のエラーチェックテーブルのテーブル構造の一例を示す図である。実施形態の登録シートテーブルのテーブル構造の一例を示す図である。実施形態の登録シート文書名テーブルのテーブル構造の一例を示す図である。実施形態の登録シート保存先テーブルのテーブル構造の一例を示す図である。図１における文書管理サーバ１０３のディレクトリ構成の一例を示す図である。図１における文書管理装置によって実行される文書管理処理のフローチャートである。図１２のステップＳ１５０２におけるスキャン処理のフローチャートである。図１２のステップＳ１５０３における前半部分の登録シート判定処理のフローチャートである。図１２のステップＳ１５０３における登録シート判定処理の後半部分のフローチャートである。図１２のステップＳ１５０４における整理処理のフローチャートである。図１２のステップＳ１５０５における分割保存処理のフローチャートである。図１における利用者端末２の構成を示すブロック図である。本実施形態を示す文書管理装置で読み取り可能な各種データ処理プログラムを格納する記憶媒体のメモリマップを説明する図である。

符号の説明

１０１文書管理システム
１０２画像読取装置
１０３文書管理サーバ
１０４振分サーバ
１０５利用者端末
１０６ネットワーク
１１ＣＰＵ
１２ＲＡＭ
１３ＲＯＭ
１４ＨＤＤ
１５記録媒体ドライブ
１６ビデオアダプタ
１７キーボード
１８ポインティングデバイス
１９ネットワークＩ／Ｆ

Claims

紙文書から電子化して作成したイメージ文書の属性情報に基づき保存先を決定する文書管理装置において、
紙書類をスキャンし電子化したイメージ文書を作成するイメージ文書作成手段と、
前記イメージ文書から属性を決定させるための属性識別用書類を抽出する属性識別用書類抽出手段と、
前記イメージ文書中の前記属性識別用書類から文書属性情報を抽出する文書属性情報抽出手段と、
前記文書属性情報に応じて前記イメージ文書をページ毎に体裁を整えるための整理処理する整理手段と、前記文書属性情報に基づいて前記イメージ文書を所定の場所に保存する保存手段と、
を備えることを特徴とする文書管理装置。
前記属性識別用書類抽出手段により抽出された属性識別用書類の位置を区切りとして、前記イメージ文書を分割する分割手段を備えることを特徴とした請求項１記載の文書管理装置。
前記保存手段は、文書属性情報に基づいて文書名を付与し、特定される保存先に前記イメージ文書を保存することを特徴とする請求項１または２記載の文書管理装置。
前記文書属性識別情報から上下区分が逆である場合は、前記整理手段はイメージ文書をページ毎に上下反転処理を行うことを特徴とする請求項１または２記載の文書管理装置。
前記文書属性識別情報から裏表区分が裏である場合は、前記整理手段はイメージ文書を前のページと入れ替える処理を行うことを特徴とする請求項１または２記載の文書管理装置。
前記文書属性識別情報からスキャン分が両面である場合は、前記整理手段はイメージ文書の属性識別用書類とその次のページとを削除する処理を行うことを特徴とする請求項１または２記載の文書管理装置。
前記文書属性情報のシート順が、前のイメージ文書の文書属性情報のシート順に連続していない場合は、前記イメージ文書をエラーフォルダに保存することを特徴とする請求項１または２記載の文書管理装置。
紙文書から電子化して作成したイメージ文書の属性情報に基づき保存先を決定する文書管理方法において、
紙書類をスキャンし電子化したイメージ文書を作成するイメージ文書ステップと、
前記イメージ文書から属性を決定させるための属性識別用書類を抽出する属性識別用書類抽出ステップと、
前記イメージ文書中の前記属性識別用書類から文書属性情報を抽出する文書属性情報抽出ステップと、
前記文書属性情報に応じて前記イメージ文書をページ毎に体裁を整えるための整理処理する整理ステップと、
前記文書属性情報に基づいて前記イメージ文書を所定の場所に保存する保存ステップと、を備えることを特徴とする文書管理方法。
紙文書から電子化して作成したイメージ文書の属性情報に基づき保存先を決定する文書管理方法をコンピュータに実行させるプログラムであって、
紙書類をスキャンし電子化したイメージ文書を作成するイメージ文書モジュールと、
前記イメージ文書から属性を決定させるための属性識別用書類を抽出する属性識別用書類抽出モジュールと、
前記イメージ文書中の前記属性識別用書類から文書属性情報を抽出する文書属性情報抽出モジュールと、
前記文書属性情報に応じて前記イメージ文書をページ毎に体裁を整えるための整理処理する整理モジュールと、
前記文書属性情報に基づいて前記イメージ文書を所定の場所に保存する保存モジュールと、
を備えることを特徴とする文書管理プログラム。