JP2005011260A - Document management device, document management system and program for document management - Google Patents
Document management device, document management system and program for document management Download PDFInfo
- Publication number
- JP2005011260A JP2005011260A JP2003177211A JP2003177211A JP2005011260A JP 2005011260 A JP2005011260 A JP 2005011260A JP 2003177211 A JP2003177211 A JP 2003177211A JP 2003177211 A JP2003177211 A JP 2003177211A JP 2005011260 A JP2005011260 A JP 2005011260A
- Authority
- JP
- Japan
- Prior art keywords
- image
- document management
- text data
- information
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、一定のルールに基づいてテキストデータから書誌事項を抽出する処理が実行可能な文書管理装置、文書管理システム及び文書管理用プログラムに関する。
【0002】
【従来の技術】
従来より、紙に記載された文書を電子化して登録する業務では、紙に記載された文書の画像を読み込むスキャナと、該スキャナで読み取られた画像データに対してOCR(光学式文字認識)処理を実行することでテキストデータを生成し、さらにユーザにより入力された書誌事項と画像データ及びテキストデータとを関連付けて登録するコンピュータとを備える文書管理システムが知られている。
【0003】
また、特許文献1には、紙に記載された文書を光学的に読み取り、OCR処理によって文字を認識し、文字領域のレイアウトを認識後、更に文字サイズとフォントの種類を識別してタイトルや図のキャプションやキーワードを抽出する技術が開示されている。
【0004】
さらに、特許文献2には、複写機とコンピュータを備えたシステムにおいて、複写機でインデックス情報(分類やキーワード)等を入力後、付加情報と画像データとをコンピュータ(PC)に送信し、コンピュータではこれらの付加情報と画像データとをデータベース(DB)用のデータ形式に変換し、ハードディスク等の内部に記録されたデータベースに該変換されたデータを登録して、管理する技術が開示されている。
【0005】
【特許文献1】
特開平11−238072号公報
【特許文献2】
特開2002−290661号公報
【0006】
【発明が解決しようとする課題】
しかしながら、上記従来の文書管理システムでは、画像データとテキストデータを参照しつつ、パソコン等の画面から書誌情報を手入力するのは手間がかかり、ユーザビリティに欠けるという問題がある。
【0007】
また、上記特許文献1の技術では、タイトルの自動識別はある程度できるものの、例えばタイトルの文字サイズや使用フォントが本文と同一である場合は、識別に失敗する可能性があり、また、書誌情報のうちの文書管理用情報(文書作成日、発行元や送付先等)は通常は1回だけ出現するので、頻度順のキーワード抽出では対応できない可能性が高いという問題がある。
【0008】
さらに、特定の文書全体のOCR処理には相当の時間がかかるので、文書登録業務の担当者は文書の読み込み後、OCR処理が完了するまで待機する必要があり、実稼動率が低くなるという問題がある。
【0009】
特許文献2のシステムによれば、複写機でキーワード入力後に1件づつ画像データをコンピュータに送信するので、付加情報と画像データの関連付けは容易な反面、キーワード入力と画像読み込みを同時に行うことができないという問題がある。すなわち、全体の作業時間の中で複写機が実際に画像を読み込んでいる時間の割合が低く、作業効率が悪いという問題がある。
【0010】
本発明は、上記問題点を解決するためになされたもので、文字認識処理以外の他の処理の待機時間を最小限に低減し、かつ書誌情報の入力の工数を低減することができ、作業効率の向上を図ることができる文書管理装置、文書管理システム及び文書管理用プログラムを提供することを目的とする。
【0011】
【課題を解決するための手段】
上記目的を達成するため、請求項1記載の文書管理装置は、原稿の画像を読み取る画像読取装置及び該読み取られた画像の画像データを表示するクライアント装置と通信回線を介して接続される文書管理装置において、前記画像読取装置から受信した画像データを記憶する画像記憶手段と、前記画像記憶手段に記憶された画像データに文字認識処理を施してテキストデータを生成する文字認識処理手段と、前記テキストデータから書誌情報を抽出するための抽出ルールを記憶する抽出ルール記憶手段と、前記テキストデータと前記抽出ルールに基づいて書誌情報を抽出する抽出手段と、前記画像データ、前記テキストデータ及び前記書誌情報を前記クライアント装置に送信する送信手段とを備えることを特徴とする。
【0012】
請求項2記載の文書管理装置は、請求項1記載の文書管理装置において、前記画像データ、前記テキストデータ及び前記書誌情報を関連付けて記憶する文書情報記憶手段を備えることを特徴とする。
【0013】
請求項3記載の文書管理装置は、請求項1又は2記載の文書管理装置において、前記クライアント装置から受信した前記書誌情報に対する編集情報を受信する受信手段と、該受信した編集情報に基づいて該書誌情報を更新する書誌情報更新手段とを備えることを特徴とする。
【0014】
請求項4記載の記載の文書管理装置は、請求項3記載の文書管理装置において、前記受信した編集情報に基づいて前記テキストデータを更新するテキストデータ更新手段とを備えることを特徴とする。
【0015】
請求項5記載の記載の文書管理装置は、請求項4記載の文書管理装置において、前記画像データ、前記書誌情報更新手段により更新された書誌情報及び前記テキストデータ更新手段により更新されたテキストデータに基づいて前記クライアント装置の画面に表示させるための表示情報を生成する表示情報生成手段を備えることを特徴とする。
【0016】
請求項6記載の記載の文書管理装置は、請求項3乃至5のいずれか1項記載の文書管理装置において、前記受信した編集情報は、前記クライアント装置で選択されたテキストデータが反転表示されているか否かの情報、前記クライアント装置で選択されたテキストデータを含む矩形領域が指定されているか否かの情報、及び反転表示されたテキストデータ又は指定された矩形領域に含まれるテキストデータが所定の入力フィールドにドラッグ&ドロップされたか否かを示す情報であることを特徴とする。
【0017】
請求項7記載の文書管理システムは、原稿の画像を読み取る画像読取装置と、該読み取られた画像の画像データを表示するクライアント装置と、前記画像読取装置及び前記クライアント装置と通信回線を介して接続される文書管理装置とを備える文書管理システムにおいて、前記画像読取装置は、前記読み取った画像の画像データに文字認識処理を施してテキストデータを生成する文字認識処理手段と、前記画像データ及び前記テキストデータを前記文書管理装置に送信する送信手段とを備え、前記文書管理装置は、前記画像読取装置から受信した画像データ及びテキストデータを記憶する記憶手段と、前記テキストデータから書誌情報を抽出するための抽出ルールを記憶する抽出ルール記憶手段と、前記テキストデータと前記抽出ルールに基づいて書誌情報を抽出する抽出手段と、前記画像データ、前記テキストデータ及び前記書誌情報を前記クライアント装置に送信する送信手段とを備えることを特徴とする。
【0018】
請求項8記載の文書管理システムは、原稿の画像を読み取る画像読取装置と、該読み取られた画像の画像データを表示するクライアント装置と、前記画像読取装置及び前記クライアント装置と通信回線を介して接続される文書管理装置とを備える文書管理システムにおいて、前記クライアント装置は、前記画像読取装置から受信した画像データを記憶する画像記憶手段と、前記画像記憶手段に記憶された画像データに文字認識処理を施してテキストデータを生成する文字認識処理手段と、前記テキストデータから書誌情報を抽出するための抽出ルールを記憶する抽出ルール記憶手段と、前記テキストデータと前記抽出ルールに基づいて書誌情報を抽出する抽出手段と、前記クライアント装置に前記画像データ、前記テキストデータ及び前記書誌情報を表示させるための表示情報生成手段とを備えることを特徴とする。
【0019】
請求項9記載の文書管理システムは、請求項8記載の文書管理システムにおいて、前記文書管理装置は、前記クライアント装置から受信した前記書誌情報に対する編集情報を受信する受信手段を備え、前記受信した編集情報は、前記クライアント装置で選択されたテキストデータが反転表示されているか否かの情報、前記クライアント装置で選択されたテキストデータを含む矩形領域が指定されているか否かの情報、及び反転表示されたテキストデータ又は指定された矩形領域に含まれるテキストデータが所定の入力フィールドにドラッグ&ドロップされたか否かを示す情報であることを特徴とする。
【0020】
請求項10記載の文書管理用プログラムは、原稿の画像を読み取る画像読取装置及び該読み取られた画像の画像データを表示するクライアント装置と通信回線を介して接続されるコンピュータに実行させる文書管理用プログラムにおいて、前記画像読取装置から受信した画像データを記憶する画像記憶モジュールと、前記画像記憶手段に記憶された画像データに文字認識処理を施してテキストデータを生成する文字認識処理モジュールと、前記テキストデータから書誌情報を抽出するための抽出ルールを記憶する抽出ルール記憶モジュールと、前記テキストデータと前記抽出ルールに基づいて書誌情報を抽出する抽出ステップと、前記画像データ、前記テキストデータ及び前記書誌情報を前記クライアント装置に表示させるための表示情報を生成する表示情報生成モジュールとを備えることを特徴とする。
【0021】
【発明の実施の形態】
以下、本発明の実施の形態を図面を参照して説明する。
【0022】
(第1の実施の形態)
図1は本発明の第1の実施の形態に係る文書管理装置のハードウェア構成を示すブロック図である。
【0023】
同図において、CPU21(送信手段、受信手段、表示情報生成手段)、RAM22、ROM23、LANアダプタ24(送信手段、受信手段)、ビデオアダプタ25、キーボード26、マウス27、ハードディスク28、CD−ROMドライブ29はそれぞれシステムバス20を介して互いに接続されている。システムバス20は、例えばPCIバス、AGPバス又はメモリバス等である。文書管理サーバ110は各バス間の接続用チップ、キーボードインタフェース及びいわゆるSCSIやATAPIのような入出力用インタフェースを備えているが、図1ではこれらを省略している。
【0024】
CPU21は、四則演算や比較演算等の各種の演算及びハードウェアやソフトウェアの制御を行う。RAM22には、ハードディスク28やCD−ROMドライブ29に装着されたCD−ROMやCD−R等の記憶媒体から読み出されたオペレーションシステムのプログラムやアプリケーションプログラム等が記憶され、これらのプログラムはCPU21の制御により実行される。ROM23には、オペレーションシステムと協働してハードディスク等への入出力を司るいわゆるBIOS等が記憶されている。LANアダプタ24は、CPU21によって制御されるオペレーションシステムに含まれる通信プログラムと協働して、ネットワーク(不図示)を介した外部装置(不図示)との通信を行う。ビデオアダプタ25はディスプレイ装置(不図示)に接続され、該ディスプレイ装置に出力する画像信号を生成し、キーボード26やマウス27は文書管理サーバ110への指示を入力するために用いられる。
【0025】
ハードディスク28はオペレーションシステムやアプリケーションプログラムや後述する抽出ルール記憶部115や書誌DB116等の各種データや不図示の各種マスタファイルを記憶している。CD−ROMドライブ29はCD−ROM、CD−R、又はCD−R/W等の記憶媒体を装着してアプリケーションプログラムをハードディスク28にインストールするために使用する。CD−ROMドライブの代わりにCD−Rドライブ、CD−R/Wドライブ、又はMOドライブ等を用いても良いのは言うまでもない。
【0026】
後述する作業端末120及び管理端末130も図1の文書管理装置と同様のハードウェア構成を備えている。
【0027】
図2は、本発明の実施形態に係る文書管理装置を適用可能な文書管理システムの構成を示すブロック図である。本発明の実施形態に係る文書管理装置は文書管理サーバ110に適用される。
【0028】
同図において、文書管理システムは、通信回線100、文書管理サーバ110、作業端末120、管理端末130及び複合機140を備えている。
【0029】
作業端末120及び管理端末130は、例えば、パソコン、いわゆるPDA(Personal Digital Assistant)又はインターネット対応の携帯電話等であり、文字の入力と画像や文字の表示が可能であれば良い。
【0030】
通信回線100は、典型的にはインターネット、LAN(Local Area Network)、WAN(Wide Area Network)、電話回線、専用デジタル回線、ATM(Asynchronous Transfer Mode)、フレームリレー回線、通信衛星回線、ケーブルテレビ回線、又はデータ放送用無線回線等のいずれか、又はこれらの組み合わせにより実現されるいわゆる通信ネットワークであり、データの送受信が可能であれば良い。
【0031】
文書管理サーバ110は、所定のOS(例えば,UNIX(登録商標)やWINDOWS(登録商標)が含まれる)及びアプリケーションプログラムによって文書の登録処理や検索処理を行う。文書管理サーバ110は、書誌登録部111(書誌情報更新手段)、OCR処理部112(文字認識処理手段)、書誌抽出部113(抽出手段)、画像管理部114、抽出ツール記憶部115(抽出ルール記憶手段)、書誌データベース(DB)116(文書情報記憶手段)、画像データベース(DB)117(画像記憶手段)及びテキストデータベース(DB)118を備えている。
【0032】
画像管理部114は、複合機140から通信回線100を介して受信した画像データを画像DB117に記憶する処理を行う。OCR処理部112は画像DB117に記憶されている画像データのうちOCR処理を実行していないものについて文字認識処理を実行するためのプログラムと認識用辞書を備え、文字認識処理により生成されたテキストデータをテキストDB118に記憶する。テキストDBは全文検索も可能なデータベースであるが、検索についての詳細な説明は省略する。
【0033】
書誌抽出部113は、テキストデータと抽出ルール記憶部115に記憶されている書誌情報の抽出ルールに基づいて、書誌情報の抽出を行う。抽出ルール115に記憶されている書誌情報の抽出ルールについては後述する図8,9で詳細に説明する。
【0034】
書誌登録部111は、作業端末120から受信した編集情報に基づいて書誌情報の更新を行い、「登録」を指示する編集情報を作業端末120から受信した場合は、書誌情報を書誌DB116に登録する。この書誌情報は画像DB117中の対応する画像データ及びテキストDB118中の対応するテキストデータと関連付けられている。なお、書誌DB116と画像DB117とテキストDBを連携させて検索可能な不図示の検索処理部も文書管理サーバ110に含まれるが詳細な説明は省略する。
【0035】
書誌登録部111、OCR処理部112、書誌抽出部113及び画像管理部114はハードディスク28に記憶されたプログラムに基づいてCPU21が制御を実行することで実現され、書誌データベース(DB)116、画像データベース(DB)117及びテキストデータベース(DB)118はハードディスク28内に構築される。
【0036】
次に、複合機140は、CCD等の撮像素子を備えた不図示のスキャンエンジンと、スキャンエンジンが読み込んだ画像データを記憶する画像データ記憶部147と、記憶した画像データを文書管理サーバ110に送信すると共に送信した履歴をログデータ記憶部146に記憶させる制御部145と、入力されるPDLデータを印刷する機能及びスキャンエンジンから出力される画像データを印刷する機能とを備えた不図示のプリンタエンジンとを備え、スキャンエンジンとプリンタエンジンとは相互に通信可能に構成されている。ログデータ記憶部146と画像データ記憶部147は複合機140が備えるハードディスク装置で構成される。
【0037】
また、複合機140は、不図示のネットワークコントローラと通信I/Fを備えて、通信回線100を介して、文書管理サーバ110、作業端末120及び管理端末130と通信可能に接続されている。
【0038】
図3,4は図2における文書管理システムで実行される処理を示すフローチャートである。
【0039】
図3,4において、ステップS601〜ステップS607の処理は、作業端末120の不図示のCPUの制御により実行され、ステップS621〜ステップS636の処理は、文書管理サーバ110のCPU21の制御により実行され、ステップS641〜ステップS643の処理は複合機140の不図示のCPUの制御により実行される。
【0040】
文書管理サーバ110がステップS621の処理を実行する前に、既に、作業端末120が文書管理サーバ110に対して認証要求を実行すること、即ちユーザIDやパスワードを送信すること、文書管理サーバ110が認証処理を実行すること、作業端末120が文書管理サーバ110に対してメニュー選択情報を送信すること、及び文書管理サーバ110がメニュー選択情報に基づく作業端末120用の画面情報を生成することは、終了しているものとする。また複合機140にはスキャニングする文書が既に置かれているものとする。
【0041】
まず、文書管理サーバ110が、作業端末120で文書登録画面を表示させるための画面情報を送信し(ステップS621)、作業端末120に接続されたディスプレイは図5に示すような画面を表示する(ステップS601)。
【0042】
図5は、作業端末120の画面に、書誌登録の処理の際に表示されるアプリケーションの一例を示す図である。
【0043】
同図において、符号1200はスキャン指示を入力するためのスキャンボタンであり、符号1201はOCR処理の対象となる画像データを表示する画像表示部であり、符号1202は実際にOCR処理によって認識されたテキストデータを表示するイメージ表示部であり、符号1209〜1215は各種書誌情報の入力欄であり、符号1203はテキストデータの情報又は書誌情報を更新する更新ボタンであり、符号1204は前ページの画像データ、テキストデータ及び書誌候補を文書管理サーバ110に要求するための前ページボタンであり、符号1205は次ページの画像データ、テキストデータ及び書誌候補を文書管理サーバ110に要求するための次ページボタンであり、符号1206は書誌情報を文書管理サーバ110に登録するための登録ボタンであり、符号1207は次文書の先頭ページの画像データ、テキストデータ及び書誌候補を文書管理サーバ110に要求するための次文書ボタンであり、符号1208は終了ボタンである。
【0044】
図5において、スキャンボタン1200が押下されると、作業端末120はスキャニングの開始を要求する旨の情報(スキャン要求情報)と該情報の送信元である作業端末120を特定する作業端末特定情報(例えば、ユーザIDやセッションID等)を文書管理サーバ110に送信する(ステップS602)。
【0045】
文書管理サーバ110は、作業端末120から受信したスキャン要求情報及び作業端末特定情報を複合機140に転送すると共に所定の文書番号を1つ採番する(ステップS622)。文書番号は文書1つに対して1つ採番される一意の管理番号であり、書誌DB116、画像DB117及びテキストDB118の検索キー又は検索キーの一部として使用され、これら3つのDBのデータの関連付けに使用される。
【0046】
複合機140は、文書管理サーバ110からのスキャン要求情報及び作業端末特定情報を受信し(ステップS641)、文書のスキャニングを実行し(ステップS642)、画像データ記憶部147に画像データを記憶する。画像データにはページ単位で一意の画像番号が採番される。画像番号は、例えば画像スキャン要求の受信時刻(14桁)とページ数(下3桁)とを組み合わせて採番する。
【0047】
複合機140の制御部145は、スキャン画像及びスキャン要求元の作業端末特定情報を一緒に文書管理サーバ110に送信し、送信した画像の名称と送信時刻をログデータ記憶部146に記憶する(ステップS643)。
【0048】
ステップS643で画像データの送信が正常終了しなかった場合は、一定時間経過後にリトライし、所定回数リトライしても送信が正常終了しなかった場合は、その旨をログデータ記憶部146に記憶するように構成してもよい。
【0049】
文書管理サーバ110では、上記ステップS621やステップS622とは別のプロセス(ステップS623〜ステップS629)が実行されており、CPU21は複合機からのスキャン画像の待ち状態になっており(ステップS623)、一定時間間隔で受信すべきスキャン画像があるか否かを判別し(ステップS624)、受信すべきスキャン画像がない場合(ステップS624でNoの場合)には、ステップS623に戻って待機する。ステップ624の判別の結果、受信すべきスキャン画像がある場合(ステップS624でYesの場合)には、スキャン画像を受信した後、画像管理部114により受信した画像データが画像DB117に登録される(ステップS625)。
【0050】
次いで、OCR処理部112が画像DB117に登録された画像データに対して1ページずつOCR処理を施し、該OCR処理により認識されたテキストはRAM22からテキストDB118に追加される(ステップ626)。OCR処理が施された画像データには画像DB117内でフラグが付される。OCR処理の詳細は後述する。
【0051】
次に、書誌抽出部113が抽出ルール記憶部115に記憶されている抽出ルールに基づいてRAM22のワークエリア内の認識されたテキストデータから書誌情報の候補を抽出し、RAM22のワークエリア内に記憶する(ステップ627)。書誌候補抽出処理の詳細も後述する。
【0052】
その後、CPU21は、受信した1ページ分の画像データと、この画像データに対応するテキストデータと、文書の先頭ページから抽出された書誌情報の候補とをRAM22のワークエリアから作業端末120に送信する(ステップ628)。
【0053】
次いで、CPU21は、画像DB117に登録された画像データであって、OCR処理部112によりOCR処理が施されていないページが存在するか否かを判別する(ステップS629)。具体的には、CPU21がOCR処理時に更新される画像DB117のフラグの有無を検出し、フラグがある場合にはOCR処理が施されていないページが存在すると判断し、フラグがない場合にはOCR処理が施されていないページは存在しないと判断する。又はCPU21は画像データに対応するテキストデータがテキストDB118に存在するか否かを確認することによりステップS629の判別を実行してもよい。
【0054】
ステップS629の判別の結果、OCR処理が施されていないページが存在する場合には、ステップS626の処理に戻り、次ページの画像データのOCR処理が実行される。一方OCR処理が施されていないページが存在しない場合には、ステップS623の処理に戻り、CPU21は次の画像データの受信を待つ。
【0055】
次いで、作業端末120が、ステップS628の処理で文書管理サーバ110から送信される画像データ、テキストデータ及び書誌候補を受信する(ステップS603)。作業端末120では図5に示すような画面が表示され、同図の画像表示部1201には画像データが表示され、イメージ表示部1202にはOCR処理によって認識されたテキストデータが表示され、さらに各種書誌情報の入力欄1209〜1215には書誌情報の候補が表示され、画面表示が更新される(ステップ604)。
【0056】
次に、作業端末120は、キーボード26の入力情報やマウス27の操作情報を識別し(ステップ605)、これらの情報を文書管理サーバ110に送信する(ステップ606)。作業端末120は、入力情報や操作情報がない場合には入力や操作が有るまで待機する。
【0057】
文書管理サーバ110のCPU21は、ステップS606で作業端末120から送信されるキーボード26の入力情報やマウス27の操作情報を受信し、この受信した入力情報や操作情報に基づいて、作業端末120の画面において終了ボタン1208が押下されたか否かを判別する(ステップS630)。
【0058】
ステップS630の判別の結果、終了ボタン1208が押下された場合には、本処理を終了する一方、終了ボタン1208が押下されていない場合には、ステップS606で作業端末120から送信されるキーボード26の入力情報やマウス27の操作情報に基づいて、作業端末120の画面において次文書ボタン1207が押下されたか否かを判別する(ステップS631)。
【0059】
ステップS631の判別の結果、次文書ボタン1207が押下された場合には、CPU21が現在処理している文書の次文書のOCR処理及び書誌候補抽出処理が終了しているか否かを判別し(ステップS632)、これらの処理が終了している場合には、ステップS628の処理に戻り、CPU21が次文書の先頭ページの画像データと、これに対応するテキストデータと、書誌情報の候補とを作業端末120に送信する。一方ステップS632の処理が終了していない場合には、ステップS626の処理に戻り、CPU21が次文書の先頭ページのOCR処理を行う。
【0060】
ステップS631の判別の結果、次文書ボタン1207が押下されていない場合には、ステップS606で作業端末120から送信されるキーボード26の入力情報やマウス27の操作情報に基づいて、作業端末120の画面において前ページボタン1204又は次ページボタン1205が押下されたか否かを判別する(ステップS633)。
【0061】
ステップS633の判別の結果、前ページボタン1204又は次ページボタン1205が押下された場合には、ステップS628の処理に戻り、押下されたボタンに応じて前ページ又は次ページの画像データと、これに対応するテキストデータと、書誌情報の候補とを作業端末120に送信する。
【0062】
ステップS633の判別の結果、前ページボタン1204又は次ページボタン1205が押下されていない場合には、ステップS606で作業端末120から送信されるキーボード26の入力情報やマウス27の操作情報に基づいて、作業端末120の画面において登録ボタン1206が押下されたか否かを判別する(ステップS634)。
【0063】
ステップS634の判別の結果、登録ボタン1206が押下された場合には、RAM22のワークエリアに記憶されていた書誌情報がハードディスク28に送信され、ステップS623の処理に戻る。文書管理サーバ110では、作業端末120に登録処理が終了した旨のメッセージを送信した後、書誌DB116を更新する。
【0064】
一方、ステップS634の判別の結果、登録ボタン1206が押下されていない場合には、イメージ表示部1202に表示されるテキストデータの情報が修正されたか、又は書誌情報の入力欄1209〜1215のいずれかの情報が修正された場合であるので、これらの修正を反映してRAM22のワークエリア内のテキストデータ(テキストデータ更新手段)又は書誌情報を更新し、この更新された内容を含む画面情報を生成し、作業端末120に送信する(ステップS635)。
【0065】
作業端末120はステップS635の処理で文書管理サーバ110から受信した画像情報を受信し(ステップS607)、ステップS604の処理を実行する。
【0066】
更新ボタン1203が押下された場合は、文書管理サーバ110がステップS635の処理を実行し、作業端末120はステップS607の処理を実行する。
【0067】
本処理によれば、原稿の画像データを1ページ単位でOCR処理して書誌情報を抽出し、元の画像データとテキストデータと抽出した書誌情報とが作業端末120の画面に表示され、バックグラウンドで次ページ以降のOCR作業が続行されるので、文字認識処理以外の他の処理の待機時間を最小限に低減し、かつ書誌情報の入力の工数を低減することができ、作業効率の向上を図ることができる。
【0068】
上記ステップS602のスキャニングを要求する旨の情報は、スキャナーやスキャナー機能を有する複合機に直接送信しても良い。この場合、ステップS643ではスキャン画像と同時にスキャニング要求元を特定する情報(ユーザID等)が一緒に送信される。
【0069】
図6,7は、OCR処理(図3のステップS626)を示すフローチャートである。
【0070】
図6,7において、ステップS701〜ステップS724の処理は文書管理サーバ110のCPU21の制御により実行される。
【0071】
まず、RAM22のワークエリア内に記憶しているOCR対象の画像データに基づき、文字ブロックと行間の解析が実行される(ステップS701)。「文字ブロック」とは、上下を空白行で挟まれているか、又は左右を所定数以上のスペースで挟まれている文字列である。左右を所定数以上のスペースで挟まれている場合を含むのは、例えば行の右端に作成年月日があり、直ぐ下の行の中央部分に表題があるようなケースを想定するからである。行間は、画像データを横方向に走査し、黒比率がゼロに近い所定値(例えば0.1)以下の場合は行間又は空白行であり、所定値以上の部分は文字行の一部と判定する。また、文字ブロック解析及び行間解析により、当該ページの最終文字の位置が確定される。最終文字の位置は再下段の文字ブロックの最終行の右端部分として確定される。最終文字位置については後で詳述する。
【0072】
次いで、画像データ全体を横方向に走査し、罫線認識を行い、画像データが特定フォーマット(例えば文書の仕切り用紙のフォーマット)と合致しているか否かを解析する(ステップS702)。
【0073】
ステップS702の解析の結果、画像データが特定フォーマットと合致していない場合には、本処理を終了し、画像データが特定フォーマットと合致している場合には、そのフォーマットに対応する特定位置の文字が文字認識処理の対象になる。特定のフォーマットの罫線情報は不図示の書式テーブル(物理的にはハードディスク28)に記憶される。
【0074】
次に、RAM22のワークエリア内の最終文字フラグがオンになっているか否かを判別する(ステップS703)。最終文字フラグとは、OCR対象の画像データの最後の文字の文字認識処理が終わった時点でオンになるフラグである。
【0075】
ステップS703の判別の結果、最終文字フラグがオンである場合には、今回処理している画像データが仕切り紙であるか否かを判別し(ステップS705)、この判別結果に応じて仕切りしであるか否かの識別データをOCR処理のテキストデータに追加し(ステップS706)、本処理を終了する。
【0076】
一方、ステップS703の判別の結果、最終文字フラグがオンでない場合には、ステップS701の行間解析の結果に基づいて、文字範囲の解析が実行される(ステップS704)。ステップS701の行間解析において画像データの垂直方向の文字間隔が判明しているので、このステップS704では垂直方向の文字間隔又はその半分の値を文字範囲解析の初期値として文字範囲の判定を行う。文字範囲の判定は文字と文字との間の空白部を識別して各文字の範囲を判定する。
【0077】
次に、確定した1文字分の範囲の黒色が占める比率を集計し(ステップS707)、この集計された黒色が占める比率の値が所定値(例えば0.005)を超えているか否かを判別する(ステップS708)。黒色の比率が所定値以下の場合には、前後の所定文字数分の黒比率が判定され、ステップS701の文字ブロック範囲の判定とあわせて、今回判定した文字が行頭又は行末にあるか否かを判定する(ステップS709)。
【0078】
次いで、今回の文字がスペースであるか否かを判別し(ステップS710)、今回の文字がスペースである場合には、出力されるテキストデータにスペースが1つ追加され(ステップS711)、後述するステップS723の処理に進む。一方、今回の文字がスペースでない場合には、今回の文字が、「。」や「、」や「・」等のいずれかの記号であるか否かを判別し(ステップS712)、今回の文字が記号である場合には、出力されるテキストデータに記号を1つ追加し(ステップS713)、後述するステップS723の処理に進む一方、今回の文字が記号でない場合には、後述するステップS723の処理に進む。
【0079】
上記ステップS708の判別の結果、黒色が占める比率の値が所定値を超えている場合には、1文字分の画像データと辞書の文字データの各画素の一致又は不一致を照合する(ステップS714)。
【0080】
次いで、ステップS714の辞書照合が完了したか否かを判別し(ステップS715)、辞書照合が完了していない場合には、ステップS714の照合結果に基づいて1文字分の画像データと辞書の文字データの各画素の一致率を判定する(ステップS716)。この辞書の文字データはハードディスク28に記憶されている。
【0081】
次に、ステップS716で判定された一致率が所定値A(例えば0.8)を超えているか否かを判別し(ステップS717)、一致率が所定値Aを超えている場合には、該当の文字のテキストデータを辞書から選択し、その文字の一致率とペアにしてRAM22のワークエリア内の候補配列に追加し(ステップS718)、ステップS714に戻り、辞書の次の文字との照合を行う。
【0082】
一方、ステップS717の判別の結果、一致率が所定値A以下の場合には、ステップS718の処理をスキップして、ステップS714に戻る。
【0083】
上記ステップS715の辞書照合が完了した場合には、1文字分の画像データと候補配列の各文字の一致率を比較し(ステップS719)、一致率が最大である文字のテキストデータが出力用テキストデータに追加される(ステップS720)。
【0084】
次いで、一致率の最大値が所定値(例えば0.9)を超えているか否かを判別し(ステップS721)、一致率の最大値が所定値以下の場合は、警告フラグがオンになり出力用テキストデータに所定の特殊文字を出力する(ステップS722)。この特殊文字により、画面表示時(図4のステップS604)では、特殊文字の直前のテキストが通常の色(例えば黒色)以外の別の色(例えば青色)で表示される。
【0085】
このように処理することで、文字の識別が正確かどうか疑わしい個所の色を変えて表示可能となるので、人手によるOCR処理の目視確認作業と訂正作業を効率的に行うことが可能になる。
【0086】
次に、今回識別した文字が1ページ分の画像データにおける最終文字であるか否かを判別し(ステップS723)、今回識別した文字が1ページ分の画像データにおける最終文字である場合は、RAM22のワークエリア内の最終文字フラグデータをオンとし(1が代入され)(ステップS724)、ステップS703の処理に戻る。ステップS723の判別の結果、今回識別した文字が1ページ分の画像データにおける最終文字でない場合は、直ちにステップS703に戻る。
【0087】
以上説明したように、図6,7のOCR処理では画像データにおけるスペースや句読点等の記号も判定して該画像データに対応するテキストデータを出力するので、元画像データとレイアウトの一致した文字認識処理が可能になる。
【0088】
図8,9は、書誌候補抽出処理(図3のステップS627)を示すフローチャートである。
【0089】
図8,9のステップS821〜ステップS836の処理は文書管理サーバ110のCPU21の制御により実行される。
【0090】
本処理では、書誌情報は文書の先頭ページにあることを前提としている。
【0091】
まず、書誌情報を抽出しようとするページが文書の先頭ページであるか否かを判別する(ステップS821)。書誌情報を抽出しようとするページが文書の先頭ページでない場合には、本処理を終了する一方、書誌情報を抽出しようとするページが文書の先頭ページである場合は、上記OCR処理で抽出されたテキストデータの文字ブロックが1つ読み込まれる(ステップS822)。ここで「文字ブロック」とは、所定数以上(例えば2つ以上)のスペースであるか、又は最初の文字が行頭又は行末にある一連の文字データをいう。
【0092】
次に、読み込んだ文字ブロックを抽出ルール記憶部115に記憶されている候補辞書と照合し(ステップS823)、文字ブロックの先頭が「平成」等の元号であり、かつ、末尾が「日」であり、さらに文字ブロックの位置がページの中央より右側であるか否かを判別する(ステップS824)。これら全ての条件を満たしている場合(ステップS824でYES)には、当該文字ブロックのテキストデータを書誌情報の「発行日」の入力欄に上書きし(ステップS825)、ステップS836の処理に進む。
【0093】
ステップS836では、現在読み込んでいる文字ブロックが先頭ページの最終ブロックであるか否か(当該文字ブロックよりも右側又は下側に他の文字ブロックが存在するか否か)を判別し、現在読み込んでいる文字ブロックが最終ブロックである場合は、本処理を終了する。一方、現在読み込んでいる文字ブロックが最終ブロックでない場合には、ステップS822の処理に戻り、次の文字ブロックを読み込む。
【0094】
一方、ステップS824の判別の結果、いずれか1つでも条件を満たしていない場合(ステップS824でNO)には、文字ブロックの先頭が組織名称であり、かつ、末尾が「殿」であるか否かを判別する(ステップS826)。
【0095】
ステップS826の判別の結果、全ての条件を満たしている場合(ステップS826でYES)には、当該文字ブロックのテキストデータを書誌情報の「送付先部署」の入力欄に上書きし(ステップS827)、ステップS836の処理に進む。
【0096】
ステップS826の判別の結果、いずれか1つでも条件を満たしていない場合(ステップS826でNO)には、文字ブロックの先頭が組織名称であるか又は文字ブロックの末尾が官職であり、かつ、文字ブロックの位置がページの中央より右側であるか否かを判別する(ステップS828)。
【0097】
ステップS828の判別の結果、全ての条件を満たしている場合(ステップS828でYES)には、当該文字ブロックのテキストデータを書誌情報の「文書作成元」の入力欄に上書きし(ステップS829)、ステップS836の処理に進む。
【0098】
ステップS828の判別の結果、いずれか1つでも条件を満たしていない場合(ステップS828でNO)には、文字ブロックの先頭が文書名称であるか又は元号であり、かつ、文字ブロックの末尾が「号」であり、さらに文字ブロックの位置がページの中央より右側であるか否かを判別する(ステップS830)。
【0099】
ステップS830の判別の結果、全ての条件を満たしている場合(ステップS830でYES)には、当該文字ブロックのテキストデータを書誌情報の「文書番号」の入力欄に上書きし(ステップS831)、ステップS836の処理に進む。
【0100】
ステップS830の判別の結果、いずれか1つでも条件を満たしていない場合(ステップS830でNO)には、文字ブロックの末尾の文字が「の件」であるか、「通達」であるか、「通知」であるか又は「について」であるか否かを判別する(ステップS832)。
【0101】
ステップS832の判別の結果、全ての条件を満たしている場合(ステップS832でYES)には、当該文字ブロックのテキストデータを書誌情報の「収受文書名」の入力欄に上書きした後(ステップS833)、当該入力欄の属性を「上書き禁止」に変更し、ステップS834の処理に進む。
【0102】
ステップS832の判別の結果、いずれか1つでも条件を満たしていない場合(ステップS832でNO)には、ステップS836の処理に進む。
【0103】
次いで、ステップS833で上書きされた収受文書名をキーにして、抽出ルール記憶部115に記憶されている管理テーブルから、主管課、担当者、文書区分及び保管期限のデータを抽出し(ステップS834)、書誌情報の入力欄にこれらデータを上書きし、この上書き直後、これらのデータの属性を上書き禁止に変更し(ステップS835)、ステップS836の処理に進む。
【0104】
ステップS833,S834で属性が「上書き禁止」に設定されるのは、文書の本文中に他の文書名称が存在する場合に、本処理で「収受文書名」と収受文書名と関連するデータとが上書きされてしまう事態を防止するためである。
【0105】
なお、本フローチャートの処理の範囲外のことであるが、この書誌候補抽出処理が終わった後、作業端末120の操作者がカーソルをこれらの入力フィールドに移動して、手入力での修正を行うのは勿論可能である。
【0106】
本処理によれば、きめ細かい抽出ルールに基づいて文書の先頭ページのテキストデータから書誌情報の候補が抽出され入力フィールドに入力されるので、書誌情報の入力工数を最小限に抑制することができる。
【0107】
図10は図3における文書管理システムで実行される処理の一部の変形例を示すフローチャートであるので、図3と異なる処理を示す。
【0108】
図10のステップS630及びステップS1123〜ステップS1134の処理は、文書管理サーバ110のCPU21の制御により実行され、ステップS606,S607の処理は作業端末120のCPUの制御により実行される。
【0109】
作業端末120では、ブラウザソフト、Java(登録商標)Script、及びActiveXが組み合わされるか、又はクライアントのアプリケーションがインストールされ起動している。
【0110】
作業端末120は、図3のステップS605でキーボード26の入力情報やマウス27の操作情報を識別し、これらの情報を文書管理サーバ110に送信する(ステップ606)。これらの情報は、例えば「ドラッグ&ドロップ操作」、「文字列の反転操作」、「特定入力フィールドへの文字入力」、「矩形領域の指定」、及び各種ボタンの押下である。操作情報がドラッグ&ドロップである場合は、ドラッグされた文字列、ドラッグ開始の座標及びドロップ先の座標が操作情報に含まれている。また、矩形領域が指定された場合は、矩形領域内のテキスト情報も操作情報に含まれる。
【0111】
文書管理サーバ110のCPU21は、ステップS606で作業端末120から送信されるキーボード26の入力情報やマウス27の操作情報に基づいて、作業端末120の画面において終了ボタン1208が押下されたか否かを判別する(ステップS630)。
【0112】
ステップS630の判別の結果、終了ボタン1208が押下された場合には、本処理を終了する一方、終了ボタン1208が押下されていない場合には、ステップS606で作業端末120から送信されるキーボード26の入力情報やマウス27の操作情報が「矩形領域の指定」であるか否かを判別する(ステップS1123)。
【0113】
ステップS1123の判別の結果、キーボード26の入力情報やマウス27の操作情報が「矩形領域の指定」である場合には、CPU21は矩形領域内のテキストデータをRAM22のワークエリアのバッファ領域に蓄積する(ステップS1124)一方、キーボード26の入力情報やマウス27の操作情報が「矩形領域の指定」でない場合には、後述するステップS1125の処理に進む。
【0114】
次に、CPU21はキーボード26の入力情報やマウス27の操作情報が「文字列反転」であるか否かを判別し(ステップS1125)、キーボード26の入力情報やマウス27の操作情報が「文字列反転」でない場合には、後述するステップS1127の処理に進む一方、キーボード26の入力情報やマウス27の操作情報が「文字列反転」である場合には、反転部分のテキストデータをRAM22のワークエリアのバッファ領域に蓄積し(ステップS1126)、ステップS1127の処理に進む。このバッファ領域にはドラッグ元の座標もテキストデータと関連付けて記憶される。
【0115】
次いで、CPU21はキーボード26の入力情報やマウス27の操作情報が「ドラッグ&ドロップ操作」であるか否かを判別し(ステップS1127)、キーボード26の入力情報やマウス27の操作情報が「ドラッグ&ドロップ操作」でない場合には、ステップS634の処理に進む一方、キーボード26の入力情報やマウス27の操作情報が「ドラッグ&ドロップ操作」である場合には、矩形領域内のテキストデータをRAM22のワークエリアのバッファ領域に蓄積する。このバッファ領域にはドラッグ元の座標もテキストデータと関連付けて記憶される。
【0116】
次いで、CPU21はドラッグ元の座標とドラッグ先の座標とを検出し、ドラッグ先の座標に基づいて該当データの上書き入力先のフィールドを特定し(ステップS1128)、さらにドラッグ元の座標から、ドラッグ元が反転文字列であるか又は矩形領域内のどの文字列であるかを特定する(ステップS1129)。その後、RAM22のワークエリアのバッファ領域内の特定された文字列をステップS1128で特定された入力フィールドに上書き入力し(ステップS1130)、ステップS634の処理に進む。ステップS634の処理については、図3の説明で上述している。
【0117】
ステップS1134では、CPU21が書誌登録が終了した旨のメッセージを作業端末井120に送信する。
【0118】
本処理によれば、作業端末120の操作者が、特定の文字列を囲む矩形領域を指定し、又は特定の文字列を反転した後、所望の入力フィールドにドラッグ&ドロップすると、これらの行為がそのまま文書管理サーバ110内で自動的に実現されるので、簡単に書誌情報等の入力フィールドの文字列を更新することが可能となり、書誌情報等の入力工数を削減し、操作者の負担を軽減することが可能になる。
【0119】
上述したように、本実施の形態によれば、文書管理サーバ110は複合機140で読み取られた画像データのOCR処理を実行し、このOCR処理により得られたテキストデータから、一定のルールに基づいて書誌情報を抽出し、画像データ、テキストデータ及び抽出された書誌情報を作業端末120に送信し、これらの書誌情報抽出処理やデータ等の送信処理のバックグラウンドで並行してOCR処理を続行する一方、作業端末120は画面に画像データ、テキストデータ及び抽出された書誌情報を表示するので、文字認識処理以外の他の処理の待機時間を最小限に低減し、かつ書誌情報の入力の工数を低減することができ、作業効率の向上を図ることができる。
【0120】
本実施の形態では、文書管理サーバ110がOCR処理部を備えていたが、OCR処理部だけを独立した他のサーバ(OCRサーバ)として構成しても良い。このとき、OCR処理により認識されたテキストデータはOCRサーバから文書管理サーバに送信され、テキストDB118に記憶される。このようにOCRサーバを独立させることによって、文書管理サーバ110の負荷を軽減し処理速度を一層向上させることができる。
【0121】
また、本実施の形態では、書誌登録の処理の際に表示される作業端末120の画面例(図5)において、画像表示部1201、イメージ表示部1202、各種ボタン1203〜1208及び各種書誌情報の入力欄1209〜1215が1つのアプリケーションに含まれているが、図17に示すように、画像表示部1201、イメージ表示部1202及び各種ボタン1203〜1208が1つのアプリケーションに含まれるようにし、各種書誌情報の入力欄1209〜1215が別のアプリケーションに含まれるようにしてもよい。
【0122】
(第2の実施の形態)
第1の実施の形態では、文書管理サーバ110がOCR処理を実行したが、本実施の形態では複合機240がOCR処理を実行する点で異なる。
【0123】
図11は、本発明の第2の実施の形態に係る文書管理装置を適用可能な文書管理システムの構成を示すブロック図である。本発明の実施形態に係る文書管理装置は文書管理サーバ110に適用される。
【0124】
同図における文書管理サーバ210は、第1の実施の形態に係る文書管理管理サーバ110と異なり、OCR処理部112を備えていない一方で、テキスト登録部212を備えている。
【0125】
複合機240は、第1の実施の形態に係る複合機140の構成の他に、さらにOCR処理部244を備えている。OCR処理部112とOCR処理部244とは、機能は同一である。
【0126】
本実施の形態に係る作業端末120では、ブラウザソフト、Java(登録商標)Script、及びActiveXが組み合わされるか、又はクライアントのアプリケーションがインストールされ起動している。
【0127】
図11の文書管理システムと図2の文書管理システムの構成は、上述した構成の差異を除き、同一である。
【0128】
図12,13は図11における文書管理システムで実行される処理を示すフローチャートである。
【0129】
このフローチャートは、上述した図3,4のフローチャートと概ね同一なので、同一の処理を実行するステップは同一のステップ番号を付し、異なる点のみを説明する。
【0130】
ステップS943〜ステップS945の処理は複合機140の不図示のCPUの制御により実行され、ステップ923〜ステップS925及びステップS935の処理は文書管理サーバ210のCPUの制御により実行され、ステップS907の処理は作業端末120のCPUの制御により実行される。
【0131】
図12において、複合機140は、文書のスキャニングを実行し、画像データ記憶部147に画像データを記憶した後(ステップS642)、OCR処理を実行する(ステップS943)。このOCR処理は、上述した図6,7で説明した処理と同一であるが、実行するのは複合機140の制御部145である。
【0132】
OCR処理の終了後、複合機140は、スキャンされた画像データとOCR処理の認識結果であるテキストデータを文書管理サーバ210に送信し(ステップS944)、制御部145はOCR処理部244によりOCR処理が施されていないページが存在するか否かを判別する(ステップS945)。この判別の結果、OCR処理が施されていないページが存在する場合には、ステップS943に戻り、引き続きOCR処理を実行し、OCR処理が施されていないページが存在しない場合には、ステップS641の処理に進む。
【0133】
文書管理サーバ210では、CPU21は複合機からのスキャン画像の他、OCR処理の認識結果であるテキストデータの待ち状態になっている(ステップS923)、一定時間間隔で受信すべきスキャン画像及びテキストデータがあるか否かを判別し(ステップS924)、受信すべきスキャン画像及びテキストデータがない場合(ステップS924でNoの場合)には、ステップS923に戻って待機する。ステップ924の判別の結果、受信すべきスキャン画像及びテキストデータがある場合(ステップS924でYesの場合)、スキャン画像及びテキストデータを受信した後、画像管理部114により受信した画像データが画像DB117に登録され、テキスト登録部212により受信したテキストデータがテキストDB118に登録される(ステップS625)。
【0134】
ステップS634の判別の結果、登録ボタン1206が押下されていない場合には、イメージ表示部1202に表示されるテキストデータの情報が修正されたか、又は書誌情報の入力欄1209〜1215のいずれかの情報が修正された場合であるので、これらの修正を反映してRAM22のワークエリア内のテキストデータ及び書誌情報を更新し、この更新されたテキストデータ及び書誌情報を作業端末120に送信する(ステップS935)。
【0135】
作業端末120はステップS935の処理で文書管理サーバ110から受信したテキストデータ及び書誌情報を受信し(ステップS907)、ステップS604の処理を実行する。
【0136】
ステップS935において、更新されたテキストデータ及び書誌情報を作業端末120に送信するのは、作業端末120はブラウザソフト等を備えており、更新されたテキストデータ及び書誌情報のみで画面表示を更新できるからである。
【0137】
本実施の形態においても、図10に示す文書管理システムで実行される処理の一部の変形例を適用できる。この場合、ステップS630、ステップS1123〜ステップS1130及びステップS634の処理を作業端末120で実行し、作業端末120は文書管理サーバ210に最終的な編集後の登録情報を送信するように構成してもよい。
【0138】
上述したように、本実施の形態によれば、複合機240は読み取った画像データのOCR処理を実行し、文書管理サーバ210は複合機240から画像データ及びOCR処理により得られたテキストデータを受信し、このテキストデータから一定のルールに基づいて書誌情報を抽出し、画像データ、テキストデータ及び抽出された書誌情報を作業端末120に送信し、これらの書誌情報抽出処理やデータ等の送信処理のバックグラウンドで並行して複合機240がOCR処理を続行する一方、作業端末120は画面に画像データ、テキストデータ及び抽出された書誌情報を表示するので、文書管理サーバ210において、文字認識処理以外の他の処理の待機時間を最小限に低減し、かつ書誌情報の入力の工数を低減することができ、作業効率の向上を図ることができる。
【0139】
また、複合機240がOCR処理を実行して、文書管理サーバ210の負荷が軽減されるので、文書管理サーバ210の処理速度を一層向上させることができる。
【0140】
(第3の実施の形態)
第1の実施の形態では、文書管理サーバ110がOCR処理及び書誌抽出処理を実行したが、本実施の形態では作業端末320がOCR処理及び書誌抽出処理を実行する点で異なる。
【0141】
図14は、本発明の第3の実施の形態に係る文書管理装置を適用可能な文書管理システムの構成を示すブロック図である。本発明の実施形態に係る文書管理装置は文書管理サーバ110に適用される。
【0142】
同図における文書管理サーバ310の構成は、第1の実施の形態に係る文書管理管理サーバ110の構成と異なり、OCR処理部112、書誌抽出部113、抽出ルール記憶部115を備えていない一方で、テキスト登録部212を備えている。複合機140の構成は、第1の実施の形態と異なり、画像データ記憶部147を備えていない。作業端末320の構成は、第1の実施の形態に係る作業端末120の構成と異なり、OCR処理部324、書誌抽出部323、抽出ルール記憶部325及びテキストデータ記憶部328を備えている。
【0143】
本実施の形態に係る作業端末320では、ブラウザソフト、Java(登録商標)Script、及びActiveXが組み合わされるか、又はクライアントのアプリケーションがインストールされ起動している。
【0144】
図14の文書管理システムと図2の文書管理システムの構成は、上述した構成の差異を除き、同一である。
【0145】
図15,16は、図14における文書管理システムで実行される処理を示すフローチャートである。
【0146】
このフローチャートは、上述した図3,4のフローチャートと概ね同一なので、同一の処理を実行するステップは同一のステップ番号を付し、異なる点のみを説明する。
【0147】
ステップS1025〜ステップS1030の処理は文書管理サーバ310のCPUの制御により実行され、ステップS1003〜ステップS1013及びステップS1031〜ステップS1033の処理は作業端末320のCPUの制御により実行される。
【0148】
図15において、ステップS624で、文書管理サーバ310は、受信すべきスキャン画像があるか否かを判別し、受信すべきスキャン画像がある場合には、受信したスキャン画像に所定の管理番号を1つ採番する(ステップS1025)。この管理番号は、書誌DB116、画像DB117及びテキストDB118の検索キー又は検索キーの一部として使用され、これら3つのDBのデータの関連付けに使用される。
【0149】
その後、文書管理サーバ310は、画像データを作業端末320に転送する(ステップS1026)と共に当該画像データを画像DB117に登録し(ステップS1027)、ステップS623の処理に戻る。
【0150】
作業端末320は、ステップS1026で文書管理サーバ310から転送された画像データを受信し(ステップS1003)、OCR処理(ステップS1004)及び書誌候補抽出処理(ステップS1005)を実行する。これらのOCR処理(ステップS1004)及び書誌候補抽出処理(ステップS1005)は、第1の実施の形態において文書管理サーバ110が実行するOCR処理及び書誌候補抽出処理と同一である。
【0151】
次いで、作業端末320では図5に示すような画面が表示され、同図の画像表示部1201には画像データが表示され、イメージ表示部1202にはOCR処理によって認識されたテキストデータが表示され、さらに各種書誌情報の入力欄1209〜1215には書誌情報の候補が表示され、画面表示が更新される(ステップ1006)。
【0152】
次に、作業端末120は、キーボードの入力情報やマウスの操作情報を識別し(ステップ1007)、ステップS1008〜ステップS1011の処理を実行する。このステップS1008〜ステップS1011の処理は、図4のステップS630〜ステップ634の処理と同一であるので、その説明は省略する。
【0153】
ステップS1011において、登録ボタンが押下されていない場合には、図5におけるイメージ表示部1202に表示されるテキストデータの情報が修正されたか、又は書誌情報の入力欄1209〜1215のいずれかの情報が修正された場合であるので、これらの修正を反映してテキストデータを更新し(ステップS1012)、ステップS1006の処理に戻る。
【0154】
一方、ステップS1009の判別の結果、次文書ボタン1207が押下された場合には、作業端末320のCPUが現在処理している文書の次文書のOCR処理が終了しているか否かを判別し(ステップS1031)、この処理が終了している場合には、次文書の先頭ページの画像データと、これに対応するテキストデータと、書誌情報の候補とをRAM等から読み出し(ステップS1032)、ステップS1006の処理に進む。一方次文書のOCR処理が終了していない場合には、ステップS1004の処理に戻る。
【0155】
ステップS1010の判別の結果、図5に示す前ページボタン1204又は次ページボタン1205が押下された場合には、作業端末320のCPUは、押下されたボタンに応じて前ページ又は次ページの画像データと、これに対応するテキストデータと、書誌情報の候補とをRAM等から読み出し(ステップS1032)、ステップS1006の処理に進む。
【0156】
ステップS1011において、登録ボタンが押下された場合には、作業端末320のCPUは、テキストデータ及び書誌情報を文書管理サーバ310に送信し(ステップS1013)、ステップS1006の処理に戻る。
【0157】
文書管理サーバ310のCPUは、作業端末320から送信されたテキストデータ及び書誌情報を受信し(ステップS1028)、書誌情報は書誌DB116に登録し、テキストデータはテキストDB118に登録し(ステップS1029)、さらに、作業端末320からテキストデータ及び書誌情報を受信するまで待機する(ステップS1030)。
【0158】
上述したように、本実施の形態によれば、作業端末320が複合機140で読み取られた画像データのOCR処理を実行し、このOCR処理により得られたテキストデータから、一定のルールに基づいて書誌情報を抽出し、これらの書誌情報抽出処理のバックグラウンドで並行してOCR処理を続行する一方、画面に画像データ、テキストデータ及び抽出された書誌情報を表示するので、作業端末320において、文字認識処理以外の他の処理の待機時間を最小限に低減し、かつ書誌情報の入力の工数を低減することができ、作業効率の向上を図ることができる。文書管理サーバ310の負荷が軽減されるので、処理速度を一層向上させることができる。
【0159】
(第4の実施の形態)
本実施の形態は、図3における文書管理システムで実行される処理の一部が第1の実施の形態と異なり、その他は第1の実施の形態と同様であるので、異なる点のみ説明する。
【0160】
本実施形態では、前提として図3のステップS627の書誌候補抽出処理は実行されず、ステップS628で図20に示す画像及びテキスト情報が作業端末120に送信されているものとする。
【0161】
まず、図20を用いて作業端末120における画面の変化を説明する。
【0162】
図20の表示部1901には図3のステップS626で認識されたOCRテキストが表示され、イメージ表示部1902には、受信したスキャン画像に重ねてOCRテキストがHTML化されて透明レイヤーとして該スキャン画像の上側に表示されている。このHTMLは通常は透明な状態(不可視)であり、テキストの左右位置については元画像と一致しているが、テキストの上下位置は略1行分上(又は略1行分下)の位置に元画像とずれて配置されているが通常は透明で見えない状態になっており、下側のスキャン画像が表示されている。
【0163】
符号1903は現在表示されている文書の先頭ページを表示するためのボタンであり、符号1904は前ページを表示するためのボタンである。又符号1905には、現在表示されている文書の全体ページ数と表示ページが表示される。例えば「1/3」は、現在全体で3ページの文書の1ページ目のスキャン画像と対応するOCRテキストが表示されていることを意味する。符号1906は次文書を表示するためのボタンであり、ここには次文書のOCR作業の進捗が表示される。つまり、図3のステップS626乃至ステップS629におけるOCRの完了ページを表示する。例えば「4/4」は次文書が4ページであり、4ページ目までOCR作業が完了していることを意味する。この場合、画面の符号1906の表示は当初の「1/4」→「2/4」→「3/4」と変化し、最終的に「4/4」に至る。符号1907は次文書の次ページを表示するためのボタンであり、符号1908は次文書の最終ページを表示するためのボタンである。次文書が表示された状態でボタン1905を押下すれば直前に表示されていた現在の文書のスキャン画像とOCRテキストが再度表示される。登録ボタン1911が押下されると書誌登録処理が行われ、画面ではボタン1906の表示が表示1905に繰り上がる。つまり、「1/3」が「1/4」に変化する。ボタン1906には更に次の文書のページ数とOCR進捗が表示される。つまり新次文書(旧次々文書)が全部で5ページであり、3ページ目までOCRが完了していれば「次文書
3/5」と表示される。
【0164】
また、OCRテキストを表示する表示部1901の特定の文字部分、例えば「○△改正について(通達)」にカーソルを位置付けてマウスのボタンを押下すると、イメージ表示部1902の透明HTMLの対応する部分が反転表示される(反転部1919)。反転するのは1センテンス分で、1センテンスは前後の空白又は改行で判定される。
【0165】
このように次文書のOCR進捗を容易に確認できるので、現在作業中の文書での書誌登録作業から次文書の書誌登録作業にスムーズに移行することができる。反転部1919を件名の入力フィールド1912の位置までドラッグ&ドロップすると「○△改正について(通達)」が入力される。
【0166】
次に、図20で説明した画面の動きに対応する処理の詳細を図18,19のフローチャートで説明する。
【0167】
図18,19は、図3における文書管理システムで実行される処理の一部の変形例を示すフローチャートであるので、図3と異なる処理を示す。図3と同様の処理ステップは「ステップS066」で始まるステップで記述している。
【0168】
図18のステップS630及びステップS1821〜ステップS1835及びステップS635の処理は、文書管理サーバ110のCPU21の制御により実行され、ステップS604〜S607の処理は作業端末120のCPUの制御により実行される。
【0169】
作業端末120では、ブラウザソフト、Java(登録商標)Script、及びActiveXが組み合わされるか、又はクライアントのアプリケーションがインストールされ起動している。
【0170】
作業端末120は、図3のステップS605でキーボード26の入力情報やマウス27の操作情報を識別し、これらの操作情報を文書管理サーバ110に送信する(ステップ606)。これらの操作情報は、例えば「画面の特定位置でのマウスボタンの押下」「ドラッグ&ドロップ操作」、「反転表示部分への文字入力や削除」、及び各種ボタンの押下である。操作情報がドラッグ&ドロップである場合は、ドラッグされた文字列、ドラッグ開始の座標及びドロップ先の座標が操作情報に含まれている。また、反転表示部分への文字入力や削除の場合は、反転表示部分の位置座標と入力又は削除されたテキスト情報も操作情報に含まれる。
【0171】
文書管理サーバ110のCPU21は、ステップS606で作業端末120から送信されるキーボード26の入力情報やマウス27の操作情報に基づいて、作業端末120の画面において終了ボタン1920が押下されたか否かを判別する(ステップS630)。
【0172】
ステップS630の判別の結果、終了ボタン1920が押下された場合には、本処理を終了する。終了ボタンが押下されていない場合、処理はステップS1821に進む。
【0173】
ステップS1821では、ステップS606で作業端末120から送信される操作情報がマウスのボタンの押下であるか否かが判別され、押下されていない場合はステップS1830に進む。押下された場合はステップS1822に進み、ページボタンが押下されたか否かを検出する。ページボタンとは図20の符号1903乃至1908の各ボタンであり、ボタン1903,1904の直ぐ下の2つのボタンとボタン1907,1908の直ぐ上の2つのボタンも含む。
【0174】
ステップS1822でページボタンが押下された場合は、処理はステップS1823に進み、文書管理サーバ110の画像DB117とテキストDB118から、指定されたページの画像とOCR済みテキストデータが読み込まれ、ステップS635で画面情報が送信され、ステップS607で作業端末120が画面情報を受信し、ステップS604に図20に示すような画面が表示される。
【0175】
ステップS1822でページボタンが押下されない場合は、処理はステップS1824に進み、テキスト上にカーソルがある状態でマウスボタンが押下されたか否かを検出する。テキスト上とは、テキストが表示されている画面領域にカーソルがあることを言う。テキスト上での押下であることが検出された場合は、処理はステップS1825に進み、マウス位置にあるテキストのワンフレーズ分がRAM中に確保されたバッファにコピーされる。後述するドラッグ&ドロップのマウスボタンの押下の場合も同様に処理される。ここでのワンフレーズとは、空白又はタブで前後を挟まれた文字列を言う。次いで、処理はステップS1825に進み、該当テキストに対応する部分のHTMLの属性が透明から反転表示に変更されて、画面に表示される。一度反転した部分を再度押下しても反転表示は変わらない。ステップS635以下は図4と同様なので説明を省略する。
【0176】
ステップS1824でテキスト上の押下でなかった場合は、処理はステップS634に進み、登録ボタンが押下されたか否かが判定される。ここは図3と同様なので説明を省略する。登録ボタンが押下されなかった場合は、処理はステップS1829に進み、「テキスト更新」等の押下されたボタンに対応する処理が実行される。以上でマウスボタンが押下された場合の処理の説明を終わる。
【0177】
次に、ステップS1821でマウスボタンが押下されていない場合は、処理はステップS1830に進み、文字入力又は削除があったか否かが検出され、文字入力又は削除があった場合は、処理はステップS1831に進み、該当位置バッファ中のテキストが更新される。
【0178】
ステップS1830で文字入力又は削除がなかった場合は、処理はステップS1832に進み、ドラッグ&ドロップがあったか否かが検出される。すなわちマウスボタンが押下されたままマウスのポインタが移動した後マウスボタンが離されたか否かが検出される。ドラッグ&ドロップがあった場合は、処理はステップS1833に進み、マウスイベントの情報からドラッグ&ドロップの始点と終点が検出される。処理はステップS1834に進み、テキストの反転表示位置がドラック&ドロップされたかが検出され、テキストの反転表示位置がドラック&ドロップされた場合は、処理はステップS1835に進み、バッファ中のテキストがドロップ位置の入力フィールドに入力され、処理はステップ635に進み画面情報が送信される。
【0179】
ステップS1834で反転位置がドラッグされた場合は直ちにステップ635に進む。
【0180】
以上説明したように、本実施の形態によれば、簡単な操作で画面上のテキストを所望の入力フィールドへ入力できるため、書誌情報登録作業の効率を大幅に向上させることができる。すなわち、通常であれば、特定の文字の始点と終点をクリックとドラッグで反転表示させ、Ctrl+Cボタンを押し、入力フィールド位置にカーソルを移動してCtrl+Vを押すといった4動作を2動作で行うことができる。
【0181】
本発明は、上述した実施の形態の機能を実現するソフトウェアのプログラムをコンピュータ又は制御部(具体的にはCPU)に供給し、そのコンピュータ又はCPUが該供給されたプログラムを読出して実行することによっても本発明の目的が達成されることは云うまでもない。
【0182】
この場合、上記プログラムは、不図示の該プログラムを記録した記録媒体から直接、又はインターネット、商用ネットワーク、若しくはローカルエリアネットワーク等に接続される不図示の他のコンピュータやデータベース等からダウンロードすることにより供給される。
【0183】
また、上記プログラムは、上述した実施の形態の機能をコンピュータで実現することができればよく、その形態は、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給されるスクリプトデータ等の形態を有するものでもよい。
【0184】
更にまた、上述した実施の形態の機能を実現するソフトウェアのプログラムを記録した記録媒体をコンピュータに供給し、そのコンピュータが記録媒体に格納されたプログラムを読出し実行することによっても、本発明の目的が達成されることは云うまでもない。
【0185】
プログラムを供給する記録媒体としては、例えば、RAM、NV−RAM、フロッピー(登録商標)ディスク、光ディスク、光磁気ディスク、CD−ROM、MO、CD−R、CD−RW、DVD(DVD−ROM、DVD−RAM、DVD−RW、DVD+RW、DVD−R、DVD+R、ブルーレイディスク等)、磁気テープ、不揮発性のメモリカード、他のROM等の上記プログラムを記憶できるものであればよい。
【0186】
【発明の効果】
以上説明したように、請求項1記載の文書管理装置及び請求項9記載の文書管理用プログラムによれば、画像読取装置から受信した画像データに文字認識処理を施してテキストデータが生成され、該生成されたテキストデータと抽出ルールに基づいて書誌情報が抽出され、クライアント装置に送信されるので、クライアント装置の画面に画像データとテキストデータと抽出した書誌情報を表示でき、さらにバックグラウンドで別の画像データの文字認識処理が続行することができる。従って、文字認識処理以外の他の処理の待機時間を最小限に低減し、かつ書誌情報の入力の工数を低減することができ、作業効率の向上を図ることができる。
【0187】
請求項2記載の文書管理装置によれば、画像データ、テキストデータ及び書誌情報が関連付けられて記憶されるので、画像データとテキストデータと抽出した書誌情報をデータベースに登録することができ、これらのデータや情報を一括で呼び出すことができ、書誌情報の訂正作業にかかる時間を最小限に抑制することができる。
【0188】
請求項3記載の文書管理装置によれば、クライアント装置から受信した編集情報に基づいて書誌情報が更新されるので、簡単に書誌情報等の入力フィールドの文字列を更新することが可能となり、書誌情報等の入力工数を削減し、操作者の負担を軽減することが可能になる。
【0189】
請求項6記載の文書管理装置によれば、書誌情報の訂正作業が容易になるという効果を奏する。
【0190】
請求項7記載の文書管理システムによれば、文書管理装置における文字認識処理以外の他の処理の待機時間を最小限に低減し、かつ書誌情報の入力の工数を低減することができ、作業効率の向上を図ることができる。画像読取装置が文字認識処理を実行するので、文書管理装置の負荷が軽減され、文書管理装置の処理速度を一層向上させることができる。
【0191】
請求項8記載の文書管理システムによれば、クライアント装置において、文字認識処理以外の他の処理の待機時間を最小限に低減し、かつ書誌情報の入力の工数を低減することができ、作業効率の向上を図ることができる。文書管理装置の負荷が軽減されるので、文書管理装置の処理速度を一層向上させることができる。
【0192】
請求項9記載の文書管理システムによれば、簡単な操作で画面上のテキストを所望の入力フィールドへ入力できるため、書誌情報登録作業の効率を大幅に向上させることができる。すなわち、通常であれば、特定の文字の始点と終点をクリックとドラッグで反転表示させ、Ctrl+Cボタンを押し、入力フィールド位置にカーソルを移動してCtrl+Vを押すといった4動作を2動作で行うことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係る文書管理装置のハードウェア構成を示すブロック図である。
【図2】本発明の実施形態に係る文書管理装置を適用可能な文書管理システムの構成を示すブロック図である。
【図3】図2における文書管理システムで実行される処理を示すフローチャートである。
【図4】図2における文書管理システムで実行される処理を示すフローチャートである。
【図5】作業端末120の画面に、書誌登録の処理の際に表示されるアプリケーションの一例を示す図である。
【図6】OCR処理(図3のステップS626)を示すフローチャートである。
【図7】OCR処理(図3のステップS626)を示すフローチャートである。
【図8】書誌候補抽出処理(図3のステップS627)を示すフローチャートである。
【図9】書誌候補抽出処理(図3のステップS627)を示すフローチャートである。
【図10】図3における文書管理システムで実行される処理の一部の変形例を示すフローチャートである。
【図11】本発明の第2の実施の形態に係る文書管理装置を適用可能な文書管理システムの構成を示すブロック図である。
【図12】図11における文書管理システムで実行される処理を示すフローチャートである。
【図13】図11における文書管理システムで実行される処理を示すフローチャートである。
【図14】本発明の第3の実施の形態に係る文書管理装置を適用可能な文書管理システムの構成を示すブロック図である。
【図15】図14における文書管理システムで実行される処理を示すフローチャートである。
【図16】図14における文書管理システムで実行される処理を示すフローチャートである。
【図17】作業端末120の画面に、書誌登録の処理の際に表示されるアプリケーションの一例を示す図である。
【図18】図3における文書管理システムで実行される処理の一部の変形例を示すフローチャートである。
【図19】図3における文書管理システムで実行される処理の一部の変形例を示すフローチャートである。
【図20】作業端末120の画面に、書誌登録の処理の際に表示されるアプリケーションの一例を示す図である。
【符号の説明】
21 CPU
22 RAM
23 ROM
28 ハードディスク
110 文書管理サーバ
111 書誌登録部
112 OCR処理部
113 書誌抽出部
114 画像管理部
115 抽出ルール記憶部
116 書誌データベース(DB)
117 画像データベース(DB)
118 テキストデータベース(DB)[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a document management apparatus, a document management system, and a document management program capable of executing processing for extracting bibliographic items from text data based on certain rules.
[0002]
[Prior art]
2. Description of the Related Art Conventionally, in the business of registering electronically a document described on paper, a scanner that reads an image of the document described on paper, and OCR (optical character recognition) processing on the image data read by the scanner There is known a document management system including a computer that generates text data by executing and registers a bibliographic item input by a user in association with image data and text data.
[0003]
In
[0004]
Further, in
[0005]
[Patent Document 1]
Japanese Patent Laid-Open No. 11-238072
[Patent Document 2]
JP 2002-290661 A
[0006]
[Problems to be solved by the invention]
However, in the conventional document management system described above, it is troublesome to manually input bibliographic information from a screen of a personal computer or the like while referring to image data and text data, and there is a problem that usability is lacking.
[0007]
In the technique of
[0008]
Furthermore, since the OCR process for a specific document as a whole takes a considerable amount of time, the person in charge of the document registration work needs to wait until the OCR process is completed after reading the document, resulting in a low actual operation rate. There is.
[0009]
According to the system of
[0010]
The present invention has been made to solve the above problems, and can reduce the waiting time for processes other than the character recognition process to a minimum, and can reduce the man-hours for inputting bibliographic information. An object is to provide a document management apparatus, a document management system, and a document management program capable of improving efficiency.
[0011]
[Means for Solving the Problems]
In order to achieve the above object, a document management apparatus according to
[0012]
A document management apparatus according to a second aspect is the document management apparatus according to the first aspect, further comprising a document information storage unit that stores the image data, the text data, and the bibliographic information in association with each other.
[0013]
The document management device according to claim 3 is the document management device according to
[0014]
According to a fourth aspect of the present invention, there is provided the document management apparatus according to the third aspect, further comprising a text data updating unit that updates the text data based on the received editing information.
[0015]
The document management apparatus according to claim 5 is the document management apparatus according to claim 4, wherein the image data, the bibliographic information updated by the bibliographic information update unit, and the text data updated by the text data update unit are used. Display information generating means for generating display information to be displayed on the screen of the client device based on the information is provided.
[0016]
The document management device according to claim 6 is the document management device according to any one of claims 3 to 5, wherein the received editing information is displayed by highlighting text data selected by the client device. Information indicating whether or not a rectangular area including text data selected by the client device is specified, and text data that is displayed in reverse video or text data included in the specified rectangular area is predetermined. It is information indicating whether or not it has been dragged and dropped into the input field.
[0017]
The document management system according to claim 7, wherein an image reading device that reads an image of a document, a client device that displays image data of the read image, and the image reading device and the client device are connected via a communication line. In the document management system, the image reading device performs character recognition processing on the image data of the read image to generate text data, the image data, and the text Transmitting means for transmitting data to the document management apparatus, wherein the document management apparatus stores storage means for storing image data and text data received from the image reading apparatus, and extracts bibliographic information from the text data. The extraction rule storage means for storing the extraction rule, and the text data and the extraction rule Extracting means for extracting the bibliographic information Zui, the image data, and a sending means for sending the text data and the bibliography information to the client device.
[0018]
9. The document management system according to claim 8, wherein an image reading device that reads an image of a document, a client device that displays image data of the read image, and the image reading device and the client device are connected via a communication line. In the document management system including the document management device, the client device stores image data received from the image reading device, and performs character recognition processing on the image data stored in the image storage device. And character recognition processing means for generating text data, extraction rule storage means for storing extraction rules for extracting bibliographic information from the text data, and extracting bibliographic information based on the text data and the extraction rules Extraction means, and the client device with the image data, the text data and the document Characterized in that it comprises a display information generation means for displaying the information.
[0019]
9. The document management system according to claim 9, wherein the document management apparatus includes receiving means for receiving editing information for the bibliographic information received from the client apparatus, and the received editing is performed. The information includes information on whether or not the text data selected on the client device is highlighted, information on whether or not a rectangular area including the text data selected on the client device is specified, and is highlighted. The text data or the text data included in the designated rectangular area is information indicating whether or not the text data is dragged and dropped into a predetermined input field.
[0020]
11. A document management program according to claim 10, which is executed by a computer connected via a communication line to an image reading device that reads an image of a document and a client device that displays image data of the read image. An image storage module for storing image data received from the image reading device, a character recognition processing module for performing character recognition processing on the image data stored in the image storage means to generate text data, and the text data An extraction rule storage module for storing an extraction rule for extracting bibliographic information from the text, an extraction step for extracting bibliographic information based on the text data and the extraction rule, the image data, the text data, and the bibliographic information. Display information to be displayed on the client device Characterized in that it comprises a display information generating module to be formed.
[0021]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0022]
(First embodiment)
FIG. 1 is a block diagram showing a hardware configuration of a document management apparatus according to the first embodiment of the present invention.
[0023]
In the figure, a CPU 21 (transmission means, reception means, display information generation means),
[0024]
The
[0025]
The
[0026]
A
[0027]
FIG. 2 is a block diagram showing a configuration of a document management system to which the document management apparatus according to the embodiment of the present invention can be applied. The document management apparatus according to the embodiment of the present invention is applied to the
[0028]
In FIG. 1, the document management system includes a
[0029]
The
[0030]
The
[0031]
The
[0032]
The
[0033]
The
[0034]
The
[0035]
The
[0036]
Next, the
[0037]
The
[0038]
3 and 4 are flowcharts showing processing executed by the document management system in FIG.
[0039]
3 and 4, the processes in steps S601 to S607 are executed under the control of a CPU (not shown) of the
[0040]
Before the
[0041]
First, the
[0042]
FIG. 5 is a diagram illustrating an example of an application displayed on the screen of the
[0043]
In the figure,
[0044]
In FIG. 5, when the
[0045]
The
[0046]
The
[0047]
The
[0048]
If the transmission of the image data does not end normally in step S643, a retry is made after a lapse of a fixed time, and if the transmission does not end normally even after a predetermined number of retries, this is stored in the log
[0049]
In the
[0050]
Next, the
[0051]
Next, the
[0052]
Thereafter, the
[0053]
Next, the
[0054]
As a result of the determination in step S629, if there is a page that has not been subjected to the OCR process, the process returns to the process in step S626, and the OCR process for the image data of the next page is executed. On the other hand, if there is no page that has not been subjected to OCR processing, the process returns to step S623, and the
[0055]
Next, the
[0056]
Next, the
[0057]
The
[0058]
If it is determined in step S630 that the
[0059]
If the
[0060]
If the
[0061]
If the
[0062]
If the
[0063]
If the
[0064]
On the other hand, if the result of determination in step S634 is that the
[0065]
The
[0066]
When the
[0067]
According to this processing, bibliographic information is extracted by performing OCR processing on the original image data in units of one page, the original image data, text data, and the extracted bibliographic information are displayed on the screen of the
[0068]
The information requesting scanning in step S602 may be directly transmitted to a scanner or a multifunction peripheral having a scanner function. In this case, in step S643, information (user ID or the like) specifying the scanning request source is transmitted together with the scanned image.
[0069]
6 and 7 are flowcharts showing the OCR process (step S626 in FIG. 3).
[0070]
6 and 7, the processes in steps S701 to S724 are executed under the control of the
[0071]
First, based on the OCR target image data stored in the work area of the
[0072]
Next, the entire image data is scanned in the horizontal direction, ruled line recognition is performed, and it is analyzed whether or not the image data matches a specific format (for example, the format of a document partition sheet) (step S702).
[0073]
As a result of the analysis in step S702, if the image data does not match the specific format, this process is terminated. If the image data matches the specific format, the character at the specific position corresponding to the format Are subject to character recognition processing. The ruled line information of a specific format is stored in a format table (not shown) (physically, the hard disk 28).
[0074]
Next, it is determined whether or not the last character flag in the work area of the
[0075]
If the final character flag is ON as a result of the determination in step S703, it is determined whether or not the image data being processed at this time is a partition paper (step S705), and partitioning is performed according to the determination result. The identification data indicating whether or not there is is added to the text data of the OCR process (step S706), and this process ends.
[0076]
On the other hand, if the result of determination in step S703 is that the final character flag is not on, character range analysis is executed based on the result of line spacing analysis in step S701 (step S704). Since the character spacing in the vertical direction of the image data is found in the line spacing analysis in step S701, the character range is determined in step S704 using the character spacing in the vertical direction or a half value as an initial value for character range analysis. The character range is determined by identifying a blank portion between characters and determining the range of each character.
[0077]
Next, the ratios of blacks in the determined range for one character are tabulated (step S707), and it is determined whether or not the ratio values of the tabulated blacks exceed a predetermined value (for example, 0.005). (Step S708). If the black ratio is equal to or less than the predetermined value, the black ratio for the predetermined number of characters before and after is determined, and together with the determination of the character block range in step S701, whether or not the character determined this time is at the beginning or end of the line. Determination is made (step S709).
[0078]
Next, it is determined whether or not the current character is a space (step S710). If the current character is a space, one space is added to the output text data (step S711), which will be described later. The process proceeds to step S723. On the other hand, if the current character is not a space, it is determined whether or not the current character is any symbol such as “.”, “,”, “•” (step S712). Is a symbol, one symbol is added to the text data to be output (step S713), and the process proceeds to step S723 described later. On the other hand, if the current character is not a symbol, the process proceeds to step S723 described later. Proceed to processing.
[0079]
As a result of the determination in step S708, if the ratio of black is greater than a predetermined value, the image data for one character and the character data in the dictionary are matched or not matched (step S714). .
[0080]
Next, it is determined whether or not the dictionary collation in step S714 is completed (step S715). If the dictionary collation is not completed, the image data for one character and the characters in the dictionary are based on the collation result in step S714. The coincidence rate of each pixel of data is determined (step S716). The dictionary character data is stored in the
[0081]
Next, it is determined whether or not the coincidence rate determined in step S716 exceeds a predetermined value A (for example, 0.8) (step S717). Is selected from the dictionary, paired with the matching rate of the character, and added to the candidate array in the work area of the RAM 22 (step S718), and the process returns to step S714 to check with the next character in the dictionary. Do.
[0082]
On the other hand, as a result of the determination in step S717, if the coincidence rate is equal to or less than the predetermined value A, the process of step S718 is skipped and the process returns to step S714.
[0083]
When the dictionary collation in step S715 is completed, the image data for one character is compared with the matching rate of each character in the candidate sequence (step S719), and the text data of the character with the maximum matching rate is output text. It is added to the data (step S720).
[0084]
Next, it is determined whether or not the maximum value of the matching rate exceeds a predetermined value (for example, 0.9) (step S721). If the maximum value of the matching rate is equal to or less than the predetermined value, the warning flag is turned on and output. A predetermined special character is output to the text data (step S722). With the special character, when the screen is displayed (step S604 in FIG. 4), the text immediately before the special character is displayed in another color (for example, blue) other than the normal color (for example, black).
[0085]
By processing in this way, it becomes possible to change and display the color of a suspicious part whether or not the character is accurately identified, so that it is possible to efficiently perform manual confirmation and correction work of OCR processing.
[0086]
Next, it is determined whether or not the character identified this time is the last character in the image data for one page (step S723). If the character identified this time is the last character in the image data for one page, the
[0087]
As described above, since the OCR processing of FIGS. 6 and 7 also determines symbols such as spaces and punctuation marks in image data and outputs text data corresponding to the image data, character recognition whose layout matches that of the original image data is performed. Processing becomes possible.
[0088]
8 and 9 are flowcharts showing the bibliographic candidate extraction process (step S627 in FIG. 3).
[0089]
8 and 9 are executed under the control of the
[0090]
In this processing, it is assumed that bibliographic information is on the first page of the document.
[0091]
First, it is determined whether or not the page from which bibliographic information is to be extracted is the first page of the document (step S821). If the page from which the bibliographic information is to be extracted is not the first page of the document, the process ends. On the other hand, if the page from which the bibliographic information is to be extracted is the first page of the document, the process is extracted by the OCR process. One character block of the text data is read (step S822). Here, the “character block” refers to a series of character data having a predetermined number or more (for example, two or more) spaces or the first character at the beginning or end of a line.
[0092]
Next, the read character block is collated with the candidate dictionary stored in the extraction rule storage unit 115 (step S823), the head of the character block is an era such as “Heisei”, and the end is “day”. Further, it is determined whether or not the position of the character block is on the right side of the center of the page (step S824). If all these conditions are satisfied (YES in step S824), the text data of the character block is overwritten in the “issue date” entry field of the bibliographic information (step S825), and the process proceeds to step S836.
[0093]
In step S836, it is determined whether or not the character block currently being read is the last block of the first page (whether or not another character block exists on the right side or the lower side of the character block). If the character block is the last block, this process is terminated. On the other hand, if the character block currently being read is not the final block, the process returns to step S822 to read the next character block.
[0094]
On the other hand, as a result of the determination in step S824, if any one of the conditions is not satisfied (NO in step S824), whether the head of the character block is the organization name and whether the end is “dono” or not. Is determined (step S826).
[0095]
As a result of the determination in step S826, if all the conditions are satisfied (YES in step S826), the text data of the character block is overwritten in the input field of “destination department” of the bibliographic information (step S827), The process proceeds to step S836.
[0096]
As a result of the determination in step S826, if any one of the conditions is not satisfied (NO in step S826), the beginning of the character block is the organization name or the end of the character block is a government office, and the character It is determined whether or not the block position is on the right side of the center of the page (step S828).
[0097]
If all the conditions are satisfied as a result of the determination in step S828 (YES in step S828), the text data of the character block is overwritten in the “document creator” input field of the bibliographic information (step S829), The process proceeds to step S836.
[0098]
As a result of the determination in step S828, if any one of the conditions is not satisfied (NO in step S828), the beginning of the character block is a document name or an era name, and the end of the character block is It is determined whether it is “No.” and the position of the character block is on the right side of the center of the page (step S830).
[0099]
If all the conditions are satisfied as a result of the determination in step S830 (YES in step S830), the text data of the character block is overwritten in the “document number” input field of the bibliographic information (step S831). The process proceeds to S836.
[0100]
As a result of the determination in step S830, if any one of the conditions is not satisfied (NO in step S830), whether the character at the end of the character block is “case”, “notice”, “ It is determined whether it is “notification” or “about” (step S832).
[0101]
If all the conditions are satisfied as a result of the determination in step S832 (YES in step S832), the text data of the character block is overwritten in the “acquired document name” input field of the bibliographic information (step S833). Then, the attribute of the input field is changed to “overwrite prohibited”, and the process proceeds to step S834.
[0102]
As a result of the determination in step S832, if any one of the conditions is not satisfied (NO in step S832), the process proceeds to step S836.
[0103]
Next, using the receipt document name overwritten in step S833 as a key, data on the managing section, the person in charge, the document classification, and the storage deadline are extracted from the management table stored in the extraction rule storage unit 115 (step S834). These data are overwritten in the entry field of bibliographic information, and immediately after this overwriting, the attribute of these data is changed to prohibit overwriting (step S835), and the process proceeds to step S836.
[0104]
In Steps S833 and S834, the attribute is set to “overwrite prohibited” because, when another document name exists in the text of the document, “acquired document name” and data related to the received document name This is to prevent a situation where the data is overwritten.
[0105]
Although it is out of the scope of the processing of this flowchart, after the bibliographic candidate extraction processing is completed, the operator of the
[0106]
According to this processing, bibliographic information candidates are extracted from the text data of the first page of the document and input to the input field based on detailed extraction rules, so that the input manpower of bibliographic information can be minimized.
[0107]
FIG. 10 is a flowchart showing a modification of part of the processing executed in the document management system in FIG. 3, and therefore shows processing different from FIG.
[0108]
10 are performed under the control of the
[0109]
In the
[0110]
The
[0111]
The
[0112]
If it is determined in step S630 that the
[0113]
If it is determined in step S1123 that the input information on the
[0114]
Next, the
[0115]
Next, the
[0116]
Next, the
[0117]
In step S1134, the
[0118]
According to this processing, when the operator of the
[0119]
As described above, according to the present embodiment, the
[0120]
In the present embodiment, the
[0121]
In this embodiment, in the screen example of the
[0122]
(Second Embodiment)
In the first embodiment, the
[0123]
FIG. 11 is a block diagram showing a configuration of a document management system to which the document management apparatus according to the second embodiment of the present invention can be applied. The document management apparatus according to the embodiment of the present invention is applied to the
[0124]
Unlike the document
[0125]
The
[0126]
In the
[0127]
The configuration of the document management system in FIG. 11 and the configuration of the document management system in FIG. 2 are the same except for the difference in configuration described above.
[0128]
12 and 13 are flowcharts showing processing executed by the document management system in FIG.
[0129]
Since this flowchart is substantially the same as the flowcharts of FIGS. 3 and 4 described above, steps for executing the same processing are given the same step numbers, and only different points will be described.
[0130]
The processing of step S943 to step S945 is executed under the control of a CPU (not shown) of the
[0131]
In FIG. 12, the
[0132]
After completion of the OCR processing, the
[0133]
In the
[0134]
If the
[0135]
The
[0136]
In step S935, the updated text data and bibliographic information are transmitted to the
[0137]
Also in the present embodiment, some modifications of the processing executed in the document management system shown in FIG. 10 can be applied. In this case, the processing of step S630, step S1123 to step S1130, and step S634 may be executed by the
[0138]
As described above, according to the present embodiment, the
[0139]
Further, since the
[0140]
(Third embodiment)
In the first embodiment, the
[0141]
FIG. 14 is a block diagram showing a configuration of a document management system to which the document management apparatus according to the third embodiment of the present invention can be applied. The document management apparatus according to the embodiment of the present invention is applied to the
[0142]
Unlike the configuration of the document
[0143]
In the
[0144]
The configuration of the document management system in FIG. 14 and the configuration of the document management system in FIG. 2 are the same except for the difference in configuration described above.
[0145]
15 and 16 are flowcharts showing processing executed by the document management system in FIG.
[0146]
Since this flowchart is substantially the same as the flowcharts of FIGS. 3 and 4 described above, steps for executing the same processing are given the same step numbers, and only different points will be described.
[0147]
Steps S1025 to S1030 are executed under the control of the CPU of the
[0148]
In FIG. 15, in step S624, the
[0149]
Thereafter, the
[0150]
The
[0151]
Next, a screen as shown in FIG. 5 is displayed on the
[0152]
Next, the
[0153]
In step S1011, if the registration button has not been pressed, the text data information displayed on the
[0154]
On the other hand, if the
[0155]
If the
[0156]
If the registration button is pressed in step S1011, the CPU of the
[0157]
The CPU of the
[0158]
As described above, according to the present embodiment, the
[0159]
(Fourth embodiment)
In the present embodiment, part of the processing executed in the document management system in FIG. 3 is different from that of the first embodiment, and the others are the same as those of the first embodiment, so only different points will be described.
[0160]
In the present embodiment, it is assumed that the bibliographic candidate extraction process in step S627 in FIG. 3 is not executed and the image and text information shown in FIG. 20 is transmitted to the
[0161]
First, changes in the screen on the
[0162]
The OCR text recognized in step S626 in FIG. 3 is displayed on the
[0163]
3/5 "is displayed.
[0164]
Further, when the cursor is positioned on a specific character portion of the
[0165]
As described above, since the OCR progress of the next document can be easily confirmed, it is possible to smoothly shift from the bibliographic registration work for the current document to the bibliographic registration work for the next document. When the reversing unit 1919 is dragged and dropped to the position of the
[0166]
Next, details of processing corresponding to the screen movement described with reference to FIG. 20 will be described with reference to flowcharts of FIGS.
[0167]
18 and 19 are flowcharts showing a modification of part of the processing executed in the document management system in FIG. 3, and thus show processing different from FIG. The processing steps similar to those in FIG. 3 are described in steps starting with “step S066”.
[0168]
18 are executed under the control of the
[0169]
In the
[0170]
The
[0171]
The
[0172]
If the result of determination in step S630 is that the
[0173]
In step S1821, it is determined whether or not the operation information transmitted from the
[0174]
If the page button is pressed in step S1822, the process advances to step S1823, and the image of the specified page and the OCR-completed text data are read from the
[0175]
If the page button is not pressed in step S1822, the process advances to step S1824 to detect whether the mouse button is pressed with the cursor on the text. On the text means that the cursor is in the screen area where the text is displayed. If it is detected that the text has been pressed, the process advances to step S1825, and one phrase of the text at the mouse position is copied to a buffer secured in the RAM. The same processing is performed when a mouse button for drag and drop described later is pressed. The one phrase here refers to a character string that is sandwiched between blanks or tabs. Next, the process proceeds to step S1825, where the HTML attribute of the portion corresponding to the text is changed from transparent to reverse display and displayed on the screen. Even if the part once reversed is pressed again, the reverse display does not change. Since step S635 and subsequent steps are the same as those in FIG.
[0176]
If the text is not pressed in step S1824, the process advances to step S634 to determine whether the registration button has been pressed. Since this is the same as FIG. 3, the description thereof is omitted. If the registration button has not been pressed, the process advances to step S1829 to execute a process corresponding to the pressed button, such as “update text”. This is the end of the description of the processing when the mouse button is pressed.
[0177]
Next, when the mouse button is not pressed in step S1821, the process proceeds to step S1830, where it is detected whether or not a character is input or deleted. If there is a character input or deletion, the process proceeds to step S1831. The text in the corresponding position buffer is updated.
[0178]
If there is no character input or deletion in step S1830, the process proceeds to step S1832, and it is detected whether there has been a drag and drop. That is, it is detected whether or not the mouse button has been released after the mouse pointer has been moved with the mouse button pressed. If there is a drag and drop, the process advances to step S1833, and the start and end points of the drag and drop are detected from the mouse event information. The process proceeds to step S1834, where it is detected whether the reversed display position of the text has been dragged and dropped. If the reversed display position of the text has been dragged and dropped, the process proceeds to step S1835, where the text in the buffer is at the drop position. Input is made in the input field, the process proceeds to step 635, and the screen information is transmitted.
[0179]
If the reverse position is dragged in step S1834, the process immediately proceeds to step 635.
[0180]
As described above, according to the present embodiment, text on the screen can be input to a desired input field with a simple operation, so that the efficiency of bibliographic information registration work can be greatly improved. In other words, normally, four operations such as clicking and dragging the start point and end point of a specific character, highlighting the Ctrl + C button, moving the cursor to the input field position, and pressing Ctrl + V can be performed in two operations. it can.
[0181]
The present invention supplies a software program that realizes the functions of the above-described embodiments to a computer or a control unit (specifically, a CPU), and the computer or CPU reads and executes the supplied program. It goes without saying that the object of the present invention is achieved.
[0182]
In this case, the program is supplied by downloading directly from a recording medium recording the program (not shown) or from another computer or database (not shown) connected to the Internet, a commercial network, a local area network, or the like. Is done.
[0183]
The above-described program only needs to be able to realize the functions of the above-described embodiments by a computer, and the form includes forms such as object code, a program executed by an interpreter, and script data supplied to the OS. But you can.
[0184]
Furthermore, the object of the present invention can also be achieved by supplying a computer with a recording medium that records a software program that implements the functions of the above-described embodiments, and reading and executing the program stored in the recording medium. Needless to say, this is achieved.
[0185]
As a recording medium for supplying the program, for example, RAM, NV-RAM, floppy (registered trademark) disk, optical disk, magneto-optical disk, CD-ROM, MO, CD-R, CD-RW, DVD (DVD-ROM, (DVD-RAM, DVD-RW, DVD + RW, DVD-R, DVD + R, Blu-ray Disc, etc.), magnetic tape, nonvolatile memory card, other ROM, etc., as long as they can store the above programs.
[0186]
【The invention's effect】
As described above, according to the document management device according to
[0187]
According to the document management device of
[0188]
According to the document management apparatus of claim 3, since the bibliographic information is updated based on the editing information received from the client apparatus, it is possible to easily update the character string of the input field such as the bibliographic information. It is possible to reduce the man-hours for inputting information and the like and reduce the burden on the operator.
[0189]
According to the document management apparatus of the sixth aspect, the bibliographic information can be easily corrected.
[0190]
According to the document management system of claim 7, the waiting time of processing other than the character recognition processing in the document management apparatus can be reduced to the minimum, and the man-hours for inputting bibliographic information can be reduced. Can be improved. Since the image reading apparatus executes the character recognition process, the load on the document management apparatus is reduced, and the processing speed of the document management apparatus can be further improved.
[0191]
According to the document management system according to claim 8, in the client device, it is possible to reduce the waiting time for processing other than the character recognition processing to a minimum, and to reduce the man-hours for inputting bibliographic information, thereby improving work efficiency. Can be improved. Since the load on the document management apparatus is reduced, the processing speed of the document management apparatus can be further improved.
[0192]
According to the document management system of the ninth aspect, since the text on the screen can be input to a desired input field with a simple operation, the efficiency of the bibliographic information registration work can be greatly improved. In other words, normally, four operations such as clicking and dragging the start point and end point of a specific character, highlighting the Ctrl + C button, moving the cursor to the input field position, and pressing Ctrl + V can be performed in two operations. it can.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a hardware configuration of a document management apparatus according to a first embodiment of the present invention.
FIG. 2 is a block diagram showing a configuration of a document management system to which a document management apparatus according to an embodiment of the present invention can be applied.
FIG. 3 is a flowchart showing processing executed by the document management system in FIG. 2;
4 is a flowchart showing processing executed by the document management system in FIG. 2. FIG.
FIG. 5 is a diagram showing an example of an application displayed on the screen of the
FIG. 6 is a flowchart showing an OCR process (step S626 in FIG. 3).
FIG. 7 is a flowchart showing an OCR process (step S626 in FIG. 3).
FIG. 8 is a flowchart showing a bibliographic candidate extraction process (step S627 in FIG. 3).
FIG. 9 is a flowchart showing a bibliographic candidate extraction process (step S627 in FIG. 3).
10 is a flowchart showing a modification of part of the processing executed in the document management system in FIG. 3; FIG.
FIG. 11 is a block diagram showing a configuration of a document management system to which a document management apparatus according to a second embodiment of the present invention can be applied.
12 is a flowchart showing processing executed by the document management system in FIG. 11. FIG.
13 is a flowchart showing processing executed in the document management system in FIG. 11. FIG.
FIG. 14 is a block diagram showing a configuration of a document management system to which a document management apparatus according to a third embodiment of the present invention can be applied.
15 is a flowchart showing processing executed by the document management system in FIG.
16 is a flowchart showing processing executed by the document management system in FIG.
FIG. 17 is a diagram illustrating an example of an application displayed on the screen of the
18 is a flowchart showing a modification of part of the processing executed in the document management system in FIG. 3. FIG.
FIG. 19 is a flowchart showing a modification of part of the processing executed by the document management system in FIG. 3;
FIG. 20 is a diagram showing an example of an application displayed on the screen of the
[Explanation of symbols]
21 CPU
22 RAM
23 ROM
28 hard disk
110 Document management server
111 Bibliographic Registration Department
112 OCR processing unit
113 Bibliographic Extraction Department
114 Image management unit
115 Extraction rule storage unit
116 Bibliographic Database (DB)
117 Image database (DB)
118 Text Database (DB)
Claims (10)
前記画像読取装置から受信した画像データを記憶する画像記憶手段と、
前記画像記憶手段に記憶された画像データに文字認識処理を施してテキストデータを生成する文字認識処理手段と、
前記テキストデータから書誌情報を抽出するための抽出ルールを記憶する抽出ルール記憶手段と、
前記テキストデータと前記抽出ルールに基づいて書誌情報を抽出する抽出手段と、
前記画像データ、前記テキストデータ及び前記書誌情報を前記クライアント装置に送信する送信手段と
を備えることを特徴とする文書管理装置。In an image reading apparatus for reading an image of a document and a document management apparatus connected via a communication line to a client apparatus for displaying image data of the read image,
Image storage means for storing image data received from the image reading device;
Character recognition processing means for generating text data by performing character recognition processing on the image data stored in the image storage means;
Extraction rule storage means for storing extraction rules for extracting bibliographic information from the text data;
Extraction means for extracting bibliographic information based on the text data and the extraction rule;
A document management apparatus comprising: transmission means for transmitting the image data, the text data, and the bibliographic information to the client apparatus.
前記画像読取装置は、
前記読み取った画像の画像データに文字認識処理を施してテキストデータを生成する文字認識処理手段と、
前記画像データ及び前記テキストデータを前記文書管理装置に送信する送信手段と
を備え、
前記文書管理装置は、
前記画像読取装置から受信した画像データ及びテキストデータを記憶する記憶手段と、
前記テキストデータから書誌情報を抽出するための抽出ルールを記憶する抽出ルール記憶手段と、
前記テキストデータと前記抽出ルールに基づいて書誌情報を抽出する抽出手段と、
前記画像データ、前記テキストデータ及び前記書誌情報を前記クライアント装置に送信する送信手段と
を備えることを特徴とする文書管理システム。Document management comprising an image reading device for reading an image of a document, a client device for displaying image data of the read image, and a document management device connected to the image reading device and the client device via a communication line In the system,
The image reading device includes:
Character recognition processing means for generating text data by performing character recognition processing on the image data of the read image;
Transmission means for transmitting the image data and the text data to the document management device,
The document management apparatus includes:
Storage means for storing image data and text data received from the image reading device;
Extraction rule storage means for storing extraction rules for extracting bibliographic information from the text data;
Extraction means for extracting bibliographic information based on the text data and the extraction rule;
A document management system comprising: transmission means for transmitting the image data, the text data, and the bibliographic information to the client device.
前記クライアント装置は、
前記画像読取装置から受信した画像データを記憶する画像記憶手段と、
前記画像記憶手段に記憶された画像データに文字認識処理を施してテキストデータを生成する文字認識処理手段と、
前記テキストデータから書誌情報を抽出するための抽出ルールを記憶する抽出ルール記憶手段と、
前記テキストデータと前記抽出ルールに基づいて書誌情報を抽出する抽出手段と、
前記画像データ、前記テキストデータ及びクライアント装置で前記書誌情報を表示するための表示情報を生成する表示情報生成手段と
を備えることを特徴とする文書管理システム。Document management comprising an image reading device for reading an image of a document, a client device for displaying image data of the read image, and a document management device connected to the image reading device and the client device via a communication line In the system,
The client device is
Image storage means for storing image data received from the image reading device;
Character recognition processing means for generating text data by performing character recognition processing on the image data stored in the image storage means;
Extraction rule storage means for storing extraction rules for extracting bibliographic information from the text data;
Extraction means for extracting bibliographic information based on the text data and the extraction rule;
A document management system comprising: the image data, the text data, and display information generating means for generating display information for displaying the bibliographic information on the client device.
前記画像読取装置から受信した画像データを記憶する画像記憶モジュールと、
前記画像記憶手段に記憶された画像データに文字認識処理を施してテキストデータを生成する文字認識処理モジュールと、
前記テキストデータから書誌情報を抽出するための抽出ルールを記憶する抽出ルール記憶モジュールと、
前記テキストデータと前記抽出ルールに基づいて書誌情報を抽出する抽出ステップと、
前記画像データ、前記テキストデータ及び前記書誌情報を前記クライアント装置に表示させるための表示情報を生成する表示情報生成モジュールと
を備えることを特徴とする文書管理用プログラム。In a document management program that is executed by a computer connected via a communication line to an image reading device that reads an image of a document and a client device that displays image data of the read image,
An image storage module for storing image data received from the image reading device;
A character recognition processing module for generating text data by performing character recognition processing on the image data stored in the image storage means;
An extraction rule storage module for storing extraction rules for extracting bibliographic information from the text data;
An extraction step of extracting bibliographic information based on the text data and the extraction rule;
A document management program, comprising: a display information generation module that generates display information for causing the client device to display the image data, the text data, and the bibliographic information.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003177211A JP2005011260A (en) | 2003-06-20 | 2003-06-20 | Document management device, document management system and program for document management |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003177211A JP2005011260A (en) | 2003-06-20 | 2003-06-20 | Document management device, document management system and program for document management |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005011260A true JP2005011260A (en) | 2005-01-13 |
Family
ID=34099865
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003177211A Pending JP2005011260A (en) | 2003-06-20 | 2003-06-20 | Document management device, document management system and program for document management |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005011260A (en) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007184748A (en) * | 2006-01-06 | 2007-07-19 | Murata Mach Ltd | Image processing system |
JP2010109653A (en) * | 2008-10-30 | 2010-05-13 | Kyocera Mita Corp | Image reader, image forming apparatus, image reading method, and image reading program |
JP2010191611A (en) * | 2009-02-17 | 2010-09-02 | Ricoh Co Ltd | Image processor, image processing system, image processing method, program and storage medium |
WO2010109594A1 (en) * | 2009-03-24 | 2010-09-30 | 三菱電機インフォメーションシステムズ株式会社 | Document search device, document search system, document search program, and document search method |
JP2011223348A (en) * | 2010-04-09 | 2011-11-04 | Murata Mach Ltd | Image processing apparatus, output device, and program |
JP2015212907A (en) * | 2014-05-07 | 2015-11-26 | 株式会社リコー | Output system, terminal device, program and output method |
JP2016019063A (en) * | 2014-07-04 | 2016-02-01 | キヤノン株式会社 | Image reader, program, image processing method, and image processing system |
JP2016165059A (en) * | 2015-03-06 | 2016-09-08 | シャープ株式会社 | Image processor |
US9471841B2 (en) | 2014-05-01 | 2016-10-18 | Konica Minolta, Inc. | Electronic document generation system, image forming apparatus and program |
JP2018072985A (en) * | 2016-10-26 | 2018-05-10 | 富士通株式会社 | Image scan system, image scanner, information acquisition method and information acquisition program |
CN109271616A (en) * | 2017-07-17 | 2019-01-25 | 江苏省质量和标准化研究院 | A kind of intelligent extract method based on normative document questions record characteristic value |
JP2019079554A (en) * | 2019-01-04 | 2019-05-23 | 富士通株式会社 | Image scan system, image scanner, information acquisition method and information acquisition program |
CN110097040A (en) * | 2018-01-31 | 2019-08-06 | 精工爱普生株式会社 | Image processing apparatus and storage medium |
-
2003
- 2003-06-20 JP JP2003177211A patent/JP2005011260A/en active Pending
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007184748A (en) * | 2006-01-06 | 2007-07-19 | Murata Mach Ltd | Image processing system |
JP2010109653A (en) * | 2008-10-30 | 2010-05-13 | Kyocera Mita Corp | Image reader, image forming apparatus, image reading method, and image reading program |
JP2010191611A (en) * | 2009-02-17 | 2010-09-02 | Ricoh Co Ltd | Image processor, image processing system, image processing method, program and storage medium |
WO2010109594A1 (en) * | 2009-03-24 | 2010-09-30 | 三菱電機インフォメーションシステムズ株式会社 | Document search device, document search system, document search program, and document search method |
JPWO2010109594A1 (en) * | 2009-03-24 | 2012-09-20 | 三菱電機インフォメーションシステムズ株式会社 | Document search device, document search system, document search program, and document search method |
JP2011223348A (en) * | 2010-04-09 | 2011-11-04 | Murata Mach Ltd | Image processing apparatus, output device, and program |
US9471841B2 (en) | 2014-05-01 | 2016-10-18 | Konica Minolta, Inc. | Electronic document generation system, image forming apparatus and program |
JP2015212907A (en) * | 2014-05-07 | 2015-11-26 | 株式会社リコー | Output system, terminal device, program and output method |
JP2016019063A (en) * | 2014-07-04 | 2016-02-01 | キヤノン株式会社 | Image reader, program, image processing method, and image processing system |
JP2016165059A (en) * | 2015-03-06 | 2016-09-08 | シャープ株式会社 | Image processor |
JP2018072985A (en) * | 2016-10-26 | 2018-05-10 | 富士通株式会社 | Image scan system, image scanner, information acquisition method and information acquisition program |
CN109271616A (en) * | 2017-07-17 | 2019-01-25 | 江苏省质量和标准化研究院 | A kind of intelligent extract method based on normative document questions record characteristic value |
CN109271616B (en) * | 2017-07-17 | 2022-09-16 | 江苏省质量和标准化研究院 | Intelligent extraction method based on bibliographic characteristic value of standard literature |
CN110097040A (en) * | 2018-01-31 | 2019-08-06 | 精工爱普生株式会社 | Image processing apparatus and storage medium |
CN110097040B (en) * | 2018-01-31 | 2023-07-04 | 精工爱普生株式会社 | Image processing apparatus and storage medium |
JP2019079554A (en) * | 2019-01-04 | 2019-05-23 | 富士通株式会社 | Image scan system, image scanner, information acquisition method and information acquisition program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9060085B2 (en) | Image forming apparatus, electronic mail delivery server, and information processing apparatus | |
CN101178725B (en) | Device and method for information retrieval | |
US7552381B2 (en) | Check boxes for identifying and processing stored documents | |
JP4920928B2 (en) | Image processing apparatus, control method therefor, and program | |
US8422796B2 (en) | Image processing device | |
JP2008250666A (en) | Image processor and control method for image processor | |
JP2009533749A (en) | Device XHTML-Print data generation method and apparatus | |
JP4237215B2 (en) | Image reading system, server device, image reading device, and terminal device | |
JP2005011260A (en) | Document management device, document management system and program for document management | |
EP3541057B1 (en) | Scan apparatus and scan result display program | |
CN102694940B (en) | Information processor and control method thereof | |
CN103377277A (en) | Document management apparatus and document management method | |
JP4968293B2 (en) | Document processing apparatus, document processing method, and program | |
JP2007166202A (en) | Information processor, control method thereof, and program | |
US20090150359A1 (en) | Document processing apparatus and search method | |
JP4315252B2 (en) | Information processing apparatus, information processing apparatus control method, and program | |
JP5049586B2 (en) | Data entry apparatus, control method therefor, program, and data entry system | |
JP5747344B2 (en) | Document management system, document management server, control method therefor, and program | |
JP4281719B2 (en) | File processing apparatus, file processing method, and file processing program | |
CN108881665B (en) | Information processing apparatus, information processing method, and computer program | |
JP4264568B2 (en) | Information processing apparatus, control method for information processing apparatus, and program | |
CN100588218C (en) | Image forming apparatus and electronic mail delivery server, | |
US20220309816A1 (en) | Image processing apparatus that extracts necessary character string from source image, and image forming apparatus including same | |
JP5573998B2 (en) | Management system, management apparatus, control method thereof, and program | |
US11206336B2 (en) | Information processing apparatus, method, and non-transitory computer readable medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20060417 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060612 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090421 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090622 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20091222 |