JP2005011260A - Document management device, document management system and program for document management - Google Patents

Document management device, document management system and program for document management Download PDF

Info

Publication number
JP2005011260A
JP2005011260A JP2003177211A JP2003177211A JP2005011260A JP 2005011260 A JP2005011260 A JP 2005011260A JP 2003177211 A JP2003177211 A JP 2003177211A JP 2003177211 A JP2003177211 A JP 2003177211A JP 2005011260 A JP2005011260 A JP 2005011260A
Authority
JP
Japan
Prior art keywords
image
document management
text data
information
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003177211A
Other languages
Japanese (ja)
Inventor
Masao Edamitsu
正夫 枝光
Masaru Otaka
大 大高
Masao Tsukawaki
正生 塚脇
Hiroshi Nomura
大志 野村
Toshihiko Wada
俊彦 和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Original Assignee
Canon Marketing Japan Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc filed Critical Canon Marketing Japan Inc
Priority to JP2003177211A priority Critical patent/JP2005011260A/en
Publication of JP2005011260A publication Critical patent/JP2005011260A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a document management device, a document management system and a document management program by which the waiting time of processing other than document recognition processing can be minimized, manhour for inputting document information can be reduced and operation efficiency can be improved. <P>SOLUTION: A document management server 110 is connected to a composite machine 140 for reading out an image from an original, and an operation terminal 120 for displaying the image data of the read image through a communication line. The document management server 110 executes OCR processing of the image data read out by the composite machine 140, extracts document information from text data obtained by the OCR processing on the basis of a fixed rule, transmits the image data, the text data and the extracted document information to the operation terminal 120, and continues the OCR processing in parallel on the background of the document information extracting processing and the transmitting processing of data or the like. During the continuation of the OCR processing, the operation terminal 120 displays the image data, the text data and the extracted document information on a screen. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、一定のルールに基づいてテキストデータから書誌事項を抽出する処理が実行可能な文書管理装置、文書管理システム及び文書管理用プログラムに関する。
【0002】
【従来の技術】
従来より、紙に記載された文書を電子化して登録する業務では、紙に記載された文書の画像を読み込むスキャナと、該スキャナで読み取られた画像データに対してOCR(光学式文字認識)処理を実行することでテキストデータを生成し、さらにユーザにより入力された書誌事項と画像データ及びテキストデータとを関連付けて登録するコンピュータとを備える文書管理システムが知られている。
【0003】
また、特許文献1には、紙に記載された文書を光学的に読み取り、OCR処理によって文字を認識し、文字領域のレイアウトを認識後、更に文字サイズとフォントの種類を識別してタイトルや図のキャプションやキーワードを抽出する技術が開示されている。
【0004】
さらに、特許文献2には、複写機とコンピュータを備えたシステムにおいて、複写機でインデックス情報(分類やキーワード)等を入力後、付加情報と画像データとをコンピュータ(PC)に送信し、コンピュータではこれらの付加情報と画像データとをデータベース(DB)用のデータ形式に変換し、ハードディスク等の内部に記録されたデータベースに該変換されたデータを登録して、管理する技術が開示されている。
【0005】
【特許文献1】
特開平11−238072号公報
【特許文献2】
特開2002−290661号公報
【0006】
【発明が解決しようとする課題】
しかしながら、上記従来の文書管理システムでは、画像データとテキストデータを参照しつつ、パソコン等の画面から書誌情報を手入力するのは手間がかかり、ユーザビリティに欠けるという問題がある。
【0007】
また、上記特許文献1の技術では、タイトルの自動識別はある程度できるものの、例えばタイトルの文字サイズや使用フォントが本文と同一である場合は、識別に失敗する可能性があり、また、書誌情報のうちの文書管理用情報(文書作成日、発行元や送付先等)は通常は1回だけ出現するので、頻度順のキーワード抽出では対応できない可能性が高いという問題がある。
【0008】
さらに、特定の文書全体のOCR処理には相当の時間がかかるので、文書登録業務の担当者は文書の読み込み後、OCR処理が完了するまで待機する必要があり、実稼動率が低くなるという問題がある。
【0009】
特許文献2のシステムによれば、複写機でキーワード入力後に1件づつ画像データをコンピュータに送信するので、付加情報と画像データの関連付けは容易な反面、キーワード入力と画像読み込みを同時に行うことができないという問題がある。すなわち、全体の作業時間の中で複写機が実際に画像を読み込んでいる時間の割合が低く、作業効率が悪いという問題がある。
【0010】
本発明は、上記問題点を解決するためになされたもので、文字認識処理以外の他の処理の待機時間を最小限に低減し、かつ書誌情報の入力の工数を低減することができ、作業効率の向上を図ることができる文書管理装置、文書管理システム及び文書管理用プログラムを提供することを目的とする。
【0011】
【課題を解決するための手段】
上記目的を達成するため、請求項1記載の文書管理装置は、原稿の画像を読み取る画像読取装置及び該読み取られた画像の画像データを表示するクライアント装置と通信回線を介して接続される文書管理装置において、前記画像読取装置から受信した画像データを記憶する画像記憶手段と、前記画像記憶手段に記憶された画像データに文字認識処理を施してテキストデータを生成する文字認識処理手段と、前記テキストデータから書誌情報を抽出するための抽出ルールを記憶する抽出ルール記憶手段と、前記テキストデータと前記抽出ルールに基づいて書誌情報を抽出する抽出手段と、前記画像データ、前記テキストデータ及び前記書誌情報を前記クライアント装置に送信する送信手段とを備えることを特徴とする。
【0012】
請求項2記載の文書管理装置は、請求項1記載の文書管理装置において、前記画像データ、前記テキストデータ及び前記書誌情報を関連付けて記憶する文書情報記憶手段を備えることを特徴とする。
【0013】
請求項3記載の文書管理装置は、請求項1又は2記載の文書管理装置において、前記クライアント装置から受信した前記書誌情報に対する編集情報を受信する受信手段と、該受信した編集情報に基づいて該書誌情報を更新する書誌情報更新手段とを備えることを特徴とする。
【0014】
請求項4記載の記載の文書管理装置は、請求項3記載の文書管理装置において、前記受信した編集情報に基づいて前記テキストデータを更新するテキストデータ更新手段とを備えることを特徴とする。
【0015】
請求項5記載の記載の文書管理装置は、請求項4記載の文書管理装置において、前記画像データ、前記書誌情報更新手段により更新された書誌情報及び前記テキストデータ更新手段により更新されたテキストデータに基づいて前記クライアント装置の画面に表示させるための表示情報を生成する表示情報生成手段を備えることを特徴とする。
【0016】
請求項6記載の記載の文書管理装置は、請求項3乃至5のいずれか1項記載の文書管理装置において、前記受信した編集情報は、前記クライアント装置で選択されたテキストデータが反転表示されているか否かの情報、前記クライアント装置で選択されたテキストデータを含む矩形領域が指定されているか否かの情報、及び反転表示されたテキストデータ又は指定された矩形領域に含まれるテキストデータが所定の入力フィールドにドラッグ&ドロップされたか否かを示す情報であることを特徴とする。
【0017】
請求項7記載の文書管理システムは、原稿の画像を読み取る画像読取装置と、該読み取られた画像の画像データを表示するクライアント装置と、前記画像読取装置及び前記クライアント装置と通信回線を介して接続される文書管理装置とを備える文書管理システムにおいて、前記画像読取装置は、前記読み取った画像の画像データに文字認識処理を施してテキストデータを生成する文字認識処理手段と、前記画像データ及び前記テキストデータを前記文書管理装置に送信する送信手段とを備え、前記文書管理装置は、前記画像読取装置から受信した画像データ及びテキストデータを記憶する記憶手段と、前記テキストデータから書誌情報を抽出するための抽出ルールを記憶する抽出ルール記憶手段と、前記テキストデータと前記抽出ルールに基づいて書誌情報を抽出する抽出手段と、前記画像データ、前記テキストデータ及び前記書誌情報を前記クライアント装置に送信する送信手段とを備えることを特徴とする。
【0018】
請求項8記載の文書管理システムは、原稿の画像を読み取る画像読取装置と、該読み取られた画像の画像データを表示するクライアント装置と、前記画像読取装置及び前記クライアント装置と通信回線を介して接続される文書管理装置とを備える文書管理システムにおいて、前記クライアント装置は、前記画像読取装置から受信した画像データを記憶する画像記憶手段と、前記画像記憶手段に記憶された画像データに文字認識処理を施してテキストデータを生成する文字認識処理手段と、前記テキストデータから書誌情報を抽出するための抽出ルールを記憶する抽出ルール記憶手段と、前記テキストデータと前記抽出ルールに基づいて書誌情報を抽出する抽出手段と、前記クライアント装置に前記画像データ、前記テキストデータ及び前記書誌情報を表示させるための表示情報生成手段とを備えることを特徴とする。
【0019】
請求項9記載の文書管理システムは、請求項8記載の文書管理システムにおいて、前記文書管理装置は、前記クライアント装置から受信した前記書誌情報に対する編集情報を受信する受信手段を備え、前記受信した編集情報は、前記クライアント装置で選択されたテキストデータが反転表示されているか否かの情報、前記クライアント装置で選択されたテキストデータを含む矩形領域が指定されているか否かの情報、及び反転表示されたテキストデータ又は指定された矩形領域に含まれるテキストデータが所定の入力フィールドにドラッグ&ドロップされたか否かを示す情報であることを特徴とする。
【0020】
請求項10記載の文書管理用プログラムは、原稿の画像を読み取る画像読取装置及び該読み取られた画像の画像データを表示するクライアント装置と通信回線を介して接続されるコンピュータに実行させる文書管理用プログラムにおいて、前記画像読取装置から受信した画像データを記憶する画像記憶モジュールと、前記画像記憶手段に記憶された画像データに文字認識処理を施してテキストデータを生成する文字認識処理モジュールと、前記テキストデータから書誌情報を抽出するための抽出ルールを記憶する抽出ルール記憶モジュールと、前記テキストデータと前記抽出ルールに基づいて書誌情報を抽出する抽出ステップと、前記画像データ、前記テキストデータ及び前記書誌情報を前記クライアント装置に表示させるための表示情報を生成する表示情報生成モジュールとを備えることを特徴とする。
【0021】
【発明の実施の形態】
以下、本発明の実施の形態を図面を参照して説明する。
【0022】
(第1の実施の形態)
図1は本発明の第1の実施の形態に係る文書管理装置のハードウェア構成を示すブロック図である。
【0023】
同図において、CPU21(送信手段、受信手段、表示情報生成手段)、RAM22、ROM23、LANアダプタ24(送信手段、受信手段)、ビデオアダプタ25、キーボード26、マウス27、ハードディスク28、CD−ROMドライブ29はそれぞれシステムバス20を介して互いに接続されている。システムバス20は、例えばPCIバス、AGPバス又はメモリバス等である。文書管理サーバ110は各バス間の接続用チップ、キーボードインタフェース及びいわゆるSCSIやATAPIのような入出力用インタフェースを備えているが、図1ではこれらを省略している。
【0024】
CPU21は、四則演算や比較演算等の各種の演算及びハードウェアやソフトウェアの制御を行う。RAM22には、ハードディスク28やCD−ROMドライブ29に装着されたCD−ROMやCD−R等の記憶媒体から読み出されたオペレーションシステムのプログラムやアプリケーションプログラム等が記憶され、これらのプログラムはCPU21の制御により実行される。ROM23には、オペレーションシステムと協働してハードディスク等への入出力を司るいわゆるBIOS等が記憶されている。LANアダプタ24は、CPU21によって制御されるオペレーションシステムに含まれる通信プログラムと協働して、ネットワーク(不図示)を介した外部装置(不図示)との通信を行う。ビデオアダプタ25はディスプレイ装置(不図示)に接続され、該ディスプレイ装置に出力する画像信号を生成し、キーボード26やマウス27は文書管理サーバ110への指示を入力するために用いられる。
【0025】
ハードディスク28はオペレーションシステムやアプリケーションプログラムや後述する抽出ルール記憶部115や書誌DB116等の各種データや不図示の各種マスタファイルを記憶している。CD−ROMドライブ29はCD−ROM、CD−R、又はCD−R/W等の記憶媒体を装着してアプリケーションプログラムをハードディスク28にインストールするために使用する。CD−ROMドライブの代わりにCD−Rドライブ、CD−R/Wドライブ、又はMOドライブ等を用いても良いのは言うまでもない。
【0026】
後述する作業端末120及び管理端末130も図1の文書管理装置と同様のハードウェア構成を備えている。
【0027】
図2は、本発明の実施形態に係る文書管理装置を適用可能な文書管理システムの構成を示すブロック図である。本発明の実施形態に係る文書管理装置は文書管理サーバ110に適用される。
【0028】
同図において、文書管理システムは、通信回線100、文書管理サーバ110、作業端末120、管理端末130及び複合機140を備えている。
【0029】
作業端末120及び管理端末130は、例えば、パソコン、いわゆるPDA(Personal Digital Assistant)又はインターネット対応の携帯電話等であり、文字の入力と画像や文字の表示が可能であれば良い。
【0030】
通信回線100は、典型的にはインターネット、LAN(Local Area Network)、WAN(Wide Area Network)、電話回線、専用デジタル回線、ATM(Asynchronous Transfer Mode)、フレームリレー回線、通信衛星回線、ケーブルテレビ回線、又はデータ放送用無線回線等のいずれか、又はこれらの組み合わせにより実現されるいわゆる通信ネットワークであり、データの送受信が可能であれば良い。
【0031】
文書管理サーバ110は、所定のOS(例えば,UNIX(登録商標)やWINDOWS(登録商標)が含まれる)及びアプリケーションプログラムによって文書の登録処理や検索処理を行う。文書管理サーバ110は、書誌登録部111(書誌情報更新手段)、OCR処理部112(文字認識処理手段)、書誌抽出部113(抽出手段)、画像管理部114、抽出ツール記憶部115(抽出ルール記憶手段)、書誌データベース(DB)116(文書情報記憶手段)、画像データベース(DB)117(画像記憶手段)及びテキストデータベース(DB)118を備えている。
【0032】
画像管理部114は、複合機140から通信回線100を介して受信した画像データを画像DB117に記憶する処理を行う。OCR処理部112は画像DB117に記憶されている画像データのうちOCR処理を実行していないものについて文字認識処理を実行するためのプログラムと認識用辞書を備え、文字認識処理により生成されたテキストデータをテキストDB118に記憶する。テキストDBは全文検索も可能なデータベースであるが、検索についての詳細な説明は省略する。
【0033】
書誌抽出部113は、テキストデータと抽出ルール記憶部115に記憶されている書誌情報の抽出ルールに基づいて、書誌情報の抽出を行う。抽出ルール115に記憶されている書誌情報の抽出ルールについては後述する図8,9で詳細に説明する。
【0034】
書誌登録部111は、作業端末120から受信した編集情報に基づいて書誌情報の更新を行い、「登録」を指示する編集情報を作業端末120から受信した場合は、書誌情報を書誌DB116に登録する。この書誌情報は画像DB117中の対応する画像データ及びテキストDB118中の対応するテキストデータと関連付けられている。なお、書誌DB116と画像DB117とテキストDBを連携させて検索可能な不図示の検索処理部も文書管理サーバ110に含まれるが詳細な説明は省略する。
【0035】
書誌登録部111、OCR処理部112、書誌抽出部113及び画像管理部114はハードディスク28に記憶されたプログラムに基づいてCPU21が制御を実行することで実現され、書誌データベース(DB)116、画像データベース(DB)117及びテキストデータベース(DB)118はハードディスク28内に構築される。
【0036】
次に、複合機140は、CCD等の撮像素子を備えた不図示のスキャンエンジンと、スキャンエンジンが読み込んだ画像データを記憶する画像データ記憶部147と、記憶した画像データを文書管理サーバ110に送信すると共に送信した履歴をログデータ記憶部146に記憶させる制御部145と、入力されるPDLデータを印刷する機能及びスキャンエンジンから出力される画像データを印刷する機能とを備えた不図示のプリンタエンジンとを備え、スキャンエンジンとプリンタエンジンとは相互に通信可能に構成されている。ログデータ記憶部146と画像データ記憶部147は複合機140が備えるハードディスク装置で構成される。
【0037】
また、複合機140は、不図示のネットワークコントローラと通信I/Fを備えて、通信回線100を介して、文書管理サーバ110、作業端末120及び管理端末130と通信可能に接続されている。
【0038】
図3,4は図2における文書管理システムで実行される処理を示すフローチャートである。
【0039】
図3,4において、ステップS601〜ステップS607の処理は、作業端末120の不図示のCPUの制御により実行され、ステップS621〜ステップS636の処理は、文書管理サーバ110のCPU21の制御により実行され、ステップS641〜ステップS643の処理は複合機140の不図示のCPUの制御により実行される。
【0040】
文書管理サーバ110がステップS621の処理を実行する前に、既に、作業端末120が文書管理サーバ110に対して認証要求を実行すること、即ちユーザIDやパスワードを送信すること、文書管理サーバ110が認証処理を実行すること、作業端末120が文書管理サーバ110に対してメニュー選択情報を送信すること、及び文書管理サーバ110がメニュー選択情報に基づく作業端末120用の画面情報を生成することは、終了しているものとする。また複合機140にはスキャニングする文書が既に置かれているものとする。
【0041】
まず、文書管理サーバ110が、作業端末120で文書登録画面を表示させるための画面情報を送信し(ステップS621)、作業端末120に接続されたディスプレイは図5に示すような画面を表示する(ステップS601)。
【0042】
図5は、作業端末120の画面に、書誌登録の処理の際に表示されるアプリケーションの一例を示す図である。
【0043】
同図において、符号1200はスキャン指示を入力するためのスキャンボタンであり、符号1201はOCR処理の対象となる画像データを表示する画像表示部であり、符号1202は実際にOCR処理によって認識されたテキストデータを表示するイメージ表示部であり、符号1209〜1215は各種書誌情報の入力欄であり、符号1203はテキストデータの情報又は書誌情報を更新する更新ボタンであり、符号1204は前ページの画像データ、テキストデータ及び書誌候補を文書管理サーバ110に要求するための前ページボタンであり、符号1205は次ページの画像データ、テキストデータ及び書誌候補を文書管理サーバ110に要求するための次ページボタンであり、符号1206は書誌情報を文書管理サーバ110に登録するための登録ボタンであり、符号1207は次文書の先頭ページの画像データ、テキストデータ及び書誌候補を文書管理サーバ110に要求するための次文書ボタンであり、符号1208は終了ボタンである。
【0044】
図5において、スキャンボタン1200が押下されると、作業端末120はスキャニングの開始を要求する旨の情報(スキャン要求情報)と該情報の送信元である作業端末120を特定する作業端末特定情報(例えば、ユーザIDやセッションID等)を文書管理サーバ110に送信する(ステップS602)。
【0045】
文書管理サーバ110は、作業端末120から受信したスキャン要求情報及び作業端末特定情報を複合機140に転送すると共に所定の文書番号を1つ採番する(ステップS622)。文書番号は文書1つに対して1つ採番される一意の管理番号であり、書誌DB116、画像DB117及びテキストDB118の検索キー又は検索キーの一部として使用され、これら3つのDBのデータの関連付けに使用される。
【0046】
複合機140は、文書管理サーバ110からのスキャン要求情報及び作業端末特定情報を受信し(ステップS641)、文書のスキャニングを実行し(ステップS642)、画像データ記憶部147に画像データを記憶する。画像データにはページ単位で一意の画像番号が採番される。画像番号は、例えば画像スキャン要求の受信時刻(14桁)とページ数(下3桁)とを組み合わせて採番する。
【0047】
複合機140の制御部145は、スキャン画像及びスキャン要求元の作業端末特定情報を一緒に文書管理サーバ110に送信し、送信した画像の名称と送信時刻をログデータ記憶部146に記憶する(ステップS643)。
【0048】
ステップS643で画像データの送信が正常終了しなかった場合は、一定時間経過後にリトライし、所定回数リトライしても送信が正常終了しなかった場合は、その旨をログデータ記憶部146に記憶するように構成してもよい。
【0049】
文書管理サーバ110では、上記ステップS621やステップS622とは別のプロセス(ステップS623〜ステップS629)が実行されており、CPU21は複合機からのスキャン画像の待ち状態になっており(ステップS623)、一定時間間隔で受信すべきスキャン画像があるか否かを判別し(ステップS624)、受信すべきスキャン画像がない場合(ステップS624でNoの場合)には、ステップS623に戻って待機する。ステップ624の判別の結果、受信すべきスキャン画像がある場合(ステップS624でYesの場合)には、スキャン画像を受信した後、画像管理部114により受信した画像データが画像DB117に登録される(ステップS625)。
【0050】
次いで、OCR処理部112が画像DB117に登録された画像データに対して1ページずつOCR処理を施し、該OCR処理により認識されたテキストはRAM22からテキストDB118に追加される(ステップ626)。OCR処理が施された画像データには画像DB117内でフラグが付される。OCR処理の詳細は後述する。
【0051】
次に、書誌抽出部113が抽出ルール記憶部115に記憶されている抽出ルールに基づいてRAM22のワークエリア内の認識されたテキストデータから書誌情報の候補を抽出し、RAM22のワークエリア内に記憶する(ステップ627)。書誌候補抽出処理の詳細も後述する。
【0052】
その後、CPU21は、受信した1ページ分の画像データと、この画像データに対応するテキストデータと、文書の先頭ページから抽出された書誌情報の候補とをRAM22のワークエリアから作業端末120に送信する(ステップ628)。
【0053】
次いで、CPU21は、画像DB117に登録された画像データであって、OCR処理部112によりOCR処理が施されていないページが存在するか否かを判別する(ステップS629)。具体的には、CPU21がOCR処理時に更新される画像DB117のフラグの有無を検出し、フラグがある場合にはOCR処理が施されていないページが存在すると判断し、フラグがない場合にはOCR処理が施されていないページは存在しないと判断する。又はCPU21は画像データに対応するテキストデータがテキストDB118に存在するか否かを確認することによりステップS629の判別を実行してもよい。
【0054】
ステップS629の判別の結果、OCR処理が施されていないページが存在する場合には、ステップS626の処理に戻り、次ページの画像データのOCR処理が実行される。一方OCR処理が施されていないページが存在しない場合には、ステップS623の処理に戻り、CPU21は次の画像データの受信を待つ。
【0055】
次いで、作業端末120が、ステップS628の処理で文書管理サーバ110から送信される画像データ、テキストデータ及び書誌候補を受信する(ステップS603)。作業端末120では図5に示すような画面が表示され、同図の画像表示部1201には画像データが表示され、イメージ表示部1202にはOCR処理によって認識されたテキストデータが表示され、さらに各種書誌情報の入力欄1209〜1215には書誌情報の候補が表示され、画面表示が更新される(ステップ604)。
【0056】
次に、作業端末120は、キーボード26の入力情報やマウス27の操作情報を識別し(ステップ605)、これらの情報を文書管理サーバ110に送信する(ステップ606)。作業端末120は、入力情報や操作情報がない場合には入力や操作が有るまで待機する。
【0057】
文書管理サーバ110のCPU21は、ステップS606で作業端末120から送信されるキーボード26の入力情報やマウス27の操作情報を受信し、この受信した入力情報や操作情報に基づいて、作業端末120の画面において終了ボタン1208が押下されたか否かを判別する(ステップS630)。
【0058】
ステップS630の判別の結果、終了ボタン1208が押下された場合には、本処理を終了する一方、終了ボタン1208が押下されていない場合には、ステップS606で作業端末120から送信されるキーボード26の入力情報やマウス27の操作情報に基づいて、作業端末120の画面において次文書ボタン1207が押下されたか否かを判別する(ステップS631)。
【0059】
ステップS631の判別の結果、次文書ボタン1207が押下された場合には、CPU21が現在処理している文書の次文書のOCR処理及び書誌候補抽出処理が終了しているか否かを判別し(ステップS632)、これらの処理が終了している場合には、ステップS628の処理に戻り、CPU21が次文書の先頭ページの画像データと、これに対応するテキストデータと、書誌情報の候補とを作業端末120に送信する。一方ステップS632の処理が終了していない場合には、ステップS626の処理に戻り、CPU21が次文書の先頭ページのOCR処理を行う。
【0060】
ステップS631の判別の結果、次文書ボタン1207が押下されていない場合には、ステップS606で作業端末120から送信されるキーボード26の入力情報やマウス27の操作情報に基づいて、作業端末120の画面において前ページボタン1204又は次ページボタン1205が押下されたか否かを判別する(ステップS633)。
【0061】
ステップS633の判別の結果、前ページボタン1204又は次ページボタン1205が押下された場合には、ステップS628の処理に戻り、押下されたボタンに応じて前ページ又は次ページの画像データと、これに対応するテキストデータと、書誌情報の候補とを作業端末120に送信する。
【0062】
ステップS633の判別の結果、前ページボタン1204又は次ページボタン1205が押下されていない場合には、ステップS606で作業端末120から送信されるキーボード26の入力情報やマウス27の操作情報に基づいて、作業端末120の画面において登録ボタン1206が押下されたか否かを判別する(ステップS634)。
【0063】
ステップS634の判別の結果、登録ボタン1206が押下された場合には、RAM22のワークエリアに記憶されていた書誌情報がハードディスク28に送信され、ステップS623の処理に戻る。文書管理サーバ110では、作業端末120に登録処理が終了した旨のメッセージを送信した後、書誌DB116を更新する。
【0064】
一方、ステップS634の判別の結果、登録ボタン1206が押下されていない場合には、イメージ表示部1202に表示されるテキストデータの情報が修正されたか、又は書誌情報の入力欄1209〜1215のいずれかの情報が修正された場合であるので、これらの修正を反映してRAM22のワークエリア内のテキストデータ(テキストデータ更新手段)又は書誌情報を更新し、この更新された内容を含む画面情報を生成し、作業端末120に送信する(ステップS635)。
【0065】
作業端末120はステップS635の処理で文書管理サーバ110から受信した画像情報を受信し(ステップS607)、ステップS604の処理を実行する。
【0066】
更新ボタン1203が押下された場合は、文書管理サーバ110がステップS635の処理を実行し、作業端末120はステップS607の処理を実行する。
【0067】
本処理によれば、原稿の画像データを1ページ単位でOCR処理して書誌情報を抽出し、元の画像データとテキストデータと抽出した書誌情報とが作業端末120の画面に表示され、バックグラウンドで次ページ以降のOCR作業が続行されるので、文字認識処理以外の他の処理の待機時間を最小限に低減し、かつ書誌情報の入力の工数を低減することができ、作業効率の向上を図ることができる。
【0068】
上記ステップS602のスキャニングを要求する旨の情報は、スキャナーやスキャナー機能を有する複合機に直接送信しても良い。この場合、ステップS643ではスキャン画像と同時にスキャニング要求元を特定する情報(ユーザID等)が一緒に送信される。
【0069】
図6,7は、OCR処理(図3のステップS626)を示すフローチャートである。
【0070】
図6,7において、ステップS701〜ステップS724の処理は文書管理サーバ110のCPU21の制御により実行される。
【0071】
まず、RAM22のワークエリア内に記憶しているOCR対象の画像データに基づき、文字ブロックと行間の解析が実行される(ステップS701)。「文字ブロック」とは、上下を空白行で挟まれているか、又は左右を所定数以上のスペースで挟まれている文字列である。左右を所定数以上のスペースで挟まれている場合を含むのは、例えば行の右端に作成年月日があり、直ぐ下の行の中央部分に表題があるようなケースを想定するからである。行間は、画像データを横方向に走査し、黒比率がゼロに近い所定値(例えば0.1)以下の場合は行間又は空白行であり、所定値以上の部分は文字行の一部と判定する。また、文字ブロック解析及び行間解析により、当該ページの最終文字の位置が確定される。最終文字の位置は再下段の文字ブロックの最終行の右端部分として確定される。最終文字位置については後で詳述する。
【0072】
次いで、画像データ全体を横方向に走査し、罫線認識を行い、画像データが特定フォーマット(例えば文書の仕切り用紙のフォーマット)と合致しているか否かを解析する(ステップS702)。
【0073】
ステップS702の解析の結果、画像データが特定フォーマットと合致していない場合には、本処理を終了し、画像データが特定フォーマットと合致している場合には、そのフォーマットに対応する特定位置の文字が文字認識処理の対象になる。特定のフォーマットの罫線情報は不図示の書式テーブル(物理的にはハードディスク28)に記憶される。
【0074】
次に、RAM22のワークエリア内の最終文字フラグがオンになっているか否かを判別する(ステップS703)。最終文字フラグとは、OCR対象の画像データの最後の文字の文字認識処理が終わった時点でオンになるフラグである。
【0075】
ステップS703の判別の結果、最終文字フラグがオンである場合には、今回処理している画像データが仕切り紙であるか否かを判別し(ステップS705)、この判別結果に応じて仕切りしであるか否かの識別データをOCR処理のテキストデータに追加し(ステップS706)、本処理を終了する。
【0076】
一方、ステップS703の判別の結果、最終文字フラグがオンでない場合には、ステップS701の行間解析の結果に基づいて、文字範囲の解析が実行される(ステップS704)。ステップS701の行間解析において画像データの垂直方向の文字間隔が判明しているので、このステップS704では垂直方向の文字間隔又はその半分の値を文字範囲解析の初期値として文字範囲の判定を行う。文字範囲の判定は文字と文字との間の空白部を識別して各文字の範囲を判定する。
【0077】
次に、確定した1文字分の範囲の黒色が占める比率を集計し(ステップS707)、この集計された黒色が占める比率の値が所定値(例えば0.005)を超えているか否かを判別する(ステップS708)。黒色の比率が所定値以下の場合には、前後の所定文字数分の黒比率が判定され、ステップS701の文字ブロック範囲の判定とあわせて、今回判定した文字が行頭又は行末にあるか否かを判定する(ステップS709)。
【0078】
次いで、今回の文字がスペースであるか否かを判別し(ステップS710)、今回の文字がスペースである場合には、出力されるテキストデータにスペースが1つ追加され(ステップS711)、後述するステップS723の処理に進む。一方、今回の文字がスペースでない場合には、今回の文字が、「。」や「、」や「・」等のいずれかの記号であるか否かを判別し(ステップS712)、今回の文字が記号である場合には、出力されるテキストデータに記号を1つ追加し(ステップS713)、後述するステップS723の処理に進む一方、今回の文字が記号でない場合には、後述するステップS723の処理に進む。
【0079】
上記ステップS708の判別の結果、黒色が占める比率の値が所定値を超えている場合には、1文字分の画像データと辞書の文字データの各画素の一致又は不一致を照合する(ステップS714)。
【0080】
次いで、ステップS714の辞書照合が完了したか否かを判別し(ステップS715)、辞書照合が完了していない場合には、ステップS714の照合結果に基づいて1文字分の画像データと辞書の文字データの各画素の一致率を判定する(ステップS716)。この辞書の文字データはハードディスク28に記憶されている。
【0081】
次に、ステップS716で判定された一致率が所定値A(例えば0.8)を超えているか否かを判別し(ステップS717)、一致率が所定値Aを超えている場合には、該当の文字のテキストデータを辞書から選択し、その文字の一致率とペアにしてRAM22のワークエリア内の候補配列に追加し(ステップS718)、ステップS714に戻り、辞書の次の文字との照合を行う。
【0082】
一方、ステップS717の判別の結果、一致率が所定値A以下の場合には、ステップS718の処理をスキップして、ステップS714に戻る。
【0083】
上記ステップS715の辞書照合が完了した場合には、1文字分の画像データと候補配列の各文字の一致率を比較し(ステップS719)、一致率が最大である文字のテキストデータが出力用テキストデータに追加される(ステップS720)。
【0084】
次いで、一致率の最大値が所定値(例えば0.9)を超えているか否かを判別し(ステップS721)、一致率の最大値が所定値以下の場合は、警告フラグがオンになり出力用テキストデータに所定の特殊文字を出力する(ステップS722)。この特殊文字により、画面表示時(図4のステップS604)では、特殊文字の直前のテキストが通常の色(例えば黒色)以外の別の色(例えば青色)で表示される。
【0085】
このように処理することで、文字の識別が正確かどうか疑わしい個所の色を変えて表示可能となるので、人手によるOCR処理の目視確認作業と訂正作業を効率的に行うことが可能になる。
【0086】
次に、今回識別した文字が1ページ分の画像データにおける最終文字であるか否かを判別し(ステップS723)、今回識別した文字が1ページ分の画像データにおける最終文字である場合は、RAM22のワークエリア内の最終文字フラグデータをオンとし(1が代入され)(ステップS724)、ステップS703の処理に戻る。ステップS723の判別の結果、今回識別した文字が1ページ分の画像データにおける最終文字でない場合は、直ちにステップS703に戻る。
【0087】
以上説明したように、図6,7のOCR処理では画像データにおけるスペースや句読点等の記号も判定して該画像データに対応するテキストデータを出力するので、元画像データとレイアウトの一致した文字認識処理が可能になる。
【0088】
図8,9は、書誌候補抽出処理(図3のステップS627)を示すフローチャートである。
【0089】
図8,9のステップS821〜ステップS836の処理は文書管理サーバ110のCPU21の制御により実行される。
【0090】
本処理では、書誌情報は文書の先頭ページにあることを前提としている。
【0091】
まず、書誌情報を抽出しようとするページが文書の先頭ページであるか否かを判別する(ステップS821)。書誌情報を抽出しようとするページが文書の先頭ページでない場合には、本処理を終了する一方、書誌情報を抽出しようとするページが文書の先頭ページである場合は、上記OCR処理で抽出されたテキストデータの文字ブロックが1つ読み込まれる(ステップS822)。ここで「文字ブロック」とは、所定数以上(例えば2つ以上)のスペースであるか、又は最初の文字が行頭又は行末にある一連の文字データをいう。
【0092】
次に、読み込んだ文字ブロックを抽出ルール記憶部115に記憶されている候補辞書と照合し(ステップS823)、文字ブロックの先頭が「平成」等の元号であり、かつ、末尾が「日」であり、さらに文字ブロックの位置がページの中央より右側であるか否かを判別する(ステップS824)。これら全ての条件を満たしている場合(ステップS824でYES)には、当該文字ブロックのテキストデータを書誌情報の「発行日」の入力欄に上書きし(ステップS825)、ステップS836の処理に進む。
【0093】
ステップS836では、現在読み込んでいる文字ブロックが先頭ページの最終ブロックであるか否か(当該文字ブロックよりも右側又は下側に他の文字ブロックが存在するか否か)を判別し、現在読み込んでいる文字ブロックが最終ブロックである場合は、本処理を終了する。一方、現在読み込んでいる文字ブロックが最終ブロックでない場合には、ステップS822の処理に戻り、次の文字ブロックを読み込む。
【0094】
一方、ステップS824の判別の結果、いずれか1つでも条件を満たしていない場合(ステップS824でNO)には、文字ブロックの先頭が組織名称であり、かつ、末尾が「殿」であるか否かを判別する(ステップS826)。
【0095】
ステップS826の判別の結果、全ての条件を満たしている場合(ステップS826でYES)には、当該文字ブロックのテキストデータを書誌情報の「送付先部署」の入力欄に上書きし(ステップS827)、ステップS836の処理に進む。
【0096】
ステップS826の判別の結果、いずれか1つでも条件を満たしていない場合(ステップS826でNO)には、文字ブロックの先頭が組織名称であるか又は文字ブロックの末尾が官職であり、かつ、文字ブロックの位置がページの中央より右側であるか否かを判別する(ステップS828)。
【0097】
ステップS828の判別の結果、全ての条件を満たしている場合(ステップS828でYES)には、当該文字ブロックのテキストデータを書誌情報の「文書作成元」の入力欄に上書きし(ステップS829)、ステップS836の処理に進む。
【0098】
ステップS828の判別の結果、いずれか1つでも条件を満たしていない場合(ステップS828でNO)には、文字ブロックの先頭が文書名称であるか又は元号であり、かつ、文字ブロックの末尾が「号」であり、さらに文字ブロックの位置がページの中央より右側であるか否かを判別する(ステップS830)。
【0099】
ステップS830の判別の結果、全ての条件を満たしている場合(ステップS830でYES)には、当該文字ブロックのテキストデータを書誌情報の「文書番号」の入力欄に上書きし(ステップS831)、ステップS836の処理に進む。
【0100】
ステップS830の判別の結果、いずれか1つでも条件を満たしていない場合(ステップS830でNO)には、文字ブロックの末尾の文字が「の件」であるか、「通達」であるか、「通知」であるか又は「について」であるか否かを判別する(ステップS832)。
【0101】
ステップS832の判別の結果、全ての条件を満たしている場合(ステップS832でYES)には、当該文字ブロックのテキストデータを書誌情報の「収受文書名」の入力欄に上書きした後(ステップS833)、当該入力欄の属性を「上書き禁止」に変更し、ステップS834の処理に進む。
【0102】
ステップS832の判別の結果、いずれか1つでも条件を満たしていない場合(ステップS832でNO)には、ステップS836の処理に進む。
【0103】
次いで、ステップS833で上書きされた収受文書名をキーにして、抽出ルール記憶部115に記憶されている管理テーブルから、主管課、担当者、文書区分及び保管期限のデータを抽出し(ステップS834)、書誌情報の入力欄にこれらデータを上書きし、この上書き直後、これらのデータの属性を上書き禁止に変更し(ステップS835)、ステップS836の処理に進む。
【0104】
ステップS833,S834で属性が「上書き禁止」に設定されるのは、文書の本文中に他の文書名称が存在する場合に、本処理で「収受文書名」と収受文書名と関連するデータとが上書きされてしまう事態を防止するためである。
【0105】
なお、本フローチャートの処理の範囲外のことであるが、この書誌候補抽出処理が終わった後、作業端末120の操作者がカーソルをこれらの入力フィールドに移動して、手入力での修正を行うのは勿論可能である。
【0106】
本処理によれば、きめ細かい抽出ルールに基づいて文書の先頭ページのテキストデータから書誌情報の候補が抽出され入力フィールドに入力されるので、書誌情報の入力工数を最小限に抑制することができる。
【0107】
図10は図3における文書管理システムで実行される処理の一部の変形例を示すフローチャートであるので、図3と異なる処理を示す。
【0108】
図10のステップS630及びステップS1123〜ステップS1134の処理は、文書管理サーバ110のCPU21の制御により実行され、ステップS606,S607の処理は作業端末120のCPUの制御により実行される。
【0109】
作業端末120では、ブラウザソフト、Java(登録商標)Script、及びActiveXが組み合わされるか、又はクライアントのアプリケーションがインストールされ起動している。
【0110】
作業端末120は、図3のステップS605でキーボード26の入力情報やマウス27の操作情報を識別し、これらの情報を文書管理サーバ110に送信する(ステップ606)。これらの情報は、例えば「ドラッグ&ドロップ操作」、「文字列の反転操作」、「特定入力フィールドへの文字入力」、「矩形領域の指定」、及び各種ボタンの押下である。操作情報がドラッグ&ドロップである場合は、ドラッグされた文字列、ドラッグ開始の座標及びドロップ先の座標が操作情報に含まれている。また、矩形領域が指定された場合は、矩形領域内のテキスト情報も操作情報に含まれる。
【0111】
文書管理サーバ110のCPU21は、ステップS606で作業端末120から送信されるキーボード26の入力情報やマウス27の操作情報に基づいて、作業端末120の画面において終了ボタン1208が押下されたか否かを判別する(ステップS630)。
【0112】
ステップS630の判別の結果、終了ボタン1208が押下された場合には、本処理を終了する一方、終了ボタン1208が押下されていない場合には、ステップS606で作業端末120から送信されるキーボード26の入力情報やマウス27の操作情報が「矩形領域の指定」であるか否かを判別する(ステップS1123)。
【0113】
ステップS1123の判別の結果、キーボード26の入力情報やマウス27の操作情報が「矩形領域の指定」である場合には、CPU21は矩形領域内のテキストデータをRAM22のワークエリアのバッファ領域に蓄積する(ステップS1124)一方、キーボード26の入力情報やマウス27の操作情報が「矩形領域の指定」でない場合には、後述するステップS1125の処理に進む。
【0114】
次に、CPU21はキーボード26の入力情報やマウス27の操作情報が「文字列反転」であるか否かを判別し(ステップS1125)、キーボード26の入力情報やマウス27の操作情報が「文字列反転」でない場合には、後述するステップS1127の処理に進む一方、キーボード26の入力情報やマウス27の操作情報が「文字列反転」である場合には、反転部分のテキストデータをRAM22のワークエリアのバッファ領域に蓄積し(ステップS1126)、ステップS1127の処理に進む。このバッファ領域にはドラッグ元の座標もテキストデータと関連付けて記憶される。
【0115】
次いで、CPU21はキーボード26の入力情報やマウス27の操作情報が「ドラッグ&ドロップ操作」であるか否かを判別し(ステップS1127)、キーボード26の入力情報やマウス27の操作情報が「ドラッグ&ドロップ操作」でない場合には、ステップS634の処理に進む一方、キーボード26の入力情報やマウス27の操作情報が「ドラッグ&ドロップ操作」である場合には、矩形領域内のテキストデータをRAM22のワークエリアのバッファ領域に蓄積する。このバッファ領域にはドラッグ元の座標もテキストデータと関連付けて記憶される。
【0116】
次いで、CPU21はドラッグ元の座標とドラッグ先の座標とを検出し、ドラッグ先の座標に基づいて該当データの上書き入力先のフィールドを特定し(ステップS1128)、さらにドラッグ元の座標から、ドラッグ元が反転文字列であるか又は矩形領域内のどの文字列であるかを特定する(ステップS1129)。その後、RAM22のワークエリアのバッファ領域内の特定された文字列をステップS1128で特定された入力フィールドに上書き入力し(ステップS1130)、ステップS634の処理に進む。ステップS634の処理については、図3の説明で上述している。
【0117】
ステップS1134では、CPU21が書誌登録が終了した旨のメッセージを作業端末井120に送信する。
【0118】
本処理によれば、作業端末120の操作者が、特定の文字列を囲む矩形領域を指定し、又は特定の文字列を反転した後、所望の入力フィールドにドラッグ&ドロップすると、これらの行為がそのまま文書管理サーバ110内で自動的に実現されるので、簡単に書誌情報等の入力フィールドの文字列を更新することが可能となり、書誌情報等の入力工数を削減し、操作者の負担を軽減することが可能になる。
【0119】
上述したように、本実施の形態によれば、文書管理サーバ110は複合機140で読み取られた画像データのOCR処理を実行し、このOCR処理により得られたテキストデータから、一定のルールに基づいて書誌情報を抽出し、画像データ、テキストデータ及び抽出された書誌情報を作業端末120に送信し、これらの書誌情報抽出処理やデータ等の送信処理のバックグラウンドで並行してOCR処理を続行する一方、作業端末120は画面に画像データ、テキストデータ及び抽出された書誌情報を表示するので、文字認識処理以外の他の処理の待機時間を最小限に低減し、かつ書誌情報の入力の工数を低減することができ、作業効率の向上を図ることができる。
【0120】
本実施の形態では、文書管理サーバ110がOCR処理部を備えていたが、OCR処理部だけを独立した他のサーバ(OCRサーバ)として構成しても良い。このとき、OCR処理により認識されたテキストデータはOCRサーバから文書管理サーバに送信され、テキストDB118に記憶される。このようにOCRサーバを独立させることによって、文書管理サーバ110の負荷を軽減し処理速度を一層向上させることができる。
【0121】
また、本実施の形態では、書誌登録の処理の際に表示される作業端末120の画面例(図5)において、画像表示部1201、イメージ表示部1202、各種ボタン1203〜1208及び各種書誌情報の入力欄1209〜1215が1つのアプリケーションに含まれているが、図17に示すように、画像表示部1201、イメージ表示部1202及び各種ボタン1203〜1208が1つのアプリケーションに含まれるようにし、各種書誌情報の入力欄1209〜1215が別のアプリケーションに含まれるようにしてもよい。
【0122】
(第2の実施の形態)
第1の実施の形態では、文書管理サーバ110がOCR処理を実行したが、本実施の形態では複合機240がOCR処理を実行する点で異なる。
【0123】
図11は、本発明の第2の実施の形態に係る文書管理装置を適用可能な文書管理システムの構成を示すブロック図である。本発明の実施形態に係る文書管理装置は文書管理サーバ110に適用される。
【0124】
同図における文書管理サーバ210は、第1の実施の形態に係る文書管理管理サーバ110と異なり、OCR処理部112を備えていない一方で、テキスト登録部212を備えている。
【0125】
複合機240は、第1の実施の形態に係る複合機140の構成の他に、さらにOCR処理部244を備えている。OCR処理部112とOCR処理部244とは、機能は同一である。
【0126】
本実施の形態に係る作業端末120では、ブラウザソフト、Java(登録商標)Script、及びActiveXが組み合わされるか、又はクライアントのアプリケーションがインストールされ起動している。
【0127】
図11の文書管理システムと図2の文書管理システムの構成は、上述した構成の差異を除き、同一である。
【0128】
図12,13は図11における文書管理システムで実行される処理を示すフローチャートである。
【0129】
このフローチャートは、上述した図3,4のフローチャートと概ね同一なので、同一の処理を実行するステップは同一のステップ番号を付し、異なる点のみを説明する。
【0130】
ステップS943〜ステップS945の処理は複合機140の不図示のCPUの制御により実行され、ステップ923〜ステップS925及びステップS935の処理は文書管理サーバ210のCPUの制御により実行され、ステップS907の処理は作業端末120のCPUの制御により実行される。
【0131】
図12において、複合機140は、文書のスキャニングを実行し、画像データ記憶部147に画像データを記憶した後(ステップS642)、OCR処理を実行する(ステップS943)。このOCR処理は、上述した図6,7で説明した処理と同一であるが、実行するのは複合機140の制御部145である。
【0132】
OCR処理の終了後、複合機140は、スキャンされた画像データとOCR処理の認識結果であるテキストデータを文書管理サーバ210に送信し(ステップS944)、制御部145はOCR処理部244によりOCR処理が施されていないページが存在するか否かを判別する(ステップS945)。この判別の結果、OCR処理が施されていないページが存在する場合には、ステップS943に戻り、引き続きOCR処理を実行し、OCR処理が施されていないページが存在しない場合には、ステップS641の処理に進む。
【0133】
文書管理サーバ210では、CPU21は複合機からのスキャン画像の他、OCR処理の認識結果であるテキストデータの待ち状態になっている(ステップS923)、一定時間間隔で受信すべきスキャン画像及びテキストデータがあるか否かを判別し(ステップS924)、受信すべきスキャン画像及びテキストデータがない場合(ステップS924でNoの場合)には、ステップS923に戻って待機する。ステップ924の判別の結果、受信すべきスキャン画像及びテキストデータがある場合(ステップS924でYesの場合)、スキャン画像及びテキストデータを受信した後、画像管理部114により受信した画像データが画像DB117に登録され、テキスト登録部212により受信したテキストデータがテキストDB118に登録される(ステップS625)。
【0134】
ステップS634の判別の結果、登録ボタン1206が押下されていない場合には、イメージ表示部1202に表示されるテキストデータの情報が修正されたか、又は書誌情報の入力欄1209〜1215のいずれかの情報が修正された場合であるので、これらの修正を反映してRAM22のワークエリア内のテキストデータ及び書誌情報を更新し、この更新されたテキストデータ及び書誌情報を作業端末120に送信する(ステップS935)。
【0135】
作業端末120はステップS935の処理で文書管理サーバ110から受信したテキストデータ及び書誌情報を受信し(ステップS907)、ステップS604の処理を実行する。
【0136】
ステップS935において、更新されたテキストデータ及び書誌情報を作業端末120に送信するのは、作業端末120はブラウザソフト等を備えており、更新されたテキストデータ及び書誌情報のみで画面表示を更新できるからである。
【0137】
本実施の形態においても、図10に示す文書管理システムで実行される処理の一部の変形例を適用できる。この場合、ステップS630、ステップS1123〜ステップS1130及びステップS634の処理を作業端末120で実行し、作業端末120は文書管理サーバ210に最終的な編集後の登録情報を送信するように構成してもよい。
【0138】
上述したように、本実施の形態によれば、複合機240は読み取った画像データのOCR処理を実行し、文書管理サーバ210は複合機240から画像データ及びOCR処理により得られたテキストデータを受信し、このテキストデータから一定のルールに基づいて書誌情報を抽出し、画像データ、テキストデータ及び抽出された書誌情報を作業端末120に送信し、これらの書誌情報抽出処理やデータ等の送信処理のバックグラウンドで並行して複合機240がOCR処理を続行する一方、作業端末120は画面に画像データ、テキストデータ及び抽出された書誌情報を表示するので、文書管理サーバ210において、文字認識処理以外の他の処理の待機時間を最小限に低減し、かつ書誌情報の入力の工数を低減することができ、作業効率の向上を図ることができる。
【0139】
また、複合機240がOCR処理を実行して、文書管理サーバ210の負荷が軽減されるので、文書管理サーバ210の処理速度を一層向上させることができる。
【0140】
(第3の実施の形態)
第1の実施の形態では、文書管理サーバ110がOCR処理及び書誌抽出処理を実行したが、本実施の形態では作業端末320がOCR処理及び書誌抽出処理を実行する点で異なる。
【0141】
図14は、本発明の第3の実施の形態に係る文書管理装置を適用可能な文書管理システムの構成を示すブロック図である。本発明の実施形態に係る文書管理装置は文書管理サーバ110に適用される。
【0142】
同図における文書管理サーバ310の構成は、第1の実施の形態に係る文書管理管理サーバ110の構成と異なり、OCR処理部112、書誌抽出部113、抽出ルール記憶部115を備えていない一方で、テキスト登録部212を備えている。複合機140の構成は、第1の実施の形態と異なり、画像データ記憶部147を備えていない。作業端末320の構成は、第1の実施の形態に係る作業端末120の構成と異なり、OCR処理部324、書誌抽出部323、抽出ルール記憶部325及びテキストデータ記憶部328を備えている。
【0143】
本実施の形態に係る作業端末320では、ブラウザソフト、Java(登録商標)Script、及びActiveXが組み合わされるか、又はクライアントのアプリケーションがインストールされ起動している。
【0144】
図14の文書管理システムと図2の文書管理システムの構成は、上述した構成の差異を除き、同一である。
【0145】
図15,16は、図14における文書管理システムで実行される処理を示すフローチャートである。
【0146】
このフローチャートは、上述した図3,4のフローチャートと概ね同一なので、同一の処理を実行するステップは同一のステップ番号を付し、異なる点のみを説明する。
【0147】
ステップS1025〜ステップS1030の処理は文書管理サーバ310のCPUの制御により実行され、ステップS1003〜ステップS1013及びステップS1031〜ステップS1033の処理は作業端末320のCPUの制御により実行される。
【0148】
図15において、ステップS624で、文書管理サーバ310は、受信すべきスキャン画像があるか否かを判別し、受信すべきスキャン画像がある場合には、受信したスキャン画像に所定の管理番号を1つ採番する(ステップS1025)。この管理番号は、書誌DB116、画像DB117及びテキストDB118の検索キー又は検索キーの一部として使用され、これら3つのDBのデータの関連付けに使用される。
【0149】
その後、文書管理サーバ310は、画像データを作業端末320に転送する(ステップS1026)と共に当該画像データを画像DB117に登録し(ステップS1027)、ステップS623の処理に戻る。
【0150】
作業端末320は、ステップS1026で文書管理サーバ310から転送された画像データを受信し(ステップS1003)、OCR処理(ステップS1004)及び書誌候補抽出処理(ステップS1005)を実行する。これらのOCR処理(ステップS1004)及び書誌候補抽出処理(ステップS1005)は、第1の実施の形態において文書管理サーバ110が実行するOCR処理及び書誌候補抽出処理と同一である。
【0151】
次いで、作業端末320では図5に示すような画面が表示され、同図の画像表示部1201には画像データが表示され、イメージ表示部1202にはOCR処理によって認識されたテキストデータが表示され、さらに各種書誌情報の入力欄1209〜1215には書誌情報の候補が表示され、画面表示が更新される(ステップ1006)。
【0152】
次に、作業端末120は、キーボードの入力情報やマウスの操作情報を識別し(ステップ1007)、ステップS1008〜ステップS1011の処理を実行する。このステップS1008〜ステップS1011の処理は、図4のステップS630〜ステップ634の処理と同一であるので、その説明は省略する。
【0153】
ステップS1011において、登録ボタンが押下されていない場合には、図5におけるイメージ表示部1202に表示されるテキストデータの情報が修正されたか、又は書誌情報の入力欄1209〜1215のいずれかの情報が修正された場合であるので、これらの修正を反映してテキストデータを更新し(ステップS1012)、ステップS1006の処理に戻る。
【0154】
一方、ステップS1009の判別の結果、次文書ボタン1207が押下された場合には、作業端末320のCPUが現在処理している文書の次文書のOCR処理が終了しているか否かを判別し(ステップS1031)、この処理が終了している場合には、次文書の先頭ページの画像データと、これに対応するテキストデータと、書誌情報の候補とをRAM等から読み出し(ステップS1032)、ステップS1006の処理に進む。一方次文書のOCR処理が終了していない場合には、ステップS1004の処理に戻る。
【0155】
ステップS1010の判別の結果、図5に示す前ページボタン1204又は次ページボタン1205が押下された場合には、作業端末320のCPUは、押下されたボタンに応じて前ページ又は次ページの画像データと、これに対応するテキストデータと、書誌情報の候補とをRAM等から読み出し(ステップS1032)、ステップS1006の処理に進む。
【0156】
ステップS1011において、登録ボタンが押下された場合には、作業端末320のCPUは、テキストデータ及び書誌情報を文書管理サーバ310に送信し(ステップS1013)、ステップS1006の処理に戻る。
【0157】
文書管理サーバ310のCPUは、作業端末320から送信されたテキストデータ及び書誌情報を受信し(ステップS1028)、書誌情報は書誌DB116に登録し、テキストデータはテキストDB118に登録し(ステップS1029)、さらに、作業端末320からテキストデータ及び書誌情報を受信するまで待機する(ステップS1030)。
【0158】
上述したように、本実施の形態によれば、作業端末320が複合機140で読み取られた画像データのOCR処理を実行し、このOCR処理により得られたテキストデータから、一定のルールに基づいて書誌情報を抽出し、これらの書誌情報抽出処理のバックグラウンドで並行してOCR処理を続行する一方、画面に画像データ、テキストデータ及び抽出された書誌情報を表示するので、作業端末320において、文字認識処理以外の他の処理の待機時間を最小限に低減し、かつ書誌情報の入力の工数を低減することができ、作業効率の向上を図ることができる。文書管理サーバ310の負荷が軽減されるので、処理速度を一層向上させることができる。
【0159】
(第4の実施の形態)
本実施の形態は、図3における文書管理システムで実行される処理の一部が第1の実施の形態と異なり、その他は第1の実施の形態と同様であるので、異なる点のみ説明する。
【0160】
本実施形態では、前提として図3のステップS627の書誌候補抽出処理は実行されず、ステップS628で図20に示す画像及びテキスト情報が作業端末120に送信されているものとする。
【0161】
まず、図20を用いて作業端末120における画面の変化を説明する。
【0162】
図20の表示部1901には図3のステップS626で認識されたOCRテキストが表示され、イメージ表示部1902には、受信したスキャン画像に重ねてOCRテキストがHTML化されて透明レイヤーとして該スキャン画像の上側に表示されている。このHTMLは通常は透明な状態(不可視)であり、テキストの左右位置については元画像と一致しているが、テキストの上下位置は略1行分上(又は略1行分下)の位置に元画像とずれて配置されているが通常は透明で見えない状態になっており、下側のスキャン画像が表示されている。
【0163】
符号1903は現在表示されている文書の先頭ページを表示するためのボタンであり、符号1904は前ページを表示するためのボタンである。又符号1905には、現在表示されている文書の全体ページ数と表示ページが表示される。例えば「1/3」は、現在全体で3ページの文書の1ページ目のスキャン画像と対応するOCRテキストが表示されていることを意味する。符号1906は次文書を表示するためのボタンであり、ここには次文書のOCR作業の進捗が表示される。つまり、図3のステップS626乃至ステップS629におけるOCRの完了ページを表示する。例えば「4/4」は次文書が4ページであり、4ページ目までOCR作業が完了していることを意味する。この場合、画面の符号1906の表示は当初の「1/4」→「2/4」→「3/4」と変化し、最終的に「4/4」に至る。符号1907は次文書の次ページを表示するためのボタンであり、符号1908は次文書の最終ページを表示するためのボタンである。次文書が表示された状態でボタン1905を押下すれば直前に表示されていた現在の文書のスキャン画像とOCRテキストが再度表示される。登録ボタン1911が押下されると書誌登録処理が行われ、画面ではボタン1906の表示が表示1905に繰り上がる。つまり、「1/3」が「1/4」に変化する。ボタン1906には更に次の文書のページ数とOCR進捗が表示される。つまり新次文書(旧次々文書)が全部で5ページであり、3ページ目までOCRが完了していれば「次文書
3/5」と表示される。
【0164】
また、OCRテキストを表示する表示部1901の特定の文字部分、例えば「○△改正について(通達)」にカーソルを位置付けてマウスのボタンを押下すると、イメージ表示部1902の透明HTMLの対応する部分が反転表示される(反転部1919)。反転するのは1センテンス分で、1センテンスは前後の空白又は改行で判定される。
【0165】
このように次文書のOCR進捗を容易に確認できるので、現在作業中の文書での書誌登録作業から次文書の書誌登録作業にスムーズに移行することができる。反転部1919を件名の入力フィールド1912の位置までドラッグ&ドロップすると「○△改正について(通達)」が入力される。
【0166】
次に、図20で説明した画面の動きに対応する処理の詳細を図18,19のフローチャートで説明する。
【0167】
図18,19は、図3における文書管理システムで実行される処理の一部の変形例を示すフローチャートであるので、図3と異なる処理を示す。図3と同様の処理ステップは「ステップS066」で始まるステップで記述している。
【0168】
図18のステップS630及びステップS1821〜ステップS1835及びステップS635の処理は、文書管理サーバ110のCPU21の制御により実行され、ステップS604〜S607の処理は作業端末120のCPUの制御により実行される。
【0169】
作業端末120では、ブラウザソフト、Java(登録商標)Script、及びActiveXが組み合わされるか、又はクライアントのアプリケーションがインストールされ起動している。
【0170】
作業端末120は、図3のステップS605でキーボード26の入力情報やマウス27の操作情報を識別し、これらの操作情報を文書管理サーバ110に送信する(ステップ606)。これらの操作情報は、例えば「画面の特定位置でのマウスボタンの押下」「ドラッグ&ドロップ操作」、「反転表示部分への文字入力や削除」、及び各種ボタンの押下である。操作情報がドラッグ&ドロップである場合は、ドラッグされた文字列、ドラッグ開始の座標及びドロップ先の座標が操作情報に含まれている。また、反転表示部分への文字入力や削除の場合は、反転表示部分の位置座標と入力又は削除されたテキスト情報も操作情報に含まれる。
【0171】
文書管理サーバ110のCPU21は、ステップS606で作業端末120から送信されるキーボード26の入力情報やマウス27の操作情報に基づいて、作業端末120の画面において終了ボタン1920が押下されたか否かを判別する(ステップS630)。
【0172】
ステップS630の判別の結果、終了ボタン1920が押下された場合には、本処理を終了する。終了ボタンが押下されていない場合、処理はステップS1821に進む。
【0173】
ステップS1821では、ステップS606で作業端末120から送信される操作情報がマウスのボタンの押下であるか否かが判別され、押下されていない場合はステップS1830に進む。押下された場合はステップS1822に進み、ページボタンが押下されたか否かを検出する。ページボタンとは図20の符号1903乃至1908の各ボタンであり、ボタン1903,1904の直ぐ下の2つのボタンとボタン1907,1908の直ぐ上の2つのボタンも含む。
【0174】
ステップS1822でページボタンが押下された場合は、処理はステップS1823に進み、文書管理サーバ110の画像DB117とテキストDB118から、指定されたページの画像とOCR済みテキストデータが読み込まれ、ステップS635で画面情報が送信され、ステップS607で作業端末120が画面情報を受信し、ステップS604に図20に示すような画面が表示される。
【0175】
ステップS1822でページボタンが押下されない場合は、処理はステップS1824に進み、テキスト上にカーソルがある状態でマウスボタンが押下されたか否かを検出する。テキスト上とは、テキストが表示されている画面領域にカーソルがあることを言う。テキスト上での押下であることが検出された場合は、処理はステップS1825に進み、マウス位置にあるテキストのワンフレーズ分がRAM中に確保されたバッファにコピーされる。後述するドラッグ&ドロップのマウスボタンの押下の場合も同様に処理される。ここでのワンフレーズとは、空白又はタブで前後を挟まれた文字列を言う。次いで、処理はステップS1825に進み、該当テキストに対応する部分のHTMLの属性が透明から反転表示に変更されて、画面に表示される。一度反転した部分を再度押下しても反転表示は変わらない。ステップS635以下は図4と同様なので説明を省略する。
【0176】
ステップS1824でテキスト上の押下でなかった場合は、処理はステップS634に進み、登録ボタンが押下されたか否かが判定される。ここは図3と同様なので説明を省略する。登録ボタンが押下されなかった場合は、処理はステップS1829に進み、「テキスト更新」等の押下されたボタンに対応する処理が実行される。以上でマウスボタンが押下された場合の処理の説明を終わる。
【0177】
次に、ステップS1821でマウスボタンが押下されていない場合は、処理はステップS1830に進み、文字入力又は削除があったか否かが検出され、文字入力又は削除があった場合は、処理はステップS1831に進み、該当位置バッファ中のテキストが更新される。
【0178】
ステップS1830で文字入力又は削除がなかった場合は、処理はステップS1832に進み、ドラッグ&ドロップがあったか否かが検出される。すなわちマウスボタンが押下されたままマウスのポインタが移動した後マウスボタンが離されたか否かが検出される。ドラッグ&ドロップがあった場合は、処理はステップS1833に進み、マウスイベントの情報からドラッグ&ドロップの始点と終点が検出される。処理はステップS1834に進み、テキストの反転表示位置がドラック&ドロップされたかが検出され、テキストの反転表示位置がドラック&ドロップされた場合は、処理はステップS1835に進み、バッファ中のテキストがドロップ位置の入力フィールドに入力され、処理はステップ635に進み画面情報が送信される。
【0179】
ステップS1834で反転位置がドラッグされた場合は直ちにステップ635に進む。
【0180】
以上説明したように、本実施の形態によれば、簡単な操作で画面上のテキストを所望の入力フィールドへ入力できるため、書誌情報登録作業の効率を大幅に向上させることができる。すなわち、通常であれば、特定の文字の始点と終点をクリックとドラッグで反転表示させ、Ctrl+Cボタンを押し、入力フィールド位置にカーソルを移動してCtrl+Vを押すといった4動作を2動作で行うことができる。
【0181】
本発明は、上述した実施の形態の機能を実現するソフトウェアのプログラムをコンピュータ又は制御部(具体的にはCPU)に供給し、そのコンピュータ又はCPUが該供給されたプログラムを読出して実行することによっても本発明の目的が達成されることは云うまでもない。
【0182】
この場合、上記プログラムは、不図示の該プログラムを記録した記録媒体から直接、又はインターネット、商用ネットワーク、若しくはローカルエリアネットワーク等に接続される不図示の他のコンピュータやデータベース等からダウンロードすることにより供給される。
【0183】
また、上記プログラムは、上述した実施の形態の機能をコンピュータで実現することができればよく、その形態は、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給されるスクリプトデータ等の形態を有するものでもよい。
【0184】
更にまた、上述した実施の形態の機能を実現するソフトウェアのプログラムを記録した記録媒体をコンピュータに供給し、そのコンピュータが記録媒体に格納されたプログラムを読出し実行することによっても、本発明の目的が達成されることは云うまでもない。
【0185】
プログラムを供給する記録媒体としては、例えば、RAM、NV−RAM、フロッピー(登録商標)ディスク、光ディスク、光磁気ディスク、CD−ROM、MO、CD−R、CD−RW、DVD(DVD−ROM、DVD−RAM、DVD−RW、DVD+RW、DVD−R、DVD+R、ブルーレイディスク等)、磁気テープ、不揮発性のメモリカード、他のROM等の上記プログラムを記憶できるものであればよい。
【0186】
【発明の効果】
以上説明したように、請求項1記載の文書管理装置及び請求項9記載の文書管理用プログラムによれば、画像読取装置から受信した画像データに文字認識処理を施してテキストデータが生成され、該生成されたテキストデータと抽出ルールに基づいて書誌情報が抽出され、クライアント装置に送信されるので、クライアント装置の画面に画像データとテキストデータと抽出した書誌情報を表示でき、さらにバックグラウンドで別の画像データの文字認識処理が続行することができる。従って、文字認識処理以外の他の処理の待機時間を最小限に低減し、かつ書誌情報の入力の工数を低減することができ、作業効率の向上を図ることができる。
【0187】
請求項2記載の文書管理装置によれば、画像データ、テキストデータ及び書誌情報が関連付けられて記憶されるので、画像データとテキストデータと抽出した書誌情報をデータベースに登録することができ、これらのデータや情報を一括で呼び出すことができ、書誌情報の訂正作業にかかる時間を最小限に抑制することができる。
【0188】
請求項3記載の文書管理装置によれば、クライアント装置から受信した編集情報に基づいて書誌情報が更新されるので、簡単に書誌情報等の入力フィールドの文字列を更新することが可能となり、書誌情報等の入力工数を削減し、操作者の負担を軽減することが可能になる。
【0189】
請求項6記載の文書管理装置によれば、書誌情報の訂正作業が容易になるという効果を奏する。
【0190】
請求項7記載の文書管理システムによれば、文書管理装置における文字認識処理以外の他の処理の待機時間を最小限に低減し、かつ書誌情報の入力の工数を低減することができ、作業効率の向上を図ることができる。画像読取装置が文字認識処理を実行するので、文書管理装置の負荷が軽減され、文書管理装置の処理速度を一層向上させることができる。
【0191】
請求項8記載の文書管理システムによれば、クライアント装置において、文字認識処理以外の他の処理の待機時間を最小限に低減し、かつ書誌情報の入力の工数を低減することができ、作業効率の向上を図ることができる。文書管理装置の負荷が軽減されるので、文書管理装置の処理速度を一層向上させることができる。
【0192】
請求項9記載の文書管理システムによれば、簡単な操作で画面上のテキストを所望の入力フィールドへ入力できるため、書誌情報登録作業の効率を大幅に向上させることができる。すなわち、通常であれば、特定の文字の始点と終点をクリックとドラッグで反転表示させ、Ctrl+Cボタンを押し、入力フィールド位置にカーソルを移動してCtrl+Vを押すといった4動作を2動作で行うことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係る文書管理装置のハードウェア構成を示すブロック図である。
【図2】本発明の実施形態に係る文書管理装置を適用可能な文書管理システムの構成を示すブロック図である。
【図3】図2における文書管理システムで実行される処理を示すフローチャートである。
【図4】図2における文書管理システムで実行される処理を示すフローチャートである。
【図5】作業端末120の画面に、書誌登録の処理の際に表示されるアプリケーションの一例を示す図である。
【図6】OCR処理(図3のステップS626)を示すフローチャートである。
【図7】OCR処理(図3のステップS626)を示すフローチャートである。
【図8】書誌候補抽出処理(図3のステップS627)を示すフローチャートである。
【図9】書誌候補抽出処理(図3のステップS627)を示すフローチャートである。
【図10】図3における文書管理システムで実行される処理の一部の変形例を示すフローチャートである。
【図11】本発明の第2の実施の形態に係る文書管理装置を適用可能な文書管理システムの構成を示すブロック図である。
【図12】図11における文書管理システムで実行される処理を示すフローチャートである。
【図13】図11における文書管理システムで実行される処理を示すフローチャートである。
【図14】本発明の第3の実施の形態に係る文書管理装置を適用可能な文書管理システムの構成を示すブロック図である。
【図15】図14における文書管理システムで実行される処理を示すフローチャートである。
【図16】図14における文書管理システムで実行される処理を示すフローチャートである。
【図17】作業端末120の画面に、書誌登録の処理の際に表示されるアプリケーションの一例を示す図である。
【図18】図3における文書管理システムで実行される処理の一部の変形例を示すフローチャートである。
【図19】図3における文書管理システムで実行される処理の一部の変形例を示すフローチャートである。
【図20】作業端末120の画面に、書誌登録の処理の際に表示されるアプリケーションの一例を示す図である。
【符号の説明】
21 CPU
22 RAM
23 ROM
28 ハードディスク
110 文書管理サーバ
111 書誌登録部
112 OCR処理部
113 書誌抽出部
114 画像管理部
115 抽出ルール記憶部
116 書誌データベース(DB)
117 画像データベース(DB)
118 テキストデータベース(DB)
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a document management apparatus, a document management system, and a document management program capable of executing processing for extracting bibliographic items from text data based on certain rules.
[0002]
[Prior art]
2. Description of the Related Art Conventionally, in the business of registering electronically a document described on paper, a scanner that reads an image of the document described on paper, and OCR (optical character recognition) processing on the image data read by the scanner There is known a document management system including a computer that generates text data by executing and registers a bibliographic item input by a user in association with image data and text data.
[0003]
In Patent Document 1, a document written on paper is optically read, a character is recognized by OCR processing, a layout of a character area is recognized, a character size and a font type are further identified, and a title or figure is identified. Techniques for extracting captions and keywords are disclosed.
[0004]
Further, in Patent Document 2, in a system including a copying machine and a computer, after the index information (classification and keyword) is input by the copying machine, additional information and image data are transmitted to the computer (PC). A technique is disclosed in which these additional information and image data are converted into a data format for a database (DB), and the converted data is registered and managed in a database recorded inside a hard disk or the like.
[0005]
[Patent Document 1]
Japanese Patent Laid-Open No. 11-238072
[Patent Document 2]
JP 2002-290661 A
[0006]
[Problems to be solved by the invention]
However, in the conventional document management system described above, it is troublesome to manually input bibliographic information from a screen of a personal computer or the like while referring to image data and text data, and there is a problem that usability is lacking.
[0007]
In the technique of Patent Document 1, although automatic identification of titles can be performed to some extent, for example, if the title character size and font used are the same as the main text, identification may fail, and bibliographic information Of these, the document management information (document creation date, issuer, destination, etc.) usually appears only once, so there is a high possibility that keyword extraction in order of frequency is not possible.
[0008]
Furthermore, since the OCR process for a specific document as a whole takes a considerable amount of time, the person in charge of the document registration work needs to wait until the OCR process is completed after reading the document, resulting in a low actual operation rate. There is.
[0009]
According to the system of Patent Document 2, since image data is transmitted to a computer one by one after a keyword is input by a copying machine, it is easy to associate additional information with image data, but keyword input and image reading cannot be performed simultaneously. There is a problem. That is, there is a problem that the ratio of the time when the copying machine actually reads an image in the entire work time is low, and the work efficiency is poor.
[0010]
The present invention has been made to solve the above problems, and can reduce the waiting time for processes other than the character recognition process to a minimum, and can reduce the man-hours for inputting bibliographic information. An object is to provide a document management apparatus, a document management system, and a document management program capable of improving efficiency.
[0011]
[Means for Solving the Problems]
In order to achieve the above object, a document management apparatus according to claim 1 is an image reading apparatus that reads an image of a document and a document management that is connected to a client apparatus that displays image data of the read image via a communication line. In the apparatus, image storage means for storing image data received from the image reading apparatus, character recognition processing means for generating text data by performing character recognition processing on the image data stored in the image storage means, and the text Extraction rule storage means for storing extraction rules for extracting bibliographic information from data, extraction means for extracting bibliographic information based on the text data and the extraction rules, the image data, the text data, and the bibliographic information Transmitting means for transmitting to the client device.
[0012]
A document management apparatus according to a second aspect is the document management apparatus according to the first aspect, further comprising a document information storage unit that stores the image data, the text data, and the bibliographic information in association with each other.
[0013]
The document management device according to claim 3 is the document management device according to claim 1 or 2, wherein the document management device according to claim 1 or 2 is configured to receive editing information for the bibliographic information received from the client device, and based on the received editing information. Bibliographic information updating means for updating bibliographic information is provided.
[0014]
According to a fourth aspect of the present invention, there is provided the document management apparatus according to the third aspect, further comprising a text data updating unit that updates the text data based on the received editing information.
[0015]
The document management apparatus according to claim 5 is the document management apparatus according to claim 4, wherein the image data, the bibliographic information updated by the bibliographic information update unit, and the text data updated by the text data update unit are used. Display information generating means for generating display information to be displayed on the screen of the client device based on the information is provided.
[0016]
The document management device according to claim 6 is the document management device according to any one of claims 3 to 5, wherein the received editing information is displayed by highlighting text data selected by the client device. Information indicating whether or not a rectangular area including text data selected by the client device is specified, and text data that is displayed in reverse video or text data included in the specified rectangular area is predetermined. It is information indicating whether or not it has been dragged and dropped into the input field.
[0017]
The document management system according to claim 7, wherein an image reading device that reads an image of a document, a client device that displays image data of the read image, and the image reading device and the client device are connected via a communication line. In the document management system, the image reading device performs character recognition processing on the image data of the read image to generate text data, the image data, and the text Transmitting means for transmitting data to the document management apparatus, wherein the document management apparatus stores storage means for storing image data and text data received from the image reading apparatus, and extracts bibliographic information from the text data. The extraction rule storage means for storing the extraction rule, and the text data and the extraction rule Extracting means for extracting the bibliographic information Zui, the image data, and a sending means for sending the text data and the bibliography information to the client device.
[0018]
9. The document management system according to claim 8, wherein an image reading device that reads an image of a document, a client device that displays image data of the read image, and the image reading device and the client device are connected via a communication line. In the document management system including the document management device, the client device stores image data received from the image reading device, and performs character recognition processing on the image data stored in the image storage device. And character recognition processing means for generating text data, extraction rule storage means for storing extraction rules for extracting bibliographic information from the text data, and extracting bibliographic information based on the text data and the extraction rules Extraction means, and the client device with the image data, the text data and the document Characterized in that it comprises a display information generation means for displaying the information.
[0019]
9. The document management system according to claim 9, wherein the document management apparatus includes receiving means for receiving editing information for the bibliographic information received from the client apparatus, and the received editing is performed. The information includes information on whether or not the text data selected on the client device is highlighted, information on whether or not a rectangular area including the text data selected on the client device is specified, and is highlighted. The text data or the text data included in the designated rectangular area is information indicating whether or not the text data is dragged and dropped into a predetermined input field.
[0020]
11. A document management program according to claim 10, which is executed by a computer connected via a communication line to an image reading device that reads an image of a document and a client device that displays image data of the read image. An image storage module for storing image data received from the image reading device, a character recognition processing module for performing character recognition processing on the image data stored in the image storage means to generate text data, and the text data An extraction rule storage module for storing an extraction rule for extracting bibliographic information from the text, an extraction step for extracting bibliographic information based on the text data and the extraction rule, the image data, the text data, and the bibliographic information. Display information to be displayed on the client device Characterized in that it comprises a display information generating module to be formed.
[0021]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0022]
(First embodiment)
FIG. 1 is a block diagram showing a hardware configuration of a document management apparatus according to the first embodiment of the present invention.
[0023]
In the figure, a CPU 21 (transmission means, reception means, display information generation means), RAM 22, ROM 23, LAN adapter 24 (transmission means, reception means), video adapter 25, keyboard 26, mouse 27, hard disk 28, CD-ROM drive. 29 are connected to each other via a system bus 20. The system bus 20 is, for example, a PCI bus, an AGP bus, a memory bus, or the like. The document management server 110 includes a chip for connecting each bus, a keyboard interface, and an input / output interface such as a so-called SCSI or ATAPI, but these are omitted in FIG.
[0024]
The CPU 21 performs various operations such as four arithmetic operations and comparison operations, and controls hardware and software. The RAM 22 stores operation system programs, application programs, and the like read from a storage medium such as a CD-ROM or CD-R mounted in the hard disk 28 or the CD-ROM drive 29. These programs are stored in the CPU 21. It is executed by control. The ROM 23 stores a so-called BIOS that manages input / output to / from a hard disk or the like in cooperation with the operation system. The LAN adapter 24 communicates with an external device (not shown) via a network (not shown) in cooperation with a communication program included in an operation system controlled by the CPU 21. The video adapter 25 is connected to a display device (not shown), generates an image signal to be output to the display device, and the keyboard 26 and the mouse 27 are used to input instructions to the document management server 110.
[0025]
The hard disk 28 stores an operation system, application programs, various data such as an extraction rule storage unit 115 and a bibliography DB 116 described later, and various master files (not shown). The CD-ROM drive 29 is used to install an application program in the hard disk 28 by mounting a storage medium such as a CD-ROM, CD-R, or CD-R / W. It goes without saying that a CD-R drive, a CD-R / W drive, or an MO drive may be used instead of the CD-ROM drive.
[0026]
A work terminal 120 and a management terminal 130, which will be described later, also have the same hardware configuration as the document management apparatus in FIG.
[0027]
FIG. 2 is a block diagram showing a configuration of a document management system to which the document management apparatus according to the embodiment of the present invention can be applied. The document management apparatus according to the embodiment of the present invention is applied to the document management server 110.
[0028]
In FIG. 1, the document management system includes a communication line 100, a document management server 110, a work terminal 120, a management terminal 130, and a multifunction device 140.
[0029]
The work terminal 120 and the management terminal 130 are, for example, a personal computer, a so-called PDA (Personal Digital Assistant), an Internet-compatible mobile phone, or the like, as long as it can input characters and display images and characters.
[0030]
The communication line 100 is typically the Internet, a LAN (Local Area Network), a WAN (Wide Area Network), a telephone line, a dedicated digital line, an ATM (Asynchronous Transfer Mode), a frame relay line, a communication satellite line, and a cable TV line. Or a so-called communication network realized by any one of a wireless link for data broadcasting or a combination thereof, and any data transmission / reception is possible.
[0031]
The document management server 110 performs document registration processing and search processing using a predetermined OS (for example, including UNIX (registered trademark) and WINDOWS (registered trademark)) and application programs. The document management server 110 includes a bibliographic registration unit 111 (bibliographic information update unit), an OCR processing unit 112 (character recognition processing unit), a bibliographic extraction unit 113 (extraction unit), an image management unit 114, and an extraction tool storage unit 115 (extraction rule). Storage means), a bibliographic database (DB) 116 (document information storage means), an image database (DB) 117 (image storage means), and a text database (DB) 118.
[0032]
The image management unit 114 performs processing for storing image data received from the multi-function peripheral 140 via the communication line 100 in the image DB 117. The OCR processing unit 112 includes a program for executing character recognition processing and a recognition dictionary for image data stored in the image DB 117 that has not been subjected to OCR processing, and text data generated by the character recognition processing. Is stored in the text DB 118. The text DB is a database capable of full-text search, but a detailed description of the search is omitted.
[0033]
The bibliographic extraction unit 113 extracts bibliographic information based on text data and bibliographic information extraction rules stored in the extraction rule storage unit 115. The bibliographic information extraction rule stored in the extraction rule 115 will be described in detail with reference to FIGS.
[0034]
The bibliographic registration unit 111 updates the bibliographic information based on the editing information received from the work terminal 120. When the editing information instructing “registration” is received from the work terminal 120, the bibliographic information is registered in the bibliographic DB 116. . This bibliographic information is associated with corresponding image data in the image DB 117 and corresponding text data in the text DB 118. The document management server 110 also includes a search processing unit (not shown) that can search by linking the bibliographic DB 116, the image DB 117, and the text DB, but a detailed description thereof will be omitted.
[0035]
The bibliographic registration unit 111, the OCR processing unit 112, the bibliographic extraction unit 113, and the image management unit 114 are realized by the CPU 21 executing control based on a program stored in the hard disk 28. The bibliographic database (DB) 116, the image database (DB) 117 and text database (DB) 118 are constructed in hard disk 28.
[0036]
Next, the multifunction device 140 includes a scan engine (not shown) provided with an image sensor such as a CCD, an image data storage unit 147 that stores image data read by the scan engine, and stores the stored image data in the document management server 110. A printer (not shown) having a control unit 145 for transmitting and storing the transmitted history in the log data storage unit 146, a function for printing input PDL data, and a function for printing image data output from a scan engine The scan engine and the printer engine are configured to be able to communicate with each other. The log data storage unit 146 and the image data storage unit 147 are configured by a hard disk device included in the multifunction device 140.
[0037]
The multifunction device 140 includes a network controller (not shown) and a communication I / F, and is communicably connected to the document management server 110, the work terminal 120, and the management terminal 130 via the communication line 100.
[0038]
3 and 4 are flowcharts showing processing executed by the document management system in FIG.
[0039]
3 and 4, the processes in steps S601 to S607 are executed under the control of a CPU (not shown) of the work terminal 120, and the processes in steps S621 to S636 are executed under the control of the CPU 21 of the document management server 110. The processing in steps S641 to S643 is executed under the control of a CPU (not shown) of the multifunction device 140.
[0040]
Before the document management server 110 executes the process of step S621, the work terminal 120 has already executed an authentication request to the document management server 110, that is, transmitted a user ID or password, and the document management server 110 has Executing the authentication process, the work terminal 120 transmitting menu selection information to the document management server 110, and the document management server 110 generating screen information for the work terminal 120 based on the menu selection information are: Assume that it has finished. Further, it is assumed that a document to be scanned is already placed in the multifunction device 140.
[0041]
First, the document management server 110 transmits screen information for displaying a document registration screen on the work terminal 120 (step S621), and the display connected to the work terminal 120 displays a screen as shown in FIG. Step S601).
[0042]
FIG. 5 is a diagram illustrating an example of an application displayed on the screen of the work terminal 120 during the bibliographic registration process.
[0043]
In the figure, reference numeral 1200 denotes a scan button for inputting a scan instruction, reference numeral 1201 denotes an image display unit that displays image data to be subjected to OCR processing, and reference numeral 1202 is actually recognized by the OCR processing. An image display unit for displaying text data, reference numerals 1209 to 1215 are input fields for various bibliographic information, reference numeral 1203 is an update button for updating text data information or bibliographic information, and reference numeral 1204 is an image of the previous page A previous page button for requesting the document management server 110 for data, text data, and bibliographic candidates. Reference numeral 1205 indicates a next page button for requesting the document management server 110 for image data, text data, and bibliographic candidates for the next page. Reference numeral 1206 indicates that the bibliographic information is registered in the document management server 110. An order registration button, reference numeral 1207 is the next document button for requesting the image data of the first page of the next document, the text data and the bibliography candidates to the document management server 110, reference numeral 1208 is the end button.
[0044]
In FIG. 5, when the scan button 1200 is pressed, the work terminal 120 requests information to start scanning (scan request information) and work terminal specifying information for specifying the work terminal 120 that is the transmission source of the information (scan terminal information). For example, a user ID, a session ID, etc.) are transmitted to the document management server 110 (step S602).
[0045]
The document management server 110 transfers the scan request information and work terminal specifying information received from the work terminal 120 to the multi-function peripheral 140 and assigns one predetermined document number (step S622). The document number is a unique management number assigned to each document and is used as a search key or a part of the search key of the bibliographic DB 116, the image DB 117, and the text DB 118. Used for association.
[0046]
The multi-function device 140 receives the scan request information and work terminal identification information from the document management server 110 (step S641), executes document scanning (step S642), and stores the image data in the image data storage unit 147. The image data is assigned a unique image number for each page. For example, the image number is obtained by combining the reception time (14 digits) of the image scan request and the number of pages (lower 3 digits).
[0047]
The control unit 145 of the multifunction device 140 transmits the scanned image and the scan request source work terminal specifying information together to the document management server 110, and stores the name and transmission time of the transmitted image in the log data storage unit 146 (step S1). S643).
[0048]
If the transmission of the image data does not end normally in step S643, a retry is made after a lapse of a fixed time, and if the transmission does not end normally even after a predetermined number of retries, this is stored in the log data storage unit 146. You may comprise as follows.
[0049]
In the document management server 110, a process (step S623 to step S629) different from the above step S621 and step S622 is executed, and the CPU 21 is in a waiting state for a scan image from the multifunction peripheral (step S623). It is determined whether or not there are scan images to be received at regular time intervals (step S624). If there is no scan image to be received (No in step S624), the process returns to step S623 and waits. If it is determined in step 624 that there is a scan image to be received (Yes in step S624), the image data received by the image management unit 114 is registered in the image DB 117 after the scan image is received ( Step S625).
[0050]
Next, the OCR processing unit 112 performs OCR processing on the image data registered in the image DB 117 page by page, and the text recognized by the OCR processing is added from the RAM 22 to the text DB 118 (step 626). A flag is attached to the image data subjected to the OCR processing in the image DB 117. Details of the OCR processing will be described later.
[0051]
Next, the bibliographic extraction unit 113 extracts bibliographic information candidates from the recognized text data in the work area of the RAM 22 based on the extraction rules stored in the extraction rule storage unit 115 and stores them in the work area of the RAM 22. (Step 627). Details of the bibliographic candidate extraction process will also be described later.
[0052]
Thereafter, the CPU 21 transmits the received image data for one page, text data corresponding to the image data, and bibliographic information candidates extracted from the first page of the document from the work area of the RAM 22 to the work terminal 120. (Step 628).
[0053]
Next, the CPU 21 determines whether there is a page that is image data registered in the image DB 117 and has not been subjected to the OCR processing by the OCR processing unit 112 (step S629). Specifically, the CPU 21 detects the presence / absence of a flag in the image DB 117 that is updated during the OCR process. If the flag is present, the CPU 21 determines that there is a page that has not been subjected to the OCR process. It is determined that there is no page that has not been processed. Alternatively, the CPU 21 may execute the determination in step S629 by confirming whether text data corresponding to the image data exists in the text DB 118.
[0054]
As a result of the determination in step S629, if there is a page that has not been subjected to the OCR process, the process returns to the process in step S626, and the OCR process for the image data of the next page is executed. On the other hand, if there is no page that has not been subjected to OCR processing, the process returns to step S623, and the CPU 21 waits for reception of the next image data.
[0055]
Next, the work terminal 120 receives image data, text data, and bibliographic candidates transmitted from the document management server 110 in the process of step S628 (step S603). The work terminal 120 displays a screen as shown in FIG. 5, image data is displayed on the image display unit 1201, text data recognized by the OCR process is displayed on the image display unit 1202, and various types of data are displayed. Bibliographic information candidates are displayed in the bibliographic information input fields 1209 to 1215, and the screen display is updated (step 604).
[0056]
Next, the work terminal 120 identifies the input information of the keyboard 26 and the operation information of the mouse 27 (step 605), and transmits these information to the document management server 110 (step 606). When there is no input information or operation information, the work terminal 120 stands by until there is an input or operation.
[0057]
The CPU 21 of the document management server 110 receives the input information of the keyboard 26 and the operation information of the mouse 27 transmitted from the work terminal 120 in step S606, and the screen of the work terminal 120 based on the received input information and operation information. In step S630, it is determined whether or not the end button 1208 has been pressed.
[0058]
If it is determined in step S630 that the end button 1208 has been pressed, the process is terminated. If the end button 1208 has not been pressed, the keyboard 26 transmitted from the work terminal 120 in step S606 is displayed. Based on the input information and the operation information of the mouse 27, it is determined whether or not the next document button 1207 is pressed on the screen of the work terminal 120 (step S631).
[0059]
If the next document button 1207 is pressed as a result of the determination in step S631, it is determined whether or not the OCR processing and bibliographic candidate extraction processing for the next document of the document currently processed by the CPU 21 has been completed (step S631). S632) When these processes are completed, the process returns to the process of step S628, and the CPU 21 displays the image data of the first page of the next document, the corresponding text data, and the bibliographic information candidate as the work terminal. 120. On the other hand, if the process of step S632 has not ended, the process returns to step S626, and the CPU 21 performs the OCR process for the first page of the next document.
[0060]
If the next document button 1207 is not pressed as a result of the determination in step S631, the screen of the work terminal 120 is based on the input information of the keyboard 26 and the operation information of the mouse 27 transmitted from the work terminal 120 in step S606. In step S633, it is determined whether the previous page button 1204 or the next page button 1205 is pressed.
[0061]
If the previous page button 1204 or the next page button 1205 is pressed as a result of the determination in step S633, the process returns to step S628, and the image data of the previous page or the next page is determined according to the pressed button. Corresponding text data and bibliographic information candidates are transmitted to the work terminal 120.
[0062]
If the previous page button 1204 or the next page button 1205 is not pressed as a result of the determination in step S633, based on the input information of the keyboard 26 and the operation information of the mouse 27 transmitted from the work terminal 120 in step S606. It is determined whether or not the registration button 1206 has been pressed on the screen of the work terminal 120 (step S634).
[0063]
If the registration button 1206 is pressed as a result of the determination in step S634, the bibliographic information stored in the work area of the RAM 22 is transmitted to the hard disk 28, and the process returns to step S623. The document management server 110 updates the bibliography DB 116 after transmitting a message indicating that the registration process has been completed to the work terminal 120.
[0064]
On the other hand, if the result of determination in step S634 is that the registration button 1206 has not been pressed, the text data information displayed on the image display unit 1202 has been corrected, or one of the bibliographic information input fields 1209 to 1215. Therefore, the text data (text data updating means) or bibliographic information in the work area of the RAM 22 is updated to reflect these corrections, and screen information including the updated contents is generated. And transmitted to the work terminal 120 (step S635).
[0065]
The work terminal 120 receives the image information received from the document management server 110 in the process of step S635 (step S607), and executes the process of step S604.
[0066]
When the update button 1203 is pressed, the document management server 110 executes the process of step S635, and the work terminal 120 executes the process of step S607.
[0067]
According to this processing, bibliographic information is extracted by performing OCR processing on the original image data in units of one page, the original image data, text data, and the extracted bibliographic information are displayed on the screen of the work terminal 120, and the background Since the OCR work on the next page and after is continued, the waiting time for processes other than the character recognition process can be reduced to a minimum, and the man-hours for inputting bibliographic information can be reduced, improving work efficiency. Can be planned.
[0068]
The information requesting scanning in step S602 may be directly transmitted to a scanner or a multifunction peripheral having a scanner function. In this case, in step S643, information (user ID or the like) specifying the scanning request source is transmitted together with the scanned image.
[0069]
6 and 7 are flowcharts showing the OCR process (step S626 in FIG. 3).
[0070]
6 and 7, the processes in steps S701 to S724 are executed under the control of the CPU 21 of the document management server 110.
[0071]
First, based on the OCR target image data stored in the work area of the RAM 22, an analysis between character blocks and lines is executed (step S701). A “character block” is a character string that is sandwiched between blank lines at the top and bottom or between a predetermined number of spaces on the left and right. The reason for including the case where the left and right sides are sandwiched by more than a predetermined number of spaces is because, for example, the case where the creation date is on the right end of the line and the title is in the center of the line immediately below is assumed. . Between lines, the image data is scanned in the horizontal direction, and if the black ratio is less than a predetermined value (for example, 0.1) that is close to zero, it is a line space or a blank line, and a portion that exceeds the predetermined value is determined to be part of a character line. To do. Further, the position of the last character of the page is determined by character block analysis and line spacing analysis. The position of the last character is determined as the right end portion of the last line of the lower character block. The final character position will be described in detail later.
[0072]
Next, the entire image data is scanned in the horizontal direction, ruled line recognition is performed, and it is analyzed whether or not the image data matches a specific format (for example, the format of a document partition sheet) (step S702).
[0073]
As a result of the analysis in step S702, if the image data does not match the specific format, this process is terminated. If the image data matches the specific format, the character at the specific position corresponding to the format Are subject to character recognition processing. The ruled line information of a specific format is stored in a format table (not shown) (physically, the hard disk 28).
[0074]
Next, it is determined whether or not the last character flag in the work area of the RAM 22 is turned on (step S703). The final character flag is a flag that is turned on when the character recognition process for the last character of the image data to be subjected to OCR is completed.
[0075]
If the final character flag is ON as a result of the determination in step S703, it is determined whether or not the image data being processed at this time is a partition paper (step S705), and partitioning is performed according to the determination result. The identification data indicating whether or not there is is added to the text data of the OCR process (step S706), and this process ends.
[0076]
On the other hand, if the result of determination in step S703 is that the final character flag is not on, character range analysis is executed based on the result of line spacing analysis in step S701 (step S704). Since the character spacing in the vertical direction of the image data is found in the line spacing analysis in step S701, the character range is determined in step S704 using the character spacing in the vertical direction or a half value as an initial value for character range analysis. The character range is determined by identifying a blank portion between characters and determining the range of each character.
[0077]
Next, the ratios of blacks in the determined range for one character are tabulated (step S707), and it is determined whether or not the ratio values of the tabulated blacks exceed a predetermined value (for example, 0.005). (Step S708). If the black ratio is equal to or less than the predetermined value, the black ratio for the predetermined number of characters before and after is determined, and together with the determination of the character block range in step S701, whether or not the character determined this time is at the beginning or end of the line. Determination is made (step S709).
[0078]
Next, it is determined whether or not the current character is a space (step S710). If the current character is a space, one space is added to the output text data (step S711), which will be described later. The process proceeds to step S723. On the other hand, if the current character is not a space, it is determined whether or not the current character is any symbol such as “.”, “,”, “•” (step S712). Is a symbol, one symbol is added to the text data to be output (step S713), and the process proceeds to step S723 described later. On the other hand, if the current character is not a symbol, the process proceeds to step S723 described later. Proceed to processing.
[0079]
As a result of the determination in step S708, if the ratio of black is greater than a predetermined value, the image data for one character and the character data in the dictionary are matched or not matched (step S714). .
[0080]
Next, it is determined whether or not the dictionary collation in step S714 is completed (step S715). If the dictionary collation is not completed, the image data for one character and the characters in the dictionary are based on the collation result in step S714. The coincidence rate of each pixel of data is determined (step S716). The dictionary character data is stored in the hard disk 28.
[0081]
Next, it is determined whether or not the coincidence rate determined in step S716 exceeds a predetermined value A (for example, 0.8) (step S717). Is selected from the dictionary, paired with the matching rate of the character, and added to the candidate array in the work area of the RAM 22 (step S718), and the process returns to step S714 to check with the next character in the dictionary. Do.
[0082]
On the other hand, as a result of the determination in step S717, if the coincidence rate is equal to or less than the predetermined value A, the process of step S718 is skipped and the process returns to step S714.
[0083]
When the dictionary collation in step S715 is completed, the image data for one character is compared with the matching rate of each character in the candidate sequence (step S719), and the text data of the character with the maximum matching rate is output text. It is added to the data (step S720).
[0084]
Next, it is determined whether or not the maximum value of the matching rate exceeds a predetermined value (for example, 0.9) (step S721). If the maximum value of the matching rate is equal to or less than the predetermined value, the warning flag is turned on and output. A predetermined special character is output to the text data (step S722). With the special character, when the screen is displayed (step S604 in FIG. 4), the text immediately before the special character is displayed in another color (for example, blue) other than the normal color (for example, black).
[0085]
By processing in this way, it becomes possible to change and display the color of a suspicious part whether or not the character is accurately identified, so that it is possible to efficiently perform manual confirmation and correction work of OCR processing.
[0086]
Next, it is determined whether or not the character identified this time is the last character in the image data for one page (step S723). If the character identified this time is the last character in the image data for one page, the RAM 22 The last character flag data in the work area is turned on (1 is substituted) (step S724), and the process returns to step S703. As a result of the determination in step S723, if the character identified this time is not the last character in the image data for one page, the process immediately returns to step S703.
[0087]
As described above, since the OCR processing of FIGS. 6 and 7 also determines symbols such as spaces and punctuation marks in image data and outputs text data corresponding to the image data, character recognition whose layout matches that of the original image data is performed. Processing becomes possible.
[0088]
8 and 9 are flowcharts showing the bibliographic candidate extraction process (step S627 in FIG. 3).
[0089]
8 and 9 are executed under the control of the CPU 21 of the document management server 110.
[0090]
In this processing, it is assumed that bibliographic information is on the first page of the document.
[0091]
First, it is determined whether or not the page from which bibliographic information is to be extracted is the first page of the document (step S821). If the page from which the bibliographic information is to be extracted is not the first page of the document, the process ends. On the other hand, if the page from which the bibliographic information is to be extracted is the first page of the document, the process is extracted by the OCR process. One character block of the text data is read (step S822). Here, the “character block” refers to a series of character data having a predetermined number or more (for example, two or more) spaces or the first character at the beginning or end of a line.
[0092]
Next, the read character block is collated with the candidate dictionary stored in the extraction rule storage unit 115 (step S823), the head of the character block is an era such as “Heisei”, and the end is “day”. Further, it is determined whether or not the position of the character block is on the right side of the center of the page (step S824). If all these conditions are satisfied (YES in step S824), the text data of the character block is overwritten in the “issue date” entry field of the bibliographic information (step S825), and the process proceeds to step S836.
[0093]
In step S836, it is determined whether or not the character block currently being read is the last block of the first page (whether or not another character block exists on the right side or the lower side of the character block). If the character block is the last block, this process is terminated. On the other hand, if the character block currently being read is not the final block, the process returns to step S822 to read the next character block.
[0094]
On the other hand, as a result of the determination in step S824, if any one of the conditions is not satisfied (NO in step S824), whether the head of the character block is the organization name and whether the end is “dono” or not. Is determined (step S826).
[0095]
As a result of the determination in step S826, if all the conditions are satisfied (YES in step S826), the text data of the character block is overwritten in the input field of “destination department” of the bibliographic information (step S827), The process proceeds to step S836.
[0096]
As a result of the determination in step S826, if any one of the conditions is not satisfied (NO in step S826), the beginning of the character block is the organization name or the end of the character block is a government office, and the character It is determined whether or not the block position is on the right side of the center of the page (step S828).
[0097]
If all the conditions are satisfied as a result of the determination in step S828 (YES in step S828), the text data of the character block is overwritten in the “document creator” input field of the bibliographic information (step S829), The process proceeds to step S836.
[0098]
As a result of the determination in step S828, if any one of the conditions is not satisfied (NO in step S828), the beginning of the character block is a document name or an era name, and the end of the character block is It is determined whether it is “No.” and the position of the character block is on the right side of the center of the page (step S830).
[0099]
If all the conditions are satisfied as a result of the determination in step S830 (YES in step S830), the text data of the character block is overwritten in the “document number” input field of the bibliographic information (step S831). The process proceeds to S836.
[0100]
As a result of the determination in step S830, if any one of the conditions is not satisfied (NO in step S830), whether the character at the end of the character block is “case”, “notice”, “ It is determined whether it is “notification” or “about” (step S832).
[0101]
If all the conditions are satisfied as a result of the determination in step S832 (YES in step S832), the text data of the character block is overwritten in the “acquired document name” input field of the bibliographic information (step S833). Then, the attribute of the input field is changed to “overwrite prohibited”, and the process proceeds to step S834.
[0102]
As a result of the determination in step S832, if any one of the conditions is not satisfied (NO in step S832), the process proceeds to step S836.
[0103]
Next, using the receipt document name overwritten in step S833 as a key, data on the managing section, the person in charge, the document classification, and the storage deadline are extracted from the management table stored in the extraction rule storage unit 115 (step S834). These data are overwritten in the entry field of bibliographic information, and immediately after this overwriting, the attribute of these data is changed to prohibit overwriting (step S835), and the process proceeds to step S836.
[0104]
In Steps S833 and S834, the attribute is set to “overwrite prohibited” because, when another document name exists in the text of the document, “acquired document name” and data related to the received document name This is to prevent a situation where the data is overwritten.
[0105]
Although it is out of the scope of the processing of this flowchart, after the bibliographic candidate extraction processing is completed, the operator of the work terminal 120 moves the cursor to these input fields and performs manual input correction. Of course, it is possible.
[0106]
According to this processing, bibliographic information candidates are extracted from the text data of the first page of the document and input to the input field based on detailed extraction rules, so that the input manpower of bibliographic information can be minimized.
[0107]
FIG. 10 is a flowchart showing a modification of part of the processing executed in the document management system in FIG. 3, and therefore shows processing different from FIG.
[0108]
10 are performed under the control of the CPU 21 of the document management server 110, and the processes of steps S606 and S607 are performed under the control of the CPU of the work terminal 120.
[0109]
In the work terminal 120, browser software, Java (registered trademark) Script, and ActiveX are combined, or a client application is installed and activated.
[0110]
The work terminal 120 identifies the input information of the keyboard 26 and the operation information of the mouse 27 in step S605 of FIG. 3, and transmits these information to the document management server 110 (step 606). Such information includes, for example, “drag and drop operation”, “character string inversion operation”, “character input to a specific input field”, “designation of a rectangular area”, and pressing of various buttons. When the operation information is drag and drop, the dragged character string, the drag start coordinates, and the drop destination coordinates are included in the operation information. When a rectangular area is specified, text information in the rectangular area is also included in the operation information.
[0111]
The CPU 21 of the document management server 110 determines whether or not the end button 1208 is pressed on the screen of the work terminal 120 based on the input information of the keyboard 26 and the operation information of the mouse 27 transmitted from the work terminal 120 in step S606. (Step S630).
[0112]
If it is determined in step S630 that the end button 1208 has been pressed, the process is terminated. If the end button 1208 has not been pressed, the keyboard 26 transmitted from the work terminal 120 in step S606 is displayed. It is determined whether the input information and the operation information of the mouse 27 are “designation of a rectangular area” (step S1123).
[0113]
If it is determined in step S1123 that the input information on the keyboard 26 and the operation information on the mouse 27 are “designation of a rectangular area”, the CPU 21 stores the text data in the rectangular area in the buffer area of the work area of the RAM 22. (Step S1124) On the other hand, if the input information on the keyboard 26 or the operation information on the mouse 27 is not “designation of a rectangular area”, the process proceeds to Step S1125 described later.
[0114]
Next, the CPU 21 determines whether the input information of the keyboard 26 and the operation information of the mouse 27 are “character string inversion” (step S1125), and the input information of the keyboard 26 and the operation information of the mouse 27 are “character string”. If it is not “inverted”, the process proceeds to step S1127 described later. On the other hand, if the input information on the keyboard 26 and the operation information on the mouse 27 are “character inverted”, the text data of the inverted part is stored in the work area of the RAM 22. (Step S1126), and the process proceeds to step S1127. In this buffer area, the coordinates of the drag source are also stored in association with the text data.
[0115]
Next, the CPU 21 determines whether or not the input information of the keyboard 26 and the operation information of the mouse 27 are “drag and drop operations” (step S1127), and the input information of the keyboard 26 and the operation information of the mouse 27 are “drag and drop”. If it is not “drop operation”, the process proceeds to step S634. On the other hand, if the input information of the keyboard 26 or the operation information of the mouse 27 is “drag and drop operation”, the text data in the rectangular area is stored in the work of the RAM 22. Accumulate in the buffer area of the area. In this buffer area, the coordinates of the drag source are also stored in association with the text data.
[0116]
Next, the CPU 21 detects the coordinates of the drag source and the coordinates of the drag destination, specifies the overwriting input destination field of the corresponding data based on the coordinates of the drag destination (step S1128), and further determines the drag source from the coordinates of the drag source. Is an inverted character string or which character string in the rectangular area is specified (step S1129). Thereafter, the character string specified in the buffer area of the work area of the RAM 22 is overwritten in the input field specified in step S1128 (step S1130), and the process proceeds to step S634. The processing in step S634 has been described above with reference to FIG.
[0117]
In step S1134, the CPU 21 transmits a message indicating that the bibliographic registration is completed to the work terminal well 120.
[0118]
According to this processing, when the operator of the work terminal 120 designates a rectangular area surrounding a specific character string or inverts the specific character string and then drags and drops it to a desired input field, these actions are performed. Since it is automatically realized in the document management server 110 as it is, it is possible to easily update the character string of the input field such as bibliographic information, reducing the man-hours for inputting the bibliographic information and the like, and reducing the burden on the operator. It becomes possible to do.
[0119]
As described above, according to the present embodiment, the document management server 110 executes OCR processing of image data read by the multi-function peripheral 140, and based on text data obtained by this OCR processing, based on certain rules. The bibliographic information is extracted, the image data, the text data, and the extracted bibliographic information are transmitted to the work terminal 120, and the OCR process is continued in parallel in the background of the bibliographic information extraction process and the data transmission process. On the other hand, since the work terminal 120 displays image data, text data, and extracted bibliographic information on the screen, the waiting time for processes other than the character recognition process can be reduced to a minimum, and manpower for inputting bibliographic information can be reduced. It is possible to reduce the operating efficiency.
[0120]
In the present embodiment, the document management server 110 includes the OCR processing unit. However, only the OCR processing unit may be configured as another independent server (OCR server). At this time, the text data recognized by the OCR process is transmitted from the OCR server to the document management server and stored in the text DB 118. By making the OCR server independent in this way, it is possible to reduce the load on the document management server 110 and further improve the processing speed.
[0121]
In this embodiment, in the screen example of the work terminal 120 displayed during the bibliographic registration process (FIG. 5), the image display unit 1201, the image display unit 1202, various buttons 1203 to 1208, and various bibliographic information items are displayed. Although input fields 1209 to 1215 are included in one application, as shown in FIG. 17, an image display unit 1201, an image display unit 1202, and various buttons 1203 to 1208 are included in one application, and various bibliographies are included. Information input fields 1209 to 1215 may be included in another application.
[0122]
(Second Embodiment)
In the first embodiment, the document management server 110 executes the OCR process. However, the present embodiment is different in that the MFP 240 executes the OCR process.
[0123]
FIG. 11 is a block diagram showing a configuration of a document management system to which the document management apparatus according to the second embodiment of the present invention can be applied. The document management apparatus according to the embodiment of the present invention is applied to the document management server 110.
[0124]
Unlike the document management management server 110 according to the first embodiment, the document management server 210 in the figure does not include the OCR processing unit 112 but includes a text registration unit 212.
[0125]
The multifunction device 240 further includes an OCR processing unit 244 in addition to the configuration of the multifunction device 140 according to the first embodiment. The functions of the OCR processing unit 112 and the OCR processing unit 244 are the same.
[0126]
In the work terminal 120 according to the present embodiment, browser software, Java (registered trademark) Script, and ActiveX are combined, or a client application is installed and activated.
[0127]
The configuration of the document management system in FIG. 11 and the configuration of the document management system in FIG. 2 are the same except for the difference in configuration described above.
[0128]
12 and 13 are flowcharts showing processing executed by the document management system in FIG.
[0129]
Since this flowchart is substantially the same as the flowcharts of FIGS. 3 and 4 described above, steps for executing the same processing are given the same step numbers, and only different points will be described.
[0130]
The processing of step S943 to step S945 is executed under the control of a CPU (not shown) of the multifunction device 140, the processing of step 923 to step S925 and step S935 is executed under the control of the CPU of the document management server 210, and the processing of step S907 is performed. It is executed under the control of the CPU of the work terminal 120.
[0131]
In FIG. 12, the MFP 140 scans a document, stores image data in the image data storage unit 147 (step S642), and then executes an OCR process (step S943). The OCR process is the same as the process described with reference to FIGS. 6 and 7 described above, but is executed by the control unit 145 of the multi-function device 140.
[0132]
After completion of the OCR processing, the multifunction device 140 transmits the scanned image data and text data that is the recognition result of the OCR processing to the document management server 210 (step S944), and the control unit 145 causes the OCR processing unit 244 to perform the OCR processing. It is determined whether or not there is a page that has not been subjected to (step S945). As a result of the determination, if there is a page that has not been subjected to the OCR process, the process returns to step S943 to continue the OCR process. If there is no page that has not been subjected to the OCR process, the process proceeds to step S641. Proceed to processing.
[0133]
In the document management server 210, the CPU 21 waits for text data as a recognition result of the OCR process in addition to the scanned image from the multifunction peripheral (step S923). The scanned image and text data to be received at regular time intervals. If there is no scan image and text data to be received (No in step S924), the process returns to step S923 and waits. If it is determined in step 924 that there is a scanned image and text data to be received (Yes in step S924), the scanned image and text data are received, and then the image data received by the image management unit 114 is stored in the image DB 117. The text data registered and received by the text registration unit 212 is registered in the text DB 118 (step S625).
[0134]
If the registration button 1206 has not been pressed as a result of the determination in step S634, the text data information displayed on the image display unit 1202 has been corrected, or information in any of the bibliographic information input fields 1209 to 1215 Therefore, the text data and bibliographic information in the work area of the RAM 22 are updated to reflect these corrections, and the updated text data and bibliographic information are transmitted to the work terminal 120 (step S935). ).
[0135]
The work terminal 120 receives the text data and bibliographic information received from the document management server 110 in the process of step S935 (step S907), and executes the process of step S604.
[0136]
In step S935, the updated text data and bibliographic information are transmitted to the work terminal 120 because the work terminal 120 includes browser software and the like, and the screen display can be updated only with the updated text data and bibliographic information. It is.
[0137]
Also in the present embodiment, some modifications of the processing executed in the document management system shown in FIG. 10 can be applied. In this case, the processing of step S630, step S1123 to step S1130, and step S634 may be executed by the work terminal 120, and the work terminal 120 may be configured to transmit the final edited registration information to the document management server 210. Good.
[0138]
As described above, according to the present embodiment, the MFP 240 performs OCR processing on the read image data, and the document management server 210 receives image data and text data obtained by OCR processing from the MFP 240. The bibliographic information is extracted from the text data based on a certain rule, and the image data, the text data, and the extracted bibliographic information are transmitted to the work terminal 120. While the multifunction device 240 continues the OCR process in parallel in the background, the work terminal 120 displays image data, text data, and extracted bibliographic information on the screen. Therefore, the document management server 210 performs processing other than character recognition processing. Work efficiency can be reduced by minimizing waiting time for other processing and reducing bibliographic information input. It can be improved.
[0139]
Further, since the multifunction device 240 executes the OCR process and the load on the document management server 210 is reduced, the processing speed of the document management server 210 can be further improved.
[0140]
(Third embodiment)
In the first embodiment, the document management server 110 executes the OCR process and the bibliographic extraction process. However, the present embodiment is different in that the work terminal 320 executes the OCR process and the bibliographic extraction process.
[0141]
FIG. 14 is a block diagram showing a configuration of a document management system to which the document management apparatus according to the third embodiment of the present invention can be applied. The document management apparatus according to the embodiment of the present invention is applied to the document management server 110.
[0142]
Unlike the configuration of the document management management server 110 according to the first embodiment, the configuration of the document management server 310 in the figure does not include the OCR processing unit 112, the bibliographic extraction unit 113, and the extraction rule storage unit 115. , A text registration unit 212 is provided. Unlike the first embodiment, the configuration of the multi-function device 140 does not include the image data storage unit 147. The configuration of the work terminal 320 is different from the configuration of the work terminal 120 according to the first embodiment, and includes an OCR processing unit 324, a bibliographic extraction unit 323, an extraction rule storage unit 325, and a text data storage unit 328.
[0143]
In the work terminal 320 according to the present embodiment, browser software, Java (registered trademark) Script, and ActiveX are combined, or a client application is installed and activated.
[0144]
The configuration of the document management system in FIG. 14 and the configuration of the document management system in FIG. 2 are the same except for the difference in configuration described above.
[0145]
15 and 16 are flowcharts showing processing executed by the document management system in FIG.
[0146]
Since this flowchart is substantially the same as the flowcharts of FIGS. 3 and 4 described above, steps for executing the same processing are given the same step numbers, and only different points will be described.
[0147]
Steps S1025 to S1030 are executed under the control of the CPU of the document management server 310, and steps S1003 to S1013 and steps S1031 to S1033 are executed under the control of the CPU of the work terminal 320.
[0148]
In FIG. 15, in step S624, the document management server 310 determines whether there is a scanned image to be received. If there is a scanned image to be received, the document management server 310 assigns a predetermined management number to the received scanned image. Numbering is performed (step S1025). This management number is used as a search key or a part of the search key of the bibliographic DB 116, the image DB 117, and the text DB 118, and is used for associating data of these three DBs.
[0149]
Thereafter, the document management server 310 transfers the image data to the work terminal 320 (step S1026), registers the image data in the image DB 117 (step S1027), and returns to the process of step S623.
[0150]
The work terminal 320 receives the image data transferred from the document management server 310 in step S1026 (step S1003), and executes OCR processing (step S1004) and bibliographic candidate extraction processing (step S1005). These OCR processing (step S1004) and bibliographic candidate extraction processing (step S1005) are the same as the OCR processing and bibliographic candidate extraction processing executed by the document management server 110 in the first embodiment.
[0151]
Next, a screen as shown in FIG. 5 is displayed on the work terminal 320, image data is displayed on the image display unit 1201, and text data recognized by the OCR process is displayed on the image display unit 1202. Further, bibliographic information candidates are displayed in various bibliographic information input fields 1209 to 1215, and the screen display is updated (step 1006).
[0152]
Next, the work terminal 120 identifies keyboard input information and mouse operation information (step 1007), and executes the processing of steps S1008 to S1011. Since the processing from step S1008 to step S1011 is the same as the processing from step S630 to step 634 in FIG. 4, the description thereof is omitted.
[0153]
In step S1011, if the registration button has not been pressed, the text data information displayed on the image display unit 1202 in FIG. 5 has been corrected, or any information in the bibliographic information input fields 1209 to 1215 is displayed. Since it is a case where it corrects, text data is updated reflecting these corrections (step S1012), and it returns to the process of step S1006.
[0154]
On the other hand, if the next document button 1207 is pressed as a result of the determination in step S1009, the CPU of the work terminal 320 determines whether or not the OCR processing of the next document of the document currently being processed has been completed ( Step S1031) If this processing is completed, the image data of the first page of the next document, the text data corresponding thereto, and bibliographic information candidates are read out from the RAM or the like (Step S1032), and Step S1006 is performed. Proceed to the process. On the other hand, if the OCR process for the next document has not been completed, the process returns to step S1004.
[0155]
If the previous page button 1204 or the next page button 1205 shown in FIG. 5 is pressed as a result of the determination in step S1010, the CPU of the work terminal 320 displays the image data of the previous page or the next page according to the pressed button. Then, corresponding text data and bibliographic information candidates are read from the RAM or the like (step S1032), and the process proceeds to step S1006.
[0156]
If the registration button is pressed in step S1011, the CPU of the work terminal 320 transmits text data and bibliographic information to the document management server 310 (step S1013), and the process returns to step S1006.
[0157]
The CPU of the document management server 310 receives the text data and bibliographic information transmitted from the work terminal 320 (step S1028), registers the bibliographic information in the bibliographic DB 116, and registers the text data in the text DB 118 (step S1029). Furthermore, it waits until it receives text data and bibliographic information from the work terminal 320 (step S1030).
[0158]
As described above, according to the present embodiment, the work terminal 320 executes the OCR process on the image data read by the multi-function device 140, and the text data obtained by the OCR process is based on a certain rule. Bibliographic information is extracted, and while OCR processing is continued in parallel in the background of these bibliographic information extraction processing, image data, text data, and extracted bibliographic information are displayed on the screen. The waiting time for processes other than the recognition process can be reduced to a minimum, the man-hours for inputting bibliographic information can be reduced, and work efficiency can be improved. Since the load on the document management server 310 is reduced, the processing speed can be further improved.
[0159]
(Fourth embodiment)
In the present embodiment, part of the processing executed in the document management system in FIG. 3 is different from that of the first embodiment, and the others are the same as those of the first embodiment, so only different points will be described.
[0160]
In the present embodiment, it is assumed that the bibliographic candidate extraction process in step S627 in FIG. 3 is not executed and the image and text information shown in FIG. 20 is transmitted to the work terminal 120 in step S628.
[0161]
First, changes in the screen on the work terminal 120 will be described with reference to FIG.
[0162]
The OCR text recognized in step S626 in FIG. 3 is displayed on the display unit 1901 in FIG. 20, and the OCR text is converted into HTML by superimposing the received scan image on the received scan image, and the scan image as a transparent layer. It is displayed on the upper side. This HTML is normally transparent (invisible), and the left and right positions of the text match the original image, but the top and bottom positions of the text are approximately one line above (or approximately one line below). Although it is shifted from the original image, it is normally transparent and invisible, and the lower scan image is displayed.
[0163]
Reference numeral 1903 is a button for displaying the first page of the currently displayed document, and reference numeral 1904 is a button for displaying the previous page. Reference numeral 1905 displays the total number of pages and the display page of the currently displayed document. For example, “1/3” means that the OCR text corresponding to the scanned image of the first page of the three-page document as a whole is currently displayed. Reference numeral 1906 denotes a button for displaying the next document, which displays the progress of the OCR work for the next document. That is, the OCR completion page in steps S626 to S629 in FIG. 3 is displayed. For example, “4/4” means that the next document has four pages, and the OCR work has been completed up to the fourth page. In this case, the display of the reference numeral 1906 on the screen changes from “1/4” → “2/4” → “3/4” at the beginning, and finally reaches “4/4”. Reference numeral 1907 is a button for displaying the next page of the next document, and reference numeral 1908 is a button for displaying the last page of the next document. If the button 1905 is pressed while the next document is displayed, the scan image and the OCR text of the current document displayed immediately before are displayed again. When the registration button 1911 is pressed, bibliographic registration processing is performed, and the display of the button 1906 is moved up to the display 1905 on the screen. That is, “1/3” changes to “1/4”. A button 1906 further displays the number of pages of the next document and the OCR progress. In other words, if the new document (old document one after another) is 5 pages in total and the OCR is completed up to the 3rd page, “Next document”
3/5 "is displayed.
[0164]
Further, when the cursor is positioned on a specific character portion of the display unit 1901 for displaying the OCR text, for example, “Regarding Revision (Notification)” and the mouse button is pressed, the corresponding portion of the transparent HTML of the image display unit 1902 is displayed. Inverted display is performed (reversing unit 1919). Inversion is performed for one sentence, and one sentence is determined by a preceding or following space or line feed.
[0165]
As described above, since the OCR progress of the next document can be easily confirmed, it is possible to smoothly shift from the bibliographic registration work for the current document to the bibliographic registration work for the next document. When the reversing unit 1919 is dragged and dropped to the position of the subject input field 1912, “○ △ Revision (Notification)” is input.
[0166]
Next, details of processing corresponding to the screen movement described with reference to FIG. 20 will be described with reference to flowcharts of FIGS.
[0167]
18 and 19 are flowcharts showing a modification of part of the processing executed in the document management system in FIG. 3, and thus show processing different from FIG. The processing steps similar to those in FIG. 3 are described in steps starting with “step S066”.
[0168]
18 are executed under the control of the CPU 21 of the document management server 110, and the processes of steps S604 to S607 are executed under the control of the CPU of the work terminal 120.
[0169]
In the work terminal 120, browser software, Java (registered trademark) Script, and ActiveX are combined, or a client application is installed and activated.
[0170]
The work terminal 120 identifies the input information of the keyboard 26 and the operation information of the mouse 27 in step S605 of FIG. 3, and transmits these operation information to the document management server 110 (step 606). These pieces of operation information include, for example, “pressing a mouse button at a specific position on the screen”, “drag and drop operation”, “character input / deletion to a highlighted part”, and pressing various buttons. When the operation information is drag and drop, the dragged character string, the drag start coordinates, and the drop destination coordinates are included in the operation information. In addition, in the case of character input or deletion in the reverse display portion, the position coordinates of the reverse display portion and the text information input or deleted are also included in the operation information.
[0171]
The CPU 21 of the document management server 110 determines whether or not the end button 1920 is pressed on the screen of the work terminal 120 based on the input information of the keyboard 26 and the operation information of the mouse 27 transmitted from the work terminal 120 in step S606. (Step S630).
[0172]
If the result of determination in step S630 is that the end button 1920 has been pressed, this processing ends. If the end button has not been pressed, the process proceeds to step S1821.
[0173]
In step S1821, it is determined whether or not the operation information transmitted from the work terminal 120 in step S606 is a press of a mouse button. If not, the process proceeds to step S1830. If it has been pressed, the process advances to step S1822 to detect whether the page button has been pressed. The page buttons are buttons 1903 to 1908 in FIG. 20, and include two buttons just below buttons 1903 and 1904 and two buttons just above buttons 1907 and 1908.
[0174]
If the page button is pressed in step S1822, the process advances to step S1823, and the image of the specified page and the OCR-completed text data are read from the image DB 117 and the text DB 118 of the document management server 110, and the screen is displayed in step S635. The information is transmitted, the work terminal 120 receives the screen information in step S607, and a screen as shown in FIG. 20 is displayed in step S604.
[0175]
If the page button is not pressed in step S1822, the process advances to step S1824 to detect whether the mouse button is pressed with the cursor on the text. On the text means that the cursor is in the screen area where the text is displayed. If it is detected that the text has been pressed, the process advances to step S1825, and one phrase of the text at the mouse position is copied to a buffer secured in the RAM. The same processing is performed when a mouse button for drag and drop described later is pressed. The one phrase here refers to a character string that is sandwiched between blanks or tabs. Next, the process proceeds to step S1825, where the HTML attribute of the portion corresponding to the text is changed from transparent to reverse display and displayed on the screen. Even if the part once reversed is pressed again, the reverse display does not change. Since step S635 and subsequent steps are the same as those in FIG.
[0176]
If the text is not pressed in step S1824, the process advances to step S634 to determine whether the registration button has been pressed. Since this is the same as FIG. 3, the description thereof is omitted. If the registration button has not been pressed, the process advances to step S1829 to execute a process corresponding to the pressed button, such as “update text”. This is the end of the description of the processing when the mouse button is pressed.
[0177]
Next, when the mouse button is not pressed in step S1821, the process proceeds to step S1830, where it is detected whether or not a character is input or deleted. If there is a character input or deletion, the process proceeds to step S1831. The text in the corresponding position buffer is updated.
[0178]
If there is no character input or deletion in step S1830, the process proceeds to step S1832, and it is detected whether there has been a drag and drop. That is, it is detected whether or not the mouse button has been released after the mouse pointer has been moved with the mouse button pressed. If there is a drag and drop, the process advances to step S1833, and the start and end points of the drag and drop are detected from the mouse event information. The process proceeds to step S1834, where it is detected whether the reversed display position of the text has been dragged and dropped. If the reversed display position of the text has been dragged and dropped, the process proceeds to step S1835, where the text in the buffer is at the drop position. Input is made in the input field, the process proceeds to step 635, and the screen information is transmitted.
[0179]
If the reverse position is dragged in step S1834, the process immediately proceeds to step 635.
[0180]
As described above, according to the present embodiment, text on the screen can be input to a desired input field with a simple operation, so that the efficiency of bibliographic information registration work can be greatly improved. In other words, normally, four operations such as clicking and dragging the start point and end point of a specific character, highlighting the Ctrl + C button, moving the cursor to the input field position, and pressing Ctrl + V can be performed in two operations. it can.
[0181]
The present invention supplies a software program that realizes the functions of the above-described embodiments to a computer or a control unit (specifically, a CPU), and the computer or CPU reads and executes the supplied program. It goes without saying that the object of the present invention is achieved.
[0182]
In this case, the program is supplied by downloading directly from a recording medium recording the program (not shown) or from another computer or database (not shown) connected to the Internet, a commercial network, a local area network, or the like. Is done.
[0183]
The above-described program only needs to be able to realize the functions of the above-described embodiments by a computer, and the form includes forms such as object code, a program executed by an interpreter, and script data supplied to the OS. But you can.
[0184]
Furthermore, the object of the present invention can also be achieved by supplying a computer with a recording medium that records a software program that implements the functions of the above-described embodiments, and reading and executing the program stored in the recording medium. Needless to say, this is achieved.
[0185]
As a recording medium for supplying the program, for example, RAM, NV-RAM, floppy (registered trademark) disk, optical disk, magneto-optical disk, CD-ROM, MO, CD-R, CD-RW, DVD (DVD-ROM, (DVD-RAM, DVD-RW, DVD + RW, DVD-R, DVD + R, Blu-ray Disc, etc.), magnetic tape, nonvolatile memory card, other ROM, etc., as long as they can store the above programs.
[0186]
【The invention's effect】
As described above, according to the document management device according to claim 1 and the document management program according to claim 9, text data is generated by performing character recognition processing on the image data received from the image reading device, Bibliographic information is extracted based on the generated text data and extraction rules and sent to the client device, so that the image data, text data, and extracted bibliographic information can be displayed on the screen of the client device. The character recognition processing of the image data can be continued. Therefore, the waiting time for processes other than the character recognition process can be reduced to a minimum, the man-hours for inputting bibliographic information can be reduced, and work efficiency can be improved.
[0187]
According to the document management device of claim 2, since image data, text data, and bibliographic information are stored in association with each other, image data, text data, and extracted bibliographic information can be registered in the database. Data and information can be recalled in a batch, and the time required for bibliographic information correction can be minimized.
[0188]
According to the document management apparatus of claim 3, since the bibliographic information is updated based on the editing information received from the client apparatus, it is possible to easily update the character string of the input field such as the bibliographic information. It is possible to reduce the man-hours for inputting information and the like and reduce the burden on the operator.
[0189]
According to the document management apparatus of the sixth aspect, the bibliographic information can be easily corrected.
[0190]
According to the document management system of claim 7, the waiting time of processing other than the character recognition processing in the document management apparatus can be reduced to the minimum, and the man-hours for inputting bibliographic information can be reduced. Can be improved. Since the image reading apparatus executes the character recognition process, the load on the document management apparatus is reduced, and the processing speed of the document management apparatus can be further improved.
[0191]
According to the document management system according to claim 8, in the client device, it is possible to reduce the waiting time for processing other than the character recognition processing to a minimum, and to reduce the man-hours for inputting bibliographic information, thereby improving work efficiency. Can be improved. Since the load on the document management apparatus is reduced, the processing speed of the document management apparatus can be further improved.
[0192]
According to the document management system of the ninth aspect, since the text on the screen can be input to a desired input field with a simple operation, the efficiency of the bibliographic information registration work can be greatly improved. In other words, normally, four operations such as clicking and dragging the start point and end point of a specific character, highlighting the Ctrl + C button, moving the cursor to the input field position, and pressing Ctrl + V can be performed in two operations. it can.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a hardware configuration of a document management apparatus according to a first embodiment of the present invention.
FIG. 2 is a block diagram showing a configuration of a document management system to which a document management apparatus according to an embodiment of the present invention can be applied.
FIG. 3 is a flowchart showing processing executed by the document management system in FIG. 2;
4 is a flowchart showing processing executed by the document management system in FIG. 2. FIG.
FIG. 5 is a diagram showing an example of an application displayed on the screen of the work terminal 120 during the bibliographic registration process.
FIG. 6 is a flowchart showing an OCR process (step S626 in FIG. 3).
FIG. 7 is a flowchart showing an OCR process (step S626 in FIG. 3).
FIG. 8 is a flowchart showing a bibliographic candidate extraction process (step S627 in FIG. 3).
FIG. 9 is a flowchart showing a bibliographic candidate extraction process (step S627 in FIG. 3).
10 is a flowchart showing a modification of part of the processing executed in the document management system in FIG. 3; FIG.
FIG. 11 is a block diagram showing a configuration of a document management system to which a document management apparatus according to a second embodiment of the present invention can be applied.
12 is a flowchart showing processing executed by the document management system in FIG. 11. FIG.
13 is a flowchart showing processing executed in the document management system in FIG. 11. FIG.
FIG. 14 is a block diagram showing a configuration of a document management system to which a document management apparatus according to a third embodiment of the present invention can be applied.
15 is a flowchart showing processing executed by the document management system in FIG.
16 is a flowchart showing processing executed by the document management system in FIG.
FIG. 17 is a diagram illustrating an example of an application displayed on the screen of the work terminal 120 in the bibliographic registration process.
18 is a flowchart showing a modification of part of the processing executed in the document management system in FIG. 3. FIG.
FIG. 19 is a flowchart showing a modification of part of the processing executed by the document management system in FIG. 3;
FIG. 20 is a diagram showing an example of an application displayed on the screen of the work terminal 120 during the bibliographic registration process.
[Explanation of symbols]
21 CPU
22 RAM
23 ROM
28 hard disk
110 Document management server
111 Bibliographic Registration Department
112 OCR processing unit
113 Bibliographic Extraction Department
114 Image management unit
115 Extraction rule storage unit
116 Bibliographic Database (DB)
117 Image database (DB)
118 Text Database (DB)

Claims (10)

原稿の画像を読み取る画像読取装置及び該読み取られた画像の画像データを表示するクライアント装置と通信回線を介して接続される文書管理装置において、
前記画像読取装置から受信した画像データを記憶する画像記憶手段と、
前記画像記憶手段に記憶された画像データに文字認識処理を施してテキストデータを生成する文字認識処理手段と、
前記テキストデータから書誌情報を抽出するための抽出ルールを記憶する抽出ルール記憶手段と、
前記テキストデータと前記抽出ルールに基づいて書誌情報を抽出する抽出手段と、
前記画像データ、前記テキストデータ及び前記書誌情報を前記クライアント装置に送信する送信手段と
を備えることを特徴とする文書管理装置。
In an image reading apparatus for reading an image of a document and a document management apparatus connected via a communication line to a client apparatus for displaying image data of the read image,
Image storage means for storing image data received from the image reading device;
Character recognition processing means for generating text data by performing character recognition processing on the image data stored in the image storage means;
Extraction rule storage means for storing extraction rules for extracting bibliographic information from the text data;
Extraction means for extracting bibliographic information based on the text data and the extraction rule;
A document management apparatus comprising: transmission means for transmitting the image data, the text data, and the bibliographic information to the client apparatus.
前記画像データ、前記テキストデータ及び前記書誌情報を関連付けて記憶する文書情報記憶手段を備えることを特徴とする請求項1記載の文書管理装置。2. The document management apparatus according to claim 1, further comprising document information storage means for storing the image data, the text data, and the bibliographic information in association with each other. 前記クライアント装置から受信した前記書誌情報に対する編集情報を受信する受信手段と、該受信した編集情報に基づいて該書誌情報を更新する書誌情報更新手段とを備えることを特徴とする請求項1又は2記載の文書管理装置。3. A receiving unit that receives editing information on the bibliographic information received from the client device, and a bibliographic information updating unit that updates the bibliographic information based on the received editing information. The document management apparatus described. 前記受信した編集情報に基づいて前記テキストデータを更新するテキストデータ更新手段とを備えることを特徴とする請求項3記載の文書管理装置。4. The document management apparatus according to claim 3, further comprising text data updating means for updating the text data based on the received editing information. 前記画像データ、前記書誌情報更新手段により更新された書誌情報及び前記テキストデータ更新手段により更新されたテキストデータに基づいて前記クライアント装置の画面に表示させるための表示情報を生成する表示情報生成手段を備えることを特徴とする請求項4記載の文書管理装置。Display information generation means for generating display information to be displayed on the screen of the client device based on the image data, the bibliographic information updated by the bibliographic information update means, and the text data updated by the text data update means; The document management apparatus according to claim 4, further comprising: 前記受信した編集情報は、前記クライアント装置で選択されたテキストデータが反転表示されているか否かの情報、前記クライアント装置で選択されたテキストデータを含む矩形領域が指定されているか否かの情報、及び反転表示されたテキストデータ又は指定された矩形領域に含まれるテキストデータが所定の入力フィールドにドラッグ&ドロップされたか否かを示す情報であることを特徴とする請求項3乃至5のいずれか1項記載の文書管理装置。The received editing information includes information on whether or not the text data selected on the client device is highlighted, information on whether or not a rectangular area including the text data selected on the client device is designated, 6. The information indicating whether or not the text data displayed in reverse video or the text data included in the designated rectangular area is dragged and dropped to a predetermined input field. Document management device described in the section. 原稿の画像を読み取る画像読取装置と、該読み取られた画像の画像データを表示するクライアント装置と、前記画像読取装置及び前記クライアント装置と通信回線を介して接続される文書管理装置とを備える文書管理システムにおいて、
前記画像読取装置は、
前記読み取った画像の画像データに文字認識処理を施してテキストデータを生成する文字認識処理手段と、
前記画像データ及び前記テキストデータを前記文書管理装置に送信する送信手段と
を備え、
前記文書管理装置は、
前記画像読取装置から受信した画像データ及びテキストデータを記憶する記憶手段と、
前記テキストデータから書誌情報を抽出するための抽出ルールを記憶する抽出ルール記憶手段と、
前記テキストデータと前記抽出ルールに基づいて書誌情報を抽出する抽出手段と、
前記画像データ、前記テキストデータ及び前記書誌情報を前記クライアント装置に送信する送信手段と
を備えることを特徴とする文書管理システム。
Document management comprising an image reading device for reading an image of a document, a client device for displaying image data of the read image, and a document management device connected to the image reading device and the client device via a communication line In the system,
The image reading device includes:
Character recognition processing means for generating text data by performing character recognition processing on the image data of the read image;
Transmission means for transmitting the image data and the text data to the document management device,
The document management apparatus includes:
Storage means for storing image data and text data received from the image reading device;
Extraction rule storage means for storing extraction rules for extracting bibliographic information from the text data;
Extraction means for extracting bibliographic information based on the text data and the extraction rule;
A document management system comprising: transmission means for transmitting the image data, the text data, and the bibliographic information to the client device.
原稿の画像を読み取る画像読取装置と、該読み取られた画像の画像データを表示するクライアント装置と、前記画像読取装置及び前記クライアント装置と通信回線を介して接続される文書管理装置とを備える文書管理システムにおいて、
前記クライアント装置は、
前記画像読取装置から受信した画像データを記憶する画像記憶手段と、
前記画像記憶手段に記憶された画像データに文字認識処理を施してテキストデータを生成する文字認識処理手段と、
前記テキストデータから書誌情報を抽出するための抽出ルールを記憶する抽出ルール記憶手段と、
前記テキストデータと前記抽出ルールに基づいて書誌情報を抽出する抽出手段と、
前記画像データ、前記テキストデータ及びクライアント装置で前記書誌情報を表示するための表示情報を生成する表示情報生成手段と
を備えることを特徴とする文書管理システム。
Document management comprising an image reading device for reading an image of a document, a client device for displaying image data of the read image, and a document management device connected to the image reading device and the client device via a communication line In the system,
The client device is
Image storage means for storing image data received from the image reading device;
Character recognition processing means for generating text data by performing character recognition processing on the image data stored in the image storage means;
Extraction rule storage means for storing extraction rules for extracting bibliographic information from the text data;
Extraction means for extracting bibliographic information based on the text data and the extraction rule;
A document management system comprising: the image data, the text data, and display information generating means for generating display information for displaying the bibliographic information on the client device.
前記文書管理装置は、前記クライアント装置から受信した前記書誌情報に対する編集情報を受信する受信手段を備え、前記受信した編集情報は、前記クライアント装置で選択されたテキストデータが反転表示されているか否かの情報、前記クライアント装置で選択されたテキストデータを含む矩形領域が指定されているか否かの情報、及び反転表示されたテキストデータ又は指定された矩形領域に含まれるテキストデータが所定の入力フィールドにドラッグ&ドロップされたか否かを示す情報であることを特徴とする請求項8記載の文書管理システム。The document management apparatus includes a receiving unit that receives editing information for the bibliographic information received from the client apparatus, and the received editing information indicates whether text data selected by the client apparatus is highlighted. Information indicating whether or not a rectangular area including text data selected by the client device is designated, and text data displayed in reverse video or text data included in the designated rectangular area is input to a predetermined input field. 9. The document management system according to claim 8, wherein the document management system is information indicating whether or not dragging and dropping has been performed. 原稿の画像を読み取る画像読取装置及び該読み取られた画像の画像データを表示するクライアント装置と通信回線を介して接続されるコンピュータに実行させる文書管理用プログラムにおいて、
前記画像読取装置から受信した画像データを記憶する画像記憶モジュールと、
前記画像記憶手段に記憶された画像データに文字認識処理を施してテキストデータを生成する文字認識処理モジュールと、
前記テキストデータから書誌情報を抽出するための抽出ルールを記憶する抽出ルール記憶モジュールと、
前記テキストデータと前記抽出ルールに基づいて書誌情報を抽出する抽出ステップと、
前記画像データ、前記テキストデータ及び前記書誌情報を前記クライアント装置に表示させるための表示情報を生成する表示情報生成モジュールと
を備えることを特徴とする文書管理用プログラム。
In a document management program that is executed by a computer connected via a communication line to an image reading device that reads an image of a document and a client device that displays image data of the read image,
An image storage module for storing image data received from the image reading device;
A character recognition processing module for generating text data by performing character recognition processing on the image data stored in the image storage means;
An extraction rule storage module for storing extraction rules for extracting bibliographic information from the text data;
An extraction step of extracting bibliographic information based on the text data and the extraction rule;
A document management program, comprising: a display information generation module that generates display information for causing the client device to display the image data, the text data, and the bibliographic information.
JP2003177211A 2003-06-20 2003-06-20 Document management device, document management system and program for document management Pending JP2005011260A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003177211A JP2005011260A (en) 2003-06-20 2003-06-20 Document management device, document management system and program for document management

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003177211A JP2005011260A (en) 2003-06-20 2003-06-20 Document management device, document management system and program for document management

Publications (1)

Publication Number Publication Date
JP2005011260A true JP2005011260A (en) 2005-01-13

Family

ID=34099865

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003177211A Pending JP2005011260A (en) 2003-06-20 2003-06-20 Document management device, document management system and program for document management

Country Status (1)

Country Link
JP (1) JP2005011260A (en)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007184748A (en) * 2006-01-06 2007-07-19 Murata Mach Ltd Image processing system
JP2010109653A (en) * 2008-10-30 2010-05-13 Kyocera Mita Corp Image reader, image forming apparatus, image reading method, and image reading program
JP2010191611A (en) * 2009-02-17 2010-09-02 Ricoh Co Ltd Image processor, image processing system, image processing method, program and storage medium
WO2010109594A1 (en) * 2009-03-24 2010-09-30 三菱電機インフォメーションシステムズ株式会社 Document search device, document search system, document search program, and document search method
JP2011223348A (en) * 2010-04-09 2011-11-04 Murata Mach Ltd Image processing apparatus, output device, and program
JP2015212907A (en) * 2014-05-07 2015-11-26 株式会社リコー Output system, terminal device, program and output method
JP2016019063A (en) * 2014-07-04 2016-02-01 キヤノン株式会社 Image reader, program, image processing method, and image processing system
JP2016165059A (en) * 2015-03-06 2016-09-08 シャープ株式会社 Image processor
US9471841B2 (en) 2014-05-01 2016-10-18 Konica Minolta, Inc. Electronic document generation system, image forming apparatus and program
JP2018072985A (en) * 2016-10-26 2018-05-10 富士通株式会社 Image scan system, image scanner, information acquisition method and information acquisition program
CN109271616A (en) * 2017-07-17 2019-01-25 江苏省质量和标准化研究院 A kind of intelligent extract method based on normative document questions record characteristic value
JP2019079554A (en) * 2019-01-04 2019-05-23 富士通株式会社 Image scan system, image scanner, information acquisition method and information acquisition program
CN110097040A (en) * 2018-01-31 2019-08-06 精工爱普生株式会社 Image processing apparatus and storage medium

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007184748A (en) * 2006-01-06 2007-07-19 Murata Mach Ltd Image processing system
JP2010109653A (en) * 2008-10-30 2010-05-13 Kyocera Mita Corp Image reader, image forming apparatus, image reading method, and image reading program
JP2010191611A (en) * 2009-02-17 2010-09-02 Ricoh Co Ltd Image processor, image processing system, image processing method, program and storage medium
WO2010109594A1 (en) * 2009-03-24 2010-09-30 三菱電機インフォメーションシステムズ株式会社 Document search device, document search system, document search program, and document search method
JPWO2010109594A1 (en) * 2009-03-24 2012-09-20 三菱電機インフォメーションシステムズ株式会社 Document search device, document search system, document search program, and document search method
JP2011223348A (en) * 2010-04-09 2011-11-04 Murata Mach Ltd Image processing apparatus, output device, and program
US9471841B2 (en) 2014-05-01 2016-10-18 Konica Minolta, Inc. Electronic document generation system, image forming apparatus and program
JP2015212907A (en) * 2014-05-07 2015-11-26 株式会社リコー Output system, terminal device, program and output method
JP2016019063A (en) * 2014-07-04 2016-02-01 キヤノン株式会社 Image reader, program, image processing method, and image processing system
JP2016165059A (en) * 2015-03-06 2016-09-08 シャープ株式会社 Image processor
JP2018072985A (en) * 2016-10-26 2018-05-10 富士通株式会社 Image scan system, image scanner, information acquisition method and information acquisition program
CN109271616A (en) * 2017-07-17 2019-01-25 江苏省质量和标准化研究院 A kind of intelligent extract method based on normative document questions record characteristic value
CN109271616B (en) * 2017-07-17 2022-09-16 江苏省质量和标准化研究院 Intelligent extraction method based on bibliographic characteristic value of standard literature
CN110097040A (en) * 2018-01-31 2019-08-06 精工爱普生株式会社 Image processing apparatus and storage medium
CN110097040B (en) * 2018-01-31 2023-07-04 精工爱普生株式会社 Image processing apparatus and storage medium
JP2019079554A (en) * 2019-01-04 2019-05-23 富士通株式会社 Image scan system, image scanner, information acquisition method and information acquisition program

Similar Documents

Publication Publication Date Title
US9060085B2 (en) Image forming apparatus, electronic mail delivery server, and information processing apparatus
CN101178725B (en) Device and method for information retrieval
US7552381B2 (en) Check boxes for identifying and processing stored documents
JP4920928B2 (en) Image processing apparatus, control method therefor, and program
US8422796B2 (en) Image processing device
JP2008250666A (en) Image processor and control method for image processor
JP2009533749A (en) Device XHTML-Print data generation method and apparatus
JP4237215B2 (en) Image reading system, server device, image reading device, and terminal device
JP2005011260A (en) Document management device, document management system and program for document management
EP3541057B1 (en) Scan apparatus and scan result display program
CN102694940B (en) Information processor and control method thereof
CN103377277A (en) Document management apparatus and document management method
JP4968293B2 (en) Document processing apparatus, document processing method, and program
JP2007166202A (en) Information processor, control method thereof, and program
US20090150359A1 (en) Document processing apparatus and search method
JP4315252B2 (en) Information processing apparatus, information processing apparatus control method, and program
JP5049586B2 (en) Data entry apparatus, control method therefor, program, and data entry system
JP5747344B2 (en) Document management system, document management server, control method therefor, and program
JP4281719B2 (en) File processing apparatus, file processing method, and file processing program
CN108881665B (en) Information processing apparatus, information processing method, and computer program
JP4264568B2 (en) Information processing apparatus, control method for information processing apparatus, and program
CN100588218C (en) Image forming apparatus and electronic mail delivery server,
US20220309816A1 (en) Image processing apparatus that extracts necessary character string from source image, and image forming apparatus including same
JP5573998B2 (en) Management system, management apparatus, control method thereof, and program
US11206336B2 (en) Information processing apparatus, method, and non-transitory computer readable medium

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060417

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060612

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090421

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090622

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091222