JP2004213091A - 文書画像検索装置及びその方法、文書画像検索システム、プログラム - Google Patents

文書画像検索装置及びその方法、文書画像検索システム、プログラム Download PDF

Info

Publication number
JP2004213091A
JP2004213091A JP2002378481A JP2002378481A JP2004213091A JP 2004213091 A JP2004213091 A JP 2004213091A JP 2002378481 A JP2002378481 A JP 2002378481A JP 2002378481 A JP2002378481 A JP 2002378481A JP 2004213091 A JP2004213091 A JP 2004213091A
Authority
JP
Japan
Prior art keywords
search
document image
character
character string
ocr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002378481A
Other languages
English (en)
Other versions
JP4208566B2 (ja
Inventor
Yukihiro Yoshii
幸宏 吉井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Canon Marketing Japan Inc
Original Assignee
Canon Inc
Canon Marketing Japan Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc, Canon Marketing Japan Inc filed Critical Canon Inc
Priority to JP2002378481A priority Critical patent/JP4208566B2/ja
Publication of JP2004213091A publication Critical patent/JP2004213091A/ja
Application granted granted Critical
Publication of JP4208566B2 publication Critical patent/JP4208566B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

【課題】所望のOCR結果を効率的に検索することができ、かつそのOCR結果に対応する文書画像中の所望の文字画像を容易に視認することができる文書画像検索装置及びその方法、文書画像検索システム、プログラムを提供する。
【解決手段】OCRサーバ300は、入力された検索条件を構成する第1検索文字列による検索を実行する。次に、その検索結果に基づいて、該第1検索文字列の一部をワイルドカードに置き換えた第2検索文字列による再検索を実行する。そして、検索あるいは再検索されたOCR結果と対応する文書画像の対比表示画像を生成する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、文書画像のOCR結果を管理し、入力された検索条件に基づいて該検索条件に合致するOCR結果を検索する文書画像検索装置及びその方法、文書画像検索システム、プログラムに関するものである。
【0002】
【従来の技術】
文書の電子データ化として、従来より文書画像を入力して、その文書画像に対してOCR(Optical Character Recognition:光学的文字認識)を行う技術が知られている。また、この応用技術として、OCR対象の文書画像と、そのOCR結果として得られるOCR結果(文字コードデータ)を対応づけて管理し、そのOCR結果を利用して対応する文書画像を検索する文書管理装置が実現されている。
【0003】
この文書管理装置では、検索対象の文書画像に含まれる検索条件となる文字コードデータを入力することで、その文字コードデータからなるOCR結果を検索し、検索されたOCR結果を表示したり、対応する文書画像を表示する。この際、OCR結果中に含まれる検索条件として入力した文字コードデータは、他の文字コードデータと区別して表示することで、ユーザに検索状況を報知することが可能である。
【0004】
また、特開平9−237320号公報には、読取文書のフォーマットが文字コードで表示されるキャラクタの範囲で復元されて違和感なく視認できる読取文書の表示が可能なファイルを生成する技術が開示されている。
【0005】
更に、特開平10−134141号公報には、シート上に記載された文字を光学的に読み取って認識結果を取得し、予め記憶媒体に格納された前記シート上に記載された文字に対応して電子データと認識結果とを照合して、照合結果を取得し、その電子データの文字を照合結果に応じて表示方法を切り替えて表示し、照合結果を目視により確認する技術が開示されている。
【0006】
【発明が解決しようとする課題】
しかしながら、上記従来技術で説明されるOCRは、100%認識可能とはいかず、そのOCR結果には少なからず誤認識が含まれる。そのため、例えば、OCR結果中に含まれるとされる文字コードデータを検索条件として、OCR結果や対応する文書画像を検索する場合でも、満足のいく検索結果を得られないことがあった。
【0007】
また、OCR結果から対応する文書画像中の所望の文字画像を検索するような場合は、一旦、OCR結果から所望の文字画像のOCR結果とされる文字コードデータを検索条件として入力し、その検索条件を含むOCR結果上で他の文字コードデータと区別して表示される検索条件の文字コードデータの表示位置に基づいて、対応する文書画像中の所望の文字画像を目視で検索する必要があり、手間がかかっていた。
【0008】
本発明は上記の課題を解決するためになされたものであり、所望のOCR結果を効率的に検索することができ、かつそのOCR結果に対応する文書画像中の所望の文字画像を容易に視認することができる文書画像検索装置及びその方法、文書画像検索システム、プログラムを提供することを目的とする。
【0009】
【課題を解決するための手段】
上記の目的を達成するための本発明による文書画像検索装置は以下の構成を備える。即ち、
文書画像のOCR結果を管理し、入力された検索条件に基づいて該検索条件に合致するOCR結果を検索する文書画像検索装置であって、
前記入力された検索条件を構成する第1検索文字列による検索を実行する第1検索手段と、
前記第1検索手段の検索結果に基づいて、該第1検索文字列の一部をワイルドカードに置き換えた第2検索文字列による再検索を実行する第2検索手段と、
前記第1あるいは第2検索手段で検索されたOCR結果と対応する文書画像の対比表示画像を生成する生成手段と
を備える。
【0010】
また、好ましくは、前記対比表示画像は、前記文書画像中の前記第1検索文字列あるいは第2検索文字列に対応する文字画像の表示属性とそれ以外の他の文字画像の表示属性が異なる。
【0011】
また、好ましくは、誤認識され易い文字群を対応づけて管理する誤認識文字リストを記憶する記憶手段と、
前記第2検索手段の検索結果に基づいて、前記第1検索文字列中の前記誤認識文字リストで管理されている第1文字を該第1文字に対応づけられている第2文字に置き換えた第3検索文字列による再検索を実行する第3検索手段を更に備え、
前記生成手段は、前記第3検索手段で検索されたOCR結果と対応する文書画像の対比表示画像を生成する。
【0012】
また、好ましくは、前記第2検索手段は、前記第2検索文字列による検索結果が得られない場合、前記第1検索文字列中の第2文字をワイルドカードに置き換えた検索文字列による検索を実行し、検索結果が得られるまで、該第1検索文字列中の各文字をワイルドカードに置き換えた検索文字列による検索を実行する。
【0013】
また、好ましくは、前記第2検索手段は、前記第1検索文字列中の所定画数以上の文字をワイルドカードに置き換える。
【0014】
上記の目的を達成するための本発明による文書画像検索システムは以下の構成を備える。即ち、
文書画像のOCR結果を管理し、入力された検索条件に基づいて該検索条件に合致するOCR結果を検索する文書画像検索サーバと、前記検索条件を入力する検索用端末とがネットワークを介して相互に接続されて構成される文書画像検索システムであって、
前記検索用端末は、
検索条件を入力する入力手段と、
前記検索条件を前記文書画像検索サーバへ送信する第1送信手段と、
前記検索条件に対応する検索結果を前記文書画像検索サーバより受信する第1受信手段と、
前記検索結果を表示する表示手段とを備え、
前記文書画像検索サーバは、
前記検索用端末より検索条件を受信する第2受信手段と、
前記検索条件を構成する第1検索文字列による検索を実行する第1検索手段と、
前記第1検索手段の検索結果に基づいて、該第1検索文字列の一部をワイルドカードに置き換えた第2検索文字列による再検索を実行する第2検索手段と、
前記第1あるいは第2検索手段で検索されたOCR結果と対応する文書画像の対比表示画像を生成する生成手段と
前記対比表示画像を前記検索用端末へ送信する第2送信手段と
を備える。
【0015】
上記の目的を達成するための本発明による文書画像検索方法は以下の構成を備える。即ち、
文書画像のOCR結果を管理し、入力された検索条件に基づいて該検索条件に合致するOCR結果を検索する文書画像検索方法であって、
前記入力された検索条件を構成する第1検索文字列による検索を実行する第1検索工程と、
前記第1検索工程の検索結果に基づいて、該第1検索文字列の一部をワイルドカードに置き換えた第2検索文字列による再検索を実行する第2検索工程と、
前記第1あるいは第2検索工程で検索されたOCR結果と対応する文書画像の対比表示画像を生成する生成工程と
を備える。
【0016】
上記の目的を達成するための本発明による文書画像検索システムの制御方法は以下の構成を備える。即ち、
文書画像のOCR結果を管理し、入力された検索条件に基づいて該検索条件に合致するOCR結果を検索する文書画像検索サーバと、前記検索条件を入力する検索用端末とがネットワークを介して相互に接続されて構成される文書画像検索システムの制御方法であって、
検索条件を入力する入力工程と、
前記検索条件を前記文書画像検索サーバへ送信する第1送信工程と、
前記検索条件を構成する第1検索文字列による検索を実行する第1検索工程と、
前記第1検索工程の検索結果に基づいて、該第1検索文字列の一部をワイルドカードに置き換えた第2検索文字列による再検索を実行する第2検索工程と、
前記第1あるいは第2検索工程で検索されたOCR結果と対応する文書画像の対比表示画像を生成する生成工程と
前記対比表示画像を前記検索用端末へ送信する第2送信工程と
を備える。
【0017】
上記の目的を達成するための本発明によるプログラムは以下の構成を備える。即ち、
文書画像のOCR結果を管理し、入力された検索条件に基づいて該検索条件に合致するOCR結果を検索する文書画像検索をコンピュータに機能させるためのプログラムであって、
前記入力された検索条件を構成する第1検索文字列による検索を実行する第1検索工程のプログラムコードと、
前記第1検索工程の検索結果に基づいて、該第1検索文字列の一部をワイルドカードに置き換えた第2検索文字列による再検索を実行する第2検索工程のプログラムコードと、
前記第1あるいは第2検索工程で検索されたOCR結果と対応する文書画像の対比表示画像を生成する生成工程のプログラムコードと
を備える。
【0018】
上記の目的を達成するための本発明によるプログラムは以下の構成を備える。即ち、
文書画像のOCR結果を管理し、入力された検索条件に基づいて該検索条件に合致するOCR結果を検索する文書画像検索サーバと、前記検索条件を入力する検索用端末とがネットワークを介して相互に接続されて構成される文書画像検索システムの制御をコンピュータに機能させるためのプログラムであって、
検索条件を入力する入力工程のプログラムコードと、
前記検索条件を前記文書画像検索サーバへ送信する第1送信工程のプログラムコードと、
前記検索条件を構成する第1検索文字列による検索を実行する第1検索工程のプログラムコードと、
前記第1検索工程の検索結果に基づいて、該第1検索文字列の一部をワイルドカードに置き換えた第2検索文字列による再検索を実行する第2検索工程のプログラムコードと、
前記第1あるいは第2検索工程で検索されたOCR結果と対応する文書画像の対比表示画像を生成する生成工程のプログラムコードと
前記対比表示画像を前記検索用端末へ送信する第2送信工程のプログラムコードと
を備える。
【0019】
【発明の実施の形態】
以下、図面を参照して本発明の実施形態を詳細に説明する。
【0020】
図1は本実施形態の文書画像検索システムの構成を示す図である。
【0021】
100はスキャナ用PC(パーソナルコンピュータ)であり、スキャナ102の入力動作を含む各種動作を制御し、スキャナ102より入力した文書画像を保存フォルダ101に保存する。また、OCRサーバ300の指示に基づいて、保存フォルダ101に保存されている文書画像をOCRサーバ300へ送信して、OCRサーバ300で文書画像を一元管理するようにしても良い。
【0022】
200はイメージ管理サーバであり、例えば、ネットワーク600上に接続されているネットワークスキャナ500の入力動作を含む各種動作を制御し、ネットワークスキャナ500より入力した文書画像を保存フォルダ201に保存する。また、OCRサーバ300の指示に基づいて、保存フォルダ201に保存されている文書画像をOCRサーバ300へ送信する。
【0023】
尚、イメージ管理サーバ200は、ネットワークスキャナ500で入力した文書画像を保存フォルダ201に保存するのではなく、ネットワーク600上に接続されている記憶装置や他のPC上に保存するように構成しても良い。この場合、保存フォルダ201には、文書画像の保存先を示す位置情報(例えば、アドレスやURL、IPアドレス等)を管理している。
【0024】
300はOCRサーバであり、ネットワーク600を介して受信する文書画像をイメージデータとしてデータベース301に保存すると共に、その文書画像のOCRを実行し、そのOCR結果を書式付テキストデータとして、データベース302に保存する。この際、OCR対象の文書画像とそのOCR結果である書式付テキストデータは対応づけて管理される。303は誤認識文字リストであり、OCRにおいて、誤認識され易い文字である誤認識文字群を管理している。誤認識文字としては、例えば、「算」と「鼻」、「籠」と「蘢」等が挙げられる。
【0025】
尚、データベース301及び302は別々に構成されているが、1つの記憶媒体上の異なる記憶領域にそれぞれのデータベースが構成されていても、もちろん構わない。
【0026】
また、書式付テキストデータとしては、例えば、マイクロソフト社のWord(登録商標)やジャストシステム社の一太郎(登録商標)等の各種ワープロソフトで実現されるフォーマットが挙げられる。
【0027】
400は検索用PCであり、検索条件として、例えば、文字コードを入力して、OCRサーバ300に管理される書式付テキストデータとそれに対応する文書画像を検索結果として表示可能である。
【0028】
500はネットワークスキャナであり、ネットワーク600上に接続されるサーバやPCによってリモート操作が可能なスキャナである。
【0029】
600はネットワークであり、本実施形態の文書画像検索システムを構成する各種構成要素を相互に接続する。
【0030】
尚、本実施形態の文書画像検索システムを構成する各種サーバはWEBサーバ機能を有し、それらのサーバにアクセスするPCはWEBブラウザを用いて、各種サーバが提供するWEBサイトにアクセスして、各種処理を行う。これ以外にも、各種サーバが専用のGUI(グラフィックユーザインタフェース)を含むクライアントプログラムと提供して、PCがそのクライアントプログラムを使用して、各種処理を行うようにしても良い。
【0031】
また、図1では、スキャナ用PC100、ネットワークスキャナ500はそれぞれ1台で構成されているが、複数台で構成されている場合もあることは言うまでもない。
【0032】
次に、本実施形態の文書画像検索システムを構成する各種端末、サーバのハードウェア構成について、図2を用いて説明する。
【0033】
図2は本実施形態の文書画像検索システムを構成する各種端末、サーバそれぞれのハードウェア構成を示す図である。
【0034】
図2において、CPU21、RAM22、ROM23、LANアダプタ24、ビデオアダプタ25、入力部(キーボード)26、入力部(マウス)27、ハードディスク28、CD−ROMドライブ29はそれぞれシステムバス20を介して互いに接続されている。システムバス20は、例えば、PCIバス、AGPバス、メモリバス等を意味する。また、図2では、各バス間の接続用チップやキーボードインタフェースや、いわゆるSCSIやATAPIのような入出力用インタフェースは省略されている。
【0035】
CPU21は四則演算や比較演算等の各種の演算や、ハードウェアやソフトウェアの制御を行う。RAM22には、ハードディスク28やCD−ROMドライブ29に装着されたCD−ROMやCD−R等の記憶媒体から読み出されたオペレーションシステムのプログラムやアプリケーションプログラム(後述する各端末やサーバで実行されるフローチャートを実行する各プログラム)等が記憶され、これらはCPU21の制御の元に実行される。
【0036】
ROM23は、オペレーションシステムと協働してハードディスク等への入出力を司るいわゆるBIOS等が記憶される。LANアダプタ24は、CPU21によって制御されるオペレーションシステムの通信プログラムと協働してネットワークを介した外部との通信を行う。ビデオアダプタ25は、ディスプレイ装置(不図示)に出力する画像信号を生成し、入力部(キーボード)26や入力部(マウス)27は端末への指示を入力するために用いられる。
【0037】
ハードディスク28は、オペレーションシステムや上述のアプリケーションプログラムを記憶しており、端末の起動時に、または必要に応じてRAM22にロードされる。
【0038】
CD−ROMドライブ29は、CD−ROMやCD−RやCD−R/W等の記憶媒体を装着してアプリケーションプログラムをハードディスク28にインストールするのに用いる。
【0039】
尚、CD−ROMドライブ29の代わりにCD−RドライブやCD−R/WドライブやMOドライブ等を用いても良いのは言うまでもない。
【0040】
次に、本実施形態の文書画像検索システムで実行される処理について説明する。
【0041】
本実施形態の文書画像検索システムで実行される処理は、大きく分けて2つの処理からなる。1つは、文書画像を入力し、その文書画像のOCRを行い、その文書画像とOCR結果を管理する文書画像管理処理、もう1つは、その管理されたOCR結果を利用して、所望のOCR結果と対応する文書画像を検索する文書画像検索処理である。
【0042】
まず、文書画像管理処理について、図3を用いて説明する。
【0043】
図3は本実施形態の文書画像管理処理を示すフローチャートである。
【0044】
尚、図3では、スキャナ用PC100に接続されるスキャナ102から入力された文書画像をOCRサーバ300でOCRを行い、そのOCR結果と文書画像を管理する場合を例に挙げる。また、文書画像管理処理は、OCRサーバ300のRAM22に記憶されている文書画像管理処理を実現する文書画像管理処理プログラムをCPU21が実行することで実現される。
【0045】
まず、ステップS201で、スキャナ用PC100は、イメージデータとして文書画像をスキャナ102より入力する。ステップS102で、スキャナ用PC100は、入力した文書画像を保存フォルダ101に保存する。あるいは、この保存フォルダ101に保存された文書画像群は、所定のタイミングでイメージ管理サーバ200へ送信され、イメージ管理サーバ200の保存フォルダ201に保存される場合もある。
【0046】
一方、ステップ201で、OCRサーバ300は、一定時間毎にスキャナ用PC100の保存フォルダ101内のイメージデータ(文書画像)の有無をチェックする。イメージデータがない場合(ステップS202でNO)、一定時間待機して、再度、チェックを実行する。一方、イメージデータがある場合(ステップS201でYES)、イメージデータがある場合(ステップS201でYES)、ステップS202に進む。
【0047】
ステップS202で、OCRサーバ300は、イメージデータをスキャナ用PC100より受信し、そのイメージデータをデータベース301に保存する。この際、スキャナ用PC100は、OCRサーバ300へイメージデータの転送後に、保存フォルダ101のイメージデータを削除する。
【0048】
ステップS203で、OCRサーバ300は、文書画像中の空白をスペースデータとして認識する認識を含むOCRを実行する。ステップS204で、OCRサーバ300は、レイアウト修正処理を行う。このレイアウト修正処理は、具体的には、OCR結果であるテキストデータをイメージに展開した展開イメージデータとOCR対象のオリジナルイメージデータを比較し、空白のずれをスペースを挿入して、展開イメージデータのレイアウトがオリジナルイメージデータのレイアウトと同じになるように微調整する。
【0049】
そして、ステップS205で、OCRサーバ300は、レイアウト修正処理後、展開イメージデータを解析して、オリジナルイメージデータ中の文字画像の位置情報を抽出し、OCR結果にその位置情報(例えば、ページ区切データや余白データ等)を反映した書式付テキストデータにフォーマット変換する。
【0050】
次に、文書画像検索処理について、図4を用いて説明する。
【0051】
図4は本実施形態の文書画像検索処理を示すフローチャートである。
【0052】
尚、この図4の文書画像検索処理は、OCRサーバ300のRAM22に記憶されている文書画像検索処理を実現する文書画像検索処理プログラムをCPU21が実行することで実現される。
【0053】
まず、OCRサーバ300は、検索用PC400から入力される検索条件に合致する文書画像を検索するための前処理として、ステップS301〜ステップS303の処理を行う。
【0054】
具体的には、ステップS301で、で、データベース301に保存されているイメージデータ群(文書画像)をRAM22に読み込む。次に、ステップ302で、データベース302に保存されているイメージデータ群それぞれに対応する書式付テキストデータをRAM22に読み込む。次に、ステップS303で、検索用PC400に検索結果としてイメージデータと対応する書式付テキストデータを対比表示するための対比表示画像を生成する。
【0055】
尚、この対比表示画像は、この時点で、検索用PC400に送信して表示しても良いし、検索条件を受信した後に、検索条件に合致する対比表示画像だけを検索用PC400に送信して表示するようにしても良い。
【0056】
次に、ステップS304で、検索用PC400から入力された検索条件である検索文字列を受信する。ステップS305で、検索文字列中の一部をワイルドカードとする文字位置を示すワイルドカード文字位置カウンタnを0に設定する。
【0057】
次に、ステップS306で、検索文字列を含む書式付テキストデータを検索する。ステップS307で、検索文字列を含む書式付テキストデータの有無を判定する。検索文字列を含む書式付テキストデータがある場合(ステップS307でYES)、ステップS311に進み、検索された書式付テキストデータ中に含まれる検索文字列の位置を含む位置情報(ページ数、行数、文字位置)を検出する。
【0058】
尚、この位置情報の検出は、書式付テキストデータ中に含まれるすべての検索文字列を検出しても良いし、書式付テキストデータ中の先頭から初めて最初に検出される検索文字列を検出しても良い。
【0059】
ステップS312で、検出された位置情報に基づいて、その書式付テキストデータの対応するイメージデータ中の対応する位置の文字画像の表示属性を変更して対比表示画像を更新して、検索用PC400へ送信する。これにより、検索用PC400には、入力した検索文字列による検索結果である対比表示画像が表示されることになる。
【0060】
尚、この表示属性の変更は、例えば、反転表示や色付表示等の表示形態を変更することを意味し、イメージデータ中の検索文字列に対応する文字画像とその他の文字画像を区別するためのものである。
【0061】
ここで、検索結果として、検索用PC400に表示される対比表示画像の一例を図5に示す。図5の例では、左にイメージデータ、右に対応する書式付テキストデータが同一画面上に表示されている。そして、図5では、検索条件である検索文字列が「対予算比」で、その「対予算比」を含む書式付テキストデータが検索され、その検索結果として、その書式付テキストデータと対応するイメージデータを対比表示している状態である。図5に示されるように、書式付テキストデータ中の「対予算比」に対応するイメージデータ中の文字画像が矩形で囲まれて表示されている。これにより、ユーザは、検索文字列に対応するイメージデータ中の文字画像を容易に視認することができる。
【0062】
一方、ステップS307において、検索文字列を含む書式付テキストデータがない場合(ステップS307でNO)、ステップS308に進み、ワイルドカード文字位置カウンタnを1インクリメントする。
【0063】
ステップS309で、検索文字列数/X(例えば、X=3:このXの値は、ワイルドカードを含む検索文字列による検索を行う回数に応じて適宜決定される)がn未満であるか否かを判定する。検索文字列数がn未満である場合(ステップS309でNO)、ステップS310に進み、現在の検索文字列から、ワイルドカード文字位置カウンタnが示す数の位置のワイルドカードを含む検索文字列を生成する。例えば、検索文字列が「対予算比」であり、ワイルドカード文字位置カウンタn=1である場合は、ワイルドカード(例えば、「?」、「*」)を含む検索文字列として、「?予算比」、ワイルドカード文字位置カウンタn=2である場合は「対?算比」、ワイルドカード文字位置カウンタn=3である場合は「対予?比」、ワイルドカード文字位置カウンタn=4である場合は「対予算?」が生成される。このようにして生成されたワイルドカードを含む検索文字列を検索条件として、ステップS306で、検索文字列を含む書式付テキストデータを検索する。
【0064】
ここで、ワイルドカードを含む検索文字列を変更して生成した検索文字列による検索結果として、検索用PC400に表示される対比表示画像の一例を図6に示す。図6の例では、図5と同様に、左にイメージデータ、右に対応する書式付テキストデータが同一画面上に表示されている。そして、図6では、検索条件である検索文字列が「対予算比」からワイルドカードを含む検索文字列として「対予?比」を生成し、その「対予?比」を含む書式付テキストデータを検索した場合の検索結果として、その書式付テキストデータと対応するイメージデータを対比表示している状態である。図6に示されるように、書式付テキストデータ中の「対予鼻比」中の「鼻」は検索文字列「対予?比」のワイルドカードに対応するので、この「対予鼻比」に対応するイメージデータ中の文字画像が矩形で囲まれて表示されている。これにより、ユーザは、検索文字列に対応するイメージデータ中の文字画像を容易に視認することができる。
【0065】
但し、検索結果がワイルドカードを含む検索文字列による検索結果であることを示すために、検索文字列中のワイルドカードに対応する文字画像の表示属性とそれ以外の文字画像の表示属性は異なるものとなる。
【0066】
一方、ステップS309で、検索文字列数/Xがn以上である場合(ステップS309でYES)、ステップS313に進み、誤認識文字リストの文字群と検索文字列中の1文字分をマッチングする。
【0067】
尚、このマッチングは、検索文字列の各文字と誤認識文字リストの誤認識文字群とのマッチングを行っても良いし、検索文字列の先頭から所定数分までの各文字と誤認識文字リストの誤認識文字群とのマッチングを行っても良く、このマッチングの方法は、用途や目的に応じて適宜変更することができる。
【0068】
次に、ステップS314で、マッチングによって、検索文字列中のマッチング対象の文字が誤認識文字リストに存在する誤認識文字であるか否かを判定する。誤認識文字である場合(ステップS314でYES)、ステップS315に進み、そのマッチング対象の文字を対応する別の誤認識文字に置き換えた検索文字列を生成する。例えば、検索文字列が「対予算比」で、マッチング対象の文字が「算」で、その「算」の誤認識文字として「鼻」がある場合は、検索文字列は「対予算比」から「対予鼻比」に変更されることになる。また、検索文字列中の文字を誤認識文字に置き換えて新たな検索文字列を生成し、その検索文字列による検索結果は、図6に示したような対比表画像の表示形態に準ずる。但し、この場合には、誤認識文字に対応する文字画像の表示属性とそれ以外の文字画像の表示属性が異なるものとなる。
【0069】
尚、ステップS314で、検索文字列を生成した場合には、検索文字列が変更されて再度、検索を実行する状態であることを示す文字列更新フラグがオンになる。この文字列更新フラグは、OCRサーバ300で管理され、処理終了時か、又は別の検索のためにOCRサーバ300が検索用PC400から新たな検索条件とする検索文字列を受信した場合にオフになる。その後、ステップS305に進み、以降の処理が実行されることになる。この場合は、誤認識文字とワイルドカードを含む検索文字列による検索を実行することができる。
【0070】
一方、ステップS314において、誤認識文字でない場合(ステップS314でNO)、検索条件に合致する書式付テキストデータがないとして、処理を終了する。
【0071】
以上説明したように、本実施形態によれば、検索用PC400から入力された検索文字列による検索結果が得られない場合、入力された検索文字列の一部をワイルドカードにして再検索を行うことで、誤認識があることが前提とされるOCR結果(書式付テキストデータ)から所望のOCR結果を効率的に検索することができる。加えて、ワイルドカードを含む検索文字列による検索結果が得られない場合には、検索文字列中の一部の文字を別の誤認識文字に置き換えて再検索を行うことで、誤認識があることが前提とされるOCR結果から所望のOCR結果を効率的に検索することができる。
【0072】
また、検索結果として、OCR結果(書式付テキストデータ)と対応するイメージデータを対比表示し、かつ検索文字列に合致するイメージデータ上の文字画像を他の文字画像と区別して表示することで、ユーザは容易にOCR対象の文字画像を視認することができ、従来に比べて、OCR対象の文書画像中の所望の文字画像の確認工数を低減することができる。
【0073】
上記実施形態では、OCRサーバ300は、イメージデータとそのOCR結果である書式付テキストデータをそれぞれデータベース301、302に保存し、文書画像管理処理プログラム及び文書画像検索処理プログラムをRAM22に記憶しているが、これに限定されない。例えば、OCRサーバ300は、イメージデータの保存と文書画像管理処理プログラムだけを備え、そのイメージデータのOCR結果である書式付テキストデータと文書画像検索処理プログラムを別途構成された検索用サーバに備えるような構成にしても良い。
【0074】
また、ワイルドカードは、検索文字列の先頭から順次切り替える構成としたが、これに限定されない。例えば、検索文字列中の誤認識されやすい画数の多い文字だけを、つまり、所定画数以上の文字をワイルドカードの対象とするようにしても良い。この場合、処理の高速化を図ることができる。
【0075】
更に、対比表示画像では、検索結果が得られた時点でその検索結果である対比表示画像を検索用PC400に提示するような構成としたが、例えば、ワイルドカードの位置が異なる各検索文字列によるそれぞれの検索結果をまとめて表示するようにしても良い。この場合の対比表示画像は、各検索文字列に対応する文書画像中の文字画像を他の文字画像と区別して表示しても良いし、これに加えて、各検索文字列中ワイルドカードの位置それぞれが区別できるように表示しても良い。
【0076】
尚、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【0077】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0078】
プログラムコードを供給するための記憶媒体としては、例えば、フロッピディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
【0079】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0080】
更に、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0081】
本発明を上記記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
【0082】
【発明の効果】
以上説明したように、本発明によれば、所望のOCR結果を効率的に検索することができ、かつそのOCR結果に対応する文書画像中の所望の文字画像を容易に視認することができる文書画像検索装置及びその方法、文書画像検索システム、プログラムを提供できる。
【図面の簡単な説明】
【図1】本実施形態の文書画像検索システムの構成を示す図である。
【図2】本実施形態の文書画像検索システムを構成する各種端末、サーバそれぞれのハードウェア構成を示す図である。
【図3】本実施形態で実行される文書画像管理処理を示すフローチャートである。
【図4】本実施形態の文書画像検索処理を示すフローチャートである。
【図5】本実施形態の対比表示画像の一例を示す図である。
【図6】本実施形態の対比表示画像の一例を示す図である。

Claims (14)

  1. 文書画像のOCR結果を管理し、入力された検索条件に基づいて該検索条件に合致するOCR結果を検索する文書画像検索装置であって、
    前記入力された検索条件を構成する第1検索文字列による検索を実行する第1検索手段と、
    前記第1検索手段の検索結果に基づいて、該第1検索文字列の一部をワイルドカードに置き換えた第2検索文字列による再検索を実行する第2検索手段と、
    前記第1あるいは第2検索手段で検索されたOCR結果と対応する文書画像の対比表示画像を生成する生成手段と
    を備えることを特徴とする文書画像検索装置。
  2. 前記対比表示画像は、前記文書画像中の前記第1検索文字列あるいは第2検索文字列に対応する文字画像の表示属性とそれ以外の他の文字画像の表示属性が異なる
    ことを特徴とする請求項1に記載の文書画像検索装置。
  3. 誤認識され易い文字群を対応づけて管理する誤認識文字リストを記憶する記憶手段と、
    前記第2検索手段の検索結果に基づいて、前記第1検索文字列中の前記誤認識文字リストで管理されている第1文字を該第1文字に対応づけられている第2文字に置き換えた第3検索文字列による再検索を実行する第3検索手段を更に備え、
    前記生成手段は、前記第3検索手段で検索されたOCR結果と対応する文書画像の対比表示画像を生成する
    ことを特徴とする請求項1に記載の文書画像検索装置。
  4. 前記第2検索手段は、前記第2検索文字列による検索結果が得られない場合、前記第1検索文字列中の第2文字をワイルドカードに置き換えた検索文字列による検索を実行し、検索結果が得られるまで、該第1検索文字列中の各文字をワイルドカードに置き換えた検索文字列による検索を実行する
    ことを特徴とする請求項1に記載の文書画像検索装置。
  5. 前記第2検索手段は、前記第1検索文字列中の所定画数以上の文字をワイルドカードに置き換える
    ことを特徴とする請求項1に記載の文書画像検索装置。
  6. 文書画像のOCR結果を管理し、入力された検索条件に基づいて該検索条件に合致するOCR結果を検索する文書画像検索サーバと、前記検索条件を入力する検索用端末とがネットワークを介して相互に接続されて構成される文書画像検索システムであって、
    前記検索用端末は、
    検索条件を入力する入力手段と、
    前記検索条件を前記文書画像検索サーバへ送信する第1送信手段と、
    前記検索条件に対応する検索結果を前記文書画像検索サーバより受信する第1受信手段と、
    前記検索結果を表示する表示手段とを備え、
    前記文書画像検索サーバは、
    前記検索用端末より検索条件を受信する第2受信手段と、
    前記検索条件を構成する第1検索文字列による検索を実行する第1検索手段と、
    前記第1検索手段の検索結果に基づいて、該第1検索文字列の一部をワイルドカードに置き換えた第2検索文字列による再検索を実行する第2検索手段と、
    前記第1あるいは第2検索手段で検索されたOCR結果と対応する文書画像の対比表示画像を生成する生成手段と
    前記対比表示画像を前記検索用端末へ送信する第2送信手段と
    を備えることを特徴とする文書画像検索システム。
  7. 文書画像のOCR結果を管理し、入力された検索条件に基づいて該検索条件に合致するOCR結果を検索する文書画像検索方法であって、
    前記入力された検索条件を構成する第1検索文字列による検索を実行する第1検索工程と、
    前記第1検索工程の検索結果に基づいて、該第1検索文字列の一部をワイルドカードに置き換えた第2検索文字列による再検索を実行する第2検索工程と、
    前記第1あるいは第2検索工程で検索されたOCR結果と対応する文書画像の対比表示画像を生成する生成工程と
    を備えることを特徴とする文書画像検索方法。
  8. 前記対比表示画像は、前記文書画像中の前記第1検索文字列あるいは第2検索文字列に対応する文字画像の表示属性とそれ以外の他の文字画像の表示属性が異なる
    ことを特徴とする請求項7に記載の文書画像検索方法。
  9. 誤認識され易い文字群を対応づけて管理する誤認識文字リストを記憶する記憶工程と、
    前記第2検索工程の検索結果に基づいて、前記第1検索文字列中の前記誤認識文字リストで管理されている第1文字を該第1文字に対応づけられている第2文字に置き換えた第3検索文字列による再検索を実行する第3検索工程を更に備え、
    前記生成工程は、前記第3検索工程で検索されたOCR結果と対応する文書画像の対比表示画像を生成する
    ことを特徴とする請求項7に記載の文書画像検索方法。
  10. 前記第2検索工程は、前記第2検索文字列による検索結果が得られない場合、前記第1検索文字列中の第2文字をワイルドカードに置き換えた検索文字列による検索を実行し、検索結果が得られるまで、該第1検索文字列中の各文字をワイルドカードに置き換えた検索文字列による検索を実行する
    ことを特徴とする請求項7に記載の文書画像検索方法。
  11. 前記第2検索工程は、前記第1検索文字列中の所定画数以上の文字をワイルドカードに置き換える
    ことを特徴とする請求項7に記載の文書画像検索方法。
  12. 文書画像のOCR結果を管理し、入力された検索条件に基づいて該検索条件に合致するOCR結果を検索する文書画像検索サーバと、前記検索条件を入力する検索用端末とがネットワークを介して相互に接続されて構成される文書画像検索システムの制御方法であって、
    検索条件を入力する入力工程と、
    前記検索条件を前記文書画像検索サーバへ送信する第1送信工程と、
    前記検索条件を構成する第1検索文字列による検索を実行する第1検索工程と、
    前記第1検索工程の検索結果に基づいて、該第1検索文字列の一部をワイルドカードに置き換えた第2検索文字列による再検索を実行する第2検索工程と、
    前記第1あるいは第2検索工程で検索されたOCR結果と対応する文書画像の対比表示画像を生成する生成工程と
    前記対比表示画像を前記検索用端末へ送信する第2送信工程と
    を備えることを特徴とする文書画像検索システムの制御方法。
  13. 文書画像のOCR結果を管理し、入力された検索条件に基づいて該検索条件に合致するOCR結果を検索する文書画像検索をコンピュータに機能させるためのプログラムであって、
    前記入力された検索条件を構成する第1検索文字列による検索を実行する第1検索工程のプログラムコードと、
    前記第1検索工程の検索結果に基づいて、該第1検索文字列の一部をワイルドカードに置き換えた第2検索文字列による再検索を実行する第2検索工程のプログラムコードと、
    前記第1あるいは第2検索工程で検索されたOCR結果と対応する文書画像の対比表示画像を生成する生成工程のプログラムコードと
    を備えることを特徴とするプログラム。
  14. 文書画像のOCR結果を管理し、入力された検索条件に基づいて該検索条件に合致するOCR結果を検索する文書画像検索サーバと、前記検索条件を入力する検索用端末とがネットワークを介して相互に接続されて構成される文書画像検索システムの制御をコンピュータに機能させるためのプログラムであって、
    検索条件を入力する入力工程のプログラムコードと、
    前記検索条件を前記文書画像検索サーバへ送信する第1送信工程のプログラムコードと、
    前記検索条件を構成する第1検索文字列による検索を実行する第1検索工程のプログラムコードと、
    前記第1検索工程の検索結果に基づいて、該第1検索文字列の一部をワイルドカードに置き換えた第2検索文字列による再検索を実行する第2検索工程のプログラムコードと、
    前記第1あるいは第2検索工程で検索されたOCR結果と対応する文書画像の対比表示画像を生成する生成工程のプログラムコードと
    前記対比表示画像を前記検索用端末へ送信する第2送信工程のプログラムコードと
    を備えることを特徴とするプログラム。
JP2002378481A 2002-12-26 2002-12-26 文書画像検索装置及びその方法、文書画像検索システム、プログラム Expired - Fee Related JP4208566B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002378481A JP4208566B2 (ja) 2002-12-26 2002-12-26 文書画像検索装置及びその方法、文書画像検索システム、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002378481A JP4208566B2 (ja) 2002-12-26 2002-12-26 文書画像検索装置及びその方法、文書画像検索システム、プログラム

Publications (2)

Publication Number Publication Date
JP2004213091A true JP2004213091A (ja) 2004-07-29
JP4208566B2 JP4208566B2 (ja) 2009-01-14

Family

ID=32815318

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002378481A Expired - Fee Related JP4208566B2 (ja) 2002-12-26 2002-12-26 文書画像検索装置及びその方法、文書画像検索システム、プログラム

Country Status (1)

Country Link
JP (1) JP4208566B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007058624A (ja) * 2005-08-25 2007-03-08 Fuji Xerox Co Ltd 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2007280104A (ja) * 2006-04-07 2007-10-25 Pioneer Electronic Corp 情報処理装置、情報処理方法、情報処理プログラムおよびコンピュータに読み取り可能な記録媒体
JP2010026750A (ja) * 2008-07-18 2010-02-04 Hitachi Software Eng Co Ltd 電子帳票システムにおけるデータ検索項目情報の自動定義システム
WO2012157252A1 (ja) * 2011-05-17 2012-11-22 パナソニック株式会社 文字列抽出方法と文字列抽出装置
JP2014241027A (ja) * 2013-06-11 2014-12-25 富士ゼロックス株式会社 文書処理装置及びプログラム
WO2020071252A1 (ja) * 2018-10-04 2020-04-09 昭和電工株式会社 文書検索装置、文書検索プログラム、文書検索方法
CN111126370A (zh) * 2018-10-31 2020-05-08 上海迈弦网络科技有限公司 一种基于ocr识别结果的最长公共子串自动纠错方法及系统
JP2020154776A (ja) * 2019-03-20 2020-09-24 株式会社Screenホールディングス 誤認識文字テーブル、誤認識文字テーブル作成方法、文字列検索装置、文字列検索方法、および、文字列検索プログラム

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007058624A (ja) * 2005-08-25 2007-03-08 Fuji Xerox Co Ltd 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2007280104A (ja) * 2006-04-07 2007-10-25 Pioneer Electronic Corp 情報処理装置、情報処理方法、情報処理プログラムおよびコンピュータに読み取り可能な記録媒体
JP2010026750A (ja) * 2008-07-18 2010-02-04 Hitachi Software Eng Co Ltd 電子帳票システムにおけるデータ検索項目情報の自動定義システム
WO2012157252A1 (ja) * 2011-05-17 2012-11-22 パナソニック株式会社 文字列抽出方法と文字列抽出装置
JP5168435B2 (ja) * 2011-05-17 2013-03-21 パナソニック株式会社 文字列抽出方法と文字列抽出装置
JP2014241027A (ja) * 2013-06-11 2014-12-25 富士ゼロックス株式会社 文書処理装置及びプログラム
WO2020071252A1 (ja) * 2018-10-04 2020-04-09 昭和電工株式会社 文書検索装置、文書検索プログラム、文書検索方法
JPWO2020071252A1 (ja) * 2018-10-04 2021-09-02 昭和電工株式会社 文書検索装置、文書検索プログラム、文書検索方法
TWI794547B (zh) * 2018-10-04 2023-03-01 日商昭和電工股份有限公司 文書檢索裝置、文書檢索程式、文書檢索方法
US11755659B2 (en) 2018-10-04 2023-09-12 Resonac Corporation Document search device, document search program, and document search method
CN111126370A (zh) * 2018-10-31 2020-05-08 上海迈弦网络科技有限公司 一种基于ocr识别结果的最长公共子串自动纠错方法及系统
JP2020154776A (ja) * 2019-03-20 2020-09-24 株式会社Screenホールディングス 誤認識文字テーブル、誤認識文字テーブル作成方法、文字列検索装置、文字列検索方法、および、文字列検索プログラム
JP7257204B2 (ja) 2019-03-20 2023-04-13 株式会社Screenホールディングス 文字列検索装置、文字列検索方法、および、文字列検索プログラム

Also Published As

Publication number Publication date
JP4208566B2 (ja) 2009-01-14

Similar Documents

Publication Publication Date Title
US8577882B2 (en) Method and system for searching multilingual documents
JP4366108B2 (ja) 文書検索装置、文書検索方法及びコンピュータプログラム
JP5353148B2 (ja) 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム
JP3220886B2 (ja) 文書検索方法および装置
JP2010073114A6 (ja) 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム
CN101611406A (zh) 文档存档系统
JP4750476B2 (ja) 文書検索装置及び方法と記憶媒体
JP4054428B2 (ja) 画像検索装置及びその方法、コンピュータ可読メモリ
US20130339002A1 (en) Image processing device, image processing method and non-transitory computer readable recording medium
JP4208566B2 (ja) 文書画像検索装置及びその方法、文書画像検索システム、プログラム
CN114141384A (zh) 用于检索医学数据的方法、设备和介质
US20090300001A1 (en) Server apparatus, catalog processing method, and computer-readable storage medium
CN113495874A (zh) 信息处理装置和计算机可读取介质
KR102570471B1 (ko) 텍스트 마이닝을 이용한 사용자 기반의 문서 작성 서비스 방법 및 사용자 기반의 문서 작성 서비스 시스템
JP2005107931A (ja) 画像検索装置
JP2004334341A (ja) 文書検索装置、文書検索方法及び記録媒体
JP6787755B2 (ja) 文書検索装置
JP2932667B2 (ja) 情報の検索方法および情報蓄積装置
JP2020047031A (ja) 文書検索装置、文書検索システム及びプログラム
JP2002132789A (ja) 文書検索方法
JPH1063813A (ja) イメージ文書管理方法及びその装置
JP2806340B2 (ja) 帳票管理装置
JP2009123033A (ja) 文書検索支援装置及びプログラム
JP2004220347A (ja) 文書分類管理装置
JP4739637B2 (ja) シソーラス構築支援装置およびシソーラス構築支援方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050613

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080623

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080819

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081006

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081021

R150 Certificate of patent or registration of utility model

Ref document number: 4208566

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111031

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111031

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121031

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131031

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees