JP4788205B2 - 文書検索装置及び文書検索プログラム - Google Patents
文書検索装置及び文書検索プログラム Download PDFInfo
- Publication number
- JP4788205B2 JP4788205B2 JP2005182495A JP2005182495A JP4788205B2 JP 4788205 B2 JP4788205 B2 JP 4788205B2 JP 2005182495 A JP2005182495 A JP 2005182495A JP 2005182495 A JP2005182495 A JP 2005182495A JP 4788205 B2 JP4788205 B2 JP 4788205B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- image data
- search
- information
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
図1は、本発明に係る文書検索装置の一実施の形態を示した機能ブロック構成図である。本実施の形態における文書検索装置は、画像読取部1、抽出処理制御部2、UUID抽出部4、特徴量抽出部6、検索語抽出部8、UUID検索部10、類似画像検索部12、文書検索部14、検索結果評価部16及び表示部18を有している。画像読取部1は、文書が記載された原稿を読み取る。UUID抽出部4は、OCR(光学的文字読取装置)を用いて読取画像からUUIDを抽出する。特徴量抽出部6は、読取画像から画像の特徴量を算出する。抽出処理制御部2は、各抽出部6における各抽出処理の実行順の決定などの処理制御を行う。検索語抽出部8は、OCRを用いて読取画像からテキスト文字を抽出し、その中から検索語を抽出する。本実施の形態では、読取画像から当該文書を特定しうる文書特徴情報を抽出する文書特徴抽出処理手段としてUUID抽出部4、特徴量抽出部6及び検索語抽出部8を設け、各抽出部4,6,8に文書特徴情報として、UUID、特徴量及び検索語という異なる種類の情報をそれぞれ抽出させるようにした。そして、データベース検索によって当該文書の選択候補を取得する取得手段として、UUID検索部10、類似画像検索部12及び文書検索部14をそれぞれ各抽出部4,6,8に対応させて設けた。つまり、UUIDデータベース20には、各文書に割り振られたUUIDが登録されているので、UUID検索部10は、読取画像から抽出されたUUIDをキーにUUIDデータベース20を検索することで該当する文書を特定する。また、類似画像データベース22には、読取画像から抽出された特徴量が登録されているので、類似画像検索部12は、読取画像から抽出された特徴量に基づき類似画像データベース22を検索することで該当する文書を特定する。また、文書データベース24には、文書自体が登録されているので、文書検索部14は、読取画像から抽出された検索語をキーに文書データベース24を検索することで該当する文書を特定する。なお、各検索部10〜14における検索処理の結果として、該当する文書が一つだけ必ず選択されるとは限らず、複数の文書が特定される場合もあるため、このような場合には、選択候補を取得するという表現の方が適切になる。検索結果評価部16は、各検索部12により得られた検索結果を評価して当該文書を特定する。表示部18は、検索結果評価部16による評価結果に従い特定された文書に関する情報を文書情報データベース26から取り出して画面表示する。
本実施の形態における文書検索処理について図4に示したフローチャートを用いて説明する。図4において、実施の形態1において図3を用いて説明した処理と同じ処理には、同じステップ番号を付け、説明を適宜省略する。なお、本実施の形態における装置構成は、実施の形態1と同じでよいため説明を省略する。
本実施の形態における文書検索処理について図5に示したフローチャートを用いて説明する。図5において、実施の形態2において図4を用いて説明した処理と同じ処理には、同じステップ番号を付け、説明を適宜省略する。なお、本実施の形態における装置構成は、実施の形態1と同じでよいため説明を省略する。
本実施の形態における文書検索処理について図6に示したフローチャートを用いて説明する。図6において、実施の形態1において図3を用いて説明した処理と同じ処理には、同じステップ番号を付け、説明を適宜省略する。なお、本実施の形態における装置構成は、実施の形態1と同じでよいため説明を省略する。
Claims (4)
- 文書に関する情報が蓄積されたデータベースの中から、入力された画像データに合致する文書を検索する文書検索装置において、
文書の画像データを入力する画像データ入力手段と、
入力された文書の画像データから当該文書を特定しうる複数種類の文書特徴情報を抽出する文書特徴抽出処理手段と、
前記文書特徴抽出処理手段から抽出された各文書特徴情報に基づき前記データベースを検索することによって当該文書の選択候補を取得する取得手段と、
前記取得手段により取得された選択候補を評価することによって当該文書を特定する評価手段と、
前記評価手段による評価結果を出力する出力手段と、
を有し、
前記文書特徴抽出処理手段は、
文書特徴情報として、当該文書に固有に割り付けられた識別情報を、画像データから抽出する識別情報抽出部と、
文書特徴情報として、当該画像データの文字認識結果の中から所定の基準で単語を抽出する検索語抽出部と、
文書識別情報として、当該文書の特徴量を画像データから算出する特徴量抽出部と、
を有し、入力された文書の画像データに基づき文書特徴情報の抽出に適用する前記各抽出部の優先順位付けを行うことを特徴とする文書検索装置。 - 請求項1記載の文書検索装置において、
前記画像データ入力手段は、画像読取手段によって読み取られた画像データを入力し、
前記文書特徴抽出処理手段は、前記画像読取手段による読取時に選択されたスキャンモードを参照して前記各抽出部の優先順位付けを行うことを特徴とする文書検索装置。 - 請求項1記載の文書検索装置において、
前記文書特徴抽出処理手段は、全ての前記抽出部を用いて文書特徴情報を抽出することを特徴とする文書検索装置。 - 文書に関する情報が蓄積されたデータベースの中から、入力された画像データに合致する文書を検索するコンピュータを、
文書の画像データを入力する画像データ入力手段、
入力された文書の画像データから当該文書を特定しうる複数種類の文書特徴情報を抽出する文書特徴抽出処理手段、
前記文書特徴抽出処理手段から抽出された各文書特徴情報に基づき前記データベースを検索することによって当該文書の選択候補を取得する取得手段、
前記取得手段により取得された選択候補を評価することによって当該文書を特定する評価手段、
前記評価手段による評価結果を出力する出力手段、
として機能させ、
前記文書特徴抽出処理手段は、
文書特徴情報として、当該文書に固有に割り付けられた識別情報を、画像データから抽出する識別情報抽出部と、
文書特徴情報として、当該画像データの文字認識結果の中から所定の基準で単語を抽出する検索語抽出部と、
文書識別情報として、当該文書の特徴量を画像データから算出する特徴量抽出部と、
を有し、入力された文書の画像データに基づき文書特徴情報の抽出に適用する前記各抽出部の優先順位付けを行うことを特徴とする文書検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005182495A JP4788205B2 (ja) | 2005-06-22 | 2005-06-22 | 文書検索装置及び文書検索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005182495A JP4788205B2 (ja) | 2005-06-22 | 2005-06-22 | 文書検索装置及び文書検索プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2007004393A JP2007004393A (ja) | 2007-01-11 |
JP2007004393A5 JP2007004393A5 (ja) | 2008-07-31 |
JP4788205B2 true JP4788205B2 (ja) | 2011-10-05 |
Family
ID=37689976
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005182495A Expired - Fee Related JP4788205B2 (ja) | 2005-06-22 | 2005-06-22 | 文書検索装置及び文書検索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4788205B2 (ja) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07114610A (ja) * | 1993-08-26 | 1995-05-02 | Fuji Xerox Co Ltd | 情報処理システムの入力装置及び情報処理システムの入力方法 |
JP2004164413A (ja) * | 2002-11-14 | 2004-06-10 | Kyocera Mita Corp | 付帯情報提供システム |
JP4251629B2 (ja) * | 2003-01-31 | 2009-04-08 | キヤノン株式会社 | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 |
JP4405831B2 (ja) * | 2003-05-20 | 2010-01-27 | キヤノン株式会社 | 画像処理装置及びその制御方法、プログラム |
JP2004348591A (ja) * | 2003-05-23 | 2004-12-09 | Canon Inc | 文書検索方法及び装置 |
-
2005
- 2005-06-22 JP JP2005182495A patent/JP4788205B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007004393A (ja) | 2007-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5623079B2 (ja) | ハード・コピーの書式からの書式定義の自動発生 | |
JP4118349B2 (ja) | 文書選択等の方法及び文書サーバ | |
JP4561474B2 (ja) | 電子化文書保管システム | |
US8099384B2 (en) | Operation procedure extrapolating system, operation procedure extrapolating method, computer-readable medium and computer data signal | |
US7734834B2 (en) | Multi-function peripheral and information acquisition system including a plurality of the multi-function peripherals | |
JP2005018678A (ja) | 帳票データ入力処理装置、帳票データ入力処理方法及びプログラム | |
US20090128862A1 (en) | Automated method and system for transmitting documents from a scanned source based on textual destination information in the document | |
JP2011003116A (ja) | 情報処理装置及びプログラム | |
JP2007172077A (ja) | 画像検索システム及び方法及びプログラム | |
CN100430957C (zh) | 图像处理装置、方法 | |
JPH10320525A (ja) | ファイリング・検索装置およびファイリング・検索方法 | |
JP6786658B2 (ja) | 書類読取システム | |
JPS5947641A (ja) | 名刺デ−タベ−ス作成装置 | |
JP2006243830A (ja) | 画像機器を利用したワークフロー支援システム及びワークフロー検索システム | |
US8712155B2 (en) | Device for identifying types of document files | |
JP5324831B2 (ja) | 証憑管理装置および証憑管理方法 | |
JP4788205B2 (ja) | 文書検索装置及び文書検索プログラム | |
US20070140568A1 (en) | History control apparatus | |
JPH09282328A (ja) | 文書画像処理装置及びその方法 | |
JP5445740B2 (ja) | 画像処理装置、画像処理システムおよび処理プログラム | |
JP2007034924A (ja) | ネットワークシステム | |
JP2009223390A (ja) | 画像処理監視システム及びプログラム | |
JP4517822B2 (ja) | 画像処理装置及びプログラム | |
JP2009182530A (ja) | 業務処理遂行支援装置 | |
JP2001101213A (ja) | 情報処理装置、ドキュメント管理装置、情報処理システム、情報管理方法、及び記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080612 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080612 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110621 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110704 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140729 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4788205 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |