JP5514002B2 - 検索装置及び方法及びプログラム - Google Patents
検索装置及び方法及びプログラム Download PDFInfo
- Publication number
- JP5514002B2 JP5514002B2 JP2010135605A JP2010135605A JP5514002B2 JP 5514002 B2 JP5514002 B2 JP 5514002B2 JP 2010135605 A JP2010135605 A JP 2010135605A JP 2010135605 A JP2010135605 A JP 2010135605A JP 5514002 B2 JP5514002 B2 JP 5514002B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- document
- query
- key
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
インデックス作成対象のドキュメントの入力を受け付けるドキュメント入力手段と、
前記ドキュメントの全体または一部領域から、インデックスキーを抽出する位置を、該ドキュメントの全体または一部領域の各文字を数値的に表現された文字コードに変換したデータと予め定められた数値的比較条件に基づいて決定するインデックスキー抽出位置決定手段と、
インデックスキー抽出位置決定手段と、
前記ドキュメントの全体または一部領域から、前記位置にある1文字以上の文字の組み合わせからなるインデックスキーを抽出するインデックスキー抽出手段と、
前記インデックスキーと該インデックスキーが出現するドキュメントにおける出現位置を関連付けてインデックス記憶手段に出力するインデックス出力手段と、を有する。
ドキュメントの全体または一部領域から、1文字以上の文字の組み合わせからなるインデックスキーを抽出する位置を、文字とその近傍に存在する文字の文字コードの関係に基づいて決定する手段を含む。
前記検索クエリから、クエリキーを抽出する位置を、文字を表現する文字コードの特徴に基づいて決定するクエリキー抽出位置決定手段と、
前記検索クエリから、1文字以上の文字の組み合わせからなるクエリキーを抽出するクエリキー抽出手段と、
前記クエリキーに基づいて、前記インデックス記憶手段を検索し、その検索結果を出力する検索手段と、を更に有する。
検索クエリから、1文字以上の文字の組み合わせからなるクエリキーを抽出する位置を、文字とその近傍に存在する文字の文字コードの関係に基づいて決定する手段を含む。
また、本発明(請求項5)は、請求項1乃至4のいずれか1項において、前記文字コードを、Unicodeとする。
入力手段が、インデックス作成対象のドキュメントの入力を受け付けるドキュメント入力ステップと、
インデックスキー抽出位置決定手段が、前記ドキュメントの全体または一部領域から、インデックスキーを抽出する位置を、該ドキュメントの全体または一部領域の各文字を数値的に表現された文字コードに変換したデータと予め定められた数値的比較条件に基づいて決定するインデックスキー抽出位置決定手段と、
インデックスキー抽出位置決定ステップと、
インデックスキー抽出手段が、前記ドキュメントの全体または一部領域から、前記位置にある1文字以上の文字の組み合わせからなるインデックスキーを抽出するインデックスキー抽出ステップと、
インデックス出力手段が、前記インデックスキーと該インデックスキーが出現するドキュメントにおける出現位置を関連付けてインデックス記憶手段に出力するインデックス出力ステップと、を行う。
ドキュメントの全体または一部領域から、1文字以上の文字の組み合わせからなるインデックスキーを抽出する位置を、文字とその近傍に存在する文字の文字コードの関係に基づいて決定する。
クエリキー抽出位置決定手段が、前記検索クエリから、クエリキーを抽出する位置を、文字を表現する文字コードの特徴に基づいて決定するクエリキー抽出位置決定ステップと、
クエリキー抽出手段が、前記検索クエリから、1文字以上の文字の組み合わせからなるクエリキーを抽出するクエリキー抽出ステップと、
検索手段が、前記クエリキーに基づいて、前記インデックス記憶手段を検索し、その検索結果を出力する検索ステップと、を更に行う。
検索クエリから、1文字以上の文字の組み合わせからなるクエリキーを抽出する位置を、文字とその近傍に存在する文字の文字コードの関係に基づいて決定する。
また、本発明(請求項10)は、請求項6乃至9のいずれか1項において、前記文字コードを、Unicodeとする。
図1は、本発明の第1の実施の形態におけるサーバの構成を示す。
図3は、本発明の第1の実施の形態における検索インデックス作成処理のフローチャートである。
図9は、本発明の第1の実施の形態における検索問い合わせ作成処理のフローチャートである。
本実施の形態は第1の実施の形態から、検索インデックス作成時におけるキー抽出位置決定(ステップ13)、検索問い合わせ時におけるキー抽出位置決定(ステップ19)のみを変更したものであり、その他の処理方法は第1の実施の形態と同様である。
本実施の形態は第1の実施の形態から、検索インデックス作成時におけるキー抽出位置決定(ステップ13)、検索問い合わせ時におけるキー抽出位置決定(ステップ19)のみを変更したものであり、その他の処理方法は第1の実施の形態と同様である。
200 ドキュメント読み取り装置
201 光学文字認識装置
300 サーバ部
301 データ入力部
302 キー抽出位置決定部
303 キー抽出部
304 検索インデックス出力部
305 検索インデックスDB
306 サーバ側データ送受信部
307 検索問い合わせ部
308 コンテンツDB
400 クライアント部
401 ドキュメント撮影部
402 クライアント側データ送受信部
403 コンテンツ表示部
Claims (11)
- 改ページや改行位置が確定しているドキュメント内の一部領域を検索クエリとして、該領域が出現するドキュメント及び該ドキュメント内における位置を取得する検索要求に応えるための検索インデックスを作成し、検索を行う検索装置であって、
インデックス作成対象のドキュメントの入力を受け付けるドキュメント入力手段と、
前記ドキュメントの全体または一部領域から、インデックスキーを抽出する位置を、該ドキュメントの全体または一部領域の各文字を数値的に表現された文字コードに変換したデータと予め定められた数値的比較条件に基づいて決定するインデックスキー抽出位置決定手段と、
前記ドキュメントの全体または一部領域から、前記位置にある1文字以上の文字の組み合わせからなるインデックスキーを抽出するインデックスキー抽出手段と、
前記インデックスキーと該インデックスキーが出現するドキュメントにおける出現位置を関連付けてインデックス記憶手段に出力するインデックス出力手段と、
を有することを特徴とする検索装置。 - 前記インデックスキー抽出位置決定手段は、
ドキュメントの全体または一部領域から、1文字以上の文字の組み合わせからなるインデックスキーを抽出する位置を、文字とその近傍に存在する文字の文字コードの関係に基づいて決定する手段を含む、
請求項1記載の検索装置。 - あるドキュメント内の一部領域を検索クエリとして受け付けるクエリ入力手段と、
前記検索クエリから、クエリキーを抽出する位置を、文字を表現する文字コードの特徴に基づいて決定するクエリキー抽出位置決定手段と、
前記検索クエリから、1文字以上の文字の組み合わせからなるクエリキーを抽出するクエリキー抽出手段と、
前記クエリキーに基づいて、前記インデックス記憶手段を検索し、その検索結果を出力する検索手段と、
を更に有する請求項1記載の検索装置。 - 前記クエリキー抽出位置決定手段は、
検索クエリから、1文字以上の文字の組み合わせからなるクエリキーを抽出する位置を、文字とその近傍に存在する文字の文字コードの関係に基づいて決定する手段を含む、
請求項3記載の検索装置。 - 前記文字コードを、Unicodeとする
請求項1乃至4のいずれか1項に記載の検索装置。 - 改ページや改行位置が確定しているドキュメント内の一部領域を検索クエリとして、該領域が出現するドキュメント及び該ドキュメント内における位置を取得する検索要求に応えるための検索インデックスを作成し、検索を行う検索方法であって、
入力手段が、インデックス作成対象のドキュメントの入力を受け付けるドキュメント入力ステップと、
インデックスキー抽出位置決定手段が、前記ドキュメントの全体または一部領域から、インデックスキーを抽出する位置を、該ドキュメントの全体または一部領域の各文字を数値的に表現された文字コードに変換したデータと予め定められた数値的比較条件に基づいて決定するインデックスキー抽出位置決定手段と、
インデックスキー抽出位置決定ステップと、
インデックスキー抽出手段が、前記ドキュメントの全体または一部領域から、前記位置にある1文字以上の文字の組み合わせからなるインデックスキーを抽出するインデックスキー抽出ステップと、
インデックス出力手段が、前記インデックスキーと該インデックスキーが出現するドキュメントにおける出現位置を関連付けてインデックス記憶手段に出力するインデックス出力ステップと、
を行うことを特徴とする検索方法。 - 前記インデックスキー抽出位置決定ステップにおいて、
ドキュメントの全体または一部領域から、1文字以上の文字の組み合わせからなるインデックスキーを抽出する位置を、文字とその近傍に存在する文字の文字コードの関係に基づいて決定する
請求項6記載の検索方法。 - クエリ入力手段が、あるドキュメント内の一部領域を検索クエリとして受け付けるクエリ入力ステップと、
クエリキー抽出位置決定手段が、前記検索クエリから、クエリキーを抽出する位置を、文字を表現する文字コードの特徴に基づいて決定するクエリキー抽出位置決定ステップと、
クエリキー抽出手段が、前記検索クエリから、1文字以上の文字の組み合わせからなるクエリキーを抽出するクエリキー抽出ステップと、
検索手段が、前記クエリキーに基づいて、前記インデックス記憶手段を検索し、その検索結果を出力する検索ステップと、
を更に行う請求項6記載の検索方法。 - 前記クエリキー抽出位置決定ステップにおいて、
検索クエリから、1文字以上の文字の組み合わせからなるクエリキーを抽出する位置を、文字とその近傍に存在する文字の文字コードの関係に基づいて決定する
請求項8記載の検索方法。 - 前記文字コードを、Unicodeとする
請求項6乃至9のいずれか1項に記載の検索方法。 - 請求項1乃至5のいずれか1項に記載の検索装置を構成する各手段としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010135605A JP5514002B2 (ja) | 2010-06-14 | 2010-06-14 | 検索装置及び方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010135605A JP5514002B2 (ja) | 2010-06-14 | 2010-06-14 | 検索装置及び方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012003355A JP2012003355A (ja) | 2012-01-05 |
JP5514002B2 true JP5514002B2 (ja) | 2014-06-04 |
Family
ID=45535287
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010135605A Active JP5514002B2 (ja) | 2010-06-14 | 2010-06-14 | 検索装置及び方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5514002B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06309382A (ja) * | 1993-04-26 | 1994-11-04 | Kayaba Ind Co Ltd | 画像情報処理装置 |
JP2000259673A (ja) * | 1999-01-06 | 2000-09-22 | Matsushita Electric Ind Co Ltd | 単語分割方法と装置 |
JP3696745B2 (ja) * | 1999-02-09 | 2005-09-21 | 株式会社日立製作所 | 文書検索方法及び文書検索システム及び文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2003132078A (ja) * | 2001-10-25 | 2003-05-09 | Toppan Printing Co Ltd | データベース構築装置、データベース構築方法、データベース構築プログラム、記録媒体 |
-
2010
- 2010-06-14 JP JP2010135605A patent/JP5514002B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012003355A (ja) | 2012-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5353148B2 (ja) | 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム | |
US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
US7669148B2 (en) | System and methods for portable device for mixed media system | |
US8064727B2 (en) | Adaptive image maps | |
US8838657B1 (en) | Document fingerprints using block encoding of text | |
US20070171482A1 (en) | Method and apparatus for managing information, and computer program product | |
US20070180471A1 (en) | Presenting digitized content on a network using a cross-linked layer of electronic documents derived from a relational database | |
JP2010073114A6 (ja) | 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム | |
US7359896B2 (en) | Information retrieving system, information retrieving method, and information retrieving program | |
CN105637509A (zh) | 在图像内搜索和注释 | |
US9310971B2 (en) | Document viewing device for display document data | |
EP1917637A4 (en) | DATA ORGANIZATION AND ACCESS FOR A MIXED MEDIA DOCUMENT SYSTEM | |
US20060167899A1 (en) | Meta-data generating apparatus | |
KR100917458B1 (ko) | 추천검색어 제공 방법 및 시스템 | |
JP2008269069A (ja) | 情報処理システム及び情報処理方法 | |
JP5484113B2 (ja) | 文書画像関連情報提供装置、及び文書画像関連情報取得システム | |
JP5384315B2 (ja) | 検索装置及び方法及びプログラム | |
JP2010092383A (ja) | 電子文書ファイル検索装置、電子文書ファイル検索方法及びコンピュータプログラム | |
JP2007011973A (ja) | 情報検索装置及び情報検索プログラム | |
US8566366B2 (en) | Format conversion apparatus and file search apparatus capable of searching for a file as based on an attribute provided prior to conversion | |
US9135517B1 (en) | Image based document identification based on obtained and stored document characteristics | |
JP5514002B2 (ja) | 検索装置及び方法及びプログラム | |
JP2016018279A (ja) | 文書ファイル検索プログラム、文書ファイル検索装置、文書ファイル検索方法、文書情報出力プログラム、文書情報出力装置及び文書情報出力方法 | |
JP2000020549A (ja) | 文書データベースシステムへの入力支援装置 | |
JP5223293B2 (ja) | 位置表現抽出装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121204 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20131001 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131010 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131112 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140325 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140328 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5514002 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |