JP2012084179A - 文書検索装置、文書検索方法、プログラム及び記憶媒体 - Google Patents
文書検索装置、文書検索方法、プログラム及び記憶媒体 Download PDFInfo
- Publication number
- JP2012084179A JP2012084179A JP2012009410A JP2012009410A JP2012084179A JP 2012084179 A JP2012084179 A JP 2012084179A JP 2012009410 A JP2012009410 A JP 2012009410A JP 2012009410 A JP2012009410 A JP 2012009410A JP 2012084179 A JP2012084179 A JP 2012084179A
- Authority
- JP
- Japan
- Prior art keywords
- document
- image
- search
- thumbnail
- display
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 84
- 238000003860 storage Methods 0.000 title claims description 21
- 238000012545 processing Methods 0.000 description 109
- 230000008569 process Effects 0.000 description 49
- 230000006870 function Effects 0.000 description 37
- 238000010586 diagram Methods 0.000 description 18
- 230000010365 information processing Effects 0.000 description 12
- 238000007639 printing Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 10
- 230000004044 response Effects 0.000 description 10
- 238000000605 extraction Methods 0.000 description 7
- 238000011161 development Methods 0.000 description 6
- WBMKMLWMIQUJDP-STHHAXOLSA-N (4R,4aS,7aR,12bS)-4a,9-dihydroxy-3-prop-2-ynyl-2,4,5,6,7a,13-hexahydro-1H-4,12-methanobenzofuro[3,2-e]isoquinolin-7-one hydrochloride Chemical compound Cl.Oc1ccc2C[C@H]3N(CC#C)CC[C@@]45[C@@H](Oc1c24)C(=O)CC[C@@]35O WBMKMLWMIQUJDP-STHHAXOLSA-N 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000010923 batch production Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000001149 cognitive effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
【課題】 画像検索を用いた文書検索において、検索結果リスト中に文書の概要と画像検索によってヒットした画像が置かれている文書中の文脈とを効率よく表示すること。
【解決手段】 文書検索装置は、入力された検索条件に合致する画像を含む文書データを検索する文書検索部と、文書検索部の検索結果に基づいて、検索条件と合致する文書データの一覧表示を表示部に表示する検索結果リスト表示部と、検索結果リスト表示部による一覧表示中に、検索条件に合致したページまたは画像要素に関する第1サムネール画像と、検索条件に合致したページまたは画像要素を含む文書データを構成する別のページまたは別の画像要素に関する第2サムネール画像と、を表示するサムネール表示部とを備える。
【選択図】 図1
【解決手段】 文書検索装置は、入力された検索条件に合致する画像を含む文書データを検索する文書検索部と、文書検索部の検索結果に基づいて、検索条件と合致する文書データの一覧表示を表示部に表示する検索結果リスト表示部と、検索結果リスト表示部による一覧表示中に、検索条件に合致したページまたは画像要素に関する第1サムネール画像と、検索条件に合致したページまたは画像要素を含む文書データを構成する別のページまたは別の画像要素に関する第2サムネール画像と、を表示するサムネール表示部とを備える。
【選択図】 図1
Description
本発明は、文書検索技術に関する。
ストレージ技術の進化および低コスト化が進み、大量の文書データを蓄積管理することが可能となっている。ファイルサーバ、文書管理システム、およびグループウェアなどが普及し、また、高機能化および高性能化が進んでいる。また情報処理装置が進化する一方で、コピー機、プリンタ、イメージスキャナ、ファクス、デジタルカメラ、文書ストレージや画像の送受信機能を備えた複合機(MFP)などの各種の映像事務機器がネットワーク対応している。ネットワーク環境においては、情報処理装置や各種映像事務機器群の間で大量の文書データの交換が常時行われているが、オフィスのネットワークを流通する文書トラフィックを積極的にストアするストレージインフラストラクチャが実用化されつつある。
特許文献1では、操作者の手を煩わすことなく確実に、必要な画像の控えを残す複合画像処理装置を提供するために、少なくとも2つの画像データ出力装置が接続できる複合画像処理装置を開示している。
ストアされた膨大な文書の中から所望の文書を効率的に検索するためには、テキストだけでなく画像主体の文書の検索にも配慮することが重要である。プレゼンテーション資料やグラフィクス、ビジュアルを多用した文書など、テキストでない画像主体の文書ではフルテキストサーチだけでは不十分である。また、手元にある画像を検索キーにしてその画像を含む文書を検索したい場合、フルテキストサーチだけではうまく機能しない。
画像を検索キーとして類似画像を検索する類似画像検索の手法が多く知られている。画像中のエッジなどからオブジェクトを抽出し形状を判定し形状やその配置や配色や複数のオブジェクト間の位置関係などを用いるものや、画像全体を構成する支配的な色の組み合わせや配色パターンをヒストグラムなどで抽出して用いるものなどがある。
例えば、特許文献2では、認知的な類似性判定に近い特性を持つ特徴量を導き出す数学処理を用いる類似画像検索の手法を開示している。
特許文献3は複数ページからなる文書をテキスト検索し、ヒットしたテキストに対応するテキストイメージを含むページまたは複数ページ(テキストが2ページにまたがっていた場合は両方のページ)を表示する構成を開示する。
画像検索技術を用いた文書検索において、検索結果としてただ1つの文書が得られるケースはむしろまれであり、多くの場合、検索後に検索にヒットした相当数の文書の中から所望の文書をユーザの判断により見出す工程を要する。その理由は、大規模なストレージインフラストラクチャにおいては実際に同一の画像を再利用したり改良したりして含む複数の文書が存在する場合が多いからである。また、画像の類似度はアナログな連続量であり、異なる画像の組であってもある程度の類似度を持つからである。また、「似ている」という判断の基準は、検索の目的に応じたユーザの主観に基づくため恣意的である。ユーザの主観に常に完全に合致した類似度評価を自動的に行うことは不可能である以上、類似画像検索は相当数の候補まで絞り込むために用いるだけで、所望の文書を見出す作業はユーザの主観に委ねるべきだからである。さらに、ある程度の幅を持って相当数の検索結果文書をユーザに提示することにより、ユーザの発想を刺激し創造的な作業を支援することが期待できる場合もある。
特許文献2等に開示されている画像検索技術を用いた文書検索では、検索結果リストは相当数の文書を含みかつノイズ(所望以外の文書)も多く含むものになる。そのため、ユーザがリストを一覧してその中から所望の文書を見つけ出す効率が重要となる。
例えば、検索にヒットした画像が複数の文書に含まれている場合、複数の文書が文書検索結果リストにあげられることになるが、その画像がおかれている文脈に依存して所望の文書であったりなかったりする場合もある。テキスト主体の文書であれば、文章の要約技術を用いて自動的に概要を生成し、検索結果リストの中に文書の概要を表示することによって、ユーザが所望の文書を選択しやすくする検索システムは構成できる。しかしながら、テキストに基づく要約では画像の情報を表現できない。
特許文献3はテキストベースの検索結果が文書内の複数のページにまたがる場合の表示を示しているが、類似画像検索による文書検索の結果一覧からユーザの目によって所望の文書を選び出す効率の向上にはつながらない。
本発明は、画像検索を用いた文書検索において、検索結果リスト中に文書の概要と画像検索によってヒットした画像が置かれている文書中の文脈とを効率よく表示することを可能にする文書検索技術の提供を目的とする。
あるいは、本発明は、ユーザが大量でノイズの多い検索結果リストの中からすばやく所望の文書を見つけ出すことを可能にする文書検索技術の提供を目的とする。
上記の少なくともいずれかの目的を達成する本発明に係る文書検索装置は、
入力された検索条件に合致する画像要素を含む文書データを検索する文書検索手段と、
前記文書検索手段の検索結果に基づいて、前記検索条件に合致する画像要素を含む文書データの一覧表示を表示手段に表示する検索結果リスト表示手段と、
前記検索結果リスト表示手段による前記一覧表示中に表示される文書データそれぞれに対して、前記検索条件に合致した画像要素に関する第1サムネール画像と、当該表示される文書データに含まれ且つ前記検索条件に合致した画像要素と異なる別の画像要素に関する第2サムネール画像との両方を表示するサムネール表示手段と
を備え、
前記一覧表示中に表示される文書データそれぞれに対して前記サムネール表示手段により表示される前記第2サムネール画像は、前記検索条件に合致した画像要素に隣接する画像要素に関するサムネール画像と、当該文書データの先頭の画像要素に関するサムネール画像との両方を含むことを特徴とする。
入力された検索条件に合致する画像要素を含む文書データを検索する文書検索手段と、
前記文書検索手段の検索結果に基づいて、前記検索条件に合致する画像要素を含む文書データの一覧表示を表示手段に表示する検索結果リスト表示手段と、
前記検索結果リスト表示手段による前記一覧表示中に表示される文書データそれぞれに対して、前記検索条件に合致した画像要素に関する第1サムネール画像と、当該表示される文書データに含まれ且つ前記検索条件に合致した画像要素と異なる別の画像要素に関する第2サムネール画像との両方を表示するサムネール表示手段と
を備え、
前記一覧表示中に表示される文書データそれぞれに対して前記サムネール表示手段により表示される前記第2サムネール画像は、前記検索条件に合致した画像要素に隣接する画像要素に関するサムネール画像と、当該文書データの先頭の画像要素に関するサムネール画像との両方を含むことを特徴とする。
あるいは、上記の少なくともいずれかの目的を達成する本発明に係る文書検索方法は、表示手段を備える文書検索装置の文書検索方法であって、
前記文書検索装置の文書検索手段が、入力された検索条件に合致する画像要素を含む文書データを検索する文書検索工程と、
前記文書検索装置の検索結果リスト表示手段が、前記文書検索工程の検索結果に基づいて、前記検索条件に合致する画像要素を含む文書データの一覧表示を前記表示手段に表示する検索結果リスト表示工程と、
前記文書検索装置のサムネール表示手段が、前記検索結果リスト表示工程による前記一覧表示中に表示される文書データそれぞれに対して、前記検索条件に合致した画像要素に関する第1サムネール画像と、当該表示される文書データに含まれ且つ前記検索条件に合致した画像要素と異なる別の画像要素に関する第2サムネール画像との両方を表示するサムネール表示工程と
を有し、
前記一覧表示中に表示される文書データそれぞれに対して前記サムネール表示工程で表示される前記第2サムネール画像は、前記検索条件に合致した画像要素に隣接する画像要素に関するサムネール画像と、当該文書データの先頭の画像要素に関するサムネール画像との両方を含むことを特徴とする。
前記文書検索装置の文書検索手段が、入力された検索条件に合致する画像要素を含む文書データを検索する文書検索工程と、
前記文書検索装置の検索結果リスト表示手段が、前記文書検索工程の検索結果に基づいて、前記検索条件に合致する画像要素を含む文書データの一覧表示を前記表示手段に表示する検索結果リスト表示工程と、
前記文書検索装置のサムネール表示手段が、前記検索結果リスト表示工程による前記一覧表示中に表示される文書データそれぞれに対して、前記検索条件に合致した画像要素に関する第1サムネール画像と、当該表示される文書データに含まれ且つ前記検索条件に合致した画像要素と異なる別の画像要素に関する第2サムネール画像との両方を表示するサムネール表示工程と
を有し、
前記一覧表示中に表示される文書データそれぞれに対して前記サムネール表示工程で表示される前記第2サムネール画像は、前記検索条件に合致した画像要素に隣接する画像要素に関するサムネール画像と、当該文書データの先頭の画像要素に関するサムネール画像との両方を含むことを特徴とする。
本発明に拠れば、画像検索を用いた文書検索において、検索結果リスト中に文書の概要と画像検索によってヒットした画像が置かれている文書中の文脈とを効率よく表示することが可能になる。
あるいは、本発明に拠れば、ユーザが大量でノイズの多い検索結果リストの中からすばやく所望の文書を見つけ出すことが可能になる。
以下、図面を参照して、本発明の好適な実施形態を例示的に詳しく説明する。ただし、この実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術的範囲は、特許請求の範囲によって確定されるのであって、以下の個別の実施形態によって限定されるわけではない。
(画像処理システムの構成)
図1は、実施形態に係る画像処理システムの全体構成を示すブロック図である。図1において、画像処理システムは、互いにネットワークを介して接続された画像処理装置110,120,130とパーソナルコンピュータ(情報処理装置)101、102とサーバシステム140とから構成される。ネットワークは、例えばLAN(Local Area Network)100で構成される。
図1は、実施形態に係る画像処理システムの全体構成を示すブロック図である。図1において、画像処理システムは、互いにネットワークを介して接続された画像処理装置110,120,130とパーソナルコンピュータ(情報処理装置)101、102とサーバシステム140とから構成される。ネットワークは、例えばLAN(Local Area Network)100で構成される。
画像処理装置110は、画像入力デバイスであるスキャナ113、画像出力デバイスであるプリンタ114、制御ユニット111、ユーザインタフェースである操作部112から構成される。スキャナ113、プリンタ114、操作部112はそれぞれ、制御ユニット111に接続されて、制御ユニット111からの命令によって制御される。制御ユニット111は、LAN100に接続されている。
また、画像処理装置120、130は、画像処理装置110と同様の構成となっている。
パーソナルコンピュータ101は、複数のユーザのそれぞれが主に個人的に使用する情報処理装置であり、ユーザが利用するアプリケーションプログラムやユーザのデータ等を格納している。
サーバシステム140は、サーバコンピュータ141と大規模ストレージ装置142から構成される。
サーバコンピュータ141は、複数のユーザやクライアントシステムに対してサービスを提供するサーバアプリケーションや共有データ等を格納している。大規模ストレージ装置142は、高性能で信頼性が高い大規模な二次記憶装置であり、主にサーバコンピュータ141上で稼動するデータベース管理システム(DBMS)のデータ等を格納している。
サーバシステム140によってサービスされるサーバアプリケーションのひとつは、ネットワーク全域に渡り流通するジョブデータ(例えば、印刷データやスキャンデータ)をアーカイブ(即ち蓄積管理)するデータベース(DB)アプリケーションである。このサーバアプリケーションを以下ジョブアーカイブアプリケーションと呼ぶ。ジョブアーカイブアプリケーションは、ネットワークに接続された他の装置群にそれぞれ組み込まれたソフトウェアと連携して、ジョブアーカイブシステムと呼ばれる分散アプリケーションを構成する。
図1のシステムにおいて、パーソナルコンピュータ101は、画像処理装置110、120、130や、サーバシステム140などとLAN100を介して連携する。例えば、パーソナルコンピュータ101は、画像処理装置110との間で文書データ(以下、単に「文書」ともいう)を送受信する。そして、プリント、スキャン、ファクス送信と受信、ボックス(画像処理装置110に組み込みの文書管理システム)への蓄積とリトリーブ、などのジョブを実行する。文書を処理するジョブを実行するとき、サーバシステム140上で稼動するジョブアーカイブアプリケーションが、ジョブ情報とジョブの処理対象文書データの控えをアーカイブする。例えば、プリントジョブの場合、パーソナルコンピュータ101のプリンタドライバが画像処理装置110へジョブを投入するとともに、サーバシステム140へもそのジョブに関連する情報と処理対象文書のデータを送信することで、アーカイブが達成される。
図1のシステムにおいて、画像処理装置110は、他の画像処理装置120、130や、パーソナルコンピュータ101、102や、サーバシステム140などとLAN100を介して連携する。例えば、画像処理装置110は、原稿の画像をスキャンしてデジタルデータ化して他の装置へ送信することが可能である。あるいは、画像処理装置110は、他の装置が保有しているデータをリトリーブしてプリントしたりローカルのボックスへ蓄積したり更に他の装置へ転送したりするジョブを実行することも可能である。
これらの文書を処理するジョブを実行するときにも、サーバシステム140上で稼動するジョブアーカイブアプリケーションが、ジョブ情報とジョブの処理対象文書データの控えをアーカイブする。例えば、プッシュスキャンジョブの場合、画像処理装置110の「送信」アプリケーションが、原稿文書をスキャナで読み取ったデジタル文書データを本来の送信宛先に送信する。そして、送信とともに、サーバシステム140へもそのジョブに関連する情報(ジョブ情報)と処理対象文書のデータを送信することで、アーカイブが達成される。
このようにして、ネットワーク全域に渡り流通するジョブ文書はジョブアーカイブアプリケーションによりアーカイブされている。
(ジョブアーカイブアプリケーションのソフトウェア構成)
図2は、サーバシステム140において稼動するジョブアーカイブアプリケーションのソフトウェア構成を示すブロック図である。
図2は、サーバシステム140において稼動するジョブアーカイブアプリケーションのソフトウェア構成を示すブロック図である。
データベース管理システム(DB管理システム)201は、大量のレコードを含む大容量のデータを、レコード間の関連とともに構造化したデータベースとして格納する。また、SQL(Structured Query Language)などの問い合わせ言語による問い合わせに応じて、条件に合致するレコードをデータベースから高速にリトリーブする。DB管理システム201は、文書DB202、ジョブDB203、インデクスDB204を含む。DB管理システム201はよく知られたリレーショナルデータベースやオブジェクト指向データベースなどの実装によって実現できる。
文書DB202は、ジョブアーカイブシステムが蓄積管理する文書データを格納するデータベースである。文書の内容データと文書に関連するメタデータとを文書レコードとして格納している。文書DB202とジョブDB203とは、格納されるレコード間で相互に関連している。
ジョブDB203は、ジョブアーカイブシステムが蓄積管理するジョブデータをジョブレコードとして格納するデータベースである。ジョブDB203と文書DB202とは、格納されるレコード間で相互に関連している。
インデクスDB204は、ジョブアーカイブシステムが蓄積管理する文書データやジョブデータから、所望のデータを高速に検索するためのインデクスレコードを格納するデータベースである。インデクスDB204に格納されるインデクスレコードは、文書DB202およびジョブDB203内のレコードを参照している。
ストア部205は、画像処理装置110やパーソナルコンピュータ101などのクライアント装置から文書データおよびジョブデータを受信して、DB管理システム201に格納する格納要求受け付けモジュールである。ストア部205は、受信した文書データとジョブデータをDB管理システム201に格納する。また、ストア部205は、受信した文書データのデータ形式に応じてメタデータを生成するための処理を切り替える。受信した文書データが、画像スキャナで読み取ったり、デジタルカメラで撮影したり、ファクスで受信したりして生成されるラスタ画像文書データである場合、ストア部205は、文書データをラスタ画像ページ処理部206に送る。
受信した文書データがコード化された文書データであった場合、ストア部205は、展開部210にデータを送る。例えば、ストア部205は、ページ記述言語やベクタ表現された各種文書フォーマットを展開部210に送る。また、ストア部205は、デスクトップパブリッシングやワードプロセッサや表計算やプレゼンテーションやドローイングやペインティング等各種アプリケーションの文書フォーマットのデータを展開部210に送る。
ラスタ画像ページ処理部206は、ラスタ画像文書から文書を構成するページ(画像ページ)を切り分けて画像ページごとに処理するモジュールである。ラスタ画像ページ処理部206は、切り分けた画像ページを画像特徴抽出部207および画像構造解析部208に送る。
画像特徴抽出部207は、ラスタ画像データを解析して画像間の類似性判定の基準として用いる特徴データ(以下、単に「特徴」ともいう)を抽出するモジュールである。抽出された特徴データはDB管理システム201に送られ、DB管理システム201は受信した特徴データを格納する。類似画像検索に有効な特徴抽出の手法は種々のものが適用可能である。本実施形態では、特定のアルゴリズムには依存せず有効な手法を複数併用する。採用可能な手法には、たとえば以下のものを含む。
例えば、画像中のエッジなどからオブジェクトを抽出し、オブジェクトの形状を判定し形状やその配置や配色や複数のオブジェクト間の位置関係などを用いる手法がある。画像全体を構成する支配的な色の組み合わせや配色パターンをヒストグラムなどで抽出する手法もある。また、認知的な類似性判定に近い特性を持つ特徴量を導き出す各種の数学処理(たとえばフーリエ・メリン変換 Fourier Mellin Transforms)を用いる手法もある。特開2006−65866号公報(特願2005‐244684)により開示されるアプローチも好適な手法である。
画像構造解析部208は、ラスタ画像データからその構造を解析するモジュールである。画像構造解析部208は、領域分割(ブロックセレクション)或は像域分離などの手法を用いて、ひとかたまりの画像領域(画像ページ)から、それを構成する特性の異なる複数の領域に分解する。例えば、画像構造解析部208は、複数の領域(文字領域、画像領域、写真領域、グラフィクス領域、白黒領域、カラー領域等)に分解し、領域構造に関する解析と分類を行う。
また、背景などの下地バターンとその上に配置された文字や形状などのオブジェクトとの、レイヤ構造に関する解析と分類も行う。解析の結果得られた画像領域(あるいは画像レイヤ)のラスタ画像データを画像特徴抽出部207に送る。また、解析の結果得られたテキスト領域(またはテキストレイヤ)のラスタ画像データをOCR209に送る。また、解析の結果得られた構造情報はDB管理システム201に送り格納する。
OCR209は、文字が描画されたラスタ画像データを解析して文字認識するモジュールである。OCR209は、文字認識したテキストデータ(すなわち、Unicodeなどによってコード化されたデータ)をDB管理システム201に送り格納する。
インデクス生成部211は、文書DB202やジョブDB203から高速にデータを検索するためのインデクス情報を生成するモジュールである。インデクスは、検索キーとして与えられる画像に類似した画像を含む文書レコードを高速に検索したり、検索キーとして与えられるテキストを文書内容データやページ内容データの中に含む文書レコードを高速に全文検索したりするために予め生成される。また、インデクスは、検索キーとして与えられる条件に合致するメタデータを持つ文書レコードやジョブレコードを高速に検索したりするために予め生成される。インデクスの生成も、知られている複数の手法を併用できる。
全文検索のためのインデクスの生成には、例えば、N−グラム(N-gram)の手法を用いる。類似画像検索のためのインデクスの生成のためには、画像の特徴を表現する特徴ベクトルを予め分類(クラスタリング)したりハッシュ関数などによって順序づけたりしておく。インデクス生成部211によるインデクス生成は、文書データやジョブデータの追加登録や編集などによって文書DB202やジョブDB203が更新されたときに行われる。また、各DBの更新とは非同期に、バッチ処理としてインデクス生成することもできる。生成したインデクスはDB管理システム201のインデクスDB204に格納する。
リトリーブ部212は、画像処理装置110やパーソナルコンピュータ101などのクライアント装置から検索キー(検索キー画像または検索キーテキスト)とその検索条件を受け付けるモジュールである。また、リトリーブ部212は、受け付けた検索条件に応じてDB管理システム201から文書データを検索する。そして、ヒットした文書データや文書に関連するサムネール画像(以下、単に「サムネール」ともいう)やジョブデータ等のメタデータをクライアント装置に返信する。
文書検索部213は、文書検索要求に合致する文書を検索するモジュールである。文書検索部213は、検索要求と与えられた検索キーの型に応じて、文書の内容データに基づく検索や文書に含まれるページデータに基づく検索や文書のメタデータに基づく検索が可能である。また、文書検索部213は、文書に関連するジョブに基づく検索を組み合わせて、検索要求に合致する文書レコードの候補を複数探し出すことも可能である。
ページ検索部214は、文書に含まれるページデータに基づく検索の要求に応じて、文書DB202から、検索要求の条件に合致するページレコードの候補(およびそのページを含む文書)を複数探し出す。
類似画像検索部215は、検索キーとして与えられた画像に基づく類似画像検索の要求に応じて、検索キー画像に類似する画像を含むページ内容データを持つページレコード(およびそのページを含む文書)を複数探し出す。類似画像検索部215は、画像特徴抽出部207と同様の画像特徴抽出を検索キー画像に対して行い、特徴間の類似性をもとに類似画像を検索する。
DB操作部216は、クライアント装置からデータベースに対する操作や各データベース内のレコードに対する操作要求を受け付けて処理し結果を返送するデータベース操作モジュールである。クライアント装置には、サーバコンピュータ141の管理コンソールまたは画像処理装置110やパーソナルコンピュータ101などが含まれる。レコードに対する操作は、たとえば、メタデータ(タグなど)の追加や編集といった操作を含む。
(画像処理装置のハードウェア構成)
図3は、画像処理装置110のハードウェア構成を示すブロック図である。画像処理装置120、130も同じ構成を備えるものとする。
図3は、画像処理装置110のハードウェア構成を示すブロック図である。画像処理装置120、130も同じ構成を備えるものとする。
制御ユニット111は、スキャナ113やプリンタ114と接続する一方でLAN100や公衆回線(WAN)と接続することで、画像情報やデバイス情報の入出力を制御する。
CPU301は、制御ユニット111全体を制御するコントローラである。RAM302は、CPU301が動作するために使用するシステムワークメモリである。また、RAM302は、画像データを一時記憶するための画像メモリでもある。ROM303は、ブートROMであり、システムのブートプログラムが格納されている。HDD304は、ハードディスクドライブであり、システムソフトウェア、画像データを格納する。
操作部I/F306は、操作部(UI)112との間のインタフェースを司り、操作部112に表示すべき画像データを操作部112に対して出力する。また、使用者が操作部112を介して入力した情報を、CPU301に伝える役割を果たす。
ネットワークインタフェース(Network)308は、LAN100との接続を司り、LAN100に対して情報の入出力を行う通信手段として機能する。モデム(MODEM)309は、公衆回線との接続を司り、公衆回線に対して情報の入出力を行う通信手段として機能する。以上のデバイスがシステムバス307上に配置される。
イメージバスインターフェース(Image Bus I/F)305は、システムバス307と画像データを高速で転送する画像バス310とを接続し、データ構造を変換するバスブリッジである。画像バス310は、PCIバスまたはIEEE1394で構成される。
画像バス310には以下のデバイスが配置される。ラスタイメージプロセッサ(RIP)311は、ネットワークから送信されたPDLコードをビットマップイメージに展開する。デバイスI/F312は、画像入出力デバイスであるスキャナ113やプリンタ114と制御ユニット111とを接続し、画像データの同期系/非同期系の変換を行う。
スキャナ画像処理部313は、入力画像データに対し補正、加工、編集を行う。プリンタ画像処理部314は、プリント出力画像データに対して、プリンタ114の性能に応じた補正、解像度変換等を行う。画像回転部315は画像データの回転を行う。画像圧縮部316は、多値画像データに対してはJPEG圧縮伸長処理を行い、2値画像データに対してはJBIG、MMR、MHの圧縮伸長処理を行う。
(画像処理装置の外観)
図4は、画像処理装置110の外観を示す斜視図である。画像処理装置120、130も同等の外観を備える。尚、これ以降では、画像処理装置110について説明するが、画像処理装置120、130でも全く同じ構成が備えられ、全く同じ動作を行うことが可能である。
図4は、画像処理装置110の外観を示す斜視図である。画像処理装置120、130も同等の外観を備える。尚、これ以降では、画像処理装置110について説明するが、画像処理装置120、130でも全く同じ構成が備えられ、全く同じ動作を行うことが可能である。
画像入力デバイスであるスキャナ113は、原稿となる記録媒体(紙上)の画像を照明し、CCDラインセンサ(図示せず)を走査することによって、ラスターイメージデータを生成する。
使用者が原稿用紙を原稿フィーダ405のトレイ406にセットして、操作部112において読み取りの起動を指示すると、制御ユニット111のCPU301がスキャナ113に指示を与える。与えられた指示に基づき、トレイ406にセットされた原稿用紙は1枚ずつフィードされ、スキャナ113が原稿画像の読み取り動作を行う。
画像出力デバイスであるプリンタ114は、ラスターイメージデータを記録媒体(用紙)に印刷し、出力する。印刷方式は、感光体ドラムや感光体ベルトを用いた電子写真方式、微少ノズルアレイからインクを吐出して記録媒体(用紙)上に直接画像を形成するインクジェット方式等があるが、どの方式であってもよい。なお、印刷動作は、CPU301からの指示によって起動される。
プリンタ114は、異なる用紙サイズまたは異なる用紙向きを選択できるように複数の給紙段を持ち、それに対応した用紙カセット401、402、403を備える。また、排紙トレイ404は、印刷し終わった用紙を受ける。
(画像処理装置の操作部)
図5は、画像処理装置110の操作部112の構成を示す平面図である。尚、画像処理装置120、130の操作部も同等の構成を備える。
図5は、画像処理装置110の操作部112の構成を示す平面図である。尚、画像処理装置120、130の操作部も同等の構成を備える。
LCD表示部501は、LCD(液晶表示装置)上にディスプレイ502にタッチパネルシートが貼られた構成になっている。LCD表示部501は、画像処理装置110の操作画面およびソフトキーを表示するとともに、表示してあるキーが押された場合には、押された位置を示す位置情報が制御ユニット111のCPU301に伝える。
スタートキー505は、原稿画像の読み取り動作を開始する場合等に操作されるキーである。スタートキー505の中央部には、緑と赤の2色LED表示部506があり、その色によってスタートキー505を操作できる状態であるか否かを示す。ストップキー503は、稼働中の画像処理装置110の動作を止めたい場合に操作されるキーである。IDキー507は、使用者のユーザIDを入力するときに操作されるキーである。また、リセットキー504は、操作部112からの設定を初期化するときに操作されるキーである。
(操作部及び操作部I/Fの内部構成)
図6は、画像処理装置110の操作部112及び操作部I/F306の内部構成を制御ユニット111の内部構成と対応させて示すブロック図である。尚、これ以降では、画像処理装置110について説明するが、画像処理装置110を画像処理装置120または画像処理装置130と読み替えても全く何ら支障は無い。
図6は、画像処理装置110の操作部112及び操作部I/F306の内部構成を制御ユニット111の内部構成と対応させて示すブロック図である。尚、これ以降では、画像処理装置110について説明するが、画像処理装置110を画像処理装置120または画像処理装置130と読み替えても全く何ら支障は無い。
上述したように、操作部112は、操作部I/F306を介してシステムバス307に接続される。システムバス307には、CPU301、RAM302、ROM303、ハードディスクドライブ(HDD)304が接続されている。CPU301は、ROM303とHDD304に記憶された制御プログラム等に基づいて、システムバス307に接続される各種デバイスとのアクセスを総括的に制御する。また、CPU301は、デバイスI/F312を介して接続されるスキャナ113から入力情報を読み込み、またデバイスI/F312を介して接続されるプリンタ114に出力情報としての画像信号を出力する。RAM302はCPU301の主メモリ、ワークエリア等として機能する。
ディスプレイ502のタッチパネルや各種ハードキー503、504、505、507からのユーザ入力情報は、入力ポート601を介してCPU301に渡される。CPU301は、ユーザ入力情報の内容と制御プログラムとに基づいて表示画面データを生成し、画面出力デバイスを制御する出力ポート602を介して、LCD表示部501に表示画面データを出力する。また、必要に応じて2色LED表示部506を制御する。
図7は、画像処理装置110の操作部112に表示される標準的な操作画面の一例を示す図である。
図7の最上部の表示領域701に並んでいるボタン群は、画像処理装置110が提供する各種機能から1つを選択するためのボタン群である。コピー機能704は、スキャナ113でスキャンし読み取った原稿画像データをプリンタ114でプリントして原稿の複写物を得るための機能である。
送信機能705は、スキャナ113で読み取った原稿画像データやHDD304に蓄積されている画像データを各種出力先に送信するための機能である。出力先としては、ネットワークインタフェース308経由で各種のプロトコルによって送信可能な各種の出力先、および、モデム309経由でファクシミリなどのプロトコルによって送信可能な各種の出力先がある。送信機能705により複数の出力先を選択して送信することができる。
ボックス機能706は、HDD304に蓄積されている画像データやコードデータなどの文書ファイルを閲覧、編集、プリント、および送信するための機能である。HDD304に蓄積される文書ファイルには、スキャナ113によって読み取った原稿画像データ、ネットワークインタフェース308経由でダウンロードしたデータが含まれる。また、HDD304に蓄積される文書ファイルにはネットワークインタフェース308経由で他の装置から受信したプリントデータを蓄積したデータ、モデム309経由で他の装置から受信したファクシミリデータなどが含まれる。
ボックス機能706は、ユーザのオフィス環境において電子的なメールボックスとして利用できる。また、パスワードを入力するまで用紙へのプリント出力を遅延することによって、PDLプリントジョブの守秘性を高めるセキュアドプリントとして利用することもできる。
ボックス機能706の利用により、他の画像処理装置120、130のHDDや情報処理装置101、102が公開する共有ファイルシステムにアクセスし、データの閲覧、編集、プリント、および送信が可能になる。ボックス機能706によりサーバシステム140の共有ファイルシステムやデータベースシステム等に蓄積されている画像データやコードデータ等の文書ファイルにアクセスし、データの閲覧、編集、プリント、送信が可能になる。
拡張機能707は、スキャナ113を外部装置から利用するために、各種の拡張機能を呼び出すための機能である。
検索機能708は、画像処理装置110のボックスや、他の画像処理装置のボックス等から所望の文書を検索するための機能である。検索機能708により、情報処理装置が公開する共有ファイルシステムや、サーバシステム140がサービスする共有ファイルシステムやデータベースシステムから、所望の文書を検索することが可能である。
図7の中間部分の表示領域702は、コピー機能704が選択された場合の操作画面を表示している。図7の最下部の表示領域703はステータス表示領域であり、最上部の表示領域701で選択された機能の如何に関わらず、画像処理装置110の各機能や装置自体の情報などの各種のメッセージをユーザに対して表示する。
図8は、DB管理システム201に格納される各データベースの概略的な構成を示す図である。
文書DB202は、複数の文書レコード801を含む。文書レコード801は、ユーザが取り扱う紙文書や電子的な文書ファイルに対応するレコードである。文書レコード801は、文書メタデータ802、文書内容データ803、および複数のページレコード804を含む。
文書メタデータ802は、文書レコードに対応する文書に関連する各種のメタデータを格納するレコードである。文書メタデータ802は、対応する文書に関して、文書名、作者、作成日付、データ形式、データサイズ、ページ数、タグ、および、ジョブ履歴などを含む。
「タグ」とは、文書にユーザがつけた任意の文字列からなるキーワードのような情報である。タグに基づいて文書の検索が可能である。ユーザはひとつの文書に対して複数のタグを自由につけることができるので、タグを文書に付加することにより文書をさまざまな基準で分類したり検索しやすくしたりすることが可能である。共有の文書に対して、その文書を後で参照したり利用したりするために、複数のユーザが後からタグを追加していくこともできる。これによって文書を分類や検索するためのメタデータを飛躍的に充実させることが期待できる。
このアプローチをフォークソノミー (folksonomy) と呼ぶ場合がある。「Folksonomy 」とは 「folks」(言葉づかい) と 「taxonomy」(分類法) を組み合わせた用語である。
ジョブ履歴は、文書を処理対象として実行された一連のジョブを特定する参照情報のリストである。1つの文書レコードは複数のジョブレコードへの参照を保持する場合がある。たとえば、明らかに同一と特定できる文書を複数のジョブが処理対象とした場合である。
文書内容データ803は、文書そのものの内容に対応するデータである。コード化された文書データが格納された場合における、テキストやアプリケーションプログラムのデータなどが相当する。紙の原稿に対応しスキャナ113で読み取られたラスタ画像データのように、文書を構成するページが明確に分離している場合は、ページレコード804に内容データを含める。
ページレコード804は、文書を構成するページのそれぞれに対応するレコードである。スキャナ113で読み取ったラスタ画像データ群や、アプリケーションプログラムのデータを展開部210で展開してページ単位に分割した画像データや構造情報やテキストやメタデータ群等が、夫々のページレコードに対応する。
ページレコードは、ページメタデータ805とページ内容データ806などを含む。ページメタデータ805は、ページレコードに対応するページに関連する各種のメタデータを格納するレコードである。ページメタデータ805は、構造情報、特徴、サムネールなどを含む。構造情報は、画像構造解析部208や展開部210が解析して格納したページの構造に関する情報である。
特徴は、画像特徴抽出部207が抽出して格納したページを構成する画像の特徴を表現する情報である。
サムネールは、ページ全体の画像やページに含まれる画像要素を、解像度変換(または縮小変倍)して、比較的小さくて扱いやすいいくつかのサイズにした画像である。サムネール画像はページメタデータ805の生成時に生成してもよいし、外部からのリトリーブに応えるために必要となったときオンデマンドに生成してもよい。また、スケジューリングされたバッチ処理によって、まだ生成されていないサムネール画像群をまとめて生成するタスクを非同期に実行してもよい。
ページ内容データ806は、ページそのものの内容に対応するデータである。紙原稿のページを画像スキャナで読み取ったラスタ画像データや、コード文書を展開部210でページにレンダリングした画像データなどページ単位の画像データが、ページ内容データ806に格納される。また、ページ画像をOCR209で文字認識して得たテキストデータや、コード文書を展開部210が展開して得たページ単位のテキスト情報なども、ページ内容データ806に格納される。
ジョブDB203は、複数のジョブレコード808を含む。ジョブレコード808は、ユーザが実行した文書処理ジョブの各々に対応するレコードである。ジョブレコード808は、日時、操作者、要求した装置、処理した装置、処理内容、および、処理文書などを含む。日時は、ジョブを実行した日時を表現するデータである。操作者は、ジョブを実行したユーザを特定するデータである。
処理を要求した装置は、ジョブ実行の要求元になった装置である例えば、パーソナルコンピュータ101から画像処理装置110にプリントした場合、要求元となる装置はパーソナルコンピュータ101である。
処理した装置は、ジョブを実質的に処理した装置である。例えば、パーソナルコンピュータ101から画像処理装置110にプリントした場合、処理した装置は画像処理装置110である。
処理内容は、ジョブの処理内容を特定する情報である。ジョブの種別、およびそれぞれのジョブ種別において選択可能な各種オプションと設定可能な各種パラメータをどのように選択・設定して処理したか特定する情報を含む。
処理文書は、このジョブが処理対象とした文書を特定する参照情報のリストである。1つのジョブレコードが複数の文書レコードを参照する場合がある。たとえば、1つのジョブが複数の文書を処理対象として実行された場合である。
インデクスDB204は、複数のインデクスレコード809を含む。インデクスレコード809は、文書DB202やジョブDB203から高速にデータを検索するためのインデクス情報であり複数の文書レコード801および複数のジョブレコード808を参照している。
インデクスレコードはインデクス生成部211によって生成される。インデクスレコードは、検索キーとして与えられる画像に類似した画像を含む文書レコードを高速に検索するために使用することが可能である。また、インデックスレコードは、検索キーとして与えられるテキストを文書内容データやページ内容データの中に含む文書レコードを高速に全文検索するために使用することが可能のである。更に、インデックスレコードは、検索キーとして与えられる条件に合致するメタデータを持つ文書レコードやジョブレコードを高速に検索したりするために使用することが可能である。
(検索処理の手順)
図9は、検索処理の手順を説明するフローチャートである。本検索処理は画像処理装置110のCPU301において実行される組み込みアプリケーションプログラムによって達成される。この組み込みアプリケーションを文書検索アプリケーションと呼ぶ。
図9は、検索処理の手順を説明するフローチャートである。本検索処理は画像処理装置110のCPU301において実行される組み込みアプリケーションプログラムによって達成される。この組み込みアプリケーションを文書検索アプリケーションと呼ぶ。
本フローチャートの一連の手順は、ユーザが操作部112の表示領域701中の「検索」ボタンを選択したときなどに開始する。
ステップS901で、文書検索機能の基本画面(検索画面)を操作部112の表示領域702に表示する。検索画面では、検索条件の設定、検索キーの入力、検索スタートなどができる。検索画面の構成は、図10によって説明する。
ステップS902で、ユーザの指示に応じて、検索キー画像を入力する。
ステップS903で、ユーザの指示に応じて、他の検索条件設定を入力する。
ステップS904で、ユーザからの検索開始指示が入力されるのを待機する。ユーザから検索開始が指示されるまでの間(S904−No)、ステップS902に戻り検索キー画像や他の検索条件設定の入力を繰り返す。ユーザから検索開始指示が入力されると(S904−Yes)、ステップS905に進む。
ステップS905で、検索処理を行う。文書検索アプリケーションは、サーバシステム140上で稼動するジョブアーカイブアプリケーションに接続し、リトリーブ部212に対して検索キーと検索条件を送信する。そして、リトリーブ部212による検索の結果、検索条件に合致(ヒット)した1つ以上の文書に関して、検索結果リストの表示に必要なデータを受信する。類似画像検索や全文検索の特徴上、相当数の文書が検索にヒットする場合が多い。検索結果リストを表示するために必要なデータは、ヒットした文書に対応する文書レコードに含まれるメタデータおよび文書レコードに関連付けられたジョブレコードに含まれるデータの一部である。
ステップS906で、ジョブアーカイブアプリケーションから受信した情報に基づいて検索結果リストを表示する。検索結果リスト表示の構成は、図11によって説明する。
ステップS907で、ユーザがサムネール表示設定変更を指示したか判定する。指示を受けた場合は(S907−Yes)、ステップS908に進み、サムネール表示設定を変更する。そして、ステップS906に処理が戻され、ステップS906で、変更されたサムネール表示設定に基づいて検索結果リストを再表示する。
ステップS907の判定で、サムネール表示設定変更指示が入力されない場合(S907−No)、処理はステップS909に進められる。
ステップS909で、ユーザが文書レコードフィルタ変更を指示したか判定する。指示を受けた場合は(S909−Yes)、ステップS910に進み、文書レコードフィルタを変更する。そして、ステップS906に処理が戻され、ステップS906で、変更された文書レコードフィルタに基づいて検索結果リストを再表示する。
ステップS909の判定で、文書レコードフィルタ変更指示が入力されない場合(S909−No)、処理はステップS911に進められる。
ステップS911で、ユーザが文書やページの詳細項目表示を指示したか判定する。指示を受けた場合は(S911−Yes)、ステップS912に進み、選択された文書やページやジョブに関する詳細情報を示すウィンドウを表示する。ユーザが詳細項目表示ウィンドウを閉じるとステップS906に戻り検索結果リストを再表示する。
ステップS911の判定で、詳細項目表示が入力されない場合(S911−No)、処理はステップS913に進められる。
ステップS913で、ユーザが文書レコードに対する操作を指示したか判定する。リスト中に示された文書レコードに対して可能な操作は、印刷、保存、送信、タグ付け、関連文書の検索表示、マーク付け、などがある。指示を受けた場合は(S913−Yes)、ステップS914に進み選択された指示に対応する文書レコード操作を実行する。次いで、ステップS906に戻り検索結果リストを再表示する。
ステップS915の判定で、文書レコード操作が入力されない場合(S913−No)、処理はステップS915に進められる。
ステップS915で、ユーザが再検索を指示したか判定する。指示を受けていない場合(S915−No)、ステップS906に戻り検索結果リストを再表示する。ステップS915の判定で再検索の指示を受けた場合は(S915−Yes)、ステップS901に戻り、再度一連の検索処理を実行する。
尚、この手順の一連の処理は情報処理装置101で実行してもよい。あるいは、一連の処理を部分に分割してそれぞれの処理を担当するソフトウェアを複数の装置上に配備して実行する分散アプリケーションとして構成することもできる。例えば、検索画面や検索結果リストの表示とユーザからの指示入力を画像処理装置110上で実行する。そして、それ以外の処理を情報処理装置101やサーバシステム140や他の画像処理装置120、130などの上で実行するように構成してもよい。
逆に、検索画面や検索結果リストの表示とユーザからの指示入力を情報処理装置101上で実行し、それ以外の処理を画像処理装置110やサーバシステム140の上で実行するように構成してもよい。情報処理装置101において文書検索アプリケーションを操作する場合、手元にスキャナ113を備える画像処理装置110において操作する場合よりも紙原稿の画像を検索キー画像として入力する操作は不便になることもある。この場合、予め画像処理装置110のボックス機能により蓄えた画像を、情報処理装置101や他の画像処理装置120などからも操作できるので、ボックスから選択した画像を検索キー画像として用いることは容易である。
尚、分散アプリケーションを構成する方法の1つとして、WebブラウザとWebサーバの組み合わせによって実現するWebアプリケーションの形態もある。
(文書検索画面の構成例)
図10は、文書検索アプリケーションの基本画面である文書検索画面の構成例を表す図である。文書検索画面1000は、文書検索アプリケーションの基本画面である。本実施形態における文書検索アプリケーションは文書検索画面を操作部112の表示領域702に表示する。文書検索画面1000は、検索条件設定領域1001、検索キー画像入力領域1002、および、検索スタート指示領域1003から構成される。
図10は、文書検索アプリケーションの基本画面である文書検索画面の構成例を表す図である。文書検索画面1000は、文書検索アプリケーションの基本画面である。本実施形態における文書検索アプリケーションは文書検索画面を操作部112の表示領域702に表示する。文書検索画面1000は、検索条件設定領域1001、検索キー画像入力領域1002、および、検索スタート指示領域1003から構成される。
検索条件設定領域1001は、検索条件を設定したり確認したりするための領域である。
検索条件ラジオボタン1004は、基本的な検索条件を選択し選択されている設定を確認するためのラジオボタンである。選択肢の「すべてのキーを含む」は、セットしたすべての検索キーにヒットする文書を検索することを示す。「いくつかのキーを含む」は、セットした検索キーのうちのいずれかにヒットする文書を検索することを示す。「高度な検索」は、検索オプションボタン1005によって設定したより詳細な検索条件の設定に基づいて、ヒットする文書を検索することを示す。
検索オプションボタン1005は、詳細な検索条件を設定するウィンドウを開くためのボタンである。詳細な検索条件の設定は、高度な検索モードで検索が実行されたときヒットする文書を判定する基準として用いる高度な検索条件の設定を含む。詳細な検索のオプションとして、メタデータ検索や全文検索を併用する条件を、類似画像検索と併用して設定できる。
メタデータ検索は、文書に対応する文書レコード801に関して、その文書メタデータやページメタデータ805群や対応するジョブレコード808にそれぞれ格納されているデータ項目ごとに検索条件を指定する検索方法である。メタデータ検索によって、タグ、文書名、所有者、作成日付、データ形式、ページ数、タグ、関連文書、などに基づく検索条件を指定できる。また、メタデータ検索によって、ジョブ履歴(日時、操作者、要求した装置、処理した装置、処理内容、このジョブにおいて処理した他の処理対象文書)、ページの構造情報、などに基づく検索条件を指定できる。
したがって、文書名や所有者や作成日時やタグなどに基づく一般的な検索に加えて、関連文書や過去にその文書が検索された履歴に基づいて検索することもできる。
メタデータ検索によれば、文書を構成するページに関して、方向がポートレート(縦長)か、ランドスケープ(横長)か、などの基準に基づいて検索することもできる。また、メタデータ検索によれば、用紙のサイズ、ページ数がnページ以上mページ未満、カラーかモノクロか、画像とテキストの割合はどの程度かなどの基準に基づいて検索することもできる。
また、メタデータ検索によれば、いつ、どこで、誰が、どのように処理した文書であるかという、ジョブに関連する基準に基づいて検索することもできる。
全文検索は、検索キーとしてテキスト(文字列)を設定し、文書の全テキスト中に設定された文字列を含む文書を検索する。文書のテキストは、文書レコード801に含まれる文書内容データ803、ページレコード804のいずれかに含まれるページ内容データに含まれているテキストである。
文書メタデータ802やページメタデータ805に含まれているテキスト形式のデータを全文検索の対象に加えることもできる。文書と関連するジョブレコード808に含まれているテキスト形式のデータを全文検索の対象に加え、ジョブレコード808がヒットした場合は対応する文書レコード801がヒットするように設定することもできる。
検索キー画像入力領域1002は、類似画像検索の検索キーとする画像を設定したり確認したりするための領域である。
原稿画像スキャンボタン1006は、画像処理装置のスキャナ113を用いて紙原稿を読み取り、類似画像検索の検索キーとして画像を入力するためのボタンである。原稿画像スキャンボタン1006が押されると、画像スキャンウィンドウを開く。画像スキャンウィンドウでは画像処理装置110のコピー機能や送信機能における原稿読み取り設定やTWAIN等に基づく一般的なスキャナデバイスドライバの原稿読み取り設定等と同様に原稿読み取りパラメータを設定できる。
スタートキー505が押されると、設定されている原稿読み取りパラメータに従って原稿画像をスキャンし、読み取った画像データを検索キー画像として入力する。原稿画像のスキャンが完了したとき画像スキャンウィンドウが開かれていれば閉じる。原稿画像スキャンボタン1006を押さず、スタートキー505が押された場合、デフォルトの原稿読み取りパラメータ、または、その時点までに設定されている原稿読み取りパラメータにしたがって原稿画像をスキャンする。
ボックス画像選択ボタン1007は、画像処理装置110のボックス機能を利用して、予め格納されている文書群の中から検索キー画像を選択するためのボタンである。ボックス機能によって、画像処理装置110のHDD304を閲覧して、検索キー画像として利用したい画像を含む文書を選択できる。
また、他の画像処理装置120、130のHDDや情報処理装置101、102が公開する共有ファイルシステムに、LAN100を介してアクセスし、閲覧し、検索キー画像として利用したい画像を含む文書を選択できる。あるいは、サーバシステム140がサービスする共有ファイルシステムやデータベースシステムなどの文書ファイルにLAN100を介してアクセスし、閲覧して、検索キー画像として利用したい画像を含む文書を選択できる。
検索キー画像設定領域1008は、セットされている検索キー画像の組を確認し操作するための領域である。
検索キー画像設定状況メッセージ1009は、検索キー画像のセット状況を示すメッセージであり、セットされている検索キー画像の個数などを表示する。
検索キー画像表示領域1010は、セットされている検索キー画像群を表示する領域である。この領域に、検索キーとしてセットされた画像に対応する検索キーアイコンの組が並べて表示される。原稿画像スキャンボタン1006やボックス画像選択ボタン1007を用いて検索キー画像を入力すると、対応する検索キーアイコンがこの領域に追加される。
検索キーアイコン1011は、1つの検索キー画像に対応するアイコンである。このアイコンを介して、検索キー画像に対する各種の操作を指示できる。
検索キーID1012は、検索キー画像を特定するための識別情報(識別子)である。
検索キーサムネール1013は、検索キー画像のサムネール画像である。検索キーサムネール1013が押されると、画像ビューアウィンドウを開きサムネールよりも大きなサイズで検索キー画像が表示される。画像ビューアウィンドウによって、ユーザは検索キー画像の詳細を確認できる。
検索キー概要1014は、検索キー画像に関する簡単な説明である。
検索キー詳細ボタン1015は、検索キー画像に関する詳細情報を確認するためのボタンである。検索キー詳細ボタン1015の操作により検索キー概要1014よりも詳細に検索キーに関する情報を表示する検索キー詳細ウィンドウを開くことができる。検索キー詳細ウィンドウでは、検索キー画像に固有の検索条件を設定することもできる。今後の検索するときこの検索キーを再利用するために、検索キー画像をボックスに保存することもできる。
検索キー編集ボタン1016は、検索キー画像を編集するためのボタンである。検索キー編集ボタン1016の操作により検索キー画像を編集するための検索キー編集ウィンドウを開くことができる。検索キー編集ウィンドウでは、検索キー画像に対してトリミング、マスキング、ノイズ除去などの各種画像処理を施して、所望の検索キー画像へと編集できる。また、検索キー画像を切り分けて、複数の検索キー画像に分割できる。また、複数ページ画像を含む文書に対応する1つの検索キーをページ画像単位に切り分けて、それぞれのページ画像に対応する検索キー画像に分割できる。
検索キー削除ボタン1017は、検索キー画像を検索キーの組から取り除くためのボタンである。検索スタート指示領域1003は、検索処理を起動するための領域である。
検索開始ボタン1018は、検索処理を開始するためのボタンである。検索開始ボタン1018が押されると検索条件設定領域1001の検索条件と検索キー画像入力領域1002の検索キー画像とを用いて、サーバシステム140のジョブアーカイブアプリケーションに対し検索処理要求を発行する。
(文書検索結果リスト画面の構成例)
図11は、文書検索アプリケーションの文書検索結果リスト画面の構成例を表す図である。文書検索結果リスト画面1100は、文書検索アプリケーションがジョブアーカイブアプリケーションから検索処理要求の応答を受信したときその検索結果を表示する画面の一例である。本実施形態における文書検索アプリケーションは文書検索結果リスト画面を操作部112の表示領域702に表示する。文書検索結果リスト画面1100は、検索リスト操作領域1101、検索リスト表示領域1102、スクロールバー1103から構成される。
図11は、文書検索アプリケーションの文書検索結果リスト画面の構成例を表す図である。文書検索結果リスト画面1100は、文書検索アプリケーションがジョブアーカイブアプリケーションから検索処理要求の応答を受信したときその検索結果を表示する画面の一例である。本実施形態における文書検索アプリケーションは文書検索結果リスト画面を操作部112の表示領域702に表示する。文書検索結果リスト画面1100は、検索リスト操作領域1101、検索リスト表示領域1102、スクロールバー1103から構成される。
検索リスト操作領域1101は、検索結果リストの表示を制御するための操作設定領域である。表示フィルタリング表示1104は、検索リスト表示領域1102に表示されている文書群が、検索の結果ヒットした複数の文書群に対してどのような表示フィルタを施した結果残った文書群であるかを示す表示である。図11の場合、検索の結果ヒットした「全文書」を表示している状態を示す。
サーバシステム140のリトリーブ部212から受信したヒット文書の組を全て表示することもできるし(すなわちフィルタなし)、またヒットした文書の中から表示を絞り込むための表示フィルタ設定した条件に従い選別して表示することもできる。
表示フィルタ設定ボタン(フィルタ)1105は、表示フィルタ条件を設定するためのボタンである。表示フィルタ設定ボタン1105が押されると、表示フィルタ設定ウィンドウを開き、ユーザに所望のフィルタ条件を設定させる。ヒットした文書群の文書レコード801に含まれる各種の情報に基づく条件をフィルタ条件に設定できる。文書メタデータ802、ヒットしたページのページレコード804のページメタデータ805、文書に関連付けられたジョブレコード808等に格納された各情報に対するパターンマッチングとして条件を設定できる。言い換えると、検索オプションボタン1005で設定できる詳細な検索のオプションと同様のフィルタ条件を設定できる。
例えば、文書名や作成日時やタグなどに基づく一般的なフィルタリングに加えて、関連文書や過去にその文書が検索された履歴に基づいてフィルタリングすることもできる。検索キーとなる検索条件と文書データとの類似度を絞込み込みを行うための表示フィルタ設定条件とすることも可能である。また、文書を構成するページに関して、方向がポートレート(縦長)か、ランドスケープ(横長)かなどの基準に基づいてフィルタリングすることもできる。また、用紙のサイズ、ページ数がnページ以上mページ未満、カラーかグレースケール(連続階調画像)か、白黒二値画像か、画像とテキストの割合はどの程度かなどの基準に基づいてフィルタリングすることもできる。また、いつ、どこで、誰が、どのように処理した文書であるかという、ジョブに関連する基準に基づいてフィルタリングすることもできる。
本実施形態によれば、検索でヒットした文書の組をすべて検索リスト表示領域1102に表示するだけでなく、特定の条件を満足する文書を抽出して一覧表示するフィルタを設定できる。さらに、設定を変更すると即時に検索結果リストが更新されるので、大量の候補文書の中から所望の文書を容易に見つけ出せる。
表示項目設定領域1106は、検索でヒットした文書の組を検索リスト表示領域1102に表示する際に、文書ごとに表示する項目を制御する領域である。チェックボックスの矩形またはチェックボックスにつけられたラベル文字列を押すたびに、チェックボックスの選択状態と非選択状態とが交互に切り替わる。「属性情報を表示」チェックボックスが選択されている場合、文書名、データ形式、ページ数、文書の所在情報、などの文書に関するメタデータ群を検索リスト表示領域1102に表示する。「サムネールを表示」チェックボックスが選択されている場合、検索条件にヒットしたページのサムネール画像を検索リスト表示領域1102に表示する。
文書サマリーサムネール設定領域1107は、検索でヒットした文書の組を検索リスト表示領域1102に表示する際に、文書ごとに表示する文書サマリーサムネールの表示形式を制御する領域である。表示項目設定領域1106の「サムネールを表示」チェックボックスが選択されており、かつ、「文書サマリーサムネールを表示」するチェックボックスが選択されている場合、文書サマリーサムネールを表示する。文書サマリーサムネールとは、その文書の概要を視覚的に把握しやすくするために、文書を構成するページに対応する一組のサムネールを並べたものである。
文書サマリーサムネール構成設定領域1108は、文書サマリーサムネールを構成するサムネール群の構成を設定する慮域である。文書サマリーサムネール構成設定領域1108には4つの数値入力用のテキスト入力フィールドが並べてあり、それぞれに「先頭」、「前」、「後」、「末尾」のラベル文字列をつけてある。「先頭」の数値によって、文書の先頭ページから何ページ分のサムネールを表示するか設定する。「前」の数値によって、検索でヒットしたページに先行するページのサムネールを何ページ分表示するか設定する。「後」の数値によって、検索でヒットしたページに後続するページのサムネールを何ページ分表示するか設定する。「末尾」の数値によって、文書の末尾ページから何ページ分のサムネールを表示するか設定する。
アニメーション表示チェックボックス1109は、文書サマリーサムネールをアニメーション表示設定するためのチェックボックスである。
再検索ボタン1110は、文書検索画面1000に戻るためのボタンである。
絞り込み検索ボタン1111は、文書検索画面1000に戻って絞り込み再検索を行うためのボタンである。検索リスト表示領域1102に表示された文書の中から検索キーとして追加したい文書(検索キーとして追加したい画像を含む文書)をマークしてから、絞り込み検索ボタン1111を押す。絞り込み検索ボタン1111が押下されると、マークをつけられた文書が検索キーとして検索キー画像表示領域1010に追加された状態で文書検索画面1000に戻り、絞り込み再検索を続行することが可能になる。
的確な検索キー画像をできるだけ多く簡便に追加することによって、所望の文書の検索ヒット率(設定された条件に合致する割合)が向上し、所望の文書を見つけ出しやすくできる。また、追加された検索キー画像の特徴量を分析し、類似度の判定における各種特徴量の配点を調整することによって、よりユーザの意図に即した類似画像検索を行うことが可能となる。
すなわち、ユーザが絞り込み検索によってあえて追加した検索キー画像は、検索を行うユーザの観点からみても主観的に類似度が高いサンプル画像であると判断できる。したがって、この検索キー画像の類似度がより高く評価されるように、複数の特徴量と類似度判定アルゴリズムを組み合わせる配点を調整することができる。例えば、元の検索キー画像と追加された検索キー画像の間で、形状に基づく類似度が高く色合いに基づく類似度が低かった場合は、絞り込み再検索では形状ベースの類似度を色合いよりも優先するように検索することができる。同様にして、色合い優先、配色パターン優先、オブジェクト構造木の類似度優先など、適切な調整を行うことができる。
検索リスト表示領域1102は、検索した結果、検索条件に合致した文書の一覧を表示する領域である。検索ヒット文書表示1112、1113、1114、1115は、それぞれ検索条件、絞り込みがかけられた条件に合致した文書に対応する情報を表示している。デフォルトの設定では、ヒット率(設定された条件に合致する割合)が高い文書ほどリストの上位に表示する。同等のヒット率(設定された条件に合致する割合)の場合、文書の価値を数値化した文書ランクが高い文書ほど上位に表示する。表示フィルタ設定ボタン1105を押して、デフォルト以外の順序で並べ替えて文書リストを表示し直すこともできる。例えば、文書の作成日、最終参照日、文書名、データ形式、ページ数、文書の所在情報、その文書を対象としたジョブの日時や装置や処理内容等、文書に関連づけられた各種のメタデータに基づいて、昇順または降順に表示できる。文書リストの表示順序を設定しなおすと、即時にリスト表示が更新される。
デフォルトの表示順序のよりどころとなる文書のヒット率(設定された条件に合致する割合)について簡単に説明する。類似画像検索は、アルゴリズムごとに固有の類似度に基づく。一般に類似度は「似ている程度」を表現する連続量であり、「似ているか、または、似ていない」の二値ではない。但し、本実施形態の実装上は、類似度が所定の閾値よりも低い画像は似ていないものとして処理する。類似度が所定の閾値よりも高い画像に関して、相対的に類似度の高い画像と低い画像とを区別することができる。与えられた検索条件に含まれる検索キー画像と、検索される文書データに含まれる画像との類似度の判定結果に基づいて、ヒット率(設定された条件に合致する割合)が算出される。すなわち、類似度が高い画像を含む文書の方が、比較的低い画像を含む文書よりも、ヒット率は高く算出される。
また、検索キーは複数指定できるので、より多くの検索条件に合致する文書の方がより少ない検索条件だけに合致する文書よりもヒット率を高く算出する。類似画像検索の検索キー画像が複数指定される場合、類似度の高い画像を多く含めばヒット率を高くする。尚、「すべてのキーを含む」ラジオボタンが選択されて検索された場合、与えられた検索キーのすべてに合致しなければヒットしないものとする。
次に、デフォルトの表示順序のよりどころとなる文書ランクについて説明する。文書ランクは文書の意味的な重要度を表す指標として算出される。文書ランクは、文書のメタデータとして明示的に割り付けられた重要度に基づく。また、機密度、所有者、作者、保管場所、ページ数、などの文書の属性に基づいて文書ランクを算出する。更に、その文書に後からつけられたタグの数や種類、参照された回数、関連文書の参照関係のネットワークなどに基づいて文書ランクを算出することもできる。
関連文書の相互参照関係のネットワークに基づく文書ランクとは、文書ランクの高い文書から多く参照されている文書は比較的ランクが高いものとして算出される。また、文書ランクの高い文書と同時に処理(すなわち、同時にプリント、送信、保存、リトリーブ、ジョブ結合など)された履歴を持つ文書は比較的文書ランクが高いものとして文書ランクが算出される。
検索リスト表示領域1102に表示される文書群のうち、リストの下位に配置される文書は上位に配置される文書よりも、検索ヒット文書表示をより簡略化したり縮小したりすることによって、一画面の中に表示可能な文書の総件数を増やすことも可能である。
本実施形態によれば、デフォルトの設定では、ヒット率順、文書ランク順、文書に付随するメタデータ順、その文書を対象として行われたジョブのメタデータ順、などに基づいて、文書リストを並べて表示できる。更に、文書リストの表示順序を設定し直すと即時にリスト表示が更新されるので、多数の候補文書の中から所望の文書を容易に検索することができる。
スクロールバー1103は、文書検索結果リスト画面1100をスクロールするためのスクロールバーである。多くの場合、検索リスト表示領域1102には大量の文書が表示されるので、操作部112のLCD表示部501の表示領域に納まらない場合が普通である。ユーザは画面をスクロールしながら文書を一覧してその中から所望の文書を見つけ出すことができる。尚、検索リスト表示領域1102の最下部などにページ送りのためのボタンなど(不図示)を配置して、検索結果文書のリストを複数のページに分割して表示してもよい。
尚、検索リスト表示領域1102の最下部などに配置したリストプリントボタン(不図示)を押すと、文書検索結果リストをプリント出力するように構成してもよい。限られた表示領域の中で、できるだけ多数の文書を一覧したいという要件と、できるだけ詳細な文書サマリーサムネールを見くらべて所望の文書を選び出したいという要件とは、同時に満たすことの難しい競合要件である。しかしながら、本実施形態に拠れば、文書検索結果リストを即時にプリント出力できるので、ディスプレイ502よりも高解像度で一覧性も高い出力紙を用いて、容易に所望の文書を見つけ出すことができる。
(検索ヒット文書表示の一例)
図11に示す検索ヒット文書表示1112、1113、1114、1115は、全て同様に構成されている。斜体の文字列は、実際の画面表示においては文書が持つ対応するメタデータの実際の値が表示されることを示している。下線が付してある文字列は、その表示領域を押すと対応する詳細情報表示ウィンドウが開き、それぞれの情報のより詳細な情報を確認できる。
図11に示す検索ヒット文書表示1112、1113、1114、1115は、全て同様に構成されている。斜体の文字列は、実際の画面表示においては文書が持つ対応するメタデータの実際の値が表示されることを示している。下線が付してある文字列は、その表示領域を押すと対応する詳細情報表示ウィンドウが開き、それぞれの情報のより詳細な情報を確認できる。
図12は、検索ヒット文書表示例として、検索ヒット文書表示1112を示す図である。データ形式アイコン1201は対応する文書のデータ形式を表示するためのアイコンである。文書名1202は対応する文書の文書名を表示するための文字列である。データ形式1203は対応する文書のデータ形式を表示するための文字列である。ページ数1204は対応する文書のページ数を表示するための文字列である。文書の所在情報1205は、対応する文書が保存されているファイルサーバなどの格納位置(場所)を特定するための文字列である。文書の所在情報は、URIやファイルサーバとそのファイルシステム中のファイルパス文字列などによって識別される。ジョブアーカイブシステムが蓄積した文書の場合、ジョブアーカイブシステムのジョブにおいて収集された処理対象文書の控えデータが保存されている位置を表示してもよい。あるいは、処理対象文書のオリジナルデータが保存されている位置が特定できる場合はその位置を表示してもよい。
履歴情報1206は、対応する文書を処理対象として過去に施されたジョブ処理や検索などの履歴を表現するための文字列である。いつ、誰が、どんな処理を、どの装置において、この文書に対して施したかといった履歴情報を確認できる。
ページ1207は、対応する文書を構成するページのうち、検索キーの条件にヒットしたページのページ番号を表現するための文字列である。
ヒットページサムネール1208は、対応する文書を構成するページのうち、検索キーの条件にヒットしたページまたは画像要素の概観を表示するためのサムネール画像である。
先頭ページサムネール1209は、対応する文書の先頭のページの概観を表示するためのサムネール画像である。文書サマリーサムネール構成設定領域1108において設定されたページ数分のサムネール画像を並べて表示する。
前ページサムネール1210は、検索キーにヒットしたページに先行するページの概観を表現するためのサムネール画像である。文書サマリーサムネール構成設定領域1108において設定されたページ数分のサムネール画像を並べて表示する。後ページサムネール1211は、検索キーにヒットしたページに後続するページの概観を表現するためのサムネール画像である。文書サマリーサムネール構成設定領域1108において設定されたページ数分のサムネール画像を並べて表示する。末尾ページサムネール1212は、対応する文書の末尾ページの概観を表現するためのサムネール画像である。文書サマリーサムネール構成設定領域1108において設定されたページ数分のサムネール画像を並べて表示する。本実施例では、ヒットページのサムネール(ヒットページサムネール)1208を大きいサイズで表示し、それ以外のページのサムネールをそれより小さいサイズで表示している。このように構成することにより、ユーザはヒットしたページをより明確に認識することができる。
限られた表示領域の中で、できるだけ多数の文書を一覧して所望の文書を選び出したいという要件と、できるだけ詳細な文書サマリーサムネールを見くらべて所望の文書を選び出したいという要件とは、同時に満たすことが難しい。しかしながら、本実施形態によれば、文書サマリーサムネール中に表示するページ構成とそのページ数を簡単に変更可能であるため、容易に所望の文書を検索することができる。
非常に多くのページを文書サマリーサムネールに表示しようとした場合、より縮小率の高い小さなサムネールを表示して、限られた表示領域の中に収まるように検索結果の表示を調整することができる。あるいは、比較的優先度の低いページのサムネールをより小さく縮小して表示したり、先行するページの裏側に重ね合わせページの一部が隠れるように配置して表示を制御することも可能である。あるいは、検索結果の表示を省略することによって、限られた表示領域の中に収まるように検索結果の表示を調整することも可能である。
表示領域が不十分なとき、文書サマリーサムネール中に優先的に表示する優先度の高いページは、次のようなアルゴリズムに従って選択することが可能である。例えば、文書の前方のページをより優先する、先に指定された検索キーに対応してヒットしたページをより優先する、類似画像検索の条件にヒットした場合は類似度の高いページを優先するアルゴリズムを利用することができる。
印刷ボタン1213は、対応する文書をプリント機能によってプリント出力するためのボタンである。保存ボタン1214は、対応する文書をボックス機能に保存するためのボタンである。送信ボタン1215は、対応する文書を送信機能によって送信するためのボタンである。
タグ付けボタン1216は、対応する文書のタグを操作するためのボタンである。タグ付けボタン1216を押すと、文書タグウィンドウが開き、既に当該する文書に設定されているタグを閲覧および編集するとともに、任意のタグを新たに追加登録できる。
関連文書ボタン1217は、対応する文書に関連付けられている文書(関連文書)に対する操作設定を行うためのボタンである。関連文書ボタン1217を押すと、関連文書ウィンドウが開き、該当する文書に関連付けられている関連文書を閲覧し、編集することが可能である。また、該当する文書に対して、他の文書を関連付け、関連文書として追加登録することができる。
マーク付けチェックボックス(マーク)1218は、対応する文書をマークするためのチェックボックスである。リストに表示された文書群のうちいくつかの文書に対する選択的な操作を行う場合、このチェックボックスが選択状態にある文書が対象となる。例えば、マーク付けチェックボックス1218を選択状態にしてから、絞り込み検索ボタン1111を押すと、マークされた(選択状態にされた)文書群が検索キーに追加された状態で再検索が実行される。
本実施形態に拠れば、文書サマリーサムネールによって検索にヒットしたページだけでなく、そのページの前後関係と、文書の全体像とを一目で把握できるので、リスト中から所望の文書を容易に検索することが可能になる。
(複数ページがヒットした文書の表示)
図13は、複数ページがヒットした文書の検索ヒット文書表示の一例を示す図である。前述の表示項目に関しては同一の符号をつけて説明を省略する。類似画像検索は連続的な類似度に基づく検索であるため、ひとつの文書に含まれる複数の類似画像が検索にヒットする可能性がある。また、検索キーと条件を複数設定して検索できるため、ひとつの文書内の複数のページが検索にヒットする可能性もある。図13は、文書中の2つのヒットページサムネール1208、1302が検索にヒットした文書に関する表示例を示している。
(複数ページがヒットした文書の表示)
図13は、複数ページがヒットした文書の検索ヒット文書表示の一例を示す図である。前述の表示項目に関しては同一の符号をつけて説明を省略する。類似画像検索は連続的な類似度に基づく検索であるため、ひとつの文書に含まれる複数の類似画像が検索にヒットする可能性がある。また、検索キーと条件を複数設定して検索できるため、ひとつの文書内の複数のページが検索にヒットする可能性もある。図13は、文書中の2つのヒットページサムネール1208、1302が検索にヒットした文書に関する表示例を示している。
ページ1301は、対応する文書を構成するページのうち、検索キーの条件にヒットした2番目のページのページ番号を表示するための文字列である。ヒットページサムネール1302は、対応する文書を構成するページのうち、検索キーの条件にヒットした2番目のページの概観を表示するためのサムネール画像である。
前ページサムネール1303は、検索キーにヒットした2番目のページに先行するページの概観を表示するためのサムネール画像である。文書サマリーサムネール構成設定領域1108において設定されたページ数分のサムネール画像を並べて表示する。
後ページサムネール1304は、検索キーにヒットした2番目のページに後続するページの概観を表示するためのサムネール画像である。文書サマリーサムネール構成設定領域1108において設定されたページ数分のサムネール画像を並べて表示する。
限られた表示領域の中で、できるだけ多数の文書を一覧して所望の文書を選び出したいという要件と、できるだけ詳細な文書サマリーサムネールを見くらべて所望の文書を選び出したいという要件とは、同時に満たすことが難しい。しかしながら、本実施形態によれば、文書サマリーサムネール中に表示するページ構成とそのページ数を簡単に変更可能であるため、容易に所望の文書を検索することが可能になる。
尚、図13の表示例の場合でも図12と同様に、より縮小率の高い小さなサムネールを表示して、限られた表示領域の中に収まるように検索結果の表示を調整することができる。あるいは、比較的優先度の低いページのサムネールをより小さく縮小して表示したり、先行するページの裏側に重ね合わせページの一部が隠れるように配置して表示を制御することも可能である。あるいは、検索結果の表示を省略することによって、限られた表示領域の中に収まるように検索結果の表示を調整することも可能である。
尚、表示領域が不十分なとき、文書サマリーサムネール画像に優先度が設定される。優先度の高いページは、次のようなアルゴリズムに従って選択することが可能である。例えば、文書の前方のページをより優先する、先に指定された検索キーに対応してヒットしたページをより優先する、類似画像検索の条件にヒットした場合は類似度の高いページを優先するアルゴリズムを利用することができる。
(文書サマリーサムネールをアニメーション表示する例)
図14は、文書サマリーサムネールのアニメーション表示例を示す図である。アニメーション表示チェックボックス1109が選択状態にあるとき、検索ヒット文書表示1112、1113、1114、1115内の各文書サマリーサムネールがそれぞれ自動的にアニメーション表示される。
図14は、文書サマリーサムネールのアニメーション表示例を示す図である。アニメーション表示チェックボックス1109が選択状態にあるとき、検索ヒット文書表示1112、1113、1114、1115内の各文書サマリーサムネールがそれぞれ自動的にアニメーション表示される。
先頭ページサムネール1209は、対応する文書の先頭のページの概観を表現するためのサムネール画像である。文書サマリーサムネール構成設定領域1108において設定されたページ数分のサムネール画像を並べて表示する。ここで、4ページが設定された場合、文書の最初の先頭ページサムネール1209とともに、文書の2ページ目から4ページ目までの後続ページのサムネール1401a、1401b、1401cが並べて表示される。検索された文書データの内容を示すサムネール画像において、1209および1401a〜cの各ページのサムネール画像は、順次、自動的に、他のサムネール画像に対して前面に、または拡大された状態に切り替え表示(アニメーション表示)される。こうしてページめくりの要領で、アニメーション表示することによって、多数のページが文書の中で並んでいる文脈や概要を少ない表示面積を活用して表現することが可能となる。
前ページサムネール1210a、1210b、1210cは、検索キーにヒットしたページに先行するページの概観を表現するためのサムネール画像である。文書サマリーサムネール構成設定領域1108において設定されたページ数分のサムネール画像を並べて表示する。ここでは、3ページが設定された状態を示している。
ヒットページサムネール1208は、対応する文書を構成するページのうち、検索キーの条件にヒットしたページの概観を表現するためのサムネール画像である。
後ページサムネール1211a、1211b、1211cは、検索キーにヒットしたページに後続するページの概観を表現するためのサムネール画像である。文書サマリーサムネール構成設定領域1108において設定されたページ数分のサムネール画像を並べて表示する。ここでは、3ページが設定された状態を示している。
1210a〜1210c、1208、および1211a〜1211cの各ページのサムネール画像は、順次、自動的に前面にまた拡大されて表示される。こうしてページめくりの要領でアニメーション表示することによって、多数のページが文書の中で並んでいる文脈を少ない表示面積を活用して表現することが可能となる。
末尾ページサムネール1212は、対応する文書の末尾のページの概観を表現するためのサムネール画像である。文書サマリーサムネール構成設定領域1108において設定されたページ数分のサムネール画像を並べて表示する。ここで、4ページが設定された場合、文書の最終ページの末尾ページサムネール1212とともに、文書の末尾から数えて2ページ目から4ページ目までの先行ページのサムネール1402a、1402b、1402cが並べて表示される。1402a〜1402cおよび1212の各ページのサムネール画像は、順次、自動的に前面にまた拡大されて表示される。こうしてページめくりの要領でアニメーション表示することによって、多数のページが文書の中で並んでいる文脈を少ない表示面積を活用して表現することが可能となる。
限られた表示領域の中で、できるだけ多数の文書を一覧して所望の文書を選び出すという要件と、夫々の文書に関して文書サマリーサムネールを見比べて所望の文書を選び出す要件とは同時に満たすことの難しい競合要件である。
本実施形態によれば、文書サマリーサムネールを自動的にアニメーション表示するように構成したため、競合要件を同時に解決することが可能となる。
(文書検索結果リスト画面を細密表示する例)
図15は、文書検索アプリケーションの文書検索結果リスト画面の細密表示モードにおける表示構成例を表す図である。
図15は、文書検索アプリケーションの文書検索結果リスト画面の細密表示モードにおける表示構成例を表す図である。
文書検索結果リスト画面1500は、図11に示した文書検索結果リスト表示例の別のモードである。表示項目設定領域1106の「属性情報を表示」チェックボックスが選択されていない場合、文書に関するメタデータ群の検索リスト表示領域1102への表示をできるだけ省き、そのかわりできるだけ大量のヒット文書のリストを画面に表示する。図11の文書検索結果リスト画面1100と同一の要素は同じ符号をつけて説明を省略する。
詳細ボタン1501は、表示を省略した文書に関する詳細情報を確認するためのウィンドウを開くボタンである。このボタンを押すと、図13と同様の詳細情報を表示するウィンドウが開く。
文書サマリーサムネールアニメーション表示領域1502a〜1502i(以下、単に「表示領域1502」とも表記する)は、文書サマリーサムネールをアニメーション表示するための表示領域である。
細密表示モードでは、大量の検索結果文書群の中から所望の文書を見出すために、できるだけ多くの検索結果文書を同時に一画面の中に表示する。文書サマリーサムネールを表示するための表示領域1502は、1ページ分の表示サイズだけしか確保できない。そこで、アニメーション表示チェックボックス1109が選択されている場合、表示領域1502の表示を時分割して用いる。表示領域1502の表示を時分割して、ページめくりの要領で表示するページ(または画像要素)を順次自動的に切り替えるアニメーション表示を行う。アニメーション表示により、文書を構成するページ群の概要と検索ヒットしたページが置かれている文脈とを把握するために役立つ特徴的なページ群の把握は可能になる。
(文書サマリーサムネールアニメーション表示処理の手順)
図16は、文書サマリーサムネールアニメーション表示処理の手順を示すフローチャートである。本表示処理は画像処理装置110のCPU301において実行される文書検索アプリケーションによって達成される。
図16は、文書サマリーサムネールアニメーション表示処理の手順を示すフローチャートである。本表示処理は画像処理装置110のCPU301において実行される文書検索アプリケーションによって達成される。
本フローチャートの一連の手順は、図15の文書検索結果リスト画面の細密表示モードが表示されているとき、表示されている全文書の文書サマリーサムネールアニメーション表示領域1502a〜1502iのそれぞれに関して並行して実行される。以下の説明では、文書サマリーサムネールアニメーション表示領域1502として表記する。
ステップS1601で、アニメーション表示が設定されているか判定する。アニメーション表示チェックボックス1109が選択状態にあれば(S1601−Yes)、ステップS1602に進み、非選択ならば(S1601−No)、本処理は終了する。
ステップS1602で、文書サマリーサムネール構成設定領域1108において設定されたページ数分の先頭のサムネール画像の表示を終えたかどうか判定する。表示済みであれば(S1602−Yes)、ステップS1604に進み、表示済みでなければ(S1602−No)、処理をステップS1603に戻す。
ステップS1603で、先頭のサムネール画像を文書サマリーサムネールアニメーション表示領域1502に表示し、ステップS1602に処理を戻す。このループによって、設定されたページ数分の先頭のサムネール画像が順次アニメーション表示される。
ステップS1604で、検索にヒットしたページの先頭のサムネール画像の表示を終えたかどうか判定する。表示済みであれば(S1604−Yes)、ステップS1610に進み、表示済みでなければ(S1604−No)、ステップS1605に処理を進める。
ステップS1605で、文書サマリーサムネール構成設定領域1108において設定されたページ数分の先頭のサムネール画像の表示を終えたかどうか判定する。表示済みであれば(S1605−Yes)、ステップS1607に進み、表示済みでなければ(S1605−No)、ステップS1606に処理を進める。
ステップS1606で、設定されたページ数分の先頭のサムネール画像を文書サマリーサムネールアニメーション表示領域1502に表示し、処理をステップS1605に戻す。このループによって、その検索ヒットページに関して設定されたページ数分の先頭のページサムネール画像が順次アニメーション表示される。
ステップS1607で、その検索ヒットページのサムネール画像を文書サマリーサムネールアニメーション表示領域1502に表示する。
ステップS1608で、検索にヒットしたページの1つについて、文書サマリーサムネール構成設定領域1108において設定されたページ数分の後続のサムネール画像の表示を終えたか判定する。表示済みであれば(S1608−Yes)、ステップS1604に進み、表示済みでなければ(S1608−No)、ステップS1609に処理を進める。
ステップS1609で、設定されたページ数分の後続のサムネール画像を文書サマリーサムネールアニメーション表示領域1502に表示し、ステップS1608に処理を戻す。このループによって、その検索ヒットページに関して設定されたページ数分の後続のサムネール画像が順次アニメーション表示される。
一方、ステップS1608の条件が真でステップS1604に戻る場合、このループによって、文書中のすべての検索ヒットページに関してそのページおよびその先行と後続のページサムネールが順次アニメーション表示される。
ステップS1610で、文書サマリーサムネール構成設定領域1108において設定されたページ数分の末尾のサムネール画像の表示を終えたかどうか判定する。表示済みであれば(S1610−Yes)、ステップS1601に処理を戻し、表示済みでなければ(S1610−No)、ステップS1611に処理を進める。
ステップS1611で、末尾サムネール画像を文書サマリーサムネールアニメーション表示領域1502に表示し、ステップS1610に処理を戻す。このループによって、設定されたページ数分の末尾ページのサムネールが順次アニメーション表示される。
なお、各サムネール画像をアニメーション表示するために、表示はタイマーの設定に基づき、タイムフレームごとに切り替えることができる。尚、文書サマリーサムネール中のページごとの優先度に応じて、優先度の高いページは長い時間表示し、優先度の低いページはより短い時間だけ表示するように構成することも可能である。
優先的に表示する優先度の高いページは、次のようなアルゴリズムを選択することが可能である。例えば、文書の前方のページをより優先する、先に指定された検索キーに対応してヒットしたページをより優先する、類似画像検索の条件にヒットした場合は類似度の高いページを優先する等のアルゴリズムの選択が可能である。
尚、文書サマリーサムネール構成設定領域1108において設定されていないページのサムネールも、ごく短い時間だけ表示するように構成してもよい。このように構成した場合、文書の概要や文書中のヒットページが置かれている文脈に関わる重要なページがその重要度に応じて比較的長く表示されるため、文書の概要やヒットページの文脈の印象を強調することが可能になる。
限られた表示領域の中で、できるだけ多数の文書を一覧して所望の文書を選び出すという要件と、夫々の文書に関して文書サマリーサムネールを見比べて所望の文書を選び出す要件とは、同時に満たすことの難しい競合要件である。
本実施形態によれば、文書サマリーサムネールを自動的にアニメーション表示するように構成したため、上述の競合要件を同時に解決することが可能となる。
(第2実施形態)
上記の実施形態では文書を構成するページを単位として文書サマリーサムネールを表示したが、本実施形態では文書を構成する個々の画像領域要素を単位として文書サマリーサムネールを表示する構成を説明する。
上記の実施形態では文書を構成するページを単位として文書サマリーサムネールを表示したが、本実施形態では文書を構成する個々の画像領域要素を単位として文書サマリーサムネールを表示する構成を説明する。
図17は、複数の画像領域要素から構成される文書の一例を示す図である。
文書1700は、複数の画像領域およびテキスト領域から構成される文書の一例である。文書1700を画像構造解析部208や展開部210が解析した結果としてページの構造に関する構造情報が得られ、文書を構成する複数の画像や複数テキストといった要素を分解できる。また、各要素の間の配置上の距離や、文化によってきまる配置と前後関係の慣習などに基づく解析によって、要素間の相互関係も構造情報として得られる。尚、文書がHTMLなどのコードデータによって記述されている場合は、データそのものが要素間の関係を自己記述している場合もある。
文書1700は、画像要素1701乃至1712を含む。これらの画像要素群は、まず左から右の順に配置され、さらに上から下の順に配置されるという文化的慣習に基づき符号の番号の順に前後関係を持つものと解析できる。
図18は、第2実施形態における検索ヒット文書表示の一例を示す図である。図18の検索ヒット文書表示例は、画像要素1704に類似した画像をキーにして検索を行い、図17の文書1700がヒットした状態を想定している。図18の検索ヒット文書表示は第1実施形態の図12に示した検索ヒット文書表示の一例と同様に構成され、共通の要素には同一の符号をつけて説明を書略する。
ヒット画像サムネール1804は、対応する文書を構成する画像要素のうち、検索キーの条件にヒットした画像要素の概観を表示するためのサムネール画像である。図17の文書1700を構成する画像要素1704に対応している。
先頭の画像サムネール1801は、対応する文書の先頭の画像要素の概観を表現するためのサムネール画像である。図17の文書1700を構成する画像要素1701に対応している。文書サマリーサムネール構成設定領域1108と同様の設定領域(不図示)において設定された画像要素数分のサムネール画像を並べて表示することができる。
前画像サムネール1803は、検索キーにヒットした画像要素に先行する画像要素の概観を表示するためのサムネール画像である。図17の文書1700を構成する画像要素1703に対応している。文書サマリーサムネール構成設定領域1108と同様の設定領域(不図示)において設定された画像要素数分のサムネール画像を並べて表示することができる。
後画像サムネール1805は、検索キーにヒットした画像要素に後続する画像要素の概観を表現するためのサムネール画像である。図17の文書1700を構成する画像要素1705に対応している。文書サマリーサムネール構成設定領域1108と同様の設定領域(不図示)において設定された画像要素数分のサムネール画像を並べて表示することができる。
末尾の画像サムネール(末尾ページサムネール)1212は、対応する文書の末尾の画像要素の概観を表示するためのサムネール画像である。図17の文書1700を構成する画像要素1712に対応している。文書サマリーサムネール構成設定領域1108と同様の設定領域(不図示)において設定された画像要素数分のサムネール画像を並べて表示することができる。
限られた表示領域で、できるだけ多数の文書を一覧して所望の文書を選び出すという要件と、できるだけ詳細な文書サマリーサムネールを見比べて所望の文書を選び出すという要件とは、同時に満たすことの難しい競合要件である。
本実施形態によれば、文書サマリーサムネール中に表示する画像要素構成とその画像要素数を簡単に変更可能であるため、容易に所望の文書を見つけ出すことができる。
尚、非常に多くの画像要素を文書サマリーサムネールに表示しようとした場合、より縮小率の高い小さなサムネールを表示して、限られた表示領域の中に収まるように検索表示を制御することも可能である。あるいは、比較的優先度の低い画像要素のサムネールをより小さく縮小して表示したり、先行する画像要素の裏側に重ね合わせ画像要素の一部が隠れるように配置して、検索表示を制御することも可能である。あるいは、表示を省略したりすることによって、限られた表示領域の中に収まるように調整する検索表示を制御することも可能である。
尚、表示領域が不十分なとき、文書サマリーサムネール中に優先的に表示する優先度の高い画像要素は、次のようなアルゴリズムに従って選択することが可能である。例えば、文書の前方の画像要素をより優先する、先に指定された検索キーに対応してヒットした画像要素をより優先する、類似画像検索の条件にヒットした場合は類似度の高い画像要素を優先する等のアルゴリズムの選択が可能である。
画像要素を単位とする文書サマリーサムネールも、図14の表示例や図16の手順と同様の要領でアニメーション表示し、多数の画像要素が文書の中で並んでいる文脈や概要を少ない表示面積を活用して表示することが可能である。
(他の実施形態)
尚、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給することによっても、達成されることは言うまでもない。また、システムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
尚、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給することによっても、達成されることは言うまでもない。また、システムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、不揮発性のメモリカード、ROMなどを用いることができる。
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現される。また、プログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態が実現される場合も含まれることは言うまでもない。
Claims (15)
- 入力された検索条件に合致する画像要素を含む文書データを検索する文書検索手段と、
前記文書検索手段の検索結果に基づいて、前記検索条件に合致する画像要素を含む文書データの一覧表示を表示手段に表示する検索結果リスト表示手段と、
前記検索結果リスト表示手段による前記一覧表示中に表示される文書データそれぞれに対して、前記検索条件に合致した画像要素に関する第1サムネール画像と、当該表示される文書データに含まれ且つ前記検索条件に合致した画像要素と異なる別の画像要素に関する第2サムネール画像との両方を表示するサムネール表示手段と
を備え、
前記一覧表示中に表示される文書データそれぞれに対して前記サムネール表示手段により表示される前記第2サムネール画像は、前記検索条件に合致した画像要素に隣接する画像要素に関するサムネール画像と、当該文書データの先頭の画像要素に関するサムネール画像との両方を含むことを特徴とする文書検索装置。 - 前記サムネール表示手段は、前記文書データそれぞれにおける画像要素の並び順に基づき、前記第2サムネール画像を、前記第1サムネール画像の前または後に配置して前記一覧表示中に表示することを特徴とする請求項1に記載の文書検索装置。
- 前記一覧表示中に表示される文書データそれぞれに対して前記サムネール表示手段により表示される第2サムネール画像は、前記検索条件に合致した画像要素に隣接する画像要素に関するサムネール画像と、当該文書データの先頭の画像要素に関するサムネール画像と、当該文書データの末尾の画像要素に関するサムネール画像とを含むことを特徴とする請求項1に記載の文書検索装置。
- 前記第2サムネール画像として表示される前記検索条件に合致した画像要素に隣接する画像要素に関するサムネール画像の表示数を、ユーザの指示に基づいて設定する表示数設定手段を更に備え、
前記一覧表示中に表示される文書データそれぞれに対して、前記サムネール表示手段は、前記表示数設定手段で設定された表示数に従い、前記検索条件に合致した画像要素に隣接する画像要素から順に、並び順に基づき複数の画像要素を選択し、当該選択された複数の画像要素それぞれのサムネール画像と、当該文書データの先頭の画像要素に関するサムネール画像とを、前記第2サムネール画像として表示することを特徴とする請求項1に記載の文書検索装置。 - 前記第2サムネール画像として表示される前記検索条件に合致した画像要素に隣接する画像要素に関するサムネール画像の第1の表示数と、前記第2サムネール画像として表示される前記文書データの先頭の画像要素に関するサムネール画像の第2の表示数とを、ユーザの指示に基づいて設定する表示数設定手段を更に備え、
前記一覧表示中に表示される文書データそれぞれに対して、前記サムネール表示手段は、前記表示数設定手段で設定された第1の表示数に従い、前記検索条件に合致した画像要素に隣接する画像要素から順に、並び順に基づき複数の画像要素を選択するとともに、前記表示数設定手段で設定された第2の表示数に従い、当該文書データの先頭の画像要素から順に、並び順に基づき複数の画像要素を選択し、当該選択された複数の画像要素それぞれのサムネール画像を、前記第2サムネール画像として表示することを特徴とする請求項1に記載の文書検索装置。 - 前記第2サムネール画像として表示される前記検索条件に合致した画像要素に隣接する画像要素に関するサムネール画像の第1の表示数と、前記第2サムネール画像として表示される前記文書データの先頭の画像要素に関するサムネール画像の第2の表示数と、前記第2サムネール画像として表示される前記文書データの末尾の画像要素に関するサムネール画像の第3の表示数とを、ユーザの指示に基づいて設定する表示数設定手段を更に備え、
前記一覧表示中に表示される文書データそれぞれに対して、前記サムネール表示手段は、前記表示数設定手段で設定された第1の表示数に従い、前記検索条件に合致した画像要素に隣接する画像要素から順に並び順に基づき複数の画像要素を選択し、前記表示数設定手段で設定された第2の表示数に従い、当該文書データの先頭の画像要素から順に並び順に基づき複数の画像要素を選択し、前記表示数設定手段で設定された第3の表示数に従い、当該文書データの末尾の画像要素から順に並び順に基づき複数の画像要素を選択し、当該選択された複数の画像要素それぞれのサムネール画像を、前記第2サムネール画像として表示することを特徴とする請求項3に記載の文書検索装置。 - 前記サムネール表示手段は、前記第1サムネール画像を前記第2サムネール画像より大きいサイズで表示することを特徴とする請求項1乃至6のいずれか1項に記載の文書検索装置。
- 前記文書検索手段により検索された前記文書データの内容を示すサムネール画像をアニメーション表示するための設定を行うアニメーション表示設定手段を更に備え、
前記サムネール表示手段は前記アニメーション表示設定手段の設定に従い前記第1サムネール画像と第2サムネール画像とをアニメーション表示することを特徴とする請求項1に記載の文書検索装置。 - 前記文書検索手段の検索結果を絞り込むための条件を設定する表示フィルタ設定手段を更に備え、
前記検索結果リスト表示手段は、前記表示フィルタ設定手段により設定された条件により絞り込まれた検索結果を前記表示手段に表示することを特徴とする請求項1に記載の文書検索装置。 - 前記検索条件には検索キー画像が含まれ、当該検索キー画像は、スキャンによって得た画像もしくは記憶装置に保存されている画像の少なくともいずれかを用いることを特徴とする請求項1に記載の文書検索装置。
- 前記検索条件に合致した画像要素が、1つの文書データ内に複数存在した場合、前記サムネール表示手段で表示する前記第1サムネール画像は、前記検索条件に合致した画像要素それぞれに関する複数のサムネール画像であることを特徴とする請求項1に記載の文書検索装置。
- 前記検索条件に合致した画像要素が、1つの文書データ内に複数存在した場合、前記サムネール表示手段で表示する前記第1サムネール画像は、優先条件にしたがって選択した画像要素に関するサムネール画像であることを特徴とする請求項1に記載の文書検索装置。
- 表示手段を備える文書検索装置の文書検索方法であって、
前記文書検索装置の文書検索手段が、入力された検索条件に合致する画像要素を含む文書データを検索する文書検索工程と、
前記文書検索装置の検索結果リスト表示手段が、前記文書検索工程の検索結果に基づいて、前記検索条件に合致する画像要素を含む文書データの一覧表示を前記表示手段に表示する検索結果リスト表示工程と、
前記文書検索装置のサムネール表示手段が、前記検索結果リスト表示工程による前記一覧表示中に表示される文書データそれぞれに対して、前記検索条件に合致した画像要素に関する第1サムネール画像と、当該表示される文書データに含まれ且つ前記検索条件に合致した画像要素と異なる別の画像要素に関する第2サムネール画像との両方を表示するサムネール表示工程と
を有し、
前記一覧表示中に表示される文書データそれぞれに対して前記サムネール表示工程で表示される前記第2サムネール画像は、前記検索条件に合致した画像要素に隣接する画像要素に関するサムネール画像と、当該文書データの先頭の画像要素に関するサムネール画像との両方を含むことを特徴とする文書検索装置の文書検索方法。 - コンピュータを、請求項1乃至12のいずれか1項に記載の文書検索装置の各手段として機能させるためのプログラム。
- コンピュータを、請求項1乃至12のいずれか1項に記載の文書検索装置の各手段として機能させるためのプログラムを記憶したことを特徴とするコンピュータ可読の記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012009410A JP5318233B2 (ja) | 2012-01-19 | 2012-01-19 | 文書検索装置、文書検索方法、プログラム及び記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012009410A JP5318233B2 (ja) | 2012-01-19 | 2012-01-19 | 文書検索装置、文書検索方法、プログラム及び記憶媒体 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006336375A Division JP2008146602A (ja) | 2006-12-13 | 2006-12-13 | 文書検索装置、文書検索方法、プログラム及び記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012084179A true JP2012084179A (ja) | 2012-04-26 |
JP5318233B2 JP5318233B2 (ja) | 2013-10-16 |
Family
ID=46242897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012009410A Expired - Fee Related JP5318233B2 (ja) | 2012-01-19 | 2012-01-19 | 文書検索装置、文書検索方法、プログラム及び記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5318233B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016198278A (ja) * | 2015-04-09 | 2016-12-01 | キヤノン株式会社 | 情報処理装置、制御方法およびプログラム |
JP2018163418A (ja) * | 2017-03-24 | 2018-10-18 | 富士ゼロックス株式会社 | 検索情報生成装置、画像処理装置、検索情報生成プログラム |
CN110879689A (zh) * | 2018-09-05 | 2020-03-13 | 富士施乐株式会社 | 信息处理装置、记录媒体及信息处理方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002073679A (ja) * | 2000-08-25 | 2002-03-12 | Canon Inc | データ検索装置及び方法 |
JP2005045434A (ja) * | 2003-07-25 | 2005-02-17 | Fuji Xerox Co Ltd | プレゼンテーション支援装置及びプレゼンテーション支援方法 |
US20060069670A1 (en) * | 2004-09-29 | 2006-03-30 | Siraj Khaliq | User interfaces for a document search engine |
-
2012
- 2012-01-19 JP JP2012009410A patent/JP5318233B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002073679A (ja) * | 2000-08-25 | 2002-03-12 | Canon Inc | データ検索装置及び方法 |
JP2005045434A (ja) * | 2003-07-25 | 2005-02-17 | Fuji Xerox Co Ltd | プレゼンテーション支援装置及びプレゼンテーション支援方法 |
US20060069670A1 (en) * | 2004-09-29 | 2006-03-30 | Siraj Khaliq | User interfaces for a document search engine |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016198278A (ja) * | 2015-04-09 | 2016-12-01 | キヤノン株式会社 | 情報処理装置、制御方法およびプログラム |
JP2018163418A (ja) * | 2017-03-24 | 2018-10-18 | 富士ゼロックス株式会社 | 検索情報生成装置、画像処理装置、検索情報生成プログラム |
CN110879689A (zh) * | 2018-09-05 | 2020-03-13 | 富士施乐株式会社 | 信息处理装置、记录媒体及信息处理方法 |
CN110879689B (zh) * | 2018-09-05 | 2024-04-09 | 富士胶片商业创新有限公司 | 信息处理装置、记录媒体及信息处理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5318233B2 (ja) | 2013-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100972241B1 (ko) | 문서 검색 장치 및 문서 검색 방법 | |
JP2008146603A (ja) | 文書検索装置、文書検索方法、プログラム及び記憶媒体 | |
JP5173721B2 (ja) | 文書処理システム及びその制御方法、プログラム、記憶媒体 | |
JP5415736B2 (ja) | 文書処理システム及びその制御方法、プログラム、記憶媒体 | |
EP1473641B1 (en) | Information processing apparatus, method, storage medium and program | |
JP4181892B2 (ja) | 画像処理方法 | |
US6397213B1 (en) | Search and retrieval using document decomposition | |
EP1837782B1 (en) | Document search apparatus, document management system, document search system and document search method | |
US8726178B2 (en) | Device, method, and computer program product for information retrieval | |
US20070041668A1 (en) | Search apparatus and search method | |
JP2006120125A (ja) | ドキュメント画像情報管理装置及びドキュメント画像情報管理プログラム | |
JP2005004724A (ja) | 画像処理装置及びその制御方法、プログラム | |
JP5318233B2 (ja) | 文書検索装置、文書検索方法、プログラム及び記憶媒体 | |
US20090150359A1 (en) | Document processing apparatus and search method | |
JP2009134580A (ja) | 文書データベースシステムおよび画像入力装置 | |
JP2013101643A (ja) | 文書処理システム及び文書処理方法、プログラム | |
JPH1125103A (ja) | 文書管理装置及びシステム及び方法 | |
US20090287692A1 (en) | Information processing apparatus and method for controlling the same | |
JP2014211884A (ja) | 文書処理システムおよび文書処理システムの制御方法 | |
US20070038606A1 (en) | File processing apparatus operating a file based on previous execution history of the file | |
JP2006252525A (ja) | 文書ファイル管理装置、文書ファイル管理方法、および文書ファイル管理プログラム | |
JP2005149210A (ja) | 画像処理装置及びその制御方法、プログラム | |
JP2019160213A (ja) | 情報処理システム、情報処理方法及びプログラム | |
JP2013042436A (ja) | 画像処理装置、ファイルの保存先フォルダ決定方法及び同決定プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130705 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130709 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5318233 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |