JP4906044B2 - 情報検索装置及びその制御方法、コンピュータプログラム、並びに、記憶媒体 - Google Patents

情報検索装置及びその制御方法、コンピュータプログラム、並びに、記憶媒体 Download PDF

Info

Publication number
JP4906044B2
JP4906044B2 JP2005282333A JP2005282333A JP4906044B2 JP 4906044 B2 JP4906044 B2 JP 4906044B2 JP 2005282333 A JP2005282333 A JP 2005282333A JP 2005282333 A JP2005282333 A JP 2005282333A JP 4906044 B2 JP4906044 B2 JP 4906044B2
Authority
JP
Japan
Prior art keywords
block
search
information
folder
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005282333A
Other languages
English (en)
Other versions
JP2007094691A5 (ja
JP2007094691A (ja
Inventor
修治 市川
雄二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005282333A priority Critical patent/JP4906044B2/ja
Publication of JP2007094691A publication Critical patent/JP2007094691A/ja
Publication of JP2007094691A5 publication Critical patent/JP2007094691A5/ja
Application granted granted Critical
Publication of JP4906044B2 publication Critical patent/JP4906044B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報検索装置及びその制御方法、コンピュータプログラム、並びに、記憶媒体に関する。
検索結果を階層的に表示するものとして、以下のような方式が提案されている(特許文献1を参照)。この方式ではまず、入力された検索条件をフォルダとして設定し、設定したフォルダが画面表示される。次に、表示されたフォルダが選択されると、このフォルダに関連付けられている検索条件に基づいて、検索サーバが文書データベースから検索条件に該当する文書の検索が行われる。更に、検索サーバの検索結果に基づいて、該当する文書の文書名がフォルダに対応づけて表示される。
特開2000−057128号公報
このような方式では、検索フォルダに対応付けられた検索条件はキーワードのみであって、そのままでは画像を検索条件することができない。更に、キーワードはユーザによって指定されなければならず、また、文書画像自体を検索条件として指定し、指定された文書中に記載されている情報に関連した情報を検索条件として検索フォルダに対応付けて、検索を行うことができない。
そこで、本発明は、検索条件として文書画像自体を指定し、柔軟な検索を可能とすることを目的とする。
上述の課題を解決するための本発明は、検索条件が設定されたフォルダの選択に応じて、該設定された検索条件に基づいてデータファイルを検索する情報検索装置であって、
画像データの指定を受け付ける指定受付手段と、
指定された前記画像データをブロック分割する分割手段と、
前記ブロック毎に、ブロックの特徴を表す情報を検索条件として抽出する抽出手段と、
前記抽出されたブロックの特徴を表す情報が検索条件として設定されるフォルダを、前記ブロック毎に作成する作成手段とを備え、
前記データファイルの検索は、作成された前記フォルダのうち選択されたフォルダに設定された前記検索条件に基づいて行われ
前記作成手段は、前記抽出手段によって抽出されたブロックの特徴を表す情報が検索条件として設定されるフォルダを前記ブロック毎にサブフォルダとして作成し、さらに、前記ブロック毎の特徴を表す情報の積集合を検索条件として設定したメインフォルダを作成することを特徴とする。
本発明によれば、検索条件として文書画像自体を指定し、柔軟な検索を行うことが可能となる。
添付する図面を参照して、本発明の好適な実施形態を説明する。
図1は、本発明の情報処理装置100の構成を示す図である。CPU101はマイクロプロセッサであり、情報検索のための演算、論理判断等を行い、バス109を介して、それらのバスに接続された各構成要素を制御する。ROM102は読出し専用の固定メモリであり、本実施形態に対応する処理プログラム等の制御プログラムコードを記憶する。RAM103は書込み可能なメモリであり、各構成要素からの各種データの一時記憶に用いられる。
入力部104は、アルファベットキー、ひらがなキー、カタカナキー、句点等の文字記号入力キー、検索を指示する検索キー及び、カーソル移動を指示するカーソル移動キー等のような各種の機能キーを備えたキーボードを備える。また、GUI上で画面の制御可能位置を指し示したり、機能選択指示をしたりするためのポインティング機器、例えばマウスやスティックポインタも備える。
表示部105は、陰極線管CRTや液晶パネル等で構成される。表示コントローラ106は、表示部105におけるドット構成の表示パターンおよびカーソルの表示を制御する。外部記憶部107には、検索対象情報(テキスト文書、画像データ等)や種々の情報が格納される。また、本実施形態に対応する処理プログラム等の制御プログラムコードを格納することもできる。これらのデータ及びプログラムを格納する記憶媒体としては、ROM、フロッピー(登録商標)ディスク、CD−ROM、DVD−ROM、メモリカード、光磁気ディスク、ハードディスクなどを用いることができる。通信部108は、Ethernet(登録商標)などのネットワークに接続し、図1に示すネットワークシステムにおいて複数の情報処理装置100同士を接続する役割を担う。
以上の各構成要素からなる情報処理装置100は、入力部104からの各種の入力及び通信部108から供給されるネットワーク経由の各種入力に応じて作動する。入力部104又は通信部108からの入力が情報処理装置100に供給されると、インタラプト信号がCPU101に送られ、CPU101が外部記憶部107内に格納されている各種の制御信号を読出す。更に、それらの制御信号に従って、対応する制御が実行される。
また、本実施形態に対応するプログラムを格納した記憶媒体を所定のシステム或いは装置に供給することもできる。その場合には、該システム或いは装置のコンピュータが、記憶媒体に格納されたプログラムコードを読み出し実行することによって、情報処理装置100として機能することで、本発明が達成される。
図2は、本実施形態に対応する情報処理装置100の機能的な構成の一例を示すブロック図である。
文書画像解析部201は、検索クエリとして指定された文書画像データをオブジェクト毎にブロックとして認識し、該ブロックをそれぞれテキスト/画像等の属性に判定し、属性毎に領域分割する。
図9にブロック解析の例を示す。図9(a)は、検索クエリである文書画像を示す。文書画像900は、ここに示されるように、テキスト領域と、図形や写真などの画像領域とが含まれる。ブロック解析は、この文書画像900を、画像の性質に応じた矩形ブロックに分割する技術である。この実現例としては、例えば文書画像中の黒画素の8連結輪郭塊、白画素の4連結輪郭塊の集合を抽出し、その形状、大きさ、集合状態などから、文字、絵や図、表といった文書に特徴的な領域を抽出することができる。但し、この実現例はブロック解析の一例であって、係る手法に限定されるものではない。図9(b)は、文書画像900についてブロック解析を行って4つのブロック901から904に分割した例を示している。ここで、ブロック901と904は、内部にテキストが含まれるためテキストブロックとして分割されている。また、ブロック902及び903は、テキスト以外の情報が含まれるため画像ブロックとして分割されている。
画像特徴量作成部202は、文書画像解析部201にて切り出された画像ブロック902や903の画像特徴量を作成する。なお、画像特徴量は、画像の色情報、規則性、対象物の形状等に注目したものであり、例えば、特開平10−260983号等で提案されている公知の画像特徴量を用いることができる。
テキスト情報作成部203は、文書画像解析部201にて切り出されたテキストブロックの画像に対して、文字単位で画像を対切り出し、パターンマッチングの一手法を用いて認識を行い、対応する文字コードを得る。テキスト検索部204は、指定された検索文字列を基に該当する文書を検索する機能を提供する。
類似画像検索部205は、指定された画像の画像特徴量を基に、特徴量が一致或いは類似する画像を検索する機能を提供する。検索フォルダ管理部206は、文書画像解析部201により作成された解析結果を基に、図8に示す検索フォルダ画面を表示するための情報である検索フォルダ管理情報207を作成し外部記憶部107に保存する。なお、検索クエリとなる文書画像毎に検索フォルダ管理情報207を保存するものとする。検索フォルダ管理情報207は、検索フォルダ管理部206で作成された図8に示す検索フォルダ画面800を表示するための情報である。
図8は、情報処理装置の表示部105に表示される検索実行及び検索結果の表示を行う検索フォルダ画面800を示す説明図である。
検索フォルダ画面800において、フォルダ表示部801には、検索クエリである文書画像を識別するための情報として作成された最上位のメインフォルダ804が表示される。また、文書画像のブロック解析結果として得られた各ブロックを識別するための情報としてサブフォルダ805が表示される。サブフォルダ805には、ブロックの種別を含む特徴を表す情報が検索条件としてそれぞれ設定される。検索クエリ表示部802には、サブフォルダ805のいずれかの選択の検出に応じて、選択されたサブフォルダ805に対応し、文書画像のブロック解析結果として得られたブロックの画像データ(画像情報)が表示される。ファイル表示部803には、メインフォルダ或いは各サブフォルダに対応する検索条件のうち、ユーザによって選択された検索条件を基にして検索処理を実行した結果が表示される。
ユーザが検索クエリとして文書画像を指定すると、表示部105において、文書画像のブロック解析結果がフォルダ表示部801に表示される。次に、ユーザにより入力部104にてメインフォルダ804或いはサブフォルダ805のうち任意のフォルダの選択が検出されると、選択されたサブフォルダ805と関連付けられた検索条件を利用して検索処理が実行される。その検索結果は、ファイル表示部803に表示される。ここで、図8は、サブフォルダ806が選択された場合の検索処理結果がファイル表示部803に表示される場合を示している。また、選択されたサブフォルダ805に対応するブロックの画像データは、検索クエリ表示部802に表示され、ユーザに対して検索条件が提示される。
なお、メインフォルダ804には、各サブフォルダ805の検索条件の積集合が設定される。すなわち、メインフォルダ804が選択された場合、各サブフォルダの検索条件の積集合を検索条件とした結果が表示されることになる。このようなメインフォルダの作成により、ユーザが選択した文書画像データを効率よく検索することが可能となる。
次に、図5を参照して、本実施形態に対応する検索クエリである文書画像の解析結果の一例を説明する。図5は、解析結果としての文書画像解析情報の構成の一例を示す図である。
図5において、文書解析情報500は、文書画像解析部201にて作成され、RAM103に記憶される。また、文書画像解析情報500は、文書画像に含まれるブロック数501と、各ブロックに対応する検索条件情報502から構成される。図5において、ブロック数501には「4」が登録されている。このブロック数は図9(b)に対応するブロック解析の結果に対応している。
また、検索条件情報502は、ブロック毎に以下の情報を保持する。ブロックの種別を保持するブロック種別503、ブロックの内容を解析し、ブロックの特徴を表す情報を検索条件として保持する検索条件504、文書画像解析処理において切り出されたブロックの画像データを保持するブロック表示情報505である。
ここで、ブロック種別503は、テキストブロックについては"テキストブロック"に、また、画像ブロックについては"画像ブロック"に設定される。図5では、図9におけるブロック901から904までのブロックにそれぞれ対応したブロック種別が与えられている。また、検索条件504は、ブロック種別が"テキストブロック"の場合には、ブロックの特徴を表す情報として、ブロックに対して文字認識を行った結果得られるテキスト情報が設定される。例えば、ブロック901に対応する検索条件504では、「検索フォルダの使用方法・・・」といったように、ブロック内のテキスト情報が登録されている。また、ブロック種別が"画像ブロック"の場合には、ブロックの画像につき画像特徴量作成を行った結果得られる画像特徴量が、該ブロックの特徴を表す情報として設定される。
次に、図6を参照して、本実施形態に対応する検索フォルダ画面を表示するための情報の一例について説明する。図6は、該情報としての検索フォルダ管理情報の構成の一例を示す図である。図6の検索フォルダ管理情報207は、検索フォルダ管理部206において作成され、外部記憶部107に記憶される。
検索フォルダ管理情報207において、検索サブフォルダ数601は、検索サブフォルダ数を保持する。図6では、図9及び図5に対応して「4」が保持されている。検索クエリ文書パス602は、検索クエリである文書画像のファイルパスを保持する。図6の場合、"C:\Query\Q1.jpg"のように文書画像ファイルの格納場所が保持される。検索条件情報603は、サブフォルダ805毎に対応する検索条件を保持する。
ここで、検索条件情報603は、文書画像解析情報500のブロック毎の検索条件情報502に対応し、サブフォルダ805毎に以下の情報を保持する。検索種別604は、サブフォルダに対応した検索方法を保持する。文書画像解析情報500のブロック種別503が"画像ブロック"の場合、検索種別604には"画像検索"が設定される。一方、文書画像解析情報500のブロック種別503が"テキストブロック"の場合、検索種別604には"テキスト検索"が設定される。
検索条件605は、検索種別604に対応した検索条件を保持する。ここで、検索種別604が"画像検索"の場合、検索条件605には、検索条件504に対応する画像特徴量が設定される。また、検索種別604が"テキスト検索"の場合、検索条件605には、検索条件504に対応するテキスト情報が設定される。検索条件表示情報606は、検索条件605を検索フォルダ画面800の検索クエリ表示部802に表示するための表示情報であり、文書画像解析情報500のブロック表示情報505が設定される。また、サブフォルダID607は、サブフォルダ805を一意に特定するための数値を保持する。このサブフォルダID607には、1から始まる連番が設定される。即ち、サブフォルダID607により、検索フォルダ画面に表示されるサブフォルダ805に、検索条件情報603が一意に関連づけられる(設定される)こととなる。
次に、図7を参照して、本実施形態に対応する検索結果の情報の一例を説明する。図7は、該情報としての検索結果情報の一例を示す図である。図7の検索結果情報700は、テキスト検索部204及び類似画像検索部205において作成され、RAM103に記憶される。
検索結果700は、検索結果数を保持する検索結果数701と、検索結果文書のパスを保持する検索結果文書パス702とから構成される。検索結果数701は、検索結果文書パス702に登録された文書数を登録する。ここでは、「9」となっているので、検索結果として9つのファイルが検出されたことを示している。検索結果文書パスは、検索において検出された文書の格納場所が登録される。例えば、"Sample1.jpg"という画像データの格納場所は"C:\Documents\Sample1.jpg"となっており、これが検索結果文書パスとして登録される。
次に、本実施形態に対応する、検索クエリである文書画像の入力に応じて、表示部105上に対応する検索フォルダを設定・表示する検索フォルダの設定・表示処理について、図3を参照して説明する。図3は、情報処理装置100のCPU101が実行する該検索フォルダ設定・表示処理の一例を示すフローチャートである。
ステップS301において、CPU101は、検索クエリとする文書画像の指定を、入力部104を介してユーザから受け付ける。次に、ステップS302において、CPU101は、ステップS301で指定された文書画像に対し、文書画像解析部201の機能に基づきブロック解析を行い、テキストブロック、画像ブロック等に分割する。ここで、文書画像解析情報500のブロック数501には、文書画像に含まれるブロック数が格納される。
続いて、ステップS303において、CPU101は、分割された全てのブロックについて検索条件情報が作成されたか否かを判定する。もし、全てのブロックについて検索条件情報が作成されていない場合には(ステップS303において「NO」)、ステップS304に移行する。ステップS304において、CPU101は、公知のブロック解析手法に基づき対象ブロックが画像オブジェクトか否かを判定する。もし、対象ブロックが画像オブジェクトであると判定された場合には(ステップS304にて「YES」)、ステップS305へ移行する。一方画像オブジェクトではないと判定された場合には、ステップS307へ移行する。
ステップS305において、CPU101は、画像特徴量作成部202の機能に基づいて、ステップS302で切り出したブロックの部分画像の画像特徴量を抽出する。更にステップS306に移行して、文書画像解析情報500の検索条件情報502の設定を行う。ここでは、ブロック種別503には、"画像検索"が格納される。また検索条件504には、ステップS305にて取得した画像特徴量が格納される。ブロック表示情報505には、ステップS302にて切り出されたブロックの部分画像データが格納される。その後、ステップS303に戻って処理を継続する。
ステップS307において、CPU101は、当該ブロックがテキストオブジェクトか否かを判定する。もし、対象ブロックがテキストオブジェクトであると判定された場合には(ステップS307にて「YES」)、ステップS308へ移行する。一方、テキストオブジェクトではないと判定された場合には(ステップS307にて「NO」)、ステップS303に戻る。
ステップS308において、CPU101は、テキスト情報作成部203の機能に基づき、ステップS302で切り出したブロックの部分画像に対して文字認識を行い、テキスト情報を抽出する。更に、ステップS309において、CPU101は、文書画像解析情報500の検索条件情報502の設定を行う。ブロック種別503には、"テキスト検索"が格納される。検索条件504には、ステップS308にて取得したテキスト情報が格納される。ブロック表示情報505には、ステップS302にて切り出されたブロックの部分画像データが格納される。その後、ステップS303に戻る。
ステップS303において、分割された全てのブロックについて検索条件情報が作成されたと判定された場合には(ステップS303において「YES」)、ステップS310に移行する。ステップS310において、CPU101は、文書フォルダ管理部206の機能に基づいて文書画像解析情報500から検索フォルダ管理情報207を生成する。検索サブフォルダ数601には、ブロック501が格納される。検索クエリ文書パス602には、ステップS301にてユーザから指定された文書画像のファイルパスが格納される。
また、ユーザから指定された文書画像に含まれるブロック毎に、検索条件情報603の検索種別604、検索条件605、検索条件表示情報606及びサブフォルダID607が設定される。検索種別604には、文書画像解析情報500のブロック種別503が格納される。検索条件605には、文書画像解析情報500の検索条件504が格納される。検索条件表示情報606には、文書画像解析情報500のブロック表示情報505が格納される。サブフォルダID607には、1から始まる連番がブロック毎に割り当てて格納される。また、生成された検索フォルダ管理情報207は、外部記憶部107に保存される。
このようにして、ブロック毎に、ブロックの特徴を表す情報が抽出される。そして、それら抽出された情報が検索条件として設定されたサブフォルダ805が作成される。このサブフォルダ805の作成により、文書画像の一部として配置された画像データの検索など、柔軟な検索処理をユーザに提供することができる。
ステップS311において、CPU101は、外部記憶部107に保存されている検索フォルダ管理情報207に基づいて、表示部105に検索フォルダ画面800を表示し、処理を終了する。
フォルダ表示部801には、最上位のフォルダアイコンとして検索クエリである文書画像を表現するメインフォルダ804が表示される。メインフォルダ804の下位には、サブフォルダアイコンとして、検索フォルダ管理情報207の検索フォルダ数601の設定値分だけサブフォルダ805が表示される。なお、サブフォルダ805の表示順は、検索フォルダ管理情報207のサブフォルダID607の設定値に基づく昇順とする。なお、図8では、検索結果としてファイル表示部803が示されているが、ステップS311における検索フォルダ表示の時点ではまだ検索は実行されていない。従って、ステップS311における表示では、ファイル表示部803はブランクの表示となっている。
次に、表示部105に表示されている検索フォルダ画面にて検索を実行し、検索結果を表示する、本実施形態の検索処理の一例を、図4を参照して説明する。図4は、本実施形態において情報処理装置100のCPU101が実行する検索実行処理の一例を示すフローチャートである。
図4において、ステップS401において、CPU101は、図3の処理において予め取得した検索種別604及び検索条件605を呼び出す。
そして、ステップS408において、CPU101は、図8のメインフォルダ804あるいはサブフォルダ805のいずれかが入力部104を介してユーザにより選択されたことを検出する。サブフォルダ805のいずれかの選択が検出された場合、ステップS402に進む。このとき、CPU101は、検索フォルダ管理部206は外部記憶部107に保存されている検索フォルダ管理情報207を読み出す。CPU101は、検索フォルダ管理情報207中、情報検索条件情報601のサブフォルダID607に基づき、選択されたサブフォルダ805に対応する検索条件情報603を抽出し、検索種別604及び検索条件605を取得する。
ステップS408において、メインフォルダ804の検出が選択された場合、ステップS409に進む。ステップS409において、CPU101は、各サブフォルダの検索条件の積集合を検索条件として抽出し、検索処理を実行する。その後、ステップS404に移行する。
ステップS402において、CPU101は、ステップS401にて取得された検索種別604に基づいて、検索種別が画像検索であるか否かを判定する。もし、検索種別が画像検索であると判定された場合には(ステップS402にて「YES」)、ステップS403へ移行する。ステップS403において、CPU101は、ステップS401で取得された検索条件605を検索クエリとして、外部記憶部107に格納されている検索対象情報につき画像検索を実行する。このとき、外部記憶部107に格納されている検索対象の画像データは、予め画像特徴量作成部202により特徴量が算出されており、画像検索は検索対象の画像データの特徴量と、検索クエリとを比較することにより行われる。その後、ステップS404に移行する。
ステップS402にて、検索種別604が画像検索ではないと判定された場合には(ステップS402において「NO」)、ステップS406へ移行する。ステップS406において、CPU101は、検索種別604に基づきテキスト検索か否かを更に判定する。検索種別がテキスト検索であると判定された場合には(ステップS406において「YES」)、ステップS407へ移行する。ステップS407において、CPU101は、ステップS401で取得した検索条件605を検索クエリとして、テキスト検索部204が外部記憶部107に格納されている検索対象情報につきテキスト検索を実行する。そしてステップS404へ進む。なお、検索種別がテキスト検索ではないと判定された場合には(ステップS406において「NO」)、処理を終了する。
ステップS407におけるこのテキスト検索では、まず検索条件605の文書中から、語の出現頻度、出現文書数、出現分布等の組み合わせ、或いは、語が内容を示す語であるかどうか等に基づいて特徴的なキーワードが抽出される。次に、抽出したキーワードを検索クエリとして外部記憶部107内の検索対象情報について全文検索を行う。次に、この検索結果に基づいて検索対象情報を順位付けし、順位の高い検索対象情報を、類似文書とする。
ステップS404において、CPU101は、ステップS403の画像検索、ステップS407のテキスト検索、又は、ステップS409における検索の検索結果を基に、検索結果情報700を生成する。検索結果数701には、画像検索またはテキスト検索にて検出されたファイルの数が格納される。検索結果文書パス702には、画像検索またはテキスト検索にて検索された各ファイルのファイルパスが格納される。
ステップS405では、CPU101は、ステップ404にて作成された検索結果情報700に基づき、検索フォルダ画面800のファイル表示部803に検索結果を表示する。なお、ファイル表示部803に表示するときには、検索結果情報700の検索結果文書パス702にて表示するファイルを求めて、サムネイル画像を作成しファイルアイコンとして表示する。このときの表示形態が図8に示すようになる。その後、処理を終了する。
以上のように、本実施形態に対応する情報処理装置によれば、テキストによるキーワードだけでなく、テキストや図形、写真を含む文書画像そのものを検索クエリとして設定し、文書中の情報に関連する文書を検索・取得することができる。
[その他の実施形態]
なお、本発明は、複数の機器(例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
また、本発明の目的は、前述した機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムに供給し、そのシステムがプログラムコードを読み出し実行することによっても達成される。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現し、そのプログラムコードを記憶した記憶媒体は本発明を構成する。また、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した機能が実現される場合も含まれる。
さらに、以下の形態で実現しても構わない。すなわち、記憶媒体から読み出されたプログラムコードを、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込む。そして、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行って、前述した機能が実現される場合も含まれる。
本発明の実施形態に対応する情報処理装置の構成の一例を示す図である。 本発明の実施形態に対応する情報処理装置100の機能構成の一例を示すブロック図である。 本発明の実施形態に対応する検索フォルダ表示処理の一例を示すフローチャートである。 本発明の実施形態に対応する検索処理の一例を示すフローチャートである。 本発明の実施形態に対応する文書画像解析情報の一例を示す図である。 本発明の実施形態に対応する検索フォルダ管理情報の一例を示す図である。 本発明の実施形態に対応する検索結果情報の一例を示す図である。 本発明の実施形態に対応する検索フォルダ画面の一例を示す図である。 本発明の実施形態に対応するブロック解析を説明するための図である。

Claims (10)

  1. 検索条件が設定されたフォルダの選択に応じて、該設定された検索条件に基づいてデータファイルを検索する情報検索装置であって、
    画像データの指定を受け付ける指定受付手段と、
    指定された前記画像データをブロック分割する分割手段と、
    前記ブロック毎に、ブロックの特徴を表す情報を検索条件として抽出する抽出手段と、
    前記抽出されたブロックの特徴を表す情報が検索条件として設定されるフォルダを、前記ブロック毎に作成する作成手段とを備え、
    前記データファイルの検索は、作成された前記フォルダのうち選択されたフォルダに設定された前記検索条件に基づいて行われ
    前記作成手段は、前記抽出手段によって抽出されたブロックの特徴を表す情報が検索条件として設定されるフォルダを前記ブロック毎にサブフォルダとして作成し、さらに、前記ブロック毎の特徴を表す情報の積集合を検索条件として設定したメインフォルダを作成することを特徴とする情報検索装置。
  2. 前記分割手段は、前記画像データを少なくともテキストブロック及び画像ブロックのいずれかに分割することを特徴とする請求項1に記載の情報検索装置。
  3. 前記抽出手段は、
    前記ブロックがテキストブロックの場合に、前記特徴を表す情報として、該テキストブロック内のテキスト情報を抽出し、
    前記ブロックが画像ブロックの場合には、前記特徴を表す情報として該画像の特徴量を抽出することを特徴とする請求項2に記載の情報検索装置。
  4. 前記作成手段によって作成されたフォルダのうち、選択されたフォルダに対応するブロックの画像情報を表示する表示手段を有することを特徴とする請求項1乃至のいずれか1項に記載の情報検索装置。
  5. 検索条件が設定されたフォルダの選択に応じて、該検索条件に基づいてデータファイルを検索する情報検索装置の制御方法であって、
    前記情報検索装置の指定受付手段が、画像データの指定を受け付ける指定受付工程と、
    前記情報検索装置の分割手段が、指定を受け付けた前記画像データをブロック分割する分割工程と、
    前記情報検索装置の抽出手段が、前記ブロック毎に、ブロックの特徴を表す情報を抽出する抽出工程と、
    前記情報検索装置の作成手段が、前記抽出されたブロックの特徴を表す情報が検索条件として設定されるフォルダを、前記ブロック毎に作成する作成工程と
    を備え、前記データファイルの検索は、作成された前記フォルダのうち選択されたフォルダに設定された前記検索条件に基づいて行われ
    前記作成工程では、前記抽出工程において抽出されたブロックの特徴を表す情報が検索条件として設定されるフォルダが、前記ブロック毎にサブフォルダとして作成され、さらに、前記ブロック毎の特徴を表す情報の積集合を検索条件として設定したメインフォルダが作成されることを特徴とする情報検索装置の制御方法。
  6. 前記分割工程では、前記画像データが少なくともテキストブロック及び画像ブロックのいずれかに分割されることを特徴とする請求項に記載の情報検索装置の制御方法。
  7. 前記抽出工程では、
    前記ブロックがテキストブロックの場合に、前記特徴を表す情報として、該テキストブロック内のテキスト情報が抽出され、
    前記ブロックが画像ブロックの場合には、前記特徴を表す情報として該画像の特徴量が抽出されることを特徴とする請求項に記載の情報検索装置の制御方法。
  8. 前記作成工程において作成されたフォルダのうち、選択されたフォルダに対応するブロックの画像情報が表示部に表示されることを特徴とする請求項乃至のいずれか1項に記載の情報検索装置の制御方法。
  9. 請求項乃至のいずれか1項に記載の情報検索装置の制御方法をコンピュータに実行させるためのコンピュータプログラム。
  10. 請求項に記載のコンピュータプログラムを記憶したコンピュータで読み取り可能な記憶媒体。
JP2005282333A 2005-09-28 2005-09-28 情報検索装置及びその制御方法、コンピュータプログラム、並びに、記憶媒体 Expired - Fee Related JP4906044B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005282333A JP4906044B2 (ja) 2005-09-28 2005-09-28 情報検索装置及びその制御方法、コンピュータプログラム、並びに、記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005282333A JP4906044B2 (ja) 2005-09-28 2005-09-28 情報検索装置及びその制御方法、コンピュータプログラム、並びに、記憶媒体

Publications (3)

Publication Number Publication Date
JP2007094691A JP2007094691A (ja) 2007-04-12
JP2007094691A5 JP2007094691A5 (ja) 2008-11-13
JP4906044B2 true JP4906044B2 (ja) 2012-03-28

Family

ID=37980346

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005282333A Expired - Fee Related JP4906044B2 (ja) 2005-09-28 2005-09-28 情報検索装置及びその制御方法、コンピュータプログラム、並びに、記憶媒体

Country Status (1)

Country Link
JP (1) JP4906044B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5345049B2 (ja) * 2009-12-25 2013-11-20 富士フイルム株式会社 検索サーバ及びその制御方法、並びに検索システム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2579397B2 (ja) * 1991-12-18 1997-02-05 インターナショナル・ビジネス・マシーンズ・コーポレイション 文書画像のレイアウトモデルを作成する方法及び装置
JP4340367B2 (ja) * 1999-01-27 2009-10-07 株式会社リコー 画像分類装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002073598A (ja) * 2000-08-24 2002-03-12 Canon Inc 文書処理装置および方法
JP2003271601A (ja) * 2002-03-18 2003-09-26 Ricoh Co Ltd 画像管理検索方法、画像管理検索装置、プログラム及び当該プログラムを記憶した記録媒体
JP2004348706A (ja) * 2003-04-30 2004-12-09 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
JP4405831B2 (ja) * 2003-05-20 2010-01-27 キヤノン株式会社 画像処理装置及びその制御方法、プログラム

Also Published As

Publication number Publication date
JP2007094691A (ja) 2007-04-12

Similar Documents

Publication Publication Date Title
JP2007200320A (ja) ファイルシステムへアクセスするための方法とシステム
US20100088307A1 (en) Search condition designation apparatus, search condition designation method, and program
US9310971B2 (en) Document viewing device for display document data
US7346673B1 (en) Method and apparatus for selecting a device and a computer product
JP4054428B2 (ja) 画像検索装置及びその方法、コンピュータ可読メモリ
US7995232B2 (en) Document file management apparatus, document file management method, and document file management program
JP2001337994A (ja) サムネイル表示システムと方法およびその処理プログラムを記録した記録媒体
US20030135497A1 (en) Recording medium on which file search program is recorded and file search apparatus
JP2008052496A (ja) 画像表示装置、画像表示方法、プログラムおよび記録媒体
US20080232842A1 (en) Image forming apparatus, image forming system and control method of image forming apparatus
JP4906044B2 (ja) 情報検索装置及びその制御方法、コンピュータプログラム、並びに、記憶媒体
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP5366647B2 (ja) 情報処理装置及び情報処理方法
US10057437B2 (en) Image processing apparatus, operation assistance method, and non-transitory computer-readable recording medium encoded with operation assistance program
US20210097275A1 (en) Image processing apparatus, control method of image processing apparatus, and storage medium
JP2004157668A (ja) 検索システム、検索方法および検索プログラム
JPH10240724A (ja) 文書管理装置及びシステム及び方法
JP7102284B2 (ja) ファイル管理装置、ファイル管理方法、及びプログラム
JP2008009859A (ja) 検索インデックス作成装置及び検索インデックス作成方法
JP2006252525A (ja) 文書ファイル管理装置、文書ファイル管理方法、および文書ファイル管理プログラム
US20060203258A1 (en) File management apparatus
JP2017068307A (ja) 情報検索装置及びその制御方法、情報検索用プログラム
JP2008250498A (ja) 情報処理装置および情報処理方法
US20060206531A1 (en) Document managing apparatus
JP2002259173A (ja) ファイル管理プログラム、ファイル管理プログラムを記録したコンピュータ読取可能な記録媒体、ファイル管理装置およびファイル管理方法

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080926

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110704

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110831

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111031

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120105

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120106

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150120

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4906044

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150120

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees