JP2004157668A - Retrieval system, retrieval method and retrieval program - Google Patents

Retrieval system, retrieval method and retrieval program Download PDF

Info

Publication number
JP2004157668A
JP2004157668A JP2002321383A JP2002321383A JP2004157668A JP 2004157668 A JP2004157668 A JP 2004157668A JP 2002321383 A JP2002321383 A JP 2002321383A JP 2002321383 A JP2002321383 A JP 2002321383A JP 2004157668 A JP2004157668 A JP 2004157668A
Authority
JP
Japan
Prior art keywords
search
page
image
reduced
simplified image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002321383A
Other languages
Japanese (ja)
Inventor
Shiro Ikegami
史郎 池上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2002321383A priority Critical patent/JP2004157668A/en
Publication of JP2004157668A publication Critical patent/JP2004157668A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a retrieval system, a retrieval method and a retrieval program, relating to a retrieval result display technology in character retrieval or image retrieval, and allowing an operator to extract a page including a retrieval key and to easily visually recognize arrangement or the like of an object fit for the retrieval key in the page. <P>SOLUTION: This retrieval system has: a retrieval key specification means 111; a retrieval means 112 extracting the page including the object fit for the retrieval key from a retrieval target; a reduced simplified image generation means 113 generating a reduced simplified image characterized such that a portion of the object can be distinguished from other portions; and a reduced simplified image display means 115 having a function for displaying the reduced simplified image generated by the reduced simplified image generation means. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明は、文字検索や画像検索における検索結果表示技術に係り、操作者が検索キーを含むページを抽出し、当該ページにおける検索キーに適合するオブジェクトの配置等を容易に視認できる検索システム、検索方法および検索プログラムに関する。
【0002】
【従来の技術】
従来、単語、文章、画像等の検索システムや検索方法には様々な検索結果の表示技術が採用されている。これらの表示技術の多くは、検索キーに適合するオブジェクト(通常は、検索キーと同一の単語等)が多数ある場合には、当該オブジェクトを多く含んだ文書を優先的にリスト表示したり、補助的な情報としてオブジェクトを含む文章の一部または全部を表示したりしている。
【0003】
たとえば、ウェブ上のサーチエンジンによる検索では、ウェブブラウザ上で、検索キーに対応するURLのリストおよび各リストごとに検索キーを含む補助文章を表示している。操作者はリストアップされたURLのウェブページを読み出し、たとえばさらに当該ウェブブラウザの検索機能を用いて前記所定の単語等を検索して当該ウェブページ上の検索キーに対応する単語等にたどり着くことができる。
【0004】
また、たとえばコンピュータ内において、所定の単語等(検索キー)を含む文書(ファイル)を検索する場合には、当該単語等を含む文書がリストアップされる。操作者はリストアップされた文書を所定のアプリケーション(通常はリストアップされたファイルにリンクされているアプリケーション)を用いて起動し、たとえばさらに当該アプリケーション上の検索機能を用いて前記所定の単語等を検索して、文書上の検索キーに対応する単語等にたどり着くことができる。
【0005】
ところが、たとえばウェブ上のサーチエンジンによる検索では、補助情報として検索キーに適合する単語を含む部分的な文章しか表示されないため、操作者は目的とする記事等にただちにたどり着くことができず、何度かリストアップされたURLにかかるウェブページを読み出さなければならない場合がある。
【0006】
従来、〔特許文献1〕,〔特許文献2〕に記載されているような、検索結果を、視覚的情報を利用して操作者に表示する技術が知られている。〔特許文献1〕の技術では、サムネイル画像による読み易さが解消されるとされているが、検索語(検索キーに適合する文字列等)の位置がサムネイル画像に反映されていないため、検索した文書に検索語がどのように配置されているかを操作者が視認することができない。
【0007】
また、〔特許文献2〕の技術では、検索結果と同時に特徴語の関連を示すグラフを表示し、検索結果とその他の文書との繋がりを視覚的に伝えているものの、やはり検索した文書に検索語がどのように配置されているかを操作者が視認することができない。
【0008】
【特許文献1】
特開2000−293541号
【特許文献2】
特開平11−85786号
【0009】
【発明が解決しようとする課題】
ところが、検索キーの意味する単語等の説明に画像が添付されている文書がリストアップされたものの中に含まれている場合であっても、当該文書が検索結果リストの上位にリストアップされているとは限らない。また、検索キーの意味する単語等の説明に画像が添付されているか否かによらず、文書の段落のどの辺りで検索対象語が出現しているか知っていたほうが理解力が深まる場合もあり、さらにレイアウトが整っている文書の方が、レイアウトが煩雑である文書よりも読み易い場合も多いが、〔特許文献1〕,〔特許文献2〕ではこれに対する配慮はなされていない。
【0010】
また、近年に見られるインターネットやグループウェアの発達により情報の共有化が進んでいる。このため、たとえばウェブサイト上の記事には、同じような記事内容の文書が散在していることが多く、たとえばある検索キーにより検索した場合に抽出される文書には情報価値が同等のものが多くなっている。従来のウェブ上の検索では、1文書のページ数が多ければ、検索キーに対応する単語等の出現頻度(出現密度:たとえば、所定の文字数の文書中に含まれる当該単語の個数)が低くても、全体として当該検索キーに対応する単語の全出現数が多ければ、この文書は検索リストの上位にリストアップされるが、このような検索結果は、操作者の意図を必ずしも反映したものではない。
【0011】
本発明の目的は、文書中の検索キーに適合するオブジェクトの位置を明示することで、当該オブジェクトの出現頻度が一目で視認でき、また、段落中のオブジェクトの出現位置より文書でのオブジェクトの使われ方が推測でき、文書内容が判別できる検索システム、検索方法および検索プログラムを提供することにある。
【0012】
本発明の他の目的は、文書のレイアウト情報を表示することで、操作者が検索結果からより価値のある文書を選ぶことができる検索システム、検索方法および検索プログラムを提供することにある。
【0013】
【課題を解決するための手段】
本発明の検索システムは、検索キーを指定する機能を備えた検索キー指定手段と、前記検索キーに適合するキャラクタ、キャラクタ列または画像としてのオブジェクトが含まれたページを検索対象から抽出する検索手段と、前記検索手段により抽出したページにかかる画像であって、前記オブジェクト部分が他の部分と識別できるように特徴付けられてなる縮小簡易画像を生成する縮小簡易画像生成手段と、前記縮小簡易画像生成手段により生成した縮小簡易画像を表示する機能を備えた縮小簡易画像表示手段とを備えたことを特徴とする(以下、この検索システムを「第1態様」と称する)。
【0014】
本発明では、検索キーに適合するオブジェクトを含むページの縮小簡易画像を表示することによって、当該ページ上のオブジェクトの位置がわかることによって、より有用な文書か否かの判断が容易となる。
【0015】
また、本発明の検索システムは、絞込み用の検索キーを指定する機能を備えた検索キー指定手段と、前記検索キーに適合するキャラクタ、キャラクタ列または画像としての絞込み用のオブジェクトを既に抽出してあるページから少なくとも1回抽出する絞込み用の検索手段と、前記絞込み用の検索手段により抽出した絞込み用のオブジェクトを含むページにかかる画像であって、前記絞込み用のオブジェクト部分が他の部分と識別でき、かつ当該絞込み前の検索における検索キーに適合するオブジェクト部分と識別できるように特徴付けられてなる縮小簡易画像を生成する前記縮小簡易画像生成手段と、前記縮小簡易画像生成手段により生成した縮小簡易画像を表示する機能を備えた縮小簡易画像表示手段とを備えたことを特徴とする(以下、この検索システムを「第2態様」と称する)。
【0016】
絞込み検索において、絞込み用検索キーに適合するオブジェクトを他の部分と識別できるように特徴付けすることによって当該オブジェクトの位置を分かり表示できる。
【0017】
第1態様および第2態様では、前記ページ上の前記オブジェクトの位置を検出できるレイアウト解析手段を備えることができ、前記縮小簡易画像生成手段は、前記レイアウト解析手段により検出したオブジェクトの位置データに基づき前記縮小簡易画像を生成することができる。
【0018】
第1態様および第2態様では、前記キー指定手段または絞込み用キー指定手段は、AND検索,OR検索またはAND/OR複合検索のための複数のキー要素を指定する機能を備えることができる。そして、縮小簡易画像生成手段は、各キー要素に適合する各オブジェクト部分が相互に識別できるように特徴付けすることができる。
【0019】
第1態様および第2態様では、さらに、所定の指示手段により特定された前記縮小簡易表示画像にかかるページを通常の大きさで表示するページ・文書表示手段を備えることができる。
【0020】
第1態様および第2態様では、前記縮小簡易画像表示手段は、前記検索手段により抽出したページが複数ある場合には、抽出ページの全部または一部を並べて表示することができる。
【0021】
第1態様および第2態様では、前記縮小簡易画像表示手段は、前記検索手段により抽出したページが複数ある場合には、同一文書にかかるページを、ページジャンプ方式、ページめくり方式またはページスクロール方式で表示することができる。ここで、ページめくり方式とは抽出した文書をオブジェクトが含まれないページを含めてページ順に表示する表示方式であり、ページジャンプ方式とはオブジェクトが含まれるページのみを表示する表示方式であり、ページスクロール方式とは表示部に表示されていない部分をスクロールにより表示する方式である。
【0022】
本発明の検索方法は、検索キーを受け取る検索キー取得ステップと、前記検索キーに適合するキャラクタ、キャラクタ列または画像としてのオブジェクトが含まれたページを検索対象から抽出する検索対象抽出ステップと、前記検索対象抽出ステップにおいて抽出したページにかかる画像であって、前記オブジェクト部分が他の部分と識別できるように特徴付けられてなる縮小簡易画像を生成する縮小簡易画像生成ステップと、前記縮小簡易画像を表示する縮小画像表示ステップとを備えたことを特徴とする(以下、この検索方法を「第3態様」と称する)。
【0023】
また、本発明の検索方法は、絞込み用の検索キーを指定する機能を備えた絞込み用の検索キー指定ステップと、前記検索キーに適合するキャラクタ、キャラクタ列または画像としての絞込み用のオブジェクトを既に抽出してあるページから少なくとも1回抽出する絞込み用の検索ステップと、前記絞込み用の検索ステップにおいて抽出した絞込み用のオブジェクトを含むページにかかる画像であって、前記絞込み用のオブジェクト部分が他の部分と識別でき、かつ当該絞込み前の検索における検索キーに適合するオブジェクト部分と識別できるように特徴付けられてなる縮小簡易画像を生成する前記縮小簡易画像生成ステップと、前記縮小簡易画像生成ステップにおいて生成した縮小簡易画像を表示する機能を備えた縮小簡易画像表示ステップとを備えたことを特徴とする(以下、この検索方法を「第4態様」と称する)。
【0024】
第3態様および第4態様における、縮小簡易画像生成ステップでは、前記検索手段により抽出したページにおける当該オブジェクトの位置を検出できるレイアウト解析処理を実行し、当該レイアウト解析処理により検出した前記オブジェクトの位置データに基づき前記縮小簡易画像を生成することができる。
【0025】
第3態様および第4態様においては、さらに、所定の指示手段により特定された前記縮小簡易表示画像にかかるページを通常の大きさで表示するページ・文書表示ステップを有すことができる。
【0026】
第3態様および第4態様では、前記縮小画像表示ステップでは、前記検索手段により抽出したページが複数ある場合には、抽出ページの全部または一部を並べて表示することができる。
【0027】
第3態様および第4態様では、前記縮小画像表示ステップでは、前記検索手段により抽出したページが複数ある場合には、同一文書にかかるページをページジャンプ方式、ページめくり方式またはぺージスクロール方式で表示することができる。
【0028】
本発明の検索プログラムは、第3態様および第4態様における各ステップを備えて構成することができる。
【0029】
【発明の実施の形態】
図1〜図8は、本発明の第1実施形態を示す説明図である。
図1において、検索システム1は、コンピュータ本体11と、入力装置(キーボード)12と、ディスプレイ13と、データベース14と、CD−ROMドライブ15とを備えている。
【0030】
図1のコンピュータ本体11では、説明の便宜上、CPU1101および検索プログラム等が格納されたメモリ(ROMあるいはRAM)1102のみを図示してある。本実施形態では、検索に使用される種々のプログラム(以下、「検索プログラム」と総称する)は、ROMに格納されていてもよいし、RAMに読み込まれていてもよい。検索対象となる文書はデータベース14に蓄積されており、各文書は一意なIDで管理される。
【0031】
図2は、図1の検索システム1を示す機能ブロック図である。図2において、コンピュータ本体11は、検索キー指定手段111と、検索手段112と、縮小簡易画像生成手段113と、縮小簡易画像表示手段114と、レイアウト解析手段115と、ページ・文書表示手段116と、絞込み用検索キー指定手段117と、絞込み用検索手段118とを備えている。
【0032】
検索キー指定手段111は、検索キー(キャラクタ、キャラクタ列または画像)を指定する機能を備えている。ここで、キャラクタとは文字または記号であり、キャラクタ列とはキャラクタの集まりである。この検索キー指定手段111は、たとえばダイアログボックスや入力ウィンドウを図1に示したディスプレイ13上に表示し、操作者からの検索キーを入力装置12を介して取得するプログラムである。
【0033】
検索キーは、図3(A)に示すように、文字または記号等のキャラクタやキャラクタ列で指定することができる。また、検索キーは、図3(B)に示すように、画像で指定するようにもできる。図3(A)では、検索キーを「AND」(論理積)や「OR」(論理和)で指定することができるようにしてもよい。また、図3(A)では、「三日月形」,「亀甲」等の図形が意味する語で、画像検索ができるようにしてもよい。
【0034】
検索手段112は、データベース14内の文書を検索して、前記検索キーに適合するキャラクタ、キャラクタ列または画像としてのオブジェクト(以下、「適合オブジェクト」)が含まれたページを検索対象である文書群から抽出する。この抽出したページについての情報(文書ID,文書中何ページであるかの情報等)は、メモリ1102に(RAM)に一時保存される。
【0035】
縮小簡易画像生成手段113は、検索手段112により抽出したページにかかる画像を生成する。この縮小簡易画像の生成に際しては、ページ上の文字を共通の図形(ドット等)で表現したり、文字列をラインで表現したりできる。この場合の縮小簡易画像は、ビットマップイメージとして生成してもよいし、ベクトルイメージ(スクリプトにより表示される画像、あるいはドロー系画像)として生成してもよい。
【0036】
また、縮小簡易画像生成手段113は、ページ上のキャラクタを、小さいフォントで表現することもできる。ページ上の画像は、当該画像を縮小して表現することもできるし、当該画像部分を矩形等で表現することもできる。なお、HTML文書等のページ概念がない文書では、所定行数単位(所定の印刷範囲に対応する領域を単位)を1ページとして簡易縮小画像を生成する。
【0037】
また、縮小簡易画像生成手段113は、適合オブジェクト部分が他の部分と識別できるように特徴付けられてなる縮小簡易画像を生成する。具体的には、たえば文書が白地に黒文字で作成されている場合には、オブジェクト部分を赤で表現しり、太線で表現したりできる。
【0038】
レイアウト解析手段114は、縮小簡易画像生成手段113が縮小簡易画像を生成するに際して、検索キーに適合するオブジェクトの、当該オブジェクトを含むページ上の位置を検出する。この検出は、たとえば上記ページの行数(行間隔)、表示されてフォントの文字間隔、フォントの種類等の情報を計算することにより行なわれる。また、文書に画像が含まれている場合には当該画像を矩形等で表現することができる。
【0039】
縮小簡易画像表示手段115は、図4(A),(B)、図5(A),(B)に例示するように縮小簡易画像生成手段113により生成した縮小簡易画像を、所定のウィンドウ上に表示することができる。
【0040】
縮小簡易画像表示手段115は、検索手段112により抽出したページ(通常、複数である)を、図4(A)に示すようにページジャンプ方式で表示することもできるし、図4(B)に示すように並べて表示することができる。図4(A)では、縮小簡易画像にかかる文書の次ページは表示せず、次にオブジェクトが現れるページに表示がジャンプするように、「ジャンプ」ボタン,「戻る」ボタンとが設けられている。
【0041】
また、縮小簡易画像表示手段115は、検索手段112により抽出したページを、図5(A),(B)に示すように「ページごと」と「一文書」が選択できるラジオボタンにより、相互に切り換えることができるように構成することができる。図5(A)は、図4(B)と同様の表示ウィンドウにラジオボタンが付加されたものである。ただし、図5(A)では、「ジャンプ」ボタン,「戻る」ボタンに代えて、ページめくり方式で表示するための「前ページ」ボタンと「次ページ」ボタンとが設けられている。
【0042】
図5(B)は、図4(A)の表示ウィンドウにラジオボタンが付加されたものであるが、ひとつの文書のオブジェクトを含む各ページのみが表示される。検索が実行されると、検索結果として、図5(A)の画面が表示される(このときは、「ページごと」のラジオボタンがデフォルトで指定されている)。そして、複数の文書のうち何れかを選択して、「一文書」のボタンを押すと図5(B)の表示に切り換わり、この状態で「ページごと」ボタンを押すと図5(A)の表示に切り換わる。
【0043】
なお、図5(B)においては、「次ページ」ボタンを押すと、次のページにオブジェクトがあるか否かによらず、当該ページの縮小簡易画像が表示されるが、図4(B)に示したように。
【0044】
なお、前述したように、HTML文書にはページ区切りは存在せず、印刷時に1ページとして区切られると想定される箇所をページの区切りとして取り扱っている。
【0045】
ページ・文書表示手段116は、マウスポインタ等の指示手段により特定された縮小簡易表示画像にかかるページを通常の大きさで表示することができる。
【0046】
すなわち、データベース14に蓄積されている文書のフォーマットを読み込めるブラウザや、アプリケーションソフトウェア(たとえば、特定のワードプロセッサ用アプリケーションソフトウェアや画像作成用アプリケーションソフトウェア)により起動される。このアプリケーションは、前述した検索プログラムに付属するものであってもよいし、検索プログラム以外のアプリケーションソフトウェアであってもよい。たとえば、検索プログラム以外のアプリケーションソフトウェアにより、縮小簡易表示画像にかかるページを表示する場合には、縮小簡易表示画像にフォーマット情報(たとえば、ファイルに付される、いわゆる「拡張子」)やページ情報(該当する文書の何ページ目かの情報)を付属させておき、当該フォーマット情報にアプリケーションをリンクさせておくことができる。
【0047】
図4(A),(B)、図5(A),(B)には縮小簡易画像が表示される領域の他に「通常表示」ボタン、および「絞込みボタン」が設けられている。「通常表示」ボタンを押すと、表示されていたサムネイル画像に対応するHTML文が、通常サイズで表示され、「絞込みボタン」を押すと、図3(C)に示すような絞込み用検索キーを指定するための入力欄(ここではダイアログボックス)が図1に示したディスプレイ13上に表示される。
【0048】
絞込み用検索キー指定手段117は、操作者が絞込み用検索キー(キャラクタ、キャラクタ列または画像)を指定するための機能であり、検索キー指定手段111と同様、たとえばダイアログボックスや入力ウィンドウを図1に示したディスプレイ13上に表示し、縮小簡易画像生成手段113が操作者からの絞込み用検索キーを図1に示した入力装置12を介して取得するプログラムである。
【0049】
絞込み用検索手段118は、絞込み用検索キーに適合するキャラクタ、キャラクタ列または画像としての絞込み用オブジェクトを既に抽出してあるページから少なくとも1回抽出することができる。なお、前述したように既に抽出してあるページにかかる情報は、メモリ(RAM)1102に一時保存されている。絞込み用検索手段118により検索した絞込み用オブジェクトも、メモリ(RAM)1102に一時保存される。
【0050】
絞込みにおいては、縮小簡易画像生成手段113は、前記絞込み用検索手段により抽出した絞込み用オブジェクトを含むページにかかり、絞込み用オブジェクト部分が他の部分と識別でき、かつ当該絞込み前の検索における検索キーに適合するオブジェクト部分と識別できるように特徴付けられてなる縮小簡易画像を生成する。図6(A)は、検索キーが「自然言語」の検索結果の表示例であり、図6(B)は絞込み用検索キーが「構文解析」であるときの絞込み検索結果の表示例である。絞込み用検索キー「構文解析」に適合するオブジェクト部分を青色で表現し、他の部分と識別され、かつ検索キー「自然言語」に適合するオブジェクト部分(たとえば赤で表示される)とも識別できるように特徴付けられている。
【0051】
図7のフローチャートにより、検索処理全体の流れを説明する。
検索手段112は、検索キー指定手段111から検索キーを受け取ると(S101)、検索キーに適合するオブジェクトが含まれるページをデータベース400から抽出する(S102)。検索キーに適合するオブジェクトが含まれるページがないときは処理を終了するが、あるときは、抽出の後または抽出処理と並行して、縮小簡易画像生成手段113は、抽出した文書から1つ取り出す(S103,S104)。レイアウト解析手段114は、文字列相当部分および画像部分を検出し(S105)、縮小簡易画像生成手段113が、キャラクタ列部分を直線で表現し、画像部分を矩形図形で表現した縮小簡易画像を生成する(S106)。この縮小簡易画像の生成処理は、抽出した文書の全てについて行なう(S107)。このとき検索キーに適合するオブジェクト部分は、他の部分と容易に識別できるように色彩等により特徴付けされる。縮小簡易画像表示手段115は、縮小簡易画像を所定のウィンドウ上に表示する(S108)。
【0052】
図8のフローチャートにより、絞込み処理全体の流れを説明する。
絞込み用検索手段117は、絞込み用検索キー指定手段117から絞込み用検索キーを受け取ると(S201)、絞込み用検索キーに適合するオブジェクトが含まれるページを、既に抽出してある文書群から抽出する(S202)。検索キーに適合するオブジェクトが含まれるページがないときは処理を終了するが、あるときは、抽出の後、または抽出処理と並行して、縮小簡易画像生成手段113は抽出した文書から1つ取り出す(S203,S204)。レイアウト解析手段114は、文字列相当部分および画像部分を検出し(S205)、縮小簡易画像生成手段113が、キャラクタ列部分を直線で表現し、画像部分を矩形図形で表現した縮小簡易画像を生成する(S206)。この縮小簡易画像の生成処理は、新たに抽出した文書の全てについて行なう(S207)。このとき絞込み用検索キーに適合するオブジェクト部分は、他の部分と容易に識別できるように(検索により既に特徴付けされて表現されているオブジェクト部分とも識別できるように)色彩等により特徴付けされる。
【0053】
縮小簡易画像表示手段115は、縮小簡易画像を所定のウィンドウ上に表示し、操作者が通常画像の表示を指定したときは、該当文書の通常表示を行なう。
【0054】
図9〜図12は、本発明の第2実施形態を示す説明図である。
図9において、検索システム2は、コンピュータ本体31と、入力装置(キーボード)32と、ディスプレイ33とを備えた端末装置3と、データベース400を備えた検索サーバ4とからなり、コンピュータ本体31と検索サーバ4とはインターネット200を介して接続されている。
【0055】
コンピュータ本体31は、CPU3101、検索キー指定プログラム等が格納されたメモリ(ROMあるいはRAM)3102を備えている。検索キー指定プログラム等は、ROMに格納されていてもよいし、RAMに読み込まれていてもよい。
【0056】
検索サーバ4は、CPU4101、検索プログラム等が格納されたメモリ(ROMあるいはRAM)4102を備えている。検索プログラムは、ROMに格納されていてもよいし、RAMに読み込まれていてもよい。本実施形態では、データベース400に蓄積された文書は、HTML等の文章(キャラクタ列)およびJPEG等のイメージ画像を含んで構成される。端末装置3のブラウザが、ベクトルイメージの表示に対応している場合には、第1実施形態と同様にベクトルイメージとすることもできる。なお、PDF(Portable Document Format)等の特定フォーマットにより作成した文書を検索対象文書とすることもできる。
【0057】
図10は、図9の検索システム3を示す機能ブロック図である。図10において、端末装置3は、検索キー指定手段311と、縮小簡易画像表示手段312と、ページ・文書表示手段313と、絞込み用検索キー指定手段314と、通信手段315とを備え、検索サーバ4は、検索手段411と、縮小簡易画像生成手段412と、レイアウト解析手段413と、絞込み用検索手段414と、通信手段415とを備えている。なお、本実施形態では、端末装置3の、検索キー指定手段311、縮小簡易画像表示手段312、ページ・文書表示手段313、絞込み用検索キー指定手段314は、インストールされたブラウザの機能に含まれている。なお、前述したようにHTML文書では、所定行数単位(所定の印刷範囲に対応する領域を単位)を1ページとして簡易縮小画像を生成する。
【0058】
検索キー指定手段311は、検索キー(キャラクタまたはキャラクタ列)を指定する機能を備えている。ここで、キャラクタとは、第1実施形態で説明したように文字または記号であり、キャラクタ列とはキャラクタの集まりである。この検索キー指定手段311は、たとえばダイアログボックスや入力ウィンドウをディスプレイ33上に表示し、操作者からの検索キーを入力装置32を介して取得するプログラムである。検索キーの指定は、第2実施形態でも、第1実施形態と同様、検索キーを文字または記号等のキャラクタやキャラクタ列で指定することができ(図3(A)参照)、検索キーを「AND」(論理積)や「OR」(論理和)で指定することができるようにしてもよい。また、第2実施形態においても、第1実施形態と同様、画像検索の場合には、「三日月形」,「亀甲」等の図形が意味する語で、画像検索ができるようにしてもよいし、画像検索に対応させることも可能である(図3(B)参照)。
【0059】
検索キー指定手段311により指定された検索キーは、通信手段315、インターネット200、通信手段415を介して、検索サーバ4の検索手段411に渡される。検索手段411は、データベース400内の文書を検索して、前記検索キーに適合するキャラクタ、キャラクタ列または画像としてのオブジェクトが含まれたページを検索対象から抽出する。この抽出した文書についての情報(文書ID,文書中何行目であるかの情報等)は、メモリ(RAM)4102に一時保存される。
【0060】
縮小簡易画像生成手段412は、第1実施形態の縮小簡易画像生成手段113が縮小簡易画像を生成したときと同様にして縮小簡易画像を生成する。すなわち、レイアウト解析手段413がオブジェクトの文書上の位置を検出し、この検出した情報に基づき縮小簡易画像生成手段412が縮小簡易画像を生成する。生成した簡易縮小画像には、表示順位を付することができる。文書単位で縮小簡易画像を表示するときは(図11(A)参照)、表示順位は当該文書単位で付され、ページごとに縮小簡易画像を表示するときは(図11(B)参照)表示順位は当該ページ単位で付され。表示順位は、一文書中または一ページ中に出現する検索キーに適合するオブジェクト数により決定することができる。また、抽出した文書数やページ数が多いときは、表示する文書数やページ数に制限を設けることができる。この場合にも、たとえば、一文書中または一ページ中に出現する、検索キーに適合するオブジェクトの数により、当該オブジェクトを含む文書を抽出対象とするか否かを決定することができる。
【0061】
たとえば、縮小簡易画像生成手段412は文書IDにより特定される文書テキストと画像をデータベース400から取得し、レイアウト解析手段413によりレイアウト情報を再現しながら文書の画像を作成し、さらにたとえば縮小簡易画像(たとえば、48×64ピクセルのサムネイル画像)を作成する。レイアウト解析手段413は、縮小簡易画像の作成に際して、オブジェクトがたとえばテキスト部の何行目の何文字目に現れるか、当該行を構成する文字のフォントサイズは何かを、HTMLのタグを解析することで検出し、オブジェクトの位置を検出できる。レイアウト解析手段413は、これを縮小簡易画像に対応するように変換して、縮小簡易画像上でのオブジェクトの出現位置を計算することができる。
【0062】
縮小簡易画像生成手段412は、文書上の文字を共通の図形(ドット等)で表したり、文字列をラインで表したりすることもできる。また、文書上のキャラクタを、小さいフォントで表示することもでき、縮小簡易画像上でのオブジェクトの出現位置を、特徴的な図形(たとえば、赤色の横長矩形)で描画する。
【0063】
本実施形態では、文書上に含まれる画像はJPEG等のイメージとしてあるが、端末装置3のブラウザが、ベクトル画像の表示に対応している場合には、第1実施形態と同様にベクトル画像とすることもできる。たとえば、縮小簡易画像生成手段412は、縮小簡易画像の作成に際して、索キー“自然言語”、文書のURL、検索されたHTML文書の“TITLE”タグのキャラクタ列を文字で抜き出し、“BODY”部を横線で表現し、画像を矩形で表現している。ここで、オブジェクト( “自然言語”なる文字列)は太線で表現される。
【0064】
この縮小簡易画像データは、通信手段41、インターネット200、通信手段317を介して、端末装置3の縮小簡易画像生成手段312に返される。
【0065】
縮小簡易画像表示手段312は、返された縮小簡易画像をディスプレイ33に表示する。縮小簡易画像表示手段312は、図11(A),(B)に例示するように、縮小簡易画像生成手段412により生成された縮小簡易画像を、所定のウィンドウ上に表示することができる。
【0066】
これらの表示では、縮小簡易画像には文書タイトルが記載されている。縮小簡易画像表示手段312は、検索手段411により抽出したページが複数ある場合には、図9(A)に示すようにスクロール方式で表示することもできるし、図9(B)に示すように抽出ページを並べて表示することができる。
【0067】
図11(A),(B)では、検索手段411による検索キー“自然言語”による検索が行なわれ、複数の文書が抽出された場合を示している。図11(A)では、縮小簡易画像表示手段312がこの文書を、一文書として表示した場合を示しており、図11(B)では、ページごとに表示した場合を示している。図12(A)に、図11(B)の上段左から2番目の縮小簡易画像を拡大して示し、図12(B)に当該縮小簡易画像にかかる文書の該当部分を示す。
【0068】
図11(A),(B)には、図4(A),(B),図5(A),(B)と同様、縮小簡易画像が表示される領域の他に「通常表示」ボタン、および「絞込みボタン」が設けられている。「通常表示」ボタンを押すと、表示されていたサムネイル画像に対応するHTML文が、通常サイズで表示される。すなわち、ページ・文書表示手段313は、縮小簡易表示画像に係る文書をデータベース400から読み出して表示することができる。
【0069】
「絞込みボタン」を押すと、図3(C)に示したような絞込み用検索キーを指定するための入力欄(ここではダイアログボックス)が図9に示した端末装置3のディスプレイ33上に表示される。絞込み用検索キー指定手段316により指定された絞込み用検索キーは、当該絞込みの前に行なった検索にかかる検索キー(当該絞込みが複数回目の絞込みの場合には、当該検索キーと、既に行なわれた全ての絞込み検索にかかる検査キー)を通信手段315、インターネット200、通信手段415を介して、検索サーバ4の絞込み用検索手段414に渡される。絞込み用検索手段414は、受け取った検索キーの「AND」により再検索を行い文書の抽出を行なう。抽出された文書について、縮小簡易画像生成手段412は、縮小簡易画像を生成する。縮小簡易画像生成手段412による縮小簡易画像の生成に際しては、複数の検索キーにそれぞれ適合するオブジェクトについては、各オブジェクト部分が識別できるように異なる色等で特徴付けられて表示される。
【0070】
これらの縮小簡易画像は、通信手段415、インターネット200、通信手段315を介して、端末装置3の縮小簡易画像表示手段312に渡され、再度、端末装置3のディスプレイ33に表示される。
【0071】
図10では、縮小簡易画像生成手段(同図では符号412)およびレイアウト解析手段(同図では符号413)は、検索サーバ4に設けてある場合を示したが、これらを端末装置側3に設けることができる。この場合には、端末装置3側は、検索により抽出された文書を検索サーバ4から受け取り、縮小簡易画像を生成する。この場合には、端末装置3側に抽出した文書(抽出された文書数が多いときは、所定数の文書)をダウンロードし縮小画像を生成した後に、当該文書を破棄することができる。残りの文書については、URLを保存しておき縮小簡易画像の表示要求があったときに、縮小簡易画像を作成するようにすることができる。
【0072】
【発明の効果】
文書中の検索キーに適合するオブジェクトの位置を明示することで、当該オブジェクトの出現頻度が一目で視認でき、また、段落中のオブジェクトの出現位置より文書でのオブジェクトの使われ方が推測でき、文書内容が判別できる。
【0073】
また、文書のレイアウト情報を表示することで、操作者が検索結果からより価値のある文書を選ぶことができる。
【図面の簡単な説明】
【図1】本発明の第1実施形態を説明するためのシステム図である。
【図2】図1に示したコンピュータ本体の機能ブロック図である。
【図3】(A)は検索キーがキャラクタである場合に当該キャラクタを指定するダイアログを示す図、(B)は検索キーが画像である場合に当該キャラクタを指定するダイアログを示す図である。
【図4】(A)は検索手段により抽出したページをページジャンプ方式で表示する例を示す説明図、(B)は検索手段により抽出したページを並べて表示した場合を示す説明図である。画像で指定するようにもできる。
【図5】(A)は検索手段により抽出したページをページめくり方式で表示する例を示す説明図、(B)は検索手段により抽出したページを並べて表示した場合を示す説明図である。画像で指定するようにもできる。
【図6】(A)は検索キーが「自然言語」の検索結果の表示例を示す図、図6(B)は絞込み用検索キーが「構文解析」であるときの絞込み検索結果の表示例を示す図である。
【図7】検索処理全体の流れを示すフローチャートである。
【図8】絞込み検索処理全体の流れを示すフローチャートである。
【図9】本発明の第2実施形態を説明するためのシステム図である。
【図10】図10に示したコンピュータ本体の機能ブロック図である。
【図11】(A)は文書単位で縮小簡易画像を表示する場合の表示例を示す図、(B)はページごとに縮小簡易画像を表示する場合の表示例を示す図である。
【図12】(A)は縮小簡易画像を拡大して示した場合の例を示す図、図12(B)は縮小簡易画像にかかる文書の該当部分を示す図である。
【符号の説明】
1,2 検索システム
3 端末装置
4 検索サーバ
11,31 コンピュータ本体
12,32 入力装置
13,33 ディスプレイ
14,400 データベース
15 CD−ROMドライブ
111,311 検索キー指定手段
112,411 検索手段
113,412 縮小簡易画像生成手段
114,413 レイアウト解析手段
115,312 縮小簡易画像表示手段
116,313 ページ・文書表示手段
117,314 絞込み用検索キー指定手段
118,414 絞込み用検索手段
315,415 通信手段
200 インターネット
1101,3101,4101 CPU
1102,3102,4102 メモリ
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a search result display technique in a character search or an image search, and relates to a search system that enables an operator to extract a page including a search key and easily visually recognize an arrangement of objects matching the search key on the page. Method and search program.
[0002]
[Prior art]
2. Description of the Related Art Conventionally, various search result display techniques have been employed in a search system and search method for words, sentences, images, and the like. In many of these display technologies, when there are many objects that match the search key (usually, the same word as the search key), a document containing many such objects is preferentially displayed in a list or displayed as an auxiliary. Some or all of the text including the object is displayed as general information.
[0003]
For example, in a search by a search engine on the web, a list of URLs corresponding to the search keys and auxiliary sentences including the search keys are displayed for each list on a web browser. The operator reads out the web page of the listed URL, for example, further searches for the predetermined word or the like using the search function of the web browser, and arrives at the word or the like corresponding to the search key on the web page. it can.
[0004]
When a document (file) including a predetermined word or the like (search key) is searched in a computer, for example, the documents including the word or the like are listed. The operator activates the listed document using a predetermined application (usually an application linked to the listed file), and further uses, for example, a search function on the application to input the predetermined word or the like. By searching, a word or the like corresponding to the search key on the document can be reached.
[0005]
However, for example, in a search by a search engine on the web, only a partial sentence containing a word that matches the search key is displayed as auxiliary information, so that the operator cannot immediately reach the target article or the like. In some cases, it is necessary to read the web page corresponding to the listed URL.
[0006]
2. Description of the Related Art Conventionally, there is known a technique for displaying search results to an operator using visual information, as described in [Patent Document 1] and [Patent Document 2]. According to the technique of [Patent Document 1], the readability of a thumbnail image is eliminated, but the position of a search word (a character string that matches a search key) is not reflected in the thumbnail image. The operator cannot visually recognize how the search terms are arranged in the retrieved document.
[0007]
Further, in the technique of [Patent Document 2], a graph showing the relation between characteristic words is displayed at the same time as the search result, and the connection between the search result and other documents is visually conveyed. The operator cannot visually recognize how the words are arranged.
[0008]
[Patent Document 1]
JP-A-2000-293541
[Patent Document 2]
JP-A-11-85786
[0009]
[Problems to be solved by the invention]
However, even if a document with an image attached to the description of the word or the like meaning of the search key is included in the list, the document is not listed at the top of the search result list. Not necessarily. Also, regardless of whether or not an image is attached to the explanation of the word or the like that the search key means, it may be better to know where the search target word appears in the paragraph of the document. In addition, a document having a well-arranged layout is often easier to read than a document having a complicated layout. However, [Patent Document 1] and [Patent Document 2] do not consider this.
[0010]
In addition, information sharing has been promoted due to the development of the Internet and groupware seen in recent years. For this reason, for example, articles on websites often have documents of similar article content, and for example, documents extracted when a search is performed using a certain search key may have the same information value. More. In a conventional search on the web, if the number of pages in one document is large, the frequency of appearance of a word or the like corresponding to the search key (appearance density: for example, the number of words included in a document having a predetermined number of characters) is low. If the total number of occurrences of the word corresponding to the search key as a whole is large, this document is listed at the top of the search list, but such a search result does not necessarily reflect the intention of the operator. Absent.
[0011]
An object of the present invention is to specify the position of an object matching a search key in a document so that the appearance frequency of the object can be visually recognized at a glance, and to use the object in the document based on the appearance position of the object in a paragraph. An object of the present invention is to provide a search system, a search method, and a search program that enable us to guess and determine the document content.
[0012]
Another object of the present invention is to provide a search system, a search method, and a search program that allow an operator to select a more valuable document from search results by displaying document layout information.
[0013]
[Means for Solving the Problems]
A search system according to the present invention includes a search key designating unit having a function of designating a search key, and a search unit for extracting, from a search target, a page including a character, a character string, or an object as an image that matches the search key. A reduced simplified image generating means for generating a reduced simplified image which is an image relating to a page extracted by the search means and wherein the object part is characterized so as to be distinguishable from other parts; and And a reduced simplified image display unit having a function of displaying the reduced simplified image generated by the generating unit (hereinafter, this search system is referred to as a “first mode”).
[0014]
According to the present invention, by displaying a reduced simplified image of a page including an object that matches the search key, the position of the object on the page is known, so that it is easy to determine whether the document is more useful.
[0015]
Further, the search system of the present invention includes a search key specifying means having a function of specifying a search key for narrowing down, and a character, a character string or an object for narrowing down as an image which matches the search key has already been extracted. An image relating to a page including a narrowing-down search unit that is extracted at least once from a certain page and a narrowing-down object extracted by the narrowing-down search unit, wherein the narrowing-down object portion is distinguished from other portions. A reduced simplified image generating means for generating a reduced simplified image that is capable of being identified as an object part that matches the search key in the search before the refinement, and a reduced size generated by the reduced simplified image generating means. A reduced simplified image display unit having a function of displaying a simplified image (hereinafter, referred to as a simplified simplified image display means). The search system is referred to as a "second aspect").
[0016]
In the refined search, by characterizing an object that matches the refined search key so that it can be distinguished from other parts, the position of the object can be understood and displayed.
[0017]
In the first aspect and the second aspect, it is possible to provide a layout analysis unit capable of detecting a position of the object on the page, and the reduced simplified image generation unit is configured to perform a process based on the position data of the object detected by the layout analysis unit. The reduced simplified image can be generated.
[0018]
In the first mode and the second mode, the key designating means or the key designating means for narrowing down may have a function of designating a plurality of key elements for AND search, OR search or AND / OR combined search. Then, the reduced simplified image generating means can be characterized so that the respective object portions corresponding to the respective key elements can be distinguished from each other.
[0019]
In the first mode and the second mode, it is possible to further include a page / document display unit for displaying a page related to the reduced simplified display image specified by the predetermined instruction unit in a normal size.
[0020]
In the first mode and the second mode, when there are a plurality of pages extracted by the search section, the reduced simplified image display section can display all or a part of the extracted pages side by side.
[0021]
In the first mode and the second mode, when there are a plurality of pages extracted by the search means, the reduced simplified image display means displays the pages related to the same document by a page jump method, a page turning method, or a page scroll method. Can be displayed. Here, the page turning method is a display method in which the extracted documents are displayed in the page order including the page not including the object, and the page jump method is a display method in which only the page including the object is displayed. The scroll method is a method of displaying a portion not displayed on the display unit by scrolling.
[0022]
The search method of the present invention includes: a search key obtaining step of receiving a search key; a search target extraction step of extracting a page including a character, a character string, or an object as an image matching the search key from the search target; A reduced simplified image generating step of generating a reduced simplified image, which is an image relating to the page extracted in the search target extracting step, wherein the object part is characterized so as to be distinguishable from other parts; And a reduced image display step of displaying (hereinafter, this search method is referred to as a “third mode”).
[0023]
Further, the search method of the present invention includes a search key specifying step for narrowing down having a function of specifying a search key for narrowing down, and a search object that is a character, a character string, or an image matching the search key is already set. A narrowing search step of extracting at least once from the extracted page; and an image of a page including the narrowing object extracted in the narrowing search step, wherein the narrowing object portion is another image. A reduced simplified image generating step of generating a reduced simplified image characterized in that it can be identified as a part and can be identified as an object part that matches the search key in the search before the narrowing-down search. A reduced simplified image display step with a function to display the generated reduced simplified image Characterized by comprising a preparative (hereinafter, this search method is referred to as "fourth aspect").
[0024]
In the reduced simplified image generation step in the third mode and the fourth mode, a layout analysis process capable of detecting the position of the object on the page extracted by the search means is executed, and the position data of the object detected by the layout analysis process is executed. , The reduced simplified image can be generated.
[0025]
The third and fourth aspects may further include a page / document display step of displaying a page relating to the reduced simplified display image specified by the predetermined instruction means in a normal size.
[0026]
In the third mode and the fourth mode, in the reduced image display step, when there are a plurality of pages extracted by the search means, all or a part of the extracted pages can be displayed side by side.
[0027]
In the third aspect and the fourth aspect, in the reduced image display step, when there are a plurality of pages extracted by the search means, pages related to the same document are displayed by a page jump method, a page turning method, or a page scroll method. can do.
[0028]
The search program of the present invention can be configured to include the steps in the third and fourth aspects.
[0029]
BEST MODE FOR CARRYING OUT THE INVENTION
1 to 8 are explanatory diagrams showing a first embodiment of the present invention.
1, the search system 1 includes a computer main body 11, an input device (keyboard) 12, a display 13, a database 14, and a CD-ROM drive 15.
[0030]
In the computer main body 11 of FIG. 1, only a CPU 1101 and a memory (ROM or RAM) 1102 in which a search program and the like are stored are shown for convenience of explanation. In the present embodiment, various programs used for search (hereinafter, collectively referred to as “search programs”) may be stored in the ROM or may be read in the RAM. Documents to be searched are stored in the database 14, and each document is managed by a unique ID.
[0031]
FIG. 2 is a functional block diagram showing the search system 1 of FIG. In FIG. 2, the computer main body 11 includes a search key designation unit 111, a search unit 112, a reduced simplified image generation unit 113, a reduced simplified image display unit 114, a layout analysis unit 115, a page / document display unit 116, And a search key specifying means 117 for narrowing down and a search means 118 for narrowing down.
[0032]
The search key specification unit 111 has a function of specifying a search key (character, character string, or image). Here, a character is a character or a symbol, and a character string is a group of characters. The search key designating means 111 is a program for displaying, for example, a dialog box or an input window on the display 13 shown in FIG. 1 and acquiring a search key from the operator via the input device 12.
[0033]
As shown in FIG. 3A, the search key can be designated by a character such as a character or a symbol or a character string. Further, the search key can be designated by an image as shown in FIG. In FIG. 3A, the search key may be specified by “AND” (logical product) or “OR” (logical sum). Further, in FIG. 3A, an image search may be performed using a word meaning a figure such as “crescent” or “turtle shell”.
[0034]
The search unit 112 searches a document in the database 14 and searches for a page containing a character, a character string, or an object as an image (hereinafter, “matching object”) matching the search key, and searching for a document group. Extract from Information on the extracted page (document ID, information on the number of pages in the document, etc.) is temporarily stored in the memory 1102 (RAM).
[0035]
The reduced simplified image generation unit 113 generates an image of the page extracted by the search unit 112. When generating the reduced simplified image, characters on the page can be represented by a common figure (dot or the like) or a character string can be represented by a line. In this case, the reduced simplified image may be generated as a bitmap image, or may be generated as a vector image (an image displayed by a script or a draw-based image).
[0036]
Further, the reduced simplified image generation unit 113 can also represent characters on a page with a small font. The image on the page can be expressed by reducing the image, or the image portion can be expressed by a rectangle or the like. In a document such as an HTML document that does not have a page concept, a simplified reduced image is generated using a predetermined number of lines (one region corresponding to a predetermined print range) as one page.
[0037]
Further, the reduced simplified image generating means 113 generates a reduced simplified image in which the adapted object portion is characterized so as to be distinguishable from other portions. Specifically, for example, when a document is created with black characters on a white background, the object portion can be expressed in red and a thick line.
[0038]
The layout analysis unit 114 detects the position of the object matching the search key on the page including the object when the reduced simplified image generation unit 113 generates the reduced simplified image. This detection is performed, for example, by calculating information such as the number of lines (line spacing) of the page, the character spacing of displayed fonts, and the type of font. When a document contains an image, the image can be represented by a rectangle or the like.
[0039]
The reduced simplified image display means 115 displays the reduced simplified image generated by the reduced simplified image generation means 113 on a predetermined window as illustrated in FIGS. 4 (A), (B), 5 (A), and (B). Can be displayed.
[0040]
The reduced simplified image display means 115 can display the page (normally, a plurality of pages) extracted by the search means 112 by a page jump method as shown in FIG. They can be displayed side by side as shown. In FIG. 4A, a “jump” button and a “return” button are provided so that the next page of the document relating to the reduced simplified image is not displayed, and the display jumps to the page where the object appears next. .
[0041]
Further, the reduced simplified image display means 115 mutually connects the pages extracted by the search means 112 by radio buttons for selecting “per page” and “one document” as shown in FIGS. 5A and 5B. It can be configured to be switchable. FIG. 5A shows a display window similar to that shown in FIG. 4B with radio buttons added. However, in FIG. 5A, instead of the “jump” button and the “return” button, a “previous page” button and a “next page” button for displaying in a page turning mode are provided.
[0042]
In FIG. 5B, a radio button is added to the display window of FIG. 4A, but only each page including an object of one document is displayed. When the search is executed, a screen shown in FIG. 5A is displayed as a search result (in this case, a radio button of "per page" is specified by default). When one of a plurality of documents is selected and the “one document” button is pressed, the display is switched to the display of FIG. 5B, and when the “per page” button is pressed in this state, FIG. The display switches to.
[0043]
In FIG. 5B, when the “next page” button is pressed, a reduced simplified image of the next page is displayed regardless of whether or not there is an object on the next page. As shown.
[0044]
As described above, a page break does not exist in the HTML document, and a portion that is assumed to be separated as one page at the time of printing is treated as a page break.
[0045]
The page / document display means 116 can display the page of the reduced simplified display image specified by the pointing means such as the mouse pointer in a normal size.
[0046]
That is, it is started by a browser capable of reading the format of the document stored in the database 14 or application software (for example, a specific word processor application software or image creation application software). This application may be included in the above-described search program, or may be application software other than the search program. For example, when a page related to the reduced simplified display image is displayed by application software other than the search program, format information (for example, a so-called “extension” added to a file, so-called “extension”) and page information ( Information on the page number of the corresponding document) can be attached, and an application can be linked to the format information.
[0047]
4A, 4B, 5A, and 5B, a "normal display" button and a "refinement button" are provided in addition to the area where the reduced simplified image is displayed. When the "normal display" button is pressed, the HTML sentence corresponding to the displayed thumbnail image is displayed in a normal size, and when the "refinement button" is pressed, a search key for narrowing down as shown in FIG. An input field (here, a dialog box) for designating is displayed on the display 13 shown in FIG.
[0048]
The search key specifying means 117 is a function for the operator to specify a search key (character, character string or image) for the search. Is displayed on the display 13 shown in FIG. 1, and the reduced simplified image generation means 113 acquires a search key for narrowing down from the operator via the input device 12 shown in FIG.
[0049]
The narrowing-down search unit 118 can extract a narrowing-down object as a character, a character string, or an image that matches the narrowing-down search key at least once from the page from which the narrowing-down object has already been extracted. Note that, as described above, the information regarding the page already extracted is temporarily stored in the memory (RAM) 1102. The refinement object retrieved by the refinement retrieval means 118 is also temporarily stored in the memory (RAM) 1102.
[0050]
In the narrowing-down, the reduced simplified image generation unit 113 applies to the page including the narrowing-down object extracted by the narrowing-down search unit, the narrowing-down object part can be identified from other parts, and the search key in the search before the narrowing-down is performed. A reduced simplified image that is characterized so that it can be identified as an object part conforming to. FIG. 6A is a display example of a search result when the search key is “natural language”, and FIG. 6B is a display example of a narrowed search result when the search key for narrowing is “syntax analysis”. . Object parts that match the search key for parsing “syntax analysis” are represented in blue so that they can be identified as other parts and also object parts that match the search key “natural language” (for example, displayed in red). It is characterized by:
[0051]
The flow of the entire search process will be described with reference to the flowchart of FIG.
When receiving the search key from the search key designating unit 111 (S101), the search unit 112 extracts a page including an object matching the search key from the database 400 (S102). If there is no page containing an object that matches the search key, the process ends. If there is, after the extraction or in parallel with the extraction process, the reduced simplified image generation unit 113 extracts one from the extracted document. (S103, S104). The layout analysis unit 114 detects a character string equivalent part and an image part (S105), and the reduced simplified image generation unit 113 generates a reduced simplified image in which the character string part is represented by a straight line and the image part is represented by a rectangular figure. (S106). This reduced simplified image generation process is performed for all the extracted documents (S107). At this time, the object portion that matches the search key is characterized by a color or the like so that it can be easily distinguished from other portions. The reduced simplified image display means 115 displays the reduced simplified image on a predetermined window (S108).
[0052]
The flow of the entire narrowing-down process will be described with reference to the flowchart of FIG.
Upon receiving the narrowing search key from the narrowing search key specifying unit 117 (S201), the narrowing search unit 117 extracts a page including an object matching the narrowing search key from the document group that has already been extracted. (S202). If there is no page containing an object that matches the search key, the process ends. If there is, after the extraction or in parallel with the extraction process, the reduced simplified image generation unit 113 extracts one from the extracted document. (S203, S204). The layout analysis unit 114 detects a character string equivalent part and an image part (S205), and the reduced simplified image generation unit 113 generates a reduced simplified image in which the character string part is represented by a straight line and the image part is represented by a rectangular figure. (S206). This reduced simplified image generation processing is performed for all newly extracted documents (S207). At this time, the object portion that matches the search key for narrowing down is characterized by a color or the like so that it can be easily distinguished from other portions (so that it can be distinguished from the object portion already characterized and expressed by the search). .
[0053]
The reduced simplified image display means 115 displays the reduced simplified image on a predetermined window, and performs normal display of the document when the operator designates display of a normal image.
[0054]
9 to 12 are explanatory diagrams showing a second embodiment of the present invention.
9, the search system 2 includes a computer main body 31, a terminal device 3 including an input device (keyboard) 32, a display 33, and a search server 4 including a database 400. The server 4 is connected via the Internet 200.
[0055]
The computer main body 31 includes a CPU 3101 and a memory (ROM or RAM) 3102 in which a search key designation program and the like are stored. The search key designation program and the like may be stored in the ROM or may be read in the RAM.
[0056]
The search server 4 includes a CPU 4101 and a memory (ROM or RAM) 4102 in which a search program and the like are stored. The search program may be stored in the ROM or may be read in the RAM. In the present embodiment, the document stored in the database 400 includes a sentence (character string) such as HTML and an image image such as JPEG. When the browser of the terminal device 3 supports the display of a vector image, the browser can also display the vector image as in the first embodiment. It should be noted that a document created in a specific format such as PDF (Portable Document Format) can be used as a search target document.
[0057]
FIG. 10 is a functional block diagram showing the search system 3 of FIG. In FIG. 10, the terminal device 3 includes a search key specifying unit 311, a reduced simplified image display unit 312, a page / document display unit 313, a narrowing-down search key specifying unit 314, and a communication unit 315. Reference numeral 4 includes a search unit 411, a reduced simplified image generation unit 412, a layout analysis unit 413, a search unit for narrowing down 414, and a communication unit 415. In the present embodiment, the search key designation unit 311, the reduced simplified image display unit 312, the page / document display unit 313, and the search key designation unit for narrowing down 314 of the terminal device 3 are included in the functions of the installed browser. ing. As described above, in the HTML document, a simplified reduced image is generated using a predetermined number of lines (one unit corresponding to a predetermined print range) as one page.
[0058]
The search key designating means 311 has a function of designating a search key (character or character string). Here, the character is a character or a symbol as described in the first embodiment, and the character string is a group of characters. The search key designating means 311 is a program for displaying a dialog box or an input window on the display 33 and acquiring a search key from the operator via the input device 32, for example. In the second embodiment, as in the first embodiment, the search key can be specified by a character such as a character or a symbol or a character string (see FIG. 3A). It may also be possible to specify with "AND" (logical product) or "OR" (logical sum). Also, in the second embodiment, similar to the first embodiment, in the case of image retrieval, image retrieval may be performed using words that are meant by figures such as “crescent moon” and “turtle shell”. It is also possible to support image search (see FIG. 3B).
[0059]
The search key specified by the search key specification unit 311 is passed to the search unit 411 of the search server 4 via the communication unit 315, the Internet 200, and the communication unit 415. The search unit 411 searches a document in the database 400 and extracts a page including a character, a character string, or an object as an image that matches the search key from the search target. Information on the extracted document (document ID, information on the line in the document, etc.) is temporarily stored in a memory (RAM) 4102.
[0060]
The reduced simplified image generator 412 generates a reduced simplified image in the same manner as when the reduced simplified image generator 113 of the first embodiment generates a reduced simplified image. That is, the layout analysis unit 413 detects the position of the object in the document, and the reduced simplified image generation unit 412 generates a reduced simplified image based on the detected information. Display ranks can be assigned to the generated simplified reduced images. When a reduced simplified image is displayed in document units (see FIG. 11 (A)), the display order is assigned in the document unit, and when a reduced simplified image is displayed for each page (see FIG. 11 (B)), the display is performed. The ranking is given on a per page basis. The display order can be determined by the number of objects matching the search key appearing in one document or one page. When the number of extracted documents or pages is large, the number of displayed documents or pages can be limited. Also in this case, for example, it is possible to determine whether to extract a document including the object based on the number of objects that match the search key and appear in one document or one page.
[0061]
For example, the reduced simplified image generation unit 412 obtains a document text and an image specified by the document ID from the database 400, creates an image of the document while reproducing the layout information by the layout analysis unit 413, and further generates, for example, a reduced simplified image ( For example, a thumbnail image of 48 × 64 pixels) is created. The layout analysis unit 413 analyzes the HTML tag to determine, for example, what line and character in the text portion the object appears in, and what the font size of the character constituting the line is, when creating the reduced simplified image. By doing so, the position of the object can be detected. The layout analysis unit 413 can convert this to correspond to the reduced simplified image and calculate the appearance position of the object on the reduced simplified image.
[0062]
The reduced simplified image generation unit 412 can also represent characters on a document with a common figure (dot or the like) or a character string with a line. In addition, characters on the document can be displayed in a small font, and the appearance position of the object on the reduced simplified image is drawn in a characteristic figure (for example, a red horizontally long rectangle).
[0063]
In the present embodiment, the image included in the document is an image of JPEG or the like. However, when the browser of the terminal device 3 supports the display of the vector image, the image is included in the vector image as in the first embodiment. You can also. For example, the reduced simplified image generating means 412 extracts a character string of a search key “natural language”, a URL of a document, and a character string of a “TITLE” tag of a searched HTML document, and generates a “BODY” part. Is represented by a horizontal line, and the image is represented by a rectangle. Here, the object (character string “natural language”) is represented by a thick line.
[0064]
The reduced simplified image data is returned to the reduced simplified image generation unit 312 of the terminal device 3 via the communication unit 41, the Internet 200, and the communication unit 317.
[0065]
The reduced simplified image display means 312 displays the returned reduced simplified image on the display 33. As illustrated in FIGS. 11A and 11B, the reduced simplified image display unit 312 can display the reduced simplified image generated by the reduced simplified image generation unit 412 on a predetermined window.
[0066]
In these displays, the document title is described in the reduced simplified image. When there are a plurality of pages extracted by the search unit 411, the reduced simplified image display unit 312 can display the pages in a scrolling manner as shown in FIG. 9A, or as shown in FIG. 9B. Extracted pages can be displayed side by side.
[0067]
FIGS. 11A and 11B show a case where a search is performed using the search key “natural language” by the search unit 411 and a plurality of documents are extracted. FIG. 11A shows a case where the reduced simplified image display unit 312 displays this document as one document, and FIG. 11B shows a case where it is displayed for each page. FIG. 12A is an enlarged view of the second reduced simplified image from the upper left of FIG. 11B, and FIG. 12B shows a corresponding portion of the document related to the reduced simplified image.
[0068]
11A and 11B, similarly to FIGS. 4A, 5B, 5A, and 5B, a “normal display” button is displayed in addition to the area where the reduced simplified image is displayed. , And a “narrowing down button” are provided. When the “normal display” button is pressed, the HTML sentence corresponding to the displayed thumbnail image is displayed in the normal size. That is, the page / document display unit 313 can read out the document related to the reduced simplified display image from the database 400 and display it.
[0069]
When the “refinement button” is pressed, an input field (here, a dialog box) for specifying a search key for refinement as shown in FIG. 3C is displayed on the display 33 of the terminal device 3 shown in FIG. Is done. The narrowing-down search key specified by the narrowing-down search key designating means 316 is a search key related to the search performed before the narrowing-down (if the narrowing-down is a plurality of narrowing-downs, the search key and the search key already performed). The inspection keys for all the narrowed searches are passed to the narrowing search unit 414 of the search server 4 via the communication unit 315, the Internet 200, and the communication unit 415. The narrowing-down search unit 414 performs a search again by using the received search key “AND” and extracts a document. For the extracted document, the reduced simplified image generation unit 412 generates a reduced simplified image. When the reduced simplified image generation unit 412 generates the reduced simplified image, the objects that respectively match the plurality of search keys are displayed by being characterized by different colors or the like so that each object portion can be identified.
[0070]
These reduced simplified images are transferred to the reduced simplified image display means 312 of the terminal device 3 via the communication means 415, the Internet 200, and the communication means 315, and displayed again on the display 33 of the terminal device 3.
[0071]
FIG. 10 shows a case where the reduced simplified image generation means (reference numeral 412 in the figure) and the layout analysis means (reference number 413 in the figure) are provided in the search server 4, but these are provided in the terminal device 3. be able to. In this case, the terminal device 3 receives the document extracted by the search from the search server 4 and generates a reduced simplified image. In this case, the extracted document (or a predetermined number of documents when the number of extracted documents is large) is downloaded to the terminal device 3 to generate a reduced image, and then the document can be discarded. For the remaining documents, the URL can be saved and a reduced simplified image can be created when a request for displaying the reduced simplified image is made.
[0072]
【The invention's effect】
By specifying the position of the object that matches the search key in the document, the appearance frequency of the object can be seen at a glance, and the use of the object in the document can be estimated from the appearance position of the object in the paragraph, Document contents can be determined.
[0073]
Also, by displaying the document layout information, the operator can select a more valuable document from the search results.
[Brief description of the drawings]
FIG. 1 is a system diagram for explaining a first embodiment of the present invention.
FIG. 2 is a functional block diagram of the computer main body shown in FIG.
3A is a diagram illustrating a dialog for specifying a character when a search key is a character, and FIG. 3B is a diagram illustrating a dialog for specifying the character when the search key is an image.
FIG. 4A is an explanatory diagram showing an example in which pages extracted by a search unit are displayed by a page jump method, and FIG. 4B is an explanatory diagram showing a case where pages extracted by a search unit are displayed side by side. It can also be specified by image.
FIG. 5A is an explanatory diagram showing an example in which pages extracted by a search unit are displayed by a page turning method, and FIG. 5B is an explanatory diagram showing a case where the pages extracted by the search unit are displayed side by side; It can also be specified by image.
6A is a diagram illustrating a display example of a search result when the search key is “natural language”, and FIG. 6B is a display example of a narrowed search result when the search key for narrowing is “syntax analysis”; FIG.
FIG. 7 is a flowchart showing the flow of the entire search process.
FIG. 8 is a flowchart illustrating a flow of the entire refined search process.
FIG. 9 is a system diagram for explaining a second embodiment of the present invention.
FIG. 10 is a functional block diagram of the computer main body shown in FIG.
11A is a diagram illustrating a display example when a reduced simplified image is displayed in document units, and FIG. 11B is a diagram illustrating a display example when a reduced simplified image is displayed for each page.
12A is a diagram illustrating an example of a case where a reduced simplified image is enlarged, and FIG. 12B is a diagram illustrating a corresponding portion of a document related to the reduced simplified image.
[Explanation of symbols]
1, 2 search system
3 Terminal device
4 search server
11,31 Computer body
12,32 input device
13,33 Display
14,400 databases
15 CD-ROM drive
111, 311 search key designation means
112,411 Search means
113,412 Reduced simplified image generation means
114,413 Layout analysis means
115, 312 Reduced simplified image display means
116,313 page / document display means
117,314 Search key specifying means for narrowing down
118,414 Search means for narrowing down
315,415 Communication means
200 Internet
1101, 3101, 4101 CPU
1102, 3102, 4102 Memory

Claims (13)

検索キーを指定する機能を備えた検索キー指定手段と、
前記検索キーに適合するキャラクタ、キャラクタ列または画像としてのオブジェクトが含まれたページを検索対象から抽出する検索手段と、
前記検索手段により抽出したページにかかる画像であって、前記オブジェクト部分が他の部分と識別できるように特徴付けられてなる縮小簡易画像を生成する縮小簡易画像生成手段と、
前記縮小簡易画像生成手段により生成した縮小簡易画像を表示する機能を備えた縮小簡易画像表示手段と、
を備えたことを特徴とする検索システム。
A search key specifying means having a function of specifying a search key;
Search means for extracting from the search target a page containing a character, a character string, or an object as an image that matches the search key,
A reduced simplified image generating means for generating a reduced simplified image, which is an image relating to a page extracted by the searching means, wherein the reduced simplified image is characterized so that the object part can be distinguished from other parts;
A reduced simplified image display means having a function of displaying the reduced simplified image generated by the reduced simplified image generation means,
A retrieval system comprising:
絞込み用の検索キーを指定する機能を備えた検索キー指定手段と、
前記検索キーに適合するキャラクタ、キャラクタ列または画像としての絞込み用のオブジェクトを既に抽出してあるページから少なくとも1回抽出する絞込み用の検索手段と、
前記絞込み用の検索手段により抽出した絞込み用のオブジェクトを含むページにかかる画像であって、前記絞込み用のオブジェクト部分が他の部分と識別でき、かつ当該絞込み前の検索における検索キーに適合するオブジェクト部分と識別できるように特徴付けられてなる縮小簡易画像を生成する前記縮小簡易画像生成手段と、
前記縮小簡易画像生成手段により生成した縮小簡易画像を表示する機能を備えた縮小簡易画像表示手段と、
を備えたことを特徴とする検索システム。
A search key specifying means having a function of specifying a search key for narrowing down,
A narrowing-down search means for extracting a narrowing-down object as a character, a character string, or an image matching the search key at least once from a page from which a narrowing-down object has been already extracted;
An image relating to a page including a narrowing object extracted by the narrowing search means, wherein the narrowing object part can be identified from other parts, and matches the search key in the search before the narrowing. Said reduced simplified image generating means for generating a reduced simplified image characterized so that it can be identified as a part,
A reduced simplified image display means having a function of displaying the reduced simplified image generated by the reduced simplified image generation means,
A retrieval system comprising:
前記ページ上の前記オブジェクトの位置を検出できるレイアウト解析手段を備え、前記縮小簡易画像生成手段は、前記レイアウト解析手段により検出したオブジェクトの位置データに基づき前記縮小簡易画像を生成することを特徴とする請求項1または2に記載の検索システム。A layout analysis unit configured to detect a position of the object on the page, wherein the reduced simplified image generation unit generates the reduced simplified image based on the position data of the object detected by the layout analysis unit. The search system according to claim 1. さらに、所定の指示手段により特定された前記縮小簡易表示画像にかかるページを通常の大きさで表示するページ・文書表示手段を備えたことを特徴とする請求項1から3の何れかに記載の検索システム。4. The apparatus according to claim 1, further comprising a page / document display unit that displays a page of the reduced simplified display image specified by the predetermined instruction unit in a normal size. Search system. 前記縮小簡易画像表示手段は、前記検索手段により抽出したページが複数ある場合には、抽出ページの全部または一部を並べて表示することを特徴とする請求項1から4の何れかに記載の検索システム。The search according to any one of claims 1 to 4, wherein, when there are a plurality of pages extracted by the search means, the reduced simplified image display means displays all or a part of the extracted pages side by side. system. 前記縮小簡易画像表示手段は、前記検索手段により抽出したページが複数ある場合には、同一文書にかかるページを、ページジャンプ方式、ページめくり方式またはページスクロール方式で表示することを特徴とする請求項1から4の何れかに記載の検索システム。The method according to claim 1, wherein the reduced simplified image display means displays a page related to the same document by a page jump method, a page turning method, or a page scroll method when there are a plurality of pages extracted by the search means. The search system according to any one of 1 to 4. 検索キーを受け取る検索キー取得ステップと、
前記検索キーに適合するキャラクタ、キャラクタ列または画像としてのオブジェクトが含まれたページを検索対象から抽出する検索対象抽出ステップと、
前記検索対象抽出ステップにおいて抽出したページにかかる画像であって、前記オブジェクト部分が他の部分と識別できるように特徴付けられてなる縮小簡易画像を生成する縮小簡易画像生成ステップと、
前記縮小簡易画像を表示する縮小画像表示ステップと、
を備えたことを特徴とする検索方法。
A search key acquisition step for receiving a search key;
A search target extraction step of extracting a page including a character, a character string, or an object as an image matching the search key from search targets
A reduced simplified image generating step of generating a reduced simplified image which is an image of the page extracted in the search target extracting step, wherein the reduced reduced image is characterized so that the object portion can be distinguished from other portions;
A reduced image display step of displaying the reduced simplified image;
A search method comprising:
絞込み用の検索キーを指定する機能を備えた絞込み用の検索キー指定ステップと、
前記検索キーに適合するキャラクタ、キャラクタ列または画像としての絞込み用のオブジェクトを既に抽出してあるページから少なくとも1回抽出する絞込み用の検索ステップと、
前記絞込み用の検索ステップにおいて抽出した絞込み用のオブジェクトを含むページにかかる画像であって、前記絞込み用のオブジェクト部分が他の部分と識別でき、かつ当該絞込み前の検索における検索キーに適合するオブジェクト部分と識別できるように特徴付けられてなる縮小簡易画像を生成する前記縮小簡易画像生成ステップと、
前記縮小簡易画像生成ステップにおいて生成した縮小簡易画像を表示する機能を備えた縮小簡易画像表示ステップと、
を備えたことを特徴とする検索方法。
A search key specifying step for narrowing down having a function of specifying a search key for narrowing down;
A narrowing-down search step of extracting a narrowing-down object as a character, a character string, or an image matching the search key at least once from the page from which the narrowing-down object has already been extracted;
An image corresponding to a page including the narrowing-down object extracted in the narrowing-down search step, wherein the narrowing-down object portion can be distinguished from other portions, and matches the search key in the search before the narrowing-down search The reduced simplified image generating step of generating a reduced simplified image characterized so that it can be identified as a part;
A reduced simplified image display step having a function of displaying the reduced simplified image generated in the reduced simplified image generation step;
A search method comprising:
縮小簡易画像生成ステップでは、前記検索手段により抽出したページにおける当該オブジェクトの位置を検出できるレイアウト解析処理を実行し、当該レイアウト解析処理により検出した前記オブジェクトの位置データに基づき前記縮小簡易画像を生成することを特徴とする請求項7または8に記載の検索方法。In the reduced simplified image generation step, a layout analysis process capable of detecting the position of the object on the page extracted by the search unit is executed, and the reduced simplified image is generated based on the position data of the object detected by the layout analysis process. 9. The retrieval method according to claim 7, wherein さらに、所定の指示手段により特定された前記縮小簡易表示画像にかかるページを通常の大きさで表示するページ・文書表示ステップを有するたことを特徴とする請求項7から9の何れかに記載の検索方法。10. The page / document display step of displaying a page relating to the reduced simplified display image specified by a predetermined instruction means in a normal size, further comprising: retrieval method. 前記縮小画像表示ステップでは、前記検索手段により抽出したページが複数ある場合には、抽出ページの全部または一部を並べて表示しまたはページめくり方式またはページジャンプ方式で表示することを特徴とする請求項7から10の何れかに記載の検索システム。In the reduced image display step, when there are a plurality of pages extracted by the search unit, all or a part of the extracted pages are displayed side by side, or displayed by a page turning method or a page jump method. The search system according to any one of 7 to 10. 前記縮小画像表示ステップでは、前記検索手段により抽出したページが複数ある場合には、同一文書にかかるページをページジャンプ方式またはページめくり方式で表示することを特徴とする請求項7から11の何れかに記載の検索システム。12. The method according to claim 7, wherein in the reduced image display step, when there are a plurality of pages extracted by the search unit, pages related to the same document are displayed by a page jump method or a page turning method. Search system. 請求項7から12の何れかに記載の方法における各ステップを実行することを特徴とする検索プログラム。A search program for performing each step of the method according to claim 7.
JP2002321383A 2002-11-05 2002-11-05 Retrieval system, retrieval method and retrieval program Pending JP2004157668A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002321383A JP2004157668A (en) 2002-11-05 2002-11-05 Retrieval system, retrieval method and retrieval program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002321383A JP2004157668A (en) 2002-11-05 2002-11-05 Retrieval system, retrieval method and retrieval program

Publications (1)

Publication Number Publication Date
JP2004157668A true JP2004157668A (en) 2004-06-03

Family

ID=32801954

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002321383A Pending JP2004157668A (en) 2002-11-05 2002-11-05 Retrieval system, retrieval method and retrieval program

Country Status (1)

Country Link
JP (1) JP2004157668A (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006179003A (en) * 2004-12-22 2006-07-06 Ricoh Co Ltd Semantic document smart nail
JP2008040753A (en) * 2006-08-04 2008-02-21 Ricoh Co Ltd Image processor and method, program and recording medium
JP2008146602A (en) * 2006-12-13 2008-06-26 Canon Inc Document retrieving apparatus, document retrieving method, program, and storage medium
JP2008146603A (en) * 2006-12-13 2008-06-26 Canon Inc Document retrieving apparatus, document retrieving method, program, and storage medium
JP2009169538A (en) * 2008-01-11 2009-07-30 Ricoh Co Ltd Document retrieval device, document retrieval method, and document retrieval program
JP2010267021A (en) * 2009-05-13 2010-11-25 Canon Inc Information processor and information processing method
US8751519B2 (en) 2007-03-30 2014-06-10 Canon Kabushiki Kaisha Image processing apparatus and method for controlling image processing apparatus
KR20220140321A (en) * 2021-04-09 2022-10-18 주식회사 디지북 Customized document file search and search keyword-centered selection information system and drive method of the Same

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006179003A (en) * 2004-12-22 2006-07-06 Ricoh Co Ltd Semantic document smart nail
JP2008040753A (en) * 2006-08-04 2008-02-21 Ricoh Co Ltd Image processor and method, program and recording medium
JP2008146602A (en) * 2006-12-13 2008-06-26 Canon Inc Document retrieving apparatus, document retrieving method, program, and storage medium
JP2008146603A (en) * 2006-12-13 2008-06-26 Canon Inc Document retrieving apparatus, document retrieving method, program, and storage medium
US8291317B2 (en) 2006-12-13 2012-10-16 Canon Kabushiki Kaisha Document retrieving apparatus, document retrieving method, program, and storage medium
US9619485B2 (en) 2006-12-13 2017-04-11 Canon Kabushiki Kaisha Document retrieving apparatus, document retrieving method, program, and storage medium
US8751519B2 (en) 2007-03-30 2014-06-10 Canon Kabushiki Kaisha Image processing apparatus and method for controlling image processing apparatus
JP2009169538A (en) * 2008-01-11 2009-07-30 Ricoh Co Ltd Document retrieval device, document retrieval method, and document retrieval program
JP2010267021A (en) * 2009-05-13 2010-11-25 Canon Inc Information processor and information processing method
KR20220140321A (en) * 2021-04-09 2022-10-18 주식회사 디지북 Customized document file search and search keyword-centered selection information system and drive method of the Same
KR102546690B1 (en) * 2021-04-09 2023-06-22 주식회사 디지북 Customized document file search and search keyword-centered selection information system and drive method of the Same

Similar Documents

Publication Publication Date Title
US8001466B2 (en) Document processing apparatus and method
US20080235563A1 (en) Document displaying apparatus, document displaying method, and computer program product
JP2007286864A (en) Image processor, image processing method, program, and recording medium
JP2001175386A (en) Display, display method and storage medium
JP2010072842A (en) Image processing apparatus and image processing method
US8429152B2 (en) Terminal device, content displaying method, and content displaying program
US9310971B2 (en) Document viewing device for display document data
US9881001B2 (en) Image processing device, image processing method and non-transitory computer readable recording medium
JP5367833B2 (en) Region of interest extraction apparatus and program
JP2004157668A (en) Retrieval system, retrieval method and retrieval program
JP2008040753A (en) Image processor and method, program and recording medium
JP2005107931A (en) Image search apparatus
JP5895828B2 (en) Information processing apparatus and program
JP2012150638A (en) Content recommendation device, content recommendation method and program
US20120154436A1 (en) Information display apparatus and information display method
JP4952079B2 (en) Image processing apparatus, method, and program
JP4278134B2 (en) Information retrieval apparatus, program, and recording medium
JP2004157965A (en) Search support device and method, program and recording medium
JP5326781B2 (en) Extraction rule creation system, extraction rule creation method, and extraction rule creation program
JP2002312401A (en) Electronic filing device, control method thereof, recording medium and program
JP4501731B2 (en) Image processing device
JP4521218B2 (en) Image forming system, information processing apparatus, image forming apparatus, image forming method, and image forming program
JP2550068B2 (en) How to search and display information
JP2021028770A (en) Information processing device and table recognition method
JP2004151957A (en) Document search support program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050401

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080613

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080708

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081104