JP2002024265A - 情報検索装置およびその方法、並びに該方法に係るプログラムを記憶した記憶媒体 - Google Patents

情報検索装置およびその方法、並びに該方法に係るプログラムを記憶した記憶媒体

Info

Publication number
JP2002024265A
JP2002024265A JP2000200430A JP2000200430A JP2002024265A JP 2002024265 A JP2002024265 A JP 2002024265A JP 2000200430 A JP2000200430 A JP 2000200430A JP 2000200430 A JP2000200430 A JP 2000200430A JP 2002024265 A JP2002024265 A JP 2002024265A
Authority
JP
Japan
Prior art keywords
search
engines
engine
information
retrieval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000200430A
Other languages
English (en)
Other versions
JP2002024265A5 (ja
Inventor
Takahiro Ogawa
孝博 小川
Shigetaka Tabata
成隆 田畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BURITTSUA KK
Original Assignee
BURITTSUA KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BURITTSUA KK filed Critical BURITTSUA KK
Priority to JP2000200430A priority Critical patent/JP2002024265A/ja
Publication of JP2002024265A publication Critical patent/JP2002024265A/ja
Publication of JP2002024265A5 publication Critical patent/JP2002024265A5/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】インターネットなどにおける検索システムにお
いて、複数の検索サイトを利用して、より多彩な検索を
実現することを目的とする。また、検索リクエストに対
して検索結果として所定数のURLを含むページを返
し、さらに次の検索結果のページについてはネクストペ
ージボタンなどの押下により送信するような検索サイト
についても、1回の検索指示ですべての検索結果を得る
ことができるようにすることを目的とする。 【解決手段】インターネット上の複数の検索エンジンに
対して、それらの検索エンジン相互に関する検索条件
を、例えば和集合をとる演算子、共通集合をとる演算
子、または差分をとる演算子を含む演算式で指定する。
各検索エンジンの検索結果に対して、上記演算式の指定
にしたがって、和集合、共通集合、または差分をとり最
終結果を得る。また、各検索エンジンのレスポンスで次
ページがある場合は、次ページの取得リクエストを自動
的に発行して所定数またはすべての検索結果を取得す
る。各検索エンジンでは、近傍検索もできるようにす
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、インターネット上
などに設けられている検索サイトを利用して効率的に各
種の情報を検索する情報検索装置およびその方法、並び
に該方法に係るプログラムを記憶した記憶媒体に関す
る。
【0002】
【従来の技術】従来より、インターネットには各種の情
報を検索するための検索サイト(例えば、YAHOO!
(登録商標)、Goo、excite、Lycosな
ど)がある。検索サイトでユーザがキーワードを検索条
件として入力し検索実行すると、その検索条件に合致し
たホームページのURLを一覧表示してくれる。検索結
果のURLの数が多いときは、複数ページで一覧表示す
る。ユーザは、その一覧表示された中から所望のURL
を指定(クリック)することにより、そのページがブラ
ウザ上に表示される。
【0003】より効率的に検索を行なうため、メタ検索
エンジンを利用したプログラムが考えられている。これ
は、ユーザがキーワードを入力して検索実行すると、複
数の検索エンジン(検索サイト)に対して並行して検索
を実行し、それらの結果を並べて表示するものである。
複数の検索サイトに対する検索が1回の検索指示操作で
実行されるので、操作が簡単になり検索効率が高い。メ
タ検索エンジンでの検索結果の表示方法としては、「ペ
ージごと」または「サイトごと」を指定できるものがあ
る。「サイトごと」は検索結果をホストポート(htt
p://hostport/の部分)でソートして表示
する指定である。「ページごと」はURL全体でソート
し表示する指定である。
【0004】
【発明が解決しようとする課題】上述の従来のメタ検索
エンジンでは、ただ同じキーワードを複数の検索サイト
に送信して検索を行なうだけである。その検索結果はソ
ートされるものの、単に所定順序に並べて表示されるだ
けである。したがって、例えば検索サイトAと検索サイ
トBの両方で検索されるURLのみ知りたい、あるいは
複数の検索サイトで検索されるURLのうち所定の検索
サイトで検索されるURLは除外したい、などといった
多彩な要求には答えることができなかった。
【0005】また、検索結果の表示件数として「20
件」「50件」「すべて」などを選択できるようになっ
ているものもあるが、たとえ「すべて」を選択したとし
ても、各検索サイトでは1回の検索リクエストに対して
検索結果として所定数のURLを含む1ページ分のデー
タが送られてくるだけである(通常はそのページに含ま
れるネクストボタンなどを押下することにより次の検索
結果のページを得る)ので、1度の検索指示で必ずしも
すべての検索結果が得られるとは限らなかった。
【0006】本発明は、インターネットなどにおける検
索システムにおいて、複数の検索サイトを利用して、よ
り多彩な検索を実現することを目的とする。また、本発
明は、検索リクエストに対して検索結果として所定数の
URLを含むページを返し、さらに次の検索結果のペー
ジについてはネクストページボタンなどの押下により送
信するような検索サイトについても、1回の検索指示で
すべての検索結果を得ることができるようにすることを
目的とする。
【0007】
【課題を解決するための手段】上記目的を達成するた
め、請求項1に係る発明は、インターネット、イントラ
ネット、またはエクストラネット上の検索エンジンにア
クセスして検索を行なう情報検索装置であって、検索を
行なう複数の検索エンジンを指定する手段と、指定した
複数の検索エンジン相互に関する検索条件を指定する手
段と、指定した複数の各検索エンジンに渡す検索条件を
入力する手段と、指定した各検索エンジンに対して、そ
れぞれ、前記検索条件での検索の実行を指示するリクエ
ストを生成して送信する手段と、各検索エンジンからの
検索結果であるレスポンスを受信する手段と、各検索エ
ンジンからの検索結果に対し、前記検索エンジン相互に
関する検索条件に応じて検索結果を統合整理する手段
と、統合整理した検索結果を表示する手段とを備えたこ
とを特徴とする。
【0008】請求項2に係る発明は、請求項1に記載の
情報検索装置において、前記複数の各検索エンジンに渡
す検索条件は、それらすべての検索エンジンに共通の検
索条件であることを特徴とする。
【0009】請求項3に係る発明は、請求項1に記載の
情報検索装置において、前記複数の各検索エンジンに渡
す検索条件は、各検索エンジンごとの個別の検索条件で
あることを特徴とする。
【0010】請求項4に係る発明は、請求項1に記載の
情報検索装置において、前記複数の検索エンジン相互に
関する検索条件は、前記複数の検索エンジンに関する演
算式で表現されるとともに、該演算式は、和集合をとる
演算子、共通集合をとる演算子、または差分をとる演算
子を含み、前記検索結果を統合整理する手段は、指定さ
れた演算式にしたがって、各検索エンジンの検索結果の
和集合、共通集合、または差分をとるものであることを
特徴とする。
【0011】請求項5に係る発明は、請求項1に記載の
情報検索装置において、前記レスポンスを受信する手段
は、受信したレスポンス中から次ページの有無を検出
し、次ページがある場合は、該次ページの取得リクエス
トを送信して該ページデータを取得し、これを繰り返す
ことにより、所定数またはすべての検索結果を取得する
ものであることを特徴とする。
【0012】請求項6に係る発明は、請求項1に記載の
情報検索装置において、前記各検索エンジンに対する検
索は、指定した複数のキーワードが指定した近傍関係に
あるか否かに基づく近傍検索を行うものであることを特
徴とする。
【0013】請求項7に係る発明は、インターネット、
イントラネット、またはエクストラネット上の検索エン
ジンにアクセスして検索を行なう情報検索方法であっ
て、検索を行なう複数の検索エンジンを指定するステッ
プと、指定した複数の検索エンジン相互に関する検索条
件を指定するステップと、指定した複数の各検索エンジ
ンに渡す検索条件を入力するステップと、指定した各検
索エンジンに対して、それぞれ、前記検索条件での検索
の実行を指示するリクエストを生成して送信するステッ
プと、各検索エンジンからの検索結果であるレスポンス
を受信するステップと、各検索エンジンからの検索結果
に対し、前記検索エンジン相互に関する検索条件に応じ
て検索結果を統合整理するステップと、を備えたことを
特徴とする。
【0014】請求項8に係る発明は、請求項7に記載の
情報検索方法において、前記複数の各検索エンジンに渡
す検索条件は、それらすべての検索エンジンに共通の検
索条件であることを特徴とする。
【0015】請求項9に係る発明は、請求項7に記載の
情報検索方法において、前記複数の各検索エンジンに渡
す検索条件は、各検索エンジンごとの個別の検索条件で
あることを特徴とする。
【0016】請求項10に係る発明は、請求項7に記載
の情報検索方法において、前記複数の検索エンジン相互
に関する検索条件は、前記複数の検索エンジンに関する
演算式で表現されるとともに、該演算式は、和集合をと
る演算子、共通集合をとる演算子、または差分をとる演
算子を含み、前記検索結果を統合整理するステップは、
指定された演算式にしたがって、各検索エンジンの検索
結果の和集合、共通集合、または差分をとるものである
ことを特徴とする。
【0017】請求項11に係る発明は、請求項7に記載
の情報検索方法において、前記レスポンスを受信するス
テップは、受信したレスポンス中から次ページの有無を
検出し、次ページがある場合は、該次ページの取得リク
エストを送信して該ページデータを取得し、これを繰り
返すことにより、所定数またはすべての検索結果を取得
するものであることを特徴とする。
【0018】請求項12に係る発明は、請求項7に記載
の情報検索方法において、前記各検索エンジンに対する
検索は、指定した複数のキーワードが指定した近傍関係
にあるか否かに基づく近傍検索を行うものであることを
特徴とする。
【0019】請求項13に係る発明は、請求項7から1
2の何れか1つに記載の情報検索方法に係るプログラム
を記憶したことを特徴とする記憶媒体である。
【0020】
【発明の実施の形態】以下、図面を用いて本発明の実施
の形態を説明する。
【0021】図1は、本発明の情報検索装置および方法
を適用した検索システムの全体図を示す。インターネッ
ト100に、クライアント101,102、および検索
エンジン(検索サイト)であるサーバ103,104,
105が接続されている。クライアント101,102
からブラウザ(本発明に係るプログラムが実装されてい
る)を用いてサーバ103、104,105に接続し検
索を行なう。ここではインターネットを例として説明す
るが、その代わりに、ある企業や建家などの内で利用さ
れるイントラネットや、特定の複数の企業や建家などの
間で利用されるエクストラネットに本発明を適用するこ
ともできる。
【0022】図2は、クライアントにおける検索画面の
例である。検索画面200は、クライアント101や1
02で本発明に係るプログラムを起動したとき表示され
る。検索画面200は、大きくは検索エンジン指定領域
201とエンジン相互間の検索条件指定領域203とか
らなる。
【0023】検索エンジン指定領域201は、利用する
複数の検索エンジンを指定する領域である。検索エンジ
ン指定領域201には、検索エンジンを指定するエンジ
ン選択フォームが複数個(210−1から210−3)
並べて表示されている。エンジン選択フォーム210−
1は、エンジン番号211、エンジン選択リストボック
ス212、検索条件入力領域213、および打ち切り件
数選択領域214を備える。エンジン番号211は、当
該エンジン選択フォーム210−1で指定した検索エン
ジンを示す番号(記号)である。エンジン選択リストボ
ックス212は、右側の下向き三角印をマウスでクリッ
クすることによりあらかじめ登録されている検索エンジ
ンの一覧をリスト表示し、その中からユーザが1つを選
択するための領域である。検索条件入力領域213は、
エンジン選択リストボックス212で選択された検索エ
ンジンに対する検索条件(キーワード)を入力する領域
である。打ち切り件数214は、当該検索エンジンにお
ける検索結果の打ち切り件数(検索結果として得られた
URLの個数の打ち切り件数)を選択するための領域で
ある。打ち切り件数214は、リストボックスにより
「10」「20」「50」「100」または「すべて」
の中から選択できる。なお、検索条件入力領域213で
は、複数のキーワードを空白で区切って入力できる。入
力したキーワードは、そのまま、対応する検索エンジン
に送られる。検索エンジンによっては、空白で区切った
複数のキーワードに関し、「すべてのキーワードを含
む」あるいは「何れかのキーワードを含む」などを指定
できるものがあるので、そのような指定を行う領域を備
えるようにしてもよい。
【0024】エンジン選択フォーム210−2,210
−3も同様の構成である。エンジンの追加ボタン221
を押下することにより、検索エンジン指定領域201の
一番下(図2ではエンジン選択領域210−3の下)に
新たなエンジン選択フォームを追加することができる。
また、エンジンの削除ボタン222を押下することによ
り、検索エンジン指定領域201の一番下のエンジン選
択フォームを削除することができる。なお、あらかじめ
複数個のエンジン選択フォームを表示しておいても良
い。
【0025】エンジン相互間の検索条件指定領域203
は、上記検索エンジン指定領域201で選択した複数の
検索エンジン相互に関する検索条件を入力する領域であ
る。エンジン相互間の検索条件指定領域203は、エン
ジン相互の条件入力領域231、検索結果のグルーピン
グ指定領域232、検索実行ボタン233、およびキャ
ンセルボタン234を備える。
【0026】エンジン相互の条件入力領域231は、上
述の検索エンジン指定領域201で選択した複数の検索
エンジン相互に関する検索条件を入力する領域である。
検索エンジンを特定するためにエンジン番号211を用
いて、例えば(A+C)×Bのように論理演算式で記載
する。+はOR(加算あるいは和集合)の意味、×はA
ND(積あるいは共通集合)の意味を示す。例えば、A
+Cは、エンジン番号211がAである検索サイトの検
索結果とエンジン番号211がCである検索サイトの検
索結果の和集合を示す。同じURLは1つに整理するも
のとする。(A+C)×Bは、(A+C)とエンジン番
号211がBである検索サイトの検索結果との共通集合
を示す。したがって、(A+C)×Bは、検索サイトA
または検索サイトCで検索されたURLと検索サイトB
で検索されたURLとの共通部分を最終的な検索結果と
して出力するということを指定するものである。また、
+と×のほか、−を使用することもできる。−は差分を
取ることを示し、例えばA−Bは、エンジン番号211
がAである検索サイトの検索結果からエンジン番号21
1がBである検索サイトの検索結果を除外することを示
す。
【0027】なお、本実施の形態では、+,×,−を用
いて表記する例で説明するが、他の表記方法を用いても
よい。例えば、ANDやORなどを使用した表記でもよ
い。
【0028】検索結果のグルーピング指定領域232
は、検索結果のURL一覧を表示する方法を指定する領
域である。リストボックスとなっており、無し、タ
イトル、ホストポート、ホストポート+パスセグメ
ントレベル1、ホストポート+パスセグメントレベル
2、日付、ホストポートと日付、などを指定するこ
とができる。無しは、検索結果をソートすることなし
にそのまま出力することを指定するものである。タイ
トルは、検索結果をタイトルでソートして表示すること
を指定するものである。ホストポートは、検索結果を
ホストポートでソートして表示することを指定するもの
である。ホストポート+パスセグメントレベル1は、
検索結果をホストポートとパスセグメントのレベル1の
レベル(http://hostport/level
1/の部分)まで利用してソートし表示することを指定
するものである。ホストポート+パスセグメントレベ
ル2は、検索結果をホストポートとパスセグメントのレ
ベル2(http://hostport/level
1/level2/の部分)まで利用してソートし表示
することを指定するものである。日付は、検索結果を
日付でソートして表示することを指定するものである。
ホストポートと日付は、検索結果をホストポートでソ
ートし、さらに同じホストポート内では日付でソートし
て表示することを指定するものである。
【0029】なお、ホストポートおよびパスセグメント
については、RFC1738のhostportおよびpathに説明があ
る。日付は、RFC1945のLast-modified date and timeに
説明がある。
【0030】以上のように図2の検索画面で複数の検索
エンジンを選択し、エンジン相互の条件を入力し、表示
方法を指定した後、検索実行ボタン233を押下するこ
とにより検索が実行される。キャンセルボタン234は
検索のキャンセルを指定するものである。
【0031】図3は、図2の画面で検索実行ボタン23
3が押下されたとき実行される検索処理ルーチンのフロ
ーチャートを示す。ステップ301で、1つのエンジン
選択フォーム210での指定に応じて、検索条件入力領
域213で指定された検索条件から、エンジン選択リス
トボックス212で選択された検索エンジン用のリクエ
ストを生成する。ステップ302では、指定された検索
エンジンに、生成したリクエストを送信し検索結果(レ
スポンス)を得る。次にステップ303で、その検索結
果(レスポンス)から1レコード(すなわち、1つのU
RL)を取り出し、ファイル(後述するテーブルやリス
トなどの形式)に格納する。ステップ304では、ステ
ップ303でファイルに格納した検索結果のURLの数
が、打ち切り件数選択領域214で指定された打ち切り
件数になったか否かを判別する。打ち切り件数になった
ときは、ステップ306に進む。打ち切り件数になって
いないときは、ステップ305で、検索結果がまだある
か否かを判定し、まだあるときはステップ303に戻っ
て検索結果のファイルへの格納処理を続ける。
【0032】なお、通常の検索エンジンでは、検索結果
として所定数(上限がある)のURLを含むページを返
し、そのページ内のネキストボタンを押下することによ
り次の所定数のURLを含むページを送る構成になって
いる。したがって、ステップ302のリクエストの送信
に対して得られる検索結果は1ページ分の所定数のUR
Lだけである。そこで、ステップ305の検索結果がま
だあるか否かの判定では、現在得られている検索結果の
ページ内にネキストボタンがあるか否かを判定し、ある
ときはネキストボタンを押下したときに発行されるのと
同じ次ページの取得リクエストを自動的に生成して発行
し、検索結果のURL一覧を取得して、ステップ305
の判定を行うようにしている。これにより、1回に所定
数のURLのみ含むページを返すように構成されている
検索サイトであっても、自動的にそれ以上の検索結果を
得ることができ、操作性が向上する。なお、次ページが
あるか否かの判別は、検索結果のページを解析して判別
するのであれば、どのような方式を採ってもよい。例え
ば次ページ表示を指定する「Next」などの特定の文字や
ボタンを検索することにより検出することができる。ま
たページによっては検索結果が全部で100件あるうち
の始めの20件を示すページであることを「1−20
of 100」というような記載で表すものもあり、そ
のようなページではこの記載をチェックすることで次ペ
ージがあることを判別することができる。ステップ30
5で検索結果がなくなったときは、ステップ306に進
む。
【0033】以上のステップ301〜305は、図2の
1つの検索エンジン選択フォーム(例えば210−1)
で選択された1つの検索エンジンでの検索についての処
理を説明したものであり、これと同じ処理が、選択され
た他の検索エンジンについても並列に実行される。ステ
ップ306に進む時点では、選択された複数の検索エン
ジンごとに検索結果がファイルに格納済みになってい
る。
【0034】図4に、各検索エンジンの検索結果のファ
イルへの格納例を示す。図4(a)は、検索エンジンS
iteAの検索結果を格納したテーブル例を示す。エン
ジン識別子の欄に検索エンジンを特定する「Site
A」が格納され、URLの欄に検索結果であるURLが
格納され、タイトルに当該URLのページのタイトルが
格納され、コンテンツや日付などの欄にそれらのデータ
が格納されている。同様に、図4(b)は検索エンジン
SiteBの検索結果格納例であり、図4(c)は検索
エンジンSiteCの検索結果例を示す。
【0035】なお、検索結果中の「コンテンツ」とは、
そのURLのページデータの先頭から所定文字数のデー
タであり、検索エンジンによっては「コンテンツの内
容」と呼んでいるデータである。「日付」はそのURL
のコンテンツに付されている日付データであるが、検索
エンジンによっては検索結果中に日付データを含まない
ものがある。そのような検索エンジンについては、図4
のテーブルに格納するときに、そのURLのページを参
照するためのリクエストを作成して発信し、そのレスポ
ンス中から日付データを読み取って使用する。あるい
は、検索結果のURLをすべて図4のようにテーブルに
格納した後、日付データのないURLについて、そのU
RLのページを参照するためのリクエストを作成して発
信し、そのレスポンス中から日付データを読み取って使
用する。
【0036】図3に戻って、ステップ306では、各検
索エンジンで得られた図4に示したような検索結果のテ
ーブルをホストポートおよびパスセグメントでグルーピ
ングしソートしておく。次にステップ307で、図2の
エンジン相互の条件231で指定された条件で論理演算
をこれらのURLに対して実施し、ステップ308で、
その結果を表示する。
【0037】ステップ307におけるエンジン相互の条
件を用いた検索結果に関する論理演算の詳細について説
明する。図5(a)は、エンジン番号がAの検索エンジ
ンの検索結果とエンジン番号がCの検索エンジンの検索
結果とを加算したA+Cの結果例である。図4(a)に
示した検索エンジンSiteAの検索結果と図4(c)
に示した検索エンジンSiteCの検索結果とを加算す
る(すなわちOR演算)ことにより、図5(a)のテー
ブルが得られる。エンジン識別子の欄は、検索エンジン
SiteAでのみ検索されたURLについては「Sit
eA」と、検索エンジンSiteCのみで検索されたU
RLについては「SiteC」と、両方の検索エンジン
で検索されたURLについては「SiteA+Site
C」と、それぞれ格納される。実際には、エンジン識別
子の欄は、図5(c)に示すように各検索エンジンの欄
を設けて当該URLが検索された検索エンジンについて
フラグを立てる(図では丸印を付している)ようにする
とよい。
【0038】図5(b)は、(A+C)×Bの結果を示
す。図5(a)に示す(A+C)の結果と図4(b)の
検索エンジンSiteBの検索結果との両方に存在する
URLのみ(すなわちAND演算)が、図5(b)のテ
ーブルに格納されている。
【0039】図6は、エンジン相互の条件231で差分
を取る演算子である−が使用されたときの差分の処理例
を示す。具体的には、図6のテーブルは、図4(c)の
検索エンジンSiteCの検索結果から図4(b)の検
索エンジンSiteBの検索結果を除外する指定、すな
わちC−Bの結果である。図4(c)のテーブルから図
4(b)のテーブルに存在するURL−H,URL−Z
が除外され、残りのURL−J,URL−Lが残ってい
る。
【0040】図7は、検索画面の別の例を示す。図2の
検索画面200では各検索エンジンごとに独立に検索条
件213を入力できるように構成していたが、図7の検
索画面700では検索エンジン指定領域701で複数の
検索エンジンの設定のみを行い、各検索エンジンに渡す
検索条件は検索条件指定領域702で入力された検索条
件を共通に用いるものとする。その他の構成は、図2と
同様である。図7の検索画面を使用した場合、図3の検
索処理ルーチンのステップ301で各検索エンジンに対
する検索条件は検索条件指定領域702に入力された検
索条件を使用すればよい。なお、ユーザは、図2の検索
画面と図7の検索画面のどちらを使用するかを任意に指
定できる。
【0041】次に、図3のステップ308における結果
表示の例について詳細に説明する。
【0042】図8は、検索結果のグルーピング指定領域
232で「無し」が指定されたときの検索結果表示例を
示す。特にソートされることなく、検索結果が表示され
ている。1つのURLの表示は、タイトルと内容とUR
L表記と日付とからなる。検索結果のグルーピング指定
領域232で「タイトル」が指定されたときは、図8の
検索結果がタイトルでソートされて表示される。
【0043】図9は、検索結果のグルーピング指定領域
232で「ホストポート」が指定されたときの検索結果
表示例を示す。検索されたURLが、ホストポートの部
分でソートされて表示されている。同じホストポートの
URLについては、それが分かるように階層的な表示を
行う。例えば図9の一番上のhttp://hostp
ort1/は、このホストポートに含まれる検索結果の
すべてが、タイトル1−1、タイトル1−3、およびタ
イトル1−4のように、少し字下げされて並べられてい
る。さらに、タイトル1−3については、さらに下層の
検索結果が字下げして表示されている。なお、階層的な
表示のためには、階層構造の上下関係が分かるように木
構造を表す線分を表示してもよい。
【0044】図10は、タイトルが同じでURLなど他
の項目が異なる検索結果がある場合の表示例である。こ
の場合、タイトルでグルーピングし表示する。例えば同
じタイトルで定期的に複数のレポートを出しているよう
なページがあるが、図10のようなまとめ方で表示する
ことにより同じタイトルの別の号がまとめて一覧表示さ
れ見やすい表示が実現できる。このような表示を行うこ
との指定は、ユーザが任意に行うことができる。
【0045】図11は、検索結果をテーブル形式で表示
する例を示す。タイトル、URL、内容、および日付の
ほか、検索された検索エンジンを示す欄が設けられてい
る。テーブル形式で表示する場合、「タイトル」「UR
L」「内容」「日付」の部分をマウスでクリックするこ
とにより、その項目について昇順または降順にソートし
て表示することができる。また、検索エンジンを示す部
分、例えば「SiteA」の部分をクリックすることに
より、検索エンジンSiteAに○がついているURL
(すなわち、SiteAで検索されたURL)をテーブ
ルの上方に集めるようにソートして表示することができ
る。
【0046】図12は、検索結果をサムネイル表示する
例を示す。表示画面の左側領域にページ(コンテンツ)
の縮小表示を行い、該縮小表示部分をクリックすると右
側領域に当該ページが表示されるようにする。なおこの
ような表示を行うためには、検索結果に対し少なくとも
縮小表示するだけのデータをダウンロードしておく必要
があるが、表示する際に必要になったときにダウンロー
ドしてもよいし、あらかじめ適当なタイミングでダウン
ロードしておいてもよい。
【0047】図13は、検索結果をマトリックス表示す
る例を示す。これは図12のサムネイル形式の表示の変
形例であり、マトリックス形式で、縮小表示されたペー
ジを表示するものである。各縮小表示のページをクリッ
クすることにより、画面が切り替わり、または別画面
(新しいウインドウ)に、当該ページが表示される。
【0048】図14は、検索結果を目次形式で表示する
例を示す。左側領域に検索されたURLのコンテンツの
タイトル一覧が表示され、その中からタイトルをクリッ
クすると右側領域にそのページのコンテンツが表示され
る。
【0049】なお、図8から図14で説明した各種の表
示方法は、ユーザが任意に指定できるものとする。ま
た、これらの表示方法において、各検索エンジンで検索
されたURLに対応する表示部分は、検索エンジンごと
に色を変えて表示するようにしてもよい。その場合、複
数の検索エンジンで検索されたものについては、対応す
る色を混合した色で表示するようにすればよい。
【0050】図15は、いわゆる近傍検索の指定例を示
す。近傍検索を行う場合は、図2で説明した1つの検索
エンジンの検索エンジン選択フォーム210を、図15
のものに入れ替える。図15の検索エンジン選択フォー
ムは、ほぼ図2で説明したものと同じであるが、検索方
式選択領域1501および距離指定領域1502を備え
ている点が異なる。検索方式選択領域1501で選択可
能な検索方式としては、OR条件、AND条件、近傍外
(順)、近傍外(不)、近傍内(順)、近傍内(不)、
近傍等(順)、および近傍等(不)がある。このうち、
OR条件およびAND条件は、キーワードに一致する通
常のORおよびANDを指定するものである。
【0051】近傍検索を行う場合、検索条件入力領域に
複数のキーワードを空白で区切って入力し、検索方式選
択領域1501で、近傍外(順)、近傍外(不)、近傍
内(順)、近傍内(不)、近傍等(順)、および近傍等
(不)のうちから1つを選択する。近傍外(順)は、入
力したキーワードがその順に出現するページであって、
かつそれらのキーワードが距離指定領域1502で指定
した距離(文字数)より離れているようなページを検索
する近傍検索の指定である。近傍外(不)は、入力した
キーワードの順は無視し、それらのキーワードが距離指
定領域1502で指定した距離(文字数)より離れてい
るようなページを検索する近傍検索の指定である。近傍
内(順)は、入力したキーワードがその順に出現するペ
ージであって、かつそれらのキーワードが距離指定領域
1502で指定した距離(文字数)以内にあるようなペ
ージを検索する近傍検索の指定である。近傍内(不)
は、入力したキーワードの順は無視し、それらのキーワ
ードが距離指定領域1502で指定した距離(文字数)
以内にあるようなページを検索する近傍検索の指定であ
る。近傍等(順)は、入力したキーワードがその順に出
現するページであって、かつそれらのキーワードが距離
指定領域1502で指定した距離(文字数)に等しい距
離にあるようなページを検索する近傍検索の指定であ
る。近傍等(不)は、入力したキーワードの順は無視
し、それらのキーワードが距離指定領域1502で指定
した距離(文字数)に等しい距離にあるようなページを
検索する近傍検索の指定である。
【0052】図16は、近傍検索の手順を示すフローチ
ャートである。図16の処理は、図3で各検索エンジン
での検索を実行するときに行われるものであるが、図1
6の処理を分割して図3の処理の適当な位置で実行する
ことも可能である。
【0053】ステップ1601で、検索条件入力領域に
入力された検索文字1を取得する。ステップ1602
で、検索条件入力領域に入力された検索文字2を取得す
る。ステップ1603で、検索に使用する検索エンジン
を特定する。ステップ1604で、検索文字1かつ検索
文字2で(すなわちAND条件)で当該検索エンジンに
対する検索を実行する。ステップ1605で結果リスト
を取得する。次にステップ1606で、結果リストから
検索結果であるURLを1つ読み込む。読み込むURL
がないときは処理を終了する。読み込んだURLがあっ
たときは、ステップ1607で、読み込んだURLのコ
ンテンツを取得する。ステップ1608で、指定された
近傍条件が成立するか否かを判定する。成立するとき
は、ステップ1609で、近傍条件に合うURLとして
登録し、ステップ1606に戻る。ステップ1608で
指定された近傍条件が成立しないときは、そのURLは
捨てて、ステップ1606に戻る。
【0054】以上により、各検索エンジンに対して近傍
検索を実現できる。
【0055】
【発明の効果】以上説明したように、本発明によれば、
インターネットなどにおける検索システムにおいて、複
数の検索サイトを利用して、より多彩な検索を実現する
ことができる。また、検索リクエストに対して検索結果
として所定数のURLを含むページを返し、さらに次の
検索結果のページについてはネクストページボタンなど
の押下により送信するような検索サイトについても、1
回の検索指示ですべての検索結果を得ることができる。
【図面の簡単な説明】
【図1】本発明の情報検索装置および方法を適用した検
索システムの全体図
【図2】クライアントにおける検索画面の例を示す図
【図3】検索処理ルーチンのフローチャート図
【図4】各検索エンジンの検索結果のファイルへの格納
例を示す図
【図5】エンジン相互の条件を用いた検索結果に関する
論理演算の結果を示す図
【図6】エンジン相互の条件で差分を取る演算子である
−が使用されたときの差分の処理例を示す図
【図7】検索画面の別の例を示す図
【図8】検索結果表示例1を示す図
【図9】検索結果表示例2を示す図
【図10】検索結果表示例3を示す図
【図11】検索結果表示例4を示す図
【図12】検索結果表示例5を示す図
【図13】検索結果表示例6を示す図
【図14】検索結果表示例7を示す図
【図15】近傍検索の指定例を示す図
【図16】近傍検索の手順を示すフローチャート図
【符号の説明】
100…インターネット、101,102…クライアン
ト、103,104,105…検索エンジンであるサー
バ。

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】インターネット、イントラネット、または
    エクストラネット上の検索エンジンにアクセスして検索
    を行なう情報検索装置であって、 検索を行なう複数の検索エンジンを指定する手段と、 指定した複数の検索エンジン相互に関する検索条件を指
    定する手段と、 指定した複数の各検索エンジンに渡す検索条件を入力す
    る手段と、 指定した各検索エンジンに対して、それぞれ、前記検索
    条件での検索の実行を指示するリクエストを生成して送
    信する手段と、 各検索エンジンからの検索結果であるレスポンスを受信
    する手段と、 各検索エンジンからの検索結果に対し、前記検索エンジ
    ン相互に関する検索条件に応じて検索結果を統合整理す
    る手段と、 統合整理した検索結果を表示する手段とを備えたことを
    特徴とする情報検索装置。
  2. 【請求項2】請求項1に記載の情報検索装置において、 前記複数の各検索エンジンに渡す検索条件は、それらす
    べての検索エンジンに共通の検索条件であることを特徴
    とする情報検索装置。
  3. 【請求項3】請求項1に記載の情報検索装置において、 前記複数の各検索エンジンに渡す検索条件は、各検索エ
    ンジンごとの個別の検索条件であることを特徴とする情
    報検索装置。
  4. 【請求項4】請求項1に記載の情報検索装置において、 前記複数の検索エンジン相互に関する検索条件は、前記
    複数の検索エンジンに関する演算式で表現されるととも
    に、該演算式は、和集合をとる演算子、共通集合をとる
    演算子、または差分をとる演算子を含み、 前記検索結果を統合整理する手段は、指定された演算式
    にしたがって、各検索エンジンの検索結果の和集合、共
    通集合、または差分をとるものであることを特徴とする
    情報検索装置。
  5. 【請求項5】請求項1に記載の情報検索装置において、 前記レスポンスを受信する手段は、受信したレスポンス
    中から次ページの有無を検出し、次ページがある場合
    は、該次ページの取得リクエストを送信して該ページデ
    ータを取得し、これを繰り返すことにより、所定数また
    はすべての検索結果を取得するものであることを特徴と
    する情報検索装置。
  6. 【請求項6】請求項1に記載の情報検索装置において、 前記各検索エンジンに対する検索は、指定した複数のキ
    ーワードが指定した近傍関係にあるか否かに基づく近傍
    検索を行うものであることを特徴とする情報検索装置。
  7. 【請求項7】インターネット、イントラネット、または
    エクストラネット上の検索エンジンにアクセスして検索
    を行なう情報検索方法であって、 検索を行なう複数の検索エンジンを指定するステップ
    と、 指定した複数の検索エンジン相互に関する検索条件を指
    定するステップと、 指定した複数の各検索エンジンに渡す検索条件を入力す
    るステップと、 指定した各検索エンジンに対して、それぞれ、前記検索
    条件での検索の実行を指示するリクエストを生成して送
    信するステップと、 各検索エンジンからの検索結果であるレスポンスを受信
    するステップと、 各検索エンジンからの検索結果に対し、前記検索エンジ
    ン相互に関する検索条件に応じて検索結果を統合整理す
    るステップと、 を備えたことを特徴とする情報検索方法。
  8. 【請求項8】請求項7に記載の情報検索方法において、 前記複数の各検索エンジンに渡す検索条件は、それらす
    べての検索エンジンに共通の検索条件であることを特徴
    とする情報検索方法。
  9. 【請求項9】請求項7に記載の情報検索方法において、 前記複数の各検索エンジンに渡す検索条件は、各検索エ
    ンジンごとの個別の検索条件であることを特徴とする情
    報検索方法。
  10. 【請求項10】請求項7に記載の情報検索方法におい
    て、 前記複数の検索エンジン相互に関する検索条件は、前記
    複数の検索エンジンに関する演算式で表現されるととも
    に、該演算式は、和集合をとる演算子、共通集合をとる
    演算子、または差分をとる演算子を含み、 前記検索結果を統合整理するステップは、指定された演
    算式にしたがって、各検索エンジンの検索結果の和集
    合、共通集合、または差分をとるものであることを特徴
    とする情報検索方法。
  11. 【請求項11】請求項7に記載の情報検索方法におい
    て、 前記レスポンスを受信するステップは、受信したレスポ
    ンス中から次ページの有無を検出し、次ページがある場
    合は、該次ページの取得リクエストを送信して該ページ
    データを取得し、これを繰り返すことにより、所定数ま
    たはすべての検索結果を取得するものであることを特徴
    とする情報検索方法。
  12. 【請求項12】請求項7に記載の情報検索方法におい
    て、 前記各検索エンジンに対する検索は、指定した複数のキ
    ーワードが指定した近傍関係にあるか否かに基づく近傍
    検索を行うものであることを特徴とする情報検索方法。
  13. 【請求項13】請求項7から12の何れか1つに記載の
    情報検索方法に係るプログラムを記憶したことを特徴と
    する記憶媒体。
JP2000200430A 2000-07-03 2000-07-03 情報検索装置およびその方法、並びに該方法に係るプログラムを記憶した記憶媒体 Withdrawn JP2002024265A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000200430A JP2002024265A (ja) 2000-07-03 2000-07-03 情報検索装置およびその方法、並びに該方法に係るプログラムを記憶した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000200430A JP2002024265A (ja) 2000-07-03 2000-07-03 情報検索装置およびその方法、並びに該方法に係るプログラムを記憶した記憶媒体

Publications (2)

Publication Number Publication Date
JP2002024265A true JP2002024265A (ja) 2002-01-25
JP2002024265A5 JP2002024265A5 (ja) 2007-08-09

Family

ID=18698308

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000200430A Withdrawn JP2002024265A (ja) 2000-07-03 2000-07-03 情報検索装置およびその方法、並びに該方法に係るプログラムを記憶した記憶媒体

Country Status (1)

Country Link
JP (1) JP2002024265A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006163826A (ja) * 2004-12-07 2006-06-22 Ns Solutions Corp 情報処理装置、情報検索方法及びプログラム
JP2008021031A (ja) * 2006-07-11 2008-01-31 Canon Inc 検索サーバ装置及びその制御方法、情報処理装置及びその制御方法、情報処理システム、情報検索装置及びその制御方法、プログラム、記憶媒体
JP2009539171A (ja) * 2006-05-29 2009-11-12 チョンヌン インコーポレイテッド 質疑に対応するタブを使用して追加的な情報を提供する方法及びその装置
US9189499B2 (en) 2009-10-06 2015-11-17 Canon Kabushiki Kaisha Information processing apparatus and information processing method

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006163826A (ja) * 2004-12-07 2006-06-22 Ns Solutions Corp 情報処理装置、情報検索方法及びプログラム
JP4731896B2 (ja) * 2004-12-07 2011-07-27 新日鉄ソリューションズ株式会社 情報処理装置、情報検索方法及びプログラム
JP2009539171A (ja) * 2006-05-29 2009-11-12 チョンヌン インコーポレイテッド 質疑に対応するタブを使用して追加的な情報を提供する方法及びその装置
KR101350525B1 (ko) * 2006-05-29 2014-01-14 서치솔루션 주식회사 질의에 대응하는 탭을 사용하여 추가적인 정보를 제공하는방법 및 그 장치
JP2008021031A (ja) * 2006-07-11 2008-01-31 Canon Inc 検索サーバ装置及びその制御方法、情報処理装置及びその制御方法、情報処理システム、情報検索装置及びその制御方法、プログラム、記憶媒体
US9189499B2 (en) 2009-10-06 2015-11-17 Canon Kabushiki Kaisha Information processing apparatus and information processing method

Similar Documents

Publication Publication Date Title
US5913215A (en) Browse by prompted keyword phrases with an improved method for obtaining an initial document set
US7925682B2 (en) System and method utilizing virtual folders
US6271840B1 (en) Graphical search engine visual index
CA2468462C (en) System and method for filtering and organizing items based on common elements
US7428705B2 (en) Web map tool
US7099861B2 (en) System and method for facilitating internet search by providing web document layout image
US20090234834A1 (en) System, method, and/or apparatus for reordering search results
US20020055919A1 (en) Method and system for gathering, organizing, and displaying information from data searches
JP2005535039A (ja) 地理的なテキスト検索システムを備えたデスクトップクライアントとの対話
JP2004510257A (ja) 使用者の検索を容易にするインターネット検索システム及びその方法
EP1518196A4 (en) FILE SYSTEM FOR DISPLAYING ARTICLES OF DIFFERENT TYPES FROM VARIOUS MATERIAL LOCATIONS
JP2003157283A (ja) 情報検索プログラム
WO2008141673A1 (en) Semantic navigation through web content and collections of documents
US20040015485A1 (en) Method and apparatus for improved internet searching
JP4075094B2 (ja) 情報分類装置
JP3049113B2 (ja) 企業内特許抄録作成システム
EP1290578B1 (fr) Procede de recherche de donnees automatise et securise au moyen d'un reseau de transmission de donnees
JP2000082074A (ja) 氏名又は名称、又は電話番号、又は住所によるurl検索システムを持つインターネットのwwwサイト
JP2003345829A (ja) 情報の検索方法およびその装置および情報検索のためのコンピュータプログラム
Mukherjea Organizing topic-specific web information
JP2004302981A (ja) 電子データ管理システム
JP2002024265A (ja) 情報検索装置およびその方法、並びに該方法に係るプログラムを記憶した記憶媒体
JP2000231570A (ja) インターネット情報処理装置、インターネット情報処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000231569A (ja) インターネット情報検索装置、インターネット情報検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002189713A (ja) 文書作成支援方法およびシステム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070622

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070622

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20080218

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080307