JPH11265393A - 情報検索装置 - Google Patents

情報検索装置

Info

Publication number
JPH11265393A
JPH11265393A JP10066585A JP6658598A JPH11265393A JP H11265393 A JPH11265393 A JP H11265393A JP 10066585 A JP10066585 A JP 10066585A JP 6658598 A JP6658598 A JP 6658598A JP H11265393 A JPH11265393 A JP H11265393A
Authority
JP
Japan
Prior art keywords
search
unit
search engine
bibliographic
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10066585A
Other languages
English (en)
Other versions
JP3564999B2 (ja
Inventor
Masao Ito
正雄 伊藤
Takamasa Koyama
隆正 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP06658598A priority Critical patent/JP3564999B2/ja
Priority to CN 99104149 priority patent/CN1114880C/zh
Publication of JPH11265393A publication Critical patent/JPH11265393A/ja
Priority to HK00101297A priority patent/HK1022538A1/xx
Application granted granted Critical
Publication of JP3564999B2 publication Critical patent/JP3564999B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 複数の検索エンジンによる文書検索に関する
もので、順序付けされた書誌一覧を高速に取得すること
を目的としている。 【解決手段】 複数のクライアント部11−1、11−
2、・・・・、11−nからの要求を受け付ける通信部12
と、要求された検索条件で検索処理を行ない、検索結果
を順位付けする複数の検索エンジン部13−1、13−
2、・・・・、13−nと、全ての検索エンジン部の検索結
果を規則に従って順位付けする全体ソート部14を設け
る。以上の構成により、全体ソート部では各検索エンジ
ン部の検索結果を全て取得することなく、部分的な検索
結果を取得するだけで、目的の書誌一覧を作成すること
ができ、高速な複数検索エンジン対応を行なうことが可
能な文書検索装置が得られる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は電子化された文書デ
ータから情報検索を行なう場合において、複数の検索エ
ンジンで構成された場合でも、高速に書誌一覧の取得が
可能な情報検索装置に関するものである。
【0002】
【従来の技術】近年、ワープロやパソコンの普及によ
り、大量の文書情報が蓄積され、必要に応じて文書情報
を検索する文書データベースに対する関心が高まってき
ている。また、文書情報に対して、キーワードを付けず
に文書の内容から検索する全文検索方式が注目され、イ
ンターネットのホームページ検索等で利用されている。
この全文検索方式を用いた検索システムは、サーバー・
クライアント、またはWWWサーバと接続した形態でユ
ーザが使用できる。このような検索システでは、1つの
ユーザに検索システムを専有させるのではなく、検索結
果の一覧を表示する場合には数十件単位で表示すること
で、ユーザ要求を同時に処理する方法が取られている。
更に、検索結果一覧は単に登録順に出力するのではな
く、文書と検索条件の間にある基準を設けて数値化(ス
コア)し、得られたスコアに従って書誌一覧を順位付け
している。このようにすることで、ユーザの要望に近い
検索結果を出力することができる。ここで、「数値化」
とは、一律に数値化しているだけでなく、検索対象とな
る文章(例えば短い文章は長い文章よりも重みづける
等)、単語によって重みづけをつけて数値化することも
含む意味である。また、「書誌一覧」とは、文書番号だ
けではユーザにわかりにくいので、例えばホームページ
のタイトルやURL(Universal Resou
rce Locator)などを意味する。
【0003】以下、従来の情報検索装置について説明す
る。図8は従来の情報検索装置の構成を示すものであ
る。図8において、81−1,81−2、・・・・、81−
nはクライアント部で、82は通信部で、83は検索エ
ンジン部で、84は索引格納部で、85は書誌格納部で
ある。
【0004】以上のように構成された情報検索装置につ
いて、以下その動作について説明する。まず、各クライ
アント部81−1,81−2、・・・・、81−nでユーザ
からの検索要求を通信部82に送る。通信部82は複数
のクライアント部からの検索要求を内部に格納し、検索
エンジン部83に送る。検索エンジン部83は索引格納
部84から索引情報を読み出して高速に検索を行ない通
信部82に返す。通信部82では検索結果件数をクライ
アント部81−1,81−2、・・・・、81−nに返す。
またクライアント部81−1,81−2、・・・・、81−
nから検索にヒットした書誌一覧の要求を通信部82に
送る。通信部82は書誌一覧要求を検索エンジン部83
に送る。検索エンジン部83は、書誌格納部85から書
誌一覧を読み出して書誌一覧の作成を行ない、通信部8
2に返す。通信部82では書誌一覧をクライアント部8
1−1,81−2、・・・・、81−nに返す。
【0005】
【発明が解決しようとする課題】しかしながら上記の従
来の構成では、格納する文書件数が数千万件を増えるよ
うな場合には、1つの計算機では検索性能の低下や、ハ
ードディスクやメモリなどの物理的な計算機資源の制約
によって限界があり、複数の計算機で対応する必要があ
った。しかしながら、複数の計算機で対応するには複数
の検索エンジン部で対応することになり、順序付けされ
た書誌一覧を取得する場合において、検索エンジン間の
通信負荷が大きくなるために、全体の性能が低下すると
いう課題を有していた。
【0006】本発明は上記従来技術の課題を解決するも
ので、複数検索エンジンの構成で順序付けされた書誌一
覧を取得する場合でも通信負荷を最小限にすることを目
的とする。
【0007】
【課題を解決するための手段】この目的を達成するため
に本発明における情報検索装置は、第1に、少なくとも
文書データの検索と書誌一覧の作成と検索結果をある基
準値に従って順序付けをそれぞれ独立して行なう複数の
検索エンジン部と、検索を行うための検索情報を格納す
る索引格納部と、書誌一覧を作成するための情報を格納
する書誌格納部と、複数の検索エンジン部の検索結果の
全体を順序付けする全体ソート部とを備え、全体ソート
部で、検索結果の先頭から所定の順序付けられた基準値
までを各検索エンジン部から取得することにより、検索
結果の書誌一覧を取得することを特徴とする。上記構成
によって、書誌一覧を高速に作成することができる。
【0008】第2に、全体ソート部は、検索結果全体の
半分以降に位置づけられた書誌一覧を取得する場合に、
検索エンジン部の検索結果の末尾から順序付けの基準値
を取得することを特徴とする。これにより、複数の検索
エンジン部で書誌一覧を取得する場合に、全体ソート部
において複数の検索エンジン部の検索履歴のスコアを全
て抽出するのではなく、検索結果の先頭または末尾から
の取得番号と取得件数に応じて部分的にスコアを抽出す
ることにより、高速に書誌一覧の作成することができ
る。
【0009】第3に、全体ソート部は、検索結果を順序
付けの基準値でn分割し(n≧2)、各々分割された基
準値の下限値以上の件数を各検索エンジンから最初に取
得して、各範囲内の件数を累計することで、目的の書誌
一覧の位置を割り出すことを可能にした。これにより、
スコアの件数分布を各検索エンジン部から取得して、件
数分布から必要となる検索結果の位置を再度計算してス
コアを部分的に取得することで、高速に書誌一覧の作成
することができる。
【0010】
【発明の実施の形態】(実施の形態1)以下、本発明の
第1の実施例について、図面を参照しながら説明する。
【0011】図1は本発明の一実施例における情報検索
装置の構成図である。図1において、11−1、11−
2、・・・・、11−nはクライアント部、12は通信部、
13−1、13−2、・・・・、13−nは検索エンジン
部、14は全体ソート部、15は高スコア記憶部、16
は索引格納部、17は書誌格納部である。
【0012】以上のように構成された情報検索装置につ
いて、その動作を説明する。まず、各クライアント部1
1−1、11−2、・・・・、11−nでユーザからの検索
要求を通信部12に転送し、通信部12は検索要求がき
た場合には各検索エンジン部13に対して検索件数の要
求を行ない、各検索エンジン部13−1、13−2、・・
・・、13−nは索引格納部16から検索するための索引
情報を読み出して検索し、検索結果件数を通信部12に
渡す。通信部12は各検索エンジン部13−1、13−
2、・・・・、13−nの検索結果件数を合計してクライア
ント部に返す。また通信部12はクライアント部11−
1、11−2、・・・・、11−nから書誌一覧の要求がき
た場合には、全体ソート部14に対して書誌一覧の先頭
からの番号と取得する件数を送る。全体ソート部14は
各検索エンジン部13−1、13−2、・・・・、13−n
に対して検索結果の情報が格納される検索履歴中の検索
要求と文書間である基準で求めた値(スコア)を({取
得開始番号}+{取得件数}−1)件分だけ要求する。
検索エンジン部13−1、13−2、・・・・、13−nは
スコアに従ってソートし、要求された件数分だけスコア
を全体ソート部14に返す。全体ソート部14では得ら
れた各検索エンジン部13−1、13−2、・・・・、13
−nのスコアをスコア順に並べ変え、各検索エンジン部
13−1、13−2、・・・・、13−nの開始番号と取得
件数を求める。全体ソート部14は求めた開始番号と取
得件数を各検索エンジン部13−1、13−2、・・・・、
13−nに送り、各検索エンジン部13−1、13−
2、・・・・、13−nは開始番号から検索履歴の文書番号
を読み出して、文書番号から書誌格納部17から書誌内
容を作成して全体ソート部14に送る。全体ソート部1
4は各検索エンジン部133−1、13−2、・・・・、1
3−nから得られた書誌の内容と、スコア順に並べ変え
た情報から書誌を並べ変えることで書誌一覧を作成し通
信部12に返す。通信部12はクライアント部11−
1、11−2、・・・・、11−nに書誌一覧を転送して処
理が終了する。
【0013】図2は検索エンジン部13−1、13−
2、・・・・、13−nで格納されている検索結果の情報で
ある検索履歴の例を示し、ここでは3台の検索エンジン
の検索履歴を示す。21は第1検索エンジン部の検索履
歴で、22は第2検索エンジン部の検索履歴で、23は
第3検索エンジン部の検索履歴である。それぞれの履歴
は、スコアで降順にソートされている状態を示す。この
検索履歴に対して、取得開始番号が1で取得件数が10
件の書誌一覧を取得する場合には、全体ソート部14
で、{1+10−1=10}件のスコアの取得要求を各
検索エンジン部13に送ることになり、各検索エンジン
部13−1、13−2、・・・・、13−nは上位10件の
スコアを取り出した例が、24、25、26である。2
4は第1検索エンジン部の10件分のスコアを示し、2
5は第2検索エンジン部の10件分のスコアを表し、2
6は第3検索エンジン部の10件分のスコアを表す。以
上の例に示すように、各検索エンジンで上位のスコアを
求めることができる。
【0014】図3は図2のスコアを全体ソート部14で
ソートした例を示す図である。この図では3台の検索エ
ンジンのそれぞれ10件ずつの検索履歴を取得し、全体
で30件の検索履歴をスコア順に並べ変えたものであ
る。この例では取得開始番号が1で取得件数が10件な
ので、1〜10番目の検索履歴がクライアント部11−
1、11−2、・・・・、11−nに返す書誌一覧になる。
この検索履歴から各々の検索エンジン部13−1、13
−2、・・・・、13−nに対する開始番号と取得件数を求
めた図が図3である。この例では第1検索エンジン部に
は開始番号1で取得件数2、第2検索エンジン部には開
始番号1で取得件数4、第3検索エンジン部には開始番
号1で取得件数4になる。以上の例に示すように、全体
ソート部14でスコアをソートして、各検索エンジン部
13−1、13−2、・・・・、13−nに要求するための
開始番号と取得件数を求めることができる。
【0015】図4は図3の各検索エンジン部の開始番号
と取得件数から書誌を取得し、書誌一覧を作成する過程
を示す図である。
【0016】各検索エンジン部13−1、13−2、・・
・・、13−nで検索履歴から文書番号を求めて、書誌格
納部17から文書番号に該当する書誌内容を読み出し、
全体ソート部14に各検索エンジン部13−1、13−
2、・・・・、13−nで得られた書誌を転送する。全体ソ
ート部14では各々の書誌をスコア順に並び替えて書誌
一覧を作成し、通信部12に書誌一覧を返す。
【0017】以上の例に示すように、各検索エンジンの
開始番号と取得件数から書誌内容を作成し、全体ソート
部で再度並べ替えることで、書誌一覧を作成することが
できる。
【0018】以上のように本実施例によれば、複数検索
エンジン部で構成された情報検索装置において、スコア
などで順序付けされた検索結果から目的の書誌一覧を取
得する場合に、全体ソート部と高スコア記憶部を設ける
ことにより、必要な検索履歴を部分的に取得するだけ
で、書誌一覧を高速に作成することができる。
【0019】なお、実施の形態1においてクライアント
部と通信部と検索エンジン部と全体ソート部はつの計算
機で行なってもよいし、全て別々の計算機で行なっても
よい。また部分的に1つの計算機で行なってもよいもの
とする。
【0020】また、実施の形態1において通信部は各検
索エンジン部の検索結果件数を保持して全体ソート部に
渡すことで、全体ソート部が検索結果件数が0件の検索
エンジン部に対しては、書誌の取得要求を行なわないこ
とで、0件の検索エンジン部との通信時間を低減するこ
とができる。
【0021】(実施の形態2)以下、本発明の実施の形
態2について、図面を参照しながら説明する。
【0022】図5は本発明の一実施例における情報検索
装置を示す図である。図5において、51−1、51−
2、・・・・、51−nはクライアント部、52は通信部、
53−1、53−2、・・・・、53−nは検索エンジン
部、56は索引格納部、57は書誌格納部で、以上は図
1の構成と同様なものである。図1の構成と異なるのは
全体ソート部54とスコア記憶部55を、検索履歴から
スコア情報を取得する場合に、スコアの高い順に取得し
て記憶するのではなく、取得開始番号の位置によって、
スコアの高い順に取得するかスコアの低い順に取得する
かを自動的に選択することができるようにした点であ
る。
【0023】例えば、新聞記事が日付順に並んでいない
場合であって、新しい記事を取得したい場合には、先頭
から取得するよりも、末尾から取得した方が効率的に検
索できる場合がある。
【0024】上記のように構成された情報検索装置につ
いて、以下その動作を説明する。まず、クライアント部
51−1、51−2、・・・・、51−nでユーザからの検
索要求を通信部52に転送し、通信部52は検索要求が
きた場合には各検索エンジン部53−1、53−2、・・
・・、53−nに対して検索件数の要求を行ない、各検索
エンジン部53−1、53−2、・・・・、53−nは索引
格納部56から検索するための索引情報を読み出して検
索し、検索結果件数を通信部52に渡す。通信部52は
各検索エンジン部53−1、53−2、・・・・、53−n
の検索結果件数を合計してクライアント部51に返す。
また通信部52は書誌一覧の要求がきた場合には、全体
ソート部54に対して書誌一覧の取得開始番号と取得件
数を送る。全体ソート部54は各検索エンジン部53−
1、53−2、・・・・、53−nに対して、全体の検索結
果件数を2で割った値より取得開始番号が大きい場合に
は、検索履歴の末尾から({全体の検索結果件数}−
{取得開始番号}−{取得件数}+2)番目で({全体
の検索結果件数}−{取得開始番号}+1)件取得する
ことを要求する。検索エンジン部53−1、53−2、
・・・・、53−nはスコアに従ってソートし、ソートした
結果の先頭または末尾から要求された件数分だけ、スコ
アを全体ソート部54に返す。全体ソート部54では得
られた各検索エンジン部53−1、53−2、・・・・、5
3−nのスコアを、先頭から取得した場合は、降順にス
コアに並べ替え、末尾から取得した場合は、昇順にスコ
アを並び替えて、各検索エンジン部53−1、53−
2、・・・・、53−nの開始番号と取得件数を求める。全
体ソート部54は求めた開始番号と取得件数を各検索エ
ンジン部53−1、53−2、・・・・、53−nに送り、
各検索エンジン部53−1、53−2、・・・・、53−n
は開始番号から検索履歴の文書番号を読み出して、文書
番号から書誌格納部57から書誌内容を作成して全体ソ
ート部54に送る。全体ソート部54は各検索エンジン
部533−1、53−2、・・・・、53−nから得られた
書誌の内容と、スコア順に並べ替えた情報から書誌を並
べ変えることで書誌一覧を作成し通信部52に返す。通
信部はクライアント部51−1、51−2、・・・・、51
−nに書誌一覧を転送して処理が終了する。
【0025】以上のように、全体ソート部が書誌一覧の
取得する位置に応じて先頭または末尾から検索履歴のス
コアを取得することで、全体ソート部に転送するスコア
が少なくなり、更に全体ソート部54でソートする件数
も少なくなり、より高速な書誌一覧の取得を行なうこと
ができる。
【0026】なお、実施の形態2において検索履歴の末
尾から取得するとしたが、検索エンジン部でのソートを
降順から昇順にソートすることで、先頭から取得するよ
うにしてもよい。
【0027】(実施の形態3)以下、本発明の実施の形
態3について、図面を参照しながら説明する。
【0028】図6は本発明の一実施例における情報検索
装置を示す図である。図6において、61−1、61−
2、・・・・、61−nはクライアント部、62は通信部、
63−1、63−2、・・・・、63−nは検索エンジン
部、67は索引格納部、67は書誌格納部で、以上は図
1の構成と同様なものである。図1の構成と異なるのは
全体ソート部64とスコア記憶部65とスコア分布記憶
部66であり、書誌一覧を取得する場合に全体ソート部
64でスコアと件数の分布情報を検索エンジン部63−
1、63−2、・・・・、63−nから取得して、各スコア
範囲内で件数を合計(累計)することで、検索エンジン
部63−1、63−2、・・・・、63−nから取得するス
コア件数を減らすことができる。
【0029】上記のように構成された情報検索装置につ
いて、以下その動作を説明する。まず、クライアント部
61−1、61−2、・・・・、61−nでユーザからの検
索要求を通信部62に転送し、通信部62は検索要求が
きた場合には各検索エンジン部63−1、63−2、・・
・・、63−nに対して検索件数の要求を行ない、各検索
エンジン部63−1、63−2、・・・・、63−nは索引
格納部67から検索するための索引情報を読み出して検
索し、検索結果件数を通信部62に渡す。通信部62は
各検索エンジン部63−1、63−2、・・・・、63−n
の検索結果件数を合計してクライアント部61に返す。
【0030】また、通信部62は書誌一覧の要求がきた
場合には、全体ソート部64に対して書誌一覧の先頭か
らの番号と取得する件数を送る。全体ソート部64はス
コアの最大値をmとして0〜mまでのスコアをn分割し
た各スコア範囲内ではスコアの下限値以上の件数を検索
エンジン部63−1、63−2、・・・・、63−nから取
得するように要求する。検索エンジン部63−1、63
−2、・・・・、63−nでは検索履歴のスコアから各スコ
ア範囲内の下限値以上の件数を求め、全体ソート部64
に送る。全体ソート部か各検索エンジンから得られたス
コア分布をスコア分布記憶部66に格納し、全体のスコ
ア分布を作成する。これにより、書誌一覧の取得開始番
号がどのスコア範囲内に位置するかわかるので、再度検
索エンジン部63−1、63−2、・・・・、63−nに対
してスコアがs以下で、かつ({取得開始番号}−{1
つ上のスコア範囲の下限スコア以上の値を持つ件数}+
{取得件数}−1)件のスコアと通し番号を取得して、
全体ソート部64に送る。全体ソート部64では得られ
た各検索エンジン部63−1、63−2、・・・・、63−
nのスコアをスコア順に並べ変え、各検索エンジン部6
3−1、63−2、・・・・、63−nの開始番号と取得件
数を求める。全体ソート部64は求めた開始番号と取得
件数を各検索エンジン部63−1、63−2、・・・・、6
3−nに送り、各検索エンジン部63−1、63−2、
・・・・、63−nは開始番号から検索履歴の文書番号を読
み出して、文書番号から書誌格納部68から書誌内容を
作成して全体ソート部64に送る。全体ソート部64は
各検索エンジン部63−1、63−2、・・・・、63−n
から得られた書誌の内容と、スコア順に並べ変えた情報
から書誌を並べ変えることで書誌一覧を作成し通信部6
2に返す。通信部62はクライアント部61−1、61
−2、・・・・、61−nに書誌一覧を転送して処理が終了
する。
【0031】図7は検索エンジン部でスコア分布を作成
した例を示す図である。3つの検索エンジンが検索履歴
のスコアから各スコア範囲の下限値以上の件数を求めた
ものが71、72、73である。それぞれのスコア分布
は全体ソート部64に送られ、74に示すように各スコ
ア範囲内で3つの検索エンジン部63のスコアが全体ソ
ート部64で合計される。この図の例では、取得開始番
号が501番目で取得件数が20件の場合は、スコアが
800以上が476件であるため、501番目はスコア
が801以下である。このため、全体ソート部64は、
各検索エンジンに対して、スコアが801以下で、46
件(501−476+20+1=46件)のスコアと通
し番号を取得する。更に、全体ソート部64は各検索エ
ンジンから取得したスコアを降順に並び替えて、34件
目(501番目−476件)から20件のエンジン番号
と通し番号と件数を取得することで、目的の書誌一覧を
各検索エンジン部63から取得することができる。
【0032】なお、実施の形態3において全体ソート部
は検索履歴の分割個数をnとしたが、検索結果件数に応
じてnを変動させてもよい。例えば検索結果件数が多い
場合にはnを大きくし、少ない場合にはnを小さくす
る。またスコア範囲内の平均件数を同じにすることで、
分割個数nを変動させてもよい。
【0033】また、実施の形態3において全体ソート部
は検索結果件数と書誌一覧を取得する位置に応じて第1
の実施例と第2の実施例の処理を組み合わせてもよい。
例えば検索結果件数が100件程度の少ない件数であれ
ば、スコア分布を取得しないで、第1の実施例の処理方
法で行なえばよい。また検索結果件数が多い場合でも先
頭からの20件程度であれば、スコア分布を取得しない
で、実施の形態1の処理方法で行なえばよい。
【0034】また、実施の形態3において全体ソート部
でスコアの最大値をmとしたが、Mは検索エンジンから
件数を取得すると同時にスコアの最大値を求め、それを
用いてもよい。
【0035】また、実施の形態1において検索履歴を並
べ変える基準として、検索要求と文書間の関係を数値化
したスコアを用いたが、日付けなどの数値情報を用いて
並べ変えてもよいものとする。この数値情報を用いるこ
とは、第2と第3の実施例でも同じように処理できるこ
とは言うまでもない。
【0036】
【発明の効果】以上のように本発明は、少なくとも文書
データの検索と書誌一覧の作成と検索結果をある基準値
に従って順序付けをそれぞれ独立して行なう複数の検索
エンジン部と、検索を行うための検索情報を格納する索
引格納部と、書誌一覧を作成するための情報を格納する
書誌格納部と、複数の検索エンジン部の検索結果の全体
を順序付けする全体ソート部とを備え、全体ソート部
で、検索結果の先頭から所定の順序付けられた基準値ま
でを各検索エンジン部から取得することにより、書誌一
覧を取得するために全体ソート部と各検索エンジン部の
通信量を減らし、複数検索エンジンの環境でも高速に書
誌一覧を取得することができるという効果を有する。
【0037】また、全体ソート部は、検索結果全体の半
分以降に位置づけられた書誌一覧を取得する場合に、検
索エンジン部の検索結果の末尾から順序付けの基準値を
取得するようにしたので、全体ソート部において複数の
検索エンジン部の検索履歴のスコアを全て抽出するので
はなく、検索結果の先頭または末尾からの取得番号と取
得件数に応じて部分的にスコアを抽出することにより、
高速に書誌一覧の作成することができるという効果を有
する。
【0038】また、検索結果を順序付けの基準値でn分
割し、各々分割された基準値の下限値以上の件数を各検
索エンジンから取得して、これらの件数を累計すること
により、スコアの件数分布を各検索エンジン部から取得
して、件数分布から必要となる検索結果の位置を再度計
算してスコアを部分的に取得することで、高速に書誌一
覧の作成することができるという効果を有する。
【図面の簡単な説明】
【図1】本発明の実施の形態1における情報検索装置の
構成図
【図2】実施の形態1における検索エンジン部の動作例
を示す図
【図3】実施の形態1における全体ソート部の動作例を
示す図
【図4】実施の形態1における書誌一覧作成例を示す図
【図5】本発明の実施の形態2における情報検索装置の
構成図
【図6】本発明の実施の形態3における情報検索装置の
構成図
【図7】実施の形態3における全体ソート部の動作例を
示す図
【図8】従来の情報検索装置の構成図
【符号の説明】
11−1 11−2 11−n クライアント部 12 通信部 13−1 13−2 13−n 検索エンジン部 14 全体ソート部 15 高スコア記憶部 16 索引格納部 17 書誌格納部 51−1 51−2 51−n クライアント部 52 通信部 53−1 53−2 53−n 検索エンジン部 54 全体ソート部 55 スコア記憶部 56 索引格納部 57 書誌格納部 61−1 61−2 61−n クライアント部 62 通信部 63−1 63−2 63−n 検索エンジン部 64 全体ソート部 65 スコア分布記憶部 66 スコア記憶部 67 索引格納部 68 書誌格納部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも文書データの検索と書誌一覧
    の作成と検索結果をある基準値に従って順序付けをそれ
    ぞれ独立して行なう複数の検索エンジン部と、検索を行
    うための検索情報を格納する索引格納部と、書誌一覧を
    作成するための情報を格納する書誌格納部と、前記複数
    の検索エンジン部の検索結果の全体を順序付けする全体
    ソート部とを備え、 前記全体ソート部で、検索結果の先頭から所定の順序付
    けられた基準値までを前記各検索エンジン部から取得す
    ることにより、検索結果の書誌一覧を取得することを特
    徴とする情報検索装置。
  2. 【請求項2】 前記検索要求を処理するクライアント部
    と、このクライアント部からの検索要求を前記検索エン
    ジン部と全体ソート部に転送して検索結果をクライアン
    ト部に返す通信部をさらに備えたことを特徴とする請求
    項1記載の情報検索装置。
  3. 【請求項3】 前記全体ソート部は、検索結果全体の半
    分以降に位置づけられた書誌一覧を取得する場合に、前
    記検索エンジン部の検索結果の末尾から順序付けの基準
    値を取得することを特徴とする請求項1記載の情報検索
    装置。
  4. 【請求項4】 前記全体ソート部は、検索結果を順序付
    けの基準値でn分割し(n≧2)、各々分割された基準
    値の下限値以上の件数を各検索エンジンから取得して、
    これらの件数を累計することにより書誌一覧の位置を割
    り出すことを可能にした請求項1記載の情報検索装置。
JP06658598A 1998-03-17 1998-03-17 情報検索装置 Expired - Fee Related JP3564999B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP06658598A JP3564999B2 (ja) 1998-03-17 1998-03-17 情報検索装置
CN 99104149 CN1114880C (zh) 1998-03-17 1999-03-17 信息检索装置和方法
HK00101297A HK1022538A1 (en) 1998-03-17 2000-03-01 Device and method for information retrieval

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06658598A JP3564999B2 (ja) 1998-03-17 1998-03-17 情報検索装置

Publications (2)

Publication Number Publication Date
JPH11265393A true JPH11265393A (ja) 1999-09-28
JP3564999B2 JP3564999B2 (ja) 2004-09-15

Family

ID=13320180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06658598A Expired - Fee Related JP3564999B2 (ja) 1998-03-17 1998-03-17 情報検索装置

Country Status (3)

Country Link
JP (1) JP3564999B2 (ja)
CN (1) CN1114880C (ja)
HK (1) HK1022538A1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000006664A (ko) * 1999-09-29 2000-02-07 문성일 엔드유저 컴퓨터에 세팅되는 메타검색엔진
KR100382600B1 (ko) * 2000-01-31 2003-05-01 주식회사 제이.이.씨 네트워크 시스템을 이용한 통합웹검색서비스 제공방법 및그 방법을 기록한 컴퓨터로 읽을 수 있는 기록매체
JP2006510962A (ja) * 2002-12-18 2006-03-30 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ クライアント・サーバ・プロトコル
JP2009187211A (ja) * 2008-02-05 2009-08-20 Nec Corp 情報検索システム、情報検索方法およびプログラム
JP2010092401A (ja) * 2008-10-10 2010-04-22 Panasonic Corp ネットワーク機器、機器、その情報検索方法、およびそのプログラム
JP2011039976A (ja) * 2009-08-18 2011-02-24 Nippon Telegr & Teleph Corp <Ntt> 文書格納装置及び文書格納プログラム
JPWO2010058519A1 (ja) * 2008-11-18 2012-04-19 日本電気株式会社 ハイブリッド検索システム、ハイブリッド検索方法およびハイブリッド検索プログラム
JP2014186643A (ja) * 2013-03-25 2014-10-02 Ntt Docomo Inc コンテンツ検索結果提供装置、コンテンツ検索結果提供方法、及びコンテンツ検索結果提供システム

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NO992269D0 (no) * 1999-05-10 1999-05-10 Fast Search & Transfer Asa S°kemotor med todimensjonalt skalerbart, parallell arkitektur
JP3555869B2 (ja) 2000-09-28 2004-08-18 Necソフト株式会社 暗号化ファイル検索方法及びその装置並びにコンピュータ可読記録媒体
AUPR894801A0 (en) * 2001-11-20 2001-12-13 Unisearch Limited A system and method for searching data sources
JP4041080B2 (ja) * 2004-03-23 2008-01-30 東芝ソリューション株式会社 データ検索装置及びデータ検索プログラム
JP2005332476A (ja) * 2004-05-19 2005-12-02 Sony Corp 情報処理装置
CN100401300C (zh) * 2006-04-29 2008-07-09 上海世纪互联信息系统有限公司 具有自动分类功能的搜索引擎
CN100456293C (zh) * 2006-10-19 2009-01-28 腾讯科技(深圳)有限公司 一种信息快捷搜索客户端、系统及方法
WO2010001464A1 (ja) * 2008-07-01 2010-01-07 富士通株式会社 検索装置および検索方法
CN101546342B (zh) * 2009-05-08 2012-07-04 阿里巴巴集团控股有限公司 实现搜索服务的方法与系统
CN116910232B (zh) * 2023-09-13 2024-01-09 之江实验室 天文文献检索方法和天文文献搜索方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05242049A (ja) * 1991-07-10 1993-09-21 Hitachi Ltd 分散データベースのソート方法およびアクセス方法
JPH1021250A (ja) * 1996-06-14 1998-01-23 Infoseek Corp 複数個のデータベースを探索する方法および複数個のデータベース間で文献を探索する方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05242049A (ja) * 1991-07-10 1993-09-21 Hitachi Ltd 分散データベースのソート方法およびアクセス方法
JPH1021250A (ja) * 1996-06-14 1998-01-23 Infoseek Corp 複数個のデータベースを探索する方法および複数個のデータベース間で文献を探索する方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000006664A (ko) * 1999-09-29 2000-02-07 문성일 엔드유저 컴퓨터에 세팅되는 메타검색엔진
KR100382600B1 (ko) * 2000-01-31 2003-05-01 주식회사 제이.이.씨 네트워크 시스템을 이용한 통합웹검색서비스 제공방법 및그 방법을 기록한 컴퓨터로 읽을 수 있는 기록매체
US9805032B2 (en) 2002-06-14 2017-10-31 Koninklijke Philips N.V. Client-server protocol
JP2006510962A (ja) * 2002-12-18 2006-03-30 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ クライアント・サーバ・プロトコル
JP2009187211A (ja) * 2008-02-05 2009-08-20 Nec Corp 情報検索システム、情報検索方法およびプログラム
JP2010092401A (ja) * 2008-10-10 2010-04-22 Panasonic Corp ネットワーク機器、機器、その情報検索方法、およびそのプログラム
JPWO2010058519A1 (ja) * 2008-11-18 2012-04-19 日本電気株式会社 ハイブリッド検索システム、ハイブリッド検索方法およびハイブリッド検索プログラム
JP2011039976A (ja) * 2009-08-18 2011-02-24 Nippon Telegr & Teleph Corp <Ntt> 文書格納装置及び文書格納プログラム
JP2014186643A (ja) * 2013-03-25 2014-10-02 Ntt Docomo Inc コンテンツ検索結果提供装置、コンテンツ検索結果提供方法、及びコンテンツ検索結果提供システム

Also Published As

Publication number Publication date
HK1022538A1 (en) 2000-08-11
JP3564999B2 (ja) 2004-09-15
CN1229218A (zh) 1999-09-22
CN1114880C (zh) 2003-07-16

Similar Documents

Publication Publication Date Title
JP3564999B2 (ja) 情報検索装置
US7966337B2 (en) System and method for prioritizing websites during a webcrawling process
US8516357B1 (en) Link based clustering of hyperlinked documents
Brin et al. Reprint of: The anatomy of a large-scale hypertextual web search engine
US5943670A (en) System and method for categorizing objects in combined categories
US7657515B1 (en) High efficiency document search
US8285724B2 (en) System and program for handling anchor text
US7676117B1 (en) Systems and methods for using image duplicates to assign labels to images
US20090125504A1 (en) Systems and methods for visualizing web page query results
CN103699700B (zh) 一种搜索引导的生成方法、系统及相关服务器
US20110191310A1 (en) Method and system for ranking intellectual property documents using claim analysis
US20080010276A1 (en) Relevance ranked faceted metadata search method
US6622139B1 (en) Information retrieval apparatus and computer-readable recording medium having information retrieval program recorded therein
US7523109B2 (en) Dynamic grouping of content including captive data
JP2004501424A (ja) 中心用語辞典を利用した表題語の中心用語抽出方法及びそれを利用した情報検索システム及びその方法
JP2006048683A (ja) 情報検索システムにおけるフレーズ識別方法
CN101136027B (zh) 用于数据库索引、搜索和数据检索的系统和方法
US7398461B1 (en) Method for ranking web page search results
US20040015485A1 (en) Method and apparatus for improved internet searching
US8661069B1 (en) Predictive-based clustering with representative redirect targets
JP2003271609A (ja) 情報監視装置及び情報監視方法
JP2003150623A (ja) 言語横断型特許文献検索方法
US20030018617A1 (en) Information retrieval using enhanced document vectors
JP2000331020A (ja) 情報参照方法,情報参照装置および情報参照プログラムを格納した記憶媒体
JPH06301732A (ja) 文書検索処理方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20031209

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040224

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040518

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080618

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090618

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100618

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees