JP3521176B2 - 検索方法および検索装置 - Google Patents

検索方法および検索装置

Info

Publication number
JP3521176B2
JP3521176B2 JP26117697A JP26117697A JP3521176B2 JP 3521176 B2 JP3521176 B2 JP 3521176B2 JP 26117697 A JP26117697 A JP 26117697A JP 26117697 A JP26117697 A JP 26117697A JP 3521176 B2 JP3521176 B2 JP 3521176B2
Authority
JP
Japan
Prior art keywords
search
result
request
unit
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP26117697A
Other languages
English (en)
Other versions
JPH11102366A (ja
Inventor
節 鈴岡
信介 澤島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP26117697A priority Critical patent/JP3521176B2/ja
Priority to US09/156,869 priority patent/US6385605B1/en
Publication of JPH11102366A publication Critical patent/JPH11102366A/ja
Application granted granted Critical
Publication of JP3521176B2 publication Critical patent/JP3521176B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、検索方法および検
索装置に係るものであり、特に、インターネットやイン
トラネットにおける検索方法および検索装置に関するも
のである。
【0002】
【従来の技術】近年、World Wide Web(以下、「WW
W」という)が普及し、インターネットやイントラネッ
トにおいて、電子化された情報の流通が非常に活発にな
った。このため、いわゆる情報洪水が生じ、利用者が真
に欲する情報を取り出すことが困難になるという問題が
生じてきた。このような問題を軽減するために、インタ
ーネットやイントラネットにおいて、検索システムが登
場してきた。この検索システムとしては、例えば、DEC
社の「Altavista 」やExcite社の「excite」等が知られ
ている。
【0003】このような検索システムは、利用者によっ
て検索式の形で表現された検索要求が与えられ、その与
えられた検索式に合致するデータ(Web ページ)を利用
者に提示する。ここで、被検索対象であるWeb ページ
は、インデックステーブルの形式に変換され保持されて
おり、高速に検索可能となっている。しかしながら、高
速とは言っても世界中の利用者から膨大な量の検索要求
がくると、それを全て処理するためには、相当の時間を
要することとなる。
【0004】従って、検索要求に対する検索を可能な限
り高速にするため。検索結果のキャッシングという技術
が用いられる場合がある。これは、一度ある検索式によ
って検索し、検索結果が得られたものについては、その
検索結果をストレージデバイス等に記憶しておき、以
降、同一の検索要求が来た場合には、再度検索すること
なく、以前に検索したときの検索結果が記憶されている
ストレージデバイスを参照することによって、高速に検
索結果を返すというものである。これにより、2回目以
降は、実際の検索が行なわれず、キャッシュの内容を参
照するだけであるので、十分に高速なレスポンスを期待
することができるようになる。このような技術は、特開
平4−199468や特開平4−326163等に開示
されている。
【0005】しかしながら、上述のような高速性を追求
した検索システムにおいては、検索結果の質については
何ら考慮されていない。これは、高速性の追求と検索結
果の質の向上とは、相反する関係にあることが原因とし
てあげられるからである。すなわち、検索結果の質を向
上させるために精緻な検索アルゴリズムを用いた場合に
は、検索時間が長くなり、また、利用者ごとのプロファ
イルに基づいた検索を行なった場合には、検索結果のキ
ャッシュが効かなくなり、レスポンス時間が長くなるか
らである。
【0006】
【発明が解決しようとする課題】上述したように、単に
以前の検索結果を返答するだけでは、質の高い検索結果
を提供することは困難であった。そこで、本発明は、短
いレスポンス時間を保ちつつも、検索結果の質を高めた
検索方法および検索装置を提供することを目的とする。
【0007】まず、現状のWWW検索の性質に着目して
みることとする。第1に、検索要求数は非常に多く、そ
の間隔はランダムである。すなわち、非常に膨大な数の
検索要求がネットワークを介して寄せられ、これに対す
るレスポンスを良くする必要がある。利用者は、ネット
ワークに接続された端末におり、個々の検索要求は、全
くランダムに検索システムに到着する。
【0008】第2に、検索式は、同一のものが多い。す
なわち、膨大な数の検索要求は、それぞれが異なってい
るものではなく、その約70%は、以前に与えられた検
索式と同一の検索式によるものである。特に、WWWに
おいては、新しい情報に対する価値が高く、多くの利用
者は新しい情報の検索をする要求が高いが、一般に、新
しい情報の種類は限られているので、検索要求は同じも
のになる傾向がある。
【0009】第3に、精度のよい検索アルゴリズムほ
ど、検索処理に時間を要する。すなわち、利用者が直接
示した検索式による検索は高速であるが、あまり質は高
くない。一方、同類語、同義語展開、表記の揺らぎ処
理、文字ベース検索と単語ベース検索との融合や、利用
者のプロファイルを加味した検索を行う場合には、検索
結果の質の向上は期待できるが、その反面、検索時間が
長くなる。
【0010】以上のように、現状のWWW検索において
は、検索要求数は多く、しかも同一の検索要求が多いの
で、検索結果のキャッシングは非常に有効なものとな
る。また、精度のよい検索アルゴリズムを用いようとす
る場合には、処理時間が問題である。一方、検索要求は
ランダムに到着するので、場合によっては検索エンジン
がアイドル状態である時間もある。そこで、この時間を
有効に活用することによって、検索結果の質を向上を期
待することができる。
【0011】
【課題を解決するための手段】本発明では、検索エンジ
ンの負荷が軽いときに、粗い検索アルゴリズムで検索し
た検索結果を、再び精緻な検索アルゴリズムで検索し直
して、その検索結果をキャッシングしておく。また、本
発明では、再検索を計算機の負荷が軽いときに行うので
はなく、再検索専用の検索エンジンによって行うように
してもよい。これにより、利用者にとって、必要以上に
レスポンス時間が長くならず、再検索しない場合に比べ
て、質のよい検索結果が得られることができるようにな
る。
【0012】より具体的には、請求項1に係る発明によ
れば、被検索対象である Web ページに係るデータベース
に蓄積された情報について、不特定の利用者からネット
ワークに接続された端末を介してサーバに与えられる検
索要求に含まれる検索式に基づいて、前記サーバの第1
の検索部において第1の検索アルゴリズムにて第1の検
索を行うステップと、このステップにより得られる検索
結果前記サーバの検索結果記憶部に記憶されている場
合で、かつ、システムの負荷が所定の閾値よりも小さい
場合に、前記検索式に基づいて、前記サーバの第2の検
索部において前記第1の検索アルゴリズムよりも検索精
度の高い第2の検索アルゴリズムにて第2の検索を行う
ステップとを有することを特徴とする検索方法である。
【0013】請求項2に係る発明によれば、前記第1の
検索又は前記第2の検索を行うことにより得られる検索
結果が前記検索結果記憶部に記憶されている場合に、前
記サーバの検索結果検索部で行なわれた検索の結果につ
いて、前記検索式を前記利用者からの検索要求が含んで
いる場合は、前記サーバの検索結果回答部から前記検索
結果を出力することを特徴とする請求項1記載の検索方
法である。
【0014】請求項3に係る発明によれば、被検索対象
である Web ページに係るデータベースに蓄積された情報
について、不特定の利用者からネットワークに接続され
た端末を介してサーバに与えられるとともに検索要求に
含まれる検索式に基づいて、前記サーバの第1の検索部
において第1の検索アルゴリズムにて第1の検索を行う
ステップと、このステップにより得られる検索結果が、
前記サーバの検索結果記憶部に記憶されている場合、か
つ、システムの負荷が所定の閾値よりも小さい場合に、
前記検索結果が前記第1の検索部において前記第1の検
索を行うことにより得られたものであり、かつ、前記サ
ーバの第2の検索部において第2の検索を行っていない
と前記サーバの検索種別決定部で判断される場合には、
前記検索式に基づき前記第2の検索部において前記第1
の検索アルゴリズムよりも検索精度の高い第2の検索ア
ルゴリズムにて前記第2の検索を行うステップとを有す
ることを特徴とする検索方法である。
【0015】請求項4に係る発明によれば、検索対象と
なる前記 Web ページが増えて前記データベースに蓄積さ
れた情報の更新を行う場合に、この更新される情報に係
る検索式が、既に前記検索結果記憶部に蓄えられている
検索式に合致するならば、その検索結果を棄却するよう
にすることを特徴とする請求項1または3記載の検索方
法である。
【0016】請求項5に係る発明によれば、被検索対象
である Web ページに係るデータベースに蓄積された情報
について、不特定の利用者からネットワークに接続され
た端末を介してサーバに与えられる検索要求を受け付け
る要求受付手段と、前記要求受付手段により検索要求を
受け付けた場合には、前記検索要求に含まれる検索式に
基づいて、第1の検索アルゴリズムにて第1の検索を行
う第1の検索手段と、前記第1の検索手段により得られ
る第1の検索結果を記憶する検索結果記憶手段と、前記
要求受付手段により検索要求を受け付けていない場合、
かつ、システムの負荷が所定の閾値よりも小さい場合に
は、前記検索式に基づいて、前記第1の検索アルゴリズ
ムよりも検索精度の高い第2の検索アルゴリズムにて第
2の検索を行う第2の検索手段とからなることを特徴と
する検索装置である。
【0017】請求項6に係る発明によれば、検索要求に
基づいて検索を行うためのプログラムを記録したコンピ
ュータ読み取り可能な記録媒体であって、不特定の利用
者からの検索要求を受け付けた場合に、この検索要求に
含まれる検索式に基づいて、前記コンピュータの第1の
検索部で、第1の検索アルゴリズムにて第1の検索を行
わせる機能と、この機能により得られる第1の検索結果
を前記コンピュータの検索結果記憶部に記憶させる機能
と、検索要求を受け付けていない場合、かつ、システム
の負荷が所定の閾値よりも小さい場合に、前記検索式に
基づいて、前記コンピュータの第2の検索部で、前記第
1の検索アルゴリズムよりも検索精度の高い第2の検索
アルゴリズムにて第2の検索を行わせる機能とからなる
プログラムを記録したコンピュータ読み取り可能な記録
媒体である。
【0018】
【0019】
【0020】
【0021】
【発明の実施の形態】以下、図面を参照しながら、本発
明の実施の形態について説明をする。 [第1の実施形態]図1は、本発明に係る検索方法が適
用されるシステムの構成の一例を示す図である。すなわ
ち、同図において、利用者は、利用者端末1からネット
ワーク2を介して、本実施形態に係る検索方法および検
索装置を実現するサーバ3に対して、検索要求を与え
る。サーバ3は、データベース4に保持されている膨大
な被検索対象であるデータ(例えば、Webページの一
覧情報等)を参照することにより、該検索要求に合致す
る検索結果を得て、これを利用者端末1に返答する。デ
ータベース4に記憶されているデータは、一般に、We
bページがインデックステーブルの形式に変換されてい
るが、特に、これにこだわるものではなく、要は、被検
索対象たるデータが何らかの形式で保持されていればよ
い。
【0022】図2は、本実施形態に係る検索装置の構成
を示す図である。同図において、検索要求受付部21
は、ネットワーク2から所定の検索式を含む検索要求を
受け取ると、これを検索種別決定部22に送出する。検
索種別決定部22は、検索要求受付部21からの通知が
ない場合は後述する処理を行うが、検索要求受付部21
から検索要求が通知された場合には、該検索要求に含ま
れる検索式を抽出して、この検索式と同一の検索式によ
って過去に検索を行ったか否かについて、検索結果検索
部23に問い合わせる。検索結果検索部23は、検索結
果記憶部24を参照し、抽出された検索式によって検索
された検索結果が記憶されているか否かを検索する。す
なわち、図3は、検索結果記憶部24に記憶されるデー
タの内容の一例を示す図であり、検索結果検索部23
は、検索式フィールドを参照することにより、該抽出さ
れた検索式に合致する検索式がすでに記憶されているか
否かを検索する。
【0023】検索結果検索部23は、検索要求に含まれ
る検索式と同一の検索式を検索結果記憶部24から検索
できた場合には、その検索式に対応する検索結果を検索
結果フィールドから取り出して、検索結果回答部25に
送出する。一方、検索した結果、該検索式が検索されな
かった場合には、その旨検索種別決定部22に返答し、
後述する処理を行う。
【0024】検索結果回答部25は、検索結果検索部2
3等から送出されてきた検索結果を、利用者端末1に返
答するために、ネットワークに送出するためのものであ
る。検索結果検索部23から検索されなかった旨の通知
を受け取った検索種別決定部22は、該検索式によって
はまだ検索していなかったことになるので、該検索式に
基づく検索を第1の検索部26に依頼する。
【0025】第1の検索部26は、データベース4に対
し、高速検索可能なアルゴリズムによって検索を行うも
ので、例えば、検索精度の粗い検索アルゴリズムによっ
て検索が行われる。第1の検索部26は、自身の検索ア
ルゴリズムによる検索結果を検索結果記憶部24に書き
込むための処理を行うとともに、検索結果回答部25に
送出する。ここで、第1の検索部26が検索結果記憶部
24に検索結果を書き込む際は、図3(a)に示される
第1のアルゴリズムについての使用チェックフィールド
32にフラグをたてる。このフラグは、システムの内部
表現として、例えば、検索済みであれば「1」がたてら
れるが、同図においては、「done」により表現してい
る。なお、本実施形態において、初めての検索式による
検索は、必ず第1の検索アルゴリズムによる検索となる
ので、検索式フィールド31に何らかのデータが存在す
る場合には、チェックフィールド32もそれに対応して
フラグがたてられることとなる。そのため、検索式フィ
ールド31と検索結果フィールド34とをもって、チェ
ックフィールド32を省略することも可能である。
【0026】ところで、検索種別決定部22は、検索要
求受付部21から検索要求を受け付けていない場合、検
索結果検索部23に、第1の検索アルゴリズムによって
すでに検索され、かつ、第2の検索アルゴリズムによっ
てはまだ検索されていない検索式があるか否かを問い合
わせる。
【0027】検索結果検索部23は、そのような問い合
わせに対し、検索結果記憶部24を参照することによっ
て、検索式を検索し、該検索式を検索種別決定部22に
回答する。この検索は、図3(a)に示した第1のアル
ゴリズムについての使用チェックフィールド32に「do
ne」が書き込まれ、第2のアルゴリズムについての使用
チェックフィールド33が空欄であるか否かを判断する
ことによって行われる。また、検索の結果、複数の検索
式が該当することとなった場合には、所定の選択基準を
用いて、1つの検索式を選択する。所定の選択基準とし
ては、例えば、最新の検索式から順に選択する方法があ
る。また、同図(b)に示すように、検索要求フィール
ド35を設けることによって、検索式による検索数をカ
ウントしていき、最も回数の多いものから順に選択する
ようにしてもよい。この方法によれば、同図(b)にお
いては、検索要求数「48」に対応する検索式が次に選
択されることとなる。
【0028】検索種別決定部22は、検索結果検索部2
3から検索式を通知された場合には、該検索式に基づく
検索を第2の検索部27に依頼する。第2の検索部27
は、データベース4に対し、上記第1の検索アルゴリズ
ムよりも検索精度の高い検索アルゴリズム(第2のアル
ゴリズム)によって検索が行う。第の検索部27は、
第2の検索アルゴリズムによる検索結果を検索結果記憶
部24に書き込むための処理を行うとともに、検索結果
回答部25に送出する。ここで、第2の検索部27が検
索結果記憶部24に検索結果を書き込む際は、図3
(a)に示される第2のアルゴリズムについての使用チ
ェックフィールド33にフラグをたてる。
【0029】以上のように構成される本実施形態に係る
検索装置は、以下のように動作する。すなわち、図4
は、本実施形態に係る検索装置の動作を説明するための
図である。
【0030】同図において、検索種別決定部22は、検
索要求が来たか否かを判断し(STEP41)、検索要
求が来たと判断した場合には、検索結果検索部23にそ
の旨通知する。検索結果検索部23は、検索結果記憶部
24を検索し(STEP42)、検索要求に含まれる検
索式と同一の検索式による検索結果がキャッシュされて
いるか否かを判断する(STEP43)。その結果、該
検索式による検索がなされ、検索結果がキャッシュされ
ていると判断した場合には、該検索結果を検索結果記憶
部24から取り出し(STEP44)、利用者に返答す
るために、それを検索結果回答部25に送出する。一
方、検索結果がキャッシュされていないと判断した場合
には、その旨検索種別決定部22に回答することによ
り、検索種別決定部22は、第1の検索部26を起動
し、第1の検索部26は、第1の検索アルゴリズムで検
索する(STEP45)。第1の検索部26は、検索結
果を検索結果記憶部24に書き込むとともに、検索結果
回答部25に送出する(STEP46)。
【0031】検索結果回答部26は、検索結果検索部2
3または第1の検索部26から検索結果を受け取った場
合には、該検索要求を送出した利用者に検索結果を返答
する(STEP47)。
【0032】一方、STEP41において、検索種別決
定部22によって検索要求が来ていないと判断された場
合には、検索結果検索部23にその旨通知し、検索結果
検索部23は、第1の検索アルゴリズムによってすでに
検索され、かつ、第2の検索アルゴリズムによってはま
だ検索されていない検索式を検索する(STEP4
8)。その結果、検索結果検索部23は、そのような条
件を満たす検索式に対応する検索結果があるか否かを判
断し(STEP49)、あると判断した場合には、第2
の検索アルゴリズムにより検索されていない検索式を所
定の選択基準により1つ選択し(STEP41)、こ
れを検索種別決定部22に返答する。検索種別決定部2
2は、第2の検索部27を起動し、第2の検索部27
は、第2の検索アルゴリズムで検索する(STEP41
1)。第2の検索部27は、得られた検索結果を検索結
果記憶部24に書き込むとともに、該検索式について第
2のアルゴリズムによって検索されたことを記録する。
【0033】以上により、検索要求を受け付けることに
よりシステムの負荷が高まった場合には、検索精度は低
いが高速な検索を行い、利用者に対するレスポンスを向
上させつつ、検索要求を受け付けていない場合には、シ
ステムのリソースを積極的に検索処理に割り当てて、す
なわち、検索精度の高い検索を行っておくことにより、
近い将来受け付けるであろう利用者からの検索要求に備
えておくことができる。これにより、高速な検索を可能
としつつ、質の高い検索結果を提供することができるよ
うになる。
【0034】[第2の実施形態]第1の実施形態におい
ては、検索要求を受け付ていない場合を、システムの負
荷が低い状態であるとして、検索種別を決定するもので
あったが、本実施形態では、検索要求に対する処理や実
際の処理に基づくシステムの負荷状態を監視することに
よって、検索種別を決定するというものである。すなわ
ち、図5は、第2の実施形態の概念を説明するための図
であり、同図は、時間の経過とともにシステムの負荷が
変化する状態を示したものである。同図に示すように、
本実施形態は、システムの負荷が低い状態において、第
2の検索アルゴリズムによる検索を行うというものであ
る。
【0035】図6は、本実施形態に係る検索装置の構成
を示す図である。同図において、第1の実施形態と同じ
機能実現手段については同一の符号を付しており、負荷
算出部61が設けられている点のみ異なっている。
【0036】すなわち、検索種別決定部22は、検索要
求を受け付けていない場合は、まず、負荷算出部61に
システムの負荷状態を問い合わせて、負荷算出部61
は、現時点のシステムの負荷値を検索種別決定部22に
送出する。負荷算出部61は、例えば、オペレーティン
グシステムのシステムコール等によって提供されている
場合には、該機能を利用するようにしてもよい。また、
負荷値は、現時点の値や所定時間おきの平均負荷値等で
あってもよい。
【0037】検索種別決定部22は、システムの負荷値
を取得すると、該負荷値が所定の閾値以下であるか否か
を判断し、所定の閾値以下であると判断した場合、つま
り、システムの負荷が小さいと判断した場合には、第1
の実施例と同様に、第1の検索アルゴリズムで検索済み
で、かつ、第2のアルゴリズムで検索されていない検索
式を得るべく、検索結果検索部23に問い合わせる。以
下の処理は、第1の実施例と同様であるので、説明を省
略する。
【0038】図7は、本実施形態に係る検索装置の動作
を説明するための図である。同図において、STEP7
1〜77およびSTEP710〜STEP714の処理
は、上記実施形態と同様であり、STEP78およびS
TEP79の処理が追加されている点が異なる。
【0039】すなわち、検索要求がきていないと判断さ
れた場合には、検索種別決定部22は、負荷算出部61
に負荷値を問い合わせ、負荷算出部61は、負荷値を算
出する(STEP78)。そして、検索種別決定部22
は、負荷算出部61から得られた該負荷値について、所
定のしきい値と比較し、該所定のしきい値よりも小さい
と判断した場合のみ、STEP710以降の処理を続行
する。
【0040】以上により、本実施形態によれば、システ
ムの実際の負荷を監視するので、検索要求を受け付けて
いなくても、何らかの原因でシステムの負荷が高い場合
には、さらに負荷を高める処理を回避することができる
ので、効率よくシステムを利用することができるように
なる。
【0041】このような構成は、特定のサーバを検索シ
ステムとしてのみ利用するのではなく、さまざまな処理
を行わせている場合に、特に有効である。 [第3の実施形態]上記実施形態においては、検索要求
が来ていない場合等に、第2の検索アルゴリズムにより
検索されていない検索式について検索しなおすこととし
ているが、本実施形態では、利用者の想定されるプロフ
ァイルの属性を加味して、予め検索しておくというもの
である。
【0042】例えば、「パソコン」という検索要求が既
にあり、第1および第2の検索アルゴリズムによる検索
が行われていたとする。さらに、利用者のなかで「経
済」分野に興味がある人が多ければ、「経済」分野での
「パソコン」を予め検索しておくというものである。
【0043】図8は、本実施形態に係る検索装置の構成
を示す図である。同図において、第1の実施形態と同じ
機能実現手段については同一の符号を付しており、プロ
ファイル情報更新部81およびプロファイル情報記憶部
82が設けられている点が異なっている。
【0044】まず、利用者Aが検索式Sによる検索要求
を出すと、検索要求受付部21は、プロファイル情報更
新部81にその旨通知し、プロファイル情報更新部81
は、該利用者の領域がプロファイル情報記憶部81に確
保していなければ、確保する。
【0045】第1の検索部26または第2の検索部27
は、与えられた検索式から所定の要素(例えば、キーワ
ード等)を抽出し、これをプロファイル情報更新部81
に通知する。プロファイル情報更新部81は、プロファ
イル情報記憶部82の対応する利用者の領域に、送出さ
れたキーワード等を記憶させる。ここで、プロファイル
情報記憶部82は、例えば、キーワード等ごとに出現頻
度等を計数するようにしてもよいし、さらに意味ネット
等を用いて該キーワードに関連する分野が注視されるよ
うにしてもよい。要は、利用者ごとに異なる検索要求に
対応した検索ができるようなものであればよい。
【0046】ところで、第1の検索部26が与えられた
検索式により検索を行い、上位n個分の検索結果を検索
結果記憶部24に記憶(キャッシング)するとともに、
利用者Aには上位m個(m<n)分の検索結果を返答し
たとする。
【0047】その後、上記実施形態と同様にして、第2
の検索部が検索式Sに基づいて第2の検索アルゴリズム
によって検索を行った場合、やはり上位n個分の検索結
果を検索結果記憶部24にキャッシングしておく。ただ
し、この場合、先のn個分の検索結果を削除しない。な
ぜならば、利用者Aが(m+1)番目以降の検索結果を
見ることを欲した場合に、第1のアルゴリズムによる上
位m個の検索結果と第2の検索アルゴリズムによる(m
+1)番目以降の検索結果とは、無関係だからである。
このような事態を回避するために、WWWの場合には、
cookieやFat URL を用いて利用者を同定し、利用者Aに
ついては、第1の検索アルゴリズムの検索結果の(m+
1)番目以降を提示するようにする。この場合、古い検
索結果のキャッシングは時間を決めておき、一定時間以
上経過した場合には削除するようにする。
【0048】[第4の実施形態]検索対象となる情報が
増えた場合には、データベース4が更新される。さら
に、場合によっては、既に検索して保持している検索結
果に影響を与えることもある。例えば、「パソコン」と
いう語での検索結果があった場合に、「パソコン」とい
う語を含む文書をデータベース4に加える場合には、
「パソコン」という語で行った検索に対する検索結果を
捨てる必要がある。
【0049】そこで、本実施形態では、検索対象を増や
す場合には、その増やすものが、既に蓄えられている検
索式に合致するかどうかを調べ、合致するならば、その
検索結果を棄却するようにする。
【0050】次に、検索対象を減らす場合について説明
する。ある情報をデータベース4から取り除く場合に
は、その情報が検索結果として含まれて保存されている
ものの中に入っている場合に、その検索結果を破棄す
る。
【0051】このように破棄された結果を検索について
は、再び検索される可能性が高いので、検索エンジンの
負荷が軽いときに検索を予め実行しておく。このときの
検索式評価の優先順位には、第1の実施形態で述べたよ
うに、最も最近検索された検索式や最も検索要求が多か
った検索式の順とすることもできる。
【0052】[その他の実施形態]上記実施形態におい
ては、説明を簡便にするために、検索アルゴリズムにつ
いて、第1 および第2 の2 種類であるとしたが、特にこ
れにこだわるものではなく、複数種類の検索アルゴリズ
ムを用いるようにしてもよい。すなわち、第2 の検索ア
ルゴリズムを適用した後にも、計算機にアイドルタイム
があるならば、第2の検索アルゴリズムよりも更に精緻
な第3 のアルゴリズムで検索を行うようにしてもよい。
これを繰り返すことにより、任意段の精緻な検索アルゴ
リズムを適用することができる。
【0053】また、上記実施形態においては、説明を簡
便にするために、テキストベースで書いたが、これに限
定されるものではなく、例えば、マルチメディアデータ
に対して適用することも可能である。すなわち、画像の
粗い検索アルゴリズムでは、縮小画像や解像度の低いも
のでヒストグラム程度のマッチングのみを行なうが、精
緻な検索アルゴリズムでは高解像度で高度なパターンマ
ッチングを行なうようにしてもよい。
【0054】
【発明の効果】本発明によれば、まだ検索していない場
合でも、必要以上にレスポンス時間が長くなるという事
態を回避することができるとともに、すでに検索されて
いる場合には、さらに質の高い検索結果を高速に得るこ
とができるようになる。
【図面の簡単な説明】
【図1】 本発明に係る検索方法が適用されるシステム
の構成の一例を示す図。
【図2】 第1の実施形態に係る検索装置の構成を示す
図。
【図3】 検索結果記憶部に記憶されるデータの内容の
一例を示す図。
【図4】 第1の実施形態に係る検索装置の動作を説明
するための図。
【図5】 第2の実施形態の概念を説明するための図。
【図6】 第2の実施形態に係る検索装置の構成を示す
図。
【図7】 第2の実施形態に係る検索装置の動作を説明
するための図。
【図8】 第3の実施形態に係る検索装置の構成を示す
図。
【符号の説明】
1…利用者端末 2…ネットワーク 3…サーバ 4…データベース 21…検索要求受付部 22…検索種別決定部 23…検索結果検索部 24…検索結果記憶部 25…検索結果回答部 26…第1の検索部 27…第2の検索部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 340 G06F 17/30 110 G06F 12/00 546 JICSTファイル(JOIS)

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 被検索対象である Web ページに係るデー
    タベースに蓄積された情報について、不特定の利用者か
    らネットワークに接続された端末を介してサーバに与え
    られる検索要求に含まれる検索式に基づいて、前記サー
    バの第1の検索部において第1の検索アルゴリズムにて
    第1の検索を行うステップと、このステップにより得ら
    れる検索結果前記サーバの検索結果記憶部に記憶され
    ている場合で、かつ、システムの負荷が所定の閾値より
    も小さい場合に、前記検索式に基づいて、前記サーバの
    第2の検索部において前記第1の検索アルゴリズムより
    も検索精度の高い第2の検索アルゴリズムにて第2の検
    索を行うステップとを有することを特徴とする検索方
    法。
  2. 【請求項2】 前記第1の検索又は前記第2の検索を行
    うことにより得られる検索結果が前記検索結果記憶部に
    記憶されている場合に、前記サーバの検索結果検索部で
    行なわれた検索の結果について、前記検索式を前記利用
    者からの検索要求が含んでいる場合は、前記サーバの検
    索結果回答部から前記検索結果を出力することを特徴と
    する請求項1記載の検索方法。
  3. 【請求項3】 被検索対象である Web ページに係るデー
    タベースに蓄積された情報について、不特定の利用者か
    らネットワークに接続された端末を介してサーバに与え
    られるとともに検索要求に含まれる検索式に基づいて、
    前記サーバの第1の検索部において第1の検索アルゴリ
    ズムにて第1の検索を行うステップと、このステップに
    より得られる検索結果が、前記サーバの検索結果記憶部
    に記憶されている場合、かつ、システムの負荷が所定の
    閾値よりも小さい場合に、前記検索結果が前記第1の検
    索部において前記第1の検索を行うことにより得られた
    ものであり、かつ、前記サーバの第2の検索部において
    第2の検索を行っていないと前記サーバの検索種別決定
    部で判断される場合には、前記検索式に基づき前記第2
    の検索部において前記第1の検索アルゴリズムよりも検
    索精度の高い第2の検索アルゴリズムにて前記第2の検
    索を行うステップとを有することを特徴とする検索方
    法。
  4. 【請求項4】 検索対象となる前記 Web ページが増えて
    前記データベースに蓄積された情報の更新を行う場合
    に、この更新される情報に係る検索式が、既に前記検索
    結果記憶部に蓄えられている検索式に合致するならば、
    その検索結果を棄却するようにすることを特徴とする請
    求項1または3記載の検索方法。
  5. 【請求項5】 被検索対象である Web ページに係るデー
    タベースに蓄積された情報について、不特定の利用者か
    らネットワークに接続された端末を介してサーバに与え
    られる検索要求を受け付ける要求受付手段と、前記要求
    受付手段により検索要求を受け付けた場合には、前記検
    索要求に含まれる検索式に基づいて、第1の検索アルゴ
    リズムにて第1の検索を行う第1の検索手段と、前記第
    1の検索手段により得られる第1の検索結果を記憶する
    検索結果記憶手段と、前記要求受付手段により検索要求
    を受け付けていない場合、かつ、システムの負荷が所定
    の閾値よりも小さい場合には、前記検索式に基づいて、
    前記第1の検索アルゴリズムよりも検索精度の高い第2
    の検索アルゴリズムにて第2の検索を行う第2の検索手
    段とからなることを特徴とする検索装置。
  6. 【請求項6】 検索要求に基づいて検索を行うためのプ
    ログラムを記録したコンピュータ読み取り可能な記録媒
    体であって、不特定の利用者からの検索要求を受け付け
    た場合に、この検索要求に含まれる検索式に基づいて、
    前記コンピュータの第1の検索部で、第1の検索アルゴ
    リズムにて第1の検索を行わせる機能と、この機能によ
    り得られる第1の検索結果を前記コンピュータの検索結
    果記憶部に記憶させる機能と、検索要求を受け付けてい
    ない場合、かつ、システムの負荷が所定の閾値よりも小
    さい場合に、前記検索式に基づいて、前記コンピュータ
    の第2の検索部で、前記第1の検索アルゴリズムよりも
    検索精度の高い第2の検索アルゴリズムにて第2の検索
    を行わせる機能とからなるプログラムを記録したコンピ
    ュータ読み取り可能な記録媒体。
JP26117697A 1997-09-26 1997-09-26 検索方法および検索装置 Expired - Fee Related JP3521176B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP26117697A JP3521176B2 (ja) 1997-09-26 1997-09-26 検索方法および検索装置
US09/156,869 US6385605B1 (en) 1997-09-26 1998-09-18 Information retrieval apparatus and a method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26117697A JP3521176B2 (ja) 1997-09-26 1997-09-26 検索方法および検索装置

Publications (2)

Publication Number Publication Date
JPH11102366A JPH11102366A (ja) 1999-04-13
JP3521176B2 true JP3521176B2 (ja) 2004-04-19

Family

ID=17358192

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26117697A Expired - Fee Related JP3521176B2 (ja) 1997-09-26 1997-09-26 検索方法および検索装置

Country Status (2)

Country Link
US (1) US6385605B1 (ja)
JP (1) JP3521176B2 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001101186A (ja) * 1999-09-30 2001-04-13 Oki Electric Ind Co Ltd 機械翻訳装置
JP2001159998A (ja) * 1999-12-03 2001-06-12 Nec Corp Webコンテンツキャッシュシステム及び方法並びに記録媒体
US6611834B1 (en) * 2000-01-12 2003-08-26 International Business Machines Corporation Customization of information retrieval through user-supplied code
JP4155382B2 (ja) * 2001-01-25 2008-09-24 富士通株式会社 パターン検索方法、パターン検索装置、パターン検索プログラムを記録したコンピュータ読み取り可能な記録媒体、パターン検索システムおよびパターン検索プログラム
JP3953282B2 (ja) * 2001-02-27 2007-08-08 株式会社藤商事 遊技機の故障診断システム
US6754346B2 (en) 2002-07-31 2004-06-22 Steven P. Eiserling Method for tracing the distribution of physical digital media
JP4120888B2 (ja) * 2004-01-30 2008-07-16 日本電気株式会社 データ検索装置及び方法
US20060167842A1 (en) * 2005-01-25 2006-07-27 Microsoft Corporation System and method for query refinement
JP4562719B2 (ja) * 2006-11-20 2010-10-13 株式会社藤商事 故障診断システム
JP4988441B2 (ja) * 2007-06-14 2012-08-01 富士通株式会社 検索プログラム、検索方法および検索装置
JP5246234B2 (ja) * 2010-09-29 2013-07-24 ブラザー工業株式会社 検索装置
CN102479207B (zh) * 2010-11-29 2013-07-03 阿里巴巴集团控股有限公司 一种信息搜索的方法、系统及信息搜索设备
US20130054558A1 (en) * 2011-08-29 2013-02-28 Microsoft Corporation Updated information provisioning
US20130110804A1 (en) * 2011-10-31 2013-05-02 Elwha LLC, a limited liability company of the State of Delaware Context-sensitive query enrichment
CN103593419B (zh) * 2013-10-30 2018-03-09 华为技术有限公司 数据查询方法、装置、服务器及系统
US20170147652A1 (en) * 2015-11-19 2017-05-25 Institute For Information Industry Search servers, end devices, and search methods for use in a distributed network
JP6695310B2 (ja) * 2017-08-09 2020-05-20 繁巳 松本 医療支援システム及び医療支援プログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04326163A (ja) 1991-04-25 1992-11-16 Hitachi Ltd 記憶装置の制御装置
JPH06139291A (ja) * 1992-10-30 1994-05-20 Hitachi Ltd 情報検索方法およびシステム
JPH06203076A (ja) * 1993-01-06 1994-07-22 Hitachi Ltd 情報検索方法
JPH06251063A (ja) * 1993-02-26 1994-09-09 Fujitsu Ltd 検索結果保持方法
US5860009A (en) * 1994-04-28 1999-01-12 Kabushiki Kaisha Toshiba Programming method for concurrent programs and program supporting apparatus thereof
US5717914A (en) * 1995-09-15 1998-02-10 Infonautics Corporation Method for categorizing documents into subjects using relevance normalization for documents retrieved from an information retrieval system in response to a query
US5737734A (en) * 1995-09-15 1998-04-07 Infonautics Corporation Query word relevance adjustment in a search of an information retrieval system
US5640553A (en) * 1995-09-15 1997-06-17 Infonautics Corporation Relevance normalization for documents retrieved from an information retrieval system in response to a query
JPH1049549A (ja) * 1996-05-29 1998-02-20 Matsushita Electric Ind Co Ltd 文書検索装置
US5802518A (en) * 1996-06-04 1998-09-01 Multex Systems, Inc. Information delivery system and method
JP4025379B2 (ja) * 1996-09-17 2007-12-19 株式会社ニューズウオッチ 検索システム
JP3499105B2 (ja) * 1997-03-03 2004-02-23 株式会社東芝 情報検索方法および情報検索装置
US5926807A (en) * 1997-05-08 1999-07-20 Microsoft Corporation Method and system for effectively representing query results in a limited amount of memory
US6067539A (en) * 1998-03-02 2000-05-23 Vigil, Inc. Intelligent information retrieval system

Also Published As

Publication number Publication date
JPH11102366A (ja) 1999-04-13
US6385605B1 (en) 2002-05-07

Similar Documents

Publication Publication Date Title
JP3521176B2 (ja) 検索方法および検索装置
US8782032B2 (en) Minimizing visibility of stale content in web searching including revising web crawl intervals of documents
KR100974906B1 (ko) 위치와 관련하여 신뢰성 있는 문서를 식별하는 시스템 및 방법
KR101700352B1 (ko) 이력적 검색 결과들을 사용한 향상된 문서 분류 데이터 생성
JP4837040B2 (ja) ブログ文書のランク付け
US9684720B2 (en) Lateral search
US8631026B1 (en) Methods and systems for efficient query rewriting
US6754873B1 (en) Techniques for finding related hyperlinked documents using link-based analysis
US7996397B2 (en) Using network traffic logs for search enhancement
US8515952B2 (en) Systems and methods for determining document freshness
US20050278314A1 (en) Variable length snippet generation
US7966341B2 (en) Estimating the date relevance of a query from query logs
US20020123988A1 (en) Methods and apparatus for employing usage statistics in document retrieval
US8176056B1 (en) Determining quality of linked documents
US10691765B1 (en) Personalized search results
CN108304444A (zh) 信息查询方法及装置
US8171228B2 (en) Garbage collection in a cache with reduced complexity
WO2008133368A1 (en) Information search ranking system and method based on users' attention levels
CN110968765A (zh) 书籍搜索方法、计算设备及计算机存储介质
US8713071B1 (en) Detecting mirrors on the web
Bhushan et al. Recommendation of optimized web pages to users using Web Log mining techniques
CN108984582B (zh) 一种查询请求处理方法
KR20190129474A (ko) 데이터 검색 장치 및 방법
JP2001337973A (ja) 検索システムのメンテナンス方法及び検索システム
CN111460307B (zh) 一种移动终端精确搜索方法和装置

Legal Events

Date Code Title Description
A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040107

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040202

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090213

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090213

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100213

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110213

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110213

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120213

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees