JP3521176B2 - 検索方法および検索装置 - Google Patents
検索方法および検索装置Info
- Publication number
- JP3521176B2 JP3521176B2 JP26117697A JP26117697A JP3521176B2 JP 3521176 B2 JP3521176 B2 JP 3521176B2 JP 26117697 A JP26117697 A JP 26117697A JP 26117697 A JP26117697 A JP 26117697A JP 3521176 B2 JP3521176 B2 JP 3521176B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- result
- request
- unit
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99934—Query formulation, input preparation, or translation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99935—Query augmenting and refining, e.g. inexact access
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
索装置に係るものであり、特に、インターネットやイン
トラネットにおける検索方法および検索装置に関するも
のである。
W」という)が普及し、インターネットやイントラネッ
トにおいて、電子化された情報の流通が非常に活発にな
った。このため、いわゆる情報洪水が生じ、利用者が真
に欲する情報を取り出すことが困難になるという問題が
生じてきた。このような問題を軽減するために、インタ
ーネットやイントラネットにおいて、検索システムが登
場してきた。この検索システムとしては、例えば、DEC
社の「Altavista 」やExcite社の「excite」等が知られ
ている。
て検索式の形で表現された検索要求が与えられ、その与
えられた検索式に合致するデータ(Web ページ)を利用
者に提示する。ここで、被検索対象であるWeb ページ
は、インデックステーブルの形式に変換され保持されて
おり、高速に検索可能となっている。しかしながら、高
速とは言っても世界中の利用者から膨大な量の検索要求
がくると、それを全て処理するためには、相当の時間を
要することとなる。
り高速にするため。検索結果のキャッシングという技術
が用いられる場合がある。これは、一度ある検索式によ
って検索し、検索結果が得られたものについては、その
検索結果をストレージデバイス等に記憶しておき、以
降、同一の検索要求が来た場合には、再度検索すること
なく、以前に検索したときの検索結果が記憶されている
ストレージデバイスを参照することによって、高速に検
索結果を返すというものである。これにより、2回目以
降は、実際の検索が行なわれず、キャッシュの内容を参
照するだけであるので、十分に高速なレスポンスを期待
することができるようになる。このような技術は、特開
平4−199468や特開平4−326163等に開示
されている。
した検索システムにおいては、検索結果の質については
何ら考慮されていない。これは、高速性の追求と検索結
果の質の向上とは、相反する関係にあることが原因とし
てあげられるからである。すなわち、検索結果の質を向
上させるために精緻な検索アルゴリズムを用いた場合に
は、検索時間が長くなり、また、利用者ごとのプロファ
イルに基づいた検索を行なった場合には、検索結果のキ
ャッシュが効かなくなり、レスポンス時間が長くなるか
らである。
以前の検索結果を返答するだけでは、質の高い検索結果
を提供することは困難であった。そこで、本発明は、短
いレスポンス時間を保ちつつも、検索結果の質を高めた
検索方法および検索装置を提供することを目的とする。
みることとする。第1に、検索要求数は非常に多く、そ
の間隔はランダムである。すなわち、非常に膨大な数の
検索要求がネットワークを介して寄せられ、これに対す
るレスポンスを良くする必要がある。利用者は、ネット
ワークに接続された端末におり、個々の検索要求は、全
くランダムに検索システムに到着する。
なわち、膨大な数の検索要求は、それぞれが異なってい
るものではなく、その約70%は、以前に与えられた検
索式と同一の検索式によるものである。特に、WWWに
おいては、新しい情報に対する価値が高く、多くの利用
者は新しい情報の検索をする要求が高いが、一般に、新
しい情報の種類は限られているので、検索要求は同じも
のになる傾向がある。
ど、検索処理に時間を要する。すなわち、利用者が直接
示した検索式による検索は高速であるが、あまり質は高
くない。一方、同類語、同義語展開、表記の揺らぎ処
理、文字ベース検索と単語ベース検索との融合や、利用
者のプロファイルを加味した検索を行う場合には、検索
結果の質の向上は期待できるが、その反面、検索時間が
長くなる。
は、検索要求数は多く、しかも同一の検索要求が多いの
で、検索結果のキャッシングは非常に有効なものとな
る。また、精度のよい検索アルゴリズムを用いようとす
る場合には、処理時間が問題である。一方、検索要求は
ランダムに到着するので、場合によっては検索エンジン
がアイドル状態である時間もある。そこで、この時間を
有効に活用することによって、検索結果の質を向上を期
待することができる。
ンの負荷が軽いときに、粗い検索アルゴリズムで検索し
た検索結果を、再び精緻な検索アルゴリズムで検索し直
して、その検索結果をキャッシングしておく。また、本
発明では、再検索を計算機の負荷が軽いときに行うので
はなく、再検索専用の検索エンジンによって行うように
してもよい。これにより、利用者にとって、必要以上に
レスポンス時間が長くならず、再検索しない場合に比べ
て、質のよい検索結果が得られることができるようにな
る。
れば、被検索対象である Web ページに係るデータベース
に蓄積された情報について、不特定の利用者からネット
ワークに接続された端末を介してサーバに与えられる検
索要求に含まれる検索式に基づいて、前記サーバの第1
の検索部において第1の検索アルゴリズムにて第1の検
索を行うステップと、このステップにより得られる検索
結果が前記サーバの検索結果記憶部に記憶されている場
合で、かつ、システムの負荷が所定の閾値よりも小さい
場合に、前記検索式に基づいて、前記サーバの第2の検
索部において前記第1の検索アルゴリズムよりも検索精
度の高い第2の検索アルゴリズムにて第2の検索を行う
ステップとを有することを特徴とする検索方法である。
検索又は前記第2の検索を行うことにより得られる検索
結果が前記検索結果記憶部に記憶されている場合に、前
記サーバの検索結果検索部で行なわれた検索の結果につ
いて、前記検索式を前記利用者からの検索要求が含んで
いる場合は、前記サーバの検索結果回答部から前記検索
結果を出力することを特徴とする請求項1記載の検索方
法である。
である Web ページに係るデータベースに蓄積された情報
について、不特定の利用者からネットワークに接続され
た端末を介してサーバに与えられるとともに検索要求に
含まれる検索式に基づいて、前記サーバの第1の検索部
において第1の検索アルゴリズムにて第1の検索を行う
ステップと、このステップにより得られる検索結果が、
前記サーバの検索結果記憶部に記憶されている場合、か
つ、システムの負荷が所定の閾値よりも小さい場合に、
前記検索結果が前記第1の検索部において前記第1の検
索を行うことにより得られたものであり、かつ、前記サ
ーバの第2の検索部において第2の検索を行っていない
と前記サーバの検索種別決定部で判断される場合には、
前記検索式に基づき前記第2の検索部において前記第1
の検索アルゴリズムよりも検索精度の高い第2の検索ア
ルゴリズムにて前記第2の検索を行うステップとを有す
ることを特徴とする検索方法である。
なる前記 Web ページが増えて前記データベースに蓄積さ
れた情報の更新を行う場合に、この更新される情報に係
る検索式が、既に前記検索結果記憶部に蓄えられている
検索式に合致するならば、その検索結果を棄却するよう
にすることを特徴とする請求項1または3記載の検索方
法である。
である Web ページに係るデータベースに蓄積された情報
について、不特定の利用者からネットワークに接続され
た端末を介してサーバに与えられる検索要求を受け付け
る要求受付手段と、前記要求受付手段により検索要求を
受け付けた場合には、前記検索要求に含まれる検索式に
基づいて、第1の検索アルゴリズムにて第1の検索を行
う第1の検索手段と、前記第1の検索手段により得られ
る第1の検索結果を記憶する検索結果記憶手段と、前記
要求受付手段により検索要求を受け付けていない場合、
かつ、システムの負荷が所定の閾値よりも小さい場合に
は、前記検索式に基づいて、前記第1の検索アルゴリズ
ムよりも検索精度の高い第2の検索アルゴリズムにて第
2の検索を行う第2の検索手段とからなることを特徴と
する検索装置である。
基づいて検索を行うためのプログラムを記録したコンピ
ュータ読み取り可能な記録媒体であって、不特定の利用
者からの検索要求を受け付けた場合に、この検索要求に
含まれる検索式に基づいて、前記コンピュータの第1の
検索部で、第1の検索アルゴリズムにて第1の検索を行
わせる機能と、この機能により得られる第1の検索結果
を前記コンピュータの検索結果記憶部に記憶させる機能
と、検索要求を受け付けていない場合、かつ、システム
の負荷が所定の閾値よりも小さい場合に、前記検索式に
基づいて、前記コンピュータの第2の検索部で、前記第
1の検索アルゴリズムよりも検索精度の高い第2の検索
アルゴリズムにて第2の検索を行わせる機能とからなる
プログラムを記録したコンピュータ読み取り可能な記録
媒体である。
明の実施の形態について説明をする。 [第1の実施形態]図1は、本発明に係る検索方法が適
用されるシステムの構成の一例を示す図である。すなわ
ち、同図において、利用者は、利用者端末1からネット
ワーク2を介して、本実施形態に係る検索方法および検
索装置を実現するサーバ3に対して、検索要求を与え
る。サーバ3は、データベース4に保持されている膨大
な被検索対象であるデータ(例えば、Webページの一
覧情報等)を参照することにより、該検索要求に合致す
る検索結果を得て、これを利用者端末1に返答する。デ
ータベース4に記憶されているデータは、一般に、We
bページがインデックステーブルの形式に変換されてい
るが、特に、これにこだわるものではなく、要は、被検
索対象たるデータが何らかの形式で保持されていればよ
い。
を示す図である。同図において、検索要求受付部21
は、ネットワーク2から所定の検索式を含む検索要求を
受け取ると、これを検索種別決定部22に送出する。検
索種別決定部22は、検索要求受付部21からの通知が
ない場合は後述する処理を行うが、検索要求受付部21
から検索要求が通知された場合には、該検索要求に含ま
れる検索式を抽出して、この検索式と同一の検索式によ
って過去に検索を行ったか否かについて、検索結果検索
部23に問い合わせる。検索結果検索部23は、検索結
果記憶部24を参照し、抽出された検索式によって検索
された検索結果が記憶されているか否かを検索する。す
なわち、図3は、検索結果記憶部24に記憶されるデー
タの内容の一例を示す図であり、検索結果検索部23
は、検索式フィールドを参照することにより、該抽出さ
れた検索式に合致する検索式がすでに記憶されているか
否かを検索する。
る検索式と同一の検索式を検索結果記憶部24から検索
できた場合には、その検索式に対応する検索結果を検索
結果フィールドから取り出して、検索結果回答部25に
送出する。一方、検索した結果、該検索式が検索されな
かった場合には、その旨検索種別決定部22に返答し、
後述する処理を行う。
3等から送出されてきた検索結果を、利用者端末1に返
答するために、ネットワークに送出するためのものであ
る。検索結果検索部23から検索されなかった旨の通知
を受け取った検索種別決定部22は、該検索式によって
はまだ検索していなかったことになるので、該検索式に
基づく検索を第1の検索部26に依頼する。
し、高速検索可能なアルゴリズムによって検索を行うも
ので、例えば、検索精度の粗い検索アルゴリズムによっ
て検索が行われる。第1の検索部26は、自身の検索ア
ルゴリズムによる検索結果を検索結果記憶部24に書き
込むための処理を行うとともに、検索結果回答部25に
送出する。ここで、第1の検索部26が検索結果記憶部
24に検索結果を書き込む際は、図3(a)に示される
第1のアルゴリズムについての使用チェックフィールド
32にフラグをたてる。このフラグは、システムの内部
表現として、例えば、検索済みであれば「1」がたてら
れるが、同図においては、「done」により表現してい
る。なお、本実施形態において、初めての検索式による
検索は、必ず第1の検索アルゴリズムによる検索となる
ので、検索式フィールド31に何らかのデータが存在す
る場合には、チェックフィールド32もそれに対応して
フラグがたてられることとなる。そのため、検索式フィ
ールド31と検索結果フィールド34とをもって、チェ
ックフィールド32を省略することも可能である。
求受付部21から検索要求を受け付けていない場合、検
索結果検索部23に、第1の検索アルゴリズムによって
すでに検索され、かつ、第2の検索アルゴリズムによっ
てはまだ検索されていない検索式があるか否かを問い合
わせる。
わせに対し、検索結果記憶部24を参照することによっ
て、検索式を検索し、該検索式を検索種別決定部22に
回答する。この検索は、図3(a)に示した第1のアル
ゴリズムについての使用チェックフィールド32に「do
ne」が書き込まれ、第2のアルゴリズムについての使用
チェックフィールド33が空欄であるか否かを判断する
ことによって行われる。また、検索の結果、複数の検索
式が該当することとなった場合には、所定の選択基準を
用いて、1つの検索式を選択する。所定の選択基準とし
ては、例えば、最新の検索式から順に選択する方法があ
る。また、同図(b)に示すように、検索要求フィール
ド35を設けることによって、検索式による検索数をカ
ウントしていき、最も回数の多いものから順に選択する
ようにしてもよい。この方法によれば、同図(b)にお
いては、検索要求数「48」に対応する検索式が次に選
択されることとなる。
3から検索式を通知された場合には、該検索式に基づく
検索を第2の検索部27に依頼する。第2の検索部27
は、データベース4に対し、上記第1の検索アルゴリズ
ムよりも検索精度の高い検索アルゴリズム(第2のアル
ゴリズム)によって検索が行う。第2の検索部27は、
第2の検索アルゴリズムによる検索結果を検索結果記憶
部24に書き込むための処理を行うとともに、検索結果
回答部25に送出する。ここで、第2の検索部27が検
索結果記憶部24に検索結果を書き込む際は、図3
(a)に示される第2のアルゴリズムについての使用チ
ェックフィールド33にフラグをたてる。
検索装置は、以下のように動作する。すなわち、図4
は、本実施形態に係る検索装置の動作を説明するための
図である。
索要求が来たか否かを判断し(STEP41)、検索要
求が来たと判断した場合には、検索結果検索部23にそ
の旨通知する。検索結果検索部23は、検索結果記憶部
24を検索し(STEP42)、検索要求に含まれる検
索式と同一の検索式による検索結果がキャッシュされて
いるか否かを判断する(STEP43)。その結果、該
検索式による検索がなされ、検索結果がキャッシュされ
ていると判断した場合には、該検索結果を検索結果記憶
部24から取り出し(STEP44)、利用者に返答す
るために、それを検索結果回答部25に送出する。一
方、検索結果がキャッシュされていないと判断した場合
には、その旨検索種別決定部22に回答することによ
り、検索種別決定部22は、第1の検索部26を起動
し、第1の検索部26は、第1の検索アルゴリズムで検
索する(STEP45)。第1の検索部26は、検索結
果を検索結果記憶部24に書き込むとともに、検索結果
回答部25に送出する(STEP46)。
3または第1の検索部26から検索結果を受け取った場
合には、該検索要求を送出した利用者に検索結果を返答
する(STEP47)。
定部22によって検索要求が来ていないと判断された場
合には、検索結果検索部23にその旨通知し、検索結果
検索部23は、第1の検索アルゴリズムによってすでに
検索され、かつ、第2の検索アルゴリズムによってはま
だ検索されていない検索式を検索する(STEP4
8)。その結果、検索結果検索部23は、そのような条
件を満たす検索式に対応する検索結果があるか否かを判
断し(STEP49)、あると判断した場合には、第2
の検索アルゴリズムにより検索されていない検索式を所
定の選択基準により1つ選択し(STEP410)、こ
れを検索種別決定部22に返答する。検索種別決定部2
2は、第2の検索部27を起動し、第2の検索部27
は、第2の検索アルゴリズムで検索する(STEP41
1)。第2の検索部27は、得られた検索結果を検索結
果記憶部24に書き込むとともに、該検索式について第
2のアルゴリズムによって検索されたことを記録する。
よりシステムの負荷が高まった場合には、検索精度は低
いが高速な検索を行い、利用者に対するレスポンスを向
上させつつ、検索要求を受け付けていない場合には、シ
ステムのリソースを積極的に検索処理に割り当てて、す
なわち、検索精度の高い検索を行っておくことにより、
近い将来受け付けるであろう利用者からの検索要求に備
えておくことができる。これにより、高速な検索を可能
としつつ、質の高い検索結果を提供することができるよ
うになる。
ては、検索要求を受け付ていない場合を、システムの負
荷が低い状態であるとして、検索種別を決定するもので
あったが、本実施形態では、検索要求に対する処理や実
際の処理に基づくシステムの負荷状態を監視することに
よって、検索種別を決定するというものである。すなわ
ち、図5は、第2の実施形態の概念を説明するための図
であり、同図は、時間の経過とともにシステムの負荷が
変化する状態を示したものである。同図に示すように、
本実施形態は、システムの負荷が低い状態において、第
2の検索アルゴリズムによる検索を行うというものであ
る。
を示す図である。同図において、第1の実施形態と同じ
機能実現手段については同一の符号を付しており、負荷
算出部61が設けられている点のみ異なっている。
求を受け付けていない場合は、まず、負荷算出部61に
システムの負荷状態を問い合わせて、負荷算出部61
は、現時点のシステムの負荷値を検索種別決定部22に
送出する。負荷算出部61は、例えば、オペレーティン
グシステムのシステムコール等によって提供されている
場合には、該機能を利用するようにしてもよい。また、
負荷値は、現時点の値や所定時間おきの平均負荷値等で
あってもよい。
を取得すると、該負荷値が所定の閾値以下であるか否か
を判断し、所定の閾値以下であると判断した場合、つま
り、システムの負荷が小さいと判断した場合には、第1
の実施例と同様に、第1の検索アルゴリズムで検索済み
で、かつ、第2のアルゴリズムで検索されていない検索
式を得るべく、検索結果検索部23に問い合わせる。以
下の処理は、第1の実施例と同様であるので、説明を省
略する。
を説明するための図である。同図において、STEP7
1〜77およびSTEP710〜STEP714の処理
は、上記実施形態と同様であり、STEP78およびS
TEP79の処理が追加されている点が異なる。
れた場合には、検索種別決定部22は、負荷算出部61
に負荷値を問い合わせ、負荷算出部61は、負荷値を算
出する(STEP78)。そして、検索種別決定部22
は、負荷算出部61から得られた該負荷値について、所
定のしきい値と比較し、該所定のしきい値よりも小さい
と判断した場合のみ、STEP710以降の処理を続行
する。
ムの実際の負荷を監視するので、検索要求を受け付けて
いなくても、何らかの原因でシステムの負荷が高い場合
には、さらに負荷を高める処理を回避することができる
ので、効率よくシステムを利用することができるように
なる。
ステムとしてのみ利用するのではなく、さまざまな処理
を行わせている場合に、特に有効である。 [第3の実施形態]上記実施形態においては、検索要求
が来ていない場合等に、第2の検索アルゴリズムにより
検索されていない検索式について検索しなおすこととし
ているが、本実施形態では、利用者の想定されるプロフ
ァイルの属性を加味して、予め検索しておくというもの
である。
にあり、第1および第2の検索アルゴリズムによる検索
が行われていたとする。さらに、利用者のなかで「経
済」分野に興味がある人が多ければ、「経済」分野での
「パソコン」を予め検索しておくというものである。
を示す図である。同図において、第1の実施形態と同じ
機能実現手段については同一の符号を付しており、プロ
ファイル情報更新部81およびプロファイル情報記憶部
82が設けられている点が異なっている。
を出すと、検索要求受付部21は、プロファイル情報更
新部81にその旨通知し、プロファイル情報更新部81
は、該利用者の領域がプロファイル情報記憶部81に確
保していなければ、確保する。
は、与えられた検索式から所定の要素(例えば、キーワ
ード等)を抽出し、これをプロファイル情報更新部81
に通知する。プロファイル情報更新部81は、プロファ
イル情報記憶部82の対応する利用者の領域に、送出さ
れたキーワード等を記憶させる。ここで、プロファイル
情報記憶部82は、例えば、キーワード等ごとに出現頻
度等を計数するようにしてもよいし、さらに意味ネット
等を用いて該キーワードに関連する分野が注視されるよ
うにしてもよい。要は、利用者ごとに異なる検索要求に
対応した検索ができるようなものであればよい。
検索式により検索を行い、上位n個分の検索結果を検索
結果記憶部24に記憶(キャッシング)するとともに、
利用者Aには上位m個(m<n)分の検索結果を返答し
たとする。
の検索部が検索式Sに基づいて第2の検索アルゴリズム
によって検索を行った場合、やはり上位n個分の検索結
果を検索結果記憶部24にキャッシングしておく。ただ
し、この場合、先のn個分の検索結果を削除しない。な
ぜならば、利用者Aが(m+1)番目以降の検索結果を
見ることを欲した場合に、第1のアルゴリズムによる上
位m個の検索結果と第2の検索アルゴリズムによる(m
+1)番目以降の検索結果とは、無関係だからである。
このような事態を回避するために、WWWの場合には、
cookieやFat URL を用いて利用者を同定し、利用者Aに
ついては、第1の検索アルゴリズムの検索結果の(m+
1)番目以降を提示するようにする。この場合、古い検
索結果のキャッシングは時間を決めておき、一定時間以
上経過した場合には削除するようにする。
増えた場合には、データベース4が更新される。さら
に、場合によっては、既に検索して保持している検索結
果に影響を与えることもある。例えば、「パソコン」と
いう語での検索結果があった場合に、「パソコン」とい
う語を含む文書をデータベース4に加える場合には、
「パソコン」という語で行った検索に対する検索結果を
捨てる必要がある。
す場合には、その増やすものが、既に蓄えられている検
索式に合致するかどうかを調べ、合致するならば、その
検索結果を棄却するようにする。
する。ある情報をデータベース4から取り除く場合に
は、その情報が検索結果として含まれて保存されている
ものの中に入っている場合に、その検索結果を破棄す
る。
は、再び検索される可能性が高いので、検索エンジンの
負荷が軽いときに検索を予め実行しておく。このときの
検索式評価の優先順位には、第1の実施形態で述べたよ
うに、最も最近検索された検索式や最も検索要求が多か
った検索式の順とすることもできる。
ては、説明を簡便にするために、検索アルゴリズムにつ
いて、第1 および第2 の2 種類であるとしたが、特にこ
れにこだわるものではなく、複数種類の検索アルゴリズ
ムを用いるようにしてもよい。すなわち、第2 の検索ア
ルゴリズムを適用した後にも、計算機にアイドルタイム
があるならば、第2の検索アルゴリズムよりも更に精緻
な第3 のアルゴリズムで検索を行うようにしてもよい。
これを繰り返すことにより、任意段の精緻な検索アルゴ
リズムを適用することができる。
便にするために、テキストベースで書いたが、これに限
定されるものではなく、例えば、マルチメディアデータ
に対して適用することも可能である。すなわち、画像の
粗い検索アルゴリズムでは、縮小画像や解像度の低いも
のでヒストグラム程度のマッチングのみを行なうが、精
緻な検索アルゴリズムでは高解像度で高度なパターンマ
ッチングを行なうようにしてもよい。
合でも、必要以上にレスポンス時間が長くなるという事
態を回避することができるとともに、すでに検索されて
いる場合には、さらに質の高い検索結果を高速に得るこ
とができるようになる。
の構成の一例を示す図。
図。
一例を示す図。
するための図。
図。
するための図。
図。
Claims (6)
- 【請求項1】 被検索対象である Web ページに係るデー
タベースに蓄積された情報について、不特定の利用者か
らネットワークに接続された端末を介してサーバに与え
られる検索要求に含まれる検索式に基づいて、前記サー
バの第1の検索部において第1の検索アルゴリズムにて
第1の検索を行うステップと、このステップにより得ら
れる検索結果が前記サーバの検索結果記憶部に記憶され
ている場合で、かつ、システムの負荷が所定の閾値より
も小さい場合に、前記検索式に基づいて、前記サーバの
第2の検索部において前記第1の検索アルゴリズムより
も検索精度の高い第2の検索アルゴリズムにて第2の検
索を行うステップとを有することを特徴とする検索方
法。 - 【請求項2】 前記第1の検索又は前記第2の検索を行
うことにより得られる検索結果が前記検索結果記憶部に
記憶されている場合に、前記サーバの検索結果検索部で
行なわれた検索の結果について、前記検索式を前記利用
者からの検索要求が含んでいる場合は、前記サーバの検
索結果回答部から前記検索結果を出力することを特徴と
する請求項1記載の検索方法。 - 【請求項3】 被検索対象である Web ページに係るデー
タベースに蓄積された情報について、不特定の利用者か
らネットワークに接続された端末を介してサーバに与え
られるとともに検索要求に含まれる検索式に基づいて、
前記サーバの第1の検索部において第1の検索アルゴリ
ズムにて第1の検索を行うステップと、このステップに
より得られる検索結果が、前記サーバの検索結果記憶部
に記憶されている場合、かつ、システムの負荷が所定の
閾値よりも小さい場合に、前記検索結果が前記第1の検
索部において前記第1の検索を行うことにより得られた
ものであり、かつ、前記サーバの第2の検索部において
第2の検索を行っていないと前記サーバの検索種別決定
部で判断される場合には、前記検索式に基づき前記第2
の検索部において前記第1の検索アルゴリズムよりも検
索精度の高い第2の検索アルゴリズムにて前記第2の検
索を行うステップとを有することを特徴とする検索方
法。 - 【請求項4】 検索対象となる前記 Web ページが増えて
前記データベースに蓄積された情報の更新を行う場合
に、この更新される情報に係る検索式が、既に前記検索
結果記憶部に蓄えられている検索式に合致するならば、
その検索結果を棄却するようにすることを特徴とする請
求項1または3記載の検索方法。 - 【請求項5】 被検索対象である Web ページに係るデー
タベースに蓄積された情報について、不特定の利用者か
らネットワークに接続された端末を介してサーバに与え
られる検索要求を受け付ける要求受付手段と、前記要求
受付手段により検索要求を受け付けた場合には、前記検
索要求に含まれる検索式に基づいて、第1の検索アルゴ
リズムにて第1の検索を行う第1の検索手段と、前記第
1の検索手段により得られる第1の検索結果を記憶する
検索結果記憶手段と、前記要求受付手段により検索要求
を受け付けていない場合、かつ、システムの負荷が所定
の閾値よりも小さい場合には、前記検索式に基づいて、
前記第1の検索アルゴリズムよりも検索精度の高い第2
の検索アルゴリズムにて第2の検索を行う第2の検索手
段とからなることを特徴とする検索装置。 - 【請求項6】 検索要求に基づいて検索を行うためのプ
ログラムを記録したコンピュータ読み取り可能な記録媒
体であって、不特定の利用者からの検索要求を受け付け
た場合に、この検索要求に含まれる検索式に基づいて、
前記コンピュータの第1の検索部で、第1の検索アルゴ
リズムにて第1の検索を行わせる機能と、この機能によ
り得られる第1の検索結果を前記コンピュータの検索結
果記憶部に記憶させる機能と、検索要求を受け付けてい
ない場合、かつ、システムの負荷が所定の閾値よりも小
さい場合に、前記検索式に基づいて、前記コンピュータ
の第2の検索部で、前記第1の検索アルゴリズムよりも
検索精度の高い第2の検索アルゴリズムにて第2の検索
を行わせる機能とからなるプログラムを記録したコンピ
ュータ読み取り可能な記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26117697A JP3521176B2 (ja) | 1997-09-26 | 1997-09-26 | 検索方法および検索装置 |
US09/156,869 US6385605B1 (en) | 1997-09-26 | 1998-09-18 | Information retrieval apparatus and a method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26117697A JP3521176B2 (ja) | 1997-09-26 | 1997-09-26 | 検索方法および検索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11102366A JPH11102366A (ja) | 1999-04-13 |
JP3521176B2 true JP3521176B2 (ja) | 2004-04-19 |
Family
ID=17358192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26117697A Expired - Fee Related JP3521176B2 (ja) | 1997-09-26 | 1997-09-26 | 検索方法および検索装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6385605B1 (ja) |
JP (1) | JP3521176B2 (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001101186A (ja) * | 1999-09-30 | 2001-04-13 | Oki Electric Ind Co Ltd | 機械翻訳装置 |
JP2001159998A (ja) * | 1999-12-03 | 2001-06-12 | Nec Corp | Webコンテンツキャッシュシステム及び方法並びに記録媒体 |
US6611834B1 (en) * | 2000-01-12 | 2003-08-26 | International Business Machines Corporation | Customization of information retrieval through user-supplied code |
JP4155382B2 (ja) * | 2001-01-25 | 2008-09-24 | 富士通株式会社 | パターン検索方法、パターン検索装置、パターン検索プログラムを記録したコンピュータ読み取り可能な記録媒体、パターン検索システムおよびパターン検索プログラム |
JP3953282B2 (ja) * | 2001-02-27 | 2007-08-08 | 株式会社藤商事 | 遊技機の故障診断システム |
US6754346B2 (en) | 2002-07-31 | 2004-06-22 | Steven P. Eiserling | Method for tracing the distribution of physical digital media |
JP4120888B2 (ja) * | 2004-01-30 | 2008-07-16 | 日本電気株式会社 | データ検索装置及び方法 |
US20060167842A1 (en) * | 2005-01-25 | 2006-07-27 | Microsoft Corporation | System and method for query refinement |
JP4562719B2 (ja) * | 2006-11-20 | 2010-10-13 | 株式会社藤商事 | 故障診断システム |
JP4988441B2 (ja) * | 2007-06-14 | 2012-08-01 | 富士通株式会社 | 検索プログラム、検索方法および検索装置 |
JP5246234B2 (ja) * | 2010-09-29 | 2013-07-24 | ブラザー工業株式会社 | 検索装置 |
CN102479207B (zh) * | 2010-11-29 | 2013-07-03 | 阿里巴巴集团控股有限公司 | 一种信息搜索的方法、系统及信息搜索设备 |
US20130054558A1 (en) * | 2011-08-29 | 2013-02-28 | Microsoft Corporation | Updated information provisioning |
US20130110804A1 (en) * | 2011-10-31 | 2013-05-02 | Elwha LLC, a limited liability company of the State of Delaware | Context-sensitive query enrichment |
CN103593419B (zh) * | 2013-10-30 | 2018-03-09 | 华为技术有限公司 | 数据查询方法、装置、服务器及系统 |
US20170147652A1 (en) * | 2015-11-19 | 2017-05-25 | Institute For Information Industry | Search servers, end devices, and search methods for use in a distributed network |
JP6695310B2 (ja) * | 2017-08-09 | 2020-05-20 | 繁巳 松本 | 医療支援システム及び医療支援プログラム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04326163A (ja) | 1991-04-25 | 1992-11-16 | Hitachi Ltd | 記憶装置の制御装置 |
JPH06139291A (ja) * | 1992-10-30 | 1994-05-20 | Hitachi Ltd | 情報検索方法およびシステム |
JPH06203076A (ja) * | 1993-01-06 | 1994-07-22 | Hitachi Ltd | 情報検索方法 |
JPH06251063A (ja) * | 1993-02-26 | 1994-09-09 | Fujitsu Ltd | 検索結果保持方法 |
US5860009A (en) * | 1994-04-28 | 1999-01-12 | Kabushiki Kaisha Toshiba | Programming method for concurrent programs and program supporting apparatus thereof |
US5717914A (en) * | 1995-09-15 | 1998-02-10 | Infonautics Corporation | Method for categorizing documents into subjects using relevance normalization for documents retrieved from an information retrieval system in response to a query |
US5737734A (en) * | 1995-09-15 | 1998-04-07 | Infonautics Corporation | Query word relevance adjustment in a search of an information retrieval system |
US5640553A (en) * | 1995-09-15 | 1997-06-17 | Infonautics Corporation | Relevance normalization for documents retrieved from an information retrieval system in response to a query |
JPH1049549A (ja) * | 1996-05-29 | 1998-02-20 | Matsushita Electric Ind Co Ltd | 文書検索装置 |
US5802518A (en) * | 1996-06-04 | 1998-09-01 | Multex Systems, Inc. | Information delivery system and method |
JP4025379B2 (ja) * | 1996-09-17 | 2007-12-19 | 株式会社ニューズウオッチ | 検索システム |
JP3499105B2 (ja) * | 1997-03-03 | 2004-02-23 | 株式会社東芝 | 情報検索方法および情報検索装置 |
US5926807A (en) * | 1997-05-08 | 1999-07-20 | Microsoft Corporation | Method and system for effectively representing query results in a limited amount of memory |
US6067539A (en) * | 1998-03-02 | 2000-05-23 | Vigil, Inc. | Intelligent information retrieval system |
-
1997
- 1997-09-26 JP JP26117697A patent/JP3521176B2/ja not_active Expired - Fee Related
-
1998
- 1998-09-18 US US09/156,869 patent/US6385605B1/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH11102366A (ja) | 1999-04-13 |
US6385605B1 (en) | 2002-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3521176B2 (ja) | 検索方法および検索装置 | |
US8782032B2 (en) | Minimizing visibility of stale content in web searching including revising web crawl intervals of documents | |
KR100974906B1 (ko) | 위치와 관련하여 신뢰성 있는 문서를 식별하는 시스템 및 방법 | |
KR101700352B1 (ko) | 이력적 검색 결과들을 사용한 향상된 문서 분류 데이터 생성 | |
JP4837040B2 (ja) | ブログ文書のランク付け | |
US9684720B2 (en) | Lateral search | |
US8631026B1 (en) | Methods and systems for efficient query rewriting | |
US6754873B1 (en) | Techniques for finding related hyperlinked documents using link-based analysis | |
US7996397B2 (en) | Using network traffic logs for search enhancement | |
US8515952B2 (en) | Systems and methods for determining document freshness | |
US20050278314A1 (en) | Variable length snippet generation | |
US7966341B2 (en) | Estimating the date relevance of a query from query logs | |
US20020123988A1 (en) | Methods and apparatus for employing usage statistics in document retrieval | |
US8176056B1 (en) | Determining quality of linked documents | |
US10691765B1 (en) | Personalized search results | |
CN108304444A (zh) | 信息查询方法及装置 | |
US8171228B2 (en) | Garbage collection in a cache with reduced complexity | |
WO2008133368A1 (en) | Information search ranking system and method based on users' attention levels | |
CN110968765A (zh) | 书籍搜索方法、计算设备及计算机存储介质 | |
US8713071B1 (en) | Detecting mirrors on the web | |
Bhushan et al. | Recommendation of optimized web pages to users using Web Log mining techniques | |
CN108984582B (zh) | 一种查询请求处理方法 | |
KR20190129474A (ko) | 데이터 검색 장치 및 방법 | |
JP2001337973A (ja) | 検索システムのメンテナンス方法及び検索システム | |
CN111460307B (zh) | 一种移动终端精确搜索方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20040107 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040130 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040202 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090213 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090213 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100213 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110213 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110213 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120213 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |