JP2007058782A - 情報検索装置および情報検索方法 - Google Patents

情報検索装置および情報検索方法 Download PDF

Info

Publication number
JP2007058782A
JP2007058782A JP2005246421A JP2005246421A JP2007058782A JP 2007058782 A JP2007058782 A JP 2007058782A JP 2005246421 A JP2005246421 A JP 2005246421A JP 2005246421 A JP2005246421 A JP 2005246421A JP 2007058782 A JP2007058782 A JP 2007058782A
Authority
JP
Japan
Prior art keywords
search
information
category
index
target information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005246421A
Other languages
English (en)
Other versions
JP4756953B2 (ja
Inventor
Kazunori Kashima
一紀 鹿島
Toshimitsu Suzuki
利光 鈴木
Toshiyuki Fujiwara
俊行 藤原
Soji Shimoda
聡司 下田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ACCELA TECHNOLOGY CORP
Fujitsu Ltd
Original Assignee
ACCELA TECHNOLOGY CORP
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ACCELA TECHNOLOGY CORP, Fujitsu Ltd filed Critical ACCELA TECHNOLOGY CORP
Priority to JP2005246421A priority Critical patent/JP4756953B2/ja
Priority to US11/298,512 priority patent/US7653623B2/en
Publication of JP2007058782A publication Critical patent/JP2007058782A/ja
Application granted granted Critical
Publication of JP4756953B2 publication Critical patent/JP4756953B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】複数の検索用語が複数の情報に分散して存在する場合であっても、漏れの無い検索結果を得ることができるようにする。
【解決手段】 検索要求が入力されると、インデックス記憶手段1aからインデックスが検索され、検索結果候補が抽出される。次に、分類基準に従って、検索結果候補が属するカテゴリが判断される。すると、検索結果候補が属するカテゴリ内において、検索結果候補よりも階層的に上位に位置する他の検索対象情報から、検索用語が検索される。検索用語が検出された検索対象情報に対応するカテゴリの表示優先度は、他よりも高く設定される。そして、カテゴリ表示順決定手段で決定した表示優先度の高い順に並べ替えられた位置情報のリストがクライアント2に送信される。
【選択図】 図1

Description

本発明は情報を検索するための情報検索装置および情報検索方法に関し、特に階層的に配置された情報を検索するための情報検索装置および情報検索方法に関する。
インターネットのような膨大な量の文書にアクセス可能なネットワークでは、ユーザが必要とする文書を検索するための検索機能が必要となる。そこで、ポータルサイトなどのサーバには、Web検索用のアプリケーションソフトウェアが実装されている。このアプリケーションソフトウェアをサーバが実行することで検索機能(検索エンジン)が実現される。
ロボット型と呼ばれる検索エンジンは、ネットワーク上で自由にアクセス可能な文書を常に収集している。この検索エンジンは、収集した文書から、その文書の内容を表すキーワードを抽出し、キーワードリストを含むインデックスを生成する。
その後、クライアントから検索要求が送られると、検索エンジンは、検索要求に含まれる検索用語に合致するキーワードをインデックスから検索する。そして、検索エンジンは、検出されたインデックスに対応するURL(Uniform Resource Locator)等の情報をクライアントに送信する。
ところで、Webサイトで公開されている情報は、複数のHTML(Hyper Text Markup Language)文書で構成されることがある。そのような情報に対して検索を行う場合、検索対象となるWebサイト内の個々のHTMLを検索対象として検索が行われる。
図24は、従来の検索技術を示す図である。図24に示すように、予め作成されたインデックス91a,91b,91cがインデックス記憶部91に格納されている。図示された3つのインデックス91a,91b,91cは、それぞれA.html、B.html、C.htmlというURLに関連づけられている。
この例では、ユーザがF通株式会社の役員リストを探しているものとする。F通株式会社のWebサイトには、「F通」という用語がA.htmlに含まれ、「役員」という用語がC.htmlに含まれている。
このとき、ユーザが「F通」、「役員」という用語の論理積(AND)検索を、検索条件として指定すると、検索エンジン92は、インデックス91a,91b,91cの中から「F通」と「役員」との両方を含むものを探す。すなわち、全て検索用語を含む文書しか検出されない。この例では、F通株式会社のWebサイトの中から、検索条件に合った文書を見つけ出すことができない。
しかも、A.htmlとC.htmlとが元々は1つの文書であっても、Webシステム側の管理上の都合で分割して格納される場合もある。この場合でも、検索がヒットせず、利用者は、必要な情報を取得することができないという不都合が生じる。
なお、検索サイト側で検索対象文書を統合し、本統合文書を対象としたインデックスを生成すれば検索漏れは発生しない。ところが、A.htmlとC.htmlとの内容を1つの文書に統合した場合、巨大な文書ファイルとなりがちで、表示、検索スピードなどに遅延が生じ、利用しづらくなってしまう。そのため、検索対象文書の統合は現実的ではない。
また、検索漏れを防ぐために、「F通株式会社」と「役員リスト」との何れか一方を検索用語とした場合、不要な検索結果が大量に検出されてしまう。そこで、検索結果の絞り込み技術が有用となる。
絞り込み技術の一例として、ドメイン制約検索がある。ドメイン制約検索では、検索対象となるドメイン名を指定することができる。ドメイン名が指定された場合、検索エンジンは、指定されたドメイン内の文書のみを検索対象とする。例えば、F通株式会社のWebサイトのドメイン名が分かっていれば、そのドメイン内のみを検索対象として「役員リスト」という検索用語による検索を行うことで、検索結果としてC.htmlを得ることができる(非特許文献1参照)。
"検索方法とヘルプ"、[online]、[平成17年8月9日検索]、インターネット<http://www.google.co.jp/intl/ja/help/refinesearch.html>
しかし、非特許文献1で示したようなドメイン制約検索を利用できるのは、対象となるドメイン名が明らかな場合に限られる。しかも、検索技術について詳しく知らないユーザは、ドメイン制約検索等の絞り込み方法の存在を知らない場合が多い。そのようなユーザは、検索用語の追加、変更等を行い目的の情報を探すこととなる。その場合、1つの文書内に目的の検索用語が含まれていない限り、その文書がヒットすることはない。
なお、サイト毎に、任意のキーワードを付与することも可能であるが、インターネットの全てのサイトに対して実施すると、作業量が膨大となる。そのため、検索エンジンの運用者の管理負荷が過大となってしまう。
本発明はこのような点に鑑みてなされたものであり、複数の検索用語が複数の情報に分散して存在する場合であっても、漏れの無い検索結果を容易に得ることができる情報検索装置および情報検索方法を提供することを目的とする。
本発明では上記課題を解決するために、図1に示すような情報検索装置1が提供される。本発明に係る情報検索装置1は、階層的に配置された検索対象情報を検索するためのものである。この情報検索装置1は、以下のような処理機能を有している。
インデックス記憶手段1aは、検索対象情報の所在を示す位置情報に関連づけて、検索対象情報から抽出されたキーワードを含む検索対象情報毎のインデックスを記憶する。第1の検索手段1bは、クライアント2から複数の検索用語を含む検索要求が入力されると、少なくとも1つの検索用語を含むインデックスを、インデックス記憶手段1aから検索し、検出されたインデックスに対応する検索対象情報を、検索結果候補とする。カテゴリ判断手段1cは、検索対象情報が属するカテゴリの分類基準が予め定義されており、分類基準に従って検索結果候補が属するカテゴリを判断する。第2の検索手段1dは、検索結果候補が属するカテゴリ内において検索結果候補よりも階層的に上位に位置する他の検索対象情報から、検索用語を検索する。カテゴリ表示順決定手段1eは、第2の検索手段1dにより検索用語が検出された検索対象情報に対応するカテゴリの表示優先度を他よりも高く設定する。検索結果送信手段1fは、検索結果候補それぞれの位置情報をインデックス記憶手段1aから取得し、取得した位置情報の属するカテゴリに基づき、カテゴリ表示順決定手段1eで決定した表示優先度の高い順に位置情報を並べ替え、並べ替えられた位置情報のリストをクライアント2に送信する。
このような情報検索装置1によれば、検索要求が入力されると、第1の検索手段1bにより、少なくとも1つの検索用語を含むインデックスが、インデックス記憶手段1aから検索され、検出されたインデックスに対応する検索対象情報が検索結果候補となる。次に、カテゴリ判断手段1cにより、分類基準に従って検索結果候補が属するカテゴリが判断される。すると、第2の検索手段1dにより、検索結果候補が属するカテゴリ内において検索結果候補よりも階層的に上位に位置する他の検索対象情報から、検索用語が検索される。さらに、カテゴリ表示順決定手段1eにより、検索用語が検出された検索対象情報に対応するカテゴリの表示優先度が他よりも高く設定される。そして、検索結果送信手段1fにより、検索結果候補それぞれの位置情報がインデックス記憶手段1aから取得され、取得した位置情報の属するカテゴリに基づき、カテゴリ表示順決定手段1eで決定した表示優先度の高い順に位置情報が並べ替えられ、並べ替えられた位置情報のリストがクライアント2に送信される。
また、上記課題を解決するために、コンピュータの演算処理により、階層的に配置された検索対象情報を検索するための情報検索方法において、前記検索対象情報の所在を示す位置情報に関連づけて、前記検索対象情報から抽出されたキーワードを含む前記検索対象情報毎のインデックスを、インデックス記憶手段に記憶させ、クライアントから複数の検索用語を含む検索要求が入力されると、少なくとも1つの前記検索用語を含む前記インデックスを、前記インデックス記憶手段から検索し、検出された前記インデックスに対応する前記検索対象情報を、検索結果候補とし、前記検索対象情報が属するカテゴリの分類基準が予め定義されており、前記分類基準に従って前記検索結果候補が属するカテゴリを判断し、前記検索結果候補が属する前記カテゴリ内において前記検索結果候補よりも階層的に上位に位置する他の前記検索対象情報から、前記検索用語を検索し、前記検索用語が検出された前記検索対象情報に対応する前記カテゴリの表示優先度を他よりも高く設定し、前記検索結果候補それぞれの前記位置情報を前記インデックス記憶手段から取得し、取得した前記位置情報の属する前記カテゴリに基づき、表示優先度の高い順に前記位置情報を並べ替え、並べ替えられた前記位置情報のリストを前記クライアントに送信する、ことを特徴とする情報検索方法が提供される。
このような情報検索方法によれば、検索要求が入力されると、少なくとも1つの検索用語を含むインデックスが、インデックス記憶手段1aから検索され、検出されたインデックスに対応する検索対象情報が検索結果候補となる。次に、分類基準に従って検索結果候補が属するカテゴリが判断される。すると、検索結果候補が属するカテゴリ内において検索結果候補よりも階層的に上位に位置する他の検索対象情報から、検索用語が検索される。さらに、検索用語が検出された検索対象情報に対応するカテゴリの表示優先度が他よりも高く設定され、カテゴリ間の表示優先順が決定される。そして、検索結果候補それぞれの位置情報がインデックス記憶手段1aから取得され、取得した位置情報の属するカテゴリに基づき、表示優先度の高い順に位置情報が並べ替えられ、並べ替えられた位置情報のリストがクライアント2に送信される。
本発明では、検索用語を含む検索結果候補をカテゴリに分類し、カテゴリ内の上位の階層の検索対象情報に検索用語が含まれた場合、表示優先度を高く設定するようにした。これにより、検索結果候補に検索用語の一部しか含まれていない場合でも、同一階層の上位の検索対象情報に検索用語が含まれていれば、その検索結果候補を含むカテゴリの表示優先度が上がり、検索結果の上位に表示される。その結果、検索用語が複数の情報に分散して存在する場合であっても、該当情報を検索結果として抽出することが可能となる。
以下、本発明の実施の形態を図面を参照して説明する。
図1は、本実施の形態の概略を示す図である。本実施の形態は、公開Webサイトなどを対象とした情報検索を行う際に、検索対象となる検索先の管理フォルダ(ディレクトリ)が、分割して配置してあっても、検索漏れを回避した検索結果を抽出するようにしたものである。そのために、情報検索装置1は、インデックス記憶手段1a、第1の検索手段1b、カテゴリ判断手段1c、第2の検索手段1d、カテゴリ表示順決定手段1e、および検索結果送信手段1fを有している。
インデックス記憶手段1aは、検索対象情報の所在を示す位置情報に関連づけて、検索対象情報から抽出されたキーワードを含む検索対象情報毎のインデックスを記憶する。例えば、Webサイトで公開された文書を検索対象情報とする場合、WWW上の文書等を周期的に取得するインデックス作成手段が、公開された文書からキーワードを抽出し、インデックスを作成する。
第1の検索手段1bは、クライアント2から複数の検索用語を含む検索要求が入力されると、少なくとも1つの検索用語を含むインデックスを、インデックス記憶手段1aから検索し、検出されたインデックスに対応する検索対象情報を検索結果候補とする。
カテゴリ判断手段1cは、検索対象情報が属するカテゴリの分類基準が予め定義されており、分類基準に従って検索結果候補が属するカテゴリを判断する。例えば、検索結果候補が存在するドメイン別で、カテゴリが分けられる。
第2の検索手段1dは、検索結果候補が属するカテゴリ内において、検索結果候補よりも階層的に上位に位置する他の検索対象情報から、検索用語を検索する。例えば、検索結果候補と同一カテゴリ内の最上位のディレクトリ直下の検索対象情報の検索が行われる。
なお、第2の検索手段1dは、検索対象情報内に任意に設定されているキーワードのみを検索対象とすることができる。Webサイトの管理者がサイトの上位の文書に任意に設定したキーワードは、そのWebサイト内の全ての文書に共通の特徴を表している可能性が高いためである。
カテゴリ表示順決定手段1eは、第2の検索手段1dにより検出された検索対象情報に対応するカテゴリの表示優先度を他よりも高く設定する。例えば、第2の検索手段1dにより検出された検索用語の種別数が多いほど、カテゴリ間の表示優先度が高く設定される。
なお、第2の検索手段1dによる検索結果以外の条件が、表示優先順の決定に反映される場合もある。その場合、第2の検索手段1dによる検索結果以外の条件が同一であれば、第2の検索手段1dにより検出された検索対象情報に対応するカテゴリの方が、それ以外のカテゴリより表示優先度が高くなる。
検索結果送信手段1fは、検索結果候補それぞれの位置情報をインデックス記憶手段1aから取得し、取得した位置情報の属するカテゴリに基づき、カテゴリ表示順決定手段で決定した表示優先度の高い順に位置情報を並べ替える。そして、検索結果送信手段1fは、並べ替えられた位置情報のリストをクライアント2に送信する。例えば、検索結果候補がカテゴリ毎に纏められ、優先順の高いカテゴリを上位に配置した画面データ(例えば、HTML文書)が作成され、クライアント2に送信される。
このような情報検索装置1によれば、検索要求が入力されると、第1の検索手段1bにより、少なくとも1つの検索用語を含むインデックスが、インデックス記憶手段1aから検索され、検出されたインデックスに対応する検索対象情報が検索結果候補となる。次に、カテゴリ判断手段1cにより、分類基準に従って検索結果候補が属するカテゴリが判断される。
すると、第2の検索手段1dにより、検索結果候補が属するカテゴリ内において検索結果候補よりも階層的に上位に位置する他の検索対象情報から、少なくとも1つの検索用語を含む検索対象情報が検索される。さらに、カテゴリ表示順決定手段1eにより、検索用語が検出された検索対象情報に対応するカテゴリの表示優先度を他よりも高く設定される。
そして、検索結果送信手段1fにより、検索結果候補それぞれの位置情報がインデックス記憶手段1aから取得され、取得した位置情報の属するカテゴリに基づき、カテゴリ表示順決定手段で決定した表示優先度の高い順に位置情報が並べ替えられる。そして、並べ替えられた位置情報のリストがクライアント2に送信される。
その結果、クライアント2には、例えば、カテゴリ毎に分類された検索結果画面2aが表示される。検索結果画面2aには、カテゴリ表示順決定手段1eによって上位に配置されたカテゴリに属する文書のURL等が画面内の上方に表示される。
このようにして、検索対象の文書を物理的にWebサイト側で統合することなく、事実上カテゴライズされた単位毎に検索結果を統合して表示することができる。その結果、複数の検索用語のうちの一部しか含まれていないが、ユーザの検索目的に合致する情報の検索漏れが防止できる。
例えば、F通株式会社の役員名をWebサイトから検索する場合を想定する。なお、通常「株式会社」の文字は省略され、単に「F通」と称される。このとき、F通のWebサイト内のHTML文書に役員名は記載されているが、役員名が記載されている文書に、F通というキーワードが無いものとする。実際、HTMLの画面構成がフレームで分割されている場合がある。その場合、フレーム内の情報毎にHTML文書が作成されるため、Webサイト全体に共通の情報は、役員名等の詳細情報を示す文書内に含まれないことが多い。
この場合、ユーザが「役員」かつ「F通」でAND検索したとき、従来の検索方式では、F通本社のWebサイトが検索結果として上位に表示されない場合が多い(この例の場合は、F通の関連会社のプレスリリースなどが検索結果の上位に表示される)。そのため、ユーザは、F通本社のWebサイト内の役員が掲載された文書になかなかたどりつけない。
実際にはF通のWebサイト内のHTML文書に役員名は記載されているが、役員名が記載されている文書に、F通というキーワードが無い場合、検索結果としても表示されず、利用者は、あたかも検索漏れが発生しているように感じる。
一方、図1に示した情報検索装置では、F通本社内のサイトを1つのカテゴリとし、F通サイト内の上位の情報のインデックスに再度検索することで、個々のHTML文書に「F通」という用語が入っていなくても、同一サイト内の情報が自動的にソートされて対象となる検索結果を表示することができる。
しかも、本実施の形態の情報検索装置では、分割された検索対象の文書であっても、カテゴリ単位に統合された検索結果の一括表示が極めて容易に得られる。すなわち、1つのWebサイト上で全ての情報を統合することは困難であるため、検索装置側で、Webサイト上の全ての文書を1つの文書と見なし、検索結果では同一カテゴリの文書を纏めて表示することができる。
このように、1つのWebサイトを1つのカテゴリとした場合、同一サイト内の各文書に関しても、検索条件への適合度合いに応じてソートして表示することで、ユーザが探している文書を容易に見つけ出すことができる。
次に、本実施の形態の詳細を説明する。
図2は、本実施の形態のシステム構成例を示す図である。インターネット10には、ポータルサイトサーバ100、複数のクライアント21,22,・・・、コンテンツサーバ31,32,・・・が接続されている。
ポータルサイトサーバ100は、インターネット10上の情報閲覧の利便性を向上させるための各種サービスを提供するコンピュータである。ポータルサイトサーバ100で提供されるサービスの1つとして、インターネット10上の情報検索サービスがある。
クライアント21,22,・・・は、ユーザがインターネット10上の文書を閲覧する際に使用するコンピュータである。クライアント21,22,・・・には、Webブラウザが実装されている。
コンテンツサーバ31,32,・・・は、インターネット10を介して文書を提供するコンピュータである。コンテンツサーバ31,32,・・・には、Webサーバアプリケーション(以下、「Webサーバ」と呼ぶ)が実装されている。
図3は、本実施の形態に用いるポータルサイトサーバのハードウェア構成例を示す図である。ポータルサイトサーバ100は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101には、バス107を介してRAM(Random Access Memory)102、ハードディスクドライブ(HDD:Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105、および通信インタフェース106が接続されている。
RAM102には、CPU101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に必要な各種データが格納される。HDD103には、OSやアプリケーションプログラムが格納される。
グラフィック処理装置104には、モニタ11が接続されている。グラフィック処理装置104は、CPU101からの命令に従って、画像をモニタ11の画面に表示させる。入力インタフェース105には、キーボード12とマウス13とが接続されている。入力インタフェース105は、キーボード12やマウス13から送られてくる信号を、バス107を介してCPU101に送信する。
通信インタフェース106は、インターネット10に接続されている。通信インタフェース106は、インターネット10を介して、他のコンピュータとの間でデータの送受信を行う。
以上のようなハードウェア構成によって、本実施の形態の処理機能を実現することができる。なお、図3には、ポータルサイトサーバ100のハードウェア構成例を示したが、クライアント21,22,・・・やコンテンツサーバ31,32,・・・も同様のハードウェアで実現することができる。
図4は、ポータルサイトサーバの機能を示すブロック図である。ポータルサイトサーバ100には、Webサーバ110、検索エンジン120、およびインデックス記憶部130が設けられている。
Webサーバ110は、クライアント21,22,・・・に対して、HTML等の文書を送信する。また、Webサーバ110は、クライアント21,22,・・・から検索要求が送られると、その検索要求を検索エンジン120に渡す。そして、Webサーバ110は、検索エンジン120から検索結果を受け取り、検索結果を含む文書をクライアント21,22,・・・に対して送信する。
検索エンジン120は、Webサーバ110経由でクライアント21,22,・・・からの検索要求を受け取ると、インターネット10上に公開されている文書の検索を行う。そして、検索エンジン120は、検索結果として、検索条件に応じた文書のURLをWebサーバ110に渡す。
検索エンジン120には、文書の検索を行うために、大別してインデックス作成部121と検索部122とを有している。
インデックス作成部121は、定期的に、インターネット10に接続されたコンテンツサーバ31,32,・・・から取得可能な文書を取得し、その文書に含まれるキーワードを抽出する。そして、インデックス作成部121は、取得した文書のURLと抽出したキーワードとを対応付けたインデックスを作成し、そのインデックスをインデックス記憶部130に格納する。
検索部122は、インデックス記憶部130を参照し、検索要求に応じた文書を検索する。次に、検索部122は、検索要求に含まれる検索用語を含む文書のURLを、検索要求に対する適合の度合いに応じて並べ替える。なお、並べ替えの際には、検索部122は、各文書が格納されたドメインの最上位の文書に含まれるキーワードを参照して、並べ替えの順番を決定する。そして、検索部122は、並べ替えられた文書のURL等の情報を、Webサーバ110に渡す。
次に、ポータルサイトサーバ100で実行される処理を詳細に説明する。まず、インデックス作成部121によるインデックス作成処理を説明する。
図5は、インデックス作成処理を示す図である。図5には、コンテンツサーバ31が有する記憶装置31aに格納されている文書31aa,31ab,31acからインデックスを作成する場面を示している。各文書31aa,31ab,31acの上に、その文書のファイル名が示されている。なお、図5では、文書31aa,31ab,31acのタイトル(ホーム、サポート情報等)の下の括弧内に、その文書の本文が示されている。また、ディレクト構造上、文書31ab,31acは、文書31aaの下位に位置するものとする。
インデックス作成部121は、コンテンツサーバ31から文書31aa,31ab,31acを取得し、それぞれのインデックス131,132,133を作成する。インデックス131,132,133には、各文書31aa,31ab,31acの本文に含まれるキーワードが設定される。そして、インデックス作成部121は、作成したインデックス131,132,133を、インデックス記憶部130に格納する。
次に、文書の検索処理について説明する。なお、検索処理の説明では、クライアント21からポータルサイトサーバ100に対して検索要求が出されたものとする。
図6は、検索処理全体の流れを示すフローチャートである。以下、図6に示す処理をステップ番号に沿って説明する。
[ステップS11]Webサーバ110は、クライアント21からの検索条件(検索用語等)の取得処理を行う。
[ステップS12]検索エンジン120は、検索処理を行う。
[ステップS13]Webサーバ110は、検索エンジン120による検索結果を、クライアント21の画面に表示させる。
以下、図6に示す各ステップの処理内容を詳細に説明する。
図7は、検索条件取得処理の手順を示すフローチャートである。以下、図7に示す処理をステップ番号に沿って説明する。
[ステップS21]Webサーバ110は、クライアント21から検索サイトを指定したアクセスがあると、検索画面データをクライアント21に対して送信する。これにより、クライアント21には、検索画面が表示される。
クライアント21を使用するユーザが検索画面上で検索用語を入力し、検索実行を示す操作入力を行うと、入力された検索用語を含む検索要求が、クライアント21からポータルサイトサーバ100に対して送信される。
[ステップS22]Webサーバ110は、クライアント21から送られた検索要求を取得する。そして、Webサーバ110は、取得した検索要求に含まれる検索用語を検索条件として検索エンジン120に渡す。
図8は、検索画面の例を示す図である。クライアント21に表示される検索画面21aには、検索用語入力部21aaと検索ボタン21abとが設けられている。検索用語入力部21aaは、ユーザが探している文書に含まれていると想定されるキーワードを入力するためのテキストボックスである。検索用語入力部21aaには、1つまたは複数の検索用語を入力することができる。
検索ボタン21abは、入力された検索用語に応じた文書の検索実行を指示するためのボタンである。検索ボタン21abが押されると、検索用語入力部21aaに入力された検索用語を含むAND検索の検索要求が、クライアント21からポータルサイトサーバ100に送信される。すると、ポータルサイトサーバ100において、検索要求に応じた検索処理が行われる。
次に、ポータルサイトサーバ100における検索処理を詳細に説明する。
図9は、検索処理の手順を示すフローチャートである。以下、図9に示す処理をステップ番号に沿って説明する。
[ステップS31]検索エンジン120内の検索部122は、第1の検索処理を行う。第1の検索処理は、カテゴライズサイト(ドメイン名でカテゴライズされた各カテゴリ)を抽出する処理である。
[ステップS32]検索部122は、第2の検索処理を行う。第2の検索処理は、カテゴリ間の表示順位を決定する処理である。
[ステップS33]検索部122は、第3の検索処理を行う。第3の検索処理は、カテゴリ内の表示順位を決定する処理である。
次に、各検索処理の詳細について説明する。
図10は、第1の検索処理の手順を示すフローチャートである。以下、図10に示す処理をステップ番号に沿って説明する。
[ステップS41]検索部122は、検索要求から検索用語を抽出する。
[ステップS42」検索部122は、RAM102上にヒットカウンタテーブルを生成し、検索用語をヒットカウンタテーブルに設定する。
[ステップS43]検索部122は、インデックス記憶部130内の各インデックス131,132,133,・・・を対象に、検索用語の検索を行う。なお、検索要求で指定されているのはAND検索であるが、このステップの検索では、検索用語の少なくとも1つを含む文書を検索する。すなわち、OR検索となる。また、1つの文書に同一の検索用語が複数含まれる場合、その検索用語の数もカウントする。
[ステップS44]検索部122は、検索の検索ヒット数をヒットカウンタテーブルに設定する。ここで、検索ヒット数とは、インデックスに含まれる検索用語の総数である。すなわち、含まれる検索用語の数が多いほど、優先順位が高くなる。
[ステップS45]検索部122は、ヒットしたURLの中の未選択のURLを、優先順位が高い順に1つ選択する。
[ステップS46]検索部122は、選択したURLをスラッシュ単位に分割して部分URLを生成し、部分URLをRAM102に格納する。例えばURLは「http://AAA/BBB/CCC.html」というように、ドメイン名「AAA」と各ディレクトリ名「BBB」,「CCC」とがスラッシュで区切られている。そこで、検索部122は、「http://AAA/BBB/CCC.html」というURLを、3つの部分URL(「http://AAA」、「BBB」、「CCC.html」)に分割する。
[ステップS47]検索部122は、先頭の分割URLをRAM102から抽出し、該当URLにアクセスする。例えば、ステップS46に示したURLの例では、最初に「http://AAA」に対するアクセスが行われる。この場合「AAA」はドメイン名を表しており、該当ドメインに対応するコンテンツサーバは、ドメイン名のみのアクセスの際に応答すべき所定の文書(例えば、「http://AAA/index.html」)を応答する。
なお、該当URLへの直接のアクセスに代えて、インデックス記憶部130に該当URLに対応するインデックスの有無を確認してもよい。インデックスが作成されていれば、インデックス作成部121によって該当URLにアクセスされていることが分かる。すなわち、該当URLに対してアクセス可能であることが分かる。
[ステップS48]検索部122は、該当URLにアクセス可能か否かを判断する。アクセス可能であれば、そのURLおよびその下位構造がカテゴライズサイトとして決定される。そして、処理がステップS50に進められる。アクセスできなれば、処理がステップS49に進められる。
[ステップS49]検索部122は、アクセス対象のURLの階層を1段下げて、そのURLにアクセスする。例えば、「http://AAA」に対するアクセスに失敗した場合、「http://AAA/BBB」に対してアクセスする。このように、上位のURLにアクセスできない場合、順次、下位のURLにアクセス対象が変更される。その後、処理がステップS48に進められる。
[ステップS50]検索部122は、ヒットしたURLの中に、ステップS45で未選択のURLがあるか否かを判断する。未選択のURLがあれば、処理がステップS45に進められる。未選択のURLが無ければ、第1の検索処理が終了する。
図11は、ヒットカウンタテーブルの例を示す図である。図11の例は、「F通」、「役員」、「一覧」、「社長」、「専務」、「会長」、および「副会長」を検索用語としたAND検索の検索要求に応じて作成されたヒットカウンタテーブル41である。ヒットカウンタテーブル41には、順位、ヒット先URL、複数の検索用語、および検索結果の欄が設けられている。図中、横方向に並べられた情報が互いに関連づけられており、1つのレコードを構成している。
順位の欄には、検索でヒットした各URLの優先順(値が小さいほど優先順が高い)が設定される。優先順の値は、検索結果の欄に設定されている値が大きいものから昇順で設定される。
ヒット先URLの欄には、第1の検索処理でヒットしたURLが設定される。検索用語の欄は、検索要求に含まれていた検索用語毎に設けられている。そして、検索用語の欄には、各URLに対応する文書に検索用語が含まれるか否かが設定される(検索用語が含まれる場合「1」、含まれない場合「0」)。
検索結果の欄には、各URLに対応する文書に含まれる検索用語の種別数が設定される。検索結果の欄の値は、同じレコード内の検索用語の欄の値を合計することで算出される。
なお、この例では、検索用語の全てを含む文書は検出されていない。すなわち、純粋に検索用語のAND検索を実行すると、該当する文書は検出されない。本実施の形態では、検索用語の少なくとも1つを含む文書であれば、その文書に対応する情報がヒットカウンタテーブル41に登録される。そして、ヒットカウンタテーブル41に登録された文書のURLに基づいて、その文書に応じたカテゴライズサイトが決定される。
例えば、図11に示したようなヒットカウンタテーブル41が生成されると、まず、優先順の高い(順位の欄の値が小さい)レコードから順にURLが抽出される。図11の例では、最初に「http://www.y.com/**/b.html」が抽出される。そして、抽出されたURLがスラッシュによって分割され、ドメイン名を表す部分URL「http://www.y.com」が抽出される。抽出された部分URLを指定したアクセスができなければ、順次、分割した部分URL(スラッシュに続くディレクトリ名)を追加し、アクセス可能な最も上位のURL(記述が最も短いURL)がカテゴライズサイトとして決定される。
同様に、次の優先順位のURL「http://www.z.com/**/f.html」に関しても、カテゴライズサイトが決定される。その後、第2の検索処理が実行される。
図12は、第2の検索処理を示すフローチャートである。以下、図12に示す処理をステップ番号に沿って説明する。
[ステップS61]検索部122は、カテゴライズサイトのヒット種別カウンタテーブルを作成する。ヒット種別カウンタテーブルには、ヒット先URL毎に生成されたカテゴライズサイトが、それぞれ1つずつのレコードとして登録される。
[ステップS62]検索部122は、ヒット種別カウンタテーブルに登録されているカテゴライズサイトの中から、ステップS63〜S65の処理が行われていないものを1つ選択する。
[ステップS63]検索部122は、選択したカテゴライズサイトの最上位の文書に任意に設定されたキーワードを検索対象として、検索要求に含まれる各検索用語の検索を行う。例えば、HTML文書では、<meta name="keywords" content="F通, F TSU, IT, コンピュータ, パソコン" />という記述によって、任意のキーワードが設定されている。
[ステップS64]検索部122は、カテゴライズサイトの最上位の文書に含まれていた検索用語に関し、ヒット種別カウンタテーブルに対してヒット種別として設定する。
[ステップS65]検索部122は、ヒット種別カウンタテーブルのヒット種別を合計する。
[ステップS66]検索部122は、未選択のカテゴライズサイトがあるか否かを判断する。未選択のカテゴライズサイトがあれば、処理がステップS62に進められる。全てのカテゴライズサイトが選択されていれば、第2の検索処理が終了する。
ここで、図11に示したヒットカウンタテーブル41の例を用いて、第2の検索処理を説明する。なお、「http://www.y.com/**/b.html」のカテゴライズサイトは「http://www.y.com」であり、「http://www.z.com/**/f.html」のカテゴライズサイトは「http://www.x.com」であるものとする。
また、「http://www.y.com」にアクセスしたときに表示される文書に任意に設定されたキーワードは、“NDC,NDC Corporation,N電気,N電,エヌディーシー,ネットワーク,ソリューション,電子デバイス,パソコン,ブロードバンド,モバイル,携帯電話,broadband,mobile”であり、「http://www.x.com」にアクセスしたときに表示される文書に任意に設定されたキーワードは“F通, F TSU, IT, コンピュータ, パソコン”である。
この場合、カテゴライズサイト「http://www.y.com」に含まれるキーワードから、「F通」、「役員」、「一覧」、「社長」、「専務」、「会長」、および「副会長」の検索用語を検索すると、ヒット件数が「0」となる。一方、同様の検索用語をカテゴライズサイト「http://www.z.com」に含まれるキーワードから検索すると、ヒット件数が「1」となる。
このようにして、カテゴライズサイトそれぞれに関し、最上位の文書から検索用語が検索され、その結果がヒット種別カウンタテーブルに設定される。
図13は、ヒット種別カウンタテーブルの例を示す図である。図13の例は、図11の示すヒット先URLに応じて生成されたカテゴライズサイトのヒット種別カウンタテーブル42である。ヒット種別カウンタテーブル42には、順位、カテゴライズサイト、複数の検索用語、およびヒット種別の合計の欄が設けられている。
順位の欄には、ヒット種別の合計に基づいて求められたカテゴライズサイトの優先順が設定される。カテゴライズサイトの欄には、ヒットURLに応じて決定されたカテゴライズサイトが設定される。検索用語の欄は、検索要求に含まれていた検索用語毎に設けられている。そして、検索用語の欄には、各カテゴライズサイトの最上位の文書に含まれる検索用語の有無が設定される(検索用語があれば「1」、無ければ「0」)。ヒット種別の合計の欄には、各カテゴライズサイトの最上位の文書に少なくとも1つ含まれる検索用語の合計が設定される。
このようにして、ヒット種別の合計に基づくカテゴライズサイトの優先順が決定される。その後、第3の検索処理が行われる。
図14は、第3の検索処理の手順を示すフローチャートである。以下、図14に示す処理をステップ番号に沿って説明する。
[ステップS71]検索部122は、ヒット種別カウンタテーブル42に設定されているカテゴライズサイトの中から、ステップS72〜S78の処理を実行していないものを1つ選択する。
[ステップS72]検索部122は、選択したカテゴライズサイトに対応するカテゴライズサイト別ヒットカウンタテーブルを作成する。
[ステップS73]検索部122は、選択したカテゴライズサイト内の各文書を検索対象として、検索用語のOR検索を行う。
[ステップS74]検索部122は、検索によるヒット数をカテゴライズサイト別ヒットカウンタテーブルに設定する。
[ステップS75]検索部122は、カテゴライズサイト内の文書毎に、検索用語がヒットした検索用語種別数を算出する。
[ステップS76]検索部122は、カテゴライズサイト内の文書毎に、検索用語がヒットした文書数の合計を算出する。
[ステップS77]検索部122は、検索用語毎に、ヒットした文書数を算出する。
[ステップS78]検索部122は、カテゴライズサイト内の優先順位を計算する。この実施の形態では、検索用語別ヒット件数に検索用語別のヒット文書数を乗算した値(希少度)に基づいて、優先順位を決定する。すなわち、希少度の値が小さいほど、該当検索用語を含む文書が希少となり、優先順位が高くなる。
[ステップS79]検索部122は、未選択のカテゴライズサイトがあるか否かを判断する。未選択のカテゴライズサイトがあれば処理がステップS71に進められる。全てのカテゴライズサイトが選択済であれば、第3の検索処理が終了する。
図15は、カテゴライズサイト別ヒットカウンタテーブルの例を示す図である。カテゴライズサイト別ヒットカウンタテーブル43には、順位、URL、複数の検索用語、およびヒット検索用語種別数の欄が設けられている。
順位の欄には、ヒット数の合計に基づいて求められたカテゴライズサイトの優先順が設定される。URLの欄には、カテゴライズサイト内の各文書に対応するURLが設定される。検索用語の欄は、検索要求に含まれていた検索用語毎に設けられている。そして、検索用語の欄には、各URLに対応する文書に含まれる検索用語の数(ヒット数)が設定される。ヒット検索用語種別数の欄には、ヒットした検索用語の種別数が設定される。
また、カテゴライズサイト別ヒットカウンタテーブル43には、検索用語毎に、検索用語別ヒット件数、検索用語別ヒット文書数、希少度、優先順位が設定されている。
カテゴライズサイト別ヒットカウンタテーブル43内のURLに対応する文書の情報を検索結果として表示する場合、ヒット検索用語種別数と希少度との値を用いて、並べ替えが行われる。具体的には、ヒット検索用語種別数の値が大きいものから順に文書が並べ替えられる。そして、ヒット検索用語種別数が同じ文書については、希少度優先順位の値が小さい検索用語を含む文書から順に並べ替えられる。
以上のような検索完了後、検索結果をクライアント21に表示させるための表示処理が行われる。
図16は、表示処理の手順を示すフローチャートである。以下、図16に示す処理をステップ番号に沿って説明する。
[ステップS81]検索部122は、第2の検索結果の優先順に基づいて、カテゴライズサイトの表示順を決定し、第3の検索結果の優先順に基づいて、カテゴライズサイト内の各文書の優先順を決定し、優先順に沿って文書の情報を並べた文書を生成する。そして、検索部122は、生成した文書をクライアント21に送信する。
[ステップS82]検索部122は、クライアント21から絞り込み指示が行われたか否かを判断する。絞り込み指示とは、カテゴライズサイトを表すURLを、下位構造のURLに変更する指示である。絞り込み指示が行われた場合、処理がステップS83に進められる。絞り込み選択が行われなければ、表示処理が終了する。
[ステップS83]検索部122は、絞り込み指示が行われた場合、絞り込み条件で示されたURLを、第1の検索処理のステップS47(図10参照)の先頭URLとした検索処理を実行する。
このような表示処理によって、検索結果を示す文書がクライアント21に送信されると、クライアント21のモニタに検索結果画面が表示される。
図17は、検索結果画面の例を示す図である。検索結果画面50には、第1の検索処理によって抽出されたカテゴライズサイト毎のカテゴライズサイト表示部51,52が設けられている。カテゴライズサイト表示部51,52は、第2の検索処理によって優先順位が先となったカテゴライズサイトが上に表示される。
また、各カテゴライズサイト表示部51,52内には、カテゴライズサイト内の文書へのリンクを含む文書リスト53,54が表示されている。文書リスト53,54は、第3の検索処理によって優先順位が先となった文書が上に表示される。
このようにして、文書を個別に検索したのでは検出できないか、もしくは表示順位が下位となる文書であっても、カテゴライズサイトの最上位の文書の内容に応じて上位に表示させることができる。その結果、従来の検索では見つけ出すことが困難な文書を、容易に見つけ出すことができる。
例えば、ユーザがF通株式会社の役員リストを探している場合を想定する。
図18は、役員リストを含む文書を示す図である。この文書61には、「役員」、「取締役」、「F TSU」等の文字が含まれているが、「F通」という文字は含まれていない。また、この文書は、F通株式会社を紹介するWebサイト内にあり、そのサイトの最上位のページには、「F通」という文字が含まれる。
そこで、ユーザが「F通」、「役員」、「一覧」、「社長」、「専務」、「会長」、および「副会長」を検索用語としたAND検索を、クライアント21を介してポータルサイトサーバ100に対して行ったものとする。この検索要求はAND検索であるため、従来の検索では、「F通」のキーワードを含まない文書61は、検出されない。
一方、本実施の形態では、文書61が検索キーワードの少なくとも1つを含んでいれば、文書61を含むドメインがカテゴライズサイトとして抽出される。カテゴライズサイトは、最上位の文書内に多くの種類の検索用語含むものほど、表示順が優先される。従って、文書61を含むカテゴライズサイトの最上位の文書には「F通」のキーワードが含まれるため、文書61を含むカテゴリの表示順が上位となる。
また、カテゴライズサイト内の文書間では、包含する検索用語の総数が多いものほど上位に表示される。図18に示す文書は、「役員」、「一覧」等の多数の検索キーワードを含んでいるため、上位に表示されることとなる。
図19は、検索結果の表示例を示す図である。検索結果62には、図18に示した文書61に関する情報が最上位に表示されている。従って、ユーザは、文書61の存在を容易に認識することができ、検索目的(F通株式会社の役員一覧を参照すること)を達成できる。また、カテゴライズサイト内の各文書に関するURL等の情報は、ヒットした検索用語の種別数が多い順に表示される。
また、各文書に関する情報は、該当する文書に対してハイパーリンクが張られている。そのため、ユーザは、文書に関する情報をポインティングデバイス等で選択することで、対応する文書を参照できる。
なお、検索結果として示すURL等の表示件数は、カテゴライズサイト毎の最大件数を設定しておくことができる。その場合、検索結果62の画面内には、カテゴライズサイト内の一部の検索結果のみが表示される。
他の検索結果を参照する場合、ユーザが操作入力を行い、ページめくりボタン62a,62bをポインティングデバイス等で選択することで、他の検索結果を画面に表示させることができる。ページめくりボタン62aが選択されると、現在表示されている検索結果よりも上位(優先度が高い)検索結果が画面に表示される。また、ページめくりボタン62bが選択されると、現在表示されている検索結果よりも下位(優先度が低い)検索結果が画面に表示される。
なお、カテゴライズサイト内の検索結果が多すぎたり、少なすぎたりした場合、ユーザは、再検索ボタン62cを選択することで、カテゴライズサイトの範囲を調整できる。例えば、再検索ボタン62cが選択されると、クライアント21にはカテゴライズサイト指定画面が表示される。
図20は、カテゴライズサイト指定画面の例を示す図である。カテゴライズサイト指定画面63には、文書に関する情報に対応付けて、カテゴライズサイト選択欄63aが設けられている。カテゴライズサイト選択欄63aには、チェックボックス63aa、カテゴライズサイト表示部63ab、および変更ボタン63acが設けられている。
ユーザは、チェックボックス63aaを選択し、そのチェックボックス63aaにマークを表示させることで、カテゴライズサイト選択欄63aの指定を有効にすることができる。
カテゴライズサイト表示部63abには、現在指定されているカテゴライズサイトのURLが表示されている。なお、デフォルトの表示(初期表示)は検索結果として得られた文書のURL(この例の場合:http://www.y.com/**/b.html)である。
変更ボタン63acは、上方向と下方向とのボタンに分かれている。上方向のボタンが選択される度に、指定されるURLの階層が上がる(スラッシュで区切られた最後の記述が削除される)。階層を上がることで、最大でドメイン名の指定まで変更していくことができる。
また、変更ボタン63acの下方向のボタンが選択される度に、指定されるURLの階層が下がる(スラッシュで区切られた記述が追加される)。階層を下がることで、検索結果のURLまで変更していくことができる。
以下、本実施の形態の変形例を説明する。
第2の検索処理において、第1の検索処理で検出できなかった検索用語が検出できたか否かにより、該当するカテゴライズサイトの優先順位を決定することもできる。
例えば、第1の検索処理の結果生成されるヒットカウンタテーブル41は、図11に示した通りとする。そして、「http://www.y.com」にアクセスしたときに表示される文書に含まれるキーワードは、“NDC,NDC Corporation,N電気,N電,エヌディーシー,ネットワーク,ソリューション,電子デバイス,パソコン,ブロードバンド,モバイル,携帯電話,broadband,mobile”であり、「http://www.x.com」にアクセスしたときに表示される文書に含まれるキーワードは“F通, F TSU, IT, コンピュータ, パソコン,一覧”であるものとする。
この場合、カテゴライズサイト「http://www.y.com」に含まれるキーワードから、「F通」、「役員」、「一覧」、「社長」、「専務」、「会長」、および「副会長」の検索用語を検索すると、ヒット件数が「0」となる。一方、同様の検索用語をカテゴライズサイト「http://www.z.com」に含まれるキーワードから検索すると、ヒット件数が「2」となる(「F通」と「一覧」がヒットする)。
図21は、ヒット種別カウンタテーブルの例を示す図である。図21に示すヒット種別カウンタテーブル42では、カテゴライズサイト「http://www.z.com」に関し、検索用語「F通」と「一覧」に「1」が設定され、ヒット種別の合計に「2」が設定されている。
ここで、検索部122は、ヒット種別カウンタテーブル42を用いて、ヒットカウンタテーブル41を更新する。すなわち、カテゴライズサイトの最上位の文書に含まれるキーワードが、ヒット先URLに対応する文書に含まれるものとした場合のヒットカウンタテーブル41を作成する。
図22は、ヒットカウンタテーブルの更新結果を示す図である。図22に示すヒットカウンタテーブル41は、図11に示した状態からURL「http://www.z.com/**/f.html」のレコードの検索用語「F通」と「一覧」との欄の値が「1」に変更されている。そして、該当レコードの検索結果に「2」が加算され、「6」に更新されている。
すなわち、第2の検索処理においてカテゴライズサイトのヒット種別の合計として得られた数が、そのカテゴライズサイト内の文書を示すヒット先URLの検索結果に加算されている。更新後のヒットカウンタテーブル41の順位の欄が、検索結果の値が大きい順となるように更新されている。その結果、URL「http://www.z.com/**/f.html」の優先順が最も高くなっている。
検索部122は、検索結果として表示するカテゴライズサイトを並べ替える際には、ヒットカウンタテーブル41の順位の欄を参照し、優先順位の高い(順位の値が小さい)ヒット先URLを含むカテゴライズサイトほど上位に配置する。
また、第3の検索処理において、カテゴライズサイト内のいずれの文書にも含まれない検索用語がある場合(カテゴライズサイト別ヒットカウンタテーブル43の検索用語別ヒット件数の値が「0」の検索用語が少なくとも1つ存在する)、このカテゴライズサイトは検索結果の表示対象から除外してもよい。すなわち、ユーザの検索要求は検索用語のAND検索であるため、検索結果として抽出するための条件として、「全ての検索用語が、カテゴライズサイト内の少なくとも1つの文書に必ず含まれる」という条件を定義することができる。
また、上記の実施の形態では、第1の検索処理で検出された文書を、階層的に上位に辿った他の文書に任意に設定されたキーワードを参照することで検索漏れを防いでいるが、その文書全体から作成されたインデックスを参照してもよい。さらには、同一カテゴリ内の全ての文書のインデックスを参照してもよい。このように、インデックスの参照対象を、最上位の文書全体、さらには同一カテゴリ全体に広げることで、検索漏れの防止効果を高めることができる。
また、上記実施の形態では、インターネット10上のコンテンツサーバで公開されている文書を検索するシステムの例を示したが、同様の検索方式を、大規模データベース内の情報検索に利用することもできる。
図23は、大規模データベースの情報検索サービスを行うシステム構成例を示す図である。図23のシステムでは、インターネット10にアプリケーションサーバ100aが接続されている。アプリケーションサーバ100aは、データベース100bを有している。
アプリケーションサーバ100aは、クライアント21,22,・・・に対して、データベース100b内の情報検索サービスを提供する。すなわち、アプリケーションサーバ100aは、クライアント21,22,・・・からの要求に応じてデータベース100b内の情報検索を行い、検索結果をクライアント21,22,・・・に送信する。
アプリケーションサーバ100aは、図4に示す検索エンジン120と同様の検索機能を有している。ただし、インデックス作成部121は、コンテンツサーバ31,32,・・・が有する文書のインデックス作成に代えて、データベース100b内の情報のインデックスを作成する。これにより、データベース100b内の情報検索において、ユーザが希望する情報を的確に検出することができる。
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、(本発明に係る装置)が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記録装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、DVD(Digital Versatile Disc)、DVD−RAM、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)などがある。光磁気記録媒体には、MO(Magneto-Optical disk)などがある。
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラム、もしくはサーバコンピュータから転送されたプログラムを自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送される毎に、逐次、受け取ったプログラムに従った処理を実行することもできる。
なお、本発明は、上述の実施の形態にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変更を加えることができる。
以上説明した実施の形態の主な技術的特徴は、以下の付記の通りである。
(付記1) 階層的に配置された検索対象情報を検索するための情報検索装置において、
前記検索対象情報の所在を示す位置情報に関連づけて、前記検索対象情報から抽出されたキーワードを含む前記検索対象情報毎のインデックスを記憶するインデックス記憶手段と、
クライアントから複数の検索用語を含む検索要求が入力されると、少なくとも1つの前記検索用語を含む前記インデックスを、前記インデックス記憶手段から検索し、検出された前記インデックスに対応する前記検索対象情報を、検索結果候補とする第1の検索手段と、
前記検索対象情報が属するカテゴリの分類基準が予め定義されており、前記分類基準に従って前記検索結果候補が属するカテゴリを判断するカテゴリ判断手段と、
前記検索結果候補が属する前記カテゴリ内において前記検索結果候補よりも階層的に上位に位置する他の前記検索対象情報から、前記検索用語を検索する第2の検索手段と、
前記第2の検索手段により前記検索用語が検出された前記検索対象情報に対応する前記カテゴリの表示優先度を他よりも高く設定するカテゴリ表示順決定手段と、
前記検索結果候補それぞれの前記位置情報を前記インデックス記憶手段から取得し、取得した前記位置情報の属する前記カテゴリに基づき、前記カテゴリ表示順決定手段で決定した表示優先度の高い順に前記位置情報を並べ替え、並べ替えられた前記位置情報のリストを前記クライアントに送信する検索結果送信手段と、
を有することを特徴とする情報検索装置。
(付記2) 前記分類基準は、前記検索対象情報の前記位置情報に含まれるドメイン名毎に分類することが定義されていることを特徴とする付記1記載の情報検索装置。
(付記3) 前記分類基準は、前記検索対象情報の前記位置情報におけるドメイン名に続けて記載されている所定の階層のディレクトリ名毎に分類することが定義されていることを特徴とする付記1記載の情報検索装置。
(付記4) 前記分類基準は、ユーザからの操作入力によって指定された階層のディレクトリより下位の情報を1つの前記カテゴリとして分類することが定義されていることを特徴とする付記1記載の情報検索装置。
(付記5) 前記検索結果送信手段は、前記位置情報をカテゴリ別にまとめて表示することを特徴とする付記1記載の情報検索装置。
(付記6) 前記第2の検索手段は、前記検索結果候補が属する前記カテゴリ内の最上位の前記検索対象情報から、少なくとも1つの前記検索用語を検索することを特徴とする付記1記載の情報検索装置。
(付記7) 前記カテゴリ表示順決定手段は、前記第2の検索手段で検出された前記インデックスに含まれる前記検索用語の種別数が多い順に、前記インデックスに対応する前記カテゴリの表示優先順を設定することを特徴とする付記1記載の情報検索装置。
(付記8) 前記カテゴリ表示順決定手段は、前記検索結果候補の前記インデックスと、前記検索結果候補と同一カテゴリの他の検索対象情報のインデックスとのいずれかに含まれる検索用語の種別数が多い順に、前記インデックスに対応する前記カテゴリの表示優先順を設定することを特徴とする付記1記載の情報検索装置。
(付記9) 前記検索結果送信手段は、同一の前記カテゴリに属する前記検索結果候補の前記位置情報を、各前記検索結果候補に対応する前記インデックスに含まれる検索用語の種別数に応じて並べ替えて、前記クライアントに送信することを特徴とする付記1記載の情報検索装置。
(付記10) 前記検索結果送信手段は、同一の前記カテゴリに属する前記検索結果候補の前記位置情報のうち、希少度の高い前記検索用語を含む前記インデックスに対応する前記位置情報を、他の前記位置情報よりも上位に配置することを特徴とする付記1記載の情報検索装置。
(付記11) コンピュータの演算処理により、階層的に配置された検索対象情報を検索するための情報検索方法において、
前記検索対象情報の所在を示す位置情報に関連づけて、前記検索対象情報から抽出されたキーワードを含む前記検索対象情報毎のインデックスを、インデックス記憶手段に記憶させ、
クライアントから複数の検索用語を含む検索要求が入力されると、少なくとも1つの前記検索用語を含む前記インデックスを、前記インデックス記憶手段から検索し、検出された前記インデックスに対応する前記検索対象情報を、検索結果候補とし、
前記検索対象情報が属するカテゴリの分類基準が予め定義されており、前記分類基準に従って前記検索結果候補が属するカテゴリを判断し、
前記検索結果候補が属する前記カテゴリ内において前記検索結果候補よりも階層的に上位に位置する他の前記検索対象情報から、前記検索用語を検索し、
前記検索用語が検出された前記検索対象情報に対応する前記カテゴリの表示優先度を他よりも高く設定し、
前記検索結果候補それぞれの前記位置情報を前記インデックス記憶手段から取得し、取得した前記位置情報の属する前記カテゴリに基づき、表示優先度の高い順に前記位置情報を並べ替え、並べ替えられた前記位置情報のリストを前記クライアントに送信する、
ことを特徴とする情報検索方法。
(付記12) 階層的に配置された検索対象情報を検索するための情報検索プログラムにおいて、
コンピュータを、
前記検索対象情報の所在を示す位置情報に関連づけて、前記検索対象情報から抽出されたキーワードを含む前記検索対象情報毎のインデックスを記憶するインデックス記憶手段、
クライアントから複数の検索用語を含む検索要求が入力されると、少なくとも1つの前記検索用語を含む前記インデックスを、前記インデックス記憶手段から検索し、検出された前記インデックスに対応する前記検索対象情報を、検索結果候補とする第1の検索手段、
前記検索対象情報が属するカテゴリの分類基準が予め定義されており、前記分類基準に従って前記検索結果候補が属するカテゴリを判断するカテゴリ判断手段、
前記検索結果候補が属する前記カテゴリ内において前記検索結果候補よりも階層的に上位に位置する他の前記検索対象情報から、前記検索用語を検索する第2の検索手段、
前記第2の検索手段により前記検索用語が検出された前記検索対象情報に対応する前記カテゴリの表示優先度を他よりも高く設定するカテゴリ表示順決定手段、
前記検索結果候補それぞれの前記位置情報を前記インデックス記憶手段から取得し、取得した前記位置情報の属する前記カテゴリに基づき、前記カテゴリ表示順決定手段で決定した表示優先度の高い順に前記位置情報を並べ替え、並べ替えられた前記位置情報のリストを前記クライアントに送信する検索結果送信手段、
として機能させることを特徴とする情報検索プログラム。
本実施の形態の概略を示す図である。 本実施の形態のシステム構成例を示す図である。 本実施の形態に用いるポータルサイトサーバのハードウェア構成例を示す図である。 ポータルサイトサーバの機能を示すブロック図である。 インデックス作成処理を示す図である。 検索処理全体の流れを示すフローチャートである。 検索条件取得処理の手順を示すフローチャートである。 検索画面の例を示す図である。 検索処理の手順を示すフローチャートである。 第1の検索処理の手順を示すフローチャートである。 ヒットカウンタテーブルの例を示す図である。 第2の検索処理を示すフローチャートである。 ヒット種別カウンタテーブルの例を示す図である。 第3の検索処理の手順を示すフローチャートである。 カテゴライズサイト別ヒットカウンタテーブルの例を示す図である。 表示処理の手順を示すフローチャートである。 検索結果画面の例を示す図である。 役員リストを含む文書を示す図である。 検索結果の表示例を示す図である。 カテゴライズサイト指定画面の例を示す図である。 ヒット種別カウンタテーブルの例を示す図である。 ヒットカウンタテーブルの更新結果を示す図である。 大規模データベースの情報検索サービスを行うシステム構成例を示す図である。 従来の検索技術を示す図である。
符号の説明
1 情報検索装置
1a インデックス記憶手段
1b 第1の検索手段
1c カテゴリ判断手段
1d 第2の検索手段
1e カテゴリ表示順決定手段
1f 検索結果送信手段
2 クライアント
2a 検索結果画面

Claims (5)

  1. 階層的に配置された検索対象情報を検索するための情報検索装置において、
    前記検索対象情報の所在を示す位置情報に関連づけて、前記検索対象情報から抽出されたキーワードを含む前記検索対象情報毎のインデックスを記憶するインデックス記憶手段と、
    クライアントから複数の検索用語を含む検索要求が入力されると、少なくとも1つの前記検索用語を含む前記インデックスを、前記インデックス記憶手段から検索し、検出された前記インデックスに対応する前記検索対象情報を、検索結果候補とする第1の検索手段と、
    前記検索対象情報が属するカテゴリの分類基準が予め定義されており、前記分類基準に従って前記検索結果候補が属するカテゴリを判断するカテゴリ判断手段と、
    前記検索結果候補が属する前記カテゴリ内において前記検索結果候補よりも階層的に上位に位置する他の前記検索対象情報から、前記検索用語を検索する第2の検索手段と、
    前記第2の検索手段により前記検索用語が検出された前記検索対象情報に対応する前記カテゴリの表示優先度を他よりも高く設定するカテゴリ表示順決定手段と、
    前記検索結果候補それぞれの前記位置情報を前記インデックス記憶手段から取得し、取得した前記位置情報の属する前記カテゴリに基づき、前記カテゴリ表示順決定手段で決定した表示優先度の高い順に前記位置情報を並べ替え、並べ替えられた前記位置情報のリストを前記クライアントに送信する検索結果送信手段と、
    を有することを特徴とする情報検索装置。
  2. 前記分類基準は、前記検索対象情報の前記位置情報に含まれるドメイン名毎に分類することが定義されていることを特徴とする請求項1記載の情報検索装置。
  3. 前記分類基準は、ユーザからの操作入力によって指定された階層のディレクトリより下位の情報を1つの前記カテゴリとして分類することが定義されていることを特徴とする請求項1記載の情報検索装置。
  4. 前記検索結果送信手段は、同一の前記カテゴリに属する前記検索結果候補の前記位置情報のうち、希少度の高い前記検索用語を含む前記インデックスに対応する前記位置情報を、他の前記位置情報よりも上位に配置することを特徴とする請求項1記載の情報検索装置。
  5. コンピュータの演算処理により、階層的に配置された検索対象情報を検索するための情報検索方法において、
    前記検索対象情報の所在を示す位置情報に関連づけて、前記検索対象情報から抽出されたキーワードを含む前記検索対象情報毎のインデックスを、インデックス記憶手段に記憶させ、
    クライアントから複数の検索用語を含む検索要求が入力されると、少なくとも1つの前記検索用語を含む前記インデックスを、前記インデックス記憶手段から検索し、検出された前記インデックスに対応する前記検索対象情報を、検索結果候補とし、
    前記検索対象情報が属するカテゴリの分類基準が予め定義されており、前記分類基準に従って前記検索結果候補が属するカテゴリを判断し、
    前記検索結果候補が属する前記カテゴリ内において前記検索結果候補よりも階層的に上位に位置する他の前記検索対象情報から、前記検索用語を検索し、
    前記検索用語が検出された前記検索対象情報に対応する前記カテゴリの表示優先度を他よりも高く設定し、
    前記検索結果候補それぞれの前記位置情報を前記インデックス記憶手段から取得し、取得した前記位置情報の属する前記カテゴリに基づき、表示優先度の高い順に前記位置情報を並べ替え、並べ替えられた前記位置情報のリストを前記クライアントに送信する、
    ことを特徴とする情報検索方法。
JP2005246421A 2005-08-26 2005-08-26 情報検索装置および情報検索方法 Expired - Fee Related JP4756953B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005246421A JP4756953B2 (ja) 2005-08-26 2005-08-26 情報検索装置および情報検索方法
US11/298,512 US7653623B2 (en) 2005-08-26 2005-12-12 Information searching apparatus and method with mechanism of refining search results

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005246421A JP4756953B2 (ja) 2005-08-26 2005-08-26 情報検索装置および情報検索方法

Publications (2)

Publication Number Publication Date
JP2007058782A true JP2007058782A (ja) 2007-03-08
JP4756953B2 JP4756953B2 (ja) 2011-08-24

Family

ID=37805562

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005246421A Expired - Fee Related JP4756953B2 (ja) 2005-08-26 2005-08-26 情報検索装置および情報検索方法

Country Status (2)

Country Link
US (1) US7653623B2 (ja)
JP (1) JP4756953B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011097190A (ja) * 2009-10-27 2011-05-12 Kyocera Corp 携帯通信機器
JP2012094086A (ja) * 2010-10-29 2012-05-17 Seiko Epson Corp コンテンツ出力システム、コンテンツサーバー、仲介サーバー、および、コンテンツ出力方法
JP2012212304A (ja) * 2011-03-31 2012-11-01 Nec Corp 検索結果出力装置および検索結果出力制御プログラムと検索結果出力方法
JP2013025605A (ja) * 2011-07-22 2013-02-04 Sony Corp 情報処理装置、情報処理方法及びプログラム
WO2014118861A1 (ja) * 2013-01-31 2014-08-07 アスタミューゼ株式会社 情報提示装置及び情報提示システム
CN113343131A (zh) * 2021-06-30 2021-09-03 北京三快在线科技有限公司 一种模型训练的方法、信息展示的方法及装置
JP7519776B2 (ja) 2020-01-20 2024-07-22 三菱電機株式会社 画像検索装置、画像検索方法、及び画像検索プログラム

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8275661B1 (en) 1999-03-31 2012-09-25 Verizon Corporate Services Group Inc. Targeted banner advertisements
US8572069B2 (en) 1999-03-31 2013-10-29 Apple Inc. Semi-automatic index term augmentation in document retrieval
WO2000058863A1 (en) 1999-03-31 2000-10-05 Verizon Laboratories Inc. Techniques for performing a data query in a computer system
US6718363B1 (en) * 1999-07-30 2004-04-06 Verizon Laboratories, Inc. Page aggregation for web sites
KR100776697B1 (ko) * 2006-01-05 2007-11-16 주식회사 인터파크지마켓 고객 구매행동 분석에 기반한 지능화된 상품 검색 방법 및 시스템
US20080154849A1 (en) * 2006-12-21 2008-06-26 International Business Machines Corporation Method, graphical user interface, and computer program product for grouping search results
US7966309B2 (en) 2007-01-17 2011-06-21 Google Inc. Providing relevance-ordered categories of information
US7849193B1 (en) * 2007-02-01 2010-12-07 Adobe Systems Incorporated Multiple hyperlinks in a uniform resource locator
US20100318552A1 (en) * 2007-02-21 2010-12-16 Bang & Olufsen A/S System and a method for providing information to a user
CN101276361B (zh) 2007-03-28 2010-09-15 阿里巴巴集团控股有限公司 一种显示相关关键词的方法及系统
US20090030707A1 (en) * 2007-07-23 2009-01-29 Yahoo! Inc. System and method of researching real estate
US7680978B1 (en) * 2007-09-05 2010-03-16 Juniper Networks, Inc. Reducing content addressable memory (CAM) power consumption counters
US8914774B1 (en) 2007-11-15 2014-12-16 Appcelerator, Inc. System and method for tagging code to determine where the code runs
US8954989B1 (en) 2007-11-19 2015-02-10 Appcelerator, Inc. Flexible, event-driven JavaScript server architecture
US8260845B1 (en) 2007-11-21 2012-09-04 Appcelerator, Inc. System and method for auto-generating JavaScript proxies and meta-proxies
US8566807B1 (en) 2007-11-23 2013-10-22 Appcelerator, Inc. System and method for accessibility of document object model and JavaScript by other platforms
US8719451B1 (en) 2007-11-23 2014-05-06 Appcelerator, Inc. System and method for on-the-fly, post-processing document object model manipulation
US8806431B1 (en) 2007-12-03 2014-08-12 Appecelerator, Inc. Aspect oriented programming
US8756579B1 (en) 2007-12-03 2014-06-17 Appcelerator, Inc. Client-side and server-side unified validation
US8819539B1 (en) 2007-12-03 2014-08-26 Appcelerator, Inc. On-the-fly rewriting of uniform resource locators in a web-page
US8938491B1 (en) 2007-12-04 2015-01-20 Appcelerator, Inc. System and method for secure binding of client calls and server functions
US8527860B1 (en) 2007-12-04 2013-09-03 Appcelerator, Inc. System and method for exposing the dynamic web server-side
US8335982B1 (en) 2007-12-05 2012-12-18 Appcelerator, Inc. System and method for binding a document object model through JavaScript callbacks
US7958232B1 (en) * 2007-12-05 2011-06-07 Appcelerator, Inc. Dashboard for on-the-fly AJAX monitoring
US8285813B1 (en) 2007-12-05 2012-10-09 Appcelerator, Inc. System and method for emulating different user agents on a server
US8639743B1 (en) 2007-12-05 2014-01-28 Appcelerator, Inc. System and method for on-the-fly rewriting of JavaScript
US8412702B2 (en) * 2008-03-12 2013-04-02 Yahoo! Inc. System, method, and/or apparatus for reordering search results
US9135328B2 (en) * 2008-04-30 2015-09-15 Yahoo! Inc. Ranking documents through contextual shortcuts
US8291079B1 (en) 2008-06-04 2012-10-16 Appcelerator, Inc. System and method for developing, deploying, managing and monitoring a web application in a single environment
US8880678B1 (en) 2008-06-05 2014-11-04 Appcelerator, Inc. System and method for managing and monitoring a web application using multiple cloud providers
CN101639831B (zh) * 2008-07-29 2012-09-05 华为技术有限公司 一种搜索方法、装置及系统
US7596620B1 (en) 2008-11-04 2009-09-29 Aptana, Inc. System and method for developing, deploying, managing and monitoring a web application in a single environment
US9069854B2 (en) * 2008-10-18 2015-06-30 Pomian & Corella, Llc Facilitating browsing of result sets
US20100287129A1 (en) * 2009-05-07 2010-11-11 Yahoo!, Inc., a Delaware corporation System, method, or apparatus relating to categorizing or selecting potential search results
US20110029505A1 (en) * 2009-07-31 2011-02-03 Scholz Martin B Method and system for characterizing web content
CN101916295B (zh) * 2010-08-27 2011-12-14 董方 基于点对点网络的互联网搜索系统和方法
US8407245B2 (en) * 2010-11-24 2013-03-26 Microsoft Corporation Efficient string pattern matching for large pattern sets
WO2014022715A1 (en) * 2012-08-01 2014-02-06 Google Inc. Categorizing search terms
US20150095194A1 (en) * 2013-09-27 2015-04-02 Romualdas Maslovskis Systems and methods for search term prioritization
KR20150120123A (ko) * 2014-04-17 2015-10-27 삼성전자주식회사 정보 제공 방법 및 장치
CN105224567B (zh) * 2014-06-26 2020-08-14 腾讯科技(深圳)有限公司 一种关键字的搜索方法及装置
US20170116194A1 (en) * 2015-10-23 2017-04-27 International Business Machines Corporation Ingestion planning for complex tables
JP6565628B2 (ja) * 2015-11-19 2019-08-28 富士通株式会社 検索プログラム、検索装置および検索方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003067419A (ja) * 2001-08-24 2003-03-07 Toshiba Corp 情報検索方法および情報検索システム
JP2004078446A (ja) * 2002-08-14 2004-03-11 Nec Corp キーワード抽出装置、抽出方法、文書検索装置、検索方法、文書分類装置及び分類方法並びにプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6665665B1 (en) * 1999-07-30 2003-12-16 Verizon Laboratories Inc. Compressed document surrogates
US7047229B2 (en) * 2000-08-08 2006-05-16 America Online, Inc. Searching content on web pages
US6947930B2 (en) * 2003-03-21 2005-09-20 Overture Services, Inc. Systems and methods for interactive search query refinement
US7523095B2 (en) * 2003-04-29 2009-04-21 International Business Machines Corporation System and method for generating refinement categories for a set of search results
US7406459B2 (en) * 2003-05-01 2008-07-29 Microsoft Corporation Concept network
US20050160107A1 (en) * 2003-12-29 2005-07-21 Ping Liang Advanced search, file system, and intelligent assistant agent
US7567959B2 (en) * 2004-07-26 2009-07-28 Google Inc. Multiple index based information retrieval system
US7451124B2 (en) * 2005-05-12 2008-11-11 Xerox Corporation Method of analyzing documents

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003067419A (ja) * 2001-08-24 2003-03-07 Toshiba Corp 情報検索方法および情報検索システム
JP2004078446A (ja) * 2002-08-14 2004-03-11 Nec Corp キーワード抽出装置、抽出方法、文書検索装置、検索方法、文書分類装置及び分類方法並びにプログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011097190A (ja) * 2009-10-27 2011-05-12 Kyocera Corp 携帯通信機器
JP2012094086A (ja) * 2010-10-29 2012-05-17 Seiko Epson Corp コンテンツ出力システム、コンテンツサーバー、仲介サーバー、および、コンテンツ出力方法
US9189177B2 (en) 2010-10-29 2015-11-17 Seiko Epson Corporation Content outputting method, content server and mediation server
JP2012212304A (ja) * 2011-03-31 2012-11-01 Nec Corp 検索結果出力装置および検索結果出力制御プログラムと検索結果出力方法
JP2013025605A (ja) * 2011-07-22 2013-02-04 Sony Corp 情報処理装置、情報処理方法及びプログラム
US9268524B2 (en) 2011-07-22 2016-02-23 Sony Corporation Information processing apparatus, information processing method, and computer readable medium
WO2014118861A1 (ja) * 2013-01-31 2014-08-07 アスタミューゼ株式会社 情報提示装置及び情報提示システム
JP7519776B2 (ja) 2020-01-20 2024-07-22 三菱電機株式会社 画像検索装置、画像検索方法、及び画像検索プログラム
CN113343131A (zh) * 2021-06-30 2021-09-03 北京三快在线科技有限公司 一种模型训练的方法、信息展示的方法及装置
CN113343131B (zh) * 2021-06-30 2022-08-26 北京三快在线科技有限公司 一种模型训练的方法、信息展示的方法及装置

Also Published As

Publication number Publication date
JP4756953B2 (ja) 2011-08-24
US7653623B2 (en) 2010-01-26
US20070050335A1 (en) 2007-03-01

Similar Documents

Publication Publication Date Title
JP4756953B2 (ja) 情報検索装置および情報検索方法
US8745039B2 (en) Method and system for user guided search navigation
US10795883B2 (en) Method and system for enterprise search navigation
US8555182B2 (en) Interface for managing search term importance relationships
US8280878B2 (en) Method and apparatus for real time text analysis and text navigation
JP4118580B2 (ja) 配置情報推薦装置、その方法、プログラム
JP5147947B2 (ja) クエリ別検索コレクション生成方法およびシステム
JP5318125B2 (ja) 複合検索用のシステムと方法
JP2005309998A (ja) コンテンツナビゲーションプログラム、コンテンツナビゲーション方法及びコンテンツナビゲーション装置
US20070185827A1 (en) Reporting of search results
JP2002099568A (ja) 個人用ブックマーク自動作成機能を有したwwwサーバー
JP2008191982A (ja) 検索結果出力装置
JP2002007461A (ja) 個人向け情報収集サーバ、個人向け情報収集方法および記録媒体
KR101172487B1 (ko) 검색 결과 내에 첨부된 정보 데이터베이스에 기초한 검색 리스트 및 검색어 순위 제공 방법 및 시스템
JP5286007B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP5757187B2 (ja) ファイル格納先候補決定装置、ファイル格納先候補の決定方法、ファイル格納先決定支援システム、並びにコンピュータ・プログラム
KR100942902B1 (ko) 웹페이지 검색 방법 및 상기 방법을 컴퓨터에서 구현하는 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체
KR20060115488A (ko) 웹 브라우저의 즐겨찾기 리스트를 이용한 개인화 검색 방법및 검색 서버
JPH10222534A (ja) 情報検索装置
JP2006236221A (ja) ウエブページ検索のための管理サーバ装置
JP2005339580A (ja) 文書データ管理装置およびプログラム
JP2010122932A (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP2022191837A (ja) プログラム、情報処理装置及び情報処理方法
JP2008165313A (ja) ホームページ作成システム
JP2009129013A (ja) 文書検索方法、文書検索装置および文書検索プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080403

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101026

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101224

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110531

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110531

R150 Certificate of patent or registration of utility model

Ref document number: 4756953

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140610

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees