JP2003186912A - ADAPTATION CALCULATION METHOD AND DEVICE FOR Web PAGE RETRIEVAL, RETRIEVAL RESULT DISPLAY METHOD AND DEVICE FOR Web PAGE RETRIEVAL, AND PERFORMANCE PROGRAM FOR THE SAME METHOD AND RECORDING MEDIUM WITH ITS PROGRAM RECORDED - Google Patents

ADAPTATION CALCULATION METHOD AND DEVICE FOR Web PAGE RETRIEVAL, RETRIEVAL RESULT DISPLAY METHOD AND DEVICE FOR Web PAGE RETRIEVAL, AND PERFORMANCE PROGRAM FOR THE SAME METHOD AND RECORDING MEDIUM WITH ITS PROGRAM RECORDED

Info

Publication number
JP2003186912A
JP2003186912A JP2001389445A JP2001389445A JP2003186912A JP 2003186912 A JP2003186912 A JP 2003186912A JP 2001389445 A JP2001389445 A JP 2001389445A JP 2001389445 A JP2001389445 A JP 2001389445A JP 2003186912 A JP2003186912 A JP 2003186912A
Authority
JP
Grant status
Application
Patent type
Prior art keywords
page
score
set
page set
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001389445A
Other languages
Japanese (ja)
Inventor
Kenichi Mori
憲一 森
Original Assignee
Nippon Telegr & Teleph Corp <Ntt>
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date

Links

Abstract

PROBLEM TO BE SOLVED: To perform the keyword retrieval of a Web page retrieval system by outputting retrieval results by page set units in the highly precise order adapted to a keyword.
SOLUTION: In a client terminal 3, a retrieving means 31 performs keyword retrieval to a Web page retrieval system 1, and receives the N pieces of scores and URL of hit pages from the retrieval system 1, and a page DB access means 32 obtains the depth of the page set ID and page set tree structure of each page from a route from a page DB 2, and registers the page set ID in a hit page set list, and a score calculating means 33 calculates a score indicating the adaptation to the keyword based on the depth of the page set tree structure and the score. A hit page set list generating means 34 uses the score as the score element of the page set ID of the list, or adds it to an already registered score element, and a sort means 35 sorts the generated hit page set list with the score element, and outputs it.
COPYRIGHT: (C)2003,JPO

Description

【発明の詳細な説明】 【0001】 【発明の属する技術分野】本発明は、Webページ検索システムに対しキーワードにより問い合わせを行ってページ情報を検索する際に、キーワードにマッチングしている度合い(適合度)を計算する方法と装置、並びに、 BACKGROUND OF THE INVENTION [0001] [Technical Field of the Invention The present invention is, when searching the page information by performing queries by the keyword to the Web page retrieval system, the degree you are matching the keyword (fit method and apparatus for calculating a degree), and,
キーワードによる検索結果がページ情報として多数得られた場合に、その検索結果を、キーワードにマッチングしている度合いの大きい順にページセット単位で高精度に表示する方法と装置に関する。 If the search results for keywords obtained number as the page information, the search result, to an apparatus and method for displaying a high accuracy in order of degree which is matched to the keyword in the page set basis. 【0002】 【従来の技術】WWW(ワールド・ワイド・ウェブ)においては、Webページ検索システムに対し、クライアント端末からキーワードによる問い合わせを行い、キーワードにヒットしたページに関する情報を検索することができる。 2. Description of the Prior Art WWW (World Wide Web), to the Web page retrieval system, an inquiry by the keyword from the client terminal, it is possible to search for information about the page that was hit in the keyword. 従来、こうしたWebページ検索システムによって複数の検索結果が得られた場合、その検索結果のリスト表示は、検索システムから整理・選別・加工されずに出力されるままであるのが一般的である。 Conventionally, when a plurality of search results are obtained by such Web pages retrieval system, a list display of the search result remains are output without being organized and sorting and processing from the search system of is common. しかし、 But,
こうしたWebページ検索で得られるページ情報は膨大になるのが常であり、その中で、どれが真にキーワードによる問い合わせにマッチングした検索結果なのかを知るには、検索結果に示されたURL(ユニバーサル・リソース・ロケータ)を一つ一つ辿って、そのサイトのページ集合を参照して捜し出さなければならない、という多大な手間と労力が必要であった。 Such a Web page information obtained in the search is a normally that becomes enormous, in that, in the which is truly know whether the results search matched to a query by keyword, has been shown in the search results URL ( Universal resource locator) to follow one by one, that must be Sagashidasa see the page set of the site, significant time and effort that was necessary. 【0003】こうした状況を改善するため、検索結果を順位付けして提示しようとする試みがなされている。 [0003] In order to improve this situation, it is an attempt to come to rank the search results have been made. 例えば、特開2001−60165に開示された技術では、あらかじめサーバ上に存在するページを収集し、各サーバの間にまたがるリンク参照状況を取得しておき、 For example, in the technology disclosed in JP 2001-60165, collect pages pre-existing on the server in advance to obtain the link reference situation spanning between each server,
そのリンク参照状況を用いて各ページの重要度を判定し、この重要度にしたがって検索結果をソートして出力するものであった。 Determining the importance of each page using the link reference situation was achieved, thereby outputting the sorted search results according to the importance. 【0004】 【発明が解決しようとする課題】しかしながら、特開2 [0004] The present invention is, however, JP 2
001−60165に開示された技術では、各サーバの間にまたがるリンク参照状況からページの重要度を判定しても、それがキーワードによるWebページ検索において、キーワードに適合していることとは無関係であり、検索結果がキーワードにマッチングしている順にソートされることにならないという大きな問題があった。 In 001-60165 disclosed in the art, also determine the importance of a page from the link reference situation spanning between each server, it in Web page search by keywords, independent of that they comply with the keywords Yes, the search result there has been a serious problem not to be sorted in the order in which they matched the keyword. 【0005】そのため、結局は、多数の検索結果に示されたURLを一つ一つ辿って、そのサイトのページ集合を参照して所望のページを捜し出すという多大な手間と労力が必要になることに変わりはなかった。 [0005] Therefore, eventually, follow one by one the URL shown in the large number of search results, great deal of time and effort that is required that locate the desired page by referring to the page set of the site There was no change to. 【0006】本発明は、Webページ検索システムに対するキーワードによる問い合わせに対する検索結果からキーワードに適合する度合いを高精度に計算できる適合度計算方法および装置を提供するとともに、その検索結果が複数ある場合には、キーワードに適合している高精度な順位で検索結果をリスト表示することができる適合度表示方法および装置を提供することを課題とする。 [0006] The present invention is to provide search results adaptability calculation method and apparatus can be calculated with high accuracy degree conforming to the keyword from the response to the inquiry by keywords for Web page search system, if the search results are multiple , and to provide a fitness display method and apparatus capable of listing the search results in accurate order that conforms to the keyword. 【0007】 【課題を解決するための手段】上記の課題を解決するため、本発明は、Webページ検索システムに対するキーワードによる問い合わせにヒットしたページのスコアとURLを取得する過程と、ページデータベースにアクセスして、前記ページが属するページセットIDとページセット木構造におけるルートからの深さ情報を取得する過程と、前記ページセット木構造の深さ情報と前記スコアを基に前記問い合わせに対する適合度を表す得点を計算する過程とを、有する、ことを特徴とするWebページ検索の適合度計算方法を手段とする。 [0007] In order to solve the problems] In order to solve the above problems, the present invention provides a process to get the score and the URL of the page that was hit to an inquiry by the keyword for the Web page retrieval system, access to the page database to represent the process of acquiring the depth information from the root in the page set ID and page set tree structure in which the page belongs, the degree of conformity of the inquiry on the basis of the depth information and the score of the page set tree structure a process of calculating a score comprises, a means for adaptability calculation method of Web page search, characterized in that. 【0008】あるいは、Webページ検索システムに対するキーワードによる問い合わせにヒットしたページのスコアとURL、および該ページが属するページセットIDとページセット木構造におけるルートからの深さ情報を取得する過程と、前記ページセット木構造の深さ情報と前記スコアを基に前記問い合わせに対する適合度を表す得点を計算する過程とを、有する、ことを特徴とするWebページ検索の適合度計算方法を手段とする。 [0008] Alternatively, the process for obtaining the depth information from the Web page score and the URL of the page that was hit to an inquiry by the keyword to the search system, and root in the page set ID and page set tree structure to which the page belongs, the page a process of calculating a score representing the fit depth information set tree structure with respect to the inquiry on the basis of the score, with, and means adaptability calculation method of Web page search, characterized in that. 【0009】あるいは、得点を計算する過程では、ページのスコアが高いほど得点が高くなる関数を有し、ページセット木構造のルートに近いページほど得点が高くなる計算式から得点を計算する、ことを特徴とするWeb [0009] Alternatively, the process of calculating the score, has a function that scores the page becomes higher score higher calculates a score from a calculation of the score the more pages increases closer to the root of the page set tree structure, Web characterized by
ページ検索の適合度計算方法を手段とする。 The goodness-of-fit calculation method of the page to search for the means. 【0010】あるいは、Webページ検索システムに対するキーワードによる問い合わせにヒットしたページのスコアとURLをN件取得する過程と、ページデータベースにアクセスして、前記N件の各ページが属するページセットIDとページセット木構造におけるルートからの深さ情報を取得する過程と、ページ毎に前記ページセット木構造の深さ情報と前記スコアを基に前記問い合わせに対する適合度を表す得点を計算する過程と、ページ毎にヒットページセットリストに前記ページセットID [0010] Alternatively, Web pages and process of page hits to a query by keyword score and the URL to N matter get to the search system, to access the page database, page set ID and page set of each page of the N matter belongs a step of acquiring the depth information from the root in the tree structure, a process of calculating a score representing the fit to the page set depth information of the tree structure for each page for the query based on the score, for each page the page set ID to hit page set list
を登録し、前記計算した得点を前記ヒットページセットリストのページセットIDの得点要素として設定するか、もしくは既にページセットIDが登録されている場合には前記計算した得点をその得点要素に加算する過程と、前記ヒットページセットリストを得点要素の値でソートして出力する過程とを、有する、ことを特徴とするWebページ検索の検索結果表示方法を手段とする。 Registers, wherein when either the calculated scores is set as the score element of the page set ID of the hit page set list, or already page set ID is registered adds the score and the calculated the score elements and process, and a step of outputting the sorted the hit page set list with a value of scoring element comprises, a means for the search result display method of a Web page search, characterized in that. 【0011】あるいは、Webページ検索システムに対するキーワードによる問い合わせにヒットしたページのスコアとURL、および該ページが属するページセットIDとページセット木構造におけるルートからの深さ情報を取得する過程と、ページ毎に前記ページセット木構造の深さ情報と前記スコアを基に前記問い合わせに対する適合度を表す得点を計算する過程と、ページ毎にヒットページセットリストに前記ページセットIDを登録し、前記計算した得点を前記ヒットページセットリストのページセットIDの得点要素として設定するか、もしくは既にページセットIDが登録されている場合には前記計算した得点をその得点要素に加算する過程と、前記ヒットページセットリストを得点要素の値でソートして出力する過程とを、 [0011] Alternatively, the process for obtaining the depth information from the root in the page set ID and page set tree structure that score and the URL of the page that was hit to an inquiry by the keyword for the Web page retrieval system, and the page belongs, each page wherein the process of calculating a score representing the fit page set depth information of the tree structure and for the query based on the score, and registers the page set ID in the hit page set list for each page, and the calculated scores a step of adding the scores obtained by the calculation to the score elements when whether to set as score elements on the page set ID of the hit page set list, or already page set ID has been registered, the hit page set list and the process of sorted output by the value of the scoring element, する、ことを特徴とするWebページ検索の検索結果表示方法を手段とする。 To, and means the search result display method of a Web page search, characterized in that. 【0012】あるいは、得点を計算する過程では、ページのスコアが高いほど得点が高くなる関数を有し、ページセット木構造のルートに近いページほど得点が高くなる計算式からから得点を計算する、ことを特徴とするW [0012] Alternatively, in the process of calculating the score, has a function score of the page becomes higher the score the higher the, to calculate the score from the formula that score as the page is higher closer to the root of the page set tree structure, W, characterized in that
ebページ検索の検索結果表示方法を手段とする。 The search results display method of eb page to search for the means. 【0013】あるいは、Webページ検索システムに対するキーワードによる問い合わせにヒットしたページのスコアとURLを取得する手段と、ページデータベースにアクセスして、前記ページが属するページセットID [0013] Alternatively, the means to get the score and the URL of the page that was hit to an inquiry by the keyword for the Web page retrieval system, to access the page database, page set ID that the page belongs
とページセット木構造におけるルートからの深さ情報を取得する手段と、前記ページセット木構造の深さ情報と前記スコアを基に前記問い合わせに対する適合度を表す得点を計算する手段とを、有する、ことを特徴とするW And means for obtaining depth information from the root in the page set tree structure, and means for calculating a score representing the fit to the inquiry based on the depth information and the score of the page set tree structure having, W, characterized in that
ebページ検索の適合度計算装置を手段とする。 And it means the goodness-of-fit calculation device eb page search. 【0014】あるいは、Webページ検索システムに対するキーワードによる問い合わせにヒットしたページのスコアとURL、および該ページが属するページセットIDとページセット木構造におけるルートからの深さ情報を取得する手段と、前記ページセット木構造の深さ情報と前記スコアを基に前記問い合わせに対する適合度を表す得点を計算する手段とを、有する、ことを特徴とするWebページ検索の適合度計算装置を手段とする。 [0014] Alternatively, the means for acquiring the depth information from the root of the Web page search score and the URL of the page that was hit to an inquiry by the keyword for the system, and page set ID and page set tree structure to which the page belongs, the page and means for calculating a score indicating the suitability of depth information of the set tree structure with respect to the inquiry on the basis of the score, with, and means adaptability calculation device Web page search, characterized in that. 【0015】あるいは、Webページ検索システムに対するキーワードによる問い合わせにヒットしたページのスコアとURLをN件取得する手段と、ページデータベースにアクセスして、前記N件の各ページが属するページセットIDとページセット木構造におけるルートからの深さ情報を取得する手段と、ページ毎に前記ページセット木構造の深さ情報と前記スコアを基に前記問い合わせに対する適合度を表す得点を計算する手段と、ページ毎にヒットページセットリストに前記ページセットID [0015] Alternatively, Web pages and means for N matter get the score and the URL of the page that was hit to an inquiry by the keyword for the search system, to access the page database, page set ID and page set of each page of the N matter belongs means for obtaining depth information from the root in the tree structure, means for calculating a score representing the fit to the page set depth information of the tree structure for each page for the query based on the score, for each page the page set ID to hit page set list
を登録し、前記計算した得点を前記ヒットページセットリストのページセットIDの得点要素として設定するか、もしくは既にページセットIDが登録されている場合には前記計算した得点を得点要素に加算する手段と、 Registers, means for adding the scores obtained by the calculated score elements if either set a score described above, calculated as score elements on the page set ID of the hit page set list, or already page set ID is registered When,
前記ヒットページセットリストを得点要素の値でソートして出力する手段とを、有する、ことを特徴とするWe We that and means for outputting the sorted the hit page set list with a value of scoring element has, characterized in that
bページの検索結果表示装置を手段とする。 The search results display device b page and means. 【0016】あるいは、Webページ検索システムに対するキーワードによる問い合わせにヒットしたページのスコアとURL、および該ページが属するページセットIDとページセット木構造におけるルートからの深さ情報を取得する手段と、ページ毎に前記ページセット木構造の深さ情報と前記スコアを基に前記問い合わせに対する適合度を表す得点を計算する手段と、ページ毎にヒットページセットリストに前記ページセットIDを登録し、前記計算した得点を前記ヒットページセットリストのページセットIDの得点要素として設定するか、もしくは既にページセットIDが登録されている場合には前記計算した得点をその得点要素に加算する手段と、前記ヒットページセットリストを得点要素の値でソートして出力する手段とを、 [0016] Alternatively, the means for acquiring the depth information from the root of the Web page search score and the URL of the page that was hit to an inquiry by the keyword for the system, and page set ID and page set tree structure to which the page belongs, each page said means for calculating a score representing the fit page set depth information of the tree structure and for the query based on the score, the registered page set ID in the hit page set list for each page, and the calculated scores and means for adding the scores obtained by the calculation to the score elements when whether to set as score elements on the page set ID of the hit page set list, or already page set ID has been registered, the hit page set list and means for sorted output by the value of the scoring element, する、ことを特徴とするWebページ検索の検索結果表示装置を手段とする。 To, and means the search results display of a Web page search, characterized in that. 【0017】あるいは、上記のWebページ検索の適合度計算方法における過程を、コンピュータに実行させるためのWebページ検索の適合度計算方法の実行プログラムを手段とする。 [0017] Alternatively, the process in adaptability calculation method of the Web page search, and means for executing the program of adaptability calculation method of Web page search to be executed by a computer. 【0018】あるいは、上記のWebページ検索の検索結果表示方法における過程を、コンピュータに実行させるためのWebページ検索の検索結果表示方法の実行プログラムを手段とする。 [0018] Alternatively, a process in the search result display method of the Web page search, and means for executing the program of the search result display method of a Web page search to be executed by a computer. 【0019】あるいは、上記のWebページ検索の適合度計算方法における過程を、コンピュータに実行させるためのプログラムを、前記コンピュータが読み取りできる記録媒体に記録した、ことを特徴とするWebページ検索の適合度計算方法の実行プログラムを記録した記録媒体を手段とする。 [0019] Alternatively, the process in adaptability calculation method of the Web page search, adaptation of the Web page search for a program to be executed by a computer, the computer is recorded in a recording medium that can read, characterized in that the recording medium recording an execution program of the calculation methods and means. 【0020】あるいは、上記のWebページ検索の検索結果表示方法における過程を、コンピュータに実行させるためのプログラムを、前記コンピュータが読み取りできる記録媒体に記録した、ことを特徴とするWebページ検索の検索結果表示方法の実行プログラムを記録した記録媒体を手段とする。 [0020] Alternatively, a process in the search result display method of the Web page search, a program for causing a computer to execute the computer is recorded in a recording medium that can read, search results Web page search, characterized in that and it means a recording medium storing the execution program of the display method. 【0021】本発明では、Webページ検索システムにおいて、ページ検索結果が得られた場合、キーワードの重みを反映したそのページのスコア、そのページが属するページセットIDおよびページセットの木構造におけるルート(根)からの深さ情報を取得し、そのスコアと深さ情報を反映させた得点を計算することにより、キーワードに対する適合度としての得点を高精度に計算する。 In the present invention, the Web page retrieval system, if the page search result is obtained, the score of the page that reflects the weights of keywords, the root in the tree structure of the page set ID and page set that page belongs (roots It acquires depth information from), by calculating a score that reflects the scores and depth information to calculate the score of the goodness of fit for the keyword with high accuracy. 複数のページ検索結果が得られた場合には、このページ毎の得点をページセットID毎に加算した得点要素でページセットIDをソートすることによって、検索結果をキーワードにマッチングした順番にページセット単位で出力する。 If multiple page search results are obtained by sorting the page set ID in the score elements obtained by adding the scores for each page for each page set ID, pages per set in order of matching a search result to the keyword in the output. 【0022】 【発明の実施の形態】以下、本発明の実施の形態について図を用いて詳細に説明する。 DETAILED DESCRIPTION OF THE INVENTION Hereinafter, embodiments of the present invention will be described in detail with reference to FIG. はじめに、本発明で用いる用語について説明する。 First, a description of terms used in the present invention. 【0023】ランキングとは、ページセットを適合度順にソートして出力する処理のことである。 [0023] The ranking, is the process of output to sort the page set to the goodness-of-fit order. 【0024】ページセットとは、木構造のルート(根) [0024] The page set, the root of the tree structure (root)
となるトップページを持ち、ルートからページセットに属する各ページへのパスが唯一決定されている(各ページは木構造のノードに該当する)ページ集合を意味する。 Have a top page to be, the path to each page belonging to the page set from the root is only determined to have (each page corresponds to a node of the tree structure) refers to the page set. なお、サイトとは、このページセットの一形態である。 It is to be noted that the site, which is an embodiment of this page set. 【0025】ページセットの木構造における深さとは、 [0025] The depth in the tree structure of the page set,
あるページがページセットの木構造のルートからの深さを示す。 A page indicates the depth from the root of the tree structure of the page set. 例えば、あるページがページセットの木構造において、ルートからリンクを2回辿って到達可能な場合、このページのページセット木構造における深さは2 For example, in the tree structure of a page is a page set, if reachable by tracing two links from the root, the depth of the page set tree structure of the page 2
であるという。 That is. ルートの深さは0である。 The depth of the root is zero. 【0026】Webページ検索システムとは、検索の対象であるWebページ集合からキーワードを抽出してインデクスを作成するインデクサ、および検索要求に対して、単語(キーワード)の重みを考慮したスコア付けを行い、スコアの高い順に検索結果のページ(検索にヒットしたページを指定した数だけ返却することが可能な検索サーバからなるシステムである(「情報検索と言語処理」、徳永健伸著、東京大学出版会ISBN4−13− [0026] The Web page retrieval system, perform the indexer to create an index by extracting a keyword from the Web page set is a search of the subject, and to the search request, the scoring that takes into account the weight of the word (keyword) , is a system consisting of a search server that is capable of returning the specified number of pages that were hit in the page (the search of the search results to the high score order ( "information retrieval and language processing", Tokunaga KenShin al., University of Tokyo Press ISBN4-13-
065405−5(以下、文献[1]と呼ぶ)、pp, 065405-5 (hereinafter, referred to as Document [1]), pp,
11−65参照)。 See 11-65). 【0027】スコアとは、あるWebページ検索システムが出力するページに対する適合度を数値化した値である。 [0027] The score is a numerical value of a value obtained fit to output page is a Web page retrieval system. スコアの計算方式は、主にそのページに含まれるキーワードの数(tf)と検索対象となるページ集合のうち、キーワードを含むページ数の逆数(idf)の積を基本とする関数で与えられることが多い(文献[1]p Calculation method of the score mainly among the pages set of number of keywords and (tf) and the search target included in the page, it is given to the function which is based on the product of the reciprocal of the number of pages including the keyword (idf) is large (the literature [1] p
p. p. 26−32参照)。 See 26-32). 【0028】次に、図1に本発明を第1の実施形態例を説明するためのシステム構成例を示す。 [0028] Next, an example system configuration for explaining a first embodiment of the present invention in FIG. 図1において、 In Figure 1,
1はWebページ検索システム、2はページDB(データベース)、3はクライアント端末である。 1 Web page retrieval system, 2 page DB (database), 3 is a client terminal. これらの間の接続は、それぞれの部分で必要なデータがやりとりできれば、その接続の形態は任意である。 Connection between them, if exchanges necessary data with each part, the form of connection is arbitrary. 【0029】Webページ検索システム1は、収集したページからキーワードを抽出したインデクスを格納しているインデクスDB11と検索エンジンを持つ検索サーバを備え、クライアント端末3からのキーワードによる検索要求に応じて、インデクスDB11を検索してキーワードにヒットしたページセットの情報をクライアント端末3へ送信する。 [0029] Web page retrieval system 1, collected the index DB11 storing an index to extract the keywords from the page includes a search server with a search engine, in response to the search request by keyword from the client terminal 3, the index Find the DB11 to send the information on the page set that you hit the keyword to the client terminal 3. ページDB2は、すべてのページI Page DB2, all of the pages I
Dと、そのページが属するページセットIDと、このページセットの木構造からの深さ情報とを蓄積している。 And D, and stores the page set ID to which the page belongs, and the depth information from the tree structure of the page set. 【0030】クライアント端末3は、Webページ検索システム1にキーワードによる問い合わせを行い、We The client terminal 3, makes an inquiry by the keyword in the Web page retrieval system 1, We
bページ検索システム1から問い合わせたキーワードにヒットしたページのスコアとURLをN件受け取る検索手段31と、ページDB2にアクセスして、N件の各ページの属するページセットIDとページセット木構造におけるルートからの深さ情報を得るとともに、ヒットページセットリストに得られたページセットIDを登録するページDBアクセス手段32と、得られたページセット木構造の深さ情報とスコアを基にキーワードに対する適合度を表す得点を計算する得点計算手段33と、計算した得点をヒットページセットリストのページセットI b page Search page that was hit from the system 1 to the query keywords score and the URL and the search means 31 N matter receive, by accessing the page DB2, root in the page set ID and page set tree structure belonging of each page of the N matter with obtaining depth information from a page DB access unit 32 for registering the page set ID obtained in the hit page set list, fit for the keyword based on the depth information and scores obtained page set tree structure the score calculation means 33 to calculate a score that represents the, page set I hit page set list was calculated score
Dの得点要素として設定するか、もしくは既にページセットIDが登録されている場合には計算した得点を得点要素に加算するヒットページセットリスト生成手段34 Either set as score elements and D, or the hit page set list generating unit 34 already when the page set ID is registered for adding the calculated score scoring element
と、生成されたヒットページセットリストを得点要素の値でソートして出力するソート手段35とを有する。 When, and a sorting means 35 for outputting the generated hit page set list sorted by the value of the score elements. 【0031】図2に、上記の構成により実現される本発明の一実施形態例によるランキング処理のフローチャートを示す。 [0031] FIG. 2 shows a flow chart of a ranking process according to an embodiment of the present invention which is realized by the above configuration. S1〜S8は処理のステップである。 S1~S8 is a step in the process. 【0032】まず、Webページ検索システム1に対し、クライアント端末3からキーワードを入力して問い合わせ検索を行い、Webページ検索システム1からキーワードによる問い合わせにヒットしたページに関する情報とともに、そのページのスコアとURLをN件受け取る(S1)。 [0032] First of all, to the Web page retrieval system 1, performs a query search from the client terminal 3 by typing the keyword, along with information about the page that was hit from the Web page retrieval system 1 to a query by keyword, score and the URL of the page the N matter receive (S1). ここで、スコアとは、上記したようにW Here, the score, as described above W
ebページ検索システム1側で単語(キーワード)の重みを考慮して計算されたものである。 In which the weight of words (keywords) is calculated taking into account at eb page retrieval system 1 side. 【0033】次に、得られたURLによってクライアント端末3からページセットDB2にアクセスし、N件の各ページのページセットIDとページセット木構造における深さ情報を取得し(S2)、ヒットページセットリストを空にする(S3)。 Next, the obtained URL by accessing from the client terminal 3 to page set DB2, acquires depth information in the page set ID and page set tree structure of each page of the N by (S2), the hit page set empty the list (S3). 【0034】次に、ループ1により、N件の全てのヒットページについて、ページ毎に以下の処理を繰り返し行う。 [0034] Next, the loop 1, for all hit the pages of N matter, perform the following processing is repeated for each page. 【0035】まず、取得したスコアとページセット木構造の深さ情報を基に検索キーワードへの適合度としてのページの得点を計算する(S4)。 [0035] First, to calculate the score of the page of the depth information of the acquired score and page set tree structure as a goodness-of-fit to the search based on keyword (S4). ここで、ページをp Here, the page p
とした場合のこのページの得点score(p)の計算式は、ヒットした各ページのスコアをs(p)、ページセットの木構造における深さの値をd(p)とすると、次式で表される。 That the formula for this page of the score score (p) of the case where the score of each page hit s (p), the depth value of the tree structure of the page set When d (p), the following equation expressed. 【0036】score(p)=f(s(p))×(1/(α The score (p) = f (s (p)) × (1 / (α
+(d(p)) 2 ×β))) ただし、α、βは0より大で1より小の定数を表し、f + (D (p)) but 2 × β))), α , β represents a small constant than 1 greater than 0, f
はs(p)が高い場合にはscore(p)も高くなるような任意の関数を表す。 Is when s (p) is high representing an arbitrary function such as the higher the score (p). 【0037】次に、ヒットページセットリストにこのページのページセットIDが未登録の場合には(S5)、 Next, in the case page set ID of the page to hit page set list has not been registered (S5),
ヒットページセットリストにこのページのページセットIDを登録し、計算した得点をページセットIDのスコア要素として設定する(S6)。 Register the page set ID of the page to hit page set list, to set the calculated score as the score elements of the page set ID (S6). 【0038】ここで、N件のページをループ1によって繰り返し処理する中で、既にページセットIDが登録されている場合(S5)には、計算した得点を得点要素に加算する(S7)。 [0038] Here, in the repeated processes pages N by the loop 1, already when the page set ID is registered (S5), it adds the calculated score score element (S7). 【0039】最後に、ヒットページセットリストを得点要素でソートして出力し(S8)、終了する。 [0039] Finally, the output to sort the hit page set list in scoring element (S8), to the end. 【0040】図3に、本発明により計算された得点の高/低の一例を、ページセットがサイトの形態をとる場合について示す。 [0040] Figure 3, an example high / low of the scores calculated by the present invention, showing a case where a page set in the form of a site. この場合、本発明により得られるヒットページセットリストは、ヒットサイトリストとなり、検索結果をサイト単位で得ることができる。 In this case, the hit page set list obtained by the present invention will become hit site list, it is possible to obtain the search results on a per-site basis. 【0041】図3(a)では、あるページセットIDを持つサイト構造において、検索でヒットしたページが、 [0041] In FIG. 3 (a), in the site structure with a certain page set ID, a page that was hit in the search,
ルートであるトップページ(深さ値0)とそれに近い第1階層(深さ値1)のページであるため、そのサイトの得点要素は高い値となる。 Home (depth value 0) is the root because a page close the first layer (depth value 1) to it, score element of the site becomes a high value. 一方、図3(b)では、あるページセットIDを持つサイト構造において、検索でヒットしたページが、ルートであるトップページから深い第2階層(深さ値2)のページであるため、そのサイトの得点要素は低い値となる。 On the other hand, in FIG. 3 (b), in site with a certain page set ID, because the page hit by the search is the page of the deep second hierarchy from the top page is the root (depth value 2), the site score element is the low value of. なお、上記のscore(p) It should be noted that the above-mentioned score (p)
の計算式から明らかなように、ページ検索のスコアが高いページを多く含むサイトほど、その得点要素は高い値となる。 Formula As is clear from, the more sites that score page search includes many high page, the scoring element is a high value. 【0042】本発明の第2の実施形態例としては、ページDBが蓄積しているページ毎のページセットIDおよびページセット木構造における深さ情報を、インデクスDBの中に含めてしまう構成が考えられる。 [0042] As a second embodiment of the present invention, considering the depth information in the page set ID and page set tree structure for each page of page DB is accumulated, the configuration will be included in the index DB It is. この場合、 in this case,
クライアント端末3のページDBアクセス手段は不要となり、検索手段31がこれらの情報を取得し、ページセットIDをヒットページセットリストに登録する。 Page DB access means of the client terminal 3 is unnecessary, the search means 31 to obtain this information, to register a page set ID to hit page set list. それ以外の構成、並びにランキング処理は第1の実施形態例と同様である。 Other configurations, as well as ranking process is the same as in the first embodiment. 【0043】さらに、本発明の第3の実施形態例としては、ランキング処理を行うための手段をWebページ検索システム側に持つことが考えられる。 [0043] Further, as a third embodiment of the present invention is considered to have a means for performing the ranking process to the Web page retrieval system side. この場合、第1、第2の実施形態例でのページDBアクセス手段(第2の実施形態例では不要)、得点計算手段、ヒットページセットリスト生成手段、ソート手段手段等はWebページ検索システム側に持つこととなる。 In this case, first, the page DB access unit in the second embodiment (not required in the second embodiment), the score calculating means, the hit page set list generating means, sorting means means such as a Web page retrieval system side so that the have to. これらの手段によって実現されるランキング処理は、第1、第2の実施形態例と同様である。 Ranking process realized by these means, the first, is the same as in the second embodiment. クライアント端末は、検索手段のみを有し、ソート手段からのヒットページセットリストを検索結果として受け取ることとなる。 The client terminal has only search means, and to receive the hit page set list from sorting unit as a search result. 【0044】なお、図1等で示した機能の実現手段をコンピュータのプログラムで構成したり、あるいは図2等で示した処理の手順をコンピュータのプログラムで構成したりして、そのプログラムをコンピュータに実行させることができることは言うまでもなく、コンピュータでその機能を実現するためのプログラム、あるいは、コンピュータにその処理の手順を実行させるためのプログラムを、そのコンピュータが読み取りできる記録媒体、例えば、FD(フロッピーディスク(登録商標))や、M [0044] Incidentally, in or configure constitute means for implementing the functions shown in FIG. 1 or the like in a computer program or a processing sequence shown in FIG. 2 or the like in a computer program, the program in the computer that can be executed, not to mention a recording medium on which a program for realizing the functions in a computer, or a program for executing the steps of the processing in a computer can read the computer, for example, FD (floppy disk (registered trademark)) and, M
O、ROM、メモリカード、CD、DVD、リムーバブルディスクなどに記録して、保存したり、配布したりすることが可能である。 O, ROM, memory card, CD, DVD, and recorded in a removable disk, or stored, it is possible to or distribute. また、上記のプログラムをインターネットや電子メールなど、ネットワークを通して提供することも可能である。 Also, the program such as the Internet or e-mail, can be provided through a network. これらの記録媒体からコンピュータに前記のプログラムをインストールすることにより、あるいはネットワークからダウンロードしてコンピュータに前記のプログラムをインストールすることにより、本発明を実施することが可能となる。 By installing the program from these recording media into the computer, or by installing the program in the computer to download from a network, it is possible to implement the present invention. 【0045】 【発明の効果】以上で説明したとおり、本発明によれば、Webページ検索システムにおいて、ページ検索結果が得られた場合、そのページのスコア、およびそのページが属するページセットIDおよびページセットの木構造におけるルート(根)からの深さ情報を取得し、そのスコアと深さ情報を反映させた得点を計算することで、キーワードに対する適合度としての得点を高精度に計算することができる。 [0045] As described in [Effect of the Invention] According to the present invention, Web in page search system, if the page search result is obtained, the page set ID and page score of the page, and the page belongs It acquires depth information from the root (root) in the tree structure of the set, by calculating a score that reflects the scores and depth information, be calculated scores as fit to keywords with high precision it can. また、複数の検索結果が得られた場合には、このページ毎の得点をページセットID毎に加算した得点要素でページセットIDをソートすることによって、検索結果をキーワードにマッチングした高精度な順番でページセット単位で出力することができる。 When a plurality of search results are obtained, precise order of matched by sorting the page set ID in the score elements obtained by adding the scores for each page for each page set ID, the search results to a keyword in can be output in a page set unit.

【図面の簡単な説明】 【図1】本発明の一実施形態例を実現するためのシステムの構成図である。 It is a configuration diagram of a system for implementing an exemplary embodiment of the BRIEF DESCRIPTION OF THE DRAWINGS [Figure 1] present invention. 【図2】本発明の一実施形態例によるランキング処理を示すフローチャートである。 2 is a flowchart showing a ranking process according to an embodiment of the present invention. 【図3】(a),(b)は、本発明における適合度としての得点の高/低について説明する図である。 [3] (a), (b) are diagrams high / low will be described scored as fit in the present invention. 【符号の説明】 1…Webページ検索システム11…インデクスDB 2…ページDB 3…クライアント端末31…検索手段32…ページDBアクセス手段33…得点計算手段34…ヒットページセットリスト生成手段35…ソート手段 [Reference Numerals] 1 ... Web page retrieval system 11 ... index DB 2 ... page DB 3 ... client terminal 31 ... retrieval means 32 ... page DB access unit 33 ... scoring unit 34 ... hit page set list generating means 35 ... sorting means

Claims (1)

  1. 【特許請求の範囲】 【請求項1】 Webページ検索システムに対するキーワードによる問い合わせにヒットしたページのスコアとURLを取得する過程と、 ページデータベースにアクセスして、前記ページが属するページセットIDとページセット木構造におけるルートからの深さ情報を取得する過程と、 前記ページセット木構造の深さ情報と前記スコアを基に前記問い合わせに対する適合度を表す得点を計算する過程とを、有する、 ことを特徴とするWebページ検索の適合度計算方法。 A step of acquiring the scores and URL of the page that hits the inquiry by keywords for [Claims] [Claim 1] Web page retrieval system, and access the page database, the page set ID and page set the page belongs wherein the steps of obtaining depth information from the root in the tree structure, and a process of calculating a score representing the fit to the inquiry based on the score and depth information of the page set tree structure having, that goodness-of-fit calculation method of the Web page search to. 【請求項2】 Webページ検索システムに対するキーワードによる問い合わせにヒットしたページのスコアとURL、および該ページが属するページセットIDとページセット木構造におけるルートからの深さ情報を取得する過程と、 前記ページセット木構造の深さ情報と前記スコアを基に前記問い合わせに対する適合度を表す得点を計算する過程とを、有する、 ことを特徴とするWebページ検索の適合度計算方法。 2. A process for obtaining depth information from the Web page score and URL of the page that hits the inquiry by the keywords for retrieval system, and the route in the page set ID and page set tree structure to which the page belongs, the page a process of calculating a score representing the fit depth information set tree structure with respect to the inquiry on the basis of the score, with, adaptability calculation method of Web page search, characterized in that. 【請求項3】 得点を計算する過程では、 ページのスコアが高いほど得点が高くなる関数を有し、 In 3. process of calculating the score, it has a function that scores the page becomes higher score the higher the,
    ページセット木構造のルートに近いページほど得点が高くなる計算式から得点を計算する、 ことを特徴とする請求項1または2に記載のWebページ検索の適合度計算方法。 Scoring more pages closer to the root of the page set tree structure to calculate the scores from the higher formula, adaptability calculation method of Web page search according to claim 1 or 2, characterized in that. 【請求項4】 Webページ検索システムに対するキーワードによる問い合わせにヒットしたページのスコアとURLをN件取得する過程と、 ページデータベースにアクセスして、前記N件の各ページが属するページセットIDとページセット木構造におけるルートからの深さ情報を取得する過程と、 ページ毎に前記ページセット木構造の深さ情報と前記スコアを基に前記問い合わせに対する適合度を表す得点を計算する過程と、 ページ毎にヒットページセットリストに前記ページセットIDを登録し、前記計算した得点を前記ヒットページセットリストのページセットIDの得点要素として設定するか、もしくは既にページセットIDが登録されている場合には前記計算した得点をその得点要素に加算する過程と、 前記ヒットページセッ 4. A process of page hits to a query by keyword score and the URL to N matter get to the Web page retrieval system, to access the page database, page set ID and page set of each page of the N matter belongs a step of acquiring the depth information from the root in the tree structure, a process of calculating a score representing the fit to the page set depth information of the tree structure for each page for the query based on the score, for each page registering the page set ID to hit page set list, the calculation in the case of either set a score that was the calculated as the score elements on the page set ID of the hit page set list, or is already a page set ID has been registered and the process for adding the score in the scoring element, the hit page set リストを得点要素の値でソートして出力する過程とを、有する、 ことを特徴とするWebページ検索の検索結果表示方法。 A step of outputting the sorted values ​​of the scoring element list has, the search result display method of a Web page search, characterized in that. 【請求項5】 Webページ検索システムに対するキーワードによる問い合わせにヒットしたページのスコアとURL、および該ページが属するページセットIDとページセット木構造におけるルートからの深さ情報を取得する過程と、 ページ毎に前記ページセット木構造の深さ情報と前記スコアを基に前記問い合わせに対する適合度を表す得点を計算する過程と、 ページ毎にヒットページセットリストに前記ページセットIDを登録し、前記計算した得点を前記ヒットページセットリストのページセットIDの得点要素として設定するか、もしくは既にページセットIDが登録されている場合には前記計算した得点をその得点要素に加算する過程と、 前記ヒットページセットリストを得点要素の値でソートして出力する過程とを、有する、 5. A process for obtaining depth information from the Web page score and URL of the page that hits the inquiry by the keywords for retrieval system, and the route in the page set ID and page set tree structure to which the page belongs, each page wherein the process of calculating a score representing the fit page set depth information of the tree structure and for the query based on the score, and registers the page set ID in the hit page set list for each page, and the calculated scores a step of adding the scores obtained by the calculation to the score elements when whether to set as score elements on the page set ID of the hit page set list, or already page set ID has been registered, the hit page set list a step of sorted output value of the scoring element comprises, ことを特徴とするWebページ検索の検索結果表示方法。 Search results display method of Web page retrieval, characterized in that. 【請求項6】 得点を計算する過程では、 ページのスコアが高いほど得点が高くなる関数を有し、 In 6. process of calculating the score, it has a function that scores the page becomes higher score the higher the,
    ページセット木構造のルートに近いページほど得点が高くなる計算式からから得点を計算する、 ことを特徴とする請求項4または5に記載のWebページ検索の検索結果表示方法。 Scoring more pages closer to the root of the page set tree structure to calculate the scores from the higher formula, the search result display method of a Web page search according to claim 4 or 5, characterized in that. 【請求項7】 Webページ検索システムに対するキーワードによる問い合わせにヒットしたページのスコアとURLを取得する手段と、 ページデータベースにアクセスして、前記ページが属するページセットIDとページセット木構造におけるルートからの深さ情報を取得する手段と、 前記ページセット木構造の深さ情報と前記スコアを基に前記問い合わせに対する適合度を表す得点を計算する手段とを、有する、 ことを特徴とするWebページ検索の適合度計算装置。 7. A means to get the score and the URL of the page that was hit to an inquiry by the keyword for the Web page retrieval system, to access the page database, from the root in the page set ID and page set tree structure in which the page belongs means for obtaining depth information, and means for calculating a score representing the fit to the inquiry based on the score and depth information of the page set tree structure having, a Web page search, characterized in that goodness-of-fit computing device. 【請求項8】 Webページ検索システムに対するキーワードによる問い合わせにヒットしたページのスコアとURL、および該ページが属するページセットIDとページセット木構造におけるルートからの深さ情報を取得する手段と、 前記ページセット木構造の深さ情報と前記スコアを基に前記問い合わせに対する適合度を表す得点を計算する手段とを、有する、 ことを特徴とするWebページ検索の適合度計算装置。 Means for obtaining depth information from the root in the page set ID and page set tree structure score and URL of the page that hits the inquiry by keywords, and the page belongs for 8. Web page retrieval system, the page and means for calculating a score indicating the suitability of depth information of the set tree structure with respect to the inquiry on the basis of the score, with, adaptability calculation device Web page search, characterized in that. 【請求項9】 Webページ検索システムに対するキーワードによる問い合わせにヒットしたページのスコアとURLをN件取得する手段と、 ページデータベースにアクセスして、前記N件の各ページが属するページセットIDとページセット木構造におけるルートからの深さ情報を取得する手段と、 ページ毎に前記ページセット木構造の深さ情報と前記スコアを基に前記問い合わせに対する適合度を表す得点を計算する手段と、 ページ毎にヒットページセットリストに前記ページセットIDを登録し、前記計算した得点を前記ヒットページセットリストのページセットIDの得点要素として設定するか、もしくは既にページセットIDが登録されている場合には前記計算した得点を得点要素に加算する手段と、 前記ヒットページセットリ 9. A means for N matter get the score and the URL of the page that was hit to an inquiry by the keyword for the Web page retrieval system, to access the page database, page set ID and page set of each page of the N matter belongs means for obtaining depth information from the root in the tree structure, means for calculating a score representing the fit to the page set depth information of the tree structure for each page for the query based on the score, for each page registering the page set ID to hit page set list, the calculation in the case of either set a score that was the calculated as the score elements on the page set ID of the hit page set list, or is already a page set ID has been registered and means for adding the score to score element, the hit page set Li トを得点要素の値でソートして出力する手段とを、有する、 ことを特徴とするWebページの検索結果表示装置。 And means for outputting the door sorted by the value of the score elements have, search result display of the Web page, characterized in that. 【請求項10】 Webページ検索システムに対するキーワードによる問い合わせにヒットしたページのスコアとURL、および該ページが属するページセットIDとページセット木構造におけるルートからの深さ情報を取得する手段と、 ページ毎に前記ページセット木構造の深さ情報と前記スコアを基に前記問い合わせに対する適合度を表す得点を計算する手段と、 ページ毎にヒットページセットリストに前記ページセットIDを登録し、前記計算した得点を前記ヒットページセットリストのページセットIDの得点要素として設定するか、もしくは既にページセットIDが登録されている場合には前記計算した得点をその得点要素に加算する手段と、 前記ヒットページセットリストを得点要素の値でソートして出力する手段とを、有する 10. A means for obtaining depth information from a Web page score and URL of the page that hits the inquiry by the keywords for retrieval system, and the route in the page set ID and page set tree structure to which the page belongs, each page said means for calculating a score representing the fit page set depth information of the tree structure and for the query based on the score, the registered page set ID in the hit page set list for each page, and the calculated scores and means for adding the scores obtained by the calculation to the score elements when whether to set as score elements on the page set ID of the hit page set list, or already page set ID has been registered, the hit page set list and means for sorted output value of the scoring element, having 、 ことを特徴とするWebページ検索の検索結果表示装置。 , The search results display of Web page retrieval, characterized in that. 【請求項11】 請求項1から3のいずれか1項に記載のWebページ検索の適合度計算方法における過程を、 11. A process in adaptability calculation method of Web page search according to any one of claims 1 to 3,
    コンピュータに実行させるためのプログラムとした、 ことを特徴とするWebページ検索の適合度計算方法の実行プログラム。 Executables adaptability calculation method of Web page search, wherein the a program to be executed by a computer, that. 【請求項12】 請求項4から6のいずれか1項に記載のWebページ検索の検索結果表示方法における過程を、コンピュータに実行させるためのプログラムとした、 ことを特徴とするWebページ検索の検索結果表示方法の実行プログラム。 12. The process in search result display method of a Web page search according to any one of claims 4 to 6, the search of a Web page search a program to be executed by a computer, characterized by execution program of the results display method. 【請求項13】 請求項1から3のいずれか1項に記載のWebページ検索の適合度計算方法における過程を、 13. The process in adaptability calculation method of Web page search according to any one of claims 1 to 3,
    コンピュータに実行させるためのプログラムとし、 前記プログラムを、前記コンピュータが読み取りできる記録媒体に記録した、 ことを特徴とするWebページ検索の適合度計算方法の実行プログラムを記録した記録媒体。 A program for causing a computer to execute the program, the computer is recorded in a recording medium readable recording medium storing an execution program of the adaptability calculation method of Web page search, characterized in that. 【請求項14】 請求項4から6のいずれか1項に記載のWebページ検索の検索結果表示方法における過程を、コンピュータに実行させるためのプログラムとし、 前記プログラムを、前記コンピュータが読み取りできる記録媒体に記録した、ことを特徴とするWebページ検索の検索結果表示方法の実行プログラムを記録した記録媒体。 14. The process in search result display method of a Web page search according to any one of claims 4 to 6, the program to be executed by a computer, the recording medium the program, the computer can read recording medium storing the execution program of the search result display method of a Web page search for recorded, it characterized in.
JP2001389445A 2001-12-21 2001-12-21 ADAPTATION CALCULATION METHOD AND DEVICE FOR Web PAGE RETRIEVAL, RETRIEVAL RESULT DISPLAY METHOD AND DEVICE FOR Web PAGE RETRIEVAL, AND PERFORMANCE PROGRAM FOR THE SAME METHOD AND RECORDING MEDIUM WITH ITS PROGRAM RECORDED Pending JP2003186912A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001389445A JP2003186912A (en) 2001-12-21 2001-12-21 ADAPTATION CALCULATION METHOD AND DEVICE FOR Web PAGE RETRIEVAL, RETRIEVAL RESULT DISPLAY METHOD AND DEVICE FOR Web PAGE RETRIEVAL, AND PERFORMANCE PROGRAM FOR THE SAME METHOD AND RECORDING MEDIUM WITH ITS PROGRAM RECORDED

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001389445A JP2003186912A (en) 2001-12-21 2001-12-21 ADAPTATION CALCULATION METHOD AND DEVICE FOR Web PAGE RETRIEVAL, RETRIEVAL RESULT DISPLAY METHOD AND DEVICE FOR Web PAGE RETRIEVAL, AND PERFORMANCE PROGRAM FOR THE SAME METHOD AND RECORDING MEDIUM WITH ITS PROGRAM RECORDED

Publications (1)

Publication Number Publication Date
JP2003186912A true true JP2003186912A (en) 2003-07-04

Family

ID=27597663

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001389445A Pending JP2003186912A (en) 2001-12-21 2001-12-21 ADAPTATION CALCULATION METHOD AND DEVICE FOR Web PAGE RETRIEVAL, RETRIEVAL RESULT DISPLAY METHOD AND DEVICE FOR Web PAGE RETRIEVAL, AND PERFORMANCE PROGRAM FOR THE SAME METHOD AND RECORDING MEDIUM WITH ITS PROGRAM RECORDED

Country Status (1)

Country Link
JP (1) JP2003186912A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1973047A1 (en) 2007-03-19 2008-09-24 Ricoh Company, Ltd. Information retrieval system and information retrieval method
US7984389B2 (en) 2006-01-28 2011-07-19 Rowan University Information visualization system
JP2013511085A (en) * 2009-11-12 2013-03-28 アリババ グループ ホールディング リミテッド Search method and system
US9852183B2 (en) 2012-04-26 2017-12-26 Alibaba Group Holding Limited Information providing method and system

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7984389B2 (en) 2006-01-28 2011-07-19 Rowan University Information visualization system
EP1973047A1 (en) 2007-03-19 2008-09-24 Ricoh Company, Ltd. Information retrieval system and information retrieval method
JP2013511085A (en) * 2009-11-12 2013-03-28 アリババ グループ ホールディング リミテッド Search method and system
US9460158B2 (en) 2009-11-12 2016-10-04 Alibaba Group Holding Limited Search method and system
US9870408B2 (en) 2009-11-12 2018-01-16 Alibaba Group Holding Limited Search method and system
US9852183B2 (en) 2012-04-26 2017-12-26 Alibaba Group Holding Limited Information providing method and system

Similar Documents

Publication Publication Date Title
Haveliwala et al. Evaluating strategies for similarity search on the web
US6182063B1 (en) Method and apparatus for cascaded indexing and retrieval
US6564257B1 (en) Repository protection by URL expiration
Ezeife et al. Mining web log sequential patterns with position coded pre-order linked wap-tree
US7194454B2 (en) Method for organizing records of database search activity by topical relevance
US6070157A (en) Method for providing more informative results in response to a search of electronic documents
US20080228675A1 (en) Multi-tiered cascading crawling system
Ke et al. Exploring behavior of E-journal users in science and technology: Transaction log analysis of Elsevier's ScienceDirect OnSite in Taiwan
US20050050014A1 (en) Method, device and software for querying and presenting search results
US7783644B1 (en) Query-independent entity importance in books
US7269546B2 (en) System and method of finding documents related to other documents and of finding related words in response to a query to refine a search
Yuwono et al. WISE: A world wide web resource database system
US20060074905A1 (en) Systems and methods of retrieving topic specific information
US7213198B1 (en) Link based clustering of hyperlinked documents
US20100228715A1 (en) Personalization of Web Search Results Using Term, Category, and Link-Based User Profiles
US20030163454A1 (en) Subject specific search engine
US20050060290A1 (en) Automatic query routing and rank configuration for search queries in an information retrieval system
US20050222989A1 (en) Results based personalization of advertisements in a search engine
Bar-Ilan Data collection methods on the Web for infometric purposes—A review and analysis
US6691105B1 (en) System and method for geographically organizing and classifying businesses on the world-wide web
US7197497B2 (en) Method and apparatus for machine learning a document relevance function
Kao et al. Mining web informative structures and contents based on entropy analysis
US20070276807A1 (en) Search Ranking Method for File System and Related Search Engine
US7953732B2 (en) Searching by using spatial document and spatial keyword document indexes
US20110078140A1 (en) Method and system for user guided search navigation