JP2003186912A - ADAPTATION CALCULATION METHOD AND DEVICE FOR Web PAGE RETRIEVAL, RETRIEVAL RESULT DISPLAY METHOD AND DEVICE FOR Web PAGE RETRIEVAL, AND PERFORMANCE PROGRAM FOR THE SAME METHOD AND RECORDING MEDIUM WITH ITS PROGRAM RECORDED - Google Patents

ADAPTATION CALCULATION METHOD AND DEVICE FOR Web PAGE RETRIEVAL, RETRIEVAL RESULT DISPLAY METHOD AND DEVICE FOR Web PAGE RETRIEVAL, AND PERFORMANCE PROGRAM FOR THE SAME METHOD AND RECORDING MEDIUM WITH ITS PROGRAM RECORDED

Info

Publication number
JP2003186912A
JP2003186912A JP2001389445A JP2001389445A JP2003186912A JP 2003186912 A JP2003186912 A JP 2003186912A JP 2001389445 A JP2001389445 A JP 2001389445A JP 2001389445 A JP2001389445 A JP 2001389445A JP 2003186912 A JP2003186912 A JP 2003186912A
Authority
JP
Japan
Prior art keywords
page
score
page set
hit
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001389445A
Other languages
Japanese (ja)
Inventor
Kenichi Mori
憲一 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2001389445A priority Critical patent/JP2003186912A/en
Publication of JP2003186912A publication Critical patent/JP2003186912A/en
Pending legal-status Critical Current

Links

Abstract

<P>PROBLEM TO BE SOLVED: To perform the keyword retrieval of a Web page retrieval system by outputting retrieval results by page set units in the highly precise order adapted to a keyword. <P>SOLUTION: In a client terminal 3, a retrieving means 31 performs keyword retrieval to a Web page retrieval system 1, and receives the N pieces of scores and URL of hit pages from the retrieval system 1, and a page DB access means 32 obtains the depth of the page set ID and page set tree structure of each page from a route from a page DB 2, and registers the page set ID in a hit page set list, and a score calculating means 33 calculates a score indicating the adaptation to the keyword based on the depth of the page set tree structure and the score. A hit page set list generating means 34 uses the score as the score element of the page set ID of the list, or adds it to an already registered score element, and a sort means 35 sorts the generated hit page set list with the score element, and outputs it. <P>COPYRIGHT: (C)2003,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、Webページ検索
システムに対しキーワードにより問い合わせを行ってペ
ージ情報を検索する際に、キーワードにマッチングして
いる度合い(適合度)を計算する方法と装置、並びに、
キーワードによる検索結果がページ情報として多数得ら
れた場合に、その検索結果を、キーワードにマッチング
している度合いの大きい順にページセット単位で高精度
に表示する方法と装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method and apparatus for calculating the degree of matching (fitness) with a keyword when inquiring a Web page search system with a keyword and searching page information. ,
The present invention relates to a method and apparatus for displaying search results with high accuracy in page set units in descending order of matching with keywords when a large number of search results by keywords are obtained as page information.

【0002】[0002]

【従来の技術】WWW(ワールド・ワイド・ウェブ)に
おいては、Webページ検索システムに対し、クライア
ント端末からキーワードによる問い合わせを行い、キー
ワードにヒットしたページに関する情報を検索すること
ができる。従来、こうしたWebページ検索システムに
よって複数の検索結果が得られた場合、その検索結果の
リスト表示は、検索システムから整理・選別・加工され
ずに出力されるままであるのが一般的である。しかし、
こうしたWebページ検索で得られるページ情報は膨大
になるのが常であり、その中で、どれが真にキーワード
による問い合わせにマッチングした検索結果なのかを知
るには、検索結果に示されたURL(ユニバーサル・リ
ソース・ロケータ)を一つ一つ辿って、そのサイトのペ
ージ集合を参照して捜し出さなければならない、という
多大な手間と労力が必要であった。
2. Description of the Related Art In the WWW (World Wide Web), a client terminal can make an inquiry using a keyword to a Web page search system, and information about a page hit by the keyword can be searched. Conventionally, when a plurality of search results are obtained by such a Web page search system, the list display of the search results is generally output without being sorted, sorted, and processed by the search system. But,
The page information obtained by such a web page search is usually enormous, and in order to know which is the search result that truly matches the query by the keyword, the URL ( It took a lot of time and effort to go through each Universal Resource Locator) and find out by referring to the page set of the site.

【0003】こうした状況を改善するため、検索結果を
順位付けして提示しようとする試みがなされている。例
えば、特開2001−60165に開示された技術で
は、あらかじめサーバ上に存在するページを収集し、各
サーバの間にまたがるリンク参照状況を取得しておき、
そのリンク参照状況を用いて各ページの重要度を判定
し、この重要度にしたがって検索結果をソートして出力
するものであった。
In order to improve such a situation, attempts have been made to rank and present search results. For example, in the technique disclosed in Japanese Patent Laid-Open No. 2001-60165, pages existing on the server are collected in advance and the link reference status across the servers is acquired.
The link reference situation is used to determine the importance of each page, and the search results are sorted and output according to the importance.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、特開2
001−60165に開示された技術では、各サーバの
間にまたがるリンク参照状況からページの重要度を判定
しても、それがキーワードによるWebページ検索にお
いて、キーワードに適合していることとは無関係であ
り、検索結果がキーワードにマッチングしている順にソ
ートされることにならないという大きな問題があった。
[Patent Document 1] Japanese Unexamined Patent Application Publication No.
In the technology disclosed in 001-60165, even if the importance level of a page is determined from the link reference status across each server, it is irrelevant to the fact that it is suitable for the keyword in the Web page search by the keyword. There was a big problem that the search results were not sorted in the order of matching the keywords.

【0005】そのため、結局は、多数の検索結果に示さ
れたURLを一つ一つ辿って、そのサイトのページ集合
を参照して所望のページを捜し出すという多大な手間と
労力が必要になることに変わりはなかった。
Therefore, after all, a great deal of time and effort is required to search for a desired page by referring to the URLs shown in a large number of search results one by one and referring to the page set of the site. There was no change.

【0006】本発明は、Webページ検索システムに対
するキーワードによる問い合わせに対する検索結果から
キーワードに適合する度合いを高精度に計算できる適合
度計算方法および装置を提供するとともに、その検索結
果が複数ある場合には、キーワードに適合している高精
度な順位で検索結果をリスト表示することができる適合
度表示方法および装置を提供することを課題とする。
The present invention provides a matching degree calculating method and apparatus capable of highly accurately calculating the degree of matching with a keyword from a search result with respect to a query by a keyword for a Web page search system. It is an object of the present invention to provide a fitness degree display method and device capable of displaying a list of search results in a highly accurate ranking that matches a keyword.

【0007】[0007]

【課題を解決するための手段】上記の課題を解決するた
め、本発明は、Webページ検索システムに対するキー
ワードによる問い合わせにヒットしたページのスコアと
URLを取得する過程と、ページデータベースにアクセ
スして、前記ページが属するページセットIDとページ
セット木構造におけるルートからの深さ情報を取得する
過程と、前記ページセット木構造の深さ情報と前記スコ
アを基に前記問い合わせに対する適合度を表す得点を計
算する過程とを、有する、ことを特徴とするWebペー
ジ検索の適合度計算方法を手段とする。
In order to solve the above problems, the present invention provides a process of obtaining a score and a URL of a page hit by a keyword inquiry to a Web page search system, and accessing a page database. Obtaining a page set ID to which the page belongs and depth information from the root of the page set tree structure, and calculating a score representing a goodness of fit to the inquiry based on the depth information of the page set tree structure and the score. And a step of performing the following.

【0008】あるいは、Webページ検索システムに対
するキーワードによる問い合わせにヒットしたページの
スコアとURL、および該ページが属するページセット
IDとページセット木構造におけるルートからの深さ情
報を取得する過程と、前記ページセット木構造の深さ情
報と前記スコアを基に前記問い合わせに対する適合度を
表す得点を計算する過程とを、有する、ことを特徴とす
るWebページ検索の適合度計算方法を手段とする。
Alternatively, the process of obtaining the score and URL of the page hit by the keyword inquiry to the Web page search system, the page set ID to which the page belongs and the depth information from the root of the page set tree structure, and the page. A method of calculating a fitness level for Web page retrieval, comprising: a step of calculating a score representing a fitness level for the inquiry based on depth information of a set tree structure and the score.

【0009】あるいは、得点を計算する過程では、ペー
ジのスコアが高いほど得点が高くなる関数を有し、ペー
ジセット木構造のルートに近いページほど得点が高くな
る計算式から得点を計算する、ことを特徴とするWeb
ページ検索の適合度計算方法を手段とする。
Alternatively, in the process of calculating the score, there is a function that the score becomes higher as the page score becomes higher, and the score is calculated from a calculation formula in which the page closer to the root of the page set tree structure has the higher score. Web characterized by
The method of calculating the fitness of page search is used.

【0010】あるいは、Webページ検索システムに対
するキーワードによる問い合わせにヒットしたページの
スコアとURLをN件取得する過程と、ページデータベ
ースにアクセスして、前記N件の各ページが属するペー
ジセットIDとページセット木構造におけるルートから
の深さ情報を取得する過程と、ページ毎に前記ページセ
ット木構造の深さ情報と前記スコアを基に前記問い合わ
せに対する適合度を表す得点を計算する過程と、ページ
毎にヒットページセットリストに前記ページセットID
を登録し、前記計算した得点を前記ヒットページセット
リストのページセットIDの得点要素として設定する
か、もしくは既にページセットIDが登録されている場
合には前記計算した得点をその得点要素に加算する過程
と、前記ヒットページセットリストを得点要素の値でソ
ートして出力する過程とを、有する、ことを特徴とする
Webページ検索の検索結果表示方法を手段とする。
Alternatively, a process of obtaining N scores and URLs of pages hit by an inquiry to a Web page search system by a keyword, and accessing a page database to access the page set ID and page set to which each of the N pages belongs. A step of obtaining depth information from the root in the tree structure, a step of calculating a score representing the suitability for the inquiry based on the depth information and the score of the page set tree structure for each page, and for each page The page set ID in the hit page set list
Is registered and the calculated score is set as the score element of the page set ID of the hit page set list, or if the page set ID is already registered, the calculated score is added to the score element. And a step of sorting the hit page set list by the value of the score element and outputting the list.

【0011】あるいは、Webページ検索システムに対
するキーワードによる問い合わせにヒットしたページの
スコアとURL、および該ページが属するページセット
IDとページセット木構造におけるルートからの深さ情
報を取得する過程と、ページ毎に前記ページセット木構
造の深さ情報と前記スコアを基に前記問い合わせに対す
る適合度を表す得点を計算する過程と、ページ毎にヒッ
トページセットリストに前記ページセットIDを登録
し、前記計算した得点を前記ヒットページセットリスト
のページセットIDの得点要素として設定するか、もし
くは既にページセットIDが登録されている場合には前
記計算した得点をその得点要素に加算する過程と、前記
ヒットページセットリストを得点要素の値でソートして
出力する過程とを、有する、ことを特徴とするWebペ
ージ検索の検索結果表示方法を手段とする。
Alternatively, the process of acquiring the score and URL of the page hit by the inquiry by the keyword to the Web page search system, the page set ID to which the page belongs and the depth information from the root in the page set tree structure, and each page. In the process of calculating a score representing the fitness to the inquiry based on the depth information of the page set tree structure and the score, and registering the page set ID in the hit page set list for each page, and the calculated score Is set as the score element of the page set ID in the hit page set list, or if the page set ID is already registered, the step of adding the calculated score to the score element, and the hit page set list And the process of sorting by the value of the score element and outputting, To, and means the search result display method of a Web page search, characterized in that.

【0012】あるいは、得点を計算する過程では、ペー
ジのスコアが高いほど得点が高くなる関数を有し、ペー
ジセット木構造のルートに近いページほど得点が高くな
る計算式からから得点を計算する、ことを特徴とするW
ebページ検索の検索結果表示方法を手段とする。
Alternatively, in the process of calculating the score, the score is calculated from a formula having a function in which the higher the score of the page, the higher the score, and the closer to the root of the page set tree structure, the higher the score. W characterized by
The search result display method of the eb page search is used as a means.

【0013】あるいは、Webページ検索システムに対
するキーワードによる問い合わせにヒットしたページの
スコアとURLを取得する手段と、ページデータベース
にアクセスして、前記ページが属するページセットID
とページセット木構造におけるルートからの深さ情報を
取得する手段と、前記ページセット木構造の深さ情報と
前記スコアを基に前記問い合わせに対する適合度を表す
得点を計算する手段とを、有する、ことを特徴とするW
ebページ検索の適合度計算装置を手段とする。
Alternatively, a means for acquiring the score and URL of the page hit by the keyword inquiry to the Web page search system, and accessing the page database, the page set ID to which the page belongs
And means for obtaining depth information from the root in the page set tree structure, and means for calculating a score representing the suitability for the query based on the depth information and the score of the page set tree structure, W characterized by
The fitness calculation device for the eb page search is used as a means.

【0014】あるいは、Webページ検索システムに対
するキーワードによる問い合わせにヒットしたページの
スコアとURL、および該ページが属するページセット
IDとページセット木構造におけるルートからの深さ情
報を取得する手段と、前記ページセット木構造の深さ情
報と前記スコアを基に前記問い合わせに対する適合度を
表す得点を計算する手段とを、有する、ことを特徴とす
るWebページ検索の適合度計算装置を手段とする。
Alternatively, the score and URL of the page hit by the keyword inquiry to the Web page search system, the page set ID to which the page belongs and the depth information from the root in the page set tree structure, and the page. A fitness calculation device for Web page search, comprising: depth information of a set tree structure; and means for calculating a score representing the fitness for the inquiry based on the score.

【0015】あるいは、Webページ検索システムに対
するキーワードによる問い合わせにヒットしたページの
スコアとURLをN件取得する手段と、ページデータベ
ースにアクセスして、前記N件の各ページが属するペー
ジセットIDとページセット木構造におけるルートから
の深さ情報を取得する手段と、ページ毎に前記ページセ
ット木構造の深さ情報と前記スコアを基に前記問い合わ
せに対する適合度を表す得点を計算する手段と、ページ
毎にヒットページセットリストに前記ページセットID
を登録し、前記計算した得点を前記ヒットページセット
リストのページセットIDの得点要素として設定する
か、もしくは既にページセットIDが登録されている場
合には前記計算した得点を得点要素に加算する手段と、
前記ヒットページセットリストを得点要素の値でソート
して出力する手段とを、有する、ことを特徴とするWe
bページの検索結果表示装置を手段とする。
Alternatively, a means for acquiring N scores and URLs of pages hit by a keyword inquiry to the Web page search system and a page database to access the page set ID and page set to which each of the N pages belongs. Means for obtaining depth information from the root in the tree structure, means for calculating a score representing the suitability for the inquiry based on the depth information and the score of the page set tree structure for each page, and for each page The page set ID in the hit page set list
Means for setting the calculated score as a score element of the page set ID of the hit page set list, or adding the calculated score to the score element if the page set ID is already registered When,
Means for sorting the hit page set list by the value of the score element and outputting the sorted result.
The search result display device on page b is used as a means.

【0016】あるいは、Webページ検索システムに対
するキーワードによる問い合わせにヒットしたページの
スコアとURL、および該ページが属するページセット
IDとページセット木構造におけるルートからの深さ情
報を取得する手段と、ページ毎に前記ページセット木構
造の深さ情報と前記スコアを基に前記問い合わせに対す
る適合度を表す得点を計算する手段と、ページ毎にヒッ
トページセットリストに前記ページセットIDを登録
し、前記計算した得点を前記ヒットページセットリスト
のページセットIDの得点要素として設定するか、もし
くは既にページセットIDが登録されている場合には前
記計算した得点をその得点要素に加算する手段と、前記
ヒットページセットリストを得点要素の値でソートして
出力する手段とを、有する、ことを特徴とするWebペ
ージ検索の検索結果表示装置を手段とする。
Alternatively, a score and URL of a page hit by a keyword inquiry to the Web page search system, a means for acquiring the page set ID to which the page belongs and depth information from the root in the page set tree structure, and each page. A means for calculating a score representing a goodness of fit for the inquiry based on the depth information of the page set tree structure and the score; and registering the page set ID in a hit page set list for each page, and calculating the score Is set as the score element of the page set ID of the hit page set list, or when the page set ID is already registered, means for adding the calculated score to the score element, and the hit page set list And the means to output by sorting by the value of the score element, To, and means the search results display of a Web page search, characterized in that.

【0017】あるいは、上記のWebページ検索の適合
度計算方法における過程を、コンピュータに実行させる
ためのWebページ検索の適合度計算方法の実行プログ
ラムを手段とする。
Alternatively, a program for executing a fitness calculation method for Web page search for causing a computer to execute the steps in the fitness calculation method for Web page search described above is used as means.

【0018】あるいは、上記のWebページ検索の検索
結果表示方法における過程を、コンピュータに実行させ
るためのWebページ検索の検索結果表示方法の実行プ
ログラムを手段とする。
Alternatively, a program for executing a search result display method for Web page search for causing a computer to execute the above-described process in the search result display method for Web page search is used as means.

【0019】あるいは、上記のWebページ検索の適合
度計算方法における過程を、コンピュータに実行させる
ためのプログラムを、前記コンピュータが読み取りでき
る記録媒体に記録した、ことを特徴とするWebページ
検索の適合度計算方法の実行プログラムを記録した記録
媒体を手段とする。
Alternatively, a program for causing a computer to execute the steps in the method for calculating the fitness for Web page search described above is recorded in a computer-readable recording medium, and the fitness for Web page search is characterized. A recording medium recording an execution program of the calculation method is used as a means.

【0020】あるいは、上記のWebページ検索の検索
結果表示方法における過程を、コンピュータに実行させ
るためのプログラムを、前記コンピュータが読み取りで
きる記録媒体に記録した、ことを特徴とするWebペー
ジ検索の検索結果表示方法の実行プログラムを記録した
記録媒体を手段とする。
Alternatively, a search result display method for a web page, characterized in that a program for causing a computer to execute the steps in the search result display method for the web page search is recorded in a computer-readable recording medium. A recording medium recording an execution program of the display method is used as a means.

【0021】本発明では、Webページ検索システムに
おいて、ページ検索結果が得られた場合、キーワードの
重みを反映したそのページのスコア、そのページが属す
るページセットIDおよびページセットの木構造におけ
るルート(根)からの深さ情報を取得し、そのスコアと
深さ情報を反映させた得点を計算することにより、キー
ワードに対する適合度としての得点を高精度に計算す
る。複数のページ検索結果が得られた場合には、このペ
ージ毎の得点をページセットID毎に加算した得点要素
でページセットIDをソートすることによって、検索結
果をキーワードにマッチングした順番にページセット単
位で出力する。
According to the present invention, when a page search result is obtained in the Web page search system, the score of the page reflecting the weight of the keyword, the page set ID to which the page belongs and the root (root) in the tree structure of the page set. ), The score as the goodness of fit for the keyword is calculated with high accuracy by calculating the score reflecting the score and the depth information. When multiple page search results are obtained, the page set ID is sorted by the score element obtained by adding the score for each page for each page set ID, and the page search units are sorted in order of matching the search results with the keyword. To output.

【0022】[0022]

【発明の実施の形態】以下、本発明の実施の形態につい
て図を用いて詳細に説明する。はじめに、本発明で用い
る用語について説明する。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described in detail below with reference to the drawings. First, terms used in the present invention will be described.

【0023】ランキングとは、ページセットを適合度順
にソートして出力する処理のことである。
Ranking is a process of sorting and outputting page sets in order of suitability.

【0024】ページセットとは、木構造のルート(根)
となるトップページを持ち、ルートからページセットに
属する各ページへのパスが唯一決定されている(各ペー
ジは木構造のノードに該当する)ページ集合を意味す
る。なお、サイトとは、このページセットの一形態であ
る。
A page set is the root of a tree structure.
It means a page set that has a top page that has the following path, and the path from the root to each page belonging to the page set is uniquely determined (each page corresponds to a node of a tree structure). A site is a form of this page set.

【0025】ページセットの木構造における深さとは、
あるページがページセットの木構造のルートからの深さ
を示す。例えば、あるページがページセットの木構造に
おいて、ルートからリンクを2回辿って到達可能な場
合、このページのページセット木構造における深さは2
であるという。ルートの深さは0である。
The depth in the tree structure of the page set is
A page shows the depth from the root of the tree structure of a page set. For example, if a page is reachable by following the link twice from the root in the page set tree structure, the depth of this page in the page set tree structure is 2
That is. The depth of the route is 0.

【0026】Webページ検索システムとは、検索の対
象であるWebページ集合からキーワードを抽出してイ
ンデクスを作成するインデクサ、および検索要求に対し
て、単語(キーワード)の重みを考慮したスコア付けを
行い、スコアの高い順に検索結果のページ(検索にヒッ
トしたページを指定した数だけ返却することが可能な検
索サーバからなるシステムである(「情報検索と言語処
理」、徳永健伸著、東京大学出版会ISBN4−13−
065405−5(以下、文献[1]と呼ぶ)、pp,
11−65参照)。
The Web page search system is an indexer that extracts a keyword from a set of Web pages to be searched to create an index, and a search request is scored in consideration of the weight of a word (keyword). , Pages with search results in descending order of score (This is a system consisting of a search server that can return a specified number of pages that hit the search ("Information Retrieval and Language Processing", Takenobu Tokunaga, The University of Tokyo Press) ISBN4-13-
065405-5 (hereinafter referred to as document [1]), pp,
11-65).

【0027】スコアとは、あるWebページ検索システ
ムが出力するページに対する適合度を数値化した値であ
る。スコアの計算方式は、主にそのページに含まれるキ
ーワードの数(tf)と検索対象となるページ集合のう
ち、キーワードを含むページ数の逆数(idf)の積を基
本とする関数で与えられることが多い(文献[1]p
p.26−32参照)。
The score is a numerical value of the degree of conformity with respect to a page output by a certain web page search system. The score calculation method should be given mainly by a function based on the product of the number of keywords included in the page (tf) and the reciprocal of the number of pages that include the keyword in the search target page set (idf). Many (Reference [1] p
p. 26-32).

【0028】次に、図1に本発明を第1の実施形態例を
説明するためのシステム構成例を示す。図1において、
1はWebページ検索システム、2はページDB(デー
タベース)、3はクライアント端末である。これらの間
の接続は、それぞれの部分で必要なデータがやりとりで
きれば、その接続の形態は任意である。
Next, FIG. 1 shows an example of a system configuration for explaining the first embodiment of the present invention. In FIG.
Reference numeral 1 is a web page search system, 2 is a page DB (database), and 3 is a client terminal. The connection between these components is arbitrary as long as necessary data can be exchanged between the respective parts.

【0029】Webページ検索システム1は、収集した
ページからキーワードを抽出したインデクスを格納して
いるインデクスDB11と検索エンジンを持つ検索サー
バを備え、クライアント端末3からのキーワードによる
検索要求に応じて、インデクスDB11を検索してキー
ワードにヒットしたページセットの情報をクライアント
端末3へ送信する。ページDB2は、すべてのページI
Dと、そのページが属するページセットIDと、このペ
ージセットの木構造からの深さ情報とを蓄積している。
The Web page search system 1 is provided with an index DB 11 that stores indexes in which keywords have been extracted from the collected pages and a search server having a search engine. The DB 11 is searched and the information of the page set hit by the keyword is transmitted to the client terminal 3. Page DB2 is all pages I
D, the page set ID to which the page belongs, and the depth information from the tree structure of this page set are accumulated.

【0030】クライアント端末3は、Webページ検索
システム1にキーワードによる問い合わせを行い、We
bページ検索システム1から問い合わせたキーワードに
ヒットしたページのスコアとURLをN件受け取る検索
手段31と、ページDB2にアクセスして、N件の各ペ
ージの属するページセットIDとページセット木構造に
おけるルートからの深さ情報を得るとともに、ヒットペ
ージセットリストに得られたページセットIDを登録す
るページDBアクセス手段32と、得られたページセッ
ト木構造の深さ情報とスコアを基にキーワードに対する
適合度を表す得点を計算する得点計算手段33と、計算
した得点をヒットページセットリストのページセットI
Dの得点要素として設定するか、もしくは既にページセ
ットIDが登録されている場合には計算した得点を得点
要素に加算するヒットページセットリスト生成手段34
と、生成されたヒットページセットリストを得点要素の
値でソートして出力するソート手段35とを有する。
The client terminal 3 makes an inquiry to the Web page search system 1 using a keyword,
The search means 31 for receiving N scores and URLs of pages hit by the keyword inquired from the b page search system 1 and the page DB 2 are accessed to access the page set ID and the root of the page set tree structure to which each N page belongs. Page DB access means 32 for registering the page set ID obtained in the hit page set list, and the degree of conformity to the keyword based on the depth information and score of the obtained page set tree structure. And a score calculation means 33 for calculating a score representing the calculated score, and the calculated score as page set I in the hit page set list.
The hit page set list generation means 34 is set as the score element of D, or when the page set ID is already registered, the calculated score is added to the score element.
And a sort means 35 for sorting the generated hit page set list by the value of the score element and outputting the sorted result.

【0031】図2に、上記の構成により実現される本発
明の一実施形態例によるランキング処理のフローチャー
トを示す。S1〜S8は処理のステップである。
FIG. 2 shows a flowchart of the ranking process according to the embodiment of the present invention realized by the above-mentioned configuration. S1 to S8 are processing steps.

【0032】まず、Webページ検索システム1に対
し、クライアント端末3からキーワードを入力して問い
合わせ検索を行い、Webページ検索システム1からキ
ーワードによる問い合わせにヒットしたページに関する
情報とともに、そのページのスコアとURLをN件受け
取る(S1)。ここで、スコアとは、上記したようにW
ebページ検索システム1側で単語(キーワード)の重
みを考慮して計算されたものである。
First, a keyword is input to the Web page search system 1 from the client terminal 3 to perform an inquiry search, and information about a page hit by the keyword from the Web page search system 1 is obtained, along with the score and URL of the page. N items are received (S1). Here, the score is W as described above.
This is calculated on the eb page search system 1 side in consideration of the weight of the word (keyword).

【0033】次に、得られたURLによってクライアン
ト端末3からページセットDB2にアクセスし、N件の
各ページのページセットIDとページセット木構造にお
ける深さ情報を取得し(S2)、ヒットページセットリ
ストを空にする(S3)。
Next, the page set DB2 is accessed from the client terminal 3 by the obtained URL, the page set ID of each N pages and the depth information in the page set tree structure are acquired (S2), and the hit page set is obtained. Empty the list (S3).

【0034】次に、ループ1により、N件の全てのヒッ
トページについて、ページ毎に以下の処理を繰り返し行
う。
Next, in loop 1, the following processing is repeated for each page for all N hit pages.

【0035】まず、取得したスコアとページセット木構
造の深さ情報を基に検索キーワードへの適合度としての
ページの得点を計算する(S4)。ここで、ページをp
とした場合のこのページの得点score(p)の計算式
は、ヒットした各ページのスコアをs(p)、ページセ
ットの木構造における深さの値をd(p)とすると、次
式で表される。
First, based on the acquired score and the depth information of the page set tree structure, the score of the page as the matching degree to the search keyword is calculated (S4). Where the page is p
When the score of this page is score (p), the score of each page hit is s (p), and the depth value in the tree structure of the page set is d (p). expressed.

【0036】score(p)=f(s(p))×(1/(α
+(d(p))2×β))) ただし、α、βは0より大で1より小の定数を表し、f
はs(p)が高い場合にはscore(p)も高くなるような
任意の関数を表す。
Score (p) = f (s (p)) × (1 / (α
+ (D (p)) 2 × β))) where α and β represent constants larger than 0 and smaller than 1, and f
Represents an arbitrary function such that when s (p) is high, score (p) is also high.

【0037】次に、ヒットページセットリストにこのペ
ージのページセットIDが未登録の場合には(S5)、
ヒットページセットリストにこのページのページセット
IDを登録し、計算した得点をページセットIDのスコ
ア要素として設定する(S6)。
Next, when the page set ID of this page is not registered in the hit page set list (S5),
The page set ID of this page is registered in the hit page set list, and the calculated score is set as the score element of the page set ID (S6).

【0038】ここで、N件のページをループ1によって
繰り返し処理する中で、既にページセットIDが登録さ
れている場合(S5)には、計算した得点を得点要素に
加算する(S7)。
Here, when the page set ID is already registered during the repeated processing of N pages by the loop 1 (S5), the calculated score is added to the score element (S7).

【0039】最後に、ヒットページセットリストを得点
要素でソートして出力し(S8)、終了する。
Finally, the hit page set list is sorted by point elements and output (S8), and the process ends.

【0040】図3に、本発明により計算された得点の高
/低の一例を、ページセットがサイトの形態をとる場合
について示す。この場合、本発明により得られるヒット
ページセットリストは、ヒットサイトリストとなり、検
索結果をサイト単位で得ることができる。
FIG. 3 shows an example of high / low scores calculated according to the present invention in the case where the page set takes the form of a site. In this case, the hit page set list obtained by the present invention becomes a hit site list, and the search result can be obtained for each site.

【0041】図3(a)では、あるページセットIDを
持つサイト構造において、検索でヒットしたページが、
ルートであるトップページ(深さ値0)とそれに近い第
1階層(深さ値1)のページであるため、そのサイトの
得点要素は高い値となる。一方、図3(b)では、ある
ページセットIDを持つサイト構造において、検索でヒ
ットしたページが、ルートであるトップページから深い
第2階層(深さ値2)のページであるため、そのサイト
の得点要素は低い値となる。なお、上記のscore(p)
の計算式から明らかなように、ページ検索のスコアが高
いページを多く含むサイトほど、その得点要素は高い値
となる。
In FIG. 3A, in the site structure having a certain page set ID, the page hit by the search is
Since the page is the root top page (depth value 0) and the first hierarchy page (depth value 1) close to it, the score element of the site has a high value. On the other hand, in FIG. 3B, in the site structure having a certain page set ID, the page hit by the search is the page of the second hierarchy (depth value 2) deep from the top page that is the root, so that site The scoring element of is a low value. The score (p) above
As is clear from the calculation formula of, the score element has a higher value for a site including many pages with a higher page search score.

【0042】本発明の第2の実施形態例としては、ペー
ジDBが蓄積しているページ毎のページセットIDおよ
びページセット木構造における深さ情報を、インデクス
DBの中に含めてしまう構成が考えられる。この場合、
クライアント端末3のページDBアクセス手段は不要と
なり、検索手段31がこれらの情報を取得し、ページセ
ットIDをヒットページセットリストに登録する。それ
以外の構成、並びにランキング処理は第1の実施形態例
と同様である。
As a second embodiment of the present invention, a configuration in which the page set ID for each page stored in the page DB and the depth information in the page set tree structure are included in the index DB is considered. To be in this case,
The page DB access means of the client terminal 3 becomes unnecessary, and the search means 31 acquires these pieces of information and registers the page set ID in the hit page set list. Other configurations and ranking processing are the same as those in the first embodiment.

【0043】さらに、本発明の第3の実施形態例として
は、ランキング処理を行うための手段をWebページ検
索システム側に持つことが考えられる。この場合、第
1、第2の実施形態例でのページDBアクセス手段(第
2の実施形態例では不要)、得点計算手段、ヒットペー
ジセットリスト生成手段、ソート手段手段等はWebペ
ージ検索システム側に持つこととなる。これらの手段に
よって実現されるランキング処理は、第1、第2の実施
形態例と同様である。クライアント端末は、検索手段の
みを有し、ソート手段からのヒットページセットリスト
を検索結果として受け取ることとなる。
Further, as a third embodiment of the present invention, it is conceivable that the Web page search system side has means for performing ranking processing. In this case, the page DB access means (not required in the second embodiment), the score calculation means, the hit page set list generation means, the sorting means, etc. in the first and second embodiments are on the Web page search system side. Will have. The ranking process realized by these means is the same as in the first and second embodiments. The client terminal has only the search means, and receives the hit page set list from the sort means as the search result.

【0044】なお、図1等で示した機能の実現手段をコ
ンピュータのプログラムで構成したり、あるいは図2等
で示した処理の手順をコンピュータのプログラムで構成
したりして、そのプログラムをコンピュータに実行させ
ることができることは言うまでもなく、コンピュータで
その機能を実現するためのプログラム、あるいは、コン
ピュータにその処理の手順を実行させるためのプログラ
ムを、そのコンピュータが読み取りできる記録媒体、例
えば、FD(フロッピーディスク(登録商標))や、M
O、ROM、メモリカード、CD、DVD、リムーバブ
ルディスクなどに記録して、保存したり、配布したりす
ることが可能である。また、上記のプログラムをインタ
ーネットや電子メールなど、ネットワークを通して提供
することも可能である。これらの記録媒体からコンピュ
ータに前記のプログラムをインストールすることによ
り、あるいはネットワークからダウンロードしてコンピ
ュータに前記のプログラムをインストールすることによ
り、本発明を実施することが可能となる。
The means for realizing the functions shown in FIG. 1 or the like may be configured by a computer program, or the processing procedure shown in FIG. 2 or the like may be configured by a computer program, and the program is stored in the computer. Needless to say, the program can be executed by a computer, or a program for causing a computer to execute the processing procedure can be read by a computer-readable recording medium such as an FD (floppy disk). (Registered trademark)) and M
The data can be recorded in O, ROM, memory card, CD, DVD, removable disk, etc., and can be saved or distributed. It is also possible to provide the above program through a network such as the Internet or electronic mail. The present invention can be implemented by installing the above program in the computer from these recording media, or by downloading from the network and installing the above program in the computer.

【0045】[0045]

【発明の効果】以上で説明したとおり、本発明によれ
ば、Webページ検索システムにおいて、ページ検索結
果が得られた場合、そのページのスコア、およびそのペ
ージが属するページセットIDおよびページセットの木
構造におけるルート(根)からの深さ情報を取得し、そ
のスコアと深さ情報を反映させた得点を計算すること
で、キーワードに対する適合度としての得点を高精度に
計算することができる。また、複数の検索結果が得られ
た場合には、このページ毎の得点をページセットID毎
に加算した得点要素でページセットIDをソートするこ
とによって、検索結果をキーワードにマッチングした高
精度な順番でページセット単位で出力することができ
る。
As described above, according to the present invention, in the Web page search system, when a page search result is obtained, the score of the page, the page set ID and the page set tree to which the page belongs. By acquiring the depth information from the root in the structure and calculating the score reflecting the score and the depth information, the score as the goodness of fit for the keyword can be calculated with high accuracy. Further, when a plurality of search results are obtained, the page set IDs are sorted by the score element obtained by adding the score for each page for each page set ID, and the search result is matched with the keyword in a highly accurate order. Can be output in page set units.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施形態例を実現するためのシステ
ムの構成図である。
FIG. 1 is a configuration diagram of a system for realizing an exemplary embodiment of the present invention.

【図2】本発明の一実施形態例によるランキング処理を
示すフローチャートである。
FIG. 2 is a flowchart showing a ranking process according to an exemplary embodiment of the present invention.

【図3】(a),(b)は、本発明における適合度とし
ての得点の高/低について説明する図である。
3 (a) and 3 (b) are diagrams for explaining high / low of a score as a goodness of fit in the present invention.

【符号の説明】[Explanation of symbols]

1…Webページ検索システム 11…インデクスDB 2…ページDB 3…クライアント端末 31…検索手段 32…ページDBアクセス手段 33…得点計算手段 34…ヒットページセットリスト生成手段 35…ソート手段 1 ... Web page search system 11 ... Index DB 2 ... Page DB 3 ... Client terminal 31 ... Search means 32 ... Page DB access means 33 ... Score calculation means 34. Hit page set list generation means 35 ... Sorting means

Claims (14)

【特許請求の範囲】[Claims] 【請求項1】 Webページ検索システムに対するキー
ワードによる問い合わせにヒットしたページのスコアと
URLを取得する過程と、 ページデータベースにアクセスして、前記ページが属す
るページセットIDとページセット木構造におけるルー
トからの深さ情報を取得する過程と、 前記ページセット木構造の深さ情報と前記スコアを基に
前記問い合わせに対する適合度を表す得点を計算する過
程とを、有する、 ことを特徴とするWebページ検索の適合度計算方法。
1. A process of obtaining a score and URL of a page hit by a keyword inquiry to a Web page search system, and accessing a page database to obtain a page set ID to which the page belongs and a root in a page set tree structure. A step of obtaining depth information, and a step of calculating a score representing a goodness of fit to the query based on the depth information of the page set tree structure and the score, Fitness calculation method.
【請求項2】 Webページ検索システムに対するキー
ワードによる問い合わせにヒットしたページのスコアと
URL、および該ページが属するページセットIDとペ
ージセット木構造におけるルートからの深さ情報を取得
する過程と、 前記ページセット木構造の深さ情報と前記スコアを基に
前記問い合わせに対する適合度を表す得点を計算する過
程とを、有する、 ことを特徴とするWebページ検索の適合度計算方法。
2. A process of obtaining a score and URL of a page hit by a keyword inquiry to the Web page search system, a page set ID to which the page belongs and depth information from the root of the page set tree structure, and the page. A method of calculating a fitness level for Web page search, comprising: a step of calculating a score representing a fitness level for the inquiry based on the depth information of the set tree structure and the score.
【請求項3】 得点を計算する過程では、 ページのスコアが高いほど得点が高くなる関数を有し、
ページセット木構造のルートに近いページほど得点が高
くなる計算式から得点を計算する、 ことを特徴とする請求項1または2に記載のWebペー
ジ検索の適合度計算方法。
3. The process of calculating the score has a function in which the score increases as the page score increases,
The score is calculated from a calculation formula in which the score is higher as the page is closer to the root of the page set tree structure. The fitness calculation method for Web page search according to claim 1, wherein the score is calculated.
【請求項4】 Webページ検索システムに対するキー
ワードによる問い合わせにヒットしたページのスコアと
URLをN件取得する過程と、 ページデータベースにアクセスして、前記N件の各ペー
ジが属するページセットIDとページセット木構造にお
けるルートからの深さ情報を取得する過程と、 ページ毎に前記ページセット木構造の深さ情報と前記ス
コアを基に前記問い合わせに対する適合度を表す得点を
計算する過程と、 ページ毎にヒットページセットリストに前記ページセッ
トIDを登録し、前記計算した得点を前記ヒットページ
セットリストのページセットIDの得点要素として設定
するか、もしくは既にページセットIDが登録されてい
る場合には前記計算した得点をその得点要素に加算する
過程と、 前記ヒットページセットリストを得点要素の値でソート
して出力する過程とを、有する、 ことを特徴とするWebページ検索の検索結果表示方
法。
4. A process of acquiring N scores and URLs of pages hit by a keyword inquiry to a Web page search system, and accessing a page database to access a page database and a page set ID and a page set to which each N page belongs. A step of obtaining depth information from the root in the tree structure, a step of calculating a score representing a goodness of fit to the query based on the depth information of the page set tree structure and the score for each page, and The page set ID is registered in the hit page set list, and the calculated score is set as the score element of the page set ID in the hit page set list, or the page set ID is already calculated when the page set ID is already registered. The process of adding the score obtained to the score element, A step of outputting the sorted values of the scoring element list has, the search result display method of a Web page search, characterized in that.
【請求項5】 Webページ検索システムに対するキー
ワードによる問い合わせにヒットしたページのスコアと
URL、および該ページが属するページセットIDとペ
ージセット木構造におけるルートからの深さ情報を取得
する過程と、 ページ毎に前記ページセット木構造の深さ情報と前記ス
コアを基に前記問い合わせに対する適合度を表す得点を
計算する過程と、 ページ毎にヒットページセットリストに前記ページセッ
トIDを登録し、前記計算した得点を前記ヒットページ
セットリストのページセットIDの得点要素として設定
するか、もしくは既にページセットIDが登録されてい
る場合には前記計算した得点をその得点要素に加算する
過程と、 前記ヒットページセットリストを得点要素の値でソート
して出力する過程とを、有する、 ことを特徴とするWebページ検索の検索結果表示方
法。
5. A process of obtaining a score and URL of a page hit by a keyword inquiry to the Web page search system, a page set ID to which the page belongs and depth information from the root of the page set tree structure, and each page. In the process of calculating the score indicating the goodness of fit to the query based on the depth information of the page set tree structure and the score, the page set ID is registered in the hit page set list for each page, and the calculated score is calculated. As a score element of the page set ID of the hit page set list, or adding the calculated score to the score element when the page set ID is already registered, and the hit page set list And a process of sorting by the value of the score element and outputting, A method for displaying a search result of a web page search, which is characterized in that:
【請求項6】 得点を計算する過程では、 ページのスコアが高いほど得点が高くなる関数を有し、
ページセット木構造のルートに近いページほど得点が高
くなる計算式からから得点を計算する、 ことを特徴とする請求項4または5に記載のWebペー
ジ検索の検索結果表示方法。
6. The process of calculating a score has a function in which the score increases as the page score increases,
6. The search result display method of the Web page search according to claim 4, wherein the score is calculated from a calculation formula in which the score is higher as the page is closer to the root of the page set tree structure.
【請求項7】 Webページ検索システムに対するキー
ワードによる問い合わせにヒットしたページのスコアと
URLを取得する手段と、 ページデータベースにアクセスして、前記ページが属す
るページセットIDとページセット木構造におけるルー
トからの深さ情報を取得する手段と、 前記ページセット木構造の深さ情報と前記スコアを基に
前記問い合わせに対する適合度を表す得点を計算する手
段とを、有する、 ことを特徴とするWebページ検索の適合度計算装置。
7. A means for obtaining the score and URL of a page hit by a query by a keyword to a Web page search system, and accessing a page database to obtain a page set ID to which the page belongs and a root in a page set tree structure. A means for acquiring depth information; and means for calculating a score representing the suitability for the inquiry based on the depth information of the page set tree structure and the score. Fitness calculator.
【請求項8】 Webページ検索システムに対するキー
ワードによる問い合わせにヒットしたページのスコアと
URL、および該ページが属するページセットIDとペ
ージセット木構造におけるルートからの深さ情報を取得
する手段と、 前記ページセット木構造の深さ情報と前記スコアを基に
前記問い合わせに対する適合度を表す得点を計算する手
段とを、有する、 ことを特徴とするWebページ検索の適合度計算装置。
8. A means for acquiring a score and URL of a page hit by a keyword inquiry to a Web page search system, a page set ID to which the page belongs and depth information from a root in a page set tree structure, and the page. A fitness calculation device for Web page search, comprising: depth information of a set tree structure; and means for calculating a score representing the fitness for the inquiry based on the score.
【請求項9】 Webページ検索システムに対するキー
ワードによる問い合わせにヒットしたページのスコアと
URLをN件取得する手段と、 ページデータベースにアクセスして、前記N件の各ペー
ジが属するページセットIDとページセット木構造にお
けるルートからの深さ情報を取得する手段と、 ページ毎に前記ページセット木構造の深さ情報と前記ス
コアを基に前記問い合わせに対する適合度を表す得点を
計算する手段と、 ページ毎にヒットページセットリストに前記ページセッ
トIDを登録し、前記計算した得点を前記ヒットページ
セットリストのページセットIDの得点要素として設定
するか、もしくは既にページセットIDが登録されてい
る場合には前記計算した得点を得点要素に加算する手段
と、 前記ヒットページセットリストを得点要素の値でソート
して出力する手段とを、有する、 ことを特徴とするWebページの検索結果表示装置。
9. A means for obtaining N scores and URLs of pages hit by a keyword inquiry to a Web page search system, and a page database accessed to access a page database and a page set ID and a page set to which each N page belongs. Means for obtaining depth information from the root in the tree structure, means for calculating a score representing the suitability for the inquiry based on the depth information of the page set tree structure and the score for each page, and for each page The page set ID is registered in the hit page set list, and the calculated score is set as the score element of the page set ID in the hit page set list, or the page set ID is already calculated when the page set ID is already registered. Means for adding the score to the score element, and the hit page set list And means for outputting the door sorted by the value of the score elements have, search result display of the Web page, characterized in that.
【請求項10】 Webページ検索システムに対するキ
ーワードによる問い合わせにヒットしたページのスコア
とURL、および該ページが属するページセットIDと
ページセット木構造におけるルートからの深さ情報を取
得する手段と、 ページ毎に前記ページセット木構造の深さ情報と前記ス
コアを基に前記問い合わせに対する適合度を表す得点を
計算する手段と、 ページ毎にヒットページセットリストに前記ページセッ
トIDを登録し、前記計算した得点を前記ヒットページ
セットリストのページセットIDの得点要素として設定
するか、もしくは既にページセットIDが登録されてい
る場合には前記計算した得点をその得点要素に加算する
手段と、 前記ヒットページセットリストを得点要素の値でソート
して出力する手段とを、有する、 ことを特徴とするWebページ検索の検索結果表示装
置。
10. A means for acquiring a score and URL of a page hit by a keyword inquiry to the Web page search system, a page set ID to which the page belongs and depth information from the root of the page set tree structure, and each page. A means for calculating a score representing a goodness of fit to the inquiry based on the depth information of the page set tree structure and the score; and registering the page set ID in a hit page set list for each page, and calculating the score Is set as the score element of the page set ID of the hit page set list, or if the page set ID is already registered, means for adding the calculated score to the score element, and the hit page set list And means for outputting the value by sorting by the value of the score element, A search result display device for Web page search, characterized in that.
【請求項11】 請求項1から3のいずれか1項に記載
のWebページ検索の適合度計算方法における過程を、
コンピュータに実行させるためのプログラムとした、 ことを特徴とするWebページ検索の適合度計算方法の
実行プログラム。
11. A process in a method for calculating a fitness level for Web page search according to claim 1,
An execution program of a fitness calculation method for Web page search, which is a program to be executed by a computer.
【請求項12】 請求項4から6のいずれか1項に記載
のWebページ検索の検索結果表示方法における過程
を、コンピュータに実行させるためのプログラムとし
た、 ことを特徴とするWebページ検索の検索結果表示方法
の実行プログラム。
12. A web page search search, characterized in that a program for causing a computer to execute the steps in the search result display method of a web page search according to any one of claims 4 to 6. Execution program of result display method.
【請求項13】 請求項1から3のいずれか1項に記載
のWebページ検索の適合度計算方法における過程を、
コンピュータに実行させるためのプログラムとし、 前記プログラムを、前記コンピュータが読み取りできる
記録媒体に記録した、 ことを特徴とするWebページ検索の適合度計算方法の
実行プログラムを記録した記録媒体。
13. A process in a method for calculating a fitness level for Web page search according to claim 1,
A recording medium having a program to be executed by a computer, the program being recorded on a computer-readable recording medium, the recording medium storing an execution program of a method for calculating a fitness level for Web page search.
【請求項14】 請求項4から6のいずれか1項に記載
のWebページ検索の検索結果表示方法における過程
を、コンピュータに実行させるためのプログラムとし、 前記プログラムを、前記コンピュータが読み取りできる
記録媒体に記録した、ことを特徴とするWebページ検
索の検索結果表示方法の実行プログラムを記録した記録
媒体。
14. A program for causing a computer to execute the steps in the search result display method of a web page search according to claim 4, wherein the program is readable by the computer. A recording medium storing an execution program of a search result display method for a web page search, which is recorded in the above.
JP2001389445A 2001-12-21 2001-12-21 ADAPTATION CALCULATION METHOD AND DEVICE FOR Web PAGE RETRIEVAL, RETRIEVAL RESULT DISPLAY METHOD AND DEVICE FOR Web PAGE RETRIEVAL, AND PERFORMANCE PROGRAM FOR THE SAME METHOD AND RECORDING MEDIUM WITH ITS PROGRAM RECORDED Pending JP2003186912A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001389445A JP2003186912A (en) 2001-12-21 2001-12-21 ADAPTATION CALCULATION METHOD AND DEVICE FOR Web PAGE RETRIEVAL, RETRIEVAL RESULT DISPLAY METHOD AND DEVICE FOR Web PAGE RETRIEVAL, AND PERFORMANCE PROGRAM FOR THE SAME METHOD AND RECORDING MEDIUM WITH ITS PROGRAM RECORDED

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001389445A JP2003186912A (en) 2001-12-21 2001-12-21 ADAPTATION CALCULATION METHOD AND DEVICE FOR Web PAGE RETRIEVAL, RETRIEVAL RESULT DISPLAY METHOD AND DEVICE FOR Web PAGE RETRIEVAL, AND PERFORMANCE PROGRAM FOR THE SAME METHOD AND RECORDING MEDIUM WITH ITS PROGRAM RECORDED

Publications (1)

Publication Number Publication Date
JP2003186912A true JP2003186912A (en) 2003-07-04

Family

ID=27597663

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001389445A Pending JP2003186912A (en) 2001-12-21 2001-12-21 ADAPTATION CALCULATION METHOD AND DEVICE FOR Web PAGE RETRIEVAL, RETRIEVAL RESULT DISPLAY METHOD AND DEVICE FOR Web PAGE RETRIEVAL, AND PERFORMANCE PROGRAM FOR THE SAME METHOD AND RECORDING MEDIUM WITH ITS PROGRAM RECORDED

Country Status (1)

Country Link
JP (1) JP2003186912A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100370459C (en) * 2005-12-08 2008-02-20 华为技术有限公司 Method and apparatus for reducing paging data retrieve time
EP1973047A1 (en) 2007-03-19 2008-09-24 Ricoh Company, Ltd. Information retrieval system and information retrieval method
US7984389B2 (en) 2006-01-28 2011-07-19 Rowan University Information visualization system
JP2013511085A (en) * 2009-11-12 2013-03-28 アリババ グループ ホールディング リミテッド Search method and system
US9852183B2 (en) 2012-04-26 2017-12-26 Alibaba Group Holding Limited Information providing method and system
CN108763469A (en) * 2018-05-29 2018-11-06 郑州云海信息技术有限公司 A kind of data base query method and device

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100370459C (en) * 2005-12-08 2008-02-20 华为技术有限公司 Method and apparatus for reducing paging data retrieve time
US7984389B2 (en) 2006-01-28 2011-07-19 Rowan University Information visualization system
EP1973047A1 (en) 2007-03-19 2008-09-24 Ricoh Company, Ltd. Information retrieval system and information retrieval method
JP2013511085A (en) * 2009-11-12 2013-03-28 アリババ グループ ホールディング リミテッド Search method and system
US9460158B2 (en) 2009-11-12 2016-10-04 Alibaba Group Holding Limited Search method and system
US9870408B2 (en) 2009-11-12 2018-01-16 Alibaba Group Holding Limited Search method and system
US9852183B2 (en) 2012-04-26 2017-12-26 Alibaba Group Holding Limited Information providing method and system
CN108763469A (en) * 2018-05-29 2018-11-06 郑州云海信息技术有限公司 A kind of data base query method and device

Similar Documents

Publication Publication Date Title
KR101076894B1 (en) System and method for incorporating anchor text into ranking search results
US6112203A (en) Method for ranking documents in a hyperlinked environment using connectivity and selective content analysis
US9940398B1 (en) Customization of search results for search queries received from third party sites
US6560600B1 (en) Method and apparatus for ranking Web page search results
US6321228B1 (en) Internet search system for retrieving selected results from a previous search
US7630973B2 (en) Method for identifying related pages in a hyperlinked database
US6321220B1 (en) Method and apparatus for preventing topic drift in queries in hyperlinked environments
US8095538B2 (en) Annotation index system and method
US9081861B2 (en) Uniform resource locator canonicalization
US7447684B2 (en) Determining searchable criteria of network resources based on a commonality of content
EP1653380A1 (en) Web page ranking with hierarchical considerations
US20030120654A1 (en) Metadata search results ranking system
WO2001016807A1 (en) An internet search system for tracking and ranking selected records from a previous search
JP5084858B2 (en) Summary creation device, summary creation method and program
WO2012071169A2 (en) Efficient forward ranking in a search engine
JP2007256992A (en) Content specifying method and device
US20080275877A1 (en) Method and system for variable keyword processing based on content dates on a web page
JP2009122807A (en) Associative retrieval system
JP4824070B2 (en) Search processing apparatus, search processing method and program for selecting seed of crawler for specialized search using click log
JP2007334590A (en) Method, device and program for information ranking, and computer readable recording medium
JP2003186912A (en) ADAPTATION CALCULATION METHOD AND DEVICE FOR Web PAGE RETRIEVAL, RETRIEVAL RESULT DISPLAY METHOD AND DEVICE FOR Web PAGE RETRIEVAL, AND PERFORMANCE PROGRAM FOR THE SAME METHOD AND RECORDING MEDIUM WITH ITS PROGRAM RECORDED
JP4759600B2 (en) Text search device, text search method, text search program and recording medium thereof
JP5286007B2 (en) Document search device, document search method, and document search program
US20130091166A1 (en) Method and apparatus for indexing information using an extended lexicon
JP2003173351A (en) Method, device, program and storage medium for analysis, collection and retrieval of information