JP2003076715A - ウェブページ検索方法、ウェブページ検索装置、プログラム、および記録媒体 - Google Patents

ウェブページ検索方法、ウェブページ検索装置、プログラム、および記録媒体

Info

Publication number
JP2003076715A
JP2003076715A JP2002003696A JP2002003696A JP2003076715A JP 2003076715 A JP2003076715 A JP 2003076715A JP 2002003696 A JP2002003696 A JP 2002003696A JP 2002003696 A JP2002003696 A JP 2002003696A JP 2003076715 A JP2003076715 A JP 2003076715A
Authority
JP
Japan
Prior art keywords
web page
user
search
popularity
visited
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002003696A
Other languages
English (en)
Other versions
JP3802813B2 (ja
Inventor
Lee Jun-Ho
ジュン−ホ,リ−
Che Byon-Yoppu
ビョン−ヨップ,チェ
An Jon-Suu
ジョン−スー,アン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NHN Corp
Original Assignee
NHN Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NHN Corp filed Critical NHN Corp
Publication of JP2003076715A publication Critical patent/JP2003076715A/ja
Application granted granted Critical
Publication of JP3802813B2 publication Critical patent/JP3802813B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Engineering & Computer Science (AREA)
  • Information Transfer Between Computers (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)

Abstract

(57)【要約】 【課題】 ユーザコンピュータのディスクキャッシュ情
報を用いて抽出したウェブページ別の訪問人気度に基づ
くウェブページ検索方法およびその装置を提供する。 【解決手段】 (a)ユーザが訪問したウェブページに
関するURL情報を受信するステップと、(b)上記受
信したURL情報からIPアドレスを確認して重複ドメ
インを除去し、ユーザ別に訪問したURL情報を抽出す
るステップと、(c)上記ユーザ別に訪問したURL情
報をウェブページ別の訪問回数順に再整列するステップ
と、(d)上記ウェブページ別の訪問回数を訪問人気度
に換算して貯蔵するステップとを含む。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はインターネット上の
ウェブページ検索方法およびウェブページ検索装置に係
り、特に、ユーザディスクキャッシュ情報を用いて抽出
したページ別の訪問人気度に基づくウェブページ検索方
法、ウェブページ検索装置、プログラム、および記録媒
体に関する。
【0002】
【従来の技術】従来のウェブページ検索方法によりワー
ルドワイドウェブ(WWW)上のウェブページについて
提供されていた検索結果は、ユーザのウェブページまた
はサーバ上のウェブページに対する人気度に関係せず
に、検索のために用いられた単語を含むか否かが反映さ
れていた。
【0003】さらに詳述すれば、従来のウェブページ検
索方法では、検索ロボットを用いて分類およびデータベ
ース化がなされたインターネットサイトの資料に対し
て、ユーザが検索しようとする単語を入力し、入力され
た単語とマッチングされるサイト情報を提供する。ある
いは、検索エンジンを提供する会社が構築した分類ツリ
ーに従って、ユーザが所望のサイトを捜し出す。
【0004】上記した従来の検索方式による検索結果に
は、ユーザの実際の訪問人気度が反映されていないの
で、実際のユーザの意図とは関係ない検索結果が提供さ
れる場合がある。すなわち、従来の検索方式による検索
結果は、実際のインターネットユーザのウェブサイト人
気度を反映するような現実的な検索結果とは言えない。
【0005】従来のウェブページ検索方法において、文
書に対する加重値は以下の式(1)に基づき計算され
る。
【0006】 (文書加重値)=α×類似度+(1-α)×リンク人気度 …式(1) ここで、検索語が文章である場合にはα>0.5、検索
質疑語が単語である場合にはα<0.5である。
【0007】また、さらに他の従来のウェブページ検索
方法では、検索対象の内容に関する情報と、その情報に
リンクされているページ数とにより、検索結果を提供し
ていた。しかし、実際に、インターネットウェブユーザ
がいかなるサイトを主として訪問するか否かということ
を考慮していないため、ユーザが訪問する可能性が大き
いサイトを検索結果に反映できないという問題がある。
【0008】
【発明が解決しようとする課題】本発明は、上記従来の
問題点に鑑みなされたものであって、その目的は、ユー
ザディスクキャッシュ情報を用いて抽出したウェブペー
ジ別の訪問人気度に基づくウェブページ検索方法および
その装置を提供することにある。
【0009】本発明の他の技術的課題は、上記方法をコ
ンピュータにて実行させるためのプログラムを記録した
コンピュータにて読取り可能な記録媒体を提供すること
にある。
【0010】
【課題を解決するための手段】本発明のウェブページ検
索方法は、上記課題を解決するため、ユーザディスクキ
ャッシュ情報を用いて抽出したウェブページ別の訪問人
気度に基づくウェブページ検索方法において、(a)ユ
ーザが訪問したウェブページに関するURL情報を受信
するステップと、(b)上記受信したURL情報からI
Pアドレスを確認して重複ドメインを除去し、ユーザ別
に訪問したURL情報を抽出するステップと、(c)上
記ユーザ別に訪問したURL情報をウェブページ別の訪
問回数順に再整列するステップと、(d)上記ウェブペ
ージ別の訪問回数を訪問人気度に換算して貯蔵するステ
ップとを含むことを特徴としている。
【0011】また、本発明のウェブページ検索方法は、
上記課題を解決するため、上記構成のウェブページ検索
方法において、上記(a)ステップが、許可されたユー
ザのユーザディスクキャッシュ情報から上記ユーザが訪
問したウェブページのURL情報を収集するステップで
あることを特徴としている。
【0012】また、本発明のウェブページ検索方法は、
上記課題を解決するため、上記構成のウェブページ検索
方法において、上記(d)ステップが、上記ウェブペー
ジのうちいずれか一つのウェブページを実際に訪問した
訪問者数を全体ウェブページの訪問者数に対する割合で
表わして貯蔵するステップであることを特徴としてい
る。
【0013】また、本発明のウェブページ検索方法は、
上記課題を解決するため、上記構成のウェブページ検索
方法において、上記ウェブページに他のウェブページが
リンクされているリンク人気度または上記ウェブページ
に含まれた上記検索語の頻度数を表わす類似度を計算し
て貯蔵するステップをさらに含むことを特徴としてい
る。
【0014】また、本発明のウェブページ検索方法は、
上記課題を解決するため、ユーザディスクキャッシュ情
報を用いて抽出したウェブページ別の訪問人気度に基づ
くウェブページ検索方法において、(a)ユーザから入
力した検索語を含むウェブページを抽出するステップ
と、(b)上記抽出したウェブページを所定の加重値に
より再整列するステップと、(c)上記ユーザが選択し
た出力類型でウェブページのリストを提供するステップ
とを含むことを特徴としている。
【0015】また、本発明のウェブページ検索方法は、
上記課題を解決するため、上記構成のウェブページ検索
方法において、上記(a)ステップが、上記検索語を索
引語とするウェブページの住所を抽出することを特徴と
している。
【0016】本発明のウェブページ検索方法は、上記課
題を解決するため、上記構成のウェブページ検索方法に
おいて、上記(b)ステップが、上記検索語により抽出
したウェブページに対する実際の訪問人気度、上記ウェ
ブページがリンクされているリンク人気度または上記ウ
ェブページに上記検索語が含まれている頻度数による類
似度のうち少なくとも一つを適用して再整列することを
特徴としている。
【0017】本発明のウェブページ検索装置は、上記課
題を解決するため、ユーザディスクキャッシュ情報を用
いて抽出したウェブページ別の訪問人気度に基づくウェ
ブページ検索装置において、ユーザが訪問したウェブペ
ージに関するURL情報またはユーザが入力した検索語
を入力される入力部と、上記受信したURL情報からI
Pアドレスを確認して重複ドメインを除去し、ユーザ別
に訪問したURL情報を抽出するURL抽出部と、上記
入力された検索語を含むウェブページに対するURLを
検索して抽出する検索部と、上記ユーザ別に訪問したU
RL情報をウェブページ別の訪問回数順に再整列するウ
ェブページ配列部と、上記ウェブページに対する訪問人
気度を所定の値に換算して貯蔵する貯蔵部と、上記検索
部で抽出したウェブページに対するURLをユーザに提
供する出力部とを含むことを特徴としている。
【0018】また、本発明のウェブページ検索装置は、
上記課題を解決するため、上記構成のウェブページ検索
装置において、上記貯蔵部が、上記ウェブページのUR
L情報を貯蔵するウェブページデータベースと、上記ウ
ェブページに含まれた単語を索引して貯蔵する索引デー
タベースとを含むことを特徴としている。
【0019】また、本発明のプログラムは、上記いずれ
かの構成のウェブページ検索方法をコンピュータにて実
行させるためのプログラムであることを特徴としてい
る。
【0020】また、本発明の記録媒体は、上記構成のプ
ログラムを記録したコンピュータ読取り可能な記録媒体
であることを特徴としている。
【0021】
【発明の実施の形態】本発明の実施の一形態について図
1ないし図4に基づいて説明すれば以下の通りである。
【0022】図1は、本発明によるユーザディスクキャ
ッシュ情報を用いて抽出したウェブページ別の訪問人気
度に基づくウェブページのURL情報を貯蔵する方法を
示したフローチャートである。該方法では、ユーザが訪
問したウェブページのURL情報のドメイン名を正規化
して各ウェブページ別の訪問人気度を貯蔵する。
【0023】図2は、本発明による検索方法によりリン
ク人気度を計算する手順を説明するため、複数のウェブ
ページにリンクが張られた状態を示す図である。図2に
ついての詳細な説明はリンク人気度の計算と共にする。
【0024】図1に示すように、事前同意を得たインタ
ーネットユーザのブラウザーディスクキャッシュファイ
ルを抽出するか、あるいはユーザが訪問したウェブペー
ジに関するURL情報を受信する(ステップ110、以
下ステップを単にSと記載する)。
【0025】次に、受信したURL情報で通信規約を表
わす部分(たとえば、http://)を除去する(S12
0)。次に、各ウェブページのドメイン名に対するIP
アドレスを確認して重複ドメインを除去し、ユーザ別に
訪問したURL情報を抽出する(S130)。
【0026】次に、ウェブページ別の訪問回数により、
ユーザ別に訪問したURL情報を再整列する(S14
0)。次に、各ウェブページに対する訪問人気度を計算
して貯蔵する(S150)。
【0027】なお、訪問人気度の計算は、ユーザ別の訪
問ページに対する統計を通じてなされる。すなわち、n
名のユーザを、U1,U2,U3,…,Unとして区別
するとともに、ユーザ別のウェブページ訪問結果をペー
ジ別の訪問回数を用いて再整列する。したがって、訪問
人気度は、以下の式(2)に基づいて計算される。
【0028】 訪問人気度=実際の訪問者数/全体ユーザ数 …式(2) また、ウェブページに含まれている単語の頻度数および
ウェブページを配列する文字等の類似度順にウェブペー
ジのURL情報を貯蔵する。
【0029】一方、ウェブページのリンク人気度は、以
下に説明するような方式により求めることができる。
【0030】図2は、リンク人気度を説明するために、
一つのウェブページに他のウェブページがリンクされて
いる関係を示している。
【0031】たとえば、全ての基本ウェブページはI
(0)の基本人気値を有していると仮定する。ウェブペ
ージPのリンク人気度を計算するためには、ウェブペー
ジPにリンクされているウェブページの個数を測定すれ
ばよい。
【0032】すなわち、図2に示すように、ウェブペー
ジAは外部に向かう3つのリンクのツリーのうち一つが
ウェブページPを指定しており、ウェブページBは外部
に向かう2つのリンクのツリーのうち一つがPを指定し
ており、ウェブページCは外部に向かう1つのリンクが
ウェブページPを指定している。このため、ウェブペー
ジPのリンク人気度は、以下の式(3)により計算され
る。
【0033】 (ウェブページPのリンク人気度) =(ウェブページPの基本人気値)+(ページAからのリンク人気値) +(ページBからのリンク人気値)+(ページCからのリンク人気値) =I(0)+I(0)/3+I(0)/2+I(0)/1 …式(3) なお、基本人気値I(0)の値は、サービス方法により
各種の数値を有しうる。
【0034】図3は、本発明によるユーザディスクキャ
ッシュ情報を用いて抽出したウェブページ別の訪問人気
度に基づくウェブページ検索方法を示したものである。
すなわち、本発明によるウェブページ検索方法では、ユ
ーザから検索語を入力されてその検索語に該当するウェ
ブページを提供する際、ウェブページの訪問人気度、リ
ンク人気度、あるいは類似度のうち少なくとも一つに該
当する順位に従い配列してウェブページを提供する。
【0035】図3に示すように、先ず、ユーザが検索語
を入力する(S310)。その後、その検索語を含むウ
ェブページを抽出する(S320)。さらに、抽出した
ウェブページを訪問人気度、類似度、あるいはリンク人
気度のうち少なくとも一つの順位に従い再配列する(S
330)。
【0036】ウェブページを訪問人気度、類似度、また
はリンク人気度に従い検索するそれぞれの場合について
説明すれば以下の通りである。
【0037】先ず、ユーザが一つの検索語を入力して検
索語に対する結果としてn個の文書情報を検索した場
合、以下の表1に示すように、類似度による検索結果
は、類似度、すなわち、検索語の頻度数が高い文書から
順に示される。
【0038】
【表1】
【0039】また、ウェブページにリンクされている他
のウェブページの多少を表わすリンク人気度による文書
の検索結果は、以下の表2の通りである。
【0040】
【表2】
【0041】一方、ユーザがウェブページを実際に訪問
した回数を表す訪問人気度による結果は、下記表3の通
りである。
【0042】
【表3】
【0043】上記表1〜表3において、類似度の検索を
通じて得た結果値、リンク人気度を通じて得た結果値ま
たは訪問人気度を通じて得た結果値を、以下の式(4)
に基づいて求められる文書加重値により再整列する。
【0044】 (文書加重値) =α×類似度+β×リンク人気度+γ×訪問人気度 …式(4) (なお、α+β+γ=1) すなわち、αの値が大きい場合には類似度に、βの値が
大きい場合にはリンク人気度に、γの値が大きい場合に
は訪問人気度に比重をおいた検索結果を表わすことにな
る。
【0045】ユーザが類似度、リンク人気度または訪問
人気度のうち少なくとも一つの加重値に比重をおく類型
を選択すれば、ユーザが選択した出力類型により出力す
る(S340)。
【0046】図4は、本発明によるユーザディスクキャ
ッシュ情報を用いて抽出したウェブページ別の訪問人気
度に基づくウェブページ検索装置を示したものである。
【0047】受信部410は、事前に同意を得たユーザ
端末380a・380bのブラウザーディスクキャッシ
ュファイルから、ウェブページのURL情報を収集す
る。また、受信部410は、ユーザが入力した検索語を
インターネットを通じて受信する。
【0048】URL抽出部420は、その情報でURL
情報を正規化して訪問者別のウェブページのURL情報
を抽出するとともに、各ウェブページに対して実際の訪
問者数を全体訪問者数に対する比率で表わした訪問人気
度を計算してウェブページデータベース460に貯蔵す
る。
【0049】検索部430は、その検索語を含むウェブ
ページを索引データベース470で検索して抽出する。
ウェブページデータベース360は、訪問人気度、類似
度またはリンク人気度別にウェブページの情報を貯蔵し
ている。索引データベース370は、ウェブページで検
索した単語または文章などを貯蔵しており、ウェブペー
ジにリングされている。
【0050】ウェブページ配列部440は、検索部43
0で抽出したウェブページを式(4)に従い再整列す
る。出力部450は、再整列された文書をユーザが選択
した類型(たとえば、訪問人気度順、類似度順またはリ
ンク人気度順)にウェブページ出力リストを提供する。
【0051】
【発明の効果】以上述べたように、本発明によれば、ユ
ーザのディスクキャッシュファイルにより直接的に反映
されたウェブページのURL情報を収集してその情報を
ウェブページ別の人気度、リンク人気度または内容の類
似度に従い貯蔵するので、ユーザが入力した検索語を含
むウェブページを人気度、リンク人気度または内容の類
似度別に抽出してユーザに提供することにより、より関
連性の高い検索結果が提供できる。
【0052】なお、本発明は、コンピュータにて読取り
可能な記録媒体にコンピュータにて読取り可能なコード
で実現できる。なお、コンピュータにて読取り可能な記
録媒体とは、コンピュータシステムにて読取り可能なデ
ータが貯蔵されるあらゆる種類の記録装置を含む。コン
ピュータにて読取り可能な記録媒体の例としては、RO
M、RAM、CD-ROM、磁気テープ、ハードディス
ク、フロッピー(登録商標)ディスク、フラッシュメモ
リ、光データ貯蔵装置などがあり、さらに、キャリアウ
ェーブ(たとえば、インターネットを通じて伝送)の形
で実現されるものも含む。さらに、コンピュータにて読
取り可能な記録媒体はネットワークにより接続されたコ
ンピュータシステムに分散されて、コンピュータが分散
方式により読取り可能なコードとして貯蔵され、かつ実
行できる。
【図面の簡単な説明】
【図1】本発明によるユーザディスクキャッシュ方法を
用いて抽出したウェブページ別の訪問人気度に基づくウ
ェブページのデータベースを貯蔵する方法を示すフロー
チャートである。
【図2】本発明による検索方法でリンク人気度を計算す
る手順を説明するため、ウェブページ間にリンクが張ら
れている状態を示す模式図である。
【図3】本発明によるユーザディスクキャッシュ情報を
用いて抽出したウェブページ別の訪問人気度に基づくウ
ェブページ検索方法を示すフローチャートである。
【図4】本発明によるユーザディスクキャッシュ情報を
用いて抽出したウェブページ別の訪問人気度に基づくウ
ェブページ検索装置を示すブロック図である。
【符号の説明】
360 ウェブページデータベース 370 索引データベース 380a・380b ユーザ端末 410 受信部 420 URL抽出部 430 検索部 440 ウェブページ配列部 450 出力部 460 ウェブページデータベース 470 索引データベース
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ビョン−ヨップ,チェ 大韓民国,ソウル,ノウォン−グ,ハギェ −ドン,273,ジャンミ アパートメント, 614−1102 (72)発明者 ジョン−スー,アン 大韓民国,ソウル,トンジャク−グ,サダ ン−ドン,105,シンドンア アパートメ ント,401−903 Fターム(参考) 5B075 KK02 ND30 ND34 PR03 PR08 UU40

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】ユーザディスクキャッシュ情報を用いて抽
    出したウェブページ別の訪問人気度に基づくウェブペー
    ジ検索方法において、 (a)ユーザが訪問したウェブページに関するURL情
    報を受信するステップと、 (b)上記受信したURL情報からIPアドレスを確認
    して重複ドメインを除去し、ユーザ別に訪問したURL
    情報を抽出するステップと、 (c)上記ユーザ別に訪問したURL情報をウェブペー
    ジ別の訪問回数順に再整列するステップと、 (d)上記ウェブページ別の訪問回数を訪問人気度に換
    算して貯蔵するステップとを含むことを特徴とするウェ
    ブページ検索方法。
  2. 【請求項2】上記(a)ステップは、許可されたユーザ
    のユーザディスクキャッシュ情報から上記ユーザが訪問
    したウェブページのURL情報を収集するステップであ
    ることを特徴とする請求項1に記載のウェブページ検索
    方法。
  3. 【請求項3】上記(d)ステップは、上記ウェブページ
    のうちいずれか一つのウェブページを実際に訪問した訪
    問者数を全体ウェブページの訪問者数に対する割合で表
    わして貯蔵するステップであることを特徴とする請求項
    1に記載のウェブページ検索方法。
  4. 【請求項4】上記ウェブページに他のウェブページがリ
    ンクされているリンク人気度または上記ウェブページに
    含まれた上記検索語の頻度数を表わす類似度を計算して
    貯蔵するステップをさらに含むことを特徴とする請求項
    1に記載のウェブページ検索方法。
  5. 【請求項5】ユーザディスクキャッシュ情報を用いて抽
    出したウェブページ別の訪問人気度に基づくウェブペー
    ジ検索方法において、 (a)ユーザから入力した検索語を含むウェブページを
    抽出するステップと、 (b)上記抽出したウェブページを所定の加重値により
    再整列するステップと、 (c)上記ユーザが選択した出力類型でウェブページの
    リストを提供するステップとを含むことを特徴とするウ
    ェブページ検索方法。
  6. 【請求項6】上記(a)ステップは、上記検索語を索引
    語とするウェブページの住所を抽出することを特徴とす
    る請求項5に記載のウェブページ検索方法。
  7. 【請求項7】上記(b)ステップは、上記検索語により
    抽出したウェブページに対する実際の訪問人気度、上記
    ウェブページがリンクされているリンク人気度、または
    上記ウェブページに上記検索語が含まれている頻度数に
    よる類似度のうち少なくとも一つを適用して再整列する
    ことを特徴とする請求項5に記載のウェブページ検索方
    法。
  8. 【請求項8】ユーザディスクキャッシュ情報を用いて抽
    出したウェブページ別の訪問人気度に基づくウェブペー
    ジ検索装置において、 ユーザが訪問したウェブページに関するURL情報また
    はユーザが入力した検索語を入力される入力部と、 上記受信したURL情報からIPアドレスを確認して重
    複ドメインを除去し、ユーザ別に訪問したURL情報を
    抽出するURL抽出部と、 上記入力された検索語を含むウェブページに対するUR
    Lを検索して抽出する検索部と、 上記ユーザ別に訪問したURL情報をウェブページ別の
    訪問回数順に再整列するウェブページ配列部と、 上記ウェブページに対する訪問人気度を所定の値に換算
    して貯蔵する貯蔵部と、 上記検索部で抽出したウェブページに対するURLをユ
    ーザに提供する出力部とを含むことを特徴とするウェブ
    ページ検索装置。
  9. 【請求項9】上記貯蔵部は、 上記ウェブページのURL情報を貯蔵するウェブページ
    データベースと、 上記ウェブページに含まれた単語を索引して貯蔵する索
    引データベースとを含むことを特徴とする請求項8に記
    載のウェブページ検索装置。
  10. 【請求項10】請求項1ないし請求項7のいずれか1項
    の方法をコンピュータに実行させるためのプログラム。
  11. 【請求項11】請求項10に記載のプログラムを記録し
    たコンピュータ読取り可能な記録媒体。
JP2002003696A 2001-08-20 2002-01-10 ウェブページ検索方法、ウェブページ検索装置、プログラム、および記録媒体 Expired - Lifetime JP3802813B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR2001-49944 2001-08-20
KR10-2001-0049944A KR100509276B1 (ko) 2001-08-20 2001-08-20 웹페이지별 방문인기도에 기반한 웹페이지 검색방법 및 그장치

Publications (2)

Publication Number Publication Date
JP2003076715A true JP2003076715A (ja) 2003-03-14
JP3802813B2 JP3802813B2 (ja) 2006-07-26

Family

ID=19713346

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002003696A Expired - Lifetime JP3802813B2 (ja) 2001-08-20 2002-01-10 ウェブページ検索方法、ウェブページ検索装置、プログラム、および記録媒体

Country Status (2)

Country Link
JP (1) JP3802813B2 (ja)
KR (1) KR100509276B1 (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217762A (ja) * 2007-02-05 2008-09-18 Ntt Docomo Inc 検索システム及び検索方法
JP2009043263A (ja) * 2007-08-10 2009-02-26 Nhn Corp 質問分類方法およびそのシステム
JP2009509275A (ja) * 2005-09-21 2009-03-05 マイクロソフト コーポレーション ドキュメント利用統計を用いたランキング関数
WO2010026900A1 (ja) * 2008-09-03 2010-03-11 日本電気株式会社 関係性発見装置、関係性発見方法および記録媒体
JP2010282354A (ja) * 2009-06-03 2010-12-16 Ntt Docomo Inc ログ加工装置、該ログ加工装置を備えた情報収集装置、及びログ加工方法
US8103649B2 (en) 2007-02-05 2012-01-24 Ntt Docomo, Inc. Search system and search method
US8738635B2 (en) 2010-06-01 2014-05-27 Microsoft Corporation Detection of junk in search result ranking
US8812493B2 (en) 2008-04-11 2014-08-19 Microsoft Corporation Search results ranking using editing distance and document information
US8843486B2 (en) 2004-09-27 2014-09-23 Microsoft Corporation System and method for scoping searches using index keys
CN104424120A (zh) * 2013-08-29 2015-03-18 北大方正集团有限公司 一种缓存管理方法和装置
US9348912B2 (en) 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
US9495462B2 (en) 2012-01-27 2016-11-15 Microsoft Technology Licensing, Llc Re-ranking search results

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100483025B1 (ko) 2004-05-21 2005-04-15 엔에이치엔(주) 명령어의 유효성 판단 방법 및 그 시스템
KR100913256B1 (ko) * 2005-04-14 2009-08-24 에스케이커뮤니케이션즈 주식회사 다중 링크를 형성하는 정보 네트워크에서 링크 관계에 따른대상 평가 방법
KR100776697B1 (ko) * 2006-01-05 2007-11-16 주식회사 인터파크지마켓 고객 구매행동 분석에 기반한 지능화된 상품 검색 방법 및 시스템
KR100736805B1 (ko) * 2006-03-16 2007-07-09 엔에이치엔(주) 검색매개정보를 관리하는 방법 및 검색매개정보 관리시스템
KR100822108B1 (ko) 2006-06-19 2008-04-15 김정훈 검색 결과 문서에 대한 유저의 선호도 예측 시스템 및 그예측방법
US7668823B2 (en) 2007-04-03 2010-02-23 Google Inc. Identifying inadequate search content
KR100893026B1 (ko) * 2007-07-23 2009-04-15 에스케이 텔레콤주식회사 Ip 패킷의 페이지 분류를 위한 패킷 분석 장치 및 그방법
KR100987284B1 (ko) * 2008-09-12 2010-10-12 주식회사 엔씨소프트 검색엔진의 화이트리스트 생성장치 및 그 방법
WO2012036401A2 (ko) * 2010-09-14 2012-03-22 Kang Ungsuk 인터넷 도메인 추천 방법 및 그 시스템
US9448695B2 (en) 2010-12-14 2016-09-20 Hewlett-Packard Development Company, L.P. Selecting web page content based on user permission for collecting user-selected content
KR20200071477A (ko) * 2018-12-11 2020-06-19 삼성전자주식회사 전자 장치 및 그의 제어 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001209601A (ja) * 2000-01-26 2001-08-03 Masahiro Adachi 複数のホームページが登録された情報処理装置、サーチエンジンシステムまたはコンピュータ読みとり可能な記憶媒体及びこれらに利用されるデータベース

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6421675B1 (en) * 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
JPH11312177A (ja) * 1998-04-28 1999-11-09 Victor Co Of Japan Ltd ホームページ嗜好評価装置
KR20000049408A (ko) * 2000-02-22 2000-08-05 권성우 인터넷상의 검색순위 관리장치 및 그 방법
KR20000036454A (ko) * 2000-03-14 2000-07-05 이중호 인터넷 검색사이트에서 조회횟수를 이용한 검색도메인표시방법
KR20010092922A (ko) * 2000-03-27 2001-10-27 이현구 유사 웹사이트의 검색 방법
KR20000037362A (ko) * 2000-04-20 2000-07-05 강영복 인터넷 사이트 평가 및 평가 결과를 활용하는 인터넷 서비스
KR20010103303A (ko) * 2000-05-09 2001-11-23 안성태 등록 홈페이지의 북마크를 이용한 네티즌의 인터넷 이용성향 분석 시스템과 그 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001209601A (ja) * 2000-01-26 2001-08-03 Masahiro Adachi 複数のホームページが登録された情報処理装置、サーチエンジンシステムまたはコンピュータ読みとり可能な記憶媒体及びこれらに利用されるデータベース

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
中島募: "ネット視聴率の調査方法に変化:専用ソフトによる集計が主流に テレビなみの傾向分析も可能", 日経インターネットテクノロジー, vol. 23号, CSND200000881001, 22 May 1999 (1999-05-22), pages 14 - 15, ISSN: 0000727521 *
灰原清太郎,川越恭二: "サイト評価情報を用いたWWW検索表示方法", 情報処理学会論文誌, vol. Vol.10,No.SIG6(TOD3), CSNG200100213003, 15 August 1999 (1999-08-15), pages 22 - 30, ISSN: 0000727520 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8843486B2 (en) 2004-09-27 2014-09-23 Microsoft Corporation System and method for scoping searches using index keys
JP2011108268A (ja) * 2005-09-21 2011-06-02 Microsoft Corp ドキュメント利用統計を用いたランキング関数
JP2009509275A (ja) * 2005-09-21 2009-03-05 マイクロソフト コーポレーション ドキュメント利用統計を用いたランキング関数
JP4698737B2 (ja) * 2005-09-21 2011-06-08 マイクロソフト コーポレーション ドキュメント利用統計を用いたランキング関数
US8103649B2 (en) 2007-02-05 2012-01-24 Ntt Docomo, Inc. Search system and search method
JP2008217762A (ja) * 2007-02-05 2008-09-18 Ntt Docomo Inc 検索システム及び検索方法
JP4729607B2 (ja) * 2007-08-10 2011-07-20 エヌエイチエヌ コーポレーション 質問分類方法およびそのシステム
JP2009043263A (ja) * 2007-08-10 2009-02-26 Nhn Corp 質問分類方法およびそのシステム
US9348912B2 (en) 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
US8812493B2 (en) 2008-04-11 2014-08-19 Microsoft Corporation Search results ranking using editing distance and document information
WO2010026900A1 (ja) * 2008-09-03 2010-03-11 日本電気株式会社 関係性発見装置、関係性発見方法および記録媒体
US8676738B2 (en) 2008-09-03 2014-03-18 Nec Corporation Relationship detector, relationship detection method, and recording medium
JP2010282354A (ja) * 2009-06-03 2010-12-16 Ntt Docomo Inc ログ加工装置、該ログ加工装置を備えた情報収集装置、及びログ加工方法
US8738635B2 (en) 2010-06-01 2014-05-27 Microsoft Corporation Detection of junk in search result ranking
US9495462B2 (en) 2012-01-27 2016-11-15 Microsoft Technology Licensing, Llc Re-ranking search results
CN104424120A (zh) * 2013-08-29 2015-03-18 北大方正集团有限公司 一种缓存管理方法和装置

Also Published As

Publication number Publication date
JP3802813B2 (ja) 2006-07-26
KR20030016037A (ko) 2003-02-26
KR100509276B1 (ko) 2005-08-22

Similar Documents

Publication Publication Date Title
JP2003076715A (ja) ウェブページ検索方法、ウェブページ検索装置、プログラム、および記録媒体
KR101063364B1 (ko) 웹 크롤링 프로세스 동안 웹 사이트에 우선순위를 부여하기위한 시스템 및 방법
US20020156779A1 (en) Internet search engine
JP2017041284A (ja) 検索エンジンの結果ページ内に目的別アプリケーションを提供する装置、方法、プログラム、及びシステム
CN108052632B (zh) 一种网络信息获取方法、系统及企业信息搜索系统
US8180751B2 (en) Using an encyclopedia to build user profiles
JP2004503878A (ja) ネットワークを介した当事者間の接続を決定するための方法およびシステム
JP2009271799A (ja) 企業相関情報抽出システム
JP3803961B2 (ja) データベース生成装置、データベース生成処理方法及びデータベース生成プログラム
Adhinugroho et al. Development of online travel Web scraping for tourism statistics in Indonesia
JP2002351916A (ja) Web情報検索装置、web情報検索方法及びその方法をコンピュータに実行させるプログラム
CN104391978A (zh) 用于浏览器的网页收藏处理方法及装置
JP2007072596A (ja) 情報共有システムおよび情報共有方法
KR100671077B1 (ko) 페이지 묶음을 이용한 정보 검색 서비스 제공 서버, 방법및 시스템
JP5284064B2 (ja) 商品idサーバ装置、および商品idサーバ装置の制御方法
JP2009122807A (ja) 連想検索システム
WO2001065410A2 (en) Search engine for spatial data indexing
JP5423470B2 (ja) 名寄せチェック支援装置、名寄せチェック支援プログラム及び名寄せチェック支援方法
JP5286007B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP2006236221A (ja) ウエブページ検索のための管理サーバ装置
CN113032436A (zh) 基于文章内容和标题的搜索方法和装置
JP5464082B2 (ja) 文書処理装置、文書処理方法、文書処理プログラム、及び文書処理プログラムを記録したコンピュータ読み取り可能な記録媒体
Maheswari et al. Algorithm for Tracing Visitors' On-Line Behaviors for Effective Web Usage Mining
KR100371805B1 (ko) 관련 웹 사이트 제공 방법 및 시스템
JP2009098932A (ja) 連想検索システム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040928

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20041227

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20050117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050906

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060120

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060309

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060428

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3802813

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100512

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110512

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110512

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120512

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130512

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term