JP2003076715A - ウェブページ検索方法、ウェブページ検索装置、プログラム、および記録媒体 - Google Patents
ウェブページ検索方法、ウェブページ検索装置、プログラム、および記録媒体Info
- Publication number
- JP2003076715A JP2003076715A JP2002003696A JP2002003696A JP2003076715A JP 2003076715 A JP2003076715 A JP 2003076715A JP 2002003696 A JP2002003696 A JP 2002003696A JP 2002003696 A JP2002003696 A JP 2002003696A JP 2003076715 A JP2003076715 A JP 2003076715A
- Authority
- JP
- Japan
- Prior art keywords
- web page
- user
- search
- popularity
- visited
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Engineering & Computer Science (AREA)
- Information Transfer Between Computers (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
Abstract
報を用いて抽出したウェブページ別の訪問人気度に基づ
くウェブページ検索方法およびその装置を提供する。 【解決手段】 (a)ユーザが訪問したウェブページに
関するURL情報を受信するステップと、(b)上記受
信したURL情報からIPアドレスを確認して重複ドメ
インを除去し、ユーザ別に訪問したURL情報を抽出す
るステップと、(c)上記ユーザ別に訪問したURL情
報をウェブページ別の訪問回数順に再整列するステップ
と、(d)上記ウェブページ別の訪問回数を訪問人気度
に換算して貯蔵するステップとを含む。
Description
ウェブページ検索方法およびウェブページ検索装置に係
り、特に、ユーザディスクキャッシュ情報を用いて抽出
したページ別の訪問人気度に基づくウェブページ検索方
法、ウェブページ検索装置、プログラム、および記録媒
体に関する。
ルドワイドウェブ(WWW)上のウェブページについて
提供されていた検索結果は、ユーザのウェブページまた
はサーバ上のウェブページに対する人気度に関係せず
に、検索のために用いられた単語を含むか否かが反映さ
れていた。
索方法では、検索ロボットを用いて分類およびデータベ
ース化がなされたインターネットサイトの資料に対し
て、ユーザが検索しようとする単語を入力し、入力され
た単語とマッチングされるサイト情報を提供する。ある
いは、検索エンジンを提供する会社が構築した分類ツリ
ーに従って、ユーザが所望のサイトを捜し出す。
は、ユーザの実際の訪問人気度が反映されていないの
で、実際のユーザの意図とは関係ない検索結果が提供さ
れる場合がある。すなわち、従来の検索方式による検索
結果は、実際のインターネットユーザのウェブサイト人
気度を反映するような現実的な検索結果とは言えない。
書に対する加重値は以下の式(1)に基づき計算され
る。
質疑語が単語である場合にはα<0.5である。
方法では、検索対象の内容に関する情報と、その情報に
リンクされているページ数とにより、検索結果を提供し
ていた。しかし、実際に、インターネットウェブユーザ
がいかなるサイトを主として訪問するか否かということ
を考慮していないため、ユーザが訪問する可能性が大き
いサイトを検索結果に反映できないという問題がある。
問題点に鑑みなされたものであって、その目的は、ユー
ザディスクキャッシュ情報を用いて抽出したウェブペー
ジ別の訪問人気度に基づくウェブページ検索方法および
その装置を提供することにある。
ンピュータにて実行させるためのプログラムを記録した
コンピュータにて読取り可能な記録媒体を提供すること
にある。
索方法は、上記課題を解決するため、ユーザディスクキ
ャッシュ情報を用いて抽出したウェブページ別の訪問人
気度に基づくウェブページ検索方法において、(a)ユ
ーザが訪問したウェブページに関するURL情報を受信
するステップと、(b)上記受信したURL情報からI
Pアドレスを確認して重複ドメインを除去し、ユーザ別
に訪問したURL情報を抽出するステップと、(c)上
記ユーザ別に訪問したURL情報をウェブページ別の訪
問回数順に再整列するステップと、(d)上記ウェブペ
ージ別の訪問回数を訪問人気度に換算して貯蔵するステ
ップとを含むことを特徴としている。
上記課題を解決するため、上記構成のウェブページ検索
方法において、上記(a)ステップが、許可されたユー
ザのユーザディスクキャッシュ情報から上記ユーザが訪
問したウェブページのURL情報を収集するステップで
あることを特徴としている。
上記課題を解決するため、上記構成のウェブページ検索
方法において、上記(d)ステップが、上記ウェブペー
ジのうちいずれか一つのウェブページを実際に訪問した
訪問者数を全体ウェブページの訪問者数に対する割合で
表わして貯蔵するステップであることを特徴としてい
る。
上記課題を解決するため、上記構成のウェブページ検索
方法において、上記ウェブページに他のウェブページが
リンクされているリンク人気度または上記ウェブページ
に含まれた上記検索語の頻度数を表わす類似度を計算し
て貯蔵するステップをさらに含むことを特徴としてい
る。
上記課題を解決するため、ユーザディスクキャッシュ情
報を用いて抽出したウェブページ別の訪問人気度に基づ
くウェブページ検索方法において、(a)ユーザから入
力した検索語を含むウェブページを抽出するステップ
と、(b)上記抽出したウェブページを所定の加重値に
より再整列するステップと、(c)上記ユーザが選択し
た出力類型でウェブページのリストを提供するステップ
とを含むことを特徴としている。
上記課題を解決するため、上記構成のウェブページ検索
方法において、上記(a)ステップが、上記検索語を索
引語とするウェブページの住所を抽出することを特徴と
している。
題を解決するため、上記構成のウェブページ検索方法に
おいて、上記(b)ステップが、上記検索語により抽出
したウェブページに対する実際の訪問人気度、上記ウェ
ブページがリンクされているリンク人気度または上記ウ
ェブページに上記検索語が含まれている頻度数による類
似度のうち少なくとも一つを適用して再整列することを
特徴としている。
題を解決するため、ユーザディスクキャッシュ情報を用
いて抽出したウェブページ別の訪問人気度に基づくウェ
ブページ検索装置において、ユーザが訪問したウェブペ
ージに関するURL情報またはユーザが入力した検索語
を入力される入力部と、上記受信したURL情報からI
Pアドレスを確認して重複ドメインを除去し、ユーザ別
に訪問したURL情報を抽出するURL抽出部と、上記
入力された検索語を含むウェブページに対するURLを
検索して抽出する検索部と、上記ユーザ別に訪問したU
RL情報をウェブページ別の訪問回数順に再整列するウ
ェブページ配列部と、上記ウェブページに対する訪問人
気度を所定の値に換算して貯蔵する貯蔵部と、上記検索
部で抽出したウェブページに対するURLをユーザに提
供する出力部とを含むことを特徴としている。
上記課題を解決するため、上記構成のウェブページ検索
装置において、上記貯蔵部が、上記ウェブページのUR
L情報を貯蔵するウェブページデータベースと、上記ウ
ェブページに含まれた単語を索引して貯蔵する索引デー
タベースとを含むことを特徴としている。
かの構成のウェブページ検索方法をコンピュータにて実
行させるためのプログラムであることを特徴としてい
る。
ログラムを記録したコンピュータ読取り可能な記録媒体
であることを特徴としている。
1ないし図4に基づいて説明すれば以下の通りである。
ッシュ情報を用いて抽出したウェブページ別の訪問人気
度に基づくウェブページのURL情報を貯蔵する方法を
示したフローチャートである。該方法では、ユーザが訪
問したウェブページのURL情報のドメイン名を正規化
して各ウェブページ別の訪問人気度を貯蔵する。
ク人気度を計算する手順を説明するため、複数のウェブ
ページにリンクが張られた状態を示す図である。図2に
ついての詳細な説明はリンク人気度の計算と共にする。
ーネットユーザのブラウザーディスクキャッシュファイ
ルを抽出するか、あるいはユーザが訪問したウェブペー
ジに関するURL情報を受信する(ステップ110、以
下ステップを単にSと記載する)。
わす部分(たとえば、http://)を除去する(S12
0)。次に、各ウェブページのドメイン名に対するIP
アドレスを確認して重複ドメインを除去し、ユーザ別に
訪問したURL情報を抽出する(S130)。
ユーザ別に訪問したURL情報を再整列する(S14
0)。次に、各ウェブページに対する訪問人気度を計算
して貯蔵する(S150)。
問ページに対する統計を通じてなされる。すなわち、n
名のユーザを、U1,U2,U3,…,Unとして区別
するとともに、ユーザ別のウェブページ訪問結果をペー
ジ別の訪問回数を用いて再整列する。したがって、訪問
人気度は、以下の式(2)に基づいて計算される。
ウェブページを配列する文字等の類似度順にウェブペー
ジのURL情報を貯蔵する。
下に説明するような方式により求めることができる。
一つのウェブページに他のウェブページがリンクされて
いる関係を示している。
(0)の基本人気値を有していると仮定する。ウェブペ
ージPのリンク人気度を計算するためには、ウェブペー
ジPにリンクされているウェブページの個数を測定すれ
ばよい。
ジAは外部に向かう3つのリンクのツリーのうち一つが
ウェブページPを指定しており、ウェブページBは外部
に向かう2つのリンクのツリーのうち一つがPを指定し
ており、ウェブページCは外部に向かう1つのリンクが
ウェブページPを指定している。このため、ウェブペー
ジPのリンク人気度は、以下の式(3)により計算され
る。
各種の数値を有しうる。
ッシュ情報を用いて抽出したウェブページ別の訪問人気
度に基づくウェブページ検索方法を示したものである。
すなわち、本発明によるウェブページ検索方法では、ユ
ーザから検索語を入力されてその検索語に該当するウェ
ブページを提供する際、ウェブページの訪問人気度、リ
ンク人気度、あるいは類似度のうち少なくとも一つに該
当する順位に従い配列してウェブページを提供する。
を入力する(S310)。その後、その検索語を含むウ
ェブページを抽出する(S320)。さらに、抽出した
ウェブページを訪問人気度、類似度、あるいはリンク人
気度のうち少なくとも一つの順位に従い再配列する(S
330)。
はリンク人気度に従い検索するそれぞれの場合について
説明すれば以下の通りである。
索語に対する結果としてn個の文書情報を検索した場
合、以下の表1に示すように、類似度による検索結果
は、類似度、すなわち、検索語の頻度数が高い文書から
順に示される。
のウェブページの多少を表わすリンク人気度による文書
の検索結果は、以下の表2の通りである。
した回数を表す訪問人気度による結果は、下記表3の通
りである。
通じて得た結果値、リンク人気度を通じて得た結果値ま
たは訪問人気度を通じて得た結果値を、以下の式(4)
に基づいて求められる文書加重値により再整列する。
大きい場合にはリンク人気度に、γの値が大きい場合に
は訪問人気度に比重をおいた検索結果を表わすことにな
る。
人気度のうち少なくとも一つの加重値に比重をおく類型
を選択すれば、ユーザが選択した出力類型により出力す
る(S340)。
ッシュ情報を用いて抽出したウェブページ別の訪問人気
度に基づくウェブページ検索装置を示したものである。
端末380a・380bのブラウザーディスクキャッシ
ュファイルから、ウェブページのURL情報を収集す
る。また、受信部410は、ユーザが入力した検索語を
インターネットを通じて受信する。
情報を正規化して訪問者別のウェブページのURL情報
を抽出するとともに、各ウェブページに対して実際の訪
問者数を全体訪問者数に対する比率で表わした訪問人気
度を計算してウェブページデータベース460に貯蔵す
る。
ページを索引データベース470で検索して抽出する。
ウェブページデータベース360は、訪問人気度、類似
度またはリンク人気度別にウェブページの情報を貯蔵し
ている。索引データベース370は、ウェブページで検
索した単語または文章などを貯蔵しており、ウェブペー
ジにリングされている。
0で抽出したウェブページを式(4)に従い再整列す
る。出力部450は、再整列された文書をユーザが選択
した類型(たとえば、訪問人気度順、類似度順またはリ
ンク人気度順)にウェブページ出力リストを提供する。
ーザのディスクキャッシュファイルにより直接的に反映
されたウェブページのURL情報を収集してその情報を
ウェブページ別の人気度、リンク人気度または内容の類
似度に従い貯蔵するので、ユーザが入力した検索語を含
むウェブページを人気度、リンク人気度または内容の類
似度別に抽出してユーザに提供することにより、より関
連性の高い検索結果が提供できる。
可能な記録媒体にコンピュータにて読取り可能なコード
で実現できる。なお、コンピュータにて読取り可能な記
録媒体とは、コンピュータシステムにて読取り可能なデ
ータが貯蔵されるあらゆる種類の記録装置を含む。コン
ピュータにて読取り可能な記録媒体の例としては、RO
M、RAM、CD-ROM、磁気テープ、ハードディス
ク、フロッピー(登録商標)ディスク、フラッシュメモ
リ、光データ貯蔵装置などがあり、さらに、キャリアウ
ェーブ(たとえば、インターネットを通じて伝送)の形
で実現されるものも含む。さらに、コンピュータにて読
取り可能な記録媒体はネットワークにより接続されたコ
ンピュータシステムに分散されて、コンピュータが分散
方式により読取り可能なコードとして貯蔵され、かつ実
行できる。
用いて抽出したウェブページ別の訪問人気度に基づくウ
ェブページのデータベースを貯蔵する方法を示すフロー
チャートである。
る手順を説明するため、ウェブページ間にリンクが張ら
れている状態を示す模式図である。
用いて抽出したウェブページ別の訪問人気度に基づくウ
ェブページ検索方法を示すフローチャートである。
用いて抽出したウェブページ別の訪問人気度に基づくウ
ェブページ検索装置を示すブロック図である。
Claims (11)
- 【請求項1】ユーザディスクキャッシュ情報を用いて抽
出したウェブページ別の訪問人気度に基づくウェブペー
ジ検索方法において、 (a)ユーザが訪問したウェブページに関するURL情
報を受信するステップと、 (b)上記受信したURL情報からIPアドレスを確認
して重複ドメインを除去し、ユーザ別に訪問したURL
情報を抽出するステップと、 (c)上記ユーザ別に訪問したURL情報をウェブペー
ジ別の訪問回数順に再整列するステップと、 (d)上記ウェブページ別の訪問回数を訪問人気度に換
算して貯蔵するステップとを含むことを特徴とするウェ
ブページ検索方法。 - 【請求項2】上記(a)ステップは、許可されたユーザ
のユーザディスクキャッシュ情報から上記ユーザが訪問
したウェブページのURL情報を収集するステップであ
ることを特徴とする請求項1に記載のウェブページ検索
方法。 - 【請求項3】上記(d)ステップは、上記ウェブページ
のうちいずれか一つのウェブページを実際に訪問した訪
問者数を全体ウェブページの訪問者数に対する割合で表
わして貯蔵するステップであることを特徴とする請求項
1に記載のウェブページ検索方法。 - 【請求項4】上記ウェブページに他のウェブページがリ
ンクされているリンク人気度または上記ウェブページに
含まれた上記検索語の頻度数を表わす類似度を計算して
貯蔵するステップをさらに含むことを特徴とする請求項
1に記載のウェブページ検索方法。 - 【請求項5】ユーザディスクキャッシュ情報を用いて抽
出したウェブページ別の訪問人気度に基づくウェブペー
ジ検索方法において、 (a)ユーザから入力した検索語を含むウェブページを
抽出するステップと、 (b)上記抽出したウェブページを所定の加重値により
再整列するステップと、 (c)上記ユーザが選択した出力類型でウェブページの
リストを提供するステップとを含むことを特徴とするウ
ェブページ検索方法。 - 【請求項6】上記(a)ステップは、上記検索語を索引
語とするウェブページの住所を抽出することを特徴とす
る請求項5に記載のウェブページ検索方法。 - 【請求項7】上記(b)ステップは、上記検索語により
抽出したウェブページに対する実際の訪問人気度、上記
ウェブページがリンクされているリンク人気度、または
上記ウェブページに上記検索語が含まれている頻度数に
よる類似度のうち少なくとも一つを適用して再整列する
ことを特徴とする請求項5に記載のウェブページ検索方
法。 - 【請求項8】ユーザディスクキャッシュ情報を用いて抽
出したウェブページ別の訪問人気度に基づくウェブペー
ジ検索装置において、 ユーザが訪問したウェブページに関するURL情報また
はユーザが入力した検索語を入力される入力部と、 上記受信したURL情報からIPアドレスを確認して重
複ドメインを除去し、ユーザ別に訪問したURL情報を
抽出するURL抽出部と、 上記入力された検索語を含むウェブページに対するUR
Lを検索して抽出する検索部と、 上記ユーザ別に訪問したURL情報をウェブページ別の
訪問回数順に再整列するウェブページ配列部と、 上記ウェブページに対する訪問人気度を所定の値に換算
して貯蔵する貯蔵部と、 上記検索部で抽出したウェブページに対するURLをユ
ーザに提供する出力部とを含むことを特徴とするウェブ
ページ検索装置。 - 【請求項9】上記貯蔵部は、 上記ウェブページのURL情報を貯蔵するウェブページ
データベースと、 上記ウェブページに含まれた単語を索引して貯蔵する索
引データベースとを含むことを特徴とする請求項8に記
載のウェブページ検索装置。 - 【請求項10】請求項1ないし請求項7のいずれか1項
の方法をコンピュータに実行させるためのプログラム。 - 【請求項11】請求項10に記載のプログラムを記録し
たコンピュータ読取り可能な記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR2001-49944 | 2001-08-20 | ||
KR10-2001-0049944A KR100509276B1 (ko) | 2001-08-20 | 2001-08-20 | 웹페이지별 방문인기도에 기반한 웹페이지 검색방법 및 그장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003076715A true JP2003076715A (ja) | 2003-03-14 |
JP3802813B2 JP3802813B2 (ja) | 2006-07-26 |
Family
ID=19713346
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002003696A Expired - Lifetime JP3802813B2 (ja) | 2001-08-20 | 2002-01-10 | ウェブページ検索方法、ウェブページ検索装置、プログラム、および記録媒体 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP3802813B2 (ja) |
KR (1) | KR100509276B1 (ja) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008217762A (ja) * | 2007-02-05 | 2008-09-18 | Ntt Docomo Inc | 検索システム及び検索方法 |
JP2009043263A (ja) * | 2007-08-10 | 2009-02-26 | Nhn Corp | 質問分類方法およびそのシステム |
JP2009509275A (ja) * | 2005-09-21 | 2009-03-05 | マイクロソフト コーポレーション | ドキュメント利用統計を用いたランキング関数 |
WO2010026900A1 (ja) * | 2008-09-03 | 2010-03-11 | 日本電気株式会社 | 関係性発見装置、関係性発見方法および記録媒体 |
JP2010282354A (ja) * | 2009-06-03 | 2010-12-16 | Ntt Docomo Inc | ログ加工装置、該ログ加工装置を備えた情報収集装置、及びログ加工方法 |
US8103649B2 (en) | 2007-02-05 | 2012-01-24 | Ntt Docomo, Inc. | Search system and search method |
US8738635B2 (en) | 2010-06-01 | 2014-05-27 | Microsoft Corporation | Detection of junk in search result ranking |
US8812493B2 (en) | 2008-04-11 | 2014-08-19 | Microsoft Corporation | Search results ranking using editing distance and document information |
US8843486B2 (en) | 2004-09-27 | 2014-09-23 | Microsoft Corporation | System and method for scoping searches using index keys |
CN104424120A (zh) * | 2013-08-29 | 2015-03-18 | 北大方正集团有限公司 | 一种缓存管理方法和装置 |
US9348912B2 (en) | 2007-10-18 | 2016-05-24 | Microsoft Technology Licensing, Llc | Document length as a static relevance feature for ranking search results |
US9495462B2 (en) | 2012-01-27 | 2016-11-15 | Microsoft Technology Licensing, Llc | Re-ranking search results |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100483025B1 (ko) * | 2004-05-21 | 2005-04-15 | 엔에이치엔(주) | 명령어의 유효성 판단 방법 및 그 시스템 |
KR100913256B1 (ko) * | 2005-04-14 | 2009-08-24 | 에스케이커뮤니케이션즈 주식회사 | 다중 링크를 형성하는 정보 네트워크에서 링크 관계에 따른대상 평가 방법 |
KR100776697B1 (ko) * | 2006-01-05 | 2007-11-16 | 주식회사 인터파크지마켓 | 고객 구매행동 분석에 기반한 지능화된 상품 검색 방법 및 시스템 |
KR100736805B1 (ko) * | 2006-03-16 | 2007-07-09 | 엔에이치엔(주) | 검색매개정보를 관리하는 방법 및 검색매개정보 관리시스템 |
KR100822108B1 (ko) | 2006-06-19 | 2008-04-15 | 김정훈 | 검색 결과 문서에 대한 유저의 선호도 예측 시스템 및 그예측방법 |
US7668823B2 (en) * | 2007-04-03 | 2010-02-23 | Google Inc. | Identifying inadequate search content |
KR100893026B1 (ko) * | 2007-07-23 | 2009-04-15 | 에스케이 텔레콤주식회사 | Ip 패킷의 페이지 분류를 위한 패킷 분석 장치 및 그방법 |
KR100987284B1 (ko) * | 2008-09-12 | 2010-10-12 | 주식회사 엔씨소프트 | 검색엔진의 화이트리스트 생성장치 및 그 방법 |
WO2012036401A2 (ko) * | 2010-09-14 | 2012-03-22 | Kang Ungsuk | 인터넷 도메인 추천 방법 및 그 시스템 |
CN103262109A (zh) | 2010-12-14 | 2013-08-21 | 惠普发展公司,有限责任合伙企业 | 基于用户许可选择网页内容以用于收集用户所选择的内容 |
KR20200071477A (ko) * | 2018-12-11 | 2020-06-19 | 삼성전자주식회사 | 전자 장치 및 그의 제어 방법 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001209601A (ja) * | 2000-01-26 | 2001-08-03 | Masahiro Adachi | 複数のホームページが登録された情報処理装置、サーチエンジンシステムまたはコンピュータ読みとり可能な記憶媒体及びこれらに利用されるデータベース |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6421675B1 (en) * | 1998-03-16 | 2002-07-16 | S. L. I. Systems, Inc. | Search engine |
JPH11312177A (ja) * | 1998-04-28 | 1999-11-09 | Victor Co Of Japan Ltd | ホームページ嗜好評価装置 |
KR20000049408A (ko) * | 2000-02-22 | 2000-08-05 | 권성우 | 인터넷상의 검색순위 관리장치 및 그 방법 |
KR20000036454A (ko) * | 2000-03-14 | 2000-07-05 | 이중호 | 인터넷 검색사이트에서 조회횟수를 이용한 검색도메인표시방법 |
KR20010092922A (ko) * | 2000-03-27 | 2001-10-27 | 이현구 | 유사 웹사이트의 검색 방법 |
KR20000037362A (ko) * | 2000-04-20 | 2000-07-05 | 강영복 | 인터넷 사이트 평가 및 평가 결과를 활용하는 인터넷 서비스 |
KR20010103303A (ko) * | 2000-05-09 | 2001-11-23 | 안성태 | 등록 홈페이지의 북마크를 이용한 네티즌의 인터넷 이용성향 분석 시스템과 그 방법 |
-
2001
- 2001-08-20 KR KR10-2001-0049944A patent/KR100509276B1/ko active IP Right Grant
-
2002
- 2002-01-10 JP JP2002003696A patent/JP3802813B2/ja not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001209601A (ja) * | 2000-01-26 | 2001-08-03 | Masahiro Adachi | 複数のホームページが登録された情報処理装置、サーチエンジンシステムまたはコンピュータ読みとり可能な記憶媒体及びこれらに利用されるデータベース |
Non-Patent Citations (2)
Title |
---|
中島募: "ネット視聴率の調査方法に変化:専用ソフトによる集計が主流に テレビなみの傾向分析も可能", 日経インターネットテクノロジー, vol. 23号, CSND200000881001, 22 May 1999 (1999-05-22), pages 14 - 15, ISSN: 0000727521 * |
灰原清太郎,川越恭二: "サイト評価情報を用いたWWW検索表示方法", 情報処理学会論文誌, vol. Vol.10,No.SIG6(TOD3), CSNG200100213003, 15 August 1999 (1999-08-15), pages 22 - 30, ISSN: 0000727520 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8843486B2 (en) | 2004-09-27 | 2014-09-23 | Microsoft Corporation | System and method for scoping searches using index keys |
JP2011108268A (ja) * | 2005-09-21 | 2011-06-02 | Microsoft Corp | ドキュメント利用統計を用いたランキング関数 |
JP2009509275A (ja) * | 2005-09-21 | 2009-03-05 | マイクロソフト コーポレーション | ドキュメント利用統計を用いたランキング関数 |
JP4698737B2 (ja) * | 2005-09-21 | 2011-06-08 | マイクロソフト コーポレーション | ドキュメント利用統計を用いたランキング関数 |
US8103649B2 (en) | 2007-02-05 | 2012-01-24 | Ntt Docomo, Inc. | Search system and search method |
JP2008217762A (ja) * | 2007-02-05 | 2008-09-18 | Ntt Docomo Inc | 検索システム及び検索方法 |
JP4729607B2 (ja) * | 2007-08-10 | 2011-07-20 | エヌエイチエヌ コーポレーション | 質問分類方法およびそのシステム |
JP2009043263A (ja) * | 2007-08-10 | 2009-02-26 | Nhn Corp | 質問分類方法およびそのシステム |
US9348912B2 (en) | 2007-10-18 | 2016-05-24 | Microsoft Technology Licensing, Llc | Document length as a static relevance feature for ranking search results |
US8812493B2 (en) | 2008-04-11 | 2014-08-19 | Microsoft Corporation | Search results ranking using editing distance and document information |
WO2010026900A1 (ja) * | 2008-09-03 | 2010-03-11 | 日本電気株式会社 | 関係性発見装置、関係性発見方法および記録媒体 |
US8676738B2 (en) | 2008-09-03 | 2014-03-18 | Nec Corporation | Relationship detector, relationship detection method, and recording medium |
JP2010282354A (ja) * | 2009-06-03 | 2010-12-16 | Ntt Docomo Inc | ログ加工装置、該ログ加工装置を備えた情報収集装置、及びログ加工方法 |
US8738635B2 (en) | 2010-06-01 | 2014-05-27 | Microsoft Corporation | Detection of junk in search result ranking |
US9495462B2 (en) | 2012-01-27 | 2016-11-15 | Microsoft Technology Licensing, Llc | Re-ranking search results |
CN104424120A (zh) * | 2013-08-29 | 2015-03-18 | 北大方正集团有限公司 | 一种缓存管理方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
KR100509276B1 (ko) | 2005-08-22 |
KR20030016037A (ko) | 2003-02-26 |
JP3802813B2 (ja) | 2006-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2003076715A (ja) | ウェブページ検索方法、ウェブページ検索装置、プログラム、および記録媒体 | |
KR101063364B1 (ko) | 웹 크롤링 프로세스 동안 웹 사이트에 우선순위를 부여하기위한 시스템 및 방법 | |
JP5760246B2 (ja) | 検索結果ページ上にコンテキスト動作を提供するためのシステム及び方法 | |
CN108052632B (zh) | 一种网络信息获取方法、系统及企业信息搜索系统 | |
US20020156779A1 (en) | Internet search engine | |
US20070198727A1 (en) | Method, apparatus and system for extracting field-specific structured data from the web using sample | |
US8180751B2 (en) | Using an encyclopedia to build user profiles | |
WO2002010982A2 (en) | Computer system for collecting information from web sites | |
US20100011025A1 (en) | Transfer learning methods and apparatuses for establishing additive models for related-task ranking | |
JP2009271799A (ja) | 企業相関情報抽出システム | |
JP3803961B2 (ja) | データベース生成装置、データベース生成処理方法及びデータベース生成プログラム | |
Adhinugroho et al. | Development of online travel Web scraping for tourism statistics in Indonesia | |
JP2002351916A (ja) | Web情報検索装置、web情報検索方法及びその方法をコンピュータに実行させるプログラム | |
KR100671077B1 (ko) | 페이지 묶음을 이용한 정보 검색 서비스 제공 서버, 방법및 시스템 | |
JP2009122807A (ja) | 連想検索システム | |
WO2001065410A2 (en) | Search engine for spatial data indexing | |
JP2008191982A (ja) | 検索結果出力装置 | |
JP5423470B2 (ja) | 名寄せチェック支援装置、名寄せチェック支援プログラム及び名寄せチェック支援方法 | |
JP2009098932A (ja) | 連想検索システム | |
JP2006236221A (ja) | ウエブページ検索のための管理サーバ装置 | |
JP2003006221A (ja) | 予測分析型検索システム、予測分析型検索方法およびコンピュータプログラム | |
JP2010072909A (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
CN113032436A (zh) | 基于文章内容和标题的搜索方法和装置 | |
JP5464082B2 (ja) | 文書処理装置、文書処理方法、文書処理プログラム、及び文書処理プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
Alkwai et al. | Making Recommendations from Web Archives for" Lost" Web Pages |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040928 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20041227 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20050117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050322 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050607 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050906 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20051025 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060120 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20060309 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060404 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060428 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 3802813 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100512 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110512 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110512 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120512 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130512 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |