JP2010524141A - 履歴重要度のファクタリングによるドキュメントの重要度の計算 - Google Patents
履歴重要度のファクタリングによるドキュメントの重要度の計算 Download PDFInfo
- Publication number
- JP2010524141A JP2010524141A JP2010503259A JP2010503259A JP2010524141A JP 2010524141 A JP2010524141 A JP 2010524141A JP 2010503259 A JP2010503259 A JP 2010503259A JP 2010503259 A JP2010503259 A JP 2010503259A JP 2010524141 A JP2010524141 A JP 2010524141A
- Authority
- JP
- Japan
- Prior art keywords
- importance
- snapshot
- time
- importance score
- web
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9558—Details of hyperlinks; Management of linked annotations
Abstract
Description
Claims (20)
- コンピューティング装置において、ドキュメント間のリンクを有するドキュメントの時間重要度を判定する方法であって、
種々のスナップショットのリンク情報を提供するステップであって、前記リンク情報は、ドキュメント間のリンクを示すステップ(213)と、
各スナップショットについて、前記スナップショットの前記リンク情報に基づいて前記ドキュメントの重要度スコアを計算するステップ(216)と、
ドキュメントのために前記スナップショットの前記計算された重要度スコアを集約して、前記ドキュメントの時間重要度スコアを提供するステップ(215)と
を含むことを特徴とする方法。 - 前記計算された重要度スコアを集約するステップは、より直近のスナップショットの重要度スコアを、それよりも直近でないスナップショットの重要度スコアよりも重く重み付けすることを特徴とする請求項1に記載の方法。
- 前記ドキュメントはウェブページであり、前記リンクは前記ドキュメント間のハイパーリンクであり、前記リンク情報はウェブグラフ表現であることを特徴とする請求項1に記載の方法。
- 前記ウェブグラフは、隣接行列で表されることを特徴とする請求項5に記載の方法。
- 前記重要度スコアを計算するステップは、ページランク付けアルゴリズムを適用することを特徴とする請求項1に記載の方法。
- 前記重要度スコアを計算するステップは、ハブ・オーソリティアルゴリズムを適用することを特徴とする請求項1に記載の方法。
- 検索結果のドキュメントの指示を受信するステップ、および前記検索結果のドキュメントを前記ドキュメントの前記時間重要度スコアに基づいてランク付けするステップを含むことを特徴とする請求項1に記載の方法。
- ウェブページおよび前記ウェブページ間のリンクを示すウェブのスナップショットを収集するステップ(211)と、
前記リンク情報に基づいて、前記スナップショットのウェブページの重要度スコアを計算するステップ(216)と、
前記ウェブページのスナップショットの前記重要度スコアを集約して、前記ウェブページの時間重要度スコアを提供するステップ(215)と、
前記ウェブページの前記時間重要度スコアをファクタリングすることにより、検索要求の検索結果のウェブページのランク付けを生成するステップ(219)と
を含む方法により、検索結果のウェブページをランク付けするコンピューティング装置を制御する命令を符号化したコンピュータ可読媒体。 - 前記ウェブページのランク付けを生成するステップは、前記検索要求に対する前記ウェブページの関連性をファクタリングすることを特徴とする請求項10に記載のコンピュータ可読媒体。
- 前記重要度スコアを集約するステップは、減衰ファクタを適用することを特徴とする請求項10に記載のコンピュータ可読媒体。
- 前記スナップショットは、前記ウェブページおよび前記リンクのウェブグラフを表すことを特徴とする請求項10に記載のコンピュータ可読媒体。
- 前記重要度スコアを計算するステップは、ページランク付けアルゴリズムを適用することを特徴とする請求項10に記載のコンピュータ可読媒体。
- 前記重要度スコアを計算するステップは、ハブ・オーソリティアルゴリズムを適用することを特徴とする請求項10に記載のコンピュータ可読媒体。
- ハイパーリンクの分析に基づいて、ウェブページの時間重要度を判定するコンピューティングシステムであって、
種々のスナップショット時間において収集されたウェブページおよび前記ウェブページのハイパーリンクを表すリンク情報のスナップショットを含むスナップショットストア(213)と、
前記スナップショットのリンク情報に基づいて、前記ウェブページの重要度スコアを計算するコンポーネント(216)と、
ウェブページのために異なるスナップショットの前記ウェブページの前記重要度スコアを集約して、前記ウェブページの時間重要度スコアを提供するコンポーネント(215)と
を備えることを特徴とするコンピューティングシステム。 - 前記計算された重要度スコアを集約するステップは、より直近のスナップショットの重要度スコアを、それよりも直近でないスナップショットの重要度スコアよりも重く重み付けすることを特徴とする請求項18に記載のコンピューティングシステム。
- 少なくとも前記ウェブページの前記時間重要度スコアに基づいて、検索結果のウェブページをランク付けするコンポーネントを含むことを特徴とする請求項18に記載のコンピューティングシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/734,336 | 2007-04-12 | ||
US11/734,336 US7676520B2 (en) | 2007-04-12 | 2007-04-12 | Calculating importance of documents factoring historical importance |
PCT/US2008/060144 WO2008128124A1 (en) | 2007-04-12 | 2008-04-11 | Calculating importance of documents factoring historical importance |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2010524141A true JP2010524141A (ja) | 2010-07-15 |
JP2010524141A5 JP2010524141A5 (ja) | 2010-12-02 |
JP4746712B2 JP4746712B2 (ja) | 2011-08-10 |
Family
ID=39854673
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010503259A Active JP4746712B2 (ja) | 2007-04-12 | 2008-04-11 | 履歴重要度のファクタリングによるドキュメントの重要度の計算 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7676520B2 (ja) |
EP (1) | EP2145264B1 (ja) |
JP (1) | JP4746712B2 (ja) |
CN (1) | CN101652771B (ja) |
WO (1) | WO2008128124A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012519901A (ja) * | 2009-03-04 | 2012-08-30 | アリババ・グループ・ホールディング・リミテッド | ウェブページの評価 |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8244722B1 (en) * | 2005-06-30 | 2012-08-14 | Google Inc. | Ranking documents |
WO2008126184A1 (ja) * | 2007-03-16 | 2008-10-23 | Fujitsu Limited | 文書重要度算出プログラム |
US8667117B2 (en) * | 2007-05-31 | 2014-03-04 | Microsoft Corporation | Search ranger system and double-funnel model for search spam analyses and browser protection |
US7873635B2 (en) * | 2007-05-31 | 2011-01-18 | Microsoft Corporation | Search ranger system and double-funnel model for search spam analyses and browser protection |
US9430577B2 (en) * | 2007-05-31 | 2016-08-30 | Microsoft Technology Licensing, Llc | Search ranger system and double-funnel model for search spam analyses and browser protection |
US10762080B2 (en) * | 2007-08-14 | 2020-09-01 | John Nicholas and Kristin Gross Trust | Temporal document sorter and method |
US7949643B2 (en) * | 2008-04-29 | 2011-05-24 | Yahoo! Inc. | Method and apparatus for rating user generated content in search results |
US10353967B2 (en) * | 2009-06-22 | 2019-07-16 | Microsoft Technology Licensing, Llc | Assigning relevance weights based on temporal dynamics |
US8150841B2 (en) * | 2010-01-20 | 2012-04-03 | Microsoft Corporation | Detecting spiking queries |
JP5357804B2 (ja) * | 2010-02-24 | 2013-12-04 | 日本電信電話株式会社 | 関心度処理装置、関心度処理方法、および、関心度処理プログラム |
US8700642B2 (en) * | 2010-03-22 | 2014-04-15 | Microsoft Corporation | Software agent for monitoring content relevance |
US9324112B2 (en) * | 2010-11-09 | 2016-04-26 | Microsoft Technology Licensing, Llc | Ranking authors in social media systems |
US9286619B2 (en) | 2010-12-27 | 2016-03-15 | Microsoft Technology Licensing, Llc | System and method for generating social summaries |
US9218419B2 (en) * | 2012-04-23 | 2015-12-22 | Yahoo! Inc. | Snapshot generation for search results page preview |
US9529926B2 (en) * | 2012-04-23 | 2016-12-27 | Excalibur Ip, Llc | Snapshot refreshment for search results page preview |
US9569413B2 (en) * | 2012-05-07 | 2017-02-14 | Sap Se | Document text processing using edge detection |
US9348846B2 (en) | 2012-07-02 | 2016-05-24 | Google Inc. | User-navigable resource representations |
US9294576B2 (en) | 2013-01-02 | 2016-03-22 | Microsoft Technology Licensing, Llc | Social media impact assessment |
US9519686B2 (en) | 2014-04-09 | 2016-12-13 | International Business Machines Corporation | Confidence ranking of answers based on temporal semantics |
US9646247B2 (en) | 2014-04-09 | 2017-05-09 | International Business Machines Corporation | Utilizing temporal indicators to weight semantic values |
CN104063504B (zh) * | 2014-07-08 | 2018-07-13 | 百度在线网络技术(北京)有限公司 | 网页的综合访问权值的确定方法及访问记录的排序方法 |
US10331673B2 (en) | 2014-11-24 | 2019-06-25 | International Business Machines Corporation | Applying level of permanence to statements to influence confidence ranking |
US10824659B2 (en) | 2018-08-28 | 2020-11-03 | International Business Machines Corporation | Predicting the temporal stability of answers in a deep question answering system |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001290843A (ja) * | 2000-02-04 | 2001-10-19 | Fujitsu Ltd | 文書検索装置及びその方法並びに文書検索プログラム及びそのプログラムを記録した記録媒体 |
JP2005332385A (ja) * | 2004-04-29 | 2005-12-02 | Microsoft Corp | リンクおよびページレイアウトの分析を利用することによりイメージ関連性を識別する方法およびシステム |
JP2007507798A (ja) * | 2003-09-30 | 2007-03-29 | グーグル・インク | ドキュメントをスコア付けするための方法、ドキュメントをランク付けするための方法及びドキュメントをスコア付けするためのシステム |
JP2008511057A (ja) * | 2004-08-19 | 2008-04-10 | クラリア コーポレイション | エンドユーザの情報要求に応答するための方法及び装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6285999B1 (en) * | 1997-01-10 | 2001-09-04 | The Board Of Trustees Of The Leland Stanford Junior University | Method for node ranking in a linked database |
CA2342871A1 (en) * | 1998-09-03 | 2000-03-16 | Ownx, Inc. | System for automatically calculating consumer earned equity |
JP3698242B2 (ja) * | 1999-08-20 | 2005-09-21 | 日本電気株式会社 | 情報セット重要度判定システム及びその判定方法、及び情報セット重要度判定プログラムを記録した記録媒体 |
US7225181B2 (en) * | 2000-02-04 | 2007-05-29 | Fujitsu Limited | Document searching apparatus, method thereof, and record medium thereof |
US7080073B1 (en) * | 2000-08-18 | 2006-07-18 | Firstrain, Inc. | Method and apparatus for focused crawling |
US6560600B1 (en) * | 2000-10-25 | 2003-05-06 | Alta Vista Company | Method and apparatus for ranking Web page search results |
US7076483B2 (en) * | 2001-08-27 | 2006-07-11 | Xyleme Sa | Ranking nodes in a graph |
US7089252B2 (en) * | 2002-04-25 | 2006-08-08 | International Business Machines Corporation | System and method for rapid computation of PageRank |
US20060294124A1 (en) * | 2004-01-12 | 2006-12-28 | Junghoo Cho | Unbiased page ranking |
US9104689B2 (en) * | 2004-03-17 | 2015-08-11 | International Business Machines Corporation | Method for synchronizing documents for disconnected operation |
US20060036598A1 (en) * | 2004-08-09 | 2006-02-16 | Jie Wu | Computerized method for ranking linked information items in distributed sources |
US7779001B2 (en) * | 2004-10-29 | 2010-08-17 | Microsoft Corporation | Web page ranking with hierarchical considerations |
US7516123B2 (en) * | 2005-04-14 | 2009-04-07 | International Business Machines Corporation | Page rank for the semantic web query |
US8140559B2 (en) * | 2005-06-27 | 2012-03-20 | Make Sence, Inc. | Knowledge correlation search engine |
-
2007
- 2007-04-12 US US11/734,336 patent/US7676520B2/en not_active Expired - Fee Related
-
2008
- 2008-04-11 WO PCT/US2008/060144 patent/WO2008128124A1/en active Application Filing
- 2008-04-11 JP JP2010503259A patent/JP4746712B2/ja active Active
- 2008-04-11 CN CN2008800114132A patent/CN101652771B/zh active Active
- 2008-04-11 EP EP08745701.6A patent/EP2145264B1/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001290843A (ja) * | 2000-02-04 | 2001-10-19 | Fujitsu Ltd | 文書検索装置及びその方法並びに文書検索プログラム及びそのプログラムを記録した記録媒体 |
JP2007507798A (ja) * | 2003-09-30 | 2007-03-29 | グーグル・インク | ドキュメントをスコア付けするための方法、ドキュメントをランク付けするための方法及びドキュメントをスコア付けするためのシステム |
JP2005332385A (ja) * | 2004-04-29 | 2005-12-02 | Microsoft Corp | リンクおよびページレイアウトの分析を利用することによりイメージ関連性を識別する方法およびシステム |
JP2008511057A (ja) * | 2004-08-19 | 2008-04-10 | クラリア コーポレイション | エンドユーザの情報要求に応答するための方法及び装置 |
Non-Patent Citations (3)
Title |
---|
LEI YANG、外4名: "Link Analysis using Time Series of Web Graphs", PROCEEDINGS OF THE SIXTEENTH ACM CONFERENCE ON CONFERENCE ON INFORMATION AND KNOWLEDGE MANAGEMENT CI, JPN6010071525, 8 November 2007 (2007-11-08), pages 1011 - 1014, XP058193027, ISSN: 0001911550, DOI: 10.1145/1321440.1321598 * |
向亨、外2名: "利用履歴に基づくPageRankアルゴリズムの改良", 第13回データ工学ワークショップ(DEWS2002)論文集[ONLINE], JPN6010071522, 15 May 2002 (2002-05-15), JP, pages 1 - 8, ISSN: 0001911548 * |
河野浩之: "サーチエンジンの表示順を決めるアルゴリズム", 電子情報通信学会誌, vol. 第89巻,第4号, JPN6010071524, 1 April 2006 (2006-04-01), JP, pages 318 - 321, ISSN: 0001911549 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012519901A (ja) * | 2009-03-04 | 2012-08-30 | アリババ・グループ・ホールディング・リミテッド | ウェブページの評価 |
Also Published As
Publication number | Publication date |
---|---|
EP2145264B1 (en) | 2018-07-25 |
EP2145264A4 (en) | 2011-10-26 |
CN101652771B (zh) | 2013-11-20 |
US20080256051A1 (en) | 2008-10-16 |
WO2008128124A1 (en) | 2008-10-23 |
CN101652771A (zh) | 2010-02-17 |
JP4746712B2 (ja) | 2011-08-10 |
EP2145264A1 (en) | 2010-01-20 |
US7676520B2 (en) | 2010-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4746712B2 (ja) | 履歴重要度のファクタリングによるドキュメントの重要度の計算 | |
US8244737B2 (en) | Ranking documents based on a series of document graphs | |
JP4950444B2 (ja) | クリックディスタンスを用いて検索結果をランク付けするシステムおよび方法 | |
US7624104B2 (en) | User-sensitive pagerank | |
KR101130533B1 (ko) | 이종 관계에 기초하여 객체들의 유사성을 결정하기 위한방법 및 시스템 | |
Liu et al. | BrowseRank: letting web users vote for page importance | |
US7502789B2 (en) | Identifying important news reports from news home pages | |
US9443022B2 (en) | Method, system, and graphical user interface for providing personalized recommendations of popular search queries | |
US20070005588A1 (en) | Determining relevance using queries as surrogate content | |
US20080313142A1 (en) | Categorization of queries | |
US7580931B2 (en) | Topic distillation via subsite retrieval | |
US20080027936A1 (en) | Ranking of web sites by aggregating web page ranks | |
US20110161330A1 (en) | Calculating global importance of documents based on global hitting times | |
US8069167B2 (en) | Calculating web page importance | |
US7660791B2 (en) | System and method for determining initial relevance of a document with respect to a given category | |
US20070198504A1 (en) | Calculating level-based importance of a web page | |
CA2682051A1 (en) | Look-ahead document ranking system | |
KR20080073289A (ko) | 계층 구조 기반의 문서의 기여도의 전달 | |
US20060004809A1 (en) | Method and system for calculating document importance using document classifications | |
Najafi et al. | A New Hybrid Method for Web Pages Ranking in Search Engines | |
Xiao et al. | Clustering web-search results using transduction-based relevance model | |
Tao et al. | Improving browsing time estimation with intentional browsing data | |
Sowmiya et al. | Enhancement in Weighted Page Rank Algorithm for Ranking Web Pages | |
Li et al. | An Improved Website Structure Optimizing Algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101014 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101014 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20101014 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20101125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110510 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110513 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140520 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4746712 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |