CN1229745C - 预取被参考资源的方法和设备 - Google Patents

预取被参考资源的方法和设备 Download PDF

Info

Publication number
CN1229745C
CN1229745C CNB018032613A CN01803261A CN1229745C CN 1229745 C CN1229745 C CN 1229745C CN B018032613 A CNB018032613 A CN B018032613A CN 01803261 A CN01803261 A CN 01803261A CN 1229745 C CN1229745 C CN 1229745C
Authority
CN
China
Prior art keywords
resource
reference substance
institute
weighted value
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB018032613A
Other languages
English (en)
Other versions
CN1465019A (zh
Inventor
S·布兰查德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1465019A publication Critical patent/CN1465019A/zh
Application granted granted Critical
Publication of CN1229745C publication Critical patent/CN1229745C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明公开了用于从服务器(102,103,104)预取被参考的资源的方法和设备(100)。第一资源(106)为未预取的资源(107),该资源被加权并按照他们加权值的次序被预取。计算加权值是基于先前取出被参考物所参考的资源的次数以及先前从服务器中取出一个或多个更多资源的次数(203),其中该服务器被构造为提供被参考物所参考的资源。设备(100)可由一计算机程序产品来实现。

Description

预取被参考资源的方法和设备
技术领域
本发明涉及一种预取被参考资源的方法,包括以下步骤:
—从给定的第一资源中确定一组资源参考物,
—为组中的每一个资源参考物计算一相应的加权值并将其分配给参考物,
—确定组中具有最大相应加权值的参考物,以及
—预取出被该参考物所参考的资源,
本发明进一步涉及一个用于预取被参考资源的设备,包括
·链路确定装置,用于从给定的第一资源中确定一组关于资源的参考物,
·链路加权装置,用于为组中的每一个资源的参考物计算一相应的加权值并将其分配给参考物,
·选择装置,用于从组中选择具有最大相应加权值的第一参考物,以及
·预取装置,用于预取被第一参考物所参考的一资源。
本发明进一步涉及一种计算机程序产品。
背景技术
根据前文的方法和系统可从美国专利6098064中可知。
诸如环球网这样的信息系统包括多个资源,例如文本文档,图形文件,音频文件和视频文件。这些资源中的一些例如以超链接或URLs形式包括其他资源的参考物。资源被各种服务器使用。用户通过具有他的客户系统的那些服务器中取出资源来访问他们。
这种取出资源典型地是按需为基础来完成的,即,当用户请求一资源时取出资源。因为取资源花费时间,所以希望预取资源使得当用户请求这样一个被预取的资源时他不必等待。预取资源包括从服务器取出资源并且自动将它存储在客户系统中,最好是存储在不需延迟就可访问的局部超高速缓存器中。
然而,因为网络容量的限制,通常不可能预取在一给定资源中被参考的所有资源。因此希望预测用户很可能沿用哪些参考物并预取那些参考物。为此上述所提及的美国专利提出了一种方法,该方法确定了一个包含有历史因素和上下文因素的需求概率。通过首先定义客户系统的上下文并且然后利用上下文来估计参考资源与用户相关的概率来近似上下文因素。被参考资源的需求概率被计算并以需求概率递减的次序被预取。这种概率是以自从所讨论的被参考资源上次被访问以来的天数以及所述访问的频率为基础的。
上述方法的缺点是它需要追踪大量的历史信息和上下文信息。
发明内容
本发明的一个目的就是提供一种根据开头一段的方法,该方法可精确的预测要被预取的被参考资源并且该方法需要留存的信息很少。
该目的是由本发明中的一方法来实现的,该方法的特征在于:根据先前取出被参考物所参考的资源的次数以及先前从服务器中取出一个或多个其它资源的次数来计算一参考物的加权值,其中该服务器提供被参考物所参考的资源。用在该计算中的信息需要的存储器很少并且很容易被追踪。另外,过去被访问多次的资源很可能在将来被再次访问,并且可以从与第一服务器相同服务器中所获得的其他资源也可能被访问。这样该方法提供了精确的预测。
该方法的实施例中进一步包括从组中按照他们相应加权值的次序预取出被参考物所参考的资源。该实施例的优点在于加权值提供了用于确定被参考资源被预取出的次序的理想排列机制。
在另外一个实施例中加权值的计算还基于被参考物所参考的资源的描述中的一个和多个关键字。该实施例的优点在于这样的关键字可被用于确定资源的主题,资源的主题与用户的首选项有相互关系以增加预测的精确性。
本发明的又一个目的就是提供一种根据开头一段的设备,该设备用来精确的预测要被预取的被参考资源并且该设备需要留存的信息很少。
该目的是由本发明中的一设备来实现的,该设备的特征在于:链路加权装置被构用来根据先前取出被参考物所参考的资源的次数以及先前从服务器中取出一个或多个其它资源的次数来计算一参考物的加权值,其中该服务器被构造为提供被参考物所参考的资源。
在一实施例中预取装置进一步被构造成用于从组中按照他们相应加权值的次序预取出其它被参考物所参考的资源。
在另一实施例中链路加权装置进一步被构造成根据被参考物所参考的资源的描述中的一个或多个关键字来计算相应加权值。
附图说明
参考如图的实施例,本发明的这些和其他方面将是显而易见的并是解释明白的。其中:
图1给出了在通信网络中的根据本发明的设备示意图;
图2给出了用在根据本发明的设备中的示例性信息图表。
具体实施方式
全部附图中,相同的附图标记表示相似的或相应的特征。在附图中所表示的一些特征典型地用软件来完成,并且因此表示为软件实体,例如软件模块或对象。
图1给出了与通信网络101相连的设备100的示意图。被构造为向设备100提供资源的服务器102,103,104也与通信网络101相连。通信网络101最好是互联网,并且在那种情况下设备100典型的是一运行浏览器程序的通用计算机,该浏览器程序可利用诸如HTTP这样的协议从服务器102,103,104中取出主页,图象,声音,视频以及其他的资源。
设备100被构造为从服务器102,103,104中取出一个或多个资源105。它可将所取出的资源105存储在局部存储器中,例如局部超高速缓存储器,以至他们可很容易并且可很快的提供给用户。这些在下面将很清楚,设备100被构造成预取资源105以至当用户请求一被预取的资源时他不需等待。预取包括从服务器102,103,104中取出资源105并自动存储在设备100中,最好是存储在局部超高速缓存器中,不需延迟就可访问局部超高速缓存器中的资源105。
设备100包括链路确定模块110,链路加权模块111,选择模块112以及预取模块113。当设备访问第一资源106时,典型的在第一资源106中存在关于其他资源的多个参考物107,108。例如,在环球网的情况下,第一资源可以是与其他HTML文档或其他资源相连的HTML文档。
链路确定模块110确定关于第一资源106中的资源的一组参考物107。它在第一资源中集合所有的资源107,108,但是最好是只有那些不在局部存储器中的参考物107形成一组。因为组将在预取中使用,希望它不包括那些已被预取的资源的参考物108,因为他们不必被预取。
链路加权模块111计算那组中的每一个参考物107的相应加权值并将已计算的加权值分配给参考物。根据本发明,链路加权模块111根据先前取出被参考物所参考的资源的次数以及先前从服务器中取出一个或多个更多资源的次数来计算参考物的加权值,其中该服务器被构造为提供被参考物所参考的资源。如果资源先前被取出多次,于是它可接收一个高的加权值,因为它很显然是通用的。从相同服务器所获得的其他资源也可能很通用,至少比其他服务器中的其他资源更通用。经常存在这样一种情况,即用户希望在一服务器中可用的一主题中读多个文档。
链路加权模块可选择性的根据一个或多个描述被参考物所参考的资源的关键字来进一步计算加权值。该描述可来自参考物本身。例如,与构成参考物的超链接有关的固定文本可被用作一描述。在HTML的情况下,可构成参考物的固定单元的可选TITLE属性可被用作一描述。
在优选实施例中,根据下述公式来计算加权值:
W = A × NU P + B × NS P + C × Σ i = 1 K i . 在这个公式中,A,B和C是比例因子。NUP是先前从服务器中取出一个或多个其他资源的次数,其中该服务器被构造成提供被参考物所参考的资源。用在描述中的关键字Ki是按从1到n的顺序被求和。
当用户第一次使用设备100时,比例因子A,B和C最好是用一缺省值来初始化,并且随着准确的预测被测定而改变。例如如果发现用户很可能返回先前所取出的资源,那么比例因子的值可被增加。
在组中的参考物107的加权值被计算之后,已加权的参考物于是被送到选择模块112,该模块从组中选择具有最大加权值的第一参考物。预取模块113于是预取出被第一参考物所参考的资源105。该资源保存在服务器102,103,104中的一个并且通过通信网络101上被预取出。预取模块113可从按照加权值增加顺序的组中预取出一个或多个被参考物所参考的另外的资源105。
因为预取需要假定可用的网络容量,所以希望限制被预取的资源数目或数据量。为此,预取模块113为给定的第一资源提供了被预取的最大数目的资源或最大量的数据。
图2设备100所使用的表200。为获得先前取出被参考物所参考的资源的次数以及先前从服务器中取出一个或多个更多资源的次数,其中该服务器被构造为提供被参考物所参考的资源,设备100包括一存储器,该存储器存储具有这些值的表。只要资源被用户访问表就被更新。在图2的示意性实施例中,表200包括第一列201,第二列202以及第三列203。第一列201包括有关资源的参考物。第二列202包括,对于第一列201中每一参考物而言,先前取出被参考物所参考的资源的次数。第三列203包括,对于第一列201中每一参考物而言,先前从服务器中取出一个或多个更多资源的次数,其中该服务器被构造为提供被参考物所参考的资源。每当设备100取出参考物不在这个表中的资源时,为该参考物增加一行。当参考物在该表中,并且参考物所参考的资源再次被取出时,该参考物第二列202以及第三列203中的值被增加。当从同一服务器取出另外一参考物时,第三列203中的值被增加。
设备100可用一计算机程序产品来实现,该计算机程序产品装载在诸如个人计算机这样的通用可编程设备中,并且可引起所述可编程设备作为设备100的功能。该计算机程序产品最好是包括浏览器或高速缓存代理服务器。该计算机程序产品可被服务器102,103和104中的一个下载。

Claims (6)

1.用于预取被参考资源的方法,包括步骤:
—从给定的第一资源(106)中确定一组关于资源的参考物(107),
—为组中的每一个资源的参考物(107)计算一相应的加权值并将其分配给参考物(107),
—确定组中具有最大相应加权值的参考物,以及
—预取出被该参考物所参考的资源,
其特征在于根据先前取出参考物(107)所参考的资源的次数(202)以及先前从服务器(102,103,104)中取出一个或多个其它资源的次数(203)来计算一参考物(107)的加权值,其中该服务器提供被参考物(107)所参考的资源。
2.如权利要求1的方法,其特征在于进一步包括以下步骤:在所述组中按照它们对应的加权值的顺序编排参考物的顺序,并且按照该对应的加权值的编排顺序预取出被这些参考物(107)所参考的另外的资源。
3.如权利要求1的方法,其特征在于计算相应加权值进一步基于被参考物(107)所参考的资源的描述中的一个或多个关键字。
4.用于预取被参考的资源的设备(100),其特征在于包括
·链路确定装置(110),用于从给定的第一资源(106)中确定一组关于资源的参考物(107),
·链路加权装置(111),用于为组中的每一个资源的参考物(107)计算一相应的加权值并将其分配给参考物(107),
·选择装置(112),用于从组中选择出具有最大相应加权值的第一参考物,以及
·预取装置(113),用于预取出被第一参考物所参考的资源,
其特征在于链路加权装置(111)被构造为根据先前取出被参考物(107)所参考的资源的次数(202)以及先前从服务器(102,103,104)中取出一个或多个其它资源的次数(203)来计算一参考物(107)的各加权值,其中该服务器提供被参考物(107)所参考的资源。
5.如权利要求4的设备,其特征在于预取装置(113)被进一步构造成从组中按照他们对应加权值的顺序预取出更多被参考物(107)所参考的资源。
6.如权利要求4的设备,其特征在于链路加权装置(111)被进一步构造成根据被参考物(107)所参考的资源的描述中的一个或多个关键字来计算相应加权值。
CNB018032613A 2000-10-24 2001-10-12 预取被参考资源的方法和设备 Expired - Fee Related CN1229745C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP00203686 2000-10-24
EP00203686.1 2000-10-24

Publications (2)

Publication Number Publication Date
CN1465019A CN1465019A (zh) 2003-12-31
CN1229745C true CN1229745C (zh) 2005-11-30

Family

ID=8172171

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB018032613A Expired - Fee Related CN1229745C (zh) 2000-10-24 2001-10-12 预取被参考资源的方法和设备

Country Status (6)

Country Link
US (1) US6877068B2 (zh)
EP (1) EP1358581A2 (zh)
JP (1) JP4202129B2 (zh)
KR (1) KR20020062987A (zh)
CN (1) CN1229745C (zh)
WO (1) WO2002035383A2 (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7062756B2 (en) * 2001-11-30 2006-06-13 Sun Microsystems, Inc. Dynamic object usage pattern learning and efficient caching
US8176186B2 (en) * 2002-10-30 2012-05-08 Riverbed Technology, Inc. Transaction accelerator for client-server communications systems
US7120666B2 (en) 2002-10-30 2006-10-10 Riverbed Technology, Inc. Transaction accelerator for client-server communication systems
US8732610B2 (en) 2004-11-10 2014-05-20 Bt Web Solutions, Llc Method and apparatus for enhanced browsing, using icons to indicate status of content and/or content retrieval
US7840911B2 (en) * 2004-09-27 2010-11-23 Scott Milener Method and apparatus for enhanced browsing
US8037527B2 (en) 2004-11-08 2011-10-11 Bt Web Solutions, Llc Method and apparatus for look-ahead security scanning
US8327440B2 (en) 2004-11-08 2012-12-04 Bt Web Solutions, Llc Method and apparatus for enhanced browsing with security scanning
US20060074984A1 (en) * 2004-09-27 2006-04-06 Scott Milener Graphical tree depicting search or browsing history
US20060143568A1 (en) * 2004-11-10 2006-06-29 Scott Milener Method and apparatus for enhanced browsing
US20060248194A1 (en) 2005-03-18 2006-11-02 Riverbed Technology, Inc. Connection forwarding
US7694008B2 (en) 2005-05-04 2010-04-06 Venturi Wireless Method and apparatus for increasing performance of HTTP over long-latency links
CN101110844B (zh) * 2007-08-21 2010-07-28 华为技术有限公司 一种节目片段预取方法及一种对等网络节点
US8789065B2 (en) 2012-06-08 2014-07-22 Throughputer, Inc. System and method for input data load adaptive parallel processing
US20130117168A1 (en) 2011-11-04 2013-05-09 Mark Henrik Sandstrom Maximizing Throughput of Multi-user Parallel Data Processing Systems
CN102624756B (zh) * 2011-01-28 2015-06-24 联想(北京)有限公司 数据下载终端以及数据下载方法
CN102354383A (zh) * 2011-06-30 2012-02-15 珠海艾派克微电子有限公司 一种权限分配方法及系统
US8793698B1 (en) * 2013-02-21 2014-07-29 Throughputer, Inc. Load balancer for parallel processors
US9448847B2 (en) 2011-07-15 2016-09-20 Throughputer, Inc. Concurrent program execution optimization
CN103260187B (zh) 2012-02-20 2016-03-02 华为技术有限公司 内容编码预同步的方法、设备及系统
US9898445B2 (en) 2012-08-16 2018-02-20 Qualcomm Incorporated Resource prefetching via sandboxed execution
US10057332B2 (en) * 2014-12-11 2018-08-21 International Business Machines Corporation Preemptive extraction of data from long latency storage in a cloud computing environment
US10484487B2 (en) 2015-04-01 2019-11-19 At&T Mobility Ii Llc System and method for predictive delivery of prioritized content
CN111399784B (zh) * 2020-06-03 2020-10-16 广东睿江云计算股份有限公司 一种分布式存储的预读写方法及装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3488289B2 (ja) * 1994-09-19 2004-01-19 Kddi株式会社 ハイパーメディア文書通信装置
JP3370507B2 (ja) * 1996-03-29 2003-01-27 日本電信電話株式会社 構造化情報表示システムにおけるクライアント
JPH10171702A (ja) * 1996-12-12 1998-06-26 Matsushita Electric Ind Co Ltd 表示装置
US5878223A (en) * 1997-05-07 1999-03-02 International Business Machines Corporation System and method for predictive caching of information pages
JPH10307780A (ja) * 1997-05-09 1998-11-17 Yazaki Corp インターネット端末装置
JPH1124982A (ja) * 1997-06-30 1999-01-29 Nec Corp 履歴に基づくWebページ先読み方式
JPH11120069A (ja) * 1997-10-17 1999-04-30 Hitachi Ltd データ先読み方法
JPH11149405A (ja) * 1997-11-14 1999-06-02 Hitachi Ltd Wwwキャッシュシステムおよびwwwデータの先読み方法
US6195622B1 (en) * 1998-01-15 2001-02-27 Microsoft Corporation Methods and apparatus for building attribute transition probability models for use in pre-fetching resources
US6055572A (en) * 1998-01-20 2000-04-25 Netscape Communications Corporation System and method for creating pathfiles for use to predict patterns of web surfaces
JPH11219313A (ja) * 1998-02-02 1999-08-10 Mitsubishi Electric Corp コンテンツ先読み方法
US6098064A (en) 1998-05-22 2000-08-01 Xerox Corporation Prefetching and caching documents according to probability ranked need S list
JP2000099438A (ja) * 1998-09-18 2000-04-07 Toshiba Corp 情報処理装置、情報先読み方法
JP3912464B2 (ja) * 1998-11-13 2007-05-09 セイコーエプソン株式会社 画面表示データ読込装置
JP2002373109A (ja) * 2001-06-13 2002-12-26 Nec Corp データ先読みシステムおよび先読み方法

Also Published As

Publication number Publication date
JP4202129B2 (ja) 2008-12-24
WO2002035383A2 (en) 2002-05-02
EP1358581A2 (en) 2003-11-05
US20020169828A1 (en) 2002-11-14
WO2002035383A3 (en) 2003-08-28
JP2004512615A (ja) 2004-04-22
CN1465019A (zh) 2003-12-31
KR20020062987A (ko) 2002-07-31
US6877068B2 (en) 2005-04-05

Similar Documents

Publication Publication Date Title
CN1229745C (zh) 预取被参考资源的方法和设备
KR100778159B1 (ko) 개별 소스들로부터의 검색 엔진 결과들을 하나의 검색결과로 블렌딩하는 방법 및 시스템
US5933832A (en) Retrieval system for frequently updated data distributed on network
JP5826266B2 (ja) ウェブページのネストしたフラグメントキャッシングを処理する方法および装置
US8782032B2 (en) Minimizing visibility of stale content in web searching including revising web crawl intervals of documents
AU2006279520B2 (en) Ranking functions using a biased click distance of a document on a network
CN1605079A (zh) 对抢先和预测的页面进行缓存以提高站点导航的方法和系统
US20180285470A1 (en) A Mobile Web Cache Optimization Method Based on HTML5 Application Caching
WO2001033345A1 (en) System and method for enforcing politeness while scheduling downloads in a web crawler
US20160371386A1 (en) Topical Mapping
EP1246082A2 (en) Systems and methods for identifying user types using multi-modal clustering and information scent
US20120130970A1 (en) Method And Apparatus For Enhanced Web Browsing
CN1339747A (zh) 用于高速缓存文件信息的系统和方法
Xiao et al. Clustering of web users using session-based similarity measures
CN109977285B (zh) 一种面向Deep Web的自适应增量数据采集方法
JP2007183903A (ja) トレンド情報分析装置
CN110677270A (zh) 一种域名的可缓存性分析方法及系统
Pons Improving the performance of client web object retrieval
CN103971326A (zh) 一种地图瓦片的个性化缓存方法和装置
CN1489735A (zh) 在客户机/服务器网络中按顺序先行高速缓存被链接文件的系统、方法和程序
JP2003271494A (ja) 情報収集システム、情報収集方法、情報収集プログラムおよび記録媒体
US20030101214A1 (en) Allocating data objects stored on a server system
CN1183464C (zh) 用于创建统一的可打印的超链接文档集的方法
US20090292683A1 (en) System and method for automatically ranking lines of text
CN1874375A (zh) 用于语音增值业务系统的预取语音资源的实现方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee