CN102591887B - 网络数据预读方法及系统 - Google Patents

网络数据预读方法及系统 Download PDF

Info

Publication number
CN102591887B
CN102591887B CN201110020228.3A CN201110020228A CN102591887B CN 102591887 B CN102591887 B CN 102591887B CN 201110020228 A CN201110020228 A CN 201110020228A CN 102591887 B CN102591887 B CN 102591887B
Authority
CN
China
Prior art keywords
page turning
turning element
page
web page
dynamic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110020228.3A
Other languages
English (en)
Other versions
CN102591887A (zh
Inventor
黄磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Tencent Cloud Computing Beijing Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201110020228.3A priority Critical patent/CN102591887B/zh
Priority to PCT/CN2012/070290 priority patent/WO2012097701A1/zh
Publication of CN102591887A publication Critical patent/CN102591887A/zh
Priority to US13/937,114 priority patent/US20130305131A1/en
Application granted granted Critical
Publication of CN102591887B publication Critical patent/CN102591887B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种网络数据预读方法及系统,该方法包括以下步骤:获取动态翻页元素集合;获取浏览网页的域名,根据所述域名从所述动态翻页元素集合中查询对应的翻页元素;根据所述翻页元素从所述浏览网页中查找与所述翻页元素相匹配的带有链接的网页元素;拉取所述网页元素对应的页面数据,进行预读处理。上述网络数据预读方法及系统,因动态翻页元素集合有用户需求的翻页元素,按照该翻页元素进行预读操作,提高了预读内容的准确性,减少了将用户不必要的网络数据发送给用户的几率,提高了网络资源的利用率。

Description

网络数据预读方法及系统
【技术领域】
本发明涉及互联网技术领域,特别涉及一种网络数据预读方法及系统。
【背景技术】
近年来,随着移动互联网的快速发展,3G网络和终端设备的快速普及,传统的互联网数据进入移动通信终端的需求越来越强烈。用户通过在移动通信终端(如手机)上安装浏览器,实现浏览互联网数据。而由于移动通信终端的计算和存储能力较弱,移动网关网络传输能力不强,浏览资源受限。
互联网数据在面对小屏幕的移动通信终端时,一般都会经过中转服务器进行分页转换处理,用户在移动通信终端浏览网页时,通常看到的是分页后的局部页面,为了浏览网页完整的内容,用户常用的操作之一是点击类似“下一页”的元素。因此在用户实际点击“下一页”之前预先进行读取相应页面网络数据的操作称为预读。然而,传统的智能预读功能是基于有限的固定翻页元素的预读,不能自适应不同类型的网站,不能满足不同的用户差异化的需求,预读一些用户不需要的网络数据给用户,造成网络资源的浪费。
【发明内容】
基于此,有必要提供一种能提高网络资源利用率的网络数据预读方法。
一种网络数据预读方法,包括以下步骤:
获取动态翻页元素集合;
获取浏览网页的域名,根据所述域名从所述动态翻页元素集合中查询对应的翻页元素;
根据所述翻页元素从所述浏览网页中查找与所述翻页元素相匹配的带有链接的网页元素;
拉取所述网页元素对应的页面数据,进行预读处理。
优选地,所述方法还包括获取静态翻页元素集合的步骤;
根据查询到的所述翻页元素从所述浏览网页中查找相匹配的带有链接的网页元素的步骤之后还包括:
判断匹配是否成功,若是,则拉取匹配后的带有链接的网页元素对应的翻页页面,进行预读处理;若否,则根据所述域名从所述静态翻页元素集合中查询对应的翻页元素,并根据查询到的所述静态翻页元素集合中的翻页元素从所述浏览网页中查找与所述翻页元素相匹配的带有链接的网页元素,再拉取匹配后的带有链接的网页元素对应的页面数据,进行预读处理。
优选地,还包括步骤:
获取动态翻页元素集合中与域名相对应的翻页元素的权重值;
根据所述翻页元素的权重值从大到小从所述浏览网页中查找与所述翻页元素相匹配的带有链接的网页元素,得出翻页元素与网页元素相匹配中权重值最大的翻页元素所对应的带有链接的网页元素。
优选地,还包括步骤:获取用户点击的带有链接的网页元素,将所述用户点击的带有链接的网页元素更新到所述动态翻页元素集合。
优选地,将所述用户点击的带有链接的网页元素更新到所述动态翻页元素集合的具体包括步骤:
根据所述用户点击的带有链接的网页元素所在的网页域名从所述动态翻页元素集合中查找与所述域名对应的翻页元素列表;
判断所述用户点击的带有链接的网页元素是否在所述翻页元素列表内,若是,则将该翻页元素的权重值加1,若否,则将所述带有链接的网页元素加入到所述翻页元素列表内。
优选地,所述方法还包括将用户的标识号及更新后的所述动态翻页元素集合上传到服务器;获取用户标识号,根据用户标识号从服务器下载所述动态翻页元素集合。
优选地,所述获取动态翻页元素集合的具体步骤为:动态采集用户在浏览网页是操作的带有链接的网页元素,并累计,形成用户的动态翻页元素集合。
此外,还有必要提供一种能提高网络资源利用率的网络数据预读系统。
一种网络数据预读系统,包括:
信息获取模块,用于获取动态翻页元素集合;
查询模块,用于获取浏览网页的域名,根据所述域名从所述动态翻页元素集合中查询对应的翻页元素;
匹配模块,用于根据所述翻页元素从所述浏览网页中查找与所述翻页元素相匹配的带有链接的网页元素;
页面拉取模块,用于拉取所述网页元素对应的页面数据,进行预读处理。
优选地,所述信息获取模块还用于获取静态翻页元素集合;
所述网络数据预读系统还包括:
判断模块,用于判断查找到的所述动态翻页元素集合中的翻页元素与带有链接的网页元素匹配是否成功;
所述页面拉取模块还用于当查找到的所述动态翻页元素集合中的翻页元素与带有链接的网页元素匹配成功时,拉取所述网页元素对应的页面数据,进行预读处理;
所述查询模块还用于当查找到的所述动态翻页元素集合中的翻页元素与带有链接的网页元素匹配不成功时,根据所述域名从所述静态翻页元素集合中查询对应的翻页元素;
所述匹配模块用于根据查询到的所述静态翻页元素集合中的翻页元素从浏览网页中查找与所述翻页元素相匹配的带有链接的网页元素。
优选地,所述信息获取模块还用于获取动态翻页元素集合中与域名相对应的翻页元素的权重值;
所述匹配模块还用于根据所述翻页元素的权重值从大到小从所述浏览网页中查找相匹配的带有链接的网页元素,得出翻页元素与元素相匹配中权重值最大的翻页元素所对应的带有链接的网页元素。
优选地,所述信息获取模块还用于获取用户点击的带有链接的网页元素;
所述系统还包括:
更新模块,用于将所述用户点击的带有链接的网页元素更新到所述动态翻页元素集合。
优选地,所述更新模块还用于根据所述用户点击的带有链接的网页元素所在的网页域名查找所述动态翻页元素集合中与所述域名对应的翻页元素列表,判读所述用户点击的带有链接的网页元素是否在所述翻页元素列表内,若是,则将该翻页元素的权重值加1,若否,则将所述带有链接的网页元素加入到所述翻页元素列表内。
优选地,还包括上传模块,所述上传模块将所述用户的标识号及更新后的所述动态翻页元素集合上传到服务器;所述信息获取模块还用于获取用户标识号,根据用户标识号从服务器下载所述动态翻页元素集合。
优选地,所述信息获取模块还用于动态采集用户在浏览网页是操作的带有链接的网页元素,并累计,形成用户的动态翻页元素集合。
上述网络数据预读方法及系统,采用获取动态翻页元素集合,获取网页域名后,从动态翻页元素集合中查找到相应的翻页元素,再根据翻页元素从网页中查找相匹配的带有链接的网页元素,根据网页元素拉取对应的页面数据进行预读处理,因动态翻页元素集合有用户需求的翻页元素,按照该翻页元素进行预读操作,提高了预读内容的准确性,减少了将用户不必要的网络数据发送给用户的几率,提高了网络资源的利用率。
【附图说明】
图1为一个实施例中网络数据预读方法的流程图;
图2为另一个实施例中网络数据预读方法的流程图;
图3为一个实施例中网络数据预读系统的结构示意图;
图4为另一个实施例中网络数据预读系统的结构示意图。
【具体实施方式】
下面结合具体的实施例及附图对技术方案进行详细的描述。
如图1所示,在一个实施例中,一种网络数据预读方法,包括以下步骤:
步骤S100,获取动态翻页元素集合。
动态翻页元素集合包括域名、与域名相对应的翻页元素等。动态翻页元素集合初始化时数据可为空,随着用户不断的浏览不同的网页,客户端收集用户点击翻页所对应的元素特征,对动态翻页元素集合中的数据进行动态更新,并可将该数据上传到服务器,使得客户端与服务器上的动态翻页元素集合保持一致。
在一个实施例中,获取动态翻页元素集合的具体步骤是:动态采集用户在浏览网页时操作的带有链接的网页元素,并累计,形成用户的动态翻页元素集合。采集用户操作的带有链接的网页元素,即采集用户浏览网页时的操作行为特征数据,并对采集的操作行为特征数据分析得出翻页元素,形成的用户的动态翻页元素集合,该用户的动态翻页元素集合体现了用户操作习惯,能更加准确的满足用户的需求。此外,该动态翻页元素集合还实时进行更新内部数据。行为特征数据是指用户浏览网页时点击的网页数据。带有链接的网页元素是指带有指向网页地址的网页中的节点,包括文本节点、图片节点等,其中,文本节点可以显示为“下一页”、“下一章”等,图片节点显示为表示翻页的手型图标等。点击带有链接的网页元素后,则拉取该链接指向的网页地址的页面数据。
网页按照域名进行分类,如abc.com、def.net等。不同的用户浏览的网页不同且操作也可不同,动态采集的带有链接的网页元素也不同,如A用户关注图片,采集的网页元素可为图片,分析得出图片翻页元素,形成A用户的动态翻页元素集合,如B用户关注英文网页,采集的网页元素可为next等,形成B用户的动态翻页元素集合。
在一个实施例中,步骤S100获取动态翻页元素集合的步骤为:获取用户标识号,根据用户标识号从服务器下载相对应的动态翻页元素集合。服务器上可以用户标识号为索引存储对应的动态翻页元素集合,不同的用户所存的动态翻页元素集合会不同,这样,可以满足不同的用户需求。
步骤S110,获取浏览网页的域名,根据该域名从该动态翻页元素集合中查询对应的翻页元素。
在步骤S110中,获取用户浏览的网页的域名,因动态翻页元素集合中有域名以及与域名对应的翻页元素,根据网页的域名可查询到该域名所对应的翻页元素。
在一个实施例中,除了获取浏览网页的域名外,还可获取动态翻页元素集合中与域名相对应的翻页元素的权重值。动态翻页元素集合中除了包括域名、与域名对应的翻页元素外,还可包括翻页元素的权重值、时间戳。翻页元素可为“下一页”、“下一章”、“next”,也可为图片等等。翻页元素的权重值是收集的用户点击翻页元素的次数。时间戳是指翻页元素最后更新的时间。在一个实施例中,动态翻页元素集合如表1所示。
表1
步骤S120,根据动态翻页元素集合中的翻页元素,从该浏览网页中查找与所述翻页元素相匹配的带有链接的网页元素。
在一个实施例中,还获取到动态翻页元素集合中与域名相对应的翻页元素的权重值,则步骤S120的具体过程为:根据翻页元素的权重值从大到小从浏览网页中查找与翻页元素相匹配的带有链接的网页元素,得出翻页元素与网页元素相匹配中权重值最大的翻页元素所对应的带有链接的网页元素。得到动态翻页元素集合中与域名相对应的翻页元素的权重值后,按照权重值从大到小从网页中查找带有链接的网页元素进行匹配,权重值大的优先进行匹配。如表1,若网页的域名为pic.abc.com,则先从该网页中查找与翻页元素“下一张”相匹配的带有链接的网页元素。
步骤S130,拉取网页元素对应的页面数据,进行预读处理。
网页元素对应URL(UniversalResourceLocator,网页地址)连接地址,在当前页面拉取并解析渲染排版等处理完毕后,启动客户端后台处理程序拉取该网页元素对应的URL页面数据。
这样,使得用户浏览当前页面和拉取翻页元素匹配的网页元素指向的页面网络数据是并行的,当用户点击浏览下一页时,省去了最耗时的网络交互环节,且是根据动态翻页元素进行匹配,减少了将不必要的网络数据进行预读的几率,提高了网络资源的利用率。
在一个实施例中,得到权重值最大的翻页元素所对应的带有链接的网页元素,则步骤S130具体为:拉取匹配后的权重值最大的翻页元素所对应的网页元素对应的页面数据,进行预读处理。得出匹配后的权重值最大的翻页元素所对应的网页元素,再根据该网页元素拉取对应的页面数据,进行预读处理。
优选的实施例中,上述网络数据预读方法还包括:获取用户点击的带有链接的网页元素,将用户点击的带有链接的网页元素更新到动态翻页元素集合。具体包括以下步骤:
根据用户点击的带有链接的网页元素所在的网页域名从该动态翻页元素集合中查找与域名对应的翻页元素列表。根据用户点击的带有链接的网页元素所在的网页域名,从动态翻页元素集合中查找与域名对应的翻页元素列表。该翻页元素列表包括域名、翻页元素、翻页元素权重值等。
判断用户点击的带有链接的网页元素是否在翻页元素列表内,若是,则将翻页元素的权重值加1,若否,则将带有链接的网页元素加入到翻页元素列表内。用户点击的网页元素在翻页元素列表内,则将对应的翻页元素的权重值加1,如“下一张”,在表1中查找到,则将翻页元素“下一张”的权重值加1变为9。若用户点击的网页元素未在翻页元素列表内,则将该网页元素加入到翻页元素列表内,并将权重值设为1,如表1中加入翻页元素next,权重值为1。如此对动态翻页元素集合进行更新。
优选的实施例中,上述网络数据预读方法还包括将用户的标识号及更新后的动态翻页元素集合上传到服务器的步骤。将更新后的动态翻页元素集合上传到服务器,方便用户更好不同的移动通信终端时,可仍按照个人使用,及时的浏览自身需要的网络数据,节省了网络资源。
如图2所示,在一个实施例中,网络数据预读方法,包括以下步骤:
步骤S200,获取动态翻页元素集合及静态翻页元素集合。
静态翻页元素集合中设定了多个固定的翻页元素,如“下页”、“下一页”、“下一章”、“下章”等等,并设定各种翻页元素的优先级。
形成动态翻页元素集合的具体步骤是:动态采集用户在浏览网页时的操作的带有链接的网页元素,并累计,形成用户的个性化的动态翻页元素集合。采集用户操作的带有链接的网页元素,即采集用户浏览网页时的操作行为特征数据,并对采集的操作行为特征数据分析得出翻页元素,形成的用户的个性化的动态翻页元素集合,该个性化的动态翻页元素集合体现了用户操作习惯,能更加准确的满足用户的需求。此外,该动态翻页元素集合还实时进行更新内部数据。行为特征数据是指用户浏览网页时点击的网页数据。带有链接的网页元素是指带有指向网页地址的网页中的节点,包括文本节点、图片节点等,其中,文本节点可以显示为“下一页”、“下一章”等,图片节点显示为表示翻页的手型图标等。点击带有链接的网页元素后,则拉取该链接指向的网页地址的页面数据。
步骤S210,获取浏览网页的域名,根据该域名从该动态翻页元素集合中查询对应的翻页元素。
步骤S220,根据翻页元素从该浏览网页中查找与翻页元素相匹配的带有链接的网页元素。
步骤S230,判断匹配是否成功,若是,则执行步骤S260,若否,则执行步骤S240。
步骤S240,根据该域名从该静态翻页元素集合中查询对应的翻页元素。
步骤S250,根据查询到的该静态翻页元素集合中的翻页元素从浏览网页中查找与翻页元素相匹配的带有链接的网页元素。
步骤S260,拉取网页元素对应的页面数据,进行预读处理。
在静态翻页元素集合中查询对应的翻页元素后,根据翻页元素的优先级从高到低,从浏览网页中查找相匹配的带有链接的网页元素,优先级越高,越优先匹配,匹配到网页元素后,根据网页元素的链接的指向地址,拉取对应的页面数据,进行预读处理。
在一个实施例中,如图3所示,一种网络数据预读系统,包括信息获取模块10、查询模块20、匹配模块30和页面拉取模块40。
其中,信息获取模块10用于获取动态翻页元素集合。动态翻页元素集合内包括域名、与域名相对应的翻页元素等等。动态翻页元素集合初始化时数据可为空,随着用户不断的浏览不同的网页,客户端收集用户点击翻页所对应的元素特征,对动态翻页元素集合中的数据进行动态更新,并可将该数据上传到服务器,使得客户端与服务器上的动态翻页元素集合保持一致。
信息获取模块10获取动态翻页元素集合的具体过程是:动态采集用户在浏览网页时的操作的带有链接的网页元素,并累计,形成用户的个性化的动态翻页元素集合。采集用户操作的带有链接的网页元素,即采集用户浏览网页时的操作行为特征数据,并对采集的操作行为特征数据分析得出翻页元素,形成的用户的个性化的动态翻页元素集合,该个性化的动态翻页元素集合体现了用户操作习惯,能更加准确的满足用户的需求。此外,该动态翻页元素集合还实时进行更新内部数据。行为特征数据是指用户浏览网页时点击的网页数据。带有链接的网页元素是指带有指向网页地址的网页中的节点,包括文本节点、图片节点等,其中,文本节点可以显示为“下一页”、“下一章”等,图片节点显示为表示翻页的手型图标等。点击带有链接的网页元素后,则拉取该链接指向的网页地址的页面数据。
该实施例中,信息获取模块10获取用户标识号,根据用户标识号从服务器下载相对应的动态翻页元素集合。服务器上可以用户标识号为索引存储对应的动态翻页元素集合,不同的用户所存的动态翻页元素集合会不同,这样,可以满足不同的用户需求。
查询模块20用于获取浏览网页的域名,根据域名从动态翻页元素集合中查询对应的翻页元素。因动态翻页元素集合中有域名以及与域名对应的翻页元素,则根据网页的域名查询到该域名的翻页元素。翻页元素可为“下一页”、“下一章”、“next”,也可为图片等等。
匹配模块30用于根据翻页元素从浏览网页中查找与翻页元素相匹配的带有链接的网页元素。
页面拉取模块40用于拉取匹配后的网页元素对应的页面数据,进行预读处理。网页元素对应URL(UniversalResourceLocator,网页地址)连接地址,在当前页面拉取并解析渲染排版等处理完毕后,启动客户端后台处理程序拉取该网页元素对应的URL页面数据。如此用户浏览当前页面和拉取翻页元素匹配的网页元素指向的页面网络数据是并行的,当用户点击浏览下一页时,省去了最耗时的网络交互环节,且是根据动态翻页元素进行匹配,减少了将不必要的网络数据进行预读的几率,提高了网络资源的利用率。
优选的实施例中,信息获取模块10还用于获取动态翻页元素集合中与域名相对应的翻页元素的权重值。在一个实施例中,除了获取浏览网页的域名外,还可获取动态翻页元素集合中与域名相对应的翻页元素的权重值。动态翻页元素集合中除了包括域名、与域名对应的翻页元素外,还可包括翻页元素的权重值、时间戳。翻页元素可为“下一页”、“下一章”、“next”,也可为图片等等。翻页元素的权重值是收集的用户点击翻页元素的次数。时间戳是指翻页元素最后更新的时间。在一个实施例中,动态翻页元素集合如表1所示。
匹配模块40还用于根据翻页元素的权重值从大到小从浏览网页中查找与翻页元素相匹配的带有链接的网页元素,翻页元素与元素相匹配后,得出权重值最大的翻页元素所对应的带有链接的网页元素。得到动态翻页元素集合中与域名相对应的翻页元素的权重值后,按照权重值从大到小从网页中查找带有链接的网页元素进行匹配,权重值大的优先进行匹配。如表1,若网页的域名为pic.abc.com,则先从该网页中查找与翻页元素“下一张”相匹配的带有链接的网页元素。
页面拉取模块40还用于拉取匹配后的网页元素对应的页面数据,进行预读处理。匹配模块30得出匹配后得出的权重值最大的翻页元素所对应的网页元素,页面拉取模块40在根据该网页元素拉取对应的页面数据,进行预读处理。
一个实施例中,如图4所示,上述网络数据预读系统,包括信息获取模块10、查询模块20、匹配模块30和页面拉取模块40,还包括判断模块50、更新模块60和上传模块70。
其中,信息获取模块10还用于获取静态翻页元素集合。信息获取模块10在获取动态翻页元素集合的同时还获取静态翻页元素集合,该静态翻页元素集合中设定了多个固定的翻页元素,如“下页”、“下一页”、“下一章”、“下章”等等,并设定各种翻页元素的优先级。
在匹配模块30根据查询到的翻页元素从浏览网页中查找相匹配的带有链接的网页元素后,判断模块50用于判断查找到的动态翻页元素集合中的翻页元素与带有链接的网页元素匹配是否成功,页面拉取模块40还用于当查找到的动态翻页元素集合中的翻页元素与带有链接的网页元素匹配成功时,拉取该网页元素对应的页面数据,进行预读处理。查询模块20还用于当查找到的动态翻页元素中的翻页元素与带有链接的网页元素匹配不成功时,根据域名从静态翻页元素集合中查询对应的翻页元素;匹配模块30还用于根据查询到的静态翻页元素集合中翻页元素从浏览网页中查找与翻页元素相匹配的带有链接的网页元素;页面拉取模块40根据网页元素对应的页面数据,进行预读处理。
在静态翻页元素集合中查询对应的翻页元素后,匹配模块30根据翻页元素的优先级从高到低,从浏览网页中查找相匹配的带有链接的网页元素,优先级越高,越优先匹配,匹配到网页元素后,根据网页元素的链接的指向地址,拉取对应的页面数据,进行预读处理。
信息获取模块10还用于获取用户点击的带有链接的网页元素,更新模块60将用户点击的带有链接的网页元素更新到所述动态翻页元素集合。
该实施例中,更新模块60还用于根据所述用户点击的带有链接的网页元素所在的网页域名,查找动态翻页元素集合中与域名对应的翻页元素列表,判断用户点击的带有链接的网页元素是否在翻页元素列表内,若是,则将该翻页元素的权重值加1,若否,则将带有链接的网页元素加入到该翻页元素列表内。用户点击的网页元素在翻页元素列表内,则将对应的翻页元素的权重值加1,如“下一张”,在表1中查找到,则将翻页元素“下一张”的权重值加1变为9。若用户点击的网页元素未在翻页元素列表内,则将该网页元素加入到翻页元素列表内,并将权重值设为1,如表1中加入翻页元素next,权重值为1。如此对动态翻页元素集合进行更新。
上传模块70将用户的标识号及更新后的动态翻页元素集合上传到服务器。上传模块70将更新后的动态翻页元素集合上传到服务器,方便用户更好不同的移动通信终端时,可仍按照个人使用,及时的浏览自身需要的网络数据,节省了网络资源。
上述网络数据预读方法及系统,采用获取动态翻页元素集合,获取网页域名后,从动态翻页元素集合中查找到相应的翻页元素,再根据翻页元素从网页中查找相匹配的带有链接的网页元素,根据网页元素拉取对应的页面数据进行预读处理,因动态翻页元素集合有用户需求的翻页元素,按照该翻页元素进行预读操作,提高了预读内容的准确性,减少了将用户不必要的网络数据发送给用户的几率,提高了网络资源的利用率。
另外,采用根据翻页元素的权重值从大到小进行匹配网页元素,提高了匹配效率,以及满足最大可能的满足用户的需求,进一步降低将无效网络数据发送给用户的几率,提高网络资源的利用率;采用动态翻页元素集合和静态翻页元素集合相结合,可更好的满足用户的需求,提供网络资源的利用率;采用获取用户的点击带有链接的网页元素,更新动态翻页元素集合,进一步提供匹配用户需求的准确性;将更新后的动态翻页元素集合上传到服务器,方便用户使用不同的移动通信终端时,用户的需求依然得到满足,即使更换了移动通信终端,也能合理利用网络资源。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种网络数据预读方法,包括以下步骤:
动态采集用户在浏览网页时操作的带有链接的网页元素,并累计,形成用户的个性化的动态翻页元素集合,所述动态翻页元素集合中包含域名和与域名对应的翻页元素;
将用户标识号及更新后的动态翻页元素集合上传到服务器;
获取用户标识号,根据所述用户标识号从服务器下载对应的动态翻页元素集合;
获取浏览网页的域名,根据所述域名从所述动态翻页元素集合中查询与所述浏览网页的域名所对应的翻页元素;
根据所述翻页元素从所述浏览网页中查找与所述翻页元素相匹配的带有链接的网页元素;
拉取所述网页元素对应的页面数据,进行预读处理。
2.根据权利要求1所述的网络数据预读方法,其特征在于,所述方法还包括获取静态翻页元素集合的步骤;
根据查询到的所述翻页元素从所述浏览网页中查找相匹配的带有链接的网页元素的步骤之后还包括:
判断匹配是否成功,若是,则拉取匹配后的带有链接的网页元素对应的翻页页面,进行预读处理;若否,则根据所述域名从所述静态翻页元素集合中查询对应的翻页元素,并根据查询到的所述静态翻页元素集合中的翻页元素从所述浏览网页中查找与所述翻页元素相匹配的带有链接的网页元素,再拉取匹配后的带有链接的网页元素对应的页面数据,进行预读处理。
3.根据权利要求1所述的网络数据预读方法,其特征在于,还包括步骤:
获取动态翻页元素集合中与域名相对应的翻页元素的权重值;
根据所述翻页元素的权重值从大到小从所述浏览网页中查找与所述翻页元素相匹配的带有链接的网页元素,得出翻页元素与网页元素相匹配中权重值最大的翻页元素所对应的带有链接的网页元素。
4.根据权利要求3所述的网络数据预读方法,其特征在于,还包括步骤:获取用户点击的带有链接的网页元素,将所述用户点击的带有链接的网页元素更新到所述动态翻页元素集合。
5.根据权利要求4所述的网络数据预读方法,其特征在于,将所述用户点击的带有链接的网页元素更新到所述动态翻页元素集合的具体包括步骤:
根据所述用户点击的带有链接的网页元素所在的网页域名从所述动态翻页元素集合中查找与所述域名对应的翻页元素列表;
判断所述用户点击的带有链接的网页元素是否在所述翻页元素列表内,若是,则将该翻页元素的权重值加1,若否,则将所述带有链接的网页元素加入到所述翻页元素列表内。
6.一种网络数据预读系统,其特征在于,包括:
信息获取模块,用于动态采集用户在浏览网页是操作的带有链接的网页元素,并累计,形成用户的个性化的动态翻页元素集合,所述动态翻页元素集合中包含域名和与域名对应的翻页元素;
上传模块,用于将所述用户标识号及更新后的动态翻页元素集合上传到服务器;
所述信息获取模块还用于获取用户标识号,根据所述用户标识号从服务器下载对应的动态翻页元素集合;
查询模块,用于获取浏览网页的域名,根据所述域名从所述动态翻页元素集合中查询与所述浏览网页的域名所对应的翻页元素;
匹配模块,用于根据所述翻页元素从所述浏览网页中查找与所述翻页元素相匹配的带有链接的网页元素;
页面拉取模块,用于拉取所述网页元素对应的页面数据,进行预读处理。
7.根据权利要求6所述的网络数据预读系统,其特征在于,所述信息获取模块还用于获取静态翻页元素集合;
所述网络数据预读系统还包括:
判断模块,用于判断查找到的所述动态翻页元素集合中的翻页元素与带有链接的网页元素匹配是否成功;
所述页面拉取模块还用于当查找到的所述动态翻页元素集合中的翻页元素与带有链接的网页元素匹配成功时,拉取所述网页元素对应的页面数据,进行预读处理;
所述查询模块还用于当查找到的所述动态翻页元素集合中的翻页元素与带有链接的网页元素匹配不成功时,根据所述域名从所述静态翻页元素集合中查询对应的翻页元素;
所述匹配模块用于根据查询到的所述静态翻页元素集合中的翻页元素从浏览网页中查找与所述翻页元素相匹配的带有链接的网页元素。
8.根据权利要求6所述的网络数据预读系统,其特征在于,所述信息获取模块还用于获取动态翻页元素集合中与域名相对应的翻页元素的权重值;
所述匹配模块还用于根据所述翻页元素的权重值从大到小从所述浏览网页中查找相匹配的带有链接的网页元素,得出翻页元素与元素相匹配中权重值最大的翻页元素所对应的带有链接的网页元素。
9.根据权利要求8所述的网络数据预读系统,其特征在于,所述信息获取模块还用于获取用户点击的带有链接的网页元素;
所述系统还包括:
更新模块,用于将所述用户点击的带有链接的网页元素更新到所述动态翻页元素集合。
10.根据权利要求9所述的网络数据预读系统,其特征在于,所述更新模块还用于根据所述用户点击的带有链接的网页元素所在的网页域名查找所述动态翻页元素集合中与所述域名对应的翻页元素列表,判读所述用户点击的带有链接的网页元素是否在所述翻页元素列表内,若是,则将该翻页元素的权重值加1,若否,则将所述带有链接的网页元素加入到所述翻页元素列表内。
CN201110020228.3A 2011-01-18 2011-01-18 网络数据预读方法及系统 Active CN102591887B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201110020228.3A CN102591887B (zh) 2011-01-18 2011-01-18 网络数据预读方法及系统
PCT/CN2012/070290 WO2012097701A1 (zh) 2011-01-18 2012-01-12 网络数据预读方法及系统、计算机存储介质
US13/937,114 US20130305131A1 (en) 2011-01-18 2013-07-08 Method, system and computer storage medium for pre-reading network data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110020228.3A CN102591887B (zh) 2011-01-18 2011-01-18 网络数据预读方法及系统

Publications (2)

Publication Number Publication Date
CN102591887A CN102591887A (zh) 2012-07-18
CN102591887B true CN102591887B (zh) 2016-07-06

Family

ID=46480556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110020228.3A Active CN102591887B (zh) 2011-01-18 2011-01-18 网络数据预读方法及系统

Country Status (3)

Country Link
US (1) US20130305131A1 (zh)
CN (1) CN102591887B (zh)
WO (1) WO2012097701A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577439B (zh) * 2012-07-27 2017-02-08 北京搜狗信息服务有限公司 网页预读取方法及系统
CN103577461A (zh) * 2012-08-02 2014-02-12 中国移动通信集团公司 一种图片作为翻页链接的识别方法及装置
CN102833633B (zh) * 2012-09-04 2016-01-20 深圳创维-Rgb电子有限公司 一种电视机语音控制系统及方法
CN103810176B (zh) * 2012-11-07 2018-01-05 腾讯科技(深圳)有限公司 一种网页信息的预取访问方法和装置
CN103177080B (zh) * 2013-02-07 2016-03-30 华为技术有限公司 文件预读的方法和装置
CN104794118B (zh) * 2014-01-17 2019-03-26 腾讯科技(深圳)有限公司 一种网页信息处理方法、装置和系统
CN107451160B (zh) * 2016-06-01 2020-10-16 阿里巴巴(中国)有限公司 一种页面预读方法及装置
CN112579850A (zh) * 2019-09-29 2021-03-30 北京国双科技有限公司 断点恢复方法及装置
CN113392351A (zh) * 2021-06-17 2021-09-14 北京沃东天骏信息技术有限公司 一种信息处理方法及装置、存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101116075A (zh) * 2005-06-30 2008-01-30 卡西欧计算机株式会社 具有Web页面浏览功能的电子设备
CN101460945A (zh) * 2004-09-27 2009-06-17 Bt网络解决方案有限责任公司 用于增进式浏览的方法和装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5878223A (en) * 1997-05-07 1999-03-02 International Business Machines Corporation System and method for predictive caching of information pages
US6819339B1 (en) * 2000-02-24 2004-11-16 Eric Morgan Dowling Web browser with multilevel functions
US20050055426A1 (en) * 2000-06-12 2005-03-10 Kim Smith System, method and computer program product that pre-caches content to provide timely information to a user
US7483941B2 (en) * 2004-01-13 2009-01-27 International Business Machines Corporation System and method for dynamically inserting prefetch tags by the web server
US20060230030A1 (en) * 2005-04-12 2006-10-12 Volpa Peter J Method and system for accessing and viewing files on mobile devices
KR100881668B1 (ko) * 2006-11-09 2009-02-06 삼성전자주식회사 웹 페이지 프리페치 장치 및 방법
CN101325602A (zh) * 2008-07-30 2008-12-17 广州市动景计算机科技有限公司 一种微浏览器智能预读网页的方法及系统
CN101369280A (zh) * 2008-10-10 2009-02-18 深圳市茁壮网络技术有限公司 一种数字电视终端网页浏览的方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101460945A (zh) * 2004-09-27 2009-06-17 Bt网络解决方案有限责任公司 用于增进式浏览的方法和装置
CN101116075A (zh) * 2005-06-30 2008-01-30 卡西欧计算机株式会社 具有Web页面浏览功能的电子设备

Also Published As

Publication number Publication date
US20130305131A1 (en) 2013-11-14
WO2012097701A1 (zh) 2012-07-26
CN102591887A (zh) 2012-07-18

Similar Documents

Publication Publication Date Title
CN102591887B (zh) 网络数据预读方法及系统
CN100424694C (zh) 一种网络收藏夹的实现方法
CN108881339B (zh) 推送方法、用户标签的生成方法、装置及设备
CN100501746C (zh) 网页抓取方法和网页抓取服务器
RU2522103C2 (ru) Способ и браузер для уведомления об обновлении
CN102123168B (zh) 基于中转服务器的网页页面预读及整合方法和系统
CN102880654B (zh) 一种信息终端浏览器的收藏夹动态更新方法
CN104239298B (zh) 文本信息推荐方法、服务器、浏览器及系统
US7900147B2 (en) System and method for enabling disconnected web access
JP2012190472A (ja) 検索クエリ完成前の代替クエリの連想
CN101025740A (zh) 图片搜索结果自动播放方法
CN110659414B (zh) 一种基于用户画像的个性化信息推送方法及用户端
US20080201219A1 (en) Query classification and selection of associated advertising information
CN102541853A (zh) 一种利用浏览器地址栏获取应用信息的方法和装置
WO2012113176A1 (zh) 终端网页显示方法及系统
CN107273393B (zh) 用于移动设备的图像搜索方法、装置及数据处理系统
CN111966887B (zh) 动态缓存方法及装置、电子设备、存储介质
WO2013060153A1 (zh) 一种添加快速链接的方法及终端
KR101324460B1 (ko) 정보 제공 장치, 정보 제공 방법 및 정보 기록 매체
WO2012006828A1 (zh) 网页呈现方法和装置
CN103617278A (zh) 一种地址栏搜索的控制方法及装置
JP5537428B2 (ja) ワイヤレス通信ネットワークを通じた検索インデックス断片の標的設定した配信
CN103294717A (zh) 一种基于双内核浏览器的网页打开方法和装置
CN102163196A (zh) 一种移动终端智能浏览器的实现方法及其系统
CN105279156B (zh) 网络信息通信方法及网络信息浏览装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20190809

Address after: 518000 Nanshan District science and technology zone, Guangdong, Zhejiang Province, science and technology in the Tencent Building on the 1st floor of the 35 layer

Co-patentee after: Tencent cloud computing (Beijing) limited liability company

Patentee after: Tencent Technology (Shenzhen) Co., Ltd.

Address before: Shenzhen Futian District City, Guangdong province 518044 Zhenxing Road, SEG Science Park 2 East Room 403

Patentee before: Tencent Technology (Shenzhen) Co., Ltd.

TR01 Transfer of patent right