【发明内容】
基于此,有必要提供一种能提高网络资源利用率的网络数据预读方法。
一种网络数据预读方法,包括以下步骤:
获取动态翻页元素集合;
获取浏览网页的域名,根据所述域名从所述动态翻页元素集合中查询对应的翻页元素;
根据所述翻页元素从所述浏览网页中查找与所述翻页元素相匹配的带有链接的网页元素;
拉取所述网页元素对应的页面数据,进行预读处理。
优选地,所述方法还包括获取静态翻页元素集合的步骤;
根据查询到的所述翻页元素从所述浏览网页中查找相匹配的带有链接的网页元素的步骤之后还包括:
判断匹配是否成功,若是,则拉取匹配后的带有链接的网页元素对应的翻页页面,进行预读处理;若否,则根据所述域名从所述静态翻页元素集合中查询对应的翻页元素,并根据查询到的所述静态翻页元素集合中的翻页元素从所述浏览网页中查找与所述翻页元素相匹配的带有链接的网页元素,再拉取匹配后的带有链接的网页元素对应的页面数据,进行预读处理。
优选地,还包括步骤:
获取动态翻页元素集合中与域名相对应的翻页元素的权重值;
根据所述翻页元素的权重值从大到小从所述浏览网页中查找与所述翻页元素相匹配的带有链接的网页元素,得出翻页元素与网页元素相匹配中权重值最大的翻页元素所对应的带有链接的网页元素。
优选地,还包括步骤:获取用户点击的带有链接的网页元素,将所述用户点击的带有链接的网页元素更新到所述动态翻页元素集合。
优选地,将所述用户点击的带有链接的网页元素更新到所述动态翻页元素集合的具体包括步骤:
根据所述用户点击的带有链接的网页元素所在的网页域名从所述动态翻页元素集合中查找与所述域名对应的翻页元素列表;
判断所述用户点击的带有链接的网页元素是否在所述翻页元素列表内,若是,则将该翻页元素的权重值加1,若否,则将所述带有链接的网页元素加入到所述翻页元素列表内。
优选地,所述方法还包括将用户的标识号及更新后的所述动态翻页元素集合上传到服务器;获取用户标识号,根据用户标识号从服务器下载所述动态翻页元素集合。
优选地,所述获取动态翻页元素集合的具体步骤为:动态采集用户在浏览网页是操作的带有链接的网页元素,并累计,形成用户的动态翻页元素集合。
此外,还有必要提供一种能提高网络资源利用率的网络数据预读系统。
一种网络数据预读系统,包括:
信息获取模块,用于获取动态翻页元素集合;
查询模块,用于获取浏览网页的域名,根据所述域名从所述动态翻页元素集合中查询对应的翻页元素;
匹配模块,用于根据所述翻页元素从所述浏览网页中查找与所述翻页元素相匹配的带有链接的网页元素;
页面拉取模块,用于拉取所述网页元素对应的页面数据,进行预读处理。
优选地,所述信息获取模块还用于获取静态翻页元素集合;
所述网络数据预读系统还包括:
判断模块,用于判断查找到的所述动态翻页元素集合中的翻页元素与带有链接的网页元素匹配是否成功;
所述页面拉取模块还用于当查找到的所述动态翻页元素集合中的翻页元素与带有链接的网页元素匹配成功时,拉取所述网页元素对应的页面数据,进行预读处理;
所述查询模块还用于当查找到的所述动态翻页元素集合中的翻页元素与带有链接的网页元素匹配不成功时,根据所述域名从所述静态翻页元素集合中查询对应的翻页元素;
所述匹配模块用于根据查询到的所述静态翻页元素集合中的翻页元素从浏览网页中查找与所述翻页元素相匹配的带有链接的网页元素。
优选地,所述信息获取模块还用于获取动态翻页元素集合中与域名相对应的翻页元素的权重值;
所述匹配模块还用于根据所述翻页元素的权重值从大到小从所述浏览网页中查找相匹配的带有链接的网页元素,得出翻页元素与元素相匹配中权重值最大的翻页元素所对应的带有链接的网页元素。
优选地,所述信息获取模块还用于获取用户点击的带有链接的网页元素;
所述系统还包括:
更新模块,用于将所述用户点击的带有链接的网页元素更新到所述动态翻页元素集合。
优选地,所述更新模块还用于根据所述用户点击的带有链接的网页元素所在的网页域名查找所述动态翻页元素集合中与所述域名对应的翻页元素列表,判读所述用户点击的带有链接的网页元素是否在所述翻页元素列表内,若是,则将该翻页元素的权重值加1,若否,则将所述带有链接的网页元素加入到所述翻页元素列表内。
优选地,还包括上传模块,所述上传模块将所述用户的标识号及更新后的所述动态翻页元素集合上传到服务器;所述信息获取模块还用于获取用户标识号,根据用户标识号从服务器下载所述动态翻页元素集合。
优选地,所述信息获取模块还用于动态采集用户在浏览网页是操作的带有链接的网页元素,并累计,形成用户的动态翻页元素集合。
上述网络数据预读方法及系统,采用获取动态翻页元素集合,获取网页域名后,从动态翻页元素集合中查找到相应的翻页元素,再根据翻页元素从网页中查找相匹配的带有链接的网页元素,根据网页元素拉取对应的页面数据进行预读处理,因动态翻页元素集合有用户需求的翻页元素,按照该翻页元素进行预读操作,提高了预读内容的准确性,减少了将用户不必要的网络数据发送给用户的几率,提高了网络资源的利用率。
【具体实施方式】
下面结合具体的实施例及附图对技术方案进行详细的描述。
如图1所示,在一个实施例中,一种网络数据预读方法,包括以下步骤:
步骤S100,获取动态翻页元素集合。
动态翻页元素集合包括域名、与域名相对应的翻页元素等。动态翻页元素集合初始化时数据可为空,随着用户不断的浏览不同的网页,客户端收集用户点击翻页所对应的元素特征,对动态翻页元素集合中的数据进行动态更新,并可将该数据上传到服务器,使得客户端与服务器上的动态翻页元素集合保持一致。
在一个实施例中,获取动态翻页元素集合的具体步骤是:动态采集用户在浏览网页时操作的带有链接的网页元素,并累计,形成用户的动态翻页元素集合。采集用户操作的带有链接的网页元素,即采集用户浏览网页时的操作行为特征数据,并对采集的操作行为特征数据分析得出翻页元素,形成的用户的动态翻页元素集合,该用户的动态翻页元素集合体现了用户操作习惯,能更加准确的满足用户的需求。此外,该动态翻页元素集合还实时进行更新内部数据。行为特征数据是指用户浏览网页时点击的网页数据。带有链接的网页元素是指带有指向网页地址的网页中的节点,包括文本节点、图片节点等,其中,文本节点可以显示为“下一页”、“下一章”等,图片节点显示为表示翻页的手型图标等。点击带有链接的网页元素后,则拉取该链接指向的网页地址的页面数据。
网页按照域名进行分类,如abc.com、def.net等。不同的用户浏览的网页不同且操作也可不同,动态采集的带有链接的网页元素也不同,如A用户关注图片,采集的网页元素可为图片,分析得出图片翻页元素,形成A用户的动态翻页元素集合,如B用户关注英文网页,采集的网页元素可为next等,形成B用户的动态翻页元素集合。
在一个实施例中,步骤S100获取动态翻页元素集合的步骤为:获取用户标识号,根据用户标识号从服务器下载相对应的动态翻页元素集合。服务器上可以用户标识号为索引存储对应的动态翻页元素集合,不同的用户所存的动态翻页元素集合会不同,这样,可以满足不同的用户需求。
步骤S110,获取浏览网页的域名,根据该域名从该动态翻页元素集合中查询对应的翻页元素。
在步骤S110中,获取用户浏览的网页的域名,因动态翻页元素集合中有域名以及与域名对应的翻页元素,根据网页的域名可查询到该域名所对应的翻页元素。
在一个实施例中,除了获取浏览网页的域名外,还可获取动态翻页元素集合中与域名相对应的翻页元素的权重值。动态翻页元素集合中除了包括域名、与域名对应的翻页元素外,还可包括翻页元素的权重值、时间戳。翻页元素可为“下一页”、“下一章”、“next”,也可为图片等等。翻页元素的权重值是收集的用户点击翻页元素的次数。时间戳是指翻页元素最后更新的时间。在一个实施例中,动态翻页元素集合如表1所示。
表1
步骤S120,根据动态翻页元素集合中的翻页元素,从该浏览网页中查找与所述翻页元素相匹配的带有链接的网页元素。
在一个实施例中,还获取到动态翻页元素集合中与域名相对应的翻页元素的权重值,则步骤S120的具体过程为:根据翻页元素的权重值从大到小从浏览网页中查找与翻页元素相匹配的带有链接的网页元素,得出翻页元素与网页元素相匹配中权重值最大的翻页元素所对应的带有链接的网页元素。得到动态翻页元素集合中与域名相对应的翻页元素的权重值后,按照权重值从大到小从网页中查找带有链接的网页元素进行匹配,权重值大的优先进行匹配。如表1,若网页的域名为pic.abc.com,则先从该网页中查找与翻页元素“下一张”相匹配的带有链接的网页元素。
步骤S130,拉取网页元素对应的页面数据,进行预读处理。
网页元素对应URL(UniversalResourceLocator,网页地址)连接地址,在当前页面拉取并解析渲染排版等处理完毕后,启动客户端后台处理程序拉取该网页元素对应的URL页面数据。
这样,使得用户浏览当前页面和拉取翻页元素匹配的网页元素指向的页面网络数据是并行的,当用户点击浏览下一页时,省去了最耗时的网络交互环节,且是根据动态翻页元素进行匹配,减少了将不必要的网络数据进行预读的几率,提高了网络资源的利用率。
在一个实施例中,得到权重值最大的翻页元素所对应的带有链接的网页元素,则步骤S130具体为:拉取匹配后的权重值最大的翻页元素所对应的网页元素对应的页面数据,进行预读处理。得出匹配后的权重值最大的翻页元素所对应的网页元素,再根据该网页元素拉取对应的页面数据,进行预读处理。
优选的实施例中,上述网络数据预读方法还包括:获取用户点击的带有链接的网页元素,将用户点击的带有链接的网页元素更新到动态翻页元素集合。具体包括以下步骤:
根据用户点击的带有链接的网页元素所在的网页域名从该动态翻页元素集合中查找与域名对应的翻页元素列表。根据用户点击的带有链接的网页元素所在的网页域名,从动态翻页元素集合中查找与域名对应的翻页元素列表。该翻页元素列表包括域名、翻页元素、翻页元素权重值等。
判断用户点击的带有链接的网页元素是否在翻页元素列表内,若是,则将翻页元素的权重值加1,若否,则将带有链接的网页元素加入到翻页元素列表内。用户点击的网页元素在翻页元素列表内,则将对应的翻页元素的权重值加1,如“下一张”,在表1中查找到,则将翻页元素“下一张”的权重值加1变为9。若用户点击的网页元素未在翻页元素列表内,则将该网页元素加入到翻页元素列表内,并将权重值设为1,如表1中加入翻页元素next,权重值为1。如此对动态翻页元素集合进行更新。
优选的实施例中,上述网络数据预读方法还包括将用户的标识号及更新后的动态翻页元素集合上传到服务器的步骤。将更新后的动态翻页元素集合上传到服务器,方便用户更好不同的移动通信终端时,可仍按照个人使用,及时的浏览自身需要的网络数据,节省了网络资源。
如图2所示,在一个实施例中,网络数据预读方法,包括以下步骤:
步骤S200,获取动态翻页元素集合及静态翻页元素集合。
静态翻页元素集合中设定了多个固定的翻页元素,如“下页”、“下一页”、“下一章”、“下章”等等,并设定各种翻页元素的优先级。
形成动态翻页元素集合的具体步骤是:动态采集用户在浏览网页时的操作的带有链接的网页元素,并累计,形成用户的个性化的动态翻页元素集合。采集用户操作的带有链接的网页元素,即采集用户浏览网页时的操作行为特征数据,并对采集的操作行为特征数据分析得出翻页元素,形成的用户的个性化的动态翻页元素集合,该个性化的动态翻页元素集合体现了用户操作习惯,能更加准确的满足用户的需求。此外,该动态翻页元素集合还实时进行更新内部数据。行为特征数据是指用户浏览网页时点击的网页数据。带有链接的网页元素是指带有指向网页地址的网页中的节点,包括文本节点、图片节点等,其中,文本节点可以显示为“下一页”、“下一章”等,图片节点显示为表示翻页的手型图标等。点击带有链接的网页元素后,则拉取该链接指向的网页地址的页面数据。
步骤S210,获取浏览网页的域名,根据该域名从该动态翻页元素集合中查询对应的翻页元素。
步骤S220,根据翻页元素从该浏览网页中查找与翻页元素相匹配的带有链接的网页元素。
步骤S230,判断匹配是否成功,若是,则执行步骤S260,若否,则执行步骤S240。
步骤S240,根据该域名从该静态翻页元素集合中查询对应的翻页元素。
步骤S250,根据查询到的该静态翻页元素集合中的翻页元素从浏览网页中查找与翻页元素相匹配的带有链接的网页元素。
步骤S260,拉取网页元素对应的页面数据,进行预读处理。
在静态翻页元素集合中查询对应的翻页元素后,根据翻页元素的优先级从高到低,从浏览网页中查找相匹配的带有链接的网页元素,优先级越高,越优先匹配,匹配到网页元素后,根据网页元素的链接的指向地址,拉取对应的页面数据,进行预读处理。
在一个实施例中,如图3所示,一种网络数据预读系统,包括信息获取模块10、查询模块20、匹配模块30和页面拉取模块40。
其中,信息获取模块10用于获取动态翻页元素集合。动态翻页元素集合内包括域名、与域名相对应的翻页元素等等。动态翻页元素集合初始化时数据可为空,随着用户不断的浏览不同的网页,客户端收集用户点击翻页所对应的元素特征,对动态翻页元素集合中的数据进行动态更新,并可将该数据上传到服务器,使得客户端与服务器上的动态翻页元素集合保持一致。
信息获取模块10获取动态翻页元素集合的具体过程是:动态采集用户在浏览网页时的操作的带有链接的网页元素,并累计,形成用户的个性化的动态翻页元素集合。采集用户操作的带有链接的网页元素,即采集用户浏览网页时的操作行为特征数据,并对采集的操作行为特征数据分析得出翻页元素,形成的用户的个性化的动态翻页元素集合,该个性化的动态翻页元素集合体现了用户操作习惯,能更加准确的满足用户的需求。此外,该动态翻页元素集合还实时进行更新内部数据。行为特征数据是指用户浏览网页时点击的网页数据。带有链接的网页元素是指带有指向网页地址的网页中的节点,包括文本节点、图片节点等,其中,文本节点可以显示为“下一页”、“下一章”等,图片节点显示为表示翻页的手型图标等。点击带有链接的网页元素后,则拉取该链接指向的网页地址的页面数据。
该实施例中,信息获取模块10获取用户标识号,根据用户标识号从服务器下载相对应的动态翻页元素集合。服务器上可以用户标识号为索引存储对应的动态翻页元素集合,不同的用户所存的动态翻页元素集合会不同,这样,可以满足不同的用户需求。
查询模块20用于获取浏览网页的域名,根据域名从动态翻页元素集合中查询对应的翻页元素。因动态翻页元素集合中有域名以及与域名对应的翻页元素,则根据网页的域名查询到该域名的翻页元素。翻页元素可为“下一页”、“下一章”、“next”,也可为图片等等。
匹配模块30用于根据翻页元素从浏览网页中查找与翻页元素相匹配的带有链接的网页元素。
页面拉取模块40用于拉取匹配后的网页元素对应的页面数据,进行预读处理。网页元素对应URL(UniversalResourceLocator,网页地址)连接地址,在当前页面拉取并解析渲染排版等处理完毕后,启动客户端后台处理程序拉取该网页元素对应的URL页面数据。如此用户浏览当前页面和拉取翻页元素匹配的网页元素指向的页面网络数据是并行的,当用户点击浏览下一页时,省去了最耗时的网络交互环节,且是根据动态翻页元素进行匹配,减少了将不必要的网络数据进行预读的几率,提高了网络资源的利用率。
优选的实施例中,信息获取模块10还用于获取动态翻页元素集合中与域名相对应的翻页元素的权重值。在一个实施例中,除了获取浏览网页的域名外,还可获取动态翻页元素集合中与域名相对应的翻页元素的权重值。动态翻页元素集合中除了包括域名、与域名对应的翻页元素外,还可包括翻页元素的权重值、时间戳。翻页元素可为“下一页”、“下一章”、“next”,也可为图片等等。翻页元素的权重值是收集的用户点击翻页元素的次数。时间戳是指翻页元素最后更新的时间。在一个实施例中,动态翻页元素集合如表1所示。
匹配模块40还用于根据翻页元素的权重值从大到小从浏览网页中查找与翻页元素相匹配的带有链接的网页元素,翻页元素与元素相匹配后,得出权重值最大的翻页元素所对应的带有链接的网页元素。得到动态翻页元素集合中与域名相对应的翻页元素的权重值后,按照权重值从大到小从网页中查找带有链接的网页元素进行匹配,权重值大的优先进行匹配。如表1,若网页的域名为pic.abc.com,则先从该网页中查找与翻页元素“下一张”相匹配的带有链接的网页元素。
页面拉取模块40还用于拉取匹配后的网页元素对应的页面数据,进行预读处理。匹配模块30得出匹配后得出的权重值最大的翻页元素所对应的网页元素,页面拉取模块40在根据该网页元素拉取对应的页面数据,进行预读处理。
一个实施例中,如图4所示,上述网络数据预读系统,包括信息获取模块10、查询模块20、匹配模块30和页面拉取模块40,还包括判断模块50、更新模块60和上传模块70。
其中,信息获取模块10还用于获取静态翻页元素集合。信息获取模块10在获取动态翻页元素集合的同时还获取静态翻页元素集合,该静态翻页元素集合中设定了多个固定的翻页元素,如“下页”、“下一页”、“下一章”、“下章”等等,并设定各种翻页元素的优先级。
在匹配模块30根据查询到的翻页元素从浏览网页中查找相匹配的带有链接的网页元素后,判断模块50用于判断查找到的动态翻页元素集合中的翻页元素与带有链接的网页元素匹配是否成功,页面拉取模块40还用于当查找到的动态翻页元素集合中的翻页元素与带有链接的网页元素匹配成功时,拉取该网页元素对应的页面数据,进行预读处理。查询模块20还用于当查找到的动态翻页元素中的翻页元素与带有链接的网页元素匹配不成功时,根据域名从静态翻页元素集合中查询对应的翻页元素;匹配模块30还用于根据查询到的静态翻页元素集合中翻页元素从浏览网页中查找与翻页元素相匹配的带有链接的网页元素;页面拉取模块40根据网页元素对应的页面数据,进行预读处理。
在静态翻页元素集合中查询对应的翻页元素后,匹配模块30根据翻页元素的优先级从高到低,从浏览网页中查找相匹配的带有链接的网页元素,优先级越高,越优先匹配,匹配到网页元素后,根据网页元素的链接的指向地址,拉取对应的页面数据,进行预读处理。
信息获取模块10还用于获取用户点击的带有链接的网页元素,更新模块60将用户点击的带有链接的网页元素更新到所述动态翻页元素集合。
该实施例中,更新模块60还用于根据所述用户点击的带有链接的网页元素所在的网页域名,查找动态翻页元素集合中与域名对应的翻页元素列表,判断用户点击的带有链接的网页元素是否在翻页元素列表内,若是,则将该翻页元素的权重值加1,若否,则将带有链接的网页元素加入到该翻页元素列表内。用户点击的网页元素在翻页元素列表内,则将对应的翻页元素的权重值加1,如“下一张”,在表1中查找到,则将翻页元素“下一张”的权重值加1变为9。若用户点击的网页元素未在翻页元素列表内,则将该网页元素加入到翻页元素列表内,并将权重值设为1,如表1中加入翻页元素next,权重值为1。如此对动态翻页元素集合进行更新。
上传模块70将用户的标识号及更新后的动态翻页元素集合上传到服务器。上传模块70将更新后的动态翻页元素集合上传到服务器,方便用户更好不同的移动通信终端时,可仍按照个人使用,及时的浏览自身需要的网络数据,节省了网络资源。
上述网络数据预读方法及系统,采用获取动态翻页元素集合,获取网页域名后,从动态翻页元素集合中查找到相应的翻页元素,再根据翻页元素从网页中查找相匹配的带有链接的网页元素,根据网页元素拉取对应的页面数据进行预读处理,因动态翻页元素集合有用户需求的翻页元素,按照该翻页元素进行预读操作,提高了预读内容的准确性,减少了将用户不必要的网络数据发送给用户的几率,提高了网络资源的利用率。
另外,采用根据翻页元素的权重值从大到小进行匹配网页元素,提高了匹配效率,以及满足最大可能的满足用户的需求,进一步降低将无效网络数据发送给用户的几率,提高网络资源的利用率;采用动态翻页元素集合和静态翻页元素集合相结合,可更好的满足用户的需求,提供网络资源的利用率;采用获取用户的点击带有链接的网页元素,更新动态翻页元素集合,进一步提供匹配用户需求的准确性;将更新后的动态翻页元素集合上传到服务器,方便用户使用不同的移动通信终端时,用户的需求依然得到满足,即使更换了移动通信终端,也能合理利用网络资源。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。