CN102306181A - 提供网络资源的方法及系统 - Google Patents

提供网络资源的方法及系统 Download PDF

Info

Publication number
CN102306181A
CN102306181A CN201110251140A CN201110251140A CN102306181A CN 102306181 A CN102306181 A CN 102306181A CN 201110251140 A CN201110251140 A CN 201110251140A CN 201110251140 A CN201110251140 A CN 201110251140A CN 102306181 A CN102306181 A CN 102306181A
Authority
CN
China
Prior art keywords
internet resources
content
added
collections
snapshot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201110251140A
Other languages
English (en)
Other versions
CN102306181B (zh
Inventor
管凌峰
王坚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201110251140.2A priority Critical patent/CN102306181B/zh
Publication of CN102306181A publication Critical patent/CN102306181A/zh
Application granted granted Critical
Publication of CN102306181B publication Critical patent/CN102306181B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了提供网络资源的方法及系统,其中一种方法包括:获得第一网络资源被加入到网络资源收藏集合时的内容;加载网络资源集合中的第一网络资源,获得所述第一网络资源的当前内容;检测所述第一网络资源的当前内容与所述第一网络资源被加入到所述网络资源收藏集合时的内容相比,内容是否发生特定程度的变化;如果所述变化达到特定程度,则获取与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;将所述第二网络资源提供给用户。通过本发明,针对网络资源收藏集合中的网络资源无法访问或内容发生变化的情况,能够提供与被加入到网络资源收藏集合中时内容相同或相似的网络资源,从而提高浏览器的性能。

Description

提供网络资源的方法及系统
技术领域
本发明涉及浏览器技术领域,特别是涉及提供网络资源的方法及系统。
背景技术
浏览器是用户访问网络的最常用入口,由于用户访问网络时,经常会有访问一些曾经访问过的网页的需求,因此,大部分的浏览器都提供了网络资源列表功能,包括收藏夹、浏览历史列表、最常访问列表等等。其中,收藏夹中保存的是用户手动选择的网络资源,浏览历史列表以及最常访问列表通常是由浏览器自动生成的。在具体实现时,网络资源列表中通常都会记录网页的URL(Universal Resource Locators,统一资源定位符),此外还可能记录有网页标题或者用户输入的网页名称,用户下次需要访问某网络资源时,就可以直接点击网络资源列表中对应的条目,相应的,浏览器就可以自动访问该网络资源的URL,并展现网络资源的内容。
但是,互联网内容千变万化,日新月异,因此在实际应用中,经常会出现以下现象:当用户再次访问网络资源列表中的某网络资源时,得到的却不是自己想要的内容。而在现有技术中,针对上述现象无法提供相应的解决方案,因此限制了浏览器性能的提高。
发明内容
本发明的目的在于提供了提供网络资源的方法及系统,针对网络资源收藏集合中的网络资源无法访问或内容发生变化的情况,能够提供与被加入到网络资源收藏集合中时内容相同或相似的网络资源,从而提高浏览器的性能。
本发明提供了如下方案:
一种提供网络资源的方法,包括:
获得第一网络资源被加入到网络资源收藏集合时的内容;
加载网络资源集合中的第一网络资源,获得所述第一网络资源的当前内容;
检测所述第一网络资源的当前内容与所述第一网络资源被加入到所述网络资源收藏集合时的内容相比,内容是否发生特定程度的变化;
如果所述变化达到特定程度,则获取与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
将所述第二网络资源提供给用户。
其中,所述加载网络资源集合中的第一网络资源包括:
在接收到用户访问网络资源收藏集合中的某第一网络资源的请求时,加载所述第一网络资源;
或者,
在接收到用户访问网络资源收藏集合中的第一网络资源的请求之前,后台加载所述网络资源集合中的第一网络资源。
其中,所述获取与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源包括:
获取所述第一网络资源的内容的快照,将所述内容的快照作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
通过搜索引擎获取所述第一网络资源的相似网络资源,将所述相似网络资源作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
在浏览器的服务器缓存中搜索所述第一网络资源的定位信息或所述第一网络资源所在网页的定位信息对应的缓存内容,将所述缓存内容作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
在点对点P2P网络中查找其他用户之前保存的与所述第一网络资源的定位信息或所述第一网络资源所在网页的定位信息对应的网络资源,将所述查找到的网络资源作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
其中,所述获取所述第一网络资源的内容的快照,将所述内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源包括:
获取并保存所述第一网络资源被加入到所述网络资源收藏集合时的内容的快照,将保存的第一网络资源的内容的快照作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
或者,
在所述第一网络资源被加入到所述网络资源收藏集合之后,后台访问所述第一网络资源,获取并保存所述第一网络资源的内容的快照,将保存的第一网络资源的内容的快照作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
或者,
通过搜索引擎搜索所述第一网络资源的内容的快照,将所搜索到的内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
其中,所述通过搜索引擎获取所述第一网络资源的相似网络资源包括:
以所述第一网络资源的统一资源定位符URL为关键词,利用搜索引擎的相似网页搜索功能获得与所述第一网络资源的相似网络资源;
或者,
获取所述第一网络资源被加入到所述网络资源收藏集合中时的内容中关键位置处的信息,以所述关键位置处的信息为关键词,从搜索引擎给出的搜索结果中获取所述第一网络资源的相似网络资源。
优选的,还包括:
将与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源添加到所述网络资源收藏集合中。
其中,所述检测所述第一网络资源的当前内容与所述第一网络资源被加入到所述网络资源收藏集合时的内容相比,内容是否发生特定程度的变化包括:
检测所述第一网络资源的当前内容与所述第一网络资源被加入到所述网络资源收藏集合时的内容相比,内容的主题内容或主体内容发生变化,或者内容的变化量达到预置条件。
一种提供网络资源的方法,包括:
在接收到用户访问网络资源收藏集合中的第一网络资源的请求之前,检测所述网络资源收藏集合中的第一网络资源是否无法访问;
如果无法访问,则获取与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
将所述第二网络资源提供给用户。
其中,所述获取与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源包括:
获取所述第一网络资源的内容的快照,将所述内容的快照作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
通过搜索引擎获取所述第一网络资源的相似网络资源,将所述相似网络资源作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
在浏览器的服务器缓存中搜索所述第一网络资源的定位信息或所述第一网络资源所在网页的定位信息对应的缓存内容,将所述缓存内容作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
在点对点P2P网络中查找其他用户之前保存的与所述第一网络资源的定位信息或所述第一网络资源所在网页的定位信息对应的网络资源,将所述查找到的网络资源作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
其中,所述获取所述第一网络资源的内容的快照,将所述内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源包括:
获取并保存所述第一网络资源被加入到所述网络资源收藏集合时的内容的快照,将保存的第一网络资源的内容的快照作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
或者,
在所述第一网络资源被加入到所述网络资源收藏集合之后,后台访问所述第一网络资源,获取并保存所述第一网络资源的内容的快照,将保存的第一网络资源的内容的快照作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
或者,
通过搜索引擎搜索所述第一网络资源的内容的快照,将所搜索到的内容的快照作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
其中,所述通过搜索引擎获取所述第一网络资源的相似网络资源包括:
以所述第一网络资源的统一资源定位符URL为关键词,利用搜索引擎的相似网页搜索功能获得与所述第一网络资源的相似网络资源;
或者,
获取所述第一网络资源被加入到所述网络资源收藏集合中时的内容中关键位置处的信息,以所述关键位置处的信息为关键词,从搜索引擎给出的搜索结果中获取所述第一网络资源的相似网络资源。
优选的,还包括:
将所述与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源添加到所述网络资源收藏集合中。
一种提供网络资源的系统,包括:
原内容获取单元,用于获得第一网络资源被加入到网络资源收藏集合时的内容;
当前内容获取单元,用于加载网络资源集合中的第一网络资源,获得所述第一网络资源的当前内容;
检测单元,用于检测所述第一网络资源的当前内容与所述第一网络资源被加入到所述网络资源收藏集合时的内容相比,内容是否发生特定程度的变化;
网络资源获取单元,用于如果所述变化达到特定程度,则获取与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
网络资源提供单元,用于将所述第二网络资源提供给用户。
其中,所述当前内容获取单元包括:
第一当前内容获取子单元,用于在接收到用户访问网络资源收藏集合中的某第一网络资源的请求时,加载该第一网络资源;
或者,
第二当前内容获取子单元,用于在接收到用户访问网络资源收藏集合中的第一网络资源的请求之前,后台加载所述网络资源集合中的第一网络资源。
其中,所述网络资源获取单元包括:
快照获取子单元,用于获取所述第一网络资源的内容的快照,将所述内容的快照作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
相似搜索子单元,用于通过搜索引擎获取所述第一网络资源的相似网络资源,将所述相似网络资源作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
缓存搜索子单元,用于在浏览器的服务器缓存中搜索所述第一网络资源的定位信息或所述第一网络资源所在网页的定位信息对应的缓存内容,将所述缓存内容作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
点对点查找子单元,用于在点对点P2P网络中查找其他用户之前保存的与所述第一网络资源的定位信息或所述第一网络资源所在网页的定位信息对应的网络资源,将所述查找到的网络资源作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
其中,所述快照获取子单元包括:
第一快照获取子单元,用于获取并保存所述第一网络资源被加入到所述网络资源收藏集合时的内容的快照,将保存的第一网络资源的内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
或者,
第二快照获取子单元,用于在所述第一网络资源被加入到所述网络资源收藏集合之后,后台访问所述第一网络资源,获取并保存所述第一网络资源的内容的快照,将保存的第一网络资源的内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
或者,
第三快照获取子单元,用于通过搜索引擎搜索所述第一网络资源的内容的快照,将所搜索到的内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
其中,所述相似搜索子单元包括:
第一相似搜索子单元,用于以所述第一网络资源的统一资源定位符URL为关键词,利用搜索引擎的相似网页搜索功能获得与所述第一网络资源的相似网络资源;
或者,
第二相似搜索子单元,用于获取所述第一网络资源被加入到所述网络资源收藏集合中时的内容中关键位置处的信息,以所述关键位置处的信息为关键词,从搜索引擎给出的搜索结果中获取所述第一网络资源的相似网络资源。
优选的,还包括:
添加单元,用于将所述与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源添加到所述网络资源收藏集合中。
其中,所述检测单元具体用于:检测所述第一网络资源的当前内容与所述第一网络资源被加入到所述网络资源收藏集合时的内容相比,内容的主题内容或主体内容发生变化,或者内容的变化量达到预置条件。
一种提供网络资源的系统,包括:
检测单元,用于在接收到用户访问网络资源收藏集合中的第一网络资源的请求之前,检测所述网络资源收藏集合中的第一网络资源是否无法访问;
网络资源获取单元,用于如果无法访问,则获取与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
网络资源提供单元,用于将所述第二网络资源提供给用户。
其中,所述网络资源获取单元包括:
快照获取子单元,用于获取所述第一网络资源的内容的快照,将所述内容的快照作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
相似搜索子单元,用于通过搜索引擎获取所述第一网络资源的相似网络资源,将所述相似网络资源作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
缓存搜索子单元,用于在浏览器的服务器缓存中搜索所述第一网络资源的定位信息或所述第一网络资源所在网页的定位信息对应的缓存内容,将所述缓存内容作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
点对点查找子单元,用于在点对点P2P网络中查找其他用户之前保存的与所述第一网络资源的定位信息或所述第一网络资源所在网页的定位信息对应的网络资源,将所述查找到的网络资源作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
其中,所述快照获取子单元包括:
第一快照获取子单元,用于获取并保存所述第一网络资源被加入到所述网络资源收藏集合时的内容的快照,将保存的第一网络资源的内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
或者,
第二快照获取子单元,用于在所述第一网络资源被加入到所述网络资源收藏集合之后,后台访问所述第一网络资源,获取并保存所述第一网络资源的内容的快照,将保存的第一网络资源的内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
或者,
第三快照获取子单元,用于通过搜索引擎搜索所述第一网络资源的内容的快照,将所搜索到的内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
其中,所述相似搜索子单元包括:
第一相似搜索子单元,用于以所述第一网络资源的统一资源定位符URL为关键词,利用搜索引擎的相似网页搜索功能获得与所述第一网络资源的相似网络资源;
或者,
第二相似搜索子单元,用于获取所述第一网络资源被加入到所述网络资源收藏集合中时的内容中关键位置处的信息,以所述关键位置处的信息为关键词,从搜索引擎给出的搜索结果中获取所述第一网络资源的相似网络资源。
优选的,还包括:
添加单元,用于将所述与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源添加到所述网络资源收藏集合中。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
通过本发明实施例,当网络资源收藏集合中的网络资源出现无法访问或内容与被加入到网络资源收藏集合中时相比发生变化等状态时,能够为用户提供与被加入到网络资源收藏集合中时内容相同或相似的网络资源,而不至于使用户看到一个仅包含有出错信息的页面,或者显示的并不是用户想要的内容的页面,因此,可以提高浏览器的性能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的方法的流程图;
图2是本发明实施例提供的另一方法的流程图;
图3是本发明实施例提供的系统的示意图;
图4是本发明实施例提供的另一系统的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
首先需要说明的是,本发明人在实现本发明的过程中发现,对于网络资源收藏集合(俗称收藏夹或者收藏列表等等)中的网络资源,在有些情况下,用户之所以要收藏这些网络资源的目的,是因为该网络资源中的内容(例如介绍某机器工作原理的文章等等)对自己比较有用或者自己比较感兴趣,将来可能会需要用到或者需要反复查看,因此,将其加入网络资源收藏集合,以便日后可以在网络资源收藏集合中找到该网络资源,打开后可以看到与之前看到的相同的内容。但是,在实际应用中,由于网络资源中的内容可能会发生变化,以至于当用户在访问之前收藏的网络资源时,可能其中的内容已经与收藏时不同,甚至网络资源可能已经无效,导致无法访问等等,这些现象都会导致用户无法从网络资源收藏集合中获得自己想要信息。本发明实施例正是基于上述现象,提出了相应的解决方案,使得即使出现无法访问或内容发生变化的情况时,也能够尽量为用户提供其想要的信息。下面进行详细地介绍。
实施例一
在该实施例一中,首先针对上述“内容发生变化”的情况提供了相应的解决方案,参见图1,本发明实施例提供的第一种提供网络资源的方法包括以下步骤:
S101:获得第一网络资源被加入到网络资源收藏集合时的内容;
由于本发明实施例所述“内容发生变化”的情况是指与第一网络资源被加入到所述网络资源收藏集合时的内容相比,其内容发生了变化,因此,首先,需要获得第一网络资源被加入到网络资源收藏集合时的内容,以便于将其作为判断是否发生“内容发生变化”的情况的比较基准。
具体实现时,可以在用户将某网络资源加入到网络资源收藏集合时,就提取该网络资源的内容,将其保存下来作为日后比较的基准。或者,如果在加入到网络资源收藏集合时没有获取到网络资源的内容,也可以记录下将某网络资源加入到网络资源收藏集合时的时间,然后到搜索引擎中去查找搜索引擎在该时间(或者在一个时间范围内,该时间范围包括将某网络资源加入到网络资源收藏集合时的时间)抓取的该网络资源的快照,从该快照中获取该网络资源被加入到网络资源收藏集合时的内容。当然,还可以通过其他方式来获取。
S102:加载网络资源集合中的第一网络资源,获得所述第一网络资源的当前内容;
具体实现时,该步骤S102的执行时机可以有多种。例如,在一种方式下,可以在接收到用户访问网络资源收藏集合中的某网络资源的请求时进行加载。也就是说,当用户打开某网络资源收藏集合,并点击其中的某个条目时,就相当于用户发起了访问该条目对应的网络资源的请求,此时,就可以启动该步骤S102,在加载网络资源的过程中,就可以获取该网络资源的当前内容。
此外,除了可以在用户发起访问请求时执行该步骤S102,在本发明实施例中,还可以在用户发起访问网络资源收藏集合中的某具体的网络资源之前,后台监控网络资源收藏集合中的网络资源,也即,即使用户没有发出访问某收藏集合中网络资源的请求,浏览器也可以在后台对收藏集合中的网络资源进行加载。具体地,可以后台定期(例如每隔三小时等)或不定期(例如每次开机时等)地发起对网络资源收藏集合中的网络资源的加载,并在每次发起后台加载时,获取网络资源在加载时刻的当前内容。这样做的好处是,在用户没有真正访问某个收藏的网络资源之前,就能提前知道某些网络资源是否发生了变化,进而可以提前让用户知道。
S103:检测所述第一网络资源的当前内容与所述第一网络资源被加入到所述网络资源收藏集合时的内容相比,内容是否发生特定程度的变化;
由于已经获取了网络资源在被加入到网络资源收藏集合中时的内容,以及被加载时的当前内容,因此,就可以将两者进行比较,确定是否发生特定程度的变化。
其中,所谓是否发生特定程度的变化,可以包括是否主题内容是否发生变化、主体内容是否发生变化或者内容的变化量是否达到预置条件等等。其中,所谓主题内容是指,网络资源中的内容通常可能会表现一个主题,同时可能还有一些广告等其他内容,而属于该主题的内容才是该网络资源的主题内容,也是用户真正需要关注的内容。例如,某网络资源的内容是报道某新闻,则其中可能会包含一个新闻标题,后面是新闻的具体介绍,这部分内容都是该网络资源的主题内容;同时,在网页的右侧或其他部位还有广告,这就不属于该网络资源的主题内容。如果该网络资源中原来的新闻被删除了,或者已经被其他的新闻所取代,则显然,在主题内容上已经发生了很大的变化,因此,可能已经不是用户需要的信息,本发明实施例就可以将这种情况监测出来。
所谓主体内容,与主题内容类似,只不过在有些网络资源中,其内容可能表现了多个主题,此时,这些主题的内容加在一起属于该网络资源中的主体内容。同样的,网络资源中除了主体内容外,还可能包括一些广告等其他的内容,可能不是用户所重点关注的,因此,也可以仅判断主体内容是否发生变化。
此外,也可以将网络资源的全部内容进行比较,如果发生变化的内容比较多,比如变化量达到预置条件,则也可能已经不是用户所需要的信息。
需要说明的是,对于前述判断网络资源的主题内容或者主体内容是否发生变化的情况,步骤S101在获取网络资源被加入到网络资源收藏集合中时的内容时,也可以仅获取其主题内容或主体内容。关于如何获取主题内容或主体内的方法可以参见已有技术中的方法,这里不再进行介绍。
S104:如果所述变化达到特定程度,则获取与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
也就是说,在发现网络资源的内容与其加入到网络资源收藏集合中时相比,在内容上已经发生了特定的变化,则证明如果直接将当前内容展现给用户,则很可能并不是用户真正想要的看到的。因此,在本发明实施例中,当发现这种现象时,可以为用户提供与网络资源被加入到网络资源收藏集合时的内容相同或相似的网络资源(为便于描述,下面均将该网络资源成为第二网络资源,将原网络资源成为第一网络资源),为此,就要首先获取这种第二网络资源。具体实现时,获取这种第二网络资源的具体实现方式可以有多种,下面进行详细地介绍。
方式一,可以获取第一网络资源的内容的快照,将该内容的快照作为与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源。其中,所谓“快照”,相当于是指网络资源在某时刻的内容的备份,“快照”是一种与原网络资源相独立的网络资源,但是在内容上与原网络资源在某一时刻的内容是相同的,并且,与原网络资源不同的是,快照中的内容是不会发生变化的。
具体实现时,浏览器可以在第一网络资源被加入到网络资源收藏集合中时(例如在收藏夹中添加某网页时),就获取并保存第一网络资源的内容的快照,这样,就可以将该保存的快照作为该网络资源的与第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
或者,也可以在向网络资源收藏集合中添加第一网络资源之后,后台访问第一网络资源,获取并保存第一网络资源的内容的快照,将该保存的快照作为第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源。也就是说,第一网络资源内容的快照也可以是在将其添加到网络资源收藏集合之后的某一时刻获取的,并且也可以采用定期或不定期重新获取的方式进行更新。
以上获取第一网络资源的内容的快照的方式都是由浏览器直接获取的,在实际应用中,还可以通过搜索引擎去获取网络资源的快照。由于搜索引擎在收录网页时,通常会对网页进行备份,存在自己的服务器缓存里,当用户在搜索引擎中点击“网页快照”链接时,搜索引擎将当时所抓取并保存的网页内容展现出来。也就是说,搜索引擎的服务器中通常会保存有网络资源的内容的快照。因此,在需要获取与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源时,也可以通过搜索引擎获取第一网络资源的内容的快照,将该快照作为与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源。
具体实现时,浏览器可以预先获得某搜索引擎的接口,然后将第一网络资源的URL作为关键词在该搜索引擎中发起搜索,由于搜索关键词就是第一网络资源的URL,因此搜索引擎返回的搜索结果中会包括该第一网络资源的链接,并且如果搜索引擎服务器中保存有该第一网络资源的快照,也会将该快照的链接显示在搜索结果中;此时,浏览器可以从搜索结果中提取出该第一网络资源的内容的快照,作为与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源。当然,也可以预先与搜索引擎约定,当接收到浏览器发送的以某网络资源的URL为关键词的搜索请求时,搜索引擎直接将该URL对应的网络资源的内容的快照返回给浏览器,这样相当于节省了浏览器去提取的过程。
需要说明的是,对于在将第一网络资源加入到网络资源收藏集合之后获取到该第一网络资源的内容的快照,或者,从搜索引擎获取到的第一网络资源的快照,在获取到之后,还可以首先与第一网络资源被加入到网络资源收藏集合时的内容进行比较,如果相似程度达到一定的程度,才将其作为与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源。
方式二,可以通过搜索引擎获取第一网络资源的相似网络资源,将该相似网络资源作为与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源。对于相似网络资源,顾名思义,相当于是与待处理的网络资源在内容、主题、组织形式等方面具有一定的相似性的网络资源。
具体在通过搜索引擎获取某网络资源的相似网络资源时,也可以有多种具体的实现方式。例如,由于搜索引擎通常会具有相似网络资源搜索功能,这相当于是搜索引擎自身具有的一项特殊功能,为了区别于普通的搜索功能,通常会预定义一个标识符,可以在搜索框中首先输入该标识符,然后再加上网络资源的URL,这样发起搜索请求之后,搜索引擎就可以将该请求识别为相关网络资源搜索请求,返回的搜索结果就是与该网络资源相似的其他网络资源的链接。例如,某搜索引擎预定义的标识符为“related:”,假设某网页的URL为www.aaa.com,则需要搜索该网页的相似网页时,就可以在搜索框中输入“related:www.aaa.com”,相应的,搜索引擎就可以返回与该网页相似的其他网页的链接。因此,在本发明实施例中,在需要获取与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源时,就可以将第一网络资源的URL作为相似网络资源搜索的搜索对象,例如,浏览器可以自动将“related:第一网络资源的URL”作为关键词向搜索引擎发起搜索请求,这样就可以从搜索引擎返回的搜索结果中获取与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源。当然,为了确保这种方式下获取到的第二网络资源在内容上与第一网络资源被加入到网络资源收藏集合中时的相似性,还可以首先与第一网络资源被加入到网络资源收藏集合中时的内容进行对比,如果整体上的相似性达到一定的程度,才作为与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源。
或者,也可以利用搜索引擎的普通搜索功能,搜索与第一网络资源在内容上相似的网络资源,作为替代网络资源。在这种方式下,可以首先获取第一网络资源在被加入到网络资源收藏集合中时的内容中,关键位置处(例如网页标题、文章正文等)的信息(包括文字或图片等)作为关键词,然后在搜索引擎中发起搜索,从搜索引擎返回的搜索结果中获取相似网络资源,作为与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源。
需要说明的是,对于相似网络资源搜索以及普通的搜索,其区别在于:相似网络资源搜索得到的结果,是与作为搜索对象的网络资源具有某种相关性的网络资源,例如,某网页是一个导航网站的主页,则其他导航网站的主页就可能是与该网页相似的网页。也就是说,此时的相似其实是相关性的一种体现,这种相关性可能是网站之间的相关性,或者网页之间的相关性,等等。对于搜索引擎而言,可能会从多个角度建立这种相关性,例如,网站所属的领域、某一类人群共同感兴趣的网页等等,将网络资源划分为多个类别,因此,网络资源的相似性搜索结果,可能就是从该网络资源所属的类别中,找到该类别中其他的网络资源作为该网络资源的相似网络资源,这种相似网络资源与该网络资源之间可能并不存在某相同的文字,但是确实在某一方面存在相关性。而普通的搜索,则通常以文字或图片等作为关键词,在搜索框中输入关键词之后,搜索结果是由正文中均包含有该关键词的网络资源组成的。所以,普通的搜索通常反映的是文字或图片等内容上的相关性。通过这种普通的搜索方式,可以将文字或图片等内容上的相似的网络资源作为第二网络资源提供给用户,其中,这种文字或图片等内容上相似的网络资源,可能是对同一事件的其他报道,还可能是网络中其他用户对同一报道的转载或者分享,等等。
另外需要说明的是,在以相似网络资源作为与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源的方式下,由于相似网络资源可能有多个,因此,获取的第二网络资源也可以有多个,具体实现时,可以预先设定需要获取的数目,从搜索引擎返回的结果中按照该预定的数目进行选择。
方式三,可以在浏览器的服务器缓存中搜索第一网络资源的定位信息或第一网络资源所在网页的定位信息对应的缓存内容,将该缓存内容作为与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源。
由于有的浏览器为了提高访问网页的速度,提供了“全网加速”功能,为实现该功能,会在服务器中存放网络上各个URL(包括网页、图片等)在过去时刻的Cache(缓存)。即只要有用户访问过某URL,就将该URL对应的网页中的内容缓存在浏览器的服务器中,以便其他用户在访问同样的URL时,可以直接从缓存中取出相应的数据,从而提升访问速度。
因此,本发明实施例也可以通过访问该缓存来获取与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源。具体实现时,可以由浏览器的服务器提供访问缓存的接口,这样,在需要获取与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源时,就可以直接利用第一网络资源的URL在缓存中进行搜索,接下来的实现过程与在搜索引擎中搜索相似。
当然,针对这种实现方式,同样可以首先将搜索到的缓存内容与第一网络资源被加入到网络资源收藏集合中时的内容进行比较,如果整体上的相似程度达到预先设置的条件,再将其作为与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源。
方式四,可以在点对点P2P网络中查找其他用户之前保存的与第一网络资源的定位信息或第一网络资源所在网页的定位信息对应的网络资源,将查找到的网络资源作为与第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。这种方式对于第一网络资源对应一下载文件或者视频等情况尤为有效。
其中,P2P又称为对等互联网络技术,是一种用于不同PC(PersonalComputer,个人计算机)用户之间,不经过中继设备直接交换数据或服务的技术。在P2P网络中,PC用户可以直接连接到其他用户的计算机,而不需要连接到服务器上再进行浏览与下载。
在本发明实施例中,就可以构建一个P2P网络(基于公开协议和自有协议的均可),用户每下载一个文件或者视频等,就可以在P2P网络共享这一文件。这样,只要有用户下载过某文件或视频,即使该文件或视频此后被删除,也可以通过在P2P网络中查找到这一文件或视频。因此,当需要获取与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源时,就可以在P2P网络中查找其他用户之前保存的与第一网络资源的定位信息或第一网络资源所在网页的定位信息对应的网络资源,并将其作为第二网络资源即可。
总之,可以采用多种具体的方式获取与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源,具体实现时,可以采用其中任意一种方式,或者也可以采用任意多种方式的组合从多个角度获取与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源。
S105:将所述第二网络资源提供给用户。
在获取到与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源之后,就可以将其提供给用户。具体在向用户提供与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源时,也可以有多种方式。例如,可以将第二网络资源的链接提供给用户供用户选择,或者也可以直接将第二网络资源的内容展现给用户,等等。其中,在将第二网络资源的链接提供给用户的情况下,可以以弹出窗口的方式,将第二网络资源的链接显示在弹出窗口中,当然,也可以采用其他的方式进行提供。再或者,先给用户一个提示,询问用户是否需要第二网络资源,如果用户需要,再将找到的第二网络资源提供给用户。
此外,在实际应用中,由于第一网络资源的内容已经与收藏时不同了,而第二网络资源的内容是与第一网络资源被收藏时的内容相同或相似的,因此,可以将第二网络资源加入到网络资源收藏集合中。具体实现时,可以直接用第二网络资源替换网络资源收藏集合中的第一网络资源,比如用第二网络资源的URL替代收藏集合中第一网络资源的URL;或者;第一网络资源与第二网络资源也可以共存,比如收藏夹中既收藏第一网络资源的URL,又收藏第二网络资源的URL。当然,也可以为用户提供入口,由用户选择是否将第二网络资源加入到网络资源收藏集合中。
总之,在本发明实施例中,对于网络资源收藏集合中的网络资源,当网络资源收藏集合中的网络资源出现内容与被加入到网络资源收藏集合中时相比发生变化等状态时,能够为用户提供与被加入到网络资源收藏集合中时内容相同或相似的网络资源,而不至于显示的并不是用户想要的内容的页面,因此,可以提高浏览器的性能。
实施例二
该实施例二主要针对网络资源收藏集合中的网络资源出现无法访问的情况,提供了相应的解决方案,参见图2,本发明实施例提供的另一种提供网络资源的方法包括以下步骤:
S201:在接收到用户访问网络资源收藏集合中的第一网络资源的请求之前,检测所述网络资源收藏集合中的第一网络资源是否无法访问;
在该实施例中,检测的动作是在接收到用户访问网络资源收藏集合中的第一网络资源的请求之前进行的,也即,在用户没有主动访问网络资源收藏集合中的某网络资源的情况下,也可以后台定期或者不定期地对网络资源收藏集合中的网络资源进行加载,并检测其是否发生无法访问的情况。
其中,由于按照常规的方法,浏览器在加载网络资源时,会根据网络资源的URL,向网络资源的服务器发送下载请求,服务器再向浏览器返回响应。其中,如果网络资源不能正常被访问,则服务器会返回出错信息,并且由于出错的原因可能有多种,包括URL已失效或过期、网络拥塞等等,因此,服务器返回的出错信息中还可能包含有错误代码,用以指示对应的各种出错原因,例如,代码为“400”的错误通常是由于不正确的请求造成的,说明正在访问的网络资源可能已经删除、更名或暂时不可用,等等。因此,可以通过判断服务器是否返回预定错误代码的出错信息,来判断第一网络资源是否出现无法访问的状态。当然,也可以通过其他方式进行判断。
S202:如果无法访问,则获取与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
S203:将所述第二网络资源提供给用户。
如果出现了无法访问的状况,则可以获取与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源,并将该第二网络资源提供给用户。其中,具体的获取与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源的方法,以及向用户提供第二网络资源的方法,均可以与实施例一中相同,这里不再赘述。
与实施例一类似,由于第一网络资源已经无法访问了,而第二网络资源的内容是与第一网络资源被收藏时的内容相同或相似的,因此,可以将第二网络资源加入到网络资源收藏集合中。具体实现时,可以直接用第二网络资源替换网络资源收藏集合中的第一网络资源,比如用第二网络资源的URL替代收藏集合中第一网络资源的URL;或者;第一网络资源与第二网络资源也可以共存,比如收藏夹中既收藏第一网络资源的URL,又收藏第二网络资源的URL。当然,也可以为用户提供入口,由用户选择是否将第二网络资源加入到网络资源收藏集合中。
需要说明的是,在本发明实施例二中,由于并不是在用户发起访问请求的时候进行的检测,因此,则为了避免对用户的正常工作造成影响,如果检测到某网络资源存在无法访问的情况,可以优先采用首先给出提示,如果用户关注了该提示,再将获取到的第二网络资源提供给用户的方式。或者,还可以在将获取到的第二网络资源添加到网络资源收藏集合中,并且还可以通过添加标识等方式,表明哪个第一网络资源已经无法访问,可以通过访问浏览器为其提供的该第二网络资源获得其需要的内容,这样,当用户需要访问网络资源收藏集合中的该第一网络资源时,就可以直接点击该第二网络资源,并从中获取到其想要的信息。
总之,通过本发明实施例二,即使在用户没有主动访问网络资源收藏集合中的某网络资源的情况下,也可以后台定期或者不定期地对网络资源收藏集合中的网络资源进行检测,如果发生无法访问的情况,则可以向用户提供与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源。这样,避免使用户看到一个仅包含有出错信息的页面。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,包括如下步骤:获得第一网络资源被加入到网络资源收藏集合时的内容;加载网络资源集合中的第一网络资源,获得所述第一网络资源的当前内容;检测所述第一网络资源的当前内容与所述第一网络资源被加入到所述网络资源收藏集合时的内容相比,内容是否发生特定程度的变化;如果所述变化达到特定程度,则获取与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;将所述第二网络资源提供给用户。或者,在接收到用户访问网络资源收藏集合中的第一网络资源的请求之前,检测所述网络资源收藏集合中的第一网络资源是否无法访问;如果无法访问,则获取与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;将所述第二网络资源提供给用户。所述的存储介质,如:ROM/RAM、磁碟、光盘等。
与本发明实施例一提供的方法相对应,本发明实施例还提供了一种提供网络资源的系统,与实施例一中相对应的各具体技术手段,就不在赘述,可以参考前述方法实施例中的对应内容。本系统参见图3,该系统可以包括:
原内容获取单元301,用于获得第一网络资源被加入到网络资源收藏集合时的内容;
当前内容获取单元302,用于加载网络资源集合中的第一网络资源,获得所述第一网络资源的当前内容;
检测单元303,用于检测所述第一网络资源的当前内容与所述第一网络资源被加入到所述网络资源收藏集合时的内容相比,内容是否发生特定程度的变化;
网络资源获取单元304,用于如果所述变化达到特定程度,则获取与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
网络资源提供单元305,用于将所述第二网络资源提供给用户。
具体实现时,所述当前内容获取单元包括:
第一当前内容获取子单元,用于在接收到用户访问网络资源收藏集合中的某第一网络资源的请求时,加载该第一网络资源;
或者,
第二当前内容获取子单元,用于在接收到用户访问网络资源收藏集合中的第一网络资源的请求之前,后台加载所述网络资源集合中的第一网络资源。
获取第二网络资源的方法可以有多种,具体的,网络资源获取单元304可以包括:
快照获取子单元,用于获取所述第一网络资源的内容的快照,将所述内容的快照作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
相似搜索子单元,用于通过搜索引擎获取所述第一网络资源的相似网络资源,将所述相似网络资源作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
缓存搜索子单元,用于在浏览器的服务器缓存中搜索所述第一网络资源的定位信息或所述第一网络资源所在网页的定位信息对应的缓存内容,将所述缓存内容作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
点对点查找子单元,用于在点对点P2P网络中查找其他用户之前保存的与所述第一网络资源的定位信息或所述第一网络资源所在网页的定位信息对应的网络资源,将所述查找到的网络资源作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
其中,快照获取子单元也可以有多种实现方式,例如浏览器获取,或者借助于搜索引擎获取等等。例如,该快照获取子单元具体可以包括:
第一快照获取子单元,用于获取并保存所述第一网络资源被加入到所述网络资源收藏集合时的内容的快照,将保存的第一网络资源的内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
或者,
第二快照获取子单元,用于在所述第一网络资源被加入到所述网络资源收藏集合之后,后台访问所述第一网络资源,获取并保存所述第一网络资源的内容的快照,将保存的第一网络资源的内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
或者,
第三快照获取子单元,用于通过搜索引擎搜索所述第一网络资源的内容的快照,将所搜索到的内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
相似搜索子单元与可以有多种实现方式,具体的,该相似搜索子单元可以包括:
第一相似搜索子单元,用于以所述第一网络资源的统一资源定位符URL为关键词,利用搜索引擎的相似网页搜索功能获得与所述第一网络资源的相似网络资源;
或者,
第二相似搜索子单元,用于获取所述第一网络资源被加入到所述网络资源收藏集合中时的内容中关键位置处的信息,以所述关键位置处的信息为关键词,从搜索引擎给出的搜索结果中获取所述第一网络资源的相似网络资源。
当然,在通过以上各种方式获取第二网络资源的过程中,都可以将获得的结果与第一网络资源被加入到网络资源收藏集合中时的内容进行对比,如果内容在整体上的相似程度达到了预置的条件(例如预置一个百分比作为阈值等待),再将其作为第二网络资源。
此外,该系统还可以包括:
添加单元,用于将所述与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源添加到所述网络资源收藏集合中。
其中,检测单元303具体可以用于:检测所述第一网络资源的当前内容与所述第一网络资源被加入到所述网络资源收藏集合时的内容相比,内容的主题内容或主体内容发生变化,或者内容的变化量达到预置条件。
总之,通过本发明实施例提供的该系统,对于网络资源收藏集合中的网络资源,当网络资源收藏集合中的网络资源出现内容与被加入到网络资源收藏集合中时相比发生变化等状态时,能够为用户提供与被加入到网络资源收藏集合中时内容相同或相似的网络资源,而不至于显示的并不是用户想要的内容的页面,因此,可以提高浏览器的性能。
与本发明实施例二提供的方法相对应,本发明实施例还提供了另一种提供网络资源的系统,与实施例二中相对应的各具体技术手段,就不在赘述,可以参考前述方法实施例中的对应内容。本系统参见图4,该系统包括:
检测单元401,用于在接收到用户访问网络资源收藏集合中的第一网络资源的请求之前,检测所述网络资源收藏集合中的第一网络资源是否无法访问;
网络资源获取单元402,用于如果无法访问,则获取与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
网络资源提供单元403,用于将所述第二网络资源提供给用户。
获取第二网络资源的方法可以有多种,具体的,网络资源获取单元402可以包括:
快照获取子单元,用于获取所述第一网络资源的内容的快照,将所述内容的快照作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
相似搜索子单元,用于通过搜索引擎获取所述第一网络资源的相似网络资源,将所述相似网络资源作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
缓存搜索子单元,用于在浏览器的服务器缓存中搜索所述第一网络资源的定位信息或所述第一网络资源所在网页的定位信息对应的缓存内容,将所述缓存内容作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
点对点查找子单元,用于在点对点P2P网络中查找其他用户之前保存的与所述第一网络资源的定位信息或所述第一网络资源所在网页的定位信息对应的网络资源,将所述查找到的网络资源作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
其中,快照获取子单元也可以有多种实现方式,例如浏览器获取,或者借助于搜索引擎获取等等。例如,该快照获取子单元具体可以包括:
第一快照获取子单元,用于获取并保存所述第一网络资源被加入到所述网络资源收藏集合时的内容的快照,将保存的第一网络资源的内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
或者,
第二快照获取子单元,用于在所述第一网络资源被加入到所述网络资源收藏集合之后,后台访问所述第一网络资源,获取并保存所述第一网络资源的内容的快照,将保存的第一网络资源的内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
或者,
第三快照获取子单元,用于通过搜索引擎搜索所述第一网络资源的内容的快照,将所搜索到的内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
相似搜索子单元与可以有多种实现方式,具体的,该相似搜索子单元可以包括:
第一相似搜索子单元,用于以所述第一网络资源的统一资源定位符URL为关键词,利用搜索引擎的相似网页搜索功能获得与所述第一网络资源的相似网络资源;
或者,
第二相似搜索子单元,用于获取所述第一网络资源被加入到所述网络资源收藏集合中时的内容中关键位置处的信息,以所述关键位置处的信息为关键词,从搜索引擎给出的搜索结果中获取所述第一网络资源的相似网络资源。
当然,在通过以上各种方式获取第二网络资源的过程中,都可以将获得的结果与第一网络资源被加入到网络资源收藏集合中时的内容进行对比,如果内容在整体上的相似程度达到了预置的条件(例如预置一个百分比作为阈值等待),再将其作为第二网络资源。
此外,该系统还可以包括:
添加单元,用于将所述与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源添加到所述网络资源收藏集合中。
总之,通过本发明实施例提供的该系统,即使在用户没有主动访问网络资源收藏集合中的某网络资源的情况下,也可以后台定期或者不定期地对网络资源收藏集合中的网络资源进行检测,如果发生无法访问的情况,则可以向用户提供与第一网络资源被加入到网络资源收藏集合时的内容相同或相似的第二网络资源。这样,避免使用户看到一个仅包含有出错信息的页面。
需要说明的是,上述系统实施例是与前述方法实施例相对应的,因此,系统实施例中未详述部分可参见方法实施例部分的介绍,这里不再赘述。
以上对本发明所提供的提供网络资源的方法及系统,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (24)

1.一种提供网络资源的方法,其特征在于,包括:
获得第一网络资源被加入到网络资源收藏集合时的内容;
加载网络资源集合中的第一网络资源,获得所述第一网络资源的当前内容;
检测所述第一网络资源的当前内容与所述第一网络资源被加入到所述网络资源收藏集合时的内容相比,内容是否发生特定程度的变化;
如果所述变化达到特定程度,则获取与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
将所述第二网络资源提供给用户。
2.根据权利要求1所述的方法,其特征在于,所述加载网络资源集合中的第一网络资源包括:
在接收到用户访问网络资源收藏集合中的某第一网络资源的请求时,加载所述第一网络资源;
或者,
在接收到用户访问网络资源收藏集合中的第一网络资源的请求之前,后台加载所述网络资源集合中的第一网络资源。
3.根据权利要求1所述的方法,其特征在于,所述获取与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源包括:
获取所述第一网络资源的内容的快照,将所述内容的快照作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
通过搜索引擎获取所述第一网络资源的相似网络资源,将所述相似网络资源作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
在浏览器的服务器缓存中搜索所述第一网络资源的定位信息或所述第一网络资源所在网页的定位信息对应的缓存内容,将所述缓存内容作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
在点对点P2P网络中查找其他用户之前保存的与所述第一网络资源的定位信息或所述第一网络资源所在网页的定位信息对应的网络资源,将所述查找到的网络资源作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
4.根据权利要求3所述的方法,其特征在于,所述获取所述第一网络资源的内容的快照,将所述内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源包括:
获取并保存所述第一网络资源被加入到所述网络资源收藏集合时的内容的快照,将保存的第一网络资源的内容的快照作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
或者,
在所述第一网络资源被加入到所述网络资源收藏集合之后,后台访问所述第一网络资源,获取并保存所述第一网络资源的内容的快照,将保存的第一网络资源的内容的快照作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
或者,
通过搜索引擎搜索所述第一网络资源的内容的快照,将所搜索到的内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
5.根据权利要求3所述的方法,其特征在于,所述通过搜索引擎获取所述第一网络资源的相似网络资源包括:
以所述第一网络资源的统一资源定位符URL为关键词,利用搜索引擎的相似网页搜索功能获得与所述第一网络资源的相似网络资源;
或者,
获取所述第一网络资源被加入到所述网络资源收藏集合中时的内容中关键位置处的信息,以所述关键位置处的信息为关键词,从搜索引擎给出的搜索结果中获取所述第一网络资源的相似网络资源。
6.根据权利要求1所述的方法,其特征在于,还包括:
将与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源添加到所述网络资源收藏集合中。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述检测所述第一网络资源的当前内容与所述第一网络资源被加入到所述网络资源收藏集合时的内容相比,内容是否发生特定程度的变化包括:
检测所述第一网络资源的当前内容与所述第一网络资源被加入到所述网络资源收藏集合时的内容相比,内容的主题内容或主体内容发生变化,或者内容的变化量达到预置条件。
8.一种提供网络资源的方法,其特征在于,包括:
在接收到用户访问网络资源收藏集合中的第一网络资源的请求之前,检测所述网络资源收藏集合中的第一网络资源是否无法访问;
如果无法访问,则获取与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
将所述第二网络资源提供给用户。
9.根据权利要求8所述的方法,其特征在于,所述获取与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源包括:
获取所述第一网络资源的内容的快照,将所述内容的快照作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
通过搜索引擎获取所述第一网络资源的相似网络资源,将所述相似网络资源作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
在浏览器的服务器缓存中搜索所述第一网络资源的定位信息或所述第一网络资源所在网页的定位信息对应的缓存内容,将所述缓存内容作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
在点对点P2P网络中查找其他用户之前保存的与所述第一网络资源的定位信息或所述第一网络资源所在网页的定位信息对应的网络资源,将所述查找到的网络资源作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
10.根据权利要求9所述的方法,其特征在于,所述获取所述第一网络资源的内容的快照,将所述内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源包括:
获取并保存所述第一网络资源被加入到所述网络资源收藏集合时的内容的快照,将保存的第一网络资源的内容的快照作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
或者,
在所述第一网络资源被加入到所述网络资源收藏集合之后,后台访问所述第一网络资源,获取并保存所述第一网络资源的内容的快照,将保存的第一网络资源的内容的快照作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
或者,
通过搜索引擎搜索所述第一网络资源的内容的快照,将所搜索到的内容的快照作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
11.根据权利要求9所述的方法,其特征在于,所述通过搜索引擎获取所述第一网络资源的相似网络资源包括:
以所述第一网络资源的统一资源定位符URL为关键词,利用搜索引擎的相似网页搜索功能获得与所述第一网络资源的相似网络资源;
或者,
获取所述第一网络资源被加入到所述网络资源收藏集合中时的内容中关键位置处的信息,以所述关键位置处的信息为关键词,从搜索引擎给出的搜索结果中获取所述第一网络资源的相似网络资源。
12.根据权利要求8至11任一项所述的方法,其特征在于,还包括:
将所述与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源添加到所述网络资源收藏集合中。
13.一种提供网络资源的系统,其特征在于,包括:
原内容获取单元,用于获得第一网络资源被加入到网络资源收藏集合时的内容;
当前内容获取单元,用于加载网络资源集合中的第一网络资源,获得所述第一网络资源的当前内容;
检测单元,用于检测所述第一网络资源的当前内容与所述第一网络资源被加入到所述网络资源收藏集合时的内容相比,内容是否发生特定程度的变化;
网络资源获取单元,用于如果所述变化达到特定程度,则获取与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
网络资源提供单元,用于将所述第二网络资源提供给用户。
14.根据权利要求13所述的系统,其特征在于,所述当前内容获取单元包括:
第一当前内容获取子单元,用于在接收到用户访问网络资源收藏集合中的某第一网络资源的请求时,加载该第一网络资源;
或者,
第二当前内容获取子单元,用于在接收到用户访问网络资源收藏集合中的第一网络资源的请求之前,后台加载所述网络资源集合中的第一网络资源。
15.根据权利要求13所述的系统,其特征在于,所述网络资源获取单元包括:
快照获取子单元,用于获取所述第一网络资源的内容的快照,将所述内容的快照作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
相似搜索子单元,用于通过搜索引擎获取所述第一网络资源的相似网络资源,将所述相似网络资源作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
缓存搜索子单元,用于在浏览器的服务器缓存中搜索所述第一网络资源的定位信息或所述第一网络资源所在网页的定位信息对应的缓存内容,将所述缓存内容作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
点对点查找子单元,用于在点对点P2P网络中查找其他用户之前保存的与所述第一网络资源的定位信息或所述第一网络资源所在网页的定位信息对应的网络资源,将所述查找到的网络资源作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
16.根据权利要求15所述的系统,其特征在于,所述快照获取子单元包括:
第一快照获取子单元,用于获取并保存所述第一网络资源被加入到所述网络资源收藏集合时的内容的快照,将保存的第一网络资源的内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
或者,
第二快照获取子单元,用于在所述第一网络资源被加入到所述网络资源收藏集合之后,后台访问所述第一网络资源,获取并保存所述第一网络资源的内容的快照,将保存的第一网络资源的内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
或者,
第三快照获取子单元,用于通过搜索引擎搜索所述第一网络资源的内容的快照,将所搜索到的内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
17.根据权利要求15所述的系统,其特征在于,所述相似搜索子单元包括:
第一相似搜索子单元,用于以所述第一网络资源的统一资源定位符URL为关键词,利用搜索引擎的相似网页搜索功能获得与所述第一网络资源的相似网络资源;
或者,
第二相似搜索子单元,用于获取所述第一网络资源被加入到所述网络资源收藏集合中时的内容中关键位置处的信息,以所述关键位置处的信息为关键词,从搜索引擎给出的搜索结果中获取所述第一网络资源的相似网络资源。
18.根据权利要求13所述的系统,其特征在于,还包括:
添加单元,用于将所述与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源添加到所述网络资源收藏集合中。
19.根据权利要求13至18任一项所述的系统,其特征在于,所述检测单元具体用于:检测所述第一网络资源的当前内容与所述第一网络资源被加入到所述网络资源收藏集合时的内容相比,内容的主题内容或主体内容发生变化,或者内容的变化量达到预置条件。
20.一种提供网络资源的系统,其特征在于,包括:
检测单元,用于在接收到用户访问网络资源收藏集合中的第一网络资源的请求之前,检测所述网络资源收藏集合中的第一网络资源是否无法访问;
网络资源获取单元,用于如果无法访问,则获取与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
网络资源提供单元,用于将所述第二网络资源提供给用户。
21.根据权利要求20所述的系统,其特征在于,所述网络资源获取单元包括:
快照获取子单元,用于获取所述第一网络资源的内容的快照,将所述内容的快照作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
相似搜索子单元,用于通过搜索引擎获取所述第一网络资源的相似网络资源,将所述相似网络资源作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
缓存搜索子单元,用于在浏览器的服务器缓存中搜索所述第一网络资源的定位信息或所述第一网络资源所在网页的定位信息对应的缓存内容,将所述缓存内容作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
和/或,
点对点查找子单元,用于在点对点P2P网络中查找其他用户之前保存的与所述第一网络资源的定位信息或所述第一网络资源所在网页的定位信息对应的网络资源,将所述查找到的网络资源作为与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
22.根据权利要求21所述的系统,其特征在于,所述快照获取子单元包括:
第一快照获取子单元,用于获取并保存所述第一网络资源被加入到所述网络资源收藏集合时的内容的快照,将保存的第一网络资源的内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
或者,
第二快照获取子单元,用于在所述第一网络资源被加入到所述网络资源收藏集合之后,后台访问所述第一网络资源,获取并保存所述第一网络资源的内容的快照,将保存的第一网络资源的内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源;
或者,
第三快照获取子单元,用于通过搜索引擎搜索所述第一网络资源的内容的快照,将所搜索到的内容的快照作为与所述该第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源。
23.根据权利要求21所述的系统,其特征在于,所述相似搜索子单元包括:
第一相似搜索子单元,用于以所述第一网络资源的统一资源定位符URL为关键词,利用搜索引擎的相似网页搜索功能获得与所述第一网络资源的相似网络资源;
或者,
第二相似搜索子单元,用于获取所述第一网络资源被加入到所述网络资源收藏集合中时的内容中关键位置处的信息,以所述关键位置处的信息为关键词,从搜索引擎给出的搜索结果中获取所述第一网络资源的相似网络资源。
24.根据权利要求20至23任一项所述的系统,其特征在于,还包括:
添加单元,用于将所述与所述第一网络资源被加入到所述网络资源收藏集合时的内容相同或相似的第二网络资源添加到所述网络资源收藏集合中。
CN201110251140.2A 2011-08-29 2011-08-29 提供网络资源的方法及系统 Active CN102306181B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110251140.2A CN102306181B (zh) 2011-08-29 2011-08-29 提供网络资源的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110251140.2A CN102306181B (zh) 2011-08-29 2011-08-29 提供网络资源的方法及系统

Publications (2)

Publication Number Publication Date
CN102306181A true CN102306181A (zh) 2012-01-04
CN102306181B CN102306181B (zh) 2014-05-07

Family

ID=45380043

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110251140.2A Active CN102306181B (zh) 2011-08-29 2011-08-29 提供网络资源的方法及系统

Country Status (1)

Country Link
CN (1) CN102306181B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015058614A1 (zh) * 2013-10-24 2015-04-30 腾讯科技(深圳)有限公司 一种书签存储方法及装置、确定待浏览书签的方法及装置
CN104731869A (zh) * 2015-02-28 2015-06-24 百度在线网络技术(北京)有限公司 页面的展现方法及装置
CN108600342A (zh) * 2018-03-30 2018-09-28 连尚(新昌)网络科技有限公司 一种消息显示方法、设备及存储介质
CN110020244A (zh) * 2017-11-03 2019-07-16 北京搜狗科技发展有限公司 一种对网址信息进行纠错的方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1504928A (zh) * 2002-12-02 2004-06-16 �Ҵ���˾ 用于访问网页内容的系统和方法
CN1912869A (zh) * 2005-08-11 2007-02-14 腾讯科技(深圳)有限公司 一种网络收藏夹的实现方法
CN101782912A (zh) * 2009-06-23 2010-07-21 北京搜狗科技发展有限公司 信息提示的方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1504928A (zh) * 2002-12-02 2004-06-16 �Ҵ���˾ 用于访问网页内容的系统和方法
CN1912869A (zh) * 2005-08-11 2007-02-14 腾讯科技(深圳)有限公司 一种网络收藏夹的实现方法
CN101782912A (zh) * 2009-06-23 2010-07-21 北京搜狗科技发展有限公司 信息提示的方法及系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015058614A1 (zh) * 2013-10-24 2015-04-30 腾讯科技(深圳)有限公司 一种书签存储方法及装置、确定待浏览书签的方法及装置
CN104731869A (zh) * 2015-02-28 2015-06-24 百度在线网络技术(北京)有限公司 页面的展现方法及装置
CN104731869B (zh) * 2015-02-28 2018-09-04 百度在线网络技术(北京)有限公司 页面的展现方法及装置
CN110020244A (zh) * 2017-11-03 2019-07-16 北京搜狗科技发展有限公司 一种对网址信息进行纠错的方法及装置
CN108600342A (zh) * 2018-03-30 2018-09-28 连尚(新昌)网络科技有限公司 一种消息显示方法、设备及存储介质
CN108600342B (zh) * 2018-03-30 2020-01-10 连尚(新昌)网络科技有限公司 一种消息显示方法、设备及存储介质

Also Published As

Publication number Publication date
CN102306181B (zh) 2014-05-07

Similar Documents

Publication Publication Date Title
CN102200980B (zh) 一种提供网络资源的方法及系统
US10250526B2 (en) Method and apparatus for increasing subresource loading speed
CN102799662B (zh) 基于域名访问历史记录推荐网址的方法、装置及系统
US8856168B2 (en) Contextual application recommendations
US9300755B2 (en) System and method for determining information reliability
CN101539949B (zh) 一种网址补全提示的方法及装置
CN102333122B (zh) 一种下载资源提供方法、装置及系统
CN102693271A (zh) 一种网络信息推荐方法及系统
CN102521251A (zh) 个性化搜索直达的方法、实现该方法的装置和搜索服务器
CN102868773B (zh) 检测dns黑洞劫持的方法、装置及系统
CN102930059A (zh) 一种聚焦爬虫的设计方法
CN102663062A (zh) 一种处理搜索结果中无效链接的方法及装置
CN105069011A (zh) 用于管理网页收藏夹的方法、装置及系统
CN101551813A (zh) 网络连接设备、搜索设备及搜集搜索引擎数据源的方法
CN102306181A (zh) 提供网络资源的方法及系统
CN102622402B (zh) 使用页面集而提供信息搜索服务的服务器、方法和系统
CN1960371B (zh) 一种访问Web应用程序文件的方法及系统
CN101599069A (zh) 电子文档的搜索方法及系统
CN104704495B (zh) 一种信息搜索的方法以及装置
US9477769B2 (en) Method and system for detecting original document of web document, method and system for providing history information of web document for the same
CN103618742A (zh) 获取子域名的方法和系统以及网站管理员权限验证方法
CN105930385A (zh) 一种数据爬取方法及系统
US9529911B2 (en) Building of a web corpus with the help of a reference web crawl
CN105243073A (zh) 一种书签访问方法、装置及终端
US20090125516A1 (en) System and method for detecting duplicate content items

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant