CN106991117B - 快照处理方法、快照显示方法、服务器、浏览器和系统 - Google Patents

快照处理方法、快照显示方法、服务器、浏览器和系统 Download PDF

Info

Publication number
CN106991117B
CN106991117B CN201710084437.1A CN201710084437A CN106991117B CN 106991117 B CN106991117 B CN 106991117B CN 201710084437 A CN201710084437 A CN 201710084437A CN 106991117 B CN106991117 B CN 106991117B
Authority
CN
China
Prior art keywords
snapshot
webpage
web page
information
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710084437.1A
Other languages
English (en)
Other versions
CN106991117A (zh
Inventor
吴华铠
任寰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201710084437.1A priority Critical patent/CN106991117B/zh
Publication of CN106991117A publication Critical patent/CN106991117A/zh
Application granted granted Critical
Publication of CN106991117B publication Critical patent/CN106991117B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/972Access to data in other repository systems, e.g. legacy data or dynamic Web page generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种快照处理方法、快照显示方法、服务器、浏览器和系统。其中,快照处理方法,包括:接收浏览器侧上传网页快照的请求,并为当前浏览器侧的网页地址生成一网页快照标识并发送到浏览器侧,以及接收浏览器侧依据所述网页快照标识上传的所述网页中的网页元素;将所述接收到的网页元素、网页快照标识、网页地址信息进行关联保存形成所述网页的快照信息;接收浏览器侧包括网页地址的下载快照的请求,根据所述网页地址匹配已保存的网页快照信息,将匹配所述网页地址的网页快照信息发送到浏览器侧。

Description

快照处理方法、快照显示方法、服务器、浏览器和系统
技术领域
本发明涉及网络信息处理技术领域,具体涉及一种快照处理方法、快照显示方法、服务器、浏览器和系统。
背景技术
现有的网页快照是指搜索引擎在收录网页时,对网页进行纯文本的备份,存在自己的服务器缓存里,当用户在搜索引擎中点击“网页快照”链接时,搜索引擎将当时所抓取并保存的网页内容展现出来的页面。
图15为现有的快照页面示意图。图15以百度提供的快照为例,这种快照的获取是搜索引擎(例如百度)的爬虫程序从网络上抓取到的,以文本形式保存。显示快照时,都是在检索结果页面中给出,由服务器提供给搜索的用户,并将搜索关键字,例如图1所示的“统一奶茶”,在快照中高亮显示,提示给用户。
使用现有的网页快照处理方法时,用户只能使用特定的工具(如搜索引擎的快照工具)获取网页快照使得操作复杂。而且,使用现有的快照处理和显示方法,只能显示一个服务器提供的单一的快照,且显示的快照而且看不到不同网页快照中的变化区别点。更进一步地,使用现有的搜索引擎获取的网页快照只直接获取文本内容(例如html内容),对于图片、音乐等非文本信息(例如js、css等),快照页面还是直接从原网页调用。若无法连接原网页,那么快照上的图片等非文本内容则无法显示。当原网页进行了修改、删除或者屏蔽后,搜索引擎会修改、删除或者屏蔽相应的网页快照。因此,用户访问的网页快照可能不是完整的历史快照。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的快照处理方法、快照显示方法、服务器、浏览器和系统。
依据本发明的一个方面,提供了一种快照处理方法,包括:接收浏览器侧上传网页快照的请求,并为当前浏览器侧的网页地址生成一网页快照标识并发送到浏览器侧,以及接收浏览器侧依据所述网页快照标识上传的所述网页中的网页元素;将所述接收到的网页元素、网页快照标识、网页地址信息进行关联保存形成所述网页的快照信息;接收浏览器侧包括网页地址的下载快照的请求,根据所述网页地址匹配已保存的网页快照信息,将匹配所述网页地址的网页快照信息发送到浏览器侧。
可选地,所述网页地址信息包括:网页的统一资源定位符URL和由URL通过归一化算法获取的归一化URL,或由URL通过归一化算法获取的归一化URL。
可选地,该方法还包括:在保存形成所述网页的快照信息时,根据网页地址信息更新与网页地址信息对应的网页快照数目;所述接收浏览器侧包括网页地址的下载快照的请求,根据所述网页地址匹配已保存的网页快照信息,将匹配所述网页地址的网页快照信息发送到浏览器侧包括:接收浏览器侧发送的与浏览器侧所访问的网址对应的网页地址,利用所述网页地址得到对应的网页快照数目;将所述网页快照数目发送给浏览器侧;在接收到浏览器侧发出的下载快照的请求时利用所述网页地址得到对应的网页快照标识和网页元素;将网页快照标识和网页元素发送给浏览器侧。
可选地,所述网页快照数目与归一化URL对应;所述网页地址为URL,所述利用所述网页地址得到对应的网页快照数目包括:将该URL通过URL归一化算法得到归一化URL,以及根据归一化URL获取对应的网页快照数目;或,所述网页地址为归一化URL,所述利用所述网页地址得到对应的网页快照数目包括:根据归一化URL获取对应的网页快照数目。
可选地,该方法进一步包括:在将网页快照标识和网页元素发送给浏览器侧时,将用于获取网页快照信息的地址发送给浏览器侧;在接收浏览器发送的访问用于获取网页快照信息的地址的请求时,判断浏览器的类别是否为预定的类别,若是则将网页快照标识和网页元素发送给浏览器侧,若否则退出流程。
可选地,所述网页快照信息,还包括对应于网页快照标识的网页快照记录;所述网页快照记录包括下述的至少一种记录:快照标签、上传者信息、上传时间、被查看次数、评价信息。
可选地,该方法还包括:在接收到浏览器侧发出的访问由特定上传者上传的网页快照的请求时,利用所述请求包含的上传者信息得到对应的网页快照信息,以及将所述对应的网页快照信息发送给浏览器侧。
可选地,所述网页元素是遍历所述网页中的所有网页内容,根据各网页内容分别得到的,包括网页元素内容和网页元素标识;所述将匹配所述网页地址的网页快照信息发送到浏览器侧,包括:将匹配所述网页地址的网页快照信息的网页快照标识和对应于网页快照标识的网页元素标识发送到浏览器侧;在接收到浏览器侧发送的下载网页元素内容的请求时,将浏览器侧请求下载的网页元素内容发送给浏览器侧。
可选地,所述网页快照信息与归一化URL对应;所述网页元素是遍历所述网页中的所有网页内容,根据各网页内容分别得到的,包括网页元素内容和网页元素标识;所述网页地址为URL,所述根据所述网页地址匹配已保存的网页快照信息包括:将该URL通过URL归一化算法得到归一化URL,根据归一化URL得到对应的网页快照标识、根据所述网页快照标识得到对应的网页元素标识、根据所述网页元素标识得到对应的网页元素内容;或,所述网页地址为归一化URL,所述根据所述网页地址匹配已保存的网页快照信息包括:根据归一化URL得到对应的网页快照标识、根据所述网页快照标识得到对应的网页元素标识、根据所述网页元素标识得到对应的网页元素内容。
可选地,在根据所述网页元素标识得到对应的网页元素内容之后,该方法进一步包括:判断网页快照标识的数目是否等于1,若否则找出对应于不同网页快照标识的相应网页元素标识所对应的网页元素内容之间的区别,供浏览器侧突出显示所述网页元素内容之间的区别。
根据本发明的另一方面,提供了一种快照显示方法,包括:将与所访问的网址对应的网页地址发送给服务器,自服务器接收匹配所述网页地址的网页快照数目;判断所述网页快照数目是否为零,若是则退出流程,若否则显示该数目;在接收到使用者输入的显示快照的指令时,将包括网页地址的下载快照的请求发送给服务器,供服务器根据所述网页地址匹配已保存的网页快照信息;从服务器下载网页快照信息,根据网页快照信息生成网页快照,显示生成的网页快照。
可选地,所述网页地址为URL或归一化URL。
可选地,所述网页快照信息是由服务器将网页元素、网页快照标识、网页地址信息进行关联保存形成的;所述网页元素包括网页元素标识和网页元素内容;所述根据网页快照信息生成网页快照,包括:自服务器得到网页快照标识和对应的网页元素标识;根据网页元素标识判断是否已下载对应的网页元素内容,是则不下载对应的网页元素内容,否则从服务器下载与网页元素标识对应的网页元素内容;根据网页快照标识、网页元素标识和网页元素内容拼接得到网页快照。
可选地,所述网页快照信息,包括对应于网页快照标识的网页快照记录;所述网页快照记录包括下述的至少一种记录:快照标签、上传者信息、上传时间、被查看次数、评价信息;该方法进一步包括:显示所述网页快照记录。
可选地,该方法还包括:在接收到使用者输入的显示由特定上传者上传的网页快照的指令时,将访问由特定上传者上传的网页快照的请求发送给服务器,供服务器利用所述请求包含的上传者信息得到与上传者信息对应的网页快照信息;以及从服务器下载所述与上传者信息对应的网页快照信息,根据网页快照信息生成网页快照,显示生成的网页快照。
可选地,所述显示生成的网页快照,包括:按照快照标签、上传者信息、上传时间、被查看次数,或评价信息的取值,在一个页面上依序地显示多个生成的网页快照。
可选地,所述显示生成的网页快照,包括:在一个页面上显示一个生成的网页快照;或,在一个页面上显示多个生成的网页快照,突出显示不同网页快照中相应网页元素内容之间的区别。
根据本发明的另一方面,提供了一种服务器,其中,该服务器包括:快照元素接收单元,适于接收浏览器侧上传网页快照的请求,并为当前浏览器侧的网页地址生成一网页快照标识并发送到浏览器侧,以及接收浏览器侧依据所述网页快照标识上传的所述网页中的网页元素;快照信息保存单元,适于将所述接收到的网页元素、网页快照标识、网页地址信息进行关联保存形成所述网页的快照信息;快照信息发送单元,适于接收浏览器侧包括网页地址的下载快照的请求,根据所述网页地址匹配已保存的网页快照信息,将匹配所述网页地址的网页快照信息发送到浏览器侧。
可选地,所述快照信息保存单元,适于保存包括网页的统一资源定位符URL和由URL通过归一化算法获取的归一化URL,或由URL通过归一化算法获取的归一化URL的网页地址信息。
可选地,所述快照信息保存单元,进一步适于在保存形成所述网页的快照信息时,根据网页地址信息更新与网页地址信息对应的网页快照数目;所述快照信息发送单元包括:快照数目获取子单元,适于接收浏览器侧发送的与浏览器侧所访问的网址对应的网页地址,利用所述网页地址得到对应的网页快照数目;快照数目发送子单元,适于将所述网页快照数目发送给浏览器侧;快照数据获取子单元,适于在接收到浏览器侧发出的下载快照的请求时利用所述网页地址得到对应的网页快照标识和网页元素;快照数据发送子单元,适于将网页快照标识和网页元素发送给浏览器侧。
可选地,所述网页快照数目与归一化URL对应;若所述网页地址信息为URL,所述快照数目获取子单元,适于将该URL通过URL归一化算法得到归一化URL,以及根据归一化URL获取对应的网页快照数目,以得到与所述网址对应的网页快照数目;或,若所述网页地址信息为归一化URL,所述快照数目获取子单元,适于根据归一化URL获取对应的网页快照数目,以得到与所述网址对应的网页快照数目。
可选地,所述快照数据发送子单元,适于在将网页快照标识和网页元素发送给浏览器侧时,将用于获取网页快照信息的地址发送给浏览器侧;所述快照数据获取子单元,适于在接收浏览器发送的访问用于获取网页快照信息的地址的请求时,判断浏览器的类别是否为预定的类别,若是则所述快照数据发送子单元将网页快照标识和网页元素发送给浏览器侧,若否则退出流程。
可选地,所述快照信息保存单元保存的网页快照信息,还包括对应于网页快照标识的网页快照记录;所述网页快照记录包括下述的至少一种记录:快照标签、上传者信息、上传时间、被查看次数、评价信息。
可选地,所述快照数据获取子单元,进一步适于在接收到浏览器侧发出的访问由特定上传者上传的网页快照的请求时,利用所述请求包含的上传者信息得到对应的网页快照信息;所述快照数据发送子单元,进一步适于将所述对应的网页快照信息发送给浏览器侧。
可选地,所述网页元素是遍历所述网页中的所有网页内容,根据各网页内容分别得到的,包括网页元素内容和网页元素标识;快照信息发送单元,适于将匹配所述网页地址的网页快照信息的网页快照标识和对应于网页快照标识的网页元素标识发送到浏览器侧;以及在接收到浏览器侧发送的下载网页元素内容的请求时,将浏览器侧请求下载的网页元素内容发送给浏览器侧。
可选地,所述网页快照信息与归一化URL对应;所述网页元素是遍历所述网页中的所有网页内容,根据各网页内容分别得到的,包括网页元素内容和网页元素标识;所述网页地址信息为URL,所述快照数据获取子单元,适于将该URL通过URL归一化算法得到归一化URL,根据归一化URL得到对应的网页快照标识、根据所述网页快照标识得到对应的网页元素标识、根据所述网页元素标识得到对应网页元素内容,以得到与所述网址对应的网页快照信息;或,所述网页地址信息为归一化URL,所述快照数据获取子单元,适于根据归一化URL得到对应的网页快照标识、根据所述网页快照标识得到对应的网页元素标识、根据所述网页元素标识得到对应网页元素内容,以得到与所述网址对应的网页快照信息。
可选地,所述快照数据获取子单元,进一步适于在根据所述网页元素标识得到对应网页元素内容之后,判断网页快照标识的数目是否等于1,若否则找出对应于不同网页快照标识的相应网页元素标识所对应的网页元素内容之间的区别,供浏览器突出显示所述网页元素内容之间的区别。
根据本发明的另一方面,提供了一种浏览器,其中,该浏览器包括:数据交换单元,适于将与所访问的网址对应的网页地址发送给服务器,自服务器接收匹配所述网页地址的网页快照数目;显示单元,适于判断所述网页快照数目是否为零,若是则退出流程,若否则显示该数目;快照访问单元,适于在接收到使用者输入的显示快照的指令时,将包括网页地址的下载快照的请求发送给服务器,供服务器根据所述网页地址匹配已保存的网页快照信息;所述显示单元,进一步适于从服务器下载网页快照信息,根据网页快照信息生成网页快照,显示生成的网页快照。
可选地,所述数据交换单元,适于将URL或归一化URL作为网页地址发送给服务器。
可选地,所述网页快照信息是由服务器将网页元素、网页快照标识、网页地址信息进行关联保存形成的;所述网页元素包括网页元素标识和网页元素内容;所述显示单元,适于:自服务器得到网页快照标识和对应的网页元素标识;根据网页元素标识判断是否已下载对应的网页元素内容,是则不下载对应的网页元素内容,否则从服务器下载与网页元素标识对应的网页元素内容;根据网页快照标识、网页元素标识和网页元素内容拼接得到网页快照。
可选地,所述网页快照信息,包括对应于网页快照标识的网页快照记录;所述网页快照记录包括下述的至少一种记录:快照标签、上传者信息、上传时间、被查看次数、评价信息;所述显示单元,适于显示所述网页快照记录。
可选地,所述快照访问单元,进一步适于在接收到使用者输入的显示由特定上传者上传的网页快照的指令时,将访问由特定上传者上传的网页快照的请求发送给服务器,供服务器利用所述请求包含的上传者信息得到与上传者信息对应的网页快照信息;所述显示单元,进一步适于从服务器下载所述与上传者信息对应的网页快照信息,根据网页快照信息生成网页快照,显示生成的网页快照。
可选地,所述显示单元,适于按照快照标签、上传者信息、上传时间、被查看次数,或评价信息的取值,在一个页面上依序地显示多个生成的网页快照。
可选地,所述显示单元,适于在一个页面上显示一个生成的网页快照;或在一个页面上显示多个生成的网页快照,突出显示不同网页快照中相应网页元素内容之间的区别。
根据本发明的另一方面,提供了一种系统,包括:如上所述的服务器,以及如上所述的浏览器。
根据本发明的快照处理方法、快照显示方法、服务器、浏览器和系统,可以根据浏览器的网页地址获取对应的网页快照信息并展示给用户,解决了用户只能使用特定的工具(如搜索引擎的快照工具)获取网页快照、只能显示一个服务器提供的单一的快照,以及用户访问的网页快照可能不是完整的历史快照的问题。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的快照处理方法的流程图;
图2示出了图1之中步骤S300的详细的流程图;
图3示出了图2之中步骤S330的详细的流程图;
图4示出了图2之中步骤S340的详细的流程图;
图5示出了根据本发明一个实施例的快照显示方法的流程图;
图6示出了图5之中步骤S540的详细流程图;
图7示出了根据本发明一个实施例的快照处理方法和快照显示方法实际应用的流程图;
图8示出了根据本发明一个实施例的服务器的框图;
图9示出了图8之中快照信息发送单元的详细的框图;
图10示出了根据本发明一个实施例的浏览器的框图;
图11示出了根据本发明一个实施例的系统的框图;
图12为显示网页快照记录的示意图;
图13为在一个页面上显示一个生成的网页快照的示意图;
图14为在一个页面上显示多个生成的网页快照的示意图;以及
图15为现有的快照页面示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明的技术构思主要在于,在服务器中将网页元素、网页快照标识、网页地址信息进行关联保存,可以根据浏览器的网页地址和网页地址信息的匹配,直接得到对应的快照信息;浏览器通过将网页地址发送给服务器,可以直接得到对应的快照信息。
图1示出了根据本发明一个实施例的快照处理方法的流程图。本实施例的快照处理方法,包括以下步骤:
S100、接收浏览器侧上传网页快照的请求,并为当前浏览器侧的网页地址生成一网页快照标识并发送到浏览器侧,以及接收浏览器侧依据网页快照标识上传的所述网页中的网页元素。
本实施例中,所述网页元素是遍历所述网页中的所有网页内容,根据各网页内容分别得到的,包括网页元素内容(源代码、文本、图像、视频等)和网页元素标识(即网页元素的ID,例如,网页元素的MD5值,则内容相同的网页元素对应于相同的ID,内容不相同的网页元素对应于不相同的ID),网页元素内容和网页元素标识一一对应。本实施例中,使用者每次上传网页快照,都可以获取网页快照标识,在接收到浏览器侧上传网页快照的请求时生成的网页快照标识是唯一且不重复的。
S200、将所述接收到的网页元素、网页快照标识、网页地址信息进行关联保存形成所述网页的快照信息。
本实施例中,网页地址信息包括:网页的统一资源定位符URL和由URL通过归一化算法获取的归一化URL,或由URL通过归一化算法获取的归一化URL。网页快照信息与归一化URL对应,换言之,网页快照信息对应于唯一的归一化URL,归一化URL为使用归一化算法获取的,能够对应不同的原始URL。本实施例的归一化算法,主要是通过人工运营及通过正则表达式方式进行处理,例如,原始URL"www.163.com"和原始URL"163.com"对应于相同的归一化URL“163.com”。以网页地址信息包括URL和归一化URL为例,具体保存样式如表一所示。
表一:网页的快照信息的保存样式
Figure GDA0001384326120000071
较佳地,表一之中的“快照数据”,包括网页快照标识和网页元素,网页元素包括网页元素内容和网页元素标识。较佳地,所述网页快照元素包括网页的超文本标记语言HTML源码对应的第一元素和网页中的资源对应的至少一个第二元素,通过将第一元素中记录的第二元素的存放路径更新为该第二元素在搜索引擎服务器侧的存放路径,例如,将文本、图片或视频的存放路径修改为文本、图片或视频在服务器的存放路径。
较佳地,步骤S200在保存形成所述网页的快照信息时,根据网页地址信息更新与网页地址信息对应的网页快照数目,例如,相对于归一化URL保存一个网页快照则将网页快照数目增加1。本实施例的网页快照数目与归一化URL对应。
S300、接收浏览器侧包括网页地址的下载快照的请求,根据所述网页地址匹配已保存的网页快照信息,将匹配所述网页地址的网页快照信息发送到浏览器侧。
本实施例中,在接收浏览器侧包括网页地址的下载快照的请求时,根据网页地址匹配已保存的网页快照信息,即利用网页地址检索得到与浏览器所在网页匹配的网页快照信息,例如,浏览器正在访问"www.163.com",则可以检索得到与归一化URL“163.com”对应的网页快照信息,从而获取网页信息的历史记录。
较佳地,本实施例中的网页快照信息,还包括对应于网页快照标识的网页快照记录。网页快照记录包括下述的至少一种记录:快照标签(使用者输入或系统通过分析内容得到的标签)、上传者信息(例如上传者ID)、上传时间、被查看次数、评价信息(记录使用者的评价)。则步骤S300还包括:在接收到浏览器侧发出的访问由特定上传者上传的网页快照的请求时,利用所述请求包含的上传者信息得到对应的网页快照信息,以及将所述对应的网页快照信息发送给浏览器侧。换言之,若浏览器侧发出访问由特定上传者上传的网页快照的请求,则根据上传者信息(例如上传者ID)检索得到对应的网页快照信息并发送给浏览器侧。
较佳地,本实施例中的步骤S300,还包括:在将网页快照标识和网页元素发送给浏览器侧时,将用于获取网页快照信息的地址(例如,保存网页快照标识的地址)发送给浏览器侧。较佳地,浏览器侧可以在地址栏显示该地址。进一步地,在接收浏览器发送的访问用于获取网页快照信息的地址的请求(例如,请求访问保存网页快照标识的地址)时,判断浏览器的类别是否为预定的类别,若是则将网页快照标识和网页元素发送给浏览器侧,若否则退出流程。
图2示出了图1之中步骤S300的详细的流程图。步骤S300具体包括以下步骤:
S310、接收浏览器侧发送的与浏览器侧所访问的网址对应的网页地址,利用所述网页地址得到对应的网页快照数目。
本实施例的网页快照数目与归一化URL对应。例如,归一化URL“163.com”、“sohu.com”分别对应相应的网页快照数目。
本实施例中,接收的网页地址为URL或归一化URL,若浏览器侧对URL进行了归一化处理,则网页地址为归一化URL,否则为URL。若网页地址为URL,则利用网页地址得到对应的网页快照数目包括:将该URL通过URL归一化算法得到归一化URL,以及根据归一化URL获取对应的网页快照数目;若网页地址为归一化URL,则利用网页地址得到对应的网页快照数目包括:根据归一化URL获取对应的网页快照数目。
S320、将所述网页快照数目发送给浏览器侧。较佳地,浏览器侧能够显示网页快照数目,从而提示使用者与当前网页对应的网页快照的数目。
S330、在接收到浏览器侧发出的下载快照的请求时利用所述网页地址得到对应的网页快照标识和网页元素。较佳地,浏览器侧在接收到用户浏览快照的操作指示时,发出下载快照的请求,下载快照的请求包括网页地址(URL或归一化URL),进而利用网页地址得到对应的网页快照标识和网页元素。
S340、将网页快照标识和网页元素发送给浏览器侧。则浏览器侧能够生成网页快照,并显示生成的网页快照。
图3示出了图2之中步骤S330的详细的流程图。其中,网页快照信息与归一化URL对应,网页地址为归一化URL。步骤S330具体包括以下步骤:
S331、根据归一化URL得到对应的网页快照标识。较佳地,若网页地址为URL,则步骤S331还包括将该URL通过URL归一化算法得到归一化URL。
S332、根据所述网页快照标识得到对应的网页元素标识。
S333、根据所述网页元素标识得到对应的网页元素内容。
S334、判断网页快照标识的数目是否等于1,若否则执行步骤S335,若是则执行步骤S340。
S335、找出对应于不同网页快照标识的相应网页元素标识所对应的网页元素内容之间的区别,从而供浏览器侧突出显示(高亮显示、改变字体等)所述网页元素内容之间的区别,进而执行步骤S340。通过步骤S334和S335,得到对应同一归一化URL的网页快照的对应网页元素内容的区别,得到用户上传的网页的变化。
图4示出了图2之中步骤S340的详细的流程图。步骤S340具体包括以下步骤:
S341、将匹配所述网页地址的网页快照信息的网页快照标识和对应于网页快照标识的网页元素标识发送到浏览器侧。
S342、在接收到浏览器侧发送的下载网页元素内容的请求时,将浏览器侧请求下载的网页元素内容发送给浏览器侧。较佳地,浏览器在接收到网页元素标识后,会根据网页元素标识判断是否已经下载了网页元素内容,若是则不发送下载网页元素内容的请求,若否则发送下载网页元素内容的请求,可以避免重复下载,节省网络和存储资源,减小开销。
图5示出了根据本发明一个实施例的快照显示方法的流程图。包括以下步骤:
S510、将与所访问的网址对应的网页地址发送给服务器,自服务器接收匹配所述网页地址的网页快照数目。较佳地,网页地址为URL或归一化URL。
S520、判断所述网页快照数目是否为零,若是则退出流程,若否则显示该数目。本实施例中,若网页快照数目为零,则退出流程,若使用者指示获取当前网页对应的网络快照则通过弹出文字窗口等方式提示使用者网页快照数目为零;若网页快照数目不为零,则显示该数目,提示使用者可以查看网页快照。
S530、在接收到使用者输入的显示快照的指令时,将包括网页地址的下载快照的请求发送给服务器,供服务器根据所述网页地址匹配已保存的网页快照信息。
S540、从服务器下载网页快照信息,根据网页快照信息生成网页快照,显示生成的网页快照。
本实施例的网页快照信息,还进一步包括对应于网页快照标识的网页快照记录。网页快照记录,适于记载与快照有关的信息,包括下述的至少一种记录:快照标签、上传者信息、上传时间、被查看次数、评价信息。则步骤S540进一步包括:显示所述网页快照记录。图12为显示网页快照记录的示意图。
本实施例的方法还包括:在接收到使用者输入的显示由特定上传者上传的网页快照的指令时(例如,使用者选中上传者ID),将访问由特定上传者上传的网页快照的请求发送给服务器,供服务器利用所述请求包含的上传者信息得到与上传者信息对应的网页快照信息;以及从服务器下载所述与上传者信息对应的网页快照信息,根据网页快照信息生成网页快照,显示生成的网页快照。换言之,若发出访问由特定上传者上传的网页快照的请求,则由服务器根据上传者信息(例如上传者ID)检索得到对应的网页快照信息,进而从服务器下载所述与上传者信息对应的网页快照信息,从而显示生成的网页快照。
本实施例中,显示生成的网页快照,包括:按照快照标签、上传者信息、上传时间、被查看次数,或评价信息的取值,在一个页面上依序地显示多个生成的网页快照。图12为显示网页快照记录的示意图,由图12可知,可以按照上传时间(例如,点选“最新”标签)或评价信息(例如,点选“最赞”标签)的取值,依序地显示多个网页快照。
本实施例中,显示生成的网页快照,包括:在一个页面上显示一个生成的网页快照;或在一个页面上显示多个生成的网页快照,突出显示不同网页快照中相应网页元素内容之间的区别。图13为在一个页面上显示一个生成的网页快照的示意图。图14为在一个页面上显示多个生成的网页快照的示意图。
图6示出了图5之中步骤S540的详细流程图。本实施例的网页快照信息是由服务器将网页元素、网页快照标识、网页地址信息进行关联保存形成的,其中网页元素包括网页元素标识和网页元素内容。
步骤S540具体包括:
S541、自服务器得到网页快照标识和对应的网页元素标识。
S542、根据网页元素标识判断是否已下载对应的网页元素内容,是则不下载对应的网页元素内容,否则从服务器下载与网页元素标识对应的网页元素内容。通过步骤S542,可以避免重复下载,节省网络和存储资源,减小开销。
S543、根据网页快照标识、网页元素标识和网页元素内容拼接得到网页快照。较佳地,本实施例的网页快照元素包括网页的超文本标记语言HTML源码对应的第一元素和网页中的资源对应的至少一个第二元素,通过利用第一元素和第二元素拼接能够得到网页快照。
图7示出了根据本发明一个实施例的快照处理方法和快照显示方法的实际应用的流程图。以浏览器侧向服务器侧发送的网页地址为归一化URL为例,具体包括以下步骤:
S701、浏览器侧向服务器侧发送上传网页快照的请求。S702、服务器侧接收浏览器侧上传网页快照的请求,并为当前浏览器侧的网页地址生成一网页快照标识并发送到浏览器侧。S703、浏览器侧依据网页快照标识上传网页中的网页元素标识。S704、服务器侧根据网页元素标识判断是否已经保存相应的网页元素内容,若判断为否则向浏览器侧发送上传网页元素内容的请求。S705、浏览器侧上传网页元素内容。通过步骤S701-S705,服务器侧保存有网页快照信息。S706、浏览器侧将与浏览器侧所访问的网址对应的归一化URL发送给服务器侧。S707、服务器侧利用归一化URL得到对应的网页快照数目,将网页快照数目发送给浏览器侧。S708、若网页快照数目不为零,则在接收到使用者输入的显示快照的指令时,浏览器侧将包括归一化URL的下载快照的请求发送给服务器侧。S709、服务器侧利用归一化URL得到对应的网页快照标识和网页元素,将网页快照标识和网页元素标识发送给浏览器侧。S710、浏览器侧根据网页元素标识判断是否已下载对应的网页元素内容,若判断为否则将下载网页元素内容的请求发送给服务器侧。S711、服务器侧将网页元素内容发送给浏览器侧。
图8示出了根据本发明一个实施例的服务器的框图。本实施例的服务器包括快照元素接收单元100、快照信息保存单元200和快照信息发送单元300。
快照元素接收单元100,适于接收浏览器侧上传网页快照的请求,并为当前浏览器侧的网页地址生成一网页快照标识并发送到浏览器侧,以及接收浏览器侧依据所述网页快照标识上传的所述网页中的网页元素。
本实施例中,所述网页元素是遍历所述网页中的所有网页内容,根据各网页内容分别得到的,包括网页元素内容(源代码、文本、图像、视频等)和网页元素标识(即网页元素的ID,例如,网页元素的MD5值,则内容相同的网页元素对应于相同的ID,内容不相同的网页元素对应于不相同的ID),网页元素内容和网页元素标识一一对应。本实施例中,快照元素接收单元100每次接收浏览器侧上传网页快照的请求,都可以生成唯一且不重复的网页快照标识。
快照信息保存单元200,适于将所述接收到的网页元素、网页快照标识、网页地址信息进行关联保存形成所述网页的快照信息。
本实施例中,快照信息保存单元200,适于保存包括网页的统一资源定位符URL和由URL通过归一化算法获取的归一化URL,或由URL通过归一化算法获取的归一化URL的网页地址信息。
本实施例中,网页快照信息与归一化URL对应,换言之,网页快照信息对应于唯一的归一化URL,归一化URL为使用归一化算法获取的,能够对应不同的原始URL。本实施例的归一化算法,主要是通过人工运营及通过正则表达式方式进行处理,例如,原始URL"www.163.com"和原始URL"163.com"对应于相同的归一化URL“163.com”。以网页地址信息包括URL和归一化URL为例,具体保存样式如表一所示,此处不再赘述。
本实施例的快照信息保存单元200,进一步适于在保存形成所述网页的快照信息时,根据网页地址信息更新与网页地址信息对应的网页快照数目,例如,相对于归一化URL保存一个网页快照则将网页快照数目增加1。本实施例的网页快照数目与归一化URL对应。
快照信息发送单元300,适于接收浏览器侧包括网页地址的下载快照的请求,根据所述网页地址匹配已保存的网页快照信息,将匹配所述网页地址的网页快照信息发送到浏览器侧。
本实施例中,快照信息发送单元300,适于在接收浏览器侧包括网页地址的下载快照的请求时,根据网页地址匹配已保存的网页快照信息。即利用网页地址检索得到与浏览器所在网页匹配的网页快照信息,例如,浏览器正在访问"www.163.com",则可以检索得到与归一化URL“163.com”对应的网页快照信息,从而获取网页信息的历史记录。
本实施例中,快照信息发送单元300,适于将匹配所述网页地址的网页快照信息的网页快照标识和对应于网页快照标识的网页元素标识发送到浏览器侧(此时,浏览器侧根据网页元素标识判断是否已经下载了网页元素内容,若已经下载了例如图片或视频等网页元素内容,则不再重复请求下载);以及在接收到浏览器侧发送的下载网页元素内容的请求时,将浏览器侧请求下载的网页元素内容发送给浏览器侧。由于实际工程中,对应于同一归一化URL的多个网页快照中对应的元素内容存在较高的相似性,可以避免重复下载,降低网络和存储资源的开销。
图9示出了图8之中快照信息发送单元的详细的框图。本实施例的快照信息发送单元300包括快照数目获取子单元310、快照数目发送子单元320、快照数据获取子单元330和快照数据发送子单元340。
快照数目获取子单元310,适于接收浏览器侧发送的与浏览器侧所访问的网址对应的网页地址,利用所述网页地址得到对应的网页快照数目。
本实施例中的网页快照数目与归一化URL对应。若所述网页地址信息为URL,所述快照数目获取子单元310,适于将该URL通过URL归一化算法得到归一化URL,以及根据归一化URL获取对应的网页快照数目,以得到与所述网址对应的网页快照数目;或,若所述网页地址信息为归一化URL,所述快照数目获取子单元310,适于根据归一化URL获取对应的网页快照数目,以得到与所述网址对应的网页快照数目。
快照数目发送子单元320,适于将所述网页快照数目发送给浏览器侧。通过将网页快照数目发送给浏览器侧,则浏览器侧的使用者可以获知与当前网页匹配的网页快照的数目。
快照数据获取子单元330,适于在接收到浏览器侧发出的下载快照的请求时利用所述网页地址得到对应的网页快照标识和网页元素。
本实施例中,网页快照信息与归一化URL对应。若网页地址信息为URL,则快照数据获取子单元330,适于将该URL通过URL归一化算法得到归一化URL,根据归一化URL得到对应的网页快照标识、根据所述网页快照标识得到对应的网页元素标识、根据所述网页元素标识得到对应网页元素内容,以得到与所述网址对应的网页快照信息;若网页地址信息为归一化URL,则快照数据获取子单元330,适于根据归一化URL得到对应的网页快照标识、根据所述网页快照标识得到对应的网页元素标识、根据所述网页元素标识得到对应网页元素内容,以得到与所述网址对应的网页快照信息。
本实施例的快照数据获取子单元330,进一步适于在根据所述网页元素标识得到对应网页元素内容之后,判断网页快照标识的数目是否等于1,若否则找出对应于不同网页快照标识的相应网页元素标识所对应的网页元素内容之间的区别,供浏览器突出显示所述网页元素内容之间的区别。由此得到对应同一归一化URL的多个网页快照的对应网页元素内容的区别,以及得到用户上传的网页的变化。
快照数据发送子单元340,适于将网页快照标识和网页元素发送给浏览器侧。
进一步地,本实施例的快照数据发送子单元340,适于在将网页快照标识和网页元素发送给浏览器侧时,将用于获取网页快照信息的地址(例如,保存网页快照标识的地址)发送给浏览器侧。本实施例的快照数据获取子单元330,适于在接收浏览器发送的访问用于获取网页快照信息的地址的请求(例如,请求访问保存网页快照标识的地址)时,判断浏览器的类别是否为预定的类别,若是则所述快照数据发送子单元将网页快照标识和网页元素发送给浏览器侧,若否则退出流程。
较佳地,所述快照信息保存单元200保存的网页快照信息,还包括对应于网页快照标识的网页快照记录。网页快照记录包括下述的至少一种记录:快照标签、上传者信息、上传时间、被查看次数、评价信息。则快照数据获取子单元330,进一步适于在接收到浏览器侧发出的访问由特定上传者上传的网页快照的请求时,利用所述请求包含的上传者信息得到对应的网页快照信息。快照数据发送子单元340,进一步适于将所述对应的网页快照信息发送给浏览器侧。
本实施例中,快照数据发送子单元340,适于在将网页快照标识和网页元素发送给浏览器侧时,将用于获取网页快照信息的地址(例如,保存网页快照标识的地址)发送给浏览器侧。所述快照数据获取子单元330,适于在接收浏览器发送的访问用于获取网页快照信息的地址的请求(例如,请求访问保存网页快照标识的地址)时,判断浏览器的类别是否为预定的类别,若是则所述快照数据发送子单元340将网页快照标识和网页元素发送给浏览器侧,若否则退出流程。
图10示出了根据本发明一个实施例的浏览器的框图。本实施例的浏览器包括数据交换单元400、显示单元500和快照访问单元600。
数据交换单元400,适于将与所访问的网址对应的网页地址发送给服务器,自服务器接收匹配所述网页地址的网页快照数目。
本实施例的数据交换单元400,适于将URL或归一化URL作为网页地址发送给服务器。
显示单元500,适于判断所述网页快照数目是否为零,若是则退出流程,若否则显示该数目。
本实施例中,若网页快照数目为零,则退出流程,若使用者指示获取当前网页对应的网络快照则显示单元500通过弹出文字窗口等方式提示使用者网页快照数目为零;若网页快照数目不为零,则显示单元500显示该数目,提示使用者可以查看网页快照。
快照访问单元600,适于在接收到使用者输入的显示快照的指令时,将包括网页地址的下载快照的请求发送给服务器,供服务器根据所述网页地址匹配已保存的网页快照信息。
本实施例的网页快照信息是由服务器将网页元素、网页快照标识、网页地址信息进行关联保存形成的。网页元素包括网页元素标识和网页元素内容。
所述显示单元500,进一步适于从服务器下载网页快照信息,根据网页快照信息生成网页快照,显示生成的网页快照。
具体地,显示单元500,适于自服务器得到网页快照标识和对应的网页元素标识。根据网页元素标识判断是否已下载对应的网页元素内容,是则不下载对应的网页元素内容,否则从服务器下载与网页元素标识对应的网页元素内容。根据网页快照标识、网页元素标识和网页元素内容拼接得到网页快照。从而可以避免重复下载,节省网络和存储资源,减小开销。较佳地,本实施例的网页快照元素包括网页的超文本标记语言HTML源码对应的第一元素和网页中的资源对应的至少一个第二元素,通过利用第一元素和第二元素拼接能够得到网页快照。
较佳地,网页快照信息,还包括对应于网页快照标识的网页快照记录。网页快照记录包括下述的至少一种记录:快照标签、上传者信息、上传时间、被查看次数、评价信息。显示单元500,适于显示所述网页快照记录。
本实施例中,快照访问单元600,进一步适于在接收到使用者输入的显示由特定上传者上传的网页快照的指令(例如,使用者选中上传者ID)时,将访问由特定上传者上传的网页快照的请求发送给服务器,供服务器利用所述请求包含的上传者信息得到与上传者信息对应的网页快照信息。则显示单元500,进一步适于从服务器下载所述与上传者信息对应的网页快照信息,根据网页快照信息生成网页快照,显示生成的网页快照。换言之,若发出访问由特定上传者上传的网页快照的请求,则由服务器根据上传者信息(例如上传者ID)检索得到对应的网页快照信息,进而从服务器下载所述与上传者信息对应的网页快照信息,从而显示生成的网页快照。
本实施例的显示单元500,适于按照快照标签、上传者信息、上传时间、被查看次数,或评价信息的取值,在一个页面上依序地显示多个生成的网页快照。
本实施例的显示单元500,适于在一个页面上显示一个生成的网页快照;或在一个页面上显示多个生成的网页快照,突出显示(高亮显示,或使用不同字体字号等)不同网页快照中相应网页元素内容之间的区别。
图11示出了根据本发明一个实施例的系统的框图。包括如上所述的服务器111和浏览器112。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的服务器、浏览器和系统中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (33)

1.一种快照处理方法,包括:
接收浏览器侧上传网页快照的请求,并为当前浏览器侧的网页地址生成一网页快照标识并发送到浏览器侧,以及接收浏览器侧依据所述网页快照标识上传的所述网页中的网页元素;
将所述接收到的网页元素、网页快照标识、网页地址信息进行关联保存形成所述网页的快照信息;
接收浏览器侧包括网页地址的下载快照的请求,根据所述网页地址匹配已保存的网页快照信息,将匹配所述网页地址的网页快照信息发送到浏览器侧;
该方法还包括:
在保存形成所述网页的快照信息时,根据网页地址信息更新与网页地址信息对应的网页快照数目;
所述接收浏览器侧包括网页地址的下载快照的请求,根据所述网页地址匹配已保存的网页快照信息,将匹配所述网页地址的网页快照信息发送到浏览器侧包括:
接收浏览器侧发送的与浏览器侧所访问的网址对应的网页地址,利用所述网页地址得到对应的网页快照数目;
将所述网页快照数目发送给浏览器侧;
在接收到浏览器侧发出的下载快照的请求时利用所述网页地址得到对应的网页快照标识和网页元素;
将网页快照标识和网页元素发送给浏览器侧。
2.根据权利要求1所述的方法,其中,
所述网页地址信息包括:网页的统一资源定位符URL和由URL通过归一化算法获取的归一化URL,或由URL通过归一化算法获取的归一化URL。
3.根据权利要求1所述的方法,其中,
所述网页快照数目与归一化URL对应;
所述网页地址为URL,所述利用所述网页地址得到对应的网页快照数目包括:将该URL通过URL归一化算法得到归一化URL,以及根据归一化URL获取对应的网页快照数目;或,所述网页地址为归一化URL,所述利用所述网页地址得到对应的网页快照数目包括:根据归一化URL获取对应的网页快照数目。
4.根据权利要求1所述的方法,其中,该方法进一步包括:
在将网页快照标识和网页元素发送给浏览器侧时,将用于获取网页快照信息的地址发送给浏览器侧;
在接收浏览器发送的访问用于获取网页快照信息的地址的请求时,判断浏览器的类别是否为预定的类别,若是则将网页快照标识和网页元素发送给浏览器侧,若否则退出流程。
5.根据权利要求1所述的方法,其中,
所述网页快照信息,还包括对应于网页快照标识的网页快照记录;所述网页快照记录包括下述的至少一种记录:快照标签、上传者信息、上传时间、被查看次数、评价信息。
6.根据权利要求5所述的方法,其中,该方法还包括:
在接收到浏览器侧发出的访问由特定上传者上传的网页快照的请求时,利用所述请求包含的上传者信息得到对应的网页快照信息,以及将所述对应的网页快照信息发送给浏览器侧。
7.根据权利要求1所述的方法,其中,
所述网页元素是遍历所述网页中的所有网页内容,根据各网页内容分别得到的,包括网页元素内容和网页元素标识;
所述将匹配所述网页地址的网页快照信息发送到浏览器侧,包括:
将匹配所述网页地址的网页快照信息的网页快照标识和对应于网页快照标识的网页元素标识发送到浏览器侧;
在接收到浏览器侧发送的下载网页元素内容的请求时,将浏览器侧请求下载的网页元素内容发送给浏览器侧。
8.根据权利要求1所述的方法,其中,
所述网页快照信息与归一化URL对应;所述网页元素是遍历所述网页中的所有网页内容,根据各网页内容分别得到的,包括网页元素内容和网页元素标识;
所述网页地址为URL,所述根据所述网页地址匹配已保存的网页快照信息包括:将该URL通过URL归一化算法得到归一化URL,根据归一化URL得到对应的网页快照标识、根据所述网页快照标识得到对应的网页元素标识、根据所述网页元素标识得到对应的网页元素内容;
或,
所述网页地址为归一化URL,所述根据所述网页地址匹配已保存的网页快照信息包括:根据归一化URL得到对应的网页快照标识、根据所述网页快照标识得到对应的网页元素标识、根据所述网页元素标识得到对应的网页元素内容。
9.根据权利要求8所述的方法,其中,在根据所述网页元素标识得到对应的网页元素内容之后,该方法进一步包括:
判断网页快照标识的数目是否等于1,若否则找出对应于不同网页快照标识的相应网页元素标识所对应的网页元素内容之间的区别,供浏览器侧突出显示所述网页元素内容之间的区别。
10.一种快照显示方法,包括:
将与所访问的网址对应的网页地址发送给服务器,自服务器接收匹配所述网页地址的网页快照数目;
判断所述网页快照数目是否为零,若是则退出流程,若否则显示该数目;
在接收到使用者输入的显示快照的指令时,将包括网页地址的下载快照的请求发送给服务器,供服务器根据所述网页地址匹配已保存的网页快照信息;
从服务器下载网页快照信息,根据网页快照信息生成网页快照,显示生成的网页快照。
11.根据权利要求10所述的方法,其中,
所述网页地址为URL或归一化URL。
12.根据权利要求10所述的方法,其中,
所述网页快照信息是由服务器将网页元素、网页快照标识、网页地址信息进行关联保存形成的;所述网页元素包括网页元素标识和网页元素内容;
所述从服务器下载网页快照信息,根据网页快照信息生成网页快照,包括:
自服务器得到网页快照标识和对应的网页元素标识;
根据网页元素标识判断是否已下载对应的网页元素内容,是则不下载对应的网页元素内容,否则从服务器下载与网页元素标识对应的网页元素内容;
根据网页快照标识、网页元素标识和网页元素内容拼接得到网页快照。
13.根据权利要求10-12任一权利要求所述的方法,其中,
所述网页快照信息,包括对应于网页快照标识的网页快照记录;所述网页快照记录包括下述的至少一种记录:快照标签、上传者信息、上传时间、被查看次数、评价信息;
该方法进一步包括:显示所述网页快照记录。
14.根据权利要求13所述的方法,其中,该方法还包括:
在接收到使用者输入的显示由特定上传者上传的网页快照的指令时,将访问由特定上传者上传的网页快照的请求发送给服务器,供服务器利用所述请求包含的上传者信息得到与上传者信息对应的网页快照信息;以及从服务器下载所述与上传者信息对应的网页快照信息,根据网页快照信息生成网页快照,显示生成的网页快照。
15.根据权利要求13所述的方法,其中,所述显示生成的网页快照,包括:
按照快照标签、上传者信息、上传时间、被查看次数,或评价信息的取值,在一个页面上依序地显示多个生成的网页快照。
16.根据权利要求10所述的方法,其中,所述显示生成的网页快照,包括:
在一个页面上显示一个生成的网页快照;或
在一个页面上显示多个生成的网页快照,突出显示不同网页快照中相应网页元素内容之间的区别。
17.一种服务器,其中,该服务器包括:
快照元素接收单元,适于接收浏览器侧上传网页快照的请求,并为当前浏览器侧的网页地址生成一网页快照标识并发送到浏览器侧,以及接收浏览器侧依据所述网页快照标识上传的所述网页中的网页元素;
快照信息保存单元,适于将所述接收到的网页元素、网页快照标识、网页地址信息进行关联保存形成所述网页的快照信息;
快照信息发送单元,适于接收浏览器侧包括网页地址的下载快照的请求,根据所述网页地址匹配已保存的网页快照信息,将匹配所述网页地址的网页快照信息发送到浏览器侧;
所述快照信息保存单元,进一步适于在保存形成所述网页的快照信息时,根据网页地址信息更新与网页地址信息对应的网页快照数目;
所述快照信息发送单元包括:
快照数目获取子单元,适于接收浏览器侧发送的与浏览器侧所访问的网址对应的网页地址,利用所述网页地址得到对应的网页快照数目;
快照数目发送子单元,适于将所述网页快照数目发送给浏览器侧;
快照数据获取子单元,适于在接收到浏览器侧发出的下载快照的请求时利用所述网页地址得到对应的网页快照标识和网页元素;
快照数据发送子单元,适于将网页快照标识和网页元素发送给浏览器侧。
18.根据权利要求17所述的服务器,其中,
所述快照信息保存单元,适于保存包括网页的统一资源定位符URL和由URL通过归一化算法获取的归一化URL,或由URL通过归一化算法获取的归一化URL的网页地址信息。
19.根据权利要求17所述的服务器,其中,
所述网页快照数目与归一化URL对应;
若所述网页地址信息为URL,所述快照数目获取子单元,适于将该URL通过URL归一化算法得到归一化URL,以及根据归一化URL获取对应的网页快照数目,以得到与所述网址对应的网页快照数目;或,若所述网页地址信息为归一化URL,所述快照数目获取子单元,适于根据归一化URL获取对应的网页快照数目,以得到与所述网址对应的网页快照数目。
20.根据权利要求17所述的服务器,其中,
所述快照数据发送子单元,适于在将网页快照标识和网页元素发送给浏览器侧时,将用于获取网页快照信息的地址发送给浏览器侧;
所述快照数据获取子单元,适于在接收浏览器发送的访问用于获取网页快照信息的地址的请求时,判断浏览器的类别是否为预定的类别,若是则所述快照数据发送子单元将网页快照标识和网页元素发送给浏览器侧,若否则退出流程。
21.根据权利要求17所述的服务器,其中,
所述快照信息保存单元保存的网页快照信息,还包括对应于网页快照标识的网页快照记录;所述网页快照记录包括下述的至少一种记录:快照标签、上传者信息、上传时间、被查看次数、评价信息。
22.根据权利要求21所述的服务器,其中,
所述快照数据获取子单元,进一步适于在接收到浏览器侧发出的访问由特定上传者上传的网页快照的请求时,利用所述请求包含的上传者信息得到对应的网页快照信息;
所述快照数据发送子单元,进一步适于将所述对应的网页快照信息发送给浏览器侧。
23.根据权利要求19所述的服务器,其中,
所述网页元素是遍历所述网页中的所有网页内容,根据各网页内容分别得到的,包括网页元素内容和网页元素标识;
快照信息发送单元,适于将匹配所述网页地址的网页快照信息的网页快照标识和对应于网页快照标识的网页元素标识发送到浏览器侧;以及在接收到浏览器侧发送的下载网页元素内容的请求时,将浏览器侧请求下载的网页元素内容发送给浏览器侧。
24.根据权利要求19所述的服务器,其中,
所述网页快照信息与归一化URL对应;所述网页元素是遍历所述网页中的所有网页内容,根据各网页内容分别得到的,包括网页元素内容和网页元素标识;
所述网页地址信息为URL,所述快照数据获取子单元,适于将该URL通过URL归一化算法得到归一化URL,根据归一化URL得到对应的网页快照标识、根据所述网页快照标识得到对应的网页元素标识、根据所述网页元素标识得到对应网页元素内容,以得到与所述网址对应的网页快照信息;
或,
所述网页地址信息为归一化URL,所述快照数据获取子单元,适于根据归一化URL得到对应的网页快照标识、根据所述网页快照标识得到对应的网页元素标识、根据所述网页元素标识得到对应网页元素内容,以得到与所述网址对应的网页快照信息。
25.根据权利要求24所述的服务器,其中,
所述快照数据获取子单元,进一步适于在根据所述网页元素标识得到对应网页元素内容之后,判断网页快照标识的数目是否等于1,若否则找出对应于不同网页快照标识的相应网页元素标识所对应的网页元素内容之间的区别,供浏览器突出显示所述网页元素内容之间的区别。
26.一种浏览器,其中,该浏览器包括:
数据交换单元,适于将与所访问的网址对应的网页地址发送给服务器,自服务器接收匹配所述网页地址的网页快照数目;
显示单元,适于判断所述网页快照数目是否为零,若是则退出流程,若否则显示该数目;
快照访问单元,适于在接收到使用者输入的显示快照的指令时,将包括网页地址的下载快照的请求发送给服务器,供服务器根据所述网页地址匹配已保存的网页快照信息;
所述显示单元,进一步适于从服务器下载网页快照信息,根据网页快照信息生成网页快照,显示生成的网页快照。
27.根据权利要求26所述的浏览器,其中,
所述数据交换单元,适于将URL或归一化URL作为网页地址发送给服务器。
28.根据权利要求26所述的浏览器,其中,
所述网页快照信息是由服务器将网页元素、网页快照标识、网页地址信息进行关联保存形成的;所述网页元素包括网页元素标识和网页元素内容;
所述显示单元,适于:
自服务器得到网页快照标识和对应的网页元素标识;
根据网页元素标识判断是否已下载对应的网页元素内容,是则不下载对应的网页元素内容,否则从服务器下载与网页元素标识对应的网页元素内容;
根据网页快照标识、网页元素标识和网页元素内容拼接得到网页快照。
29.根据权利要求26-28任一权利要求所述的浏览器,其中,
所述网页快照信息,包括对应于网页快照标识的网页快照记录;所述网页快照记录包括下述的至少一种记录:快照标签、上传者信息、上传时间、被查看次数、评价信息;
所述显示单元,适于显示所述网页快照记录。
30.根据权利要求29所述的浏览器,其中,
所述快照访问单元,进一步适于在接收到使用者输入的显示由特定上传者上传的网页快照的指令时,将访问由特定上传者上传的网页快照的请求发送给服务器,供服务器利用所述请求包含的上传者信息得到与上传者信息对应的网页快照信息;
所述显示单元,进一步适于从服务器下载所述与上传者信息对应的网页快照信息,根据网页快照信息生成网页快照,显示生成的网页快照。
31.根据权利要求29所述的浏览器,其中,
所述显示单元,适于按照快照标签、上传者信息、上传时间、被查看次数,或评价信息的取值,在一个页面上依序地显示多个生成的网页快照。
32.根据权利要求26所述的浏览器,其中,
所述显示单元,适于在一个页面上显示一个生成的网页快照;或在一个页面上显示多个生成的网页快照,突出显示不同网页快照中相应网页元素内容之间的区别。
33.一种系统,包括:
如权利要求17-25任一权利要求所述的服务器,以及
如权利要求26-32任一权利要求所述的浏览器。
CN201710084437.1A 2013-11-08 2013-11-08 快照处理方法、快照显示方法、服务器、浏览器和系统 Active CN106991117B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710084437.1A CN106991117B (zh) 2013-11-08 2013-11-08 快照处理方法、快照显示方法、服务器、浏览器和系统

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201310553072.4A CN103744852B (zh) 2013-11-08 2013-11-08 快照处理方法、快照显示方法、服务器、浏览器和系统
CN201710084437.1A CN106991117B (zh) 2013-11-08 2013-11-08 快照处理方法、快照显示方法、服务器、浏览器和系统

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201310553072.4A Division CN103744852B (zh) 2013-11-08 2013-11-08 快照处理方法、快照显示方法、服务器、浏览器和系统

Publications (2)

Publication Number Publication Date
CN106991117A CN106991117A (zh) 2017-07-28
CN106991117B true CN106991117B (zh) 2020-08-14

Family

ID=50501870

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201710084437.1A Active CN106991117B (zh) 2013-11-08 2013-11-08 快照处理方法、快照显示方法、服务器、浏览器和系统
CN201310553072.4A Active CN103744852B (zh) 2013-11-08 2013-11-08 快照处理方法、快照显示方法、服务器、浏览器和系统

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201310553072.4A Active CN103744852B (zh) 2013-11-08 2013-11-08 快照处理方法、快照显示方法、服务器、浏览器和系统

Country Status (1)

Country Link
CN (2) CN106991117B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106796604B (zh) 2014-11-05 2020-07-07 华为技术有限公司 用于提供交互式报表的方法和报表服务器
CN105930528B (zh) * 2016-06-03 2020-09-08 腾讯科技(深圳)有限公司 一种网页缓存的方法及服务器
CN111552879B (zh) * 2020-04-29 2023-10-03 百度在线网络技术(北京)有限公司 数据处理的方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101676907A (zh) * 2008-09-16 2010-03-24 北京雷速科技有限公司 一种互联网资源定向获取方法及系统
CN102915363A (zh) * 2012-10-18 2013-02-06 北京奇虎科技有限公司 网址收藏方法和系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7917483B2 (en) * 2003-04-24 2011-03-29 Affini, Inc. Search engine and method with improved relevancy, scope, and timeliness
JP2007052766A (ja) * 2005-07-22 2007-03-01 Mathematical Systems Inc パスウェイ表示方法、情報処理装置及びパスウェイ表示プログラム
US20120311419A1 (en) * 2010-09-07 2012-12-06 Sk Planet Co., Ltd. System for displaying cached webpages, a server therefor, a terminal therefor, a method therefor and a computer-readable recording medium on which the method is recorded
CN102937981A (zh) * 2012-10-18 2013-02-20 北京奇虎科技有限公司 网页呈现系统和方法
CN102902816B (zh) * 2012-10-23 2016-07-06 北京奇虎科技有限公司 搜索结果显示方法、系统及客户端

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101676907A (zh) * 2008-09-16 2010-03-24 北京雷速科技有限公司 一种互联网资源定向获取方法及系统
CN102915363A (zh) * 2012-10-18 2013-02-06 北京奇虎科技有限公司 网址收藏方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《搜索引擎网页快照的实现与安全》;孙静等;《信息科技》;20070630(第11期);138-141 *

Also Published As

Publication number Publication date
CN103744852B (zh) 2017-03-15
CN103744852A (zh) 2014-04-23
CN106991117A (zh) 2017-07-28

Similar Documents

Publication Publication Date Title
US8370358B2 (en) Tagging content with metadata pre-filtered by context
US8413042B2 (en) Referrer-based website personalization
JP5721818B2 (ja) 検索におけるモデル情報群の使用
US10423673B2 (en) Image, audio, and metadata inputs for domain name suggestions
US20140149845A1 (en) Method for generating websites
EP3311309A1 (en) Methods and systems for object recognition
US20150006333A1 (en) Generating websites and online stores from seed input
JP2014519072A (ja) 分散されたブックマークの管理および格納
US20140149240A1 (en) Method for collecting point-of-sale data
US20150007022A1 (en) Generating websites and business documents from seed input
US20140149846A1 (en) Method for collecting offline data
US11561988B2 (en) Systems and methods for harvesting data associated with fraudulent content in a networked environment
EP2611114B1 (en) Image, audio, and metadata inputs for name suggestion
US8244719B2 (en) Computer method and apparatus providing social preview in tag selection
US20150058712A1 (en) Method for assisting website design using keywords
CN113220657B (zh) 数据处理方法、装置及计算机设备
KR20180126589A (ko) 정보 검색 방법 및 장치
CN110968765B (zh) 书籍搜索方法、计算设备及计算机存储介质
US9390446B2 (en) Consumer centric online product research
CN106991117B (zh) 快照处理方法、快照显示方法、服务器、浏览器和系统
KR102091225B1 (ko) 자동화된 정보 검색
CN112269906A (zh) 网页正文的自动抽取方法及装置
US20080114786A1 (en) Breaking documents
JP2008204198A (ja) 情報提供システム、及び、情報提供プログラム
JP5407874B2 (ja) ブログ投稿画像コミュニケーションシステム、ブログ投稿画像コミュニケーション方法、サーバ、プログラム、記憶媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant