CN104156397A - 一种用于收藏页面的方法与设备 - Google Patents

一种用于收藏页面的方法与设备 Download PDF

Info

Publication number
CN104156397A
CN104156397A CN201410340027.5A CN201410340027A CN104156397A CN 104156397 A CN104156397 A CN 104156397A CN 201410340027 A CN201410340027 A CN 201410340027A CN 104156397 A CN104156397 A CN 104156397A
Authority
CN
China
Prior art keywords
collection
page
target pages
content information
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410340027.5A
Other languages
English (en)
Inventor
李彬孟
丁文斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201410340027.5A priority Critical patent/CN104156397A/zh
Publication of CN104156397A publication Critical patent/CN104156397A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9562Bookmark management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明的目的是提供一种收藏页面的方法与设备。具体地,网络设备端接收对应用户设备发送的用户基于收藏应用发起的关于目标页面的收藏请求,其中,收藏请求包括目标页面的当前页面内容信息及用户在收藏应用中的标识信息;根据当前页面内容信息,确定目标页面所对应的收藏内容信息;根据收藏内容信息,建立或更新与标识信息相对应的页面收藏数据库,以收藏目标页面。与现有技术相比,本发明的一个实施例实现了收藏内容与用户所见相一致,即确保了用户所见即所得,提升了用户的收藏体验,且网络设备端不需要额外的渲染引擎以进行页面的解析,从而不但节省了网络设备端的成本,还避免了网络设备端对目标页面造成的额外抓取压力,减少了带宽消耗。

Description

一种用于收藏页面的方法与设备
技术领域
本发明涉及互联网技术领域,尤其涉及一种用于收藏页面的技术。
背景技术
随着互联网技术的飞速发展,越来越多的人们喜欢通过网络获取信息(如通过浏览器浏览网页)以用于学习和工作。而用户在网页浏览过程中,希望保存内容对其有用的网页,或者,保存其喜欢和常用的网页。浏览器提供的收藏夹功能使得用户通过对页面链接的收藏而实现对页面的收藏,满足了用户对网页收藏的基本需求。但是,页面链接对应的网址不具有稳定性,可能会失效,而页面内容也可能会更新,因此,现有的对页面链接进行收藏而实现对页面收藏的方法既无法实现长久地保存页面内容,也不能保证收藏页面的内容即是用户所见的内容,降低了收藏效果,影响了用户的收藏体验。
发明内容
本发明的一个目的是提供一种用于收藏页面的方法与设备。
根据本发明的一个方面,提供了一种在网络设备端用于收藏页面的方法,其中,该方法包括:
接收对应用户设备发送的用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息;
根据所述当前页面内容信息,确定所述目标页面所对应的收藏内容信息;
根据所述收藏内容信息,建立或更新与所述标识信息相对应的页面收藏数据库,以收藏所述目标页面。
根据本发明的另一方面,还提供了一种在用户设备端用于收藏页面的方法,其中,该方法包括:
向对应的网络设备发送用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息。
根据本发明的一个方面,还提供了一种用于收藏页面的网络设备,其中,该网络设备包括:
用于接收对应用户设备发送的用户基于收藏应用发起的关于目标页面的收藏请求的装置,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息;
用于根据所述当前页面内容信息,确定所述目标页面所对应的收藏内容信息的装置;
用于根据所述收藏内容信息,建立或更新与所述标识信息相对应的页面收藏数据库的装置,以收藏所述目标页面。
根据本发明的另一个方面,还提供了一种用于收藏页面的用户设备,其中,该用户设备包括:
用于向对应的网络设备发送用户基于收藏应用发起的关于目标页面的收藏请求的装置,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息。
根据本发明的再一个方面,还提供了一种用于收藏页面的系统,其中,该系统包括如前述根据本发明一个方面的用于收藏页面的网络设备,以及根据本发明另一个方面的用于收藏页面的用户设备。
与现有技术相比,本发明的一个实施例中网络设备端通过接收对应用户设备发送的用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息,以根据所述当前页面内容信息,确定所述目标页面所对应的收藏内容信息,进而根据所述收藏内容信息,建立或更新与所述标识信息相对应的页面收藏数据库,以收藏所述目标页面,实现了收藏内容与用户所见相一致,即确保了用户所见即所得,提升了用户的收藏体验,且网络设备端不需要额外的渲染引擎以进行页面的解析,从而不但节省了网络设备端的成本,还避免了网络设备端对目标页面造成的额外抓取压力,减少了带宽消耗。若当前页面内容信息中包含预定指示内容连接的标识信息,本发明的另一个实施例还可基于所述当前页面内容信息中包含的预定指示内容连接的标识信息,确定所述目标页面所对应的完整页面内容信息,以根据所述完整页面内容信息,确定所述收藏内容信息,实现了对由多页面组成一个完整内容的网页的收藏,从而使得用户可实现一键收藏,无论用户在多个页面中的哪一页,本发明均可提取完整的页面内容,不需要用户分别在每一页上进行收藏操作,进一步提高了用户体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的一种用于收藏页面的网络设备和用户设备的设备示意图;
图2(a)至图2(d)示出本发明一个实施例的确定目标页面的完整页面内容信息的过程示意图;
图3示出根据本发明一个优选实施例的一种用于收藏页面的网络设备和用户设备的设备示意图;
图4示出根据本发明一个实施例的收藏内容信息中示出用户选择的目标对象的收藏结果示意图;
图5示出根据本发明另一个方面的网络设备和用户设备配合实现一种用于收藏页面方法流程图;
图6示出根据本发明一个优选实施例的网络设备和用户设备配合实现一种用于收藏页面的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的一种用于收藏页面的网络设备1和用户设备2的设备示意图,其中,网络设备1包括用于接收对应用户设备发送的用户基于收藏应用发起的关于目标页面的收藏请求的装置(以下简称“请求接收装置11”),其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息;用于根据所述当前页面内容信息,确定所述目标页面所对应的收藏内容信息的装置(以下简称“确定装置12”);用于根据所述收藏内容信息,建立或更新与所述标识信息相对应的页面收藏数据库的装置(以下简称“建立装置13”),以收藏所述目标页面,用户设备2包括用于向对应的网络设备发送用户基于收藏应用发起的关于目标页面的收藏请求的装置(以下简称“请求发送装置21”),其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息。具体地,用户设备2的请求发送装置21向对应的网络设备1发送用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息;相应地,网络设备1的请求接收装置11接收对应用户设备2发送的用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息;确定装置12根据所述当前页面内容信息,确定所述目标页面所对应的收藏内容信息;建立装置13根据所述收藏内容信息,建立或更新与所述标识信息相对应的页面收藏数据库,以收藏所述目标页面。
在此,网络设备1包括用于从网络接收用户设备发送的用户基于收藏应用发起的关于目标页面的收藏请求,并响应于该收藏请求对目标页面进行收藏的服务器,除此之外,网络设备1还可收藏用户通过对应客户端记录的以文字、拍照、录音等一种或多种方式支持的任意格式的内容进行收藏,网络设备1包括但不限于收藏服务器,其可由网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现,在此,云由基于云计算(Cloud Computing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。在具体实施例中,网络设备1可以是浏览器中的具有收藏功能的插件所对应的服务器端,或者,也可以是自身具有收藏功能的浏览器对应的服务器端,或者,还可以是应用于移动设备中的第三方应用程序如收藏app所对应的服务器端。
在此,用户设备2可以是任何一种可与用户通过键盘、鼠标、触摸板、触摸屏、或手写设备等方式进行人机交互的电子产品,例如手机、PDA、智能手机、PC或平板电脑等。
在此,本领域技术人员应能理解上述网络设备1和用户设备2仅为举例,其他现有的或今后可能出现的网络设备或用户设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,网络设备及用户设备均包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。
具体地,用户设备2的请求发送装置21向对应的网络设备1发送用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息。在此,所述收藏应用是指对应于能够收藏用户所收藏内容的服务器端的客户端程序,如浏览器中的具有收藏功能的插件、自身具有收藏功能的浏览器、应用于移动设备中的第三方应用程序如收藏app等,用户通过收藏应用可查看、搜索、分类管理、同步对应服务器端所收藏的内容(如用户收藏的页面内容,用户记录的以文字、拍照、录音等一种或多种记录方式支持的任意格式的内容)。在此,所述收藏应用可由一系列按照特定顺序组织的计算机数据和指令的集合实现。在此,所述用户在所述收藏应用中的标识信息包括但不限于:1)所述用户在收藏应用中的原始的帐号信息;2)经过一定转换处理(例如用于保护用户个人隐私)的标识信息。在此,所述目标页面的当前页面内容信息包括以下任一项:1)用户当前正在浏览的浏览器已加载完成的整个页面的页面内容信息;2)浏览器对从网页服务器获取的页面html源码进行渲染以解析嵌入在页面html源码中的对象如css、js等而得到的进一步的html文本。用户基于收藏应用发起的关于目标页面的收藏请求是指通过收藏应用发起的收藏请求,如i)在收藏应用的用户界面上点击收藏按钮,从而发起收藏请求,ii)在收藏应用的用户界面上设置收藏信息(如修改默认的收藏文件夹、修改默认的收藏标题等)之后,点击收藏应用的用户界面上的保存按钮,从而发起收藏请求。在此,本领域技术人员应能理解上述通过收藏应用发起收藏请求的方式仅为举例,其他现有的或今后可能出现的通过收藏应用发起收藏请求的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
例如,假设用户A在其手机mobile phone上通过浏览器browser1访问当前网址为URL1的网页web1的过程中,发现该页面中介绍的《SIP协议解析与实现》的页面内容对其很有用,希望将其保存,用户A点击了浏览器browser1安装的收藏插件如collection-plugin1(对应于收藏应用),并通过帐号abc123登录该收藏插件collection-plugin1,然后,点击了该收藏插件collection-plugin1所提供的收藏按钮,如保存、收藏等,则该收藏插件collection-plugin1的请求发送装置21可通过调用浏览器browser1自身所提供的已加载完成的整个页面的页面内容信息的应用程序接口(API),获取到网页web1的当前页面内容信息,即当前web1加载完成后呈现给用户的页面内容信息,并基于用户A登录该收藏插件collection-plugin1的输入的帐号信息abc123,获取到用户A在该收藏插件collection-plugin1中的标识信息;然后,请求发送装置21通过诸如http、https等约定的通信方式,向收藏插件collection-plugin1对应的服务器端(对应于网络设备1)发送用户A基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息,即向网络设备1发送用户A基于收藏插件collection-plugin1发起的关于网页web1的收藏请求,其中,该收藏请求中包括网页web1的当前页面内容信息及用户A在收藏插件collection-plugin1中的帐号abc123。
优选地,请求发送装置21还可首先通过ASP、JSP等动态页面技术,或者,通过调用收藏应用自身提供的应用程序接口(API),获取用户通过其用户设备中打开/安装的收藏应用对目标页面执行的收藏操作;然后,根据所述收藏操作,获取所述目标页面的当前页面内容信息,如通过收藏应用调用浏览器所提供的已加载完成页面的页面内容信息的应用程序接口(API),获取所述目标页面的当前页面内容信息;接着,向对应的网络设备发送关于所述目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息。在此,所述收藏操作包括但不限于如点击、选择、添加等操作。
例如,接上例,当用户A在其手机mobile phone上通过浏览器browser1访问当前网址为URL1的网页web1的过程中,点击了浏览器browser1安装的收藏插件如collection-plugin1(对应于收藏应用)之后,并通过帐号abc123登录该收藏插件collection-plugin1,则收藏插件collection-plugin1的请求发送装置21可首先通过ASP、JSP等动态页面技术,或者,通过调用收藏应用自身提供的应用程序接口(API),便可获取到用户A基于收藏插件collection-plugin1对网页web1执行的点击收藏操作;然后,请求发送装置21可通过调用浏览器browser1所提供的已加载完成页面的页面内容信息的应用程序接口(API),获取到网页web1的当前页面内容信息;接着,请求发送装置21通过诸如http、https等约定的通信方式,向收藏插件collection-plugin1对应的服务器端(对应于网络设备1)发送用户A基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息,即向网络设备1发送用户A基于收藏插件collection-plugin1发起的关于网页web1的收藏请求,其中,该收藏请求中包括网页web1的当前页面内容信息及用户A在收藏插件collection-plugin1中的帐号abc123。
本领域技术人员应当理解,在具体实施例中,请求发送装置21在获取用户在收藏应用中标识信息与目标页面的当前页面内容信息时,可以是串行的,也可以是并行的。
优选地,当收藏应用为收藏app时,若用户在基于该收藏app发起关于目标页面的收藏请求之前,已在用户设备2中开启并登录该收藏app,则当用户基于该收藏app对目标页面执行收藏操作时,请求发送装置21可首先获取所述目标页面的当前页面内容信息,然后,直接向对应的网络设备1发送关于所述目标页面的收藏请求,这样,实现了避免用户重复登录收藏应用的操作的有益效果。
本领域技术人员应能理解上述获取所述当前页面内容信息和用户在收藏应用中的标识信息的方式仅为举例,其他现有的或今后可能出现的获取所述当前页面内容信息或用户在收藏应用中的标识信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在此,本发明通过收藏应用客户端向网络设备发送目标页面的当前页面内容信息,具有以下有益效果:1)通过借助浏览器的渲染功能,将解析完成后的页面内容直接提交给网络设备端,使得网络设备端不需要额外的渲染引擎以进行页面的解析,从而不但节省了网络设备端的成本,还避免了网络设备端对目标页面造成的额外抓取压力,减少了带宽消耗;2)本发明收藏应用客户端端直接提交目标页面的当前页面渲染结果,不仅可以确保用户所见即所得,避免了网络设备端重新抓取页面时因页面变化等因素导致页面内容信息和用户访问时有差别的缺陷,还可以使得网络设备端不需要接收用户第三方的cookie,避免了用户隐私方面的顾虑。
相应地,网络设备1的请求接收装置11通过诸如http、https等约定的通信方式,接收对应用户设备2发送的用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息。
接着,确定装置12根据所述当前页面内容信息,确定所述目标页面所对应的收藏内容信息,如从所述当前页面内容信息中提取所述目标页面所对应的页面主体内容信息,以将所述页面主体内容信息作为所述收藏内容信息。在此,确定装置12提取所述页面主体内容信息的方式包括但不限于以下至少任一项:
1)通过预定的页面类型与其对应的页面主体元素之间的映射关系,从网页web1的当前页面内容信息中,提取与页面主体元素相对应的页面内容,从而获得对应的页面主体内容信息。
在此,所述页面类型包括但不限于以下至少任一项:a)新闻类型页面;b)问答类型页面;c)阅读类型页面;d)论坛类型页面。其中,新闻类型页面对应的页面主体元素包括但不限于如:新闻标题、新闻正文、新闻来源、发布时间等。问答类型页面对应的页面主体元素包括但不限于如该页面的不同内容的页面分块如首页、广场/热门问答、广场/最新问题、发现浏览等。阅读类型页面所对应的页面主体元素包括但不限于如文章标题、文章正文等。论坛类型页面对应的页面主体元素包括但不限于如:1)论坛首页:论坛名称、版块区名称、板块标题、今日帖子数、登录、注册、搜索;2)论坛列表页:板块名称、子版块标题、主题名称、板块主题/回复数、主题分类、主题标题、作者/时间;3)论坛帖子页:帖子作者、发帖时间、帖子正文、楼层编号、翻页链接。
例如,假设网络设备1的请求获取装置11获取到用户设备2发送的用户A基于收藏插件collection-plugin1发起的关于目标页面的收藏请求,其中,所述收藏请求关于网页web1的收藏请求,其中,该收藏请求中包括网页web1的当前页面内容信息及用户A在收藏插件collection-plugin1中的帐号abc123,网页web1的页面类型为阅读类型页面,则确定装置12根据预定的阅读类型页面与其对应的页面主体元素之间的映射关系,确定该类型页面的页面主体元素包括文章标题、文章正文等;然后,确定装置12从网页web1的当前页面内容信息中提取与文章标题、文章正文等页面主体元素相对应的页面内容,如得到文章标题为《SIP协议解析与实现》、文章正文如body of the article1为:
“本文将按照RFC3261逐步的介绍SIP协议,介绍了c和c++语言的实现,分析了osip库的使用和实现。
第一章概述
SIP协议是一个基于应用层的会话控制协议。它可以创建、修改、终止多媒体会话(会议),也可以邀请参与者加入到一个现有的会话。
……
SIP是一个与HTTP协议很像的,请求/应答式的事务模型。每一个事务最少由一个要完成特定方法或功能的请求,和服务器端的一个应答组成。在这个例子中,这个事务从Alice的软电话发送一个INVITE请求到Bob的SIP URI开始。INVITE是一个SIP消息,它表示请求者Alice想与Bob通话。INVITE请求包含一些头域。头域被称为属性,可以提供关于这个消息的额外信息…
…,如果Bob不希望接听电话,或者他现在正忙(接听其它电话),那么他会发送一个错误应答而不是200(OK)应答。一个错误应答将不会建立会话。”
则确定装置12将上述文章标题《SIP协议解析与实现》和文章正文如bodyof the article1作为网页web1对应的页面主体内容信息。
2)通过现有的页面主体识别技术如HTML标签分析、,将所述当前页面内容信息中的标题、正文等内容抽取出来,从而得到所述目标页面所对应的页面主体内容信息。
例如,接上例,则确定装置12首先滤除页面web1中的广告链接、导航条、外链接等实现对页面web1的当前页面内容进行去噪,然后,基于浏览器对从网页服务器获取的页面html源码进行渲染以解析嵌入在页面html源码中的对象如css、js等而得到的进一步的html文本,然后根据该html文本中的标题标签<h1>、文档主体标签<body>、段落标签<p>得到对应的文本内容,从而将网页web1中的标题、正文等内容抽取出来,得到网页web1所对应的页面主体内容信息。
本领域技术人员应能理解上述从所述当前页面内容信息中提取所述目标页面所对应的页面主体内容信息的方式仅为举例,其他现有的或今后可能出现的从所述当前页面内容信息中提取所述目标页面所对应的页面主体内容信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
然后,确定装置12将获得的网页web1的所述页面主体内容信息作为所述收藏内容信息,即将文章标题《SIP协议解析与实现》和文章正文如body of the article1作为网页web1所对应的收藏内容信息。
在此,本发明通过将页面主体内容信息的提取放到网络设备端,使得可以仅借助于网络设备端就能够长期持续优化页面主体内容信息提取等相关算法,提高了页面主体内容信息识别的准确率;同时不需要去升级客户端(如浏览器收藏插件客户端、收藏app客户端),避免了对用户造成干扰。
建立装置13根据所述收藏内容信息,建立或更新与所述标识信息相对应的页面收藏数据库,以收藏所述目标页面。例如,对于目标页面web1,确定装置12确定其文章标题《SIP协议解析与实现》和文章正文如body of the article1作为网页web1对应的页面主体内容信息,并将该页面主体内容信息作为网页web1所对应的收藏内容信息,则建立装置13可建立与用户A的标识信息即用户A在收藏插件collection-plugin1中的帐号abc123相对应的页面收藏数据库如webcollection database1,即该页面收藏数据库web collection database1也被用户A在收藏插件collection-plugin1中的帐号abc123标识,实现了对网页web1的收藏。
网络设备1和用户设备2的各装置之间是持续不断工作的。具体地,用户设备2的请求发送装置21持续向对应的网络设备1发送用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息;相应地,网络设备1的请求接收装置11持续接收对应用户设备2发送的用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息;确定装置12持续根据所述当前页面内容信息,确定所述目标页面所对应的收藏内容信息;建立装置13持续根据所述收藏内容信息,建立或更新与所述标识信息相对应的页面收藏数据库,以收藏所述目标页面。在此,本领域技术人员应能理解“持续”是用户设备2和网络设备1的各装置之间分别不断地进行收藏请求的发送与接收、收藏内容信息的确定、页面收藏数据库,直至用户设备2在较长时间内停止发送所述收藏请求。
优选地,确定装置12包括若所述当前页面内容信息中包含预定指示内容连接的标识信息,用于基于所述当前页面内容信息中包含的预定指示内容连接的标识信息,确定所述目标页面所对应的完整页面内容信息的单元(以下简称“第一确定单元”,未示出),以及用于根据所述完整页面内容信息,确定所述收藏内容信息的单元(以下简称“第二确定单元”,未示出)。
具体地,若所述当前页面内容信息中包含预定指示内容连接的标识信息,第一确定单元基于所述当前页面内容信息中包含的预定指示内容连接的标识信息,确定所述目标页面所对应的完整页面内容信息。在此,所述预定指示内容连接的标识信息是指页面内容中标识了该页面内容是较长的页面内容中的一部分的信息,其包括但不限于如上一页/下一页、前一页/后一页、连接顺序标识如[2][3][4][5]等。
例如,假设请求接收装置11接收到用户设备2发送的用户A基于收藏应用如收藏插件collection-plugin1发起的关于目标页面web2(网址为URL2,其页面内容如图2(a)所示)的收藏请求,其中,该收藏请求包括页面URL2的当前页面内容信息及用户A在收藏插件collection-plugin1中的帐号abc123,页面URL2的当前页面内容信息属于浅谈翻页控件在手机端的应用[1],该当前页面内容信息中包含预定指示内容连接的标识信息如“下一页 浅谈翻页控件在手机端的应用[2]”,则第一确定单元可首先提取如图2(a)所示的当前页面内容信息中的页面主体内容,如通过去除页面中的广告链接、导航条、外链接等,来得到对应的页面主体内容body of the article21;然后,第一确定单元可基于页面URL2的当前页面内容信息中的预定指示内容连接的标识信息“下一页 浅谈翻页控件在手机端的应用[2]”,提取该内容连接所对应的页面如URL3(如图2(b)所示)的页面主体内容如body of the article22,而页面URL3的当前页面内容信息中包含预定指示内容连接的标识信息如“上一页 浅谈翻页控件在手机端的应用[1]下一页 浅谈翻页控件在手机端的应用[3]”,同样地,第一确定单元可基于页面URL3的当前页面内容信息中的预定指示内容连接的标识信息“下一页 浅谈翻页控件在手机端的应用[3]”,提取该内容连接所对应的页面如URL4(如图2(c)所示)的页面主体内容如body of the article23,以此类推,直至所述内容连接所对应的页面中不包含指示“下一页”预定指示内容连接的标识信息时,第一确定单元停止提取所述内容连接所对应的页面的页面主体内容,因页面URL4中不包含指示“下一页”预定指示内容连接的标识信息,至此,第一确定单元分别得到了页面URL2、URL3、URL4的页面主体内容信息;然后,第一确定单元按各页面对应的所述预定指示内容连接的标识信息为顺序,将各页面所对应的页面主体信息进行合并,得到目标页面web2所对应的完整页面内容信息,因页面URL2对应于下一页 浅谈翻页控件在手机端的应用[1]、页面URL3对应于下一页 浅谈翻页控件在手机端的应用[2]、页面URL4对应于下一页 浅谈翻页控件在手机端的应用[3],则第一确定单元以此为顺序,将页面URL3的页面主体内容如body of the article22合并在页面URL2的页面主体内容body of the article21之后,将页面URL4的页面主体内容body of the article23合并在页面URL3的页面主体内容如bodyof the article22之后,得到合并后的页面主体内容,如图2(d)所示,并将其作为目标页面web2所对应的完整页面内容信息。在此,合并页面URL2、URL3和URL4各自的页面主体内容时,可进行重新排版。
优选地,若所述当前页面内容信息中包含预定指示内容连接的标识信息,第一确定单元首先基于所述当前页面内容信息中包含的预定指示内容连接的标识信息,以及该内容连接所对应的页面中包含的预定指示内容连接的标识信息,递归确定该目标页面所对应的多个内容连接部分,其中,所述多个内容连接部分均包含所述预定指示内容连接的标识信息所对应的连接内容;然后,将所述多个内容连接部分以对应的所述预定指示内容连接的标识信息为顺序进行合并,以获得所述完整页面内容信息。
例如,接上例,请求接收装置11接收到用户设备2发送的用户A基于收藏应用如收藏插件collection-plugin1发起的关于目标页面web2(网址为URL2,其页面内容如图2(a)所示)的收藏请求,其中,该收藏请求包括页面URL2的当前页面内容信息及用户A在收藏插件collection-plugin1中的帐号abc123,页面URL2的当前页面内容信息属于浅谈翻页控件在手机端的应用[1],该当前页面内容信息中包含预定指示内容连接的标识信息如“下一页 浅谈翻页控件在手机端的应用[2]”,则第一确定单元可基于页面URL2的当前页面内容信息中的预定指示内容连接的标识信息“下一页 浅谈翻页控件在手机端的应用[2]”,得到该内容连接所对应的页面如URL3(如图2(b)所示),而页面URL3的当前页面内容信息中包含预定指示内容连接的标识信息如“上一页 浅谈翻页控件在手机端的应用[1]下一页 浅谈翻页控件在手机端的应用[3]”,同样地,第一确定单元可基于页面URL3的当前页面内容信息中的预定指示内容连接的标识信息“下一页 浅谈翻页控件在手机端的应用[3]”,得到该内容连接所对应的页面如URL4(如图2(c)所示),以此类推,直至所述内容连接所对应的页面中不包含指示“下一页”预定指示内容连接的标识信息时,第一确定单元停止提取所述内容连接所对应的页面的当前页面内容信息,因页面URL4中不包含指示“下一页”预定指示内容连接的标识信息,至此,第一确定单元分别得到了页面URL2、URL3、URL4的当前页面内容信息,即得到了页面URL2的多个内容连接部分;然后,第一确定单元按各页面对应的所述预定指示内容连接的标识信息为顺序,将各页面所对应的当前页面内容信息进行合并,得到目标页面web2所对应的完整页面内容信息,因页面URL2对应于浅谈翻页控件在手机端的应用[1]、页面URL3对应于浅谈翻页控件在手机端的应用[2]、页面URL4对应于浅谈翻页控件在手机端的应用[3],则第一确定单元以此为顺序,将页面URL3的当前页面内容信息合并在页面URL2的当前页面内容信息之后,将页面URL4的当前页面内容信息合并在页面URL3的当前页面内容信息之后,得到合并后的当前页面内容信息,并将其作为目标页面web2所对应的完整页面内容信息。
在此,本领域技术人员应能理解,当目标页面中包含预定指示内容连接的标识信息表明该目标页面的页面内容是较长页面内容中的中间内容部分时(也就是说,既不是较长页面内容中的第一部分,也不是最后一部分),则第一确定单元可基于目标页面的当前页面内容信息中包含的预定指示内容连接的标识信息,以及该内容连接所对应的页面中包含的预定指示内容连接的标识信息,分别向前和向后递归,得到前几部分和后几部分的页面内容,例如,假设对应目标页面web3,其属于由5个页面内容部分([1]至[5])组成的较长页面内容中的部分[3],则第一确定单元可向前递归得到部分[1]和[2]的页面内容,向后递归得到部分[4]和[5]的页面内容,然后,将这5部分内容按照对应的标识次序(即按照[1]至[5]的次序)进行合并,即可得到所述完整的页面内容信息。
本领域技术人员应能理解上述确定所述完整页面内容信息的方式仅为举例,其他现有的或今后可能出现的确定所述完整页面内容信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
然后,第二确定单元根据所述完整页面内容信息,确定所述收藏内容信息,如将所述完整内容信息作为所述收藏内容信息,或者,对所述完整内容信息进行页面去噪处理,以提取所述完整内容信息所对应的页面主体内容信息,将提取得到的页面主体内容信息作为所述收藏内容信息。在此,第二确定单元提取所述完整页面内容信息的页面主体内容的方式与确定装置12提取页面主体内容信息的方式相同或相似,为简明起见,故在此不再赘述,并以引用的方式包含与此。
在此,本发明实现由多页面组成一个完整内容的网页的收藏,从而使得用户可实现一键收藏,无论用户在多个页面中的哪一页,本发明均可提取完整的页面内容,不需要用户分别在每一页上进行收藏操作,进一步提高了用户体验。
图3示出根据本发明一个优选实施例的一种用于收藏页面的网络设备1和用户设备2的设备示意图,其中,网络设备1包括用于接收对应用户设备发送的用户基于收藏应用发起的关于目标页面的收藏请求的装置(以下简称“请求接收装置11’”),其中,所述收藏请求包括所述目标页面的当前页面内容信息、所述用户在所述目标页面中选择的目标对象及所述用户在所述收藏应用中的标识信息;用于根据所述当前页面内容信息及所述目标对象,确定所述收藏内容信息的装置(以下简称“确定装置12’”);用于根据所述收藏内容信息,建立或更新与所述标识信息相对应的页面收藏数据库的装置(以下简称“建立装置13’”),以收藏所述目标页面,用户设备2包括用于获取所述用户对所述目标页面中目标对象的选择操作的装置(以下简称“选择获取装置22’”)、用于向对应的网络设备发送用户基于收藏应用发起的关于目标页面的收藏请求的装置(以下简称“请求发送装置21’”),其中,所述收藏请求包括所述目标页面的当前页面内容信息、所述目标对象及所述用户在所述收藏应用中的标识信息。具体地,用户设备2的选择获取装置22’获取所述用户对所述目标页面中目标对象的选择操作;请求发送装置21’向对应的网络设备1发送用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息、所述目标对象及所述用户在所述收藏应用中的标识信息;相应地,网络设备1的请求接收装置11’接收对应用户设备发送的用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息、所述用户在所述目标页面中选择的目标对象及所述用户在所述收藏应用中的标识信息;确定装置12’根据所述当前页面内容信息及所述目标对象,确定所述收藏内容信息;建立装置13’根据所述收藏内容信息,建立或更新与所述标识信息相对应的页面收藏数据库,以收藏所述目标页面。在此,网络设备1的建立装置13’与图1实施例中网络设备1的建立装置13的内容相同或基本相同,为简明起见,故在此不再赘述,并以引用的方式包含与此。
具体地,用户设备2的选择获取装置22’通过JSP、ASP等动态网页技术,或通过调用浏览器提供的应用程序接口(API),获取所述用户对所述目标页面中目标对象的选择操作。在此,所述目标对象是指所述目标页面的部分语句/段落/图片等。在此,所述选择操作包括但不限于如涂抹、选中操作(如画圈,鼠标选中,以预定符号[]等前后标记选中的起始位置)等。
例如,假设对于目标页面web1,在用户A基于收藏应用如收藏插件collection-plugin1对该目标页面web1执行了收藏操作并通过帐号abc123登录了该收藏插件collection-plugin1,根据收藏插件collection-plugin1提供的是否要选择指定目标对象的操作按钮,用户A利用灰色涂抹了该页面的当前页面内容信息中的部分语句如sentence1:
“SIP是一个与HTTP协议很像的,请求/应答式的事务模型。每一个事务最少由一个要完成特定方法或功能的请求,和服务器端的一个应答组成。…INVITE是一个SIP消息,它表示请求者Alice想与Bob通话。INVITE请求包含一些头域。头域被称为属性,可以提供关于这个消息的额外信息”以进行着重标记;或者,在用户A浏览目标页面web1的过程中,认为对以上部分语句sentence1对其很有用,需要重点标记,便对以上部分语句进行了涂抹操作,或者选中可以上部分语句sentence1,然后,基于收藏应用如收藏插件collection-plugin1对该目标页面web1执行了收藏操作并通过帐号abc123登录了该收藏插件collection-plugin1,则收藏插件collection-plugin1的选择获取装置22’通过JSP、ASP等动态网页技术,或通过调用浏览器提供的应用程序接口(API),便获取到用户A对目标页面web1中以上部分语句的选择操作,如对以上部分语句的涂抹操作。
然后,请求发送装置21’基于所述选择操作,通过调用浏览器自身所提供应用程序接口(API),获取到所述目标页面的当前页面内容信息及所述选择操作所对应的目标对象;接着,向对应的网络设备1发送用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息、所述目标对象及所述用户在所述收藏应用中的标识信息。
例如,接上例,则请求发送装置21’基于所述选择操作,通过调用浏览器browser1自身所提供应用程序接口(API),获取到网页web1的当前页面内容信息及所述选择操作所对应的目标对象,即获取到当前页面web1加载完成后呈现给用户的页面内容信息,以及用户A在网页web1中涂抹的以上部分语句sentence1,并且,可基于用户A登录该收藏插件collection-plugin1的输入的帐号信息abc123,获取到用户A在该收藏插件collection-plugin1中的标识信息;然后,通过诸如http、https等约定的通信方式,向对应的网络设备1发送用户A基于收藏应用发起的关于目标页面的收藏请求,其中,该收藏请求包括页面web1的当前页面内容信息、所述目标对象即用户A涂抹的以上部分语句sentence1,及用户A在收藏插件collection-plugin1中的帐号信息abc123。
相应地,网络设备1的请求接收装置11’通过诸如http、https等约定的通信方式,接收对应用户设备发送的用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息、所述用户在所述目标页面中选择的目标对象及所述用户在所述收藏应用中的标识信息。
确定装置12’根据所述当前页面内容信息及所述目标对象,确定所述收藏内容信息。在此,确定装置12’确定所述收藏内容信息的方式包括但不限于以下至少任一项:
1)首先在所述当前页面内容信息中标识出所述目标对象,如按照用户在目标页面中涂抹所述目标对象的方式(如颜色、涂抹样式等),标识出所述目标对象;然后从标识了目标对象的所述当前页面内容信息中提取对应的页面主体内容信息,并将其作为所述收藏内容信息。
例如,假设网络设备1的请求接收装置11’接收到对应用户设备2发送的用户A基于收藏插件collection-plugin1发起的页面web1的收藏请求,其中,该收藏请求包括页面web1的当前页面内容信息、所述目标对象即用户A涂抹的以上部分语句sentence1,及用户A在收藏插件collection-plugin1中的帐号信息abc123,因用户A用灰色对页面web1的当前页面内容信息中的以上部分语句sentence1进行了涂抹,则确定装置12’可首先在所述当前页面内容信息中用灰色涂抹的方式标识出以上部分语句sentence1;然后,从标识了目标对象的所述当前页面内容信息中提取对应的页面主体内容信息,并将其作为所述收藏内容信息,如得到如图4所示的收藏内容信息。在此,确定装置12’提取所述页面主体内容信息的方式与图1中确定装置12提取页面主体内容信息的方式相同或相似,为简明起见,故在此不再赘述,并以引用的方式包含与此。
2)首先从所述当前页面内容信息中提取对应的页面主体内容信息;然后,将所述目标对象在所述页面主体内容信息中标识出来,如按照用户在目标页面中涂抹所述目标对象的方式(如颜色、涂抹样式等),标识出所述目标对象,并将标识了所述目标对象的所述页面主体内容信息作为所述收藏内容信息。
例如,接上例,则确定装置12’首先从页面web1的当前页面内容信息中提取对应的页面主体内容信息;然后,在所述页面主体内容信息中用灰色涂抹的方式标识出以上部分语句sentence1,并将标识了所述目标对象的所述页面主体内容信息作为所述收藏内容信息,如得到如图4所示的收藏内容信息。在此,确定装置12’提取所述页面主体内容信息的方式与图1中确定装置12提取页面主体内容信息的方式相同或相似,为简明起见,故在此不再赘述,并以引用的方式包含与此。
在此,本发明得到的收藏内容信息中显示出用户在目标页面中选择的目标对象,使得用户以后查看所收藏该页面信息时,可以清楚地看到自己着重标记的部分,从而更进一步提升用户的收藏体验。
本领域技术人员应能理解上述根据所述当前页面内容信息及所述目标对象确定所述收藏内容信息的方式仅为举例,其他现有的或今后可能出现的根据所述当前页面内容信息及所述目标对象确定所述收藏内容信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
图5示出根据本发明另一个方面的网络设备和用户设备配合实现一种用于收藏页面方法流程图。
其中,该方法包括步骤S1、步骤S2和步骤S3。具体地,在步骤S1中,用户设备2向对应的网络设备1发送用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息;相应地,网络设备1接收对应用户设备2发送的用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息;在步骤S2中,网络设备1根据所述当前页面内容信息,确定所述目标页面所对应的收藏内容信息;在步骤S3中,网络设备1根据所述收藏内容信息,建立或更新与所述标识信息相对应的页面收藏数据库,以收藏所述目标页面。
在此,网络设备1包括用于从网络接收用户设备发送的用户基于收藏应用发起的关于目标页面的收藏请求,并响应于该收藏请求对目标页面进行收藏的某种类型计算机的程序,除此之外,网络设备1还可收藏用户通过对应客户端记录的以文字、拍照、录音等一种或多种记录方式支持的任意格式的内容进行收藏,网络设备1包括但不限于收藏服务器,其可由网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现,在此,云由基于云计算(CloudComputing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。在具体实施例中,网络设备1可以是浏览器中的具有收藏功能的插件所对应的服务器端,或者,也可以是自身具有收藏功能的浏览器对应的服务器端,或者,还可以是应用于移动设备中的第三方应用程序如收藏app所对应的服务器端。
在此,用户设备2可以是任何一种可与用户通过键盘、鼠标、触摸板、触摸屏、或手写设备等方式进行人机交互的电子产品,例如手机、PDA、智能手机、PC或平板电脑等。
在此,本领域技术人员应能理解上述网络设备1和用户设备2仅为举例,其他现有的或今后可能出现的网络设备或用户设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,网络设备及用户设备均包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。
具体地,在步骤S1中,用户设备2向对应的网络设备1发送用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息。在此,所述收藏应用是指对应于能够收藏用户所收藏内容的服务器端的客户端程序,如浏览器中的具有收藏功能的插件、自身具有收藏功能的浏览器、应用于移动设备中的第三方应用程序如收藏app等,用户通过收藏应用可查看、搜索、分类管理、同步对应服务器端所收藏的内容(如用户收藏的页面内容,用户记录的以文字、拍照、录音等一种或多种记录方式支持的任意格式的内容)。在此,所述收藏应用可由一系列按照特定顺序组织的计算机数据和指令的集合实现。在此,所述用户在所述收藏应用中的标识信息包括但不限于:1)所述用户在收藏应用中的原始的帐号信息;2)经过一定转换处理(例如用于保护用户个人隐私)的标识信息。在此,所述目标页面的当前页面内容信息包括以下任一项:1)用户当前正在浏览的浏览器已加载完成的整个页面的页面内容信息;2)浏览器对从网页服务器获取的页面html源码进行渲染以解析嵌入在页面html源码中的对象如css、js等而得到的进一步的html文本。用户基于收藏应用发起的关于目标页面的收藏请求是指通过收藏应用发起的收藏请求,如i)在收藏应用的用户界面上点击收藏按钮,从而发起收藏请求,ii)在收藏应用的用户界面上设置收藏信息(如修改默认的收藏文件夹、修改默认的收藏标题等)之后,点击收藏应用的用户界面上的保存按钮,从而发起收藏请求。在此,本领域技术人员应能理解上述通过收藏应用发起收藏请求的方式仅为举例,其他现有的或今后可能出现的通过收藏应用发起收藏请求的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
例如,假设用户A在其手机mobile phone上通过浏览器browser1访问当前网址为URL1的网页web1的过程中,发现该页面中介绍的《SIP协议解析与实现》的页面内容对其很有用,希望将其保存,用户A点击了浏览器browser1安装的收藏插件如collection-plugin1(对应于收藏应用),并通过帐号abc123登录该收藏插件collection-plugin1,然后,点击了该收藏插件collection-plugin1所提供的收藏按钮,如保存、收藏等,则在步骤S1中,用户设备2可通过调用浏览器browser1所提供的已加载完成的整个页面的页面内容信息的应用程序接口(API),获取到网页web1的当前页面内容信息,即当前web1加载完成后呈现给用户的页面内容信息,并基于用户A登录该收藏插件collection-plugin1的输入的帐号信息abc123,获取到用户A在该收藏插件collection-plugin1中的标识信息;然后,在步骤S1中,用户设备2通过诸如http、https等约定的通信方式,向收藏插件collection-plugin1对应的服务器端(对应于网络设备1)发送用户A基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息,即向网络设备1发送用户A基于收藏插件collection-plugin1发起的关于网页web1的收藏请求,其中,该收藏请求中包括网页web1的当前页面内容信息及用户A在收藏插件collection-plugin1中的帐号abc123。
优选地,在步骤S1中,用户设备2还可首先通过ASP、JSP等动态页面技术,或者,通过调用收藏应用自身提供的应用程序接口(API),获取用户通过其用户设备上打开/安装的收藏应用对目标页面执行的收藏操作;然后,根据所述收藏操作,获取所述目标页面的当前页面内容信息,如通过收藏插件调用浏览器自身所提供的已加载完成页面的页面内容信息的应用程序接口(API),获取所述目标页面的当前页面内容信息;接着,向对应的网络设备发送关于所述目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息。在此,所述收藏操作包括但不限于如点击、选择、添加等操作。
例如,接上例,当用户A在其手机mobile phone上通过浏览器browser1访问当前网址为URL1的网页web1的过程中,点击了浏览器browser1安装的收藏插件如collection-plugin1(对应于收藏应用)之后,并通过帐号abc123登录该收藏插件collection-plugin1,则在步骤S1中,用户设备2可首先通过ASP、JSP等动态页面技术,或者,通过调用收藏插件如collection-plugin1自身提供的应用程序接口(API),获取到用户A基于收藏插件如collection-plugin1对网页web1执行的点击收藏操作;然后,在步骤S1中,用户设备2可通过调用浏览器browser1所提供的已加载完成页面的页面内容信息的应用程序接口(API),获取到网页web1的当前页面内容信息;接着,在步骤S1中,用户设备2通过诸如http、https等约定的通信方式,向收藏插件collection-plugin1对应的服务器端(对应于网络设备1)发送用户A基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息,即向网络设备1发送用户A基于收藏插件collection-plugin1发起的关于网页web1的收藏请求,其中,该收藏请求中包括网页web1的当前页面内容信息及用户A在收藏插件collection-plugin1中的帐号abc123。
本领域技术人员应当理解,在具体实施例中,在步骤S1中,用户设备2在获取用户在收藏应用中标识信息与目标页面的当前页面内容信息时,可以是串行的,也可以是并行的。
优选地,当收藏应用为收藏app时,若用户在基于该收藏app发起关于目标页面的收藏请求之前,已在用户设备2中开启并登录该收藏app,则当用户基于该收藏app对目标页面执行收藏操作时,在步骤S1中,用户设备2可首先获取所述目标页面的当前页面内容信息,然后,直接向对应的网络设备1发送关于所述目标页面的收藏请求,这样,实现了避免用户重复登录收藏应用的操作的有益效果。
本领域技术人员应能理解上述获取所述当前页面内容信息和用户在收藏应用中的标识信息的方式仅为举例,其他现有的或今后可能出现的获取所述当前页面内容信息或用户在收藏应用中的标识信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在此,本发明中通过收藏应用客户端向网络设备发送目标页面的当前页面内容信息,具有以下有益效果:1)通过借助浏览器的渲染功能,将解析完成后的页面内容直接提交给网络设备端,使得网络设备端不需要额外的渲染引擎以进行页面的解析,从而不但节省了网络设备端的成本,还避免了网络设备端对目标页面造成的额外抓取压力,减少了带宽消耗;2)本发明收藏应用客户端端直接提交目标页面的当前页面渲染结果,不仅可以确保用户所见即所得,避免了网络设备端重新抓取页面时因页面变化等因素导致页面内容信息和用户访问时有差别的缺陷,还可以使得网络设备端不需要接收用户第三方的cookie,避免了用户隐私方面的顾虑。
相应地,网络设备1通过诸如http、https等约定的通信方式,接收对应用户设备2发送的用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息。
接着,在步骤S2中,网络设备1根据所述当前页面内容信息,确定所述目标页面所对应的收藏内容信息,如从所述当前页面内容信息中提取所述目标页面所对应的页面主体内容信息,以将所述页面主体内容信息作为所述收藏内容信息。在此,在步骤S2中,网络设备1提取所述页面主体内容信息的方式包括但不限于以下至少任一项:
1)通过预定的页面类型与其对应的页面主体元素之间的映射关系,从网页web1的当前页面内容信息中,提取与页面主体元素相对应的页面内容,从而获得对应的页面主体内容信息。
在此,所述页面类型包括但不限于以下至少任一项:a)新闻类型页面;b)问答类型页面;c)阅读类型页面;d)论坛类型页面。其中,新闻类型页面对应的页面主体元素包括但不限于如:新闻标题、新闻正文、新闻来源、发布时间等。问答类型页面对应的页面主体元素包括但不限于如该页面的不同内容的页面分块如首页、广场/热门问答、广场/最新问题、发现浏览等。阅读类型页面所对应的页面主体元素包括但不限于如文章标题、文章正文等。论坛类型页面对应的页面主体元素包括但不限于如:1)论坛首页:论坛名称、版块区名称、板块标题、今日帖子数、登录、注册、搜索;2)论坛列表页:板块名称、子版块标题、主题名称、板块主题/回复数、主题分类、主题标题、作者/时间;3)论坛帖子页:帖子作者、发帖时间、帖子正文、楼层编号、翻页链接。
例如,假设网络设备1在步骤S1中获取到用户设备2发送的用户A基于收藏插件collection-plugin1发起的关于目标页面的收藏请求,其中,所述收藏请求关于网页web1的收藏请求,其中,该收藏请求中包括网页web1的当前页面内容信息及用户A在收藏插件collection-plugin1中的帐号abc123,网页web1的页面类型为阅读类型页面,则在步骤S2中,网络设备1根据预定的阅读类型页面与其对应的页面主体元素之间的映射关系,确定该类型页面的页面主体元素包括文章标题、文章正文等;然后,在步骤S2中,网络设备1从网页web1的当前页面内容信息中提取与文章标题、文章正文等页面主体元素相对应的页面内容,如得到文章标题为《SIP协议解析与实现》、文章正文如body of the article1为:
“本文将按照RFC3261逐步的介绍SIP协议,介绍了c和c++语言的实现,分析了osip库的使用和实现。
第一章概述
SIP协议是一个基于应用层的会话控制协议。它可以创建、修改、终止多媒体会话(会议),也可以邀请参与者加入到一个现有的会话。
……
SIP是一个与HTTP协议很像的,请求/应答式的事务模型。每一个事务最少由一个要完成特定方法或功能的请求,和服务器端的一个应答组成。在这个例子中,这个事务从Alice的软电话发送一个INVITE请求到Bob的SIP URI开始。INVITE是一个SIP消息,它表示请求者Alice想与Bob通话。INVITE请求包含一些头域。头域被称为属性,可以提供关于这个消息的额外信息…
…,如果Bob不希望接听电话,或者他现在正忙(接听其它电话),那么他会发送一个错误应答而不是200(OK)应答。一个错误应答将不会建立会话。”
则在步骤S2中,网络设备1将上述文章标题《SIP协议解析与实现》和文章正文如body of the article1作为网页web1对应的页面主体内容信息。
2)通过现有的页面主体识别技术如HTML标签分析,将所述当前页面内容信息中的标题、正文等内容抽取出来,从而得到所述目标页面所对应的页面主体内容信息。
例如,接上例,则在步骤S2中,网络设备1首先滤除页面web1中的广告链接、导航条、外链接等实现对页面web1的当前页面内容进行去噪,然后,基于浏览器对从网页服务器获取的页面html源码进行渲染以解析嵌入在页面html源码中的对象如css、js等而得到的进一步的html文本,然后根据该html文本中的标题标签<h1>、文档主体标签<body>、段落标签<p>得到对应的文本内容,从而将网页web1中的标题、正文等内容抽取出来,得到网页web1所对应的页面主体内容信息。
本领域技术人员应能理解上述从所述当前页面内容信息中提取所述目标页面所对应的页面主体内容信息的方式仅为举例,其他现有的或今后可能出现的从所述当前页面内容信息中提取所述目标页面所对应的页面主体内容信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
然后,在步骤S2中,网络设备1将获得的网页web1的所述页面主体内容信息作为所述收藏内容信息,即将文章标题《SIP协议解析与实现》和文章正文如body of the article1作为网页web1所对应的收藏内容信息。
在此,本发明通过将页面主体内容信息的提取放到网络设备端,使得可以仅借助于网络设备端就能够长期持续优化页面主体内容信息提取等相关算法,提高了页面主体内容信息识别的准确率;同时不需要去升级客户端(如浏览器收藏插件客户端、收藏app客户端),避免了对用户造成干扰。
在步骤S3中,网络设备1根据所述收藏内容信息,建立或更新与所述标识信息相对应的页面收藏数据库,以收藏所述目标页面。例如,对于目标页面web1,在步骤S2中,网络设备1确定其文章标题《SIP协议解析与实现》和文章正文如body of the article1作为网页web1对应的页面主体内容信息,并将该页面主体内容信息作为网页web1所对应的收藏内容信息,则在步骤S3中,网络设备1可建立与用户A的标识信息即用户A在收藏插件collection-plugin1中的帐号abc123相对应的页面收藏数据库如web collection database1,即该页面收藏数据库web collection database1也被用户A在收藏插件collection-plugin1中的帐号abc123标识,实现了对网页web1的收藏。
网络设备1和用户设备2的各步骤之间是持续不断工作的。具体地,在步骤S1中,用户设备2持续向对应的网络设备1发送用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息;相应地,网络设备1持续接收对应用户设备2发送的用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息;在步骤S2中,网络设备1持续根据所述当前页面内容信息,确定所述目标页面所对应的收藏内容信息;在步骤S3中,网络设备1持续根据所述收藏内容信息,建立或更新与所述标识信息相对应的页面收藏数据库,以收藏所述目标页面。在此,本领域技术人员应能理解“持续”是用户设备2和网络设备1的各步骤之间分别不断地进行收藏请求的发送与接收、收藏内容信息的确定、页面收藏数据库,直至用户设备2在较长时间内停止发送所述收藏请求。
优选地,步骤S2包括步骤S21(未示出)和步骤S22(未示出)。具体地,若所述当前页面内容信息中包含预定指示内容连接的标识信息,在步骤S21中,网络设备2基于所述当前页面内容信息中包含的预定指示内容连接的标识信息,确定所述目标页面所对应的完整页面内容信息;在步骤S22中,网络设备2根据所述完整页面内容信息,确定所述收藏内容信息。
具体地,若所述当前页面内容信息中包含预定指示内容连接的标识信息,在步骤S21中,网络设备1基于所述当前页面内容信息中包含的预定指示内容连接的标识信息,确定所述目标页面所对应的完整页面内容信息。在此,所述预定指示内容连接的标识信息是指页面内容中标识了该页面内容是较长的页面内容中的一部分的信息,其包括但不限于如上一页/下一页、前一页/后一页、连接顺序标识如[2][3][4][5]等。
例如,假设在步骤S1中,网络设备1接收到用户设备2发送的用户A基于收藏应用如收藏插件collection-plugin1发起的关于目标页面web2(网址为URL2,其页面内容如图2(a)所示)的收藏请求,其中,该收藏请求包括页面URL2的当前页面内容信息及用户A在收藏插件collection-plugin1中的帐号abc123,页面URL2的当前页面内容信息属于浅谈翻页控件在手机端的应用[1],该当前页面内容信息中包含预定指示内容连接的标识信息如“下一页 浅谈翻页控件在手机端的应用[2]”,则在步骤S21中,网络设备1可首先提取如图2(a)所示的当前页面内容信息中的页面主体内容,如通过去除页面中的广告链接、导航条、外链接等,来得到对应的页面主体内容body of the article21;然后,在步骤S21中,网络设备1可基于页面URL2的当前页面内容信息中的预定指示内容连接的标识信息“下一页 浅谈翻页控件在手机端的应用[2]”,提取该内容连接所对应的页面如URL3(如图2(b)所示)的页面主体内容如bodyof the article22,而页面URL3的当前页面内容信息中包含预定指示内容连接的标识信息如“上一页 浅谈翻页控件在手机端的应用[1] 下一页 浅谈翻页控件在手机端的应用[3]”,同样地,在步骤S21中,网络设备1可基于页面URL3的当前页面内容信息中的预定指示内容连接的标识信息“下一页 浅谈翻页控件在手机端的应用[3]”,提取该内容连接所对应的页面如URL4(如图2(c)所示)的页面主体内容如body of the article23,以此类推,直至所述内容连接所对应的页面中不包含指示“下一页”预定指示内容连接的标识信息时,在步骤S21中,网络设备1停止提取所述内容连接所对应的页面的页面主体内容,因页面URL4中不包含指示“下一页”预定指示内容连接的标识信息,至此,在步骤S21中,网络设备1分别得到了页面URL2、URL3、URL4的页面主体内容信息;然后,在步骤S21中,网络设备1按各页面对应的所述预定指示内容连接的标识信息为顺序,将各页面所对应的页面主体信息进行合并,得到目标页面web2所对应的完整页面内容信息,因页面URL2对应于浅谈翻页控件在手机端的应用[1]、页面URL3对应于浅谈翻页控件在手机端的应用[2]、页面URL4对应于浅谈翻页控件在手机端的应用[3],则在步骤S21中,网络设备1以此为顺序,将页面URL3的页面主体内容如body of the article22合并在页面URL2的页面主体内容body ofthe article21之后,将页面URL4的页面主体内容body of the article23合并在页面URL3的页面主体内容如body of the article22之后,得到合并后的页面主体内容,如图2(d)所示,并将其作为目标页面web2所对应的完整页面内容信息。在此,合并页面URL2、URL3和URL4各自的页面主体内容时,可进行重新排版。
优选地,若所述当前页面内容信息中包含预定指示内容连接的标识信息,在步骤S21中,网络设备1首先基于所述当前页面内容信息中包含的预定指示内容连接的标识信息,以及该内容连接所对应的页面中包含的预定指示内容连接的标识信息,递归确定该目标页面所对应的多个内容连接部分,其中,所述多个内容连接部分均包含所述预定指示内容连接的标识信息所对应的连接内容;然后,将所述多个内容连接部分以对应的所述预定指示内容连接的标识信息为顺序进行合并,以获得所述完整页面内容信息。
例如,接上例,在步骤S1中,网络设备1接收到用户设备2发送的用户A基于收藏应用如收藏插件collection-plugin1发起的关于目标页面web2(网址为URL2,其页面内容如图2(a)所示)的收藏请求,其中,该收藏请求包括页面URL2的当前页面内容信息及用户A在收藏插件collection-plugin1中的帐号abc123,页面URL2的当前页面内容信息属于浅谈翻页控件在手机端的应用[1],该当前页面内容信息中包含预定指示内容连接的标识信息如“下一页 浅谈翻页控件在手机端的应用[2]”,则在步骤S21中,网络设备1可基于页面URL2的当前页面内容信息中的预定指示内容连接的标识信息“下一页 浅谈翻页控件在手机端的应用[2]”,得到该内容连接所对应的页面如URL3(如图2(b)所示),而页面URL3的当前页面内容信息中包含预定指示内容连接的标识信息如“上一页 浅谈翻页控件在手机端的应用[1]下一页 浅谈翻页控件在手机端的应用[3]”,同样地,在步骤S21中,网络设备1可基于页面URL3的当前页面内容信息中的预定指示内容连接的标识信息“下一页 浅谈翻页控件在手机端的应用[3]”,得到该内容连接所对应的页面如URL4(如图2(c)所示),以此类推,直至所述内容连接所对应的页面中不包含指示“下一页”预定指示内容连接的标识信息时,在步骤S21中,网络设备1停止提取所述内容连接所对应的页面的当前页面内容信息,因页面URL4中不包含指示“下一页”预定指示内容连接的标识信息,至此,在步骤S21中,网络设备1分别得到了页面URL2、URL3、URL4的当前页面内容信息,即得到了页面URL2的多个内容连接部分;然后,在步骤S21中,网络设备1按各页面对应的所述预定指示内容连接的标识信息为顺序,将各页面所对应的当前页面内容信息进行合并,得到目标页面web2所对应的完整页面内容信息,因页面URL2对应于浅谈翻页控件在手机端的应用[1]、页面URL3对应于浅谈翻页控件在手机端的应用[2]、页面URL4对应于浅谈翻页控件在手机端的应用[3],则在步骤S21中,网络设备1以此为顺序,将页面URL3的当前页面内容信息合并在页面URL2的当前页面内容信息之后,将页面URL4的当前页面内容信息合并在页面URL3的当前页面内容信息之后,得到合并后的当前页面内容信息,并将其作为目标页面web2所对应的完整页面内容信息。
在此,本领域技术人员应能理解,当目标页面中包含预定指示内容连接的标识信息表明该目标页面的页面内容是较长页面内容中的中间内容部分时(也就是说,既不是较长页面内容中的第一部分,也不是最后一部分),则在步骤S21中,网络设备1可基于目标页面的当前页面内容信息中包含的预定指示内容连接的标识信息,以及该内容连接所对应的页面中包含的预定指示内容连接的标识信息,分别向前和向后递归,得到前几部分和后几部分的页面内容,例如,假设对应目标页面web3,其属于由5个页面内容部分([1]至[5])组成的较长页面内容中的部分[3],则在步骤S21中,网络设备1可向前递归得到部分[1]和[2]的页面内容,向后递归得到部分[4]和[5]的页面内容,然后,将这5部分内容按照对应的标识次序(即按照[1]至[5]的次序)进行合并,即可得到所述完整的页面内容信息。
本领域技术人员应能理解上述确定所述完整页面内容信息的方式仅为举例,其他现有的或今后可能出现的确定所述完整页面内容信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
然后,在步骤S22中,网络设备1根据所述完整页面内容信息,确定所述收藏内容信息,如将所述完整内容信息作为所述收藏内容信息,或者,对所述完整内容信息进行页面去噪处理,以提取所述完整内容信息所对应的页面主体内容信息,将提取得到的页面主体内容信息作为所述收藏内容信息。在此,在步骤S22中,网络设备1提取所述完整页面内容信息的页面主体内容的方式与在步骤S2中,网络设备1提取页面主体内容信息的方式相同或相似,为简明起见,故在此不再赘述,并以引用的方式包含与此。
在此,本发明实现由多页面组成一个完整内容的网页的收藏,从而使得用户可实现一键收藏,无论用户在多个页面中的哪一页,本发明均可提取完整的页面内容,不需要用户分别在每一页上进行收藏操作,进一步提高了用户体验。
图6示出根据本发明一个优选实施例的网络设备和用户设备配合实现一种用于收藏页面的方法流程图。
其中,该方法包括步骤S1’、步骤S2’、步骤S3’和步骤S4’。具体地,在步骤S4’中,用户设备2获取所述用户对所述目标页面中目标对象的选择操作;在步骤S1’中,用户设备2向对应的网络设备1发送用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息、所述目标对象及所述用户在所述收藏应用中的标识信息;相应地,网络设备1接收对应用户设备发送的用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息、所述用户在所述目标页面中选择的目标对象及所述用户在所述收藏应用中的标识信息;在步骤S2’中,网络设备1根据所述当前页面内容信息及所述目标对象,确定所述收藏内容信息;在步骤S3’中,网络设备1根据所述收藏内容信息,建立或更新与所述标识信息相对应的页面收藏数据库,以收藏所述目标页面。在此,步骤S3’与图5实施例中步骤S3的内容相同或基本相同,为简明起见,故在此不再赘述,并以引用的方式包含与此。
具体地,在步骤S4’中,用户设备2通过JSP、ASP等动态网页技术,或通过调用浏览器提供的应用程序接口(API),获取所述用户对所述目标页面中目标对象的选择操作。在此,所述目标对象是指所述目标页面的部分语句/段落/图片等。在此,所述选择操作包括但不限于如涂抹、选中操作(如画圈,鼠标选中,以预定符号[]等前后标记选中的起始位置)等。
例如,假设对于目标页面web1,在用户A基于收藏应用如收藏插件collection-plugin1对该目标页面web1执行了收藏操作并通过帐号abc123登录了该收藏插件collection-plugin1,根据收藏插件collection-plugin1提供的是否要选择指定目标对象的操作按钮,用户A利用灰色涂抹了该页面的当前页面内容信息中的部分语句如sentence1:
“SIP是一个与HTTP协议很像的,请求/应答式的事务模型。每一个事务最少由一个要完成特定方法或功能的请求,和服务器端的一个应答组成。…INVITE是一个SIP消息,它表示请求者Alice想与Bob通话。INVITE请求包含一些头域。头域被称为属性,可以提供关于这个消息的额外信息”
以进行着重标记;或者,在用户A浏览目标页面web1的过程中,认为对以上部分语句sentence1对其很有用,需要重点标记,便对以上部分语句进行了涂抹操作,或者选中可以上部分语句sentence1,然后,基于收藏应用如收藏插件collection-plugin1对该目标页面web1执行了收藏操作并通过帐号abc123登录了该收藏插件collection-plugin1,在步骤S4’中,用户设备2通过JSP、ASP等动态网页技术,或通过调用浏览器提供的应用程序接口(API),便获取到用户A对目标页面web1中以上部分语句的选择操作,如对以上部分语句的涂抹操作。
然后,在步骤S1’中,用户设备2基于所述选择操作,通过调用浏览器自身所提供应用程序接口(API),获取到所述目标页面的当前页面内容信息及所述选择操作所对应的目标对象;接着,向对应的网络设备1发送用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息、所述目标对象及所述用户在所述收藏应用中的标识信息。
例如,接上例,则在步骤S1’中,用户设备2基于所述选择操作,通过调用浏览器browser1自身所提供应用程序接口(API),获取到网页web1的当前页面内容信息及所述选择操作所对应的目标对象,即获取到当前页面web1加载完成后呈现给用户的页面内容信息,以及用户A在网页web1中涂抹的以上部分语句sentence1,并且,可基于用户A登录该收藏插件collection-plugin1的输入的帐号信息abc123,获取到用户A在该收藏插件collection-plugin1中的标识信息;然后,通过诸如http、https等约定的通信方式,向对应的网络设备1发送用户A基于收藏应用发起的关于目标页面的收藏请求,其中,该收藏请求包括页面web1的当前页面内容信息、所述目标对象即用户A涂抹的以上部分语句sentence1,及用户A在收藏插件collection-plugin1中的帐号信息abc123。
相应地,网络设备1通过诸如http、https等约定的通信方式,接收对应用户设备发送的用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息、所述用户在所述目标页面中选择的目标对象及所述用户在所述收藏应用中的标识信息。
在步骤S2’中,网络设备1根据所述当前页面内容信息及所述目标对象,确定所述收藏内容信息。在此,在步骤S2’中,网络设备1确定所述收藏内容信息的方式包括但不限于以下至少任一项:
1)首先在所述当前页面内容信息中标识出所述目标对象,如按照用户在目标页面中涂抹所述目标对象的方式(如颜色、涂抹样式等),标识出所述目标对象;然后从标识了目标对象的所述当前页面内容信息中提取对应的页面主体内容信息,并将其作为所述收藏内容信息。
例如,假设网络设备1在步骤S1’中接收到对应用户设备2发送的用户A基于收藏插件collection-plugin1发起的页面web1的收藏请求,其中,该收藏请求包括页面web1的当前页面内容信息、所述目标对象即用户A涂抹的以上部分语句sentence1,及用户A在收藏插件collection-plugin1中的帐号信息abc123,因用户A用灰色对页面web1的当前页面内容信息中的以上部分语句sentence1进行了涂抹,则在步骤S2’中,网络设备1可首先在所述当前页面内容信息中用灰色涂抹的方式标识出以上部分语句sentence1;然后,从标识了目标对象的所述当前页面内容信息中提取对应的页面主体内容信息,并将其作为所述收藏内容信息,如得到如图4所示的收藏内容信息。在此,网络设备1在步骤S2’中提取所述页面主体内容信息的方式与图5中网络设备1在步骤S2中提取页面主体内容信息的方式相同或相似,为简明起见,故在此不再赘述,并以引用的方式包含与此。
2)首先从所述当前页面内容信息中提取对应的页面主体内容信息;然后,将所述目标对象在所述页面主体内容信息中标识出来,如按照用户在目标页面中涂抹所述目标对象的方式(如颜色、涂抹样式等),标识出所述目标对象,并将标识了所述目标对象的所述页面主体内容信息作为所述收藏内容信息。
例如,接上例,则在步骤S2’中,网络设备1首先从页面web1的当前页面内容信息中提取对应的页面主体内容信息;然后,在所述页面主体内容信息中用灰色涂抹的方式标识出以上部分语句sentence1,并将标识了所述目标对象的所述页面主体内容信息作为所述收藏内容信息,如得到如图4所示的收藏内容信息。在此,网络设备1在步骤S2’中提取所述页面主体内容信息的方式与图5中网络设备1在步骤S2中提取页面主体内容信息的方式相同或相似,为简明起见,故在此不再赘述,并以引用的方式包含与此。
在此,本发明得到的收藏内容信息中显示出用户在目标页面中选择的目标对象,使得用户以后查看所收藏该页面信息时,可以清楚地看到自己着重标记的部分,从而更进一步提升用户的收藏体验。
本领域技术人员应能理解上述根据所述当前页面内容信息及所述目标对象确定所述收藏内容信息的方式仅为举例,其他现有的或今后可能出现的根据所述当前页面内容信息及所述目标对象确定所述收藏内容信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在此,在本发明一个典型的配置中,终端和服务网络的设备均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (17)

1.一种在网络设备端用于收藏页面的方法,其中,该方法包括:
接收对应用户设备发送的用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息;
根据所述当前页面内容信息,确定所述目标页面所对应的收藏内容信息;
根据所述收藏内容信息,建立或更新与所述标识信息相对应的页面收藏数据库,以收藏所述目标页面。
2.根据权利要求1所述的方法,其中,确定所述目标页面所对应的收藏内容信息包括:
从所述当前页面内容信息中提取所述目标页面所对应的页面主体内容信息,以将所述页面主体内容信息作为所述收藏内容信息。
3.根据权利要求1所述的方法,其中,确定所述目标页面所对应的收藏内容信息包括:
若所述当前页面内容信息中包含预定指示内容连接的标识信息,基于所述当前页面内容信息中包含的预定指示内容连接的标识信息,确定所述目标页面所对应的完整页面内容信息;
根据所述完整页面内容信息,确定所述收藏内容信息。
4.根据权利要求3所述的方法,其中,确定所述目标页面所对应的完整页面内容信息包括:
若所述当前页面内容信息中包含预定指示内容连接的标识信息,基于所述当前页面内容信息中包含的预定指示内容连接的标识信息,以及该内容连接所对应的页面中包含的预定指示内容连接的标识信息,递归确定该目标页面所对应的多个内容连接部分,其中,所述多个内容连接部分均包含所述预定指示内容连接的标识信息所对应的连接内容;
将所述多个内容连接部分以对应的所述预定指示内容连接的标识信息为顺序进行合并,以获得所述完整页面内容信息。
5.根据权利要求1所述的方法,其中,接收对应用户设备发送的用户基于收藏应用发起的关于目标页面的收藏请求包括:
接收对应用户设备发送的用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息、所述用户在所述目标页面中选择的目标对象及所述用户在所述收藏应用中的标识信息;
其中,确定所述目标页面所对应的收藏内容信息包括:
根据所述当前页面内容信息及所述目标对象,确定所述收藏内容信息。
6.一种在用户设备端用于收藏页面的方法,其中,该方法包括:
向对应的网络设备发送用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息。
7.根据权利要求6所述的方法,其中,向对应的网络设备发送用户基于收藏应用发起的关于目标页面的收藏请求包括:
获取用户基于收藏应用对目标页面执行的收藏操作;
根据所述收藏操作,获取所述目标页面的当前页面内容信息;
向对应的网络设备发送关于所述目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息。
8.根据权利要求6或7所述的方法,其中,该方法还包括:
-获取所述用户对所述目标页面中目标对象的选择操作;
其中,向对应的网络设备发送用户基于收藏应用发起的关于目标页面的收藏请求包括:
-向对应的网络设备发送用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息、所述目标对象及所述用户在所述收藏应用中的标识信息。
9.一种用于收藏页面的网络设备,其中,该网络设备包括:
用于接收对应用户设备发送的用户基于收藏应用发起的关于目标页面的收藏请求的装置,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息;
用于根据所述当前页面内容信息,确定所述目标页面所对应的收藏内容信息的装置;
用于根据所述收藏内容信息,建立或更新与所述标识信息相对应的页面收藏数据库的装置,以收藏所述目标页面。
10.根据权利要求9所述的网络设备,其中,确定所述目标页面所对应的收藏内容信息的装置用于:
从所述当前页面内容信息中提取所述目标页面所对应的页面主体内容信息,以将所述页面主体内容信息作为所述收藏内容信息。
11.根据权利要求9所述的网络设备,其中,用于确定所述目标页面所对应的收藏内容信息的装置包括:
若所述当前页面内容信息中包含预定指示内容连接的标识信息,用于基于所述当前页面内容信息中包含的预定指示内容连接的标识信息,确定所述目标页面所对应的完整页面内容信息的单元;
用于根据所述完整页面内容信息,确定所述收藏内容信息的单元。
12.根据权利要求11所述的网络设备,其中,确定所述目标页面所对应的完整页面内容信息的单元用于:
若所述当前页面内容信息中包含预定指示内容连接的标识信息,基于所述当前页面内容信息中包含的预定指示内容连接的标识信息,以及该内容连接所对应的页面中包含的预定指示内容连接的标识信息,递归确定该目标页面所对应的多个内容连接部分,其中,所述多个内容连接部分均包含所述预定指示内容连接的标识信息所对应的连接内容;
将所述多个内容连接部分以对应的所述预定指示内容连接的标识信息为顺序进行合并,以获得所述完整页面内容信息。
13.根据权利要求9所述的网络设备,其中,接收对应用户设备发送的用户基于收藏应用发起的关于目标页面的收藏请求的装置用于:
接收对应用户设备发送的用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息、所述用户在所述目标页面中选择的目标对象及所述用户在所述收藏应用中的标识信息;
其中,确定所述目标页面所对应的收藏内容信息的装置用于:
根据所述当前页面内容信息及所述目标对象,确定所述收藏内容信息。
14.一种用于收藏页面的用户设备,其中,该用户设备包括:
用于向对应的网络设备发送用户基于收藏应用发起的关于目标页面的收藏请求的装置,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息。
15.根据权利要求14所述的用户设备,其中,向对应的网络设备发送用户基于收藏应用发起的关于目标页面的收藏请求的装置用于:
获取用户基于收藏应用对目标页面执行的收藏操作;
根据所述收藏操作,获取所述目标页面的当前页面内容信息;
向对应的网络设备发送关于所述目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息及所述用户在所述收藏应用中的标识信息。
16.根据权利要求14或15所述的用户设备,其中,该用户设备还包括:
用于获取所述用户对所述目标页面中目标对象的选择操作的装置;
其中,向对应的网络设备发送用户基于收藏应用发起的关于目标页面的收藏请求的装置用于:
-向对应的网络设备发送用户基于收藏应用发起的关于目标页面的收藏请求,其中,所述收藏请求包括所述目标页面的当前页面内容信息、所述目标对象及所述用户在所述收藏应用中的标识信息。
17.一种用于收藏页面的系统,其中,该系统包括根据权利要求9至13中任一项所述的网络设备,以及根据权利要求14至16中任一项所述的用户设备。
CN201410340027.5A 2014-07-16 2014-07-16 一种用于收藏页面的方法与设备 Pending CN104156397A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410340027.5A CN104156397A (zh) 2014-07-16 2014-07-16 一种用于收藏页面的方法与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410340027.5A CN104156397A (zh) 2014-07-16 2014-07-16 一种用于收藏页面的方法与设备

Publications (1)

Publication Number Publication Date
CN104156397A true CN104156397A (zh) 2014-11-19

Family

ID=51881901

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410340027.5A Pending CN104156397A (zh) 2014-07-16 2014-07-16 一种用于收藏页面的方法与设备

Country Status (1)

Country Link
CN (1) CN104156397A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105183899A (zh) * 2015-09-29 2015-12-23 上海斐讯数据通信技术有限公司 收藏功能共享系统及方法
CN109788127A (zh) * 2018-12-20 2019-05-21 努比亚技术有限公司 一种文字信息的获取方法、移动终端及存储介质
CN114756782A (zh) * 2017-02-27 2022-07-15 华为技术有限公司 一种显示收藏对象的方法和终端

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008092079A2 (en) * 2007-01-25 2008-07-31 Clipmarks Llc System, method and apparatus for selecting content from web sources and posting content to web logs
CN101937461A (zh) * 2010-09-01 2011-01-05 百度在线网络技术(北京)有限公司 一种基于翻页操作优化网页浏览的方法与设备
CN102163203A (zh) * 2010-02-24 2011-08-24 富士通株式会社 网页下载的方法和装置
CN102722481A (zh) * 2011-03-29 2012-10-10 阿里巴巴集团控股有限公司 一种用户收藏夹数据的处理方法及搜索方法
CN102904912A (zh) * 2011-07-26 2013-01-30 腾讯科技(深圳)有限公司 一种网页内容下载方法及系统
CN103077254A (zh) * 2013-02-06 2013-05-01 人民搜索网络股份公司 网页获取方法和装置
CN103577482A (zh) * 2012-08-07 2014-02-12 腾讯科技(深圳)有限公司 一种网页收藏方法、装置及浏览器
CN103714119A (zh) * 2013-11-29 2014-04-09 北京奇虎科技有限公司 一种浏览器数据的处理方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008092079A2 (en) * 2007-01-25 2008-07-31 Clipmarks Llc System, method and apparatus for selecting content from web sources and posting content to web logs
CN102163203A (zh) * 2010-02-24 2011-08-24 富士通株式会社 网页下载的方法和装置
CN101937461A (zh) * 2010-09-01 2011-01-05 百度在线网络技术(北京)有限公司 一种基于翻页操作优化网页浏览的方法与设备
CN102722481A (zh) * 2011-03-29 2012-10-10 阿里巴巴集团控股有限公司 一种用户收藏夹数据的处理方法及搜索方法
CN102904912A (zh) * 2011-07-26 2013-01-30 腾讯科技(深圳)有限公司 一种网页内容下载方法及系统
CN103577482A (zh) * 2012-08-07 2014-02-12 腾讯科技(深圳)有限公司 一种网页收藏方法、装置及浏览器
CN103077254A (zh) * 2013-02-06 2013-05-01 人民搜索网络股份公司 网页获取方法和装置
CN103714119A (zh) * 2013-11-29 2014-04-09 北京奇虎科技有限公司 一种浏览器数据的处理方法和装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105183899A (zh) * 2015-09-29 2015-12-23 上海斐讯数据通信技术有限公司 收藏功能共享系统及方法
CN114756782A (zh) * 2017-02-27 2022-07-15 华为技术有限公司 一种显示收藏对象的方法和终端
US11606458B2 (en) 2017-02-27 2023-03-14 Huawei Technologies Co., Ltd. Favorite-object display method and terminal
CN109788127A (zh) * 2018-12-20 2019-05-21 努比亚技术有限公司 一种文字信息的获取方法、移动终端及存储介质

Similar Documents

Publication Publication Date Title
US9916364B2 (en) Personalization of news articles based on news sources
US10447742B2 (en) Information sharing method and device
CN102420813B (zh) 一种根据用户设备的终端属性提供目标信息的方法与设备
JP2013533527A (ja) フォントサブセットの開始
EP3036661A1 (en) Presenting fixed format documents in reflowed format
CN104090887A (zh) 歌曲搜索方法及装置
CN104980512A (zh) 一种基于移动应用提供目标对象的方法与设备
CN102298617A (zh) 一种用于获取目标页面的方法与设备
CN103336794A (zh) 用于在目标页面中提供对应呈现信息的方法与设备
CN102523106A (zh) 基于FlexRIA技术的视频网站用户行为分析系统
CN103559194A (zh) 一种搜索方法、服务器、系统
CN103207900A (zh) 基于位置信息向目标用户提供询问请求信息的方法与装置
CN104156397A (zh) 一种用于收藏页面的方法与设备
CN102959546A (zh) 用于转换内容的方法和设备
CN104954398A (zh) 一种获取内容的方法及装置
CN105787750A (zh) 信息推送方法及装置
US20180192121A1 (en) System and methods thereof for displaying video content
CN102968412A (zh) 一种用于获取多媒体数据的特征信息的方法和设备
US20230275859A1 (en) Enhancing a social media post with content that is relevant to the audience of the post
CN103379022B (zh) 一种基于互联网地图搜索的即时通讯方法和系统
JP6684894B2 (ja) 情報をプッシュ配信する方法及び装置
CN103559195A (zh) 一种搜索方法和终端
CN108255898A (zh) 页面显示方法和装置
US20130230248A1 (en) Ensuring validity of the bookmark reference in a collaborative bookmarking system
CN112601129B (zh) 视频交互系统、方法和接收端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination