CN103207874B - 一种网页更新内容的提示方法及系统 - Google Patents

一种网页更新内容的提示方法及系统 Download PDF

Info

Publication number
CN103207874B
CN103207874B CN201210013870.3A CN201210013870A CN103207874B CN 103207874 B CN103207874 B CN 103207874B CN 201210013870 A CN201210013870 A CN 201210013870A CN 103207874 B CN103207874 B CN 103207874B
Authority
CN
China
Prior art keywords
webpage
web page
update content
user
page contents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210013870.3A
Other languages
English (en)
Other versions
CN103207874A (zh
Inventor
蒋进舟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yayue Technology Co ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201210013870.3A priority Critical patent/CN103207874B/zh
Publication of CN103207874A publication Critical patent/CN103207874A/zh
Application granted granted Critical
Publication of CN103207874B publication Critical patent/CN103207874B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明实施例公开了一种网页更新内容的提示方法,该方法包括:获取用户当前浏览的网页中指定区域的网页内容;比较所述网页内容与预先保存的,用户上一次浏览该网页时,所述指定区域的网页内容,得到该网页指定区域的更新内容;保存所述用户当前浏览的网页中指定区域的网页内容;在浏览器中对所述更新内容进行提示。本发明还公开了一种网页更新内容的提示系统,该方法和系统对没有提供订阅功能的网站,也能够给出更新内容的提示。

Description

一种网页更新内容的提示方法及系统
技术领域
本发明涉及网页技术领域,特别涉及一种网页更新内容的提示方法及系统。
背景技术
网站的内容每时每刻都在更新,用户每天不同的时刻打开同一个网站,所看到的内容是不一样的,而用户一般只关注最新的以及自己没有阅读过的新内容,对过时或已经阅读过的内容基本不会关注,那么这个时候,用户就需要从网页中众多的信息中找出最近更新过的或自己未读过的内容,而这并不是一件很容易的事情,尤其是信息量巨大的门户网站首页,如果没有提示,寻找新内容也是一件有难度的事情。
为了方便用户从海量信息中找到更新的内容,现在很多浏览器都引入了订阅的功能,通过网站提供的订阅内容,如通过简易信息聚合(RSS)格式或者原子(Atom)格式,将更新的内容和未读的内容标识出来,这样用户只需要打开浏览器的订阅页,就可以知道哪些内容是更新的,哪些内容是已读的了。
但是对于没有提供RSS或者Atom的网站,或者不支持订阅功能的浏览器,用户是无法得到更新内容的提示信息的。
发明内容
有鉴于此,本发明提供了一种网页更新内容的提示方法及系统,对没有提供订阅功能的网站,也能够给出更新内容的提示。
为达上述目的,本发明的技术方案具体是这样实现的:
一种网页更新内容的提示方法,该方法包括:
获取用户当前浏览的网页中指定区域的网页内容;
比较所述网页内容与预先保存的,用户上一次浏览该网页时,所述指定区域的网页内容,得到该网页指定区域的更新内容;
保存所述用户当前浏览的网页中指定区域的网页内容;
在浏览器中对所述更新内容进行提示。
一种网页更新内容的提示系统,该系统包括:
获取模块,用于获取用户当前浏览的网页中指定区域的网页内容;
比较模块,用于比较所述获取模块获取的网页内容与存储模块中预先保存的,用户上一次浏览该网页时,所述指定区域的网页内容,得到该网页指定区域的更新内容;
存储模块,用于保存所述用户当前浏览的网页中指定区域的网页内容;
提示模块,用于在浏览器中对所述更新内容进行提示。
由上述技术方案可见,本发明的这种网页更新内容的提示方法及系统,通过比较用户当前浏览和上一次浏览的同一个网页中的相同指定区域的网页内容获取到当前浏览的网页中的更新内容,从而对不提供订阅的网站或者没有订阅功能的浏览器也能得到网页中更新内容的提示。
附图说明
图1为本发明实施例的网页更新内容的提示方法流程图。
图2为本发明实施例的更新内容的比较确定方法流程图。
图3为本发明实施例的网页更新内容的提示系统结构示意图。
图4为本发明实施例的比较模块结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本发明进一步详细说明。
本发明主要是在每次用户浏览网页的时候保存网页的内容,并通过比较当前网页内容与上一次保存的网页内容的区别,确定网页中哪些内容是新的,并向用户发出提示信息。
图1为本发明网页更新内容的提示方法流程图,如图1所示,该方法包括如下步骤:
步骤101,获取用户当前浏览的网页中指定区域的网页内容;
由于网页一般由多个区域嵌套而成,例如门户网站往往将不同栏目的内容分别存放在不同的区域内,而用户往往只关注网页中特定栏目的内容,因此,本步骤中,可以获取用户预先指定区域的网页内容;当然,如果用户指定了网页的全部区域,则获取的将是网页全部内容。
步骤102,比较所述网页内容与预先保存的,用户上一次浏览该网页时,所述指定区域的网页内容,得到该网页指定区域的更新内容;
如果用户当前浏览的网页以前曾经打开过,则会保存有该网页指定区域在用户上一次浏览时的网页内容,此时,将该网页当前指定区域的网页内容与上次用户浏览该网页时保存的指定区域的网页内容进行比较,即可知道该网页指定区域的内容中,哪些是新内容,哪些没有变化。
步骤103,保存用户当前浏览的网页中指定区域的网页内容,并在浏览器中对所述更新内容进行提示。
将获取的用户当前浏览的网页中指定区域的网页内容保存下来,并覆盖上一次保存的该指定区域得网页内容,以供用户下次浏览该网页时进行内容比较,并根据上一步骤中得到的更新内容在网页中做出提示,比如高亮显示更新内容,为更新内容添加提示标记等;具体可以通过浏览器内核提供的相关接口实现,例如通过高亮API将更新内容高亮显示。
另外,具体进行内容比较时,需要将用户指定的区域标识出来,通过唯一标识来指示用户指定的区域,进而可以进行网页中指定区域的网页内容比较。
对于指定区域的标识,可以使用网页代码中不同区域的特征代码,例如网页代码中对于不同区域一般都会有一个代表该区域的名称或者标识,这个标识可以是网页元素的id,className甚至是在这个区域内的网页元素的序号,利用这些标识即可表示出指定区域,再加上当前网页的URL,就能够唯一标识用户选定的这个网页区域了。
之后就可以根据这个唯一标识,建立网页区域和其网页内容之间的映射关系,以使用URL+元素路径作为唯一标识为例,如表一所示,可以建立以下的对应关系:
表一,指定区域的唯一标识与网页内容映射关系表
通过这样的映射关系,即可将用户浏览的网页中指定区域的网页内容标识出来以供比较。
有了唯一标识,还需要获取标识对应的具体网页内容,网页内容的获取方法具体举例如下:
1、获取指定区域的HTML代码
比如使用IE浏览器的用户,可以通过IHTMLElement的innerHTML接口来获取指定区域的HTML代码,通过比较当前和上次保存的指定区域的HTML代码的不同,就可以知道哪些内容是新增的。
2、获取指定区域的文档对象模型(DOM)节点信息
网页中的任何一个元素都是一个DOM节点,我们可以通过获取网页代码中的DOM节点来获取网页中各个网页元素。例如,HTML代码中的<a>,<ul>,<ol>和<li>等标签用来标识各种网页元素,这些标签中记录了具体的网页元素的信息,如这个元素是列表、链接还是图片等,还有具体的元素内容,如果是链接,则还记录该链接的点击事件,即是否被点击过;因此可以通过提取指定区域中的这些DOM节点信息,就可以得到指定区域中的网页内容,并可以进一步获得链接的点击状态信息。
除上述举例的两种方法以外,采用任何其他网页代码的分析方法获取网页内容都是可以的,通过上述方法获取用户当前浏览的网页中指定区域的网页内容后,即可将其与用户本地保存的网页内容中唯一标识相同的网页内容进行比较。
在具体进行网页内容比较时,如果采用获取HTML代码的方法,则比较过程比较简单,可以直接比较HTML代码,其中不同的部分确定为更新内容。如果采用获取DOM节点信息的方法,则需要逐一对指定区域内的所有网页元素进行比较,其中不同的网页元素确定为更新内容;另外,对于链接形式的网页元素,还可以进一步判断其点击状态,从而确定该链接是否已读,如果是新出现的链接,但已读的,可以不作为更新内容。
网页内容的比较和更新内容的确定流程举例如图2所示(以获取dom节点信息的网页内容为例),包括如下步骤:
步骤201,遍历指定区域内的网页元素;
遍历用户当前浏览网页中指定区域的所有网页元素,逐一进行分析和比较;
步骤202,判断网页元素是否为链接,如果是,则执行步骤204,否则执行步骤203;
步骤203,判断网页元素是否出现过,如果是,则执行步骤205,否则执行步骤206;
对于非链接的网页元素,由于没有点击事件,所以这里需要比较当前的网页元素在上一次保存的网页内容中是否出现,如果没出现过,则说明是新的内容,执行步骤205,否则说明不是新的内容,执行步骤206;
步骤204,判断网页元素是否被点击过,如果是,则执行步骤206,否则执行步骤205;
对于链接,根据dom节点信息中的点击状态信息判断该链接是否被用户点击过,如果是,则说明用户已经读过这个链接的内容,执行步骤206,否则说明用户没有点击过,是新的内容,执行步骤205;
步骤205,将网页元素确定为更新内容,执行步骤207;
步骤206,将网页元素确定为非更新内容,执行步骤207;
步骤207,判断是否还有网页元素,如果是,则返回步骤201,否则结束流程。
另外,对于一些结构复杂的网页,可以将上述步骤101、102的工作交由外部服务器来完成,即用户打开网页时,将该网页指定区域的唯一标识发送给外部服务器,由外部服务器对该网页的指定区域的网页内容进行获取和比较,得到更新内容,再将获得的更新内容返回用户,具体返回用户的内容可以是按照表一那样形式的指定区域的网页内容,并将更新内容标识出来,从而提示用户。
再有,打开网页时候,浏览器需要优先保证网页的加载速度,所以在此时去进行网页内容的分析和比较,可能会拖慢网页的加载速度,为避免这一情况,进行网页内容的获取和比较的时机,除了在用户打开网页时之外,还可以在页面打开完毕之后再进行,或者定时地进行;对于在服务器上进行分析和比较网页内容的情况下,可以将指定区域的标识预读到本地,在加载网页之后,从服务器获取到更新内容,无需浏览器对网页进行分析,即可高亮其中的更新内容,从而加快网页的显示速度。
另外,本发明还提供一种网页更新内容的提示系统,该系统如图3所示,包括:
获取模块301,用于获取用户当前浏览的网页中指定区域的网页内容;
比较模块302,用于比较所述获取模块获取的网页内容与存储模块中预先保存的,用户上一次浏览该网页时,所述指定区域的网页内容,得到该网页指定区域的更新内容;
存储模块303,用于保存所述用户当前浏览的网页中指定区域的网页内容;
提示模块304,用于在浏览器中对所述更新内容进行提示。
其中,所述比较模块302的具体结构如图4所示,包括:
标识确定单元401,根据所述用户当前浏览的网页的URL及所述指定区域在网页代码中的标识确定所述用户当前浏览的网页中指定区域的网页内容的唯一标识;
比较单元402,将所述确定了唯一标识的网页内容,与所述存储模块303中,用户最近一次保存的网页内容中,与所述唯一标识相同的网页内容进行比较,得到更新内容。具体地,所述比较单元402将比较中得到的HTML代码不同的部分确定为更新内容或者将比较中得到的没有出现过的非链接元素,以及没有点击过的链接元素确定为更新内容。具体比较方法可以参考上述方法实施例。
另外,所述获取模块301通过浏览器提供的接口获取的网页指定区域的HTML代码作为获取的网页内容;或者从网页指定区域代码的dom节点标签中提取的网页元素信息作为获取的网页内容。
系统中的获取模块301、比较模块302、存储模块303和提示模块304可以在用户本地实现,对于复杂网页区域,则存储模块303和提示模块304可以在用户本地实现,而所述获取模块301、比较模块302则可以在用户本地以外的外部服务器实现。用户浏览器可以在特定的时刻,比如打开网页的时候去外部服务器上查询哪些内容是更新内容,然后根据外部服务器返回的结果高亮显示网页中特定的元素。
由上述的实施例可见,本发明的这种网页更新内容的提示方法及系统,通过比较用户当前浏览和上一次浏览的同一个网页中的相同指定区域的网页内容获取到当前浏览的网页中的更新内容,从而对不提供订阅的网站或者没有订阅功能的浏览器也能得到网页中更新内容的提示。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (11)

1.一种网页更新内容的提示方法,其特征在于,该方法包括:
外部服务器获取用户当前浏览的网页中用户预先指定区域的网页内容;
所述服务器比较所获取的所述指定区域的所述网页内容与预先保存的、用户上一次浏览该网页时所述指定区域的网页内容,得到该网页中所述指定区域的更新内容;
用户本地保存所获取的所述用户当前浏览的网页中所述指定区域的所述网页内容;
在浏览器加载所述网页之后从所述服务器中获取所述更新内容,并对所述更新内容进行提示。
2.如权利要求1所述的网页更新内容的提示方法,其特征在于,所述比较,包括:
根据所述用户当前浏览的网页的URL及所述指定区域在网页代码中的标识确定所述用户当前浏览的网页中指定区域的网页内容的唯一标识;
将所述确定了唯一标识的网页内容,与用户最近一次保存的网页内容中,与所述唯一标识相同的网页内容进行比较。
3.如权利要求2所述的网页更新内容的提示方法,其特征在于,所述网页内容,包括:
通过浏览器提供的接口获取的网页指定区域的HTML代码;或者从网页指定区域代码的文档对象模型dom节点标签中提取的网页元素信息。
4.如权利要求3所述的网页更新内容的提示方法,其特征在于,所述得到更新内容包括:
将所述比较中得到的HTML代码不同的部分确定为更新内容。
5.如权利要求3所述的网页更新内容的提示方法,其特征在于,所述得到更新内容包括:
将所述比较中得到的没有出现过的非链接元素,以及没有点击过的链接元素确定为更新内容。
6.一种网页更新内容的提示系统,其特征在于,该系统包括:
获取模块,用于获取用户当前浏览的网页中用户预先指定区域的网页内容;
比较模块,用于比较所述获取模块获取的所述指定区域的所述网页内容与存储模块中预先保存的、用户上一次浏览该网页时所述指定区域的网页内容,得到该网页中所述指定区域的更新内容;
存储模块,用于保存所获取的所述用户当前浏览的网页中所述指定区域的所述网页内容;
提示模块,用于在浏览器加载所述网页之后从服务器获取所述更新内容,并对所述更新内容进行提示;
其中,存储模块和提示模块在用户本地实现,所述获取模块、比较模块在用户本地以外的外部服务器实现。
7.如权利要求6所述的网页更新内容的提示系统,其特征在于,所述比较模块,包括:
标识确定单元,根据所述用户当前浏览的网页的URL及所述指定区域在网页代码中的标识确定所述用户当前浏览的网页中指定区域的网页内容的唯一标识;
比较单元,将所述确定了唯一标识的网页内容,与所述存储模块中,用户最近一次保存的网页内容中,与所述唯一标识相同的网页内容进行比较,得到更新内容。
8.如权利要求7所述的网页更新内容的提示系统,其特征在于,所述获取模块通过浏览器提供的接口获取的网页指定区域的HTML代码作为获取的网页内容。
9.如权利要求7所述的网页更新内容的提示系统,其特征在于,所述获取模块从网页指定区域代码的dom节点标签中提取的网页元素信息作为获取的网页内容。
10.如权利要求8所述的网页更新内容的提示系统,其特征在于,所述比较单元将比较中得到的HTML代码不同的部分确定为更新内容。
11.如权利要求9所述的网页更新内容的提示系统,其特征在于,所述比较单元将比较中得到的没有出现过的非链接元素,以及没有点击过的链接元素确定为更新内容。
CN201210013870.3A 2012-01-17 2012-01-17 一种网页更新内容的提示方法及系统 Active CN103207874B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210013870.3A CN103207874B (zh) 2012-01-17 2012-01-17 一种网页更新内容的提示方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210013870.3A CN103207874B (zh) 2012-01-17 2012-01-17 一种网页更新内容的提示方法及系统

Publications (2)

Publication Number Publication Date
CN103207874A CN103207874A (zh) 2013-07-17
CN103207874B true CN103207874B (zh) 2017-05-10

Family

ID=48755099

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210013870.3A Active CN103207874B (zh) 2012-01-17 2012-01-17 一种网页更新内容的提示方法及系统

Country Status (1)

Country Link
CN (1) CN103207874B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593466B (zh) * 2013-11-26 2017-08-04 优视科技有限公司 网页加载方法及客户端和服务器
CN103678639B (zh) * 2013-12-20 2017-07-28 北京奇虎科技有限公司 浏览器中进行信息更新提醒的方法及设备
CN104142987A (zh) * 2014-07-24 2014-11-12 腾讯科技(深圳)有限公司 一种页面的内容管理方法、装置及终端设备
CN104615787B (zh) * 2015-03-06 2018-05-18 中国建设银行股份有限公司 一种更新界面显示方法及装置
CN106708900A (zh) * 2015-11-17 2017-05-24 北大方正集团有限公司 网页内容加载方法及装置
JP6440868B2 (ja) * 2015-12-18 2018-12-19 三菱電機株式会社 データ処理装置、データ処理方法及びデータ処理プログラム
CN106933782A (zh) * 2015-12-30 2017-07-07 阿里巴巴集团控股有限公司 一种文本资源文件的比对方法及装置
CN107025247A (zh) * 2016-02-02 2017-08-08 广州市动景计算机科技有限公司 对网页数据进行处理的方法、设备、浏览器和电子设备
CN105956202A (zh) * 2016-06-27 2016-09-21 北京小米移动软件有限公司 浏览器中的网页显示方法、装置及终端
CN106227823A (zh) * 2016-07-21 2016-12-14 知几科技(深圳)有限公司 一种网页更新探测方法、网页信息抓取及呈现方法
CN108280110A (zh) * 2017-05-15 2018-07-13 广州市动景计算机科技有限公司 网站差异对比方法、装置及客户端
CN107766513A (zh) * 2017-10-23 2018-03-06 林楚莲 一种对网页中内容进行标记提醒的方法及系统
CN108536467B (zh) * 2018-04-08 2021-11-02 中国联合网络通信集团有限公司 代码的定位处理方法、装置、终端设备及存储介质
CN110222281B (zh) * 2019-06-03 2022-04-29 贝壳技术有限公司 网页中目标内容定位方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1815476A (zh) * 2005-01-28 2006-08-09 京瓷株式会社 显示装置
CN100380864C (zh) * 2003-11-19 2008-04-09 国际商业机器公司 更新/重装在网络上浏览过的页面内容的方法和系统
CN101211340A (zh) * 2006-12-29 2008-07-02 上海芯盛电子科技有限公司 基于客户端/服务端结构的动态网络爬行器
US7698321B2 (en) * 2005-09-30 2010-04-13 At&T Intellectual Property I, L.P. Methods, systems, and products for updating web content
CN102193933A (zh) * 2010-03-10 2011-09-21 北大方正集团有限公司 一种网页编辑方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100380864C (zh) * 2003-11-19 2008-04-09 国际商业机器公司 更新/重装在网络上浏览过的页面内容的方法和系统
CN1815476A (zh) * 2005-01-28 2006-08-09 京瓷株式会社 显示装置
US7698321B2 (en) * 2005-09-30 2010-04-13 At&T Intellectual Property I, L.P. Methods, systems, and products for updating web content
CN101211340A (zh) * 2006-12-29 2008-07-02 上海芯盛电子科技有限公司 基于客户端/服务端结构的动态网络爬行器
CN102193933A (zh) * 2010-03-10 2011-09-21 北大方正集团有限公司 一种网页编辑方法及系统

Also Published As

Publication number Publication date
CN103207874A (zh) 2013-07-17

Similar Documents

Publication Publication Date Title
CN103207874B (zh) 一种网页更新内容的提示方法及系统
CN101211364B (zh) 用于万维网页中暴露的资源的公共书签的方法和系统
CN100442283C (zh) 面向领域基于样本的互联网结构化数据抽取方法及其系统
CN101517511B (zh) 用于辅助因特网导航的系统、过程和软件布置
CN101957818B (zh) 一种批量收藏网页的方法及系统
EP3299973A1 (en) Site memory processing and clipping control
CN102999624A (zh) 搜索和浏览url和url历史的方法和系统
US20090240638A1 (en) Syntactic and/or semantic analysis of uniform resource identifiers
EP2987088A2 (en) Client side page processing
KR100885945B1 (ko) 지능형 자동인식 툴바 검색 방법 및 검색 시스템
US8433995B1 (en) Managing bookmarks for web pages
CN102779169A (zh) 一种基于html标签的网页正文提取方法及装置
CN106951495A (zh) 用于呈现信息的方法和装置
US20110145717A1 (en) Web-browsing system
CN108595697A (zh) 网页集成方法、装置及系统
CN108062468A (zh) 一种基于图片验证码识别的网络爬虫方法
CN108280102A (zh) 上网行为记录方法、装置及用户终端
CN103246680A (zh) 一种在浏览器中将网页内容聚合展现的方法及装置
US7512905B1 (en) Highlight linked-to document sections for increased readability
CN104484415A (zh) 提供电子书的方法及装置
CN101436181A (zh) 一种通用web媒体获取与展示的方法
CN108205532A (zh) 生成网页的方法和装置
CN103246662A (zh) 网络页面中区域数据内容的处理方法和装置
CN106126716A (zh) 一种数据爬取方法及装置
CN101221560A (zh) 网页搜寻结果的表列显示方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20221114

Address after: 1402, Floor 14, Block A, Haina Baichuan Headquarters Building, No. 6, Baoxing Road, Haibin Community, Xin'an Street, Bao'an District, Shenzhen, Guangdong 518133

Patentee after: Shenzhen Yayue Technology Co.,Ltd.

Address before: 2, 518044, East 403 room, SEG science and Technology Park, Zhenxing Road, Shenzhen, Guangdong, Futian District

Patentee before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

TR01 Transfer of patent right