CN101957818A - 一种批量收藏网页的方法及系统 - Google Patents

一种批量收藏网页的方法及系统 Download PDF

Info

Publication number
CN101957818A
CN101957818A CN2009100882862A CN200910088286A CN101957818A CN 101957818 A CN101957818 A CN 101957818A CN 2009100882862 A CN2009100882862 A CN 2009100882862A CN 200910088286 A CN200910088286 A CN 200910088286A CN 101957818 A CN101957818 A CN 101957818A
Authority
CN
China
Prior art keywords
webpage
hyperlink
collection
zone
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009100882862A
Other languages
English (en)
Other versions
CN101957818B (zh
Inventor
武健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN200910088286.2A priority Critical patent/CN101957818B/zh
Publication of CN101957818A publication Critical patent/CN101957818A/zh
Application granted granted Critical
Publication of CN101957818B publication Critical patent/CN101957818B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种批量收藏网页的方法及系统。所述方法包括:根据接收到的位置信息确定其在网页上选择出的区域;提取所述区域内的超链接的地址;将所述超链接的地址添加到收藏夹内。本发明能够将用户需要添加的多个网页一次性添加到收藏夹中,而无需用户重复大量相同的操作,大大简化了用户的操作。此外,用户还可以更为轻松的实现网页上多块区域内所有超链接的一次性收藏,提升了批量收藏网页的用户体验。

Description

一种批量收藏网页的方法及系统
技术领域
本发明涉及互联网技术领域,尤其涉及一种批量收藏网页的方法及系统。
背景技术
用户使用浏览器上网的时候,总要浏览很多的网页。其中很多网页是用户感兴趣并且希望将来能够再次访问的,用户就会选择把这些网页添加到浏览器的收藏夹中,这样,下一次用户打开浏览器后,就不需要再次输入自己感兴趣的网页的统一资源定位符(URL,Uniform Resource Location),而可以直接通过收藏夹访问这些网页。
目前,用户使用浏览器时想添加某一个网页到收藏夹的方式有两种,一种是先访问要添加到收藏夹的网页,然后使用浏览器的“添加到收藏夹”功能来进行收藏;另一种是在该网页的链接上点击鼠标右键,选择“添加到收藏夹”进行收藏。
然而,如果用户对某一批网页都感兴趣,如图1所示,右侧实线框中的网页链接用户都想收藏,如果采用上述现有技术则需要顺次访问这些页面并依次使用浏览器的“添加到收藏夹”功能或者在每个链接上点击鼠标右键选择“添加到收藏夹”,显然,操作过程十分繁琐。
由此可知,上述现有技术无法一次添加多个网页到收藏夹中,用户需要批量添加网页的时候只能一个一个重复操作,很不方便。
发明内容
本发明实施例提供一种批量收藏网页的方法及系统,能够将用户需要添加的多个网页一次性添加到收藏夹中。
本发明实施例提供以下技术方案:
一种批量收藏网页的方法,包括:
根据接收到的位置信息确定其在网页上选择出的区域;
提取所述区域内的超链接的地址;
将所述超链接的地址添加到收藏夹内。
优选的,所述根据接收到的位置信息确定其在网页上选择出的区域包括:
根据接收到的包括用户当前正在浏览的网页的URL,及用户选择的区域在所述网页内的坐标确定区域。
优选的,所述根据接收到的包括用户当前正在浏览的网页的URL,及用户选择的区域在所述网页内的坐标确定区域包括:
根据用户当前正在浏览的网页的URL,及用户框选的区域的左上角和右下角在所述网页内的坐标确定区域;和/或
根据用户当前正在浏览的网页的URL,及用户框选的区域的左上角的坐标加上长和宽的值确定区域。
优选的,所述提取所述区域内的全部超链接的地址包括:
从网页的源代码中获取所述区域对应的源代码;
对所述区域对应的源代码进行分析,并根据分析结果将所述区域对应的源代码中包含的超链接的地址提取出来。
优选的,所述将所述超链接的地址全部添加到浏览器的收藏夹内还包括:
将添加收藏的结果通知给用户。
优选的,所述将所述超链接的地址添加到收藏夹内包括:
将所述超链接的地址添加到收藏夹内一个或多个收藏项中。
优选的,所述将所述超链接的地址添加到收藏夹内还包括:
对所述超链接进行过滤,将经过过滤处理后的超链接的地址添加到收藏夹内。
进一步的,所述对所述超链接进行过滤包括:
通过锚文本或者链接分析文件对所述超链接的地址按照预置的过滤规则进行过滤,去除无效链接和/或广告链接。
优选的,所述预置的过滤规则为系统预置和/或用户自定义的。
优选的,所述对所述超链接进行过滤包括:
通过锚文本对所述超链接网站或网页的自我描述进行过滤,去除无效链接和/或广告链接。
进一步的,所述超链接网站或网页的自我描述按照如下任意一种方式获得:
向所述超链接网站发送请求;或者
登陆所述超链接网站或访问所述超链接网页;或者
通过搜索引擎搜索所述超链接网站或网页。
优选的,所述方法还包括:
将所述超链接网站或网页的自我描述作为收藏链接对应的描述显示给用户。
优选的,所述区域为一个或多个。
一种批量收藏网页的系统,包括:
用户数据接收模块,用于接收用户在网页上选择出的区域的位置信息;
超链接提取模块,用于根据接收到的位置信息确定其在网页上对应的区域,提取所述区域内的超链接的地址;
收藏夹添加模块,用于将所述超链接的地址添加到收藏夹内。
优选的,所述超链接提取模块包括:
区域确定单元,用于根据接收到的包括用户当前正在浏览的网页的URL,及用户选择的区域在所述网页内的坐标确定区域。
优选的,所述区域确定单元包括:
第一区域确定子单元,用于根据用户当前正在浏览的网页的URL,及用户框选的区域的左上角和右下角在所述网页内的坐标确定区域;和/或
第二区域确定子单元,用于根据用户当前正在浏览的网页的URL,及用户框选的区域的左上角的坐标加上长和宽的值确定区域。
优选的,所述超链接提取模块还包括:
获取单元,用于从网页的源代码中获取所述区域对应的源代码;
提取单元,用于对所述区域对应的源代码进行分析,根据分析结果将所述区域对应的源代码中包含的超链接的地址提取出来。
优选的,所述系统还包括:
通知模块,用于将添加收藏的结果通知给用户。
优选的,所述收藏夹添加模块具体是将所述超链接的地址添加到收藏夹内一个或多个收藏项中。
优选的,所述系统还包括:
超链接过滤模块,用于对所述超链接提取模块提取出的所述超链接进行过滤,将经过过滤处理后的超链接的地址提供给所述收藏夹添加模块。
进一步的,所述超链接过滤模块具体是通过锚文本或者链接分析文件对所述超链接的地址按照预置的过滤规则进行过滤,去除无效链接和/或广告链接。
优选的,所述预置的过滤规则为系统预置和/或用户自定义的。
优选的,所述超链接过滤模块具体是通过锚文本对所述超链接网站或网页的自我描述进行过滤,去除无效链接和/或广告链接。
进一步的,所述超链接网站或网页的自我描述按照如下任意一种方式获得:
向所述超链接网站发送请求;或者
登陆所述超链接网站或访问所述超链接网页;或者
通过搜索引擎搜索所述超链接网站或网页。
优选的,所述系统还包括:
显示模块,用于将所述超链接网站或网页的自我描述作为收藏链接对应的描述显示给用户。
优选的,所述区域为一个或多个。
优选的,所述系统为浏览器。
本发明实施例提供一种批量收藏网页的方法及系统,用户只需要在网页内框选出感兴趣的区域,浏览器便可以自动分析框选区域中的所有超链接的地址,并可以一次性添加到收藏夹中,从而轻松的达到添加目的,而无需用户重复大量相同的操作,大大简化了用户的操作。此外,通过鼠标与键盘的配合,用户可以更为轻松的实现网页上多块区域内所有超链接的一次性收藏,提升了批量收藏网页的用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是应用场景示意图;
图2是本发明实施例提供的批量收藏网页的方法概括流程图;
图3是本发明实施例提供的批量收藏网页的方法具体流程图;
图4是本发明实施例提供的批量收藏网页的系统概括结构示意图;
图5是本发明实施例提供的批量收藏网页的系统具体结构示意图;
图6是本发明实施例提供的批量收藏网页的系统另一具体结构示意图。
具体实施方式
本发明实施例提供一种批量收藏网页的方法及系统,能够将用户需要添加的多个网页一次性添加到收藏夹中。为使本发明的目的、技术方案及优点更加清楚明白,下面参照附图并举实施例,对本发明进一步详细说明。
如图2所示,为本发明实施例提供的批量收藏网页的方法概括流程图。所述方法包括:
步骤201、根据接收到的位置信息确定其在网页上选择出的区域;
步骤202、提取所述区域内的超链接的地址;
步骤203、将所述超链接的地址添加到收藏夹内。
如图3所示,为本发明实施例提供的批量收藏网页的方法具体流程图。所述方法具体包括:
步骤301、接收用户选择区域的位置信息;
具体而言,所述位置信息包括用户当前正在浏览的网页的URL,及用户选择的每个区域在所述网页内的坐标。用户选择区域的方式有很多,例如,用户使用鼠标或手写笔或触摸屏等方式在网页上选出一块区域。另外,该区域的形状可以为任意,例如圆形、方形、多边形、不规则形状等,本发明对此不作限制。如果用户选择的区域不只一块,还可以通过键盘协助框选,例如,用户使用鼠标在网页上先框选出一块区域,然后按住键盘的Ctrl功能键,在网页上进行多块内容的框选。
步骤302、根据接收到的位置信息确定每个区域;
具体而言,根据接收到的位置信息确定每个区域的方式有很多,例如,根据用户当前正在浏览的网页的URL,及用户框选的每个区域的左上角和右下角在所述网页内的坐标确定每个区域。再例如,根据用户当前正在浏览的网页的URL,及用户框选的每个区域的左上角的坐标加上长和宽的值确定每个区域。
步骤303、从网页的HTML源代码中获取所述每个区域对应的HTML源代码;
需要说明的是,本发明实施例是以HTML源代码为例进行说明的,可以理解的是,本发明对网页源代码并不加以限制,也就是说,除了本发明实施例的HTML源代码以外,其他网页的源代码也同样适用。
步骤304、对所述部分HTML源代码进行分析,并根据分析结果将所述HTML源代码中包含的所有的超链接的地址提取出来;
需要说明的是,除了本发明实施例所述的提取所有的超链接地址之外,还可以通过快捷键配合鼠标或者其他某种方式,手工去掉其中的某个或某几个超链接,仅保留剩下的超链接地址,以后后续添加到收藏夹内。
步骤305、将所述超链接的地址全部添加到浏览器的收藏夹内;
具体而言,可以将所述全部超链接的地址添加到浏览器的收藏夹内一个收藏项中,这样用户在下次打开收藏夹时,点开该收藏项则自动打开原先区域内的全部链接。当然,也可以将所述全部超链接的地址分别添加到浏览器的收藏夹内多个收藏项中,这样用户可以分别管理并有效区分。
需要说明的是,本发明实施例是以浏览器的收藏夹为例进行说明的,可以理解的是,除了本发明实施例所述的浏览器的收藏夹以外,其他工具的收藏夹也同样适用,例如word或者即时通讯软件等工具的收藏夹。
另外,添加收藏的方式也有多种,例如可以通过添加收藏的选项添加至收藏夹内,还可以通过鼠标、手写笔或触摸屏等方式执行拖拽操作添加至收藏夹内,本发明对此不作限制。
步骤306、将添加收藏的结果通知给用户。
具体而言,如果用户添加收藏成功,则通过对话框提醒用户本次添加完成,是否继续添加;如果用户添加收藏失败,则通过对话框提醒用户本次添加失败,是否重新添加。需要说明的是,所述步骤306为可选步骤。
需要说明的是,上述流程中的步骤304和305之间还可以进一步包括:
步骤304’、对所述超链接的进行过滤,将经过过滤处理后的超链接的地址添加到浏览器的收藏夹内。
其中,通过锚文本或者链接分析文件对所述超链接的地址按照预置的过滤规则进行过滤去除无效链接和/或广告链接。所述预置的过滤规则可以是浏览器预置的,也可以是用户自定义添加的。例如浏览器预置了包含大部分广告页面的超链接(黑名单)的规则库,用户使用过程中用户可以在此基础上陆续添加补充。用户也可以定义符合自己需求的规则加入该规则库中,用来过滤用户不需要的超链接类型。
在具体实现时,可以到存储有过滤规则的规则库中查询,如果步骤304中提取的超链接满足其中的一项规则则自动去除。所述过滤规则可以有很多,例如去除广告链接、去除无效链接等。其中,对于无效链接的判断,其方法也有很多,例如向每个链接发一个http请求头,检查返回值,如果是无效的返回值,则判定该链接为无效链接。
另外,除了上述过滤方式之外,还可以通过锚文本对所述超链接网站或网页的自我描述进行过滤,去除无效链接和/或广告链接。其中,所述超链接网站或网页的自我描述的获得方式有多种,例如可以向所述超链接网站发送请求获得所述超链接网站或网页的自我描述;也可以登陆所述超链接网站或访问所述超链接网页获得所述超链接网站或网页的自我描述;还可以通过搜索引擎搜索所述超链接网站或网页获得所述超链接网站或网页的自我描述。本发明实施例所述的自我描述是一个广泛的定义,其可以是网站或网页自身提供的用于表述该网站或网页特点的信息,或者是希望用户点击查看的具有吸引性质的信息。例如,可以做出来一个垃圾网站的列表,但垃圾网站一般会通过欺骗性的锚文本,通过向该网站发送请求、或者登陆该超链接网站,或者通过搜索引擎搜索该超链接等方式获得该网站的自我描述,从而对垃圾网站进行过滤。此外,还可以将所述超链接网站或网页的自我描述作为收藏链接对应的描述显示给用户。
如图4所示,为本发明实施例提供的批量收藏网页的系统概括结构示意图。该系统包括:用户数据接收模块410、超链接提取模块420、收藏夹添加模块430;其中:
所述用户数据接收模块410,用于接收用户在网页上选择出的区域的位置信息;
所述超链接提取模块420,用于根据所述用户数据接收模块410接收到的位置信息确定其在网页上对应的区域,提取所述区域内的超链接的地址;
所述收藏夹添加模块430,用于将所述超链接提取模块420提取的超链接的地址添加到收藏夹内。
需要说明的是,所述系统为浏览器。
具体而言,如图5所示,为本发明实施例提供的批量收藏网页的系统具体结构示意图。该系统包括:用户数据接收模块510、超链接提取模块520、收藏夹添加模块530;其中:
所述用户数据接收模块510,用于接收用户在网页上选择出的区域的位置信息;所述位置信息包括用户当前正在浏览的网页的URL,及用户选择的每个区域在所述网页内的坐标。用户选择区域的方式有很多,例如,用户使用鼠标或手写笔或触摸屏等方式在网页上选出一块区域。另外,该区域的形状可以为任意,例如圆形、方形、多边形、不规则形状等,本发明对此不作限制。如果用户选择的区域不只一块,还可以通过键盘协助框选,例如,用户使用鼠标在网页上先框选出一块区域,然后按住键盘的Ctrl功能键,在网页上进行多块内容的框选。
所述超链接提取模块520包括:区域确定单元521、获取单元522、提取单元523;其中:
所述区域确定单元521根据接收到的包括用户当前正在浏览的网页的URL,及用户选择的区域在所述网页内的坐标确定每个区域。更具体的,所述区域确定单元521包括:第一区域确定子单元,用于根据用户当前正在浏览的网页的URL,及用户框选的区域的左上角和右下角在所述网页内的坐标确定区域;和/或,第二区域确定子单元,用于根据用户当前正在浏览的网页的URL,及用户框选的区域的左上角的坐标加上长和宽的值确定区域。
所述获取单元522从网页的源代码中获取所述区域对应的源代码;需要说明的是,本发明实施例是以HTML源代码为例进行说明的,可以理解的是,本发明对网页源代码并不加以限制,也就是说,除了本发明实施例的HTML源代码以外,其他网页的源代码也同样适用。
所述提取单元523对所述区域对应的源代码进行分析,根据分析结果将所述区域对应的源代码中包含的超链接的地址提取出来。需要说明的是,除了本发明实施例所述的提取所有的超链接地址之外,还可以通过快捷键配合鼠标或者其他某种方式,手工去掉其中的某个或某几个超链接,仅保留剩下的超链接地址,以后后续添加到收藏夹内。
所述收藏夹添加模块530,用于将所述超链接的地址添加到收藏夹内;其中,可以将所述全部超链接的地址添加到浏览器的收藏夹内一个收藏项中,这样用户在下次打开收藏夹时,点开该收藏项则自动打开原先区域内的全部链接。当然,也可以将所述全部超链接的地址分别添加到浏览器的收藏夹内多个收藏项中。需要说明的是,本发明实施例是以浏览器的收藏夹为例进行说明的,可以理解的是,除了本发明实施例所述的浏览器的收藏夹以外,其他工具的收藏夹也同样适用,例如word或者即时通讯软件等工具的收藏夹。另外,添加收藏的方式也有多种,例如可以通过添加收藏的选项添加至收藏夹内,还可以通过鼠标、手写笔或触摸屏等方式执行拖拽操作添加至收藏夹内,本发明对此不作限制。
更进一步的,所述批量收藏网页的系统还可以包括:通知模块540,用于将添加收藏的结果通知给用户。具体而言,如果用户添加收藏成功,则通过对话框提醒用户本次添加完成,是否继续添加;如果用户添加收藏失败,则通过对话框提醒用户本次添加失败,是否重新添加。
更进一步的,所述批量收藏网页的系统还可以包括:超链接过滤模块630,如图6所示,用户数据接收模块610接收用户在网页上选择出的区域的位置信息;超链接提取模块620根据所述用户数据接收模块610接收到的位置信息确定其在网页上对应的区域,提取所述区域内的全部超链接的地址;超链接过滤模块630对所述超链接提取模块620提取出的所述超链接的地址按照预置的过滤规则进行过滤,将经过过滤处理后的超链接的地址提供给收藏夹添加模块640;收藏夹添加模块640将经过超链接过滤模块630过滤后的超链接的地址添加到浏览器的收藏夹内。
需要说明的是,所述超链接过滤模块630具体可以通过锚文本或者链接分析文件对所述超链接的地址按照预置的过滤规则进行过滤,去除无效链接和/或广告链接;也可以通过锚文本对所述超链接网站或网页的自我描述进行过滤,去除无效链接和/或广告链接。其中,所述预置的过滤规则可以是系统预置的,也可以是用户自定义的。而所述过滤规则可以包括:去除无效链接,和/或去除广告链接等。所述超链接网站或网页的自我描述的获得方式有很多种,例如可以向所述超链接网站发送请求获得所述超链接网站或网页的自我描述;也可以登陆所述超链接网站或访问所述超链接网页获得所述超链接网站或网页的自我描述;还可以通过搜索引擎搜索所述超链接网站或网页获得所述超链接网站或网页的自我描述。同时,所述系统还可以进一步包括显示模块600,用于将所述超链接网站的自我描述作为收藏链接对应的描述显示给用户。
需要说明的是,上述方法各实施例的说明也同样适用于装置各实施例。
下面,通过一个具体应用实例对本发明作进一步说明。用户使用浏览器浏览网页,在www.hao123.com主页上发现有一批网页链接属于自己感兴趣的范围,希望全部添加到浏览器收藏夹内,于是用鼠标框选了一块区域,该区域内包含“音乐,视频,游戏...”等多个超链接。用户在选择的区域内点击鼠标右键,并选择“全部添加到收藏夹”,浏览器根据用户选择的区域在网页中的坐标位置,找到网页HTML源代码中的对应部分,自动分析出该区域内所有的超链接的地址,并添加到浏览器收藏夹内。
接着,用户访问123.sogou.com主页,对页面上两个区域内的网页超链接都感兴趣,都想添加到浏览器收藏夹内。于是,用户先用鼠标框选出第一个区域,然后按下键盘上的Ctrl键,接着用鼠标框选出第二个区域。选择完毕后在该两个区域中的任何一个区域内点击鼠标右键,选择“全部添加到收藏夹”,浏览器会根据用户选择的区域在网页中的坐标位置,找到网页HTML源代码中的对应部分,自动分析该两个区域内所有的超链接的地址,并一次性添加到浏览器的收藏夹内。
本领域普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
综上所述,本发明提供了一种批量收藏网页的方法及系统,用户只需要在网页内框选出感兴趣的区域,浏览器便可以自动分析框选区域中的所有超链接的地址,并可以一次性添加到收藏夹中,从而轻松的达到添加目的,而无需用户重复大量相同的操作,大大简化了用户的操作。此外,通过鼠标与键盘的配合,用户可以更为轻松的实现网页上多块区域内所有超链接的一次性收藏,提升了批量收藏网页的用户体验。
以上对本发明所提供的批量收藏网页的方法及系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方案;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (27)

1.一种批量收藏网页的方法,其特征在于,包括:
根据接收到的位置信息确定其在网页上选择出的区域;
提取所述区域内的超链接的地址;
将所述超链接的地址添加到收藏夹内。
2.根据权利要求1所述的批量收藏网页的方法,其特征在于,所述根据接收到的位置信息确定其在网页上选择出的区域包括:
根据接收到的包括用户当前正在浏览的网页的URL,及用户选择的区域在所述网页内的坐标确定区域。
3.根据权利要求2所述的批量收藏网页的方法,其特征在于,所述根据接收到的包括用户当前正在浏览的网页的URL,及用户选择的区域在所述网页内的坐标确定区域包括:
根据用户当前正在浏览的网页的URL,及用户框选的区域的左上角和右下角在所述网页内的坐标确定区域;和/或
根据用户当前正在浏览的网页的URL,及用户框选的区域的左上角的坐标加上长和宽的值确定区域。
4.根据权利要求1所述的批量收藏网页的方法,其特征在于,所述提取所述区域内的超链接的地址包括:
从网页的源代码中获取所述区域对应的源代码;
对所述区域对应的源代码进行分析,并根据分析结果将所述区域对应的源代码中包含的超链接的地址提取出来。
5.根据权利要求1所述的批量收藏网页的方法,其特征在于,所述方法还包括:
将添加收藏的结果通知给用户。
6.根据权利要求1所述的批量收藏网页的方法,其特征在于,所述将所述超链接的地址添加到收藏夹内包括:
将所述超链接的地址添加到收藏夹内一个或多个收藏项中。
7.根据权利要求1所述的批量收藏网页的方法,其特征在于,所述将所述超链接的地址添加到收藏夹内还包括:
对所述超链接进行过滤,将经过过滤处理后的超链接的地址添加到收藏夹内。
8.根据权利要求7所述的批量收藏网页的方法,其特征在于,所述对所述超链接进行过滤包括:
通过锚文本或者链接分析文件对所述超链接的地址按照预置的过滤规则进行过滤,去除无效链接和/或广告链接。
9.根据权利要求8所述的批量收藏网页的方法,其特征在于,所述预置的过滤规则为系统预置和/或用户自定义的。
10.根据权利要求7所述的批量收藏网页的方法,其特征在于,所述对所述超链接进行过滤包括:
通过锚文本对所述超链接网站或网页的自我描述进行过滤,去除无效链接和/或广告链接。
11.根据权利要求10所述的批量收藏网页的方法,其特征在于,所述超链接网站或网页的自我描述按照如下任意一种方式获得:
向所述超链接网站发送请求;或者
登陆所述超链接网站或访问所述超链接网页;或者
通过搜索引擎搜索所述超链接网站或网页。
12.根据权利要求1所述的批量收藏网页的方法,其特征在于,还包括:
将所述超链接网站或网页的自我描述作为收藏链接对应的描述显示给用户。
13.根据权利要求1至12任意一项所述的批量收藏网页的方法,其特征在于,所述区域为一个或多个。
14.一种批量收藏网页的系统,其特征在于,包括:
用户数据接收模块,用于接收用户在网页上选择出的区域的位置信息;
超链接提取模块,用于根据接收到的位置信息确定其在网页上对应的区域,提取所述区域内的超链接的地址;
收藏夹添加模块,用于将所述超链接的地址添加到收藏夹内。
15.根据权利要求14所述的批量收藏网页的系统,其特征在于,所述超链接提取模块包括:
区域确定单元,用于根据接收到的包括用户当前正在浏览的网页的URL,及用户选择的区域在所述网页内的坐标确定区域。
16.根据权利要求15所述的批量收藏网页的系统,其特征在于,所述区域确定单元包括:
第一区域确定子单元,用于根据用户当前正在浏览的网页的URL,及用户框选的区域的左上角和右下角在所述网页内的坐标确定区域;和/或
第二区域确定子单元,用于根据用户当前正在浏览的网页的URL,及用户框选的区域的左上角的坐标加上长和宽的值确定区域。
17.根据权利要求15所述的批量收藏网页的系统,其特征在于,所述超链接提取模块还包括:
获取单元,用于从网页的源代码中获取所述区域对应的源代码;
提取单元,用于对所述区域对应的源代码进行分析,根据分析结果将所述区域对应的源代码中包含的超链接的地址提取出来。
18.根据权利要求14所述的批量收藏网页的系统,其特征在于,所述系统还包括:
通知模块,用于将添加收藏的结果通知给用户。
19.根据权利要求14所述的批量收藏网页的系统,其特征在于,所述收藏夹添加模块具体是将所述超链接的地址添加到收藏夹内一个或多个收藏项中。
20.根据权利要求14所述的批量收藏网页的系统,其特征在于,所述系统还包括:
超链接过滤模块,用于对所述超链接提取模块提取出的所述超链接进行过滤,将经过过滤处理后的超链接的地址提供给所述收藏夹添加模块。
21.根据权利要求20所述的批量收藏网页的系统,其特征在于,所述超链接过滤模块具体是通过锚文本或者链接分析文件对所述超链接的地址按照预置的过滤规则进行过滤,去除无效链接和/或广告链接。
22.根据权利要求21所述的批量收藏网页的系统,其特征在于,所述预置的过滤规则为系统预置和/或用户自定义的。
23.根据权利要求20所述的批量收藏网页的系统,其特征在于,所述超链接过滤模块具体是通过锚文本对所述超链接网站或网页的自我描述进行过滤,去除无效链接和/或广告链接。
24.根据权利要求23所述的批量收藏网页的系统,其特征在于,所述超链接网站或网页的自我描述按照如下任意一种方式获得:
向所述超链接网站发送请求;或者
登陆所述超链接网站或访问所述超链接网页;或者
通过搜索引擎搜索所述超链接网站或网页。
25.根据权利要求14所述的批量收藏网页的方法,其特征在于,还包括:
显示模块,用于将所述超链接网站或网页的自我描述作为收藏链接对应的描述显示给用户。
26.根据权利要求16至25任意一项所述的批量收藏网页的系统,其特征在于,所述区域为一个或多个。
27.根据权利要求16至25任意一项所述的批量收藏网页的系统,其特征在于,所述系统为浏览器。
CN200910088286.2A 2009-07-13 2009-07-13 一种批量收藏网页的方法及系统 Active CN101957818B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910088286.2A CN101957818B (zh) 2009-07-13 2009-07-13 一种批量收藏网页的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910088286.2A CN101957818B (zh) 2009-07-13 2009-07-13 一种批量收藏网页的方法及系统

Publications (2)

Publication Number Publication Date
CN101957818A true CN101957818A (zh) 2011-01-26
CN101957818B CN101957818B (zh) 2014-08-13

Family

ID=43485151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910088286.2A Active CN101957818B (zh) 2009-07-13 2009-07-13 一种批量收藏网页的方法及系统

Country Status (1)

Country Link
CN (1) CN101957818B (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102231157A (zh) * 2011-06-17 2011-11-02 深圳市五巨科技有限公司 一种移动终端批量查看页面的方法和装置
CN102591975A (zh) * 2012-01-04 2012-07-18 北京飞漫软件技术有限公司 一种个性化网址导航实现方法
CN102624910A (zh) * 2012-03-15 2012-08-01 华为技术有限公司 处理用户选取的网页内容的方法、装置及系统
CN102722322A (zh) * 2012-05-22 2012-10-10 百度在线网络技术(北京)有限公司 一种用于收藏页面对象的方法与设备
CN102819554A (zh) * 2012-06-26 2012-12-12 北京奇虎科技有限公司 一种收藏夹数据的处理方法、装置和服务器
CN102830894A (zh) * 2012-05-11 2012-12-19 北京奇虎科技有限公司 一种收藏网页的方法和装置
CN102929984A (zh) * 2012-10-18 2013-02-13 北京奇虎科技有限公司 失效网址搜索方法和装置
CN102929985A (zh) * 2012-10-18 2013-02-13 北京奇虎科技有限公司 一种收藏网页展示的方法和系统
CN102937981A (zh) * 2012-10-18 2013-02-20 北京奇虎科技有限公司 网页呈现系统和方法
CN102945259A (zh) * 2012-10-18 2013-02-27 北京奇虎科技有限公司 一种基于收藏夹的搜索方法和搜索装置
CN103154937A (zh) * 2010-10-04 2013-06-12 三星电子株式会社 用于将超链接的地址插入书签的方法和设备
CN103856294A (zh) * 2012-11-29 2014-06-11 北京千橡网景科技发展有限公司 实时自动校验链接的方法和设备
WO2015027855A1 (zh) * 2013-08-27 2015-03-05 腾讯科技(深圳)有限公司 基于二维码的网站链接处理方法、装置及系统
CN104809116A (zh) * 2014-01-24 2015-07-29 腾讯科技(深圳)有限公司 一种收藏内容的方法、装置及终端
CN106021589A (zh) * 2016-06-06 2016-10-12 腾讯科技(深圳)有限公司 一种网页地址分享方法和装置
CN107193976A (zh) * 2017-05-25 2017-09-22 北京小米移动软件有限公司 信息资源显示方法、装置及计算机可读存储介质
WO2018018289A1 (zh) * 2016-07-24 2018-02-01 张鹏华 一种延后阅读技术的数据采集方法和阅读系统
CN108259183A (zh) * 2018-01-12 2018-07-06 武汉斗鱼网络科技有限公司 一种关注方法、装置、电子设备及介质
CN111246372A (zh) * 2012-12-14 2020-06-05 苹果公司 移动设备的统一资源定位符(url)的列表的位置感知管理
CN111400566A (zh) * 2020-02-10 2020-07-10 北京物资学院 一种将网页搜索结果分类管理的方法及装置
US11416575B2 (en) 2020-07-06 2022-08-16 Grokit Data, Inc. Automation system and method

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101419617A (zh) * 2008-12-10 2009-04-29 深圳市迅雷网络技术有限公司 一种确定网页对象的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101170763A (zh) * 2006-10-24 2008-04-30 张扬 手机浏览器用户接口的系统与装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101419617A (zh) * 2008-12-10 2009-04-29 深圳市迅雷网络技术有限公司 一种确定网页对象的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SILVERBABY: "疾速浏览Maxthon过滤漂浮Flash广告全攻略", 《太平洋电脑网》 *

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103154937A (zh) * 2010-10-04 2013-06-12 三星电子株式会社 用于将超链接的地址插入书签的方法和设备
CN102231157B (zh) * 2011-06-17 2013-01-16 深圳市五巨科技有限公司 一种移动终端批量查看页面的方法和装置
CN102231157A (zh) * 2011-06-17 2011-11-02 深圳市五巨科技有限公司 一种移动终端批量查看页面的方法和装置
CN102591975A (zh) * 2012-01-04 2012-07-18 北京飞漫软件技术有限公司 一种个性化网址导航实现方法
CN102624910A (zh) * 2012-03-15 2012-08-01 华为技术有限公司 处理用户选取的网页内容的方法、装置及系统
CN102624910B (zh) * 2012-03-15 2015-11-25 华为技术有限公司 处理用户选取的网页内容的方法、装置及系统
CN102830894A (zh) * 2012-05-11 2012-12-19 北京奇虎科技有限公司 一种收藏网页的方法和装置
CN102722322A (zh) * 2012-05-22 2012-10-10 百度在线网络技术(北京)有限公司 一种用于收藏页面对象的方法与设备
CN102819554A (zh) * 2012-06-26 2012-12-12 北京奇虎科技有限公司 一种收藏夹数据的处理方法、装置和服务器
CN102819554B (zh) * 2012-06-26 2015-11-25 北京奇虎科技有限公司 一种收藏夹数据的处理方法、装置和服务器
CN102945259B (zh) * 2012-10-18 2016-06-22 北京奇虎科技有限公司 一种基于收藏夹的搜索方法和搜索装置
CN102945259A (zh) * 2012-10-18 2013-02-27 北京奇虎科技有限公司 一种基于收藏夹的搜索方法和搜索装置
CN102937981A (zh) * 2012-10-18 2013-02-20 北京奇虎科技有限公司 网页呈现系统和方法
CN102929985A (zh) * 2012-10-18 2013-02-13 北京奇虎科技有限公司 一种收藏网页展示的方法和系统
CN102929984B (zh) * 2012-10-18 2016-06-22 北京奇虎科技有限公司 失效网址搜索方法和装置
CN102929984A (zh) * 2012-10-18 2013-02-13 北京奇虎科技有限公司 失效网址搜索方法和装置
CN103856294A (zh) * 2012-11-29 2014-06-11 北京千橡网景科技发展有限公司 实时自动校验链接的方法和设备
CN111246372A (zh) * 2012-12-14 2020-06-05 苹果公司 移动设备的统一资源定位符(url)的列表的位置感知管理
WO2015027855A1 (zh) * 2013-08-27 2015-03-05 腾讯科技(深圳)有限公司 基于二维码的网站链接处理方法、装置及系统
CN104809116B (zh) * 2014-01-24 2018-10-19 腾讯科技(深圳)有限公司 一种收藏内容的方法、装置及终端
US10732800B2 (en) 2014-01-24 2020-08-04 Tencent Technology (Shenzhen) Company Limited Method and system for collecting content
US10338777B2 (en) 2014-01-24 2019-07-02 Tencent Technology (Shenzhen) Company Limited Method and system for collecting content
CN104809116A (zh) * 2014-01-24 2015-07-29 腾讯科技(深圳)有限公司 一种收藏内容的方法、装置及终端
CN106021589A (zh) * 2016-06-06 2016-10-12 腾讯科技(深圳)有限公司 一种网页地址分享方法和装置
WO2018018289A1 (zh) * 2016-07-24 2018-02-01 张鹏华 一种延后阅读技术的数据采集方法和阅读系统
CN107193976B (zh) * 2017-05-25 2024-03-29 北京小米移动软件有限公司 信息资源显示方法、装置及计算机可读存储介质
CN107193976A (zh) * 2017-05-25 2017-09-22 北京小米移动软件有限公司 信息资源显示方法、装置及计算机可读存储介质
CN108259183B (zh) * 2018-01-12 2021-02-02 武汉斗鱼网络科技有限公司 一种关注方法、装置、电子设备及介质
CN108259183A (zh) * 2018-01-12 2018-07-06 武汉斗鱼网络科技有限公司 一种关注方法、装置、电子设备及介质
CN111400566A (zh) * 2020-02-10 2020-07-10 北京物资学院 一种将网页搜索结果分类管理的方法及装置
US11416575B2 (en) 2020-07-06 2022-08-16 Grokit Data, Inc. Automation system and method
US11568019B2 (en) 2020-07-06 2023-01-31 Grokit Data, Inc. Automation system and method
US11580190B2 (en) 2020-07-06 2023-02-14 Grokit Data, Inc. Automation system and method
US11640440B2 (en) * 2020-07-06 2023-05-02 Grokit Data, Inc. Automation system and method
US11860967B2 (en) 2020-07-06 2024-01-02 The Iremedy Healthcare Companies, Inc. Automation system and method
US11983236B2 (en) 2020-07-06 2024-05-14 The Iremedy Healthcare Companies, Inc. Automation system and method

Also Published As

Publication number Publication date
CN101957818B (zh) 2014-08-13

Similar Documents

Publication Publication Date Title
CN101957818B (zh) 一种批量收藏网页的方法及系统
RU2522103C2 (ru) Способ и браузер для уведомления об обновлении
CN102073726B (zh) 搜索引擎系统的结构化数据的引入方法和装置
CN102930057A (zh) 搜索实现方法和装置
US20080163067A1 (en) System for visualizing weblog social network communities
JP2002544595A (ja) リンクされる文書の階層構成の中の文書を表現するデータファイルの修正
CN101882162A (zh) 一种网络信息推送方法及系统
CN104063454A (zh) 一种挖掘用户需求的搜索推送方法和装置
CN102930058A (zh) 一种在浏览器的地址栏中实现搜索的方法和装置
CN102930059A (zh) 一种聚焦爬虫的设计方法
CN103544178A (zh) 一种用于提供与目标页面相对应的重构页面的方法和设备
CN102750352A (zh) 浏览器中分类收藏历史访问记录的方法及装置
CN102982117A (zh) 信息搜索方法和装置
CN102880711A (zh) 浏览器地址栏中输入数据的处理方法和处理装置
CN102982118A (zh) 一种基于收藏夹的搜索方法和装置
CN103577566A (zh) 一种网页阅读内容加载方法和装置
CN101188521B (zh) 一种挖掘用户行为数据的方法和网站服务器
CN103258058A (zh) 页面展现方法、系统及浏览器
CN104391978A (zh) 用于浏览器的网页收藏处理方法及装置
CN108763500A (zh) 基于语音的网页浏览方法、装置、设备及存储介质
CN108647312A (zh) 一种用户偏好分析方法及其装置
CN103324379A (zh) 一种网页获取方法和装置
CN101894109A (zh) 一种数据库建立方法和装置
CN101133415A (zh) 使用页面集而提供信息搜索服务的服务器、方法和系统
CN103617225A (zh) 一种关联网页搜索方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant