CN102760162A - 展现和获取下载链接的方法及装置 - Google Patents

展现和获取下载链接的方法及装置 Download PDF

Info

Publication number
CN102760162A
CN102760162A CN2012101918774A CN201210191877A CN102760162A CN 102760162 A CN102760162 A CN 102760162A CN 2012101918774 A CN2012101918774 A CN 2012101918774A CN 201210191877 A CN201210191877 A CN 201210191877A CN 102760162 A CN102760162 A CN 102760162A
Authority
CN
China
Prior art keywords
download link
download
page
link
preferred
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012101918774A
Other languages
English (en)
Inventor
田伟
应倩
苏雪峰
佟子健
茹立云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Beijing Sogou Information Service Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Beijing Sogou Information Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd, Beijing Sogou Information Service Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN2012101918774A priority Critical patent/CN102760162A/zh
Publication of CN102760162A publication Critical patent/CN102760162A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种展现和获取下载链接的方法及装置,其中的展现下载链接的方法具体包括:将当前浏览页面的页面信息进行发送;接收所述当前浏览页面对应的优选下载链接;所述优选下载链接在当前浏览页面为下载相关页面时,对下载相关页面的页面信息进行分析优选后所返回;对所述优选下载链接进行展现。本发明能够在用户使用浏览器浏览网页的过程中自动展现与下载相关页面相应资源的优选下载链接,能够提高浏览器的信息访问效率。

Description

展现和获取下载链接的方法及装置
技术领域
本申请涉及网络技术领域,特别是涉及一种展现和获取下载链接的方法及装置。
背景技术
随着互联网的发展,越来越多的用户习惯在网上下载想要的资源。
以软件资源为例,目前典型的下载流程通常包括:
步骤1、用户访问下载站点的软件描述页面;该软件描述页面为下载站点中展示版本、平台、占用空间大小、功能描述、更新时间、已被下载数量等软件信息的页面,该软件描述页面上往往具有一个以上链接;
步骤2、用户在该软件描述页面上寻找相应软件的下载链接,并点击下载。
目前下载站点为了自身利益,往往在软件描述页面上设计繁杂的内容,这会对用户的下载带来如下影响因素:
1、对于用户而言,除了相关软件的下载链接,软件描述页面上的其它链接均为干扰链接,这些干扰链接会干扰用户对相关软件的下载链接的寻找,降低用户的下载效率。
例如,有些下载站点为了推广有利益关系的软件、游戏或者广告,会将推广链接以醒目的方式显示,容易使用户误认为是相关软件的下载链接,造成无效的点击,并且会增加下载时间。
2、有些下载站点为了增加PV(页面浏览量,Page View),往往将软件描述页面和软件下载页面分置;这样,在不能从该软件描述页面上找到相关软件的下载链接时,用户需要在该软件描述页面上寻找软件下载页面的链接,并通过点击该软件下载页面的链接访问该软件下载页面,然后在该软件下载页面上寻找相关软件的下载链接;该软件下载页面为下载站点中展示下载链接供用户选择的页面,该软件下载页面上往往具有一个以上链接;两次寻找都会花费用户的下载时间,影响了浏览器的信息访问效率。
以上影响因素都会影响浏览器的信息访问效率。
总之,需要本领域技术人员迫切解决的一个技术问题就是:如何能够提高浏览器的信息访问效率。
发明内容
本申请所要解决的技术问题是提供一种展现和获取下载链接的方法及装置,能够在用户使用浏览器浏览网页的过程中自动展现与下载相关页面相应资源的优选下载链接,能够提高用户的下载效率和上网体验。
为了解决上述问题,本申请公开了一种展现下载链接的方法,包括:
将当前浏览页面的页面信息进行发送;
接收所述当前浏览页面对应的优选下载链接;所述优选下载链接在当前浏览页面为下载相关页面时,对下载相关页面的页面信息进行分析优选后所返回;
对所述优选下载链接进行展现。
另一方面,本申请还公开了一种获取下载链接的方法,包括:
依据当前浏览页面的页面信息,判定当前浏览页面是否为下载相关页面;
在当前浏览页面为下载相关页面时,依据所述下载相关页面的页面信息获取当前浏览页面相应资源的下载链接;
对所述下载链接进行分析优选,得到对应的优选下载链接;
浏览器服务器端将所述优选下载链接进行返回。
另一方面,本申请还公开了一种展现下载链接的装置,包括:
发送模块,用于将当前浏览页面的页面信息进行发送;
接收模块,用于接收所述当前浏览页面对应的优选下载链接;所述优选下载链接在当前浏览页面为下载相关页面时,对下载相关页面的页面信息进行分析优选后所返回;及
展现模块,用于对所述优选下载链接进行展现。
再一方面,本申请还公开了一种获取下载链接的装置,包括:
判定模块,用于依据当前浏览页面的页面信息,判定当前浏览页面是否为下载相关页面;
下载链接获取模块,用于在当前浏览页面为下载相关页面时,依据所述下载相关页面的页面信息获取当前浏览页面相应资源的下载链接;
优选分析模块,用于对所述下载链接进行分析优选,得到对应的优选下载链接;及
返回模块,用于将所述优选下载链接进行返回。
与现有技术相比,本申请具有以下优点:
本申请在用户使用浏览器浏览网页的过程中,自动展现与下载相关页面相应资源的优选下载链接;对于用户而言,其浏览下载相关页面往往是为了从下载相关页面上获取相应资源的下载链接,以完成下载,现有技术中其需要执行寻找操作以逐个排除干扰链接,故需要花费大量的时间和精力;而本申请自动展现与下载相关页面相应资源的优选下载链接的操作能够避免用户的寻找操作,减少用户的寻找操作所花费的时间;尤其在下载相关页面上的干扰链接繁多时,本申请能够大大提高浏览器的信息访问效率。
其次,所述优选下载链接可以为一个以上下载链接中质量最优的,此时能够节省用户从一个以上下载链接中选择一个最优的下载链接进行点击下载的时间,进一步提高浏览器的信息访问效率。
附图说明
图1是本申请一种获取下载链接的方法实施例1的流程图;
图2是本申请一种获取下载链接的方法实施例2的流程图;
图3是本申请一种获取下载链接的方法实施例3的流程图;
图4是本申请一种获取下载链接的方法实施例4的流程图;
图5是本申请一种展现下载链接的方法实施例的流程图;
图6是本申请一种获取下载链接的装置实施例的结构图;
图7是本申请一种展现下载链接的装置实施例的结构图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
本申请自动展现与下载相关页面相应资源的优选下载链接的操作能够避免用户的寻找操作,减少用户的寻找操作所花费的时间;尤其在下载相关页面上的干扰链接繁多时,本申请能够大大提高用户的下载效率和浏览器使用体验。
本申请实施例的下载相关页面分含有下载链接和不含有下载链接两种情况;其中,下载相关页面含有下载链接时,主要用于直接展示下载链接;下载相关页面不含下载链接时,主要用于通往直接展示下载链接的页面。为了简便起见,以下主要以典型的资源——软件为例进行说明,与软件相应的下载相关页面主要可以软件描述页面和软件下载页面,其它资源如文档、音乐、视频等请参照软件即可。
本申请给出如下应用场景:
应用场景1、
用户访问下载站点的软件描述页面;该软件描述页面为下载站点中展示版本、平台、占用空间大小、功能描述、更新时间、已被下载数量等软件信息的页面,该软件描述页面上设置有一个以上链接,其中的链接包括软件的下载链接。
如果使用现有技术,则用户不得不从该软件描述页面上设置的一个以上链接中寻找相应软件的下载链接,然后点击下载。
而本申请实施例会在浏览器客户端自动展现相应软件的下载链接,用户无需执行上述寻找操作,只需点击所述自动展现的相应软件的下载链接即可。
应用场景2、
用户访问下载站点的软件描述页面;该软件描述页面为下载站点中展示版本、平台、占用空间大小、功能描述、更新时间、已被下载数量等软件信息的页面,该软件描述页面上设置有一个以上链接,其中的链接不包括软件的下载链接。
如果使用现有技术,则用户首选尝试从该软件描述页面上设置的一个以上链接中寻找相应软件的下载链接,在寻找失败后,在该软件描述页面上寻找软件下载页面的链接,并通过点击该软件下载页面的链接访问该软件下载页面,然后在该软件下载页面上寻找相关软件的下载链接;两次寻找都会花费用户的下载时间。
而本申请实施例会在浏览器客户端自动展现相应软件的下载链接,用户无需执行上述寻找+点击+寻找操作,只需点击所述自动展现的相应软件的下载链接即可。
另外,本申请的下载相关页面与用户欲要下载的资源具有一一对应的关系,也即本申请“相应资源”用于表示与下载相关页面相应的资源。
参照图1,示出了本申请一种获取下载链接的方法实施例1的流程图,具体可以包括:
步骤101、浏览器服务器端依据当前浏览页面的页面信息,判定当前浏览页面是否为下载相关页面;
步骤102、在当前浏览页面为下载相关页面时,浏览器服务器端依据所述下载相关页面的页面信息获取当前浏览页面相应资源的下载链接;
步骤103、浏览器服务器端对下载链接进行分析优选,得到对应的优选下载链接;
步骤104、浏览器服务器端将所述优选下载链接返回给浏览器客户端。
在本申请实施例中,优选的是,当前浏览页面的页面信息主要可以包括如下信息中的一项或多项:当前浏览页面的URL(统一资源定位符,Uniform Resource Locator)、当前浏览页面的HTML(超文本标记语言,Hypertext Markup Language)。浏览器客户端可以直接发送当前浏览页面的URL到浏览器服务器端,浏览器服务器端触发该URL得到当前浏览页面的内容,也可以直接发送当前浏览页面的内容供浏览器服务器进行分析统计。
本申请可以提供如下判定当前浏览页面是否为下载相关页面的方案:
判定方案1、
将所述当前浏览页面的页面信息与预存的下载站点内下载相关页面的页面信息进行匹配,若匹配成功,则判定当前浏览页面为下载相关页面。
本申请发明人在研究中发现如下页面结构规律:同一下载站点内下载相关页面具有相同的结构,这些相同的结构主要可以包括:
A、URL的部分结构相同;例如,非凡软件站内http://www.crsky.com/soft/492.html、 http://www.crsky.com/soft/5814.html等下载相关页面的URL均包含http://www.crsky.com/soft/这一部分结构。
B、HTML的部分结构相同。
对于同一下载站点,其特定类页面HTML信息中的超级链接布局是相同的,这里的超级链接布局主要指链接出现的位置;由于下载相关页面就是特定类的页面,这样,同一下载站点中下载相关页面的链接会出现在相同的位置,而页面的HTML信息会包含链接的位置。
综上,判定方案1可以依据下载站点内下载相关页面进行页面解析,得到预存的下载站点内下载相关页面所具有的相同的URL结构和/或HTML结构,如果所述当前浏览页面的页面信息与预存的下载站点内下载相关页面的URL结构和/或HTML结构匹配成功,则可以判定当前浏览页面为下载相关页面。
关于下载站点内下载相关页面的数据来源,在实际中,可以依据全网网页浏览数据或若干下载站点的网页浏览数据进行挖掘得到。例如,可以依据页面的标题、正文、面包屑等基本特征,从下载站点内的网页浏览数据中提取出下载相关页面的集合。当然,也可以针对特定的下载站点,人工收集特定的下载相关页面,等等,本申请对具体的获取下载站点内下载相关页面的方法不加以限制。
在具体实现中,可以采用正则表达式进行URL结构的匹配。有可能字符串里有不止一个部分满足给定的正则表达式,这时每一个这样的部分被称为一个匹配。匹配在本文里可以包括三种含义:一种是形容词性的,比如说一个字符串匹配一个表达式;一种是动词性的,比如说在字符串里匹配正则表达式;还有一种是名词性的,就是刚刚说到的“字符串中满足给定的正则表达式的一部分”。
在实际应用中,可针对下载站点分析统计得到相应的URL结构匹配的正则表达式:例如,与下载站点:www.duote.com相应的URL结构匹配的正则表达式的一个例子为:http://www\.duote\.com/soft/\d+\.html;又如,与下载站点:www.onlinedown.net相应的URL结构匹配的正则表达式的一个例子为:http://www\.onlinedown\.net/soft-d+\.html等等。
在具体实现中,可以采用Xpath进行HTML结构的匹配。Xpath是一门在XML(可扩展标记语言,Extensible Markup Language)文档中查找信息的语言,Xpath可用于在XML文档中通过元素和属性进行导航。
在此提供一个Xpath的示例:“div[class='down_tree']//a/href”表示一个页面内部的文本的集合,该集合是“页面中所有class属性的值为down_tree的html标签的所有下级a标签的href属性”。
由于同一下载站点中下载相关页面的链接会出现在相同的位置,而Xpath能够代表页面中HTML的位置,故采用Xpath能够实现HTML结构的匹配。
判定方案2、
判定方案2采用统计模式识别方法,将下载类别和非下载类别的页面样本作为训练样本,训练得到页面模型。
判定方案2的实现过程具体可以包括:依据页面模型判别所述当前浏览页面是否为下载类别,若为下载类别,则判定当前浏览页面为下载相关页面;所述页面模型依据全网中抓取的页面元素和用户标识进行构造,用于判定当前浏览页面所属的类别。
由于相同类别样本在某些特征上具有一定的相似性,而不同类别样本之间才会具有一定的差异,故判定方案2采用统计模式识别算法构造的下载相关页面分类器具有下载相关页面和非下载相关页面的判别能力,因此,判别结果(下载类别或非下载类别)就可以表明当前浏览页面是否为下载相关页面。
本申请可以提供如下依据所述下载相关页面的页面信息获取相应资源的下载链接的方案:
获取方案1、
获取方案1的实现过程具体可以包括:提取所述下载相关页面中的位置信息,并依据所述位置信息分析出对应的下载链接。
前面提到,同一下载站点中特定类页面的链接会出现在相同的位置;故可以依据上述位置导航原理,从下载相关页面中提取位置信息,并进一步分析出对应的下载链接。
本申请可以提供如下获取方案1的应用方案:
应用方案1A、
所述下载相关页面含有所述下载链接时,所述浏览器服务器端依据所述页面信息进行分析,得到相应资源的下载链接在所述下载相关页面中的位置信息作为第一位置信息,并依据所述第一位置信息提取所述下载链接。
下载相关页面也即下载链接所在的页面,其主要用于直接展示下载链接,故应用方案1A可以依据从特定位置提取下载链接的技术原理进行下载链接的获取。
在本申请的一种优选实施例中,所述依据所述下载相关页面的页面信息得到相应资源的下载链接在所述下载相关页面中的位置信息的步骤,可以进一步包括:
步骤A1、依据所述下载相关页面的页面信息进行分析,得到所述下载相关页面的站点属性;
步骤A2、根据预存的站点属性与该站点内所述下载相关页面中相应资源的下载链接所对应的位置信息的关联关系,匹配得到相应资源的下载链接在所述下载相关页面中的位置信息作为第一位置信息。
本申请实施例中,所述下载相关页面的站点属性主要用来表示所述下载相关页面属于哪个下载站点。在当前浏览页面的URL和/或HTML已知的情况下,如何获取当前浏览页面的站点属性,最为简单的方案是分析统计各下载站点的URL结构,并将下载站点名称与相应的URL结构存储至站点属性数据库,这样,将当前浏览页面的URL与站点属性数据库中的URL结构进行匹配,即可得到相应的下载站点属性。
站点属性数据库中预存各下载站点的站点属性与站点内下载相关页面中下载链接对应的位置关系。这样,在下载相关页面含有下载链接时,根据下载相关页面的站点属性匹配得到该站点属性对应的相应资源的下载链接在下载相关页面中的位置信息,即第一位置信息。
当然,也可以采用前述判定当前浏览页面是否为下载相关页面的方案得到所述下载相关页面的下载站点属性。总之,本申请对于具体的依据所述下载相关页面的页面信息得到所述下载相关页面的下载站点属性的方法不加以限制。
在本申请的一种优选实施例中,可以通过如下步骤站点内所述下载相关页面中相应资源的下载链接所对应的位置信息的关联关系:
步骤B1、分别提取同一下载站点内各下载相关页面中的链接和所述链接在各下载相关页面中的相对位置,并分别统计下载相关页面中的各相对位置所对应的不同链接的数目;
步骤B2、将在所述不同链接的数目最大时所对应的相对位置作为相应下载站点内的下载链接在下载相关页面中的位置信息。
在此通过一个具体的例子说明上述步骤B1-步骤B2的实现过程。
假设某下载站点有页面1、页面2、页面3三个下载相关页面,相应的HTML结构(为清楚起见,用斜体表示)如下:
页面1:
Figure BDA00001751123000061
Figure BDA00001751123000071
页面2:
Figure BDA00001751123000072
页面3:
Figure BDA00001751123000073
则步骤B1对三个页面分别提取所有含有链接的Xpath,为清楚起见,用表格表示;参照表1、表2、表3分别示出了页面1、页面2、页面3的Xpath及相应的链接。
表1
  Xpath   链接
  /html/body/a[1]   http://mysoft.com/download.php?id=1
  /html/body/a[2]   http://www.crsky.com/
  /html/body/a[3]   http://mysoft.com/
表2
  Xpath   链接
  /html/body/a[1]   http://mysoft.com/download.php?id=2
  /html/body/a[2]   http://www.crsky.com/
  /html/body/a[3]   http://mysoft.com/
表3
  Xpath   链接
  /html/body/a[1]   http://mysoft.com/download.php?id=3
  /html/body/a[2]   http://www.crsky.com/
  /html/body/a[3]   http://mysoft.com/
合并表1、表2和表3,得到表4;
表4
  Xpath   链接
  /html/body/a[1]   http://mysoft.com/download.php?id=1
  /html/body/a[2]   http://www.crsky.com/
  /html/body/a[3]   http://mysoft.com/
  /html/body/a[1]   http://mysoft.com/download.php?id=2
  /html/body/a[2]   http://www.crsky.com/
  /html/body/a[3]   http://mysoft.com/
  /html/body/a[1]   http://mysoft.com/download.php?id=3
  /html/body/a[2]   http://www.crsky.com/
  /html/body/a[3]   http://mysoft.com/
统计每个Xpath对应的独立链接(不重复的链接)的数目;
独立链接的数目:
/html/body/a[1]3
/html/body/a[2]1
/html/body/a[3]1
步骤B2将最大统计结果对应的Xpath作为相应下载站点内下载相关页面中下载链接对应的位置信息。
/html/body/a[1]具有3个独立链接,明显比另外两个Xpath高,因此/html/body/a[1]判定为下载链接对应的Xpath。
应用方案1B、
应用方案1B的实现过程具体可以包括:所述下载相关页面不含所述下载链接时,所述浏览器服务器端依据所述页面信息转至含有相应资源的下载链接所在的二级下载页面进行分析,得到相应资源的下载链接在所述二级下载页面中的位置信息作为第二位置信息,并依据所述第二位置信息提取所述下载链接。
下载相关页面不含有下砸连接时,应用方案1B依据所述页面信息转至含有相应资源的下载链接所在的二级下载页面,然后采用与应用方案1A相同的方法依据从特定位置提取下载链接的技术原理进行下载链接的获取。
在本申请的一种优选实施例中,浏览器服务器端依据所述页面信息转至含有相应资源的下载链接所在的页面进行分析的步骤,可以进一步包括:
步骤C1、依据所述页面信息得到含有相应资源的下载链接所在的页面的站点属性;
步骤C2、根据预存的站点属性与该站点内二级下载页面中相应资源的下载链接所对应的位置信息的关联关系,匹配得到相应资源的下载链接在所述二级下载页面中的位置信息,作为第二位置信息;
步骤C3、依据所述第二位置信息从所述二级下载页面中提取相应资源的下载链接,得到相应资源的下载链接。
在本申请的一种优选实施例中,可以通过如下步骤得到站点内二级下载页面中相应资源的下载链接所对应的位置信息:
步骤D1、分别提取同一下载站点内各二级下载页面中的链接和所述链接在各二级下载页面中的相对位置,并分别统计二级下载页面中的各相对位置所对应的不同链接的数目;
步骤D2、将在所述不同链接的数目最大时所对应的相对位置作为相应下载站点内的下载链接在二级下载页面中的位置信息。
由于步骤C1和步骤C2的实现原理与步骤A1和步骤A2的实现原理类似,步骤D1-步骤D2的实现原理与步骤B1-步骤B2的实现原理类似,故在此不作赘述,相互参照即可。
获取方案2、
获取方案2的实现过程具体可以包括:根据预设的下载相关页面信息和下载链接的对应关系,由所述下载相关页面的页面信息匹配得到相应资源的下载链接。
获取方案2可以在离线方式下预设下载相关页面信息和下载链接的对应关系,然后基于在线匹配得到相应资源的下载链接。
本领域技术人员可以采用任意方式预设下载相关页面信息和下载链接的对应关系,例如,可以遍历各下载站点内各下载相关页面,得到相应资源的下载链接,然后预设所述对应关系;或者,可以采用获取方案1和获取方案2的分析结果,依据资源的下载链接在所述下载相关页面中的位置信息,统计各下载相关页面的下载链接等等,本申请对具体的预设下载相关页面信息和下载链接的对应关系的方式不加以限制。
优选的,浏览器服务器端对下载链接进行分析优选,得到对应的优选下载链接时,
在所述下载链接为一个以上的情况下,浏览器服务器端根据下载链接的质量属性,确定各下载链接的质量;浏览器服务器端依据下载链接的质量,从所述下载链接中选择优选的下载链接作为优选下载链接;浏览器服务器端再将所述优选下载链接返回给浏览器客户端。
由于下载站点的页面布局等原因,在很多情况下,与下载相关页面相应资源的下载链接的数目往往大于1,在有些情况下数目还很庞大(如30个、50个);这种情况下,虽然浏览器客户端展现的下载链接不会具有下载站点中设置的干扰链接,但在浏览器客户端展现的下载链接的数目过多时,用户需要根据自身的网络情况,从一个以上下载链接中选择一个最优的下载链接进行点击;但是大部分用户均缺乏这方面的专业知识,往往不能做出最优选择,即使花了时间去选择,但仍然做了错误的选择,例如选择了下载速度很慢、附加内容很多、资源文件比较大、下载浏览器服务器端距离自身很远的下载链接等等,这些都会导致下载速度慢,严重影响下载效率。
针对上述情形,本实施例在所述下载链接为一个以上时,浏览器服务器端根据下载链接的质量属性,确定各下载链接的质量,并依据下载链接的质量,从所述下载链接中选择优选的下载链接作为优选下载链接。
在本申请的一种优选实施例中,所述下载链接的质量属性具体可以包括如下属性中的一项或多项:下载链接的物理位置、下载链接的附加内容、下载链接对应资源的大小、下载链接的下载速度和下载链接对应资源的排名等。其中
A、下载链接的物理位置主要可以包括下载链接的IP(Internet Protocol,网络之间互连的协议)地址,通常来说,用户的IP地址与下载链接的IP地址越匹配,下载速度会越高。
于是,在本申请的一种优选实施例中,所述方法还可以包括:
浏览器服务器端接收所述各下载链接的物理位置和浏览器客户端的物理位置信息;
根据所述浏览器客户端的物理位置信息与各下载链接的物理位置之间的匹配度,确定各下载链接的质量。
依据本优选实施例,对于下载链接而言,其与用户的物理位置信息的匹配度越高,则其质量就会越优。
B、下载链接的附加内容主要用于表示下载链接是否具有附加内容。通常对于下载链接而言,不具有附加内容的下载链接的质量会优于具有附加内容的下载链接的质量。
下载链接的附加内容可基于探测得到。例如,在本申请的一种应用示例中,探测下载链接的附加内容的一种流程可以包括:首先确定资源的各种压缩包的格式,将压缩包内的独立文件解压出来,然后统计压缩包内唯一的单个独立文件出现的个数。如果某个文件在各个压缩包中出现的次数太多,则可以认为是广告等附加内容。例如,如果很多压缩包中都出现了welcome.txt,且这个welcome.txt的内容都相同,那么可以认为welcome.txt是下载站点加入的附加内容。
当然大部分附加内容本身是无害的,只是影响下载速度而言。对于小部分可执行的、有害的附加内容,本领域技术人员还可以根据需求进行过滤或者提示用户。
C、由于下载时间与下载链接对应资源的大小成正比,下载链接对应资源的大小越大,下载时间越长;但是考虑到一个因素,过于小的资源有可能是坏(corrupt)资源,反而需要被先过滤掉;故在本申请的一种应用示例中,可以通过如下方式判定下载链接的质量:对于同一资源对应的一个以上下载链接的资源大小求平均值,这样,对于这一个以上下载链接中的任一而言,其对应资源的大小越小且在平均值附近,则认为其质量越优。当然上述判定方式只是作为应用示例,并不作为本申请的应用限制。
D、由于下载时间与下载链接的下载速度成反比,下载链接的下载速度越大,下载时间越短;故对于下载链接而言,其下载链接的下载速度越高,则其质量就会越优;
E、通常,下载链接对应资源的排名越高,则用户体验越高。
在用到多种下载链接的质量属性时,可以对每种下载链接的质量属性赋予相应的权重,然后确定下载链接的质量;可以首先确定每种下载链接的质量属性的质量,然后可以对多种下载链接的质量属性的的质量进行相乘、加权求和或者其他归一化处理方法,得到最终的下载链接的质量。总之,本申请对多种下载链接的质量属性的使用不加以限制。
另外,在浏览器服务器端依据下载链接的质量,从所述一个以上下载链接中选择一个或多个优选的下载链接时,可以按照优良中差的顺序,对下载链接的质量进行排序,然后选择排在前面的一个或多个优选的下载链接。本申请对具体的选择方法不加以限制。在其他实施例中,依据当前浏览页面的页面信息,判定当前浏览页面是否为下载相关页面的执行主体不限于浏览器服务器端,浏览器客户端也可执行此操作;同理步骤102~步骤104中涉及到的实体也不限于浏览器服务器端,浏览器客户端也可以执行对应的操作,完成本申请所述的逻辑过程,使对应的优选下载链接展现给用户。
当然,在浏览器中当前浏览页面相应资源对应的所述下载链接仅有一个时,浏览器服务器端直接选择该下载链接作为优选下载链接。
总之,本实施例自动从一个以上下载链接中选择一个或多个优选的下载链接,并展现给用户,能够节省用户从一个以上下载链接中选择优选的下载链接进行点击下载的时间,进一步提高用户的下载效率,提高浏览器的信息访问效率。
参照图2,示出了本申请一种获取下载链接的方法实施例2的流程图,具体可以包括:
步骤201、浏览器服务器端依据当前浏览页面的页面信息,判定当前浏览页面是否为下载相关页面;
步骤202、在当前浏览页面为下载相关页面时,浏览器服务器端依据所述下载相关页面的页面信息获取相应资源的下载链接;
步骤203、浏览器服务器端获取所述下载链接对应资源的名称;
步骤204、浏览器服务器端依据所述资源的名称在全网中进行检索,得到全网中相应的第一全局下载链接;
步骤205、浏览器服务器端根据各第一全局下载链接的质量属性,从所述第一全局下载链接中选择优选的第一全局下载链接作为优选下载链接;
步骤206、浏览器服务器端将所述优选下载链接返回给浏览器客户端。
获取方法实施例1获取的下载链接为当前浏览页面所属的下载站点的下载链接,所述下载链接不一定为最优的下载链接,这里的最优与否可依据质量确定。
相对于获取方法实施例1,获取方法实施例2增加了下载链接的获取范围,也即获取与当前浏览页面(下载相关页面)相应资源在一个以上下载站点的下载链接,并在其他下载站点上有质量更好或是速度更等更优的下载链接时,将更优的下载链接自动展现给用户。
假设步骤202所获取的下载链接为http://www.skycn.com/down.php?uri=http://218.201.124.25:82/down/WDCFree.zip,则在具体实现中,可以在资源链接数据库(用于存储下载链接和资源名称的数据记录)中查找http://www.skycn.com/down.php?uri=http://218.201.124.25:82/down/WDCFree.zip对应的记录,得到了该下载链接对应的资源名称是“Wise Disk Cleaner Free 7.15.472”,之后在资源链接数据库中检索资源名称为“Wise Disk CleanerFree 7.15.472”的资源下载链接,并依据全局下载链接的质量确定站点链接http://www.xdowns.com/soft/xdowns2009.asp?softid=48301&downid=57&id=51036是质量更好的(因为该下载源标明为绿色版)下载链接,于是将http://www.xdowns.com/soft/xdowns2009.asp?softid=48301&downid=57&id=51036返回给浏览器客户端,并标明该下载链接并非当前下载相关页面对应的下载链接,而是同一资源的推荐链接。
需要说明的是,“标明该下载链接并非当前下载相关页面对应的下载链接,而是同一资源的推荐链接”为本实施例与第一全局下载链接相应的标识信息的一种示例,实际上,本领域技术人员可以根据实际需求,返回各种与第一全局下载链接相应的标识信息,如“非本下载站点,同一资源最优下载链接”等等,本实施例的与第一全局下载链接相应的标识信息主要用于表示返回的第一全局下载链接的信息,本申请对具体的与第一全局下载链接相应的标识信息不加以限制。
总之,本实施例将比与当前浏览页面相应资源的下载链接更优的下载链接自动展现给用户,一方面能够提高用户的下载效率,另一方面能够节省用户寻找比与当前浏览页面相应资源更优的下载链接所花费的时间。
参照图3,示出了本申请一种获取下载链接的方法实施例3的流程图,具体可以包括:
步骤301、浏览器服务器端依据当前浏览页面的页面信息,判定当前浏览页面是否为下载相关页面;
步骤302、在当前浏览页面为下载相关页面时,浏览器服务器端依据所述下载相关页面的页面信息获取相应资源的下载链接;
步骤303、浏览器服务器端获取所述下载链接对应资源的类别;
步骤304、浏览器服务器端依据所述资源的类别在全网中进行检索,在所述类别的资源排名中选取首位的资源,并检索得到全网中所述首位的资源相应的第二全局下载链接;
步骤305、浏览器服务器端根据各第二全局下载链接的质量属性,从所述第二全局下载链接中选择优选的第二全局下载链接作为优选下载链接;
步骤306、浏览器服务器端将所述优选下载链接返回给浏览器客户端。
获取方法实施例1获取的下载链接为当前浏览页面所属的某资源类别下的下载链接,所述下载链接不一定为最优的下载链接,这里的最优与否可依据质量确定。
相对于获取方法实施例1,本实施例增加了下载链接的获取范围,也即获取与当前浏览页面(下载相关页面)相应资源的同类资源的下载链接,并在与当前浏览页面相应资源在同类资源中有更好的替代资源时,实施例4可以推荐出较好的同类替代资源。
在具体实现中,可以在下载链接数据库中存储每个下载链接对应的资源的类别和资源在同类资源中的排名等,如果利用资源在同类资源中的排名确定质量,则当判定与当前浏览页面相应资源在同类资源中的排名较低时,可以推荐出同类资源中的排名更高的资源。
假设步骤302所获取的下载链接为http://count.crsky.com/view_down asp?down_url=http://12.sxdx.crsky.com/201203/Coral-v1.3.zip&downd_id=27&ID=81771&SOFTID=24411&down=yes,则在具体实现中,可以在资源链接数据库中查找http://count.crsky.comview_down asp?down_url=http://12.sxdx.crsky.com/201203/Coral-v1.3.zip&downd_id=27&ID=81771&SOFTID=24411&down=yes的对应的软件,得到相应的记录;分析该记录的属性字段,发现该资源是一个浏览器软件,于是在下载链接数据库中检索得到所有的浏览器软件,比较这些浏览器软件的排名之后,认为有更好的浏览器软件值得推荐,进行进一步比较之后,认为链接http://ebadu.newhua.com/down/sogou_explorer_3.2.zip对应的浏览器软件是浏览软件中最好的,于是将浏览器软件http://ebadu.newhua.com/down/sogou_explorer_3.2.zip返回给浏览器客户端,并标明该下载链接并非当前下载相关页面对应的下载链接,而是同类较好软件的推荐链接。
需要说明的是,“标明该下载链接并非当前下载相关页面对应的下载链接,而是同类较好软件的推荐链接”为本实施例与第二全局下载链接相应的标识信息的一种示例,实际上,本领域技术人员可以根据实际需求,返回各种与第二全局下载链接相应的标识信息,如“非当前下载相关页面对应的资源,同类资源最优下载链接”等等,本实施例的与第二全局下载链接相应的标识信息主要用于表示返回的第二全局下载链接的信息,本申请对具体的与第二全局下载链接相应的标识信息不加以限制。
总之,本实施例能够在当前下载相关页面对应的资源并非是同类资源中的最优资源时,将同类资源中更优资源的下载链接自动展现给用户,一方面能够提高用户的下载效率,另一方面能够节省用户寻找当前资源的同类更好资源的浏览时间。
参照图4,示出了本申请一种获取下载链接的方法实施例4的流程图,具体可以包括:
步骤401、浏览器服务器端依据当前浏览页面的页面信息,判定当前浏览页面是否为下载相关页面;
步骤402、在当前浏览页面为下载相关页面时,浏览器服务器端依据所述下载相关页面的页面信息获取相应资源的下载链接;
步骤403、浏览器服务器端获取所述下载链接对应资源的完整性信息;所述资源的完整性信息具体可以包括分卷和整卷;
步骤404、在所述下载链接对应资源的完整性信息为分卷时,浏览器服务器端检索得到所述下载链接对应资源的其它分卷所对应的下载链接,并将所检索得到的其他分卷的下载链接及所述当前浏览页面相应资源的下载链接作为优选下载链接;
步骤405、浏览器服务器端将所述优选下载链接返回给浏览器客户端。
在与当前浏览页面相应资源需要分卷下载,或者与当前浏览页面相应资源仅是一个以上压缩卷中的一份时,获取方法实施例1获取的下载链接实际上是只是用户下载需求的一部分,因为用户还需要下载另外的几分压缩卷。
相对于获取方法实施例1,本实施例增加了下载链接的获取范围,也即获取所述下载链接对应资源的整卷下载链接(通常为一个以上下载链接的组合),并自动展现给用户。
假设步骤402所获取的下载链接为http://jscn.newhua.com/down/Data.zip,则在具体实现中,可以在资源链接数据库中查找http://jscn.newhua.com/down/Data.zip的对应的数据记录,发现该下载链接对应的软件是“永恒之塔2.1黄金时代”,且只是这个软件为完整资源的第5卷;该软件描述页面并没有该软件的完整资源对应的下载链接,基于当前浏览页面在该网站搜索所述软件的其他分卷的软件描述页面对应的下载链接,得到该软件对应的所有的分卷的下载链接如下:
第1卷:http://jscn.newhua.com/down/AION_Setup2.1.0.7.zip
第2卷:http://jscn.newhua.com/down/Data_8893.zip
第3卷:http://jscn.newhua.com/down/Data_8894.zip
第4卷:http://jscn.newhua.com/down/Data_8895.zip
第5卷:http://jscn.newhua.com/down/Data.zip
第6卷:http://jscn.newhua.com/down/Data_34634.zip
第7卷:http://jscn.newhua.com/down/Data_34635.zip
于是将这一组的7个链接都返回给浏览器客户端,并标明这些下载链接当前软件描述页面对应的完整的一组下载链接,当用户点击客户端的对应位置进行触发时,这七条下载链接同时进行下载。
也可以将这七条下载链接通过算法加密为一条链接作为优选下载链接之后返回给浏览器客户端,当用户点击客户端的对应位置进行触发时,这该条优选下载链接被解密后形成七条下载链接同时进行下载。
需要说明的是,“标明这些下载链接当前软件描述页面对应的完整的一组下载链接”为本实施例与整卷下载链接相应的标识信息的一种示例,实际上,本领域技术人员可以根据实际需求,返回各种与整卷下载链接相应的标识信息,如“当前浏览页面对应的完整的一组下载链接”等等,本实施例的与整卷下载链接相应的标识信息主要用于表示返回的整卷下载链接的信息,本申请对具体的与整卷下载链接相应的标识信息不加以限制。
总之,本实施例能够在与当前浏览页面相应资源的下载链接只是资源的一部分时,自动展现出下载完整资源需要的一组下载链接,一方面能够提高用户的下载效率,另一方面能够节省用户寻找当前资源的全部下载链接所花费的时间。
参照图5,示出了本申请一种展现下载链接的方法实施例的流程图,具体可以包括:
步骤501、浏览器客户端将当前浏览页面的页面信息发送至浏览器服务器端;
步骤502、浏览器客户端接收所述当前浏览页面对应的优选下载链接;所述优选下载链接在当前浏览页面为下载相关页面时,对下载相关页面的页面信息进行分析优选后所返回;
步骤503、浏览器客户端对所述优选下载链接进行展现。
在具体实现中,当用户打开一个浏览页面时,浏览器客户端会将其作为当前浏览页面,将当前浏览页面的页面信息发送至浏览器服务器端,接收浏览器服务器端对当前浏览页面进行分析后所返回的优选下载链接,并进行展现,供用户直接触发后下载。
需要说明的是,如果当前浏览页面不是下载相关页面,则浏览器服务器端是无法获取到相应资源的下载链接的,也就无法返回相应的下载链接;故浏览器客户端不负责当前浏览页面是否为下载相关页面的判定,而是负责当前浏览页面的页面信息的传递,以及,与所述当前浏览页面相应的下载链接的接收和展现。
本申请实施例中,发送给浏览器服务器端的当前浏览页面的页面信息主要可以包括如下信息中的一项或多项:当前浏览页面的URL、当前浏览页面的HTML等等,本申请对具体的发送给浏览器服务器端的当前浏览页面的页面信息不加以限制。
关于优选下载链接的展现位置,其可以为浏览器的任意位置,例如,上方、下方、左方、右方等等。为了不影响和不干扰用户浏览的当前浏览页面的内容,在本申请的一种优选实施例中,所述展现位置可以为浏览器的下方或右方。
关于优选下载链接的展现形式,其可以为任意的形式,如弹窗、气泡等等。在本申请的一种优选实施例中,所述步骤503的实现过程可以为,采用弹窗形式对与所述优选下载链接进行展现。该弹窗可以位于浏览器的任意位置;该弹窗可提供有关闭按钮,可依据用户对该关闭按钮的操作而关闭,或者,该弹窗可被设置具有一定生命周期(如5秒),在生命周期结束后该弹窗自动退出。
当然,除了弹窗、气泡的展现形式外,本申请的展现形式还可以包括浮动工具条、菜单栏、工具栏、状态栏等等,凡是能够为用户展现下载链接入口的UI(用户界面,userinterface)均属于本申请的保护范围内。
目前大多下载站点为了推广广告链接,会在站点的a标签上设置OnClick事件,由于onclick事件会在对象被点击时发生。故用户在点击下载站点的链接时,会附带弹出广告页面,这严重影响了浏览器的信息访问效率。
而本申请优选下载链接的展现形式避免了上述附带弹出效果,因而,能够消除下载站点的附加广告行为,增加浏览器的信息访问效率。
在本申请的一些实施例中,浏览器客户端还可以在展现优选下载链接的同时,展现相应的文字描述信息,如“当前浏览页面下载链接”、“当前浏览页面速度最快下载链接”等等。将当前浏览页面的页面信息进行发送的过程不限于浏览器客户端,浏览器服务端也可执行此操作;同理步骤502~步骤503中涉及到的实体也不限于浏览器客户端,浏览器服务器端也可以执行对应的操作,完成本申请所述的逻辑过程,使对应的优选下载链接展现给用户。
在本申请的一种优选实施例中,所述方法还可以进一步包括:浏览器客户端将当前用户的物理位置信息发送至浏览器服务器端。
当前用户的物理位置信息主要可以包括当前用户的IP地址,通常来说,用户的IP地址与下载链接的IP地址越匹配,下载速度会越高。故将当前用户的IP地址发送至浏览器服务器端,能够方便浏览器服务器端获取用户的物理位置信息与各下载链接的物理位置属性之间的匹配度,并依据匹配度确定各下载链接的质量。
在本申请的另一种优选实施例中,所述方法还可以包括:
浏览器客户端对所述优选下载链接及相应的标识信息进行展现。
所述与所述优选下载链接及相应的标识信息具体可以包括:浏览器服务器端依据所述资源的名称检索得到相应的第一全局下载链接及相应的标识信息,浏览器服务器端依据所述资源的类别检索得到相应的第二全局下载链接及相应的标识信息,或浏览器服务器端检索得到所述下载链接对应资源的整卷下载链接及相应的标识信息等等。
为使本领域技术人员更好地理解本申请,以下提供本申请的浏览器获取和展现下载链接方法在实际中的应用示例。
应用示例1、
步骤E1、浏览器客户端将当前浏览页面的URL http://www.duote.com/soft/4494.html以及用户的IP地址传送至浏览器服务器端;
步骤E2、浏览器服务器端将当前浏览页面的URL与相应下载站点www.duote.com的正则表达式http://www\.duote\.com/soft/\d+\.html进行匹配,并依据匹配结果判定当前浏览器页面为下载相关页面;
步骤E3、浏览器服务器端依据当前浏览页面的URL得到相应的下载站点属性;
浏览器服务器端根据预设的下载站点属性和下载站点内下载相关页面中下载链接对应的位置信息的对应关系,由所述下载相关页面的下载站点属性匹配得到相应资源的下载链接在所述下载相关页面中的位置信息:xpath div[class='down_tree']//a/href;
浏览器服务器端从当前浏览页面的xpath div[class='down_tree']//a/href位置,提取得到相应的下载链接集合:
步骤E4、浏览器服务器端根据用户的IP地址和各下载链接的下载速度、忙闲状况、断线的频率等各个质量属性,判定下载链接http://77.duote.com.cn/uctalk.zip相对于用户的IP地址最为稳定迅速,将其作为优选下载链接;
步骤E5、浏览器服务器端将http://77.duote.com.cn/uctalk.zip返回给浏览器客户端;步骤E6、浏览器客户端接收优选下载链接http://77.duote.com.cn/uctalk.zip
步骤E7、在浏览器客户端加载显示该优选下载链接的TAB(标签)页,浮出方框提示用户,供用户点击之后直接触发下载。
应用示例1能直接展现下载链接,节省用户在页面上寻找下载链接所花费的时间;并且,由于展现的是最为稳定迅速的下载链接,能够提高了浏览器的信息访问效率,同时避免了点击原始页面链接时触发点击事件,被页面上javascript脚本捕捉的副作用,避免了弹出新窗口。
应用示例2、
有些下载站点的下载相关页面不能直接展示下载链接,但下载相关页面能够链接至直接展示下载链接的二级下载页面;相对于应用示例1,应用示例2首先获取二级下载页面的URL,然后从二级下载页面的特定位置提取相应的下载链接。
步骤F1、浏览器客户端将当前浏览页面的URLhttp://www.onlinedown.net/soft/78249.htm以及用户的IP地址传送至浏览器服务器端;
步骤F2、浏览器服务器端将当前浏览页面的URL内容与相应下载站点www.onlinedown.net的正则表达式http://www\.onlinedown\.net/soft/\d+\.html进行匹配,并依据匹配结果判定当前浏览器页面为下载相关页面;
步骤F3、浏览器服务器端依据当前浏览页面的URL得到相应的下载站点属性;
浏览器服务器端根据预设的下载站点属性和下载站点内下载相关页面中跳转链接对应的位置信息的对应关系,由所述下载相关页面的下载站点属性匹配得到相应资源的跳转链接在所述下载相关页面中的位置信息:
xpath div[class='download']/h4/a/href;
从所述下载相关页面的xpath div[class='download']/h4/a/href位置,提取相应资源的二级下载页面;
浏览器服务器端根据预设的下载站点属性和下载站点内二级下载页面中下载链接对应的位置信息的对应关系,由所述二级下载页面的下载站点属性匹配得到相应资源的下载链接在所述二级下载页面中的位置信息:xpath div[id='content']//a/href;
浏览器服务器端从二级下载页面的xpath div[id='content']//a/href位置,提取得到相应的下载链接集合:
步骤F4、浏览器服务器根据用户的IP,判定下载链接http://ebadu.newhua.com/down/sogou_explorer_3.2.zip相对于用户的IP最为迅速,将其作为优选下载链接;
步骤F5、浏览器服务器端将该优选下载链接传回给浏览器客户端;
步骤F6、浏览器客户端接收到优选下载链接http://ebadu.newhua.com/down/sogou_explorer_3.2.zip
步骤F7、在浏览器客户端加载显示下载链接的TAB页,浮出方框提示用户,供用户点击之后直接触发下载。
总之,应用示例2能直接展现下载链接,使用户不必打开资源下载页面就可以直接得到下载链接,节省用户点击页面和用户在页面上寻找下载链接所花费的时间;并且,由于展现的是最为迅速的下载链接,能够提高用户的下载效率和浏览器使用体验。
应用示例3、
当前浏览页面上的软件在其他下载站点上有质量更好或是速度更快的优选下载链接时,应用示例4可以给出其他下载站点上的更好的下载链接。
步骤H1、浏览器客户端将当前浏览页面的URLhttp://www.skycn.com/soft/53493.html和HTML内容,以及用户的IP地址传送至浏览器服务器端;
步骤H2、浏览器服务器端将当前浏览页面的URL与相应下载站点www.skycn.com的正则表达式http://www\.skycn\.com/soft/(\d+)\.html进行匹配,并依据匹配结果判定当前浏览器页面为下载相关页面;
步骤H3、浏览器服务器端依据当前浏览页面的URL和HTML内容得到相应的下载站点属性;
浏览器服务器端根据预设的下载站点属性和下载站点内下载相关页面中跳转链接对应的位置信息的对应关系,由所述下载相关页面的下载站点属性匹配得到相应资源的跳转链接在所述下载相关页面中的位置信息:
Figure BDA00001751123000181
从所述下载相关页面的xpath div[class='download']/h4/a/href位置,提取相应资源的二级下载页面;
浏览器服务器端根据预设的下载站点属性和下载站点内二级下载页面中下载链接对应的位置信息的对应关系,由所述二级下载页面的下载站点属性匹配得到相应资源的下载链接在所述二级下载页面中的位置信息:xpath//a/href;
浏览器服务器端从二级下载页面的xpath//a/href位置,提取得到相应的下载链接:
http://www.skycn.com/down.php?uri=http://218.201.124.25:82/down/WDCFree.zip;
步骤H4、浏览器服务器端在数据库中查找http://www.skycn.com/down.php?uri=http://218.201.124.25:82/down/WDCFree.zip对应的记录,得到了该下载链接对应的软件名称是“Wise Disk Cleaner Free 7.15.472”,之后在数据库中检索名称为“Wise Disk Cleaner Free 7.15.472”的同一软件链接,认为站点链接http://www.xdowns.com/soft/xdowns2009.asp?softid=48301&downid=57&id=51036是质量更好的(因为该下载源标明为绿色版)下载链接,于是将http://www.xdowns.com/soft/xdowns2009.asp?softid=48301&downid=57&id=51036作为优选下载链接;
步骤H5、浏览器服务器端将该优选下载链接返回给浏览器客户端,并标明该链接并非当前软件页面对应的下载链接,而是同一软件的推荐链接;
步骤H6、浏览器客户端收到标明为同一软件的推荐链接的http://www.xdowns.com/soft/xdowns2009.asp?softid=48301&downid=57&id=51036
步骤H7、在浏览器客户端加载显示下载链接的TAB页,浮出方框提示用户,用户点击之后直接触发下载。
应用示例3能够节约用户寻找当前软件更好版本的下载链接的浏览时间。
应用示例4、
当前浏览页面上的软件在同类软件中有更好的替代软件时,应用示例4可以推荐出较好的同类替代软件。应用示例4在下载链接数据库中存储每个下载链接对应的软件的类型,软件在同类软件中的排名等。当判定一个该资源在同类软件中的排名较低时,可以推荐出同类软件中的更好的软件。
步骤I1、浏览器客户端将当前浏览页面的URLhttp://www.crsky.com/soft/24411.html以及用户的IP地址传送至浏览器服务器端;
步骤I2、浏览器服务器端将当前浏览页面的URL内容与相应下载站点www.crsky.com的正则表达式ttp://www\.crsky\.com/soft/(\d+)\html进行匹配,并依据匹配结果判定当前浏览器页面为下载相关页面;
步骤I3、浏览器服务器端依据当前浏览页面的URL得到相应的下载站点属性;
浏览器服务器端根据预设的下载站点属性和下载站点内下载相关页面中下载链接对应的位置信息的对应关系,由所述下载相关页面的下载站点属性匹配得到相应资源的下载链接在所述下载相关页面中的位置信息:xpath div[class='section-content']//a/href;
浏览器服务器端从当前浏览页面的xpath div[class='section-content']//a/href位置,提取得到相应的下载链接:http://count.crsky.com/view_down.asp?down_url=http://12.sxdx.crsky.com/201203/Coral-v1.3.zip&downd_id=27&ID=81771&SOFTID=24411&down=yes
步骤I4、浏览器服务器端在软件链接数据库中查找http://count.crsky.comview_down asp?down_url=http://12.sxdx.crsky.com/201203/Coral-v1.3.zip&downd_id=27&ID=81771&SOFTID=24411&down=yes的对应的软件,得到相应的记录;读取该记录的属性字段,发现该软件是一个浏览器软件,于是在下载链接数据库中检索得到所有的浏览器软件,比较这些浏览器软件的排名之后,认为有更好的浏览器软件值得推荐,进行进一步比较之后,认为链接http://ebadu.newhua.com/down/sogou_explorer_3.2.zip对应的浏览器软件是浏览软件中最好的,于是将浏览器软件http://ebadu.newhua.com/down/sogou_explorer_3.2.zip作为优选下载链接返回给浏览器客户端,并标明该链接并非当前软件页面对应的下载链接,而是同类较好软件的推荐链接;
步骤I5、浏览器客户端收到标明为同类较好软件的推荐链接的http://www.xdowns.com/soft/xdowns2009.asp?softid=48301&downid=57&id=51036返回给浏览器客户端;
步骤I6、浏览器客户端接收该优选下载链接;
步骤I7、在浏览器客户端加载显示该优选下载链接的TAB页,浮出方框提示用户,供用户点击之后直接触发下载。
使用应用示例4,用户可以节约用于寻找当前软件的同类更好软件的浏览时间。
应用示例5、
当前浏览页面对应的软件如果过大,如某些大型游戏软件、系统软件,则需对该资源进行分卷下载。这样,当前浏览页面只对应一个以上压缩卷中的一份时,则将各压缩卷从当前浏览页面/当前浏览页面的相关页面的链接组合后(一次点击触发一个以上链接)嵌入插件,供浏览器推荐给用户。
步骤J1、浏览器客户端将当前浏览页面的URLhttp://www.onlinedown.net/soft/195244.htm,以及用户的IP地址传送至浏览器服务器端;
步骤J2、浏览器服务器端将当前浏览页面的URL与相应下载站点www.onlinedown.net的正则表达式http://www\.onlinedown\.net/soft/\d+\.html进行匹配,并依据匹配结果判定当前浏览器页面为下载相关页面;
步骤J3、浏览器服务器端依据当前浏览页面的URL内容得到相应的下载站点属性;
浏览器服务器端根据预设的下载站点属性和下载站点内下载相关页面中跳转链接对应的位置信息的对应关系,由所述下载相关页面的下载站点属性匹配得到相应资源的跳转链接在所述下载相关页面中的位置信息:
从所述下载相关页面的
Figure BDA00001751123000201
位置,提取相应资源的二级下载链接;
浏览器服务器端根据预设的下载站点属性和下载站点内二级下载页面中下载链接对应的位置信息的对应关系,由所述二级下载页面的下载站点属性匹配得到相应资源的下载链接在所述二级下载页面中的位置信息:xpath div[id='content']//a/href;
浏览器服务器端从二级下载页面的xpath div[id='content']//a/href位置,提取得到相应的下载链接:
http://jscn.newhua.com/down/Data.zip;
步骤J4、浏览器服务器端在软件链接数据库中查找http://jscn.newhua.com/down/Data.zip的对应的数据记录,发现该链接对应的软件是“永恒之塔2.1黄金时代”,且只是这个软件完整资源的第5卷。该软件页面并没有该软件的完整资源对应的下载链接,基于当前页面在该网站搜索所述软件的其他分卷的软件页面对应的下载链接,得到该软件对应的所有的分卷的下载链接如下:
第1卷:http://jscn.newhua.com/down/AION_Setup2.1.0.7.zip
第2卷:http://jscn.newhua.com/down/Data_8893.zip
第3卷:http://jscn.newhua.com/down/Data_8894.zip
第4卷:http://jscn.newhua.com/down/Data_8895.zip
第5卷:http://jscn.newhua.com/down/Data.zip
第6卷:http://jscn.newhua.com/down/Data_34634.zip
第7卷:http://jscn.newhua.com/down/Data_34635.zip
于是将这一组的7个链接作为优选下载链接;
步骤J5、浏览器服务器端将优选下载链接返回给浏览器客户端,并标明这是当前软件页面对应的完整的一组下载链接;
步骤J6、浏览器服务器端收到标明为该软件的一组链接
http://jscn.newhua.com/down/AION_Setup2.1.0.7.zip
http://jscn.newhua.com/down/Data_8893.zip
http://jscn.newhua.com/down/Data_8894.zip
http://jscn.newhua.com/down/Data_8895.zip
http://jscn.newhua.com/down/Data.zip
http://jscn.newhua.com/down/Data_34634.zip
http://jscn.newhua.com/down/Data_34635.zip
步骤J7、在浏览器下端加载显示下载链接的TAB页,TAB页上只有一个链接,点击该链接之后,将触发以上7个下载链接的下载,用该TAB页的浮出方框提示用户,用户点击之后可以直接触发7个文件下载,全部下载完毕后解压即得该软件的完整版本。
使用应用示例5,用户可以节约用于寻找当前软件的全部下载链接的浏览时间。
参照图6,示出了本申请一种获取下载链接的装置实施例的结构图,具体可以包括:
判定模块601,用于依据当前浏览页面的页面信息,判定当前浏览页面是否为下载相关页面;
下载链接获取模块602,用于在当前浏览页面为下载相关页面时,浏览器服务器端依据所述下载相关页面的页面信息获取当前浏览页面相应资源的下载链接;
优选分析模块603,用于对下载链接进行分析优选,得到对应的优选下载链接;及
返回模块604,用于浏览器服务器端将所述优选下载链接返回给浏览器客户端。
在本申请的一种优选实施例中,所述优选分析模块可以进一步包括:
名称获取子模块,用于获取所述下载链接对应资源的名称;
名称检索子模块,用于依据所述资源的名称在全网中进行检索,得到全网中相应的第一全局下载链接;
第一质量分析子模块,用于根据各第一全局下载链接的质量属性,从所述第一全局下载链接中选择优选的第一全局下载链接作为优选下载链接。
在本申请的一种优选实施例中,所述优选分析模块可以进一步包括:
类别获取子模块,用于获取所述下载链接对应资源的类别;
类别检索子模块,用于依据所述资源的类别在全网中进行检索,在所述类别的资源排名中选取首位的资源,并检索得到全网中所述首位的资源相应的第二全局下载链接;
第二质量分析子模块,用于根据各第二全局下载链接的质量属性,从所述第二全局下载链接中优选的第二全局下载链接作为优选下载链接。
在本申请的另一种优选实施例中,所述优选分析模块可以进一步包括:
完整性获取子模块,用于获取所述下载链接对应资源的完整性信息;所述资源的完整性信息包括分卷和整卷;
完整性检索子模块,用于在所述下载链接对应资源的完整性信息为分卷时,检索得到所述下载链接对应资源的其他分卷所对应的下载链接;
组合子模块,用于将所检索得到的其他分卷的下载链接及所述当前浏览页面相应资源的下载链接作为优选下载链接。
在本申请的再一种优选实施例中,所述优选分析模块可以进一步包括:
质量确定子模块,用于在所述下载链接为一个以上时,浏览器服务器端根据各下载链接的质量属性,确定各下载链接的质量;
质量选择子模块,用于依据下载链接的质量,从所述下载链接中选择优选的下载链接作为优选下载链接。
对于浏览器服务器实施例而言,由于其与获取方法实施例基本相似,所以描述的比较简单,相关之处参见获取方法实施例的部分说明即可。
参照图7,示出了本申请一种展现下载链接的装置实施例的结构图,具体可以包括:
发送模块701,用于将当前浏览页面的页面信息发送至浏览器服务器端;
接收模块702,用于接收所述当前浏览页面对应的优选下载链接;所述优选下载链接为浏览器服务器端对当前浏览页面进行分析后所返回;及
展现模块703,用于对所述优选下载链接进行展现。
对于浏览器客户端实施例而言,由于其与展现方法实施例基本相似,所以描述的比较简单,相关之处参见获取方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
以上对本申请所提供的一种展现和获取下载链接的方法、一种浏览器客户端和一种浏览器服务器端,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (24)

1.一种获取下载链接的方法,其特征在于,包括:
依据当前浏览页面的页面信息,判定当前浏览页面是否为下载相关页面;
在当前浏览页面为下载相关页面时,依据所述下载相关页面的页面信息获取当前浏览页面相应资源的下载链接;
对所述下载链接进行分析优选,得到对应的优选下载链接;
将所述优选下载链接进行返回。
2.如权利要求1所述的方法,其特征在于,所述依据当前浏览页面的页面信息,判定当前浏览页面是否为下载相关页面的步骤,包括:
将所述当前浏览页面的页面信息与预存的下载站点内下载相关页面的页面信息进行匹配,若匹配成功,则判定当前浏览页面为下载相关页面;和/或
依据页面模型判别所述当前浏览页面是否为下载类别,若为下载类别,则判定当前浏览页面为下载相关页面;所述页面模型依据全网中抓取的页面元素和用户标识进行构造,用于判定当前浏览页面所属的类别。
3.如权利要求1所述的方法,其特征在于,所述依据所述下载相关页面的页面信息获取相应资源的下载链接的步骤,包括:
提取所述下载相关页面中的位置信息,并依据所述位置信息分析出对应的下载链接;和/或
根据预设的下载相关页面信息和下载链接的对应关系,由所述下载相关页面的页面信息匹配得到相应资源的下载链接。
4.如权利要求3所述的方法,其特征在于,所述提取所述下载相关页面中的位置信息,并依据所述位置信息分析出对应的下载链接的步骤,进一步包括:
所述下载相关页面含有所述下载链接时,所述依据所述页面信息进行分析,得到相应资源的下载链接在所述下载相关页面中的位置信息作为第一位置信息,并依据所述第一位置信息提取所述下载链接;
所述下载相关页面不含所述下载链接时,所述依据所述页面信息转至含有相应资源的下载链接所在的二级下载页面进行分析,得到相应资源的下载链接在所述二级下载页面中的位置信息作为第二位置信息,并依据所述第二位置信息提取所述下载链接。
5.如权利要求4所述的方法,其特征在于,所述依据所述页面信息进行分析,得到相应资源的下载链接在所述下载相关页面中的位置信息作为第一位置信息的步骤,包括:
依据所述下载相关页面的页面信息进行分析,得到所述下载相关页面的站点属性;
根据预存的各站点属性与该站点内所述下载相关页面中下载链接所对应的位置信息的关联关系,匹配得到所述下载链接在所述下载相关页面中的位置信息作为第一位置信息。
6.如权利要求4或5所述的方法,其特征在于,所述下载相关页面含有所述下载链接时,所述方法还包括:
分别提取同一下载站点内各下载相关页面中的链接和所述链接在各下载相关页面中的相对位置,并分别统计下载相关页面中的各相对位置所对应的不同链接的数目;
将在所述不同链接的数目最大时所对应的相对位置作为第一位置信息。
7.如权利要求4所述的方法,其特征在于,所述依据所述页面信息转至含有相应资源的下载链接所在的二级下载页面进行分析,得到相应资源的下载链接在所述二级下载页面中的位置信息作为第二位置信息的步骤,包括:
依据所述页面信息得到含有相应资源的下载链接所在的页面的站点属性;
根据预存的各站点属性与该站点内二级下载页面中下载链接所对应的位置信息的关联关系,匹配得到相应资源的下载链接在所述二级下载页面中的位置信息,作为第二位置信息。
8.如权利要求4或7所述的方法,其特征在于,所述下载相关页面不含所述下载链接时,所述方法还包括:
分别提取同一下载站点内各二级下载页面中的链接和所述链接在各二级下载页面中的相对位置,并分别统计二级下载页面中的各相对位置所对应的不同链接的数目;
将在所述不同链接的数目最大时所对应的相对位置作为第二位置信息。
9.如权利要求1所述的方法,其特征在于,所述对下载链接进行分析优选,得到对应的优选下载链接的步骤,进一步包括:
在所述下载链接为一个以上时,根据各下载链接的质量属性,确定各下载链接的质量;
依据下载链接的质量,从所述下载链接中选择优选的下载链接作为优选下载链接。
10.如权利要求1所述的方法,其特征在于,所述对下载链接进行分析优选,得到对应的优选下载链接的步骤,进一步包括:
获取所述下载链接对应资源的名称;
依据所述资源的名称在全网中进行检索,得到全网中相应的第一全局下载链接;
根据各第一全局下载链接的质量属性,从所述第一全局下载链接中选择优选的第一全局下载链接作为优选下载链接。
11.如权利要求1所述的方法,其特征在于,所述对下载链接进行分析优选,得到对应的优选下载链接的步骤,进一步包括:
获取所述下载链接对应资源的类别;
依据所述资源的类别在全网中进行检索,在所述类别的资源排名中选取首位的资源,并检索得到全网中所述首位的资源相应的第二全局下载链接;
根据各第二全局下载链接的质量属性,从所述第二全局下载链接中选择优选的第二全局下载链接作为优选下载链接。
12.如权利要求1所述的方法,其特征在于,所述对下载链接进行分析优选,得到对应的优选下载链接的步骤,进一步包括:
获取所述下载链接对应资源的完整性信息;所述资源的完整性信息包括分卷和整卷;
在所述下载链接对应资源的完整性信息为分卷时,检索得到所述下载链接对应资源的其他分卷所对应的下载链接;
将所检索得到的其他分卷的下载链接及所述当前浏览页面相应资源的下载链接作为优选下载链接。
13.如权利要求9、10或11所述的方法,其特征在于,所述下载链接的质量属性包括如下中的一项或多项:下载链接的物理位置、下载链接的附加内容、下载链接对应资源的大小、下载链接的下载速度、下载链接对应资源的排名。
14.如权利要求13所述的方法,其特征在于,所述确定各下载链接的质量的步骤,进一步包括:
接收所述各下载链接的物理位置和浏览器客户端的物理位置信息;
根据所述浏览器客户端的物理位置信息与各下载链接的物理位置之间的匹配度,确定各下载链接的质量。
15.一种展现下载链接的方法,其特征在于,包括:
将当前浏览页面的页面信息进行发送;
接收所述当前浏览页面对应的优选下载链接;所述优选下载链接在当前浏览页面为下载相关页面时,对下载相关页面的页面信息进行分析优选后所返回;
对所述优选下载链接进行展现。
16.如权利要求15所述的方法,其特征在于,还包括:
将当前用户的物理位置信息进行发送。
17.如权利要求15或16所述的方法,其特征在于,对所述优选下载链接进行展现时,采用弹窗形式对所述优选下载链接进行展现,供用户直接触发后下载。
18.一种获取下载链接的装置,其特征在于,包括:
判定模块,用于依据当前浏览页面的页面信息,判定当前浏览页面是否为下载相关页面;
下载链接获取模块,用于在当前浏览页面为下载相关页面时,依据所述下载相关页面的页面信息获取当前浏览页面相应资源的下载链接;
优选分析模块,用于对所述下载链接进行分析优选,得到对应的优选下载链接;及
返回模块,用于将所述优选下载链接进行返回。
19.如权利要求18所述的装置,其特征在于,所述优选分析模块进一步包括:
名称获取子模块,用于获取所述下载链接对应资源的名称;
名称检索子模块,用于依据所述资源的名称在全网中进行检索,得到全网中相应的第一全局下载链接;
第一质量分析子模块,用于根据各第一全局下载链接的质量属性,从所述第一全局下载链接中选择优选的第一全局下载链接作为优选下载链接。
20.如权利要求18所述的装置,其特征在于,所述优选分析模块进一步包括:
类别获取子模块,用于获取所述下载链接对应资源的类别;
类别检索子模块,用于依据所述资源的类别在全网中进行检索,在所述类别的资源排名中选取首位的资源,并检索得到全网中所述首位的资源相应的第二全局下载链接;
第二质量分析子模块,用于根据各第二全局下载链接的质量属性,从所述第二全局下载链接中选择优选的第二全局下载链接作为优选下载链接。
21.如权利要求18所述的装置,其特征在于,所述优选分析模块进一步包括:
完整性获取子模块,用于获取所述下载链接对应资源的完整性信息;所述资源的完整性信息包括分卷和整卷;
完整性检索子模块,用于在所述下载链接对应资源的完整性信息为分卷时,检索得到所述下载链接对应资源的其他分卷所对应的下载链接;
组合子模块,用于将所检索得到的其他分卷的下载链接及所述当前浏览页面相应资源的下载链接作为优选下载链接。
22.如权利要求18所述的装置,其特征在于,所述优选分析模块进一步包括:
质量确定子模块,用于在所述下载链接为一个以上时,根据各下载链接的质量属性,确定各下载链接的质量;
质量选择子模块,用于依据下载链接的质量,从所述下载链接中选择优选的下载链接作为优选下载链接。
23.一种展现下载链接的装置,其特征在于,包括:
发送模块,用于将当前浏览页面的页面信息进行发送;
接收模块,用于接收所述当前浏览页面对应的优选下载链接;所述优选下载链接在当前浏览页面为下载相关页面时,对下载相关页面的页面信息进行分析优选后所返回;及
展现模块,用于对所述优选下载链接进行展现。
24.如权利要求23所述的装置,其特征在于,所述展现模块具体用于采用弹窗形式对与所述优选下载链接进行展现,供用户直接触发后下载。
CN2012101918774A 2012-06-11 2012-06-11 展现和获取下载链接的方法及装置 Pending CN102760162A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012101918774A CN102760162A (zh) 2012-06-11 2012-06-11 展现和获取下载链接的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012101918774A CN102760162A (zh) 2012-06-11 2012-06-11 展现和获取下载链接的方法及装置

Publications (1)

Publication Number Publication Date
CN102760162A true CN102760162A (zh) 2012-10-31

Family

ID=47054619

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012101918774A Pending CN102760162A (zh) 2012-06-11 2012-06-11 展现和获取下载链接的方法及装置

Country Status (1)

Country Link
CN (1) CN102760162A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103246699A (zh) * 2013-04-01 2013-08-14 张士益 一种基于浏览器的数据访问控制方法和装置
CN103530365A (zh) * 2013-10-12 2014-01-22 北京搜狗信息服务有限公司 获取资源的下载链接的方法及系统
CN104038549A (zh) * 2014-06-18 2014-09-10 广州金山网络科技有限公司 一种数据下载方法、装置和终端
CN104283865A (zh) * 2013-07-12 2015-01-14 贝壳网际(北京)安全技术有限公司 一种下载处理方法、装置、服务器及客户端设备
CN104601614A (zh) * 2013-10-30 2015-05-06 腾讯科技(深圳)有限公司 客户端的下载方法及装置
CN105472033A (zh) * 2015-12-31 2016-04-06 腾讯科技(深圳)有限公司 媒体信息处理方法及移动终端
CN105574106A (zh) * 2015-12-14 2016-05-11 四川九成信息技术有限公司 一种大数据平台的网络信息分析处理方法
CN105574149A (zh) * 2015-12-16 2016-05-11 惠州Tcl移动通信有限公司 一种移动终端及其页面下载内容自动显示的方法和系统
CN105677132A (zh) * 2016-01-06 2016-06-15 腾讯科技(深圳)有限公司 应用程序的提示信息的处理方法和装置
CN106790593A (zh) * 2016-12-28 2017-05-31 北京奇虎科技有限公司 一种页面处理方法和装置
US9679076B2 (en) 2014-03-24 2017-06-13 Xiaomi Inc. Method and device for controlling page rollback
CN106919620A (zh) * 2015-12-28 2017-07-04 北京国双科技有限公司 单页面处理方法及装置
CN107734049A (zh) * 2017-10-31 2018-02-23 维沃移动通信有限公司 网络资源的下载方法、装置和移动终端
CN108170440A (zh) * 2017-12-11 2018-06-15 北京小米移动软件有限公司 应用来源统计方法及装置
CN108255865A (zh) * 2016-12-29 2018-07-06 广东中科遥感技术有限公司 php网站模板链接静态处理方法
CN110620795A (zh) * 2018-06-19 2019-12-27 优视科技有限公司 文件下载中断续传的方法、装置及终端
CN110955833A (zh) * 2019-11-27 2020-04-03 百度在线网络技术(北京)有限公司 一种搜索方法、装置、服务器、终端设备和介质
CN113626737A (zh) * 2021-10-12 2021-11-09 北京天际友盟信息技术有限公司 一种识别主体链接的方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020198962A1 (en) * 2001-06-21 2002-12-26 Horn Frederic A. Method, system, and computer program product for distributing a stored URL and web document set
CN101114285A (zh) * 2006-07-25 2008-01-30 腾讯科技(深圳)有限公司 一种互联网主题文件搜索方法、爬虫系统和搜索引擎
US20090287658A1 (en) * 2008-05-15 2009-11-19 Bennett James D Network browser supporting historical content viewing
CN101694658A (zh) * 2009-10-20 2010-04-14 浙江大学 基于新闻去重的网页爬虫的构建方法
CN102065108A (zh) * 2009-11-17 2011-05-18 中国移动通信集团广东有限公司 一种实现预下载的方法、无线通信终端及客户端浏览器
CN102624703A (zh) * 2011-12-31 2012-08-01 成都市华为赛门铁克科技有限公司 统一资源定位符url的过滤方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020198962A1 (en) * 2001-06-21 2002-12-26 Horn Frederic A. Method, system, and computer program product for distributing a stored URL and web document set
CN101114285A (zh) * 2006-07-25 2008-01-30 腾讯科技(深圳)有限公司 一种互联网主题文件搜索方法、爬虫系统和搜索引擎
US20090287658A1 (en) * 2008-05-15 2009-11-19 Bennett James D Network browser supporting historical content viewing
CN101694658A (zh) * 2009-10-20 2010-04-14 浙江大学 基于新闻去重的网页爬虫的构建方法
CN102065108A (zh) * 2009-11-17 2011-05-18 中国移动通信集团广东有限公司 一种实现预下载的方法、无线通信终端及客户端浏览器
CN102624703A (zh) * 2011-12-31 2012-08-01 成都市华为赛门铁克科技有限公司 统一资源定位符url的过滤方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
乔珊: "《宽带的油,你榨干了吗?》", 《电脑爱好者》 *
刘宇波: "《面向可下载资源的WEB搜索引擎的设计与实现》", 《中国优秀硕士学位论文全文数据库-信息科技辑》 *

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014161455A1 (zh) * 2013-04-01 2014-10-09 Zhang Shiyi 一种基于浏览器的数据访问控制方法和装置
CN103246699A (zh) * 2013-04-01 2013-08-14 张士益 一种基于浏览器的数据访问控制方法和装置
CN103246699B (zh) * 2013-04-01 2017-06-27 钱咸升(北京)网络科技有限公司 一种基于浏览器的数据访问控制方法和装置
CN104283865A (zh) * 2013-07-12 2015-01-14 贝壳网际(北京)安全技术有限公司 一种下载处理方法、装置、服务器及客户端设备
WO2015003664A1 (zh) * 2013-07-12 2015-01-15 贝壳网际(北京)安全技术有限公司 一种下载处理方法、装置、服务器及客户端设备
CN103530365A (zh) * 2013-10-12 2014-01-22 北京搜狗信息服务有限公司 获取资源的下载链接的方法及系统
CN103530365B (zh) * 2013-10-12 2017-07-04 北京搜狗信息服务有限公司 获取资源的下载链接的方法及系统
CN104601614B (zh) * 2013-10-30 2019-01-29 腾讯科技(深圳)有限公司 客户端的下载方法及装置
CN104601614A (zh) * 2013-10-30 2015-05-06 腾讯科技(深圳)有限公司 客户端的下载方法及装置
US9679076B2 (en) 2014-03-24 2017-06-13 Xiaomi Inc. Method and device for controlling page rollback
CN104038549A (zh) * 2014-06-18 2014-09-10 广州金山网络科技有限公司 一种数据下载方法、装置和终端
CN105574106B (zh) * 2015-12-14 2018-10-12 元力云网络有限公司 一种大数据平台的网络信息分析处理方法
CN105574106A (zh) * 2015-12-14 2016-05-11 四川九成信息技术有限公司 一种大数据平台的网络信息分析处理方法
CN105574149A (zh) * 2015-12-16 2016-05-11 惠州Tcl移动通信有限公司 一种移动终端及其页面下载内容自动显示的方法和系统
CN106919620B (zh) * 2015-12-28 2021-06-04 北京国双科技有限公司 单页面处理方法及装置
CN106919620A (zh) * 2015-12-28 2017-07-04 北京国双科技有限公司 单页面处理方法及装置
CN105472033A (zh) * 2015-12-31 2016-04-06 腾讯科技(深圳)有限公司 媒体信息处理方法及移动终端
CN105677132A (zh) * 2016-01-06 2016-06-15 腾讯科技(深圳)有限公司 应用程序的提示信息的处理方法和装置
CN106790593A (zh) * 2016-12-28 2017-05-31 北京奇虎科技有限公司 一种页面处理方法和装置
CN108255865A (zh) * 2016-12-29 2018-07-06 广东中科遥感技术有限公司 php网站模板链接静态处理方法
CN108255865B (zh) * 2016-12-29 2020-10-16 广东中科遥感技术有限公司 php网站模板链接静态处理方法
CN107734049A (zh) * 2017-10-31 2018-02-23 维沃移动通信有限公司 网络资源的下载方法、装置和移动终端
CN107734049B (zh) * 2017-10-31 2020-10-27 维沃移动通信有限公司 网络资源的下载方法、装置和移动终端
CN108170440A (zh) * 2017-12-11 2018-06-15 北京小米移动软件有限公司 应用来源统计方法及装置
CN110620795A (zh) * 2018-06-19 2019-12-27 优视科技有限公司 文件下载中断续传的方法、装置及终端
CN110955833A (zh) * 2019-11-27 2020-04-03 百度在线网络技术(北京)有限公司 一种搜索方法、装置、服务器、终端设备和介质
CN113626737A (zh) * 2021-10-12 2021-11-09 北京天际友盟信息技术有限公司 一种识别主体链接的方法、装置、电子设备及存储介质
CN113626737B (zh) * 2021-10-12 2022-03-11 北京天际友盟信息技术有限公司 一种识别主体链接的方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN102760162A (zh) 展现和获取下载链接的方法及装置
CN109543086B (zh) 一种面向多数据源的网络数据采集与展示方法
CN103136360B (zh) 一种互联网行为标注引擎及对应该引擎的行为标注方法
CN102930059B (zh) 一种聚焦爬虫的设计方法
CN105608134B (zh) 一种基于多线程的网络爬虫系统及其网页爬取方法
CN106126648B (zh) 一种基于重做日志的分布式商品信息爬虫方法
CN102708174B (zh) 一种浏览器中的富媒体信息的展示方法和装置
CN102521251A (zh) 个性化搜索直达的方法、实现该方法的装置和搜索服务器
US20090100015A1 (en) Web-based workspace for enhancing internet search experience
CN105138558B (zh) 基于用户访问内容的实时个性化信息采集方法
CN104268148B (zh) 一种基于时间串的论坛页面信息自动抽取方法及系统
CN102831199A (zh) 建立兴趣模型的方法及装置
CN104391978B (zh) 用于浏览器的网页收藏处理方法及装置
CN103023714A (zh) 基于网络话题的活跃度与集群结构分析系统及方法
CN103455524A (zh) 展现和获取词条信息的方法和装置
US20150161278A1 (en) Method and apparatus for identifying webpage type
US20100094826A1 (en) System for resolving entities in text into real world objects using context
CN103530339A (zh) 移动应用信息推送方法和装置
CN107066576A (zh) 一种大数据网络爬虫分页选择方法和系统
CN104239298A (zh) 文本信息推荐方法、服务器、浏览器及系统
CN106909663A (zh) 基于标签用户品牌偏好行为预测方法及其装置
CN106446115A (zh) 移动上网用户分类方法及装置
CN104090757A (zh) 针对浏览器的富媒体信息展示方法
CN110222251A (zh) 一种基于网页分割和搜索算法的服务包装方法
CN104090923A (zh) 一种浏览器中的富媒体信息的展示方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20121031