CN102663062A - 一种处理搜索结果中无效链接的方法及装置 - Google Patents

一种处理搜索结果中无效链接的方法及装置 Download PDF

Info

Publication number
CN102663062A
CN102663062A CN2012100907927A CN201210090792A CN102663062A CN 102663062 A CN102663062 A CN 102663062A CN 2012100907927 A CN2012100907927 A CN 2012100907927A CN 201210090792 A CN201210090792 A CN 201210090792A CN 102663062 A CN102663062 A CN 102663062A
Authority
CN
China
Prior art keywords
user
invalid
invalid link
search results
link
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012100907927A
Other languages
English (en)
Other versions
CN102663062B (zh
Inventor
李铁钧
宁浩宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qizhi Software Beijing Co Ltd filed Critical Qizhi Software Beijing Co Ltd
Priority to CN201210090792.7A priority Critical patent/CN102663062B/zh
Publication of CN102663062A publication Critical patent/CN102663062A/zh
Application granted granted Critical
Publication of CN102663062B publication Critical patent/CN102663062B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种处理搜索结果中无效链接的方法及装置,其中,所述方法包括:在浏览器端对用户浏览网页的页面信息进行监控;当监控到用户浏览网页的页面信息与预置的无效链接检测规则相匹配时,获取用户浏览网页的相关信息,并将所述用户浏览网页的相关信息发送至服务器端;其中,所述用户浏览网页的相关信息包括被浏览网页的唯一性标识信息;服务器端接收到所述用户浏览网页的相关信息后,对所述用户浏览网页进行有效性检测,得到检测结果;搜索引擎服务器根据所述检测结果,对搜索结果中包含的无效链接进行处理。通过本发明,能够比较快速和高效的发现互联网上的无效链接,进而快速地应用于改善搜索结果。

Description

一种处理搜索结果中无效链接的方法及装置
技术领域
本发明涉及计算机技术领域,特别是涉及一种处理搜索结果中无效链接的方法及装置。
背景技术
随着计算机的普及和互联网的发展,人们对网络的使用越来越频繁,计算机网络逐渐成为人们日常生活中必不可少的工具,而搜索引擎因其本身能够提供的各种丰富的信息服务,给用户提供了方方面面的信息和数据,在人们的日常生活中得到了广泛的应用,给人们日常的生产生活带来了巨大的便利。
搜索引擎网站是互联网上专门提供检索服务的一类网站,这些站点的服务器通过网络搜索软件或网络登录等方式,将互联网上的大量网站的页面信息收集起来,经过加工处理后,建立信息数据库和索引数据库,通过一定的接口对用户提出的检索请求做出响应,提供用户所需的信息。能否将互联网上不断出现的新的页面和有效信息迅速而高效收集起来,是衡量一个搜索引擎优劣的标准之一,同时也是搜索引擎是否能为用户提供优质服务的基础。搜索引擎网站需要不断更新自己的信息数据库,将从互联网上获取到的信息进行加工和整合,建立信息数据库和索引数据库,以便为用户提供信息检索和查询服务。
然而,在当今互联网高速发展的情况下,网页的数量以极高的速度与日俱增的同时,在互联网上存在着一定数量的无效链接,无效链接也叫做“死链”,用户在点击这种链接时,通常会返回一个带有错误提示的页面,如常见的“404错误”页面,或者某些互联网服务提供商返回的带有类似“您访问的页面不存在”等字样的页面。造成链接无效的原因是多样的,比如网页内容更新并换成其他的链接,使原来的有效链接变成无效链接;某些文件夹的名称或者路径修改,路径错误链接变成无效链接等等。无效链接的存在对于网站和搜索引擎,乃至用户都有着不利的影响。对于网站来说,无效链接可能会使网站的搜索排名降低,使用户资源流失;对于用户来说,访问一个存在若干无效链接的网站,无疑会影响用户的互联网使用。
而对于搜索引擎来说,在响应用户的检索请求时,呈现给用户的搜索结果中如果出现无效链接,势必会影响用户的信息检索效率。因此,迫切需要本领域技术人员解决的技术问题就在于,如何提供一种高效的处理搜索结果中无效链接的方法,使搜索引擎能够快速的处理数据库中的无效链接,更好的满足用户使用互联网搜索引擎进行信息检索的需要。
发明内容
本发明提供了一种处理搜索结果中无效链接的方法,能够比较快速和高效的发现互联网上的无效链接,进而快速地应用于改善搜索结果。
本发明提供了如下方案:
一种处理搜索结果中无效链接的方法,包括:
在浏览器端对用户浏览网页的页面信息进行监控;
当监控到用户浏览网页的页面信息与预置的无效链接检测规则相匹配时,获取用户浏览网页的相关信息,并将所述用户浏览网页的相关信息发送至服务器端;其中,所述用户浏览网页的相关信息包括被浏览网页的唯一性标识信息;
服务器端接收到所述用户浏览网页的相关信息后,对所述用户浏览网页进行有效性检测,得到检测结果;
搜索引擎服务器根据所述检测结果,对搜索结果中包含的无效链接进行处理。
其中,由所述服务器端向所述浏览器端下发所述无效链接检测规则;所述方法还包括:
所述服务器端根据所述检测结果以及所述用户浏览网页的相关信息,更新所述无效链接检测规则,将更新后的无效链接检测规则下发给所述浏览器端,以便所述浏览器端使用更新后的无效链接检测规则对用户浏览网页时获得的页面信息进行监控。
其中,所述搜索引擎服务器根据所述检测结果,对搜索结果中包含的无效链接进行处理,包括:
当检测出所述用户浏览网页对应的网址为无效链接时,根据所述用户浏览网页的相关信息更新无效链接库;
根据所述无效链接库对搜索结果中包含的无效链接进行处理。
其中,所述根据所述无效链接库对搜索结果中包含的无效链接进行处理,包括:
根据所述无效链接库,更新搜索引擎数据库,以便搜索引擎服务器在响应用户搜索请求时,依据更新后的搜索引擎数据库,对搜索结果中包含的无效链接进行处理;
或者,
搜索引擎服务器在响应用户搜索请求时,根据无效链接库,对搜索结果中包含的无效链接进行处理。
其中,还包括:
当检测出所述用户浏览网页对应的网址为无效链接时,获取无效链接形成原因,并记录在所述无效链接库中;
所述对搜索结果中包含的无效链接进行处理包括:
搜索引擎服务器在响应用户搜索请求时,结合所述无效链接形成原因,对搜索结果中包含的无效链接进行处理。
其中,所述对搜索结果中包含的无效链接进行处理,包括:
屏蔽搜索结果中包含的无效链接;
或者,
为搜索结果中包含的无效链接添加标识;
或者,
将搜索结果中包含的无效链接做排序降权处理;
或者,
当用户点击搜索结果中的无效链接时,搜索引擎服务器返回由搜索引擎服务器备份存储的所述无效链接对应的网页内容,并给予用户相应提示。
一种处理搜索结果中无效链接的装置,包括:
监控单元,用于在浏览器端对用户浏览网页的页面信息进行监控;
信息获取及发送单元,用于当监控到用户浏览网页的页面信息与预置的无效链接检测规则相匹配时,获取用户浏览网页的相关信息,并将所述用户浏览网页的相关信息发送至服务器端;其中,所述用户浏览网页的相关信息包括被浏览网页的唯一性标识信息;
检测单元,用于服务器端接收到所述用户浏览网页的相关信息后,对所述用户浏览网页进行有效性检测,得到检测结果;
处理单元,用于搜索引擎服务器根据所述检测结果,对搜索结果中包含的无效链接进行处理。
其中,由所述服务器端向所述浏览器端下发所述无效链接检测规则;所述装置还包括:
检测规则更新下发单元,用于所述服务器端根据所述检测结果以及所述用户浏览网页的相关信息,更新所述无效链接检测规则,将更新后的无效链接检测规则下发给所述浏览器端,以便所述浏览器端使用更新后的无效链接检测规则对用户浏览网页时获得的页面信息进行监控。
其中,所述处理单元,包括:
无效链接库更新子单元,用于当检测出所述用户浏览网页对应的网址为无效链接时,根据所述用户浏览网页的相关信息更新无效链接库;
处理子单元,用于根据所述无效链接库对搜索结果中包含的无效链接进行处理。
其中,所述处理子单元,包括:
数据库更新子单元,用于根据所述无效链接库,更新搜索引擎数据库,以便搜索引擎服务器在响应用户搜索请求时,依据更新后的搜索引擎数据库,对搜索结果中包含的无效链接进行处理;
或者,
实时处理子单元,用于搜索引擎服务器在响应用户搜索请求时,根据无效链接库,对搜索结果中包含的无效链接进行处理。
其中,还包括:
成因获取及记录单元,用于当检测出所述用户浏览网页对应的网址为无效链接时,获取无效链接形成原因,并记录在所述无效链接库中;
所述处理子单元包括:
成因处理子单元,用于搜索引擎服务器在响应用户搜索请求时,结合所述无效链接形成原因,对搜索结果中包含的无效链接进行处理。
其中,所述处理单元,包括:
屏蔽子单元,用于屏蔽搜索结果中包含的无效链接;
或者,
标识子单元,用于为搜索结果中包含的无效链接添加标识;
或者,
降权子单元,用于将搜索结果中包含的无效链接做排序降权处理;
或者,
内容提供子单元,用于当用户点击搜索结果中的无效链接时,搜索引擎服务器返回由搜索引擎服务器备份存储的所述无效链接对应的网页内容,并给予用户相应提示。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
通过本发明,可以在浏览器端对用户浏览网页的页面信息进行监控,当监控到用户浏览网页的页面信息与预置的无效链接检测规则相匹配时,获取用户浏览网页的相关信息,并将用户浏览网页的相关信息发送至服务器端,使得服务器端能够更加快速和全面的获得互联网上可能的无效链接信息,在服务器端接收到用户浏览网页的相关信息后,对用户浏览的网页进行有效性检测,并根据检测结果,处理搜索引擎提供的搜索结果中的无效链接,使搜索引擎能够更高效的对无效链接做出响应,并在响应用户检索请求时对提供的搜索结果中的无效链接进行处理。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的方法的流程图;
图2是本发明实施例提供的装置的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,本发明实施例提供的方法包括以下步骤:
S101:在浏览器端对用户浏览网页的页面信息进行监控;
用户浏览互联网上的网页,一般会通过使用某一种浏览器进行,比如视窗Windows操作系统下运行的浏览器Internet Explorer,以及其他第三方浏览器。所谓第三方浏览器,通常指在Windows操作系统上运行的非IE的浏览器软件,这类第三方浏览器通常会因其有着针对用户的丰富的独特功能设计和个性化扩展,被许多用户安装和使用。
由于实际应用中,人们使用计算机的应用环境,如操作系统、浏览器类型等的不尽相同,在浏览器端对用户浏览网页时获得的页面信息进行监控可以有多种实现方式:
例如使用一种带有监控功能的第三方浏览器程序,在用户使用浏览器浏览网页时,对用户浏览网页时获得的页面信息进行监控。
另外针对支持插件扩展功能的浏览器,对用户浏览网页时获得的页面信息进行监控,也可以由随浏览器启动的插件程序来实现。插件是按照一定的应用程序接口规范编写出来的、能被主程序调用以实现处理某种事务的应用程序,例如某些下载辅助类软件的插件,用户安装这类插件程序后,在启动浏览器时,这些插件会随浏览器启动,并监视用户的点击操作以及系统剪切板信息,一旦用户的点击或者对页面链接进行复制操作,从而触发对某一互联网资源的下载,这类插件就会启动下载辅助软件,对用户选择的互联网资源进行下载。在本发明实施例中,对于不具备所需对用户浏览网页时获得的页面信息进行监控功能,但可以支持的浏览器插件扩展的浏览器来说,通过带有对用户浏览网页获得的信息进行监控功能的插件程序来实现对用户浏览网页时获得的页面信息进行监控,也是一种有效的实现手段。
当然,在本领域的技术中,还有其他实现对用户浏览网页时获得的页面信息进行监控的方法,在此就不再赘述举例了。
S102:当监控到用户浏览网页的页面信息与预置的无效链接检测规则相匹配时,获取用户浏览网页的相关信息,并将所述用户浏览网页的相关信息发送至服务器端;其中,所述用户浏览网页的相关信息包括被浏览网页的唯一性标识信息;
用户在点击无效的链接时,通常会返回一个带有错误提示的页面,如常见的“404错误”页面,或者某些互联网服务提供商返回的带有类似“您访问的页面不存在”等字样的错误提示页面等等,可以以这些点击无效链接后用户得到的页面的特征为依据,制定相应的无效链接检测规则。当监控到用户浏览网页与预置的无效链接检测规则相匹配时,可以将目标网页的URL作为一个疑似无效链接,并将其相关信息发送至服务器。
之所以将目标网页的URL作为一个疑似的无效链接看待,是因为,用户在打开一个目标网页时,可能由于种种原因,比如用户所使用网络的网络设置、服务器响应超时、用户缺少访问权限、用户防火墙规则设置等原因,导致用户无法打开目标页面而的到了带有错误提示的页面,而这种用户得到的错误提示页面可能会导致页面信息命中无效链接检测规则,此时可以将命中了浏览器端无效链接检测规则的链接作为“疑似无效链接”,对于疑似无效链接是否为真正的无效链接,可以在目标网页的页面信息命中了预置的无效链接检测规则,并将页面的相关信息发送至服务器端后,由服务器端做进一步的检测,同时根据用户浏览网页的相关信息,在服务器端的无效链接库中记录无效链接的形成原因,以便为处理搜索结果中的无效链接提供更多的依据。
无效链接检测规则可以内置于用户浏览器端的应用程序中,如固化到浏览器端的应用程序(比如浏览器)的无效链接检测模块或者检测插件中,当用户安装了有无效链接检测功能的浏览器端的应用程序,并启动浏览器浏览网页时,由浏览器端应用程序的无效链接检测模块或者检测插件,来检测用户获得页面信息是否命中了固化到浏览器端的应用程序的无效链接检测模块或者检测插件中的无效链接检测规则。另外,为了实现更大的灵活性,在实际应用中用户浏览器端也可以通过与服务器实时通信的方式,获得的实时的无效链接检测规则,即由服务器实时地将无效链接检测规则下发给用户浏览器端的应用程序,这样做可以使用户浏览器端及时更新无效链接检测规则,当服务器端无效链接检测规则更新而发生变化时,服务器将新的无效链接检测规则下发给用户浏览器端,这样,用户浏览器端可以及时获得新的无效链接检测规则,以更加准确的检测无效链接。
当监控到用户浏览目标网页时获得的页面信息与预置的无效链接检测规则相匹配时,获取目标网页的相关信息并发送至服务器端。目标网页的相关信息,包括被浏览网页的唯一性标识信息,以便服务器端能够依据这些标识信息,下载相应的页面以做进一步的检测。在实际的应用中,可以将比如网页的统一资源定位符URL,网页的特征性检测值如MD5值等信息作为被浏览网页的唯一性标识。而这种将获取的网页相关信息上报给服务器端的过程可以是实时的,即每监控到用户浏览目标网页时获得的页面信息与预置的无效链接检测规则相匹配时,就将此次用户浏览的目标网页的相关信息上报给服务器端,这样做可以实现服务器端实时获取用户浏览器端发现的疑似无效链接,保证了服务器端获得用户浏览器端发现的疑似无效链接信息的及时性。
也可以使用在浏览器端生成包含在浏览器端发现的无效链接信息的无效链接日志文件,并将无效链接日志文件上传到服务器端的方式,将用户浏览器端发现的无效链接上报给服务器端。当监控到用户浏览一目标网页时获得的页面信息与预置的无效链接检测规则相匹配时,在用户端生成包含失效页面URL等相关信息的日志文件,或者对原有日志文件进行更新,即将当前浏览器端发现的无效链接的信息整合到原有日志文件中,例如当原有日志中不存在当前发现的疑似无效链接的信息时,将当前发现的无效链接的信息增加到日志文件中。然后可以在一定的条件下,将用户浏览器端生成的无效链接日志文件上报给服务器端,交由服务器端进行处理。具体的,在一定的条件下,将用户浏览器端生成的无效链接日志文件上报给服务器端的过程中,可以是当用户浏览器端生成的无效链接日志文件达到一定的时间或者存储容量时,将无效链接日志文件上报给服务器端,比如,当无效链接日志文件达到或超过1兆字节时,将无效链接日志文件上报给服务器端,或者以1周作为一个时间段,每一周将无效链接日志文件上报给服务器端一次。这种在浏览器端生成包含在浏览器端发现的无效链接信息的无效链接日志文件,并在一定条件下上报无效链接日志文件到服务器端的方式,通常有能够降低系统和网络开销,减少用户计算机以及服务器系统压力的优点。
S103:服务器端接收到所述用户浏览网页的相关信息后,对所述用户浏览网页进行有效性检测,得到检测结果;
在已有的技术中,识别一个网页的URL是否成为无效链接,通常采用由服务器将搜索引擎网址库中收录的所有URL再次进行下载,如果下载不成功,或者返回类似“网页不存在”等提示信息,则可判定此网页URL为无效链接。但是,由于搜索引擎索引了海量的网页数据,搜索引擎网址库中收录的URL数量相当庞大,要通过逐一下载搜索引擎网址库中收录的URL并进行检测的方式,对所有的搜索引擎网址库中收录的URL进行检测,不仅需要较长的时间,也会消耗大量的带宽资源。而且,搜索引擎索引库提供的大多数网页并不会频繁在搜索结果中命中,或者在搜索结果的前端展现,这一部分网页从而不会经常被用户访问到,因而对于这部分网页进行频繁的无效链接检测不仅消耗系统和网络资源,而且对搜索结果的质量提升帮助不大。
在本发明实施例提供的方法中,服务器端在接收到命中了用户浏览器端无效链接检测规则的页面的相关信息后,检测目标页面URL是否为无效链接,当疑似无效链接确实无法下载,或者返回类似“网页不存在”等提示信息时,将疑似无效链接确定为无效链接。通过这种方法,可以充分利用互联网用户资源,通过利用众互联网用户浏览器端获取的疑似无效链接的信息,来确定需要进行无效链接检测的URL,而不是对数量庞大的搜索引擎网址库的所有URL都进行无效链接检测,从而减少了需要检测的URL数量,以及服务器端无效链接检测作业对系统资源及网络带宽的消耗,进而能够快速的发现无效链接,并将检测结果快速的应用于改善搜索结果,以及搜索引擎数据库的更新。在发明人实施本发明的实践过程中,应用本发明实施例提供的方法,通过利用从互联网用户浏览器端获得的疑似无效链接的信息,筛选出需要进行无效链接检测的部分URL,并进行链接的有效性检测,这种方法能够提高发现及检测互联网上的无效链接的效率,进而提升搜索引擎的服务质量,实现了“取之于民,用之于民”。
另外,服务器端在接收到命中了用户浏览器端无效链接检测规则的页面的相关信息后,对疑似的无效链接进行检测并得到检测结果,在这个过程中,随着无效链接页面数量的增加,无效链接的页面可能会呈现出更多的特征,此时,服务器端可以建立包含一套无效链接检测规则的无效链接检测规则库,并向客户的浏览器端下发,同时,服务器端可以根据上述无效链接的页面呈现出的更多的特征,及时优化或更新无效链接检测规则库,并实时的或定期的,或者在响应用户浏览器端的无效链接检测规则更新请求时,向用户浏览器端下发优化或更新后的无效链接检测规则,以便用户浏览器端能够利用优化或更新后的无效链接检测规则,更高效和准确的命中互联网上的疑似无效链接。
S104:搜索引擎服务器根据所述检测结果,对搜索结果中包含的无效链接进行处理。
服务器端在接收到命中了用户浏览器端无效链接检测规则的页面的相关信息后,对疑似无效链接进行有效性检测,当服务器端经检测确定目标URL为无效链接时,将检测结果发送给搜索引擎,搜索引擎将根据检测结果,更新搜索引擎数据库。在这个过程中,服务器端可以实时的将检测确定为无效链接的相关信息发送给搜索引擎,由搜索引擎实时更新数据库;也可以由服务器端建立包含无效链接信息的无效链接库,当检测确定目标URL为无效链接时,根据目标URL的相关信息更新无效链接库,由搜索引擎参照服务器端的无效链接库更新搜索引擎数据库,从而处理搜索结果中的无效链接,使无效链接库中的无效链接信息作用于搜索结果。
在现有技术中,由于搜索引擎接收到无效链接的数据后,需要通过搜索引擎定期地重新构造数据库的方式才能影响搜索结果,即搜索引擎需要到下次重新构造索引库时,才能将上次到本次重新构造索引库期间发现的无效链接,应用于影响搜索结果,从发现无效链接到在搜索结果处理无效链接,通常在时间上是滞后的。因此,在本发明实施例的具体应用中,为了更加迅速的将发现的无效链接应用于影响搜索结果,也可以在用户提出检索请求时,搜索引擎实时的参考服务器端的无效链接库,在返回给用户搜索结果时,处理搜索结果中的无效链接。
在将发现的无效链接信息应用于影响搜索结果的过程中,即在处理搜索引擎结果中的无效链接的过程中,具体的可以有如下的处理方式:
可以将无效链接对应的页面信息从搜索结果中剔除;
可以对无效链接对应的页面信息进行降权处理,即在搜索结果排序的时将无效链接排在较后的位置;
也可以在搜索结果中展现无效链接并给予用户相应的提示,如对搜索结果中的无效链接添加标识,以告知用户本链接是个无效链接,以便用户可以有更多的选择。具体在为搜索结果包含的无效链接添加标识时,可以在通过浏览器渲染搜索结果页面前,找到无效链接在搜索结果页面中对应的页面元素,然后可以通过多种方式对无效链接对应的页面元素进行处理以提醒用户。例如:可以对页面元素的背景属性设置不同的颜色用以醒目的提醒用户;或者,在页面元素链接文本后插入一个图片网页元素、数字元素、或文本描述以醒目标识安全为死链、响应网页元素的mouseover事件(当鼠标指针位于元素上方时,会发生mouseover事件)以tooltip(控件提示)的方式说明此网址为无效链接。此外,对于提示给用户的信息,可以根据无效链接库中记录的无效链接的形成原因,给予用户相应的提示,比如某些无效链接可能是因为用户所使用网络的网络设置导致的无法访问,此时在提示用的信息中可以加入类似“您所在的网络可能不允许访问此网页”的提示;
还可以在搜索结果中,对无法访问的无效链接提供“快照”的方式,处理搜索结果中的无效链接。“快照”是搜索引擎服务器缓存的网页信息,在用户点击搜索结果中的无效链接时,可以将搜索引擎服务器提供的“快照”返回给用户,并给予用户相应的提示,如类似于“您所访问的链接为无效链接,本网页是由所搜引擎提供的快照”的提示信息。这样可以在用户无法访问无效链接时返回给用户搜索引擎服务器缓存的网页信息,达到了方便用户检索信息的目的;
此外也可以将以上提供的处理搜索结果中的无效链接的方式结合使用,比如将无效链接在搜索结果中降权并作出标识等。
另外,由于无效链接可能会因为网站管理员改正了链接错误等原因,使无效链接变成了有效链接,服务器端还可以对无效链接库中的无效链接做定期或不定期的重新检测,将其中的有效链接予以剔除,以保证无效链接库的准确性。具体在进行重新检测无效链接库中的无效链接时,同样可以由服务器端重新对无效链接库中的链接进行下载,在获取到页面内容后,根据无效链接检测规则,来确定网页的有效性,并对无效链接库进行更新操作。
直接对搜索引擎数据库进行无效链接的删除或者增加标识,相当于是一旦无效链接被识别了以后,会将结果固化在搜索引擎数据库中,也就是说从搜索引擎数据库直接查询的结果中就已经不包含无效链接,或者无效链接就已经包含有标识。具体在对搜索引擎数据库进行更新时,可以有全量和增量两种方式。其中,全量方式就是通过“重新构建(rebuild)”搜素引擎所有数据的方式进行更新,这种具有效率高,处理数据量大等优点,适用于大规模数据的更新操作。增量方式是以“修改”的方式对搜索引擎中的数据进行更新,不用重新构建整个或者部分搜索引擎数据库。这种方式具有生效快,不用中止在线服务等优点,适用于中小规模数据量的更新。增量模式是对全量模式的优化和改进,缩短了数据生效的时间。
需要说明的是,本发明实施例提供的方法,不但可以作为处理搜索结果中无效链接的主要手段,也可以作为其他现有技术的一种辅助手段,在应用现有技术手段的基础上,将本发明实施例提供的方法作为一种辅助的处理搜索结果中的无效链接的手段也是可行的,同样可以达到快速和高效的发现互联网上的无效链接,并应用于改善搜索结果,以及搜索引擎服务质量的目的。
与本发明实施例提供的处理搜索结果中无效链接的方法相对应,本发明实施例还提供了一种处理搜索结果中无效链接的装置,参见图2,该装置包括:
监控单元201,用于在浏览器端对用户浏览网页的页面信息进行监控;
信息获取及发送单元202,用于当监控到用户浏览网页的页面信息与预置的无效链接检测规则相匹配时,获取用户浏览网页的相关信息,并将所述用户浏览网页的相关信息发送至服务器端;其中,所述用户浏览网页的相关信息包括被浏览网页的唯一性标识信息;
检测单元203,用于服务器端接收到所述用户浏览网页的相关信息后,对所述用户浏览网页进行有效性检测,得到检测结果;
处理单元204,用于搜索引擎服务器根据所述检测结果,对搜索结果中包含的无效链接进行处理。
具体实现时,可以由所述服务器端向所述浏览器端下发所述无效链接检测规则;此时,该装置还可以包括:
检测规则更新下发单元,用于所述服务器端根据所述检测结果以及所述用户浏览网页的相关信息,更新所述无效链接检测规则,将更新后的无效链接检测规则下发给所述浏览器端,以便所述浏览器端使用更新后的无效链接检测规则对用户浏览网页时获得的页面信息进行监控。
在实际应用中,处理单元204可以包括:
无效链接库更新子单元,用于当检测出所述用户浏览网页对应的网址为无效链接时,根据所述用户浏览网页的相关信息更新无效链接库;
处理子单元,用于根据所述无效链接库对搜索结果中包含的无效链接进行处理。
其中,所述处理子单元具体可以包括:
数据库更新子单元,用于根据所述无效链接库,更新搜索引擎数据库,以便搜索引擎服务器在响应用户搜索请求时,依据更新后的搜索引擎数据库,对搜索结果中包含的无效链接进行处理;
或者,s
实时处理子单元,用于搜索引擎服务器在响应用户搜索请求时,根据无效链接库,对搜索结果中包含的无效链接进行处理。
另外,在实际应用中,该装置还可以包括:
成因获取及记录单元,用于当检测出所述用户浏览网页对应的网址为无效链接时,获取无效链接形成原因,并记录在所述无效链接库中;
此时,所述处理子单元可以包括:
成因处理子单元,用于搜索引擎服务器在响应用户搜索请求时,结合所述无效链接形成原因,对搜索结果中包含的无效链接进行处理。
具体对无效链接的处理方式可以有多种,具体的,处理单元204可以包括:
屏蔽子单元,用于屏蔽搜索结果中包含的无效链接;
或者,
标识子单元,用于为搜索结果中包含的无效链接添加标识;
或者,
降权子单元,用于将搜索结果中包含的无效链接做排序降权处理;
或者,
内容提供子单元,用于当用户点击搜索结果中的无效链接时,搜索引擎服务器返回由搜索引擎服务器备份存储的所述无效链接对应的网页内容,并给予用户相应提示。通过本发明实施例提供的装置,可以在浏览器端对用户浏览网页的页面信息进行监控,当监控到用户浏览网页的页面信息与预置的无效链接检测规则相匹配时,获取用户浏览网页的相关信息,并将用户浏览网页的相关信息发送至服务器端,使得服务器端能够更加快速和全面的获得互联网上可能的无效链接信息,在服务器端接收到用户浏览网页的相关信息后,对用户浏览的网页进行有效性检测,并根据检测结果,处理搜索引擎提供的搜索结果中的无效链接,使搜索引擎能够更高效的对无效链接做出响应,并在响应用户检索请求时对提供的搜索结果中的无效链接进行处理。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上对本发明所提供的处理搜索结果中无效链接的方法及装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (12)

1.一种处理搜索结果中无效链接的方法,其特征在于,包括:
在浏览器端对用户浏览网页的页面信息进行监控;
当监控到用户浏览网页的页面信息与预置的无效链接检测规则相匹配时,获取用户浏览网页的相关信息,并将所述用户浏览网页的相关信息发送至服务器端;其中,所述用户浏览网页的相关信息包括被浏览网页的唯一性标识信息;
服务器端接收到所述用户浏览网页的相关信息后,对所述用户浏览网页进行有效性检测,得到检测结果;
搜索引擎服务器根据所述检测结果,对搜索结果中包含的无效链接进行处理。
2.根据权利要求1所述的方法,其特征在于,由所述服务器端向所述浏览器端下发所述无效链接检测规则;所述方法还包括:
所述服务器端根据所述检测结果以及所述用户浏览网页的相关信息,更新所述无效链接检测规则,将更新后的无效链接检测规则下发给所述浏览器端,以便所述浏览器端使用更新后的无效链接检测规则对用户浏览网页时获得的页面信息进行监控。
3.根据权利要求1所述的方法,其特征在于,所述搜索引擎服务器根据所述检测结果,对搜索结果中包含的无效链接进行处理,包括:
当检测出所述用户浏览网页对应的网址为无效链接时,根据所述用户浏览网页的相关信息更新无效链接库;
根据所述无效链接库对搜索结果中包含的无效链接进行处理。
4.根据权利要求3所述的方法,其特征在于,所述根据所述无效链接库对搜索结果中包含的无效链接进行处理,包括:
根据所述无效链接库,更新搜索引擎数据库,以便搜索引擎服务器在响应用户搜索请求时,依据更新后的搜索引擎数据库,对搜索结果中包含的无效链接进行处理;
或者,
搜索引擎服务器在响应用户搜索请求时,根据无效链接库,对搜索结果中包含的无效链接进行处理。
5.根据权利要求3或4所述的方法,其特征在于,还包括:
当检测出所述用户浏览网页对应的网址为无效链接时,获取无效链接形成原因,并记录在所述无效链接库中;
所述对搜索结果中包含的无效链接进行处理包括:
搜索引擎服务器在响应用户搜索请求时,结合所述无效链接形成原因,对搜索结果中包含的无效链接进行处理。
6.根据权利要求1所述的方法,其特征在于,所述对搜索结果中包含的无效链接进行处理,包括:
屏蔽搜索结果中包含的无效链接;
或者,
为搜索结果中包含的无效链接添加标识;
或者,
将搜索结果中包含的无效链接做排序降权处理;
或者,
当用户点击搜索结果中的无效链接时,搜索引擎服务器返回由搜索引擎服务器备份存储的所述无效链接对应的网页内容,并给予用户相应提示。
7.一种处理搜索结果中无效链接的装置,其特征在于,包括:
监控单元,用于在浏览器端对用户浏览网页的页面信息进行监控;
信息获取及发送单元,用于当监控到用户浏览网页的页面信息与预置的无效链接检测规则相匹配时,获取用户浏览网页的相关信息,并将所述用户浏览网页的相关信息发送至服务器端;其中,所述用户浏览网页的相关信息包括被浏览网页的唯一性标识信息;
检测单元,用于服务器端接收到所述用户浏览网页的相关信息后,对所述用户浏览网页进行有效性检测,得到检测结果;
处理单元,用于搜索引擎服务器根据所述检测结果,对搜索结果中包含的无效链接进行处理。
8.根据权利要求7所述的装置,其特征在于,由所述服务器端向所述浏览器端下发所述无效链接检测规则;所述装置还包括:
检测规则更新下发单元,用于所述服务器端根据所述检测结果以及所述用户浏览网页的相关信息,更新所述无效链接检测规则,将更新后的无效链接检测规则下发给所述浏览器端,以便所述浏览器端使用更新后的无效链接检测规则对用户浏览网页时获得的页面信息进行监控。
9.根据权利要求7所述的装置,其特征在于,所述处理单元,包括:
无效链接库更新子单元,用于当检测出所述用户浏览网页对应的网址为无效链接时,根据所述用户浏览网页的相关信息更新无效链接库;
处理子单元,用于根据所述无效链接库对搜索结果中包含的无效链接进行处理。
10.根据权利要求9所述的装置,其特征在于,所述处理子单元,包括:
数据库更新子单元,用于根据所述无效链接库,更新搜索引擎数据库,以便搜索引擎服务器在响应用户搜索请求时,依据更新后的搜索引擎数据库,对搜索结果中包含的无效链接进行处理;
或者,
实时处理子单元,用于搜索引擎服务器在响应用户搜索请求时,根据无效链接库,对搜索结果中包含的无效链接进行处理。
11.根据权利要求9或10所述的装置,其特征在于,还包括:
成因获取及记录单元,用于当检测出所述用户浏览网页对应的网址为无效链接时,获取无效链接形成原因,并记录在所述无效链接库中;
所述处理子单元包括:
成因处理子单元,用于搜索引擎服务器在响应用户搜索请求时,结合所述无效链接形成原因,对搜索结果中包含的无效链接进行处理。
12.根据权利要求7所述的装置,其特征在于,所述处理单元,包括:
屏蔽子单元,用于屏蔽搜索结果中包含的无效链接;
或者,
标识子单元,用于为搜索结果中包含的无效链接添加标识;
或者,
降权子单元,用于将搜索结果中包含的无效链接做排序降权处理;
或者,
内容提供子单元,用于当用户点击搜索结果中的无效链接时,搜索引擎服务器返回由搜索引擎服务器备份存储的所述无效链接对应的网页内容,并给予用户相应提示。
CN201210090792.7A 2012-03-30 2012-03-30 一种处理搜索结果中无效链接的方法及装置 Active CN102663062B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210090792.7A CN102663062B (zh) 2012-03-30 2012-03-30 一种处理搜索结果中无效链接的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210090792.7A CN102663062B (zh) 2012-03-30 2012-03-30 一种处理搜索结果中无效链接的方法及装置

Publications (2)

Publication Number Publication Date
CN102663062A true CN102663062A (zh) 2012-09-12
CN102663062B CN102663062B (zh) 2015-01-14

Family

ID=46772553

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210090792.7A Active CN102663062B (zh) 2012-03-30 2012-03-30 一种处理搜索结果中无效链接的方法及装置

Country Status (1)

Country Link
CN (1) CN102663062B (zh)

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103345499A (zh) * 2013-06-28 2013-10-09 宇龙计算机通信科技(深圳)有限公司 一种搜索引擎的搜索结果处理方法及装置
CN103473359A (zh) * 2013-09-26 2013-12-25 北京奇虎科技有限公司 一种引擎提供网页开放式摘要的方法及装置
CN103546830A (zh) * 2013-10-28 2014-01-29 Tcl集团股份有限公司 一种视频地址失效的处理方法及系统
CN104052630A (zh) * 2013-03-14 2014-09-17 北京百度网讯科技有限公司 对网站执行验证的方法和系统
CN104158697A (zh) * 2013-10-18 2014-11-19 深圳信息职业技术学院 一种死链检测方法及装置
CN104660721A (zh) * 2013-11-19 2015-05-27 腾讯科技(深圳)有限公司 资源数据下载中的下载地址处理方法、系统和装置
CN104750741A (zh) * 2013-12-30 2015-07-01 中国移动通信集团湖南有限公司 一种无效链接处理方法及装置
CN104869033A (zh) * 2015-04-23 2015-08-26 百度在线网络技术(北京)有限公司 一种用于确定死链接的方法和装置
CN104933180A (zh) * 2015-07-01 2015-09-23 北京奇虎科技有限公司 对包括手机号码的查询词进行搜索的方法和装置
CN104935605A (zh) * 2015-06-30 2015-09-23 北京奇虎科技有限公司 钓鱼网站的检测方法、装置及系统
CN104951556A (zh) * 2015-06-30 2015-09-30 北京奇虎科技有限公司 在搜索结果页中生成提示信息的方法及装置
CN104980770A (zh) * 2014-04-09 2015-10-14 杭州迪普科技有限公司 一种视频数据内容下载方法以及装置
CN105022824A (zh) * 2015-07-21 2015-11-04 北京神州绿盟信息安全科技股份有限公司 无效链接的识别方法和装置
CN105069011A (zh) * 2015-07-07 2015-11-18 安一恒通(北京)科技有限公司 用于管理网页收藏夹的方法、装置及系统
CN105187505A (zh) * 2015-08-11 2015-12-23 魅族科技(中国)有限公司 一种下载处理方法和装置
CN105653625A (zh) * 2015-12-23 2016-06-08 郑州悉知信息科技股份有限公司 一种异常数据分析方法及装置
CN105975526A (zh) * 2016-04-29 2016-09-28 国家计算机网络与信息安全管理中心 一种url链接有效性的验证方法
CN106209417A (zh) * 2016-06-23 2016-12-07 努比亚技术有限公司 一种资源下载链接可用性的监控处理系统及方法
CN106372206A (zh) * 2016-09-02 2017-02-01 广东聚联电子商务股份有限公司 一种在历史浏览界面标记网站的方法
CN106682041A (zh) * 2015-11-11 2017-05-17 北京国双科技有限公司 网页断链的检测方法和装置
CN106682223A (zh) * 2017-01-04 2017-05-17 上海智臻智能网络科技股份有限公司 数据有效性检测方法及装置、智能交互方法及装置
CN103618793B (zh) * 2013-11-29 2018-04-06 北京猎豹移动科技有限公司 浏览器任务监控方法、装置及系统
CN108062362A (zh) * 2017-12-01 2018-05-22 北京小度互娱科技有限公司 死链检测方法及装置
CN108207119A (zh) * 2016-10-17 2018-06-26 谷歌有限责任公司 对损坏网络连接的基于机器学习的识别
WO2019019648A1 (zh) * 2017-07-26 2019-01-31 深圳壹账通智能科技有限公司 用户行为统计方法、系统、计算机设备和存储介质
CN109408760A (zh) * 2018-09-30 2019-03-01 东软集团股份有限公司 获取坏死链接的信息的方法和装置
CN110825951A (zh) * 2019-10-30 2020-02-21 百度在线网络技术(北京)有限公司 网页处理方法、装置和电子设备
CN110990492A (zh) * 2020-03-03 2020-04-10 支付宝(杭州)信息技术有限公司 一种信息的处理方法、装置及设备
CN111444408A (zh) * 2020-03-26 2020-07-24 腾讯科技(深圳)有限公司 网络搜索处理方法、装置、电子设备
CN111488539A (zh) * 2020-04-08 2020-08-04 中国银行股份有限公司 页面调整方法及装置
CN112416707A (zh) * 2020-11-16 2021-02-26 北京五八信息技术有限公司 一种链接检测方法及装置
CN113326417A (zh) * 2021-06-17 2021-08-31 北京百度网讯科技有限公司 用于更新网页库的方法和装置
CN113343159A (zh) * 2021-08-06 2021-09-03 万商云集(成都)科技股份有限公司 一种从任意渠道快速获取数据并分析与存储的方法及系统
US11803597B2 (en) 2020-04-29 2023-10-31 Baidu Online Network Technology (Beijing) Co., Ltd. Data updating method, apparatus, search server, terminal and storage medium

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004084097A1 (en) * 2003-03-19 2004-09-30 Nhn Corporation Method and apparatus for detecting invalid clicks on the internet search engine
CN102024042A (zh) * 2010-12-03 2011-04-20 百度在线网络技术(北京)有限公司 一种监控图片展现效果的方法、装置和系统
CN102025559A (zh) * 2010-11-09 2011-04-20 百度在线网络技术(北京)有限公司 用于基于分级来进行死链检测和处理的方法和网络设备
CN102200980A (zh) * 2010-03-25 2011-09-28 北京搜狗科技发展有限公司 一种提供网络资源的方法及系统
CN102236654A (zh) * 2010-04-26 2011-11-09 广东开普互联信息科技有限公司 基于内容相关性的Web无效链接过滤方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004084097A1 (en) * 2003-03-19 2004-09-30 Nhn Corporation Method and apparatus for detecting invalid clicks on the internet search engine
CN102200980A (zh) * 2010-03-25 2011-09-28 北京搜狗科技发展有限公司 一种提供网络资源的方法及系统
CN102236654A (zh) * 2010-04-26 2011-11-09 广东开普互联信息科技有限公司 基于内容相关性的Web无效链接过滤方法
CN102025559A (zh) * 2010-11-09 2011-04-20 百度在线网络技术(北京)有限公司 用于基于分级来进行死链检测和处理的方法和网络设备
CN102024042A (zh) * 2010-12-03 2011-04-20 百度在线网络技术(北京)有限公司 一种监控图片展现效果的方法、装置和系统

Cited By (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104052630A (zh) * 2013-03-14 2014-09-17 北京百度网讯科技有限公司 对网站执行验证的方法和系统
CN103345499A (zh) * 2013-06-28 2013-10-09 宇龙计算机通信科技(深圳)有限公司 一种搜索引擎的搜索结果处理方法及装置
CN103473359B (zh) * 2013-09-26 2017-03-22 北京奇虎科技有限公司 一种引擎提供网页开放式摘要的方法及装置
CN103473359A (zh) * 2013-09-26 2013-12-25 北京奇虎科技有限公司 一种引擎提供网页开放式摘要的方法及装置
CN104158697A (zh) * 2013-10-18 2014-11-19 深圳信息职业技术学院 一种死链检测方法及装置
CN104158697B (zh) * 2013-10-18 2017-07-21 深圳信息职业技术学院 一种死链检测方法及装置
CN103546830B (zh) * 2013-10-28 2017-08-08 Tcl集团股份有限公司 一种视频地址失效的处理方法及系统
CN103546830A (zh) * 2013-10-28 2014-01-29 Tcl集团股份有限公司 一种视频地址失效的处理方法及系统
CN104660721A (zh) * 2013-11-19 2015-05-27 腾讯科技(深圳)有限公司 资源数据下载中的下载地址处理方法、系统和装置
CN104660721B (zh) * 2013-11-19 2019-09-20 腾讯科技(深圳)有限公司 资源数据下载中的下载地址处理方法、系统和装置
CN103618793B (zh) * 2013-11-29 2018-04-06 北京猎豹移动科技有限公司 浏览器任务监控方法、装置及系统
CN104750741A (zh) * 2013-12-30 2015-07-01 中国移动通信集团湖南有限公司 一种无效链接处理方法及装置
CN104980770A (zh) * 2014-04-09 2015-10-14 杭州迪普科技有限公司 一种视频数据内容下载方法以及装置
CN104869033A (zh) * 2015-04-23 2015-08-26 百度在线网络技术(北京)有限公司 一种用于确定死链接的方法和装置
CN104869033B (zh) * 2015-04-23 2018-05-01 百度在线网络技术(北京)有限公司 一种用于确定死链接的方法和装置
CN104951556A (zh) * 2015-06-30 2015-09-30 北京奇虎科技有限公司 在搜索结果页中生成提示信息的方法及装置
CN104935605B (zh) * 2015-06-30 2018-05-04 北京奇虎科技有限公司 钓鱼网站的检测方法、装置及系统
WO2017000613A1 (zh) * 2015-06-30 2017-01-05 北京奇虎科技有限公司 在搜索结果页中生成提示信息的方法及装置
CN104935605A (zh) * 2015-06-30 2015-09-23 北京奇虎科技有限公司 钓鱼网站的检测方法、装置及系统
CN104933180A (zh) * 2015-07-01 2015-09-23 北京奇虎科技有限公司 对包括手机号码的查询词进行搜索的方法和装置
CN105069011A (zh) * 2015-07-07 2015-11-18 安一恒通(北京)科技有限公司 用于管理网页收藏夹的方法、装置及系统
CN105022824A (zh) * 2015-07-21 2015-11-04 北京神州绿盟信息安全科技股份有限公司 无效链接的识别方法和装置
CN105022824B (zh) * 2015-07-21 2018-07-03 北京神州绿盟信息安全科技股份有限公司 无效链接的识别方法和装置
CN105187505A (zh) * 2015-08-11 2015-12-23 魅族科技(中国)有限公司 一种下载处理方法和装置
CN106682041A (zh) * 2015-11-11 2017-05-17 北京国双科技有限公司 网页断链的检测方法和装置
CN105653625A (zh) * 2015-12-23 2016-06-08 郑州悉知信息科技股份有限公司 一种异常数据分析方法及装置
CN105653625B (zh) * 2015-12-23 2020-05-12 郑州悉知信息科技股份有限公司 一种异常数据分析方法及装置
CN105975526A (zh) * 2016-04-29 2016-09-28 国家计算机网络与信息安全管理中心 一种url链接有效性的验证方法
CN106209417A (zh) * 2016-06-23 2016-12-07 努比亚技术有限公司 一种资源下载链接可用性的监控处理系统及方法
CN106372206A (zh) * 2016-09-02 2017-02-01 广东聚联电子商务股份有限公司 一种在历史浏览界面标记网站的方法
CN108207119A (zh) * 2016-10-17 2018-06-26 谷歌有限责任公司 对损坏网络连接的基于机器学习的识别
CN108207119B (zh) * 2016-10-17 2021-06-01 谷歌有限责任公司 对损坏网络连接的基于机器学习的识别
US11361046B2 (en) 2016-10-17 2022-06-14 Google Llc Machine learning classification of an application link as broken or working
CN106682223B (zh) * 2017-01-04 2020-03-10 上海智臻智能网络科技股份有限公司 数据有效性检测方法及装置、智能交互方法及装置
CN106682223A (zh) * 2017-01-04 2017-05-17 上海智臻智能网络科技股份有限公司 数据有效性检测方法及装置、智能交互方法及装置
WO2019019648A1 (zh) * 2017-07-26 2019-01-31 深圳壹账通智能科技有限公司 用户行为统计方法、系统、计算机设备和存储介质
CN108062362A (zh) * 2017-12-01 2018-05-22 北京小度互娱科技有限公司 死链检测方法及装置
CN109408760A (zh) * 2018-09-30 2019-03-01 东软集团股份有限公司 获取坏死链接的信息的方法和装置
CN110825951A (zh) * 2019-10-30 2020-02-21 百度在线网络技术(北京)有限公司 网页处理方法、装置和电子设备
CN110990492A (zh) * 2020-03-03 2020-04-10 支付宝(杭州)信息技术有限公司 一种信息的处理方法、装置及设备
CN110990492B (zh) * 2020-03-03 2020-06-16 支付宝(杭州)信息技术有限公司 一种信息的处理方法、装置及设备
CN111444408A (zh) * 2020-03-26 2020-07-24 腾讯科技(深圳)有限公司 网络搜索处理方法、装置、电子设备
CN111444408B (zh) * 2020-03-26 2021-09-14 腾讯科技(深圳)有限公司 网络搜索处理方法、装置、电子设备
CN111488539A (zh) * 2020-04-08 2020-08-04 中国银行股份有限公司 页面调整方法及装置
CN111488539B (zh) * 2020-04-08 2023-04-21 中国银行股份有限公司 页面调整方法及装置
US11803597B2 (en) 2020-04-29 2023-10-31 Baidu Online Network Technology (Beijing) Co., Ltd. Data updating method, apparatus, search server, terminal and storage medium
CN112416707A (zh) * 2020-11-16 2021-02-26 北京五八信息技术有限公司 一种链接检测方法及装置
CN112416707B (zh) * 2020-11-16 2022-02-11 北京五八信息技术有限公司 一种链接检测方法及装置
CN113326417A (zh) * 2021-06-17 2021-08-31 北京百度网讯科技有限公司 用于更新网页库的方法和装置
CN113326417B (zh) * 2021-06-17 2023-08-01 北京百度网讯科技有限公司 用于更新网页库的方法和装置
CN113343159A (zh) * 2021-08-06 2021-09-03 万商云集(成都)科技股份有限公司 一种从任意渠道快速获取数据并分析与存储的方法及系统
CN113343159B (zh) * 2021-08-06 2021-11-12 万商云集(成都)科技股份有限公司 一种从任意渠道快速获取数据并分析与存储的方法及系统

Also Published As

Publication number Publication date
CN102663062B (zh) 2015-01-14

Similar Documents

Publication Publication Date Title
CN102663062B (zh) 一种处理搜索结果中无效链接的方法及装置
CN102333122B (zh) 一种下载资源提供方法、装置及系统
CN107463641B (zh) 用于改进对搜索结果的访问的系统和方法
JP5199003B2 (ja) 管理装置及び計算機システム
CN106484828B (zh) 一种分布式互联网数据快速采集系统及采集方法
EP2724251B1 (en) Methods for making ajax web applications bookmarkable and crawlable and devices thereof
CN102799372B (zh) 一种图片信息的上传方法及上传装置
TW200935245A (en) System and method for providing visibility for dynamic webpages
CN105095280A (zh) 一种浏览器缓存方法和装置
CN102663049B (zh) 一种更新搜索引擎网址库方法及装置
US20150161267A1 (en) Deduplication in Search Results
CN102663052A (zh) 一种提供搜索引擎搜索结果的方法及装置
CN105721578A (zh) 一种用户行为数据采集方法和系统
CN102929944B (zh) Ie内核浏览器进行网页渲染的方法及装置
AU2008355023A1 (en) Generating sitemaps
CN105302461A (zh) 一种用于在移动应用中提供目标页面的方法与设备
CN104182425A (zh) 一种多语种网站的静态页面生成方法
CN110865834B (zh) 应用程序界面更新方法、装置、可读存储介质及终端设备
CN106557584A (zh) 一种网址收藏方法及装置
CN105975599B (zh) 一种监测网站的页面埋点的方法和装置
KR20110122719A (ko) 탐색 엔진 결과 페이지 연구 보조를 위한 시스템 및 방법
CN105653550A (zh) 网页过滤方法和装置
CN108108381B (zh) 页面的监测方法及装置
CN103347069A (zh) 网络访问的实现方法及装置
CN103440281A (zh) 一种用于获取下载文件的方法、装置与设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: QIZHI SOFTWARE (BEIJING) CO., LTD.

Effective date: 20121017

Owner name: BEIJING QIHU TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: QIZHI SOFTWARE (BEIJING) CO., LTD.

Effective date: 20121017

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100016 CHAOYANG, BEIJING TO: 100088 XICHENG, BEIJING

TA01 Transfer of patent application right

Effective date of registration: 20121017

Address after: 100088 Beijing city Xicheng District xinjiekouwai Street 28, block D room 112 (Desheng Park)

Applicant after: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Applicant after: Qizhi software (Beijing) Co.,Ltd.

Address before: The 4 layer 100016 unit of Beijing city Chaoyang District Jiuxianqiao Road No. 14 Building C

Applicant before: Qizhi software (Beijing) Co.,Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220726

Address after: Room 801, 8th floor, No. 104, floors 1-19, building 2, yard 6, Jiuxianqiao Road, Chaoyang District, Beijing 100015

Patentee after: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park)

Patentee before: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Patentee before: Qizhi software (Beijing) Co.,Ltd.