CN103631926B - 一种搜索结果页面中链接的连接方法及装置 - Google Patents

一种搜索结果页面中链接的连接方法及装置 Download PDF

Info

Publication number
CN103631926B
CN103631926B CN201310646954.5A CN201310646954A CN103631926B CN 103631926 B CN103631926 B CN 103631926B CN 201310646954 A CN201310646954 A CN 201310646954A CN 103631926 B CN103631926 B CN 103631926B
Authority
CN
China
Prior art keywords
target pages
link
address
execution data
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310646954.5A
Other languages
English (en)
Other versions
CN103631926A (zh
Inventor
任寰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201310646954.5A priority Critical patent/CN103631926B/zh
Priority claimed from CN201210094032.3A external-priority patent/CN102663074B/zh
Publication of CN103631926A publication Critical patent/CN103631926A/zh
Application granted granted Critical
Publication of CN103631926B publication Critical patent/CN103631926B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]

Abstract

本申请提供了一种搜索结果页面中链接的连接方法及装置,以解决搜索结果页面中的所述链接不能连接到目标页面的问题。所述的方法包括:检测到搜索结果页面中链接的搜索引擎失去连接,则从所述链接中提取目标页面的地址,其中所述目标页面为所述链接对应的页面;生成浏览器的跳转执行数据,其中所述跳转执行数据包括所述提取出来的目标页面的地址;执行所述跳转执行数据,连接到所述目标页面的地址。本申请在打开目标页面,即使所述链接对应的目标页面需要认证或安全加密,也不会受到影响,保证能够跳转到用户想看的目标页面中,搜索结果中的所述链接不会出现不能连接到目标页面的问题。

Description

一种搜索结果页面中链接的连接方法及装置
本发明专利申请是申请日为2012年3月31日、申请号为201210094032.3、名称为“一种搜索结果页面中链接的连接方法及装置”的中国发明专利申请的分案申请。
技术领域
本申请涉及技术领域,特别是涉及一种搜索结果页面中链接的连接方法及装置。
背景技术
浏览器是一种应用软件,可以显示网页服务器或者文件系统的HTML文件内容,并让用户与这些文件进行交互。它可以显示在万维网或局域网等网络内的文字、影像及其他信息。这些文字或影像,可以是连接其他网址的超链接,用户可迅速、轻易地浏览各种信息。
浏览器中的搜索功能可以使得用户更加快速准确地从网络众多数据中找到目标信息,用户通过某个搜索引擎的搜索功能获取到搜索结果后,将用户想要查看的页面作为目标页面,用户可以点击其中的链接来连接目标页面查看具体的内容。通常用户点击所述链接后,会先连接所述搜索引擎,由所述搜索引擎返回数据给浏览器,浏览器再根据返回数据连接并显示目标页面。
但有时用户点击所述链接时,由于网络状况不好等原因,导致搜索引擎的服务器与浏览器连接断开,浏览器接收不到返回数据,无法显示目标页面。此时一种解决方法是采用重定向的方法。
所述重定向是超文本传送协议HTTP(HyperText Transport Protocol)中的一种方法,即在链接会无法连接时,服务器可以修改超文本传送协议HTTP(HyperTextTransport Protocol)的响应头,然后返回到浏览器,由浏览器跳转到指定地址显示目标页面。
但是,若用户点击的所述链接对应的目标页面需要认证或安全加密,例如目标页面为银行网页,采用HTTPS协议(Hypertext Transfer Protocol over Secure SocketLayer,以安全为目标的HTTP通道)。所述HTTPS协议与HTTP协议不同,使用HTTP协议中的重定向方法因此无法连接到HTTPS协议的页面上。因此所述重定向的方法不能保证跳转到用户想看的目标页面中,搜索结果页面中的链接仍然不能连接到目标页面。
发明内容
本申请提供了一种搜索结果页面中链接的连接方法及装置,以解决搜索结果页面中的所述链接不能连接到目标页面的问题。
为了解决上述问题,本申请公开了一种搜索结果页面中链接的连接方法,包括:
检测到搜索结果页面中链接的搜索引擎失去连接,则从所述链接中提取目标页面的地址,其中所述目标页面为所述链接对应的页面;
生成浏览器的跳转执行数据,其中所述跳转执行数据包括所述提取出来的目标页面的地址;
执行所述跳转执行数据,连接到所述目标页面的地址。
优选的,所述从所述链接中提取目标页面的地址之前,还包括:
预先获取搜索结果页面中的链接,并分析所述链接的结构;
从链接中获取目标页面URL的位置,其中所述目标页面URL用于保存目标页面的地址。
优选的,所述从所述链接中提取目标页面的地址,包括:
从所述链接中目标页面URL的位置处提取目标页面的地址。
优选的,所述从所述链接中目标页面URL的位置处提取目标页面的地址,包括:
使用所述正则表达式从所述链接中查找目标页面URL的位置,其中,所述正则表达式用于查找所述链接中获取目标页面的地址;
在所述目标页面URL的位置处提取目标页面的地址。
优选的,所述跳转执行数据用于在浏览器中打开一个标签,并在所述标签内显示标签对象对应的页面,所述的方法还包括:
预先获取从本地缓存中获取浏览器的第一跳转执行数据并保存;
分析所述第一跳转执行数据中标签对象的位置。
优选的,根据生成浏览器的跳转执行数据,包括:
提取预先保存的第一跳转执行数据;
将所述第一跳转执行数据中标签对象的位置添加为所述目标页面的地址;
生成第二跳转执行数据,并保存在本地缓存中。
优选的,所述执行所述跳转执行数据,连接到所述目标页面的地址,包括:
提取并执行本地缓存中保存的第二跳转执行数据;
在浏览器中打开一个新的标签;
在所述新的标签中连接目标页面的地址以打开目标页面。
相应的,本申请还公开了一种搜索结果页面中链接的连接装置,包括:
提取模块,用于检测到搜索结果页面中链接的搜索引擎失去连接,则从所述链接中提取目标页面的地址,其中所述目标页面为所述链接对应的页面;
生成模块,用于生成浏览器的跳转执行数据,其中所述跳转执行数据包括所述提取出来的目标页面的地址;
连接模块,用于执行所述跳转执行数据,连接到所述目标页面的地址。
优选的,所述的装置还包括:第一预处理模块,所述第一预处理模块包括:
获取并分析子模块,用于预先获取搜索结果页面中链接,并分析所述链接的结构;
获取子模块,用于从链接中获取目标页面URL的位置,其中所述目标页面URL用于保存目标页面的地址。
优选的,所述提取模块,用于从所述链接中目标页面URL的位置处提取目标页面的地址。
优选的,所述提取模块,包括:
查找子模块,用于使用所述正则表达式从所述链接中查找目标页面URL的位置,其中,所述正则表达式用于查找所述链接中获取目标页面的地址;
提取子模块,用于在所述目标页面URL的位置处提取目标页面的地址。
优选的,所述跳转执行数据用于在浏览器中打开一个标签,并在所述标签内显示标签对象对应的页面,所述的装置还包括:第二预处理模块,
所述第二预处理模块,包括:
获取子模块,用于预先获取从本地缓存中获取浏览器的第一跳转执行数据并保存;
分析子模块,用于分析所述第一跳转执行数据获取标签对象的位置。
优选的,所述生成模块,包括:
提取子模块,用于提取预先保存的第一跳转执行数据;
添加子模块,用于将所述第一跳转执行数据中获取标签对象的位置添加为所述目标页面的地址;
生成并保存子模块,用于生成第二跳转执行数据,并保存在本地缓存中。
优选的,所述连接模块,包括:
提取并执行子模块,用于提取并执行本地缓存中保存的第二跳转执行数据;
打开子模块,用于在浏览器中打开一个新的标签;
连接子模块,用于在所述新的标签中连接目标页面的地址以打开目标页面。
与现有技术相比,本申请包括以下优点:
首先,检测到搜索结果页面中链接的搜索引擎失去连接,则从所述链接中提取目标页面的地址,其中所述目标页面为所述链接对应的页面,生成浏览器的跳转执行数据,其中所述跳转执行数据包括所述提取出来的目标页面的地址,执行所述跳转执行数据,连接到所述目标页面的地址。本申请在搜索引擎无法跳转到目标页面时,可以自己生成所述跳转执行数据,然后连接到所述目标页面的地址。本申请在打开目标页面,即使所述链接对应的目标页面需要认证或安全加密,也不会受到影响,保证能够跳转到用户想看的目标页面中,搜索结果中的所述链接不会出现不能连接到目标页面的问题。
附图说明
图1是本申请实施例所述一种搜索结果页面中链接的连接方法流程图;
图2是本申请优选实施例所述一种搜索结果页面中链接的连接方法流程图;
图3是本申请实施例所述一种搜索结果页面中链接的连接装置结构图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
用户点击所述链接时,由于网络状况不好等原因,导致搜索引擎的服务器与浏览器连接断开,浏览器接收不到返回数据,无法显示目标页面。
此时一种解决方法是采用重定向的方法。所述重定向的方法包括:1、301redirect即永久性转移(Permanently Moved);2、302redirect即暂时性转移(Temporarily Moved);3、meta fresh即通过网页中的meta指令,在特定时间后重定向到新的网页,如果延迟的时间太短(约5秒之内),会被判断为欺骗搜索引擎的信息。
但是所述重定向的方法不能保证跳转到用户想看的目标页面中,搜索结果中的所述链接仍然不能连接到目标页面。
本申请提供一种搜索结果页面中链接的连接方法,可以在打开目标页面,即使所述链接对应的目标页面需要认证或安全加密,也不会受到影响,保证能够跳转到用户想看的目标页面中,搜索结果中的所述链接不会出现不能连接到目标页面的问题。
参照图1,给出了本申请实施例所述一种搜索结果页面中链接的连接方法流程图。
步骤11,检测到搜索结果页面中链接的搜索引擎失去连接,则从所述链接中提取目标页面的地址,其中所述目标页面为所述链接对应的页面;
用户通过某个搜索引擎的搜索功能获取到搜索结果后,可以点击所述链接查看想看的页面,此时将用户想看的页面,即所述链接对应的页面作为目标页面。
例如,用户搜索xx网,在搜索结果页面中,第一条链接的描述信息为xx网首页,用户点击第一条链接,所述第一条链接对应的页面,即xx网首页为目标页面。
用户点击所述链接后,会先连接搜索引擎,此时若浏览器与搜索引擎失去连接,即检测到搜索结果页面中链接的搜索引擎失去连接,则无法接收搜索引擎的返回数据,如跳转执行数据,因此无法显示目标页面。此时浏览器可以从所述链接中提取目标页面的地址。
步骤12,生成浏览器的跳转执行数据,其中,所述跳转执行数据包括所述提取出来的目标页面的地址;
本申请依据浏览器通过跳转执行数据来显示目标页面的方法,在上述提取了目标页面的地址后,可以根据所述目标页面的地址,生成浏览器的跳转执行数据,然后使用所述生成的跳转执行数据打开并显示目标页面。
步骤13,执行所述跳转执行数据,连接到所述目标页面的地址。
在生成跳转执行数据后,浏览器可以执行所述跳转执行数据,根据所述跳转执行数据可以连接到所述目标页面的地址,显示所述目标页面。
综上所述,检测到搜索结果页面中链接的搜索引擎失去连接,则从所述链接中提取目标页面的地址,其中所述目标页面为所述链接对应的页面,生成浏览器的跳转执行数据,其中所述跳转执行数据包括所述提取出来的目标页面的地址,执行所述跳转执行数据,连接到所述目标页面的地址。本申请在搜索引擎无法跳转到目标页面时,可以自己生成所述跳转执行数据,然后连接到所述目标页面的地址。本申请可在打开目标页面,即使所述链接对应的目标页面需要认证或安全加密,也不会受到影响,保证能够跳转到用户想看的目标页面中,搜索结果中的所述链接不会出现不能连接到目标页面的问题。
通常缓存机制是由响应头来控制的。HTTP规范描述了Header控制缓存,Theoptional Cache-Control,Expires(过期)。
一般说来,遵循以下基本的规则:
1、如果响应头信息:告诉缓存器不要保留缓存,缓存器就不会缓存相应内容;
2、如果请求信息是需要认证或者安全加密的,相应内容也不会被缓存;
3、如果在回应中不存在校验器(ETag或者Last-Modified头信息),缓存服务器会认为缺乏直接的更新度信息,内容将会被认为不可缓存。
4、一个缓存的副本如果含有以下信息:内容将会被认为是足够新的
1)含有完整的过期时间和寿命控制头信息,并且内容仍在保鲜期内;
2)浏览器已经使用过缓存副本,并且在一个会话中已经检查过内容的新鲜度;
3)缓存代理服务器近期内已经使用过缓存副本,并且内容的最后更新时间在上次使用期之前;
4)够新的副本将直接从缓存中送出,而不会向源服务器发送请求;
5、如果缓存的副本已经太旧了,缓存服务器将向源服务器发出请求校验请求,用于确定是否可以继续使用当前拷贝继续服务。
本申请通过浏览器的HTTP缓存机制,可以根据用户在搜索应请的历史Javascript脚本动态构造新的Javascript脚本,并置于浏览器HTTP缓存内。当搜索引擎不可服务时,浏览器执行动态构造新的Javascript脚本,连接目标页面。
优选的,所述从点击的所述链接中提取目标页面的地址之前,还包括:
预先获取搜索结果页面中的链接,并分析所述链接的结构;
从链接中获取目标页面URL的位置,其中所述目标页面URL用于保存目标页面的地址。
本申请可以预先获取搜索结果页面中的链接,然后分析所述链接的结构。例如,所述链接中可能包含搜索引擎对应的地址,搜索的关键字,目标页面的地址等。
对所述链接的结构分析后,就可以从中获取目标页面URL的位置,其中所述目标页面URL用于保存目标页面的地址。
优选的,所述跳转执行数据用于在浏览器中打开一个标签,并在所述标签内显示标签对象对应的页面,
所述的方法还包括:
预先获取从本地缓存中获取浏览器的第一跳转执行数据并保存;
分析所述第一跳转执行数据中标签对象的位置。
浏览器在通过跳转执行数据连接页面时,会将所述跳转执行数据保存在本地缓存中。将所述本地缓存中的调准执行数据作为第一跳转执行数据,预先获取本地缓存中的第一跳转执行数据,并且可以保存所述第一跳转执行数据,可以仍然保存在本地缓存中,也可以保存在其它位置,本申请对此不作限定。
其中,所述跳转执行数据的功能是首先在浏览器中打开一个标签,然后在所述标签内连接并显示标签对象对应的页面。
因此可以分析所述第一跳转执行数据的结构,分析出所述第一跳转执行数据中标签对象的位置。后续将所述标签对象的位置中的页面地址替换成目标页面的地址,连接目标页面。
例如,一种跳转执行数据中,具体Javascript脚本如下:
<script>window.googleJavaScriptRedirect=1</script><script>var a=parent,b=parent.google,c=location;if(a!=window&&b){if(b.r){b.r=0;a.location.href=″http://ent.xx1.com.cn/s/m/f/lix2.html″;c.replace(″about:blank″);}}else{c.replace(″http://ent.xx1.com.cn/s/m/f/lix2.html″);};</script><noscript><META http-equiv=″refresh″
content=″0;URL=′http://ent.xx1.com.cn/s/m/f/lix2.html′″></noscript>
其中,标签对象的位置中的页面地址为:
http://ent.xx1.com.cn/s/m/f/lix2.html。
下面具体论述搜索结果页面中链接的连接方法:
参照图2,给出了本申请优选实施例所述一种搜索结果页面中链接的连接方法流程图。
步骤201,从所述链接中目标页面URL的位置处提取目标页面的地址;
上述分析出所述第一跳转执行数据中标签对象的位置后,可以构造一个正则表达式或一个函数,然后从所述链接中目标页面URL的位置处提取目标页面的地址。
如,使用所述正则表达式从所述链接中查找目标页面URL的位置,其中,所述正则表达式用于查找所述链接中获取目标页面的地址
例如,搜索结果页面中搜索xx网的第一条链接为:
http://www.google.com.hk/url?sa=t&rct=j&q=%E5%A5%87%E8%99%8E&source=web&cd=1&ved=0CDoQFjAA&url=http%3A%2F%2Fwww.xx.com%2F&ei=bUJoT6_ALMPorQeI9rHdBw&usg=AFQjCNGjK7aOPd4q6SliFZugXw gb-M4DVQ
可以从中提取目标页面的地址,即xx网的地址:http://www.xx.com/
步骤202,提取预先保存的第一跳转执行数据;
然后可以第一跳转执行数据的保存地址处提取所述跳转执行数据,例如,若跳转文件保存在本地缓存中,就可以从本地缓存各种获取所述第一跳转执行数据。
当然,也可以在浏览器的服务器端保存所述第一跳转执行数据,可以实时更新所述第一跳转执行数据,然后在浏览器需要所述第一跳转执行数据时,发送请求给服务器来获取所述第一跳转执行数据。本申请对所述第一跳转执行数据保存位置和获取方法不作限定。
步骤203,将所述第一跳转执行数据中标签对象的位置添加为所述目标页面的地址;
在获取到所述第一跳转执行数据后,可以在第一跳转执行数据中标签对象的位置处,使用所述目标页面的地址替换原有的页面地址。
例如将上述页面地址:http://ent.xx1.com.cn/s/m/f/lix2.html,替换为xx网的地址:http://www.xx.com/。
步骤204,生成第二跳转执行数据,并保存在本地缓存中;
在修改了标签对象对应的页面地址后,可以生成第二跳转执行数据,并保存在本地缓存中。
步骤205,提取并执行本地缓存中保存的第二跳转执行数据;
然后提取本地缓存中保存的第二跳转执行数据,并执行所述第二跳转执行数据。
步骤206,在浏览器中打开一个新的标签;
所述第二跳转执行数据首先在浏览器中打开一个新的标签,所述新的标签用于显示目标页面。
步骤207,在所述新的标签中连接目标页面的地址以打开目标页面。
然后所述第二跳转执行数据在新的标签中连接所述标签对象,即连接目标页面的地址,然后打开并显示所述目标页面。
参照图3,给出了本申请实施例所述一种搜索结果页面中链接的连接装置结构图。
相应的,本申请提供了一种搜索结果页面中链接的连接装置,包括:提取模块13、生成模块14和连接模块15,其中,
提取模块13,用于检测到搜索结果页面中链接的搜索引擎失去连接,则从所述链接中提取目标页面的地址,其中所述目标页面为所述链接对应的页面;
生成模块14,用于生成浏览器的跳转执行数据,其中所述跳转执行数据包括所述提取出来的目标页面的地址;
连接模块15,用于执行所述跳转执行数据,连接到所述目标页面的地址。
优选的,所述的装置还包括:第一预处理模块11,
所述第一预处理模块11包括:
获取并分析子模块111,用于预先获取搜索结果页面中链接,并分析所述链接的结构;
获取子模块112,用于从链接中获取目标页面URL的位置,其中所述目标页面URL用于保存目标页面的地址。
优选的,所述提取模块13,用于从所述链接中目标页面URL的位置处提取目标页面的地址。
优选的,提取模块13,包括:
查找子模块131,用于使用所述正则表达式从所述链接中查找目标页面URL的位置,其中,所述正则表达式用于查找所述链接中获取目标页面的地址;
提取子模块132,用于在所述目标页面URL的位置处提取目标页面的地址。
优选的,所述跳转执行数据用于在浏览器中打开一个标签,并在所述标签内显示标签对象对应的页面,
所述的装置还包括:第二预处理模块12,
所述第二预处理模块12,包括:
获取子模块121,用于预先获取从本地缓存中获取浏览器的第一跳转执行数据并保存;
分析子模块122,用于分析所述第一跳转执行数据获取标签对象的位置。
优选的,所述生成模块14,包括:
提取子模块141,用于提取预先保存的第一跳转执行数据;
添加子模块142,用于将所述第一跳转执行数据中获取标签对象的位置添加为所述目标页面的地址;
生成并保存子模块143,用于生成第二跳转执行数据,并保存在本地缓存中。
优选的,所述连接模块15,包括:
提取并执行子模块151,用于提取并执行本地缓存中保存的第二跳转执行数据;
打开子模块152,用于在浏览器中打开一个新的标签;
连接子模块153,用于在所述新的标签中连接目标页面的地址以打开目标页面。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上对本申请所提供的一种搜索结果页面中链接的连接方法及装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (9)

1.一种搜索结果页面中链接的连接方法,其包括:
当搜索结果页面中的链接打不开时,从所述链接中提取目标页面的地址,其中,所述目标页面为所述链接对应的页面;
根据所述目标页面的地址生成浏览器的跳转执行数据;
执行所述跳转执行数据以打开所述目标页面;
其中,根据所述目标页面的地址生成浏览器的跳转执行数据进一步包括:预先从本地缓存中获取浏览器的第一跳转执行数据并保存;分析所述第一跳转执行数据以获得标签对象的位置;把所述目标页面的地址添加到所述第一跳转执行数据中标签对象的位置处以生成第二跳转执行数据;把所述第二跳转执行数据保存在本地缓存中;其中,分析所述第一跳转执行数据以获得标签对象的位置包括:分析所述第一跳转执行数据的结构,进而分析出所述第一跳转执行数据中标签对象的位置。
2.根据权利要求1所述的方法,其中,从所述链接中提取目标页面的地址进一步包括:
获取搜索结果页面中的链接;
对所述链接的结构进行分析以获取目标页面的地址在所述链接中的位置;
从目标页面的地址在所述链接中的位置处提取目标页面的地址。
3.根据权利要求1所述的方法,其中,执行所述跳转执行数据以打开所述目标页面进一步包括:
提取并执行本地缓存中保存的第二跳转执行数据;
在浏览器中打开一个新的标签;
在所述新的标签中连接所述第二跳转执行数据中所包含的目标页面的地址以打开目标页面。
4.一种搜索结果页面中链接的连接装置,其包括
提取模块,适于当搜索结果页面中的链接打不开时,从所述链接中提取目标页面的地址,其中,所述目标页面为所述链接对应的页面;
生成模块,适于根据所述目标页面的地址生成浏览器的跳转执行数据;
打开模块,适于执行所述跳转执行数据以打开所述目标页面;
其中,生成模块还包括:预处理模块,适于预先从本地缓存中获取浏览器的第一跳转执行数据并保存;分析子模块,适于分析所述第一跳转执行数据以获得标签对象的位置;生成子模块,适于把所述目标页面的地址添加到所述第一跳转执行数据中标签对象的位置处以生成第二跳转执行数据;保存子模块,适于把所述第二跳转执行数据保存在本地缓存中;其中,分析所述第一跳转执行数据以获得标签对象的位置包括:分析所述第一跳转执行数据的结构,进而分析出所述第一跳转执行数据中标签对象的位置。
5.根据权利要求4所述的装置,其中,提取模块还包括:
获取子模块,适于获取搜索结果页面中的链接;
获取分析子模块,适于对所述链接的结构进行分析以获取目标页面的地址在所述链接中的位置;
提取子模块,适于从目标页面的地址在所述链接中的位置处提取目标页面的地址。
6.一种搜索结果页面中链接的连接方法,其包括:
从本地缓存中获取浏览器的跳转执行数据并对该跳转执行数据进行分析以获得标签对象的位置,其中,本地缓存中存储了浏览器的跳转执行数据;
当搜索结果页面中的链接打不开时,从所述链接中提取目标页面的地址,其中,所述目标页面为所述链接对应的页面;
把所提取的目标页面的地址添加到所获取的标签对象的位置处;
所述方法还包括:执行经处理的跳转执行数据以打开所述目标页面;进一步包括:提取并执行经处理了的跳转执行数据;在浏览器中打开一个新的标签;在所述新的标签中连接经处理的跳转执行数据中所包含的目标页面的地址以打开目标页面。
7.根据权利要求6所述的方法,其中,从所述链接中提取目标页面的地址进一步包括:
获取搜索结果页面中的链接;
对所述链接的结构进行分析以获取目标页面的地址在所述链接中的位置;
从目标页面的地址在所述链接中的位置处提取目标页面的地址。
8.一种搜索结果页面中链接的连接装置,其包括
标签对象位置获取模块,适于从本地缓存中获取浏览器的跳转执行数据并对该跳转执行数据进行分析以获得标签对象的位置,其中,本地缓存中存储了浏览器的跳转执行数据;
提取模块,适于当搜索结果页面中的链接打不开时,从所述链接中提取目标页面的地址,其中,所述目标页面为所述链接对应的页面;
添加模块,适于把所提取的目标页面的地址添加到所获取的标签对象的位置处;
所述装置还包括:执行模块,适于执行经处理的跳转执行数据以打开所述目标页面;进一步包括:提取执行模块,适于提取并执行经处理了的跳转执行数据;标签打开模块,适于在浏览器中打开一个新的标签;连接打开模块,适于在所述新的标签中连接经处理的跳转执行数据中所包含的目标页面的地址以打开目标页面。
9.根据权利要求8所述的装置,其中,提取模块还包括:
链接获取模块,适于获取搜索结果页面中的链接;
目标页面地址位置获取模块,适于对所述链接的结构进行分析以获取目标页面的地址在所述链接中的位置;
提取子模块,适于从目标页面的地址在所述链接中的位置处提取目标页面的地址。
CN201310646954.5A 2012-03-31 2012-03-31 一种搜索结果页面中链接的连接方法及装置 Expired - Fee Related CN103631926B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310646954.5A CN103631926B (zh) 2012-03-31 2012-03-31 一种搜索结果页面中链接的连接方法及装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201310646954.5A CN103631926B (zh) 2012-03-31 2012-03-31 一种搜索结果页面中链接的连接方法及装置
CN201210094032.3A CN102663074B (zh) 2012-03-31 2012-03-31 一种搜索结果页面中链接的连接方法及装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201210094032.3A Division CN102663074B (zh) 2012-03-31 2012-03-31 一种搜索结果页面中链接的连接方法及装置

Publications (2)

Publication Number Publication Date
CN103631926A CN103631926A (zh) 2014-03-12
CN103631926B true CN103631926B (zh) 2017-07-04

Family

ID=50212967

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310646954.5A Expired - Fee Related CN103631926B (zh) 2012-03-31 2012-03-31 一种搜索结果页面中链接的连接方法及装置

Country Status (1)

Country Link
CN (1) CN103631926B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106933871B (zh) 2015-12-30 2021-08-17 创新先进技术有限公司 短链接处理方法、装置及短链接服务器
CN105930476A (zh) * 2016-04-28 2016-09-07 乐视控股(北京)有限公司 一种连接地址的生成方法和终端
CN106997374A (zh) * 2017-01-05 2017-08-01 深圳大宇无限科技有限公司 深度链接获取方法和装置
CN110750741B (zh) * 2019-10-18 2022-12-13 深圳市比量科技传媒有限公司 一种网页链接跳转处理方法、计算机装置及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101067812A (zh) * 2006-12-21 2007-11-07 腾讯科技(深圳)有限公司 一种保持网页当前数据信息的方法及系统
CN101158974A (zh) * 2007-11-21 2008-04-09 深圳市茁壮网络技术有限公司 一种资源引用的方法及装置
CN102169486A (zh) * 2010-02-25 2011-08-31 腾讯科技(深圳)有限公司 一种文件下载方法及装置
CN102214223A (zh) * 2011-06-15 2011-10-12 奇智软件(北京)有限公司 一种浏览器访问控制方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101067812A (zh) * 2006-12-21 2007-11-07 腾讯科技(深圳)有限公司 一种保持网页当前数据信息的方法及系统
CN101158974A (zh) * 2007-11-21 2008-04-09 深圳市茁壮网络技术有限公司 一种资源引用的方法及装置
CN102169486A (zh) * 2010-02-25 2011-08-31 腾讯科技(深圳)有限公司 一种文件下载方法及装置
CN102214223A (zh) * 2011-06-15 2011-10-12 奇智软件(北京)有限公司 一种浏览器访问控制方法及系统

Also Published As

Publication number Publication date
CN103631926A (zh) 2014-03-12

Similar Documents

Publication Publication Date Title
US10567407B2 (en) Method and system for detecting malicious web addresses
US7885950B2 (en) Creating search enabled web pages
CA2640025C (en) Methods and devices for post processing rendered web pages and handling requests of post processed web pages
US20200036799A1 (en) System and method for main page identification in web decoding
AU2004255005B2 (en) Method and system for augmenting web content
US8725794B2 (en) Enhanced website tracking system and method
US7941740B2 (en) Automatically fetching web content with user assistance
US7827166B2 (en) Handling dynamic URLs in crawl for better coverage of unique content
CN102663074B (zh) 一种搜索结果页面中链接的连接方法及装置
CN104063455B (zh) 一种基于搜索获取疾病咨询信息的方法和装置
US8359317B2 (en) Method and device for indexing resource content in computer networks
US20160241656A1 (en) Method and system for tracking web link usage
Janc et al. Feasibility and real-world implications of web browser history detection
CN103631926B (zh) 一种搜索结果页面中链接的连接方法及装置
US20110066608A1 (en) Systems and methods for delivering targeted content to a user
CN104615771B (zh) 一种获取网页数据的方法及装置
CN106899549A (zh) 一种网络安全检测方法及装置
CN110221871A (zh) 网页获取方法、装置、计算机设备及存储介质
CN106850572A (zh) 目标资源的访问方法和装置
CN110532455A (zh) 一种基于Chrome浏览器的网页图片获取方法和系统
US20070124480A1 (en) System and method for persistent user tracking using cached resource content
CN104881453B (zh) 一种识别网页类型的方法和装置
Rizothanasis et al. Identifying user actions from HTTP (S) traffic
Kinnunen Evaluating and improving Web performance using free-to-use tools
Guo et al. A web crawler detection algorithm based on web page member list

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220725

Address after: Room 801, 8th floor, No. 104, floors 1-19, building 2, yard 6, Jiuxianqiao Road, Chaoyang District, Beijing 100015

Patentee after: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park)

Patentee before: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Patentee before: Qizhi software (Beijing) Co.,Ltd.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170704

CF01 Termination of patent right due to non-payment of annual fee