CN102360349B - 一种获取网页中音/视频链接地址的方法及装置 - Google Patents

一种获取网页中音/视频链接地址的方法及装置 Download PDF

Info

Publication number
CN102360349B
CN102360349B CN201110205241.6A CN201110205241A CN102360349B CN 102360349 B CN102360349 B CN 102360349B CN 201110205241 A CN201110205241 A CN 201110205241A CN 102360349 B CN102360349 B CN 102360349B
Authority
CN
China
Prior art keywords
audio
video
chained address
request
data bag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110205241.6A
Other languages
English (en)
Other versions
CN102360349A (zh
Inventor
祝剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wanxing Polytron Technologies Inc
Original Assignee
SHENZHEN WONDERSHARE INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN WONDERSHARE INFORMATION TECHNOLOGY Co Ltd filed Critical SHENZHEN WONDERSHARE INFORMATION TECHNOLOGY Co Ltd
Priority to CN201110205241.6A priority Critical patent/CN102360349B/zh
Priority to PCT/CN2011/084171 priority patent/WO2013010369A1/zh
Publication of CN102360349A publication Critical patent/CN102360349A/zh
Application granted granted Critical
Publication of CN102360349B publication Critical patent/CN102360349B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例公开了一种获取网页中音/视频链接地址的方法及装置,该方法包括:向终端的网页浏览器进程中注入钩子程序,获取所述网页浏览器向服务器发送的请求数据包;根据所述请求数据包,模拟所述网页浏览器向所述服务器发送页面请求;接收所述服务器反馈的应答数据包,判断所述应答数据包中携带链接地址是否为音/视频数据的链接地址;若判断为是,则获取该音/视频链接地址。本发明实施例所提供的获取网页中音/视频链接地址的方法及装置,利用钩子程序,在用户想下载网页中的音/视频文件,又找不到音/视频真实的链接地址时,能准确帮助用户找到音视频真实的链接地址。

Description

一种获取网页中音/视频链接地址的方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种获取网页中音/视频链接地址的方法及装置。
背景技术
随着互联网的发展,越来越多的网站为增加网页总的信息量或者为了使用户更加感兴趣,而在网页中增加一些音频或视频,通常的做法是在文字页面中开一个播放窗口,内嵌的媒体播放器,如real player、windows media player和flashplayer等,用户可以直接通过该窗口播放可定的音频或视频。
但是,这些播放器在播放视频音频或视频时,通常会隐藏正在播放的音视频真实的链接地址,用户想下载这些音视频文件时,通常找不到音视频真实的链接地址。
基于上述问题,本发明人希望利用钩子程序帮助用户找到音视频真实的链接地址。
钩子(Hook),是Windows消息处理机制的一个平台,应用程序可以在上面设置子程以监视指定窗口的某种消息,而且所监视的窗口可以是其他进程所创建的。当消息到达后,在目标窗口处理消息之前处理它。钩子机制允许应用程序截获处理Windows消息或特定事件。
钩子程序实际上是一个处理消息的程序段,通过系统调用,把它注入系统。每当特定的消息发出,在没有到达目的窗口前,钩子程序就先捕获该消息,这时钩子程序即可以加工处理(改变)该消息,也可以不作处理而继续传递该消息,还可以强制结束消息的传递。
钩子程序也可以理解为Windows留给我们的后门,比如用户想控制键盘,在DOS时代很简单通过INT即可,而Windows时代不允许我们直接操作硬件;由于Windows是消息驱动,所以我们可以通过拦截键盘消息以达到控制键盘的目的。但是,程序控制自己进程的消息固然很简单,要控制所有程序进程的消息要利用钩子程序了。将钩子程序放在DLL中,这样所有的有关键盘的消息都必须经过钩子程序过滤了。
发明内容
本发明实施例所要解决的技术问题在于,提供一种获取网页中音/视频链接地址的方法及装置,利用钩子程序,在用户想下载网页中的音/视频文件,又找不到音/视频真实的链接地址时,能准确帮助用户找到音视频真实的链接地址。
为了解决上述技术问题,本发明实施例提供了一种获取网页中音/视频链接地址的方法,包括:
向终端的网页浏览器进程中注入钩子程序,获取所述网页浏览器向服务器发送的请求数据包,包括:建立钩子程序,所述钩子程序中具有获取所述网页浏览器向服务器发送的请求数据包的动态数据库;
根据所述请求数据包,模拟所述网页浏览器向所述服务器发送页面请求,包括:
将所述请求数据包按照各自采用的网络协议进行分类;及
根据所述请求数据包中的信息,以及该请求数据包采用的网络协议,模拟所述网页浏览器向所述服务器发送页面请求,其中,所述页面请求为文件属性的请求;
接收所述服务器反馈的应答数据包,判断所述应答数据包中携带链接地址是否为音/视频数据的链接地址;若判断为是,则获取该音/视频链接地址。
其中,所述向终端的网页浏览器进程中注入钩子程序,获取所述网页浏览器向服务器发送的请求数据包,包括:
将所述钩子程序注入所述网页浏览器的进程中,获取所述网页浏览器向服务器发送的请求数据包。
其中,所述接收所述服务器反馈的应答数据包,判断所述应答数据包中携带链接地址是否为音/视频数据的链接地址,包括:
接收所述服务器反馈的应答数据包,所述应答数据包中包括:服务器状态码、内容长度Content-Length、内容类型Content-Type、链接地址;
判断所述应答数据包中携带的Content-Type是否为音/视频类型;
若判断为是,则判定所述应答数据包中携带链接地址为音/视频数据的链接地址;否则,判定所述应答数据包中携带链接地址不是音/视频数据的链接地址。
其中,所述接收所述服务器反馈的应答数据包,判断所述应答数据包中携带链接地址是否为音/视频数据的链接地址,包括:
接收所述服务器反馈的应答数据包,所述应答数据包中包括:服务器状态码、内容长度Content-Length、内容类型Content-Type、链接地址;
判断所述应答数据包中携带的Content-Type是否为音/视频类型;若判断为否,则判定所述应答数据包中携带链接地址不是音/视频数据的链接地址;
若判断为是,则进一步判断所述Content-Length是否大于预设的数值;若判断为是,则判定所述应答数据包中携带链接地址为音/视频数据的链接地址;否则,判定所述应答数据包中携带链接地址不是音/视频数据的链接地址。
其中,所述获取该音/视频链接地址包括:
获取该音/视频链接地址,并存储在本地;
当用户需要下载对应的音/视频时,向用户提供所述音/视频链接地址。
相应的,本发明实施例还提供一种获取网页中音/视频链接地址的装置,包括:
请求数据包获取模块,用于向终端的网页浏览器进程中注入钩子程序,获取所述网页浏览器向服务器发送的请求数据包,所述请求数据包获取模块包括用于建立钩子程序的模块,所述的钩子程序中具有获取所述网页浏览器向服务器发送的请求数据包的动态数据库;
模拟请求模块,用于根据所述请求数据包获取模块所获取的请求数据包,模拟所述网页浏览器向所述服务器发送页面请求,所述模拟请求模块包括:
数据包分类单元,用于将所述请求数据包获取模块所获取的请求数据包按照其各自采用的网络协议进行分类;及
模拟请求单元,用于根据所述请求数据包中的信息,以及该请求数据包采用的网络协议,模拟所述网页浏览器向所述服务器发送页面请求,其中,所述页面请求为文件属性的请求;
链接分析及获取模块,用于接收所述服务器反馈的应答数据包,判断所述应答数据包中携带链接地址是否为音/视频数据的链接地址;若判断为是,则获取该音/视频链接地址。
其中,所述链接分析及获取模块包括:
数据包接收单元,用于接收服务器反馈的应答数据包,所述应答数据包中包括:服务器状态码、内容长度Content-Length、内容类型Content-Type、链接地址;
第一判断单元,用于判断所述应答数据包中携带的Content-Type是否为音/视频类型;若判断为是,则判定所述应答数据包中携带链接地址为音/视频数据的链接地址;否则,判定所述应答数据包中携带链接地址不是音/视频数据的链接地址。
其中,所述链接分析及获取模块包括:
数据包接收单元,用于接收服务器反馈的应答数据包,所述应答数据包中包括:服务器状态码、内容长度Content-Length、内容类型Content-Type、链接地址;
第二判断单元,判断所述应答数据包中携带的Content-Type是否为音/视频类型;若判断为否,则判定所述应答数据包中携带链接地址不是音/视频数据的链接地址;若判断为是,则交由第三判断单元进一步判断;
第三判断单元,用于判断所述Content-Length是否大于预设的数值;若判断为是,则判定所述应答数据包中携带链接地址为音/视频数据的链接地址;否则,判定所述应答数据包中携带链接地址不是音/视频数据的链接地址。
本发明实施例提供的获取网页中音/视频链接地址的方法及装置,利用钩子程序,在用户想下载网页中的音/视频文件,又找不到音/视频真实的链接地址时,能准确帮助用户找到音视频真实的链接地址。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的获取网页中音/视频链接地址的方法第一实施例流程示意图;
图2为本发明提供的获取网页中音/视频链接地址的方法第二实施例流程示意图;
图3为本发明提供的获取网页中音/视频链接地址的装置第一实施例结构示意图;
图4为本发明提供的获取网页中音/视频链接地址的装置第二实施例结构示意图;
图5为本发明提供的获取网页中音/视频链接地址的装置第三实施例结构示意图。
具体实施方式
本发明实施例提供的获取网页中音/视频链接地址的方法及装置,利用钩子程序,在用户想下载网页中的音/视频文件,又找不到音/视频真实的链接地址时,能准确帮助用户找到音视频真实的链接地址。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,为本发明提供的获取网页中音/视频链接地址的方法第一实施例流程示意图,如图1所示,包括:
在步骤S100,向终端的网页浏览器进程中注入钩子程序,并利用所述钩子程序,获取网页浏览器向服务器发送的请求数据包。
在步骤S101,根据获取的所述请求数据包,模拟所述网页浏览器向所述服务器发送页面请求。
在步骤S102,接收所述服务器反馈的应答数据包。并判断所述应答数据包中携带链接地址是否为音/视频数据的链接地址,若判断为是,则执行步骤S103;否则结束本流程。
在步骤S103,获取该音/视频链接地址,供用户需要下载对应的音/视频数据时使用。
本发明实施例提供的获取网页中音/视频链接地址的方法,利用钩子程序,获取网页中的音/视频文件真实的链接地址,方便用户下载。
参见图2,为本发明提供的获取网页中音/视频链接地址的方法第二实施例流程示意图。在本实施例中,将更为详细的描述该获取网页中音/视频链接地址的方法流程。如图2所示,该方法流程包括:
在步骤S200,建立钩子程序,所述钩子程序中具有获取所述网页浏览器向服务器发送的请求数据包的动态数据库。更为具体的,钩子(Hook),是Windows消息处理机制的一个平台,应用程序可以在上面设置子程以监视指定窗口的某种消息,而且所监视的窗口可以是其他进程所创建的。当消息到达后,在目标窗口处理消息之前处理它。钩子机制允许应用程序截获处理Windows消息或特定事件。在本发明实施例中建立的钩子程序具有一个动态数据库,用于截获网页浏览器向服务器发送的请求数据包。
在步骤S201,将所述钩子程序注入所述网页浏览器的进程中,获取所述网页浏览器向服务器发送的请求数据包。更为具体的,用windows钩子注入浏览器进程(如IE、Chrome、Safari,Opera、Firefox等),挂接浏览器进程中请求数据包函数(send WSASend)该钩子程序实际上是一个处理消息的程序段,通过系统调用,把它注入网页浏览器的进程中。每当网页浏览器有请求数据包发出,钩子程序就先捕获该请求数据包。这时钩子程序即可以加工处理(改变)该请求数据包,也可以不作处理而继续传递该请求数据包,还可以强制结束请求数据包的传递。在本发明实施例中,钩子程序对服务器发送的请求数据包不作处理而继续传递,只是自身再复制一个相同的请求数据包。
在步骤S202,将所述请求数据包按照其各自采用的网络协议进行分类。更为具体的,根据获取的请求数据包所采用的不同网络协议,对请求数据包进行分类,请求数据的网络协议包括:http请求数据包,mms请求数据包,rtmp请求数据包,rtsp请求数据包等等。对请求数据包进行分类的原因在于,利于后续步骤根据对应的网络协议解析出所述请求数据包所携带的信息。
在步骤S203,根据所述请求数据包中的信息,以及该请求数据包采用的网络协议,模拟所述网页浏览器向所述服务器发送页面请求。更为具体的,本步骤为根据所述请求数据包所采用的网络协议,解析该请求数据包,获取所述请求数据包的信息。然后根据所述请求数据包中的信息,以及该请求数据包原本采用的网络协议,模拟所述网页浏览器向所述服务器发送页面请求。
进一步的,所述页面请求为文件属性的请求,远比原本的请求数据包简单。本实施例中的页面请求发送给服务器,仅请求获取链接地址、服务器状态码、Content-Length(内容长度)、Content-Type(内容类型)等文件属性信息,并不请求获取握手信号、Cookie等附加信息,既节约终端与服务器之间的带宽,又使后续的处理更加简单、方便(因为服务器反馈的信息少)。
在步骤S204,接收服务器反馈的应答数据包,所述应答数据包中包括:服务器状态码、内容长度Content-Length、内容类型Content-Type、链接地址;该应答数据包中的内容与页面请求中请求获取的内容是对应的,因为页面请求中请求获取的内容比正常的请求数据包简单,所以应答数据包中的内容也比正常的应答数据包中的内容更少。
进一步的,应答数据包中Content-Type记录的是应答数据包中链接地址所对应的文件的内型,Content-Length记录的则是应答数据包中链接地址所对应的文件的大小。
在步骤S205,判断应答数据包中携带的Content-Type是否为音/视频类型;若判断为是,则执行步骤S206;否则,执行步骤S207。更为具体的,通过判断应答数据包中携带的Content-Type中的是否是音/视频类型,就可以判断应答数据包中携带的链接地址所对应的文件是否是音/视频文件。进一步的,音视频类型包括audio,video,flv,mp4,mp3,audio/x-mpeg,audio/x-wav,audio/x-ms-wma,video/x-msvideo,video/mpeg,video/quicktime,video/x-flv,video/mp4,video/x-ms-asf,video/x-ms-wmv,application/x-octet-stream,binary/octet-stream,application/octet-stream,application/x-shockwave-flash,text/plain,application/x-rhapsodycontent,flv-application/octet-stream等。
在步骤S206,判定所述应答数据包中携带链接地址为音/视频数据的链接地址;获取该音/视频链接地址,并存储在本地;当用户需要下载对应的音/视频时,向用户提供所述音/视频链接地址。
优选的,为了提高判断的准确定,本步骤S206还可以是:
进一步判断所述Content-Length是否大于预设的数值(例如1K);若判断为是,则判定所述应答数据包中携带链接地址为音/视频数据的链接地址,获取该音/视频链接地址,并存储在本地;当用户需要下载对应的音/视频时,向用户提供所述音/视频链接地址。若所述Content-Length小于预设的数值,则执行步骤S207。
在步骤S207,判定所述应答数据包中携带链接地址不是音/视频数据的链接地址,丢弃该链接地址,重新寻找音/视频的真实链接地址。
本发明实施例提供的获取网页中音/视频链接地址的方法,利用钩子程序,截获浏览器发送的请求数据包,再通过模拟浏览器发送页面请求后,分析服务器反馈的应答数据包,找到载网页中的音/视频文件的真实链接地址,当用户需要下载对应的音/视频时向用户提供,方便用户操作节约用户时间。
参见图3,为本发明提供的获取网页中音/视频链接地址的装置第一实施例结构示意图,如图3所示,该装置包括:
请求数据包获取模块1,用于向终端的网页浏览器进程中注入钩子程序,获取所述网页浏览器向服务器发送的请求数据包。
模拟请求模块2,用于根据所述请求数据包获取模块1所获取的请求数据包,模拟所述网页浏览器向所述服务器发送页面请求。
链接分析及获取模块3,用于接收所述服务器反馈的应答数据包,判断所述应答数据包中携带链接地址是否为音/视频数据的链接地址;若判断为是,则获取该音/视频链接地址。
本发明实施例提供的获取网页中音/视频链接地址的装置,利用钩子程序,获取网页中的音/视频文件真实的链接地址,方便用户下载。
参见图4,为本发明提供的获取网页中音/视频链接地址的装置第二实施例结构示意图,在本实施例中,将更为详细的描述该装置的结构,该装置如图4所示,包括:请求数据包获取模块1、模拟请求模块2、链接分析及获取模块3。
请求数据包获取模块1,用于向终端的网页浏览器进程中注入钩子程序,获取所述网页浏览器向服务器发送的请求数据包。更为具体的,钩子(Hook),是Windows消息处理机制的一个平台,应用程序可以在上面设置子程以监视指定窗口的某种消息,而且所监视的窗口可以是其他进程所创建的。当消息到达后,在目标窗口处理消息之前处理它。钩子机制允许应用程序截获处理Windows消息或特定事件。在本发明实施例中请求数据包获取模块1建立的钩子程序具有一个动态数据库,用于截获网页浏览器向服务器发送的请求数据包。
进一步的,请求数据包获取模块1用windows钩子注入浏览器进程(如IE、Chrome、Safari,Opera、Firefox等),挂接浏览器进程中请求数据包函数(sendWSASend)。每当网页浏览器有请求数据包发出,钩子程序就先捕获该请求数据包。这时钩子程序即可以加工处理(改变)该请求数据包,也可以不作处理而继续传递该请求数据包,还可以强制结束请求数据包的传递。在本发明实施例中,请求数据包获取模块1的钩子程序对服务器发送的请求数据包不作处理而继续传递,只是自身再复制一个相同的请求数据包发送给模拟请求模块2。
模拟请求模块2,用于根据所述请求数据包获取模块1所获取的请求数据包,模拟所述网页浏览器向所述服务器发送页面请求。更为具体的,模拟请求模块2包括:
数据包分类单元21,用于将所述请求数据包获取模块所获取的请求数据包按照其各自采用的网络协议进行分类。更为具体的,数据包分类单元21根据获取的请求数据包所采用的不同网络协议,对请求数据包进行分类,请求数据的网络协议包括:http请求数据包,mms请求数据包,rtmp请求数据包,rtsp请求数据包等等。数据包分类单元21对请求数据包进行分类的原因在于,利于模拟请求单元22根据对应的网络协议解析出所述请求数据包所携带的信息。
模拟请求单元22,用于根据所述请求数据包中的信息,以及该请求数据包采用的网络协议,模拟所述网页浏览器向所述服务器发送页面请求。更为具体的,模拟请求单元22根据数据包分类单元21对请求数据包的分类,采用对应的网络协议解析请求数据包,获取所述请求数据包的信息。然后模拟请求单元22根据所述请求数据包中的信息,以及该请求数据包原本采用的网络协议,模拟所述网页浏览器向所述服务器发送页面请求。
进一步的,模拟请求单元22发送的页面请求为文件属性的请求,远比原本的请求数据包简单。本实施例中,模拟请求单元22将页面请求发送给服务器,仅请求获取链接地址、服务器状态码、Content-Length(内容长度)、Content-Type(内容类型)等文件属性信息,并不请求获取握手信号、Cookie等附加信息,如此,既节约终端与服务器之间的带宽,又使后续的处理更加简单、方便(因为服务器反馈的信息少)。
链接分析及获取模块3,用于接收所述服务器反馈的应答数据包,判断所述应答数据包中携带链接地址是否为音/视频数据的链接地址;若判断为是,则获取该音/视频链接地址。更为具体的,该链接分析及获取模块3包括:
数据包接收单元31,用于接收服务器反馈的应答数据包,所述应答数据包中包括:服务器状态码、内容长度Content-Length、内容类型Content-Type、链接地址;该应答数据包中的内容与模拟请求单元22发送的页面请求中请求获取的内容是对应的,因为页面请求中请求获取的内容比正常的请求数据包简单,所以应答数据包中的内容也比正常的应答数据包中的内容更少。
进一步的,应答数据包中Content-Type记录的是应答数据包中链接地址所对应的文件的内型,Content-Length记录的则是应答数据包中链接地址所对应的文件的大小。
第一判断单元32,用于判断所述应答数据包中携带的Content-Type是否为音/视频类型;若判断为是,则判定所述应答数据包中携带链接地址为音/视频数据的链接地址,并获取该音/视频链接地址;否则,判定所述应答数据包中携带链接地址不是音/视频数据的链接地址。
更为具体的,第一判断单元32通过判断应答数据包中携带的Content-Type中的是否是音/视频类型,就可以判断应答数据包中携带的链接地址所对应的文件是否是音/视频文件。音视频类型包括audio,video,flv,mp4,mp3,audio/x-mpeg,audio/x-wav,audio/x-ms-wma,video/x-msvideo,video/mpeg,video/quicktime,video/x-flv,video/mp4,video/x-ms-asf,video/x-ms-wmv,application/x-octet-stream,binary/octet-stream,application/octet-stream,application/x-shockwave-flash,text/plain,application/x-rhapsodycontent,flv-application/octet-stream等。
第一判断单元32若判定所述应答数据包中携带链接地址为音/视频数据的链接地址,则获取该音/视频链接地址,并存储在本地;当用户需要下载对应的音/视频时,向用户提供所述音/视频链接地址。第一判断单元32若判定所述应答数据包中携带链接地址不是音/视频数据的链接地址,则丢弃该链接地址,重新寻找音/视频的真实链接地址。
优选的,为了提高判断的准确定,本发明实施例还提供获取网页中音/视频链接地址的装置第三实施例,在本实施例中,获取网页中音/视频链接地址的装置包括:请求数据包获取模块4、模拟请求模块5、链接分析及获取模块6,且请求数据包获取模块4、模拟请求模块5与上一实施例中的数据包获取模块1、模拟请求模块2具有相同的结构,不同之处在于链接分析及获取模块6,在本实施例中,该链接分析及获取模块6用于接收所述服务器反馈的应答数据包,判断所述应答数据包中携带链接地址是否为音/视频数据的链接地址;若判断为是,则获取该音/视频链接地址。更为具体的,该链接分析及获取模块6包括:
数据包接收单元61,用于接收服务器反馈的应答数据包,所述应答数据包中包括:服务器状态码、内容长度Content-Length、内容类型Content-Type、链接地址。
第二判断单元62,判断所述应答数据包中携带的Content-Type是否为音/视频类型;若判断为否,则判定所述应答数据包中携带链接地址不是音/视频数据的链接地址;若判断为是,则交由第三判断单元63进一步判断。
第三判断单元63,用于进一步判断所述Content-Length是否大于预设的数值(例如1K);若判断为是,则第三判断单元63判定所述应答数据包中携带链接地址为音/视频数据的链接地址,并存储在本地;当用户需要下载对应的音/视频时,向用户提供所述音/视频链接地址。
若所述Content-Length小于预设的数值,则第三判断单元63判定所述应答数据包中携带链接地址不是音/视频数据的链接地址,丢弃该链接地址,重新寻找音/视频的真实链接地址。
本发明实施例提供的获取网页中音/视频链接地址的装置,利用钩子程序,截获浏览器发送的请求数据包,再通过模拟浏览器发送页面请求后,分析服务器反馈的应答数据包,找到载网页中的音/视频文件的真实链接地址,当用户需要下载对应的音/视频时向用户提供,方便用户操作节约用户时间。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (8)

1.一种获取网页中音/视频链接地址的方法,其特征在于,包括:
向终端的网页浏览器进程中注入钩子程序,获取所述网页浏览器向服务器发送的请求数据包,包括:建立钩子程序,所述钩子程序中具有获取所述网页浏览器向服务器发送的请求数据包的动态数据库;
根据所述请求数据包,模拟所述网页浏览器向所述服务器发送页面请求,包括:
将所述请求数据包按照各自采用的网络协议进行分类;及
根据所述请求数据包中的信息,以及该请求数据包采用的网络协议,模拟所述网页浏览器向所述服务器发送页面请求,其中,所述页面请求为文件属性的请求;
接收所述服务器反馈的应答数据包,判断所述应答数据包中携带链接地址是否为音/视频数据的链接地址;若判断为是,则获取该音/视频链接地址。
2.如权利要求1所述的获取网页中音/视频链接地址的方法,其特征在于,所述向终端的网页浏览器进程中注入钩子程序,获取所述网页浏览器向服务器发送的请求数据包,包括:
将所述钩子程序注入所述网页浏览器的进程中,获取所述网页浏览器向服务器发送的请求数据包。
3.如权利要求1所述的获取网页中音/视频链接地址的方法,其特征在于,所述接收所述服务器反馈的应答数据包,判断所述应答数据包中携带链接地址是否为音/视频数据的链接地址,包括:
接收所述服务器反馈的应答数据包,所述应答数据包中包括:服务器状态码、内容长度Content-Length、内容类型Content-Type、链接地址;
判断所述应答数据包中携带的Content-Type是否为音/视频类型;
若判断为是,则判定所述应答数据包中携带链接地址为音/视频数据的链接地址;否则,判定所述应答数据包中携带链接地址不是音/视频数据的链接地址。
4.如权利要求1所述的获取网页中音/视频链接地址的方法,其特征在于,所述接收所述服务器反馈的应答数据包,判断所述应答数据包中携带链接地址是否为音/视频数据的链接地址,包括:
接收所述服务器反馈的应答数据包,所述应答数据包中包括:服务器状态码、内容长度Content-Length、内容类型Content-Type、链接地址;
判断所述应答数据包中携带的Content-Type是否为音/视频类型;若判断为否,则判定所述应答数据包中携带链接地址不是音/视频数据的链接地址;
若判断为是,则进一步判断所述Content-Length是否大于预设的数值;若判断为是,则判定所述应答数据包中携带链接地址为音/视频数据的链接地址;否则,判定所述应答数据包中携带链接地址不是音/视频数据的链接地址。
5.如权利要求1至4中任一项所述的获取网页中音/视频链接地址的方法,其特征在于,所述获取该音/视频链接地址包括:
获取该音/视频链接地址,并存储在本地;
当用户需要下载对应的音/视频时,向用户提供所述音/视频链接地址。
6.一种获取网页中音/视频链接地址的装置,其特征在于,包括:
请求数据包获取模块,用于向终端的网页浏览器进程中注入钩子程序,获取所述网页浏览器向服务器发送的请求数据包,所述请求数据包获取模块包括用于建立钩子程序的模块,所述的钩子程序中具有获取所述网页浏览器向服务器发送的请求数据包的动态数据库;
模拟请求模块,用于根据所述请求数据包获取模块所获取的请求数据包,模拟所述网页浏览器向所述服务器发送页面请求,所述模拟请求模块包括:
数据包分类单元,用于将所述请求数据包获取模块所获取的请求数据包按照其各自采用的网络协议进行分类;及
模拟请求单元,用于根据所述请求数据包中的信息,以及该请求数据包采用的网络协议,模拟所述网页浏览器向所述服务器发送页面请求,其中,所述页面请求为文件属性的请求;
链接分析及获取模块,用于接收所述服务器反馈的应答数据包,判断所述应答数据包中携带链接地址是否为音/视频数据的链接地址;若判断为是,则获取该音/视频链接地址。
7.如权利要求6所述的获取网页中音/视频链接地址的装置,其特征在于,所述链接分析及获取模块包括:
数据包接收单元,用于接收服务器反馈的应答数据包,所述应答数据包中包括:服务器状态码、内容长度Content-Length、内容类型Content-Type、链接地址;
第一判断单元,用于判断所述应答数据包中携带的Content-Type是否为音/视频类型;若判断为是,则判定所述应答数据包中携带链接地址为音/视频数据的链接地址;否则,判定所述应答数据包中携带链接地址不是音/视频数据的链接地址。
8.如权利要求6所述的获取网页中音/视频链接地址的装置,其特征在于,所述链接分析及获取模块包括:
数据包接收单元,用于接收服务器反馈的应答数据包,所述应答数据包中包括:服务器状态码、内容长度Content-Length、内容类型Content-Type、链接地址;
第二判断单元,判断所述应答数据包中携带的Content-Type是否为音/视频类型;若判断为否,则判定所述应答数据包中携带链接地址不是音/视频数据的链接地址;若判断为是,则交由第三判断单元进一步判断;
第三判断单元,用于判断所述Content-Length是否大于预设的数值;若判断为是,则判定所述应答数据包中携带链接地址为音/视频数据的链接地址;否则,判定所述应答数据包中携带链接地址不是音/视频数据的链接地址。
CN201110205241.6A 2011-07-21 2011-07-21 一种获取网页中音/视频链接地址的方法及装置 Active CN102360349B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201110205241.6A CN102360349B (zh) 2011-07-21 2011-07-21 一种获取网页中音/视频链接地址的方法及装置
PCT/CN2011/084171 WO2013010369A1 (zh) 2011-07-21 2011-12-17 一种获取网页中音/视频链接地址的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110205241.6A CN102360349B (zh) 2011-07-21 2011-07-21 一种获取网页中音/视频链接地址的方法及装置

Publications (2)

Publication Number Publication Date
CN102360349A CN102360349A (zh) 2012-02-22
CN102360349B true CN102360349B (zh) 2014-12-03

Family

ID=45585678

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110205241.6A Active CN102360349B (zh) 2011-07-21 2011-07-21 一种获取网页中音/视频链接地址的方法及装置

Country Status (2)

Country Link
CN (1) CN102360349B (zh)
WO (1) WO2013010369A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102857575B (zh) * 2012-09-21 2016-12-21 深圳市宜搜科技发展有限公司 一种互联网资源的下载方法及系统
CN103024044B (zh) * 2012-12-14 2016-07-06 北京奇虎科技有限公司 网页下载方法及装置
CN102984275B (zh) * 2012-12-14 2016-09-21 北京奇虎科技有限公司 进行网页下载的方法及浏览器
CN103825783A (zh) * 2014-03-10 2014-05-28 珠海市君天电子科技有限公司 一种测试方法及装置
CN104080016B (zh) * 2014-06-25 2018-08-17 北京奇虎科技有限公司 一种浏览器中进行音视频信息显示的方法和装置
CN105721387A (zh) * 2014-12-01 2016-06-29 北京蓝光引力网络股份有限公司 防止网络劫持的方法
CN107292165B (zh) * 2016-03-30 2020-05-01 无锡天脉聚源传媒科技有限公司 一种函数处理方法及装置
CN106649531A (zh) * 2016-10-24 2017-05-10 福建中金在线信息科技有限公司 一种网页检测方法及装置
CN107256276A (zh) * 2017-08-01 2017-10-17 北京合天智汇信息技术有限公司 一种基于云平台的移动App内容安全获取方法及设备
CN111565336B (zh) * 2020-05-22 2022-12-27 郑州阿帕斯科技有限公司 一种视频播放方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101645815A (zh) * 2008-08-06 2010-02-10 百度在线网络技术(北京)有限公司 音视频文件下载提示方法
CN101715004A (zh) * 2009-11-12 2010-05-26 中国科学院计算技术研究所 面向网络视频的分布式采集方法和系统
CN101916283A (zh) * 2010-08-17 2010-12-15 奇诺光瑞电子(深圳)有限公司 由动态网页上获取链接信息的方法及其服务器

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005056286A (ja) * 2003-08-07 2005-03-03 Nec Engineering Ltd ウェブブラウザにおける拡大表示方法および拡大表示プログラム
CN101212485A (zh) * 2006-12-28 2008-07-02 中国科学院计算技术研究所 一种获取流媒体链接地址的方法
CN102098327A (zh) * 2010-12-15 2011-06-15 百度在线网络技术(北京)有限公司 在线视频嗅探下载方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101645815A (zh) * 2008-08-06 2010-02-10 百度在线网络技术(北京)有限公司 音视频文件下载提示方法
CN101715004A (zh) * 2009-11-12 2010-05-26 中国科学院计算技术研究所 面向网络视频的分布式采集方法和系统
CN101916283A (zh) * 2010-08-17 2010-12-15 奇诺光瑞电子(深圳)有限公司 由动态网页上获取链接信息的方法及其服务器

Also Published As

Publication number Publication date
CN102360349A (zh) 2012-02-22
WO2013010369A1 (zh) 2013-01-24

Similar Documents

Publication Publication Date Title
CN102360349B (zh) 一种获取网页中音/视频链接地址的方法及装置
US10567407B2 (en) Method and system for detecting malicious web addresses
US9332056B2 (en) Methods and apparatus to distinguish between parent and child webpage accesses and/or browser tabs in focus
US9842093B2 (en) Method and apparatus for intelligent capture of document object model events
CN104767775B (zh) 网页应用消息推送方法及系统
CN101594241B (zh) 一种网络视频的下载方法及系统
CN103810176B (zh) 一种网页信息的预取访问方法和装置
CN101645815B (zh) 音视频文件下载提示方法
CN102651731A (zh) 一种视频播放方法及其装置
CN104050266B (zh) 用户行为记录方法、装置和网页浏览器
CN111163054B (zh) 检测网页恶意行为的方法和装置
CN109948077A (zh) 用户行为数据采集方法、装置、设备和计算机存储介质
CN103501481A (zh) 一种基于无线网络的信息宣传推送方法及其推送设备
CN102752371B (zh) 在客户端上实现闪屏的方法和客户端
CN109684571B (zh) 一种数据采集方法及装置、存储介质
US10659311B2 (en) Method and apparatus for processing delivery data, and storage medium
CN104394475A (zh) 一种流媒体文件的播放方法及媒体播放器
CN104123380A (zh) 网页访问方法和装置
CN107423312B (zh) 直播数据播放方法及装置
CN104778172A (zh) 网页信息的预取处理方法、装置及对应的网页浏览装置
CN101836214A (zh) 对数字媒体内容未经许可的复制的保护
CN101887463A (zh) 一种基于虚拟域的http还原展示方法
CN104753961A (zh) 一种多媒体数据的处理方法、客户端及服务器
CN110188257B (zh) 一种移动应用数据采集方法及装置
CN103368907A (zh) 事件上报请求系统、方法、客户端装置及其上报请求方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent for invention or patent application
CB02 Change of applicant information

Address after: 518057 Guangdong city of Shenzhen province Nanshan District Gao Xin Road, room 9 building on the north side of block A901 No. 006 TCL Industry Research Institute building A A Building 8 floor

Applicant after: Shenzhen Wondershare Information Technology Co., Ltd.

Address before: 518057 Guangdong city of Shenzhen province Nanshan District Gao Xin Road Building A block 8 Building TCL

Applicant before: Shenzhen Wondershare Software Co., Ltd.

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: SHENZHEN WONDERSHARE SOFTWARE CO., LTD. TO: SHENZHEN WONDERSHARE INFORMATION TECHNOLOGY CO., LTD.

C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 850000 Tibet autonomous region, Lhasa City, New District, west of the East Ring Road, 1-4 road to the north, south of 1-3 Road, Liu Dong building, east of the 8 unit 6, floor 2, No.

Patentee after: Wanxing Polytron Technologies Inc

Address before: 518057 Guangdong city of Shenzhen province Nanshan District Gao Xin Road, room 9 building on the north side of block A901 No. 006 TCL Industry Research Institute building A A Building 8 floor

Patentee before: Shenzhen Wondershare Information Technology Co., Ltd.