视频地址的解析方法、装置、设备及可读存储介质
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种视频地址的解析方法、装置、设备及可读存储介质。
背景技术
最近几年,随着互联网的快速发展,尤其是移动互联网的快速发展,除了优酷视频、土豆视频、腾讯视频等传统视频网站外,微博、秒拍、快手、美拍视频等短视频网站快速崛起,互联网上的视频出现了爆炸性的增长,对这些视频进行分析有着很重要的实用价值。视频分析的前提是依据视频地址获取视频,然而视频网站上视频的真实地址都是隐藏在背后的,无法直接拿到视频的真实地址进行下载,所以如何获取视频真实地址一直是难点。
现有技术中,最直观的视频下载方法是通过视频网站提供的工具下载视频,但视频网站提供的工具风格各异,限制过多,无法满足实际需求;另一种方法是通过抓包工具,在视频播放的时候抓取视频的真实地址,然后通过真实地址进行下载,但这种方法需要首先加载视频,然后才能通过抓包获取视频地址,因为涉及到视频加载,所以速度会非常慢。
发明内容
本发明实施例提供一种视频地址的解析方法、装置、设备及可读存储介质,用以获取网站上视频的真实地址。
本发明实施例第一方面提供一种视频地址的解析方法,包括:
加载网站上的任一视频,获取所述视频的真实地址,以及所述网站在请求所述视频的真实地址时与网站服务器之间的交互信息;
基于所述真实地址和所述交互信息,确定所述网站中视频真实地址的解析规则;
基于所述解析规则,获取所述网站上其他视频的真实地址。
可选的,所述加载网站上的任一视频,获取所述视频的真实地址,以及所述网站在请求所述视频的真实地址时与网站服务器之间的交互信息,包括:
加载网站上的任一视频,通过抓包工具获取所述视频的真实地址,以及所述网站在请求所述视频的真实地址时与网站服务器之间的交互信息。
可选的,所述基于所述真实地址和所述交互信息,确定所述网站中视频真实地址的解析规则,包括:
将所述真实地址进行分解,从所述真实地址中获取目标参数;
从所述交互信息中查找包括部分或者全部所述目标参数的目标信息;
基于所述目标参数在所述目标信息中的位置,确定所述网站中视频真实地址的解析规则。
可选的,所述基于所述真实地址和所述交互信息,确定所述网站中视频真实地址的解析规则,包括:
当所述网站中的视频需要由FLASH播放器播放时,将所述真实地址进行分解,从所述真实地址中获取目标参数;
基于所述交互信息,确定所述FLASH播放器生成所述目标参数的算法;
所述基于所述解析规则,获取所述网站上其他视频的真实地址,包括:
基于所述算法,获取所述网站上其他视频的真实地址。
本发明实施例第二方面提供一种视频地址的解析装置,包括:
第一获取模块,用于加载网站上的任一视频,获取所述视频的真实地址,以及所述网站在请求所述视频的真实地址时与网站服务器之间的交互信息;
确定模块,用于基于所述真实地址和所述交互信息,确定所述网站中视频真实地址的解析规则;
第二获取模块,用于基于所述解析规则,获取所述网站上其他视频的真实地址。
可选的,所述第一获取模块,具体用于:
加载网站上的任一视频,通过抓包工具获取所述视频的真实地址,以及所述网站在请求所述视频的真实地址时与网站服务器之间的交互信息。
可选的,所述确定模块,包括:
第一处理子模块,用于将所述真实地址进行分解,从所述真实地址中获取目标参数;
查找子模块,用于从所述交互信息中查找包括部分或者全部所述目标参数的目标信息;
第一确定子模块,用于基于所述目标参数在所述目标信息中的位置,确定所述网站中视频真实地址的解析规则。
可选的,所述确定模块,包括:
第二处理子模块,用于当所述网站中的视频需要由FLASH播放器播放时,将所述真实地址进行分解,从所述真实地址中获取目标参数;
第二确定子模块,用于基于所述交互信息,确定所述FLASH播放器生成所述目标参数的算法;
所述第二获取模块,用于:
基于所述算法,获取所述网站上其他视频的真实地址。
本发明实施例第三方面提供一种计算机设备,包括:
处理器;
存储器,用于存储所述处理器的可执行指令;
当所述处理器执行所述可执行指令时,可以执行上述第一方面所述的方法。
本发明实施例第四方面提供一种计算机可读存储介质,包括指令,当所述指令在所述计算机上运行时,所述计算机可以执行上述第一方面所述的方法。
本发明实施例,通过加载网站上的任一视频,获取该视频的真实地址,以及该网站在请求该视频的真实地址时与网站服务器之间的交互信息,并基于获取到的真实地址和交互信息,确定网站中视频真实地址的解析规则,从而基于该解析规则获取该网站上的其他视频的真实地址。由于本发明实施例只需对网站上任一视频进行加载,获取网站中视频真实地址的解析规则,就能够根据该解析规则获得该网站上其他视频的真实地址,而无需对网站上其他视频进行加载,因而,提高了网站上视频真实地址的获取效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种视频地址的解析方法的流程图;
图2是本发明实施例提供一种步骤102的执行方法流程图;
图3是本发明实施例提供的一种视频地址的解析装置的结构示意图;
图4是本发明实施例提供的一种确定模块12的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤的过程或结构的装置不必限于清楚地列出的那些结构或步骤而是可包括没有清楚地列出的或对于这些过程或装置固有的其它步骤或结构。
现有技术中,视频网站提供给用户的视频资源,其真实地址都是隐藏的,无法直接获取,因此,视频在加载前都需要经过数个交互过程来请求视频的真实地址,从而根据真实地址来对视频进行加载。基于此,本本发明实施例通过加载网站上任一视频,获取该视频的真实地址及网站在请求该视频的真实地址时与网站服务器之间的交互信息,再基于该视频的真实地址和交互信息逆向获得该网站中视频真实地址的解析规则,从而基于该解析规则就可以获取该网站上其他视频的真实地址,而无需加载其他视频,提高了视频真实地址的获取效率。
基于上述原理,本发明实施例提供一种视频地址的解析方法,该方法可以由一种视频地址的解析装置来执行。参见图1,图1是本发明实施例提供的一种视频地址的解析方法的流程图,如图1所示,该方法包括如下步骤:
步骤101、加载网站上的任一视频,获取所述视频的真实地址,以及所述网站在请求所述视频的真实地址时与网站服务器之间的交互信息。
可选的,本实施例可以在视频成功加载后,通过抓包工具获取视频的真实地址,以及网站在请求该视频的真实地址时与网站服务器之间的交互信息,其具体执行过程可以参见现有技术,在这里不再赘述。
可选的,由于实际场景中,一些网站上的视频是分段存储的,针对这些网站上的视频,在加载网站上的任一视频时,可以对该视频的所有分段的地址以及交互信息进行获取,也可以只对其中某一个或多个视频段的地址和交互信息进行获取。
步骤102、基于所述真实地址和所述交互信息,确定所述网站中视频真实地址的解析规则。
具体的,步骤102可以通过如下可能的方式实现:
在一种可能的实现方式中,可以先根据获取到的视频的真实地址,从上述获取到的交互信息中,确定出包括该真实地址的目标交互信息,再基于目标交互信息得到网站中视频真实地址的解析规则,比如,可以基于目标交互信息,获得真实地址携带在哪些交互信息中,该些交互信息中包括的是真实地址的全部参数,还是仅包括真实地址的部分参数,若仅包括部分参数,该些交互信息包括的是真实地址的哪部分参数,该些参数分别携带在信息格式的什么位置上等等。
具体的,图2是本发明实施例提供一种步骤102的执行方法流程图,如图2所示,该方法包括:
步骤201、将所述真实地址进行分解,从所述真实地址中获取目标参数。
可选的,本实施例在获取到视频的真实地址后,需要先对获取到的真实地址进行切割分解,从而获得真实地址中的目标参数,其中,目标参数是指加载视频所必不可少的参数。其中,目标参数可以经过多次切割分解获得,比如可以在每次切割后均依据真实地址剩下的部分进行视频加载,若能够正常加载,则确定被切割掉的部分不是目标参数,如此反复,即可获得真实地址的目标参数。
当然,上述获取目标参数的方案只是本实施例的一种优选方案,根据该方案可以进一步提高视频真实地址的获取效率,而在实际场景中若不考虑运算量的情况下,也可以不对真实地址进行分解,而是可以直接依据真实地址,确定网站中视频真实地址的解析规则。
步骤202、从所述交互信息中查找包括部分或者全部所述目标参数的目标信息。
实际场景中真实地址中的目标参数可能仅被携带在一个交互信息中(比如地址请求消息的响应信息中),也可能目标参数被拆分为多块,并分别携带在多个交互信息中,此时需要从全部交互信息中查找获得所有包括全部或者部分目标参数的交互信息,即目标信息。
步骤203、基于所述目标参数在所述目标信息中的位置,确定所述网站中视频真实地址的解析规则。
比如,网站g在请求视频A的真实地址时与网站服务器之间的交互信息包括信息a、信息b、信息c,其中,信息a和信息b包括真实地址的目标参数,且目标参数均被携带在信息a和信息b信息格式的第二栏位中,则确定网站g中视频真实地址的解析规则是:从信息a和信息b的第二栏位中获取目标参数。当然这里仅为示例说明而不是对本发明的唯一限定。
在另一种可能的实现方式中,主要针对需要FLASH播放器播放视频的网站,针对该些网站,可以在获取到网站上任一视频的真实地址后,对该真实地址进行切割分解,获得真实地址中的目标参数,其中涉及的获取目标参数的方法与前述的方式类似,在这里不再赘述。进一步的,在获取到目标参数后,基于网站在请求该真实地址时与网站服务器之间的交互信息,从网站的FLASH播放器中反解出该FLASH播放器生成目标参数的算法,比如,该算法具体可以表现为基于哪些交互信息中的哪些参数,通过哪些运算获得目标参数,当然这里仅是示例说明而不是唯一限定。其中,本实施例涉及的反解方法可以参见现有技术,在这里不再赘述。
步骤103、基于所述解析规则,获取所述网站上其他视频的真实地址。
举例来说,假设在网站g中视频真实地址的解析规则是:从交互信息d和交互信息s的第二栏位中获取目标参数。则在执行获取网站g上其他视频真实地址的操作时,可以先获取网站g请求其他视频的真实地址时与网站服务器之间的全部交互信息,再从全部交互信息中筛选出交互信息d和交互信息s,再从交互信息d和交互信息s的第二栏位中获取目标参数,从而通过将目标参数填入视频地址的统一格式中,即可获得其他视频的真实地址。当然这里仅为示例说明,而不是对本发明的唯一限定。
本实施例,通过加载网站上的任一视频,获取该视频的真实地址,以及该网站在请求该视频的真实地址时与网站服务器之间的交互信息,并基于获取到的真实地址和交互信息,确定网站中视频真实地址的解析规则,从而基于该解析规则获取该网站上的其他视频的真实地址。由于本实施例只需对网站上任一视频进行加载,获取网站中视频真实地址的解析规则,就能够根据该解析规则获得该网站上其他视频的真实地址,而无需对网站上其他视频进行加载,因而,提高了网站上视频真实地址的获取效率。
图3是本发明实施例提供的一种视频地址的解析装置的结构示意图,如图3所示,该视频地址的解析装置30包括:
第一获取模块11,用于加载网站上的任一视频,获取所述视频的真实地址,以及所述网站在请求所述视频的真实地址时与网站服务器之间的交互信息;
确定模块12,用于基于所述真实地址和所述交互信息,确定所述网站中视频真实地址的解析规则;
第二获取模块13,用于基于所述解析规则,获取所述网站上其他视频的真实地址。
可选的,所述第一获取模块11,具体用于:
加载网站上的任一视频,通过抓包工具获取所述视频的真实地址,以及所述网站在请求所述视频的真实地址时与网站服务器之间的交互信息。
本实施例提供的视频地址的解析装置能够用于执行图1实施例的方法,其执行方式和有益效果类似,在这里不再赘述。
图4是本发明实施例提供的一种确定模块12的结构示意图,如图4所示,在图3实施例的基础上,确定模块12,包括:
第一处理子模块121,用于将所述真实地址进行分解,从所述真实地址中获取目标参数;
查找子模块122,用于从所述交互信息中查找包括部分或者全部所述目标参数的目标信息;
第一确定子模块123,用于基于所述目标参数在所述目标信息中的位置,确定所述网站中视频真实地址的解析规则。
可选的,确定模块12,还可以包括:
第二处理子模块,用于当所述网站中的视频需要由FLASH播放器播放时,将所述真实地址进行分解,从所述真实地址中获取目标参数;
第二确定子模块,用于基于所述交互信息,确定所述FLASH播放器生成所述目标参数的算法;
所述第二获取模块13,用于:
基于所述算法,获取所述网站上其他视频的真实地址。
本实施例提供的视频地址的解析装置能够用于执行图2实施例的方法,其执行方式和有益效果类似,在这里不再赘述。
本发明实施例还提供一种计算机设备,包括:
处理器;
存储器,用于存储所述处理器的可执行指令;
当所述处理器执行所述可执行指令时,可以执行上述图1或图2实施例所示的方法。
本发明实施例还提供一种计算机可读存储介质,包括指令,当所述指令在所述计算机上运行时,所述计算机可以执行上述图1或图2实施例所示的方法。
最后需要说明的是,本领域普通技术人员可以理解上述实施例方法中的全部或者部分流程,是可以通过计算机程序来指令相关的硬件完成,所述的程序可存储于一计算机可读存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可以为磁盘、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。
本发明实施例中的各个功能单元可以集成在一个处理模块中,也可以是各个单元单独的物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现,并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。上述提到的存储介质可以是只读存储器、磁盘或光盘等。
以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。