CN114925249A

CN114925249A - 一种面向自适应流媒体的视频传输指纹快速生成方法

Info

Publication number: CN114925249A
Application number: CN202210552435.1A
Authority: CN
Inventors: 吴桦; 刘嵩涛; 罗浩; 程光
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2022-05-20
Filing date: 2022-05-20
Publication date: 2022-08-19
Anticipated expiration: 2042-05-20

Abstract

本发明公开了一种面向自适应流媒体的视频传输指纹快速生成方法，自适应流媒体协议在传输视频时分片顺序传输，分片的顺序及分片长度构成了视频的传输指纹。该方法基于自适应流媒体协议HLS和DASH的视频传输标准，根据常见的视频平台的特点，解析给定的URL，从页面信息中提取与该视频相关的信息，根据提取到的有效信息进一步调用视频播放接口或者请求视频描述文件，从而提取相应的分片长度等信息，得到视频传输指纹。该方法无需下载完整的视频文件，仅需下载少量信息就可以获得准确的视频传输指纹，减少了视频传输指纹获取所需的存储资源，并且过程中无需人为操作，极大地提升了视频传输指纹的获取速度。

Description

一种面向自适应流媒体的视频传输指纹快速生成方法

技术领域

本发明涉及一种面向自适应流媒体的视频传输指纹快速生成方法，属于网络安全技术领域。

背景技术

随着互联网技术的发展，在线视频平台已经成为人们日常生活中重要的一部分。由于网络带宽的提高和移动互联网的普及，海量视频在因特网广泛传播。在海量视频中必然存在一些公害视频，对这些视频的及时发现有利于保障网络空间的安全。

现有研究中已提出了一些针对特定流媒体传输协议，从在线视频平台下载视频文件的方法，这有助于构建电子证据，辅助司法决策。获取到的公害视频，能作为非法行为的证据留存，但难以在阻止公害视频二次传播的场景下发挥作用。减轻公害视频的传播给社会带来的不良影响，对营造清朗的网络空间具有重要意义。因此，在加密传输场景下，提出一种快速而高效地识别公害视频的方法是必要的。

虽然视频的内容通常是加密的，但是由于自适应流媒体技术的广泛应用，视频传输的时候会被分块顺序传输，这些分块的数据长度与视频内容具有关联关系，可以根据这些数据长度序列得到视频传输指纹。视频传输指纹表征了特定视频在因特网中传输时的不变特点。如果可以得到有害视频的传输指纹，就有可能在这些视频传输时对其进行监控和识别，从而保障网络空间安全。

目前较为常见的视频传输指纹获取方法，是下载视频文件后，通过解析视频文件中的索引字段，提取该视频的分片信息。该方法的优势在它获得的视频指纹，与用户在线观看视频时，浏览器的请求行为高度一致。但该方法只有在客户端通过完全下载并播放视频才能获得视频传输指纹。当需要获得大量的视频传输指纹时，这种方法存在耗时长，占用终端较大的存储空间，不适用于快速提取大量的视频传输指纹。

若能在终端接入点采集流量，通过对报文的分析，则有可能在不需要下载完全的视频文件情况下提取出视频传输指纹。但是这类方法在面对加密的视频流量的时候需要通过“中间人攻击”的方法对得到破解的明文，已有的发明专利“一种面向YouTube DASH加密视频的指纹数据库构建方法”，使用“中间人攻击”的方法获得明文，而且需要操作员手动选择视频分辨率，手动开启和停止采集流程，无法进行大规模快速采样，也无法避免人为操作失误的影响。本发明在实际应用中，无需逐步手动操作，也不依赖人为判断决策，能够有效减少人力成本，提高数据库构建效率。

除了视频传输指纹，还有其它与视频传输状态无关的视频指纹。例如基于视频文件得到的对视频的唯一标识也被称为视频文件特征指纹，这类指纹主要用于对本地视频文件的区分和识别。视频特征指纹的获取方法主要是在视频帧的粒度上，提取本地视频文件的关键帧，对关键帧进行特征提取，生成视频特征指纹。在基于视频特征指望对视频识别的过程中，通过逐个对比目标视频特征指纹与指纹库中的每个视频特征指纹，计算两特征向量之间的距离，得到相似度得分，以此判断是否匹配。若要获取视频指纹，必须有完整的视频文件，对视频指纹提取设备的存储能力有较高的要求。提取关键帧的过程涉及对视频文件的解码，针对提取到的关键帧，还需通过神经网络等方式进行特征提取和处理，这对视频指纹提取设备的处理性能也提出了较高的要求。此外，这类视频指纹并不反映视频传输特点，无法用于视频在因特网中传输时对其进行识别。因此这类视频特征指纹与本发明提取的视频传输指纹是应用于不同场景的两种视频指纹。

发明内容

为了解决自适应流媒体的视频传输指纹快速生成问题，本发明给出了针对自适应流媒体协议HLS和DASH的视频传输指纹生成方案，覆盖了当前主流视频平台。该方法根据常见的视频平台和自适应流媒体的特点，解析给定的URL，从页面信息中提取与该视频相关信息，根据提取到的有效信息进一步调用视频播放API或者请求视频描述文件，从而提取相应的分片长度等信息，得到视频传输指纹。该方法无需下载完整的视频文件，仅需下载少量信息就可以获得准确的视频传输指纹，减少了视频传输指纹获取所需的存储资源，并且过程中不需人为操作，极大地提升了视频传输指纹的获取速度，本发明覆盖了当前主流视频平台，可用于构建大型的视频传输指纹库。

为了实现上述目的，本发明的技术方案如下：一种面向自适应流媒体的视频传输指纹快速生成方法，该方法包括以下步骤：

步骤(1)解析给定的视频URL，根据URL所属的视频平台选择对应的页面信息提取模块，该模块负责根据URL所属的视频平台构造合适的访问请求，获取并处理目标网页源码及返回的JSON信息中与视频相关的信息；

步骤(2)由步骤(1)中选择的页面信息提取模块模拟浏览器正常浏览行为，向目标URL请求页面信息和视频播放API，页面信息提取模块处理响应结果，提取有效信息，并以规范的数据结构保存；

步骤(3)解析步骤(2)中提取到的信息，判断视频平台使用的传输协议，选择合适的分片信息提取模块，该模块负责提取并保存与视频分片有关的信息，传输协议若为HLS协议则进入步骤(4)，若为DASH协议则进入步骤(5)，否则进入异常处理流程；

步骤(4)对于使用HLS协议传输的视频平台，分片信息提取模块根据步骤(2)中得到的信息，请求视频的描述文件，该文件一般为独立的M3U8文件，少数以JSON形式呈现。在分析并处理该描述文件后，得到视频传输指纹；

步骤(5)对于使用DASH协议传输的视频平台，分片信息提取模块根据步骤(2)中得到的信息，请求视频的描述文件，该文件一般为独立的MPD文件，少数以JSON形式呈现。在分析并处理该描述文件后，得到视频指纹；

步骤(6)根据分片信息提取模块获得的视频传输指纹信息构建视频传输指纹数据库。

进一步，所述步骤(1)中，选择页面信息提取模块的具体过程为：依次调用根据各平台特点编写的，相互独立的页面信息提取模块，通过正则表达式将给定URL与URL所属平台的页面信息提取模块匹配，匹配成功则利用该模块进行信息提取。

进一步，所述步骤(2)具体包含以下子步骤：

(2.1)根据浏览器浏览行为特点，构造合适的请求头部，从步骤(1)中获得的URL下载页面信息并保存；

(2.2)根据平台视频播放API的交互规范，构造合适的参数，并将参数包含于请求头部或URL中，请求视频播放API并保存响应；

(2.3)处理(2.1)、(2.2)中返回的结果，提取包括但不限于视频标题、视频格式、视频文件地址、视频描述文件地址等信息。滤去与下载无关的信息能有效减少后续模块的处理压力，保留部分与视频相关的信息有助于构建清晰直观的视频传输指纹库；

(2.4)将(2.3)中获得的信息以规范的数据结构保存。

进一步，所述步骤(4)具体包含以下子步骤：

(4.1)判断从步骤(2)获得的信息中是否包含M3U8文件的地址。若包含则进入步骤(4.2)，否则进入步骤(4.4)；

(4.2)请求M3U8文件，解析文件内容。判断其在给出分片访问地址的同时是否给出分片大小。若给出，则提取信息并保存。至此取得视频传输指纹，分片信息提取模块运行结束。若未给出，则进入步骤(4.3)；

(4.3)依次访问M3U8文件中每个分片的地址。读取响应头部的Content-length字段并保存该长度信息。仅请求Content-length字段避免了数据传输带来的网络和存储开销，保证视频传输指纹获取效率。至此取得视频传输指纹，分片信息提取模块运行结束；

(4.4)从步骤(2)获得的视频播放API返回的JSON数据中查找分片大小信息并保存该长度信息。至此取得视频传输指纹，分片信息提取模块运行结束。

进一步，所述步骤(5)具体包含以下子步骤：

(5.1)判断从步骤(2)获得的信息中是否包含MPD文件的地址。若包含则进入步骤(5.2)，否则进入步骤(5.5)；

(5.2)请求MPD文件，解析文件内容。分析MPD文件的组织形式，若是(BaseURL)+SegmentList的形式，进入步骤(5.3)。若是BaseURL+SegmentBase或类(BaseURL)+SegmentTemplate+SegmentTimeline的形式，进入步骤(5.4)；

(5.3)采取和HLS协议相同的方法，依次请求各分片地址，读取响应头部的Content-length字段并保存长度信息。至此取得视频传输指纹，分片信息提取模块运行结束；

(5.4)查找MPD文件中的SegmentBase字段，提取其中indexRange字段的信息并保存该长度信息，该字段包含DASH协议传输的视频文件的索引信息。进入步骤(5.6)；

(5.5)从步骤(2)获得的请求视频播放API返回的JSON数据中查找indexRange字段并保存该长度信息，进入步骤(5.6)；

(5.6)从步骤(2)中获得的信息中取得视频文件的下载地址，根据平台特点构造请求头部。设置请求头部的Range参数，只请求indexRange部分的数据，避免传输完整视频数据带来的网络和存储开销，保证视频传输指纹获取效率。该部分数据为视频文件的索引字段，其中包含视频文件的分片数量和大小信息。将请求到的数据以统一的命名规则保存，称为索引元数据；

(5.7)使用DASH协议传输的视频平台其视频文件一般有两种格式，fMP4和WebM。两种格式的组织结构不同，故需分别使用fMP4解析程序和WebM解析程序对步骤(5.6)中获得的索引元数据进行解析获得长度信息。至此取得视频传输指纹，分片信息提取模块运行结束。

与现有技术相比，本发明的技术方案具有以下有益技术效果。

(1)本发明提出了一种新的，快速获取视频传输指纹的方法，该方法无需下载完整的视频文件，而是通过解析响应头部、解析视频描述文件和视频索引字段信息的方式获取视频传输指纹。极大地提升了视频传输指纹的获取效率，降低了性能开销和存储开销。

(2)已有的获取特定视频平台传输指纹方法，需要操作员手动选择视频分辨率，手动开启和停止采集流程，无法进行大规模快速采样，也无法避免人为操作失误的影响,本发明在实际应用中，无需专人值守，也不依赖人为判断决策，能够有效减少人力成本，提高数据库构建效率。

(3)本发明提出的视频传输指纹获取技术，能广泛用于大部分主流视频平台，针对不同格式的音视频，提出了与之适配的解决方案。因此，本发明能够高效地构建跨多个平台的大型视频传输指纹库。

(4)本发明获取的视频传输指纹，可用于网络公害视频的识别、监控、检测领域，为相关系统数据的及时更新，打下坚实技术基础，为防止公害视频进一步扩散，提供强有力的保障。

附图说明

图1面向自适应流媒体的视频传输指纹快速生成方法的总体架构图；

图2面向自适应流媒体的视频传输指纹快速生成方法的流程图；

图3使用HLS协议传输的视频传输指纹获取步骤；

图4使用DASH协议传输的视频传输指纹获取步骤。

具体实施方式

以下将结合具体实施例对本发明提供的技术方案进行详细说明，应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。

实施例：本发明提供的一种面向自适应流媒体的视频传输指纹快速生成方法，其总体架构如图1所示，以下将分别介绍使用HLS协议的视频平台和使用DASH协议的视频平台的视频传输指纹获取步骤。

实施例1：使用HLS协议的视频平台视频传输指纹获取包括以下步骤：

(1)解析给定的视频URL，根据URL所属的视频平台选择对应的页面信息提取模块，该模块负责根据URL所属的视频平台构造合适的访问请求，获取并处理目标网页源码及返回的JSON信息中与视频相关的信息；

本发明的一个实施例中，步骤(1)中，选择页面信息提取模块的具体过程为：模块接收到URL：https://v.youku.com/v_show/id_XMzYxOTQ3MTc2.html，依次调用根据各平台特点编写的，相互独立的页面信息提取模块，通过正则表达式将URL与优酷平台的页面信息提取模块匹配，并利用该模块进行信息提取。

(2)由步骤(1)中选择的页面信息提取模块模拟浏览器正常浏览行为，向目标URL请求页面信息和视频播放API。页面信息提取模块处理响应结果，提取有效信息，并以规范的数据结构保存；

本发明的一个实施例中，步骤(2)中，具体包含以下子步骤：

(2.1)根据浏览器浏览行为特点，构造合适的请求头部，从步骤(1)中获得的URL下载页面信息并保存；表1列出了请求优酷页面信息时，请求头部所包含的字段含义和具体值。

表1URL页面信息请求头部(优酷)

(2.2)根据平台视频播放API的交互规范，构造合适的参数，并将参数包含于请求头部或URL中，请求视频播放API并保存响应；表2列出了请求优酷视频播放API信息时，请求参数所包含的字段含义和具体值。

表2视频播放API请求参数(优酷)

(2.3)处理(2.1)、(2.2)中返回的结果，提取包括但不限于视频标题、视频格式、视频文件地址、视频描述文件地址等信息；

(2.4)将(2.3)中获得的信息以规范的数据结构保存。表3列出了页面信息提取模块提取到的字段名称及含义。

表3页面信息字段名称及含义(HLS)

字段名称	含义
		title	视频标题
format	视频格式
		duration	视频时长
id	视频id
		platform	视频平台名称
url	视频文件地址
		webpage_url	视频页面地址
manifest_url	视频描述文件地址
		protocol	传输协议

(3)解析步骤(2)中提取到的信息，判断视频平台使用的传输协议，选择针对HLS协议的分片信息提取模块。该模块负责提取并保存与视频分片有关的信息。分片信息提取模块根据步骤(2)中得到的信息，请求视频的描述文件，该文件一般为独立的M3U8文件，少数以JSON形式呈现。在分析并处理该描述文件后，得到视频传输指纹；

本发明的一个实施例中，以优酷平台为例，步骤(3)中，具体包含以下子步骤：

(3.1)解析从步骤(2)中获得的信息，从优酷提取的信息中，有M3U8文件的地址；分片信息提取模块得到的信息如表4所示，url字段为空表示视频不能直接从某一地址下载，必须从M3U8文件中解析。

表4页面信息(优酷)

(3.2)请求M3U8文件，解析文件内容。优酷的M3U8文件中仅给出分片访问地址，而没有分片大小；

(3.3)依次访问M3U8文件中每个分片的地址。读取响应头部的Content-length字段并保存该长度信息。至此取得视频传输指纹，分片信息提取模块运行结束。表5给出了前8个分片信息的具体数值。

表5分片信息

(4)根据分片信息提取模块获得的视频传输指纹信息构建视频传输指纹数据库。

实施例2：使用DASH协议的视频平台视频传输指纹获取包括以下步骤：

本发明的一个实施例中，步骤(1)中，选择页面信息提取模块的具体过程为：模块接收到URL：https://www.bilibili.com/video/BV1HF411M7EY，依次调用根据各平台特点编写的，相互独立的页面信息提取模块，通过正则表达式将URL与bilibili平台的页面信息提取模块匹配，并利用该模块进行信息提取。

本发明的一个实施例中，步骤(2)中，具体包含以下子步骤：

(2.1)根据浏览器浏览行为特点，构造合适的请求头部，从步骤(1)中获得的URL下载页面信息并保存；表6列出了请求bilibili页面信息时，请求头部所包含的字段名称和具体值。

表6URL页面信息请求头部(bilibili)

(2.2)根据平台视频播放API的交互规范，构造合适的参数，并将参数包含于请求头部或URL中，请求视频播放API并保存响应；表7列出了请求bilibili视频播放API信息时，请求参数所包含的字段名称和具体值。

表7视频播放API请求参数(bilibili)

(2.4)将(2.3)中获得的信息以规范的数据结构保存。表8列出了页面信息提取模块提取到的字段名称及含义。

表8页面信息字段名称及含义(DASH)

(3)解析步骤(2)中提取到的信息，判断视频平台使用的传输协议，选择针对DASH协议的分片信息提取模块。该模块负责提取并保存与视频分片有关的信息。分片信息提取模块根据步骤(2)中得到的信息，请求视频的描述文件，该文件一般为独立的MPD文件，少数以JSON形式呈现。在分析并处理该描述文件后，得到视频指纹；

本发明的一个实施例中，以bilibili平台为例，步骤(3)具体包含以下子步骤：

(3.1)解析从步骤(2)中获得的信息，bilibili未给出MPD文件的地址；分片信息提取模块得到的信息如表9所示，manifest_url字段为空表示bilibili未给出视频描述文件的地址。

表9页面信息(bilibili)

(3.2)从步骤(2)获得的请求视频播放API返回的JSON数据中查找indexRange字段并保存该长度信息；

(3.3)从步骤(2)中获得的信息中取得视频文件的下载地址，根据平台特点构造请求头部。设置请求头部的Range参数，只请求indexRange部分的数据。该部分数据为视频文件的索引字段，其中包含视频文件的分片数量和大小信息。将请求到的数据以统一的命名规则保存，称为索引元数据；

(3.4)bilibili传输的视频文件使用fMP4格式，故使用fMP4解析程序对步骤(3.3)中获得的索引元数据进行解析获得长度信息。至此取得视频传输指纹，分片信息提取模块运行结束。表10给出了前8个分片信息的具体数值。

表10分片信息

分片编号	分片长度(Byte)
		1	199158
2	199268
		3	199136
4	200144
		5	199009
6	199367
		7	200135
8	199020

本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段，还包括由以上技术特征任意组合所组成的技术方案。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

Claims

1.一种面向自适应流媒体的视频传输指纹快速生成方法，其特征在于，该方法包括以下步骤：

步骤(2)由步骤(1)中选择的页面信息提取模块模拟浏览器正常浏览行为，向目标URL请求页面信息和视频播放API,页面信息提取模块处理响应结果，提取有效信息，并以规范的数据结构保存；

步骤(3)解析步骤(2)中提取到的信息，判断视频平台使用的传输协议，选择合适的分片信息提取模块，该模块负责提取并保存与视频分片有关的信息,传输协议若为HLS协议则进入步骤(4)，若为DASH协议则进入步骤(5)，否则进入异常处理流程；

步骤(4)对于使用HLS协议传输的视频平台，分片信息提取模块根据步骤(2)中得到的信息，请求视频的描述文件，该文件为独立的M3U8文件，少数以JSON形式呈现,在分析并处理该描述文件后，得到视频传输指纹；

步骤(5)对于使用DASH协议传输的视频平台，分片信息提取模块根据步骤(2)中得到的信息，请求视频的描述文件，该文件为独立的MPD文件，少数以JSON形式呈现，在分析并处理该描述文件后，得到视频传输指纹；

2.根据权利要求1所述的一种面向加密视频传输协议的视频传输指纹快速生成方法，其特征在于，所述步骤(1)中，选择页面信息提取模块的具体过程为：依次调用根据各平台特点编写的，相互独立的页面信息提取模块，通过正则表达式将给定URL与URL所属平台的页面信息提取模块匹配，匹配成功则利用该模块进行信息提取。

3.根据权利要求1所述的一种面向加密视频传输协议的视频传输指纹快速生成方法，其特征在于，所述步骤(2)具体包含以下子步骤：

(2.3)处理(2.1)、(2.2)中返回的结果，提取包括视频标题、视频格式、视频文件地址、视频描述文件地址信息；

(2.4)将(2.3)中获得的信息以规范的数据结构保存。

4.根据权利要求1所述的一种面向加密视频传输协议的视频传输指纹快速生成方法，其特征在于，所述步骤(4)具体包含以下子步骤：

(4.1)判断从步骤(2)获得的信息中是否包含M3U8文件的地址,若包含则进入步骤(4.2)，否则进入步骤(4.4)；

(4.2)请求M3U8文件，解析文件内容，判断其在给出分片访问地址的同时是否给出分片大小,若给出，则提取信息并保存,至此取得视频传输指纹，分片信息提取模块运行结束,若未给出，则进入步骤(4.3)；

(4.3)依次访问M3U8文件中每个分片的地址,读取响应头部的Content-length字段并保存该长度信息,至此取得视频传输指纹，分片信息提取模块运行结束；

(4.4)从步骤(2)获得的视频播放API返回的JSON数据中查找分片大小信息并保存该长度信息,至此取得视频传输指纹，分片信息提取模块运行结束。

5.根据权利要求1所述的一种面向加密视频传输协议的视频传输指纹快速生成方法，其特征在于，所述步骤(5)具体包含以下子步骤：

(5.1)判断从步骤(2)获得的信息中是否包含MPD文件的地址,若包含则进入步骤(5.2)，否则进入步骤(5.5)；

(5.2)请求MPD文件，解析文件内容，分析MPD文件的组织形式，若是(BaseURL)+SegmentList的形式，进入步骤(5.3)，若是BaseURL+SegmentBase或类(BaseURL)+SegmentTemplate+SegmentTimeline的形式，进入步骤(5.4)；

(5.3)采取和HLS协议相同的方法，依次请求各分片地址，读取响应头部的Content-length字段并保存长度信息，至此取得视频传输指纹，分片信息提取模块运行结束；

(5.4)查找MPD文件中的SegmentBase字段，提取其中indexRange字段的信息并保存该长度信息，该字段包含DASH协议传输的视频文件的索引信息，进入步骤(5.6)，

(5.6)从步骤(2)中获得的信息中取得视频文件的下载地址，根据平台特点构造请求头部，设置请求头部的Range参数，只请求indexRange部分的数据，该部分数据为视频文件的索引字段，其中包含视频文件的分片数量和大小信息，将请求到的数据以统一的命名规则保存，称为索引元数据；

(5.7)使用DASH协议传输的视频平台其视频文件一般有两种格式，fMP4和WebM，两种格式的组织结构不同，故需分别使用fMP4解析程序和WebM解析程序对步骤(5.6)中获得的索引元数据进行解析获得长度信息，至此取得视频传输指纹，分片信息提取模块运行结束。