CN110020252A

CN110020252A - 基于片尾内容的识别有害视频的方法及其系统

Info

Publication number: CN110020252A
Application number: CN201711499888.8A
Authority: CN
Inventors: 蔡昭权; 胡松; 胡辉; 蔡映雪; 陈伽; 黄翰; 梁椅辉; 罗伟; 黄思博
Original assignee: Huizhou University
Current assignee: Huizhou University
Priority date: 2017-12-30
Filing date: 2017-12-30
Publication date: 2019-07-16
Anticipated expiration: 2037-12-30
Also published as: WO2019127653A1; CN110020252B

Abstract

一种识别有害视频的方法及其系统，所述方法包括：获取视频的URL路径，进而依据URL路径获取域名、IP地址，并且基于所述IP地址和域名的相关查询输出第一权重因子、第二权重因子；并且，获取片尾的视频内容，并在预先建立的有害视频数据库中对所述片尾的视频内容进行视频拷贝检测，根据监测的结果输出第三权重因子；综合第一权重因子和第二权重因子以及第三权重因子，对所述视频是否属于有害视频进行识别。本公开能够结合大数据所打造的数据库，用尽量少的图像处理手段，利用多种模式提供一种识别有害视频的方案。

Description

基于片尾内容的识别有害视频的方法及其系统

技术领域

本公开属于信息安全领域，例如涉及一种识别有害视频的方法及其系统。

背景技术

在信息社会，到处充斥信息流，包括但不限于文本、视频、音频、图片等。其中，视频文件往往包括听觉信息和视觉信息，表达能力更加全面。然而，随着移动互联网的普及，网络上充斥大量有害视频内容，由于视觉直观性、冲击性等特点，其危害性更加甚于有害文本、有害图片和有害音频等，因此对这些有害视频进行识别，进而进行过滤、删除、消除危害，是十分必要的。

对于网络有害视频的识别，现在的技术主要有可以分为两大类，一种是传统方法，其中又包括两类：(1)基于单模态特征的识别方法。这类方法主要是提取视频的视觉特征，根据这些特征来构造分类器。例如在暴力视频识别上，常见的特征有视频运动矢量、颜色、纹理以及形状等。(2)基于多模态特征融合的识别方法，这类方法主要是提取视频的多个模态的特征，将其融合以构造分类器。例如在暴力视频识别上，除了视频特征外，很多方法还提取音频特征，包括短时能量，突发声音等。有些方法还考虑了网络视频周围的文本，从这些文本中继续提取一些特征用于融合识别。另一种是深度学习的方法：(1)CNN 利用卷积神经网络对资料库中的敏感有害图像进行识别处理，得到有害敏感视频的内部特征，利用学习到的有害视频框架判断得到的视频帧中是否有有害信息。(2)RNN循环神经网络，直接将资料库中的视频序列输入循环神经网络中识别有害视频信息，学习到有害视频的框架，利用学习到的有害视频框架判断识别新的视频是否为有害视频。 (3)CNN+RNN，利用CNN学习视频中图像帧中的空间域信息，利用 RNN识别视频序列中的时间域信息，最后将两者结合进行识别判断，利用学习到的框架对视频进行识别。

现有的图像处理手段主要有下面两种方法：传统方法和深度学习方法。其中传统方法中经典的方法词包模型，该模型由四个部分组成： (1)底层的特征提取阶段(2)特征编码(3)特征汇聚(4)使用合适的分类器进行分类。深度学习模型是另一种图像处理的模型，主要有自编码器，受限波尔兹曼机，深度信念网络，卷积神经网络，循环神经网络等。随着计算机硬件的不断进步，数据库的完善，使用传统的方法运算过程相比于深度学习来说较为简单，深度学习方法能够学习到更有意义的数据，并根据任务不断进行参数调整，所以对于图像处理方面，深度学习模型有更强大的特征表达能力。

现有的识别方法在在识别效率上都有所不足，在大数据和人工智能发展的情形下，如何高效的识别有害视频，就成为一个需要考虑的问题。

发明内容

本公开提供了一种识别有害视频的方法，包括：

步骤a),获取视频的URL路径，进而依据URL路径获取域名、IP 地址,并且基于所述IP地址，在第一数据库中查询是否存在所述IP 地址或同一网段IP地址，并根据IP地址的查询结果输出与IP相关的第一权重因子；

步骤b)，基于所述域名，在第二数据库中进行whois查询，并根据whois查询结果输出与域名相关的第二权重因子；

步骤c)，基于所述视频的URL路径和所述视频的在线播放时间，获取片尾的视频内容，并利用基于内容的视频拷贝检测技术，在预先建立的有害视频数据库中对所述片尾的视频内容进行视频拷贝检测，并根据检测的结果输出第三权重因子；

步骤d)，综合第一权重因子和第二权重因子以及第三权重因子，对所述视频是否属于有害视频进行识别。

此外，本公开还揭示了一种识别有害视频的系统，包括：

第一权重因子生成模块,用于：获取视频的URL路径，进而依据 URL路径获取域名、IP地址,并且基于所述IP地址，在第一数据库中查询是否存在所述IP地址或同一网段IP地址，并根据IP地址的查询结果输出与IP相关的第一权重因子；

第二权重因子生成模块，用于：基于所述域名，在第二数据库中进行whois查询，并根据whois查询结果输出与域名相关的第二权重因子；

第三权重因子生成模块，用于：基于所述视频的URL路径和所述视频的在线播放时间，获取片尾的视频内容，并利用基于内容的视频拷贝检测技术，在预先建立的有害视频数据库中对所述片尾的视频内容进行视频拷贝检测，并根据检测的结果输出第三权重因子；

识别模块，用于综合第一权重因子和第二权重因子以及第三权重因子，对所述视频是否属于有害视频进行识别。

通过所述方法及其系统，本公开能够结合大数据所打造的数据库，用尽量少的图像处理手段，提供一种较为高效的识别有害视频的方案。

附图说明

图1是本公开中一个实施例所述方法的示意图；

图2是本公开中一个实施例所述系统的示意图。

具体实施方式

为了使本领域技术人员理解本公开所披露的技术方案，下面将结合实施例及有关附图，对各个实施例的技术方案进行描述，所描述的实施例是本公开的一部分实施例，而不是全部的实施例。本公开所采用的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，“包括”和“具有”以及它们的任何变形，意图在于覆盖且不排他的包含。例如包含了一系列步骤或单元的过程、或方法、或系统、或产品或设备没有限定于已列出的步骤或单元，而是可选的还包括没有列出的步骤或单元，或可选的还包括对于这些过程、方法、系统、产品或设备固有的其他步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本公开的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其他实施例互斥的独立的或备选的实施例。本领域技术人员可以理解的是，本文所描述的实施例可以与其他实施例相结合。

参见图1，图1是本公开中一个实施例提供的一种识别有害视频的方法的流程示意图。如图所示，所述方法包括：

步骤S100,获取视频的URL路径，进而依据URL路径获取域名、 IP地址,并且基于所述IP地址，在第一数据库中查询是否存在所述 IP地址或同一网段IP地址，并根据IP地址的查询结果输出与IP相关的第一权重因子；

能够理解，第一数据库维护已知的、发布过有害视频的IP地址清单。

例如，IP地址是192.168.10.3的情形下：

如果第一数据库中记载有该IP地址，那么第一权重因子可以示例性为1.0；

如果数据库中记载的IP地址只有192.168.10.4，那么 192.168.10.3则被中度怀疑为该视频所属网站的备用地址或者新近更换的地址，第一权重因子可以示例性为0.6；

如果数据库中记载的IP地址有192.168.10.4以及 192.168.10.5，甚至记载了192.168.10.X网段的所有IP地址，那么 192.168.10.3则被高度怀疑为该视频所属网站的备用地址或者新近更换的地址，第一权重因子可以示例性为0.9；

如果数据库中记载的IP地址中包括多个192.168.X.X网段，而没有192.168.10.X网段，那么192.168.10.3则被谨慎怀疑为有害视频所属网站的地址，第一权重因子可以示例性为0.4。

步骤S200，基于所述域名，在第二数据库中进行whois查询，并根据whois查询结果输出与域名相关的第二权重因子；

能够理解，第二数据库维护已知的、发布过有害视频的域名清单。

Whois查询是为了考察域名注册人与有害视频的关联情况。第二数据库可以维护如下信息：域名、互联网上大量发布有害视频的域名注册人的信息以及对应的有害视频的标识。

例如，域名是www.a.com的情形下：

如果第二数据库中记载有该域名地址、相应有害视频的标识及其 whois信息，那么第二权重因子可以示例性为1.0；

如果第二数据库中没有记载上述域名www.a.com的任何有害视频的标识，但是能够查询到该域名的域名注册人，以及该域名的域名注册人注册的其他网站的域名，且第二数据库包括所述其他网站在互联网上大量发布有害视频的标识；，那么即使第二数据库中没有记载上述域名www.a.com的任何有害视频的标识，www.a.com该域名对应的网站依然被高度怀疑为有害视频的来源，所述第二权重因子可以示例性为0.9；

如果第二数据库中没有记载上述域名www.a.com的任何有害视频的标识，但是能够查询到该域名的域名注册人，以及该域名的域名注册人注册的其他网站的域名，然而第二数据库并不包括任何关于所述其他网站发布有害视频的标识，所述第二权重因子可以示例性为0；

容易理解，如果第二数据库中没有记载上述域名www.a.com的任何有害视频的标识，也查询不到该域名的域名注册人注册的其他网站的域名，那么所述第二权重因子也可以示例性为0。

步骤S300，基于所述视频的URL路径和所述视频的在线播放时间，获取片尾的视频内容，并基于内容的视频拷贝监测，在预设的有害视频数据库中对所述片尾的视频内容进行视频拷贝监测，并根据监测的结果输出第三权重因子；

该步骤S300是基于内容的视频拷贝检测，并通过检测的结果来输出第三权重因子。能够理解，预先建立的有害视频数据库包括了常规有害视频或其他不健康内容等，并且所述预先建立的有害视频数据库可以结合大数据技术来建立，且可以被不断更新。如果所述最低画面质量时的视频文件被检测结果认定为：所述预先建立的有害视频数据库中某视频的疑似拷贝版本，则第三权重因子会有所体现。能够理解，满足相应的阈值条件时，第三权重因子可能是1.0，也可能是0.8 或0.4，视具体阈值条件而定。

另外，需要强调的是，为了降低本实施例所需的计算资源和时间成本，对图像文件进行是否有害识别时，是基于所述视频的URL 路径和所述视频的在线播放时间，获取片尾的视频内容。能够理解，片尾的视频内容可以通过视频文件的形式保存起来作为处理的对象，或者通过缓存的形式作为处理的对象。这是因为，对于有害视频而言，其片尾往往是情节的高潮部分，而这些有害视频的传播者，无论是出于癖好还是别的不良动机，一般都不太可能删除片尾的高潮部分。也就是说，对于本实施例而言，其大大减少了视频拷贝检测的工作量。需要补充说明的是，该实施例是较佳实施例，并不意味着视频内容不能从视频的前面1/3播放时间段选取相应内容，或者从中间1/3播放时间段选取相应内容。

较佳的，片尾的视频内容可以是视频的末尾1/3播放时间段内选取的相应内容。更佳的，片尾的视频内容可以是视频的末尾几分钟内的内容，例如3分钟、5分钟、10分钟；不论几分钟，如果末尾 1/3播放时间长度更小，那么自然优选末尾1/3播放时间段内的相应内容。

能够理解，所述步骤S300，既可以结合传统的方法进行视频处理，也可以结合深度学习模型进行视频处理，进而对有害视频进行识别。

步骤S400，综合第一权重因子和第二权重因子以及第三权重因子，对所述视频是否属于有害视频进行识别。

示例性的，设第一权重因子为x，第二权重因子为y，第三权重因子为z，其中0≤x≤1，0≤y≤1，0≤z≤1，可以根据如下公式综合上述权重因子计算视频的有害系数W：

W＝a×x+b×y+c×z，其中，a+b+c＝1，a、b、c则分别表示各个权重因子的权重。

例如，a＝b＝c＝1/3；

更例如，a、b、c不相等，具体可以根据各个权重因子以及识别有害内容的实际情况而调整。

能够理解，W越接近1，相关视频属于有害视频的几率越大。

以上计算W的公式属于线性公式，然而实际应用时，也可能采用非线性公式。

进一步的，无论是线性公式还是非线性公式，均可以考虑通过训练或拟合来确定相关公式及其参数。

综上，对于上述实施例，仅仅步骤S300进行了图像处理，而其余步骤则是另辟蹊径，利用了相关查询、获得相关的权重因子。步骤 S400则综合(也可称为融合)多个权重因子进行有害视频的识别。本领域技术人员均知晓，针对视频的每一帧图像进行处理、识别是非常消耗时间成本的，而查询则相对而言更加节省时间成本。显而易见，上述实施例提出了一种富有效率的识别有害视频的方法。另外，上述实施例显然能够进一步结合大数据和/或人工智能来建立、更新所述第一数据库、第二数据库以及其他数据库。

在另一个实施例中，所述第二数据库为第三方数据库。

例如，进行whois查询的众多网站、以及第三方维护的有害视频的网站列表方面的数据库。

在另一个实施例中，对于识别后确定为有害视频的，针对其来源的网址(例如论坛或网页)，收集所述网址上记载的所述有害视频的发表者的IP地址信息并更新第一数据库。这是因为，有害视频一般会形成一些粘性用户，这些用户有一部分会参与传播有害视频且大部分的IP地址会相对固定，如果相关网址自身记载了所述有害视频的发表者的IP地址信息，本公开则通过收集其IP地址信息来更新前述第一数据库。

在另一个实施例中，步骤S200还包括：

进一步的，在第三方域名安全列表中查询所述域名的安全性以便输出安全因子，并通过所述安全因子对所述与域名相关的第二权重因子进行修正。

例如virustotal.com这一第三方域名安全筛查网站。能够理解，如果第三方信息中认为相关域名包含病毒或木马，则应当提高第二权重因子，根源在于相关网站更加不安全。

能够理解，所述实施例是侧重于从网络安全角度修正第二权重因子，防止用户遭受其他损失。这是因为，网络安全事关用户的隐私和财产权，如果有害视频的相关网站存在网络安全隐患，那么除了有害视频的危害之外还对用户带来隐私泄露或财产损失的危害。

在另一个实施例中，步骤S300中的获取片尾的视频内容，是获取低画质情形下的片尾的视频内容。

对该实施例而言，其意味着获取视频内容时，为了尽量减少获取的视频内容的大小，优先选择低画质情形下的片尾的视频内容。显然，发明人充分利用了当今视频播放设置中的最低画面质量所对应的视频内容来进行高效地视频拷贝检测。但是，这不意味着必须通过播放设置来获取最低画面或低画质画面，因为还可以通过各种采样来获得低画质所对应的视频内容并进一步实施视频拷贝检测。

在另一个实施例中，步骤S300中的

获取片尾的视频内容，还包括如下：

步骤c1)：提取所述片尾的视频内容中的音频；

步骤c2)：识别音频中是否包括有害内容，如果有，则根据音频的起止时间获取所述起止时间内的视频内容。

对于该实施例而言，如果识别到音频中包括所述有害内容，则定位其时间，从音频的起止时间为依据，获取起止时间内的视频内容。这样能够更加针对性的找到相关有害的画面。

如前文所述，如果结合大数据技术，本公开能够富有成效的结合多个维度、多种模式，结合IP信息、域名信息、图像信息、音频信息来快速的识别有害视频。

更进一步的，上述实施例可以在路由器一侧、或者网络提供商一侧实施，提前过滤相关视频。

与方法相对应的，参见图2，本公开在另一个实施例中揭示了一种识别有害视频的系统，包括：

与前文各个方法的实施例所类似的，

优选的，所述第二数据库为第三方数据库。

更优选的，第二权重因子生成模块还包括：

修正单元，用于：进一步的，在第三方域名安全列表中查询所述域名的安全性以便输出安全因子，并通过所述安全因子对所述与域名相关的第二权重因子进行修正。

更优选的，所述第三权重因子生成模块中获取片尾的视频内容，是获取低画质情形下的片尾的视频内容。

更优选的，所述第三权重因子生成模块中还通过如下单元获取片尾的视频内容：

音频提取单元，用于提取所述片尾的视频内容中的音频；

音频识别单元，用于识别音频中是否包括有害内容，如果有，则根据音频的起止时间获取所述起止时间内的视频内容。

本公开在另一个实施例中揭示了一种识别有害视频的系统，包括：

处理器及存储器，所述存储器中存储有可执行指令，所述处理器执行这些指令以执行以下操作：

本公开在另一个实施例中还揭示了一种计算机存储介质，存储有可执行指令，所述指令用于执行如下识别有害视频的方法：

对于上述系统，其可以包括：至少一个处理器(例如CPU)，至少一个传感器(例如加速度计、陀螺仪、GPS模块或其他定位模块)，至少一个存储器，至少一个通信总线，其中，通信总线用于实现各个组件之间的连接通信。所述设备还可以包括至少一个接收器，至少一个发送器，其中，接收器和发送器可以是有线发送端口，也可以是无线设备(例如包括天线装置)，用于与其他节点设备进行信令或数据的传输。所述存储器可以是高速RAM存储器，也可以是非不稳定的存储器(Non-volatile memory)，例如至少一个磁盘存储器。存储器可选的可以是至少一个位于远离前述处理器的存储装置。存储器中存储一组程序代码，且所述处理器可通过通信总线，调用存储器中存储的代码以执行相关的功能。

本公开的实施例还提供一种计算机存储介质，其中，该计算机存储介质可存储程序，该程序执行时包括上述方法实施例中记载的任何一种识别有害视频的方法的部分或全部步骤。

本公开的实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。

本公开的实施例系统中的模块和单元可以根据实际需要进行合并、划分和删减。需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作、模块、单元并不一定是本发明所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本公开所提供的几个实施例中，应该理解到，所揭露的系统，可通过其它的方式实现。例如，以上所描述的实施例仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，各单元或组件相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，既可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，本公开的各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为智能手机、个人数字助理、可穿戴设备、笔记本电脑、平板电脑)执行本公开的各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(R0M，Read-0nly Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本公开的技术方案，而非对其限制；尽管参照前述实施例对本公开进行了详细的说明，本领域技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本公开的各实施例技术方案的范围。

Claims

1.一种识别有害视频的方法，包括：

步骤a)，获取视频的URL路径，进而依据URL路径获取域名、IP地址，并且基于所述IP地址，在第一数据库中查询是否存在所述IP地址或同一网段IP地址，并根据IP地址的查询结果输出与IP相关的第一权重因子；

2.根据权利要求1所述的方法，其中，优选的，所述第二数据库为第三方数据库。

3.根据权利要求1所述的方法，其中，步骤b)还包括：

4.根据权利要求1所述的方法，其中，步骤c)中的获取片尾的视频内容，是获取低画质情形下的片尾的视频内容。

5.根据权利要求1所述的方法，其中，步骤c)中的获取片尾的视频内容，还包括如下：

步骤c1)：提取所述片尾的视频内容中的音频；

6.一种识别有害视频的系统，包括：

第一权重因子生成模块，用于：获取视频的URL路径，进而依据URL路径获取域名、IP地址，并且基于所述IP地址，在第一数据库中查询是否存在所述IP地址或同一网段IP地址，并根据IP地址的查询结果输出与IP相关的第一权重因子；

7.根据权利要求6所述的系统，其中，优选的，所述第二数据库为第三方数据库。

8.根据权利要求6所述的系统，其中，第二权重因子生成模块还包括：

9.根据权利要求6所述的系统，其中，所述第三权重因子生成模块中获取片尾的视频内容，是获取低画质情形下的片尾的视频内容。

10.根据权利要求6所述的系统，其中，所述第三权重因子生成模块中还通过如下单元获取片尾的视频内容：

音频提取单元，用于提取所述片尾的视频内容中的音频；