CN115550684B

CN115550684B - 一种改进的视频内容过滤方法和系统

Info

Publication number: CN115550684B
Application number: CN202111651302.1A
Authority: CN
Inventors: 苏长君; 曾祥禄
Original assignee: Beijing Guorui Digital Intelligence Technology Co ltd
Current assignee: Beijing Guorui Digital Intelligence Technology Co ltd
Priority date: 2021-12-30
Filing date: 2021-12-30
Publication date: 2023-07-25
Anticipated expiration: 2041-12-30
Also published as: CN115550684A

Abstract

本发明提供一种改进的视频内容过滤方法和系统，通过将接收的视频数据流经过两重视频采样，得到携带有边界和区域局部特征的高维图像，将其的帧定义为关键帧，通过关键帧映射回原视频数据流，提取出修剪后的数据流，对它进行物体识别和语义分析，判断是否合规，可以更快地检测判断。

Description

一种改进的视频内容过滤方法和系统

技术领域

本申请涉及网络多媒体领域，尤其涉及一种改进的视频内容过滤方法和系统。

背景技术

网络视频是一种比较特殊的媒体形式，无结构、规格也不统一，很难给视频内容进行有效表示的和特征规格化。同时随着词汇量增加到一定程度，文档进行有效表示的向量长度会快速增长，并且向量值为零的部分也会增多，使得向量变得进一步稀疏。

因此，急需一种针对性的改进的视频内容过滤方法和系统。

发明内容

本发明的目的在于提供一种改进的视频内容过滤方法和系统，通过将接收的视频数据流经过两重视频采样，得到携带有边界和区域局部特征的高维图像，将其的帧定义为关键帧，通过关键帧映射回原视频数据流，提取出修剪后的数据流，对它进行物体识别和语义分析，判断是否合规，可以更快地检测判断。

第一方面，本申请提供一种改进的视频内容过滤方法，所述方法包括：

服务器接收视频数据流，将接收后的所述视频数据流进行视频采样，所述视频采样使用基础过滤单元来提取第一图像特征，将所述第一图像特征进行向量化，根据向量化后的特征值大小判断出若干个关键点，对所述若干个关键点进行聚类运算，映射到相应的视觉词典进行量化，所述量化的方程是随机从大类方程中选取；

将所述量化的结果输入到N层卷积单元，根据所述N层卷积单元的输出结果，得到第一中间结果；

所述第一中间结果的每一个点生成一个锚点，锚点的值是由每个点的特征与四周相邻点的特征加权平均计算得到的；若干个锚点组成一个滑动窗，组成该滑动窗所需的锚点数目由最中间锚点所属的点的特征大小决定；

使用所述滑动窗再次对视频流量进行视频采样，提到第二图像特征，将所述第二图像特征进行向量化，输入到N层卷积单元，根据所述N层卷积单元的输出结果，得到第二中间结果；

对所述第二中间结果进行平滑处理，得到携带有边界和区域局部特征的高维图像，将所述高维图像的帧定义为关键帧；

将所述关键帧映射到所述服务器接收的视频数据流，得到修剪后的视频数据流，其中当前后两个关键帧之间的帧图像数量少于预设阈值时，则将该该前后两个关键帧进行合并，当前后两个关键帧之间的帧图像数量大于预设阈值时，则通过随机采样的方式进行帧数量选取，有效保证视频重要内容的完整性；

分析所述修剪后的视频数据流，识别出包含的物体和运动方式，检测出该物体和运动方式是否合规，以及按照语义逐项判断是否包括指定关键词、语句含义和语境特征，如果不合规则将该微小视频数据流过滤除去。

结合第一方面，在第一方面第一种可能的实现方式中，所述N层卷积单元是由N个依次连接的卷积运算模块组成，N的值反映服务器负载处理的能力。

结合第一方面，在第一方面第二种可能的实现方式中，所述语句含义是指弹幕语句所指代的意思，所述语境特征是指弹幕语句所处的场景，该场景是根据语义分析模拟推测的。

结合第一方面，在第一方面第三种可能的实现方式中，所述识别图像中的物体和运动方式的过程中采用了神经网络模型。

第二方面，本申请提供一种改进的视频内容过滤系统，所述系统包括处理器以及存储器：

所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器用于根据所述程序代码中的指令执行第一方面四种可能中任一项所述的方法。

第三方面，本申请提供一种计算机可读存储介质，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行第一方面四种可能中任一项所述的方法。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明方法的流程图。

具体实施方式

下面结合附图对本发明的优选实施例进行详细阐述，以使本发明的优点和特征能更易于被本领域技术人员理解，从而对本发明的保护范围做出更为清楚明确的界定。

图1为本申请提供的改进的视频内容过滤方法的流程图，包括：

方法还包括将视频数据流传递到情感分类模型；

所述情感分类模型按照语义逐项分析，判断所述视频数据流是否包括指定关键词、语句含义、以及提取语境特征，根据所述语境特征和所述语句含义，判断弹幕的情感类型；

根据所述情感分类模型确定的情感类型，判断所述视频数据流携带的指定关键词是否符合该情感类型限定的合理范围，如果是则认定该视频数据流合规，允许播放，反之则认定该视频数据流不合规，将该视频数据流过滤除去。

在一些优选实施例中，所述N层卷积单元是由N个依次连接的卷积运算模块组成，N的值反映服务器负载处理的能力。

在一些优选实施例中，所述语句含义是指弹幕语句所指代的意思，所述语境特征是指弹幕语句所处的场景，该场景是根据语义分析模拟推测的。

在一些优选实施例中，所述识别图像中的物体和运动方式的过程中采用了神经网络模型。

本申请提供一种改进的视频内容过滤系统，所述系统包括：所述系统包括处理器以及存储器：

所述处理器用于根据所述程序代码中的指令执行第一方面所有实施例中任一项所述的方法。

本申请提供一种计算机可读存储介质，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行第一方面所有实施例中任一项所述的方法。

具体实现中，本发明还提供一种计算机存储介质，其中，该计算机存储介质可以存储有程序，该程序执行时可包括本发明各个实施例中的部分或全部步骤。所述的存储介质可以为磁碟、光盘、只读存储记忆体(简称：ROM)或随机存储记忆体(简称：RAM)等。

本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明实施例中的技术方案本质上或者对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

本说明书各个实施例之间相同相似的部分互相参见即可。尤其，对于实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例中的说明即可。

以上所述的本发明实施方式并不构成对本发明保护范围的限定。

Claims

1.一种改进的视频内容过滤方法，其特征在于，所述方法包括：

服务器接收视频数据流，将接收后的所述视频数据流进行视频采样，所述视频采样使用基础过滤单元来提取第一图像特征，将所述第一图像特征进行向量化，根据向量化后的特征值大小判断出若干个关键点，对所述若干个关键点进行聚类运算，映射到相应的视觉词典进行量化，所述量化的方程是随机选取的；

使用所述滑动窗再次对视频数据流进行视频采样，提取第二图像特征，将所述第二图像特征进行向量化，输入到N层卷积单元，根据所述N层卷积单元的输出结果，得到第二中间结果；

将所述关键帧映射到所述服务器接收的视频数据流，得到修剪后的视频数据流，其中当前后两个关键帧之间的帧图像数量少于预设阈值时，则将该前后两个关键帧进行合并，当前后两个关键帧之间的帧图像数量大于预设阈值时，则对前后两个关键帧之间的帧的数量通过随机采样的方式进行选取，有效保证视频重要内容的完整性；

分析所述修剪后的视频数据流，识别出包含的物体和该物体的运动方式，检测出该物体和该物体的运动方式是否合规，以及按照语义逐项判断是否包括指定关键词、语句含义和语境特征，如果不合规则将该视频数据流过滤除去。

2.根据权利要求1所述的方法，其特征在于：所述N层卷积单元是由N个依次连接的卷积运算模块组成，N的值反映服务器负载处理的能力。

3.根据权利要求1-2任一项所述的方法，其特征在于：所述语句含义是指弹幕语句所指代的意思，所述语境特征是指弹幕语句所处的场景，该场景是根据语义分析模拟推测的。

4.根据权利要求3所述的方法，其特征在于：所述识别出包含的物体和该物体的运动方式的过程中采用了神经网络模型。

5.一种改进的视频内容过滤系统，其特征在于，所述系统包括处理器以及存储器：

所述处理器用于根据所述程序代码中的指令执行实现权利要求1-4任一项所述的方法。

6.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行实现权利要求1-4任一项所述的方法。