CN115527138A

CN115527138A - 基于关键帧的视觉语义检测方法和系统

Info

Publication number: CN115527138A
Application number: CN202111609817.5A
Authority: CN
Inventors: 苏长君; 曾祥禄
Original assignee: Beijing Zhimei Internet Technology Co ltd
Current assignee: Beijing Zhimei Internet Technology Co ltd
Priority date: 2021-12-27
Filing date: 2021-12-27
Publication date: 2022-12-27

Abstract

本发明提供一种基于关键帧的视觉语义检测方法和系统，通过计算帧图像的直方图在梯度方向的特征值，得到特征值跳跃点，进行视频采样、向量化和卷积运算得到关键帧，在该关键帧处进行维度转换和划分平面，将同一平面的帧图像进行图形分析，判断帧图像以及数据流是否合规。

Description

基于关键帧的视觉语义检测方法和系统

技术领域

本申请涉及网络多媒体领域，尤其涉及一种基于关键帧的视觉语义检测方法和系统。

背景技术

现有网络中存在很多视频，其不包含或包含少量语义信息，根据现有的语义检测方法很难准确识别和解析。然而这些视频都会有若干个关键帧，关键帧为视频中最能代表其内容的视频帧。如果利用好关键帧进行视频检测，成为本领域技术人员研究的重点方向。

因此，急需一种针对性的基于关键帧的视觉语义检测方法和系统。

发明内容

本发明的目的在于提供一种基于关键帧的视觉语义检测方法和系统，通过计算帧图像的直方图在梯度方向的特征值，得到特征值跳跃点，进行视频采样、向量化和卷积运算得到关键帧，在该关键帧处进行维度转换和划分平面，将同一平面的帧图像进行图形分析，判断帧图像以及数据流是否合规。

第一方面，本申请提供一种基于关键帧的视觉语义检测方法，所述方法包括：

获取视频数据流，计算每一帧图像的直方图在梯度方向的特征值，当所述帧与帧之间的所述特征值之差大于预设的阈值时，对所述视频数据流进行视频采样，所述视频采样使用基础过滤单元来提取第一图像特征，将所述第一图像特征进行向量化，根据向量化后的特征值大小判断出若干个关键点，对所述若干个关键点进行聚类运算，映射到相应的视觉词典进行量化；

将所述量化的结果输入到N层卷积单元，根据所述N层卷积单元的输出结果，得到第一中间结果，对所述第一中间结果进行平滑处理，得到携带有边界和区域局部特征的高维图像，将所述高维图像的帧定义为关键帧；

将所述关键帧的图像向量化后进行维度转换，输入高维度样本集合，调用分类器对该高维度样本集合进行分类，集合的两两特征值在预设差值范围内的划为一组，计算组的平均特征值，将所述组与组之间的平均特征值差值大于阈值的不同组划为不同的平面；

将同一平面的帧图像输入图形分析模型，识别该帧图像中包含的物体信息，获取关键物体特征，判断该帧图像是否包括不合规的图形内容；

如果帧图像包括的图形内容不合规，则删除该段视频数据流。

结合第一方面，在第一方面第一种可能的实现方式中，所述直方图在梯度方向的特征值包括检测图像的灰度质心位置的变化。

结合第一方面，在第一方面第二种可能的实现方式中，所述调用分类器对该高维度样本集合进行分类，包括输入向量与高维度样本集合间的内积运算。

结合第一方面，在第一方面第三种可能的实现方式中，所述语义分析模型和图形分析模型的内核均使用神经网络模型。

第二方面，本申请提供一种基于关键帧的视觉语义检测系统，所述系统包括处理器以及存储器：

所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器用于根据所述程序代码中的指令执行第一方面四种可能中任一项所述的方法。

第三方面，本申请提供一种计算机可读存储介质，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行第一方面四种可能中任一项所述的方法。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明方法的流程图。

具体实施方式

下面结合附图对本发明的优选实施例进行详细阐述，以使本发明的优点和特征能更易于被本领域技术人员理解，从而对本发明的保护范围做出更为清楚明确的界定。

图1为本申请提供的基于关键帧的视觉语义检测方法的流程图，包括：

在一些优选实施例中，所述直方图在梯度方向的特征值包括检测图像的灰度质心位置的变化。

在一些优选实施例中，所述调用分类器对该高维度样本集合进行分类，包括输入向量与高维度样本集合间的内积运算。

在一些优选实施例中，所述语义分析模型和图形分析模型的内核均使用神经网络模型。

本申请提供一种基于关键帧的视觉语义检测系统，所述系统包括：所述系统包括处理器以及存储器：

所述处理器用于根据所述程序代码中的指令执行第一方面所有实施例中任一项所述的方法。

本申请提供一种计算机可读存储介质，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行第一方面所有实施例中任一项所述的方法。

具体实现中，本发明还提供一种计算机存储介质，其中，该计算机存储介质可以存储有程序，该程序执行时可包括本发明各个实施例中的部分或全部步骤。所述的存储介质可以为磁碟、光盘、只读存储记忆体(简称：ROM)或随机存储记忆体(简称：RAM)等。

本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明实施例中的技术方案本质上或者对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

本说明书各个实施例之间相同相似的部分互相参见即可。尤其，对于实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例中的说明即可。

以上所述的本发明实施方式并不构成对本发明保护范围的限定。

Claims

1.一种基于关键帧的视觉语义检测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于：所述直方图在梯度方向的特征值包括检测图像的灰度质心位置的变化。

3.根据权利要求1-2任一项所述的方法，其特征在于：所述调用分类器对该高维度样本集合进行分类，包括输入向量与高维度样本集合间的内积运算。

4.根据权利要求1-3任一项所述的方法，其特征在于：所述语义分析模型和图形分析模型的内核均使用神经网络模型。

5.一种基于关键帧的视觉语义检测系统，其特征在于，所述系统包括处理器以及存储器：

所述处理器用于根据所述程序代码中的指令执行实现权利要求1-4任一项所述的方法。

6.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行实现权利要求1-4任一项所述的方法。