CN115527138A - 基于关键帧的视觉语义检测方法和系统 - Google Patents

基于关键帧的视觉语义检测方法和系统 Download PDF

Info

Publication number
CN115527138A
CN115527138A CN202111609817.5A CN202111609817A CN115527138A CN 115527138 A CN115527138 A CN 115527138A CN 202111609817 A CN202111609817 A CN 202111609817A CN 115527138 A CN115527138 A CN 115527138A
Authority
CN
China
Prior art keywords
frame
key
image
sample set
data stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111609817.5A
Other languages
English (en)
Inventor
苏长君
曾祥禄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhimei Internet Technology Co ltd
Original Assignee
Beijing Zhimei Internet Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhimei Internet Technology Co ltd filed Critical Beijing Zhimei Internet Technology Co ltd
Priority to CN202111609817.5A priority Critical patent/CN115527138A/zh
Publication of CN115527138A publication Critical patent/CN115527138A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于关键帧的视觉语义检测方法和系统,通过计算帧图像的直方图在梯度方向的特征值,得到特征值跳跃点,进行视频采样、向量化和卷积运算得到关键帧,在该关键帧处进行维度转换和划分平面,将同一平面的帧图像进行图形分析,判断帧图像以及数据流是否合规。

Description

基于关键帧的视觉语义检测方法和系统
技术领域
本申请涉及网络多媒体领域,尤其涉及一种基于关键帧的视觉语义检测方法和系统。
背景技术
现有网络中存在很多视频,其不包含或包含少量语义信息,根据现有的语义检测方法很难准确识别和解析。然而这些视频都会有若干个关键帧,关键帧为视频中最能代表其内容的视频帧。如果利用好关键帧进行视频检测,成为本领域技术人员研究的重点方向。
因此,急需一种针对性的基于关键帧的视觉语义检测方法和系统。
发明内容
本发明的目的在于提供一种基于关键帧的视觉语义检测方法和系统,通过计算帧图像的直方图在梯度方向的特征值,得到特征值跳跃点,进行视频采样、向量化和卷积运算得到关键帧,在该关键帧处进行维度转换和划分平面,将同一平面的帧图像进行图形分析,判断帧图像以及数据流是否合规。
第一方面,本申请提供一种基于关键帧的视觉语义检测方法,所述方法包括:
获取视频数据流,计算每一帧图像的直方图在梯度方向的特征值,当所述帧与帧之间的所述特征值之差大于预设的阈值时,对所述视频数据流进行视频采样,所述视频采样使用基础过滤单元来提取第一图像特征,将所述第一图像特征进行向量化,根据向量化后的特征值大小判断出若干个关键点,对所述若干个关键点进行聚类运算,映射到相应的视觉词典进行量化;
将所述量化的结果输入到N层卷积单元,根据所述N层卷积单元的输出结果,得到第一中间结果,对所述第一中间结果进行平滑处理,得到携带有边界和区域局部特征的高维图像,将所述高维图像的帧定义为关键帧;
将所述关键帧的图像向量化后进行维度转换,输入高维度样本集合,调用分类器对该高维度样本集合进行分类,集合的两两特征值在预设差值范围内的划为一组,计算组的平均特征值,将所述组与组之间的平均特征值差值大于阈值的不同组划为不同的平面;
将同一平面的帧图像输入图形分析模型,识别该帧图像中包含的物体信息,获取关键物体特征,判断该帧图像是否包括不合规的图形内容;
如果帧图像包括的图形内容不合规,则删除该段视频数据流。
结合第一方面,在第一方面第一种可能的实现方式中,所述直方图在梯度方向的特征值包括检测图像的灰度质心位置的变化。
结合第一方面,在第一方面第二种可能的实现方式中,所述调用分类器对该高维度样本集合进行分类,包括输入向量与高维度样本集合间的内积运算。
结合第一方面,在第一方面第三种可能的实现方式中,所述语义分析模型和图形分析模型的内核均使用神经网络模型。
第二方面,本申请提供一种基于关键帧的视觉语义检测系统,所述系统包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面四种可能中任一项所述的方法。
第三方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面四种可能中任一项所述的方法。
本发明提供一种基于关键帧的视觉语义检测方法和系统,通过计算帧图像的直方图在梯度方向的特征值,得到特征值跳跃点,进行视频采样、向量化和卷积运算得到关键帧,在该关键帧处进行维度转换和划分平面,将同一平面的帧图像进行图形分析,判断帧图像以及数据流是否合规。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法的流程图。
具体实施方式
下面结合附图对本发明的优选实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
图1为本申请提供的基于关键帧的视觉语义检测方法的流程图,包括:
获取视频数据流,计算每一帧图像的直方图在梯度方向的特征值,当所述帧与帧之间的所述特征值之差大于预设的阈值时,对所述视频数据流进行视频采样,所述视频采样使用基础过滤单元来提取第一图像特征,将所述第一图像特征进行向量化,根据向量化后的特征值大小判断出若干个关键点,对所述若干个关键点进行聚类运算,映射到相应的视觉词典进行量化;
将所述量化的结果输入到N层卷积单元,根据所述N层卷积单元的输出结果,得到第一中间结果,对所述第一中间结果进行平滑处理,得到携带有边界和区域局部特征的高维图像,将所述高维图像的帧定义为关键帧;
将所述关键帧的图像向量化后进行维度转换,输入高维度样本集合,调用分类器对该高维度样本集合进行分类,集合的两两特征值在预设差值范围内的划为一组,计算组的平均特征值,将所述组与组之间的平均特征值差值大于阈值的不同组划为不同的平面;
将同一平面的帧图像输入图形分析模型,识别该帧图像中包含的物体信息,获取关键物体特征,判断该帧图像是否包括不合规的图形内容;
如果帧图像包括的图形内容不合规,则删除该段视频数据流。
在一些优选实施例中,所述直方图在梯度方向的特征值包括检测图像的灰度质心位置的变化。
在一些优选实施例中,所述调用分类器对该高维度样本集合进行分类,包括输入向量与高维度样本集合间的内积运算。
在一些优选实施例中,所述语义分析模型和图形分析模型的内核均使用神经网络模型。
本申请提供一种基于关键帧的视觉语义检测系统,所述系统包括:所述系统包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面所有实施例中任一项所述的方法。
本申请提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面所有实施例中任一项所述的方法。
具体实现中,本发明还提供一种计算机存储介质,其中,该计算机存储介质可以存储有程序,该程序执行时可包括本发明各个实施例中的部分或全部步骤。所述的存储介质可以为磁碟、光盘、只读存储记忆体(简称:ROM)或随机存储记忆体(简称:RAM)等。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书各个实施例之间相同相似的部分互相参见即可。尤其,对于实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
以上所述的本发明实施方式并不构成对本发明保护范围的限定。

Claims (6)

1.一种基于关键帧的视觉语义检测方法,其特征在于,所述方法包括:
获取视频数据流,计算每一帧图像的直方图在梯度方向的特征值,当所述帧与帧之间的所述特征值之差大于预设的阈值时,对所述视频数据流进行视频采样,所述视频采样使用基础过滤单元来提取第一图像特征,将所述第一图像特征进行向量化,根据向量化后的特征值大小判断出若干个关键点,对所述若干个关键点进行聚类运算,映射到相应的视觉词典进行量化;
将所述量化的结果输入到N层卷积单元,根据所述N层卷积单元的输出结果,得到第一中间结果,对所述第一中间结果进行平滑处理,得到携带有边界和区域局部特征的高维图像,将所述高维图像的帧定义为关键帧;
将所述关键帧的图像向量化后进行维度转换,输入高维度样本集合,调用分类器对该高维度样本集合进行分类,集合的两两特征值在预设差值范围内的划为一组,计算组的平均特征值,将所述组与组之间的平均特征值差值大于阈值的不同组划为不同的平面;
将同一平面的帧图像输入图形分析模型,识别该帧图像中包含的物体信息,获取关键物体特征,判断该帧图像是否包括不合规的图形内容;
如果帧图像包括的图形内容不合规,则删除该段视频数据流。
2.根据权利要求1所述的方法,其特征在于:所述直方图在梯度方向的特征值包括检测图像的灰度质心位置的变化。
3.根据权利要求1-2任一项所述的方法,其特征在于:所述调用分类器对该高维度样本集合进行分类,包括输入向量与高维度样本集合间的内积运算。
4.根据权利要求1-3任一项所述的方法,其特征在于:所述语义分析模型和图形分析模型的内核均使用神经网络模型。
5.一种基于关键帧的视觉语义检测系统,其特征在于,所述系统包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行实现权利要求1-4任一项所述的方法。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行实现权利要求1-4任一项所述的方法。
CN202111609817.5A 2021-12-27 2021-12-27 基于关键帧的视觉语义检测方法和系统 Pending CN115527138A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111609817.5A CN115527138A (zh) 2021-12-27 2021-12-27 基于关键帧的视觉语义检测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111609817.5A CN115527138A (zh) 2021-12-27 2021-12-27 基于关键帧的视觉语义检测方法和系统

Publications (1)

Publication Number Publication Date
CN115527138A true CN115527138A (zh) 2022-12-27

Family

ID=84694029

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111609817.5A Pending CN115527138A (zh) 2021-12-27 2021-12-27 基于关键帧的视觉语义检测方法和系统

Country Status (1)

Country Link
CN (1) CN115527138A (zh)

Similar Documents

Publication Publication Date Title
US11416710B2 (en) Feature representation device, feature representation method, and program
CN110807314A (zh) 文本情感分析模型训练方法、装置、设备及可读存储介质
CN109685065B (zh) 试卷内容自动分类的版面分析方法、系统
CN113869449A (zh) 一种模型训练、图像处理方法、装置、设备及存储介质
CN112800919A (zh) 一种检测目标类型视频方法、装置、设备以及存储介质
CN111368632A (zh) 一种签名识别方法及设备
CN114639101A (zh) 一种乳状液液滴识别系统、方法、计算机设备及存储介质
CN114581928A (zh) 一种表格识别方法及系统
CN112241470A (zh) 一种视频分类方法及系统
CN117078970A (zh) 一种图片识别方法、装置、电子设备及存储介质
CN111340139A (zh) 一种图像内容复杂度的判别方法及装置
CN117076455A (zh) 一种基于智能识别的保单结构化存储方法、介质及系统
CN109657710B (zh) 数据筛选方法、装置、服务器及存储介质
CN115527138A (zh) 基于关键帧的视觉语义检测方法和系统
CN115546554A (zh) 敏感图像的识别方法、装置、设备和计算机可读存储介质
CN113158745B (zh) 一种基于多特征算子的乱码文档图片识别方法及系统
CN112633394B (zh) 一种智能用户标签确定方法、终端设备及存储介质
CN114494678A (zh) 文字识别方法和电子设备
CN114399497A (zh) 文本图像质量检测方法、装置、计算机设备及存储介质
CN115550684B (zh) 一种改进的视频内容过滤方法和系统
CN111708884A (zh) 文本分类方法、装置及电子设备
CN114241367A (zh) 视觉语义检测方法和系统
CN111625672B (zh) 图像处理方法、装置、计算机设备及存储介质
CN113139382A (zh) 命名实体识别方法及装置
Jyothirmayi et al. Identification of brain tumors using deep learning techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 607a, 6 / F, No. 31, Fuchengmenwai street, Xicheng District, Beijing 100037

Applicant after: Beijing Guorui Digital Intelligence Technology Co.,Ltd.

Address before: 607a, 6 / F, No. 31, Fuchengmenwai street, Xicheng District, Beijing 100037

Applicant before: Beijing Zhimei Internet Technology Co.,Ltd.