CN112149751A - 一种基于3d-cnn与cvv-glcm的融媒体信息获取方法 - Google Patents

一种基于3d-cnn与cvv-glcm的融媒体信息获取方法 Download PDF

Info

Publication number
CN112149751A
CN112149751A CN202011054195.XA CN202011054195A CN112149751A CN 112149751 A CN112149751 A CN 112149751A CN 202011054195 A CN202011054195 A CN 202011054195A CN 112149751 A CN112149751 A CN 112149751A
Authority
CN
China
Prior art keywords
determining
glcm
value
image
frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011054195.XA
Other languages
English (en)
Inventor
胡燕祝
王松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN202011054195.XA priority Critical patent/CN112149751A/zh
Publication of CN112149751A publication Critical patent/CN112149751A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/34Smoothing or thinning of the pattern; Morphological operations; Skeletonisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/457Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by analysing connectivity, e.g. edge linking, connected component analysis or slices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及基于3D‑CNN与CVV‑GLCM的融媒体信息获取方法,是一种对安全生产中危化品事故的融媒体信息获取方法,属于智能安全领域,其特征在于采用如下步骤:(1)确定像素值处的特征单位值;(2)确定帧间的Hamming距离;(3)确定视频帧的CCV特征;(4)确定归一化矩阵;(5)确定图像的对比度和相关性;(6)确定图像的能量和同质性度量矩阵;(7)确定GLCM纹理特征帧间的相似度;(8)确定关键帧。本发明克服了传统普通检测关键帧冗余的问题,解决了传统的融媒体信息获取过程中关键信息检索速度以及检测精度等无法达到很好效果的问题,提升关键信息获取的效率和准确度。为融媒体信息获取领域提供了一种拥有较高准确率的方法。

Description

一种基于3D-CNN与CVV-GLCM的融媒体信息获取方法
技术领域
本发明涉及智能安全领域,主要是一种对安全生产中危化品事故的融媒体信息获取方法。
背景技术
随着融媒体信息的不断发展,如何从相关视频信息中获取关键数据信息正逐渐被重视,传统的视频信息的获取方法,主要是对视频图像进行逐帧的数据的采集,并利用人工或机器进行逐帧比对,这个方式对于小数据量的处理有着一定的处理能力,但是由于一般视频数据时长较长,所以产生的视频帧通常存在大量冗余,所以此时通过人工或机器进行数据的处理关键信息的提取,需要消耗大量的工作时间,不能达到及时高效的工作目的,并且传统的图像特征如颜色直方图以及尺度不变特征变换等对视频拷贝检测中检索速度以及检测精度等问题无法达到很好的效果。所以需要一种高效准确的方法来进行视频关键信息的获取。
对与融媒体视频的获取,对相关视频信息的处理,我们可以通过颜色特征、纹理特征以及深度特征相结合的方式,通过多维度从不同角度对视频信息进行处理,将多特征数据进行融合,达到高效准确的目的。在此基础上我们提出了一种基于3D-CNN与CVV-GLCM的融媒体信息获取方法,通过对视频中的颜色特征图块进行提取计算图像块的颜色聚合向量特征,将特征与模板进行比对,判断相似性。提取视频信息的纹理特征以及深度特征,最后融合颜色特征、纹理特征和深度特征提取关键帧,以达到高效准确得提取关键信息的目的,从而提高检测精度,达到较好的视频检索准确度。
发明内容
针对上述现有技术中存在的问题,本发明要解决的技术问题是提供一种基于3D-CNN与CVV-GLCM的融媒体信息获取方法,其具体流程如图1所示。
技术方案实施步骤如下:
步骤一:确定像素值处的特征单位值
Figure BDA0002710429120000011
Figure BDA0002710429120000012
式中,bij表示特征图的偏置值,
Figure BDA0002710429120000013
表示连接第n个特征图的核第(p,q,r)的值,Pi和Qi表示核的高和宽,Ri表示卷积核在时间维度的大小,p,q,r分别代表高、宽、维度的计数值,i,j表示像素的灰度,(x,y)表示像素值,z表示像素点上的维度值;
步骤二:确定帧间的Hamming距离D:
使用哈希算法处理图像的深度特征,建立卷积神经网络函数,构造Hash码,通过Hash码计算视频帧的Hamming距离D:
Figure BDA0002710429120000021
式中,α、β分别指两帧的Hash码,αi、βi分别指两帧的Hash码第i个码,I()表示相似度矩阵,通过Hamming距离表达视频帧的相似度,Hamming距离越小,视频帧的相似度Sdf越高;
步骤三:确定视频帧的CCV特征:
将图像进行平滑滤波,采用均匀量化方法把0~255的颜色区间量化为一定个数的颜色区间,即直方图的bin,划分相关性像素的连通区域,每一个连通区域只有一个量化的灰度值,计算颜色聚合向量CCV:
CCV=[(C1,N1)、(C2,N2)、…、(Ci,Ni)、…、(Cn,Nn)];
式中,i指每一个颜色区间的灰度级,对应直方图的每一个bin,Ci指聚合像素的个数,即灰度值为i的所有大的连通区域像素之和,Ni指非聚合像素的个数,即灰度值为i的所有零散的小连通区域像素之和,确定帧间的颜色相似度SCCV
步骤四:确定归一化矩阵N(p,q):
Figure BDA0002710429120000022
式中,p,q=0,…,L,1≤i,j≤L,f(i,j)是具有值zi和zj的像素对的数目,f(p,q)是共生矩阵中的元素,L是最大灰度级数;
步骤五:确定图像的对比度Contrast和相关性Correlation:
Figure BDA0002710429120000031
Figure BDA0002710429120000032
Figure BDA0002710429120000033
Figure BDA0002710429120000034
式中,对比度的数值范围从0到(L-1)2,相关性的值在[-1,1]之间,相关性的大小反映了图像中局部灰度相关性的情况;
步骤六:确定图像的能量Energy和同质性度量矩阵Homogeneity:
Figure BDA0002710429120000035
Figure BDA0002710429120000036
式中,能量值范围在[0,1]之间,灰度一致的图像能量为1,Homogeneity值范围在[0,1]之间;
步骤七:确定GLCM纹理特征帧间的相似度Sglcm
确定对比度、相关性、能量和同质性的均值和标准差作为最终的纹理特征,
Figure BDA0002710429120000037
式中,glcmi,glcmj分别是帧i,j的GLCM纹理特征;
步骤八:加权融合,确定关键帧S:
S=w1·Sdf+w2·SCCV+w3·Sglcm
式中,w1、w2、w3分别为深度特征、颜色特征和纹理特征的权重因子。
本发明比现有技术的优点:
(1)本发明运用多特征融合的方法,将融媒体视频信息的多种特征相融合结合卷积神经网络,大大提升了对关键信息提取的处理能力,相对以往关键帧提取方法有更好的表现力。
(2)本发明采用颜色特征识别与纹理特征相结合的方法,对视频数据进行处理,克服了传统普通检测关键帧冗余的问题,精确了特定关键帧,提升了系统处理效率。
(3)本发明解决了传统的融媒体信息获取过程中关键信息检索速度以及检测精度等无法达到很好效果的问题,提升关键信息获取的效率和准确度。
附图说明
为了更好地理解本发明,下面结合附图作进一步的说明。
图1是建立基于3D-CNN与CVV-GLCM的融媒体信息获取方法的步骤流程图;
图2是建立基于3D-CNN与CVV-GLCM的融媒体信息获取方法的算法流程图;
图3是3D-CNN神经网络的主要模块示意图;
图4是利用本发明对四组融媒体信息获取的结果;
具体实施方案
下面通过实施案例对本发明作进一步详细说明。
本实施案例选用的数据集来自安全生产中危化品事故视频,该数据集一共有1000个视频片段。其中,3D-CNN的训练中,采用随机抽样的方法从数据集中抽取训练样本850组,剩下的150组样本作为测试集,进行实验。从1000个样本集中,进行颜色聚合向量和灰度共生矩阵的特征获取。
本发明所提供的3D-CNN与CVV-GLCM的融媒体信息获取方法的整体流程如图1所示,具体步骤如下:
(1)确定像素值处的特征单位值
Figure BDA0002710429120000041
Figure BDA0002710429120000042
式中,bij表示特征图的偏置值,
Figure BDA0002710429120000043
表示连接第n个特征图的核第(p,q,r)的值,Pi和Qi表示核的高和宽,Ri表示卷积核在时间维度的大小,(x,y)表示像素值。
(2)确定帧间的Hamming距离D:
使用哈希算法处理图像的深度特征,建立卷积神经网络函数,构造Hash码,通过Hash码计算视频帧的Hamming距离D:
Figure BDA0002710429120000051
式中,α、β指两帧的Hash码。通过Hamming距离表达视频帧的相似度,Hamming距离越小,视频帧的相似度Sdf越高。
(3)确定视频帧的CCV特征:
将图像进行平滑滤波,采用均匀量化方法把0~255的颜色区间量化为32个颜色区间,即直方图的32个bin,划分相关性像素的连通区域,每一个连通区域只有一个量化的灰度值,计算颜色聚合向量CCV:
CCV=[(C1,N1)、(C2,N2)、…、(Ci,Ni)、…、(Cn,Nn)]
式中,i指每一个颜色区间的灰度级,对应直方图的每一个bin,Ci指聚合像素的个数,即灰度值为i的所有大的连通区域像素之和,Ni指非聚合像素的个数,即灰度值为i的所有零散的小连通区域像素之和,确定帧间的颜色相似度SCCV
(4)确定归一化矩阵N(p,q):
Figure BDA0002710429120000052
式中,p,q=0,…,L,1≤i,j≤L,f(i,j)是具有值zi和zj的像素对的数目,f(p,q)是共生矩阵中的元素,L是最大灰度级数。
(5)确定图像的对比度Contrast和相关性Correlation:
Figure BDA0002710429120000053
Figure BDA0002710429120000054
Figure BDA0002710429120000061
Figure BDA0002710429120000062
式中,对比度的数值范围从0到(L-1)2,相关性的值在[-1,1]之间,i,j表示像素的灰度,相关性的大小反映了图像中局部灰度相关性的情况。
(6)确定图像的能量Energy和同质性度量矩阵Homogeneity:
Figure BDA0002710429120000063
Figure BDA0002710429120000064
式中,能量值范围在[0,1]之间,灰度一致的图像能量为1,Homogeneity值范围在[0,1]之间。
(7)确定GLCM纹理特征帧间的相似度Sglcm
确定对比度、相关性、能量和同质性的均值和标准差作为最终的纹理特征。
Figure BDA0002710429120000065
式中,glcmi,glcmj分别是帧i,j的GLCM纹理特征。
(8)进行加权融合,确定关键帧S:
S=w1·Sdf+w2·SCCV+w3·Sglcm
式中,w1、w2、w3分别为深度特征、颜色特征和纹理特征的权重因子。其中,经过实验,得到w1为0.5,w2为0.25,w3为0.25,得到的融媒体关键帧能够达到很高的准确度。
为了验证本发明对融媒体信息获取的准确性,对本发明进行了四组信息获取实验,实验结果如图4所示。由图4可知,本发明所建立的基于3D-CNN与CVV-GLCM的融媒体信息获取方法准确率均保持在90%以上,能够达到较高的准确率,获取信息效果良好。这表明本发明建立的3D-CNN与CVV-GLCM的融媒体信息获取方法是有效的,为建立精确的安全生产中危化品事故融媒体信息获取模型提供了更好的方法,具有一定的实用性。

Claims (1)

1.一种基于3D-CNN与CVV-GLCM的融媒体信息获取方法,本发明特征在于:(1)确定像素值处的特征单位值;(2)确定帧间的Hamming距离;(3)确定视频帧的CCV特征;(4)确定归一化矩阵;(5)确定图像的对比度和相关性;(6)确定图像的能量和同质性度量矩阵;(7)确定GLCM纹理特征帧间的相似度;(8)确定关键帧,具体包括以下八个步骤:
步骤一:确定像素值处的特征单位值
Figure FDA0002710429110000011
Figure FDA0002710429110000012
式中,bij表示特征图的偏置值,
Figure FDA0002710429110000013
表示连接第n个特征图的核第(p,q,r)的值,Pi和Qi表示核的高和宽,Ri表示卷积核在时间维度的大小,p,q,r分别代表高、宽、维度的计数值,i,j表示像素的灰度,(x,y)表示像素值,z表示像素点上的维度值;
步骤二:确定帧间的Hamming距离D:
使用哈希算法处理图像的深度特征,建立卷积神经网络函数,构造Hash码,通过Hash码计算视频帧的Hamming距离D:
Figure FDA0002710429110000014
式中,α、β分别指两帧的Hash码,αi、βi分别指两帧的Hash码第i个码,I()表示相似度矩阵,通过Hamming距离表达视频帧的相似度,Hamming距离越小,视频帧的相似度Sdf越高;
步骤三:确定视频帧的CCV特征:
将图像进行平滑滤波,采用均匀量化方法把0~255的颜色区间量化为一定个数的颜色区间,即直方图的bin,划分相关性像素的连通区域,每一个连通区域只有一个量化的灰度值,计算颜色聚合向量CCV:
CCV=[(C1,N1)、(C2,N2)、…、(Ci,Ni)、…、(Cn,Nn)];
式中,i指每一个颜色区间的灰度级,对应直方图的每一个bin,Ci指聚合像素的个数,即灰度值为i的所有大的连通区域像素之和,Ni指非聚合像素的个数,即灰度值为i的所有零散的小连通区域像素之和,确定帧间的颜色相似度SCCV
步骤四:确定归一化矩阵N(p,q):
Figure FDA0002710429110000021
式中,p,q=0,…,L,1≤i,j≤L,f(i,j)是具有值zi和zj的像素对的数目,f(p,q)是共生矩阵中的元素,L是最大灰度级数;
步骤五:确定图像的对比度Contrast和相关性Correlation:
Figure FDA0002710429110000022
Figure FDA0002710429110000023
Figure FDA0002710429110000024
Figure FDA0002710429110000025
式中,对比度的数值范围从0到(L-1)2,相关性的值在[-1,1]之间,相关性的大小反映了图像中局部灰度相关性的情况;
步骤六:确定图像的能量Energy和同质性度量矩阵Homogeneity:
Figure FDA0002710429110000026
Figure FDA0002710429110000027
式中,能量值范围在[0,1]之间,灰度一致的图像能量为1,Homogeneity值范围在[0,1]之间;
步骤七:确定GLCM纹理特征帧间的相似度Sglcm
确定对比度、相关性、能量和同质性的均值和标准差作为最终的纹理特征,
Figure FDA0002710429110000028
式中,glcmi,glcmj分别是帧i,j的GLCM纹理特征;
步骤八:加权融合,确定关键帧S:
S=w1·Sdf+w2·SCCV+w3·Sglcm
式中,w1、w2、w3分别为深度特征、颜色特征和纹理特征的权重因子。
CN202011054195.XA 2020-09-29 2020-09-29 一种基于3d-cnn与cvv-glcm的融媒体信息获取方法 Pending CN112149751A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011054195.XA CN112149751A (zh) 2020-09-29 2020-09-29 一种基于3d-cnn与cvv-glcm的融媒体信息获取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011054195.XA CN112149751A (zh) 2020-09-29 2020-09-29 一种基于3d-cnn与cvv-glcm的融媒体信息获取方法

Publications (1)

Publication Number Publication Date
CN112149751A true CN112149751A (zh) 2020-12-29

Family

ID=73895960

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011054195.XA Pending CN112149751A (zh) 2020-09-29 2020-09-29 一种基于3d-cnn与cvv-glcm的融媒体信息获取方法

Country Status (1)

Country Link
CN (1) CN112149751A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112800260A (zh) * 2021-04-09 2021-05-14 北京邮电大学 基于深度哈希能量模型的多标签图像检索方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107135401A (zh) * 2017-03-31 2017-09-05 北京奇艺世纪科技有限公司 关键帧选取方法及系统
CN110837802A (zh) * 2019-11-06 2020-02-25 齐鲁工业大学 一种基于灰度共生矩阵的面部图像特征提取方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107135401A (zh) * 2017-03-31 2017-09-05 北京奇艺世纪科技有限公司 关键帧选取方法及系统
CN110837802A (zh) * 2019-11-06 2020-02-25 齐鲁工业大学 一种基于灰度共生矩阵的面部图像特征提取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张晓宇等: "基于融合特征的视频关键帧提取方法", 《计算机系统应用》 *
张泉: "基于底层特征和相关反馈的医学图像检索", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112800260A (zh) * 2021-04-09 2021-05-14 北京邮电大学 基于深度哈希能量模型的多标签图像检索方法和装置
CN112800260B (zh) * 2021-04-09 2021-08-20 北京邮电大学 基于深度哈希能量模型的多标签图像检索方法和装置

Similar Documents

Publication Publication Date Title
CN108491430B (zh) 一种基于对特征方向进行聚类的无监督哈希检索方法
CN110543822A (zh) 一种基于卷积神经网络和监督式离散哈希算法的指静脉识别方法
CN110659665B (zh) 一种异维特征的模型构建方法及图像识别方法、装置
CN107122712B (zh) 基于cnn和双向vlad的掌纹图像识别方法
CN108491797A (zh) 一种基于大数据的车辆图像精确检索方法
CN107092884B (zh) 一种快速粗精级联行人检测方法
CN106780639B (zh) 基于显著性特征稀疏嵌入和极限学习机的哈希编码方法
CN111652273B (zh) 一种基于深度学习的rgb-d图像分类方法
CN109344856B (zh) 一种基于多层判别式特征学习的脱机签名鉴别方法
CN110287847A (zh) 基于Alexnet-CLbpSurf多特征融合的车辆分级检索方法
CN111428764B (zh) 一种用于图像类别识别的图像聚类方法
CN110414431B (zh) 基于弹性上下文关系损失函数的人脸识别方法及系统
CN110991374B (zh) 一种基于rcnn的指纹奇异点检测方法
CN112163114A (zh) 一种基于特征融合的图像检索方法
CN103839074A (zh) 一种基于素描线段信息和空间金字塔匹配的图像分类方法
CN114972753A (zh) 基于上下文信息聚合和辅助学习的轻量级语义分割方法及系统
CN114800041A (zh) 一种刀具状态监测方法及其监测装置
CN112149751A (zh) 一种基于3d-cnn与cvv-glcm的融媒体信息获取方法
CN111027440A (zh) 一种基于神经网络的人群异常行为检测装置和检测方法
CN109446882A (zh) 基于梯度方向划分的特征量化的车标特征提取和识别方法
CN109165542A (zh) 基于精简卷积神经网络的行人检测方法
CN105844299B (zh) 一种基于词袋模型的图像分类方法
CN111292346A (zh) 一种噪声环境下浇铸箱体轮廓的检测方法
CN113392695B (zh) 一种公路货车及其轮轴识别方法
CN113034543B (zh) 一种基于局部注意力机制的3D-ReID多目标追踪方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20201229

WD01 Invention patent application deemed withdrawn after publication