CN109492129B - 一种基于双流神经网络的相似视频搜索方法和系统 - Google Patents

一种基于双流神经网络的相似视频搜索方法和系统 Download PDF

Info

Publication number
CN109492129B
CN109492129B CN201811256363.6A CN201811256363A CN109492129B CN 109492129 B CN109492129 B CN 109492129B CN 201811256363 A CN201811256363 A CN 201811256363A CN 109492129 B CN109492129 B CN 109492129B
Authority
CN
China
Prior art keywords
video
frame
double
key
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811256363.6A
Other languages
English (en)
Other versions
CN109492129A (zh
Inventor
夏又新
高瑞
施辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Technology WUT
Original Assignee
Wuhan University of Technology WUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Technology WUT filed Critical Wuhan University of Technology WUT
Priority to CN201811256363.6A priority Critical patent/CN109492129B/zh
Publication of CN109492129A publication Critical patent/CN109492129A/zh
Application granted granted Critical
Publication of CN109492129B publication Critical patent/CN109492129B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提出一种基于双流神经网络的相似视频搜索方法和系统。本发明中,视频帧提取采用关键帧提取技术,大大节省了存储空间,同时也使神经网络训练更加稳定,加快的神经网络训练的收敛速度;由于采用双流卷积神经网络提取视频特征,使得提取到的视频特征同时保留了视频中的空间信息和时间信息,更具有健壮性。本发明利用汉明距离来度量视频的相似性,汉明空间里的距离运算其实是一种位运算,所以即使是很复杂的检索算法,它的计算成本也远低于原始空间的运算,所以本检索算法是一种高效的检索方式。

Description

一种基于双流神经网络的相似视频搜索方法和系统
技术领域
本发明涉及一种相似视频的搜索算法,具体地指一种基于双流神经网络算法的特征提取与视频哈希搜索算法。
背景技术
伴随短视频的火热,用户规模、视频观看时长也在日益增长。在大型城市,每秒钟所产生的数据量要高达4T以上。其中大量的近似重复视频涌现在互联网中,并呈现爆炸式的增长趋势。而面对海量的视频,如何通过搜索算法在视频库中进行查找,找出与样例视频相似或者重复的视频,对如版权保护、视频监控、视频推荐具有非常重大的意义。
目前,视频搜索领域主要使用局部敏感哈希的算法,核心思想是在原始的数据空间里相似的数据,在哈希映射之后的哈希码也具有相似性,这些哈希方法是与数据无关的。局部敏感哈希也存在几个明显的缺点。首先,为了达到更高的检索要求,往往需要更长的哈希码,这无疑会牺牲查全率,而为了解决这个问题所采用的多哈希的算法又会增加存储成本和检索时间成本。其次,局部敏感只适用于某些特定的指标,如p系数,jaccard系数等,当检索要求表达方式变得复杂比如语义等,而不是简单的距离或者相似度,这种度量方式就不再满足近似最近邻检索的要求。
发明内容
针对这种情况,本发明提出了一种基于双流神经网络的相似视频搜索方法,本发明方法具有搜索精度高,搜索速度快,扩展性好等特点。
本发明的技术方案如下:一种基于双流神经网络的相似视频搜索方法,
步骤S100,采集视频数据训练样本,并对样本进行预处理;
步骤S200,提取视频数据训练样本中的视频关键帧;
步骤S300,使用经过步骤S200处理过后的视频关键帧数据训练双流深度网络模型;
步骤S400,将给定视频输入到步骤S300训练好的双流网络模型提取视频特征,用于在视频库中进行匹配;
步骤S500,对步骤S400得到的特征向量经过sgn阶跃函数二值化作为视频特征哈希吗,sgn函数如下:
Figure BDA0001842815580000021
其中,x为步骤S400得到的特征向量;
步骤S600,计算给定视频与视频库中所有视频的距离,按照距离由小到大对视频进行排序,排序靠前的视频即为最后的搜索结果。
进一步的,步骤S100中所述视频数据训练样本包括多种类型的视频,每种类型的视频数据在1000份以上;所述预处理包括对视频数据进行清洗,并删除噪声样本。
进一步的,步骤S200的具体实现包括如下子步骤,
步骤S201,输入视频数据,将视频分帧并按视频时间顺序保存;
步骤S202,从第1帧开始,利用相邻的前一帧,通过brox算法计算出每一视频帧单通道的光流图;
步骤S203,对所有光流图计算方差值,根据方差值对光流图排序,选取方差最大的m帧图像作为关键光流帧,并选取对应的RGB关键帧。
进一步的,步骤S300训练双流深度网络模型的具体实现方式如下,
步骤S301,对包括关键帧和非关键帧在内的所有帧数据进行随机裁剪,水平翻转与旋转,随机噪声扰动以增加数据的多样性;
步骤S302,选取y1类别的视频中一帧RGB关键帧和10帧光流关键帧在通道上连接,作为双流网络输入,提取出的特征向量作为positive;选取y1类别中的一帧RGB非关键帧和10帧光流非关键帧在通道上连接,作为双流网络输入,提取出的特征向量作为anchor;选取y2类别的视频中的一帧RGB关键帧和10帧光流图关键帧在通道上连接,作为双流网络输入,提取出的特征向量作为negative,其中positive、anchor和negative均为1024维度特征向量;
步骤S303,网络前向传播结束后,构造hash triplet loss损失函数,使用hashtriplet loss拉近positive和anchor的距离,拉远negative和anchor的距离,具体计算公式如下:
Figure BDA0001842815580000031
其中:定义哈希码特征bi,bj∈{+1,-1}L,定义
Figure BDA0001842815580000032
计算二进制特征向量bi和bj的汉明距离;式中M表示训练视频对的数量,式中pm为1024维度的向量,表示第m个视频对中的positive;qm为1024维度向量,表示第m个视频对中的anchor;nm为1024维度向量,表示第m个视频对中的negative;bm=sgn(pm)表示哈希化之后的视频特征;α是一个常量,控制损失函数边缘大小;
Figure BDA0001842815580000041
为转换误差,对浮点型特征转换为二进制特征加上惩罚项;λ为超参数,控制惩罚的程度;
步骤S304,使用随机梯度下降优化算法,对网络反向传播,反复迭代,调整训练学习率等超参数,直到网络收敛。
进一步的,步骤S600中相似距离度量通过计算两两视频特征之间的汉明距离,计算公式如下:
Figure BDA0001842815580000044
其中,x,y为n维向量,x[i]表示给定视频特征哈希码向量x中的第i个元素的值,y[i]表示视频库中任一视频特征哈希码向量y中的第i个元素的值;
Figure BDA0001842815580000042
表示异或操作。
本发明还提供一种基于双流神经网络的相似视频搜索系统,包括如下模块:
视频数据采集模块,用于采集视频数据训练样本,并对样本进行预处理;
关键帧提取模块,用于提取视频数据训练样本中的视频关键帧;
双流网络训练模块,使用经过关键帧提取模块处理过后的视频关键帧数据训练双流深度网络模型;
视频特征提取模块,将给定视频输入到双流网络训练模块训练好的双流网络模型提取视频特征,用于在视频库中进行匹配;
特征哈希码转换模块,用于对视频特征提取模块得到的特征向量经过sgn阶跃函数二值化作为视频特征哈希码,sgn函数如下:
Figure BDA0001842815580000043
其中,x为步骤S400得到的特征向量;
搜索模块,用于计算给定视频与视频库中所有视频的距离,按照距离由小到大对视频进行排序,排序靠前的视频即为最后的搜索结果。
进一步的,视频数据采集模块中所述视频数据训练样本包括多种类型的视频,每种类型的视频数据在1000份以上;所述预处理包括对视频数据进行清洗,并删除噪声样本。
进一步的,关键帧提取模块中提取视频关键帧的具体实现包括如下子步骤,
步骤S201,输入视频数据,将视频分帧并按视频时间顺序保存;
步骤S202,从第1帧开始,利用相邻的前一帧,通过brox算法计算出每一视频帧单通道的光流图;
步骤S203,对所有光流图计算方差值,根据方差值对光流图排序,选取方差最大的m帧图像作为关键光流帧,并选取对应的RGB关键帧。
进一步的,双流网络训练模块中训练双流深度网络模型的具体实现方式如下,
步骤S301,对包括关键帧和非关键帧在内的所有帧数据进行随机裁剪,水平翻转与旋转,随机噪声扰动以增加数据的多样性;
步骤S302,选取y1类别的视频中一帧RGB关键帧和10帧光流关键帧在通道上连接,作为双流网络输入,提取出的特征向量作为positive;选取y1类别中的一帧RGB非关键帧和10帧光流非关键帧在通道上连接,作为双流网络输入,提取出的特征向量作为anchor;选取y2类别的视频中的一帧RGB关键帧和10帧光流图关键帧在通道上连接,作为双流网络输入,提取出的特征向量作为negative,其中positive、anchor和negative均为1024维度特征向量;
步骤S303,网络前向传播结束后,构造hash triplet loss损失函数,使用hashtriplet loss拉近positive和anchor的距离,拉远negative和anchor的距离,具体计算公式如下:
Figure BDA0001842815580000061
其中:定义哈希码特征bi,bj∈{+1,-1}L,定义
Figure BDA0001842815580000062
计算二进制特征向量bi和bj的汉明距离;式中M表示训练视频对的数量,式中pm为1024维度的向量,表示第m个视频对中的positive;qm为1024维度向量,表示第m个视频对中的anchor;nm为1024维度向量,表示第m个视频对中的negative;bm=sgn(pm)表示哈希化之后的视频特征;α是一个常量,控制损失函数边缘大小;
Figure BDA0001842815580000063
为转换误差,对浮点型特征转换为二进制特征加上惩罚项;λ为超参数,控制惩罚的程度;
步骤S304,使用随机梯度下降优化算法,对网络反向传播,反复迭代,调整训练学习率等超参数,直到网络收敛。
进一步的,搜索模块中相似距离度量通过计算两两视频特征之间的汉明距离,计算公式如下:
Figure BDA0001842815580000064
其中,x,y为n维向量,x[i]表示给定视频特征哈希码向量x中的第i个元素的值,y[i]表示视频库中任一视频特征哈希码向量y中的第i个元素的值;
Figure BDA0001842815580000065
表示异或操作。
与现有技术相比,本发明的优点如下;
(1)本发明中,视频帧提取采用关键帧提取技术,大大节省了存储空间,同时也使神经网络训练更加稳定,加快的神经网络训练的收敛速度。
(2)由于采用双流卷积神经网络提取视频特征,使得提取到的视频特征同时保留了视频中的空间信息和时间信息,更具有健壮性。
(3)利用汉明距离来度量视频的相似性,汉明空间里的距离运算其实是一种位运算,所以即使是很复杂的检索算法,它的计算成本也远低于原始空间的运算,所以本检索算法是一种高效的检索方式。
附图说明
图1是基于双流神经网络的相似视频搜索方法流程图;
图2是视频数据关键帧提取方法流程图;
图3是双流神经网络的算法训练过程结构流程图;
具体实施方式
下面结合附图,对本发明的技术方案进行具体说明。
如图1所示,基于双流神经网络的相似视频搜索方法包括以下步骤:
步骤S100、采集视频数据训练样本,对每种类别的视频数据采集1000份以上,并做数据清洗,删除噪声样本。
步骤S200、提取样本视频关键帧,如图2所示,具体包括以下三个步骤:
步骤S201、输入视频数据,使用opencv将视频分帧并按视频时间顺序保存。
步骤S202、从第1帧开始,利用相邻的前一帧,通过brox算法计算出每一视频帧单通道的光流图。
步骤S203、对所有光流图计算方差值,根据方差值对光流图排序,取方差值较大帧即为关键帧。选取方差最大的m帧图像作为光流关键帧,并选取对应的RGB关键帧,本实施例中m取10。
步骤S300、使用经过步骤S200处理过后的视频关键帧数据训练双流深度网络模型,如图3所示,具体包括以下四个步骤:
步骤S301、输入视频数据,经过步骤S200处理过后,得到m张关键RGB帧和m张光流关键帧,对包括关键帧和非关键帧在内的所有帧数据进行随机裁剪,水平翻转与旋转,随机噪声扰动以增加数据的多样性。
步骤S302、使用双流卷积神经网络提取视频特征,双流卷积网络结构由两个深度网络组成,分别处理时间与空间的维度。对于空间域,将视频的单帧RGB图像作为输入,将图像输入inceptionv3模型,提取物体、场景信息,输出为1024维度特征向量。对于时间域,将10帧叠加后的光流关键帧图像作为输入,送入bn-inception模型,可以提取动作的信息,输出为1024维度的特征向量。在网络最后接入全连接层将两个模型输出的1024维度的特征向量融合作为最后双流网络的输出结果,结果为1024维度特征向量。本实施例中,每次输入2个不同类别的视频进入网络训练,选取y1类别的视频中一帧RGB关键帧和10帧光流关键帧在通道上连接,作为双流网络输入,提取出的特征向量作为positive;选取y1类别中的一帧RGB非关键帧和10帧光流非关键帧在通道上连接,作为双流网络输入,提取出的特征向量作为anchor;选取y2类别的视频中的一帧RGB关键帧和10帧光流图关键帧在通道上连接,作为双流网络输入,提取出的特征向量作为negative。
步骤S303、网络前向传播结束后,构造hash triplet loss损失函数,使用hashtriplet loss拉近positive和anchor的距离,拉远negative和anchor的距离,具体计算公式如下:
Figure BDA0001842815580000091
其中:定义哈希码特征bi,bj∈{+1,-1}L,定义
Figure BDA0001842815580000092
计算二进制特征向量bi和bj的汉明距离;式中M表示训练视频对的数量,式中pm为1024维度的向量,表示第m个视频对中的positive;qm为1024维度向量,表示第m个视频对中的anchor;nm为1024维度向量,表示第m个视频对中的negative;bm=sgn(pm)表示哈希化之后的视频特征;α是一个常量,控制损失函数边缘大小,当α设置过大时损失函数过大模型难以收敛,当α设置过小时,损失函数较小,模型提取出的特征不能够很好的区分相似性;
Figure BDA0001842815580000093
为转换误差,对浮点型特征转换为二进制特征加上惩罚项;λ为超参数,控制惩罚的程度。
步骤S304、使用随机梯度下降算法进行优化,对网络反向传播,反复迭代,调整训练学习率等超参数,直到网络收敛,即Hash triplet loss损失函数值在训练数据上不再发生变化。
步骤S400、将给定视频输入到步骤S300训练好的双流网络模型提取视频特征,用于在视频库中进行匹配。
步骤S500、对步骤S400输出的1024维度特征向量,经过sgn阶跃函数二值化作为视频特征哈希码,sgn函数如下:
Figure BDA0001842815580000094
其中,x指1024维特征向量里的每一个元素。
步骤S600、计算给定视频与视频库中所有视频的距离,相似距离度量通过计算两两视频特征之间的汉明距离。计算公式如下:
Figure BDA0001842815580000101
式中x,y为n维向量,n=1024,x[i]表示给定视频特征哈希码向量x中的第i个元素的值,y[i]表示视频库中任一视频特征哈希码向量y中的第i个元素的值;
Figure BDA0001842815580000103
表示异或操作。
按照距离由小到大对视频进行排序,排序靠前的视频即为最后的搜索结果。
本发明实施例还提供一种基于双流神经网络的相似视频搜索系统,包括如下模块:
视频数据采集模块,用于采集视频数据训练样本,并对样本进行预处理;
关键帧提取模块,用于提取视频数据训练样本中的视频关键帧;
双流网络训练模块,使用经过关键帧提取模块处理过后的视频关键帧数据训练双流深度网络模型;
视频特征提取模块,将给定视频输入到双流网络训练模块训练好的双流网络模型提取视频特征,用于在视频库中进行匹配;
特征哈希码转换模块,用于对视频特征提取模块得到的特征向量经过sgn阶跃函数二值化作为视频特征哈希码,sgn函数如下:
Figure BDA0001842815580000102
其中,x为步骤S400得到的特征向量;
搜索模块,用于计算给定视频与视频库中所有视频的距离,按照距离由小到大对视频进行排序,排序靠前的视频即为最后的搜索结果。
各模块的具体实现和各步骤相应,本发明不予撰述。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (6)

1.一种基于双流神经网络的相似视频搜索方法,其特征在于,包括如下步骤:
步骤S100,采集视频数据训练样本,并对样本进行预处理;
步骤S200,提取视频数据训练样本中的视频关键帧;具体实现包括如下子步骤,
步骤S201,输入视频数据,将视频分帧并按视频时间顺序保存;
步骤S202,从第1帧开始,利用相邻的前一帧,通过brox算法计算出每一视频帧单通道的光流图;
步骤S203,对所有光流图计算方差值,根据方差值对光流图排序,选取方差最大的m帧图像作为关键光流帧,并选取对应的RGB关键帧;
步骤S300,使用经过步骤S200处理过后的视频关键帧数据训练双流深度网络模型;具体实现方式如下,
步骤S301,对包括关键帧和非关键帧在内的所有帧数据进行随机裁剪,水平翻转与旋转,随机噪声扰动以增加数据的多样性;
步骤S302,选取y1类别的视频中一帧RGB关键帧和10帧光流关键帧在通道上连接,作为双流网络输入,提取出的特征向量作为positive;选取y1类别中的一帧RGB非关键帧和10帧光流非关键帧在通道上连接,作为双流网络输入,提取出的特征向量作为anchor;选取y2类别的视频中的一帧RGB关键帧和10帧光流图关键帧在通道上连接,作为双流网络输入,提取出的特征向量作为negative,其中positive、anchor和negative均为1024维度特征向量;
步骤S303,网络前向传播结束后,构造hash triplet loss损失函数,使用hashtriplet loss拉近positive和anchor的距离,拉远negative和anchor的距离,具体计算公式如下:
Figure DEST_PATH_IMAGE001
其中:定义哈希码特征
Figure 611156DEST_PATH_IMAGE002
,定义
Figure 724343DEST_PATH_IMAGE003
,计算二进制特征向量
Figure 801759DEST_PATH_IMAGE004
Figure 691217DEST_PATH_IMAGE005
的汉明距离;式中M表示训练视频对的数量,式中
Figure 835891DEST_PATH_IMAGE006
为1024维度的向量,表示第m个视频对中的positive;
Figure 182296DEST_PATH_IMAGE007
为1024维度向量,表示第m个视频对中的anchor;
Figure 107527DEST_PATH_IMAGE008
为1024维度向量,表示第m个视频对中的negative;
Figure 800676DEST_PATH_IMAGE009
=sgn(
Figure 3119DEST_PATH_IMAGE006
)表示哈希化之后的视频特征;α是一个常量,控制损失函数边缘大小;
Figure 21890DEST_PATH_IMAGE010
为转换误差,对浮点型特征转换为二进制特征加上惩罚项;λ为超参数,控制惩罚的程度;
步骤S304,使用随机梯度下降优化算法,对网络反向传播,反复迭代,调整训练学习率,直到网络收敛;
步骤S400,将给定视频输入到步骤S300训练好的双流网络模型提取视频特征,用于在视频库中进行匹配;
步骤S500,对步骤S400得到的特征向量经过sgn阶跃函数二值化作为视频特征哈希码,sgn函数如下:
Figure 903259DEST_PATH_IMAGE011
其中,
Figure 69273DEST_PATH_IMAGE012
为步骤S400得到的特征向量;
步骤S600,计算给定视频与视频库中所有视频的距离,按照距离由小到大对视频进行排序,排序靠前的视频即为最后的搜索结果。
2.如权利要求1所述的一种基于双流神经网络的相似视频搜索方法,其特征在于:步骤S100中所述视频数据训练样本包括多种类型的视频,每种类型的视频数据在1000份以上;所述预处理包括对视频数据进行清洗,并删除噪声样本。
3.如权利要求1或2所述的一种基于双流神经网络的相似视频搜索方法,其特征在于:步骤S600中相似距离度量通过计算两两视频特征之间的汉明距离,计算公式如下:
D(x,y)=
Figure 719697DEST_PATH_IMAGE013
其中,x,yn维向量,x[i]表示给定视频特征哈希码向量x中的第i个元素的值,
Figure 378212DEST_PATH_IMAGE014
表示视频库中任一视频特征哈希码向量y中的第i个元素的值;
Figure 746876DEST_PATH_IMAGE015
表示异或操作。
4.一种基于双流神经网络的相似视频搜索系统,其特征在于,包括如下模块:
视频数据采集模块,用于采集视频数据训练样本,并对样本进行预处理;
关键帧提取模块,用于提取视频数据训练样本中的视频关键帧;具体实现包括如下子步骤,
步骤S201,输入视频数据,将视频分帧并按视频时间顺序保存;
步骤S202,从第1帧开始,利用相邻的前一帧,通过brox算法计算出每一视频帧单通道的光流图;
步骤S203,对所有光流图计算方差值,根据方差值对光流图排序,选取方差最大的m帧图像作为关键光流帧,并选取对应的RGB关键帧;
双流网络训练模块,使用经过关键帧提取模块处理过后的视频关键帧数据训练双流深度网络模型;具体实现方式如下,
步骤S301,对包括关键帧和非关键帧在内的所有帧数据进行随机裁剪,水平翻转与旋转,随机噪声扰动以增加数据的多样性;
步骤S302,选取y1类别的视频中一帧RGB关键帧和10帧光流关键帧在通道上连接,作为双流网络输入,提取出的特征向量作为positive;选取y1类别中的一帧RGB非关键帧和10帧光流非关键帧在通道上连接,作为双流网络输入,提取出的特征向量作为anchor;选取y2类别的视频中的一帧RGB关键帧和10帧光流图关键帧在通道上连接,作为双流网络输入,提取出的特征向量作为negative,其中positive、anchor和negative均为1024维度特征向量;
步骤S303,网络前向传播结束后,构造hash triplet loss损失函数,使用hashtriplet loss拉近positive和anchor的距离,拉远negative和anchor的距离,具体计算公式如下:
Figure 648009DEST_PATH_IMAGE001
其中:定义哈希码特征
Figure 684098DEST_PATH_IMAGE002
,定义
Figure 513514DEST_PATH_IMAGE003
,计算二进制特征向量
Figure 369474DEST_PATH_IMAGE004
Figure 519702DEST_PATH_IMAGE005
的汉明距离;式中M表示训练视频对的数量,式中
Figure 879139DEST_PATH_IMAGE006
为1024维度的向量,表示第m个视频对中的positive;
Figure 145035DEST_PATH_IMAGE007
为1024维度向量,表示第m个视频对中的anchor;
Figure 222713DEST_PATH_IMAGE008
为1024维度向量,表示第m个视频对中的negative;
Figure 566844DEST_PATH_IMAGE009
=sgn(
Figure 46367DEST_PATH_IMAGE006
)表示哈希化之后的视频特征;α是一个常量,控制损失函数边缘大小;
Figure 483164DEST_PATH_IMAGE010
为转换误差,对浮点型特征转换为二进制特征加上惩罚项;λ为超参数,控制惩罚的程度;
步骤S304,使用随机梯度下降优化算法,对网络反向传播,反复迭代,调整训练学习率,直到网络收敛;
视频特征提取模块,将给定视频输入到双流网络训练模块训练好的双流网络模型提取视频特征,用于在视频库中进行匹配;
特征哈希码转换模块,用于对视频特征提取模块得到的特征向量经过sgn阶跃函数二值化作为视频特征哈希码,sgn函数如下:
Figure 48138DEST_PATH_IMAGE011
其中,
Figure 228584DEST_PATH_IMAGE012
为步骤S400得到的特征向量;
搜索模块,用于计算给定视频与视频库中所有视频的距离,按照距离由小到大对视频进行排序,排序靠前的视频即为最后的搜索结果。
5.如权利要求4所述的一种基于双流神经网络的相似视频搜索系统,其特征在于:视频数据采集模块中所述视频数据训练样本包括多种类型的视频,每种类型的视频数据在1000份以上;所述预处理包括对视频数据进行清洗,并删除噪声样本。
6.如权利要求4或5所述的一种基于双流神经网络的相似视频搜索系统,其特征在于:搜索模块中相似距离度量通过计算两两视频特征之间的汉明距离,计算公式如下:
D(x,y)=
Figure 828192DEST_PATH_IMAGE013
其中,x,yn维向量,x[i]表示给定视频特征哈希码向量x中的第i个元素的值,
Figure 435891DEST_PATH_IMAGE014
表示视频库中任一视频特征哈希码向量y中的第i个元素的值;
Figure 986696DEST_PATH_IMAGE015
表示异或操作。
CN201811256363.6A 2018-10-26 2018-10-26 一种基于双流神经网络的相似视频搜索方法和系统 Active CN109492129B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811256363.6A CN109492129B (zh) 2018-10-26 2018-10-26 一种基于双流神经网络的相似视频搜索方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811256363.6A CN109492129B (zh) 2018-10-26 2018-10-26 一种基于双流神经网络的相似视频搜索方法和系统

Publications (2)

Publication Number Publication Date
CN109492129A CN109492129A (zh) 2019-03-19
CN109492129B true CN109492129B (zh) 2020-08-07

Family

ID=65692778

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811256363.6A Active CN109492129B (zh) 2018-10-26 2018-10-26 一种基于双流神经网络的相似视频搜索方法和系统

Country Status (1)

Country Link
CN (1) CN109492129B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3989158A4 (en) * 2019-07-18 2022-06-29 Huawei Cloud Computing Technologies Co., Ltd. Method, apparatus and device for video similarity detection
CN110415236A (zh) * 2019-07-30 2019-11-05 深圳市博铭维智能科技有限公司 一种基于双流神经网络的复杂地下管道的异常检测方法
CN110414471B (zh) * 2019-08-06 2022-02-01 福建省趋普物联科技有限公司 基于双模型的视频识别方法及系统
CN110996123B (zh) * 2019-12-18 2022-01-11 广州市百果园信息技术有限公司 一种视频处理方法、装置、设备及介质
CN111274445B (zh) * 2020-01-20 2021-04-23 山东建筑大学 基于三元组深度学习的相似视频内容检索方法及系统
CN111339356B (zh) * 2020-02-21 2023-07-18 北京字节跳动网络技术有限公司 视频检索中防误判方法、装置及电子设备
CN116758494B (zh) * 2023-08-23 2023-12-22 深圳市科灵通科技有限公司 一种网联车车载视频智能监控方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156284A (zh) * 2016-06-24 2016-11-23 合肥工业大学 基于随机多视角哈希的大规模近重复视频检索方法
CN107229757A (zh) * 2017-06-30 2017-10-03 中国科学院计算技术研究所 基于深度学习和哈希编码的视频检索方法
CN107862376A (zh) * 2017-10-30 2018-03-30 中山大学 一种基于双流神经网络的人体图像动作识别方法
CN108280233A (zh) * 2018-02-26 2018-07-13 南京邮电大学 一种基于深度学习的视频gis数据检索方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156284A (zh) * 2016-06-24 2016-11-23 合肥工业大学 基于随机多视角哈希的大规模近重复视频检索方法
CN107229757A (zh) * 2017-06-30 2017-10-03 中国科学院计算技术研究所 基于深度学习和哈希编码的视频检索方法
CN107862376A (zh) * 2017-10-30 2018-03-30 中山大学 一种基于双流神经网络的人体图像动作识别方法
CN108280233A (zh) * 2018-02-26 2018-07-13 南京邮电大学 一种基于深度学习的视频gis数据检索方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Two-stream Attentive CNNs for Image Retrieval;Fei Yang 等;《PROCEEDINGS OF THE 2017 ACM MULTIMEDIA CONFERENCE》;20171027;全文 *

Also Published As

Publication number Publication date
CN109492129A (zh) 2019-03-19

Similar Documents

Publication Publication Date Title
CN109492129B (zh) 一种基于双流神经网络的相似视频搜索方法和系统
CN108228915B (zh) 一种基于深度学习的视频检索方法
KR101183391B1 (ko) 메트릭 임베딩에 의한 이미지 비교
CN108171663B (zh) 基于特征图最近邻替换的卷积神经网络的图像填充系统
CN107545277B (zh) 模型训练、身份验证方法、装置、存储介质和计算机设备
CN108805151B (zh) 一种基于深度相似性网络的图像分类方法
CN112434553B (zh) 一种基于深度字典学习的视频鉴别方法及系统
CN110472089B (zh) 一种基于对抗生成网络的红外和可见光图像检索方法
WO2021042857A1 (zh) 图像分割模型的处理方法和处理装置
CN111831844A (zh) 图像检索方法、图像检索装置、图像检索设备及介质
CN112084895B (zh) 一种基于深度学习的行人重识别方法
CN113628059A (zh) 一种基于多层图注意力网络的关联用户识别方法及装置
CN115331079A (zh) 一种面向多模态遥感图像分类网络的对抗攻击方法
CN111639230A (zh) 一种相似视频的筛选方法、装置、设备和存储介质
Liu et al. Ensemble of CNN and rich model for steganalysis
CN110083734B (zh) 基于自编码网络和鲁棒核哈希的半监督图像检索方法
CN115170836A (zh) 一种基于浅层纹理提取的跨域重识别方法及相关设备
CN116383470B (zh) 一种具有隐私保护的图像搜索方法
CN116089652B (zh) 视觉检索模型的无监督训练方法、装置和电子设备
CN114694185B (zh) 一种跨模态目标重识别方法、装置、设备及介质
CN111241326A (zh) 基于注意力金字塔图网络的图像视觉关系指代定位方法
CN116597177A (zh) 一种基于双分支并行深度交互协同的多源图像块匹配方法
CN113222016B (zh) 一种基于高层和低层特征交叉增强的变化检测方法及装置
CN113191144B (zh) 一种基于传播影响力的网络谣言识别系统及方法
CN115098646A (zh) 一种图文数据的多级关系分析与挖掘方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant