CN106203442B - 一种基于深度学习的拷贝图像特征提取方法 - Google Patents

一种基于深度学习的拷贝图像特征提取方法 Download PDF

Info

Publication number
CN106203442B
CN106203442B CN201610485911.7A CN201610485911A CN106203442B CN 106203442 B CN106203442 B CN 106203442B CN 201610485911 A CN201610485911 A CN 201610485911A CN 106203442 B CN106203442 B CN 106203442B
Authority
CN
China
Prior art keywords
image
characteristic image
convolutional neural
neural networks
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610485911.7A
Other languages
English (en)
Other versions
CN106203442A (zh
Inventor
郝晖
刑爽
杜强
许正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiao Bai Century Network Technology Co Ltd
Original Assignee
Beijing Xiao Bai Century Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiao Bai Century Network Technology Co Ltd filed Critical Beijing Xiao Bai Century Network Technology Co Ltd
Priority to CN201610485911.7A priority Critical patent/CN106203442B/zh
Publication of CN106203442A publication Critical patent/CN106203442A/zh
Application granted granted Critical
Publication of CN106203442B publication Critical patent/CN106203442B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学习的拷贝图像特征提取方法,包括如下步骤:通过卷积神经网络构建训练图像的特征图像;对训练图像的特征图像进行特征表示;特征表示度量训练图像间的相似度;根据训练图像特征表示的相似度对卷积神经网络参数进行优化,得到目标卷积神经网络结构;利用目标卷积神经网络结构提取拷贝图像的特征表示。本发明以深度学习的卷积神经网络为基础,提高了图像特征表示的唯一性与鲁棒性,并且特征提取的效率和准确率都较高。

Description

一种基于深度学习的拷贝图像特征提取方法
技术领域
本发明涉及计算机多媒体技术领域,尤其涉及一种基于深度学习的拷贝图像特征提取方法。
背景技术
随着信息技术的飞速发展,尤其是网络通信技术和多媒体技术的应用,图像已成为互联网上信息传输的重要内容。相应地,为了有效防止网络多媒体盗版事件的发生,针对网络图像的版权保护也获得了广泛的重视。拷贝图像,即查询图像与参考图像之间存在某种图像变换,或者说,查询图像是由参考图像通过各种图像编辑操作得到。关于拷贝图像检测的研究,主要集中在以下三个方面:图像表示方式、快速检索方法、相似性度量方法。根据图像表示方式的不同,当前的两类主要框架分别是基于全局特征方法和基于局部特征方法。
基于全局特征方法将图像描述为一个全局的特征向量或者描述子,通过计算图像特征向量或描述子之间的距离来度量图像的相似性。同时,在相似性度量方法方面,其与图像表示方法相关联,基于不同的图像表示方法一般会采用不同的相似性度量方法。但是该方法需要顺序计算特征向量之间的距离,因此效率较低,同时,对图像的裁剪、平移、加框、Logo添加等变换操作鲁棒性较差。
基于局部特征方法将图像描述为局部特征的集合,并将文本检索中词袋模型应用于拷贝图像检测中。最常用的局部特征描述方法有:PCA-SIFT、SIFT、PM-DFT、LocalDifference Pattern、多分辨率直方图等。基于局部特征方法虽然鲁棒性较高,能处理当前各种图像编辑操作。但是由于图像规模非常大,而在将图像表示视觉词汇集合时,损失了视觉词汇的位置信息,以及在利用量化方法得到视觉词汇时也损失了局部描述子的信息量。所以基于局部特征的方法效率和准确率都较低。
发明内容
本发明的目的之一在于提供一种基于深度学习的拷贝图像特征提取方法,以解决在拷贝图像检测问题中,基于深度学习进行图像特征抽取以构建具有唯一性和鲁棒性的特征表示的问题。
本发明的发明目的是通过下述技术方案来实现的:
一种基于深度学习的拷贝图像特征提取方法包括如下步骤:
通过卷积神经网络构建训练图像的特征图像;
对训练图像的特征图像进行特征表示;
根据训练图像特征表示的相似度对卷积神经网络参数进行优化,得到目标卷积神经网络结构;
利用目标卷积神经网络结构提取拷贝图像的特征表示。
进一步的,本发明提供的一种基于深度学习的拷贝图像特征提取方法具体包括如下步骤:
步骤S1:选取训练图像,并对所述训练图像进行预处理;
步骤S2:将步骤S1中经过预处理的训练图像输入到卷积神经网络中进行卷积、切分处理,得到训练图像的特征图像;
步骤S3:提取步骤S2中得到的特征图像的特征表示;
步骤S4:根据步骤S3中得到的特征表示度量训练图像间的相似度;
步骤S5:根据步骤S4中得到的相似度对卷积神经网络参数进行优化,最后训练得到目标卷积神经网络结构;
步骤S6:利用步骤S5得到的目标卷积神经网络结构,提取拷贝图像的特征表示。
进一步的,所述步骤S2:将步骤S1中经过预处理的训练图像输入到卷积神经网络中进行卷积、切分处理,得到训练图像的特征图像,具体包括如下步骤:
步骤S2.1:将步骤S1中经过预处理的训练图像输入到卷积神经网络中的C1卷积层,对训练图像进行卷积操作,输出C1卷积层特征图像;
步骤S2.2:将步骤S2.1中得到的C1卷积层特征图像输入卷积神经网络中的S2下采样层,将C1卷积层特征图像切分为子区域,取每个区域的最大值,进行最大池化(maxpooling),输出S2下采样层特征图像;
步骤S2.3:将步骤S2.2中得到的S2下采样层特征图像输入卷积神经网络中的C3卷积层,对S2下采样层特征图像进行卷积操作,输出C3卷积层特征图像;
步骤S2.4:将步骤S2.3中得到的C3卷积层特征图像输入卷积神经网络中的S4下采样层,将C3卷积层特征图像切分为子区域,取每个区域的最大值,进行max pooling,输出S4下采样层特征图像。
进一步的,所述步骤S2:将步骤S1中经过预处理的训练图像输入到卷积神经网络中进行卷积、切分处理,得到训练图像的特征图像,具体包括如下步骤:
步骤S2.1.1:将步骤S1中经过预处理的训练图像输入到卷积神经网络中的C1卷积层,通过64个11×11的滤波器,使用4个像素的步长,对经过预处理的训练图像进行卷积操作,输出64×56×56的C1卷积层特征图像;
步骤S2.2.1:将步骤S2.1.1中得到的每幅56×56的C1卷积层特征图像输入卷积神经网络中的S2下采样层,将C1卷积层特征图像切分为28×28个子区域,取每个区域的最大值,进行max pooling,输出64×28×28的S2下采样层特征图像;
步骤S2.3.1:将步骤S2.2.1中得到的S2下采样层特征图像输入卷积神经网络中的C3卷积层,通过128个5×5的滤波器,使用1个像素的步长,对S2下采样层特征图像进行卷积操作,输出128×24×24的C3卷积层特征图像;
步骤S2.4.1:将步骤S2.3.1中得到的每幅24×24的C3卷积层特征图像输入卷积神经网络中的S4下采样层,将C3卷积层特征图像切分为12×12个子区域,取每个区域的最大值,进行max pooling,输出128×12×12的S4下采样层特征图像。
进一步的,所述步骤S3:提取步骤S2中得到的特征图像的特征表示,具体包括如下步骤:
步骤S3.1:将步骤S2中得到的特征图像输入到全连接层进行全连接,输出特征图像的特征表示;
步骤S3.2:对步骤S3.1中得到的特征图像的特征表示进行二进制特征转换,得到特征图像的二进制特征表示。
进一步的,所述步骤S3:提取步骤S2中得到的特征图像的特征表示,具体包括如下步骤:
步骤S3.1.1:将步骤S2中得到的特征图像输入到全连接层与m个sigmoid类型的节点进行全连接,输出特征图像的特征表示为m维特征向量(x1,,x2,…,xm);
步骤S3.2.1:对全连接层输出的m维特征向量(x1,,x2,…,xm)进行二进制特征转换,得到特征图像的二进制特征向量;
所述二进制特征转换方式为:
进一步的,所述步骤S4:根据步骤S3中得到的特征表示度量图像间的相似度,具体包括如下步骤:
根据步骤S3中得到的特征表示利用汉明距离方法度量图像间的相似度,所述汉明距离方法为:
度量特征表示分别为(x1,,x2,…,xm)和(y1,,y2,…,ym)的图像间的相似度为
进一步的,所述步骤S5中:根据步骤S4中得到的相似度对卷积神经网络参数进行优化,最后训练得到目标卷积神经网络结构的步骤,具体包括如下步骤:
步骤S5.1:根据步骤S4中得到的相似度对卷积神经网络参数进行优化;
步骤S5.2:根据优化后的卷积神经网络参数更新卷积神经网络,重复上述步骤S2到步骤S4,直至训练图像的相似度不再变化,最后训练得到目标卷积神经网络结构。
进一步的,所述步骤S5.1:根据步骤S4中得到的相似度对卷积神经网络参数进行优化的步骤中,具体包括如下步骤:
根据步骤S4中得到的相似度,通过二项式偏差函数,利用梯度下降的方法,对卷积神经网络参数进行优化;所述二项式偏差函数为:
其中相似度矩阵S=[Sij]n×n
矩阵M=[Mij]n×n
矩阵W=[Wij]n×n
进一步的,所述步骤S6:利用步骤S5得到的目标卷积神经网络结构,提取拷贝图像的特征向量的步骤中,具体包括如下步骤:
步骤S6.1:对拷贝图像进行预处理;
步骤S6.2:将步骤S6.1中经预处理的拷贝图像输入到目标卷积神经网络结构中,输出拷贝图像的特征图像;
步骤S6.3:将步骤S6.2中得到的拷贝图像的特征图像进行全连接,得到拷贝图像的特征表示;
步骤S6.4:将步骤S6.3中的到的拷贝图像的特征表示进行二进制特征转换,得到拷贝图像的二进制特征表示。
本发明的有益效果:
(1)本发明以深度学习的卷积神经网络为基础,提高了图像特征表示的唯一性与鲁棒性;
(2)本发明采用的卷积神经网络的一个映射面上的神经元共享权值,降低了网络训练的复杂程度,效率更高;
(3)本发明采用了二项式偏差函数作为损失函数,并利用梯度下降的策略来优化网络参数,经过多次训练后,会得到较优的图像特征表示,从而提高了特征提取的准确率。
附图说明
图1为实施例中基于深度学习的拷贝图像特征提取方法的流程图;
图2为实施例中步骤S2:将经过预处理的训练图像输入到卷积神经网络中进行卷积、切分处理,得到训练图像的特征图像的方法流程图;
图3为实施例中步骤S6:利用步骤S5得到的目标卷积神经网络结构,提取拷贝图像的特征表示的方法流程图。
具体实施方式
下文将结合具体实施方式详细描述本发明。应当注意的是,下述实施例中描述的技术特征或者技术特征的组合不应当被认为是孤立的,它们可以被相互组合从而达到更好的技术效果。
本发明提供的一种基于深度学习的拷贝图像特征提取方法包括如下步骤:
通过卷积神经网络构建训练图像的特征图像;
对训练图像的特征图像进行特征表示;
根据训练图像特征表示的相似度对卷积神经网络参数进行优化,得到目标卷积神经网络结构;
利用目标卷积神经网络结构提取拷贝图像的特征表示。
如图1-3所示,本发明提供的一种基于深度学习的拷贝图像特征提取方法具体包括如下步骤:
步骤S1:选取训练图像,并对所述训练图像进行预处理;
步骤S2:将步骤S1中经过预处理的训练图像输入到卷积神经网络中进行卷积、切分处理,得到训练图像的特征图像;
步骤S3:提取步骤S2中得到的特征图像的特征表示;
步骤S4:根据步骤S3中得到的特征表示度量训练图像间的相似度;
步骤S5:根据步骤S4中得到的相似度对卷积神经网络参数进行优化,最后训练得到目标卷积神经网络结构;
步骤S6:利用步骤S5得到的目标卷积神经网络结构,提取拷贝图像的特征表示。
进一步的,所述步骤S2:将步骤S1中经过预处理的训练图像输入到卷积神经网络中进行卷积、切分处理,得到训练图像的特征图像,具体包括如下步骤:
步骤S2.1:将步骤S1中经过预处理的训练图像输入到卷积神经网络中的C1卷积层,对训练图像进行卷积操作,输出C1卷积层特征图像;
步骤S2.2:将步骤S2.1中得到的C1卷积层特征图像输入卷积神经网络中的S2下采样层,将C1卷积层特征图像切分为子区域,取每个区域的最大值,进行max pooling,输出S2下采样层特征图像;
步骤S2.3:将步骤S2.2中得到的S2下采样层特征图像输入卷积神经网络中的C3卷积层,对S2下采样层特征图像进行卷积操作,输出C3卷积层特征图像;
步骤S2.4:将步骤S2.3中得到的C3卷积层特征图像输入卷积神经网络中的S4下采样层,将C3卷积层特征图像切分为子区域,取每个区域的最大值,进行max pooling,输出S4下采样层特征图像。
进一步的,所述步骤S3:提取步骤S2中得到的特征图像的特征表示,具体包括如下步骤:
步骤S3.1:将步骤S2中得到的特征图像输入到全连接层进行全连接,输出特征图像的特征表示;
步骤S3.2:对步骤S3.1中得到的特征图像的特征表示进行二进制特征转换,得到特征图像的二进制特征表示。
进一步的,所述步骤S4:根据步骤S3中得到的特征表示度量图像间的相似度,具体包括如下步骤:
根据步骤S3中得到的特征表示利用汉明距离方法度量图像间的相似度,具体的,汉明距离方法为:度量特征表示分别为(x1,,x2,…,xm)和(y1,,y2,…,ym)的图像间的相似度为
进一步的,所述步骤S5中:根据步骤S4中得到的相似度对卷积神经网络参数进行优化,最后训练得到目标卷积神经网络结构的步骤,具体包括如下步骤:
步骤S5.1:根据步骤S4中得到的相似度对卷积神经网络参数进行优化;
步骤S5.2:根据优化后的卷积神经网络参数更新卷积神经网络,重复上述步骤S2到步骤S4,直至训练图像的相似度不再变化,最后训练得到目标卷积神经网络结构。
进一步的,所述步骤S6:利用步骤S5得到的目标卷积神经网络结构,提取拷贝图像的特征向量的步骤中,具体包括如下步骤:
步骤S6.1:对拷贝图像进行预处理;
步骤S6.2:将步骤S6.1中经预处理的拷贝图像输入到目标卷积神经网络结构中,输出拷贝图像的特征图像;
步骤S6.3:将步骤S6.2中得到的拷贝图像的特征图像进行全连接,得到拷贝图像的特征表示;
步骤S6.4:将步骤S6.3中的到的拷贝图像的特征表示进行二进制特征转换,得到拷贝图像的二进制特征表示。
实施例
本发明提供的一种基于深度学习的拷贝图像特征提取方法具体包括如下步骤:
(1)选取2张图像作为训练图像,并对该2张训练图像进行预处理,即将训练图像尺寸调整为224×224像素;
(2)将步骤(1)中经过预处理的训练图像输入到卷积神经网络中进行卷积、切分处理,得到训练图像的特征图像,具体包括如下步骤:
(2.1)将步骤(1)中经过预处理的训练图像输入卷积神经网络中的C1卷积层,通过64个11×11的滤波器,使用4个像素的步长,对训练图像进行卷积操作,输出64×56×56的C1卷积层特征图像;
(2.2)将步骤(2.1)中得到的每幅56×56的C1卷积层特征图像输入卷积神经网络中的S2下采样层,将C1卷积层特征图像切分为28×28个子区域,取每个区域的最大值,进行max pooling,输出64×28×28的S2下采样层特征图像;
(2.3)将步骤(2.2)中得到的S2下采样层特征图像输入卷积神经网络中的C3卷积层,通过128个5×5的滤波器,使用1个像素的步长,对S2下采样层特征图像进行卷积操作,输出128×24×24的C3卷积层特征图像;
(2.4)将步骤(2.3)中得到的每幅24×24的C3卷积层特征图像输入卷积神经网络中的S4下采样层,将C3卷积层特征图像切分为12×12个子区域,取每个区域的最大值,进行max pooling,输出128×12×12的S4下采样层特征图像。
(3)提取步骤(2)中得到的特征图像的特征表示,具体包括如下步骤:
(3.1)将步骤(2)中得到的特征图像输入到全连接层与500个节点进行全连接,所述节点类型为sigmoid函数,输出特征图像的特征表示为500维特征向量(x1,,x2,…,x500);
(3.2)对全连接层输出的500维特征向量(x1,,x2,…,x500)进行二进制特征转换,得到特征图像的二进制特征向量;
所述二进制特征转换方式为:
(4)根据步骤(3)中得到的特征表示利用汉明距离方法度量图像间的相似度,具体的,特征图像的特征表示分别为(x1,,x2,…,x500)和(y1,,y2,…,y500)的图像间的相似度为
(5)根据步骤(4)中得到的相似度对卷积神经网络参数进行优化,最后训练得到目标卷积神经网络结构的步骤,具体包括如下步骤:
(5.1)根据步骤(4)中得到的相似度,通过二项式偏差函数,利用梯度下降的方法,对卷积神经网络参数进行优化;所述二项式偏差函数为:
其中相似度矩阵S=[Sij]n×n
矩阵M=[Mij]n×n
矩阵W=[Wij]n×n
本发明因为采用了二项式偏差函数作为损失函数,并利用梯度下降的策略来优化网络参数,经过多次训练后,会得到较优的图像特征表示。
(5.2)利用优化后的卷积神经网络参数更新卷积神经网络结构,重复上述步骤(2)到步骤(4),直至训练图像的相似度不再变化,最后训练得到目标卷积神经网络结构。
(6)利用步骤(5)得到的目标卷积神经网络结构,提取拷贝图像的特征向量的步骤中,具体包括如下步骤:
(6.1)对拷贝图像Image(A)进行预处理,即将图像的尺寸调整为224×224像素;
(6.2)将步骤S6.1中经预处理的拷贝图像输入到目标卷积神经网络结构中,输出拷贝图像的特征图像;
(6.3)将步骤S6.2中得到的拷贝图像的特征图像与500个sigmoid类型的节点进行全连接,得到拷贝图像的特征表示为500维的特征向量(a1,,a2,…,a500)。;
(6.4)将步骤S6.3中的到的拷贝图像的特征表示进行如下二进制特征转换:
得到拷贝图像的二进制特征表示。
综上所述,本发明具有的优势为:
(1)本发明以深度学习的卷积神经网络为基础,提高了图像特征表示的唯一性与鲁棒性;
(2)本发明采用的卷积神经网络的一个映射面上的神经元共享权值,降低了网络训练的复杂程度,效率更高;
(3)本发明采用了二项式偏差函数作为损失函数,并利用梯度下降的策略来优化网络参数,经过多次训练后,会得到较优的图像特征表示,从而提高了特征提取的准确率。
当然应意识到,虽然通过本发明的示例已经进行了前面的描述,但是对本发明做出的将对本领域的技术人员显而易见的这样和其他的改进及改变应认为落入如本文提出的本发明宽广范围内。因此,尽管本发明已经参照了优选的实施方式进行描述,但是,其意并不是使具新颖性的设备由此而受到限制,相反,其旨在包括符合上述公开部分、权利要求的广阔范围之内的各种改进和等同修改。

Claims (8)

1.一种基于深度学习的拷贝图像特征提取方法,其特征在于,包括如下步骤:
通过卷积神经网络构建训练图像的特征图像;
对所述训练图像的特征图像进行特征表示;
根据所述训练图像的特征表示的相似度,通过二项式偏差函数,利用梯度下降的方法,对卷积神经网络参数进行优化;
所述二项式偏差函数为:
其中相似度矩阵S=[Sij]n×n
矩阵M=[Mij]n×n
矩阵W=[Wij]n×n
然后根据优化后的卷积神经网络参数更新卷积神经网络,重复上述步骤,直至训练图像的相似度不再变化,最后训练得到目标卷积神经网络结构;
利用目标卷积神经网络结构提取拷贝图像的特征表示。
2.如权利要求1所述的一种基于深度学习的拷贝图像特征提取方法,其特征在于,包括如下步骤:
步骤S1:选取训练图像,并对所述训练图像进行预处理;
步骤S2:将步骤S1中经过预处理的训练图像输入到卷积神经网络中进行卷积、切分处理,得到训练图像的特征图像;
步骤S3:提取步骤S2中得到的特征图像的特征表示;
步骤S4:根据步骤S3中得到的特征表示度量训练图像间的相似度;
步骤S5:根据步骤S4中得到的相似度对卷积神经网络参数进行优化,具体包括如下步骤:
步骤S5.1:根据步骤S4中得到的相似度对卷积神经网络参数进行优化,具体包括如下步骤:
根据步骤S4中得到的相似度,通过二项式偏差函数,利用梯度下降的方法,对卷积神经网络参数进行优化;
所述二项式偏差函数为:
其中相似度矩阵S=[Sij]n×n
矩阵W=[Wij]n×n
矩阵W=[Wij]n×n
步骤S5.2:根据优化后的卷积神经网络参数更新卷积神经网络,重复上述步骤S2到步骤S4,直至训练图像的相似度不再变化,最后训练得到目标卷积神经网络结构;
步骤S6:利用步骤S5得到的目标卷积神经网络结构,提取拷贝图像的特征表示。
3.如权利要求2所述的一种基于深度学习的拷贝图像特征提取方法,其特征在于,所述步骤S2:将步骤S1中经过预处理的训练图像输入到卷积神经网络中进行卷积、切分处理,得到训练图像的特征图像,具体包括如下步骤:
步骤S2.1:将步骤S1中经过预处理的训练图像输入到卷积神经网络中的C1卷积层,对训练图像进行卷积操作,输出C1卷积层特征图像;
步骤S2.2:将步骤S2.1中得到的C1卷积层特征图像输入卷积神经网络中的S2下采样层,将C1卷积层特征图像切分为子区域,取每个区域的最大值,进行最大池化,输出S2下采样层特征图像;
步骤S2.3:将步骤S2.2中得到的S2下采样层特征图像输入卷积神经网络中的C3卷积层,对S2下采样层特征图像进行卷积操作,输出C3卷积层特征图像;
步骤S2.4:将步骤S2.3中得到的C3卷积层特征图像输入卷积神经网络中的S4下采样层,将C3卷积层特征图像切分为子区域,取每个区域的最大值,进行最大池化,输出S4下采样层特征图像。
4.如权利要求3所述的一种基于深度学习的拷贝图像特征提取方法,其特征在于,所述步骤S2:将步骤S1中经过预处理的训练图像输入到卷积神经网络中进行卷积、切分处理,得到训练图像的特征图像,具体包括如下步骤:
步骤S2.1.1:将步骤S1中经过预处理的图像输入卷积神经网络中的C1卷积层,通过64个11×11的滤波器,使用4个像素的步长,对经过预处理的图像进行卷积操作,输出64×56×56的C1卷积层特征图像;
步骤S2.2.1:将步骤S2.1.1中得到的每幅56×56的C1卷积层特征图像输入卷积神经网络中的S2下采样层,将C1卷积层特征图像切分为28×28个子区域,取每个区域的最大值,进行最大池化,输出64×28×28的S2下采样层特征图像;
步骤S2.3.1:将步骤S2.2.1中得到的S2下采样层特征图像输入卷积神经网络中的C3卷积层,通过128个5×5的滤波器,使用1个像素的步长,对S2下采样层特征图像进行卷积操作,输出128×24×24的C3卷积层特征图像;
步骤S2.4.1:将步骤S2.3.1中得到的每幅24×24的C3卷积层特征图像输入卷积神经网络中的S4下采样层,将C3卷积层特征图像切分为12×12个子区域,取每个区域的最大值,进行最大池化,输出128×12×12的S4下采样层特征图像。
5.如权利要求3所述的一种基于深度学习的拷贝图像特征提取方法,其特征在于,所述步骤S3:提取步骤S2中得到的特征图像的特征表示,具体包括如下步骤:
步骤S3.1:将步骤S2中得到的特征图像输入到全连接层进行全连接,输出特征图像的特征表示;
步骤S3.2:对步骤S3.1中得到的特征图像的特征表示进行二进制特征转换,得到特征图像的二进制特征表示。
6.如权利要求5所述的一种基于深度学习的拷贝图像特征提取方法,其特征在于,所述步骤S3:提取步骤S2中得到的特征图像的特征表示,具体包括如下步骤:
步骤S3.1.1:将步骤S2中得到的特征图像输入到全连接层与m个sigmoid类型的节点进行全连接,输出特征图像的特征表示为m维特征向量(x1,,x2,...,xm);
步骤S3.2.1:对全连接层输出的m维特征向量(x1,,x2,...,xm)进行二进制特征转换,得到所述特征图像的二进制特征向量;
所述二进制特征转换方式为:
7.如权利要求6所述的一种基于深度学习的拷贝图像特征提取方法,其特征在于,所述步骤S4:根据步骤S3中得到的特征表示度量图像间的相似度,具体包括如下步骤:
根据步骤S3中得到的特征表示利用汉明距离方法度量图像间的相似度,所述汉明距离方法为:
度量特征表示分别为(x1,x2,…,xm)和(y1,y2,…,ym)的图像间的相似度为
8.如权利要求2-7中任一项所述的一种基于深度学习的拷贝图像特征提取方法,其特征在于,所述步骤S6:利用步骤S5得到的目标卷积神经网络结构,提取拷贝图像的特征向量的步骤中,具体包括如下步骤:
步骤S6.1:对拷贝图像进行预处理;
步骤S6.2:将步骤S6.1中经预处理的拷贝图像输入到目标卷积神经网络结构中,输出拷贝图像的特征图像;
步骤S6.3:将步骤S6.2中得到的拷贝图像的特征图像进行全连接,得到拷贝图像的特征表示;
步骤S6.4:将步骤S6.3中的到的拷贝图像的特征表示进行二进制特征转换,得到拷贝图像的二进制特征表示。
CN201610485911.7A 2016-06-28 2016-06-28 一种基于深度学习的拷贝图像特征提取方法 Active CN106203442B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610485911.7A CN106203442B (zh) 2016-06-28 2016-06-28 一种基于深度学习的拷贝图像特征提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610485911.7A CN106203442B (zh) 2016-06-28 2016-06-28 一种基于深度学习的拷贝图像特征提取方法

Publications (2)

Publication Number Publication Date
CN106203442A CN106203442A (zh) 2016-12-07
CN106203442B true CN106203442B (zh) 2019-04-05

Family

ID=57462367

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610485911.7A Active CN106203442B (zh) 2016-06-28 2016-06-28 一种基于深度学习的拷贝图像特征提取方法

Country Status (1)

Country Link
CN (1) CN106203442B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107341509B (zh) * 2017-06-29 2020-12-04 北京小米移动软件有限公司 卷积神经网络的训练方法、装置及可读存储介质
CN108121805B (zh) * 2017-12-25 2021-09-14 广东三维家信息科技有限公司 基于深度学习实现快速珠宝图片检索的方法
CN109801317A (zh) * 2018-12-29 2019-05-24 天津大学 基于卷积神经网络进行特征提取的图像匹配方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103605972A (zh) * 2013-12-10 2014-02-26 康江科技(北京)有限责任公司 一种基于分块深度神经网络的非限制环境人脸验证方法
CN103984959A (zh) * 2014-05-26 2014-08-13 中国科学院自动化研究所 一种基于数据与任务驱动的图像分类方法
CN104318215A (zh) * 2014-10-27 2015-01-28 中国科学院自动化研究所 一种基于域鲁棒卷积特征学习的交叉视角人脸识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8345962B2 (en) * 2007-11-29 2013-01-01 Nec Laboratories America, Inc. Transfer learning methods and systems for feed-forward visual recognition systems
US10346726B2 (en) * 2014-12-15 2019-07-09 Samsung Electronics Co., Ltd. Image recognition method and apparatus, image verification method and apparatus, learning method and apparatus to recognize image, and learning method and apparatus to verify image

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103605972A (zh) * 2013-12-10 2014-02-26 康江科技(北京)有限责任公司 一种基于分块深度神经网络的非限制环境人脸验证方法
CN103984959A (zh) * 2014-05-26 2014-08-13 中国科学院自动化研究所 一种基于数据与任务驱动的图像分类方法
CN104318215A (zh) * 2014-10-27 2015-01-28 中国科学院自动化研究所 一种基于域鲁棒卷积特征学习的交叉视角人脸识别方法

Also Published As

Publication number Publication date
CN106203442A (zh) 2016-12-07

Similar Documents

Publication Publication Date Title
Zhang et al. A full convolutional network based on DenseNet for remote sensing scene classification
CN105512289B (zh) 基于深度学习和哈希的图像检索方法
CN105678284B (zh) 一种固定位人体行为分析方法
CN110428428A (zh) 一种图像语义分割方法、电子设备和可读存储介质
CN110222140A (zh) 一种基于对抗学习和非对称哈希的跨模态检索方法
CN113065558A (zh) 一种结合注意力机制的轻量级小目标检测方法
CN107220657A (zh) 一种面向小数据集的高分辨率遥感影像场景分类的方法
CN112488210A (zh) 一种基于图卷积神经网络的三维点云自动分类方法
CN112052783B (zh) 一种结合像素语义关联和边界注意的高分影像弱监督建筑物提取方法
CN109389051A (zh) 一种基于卷积神经网络的建筑物遥感图像识别方法
CN110415170A (zh) 一种基于多尺度注意力卷积神经网络的图像超分辨率方法
CN103823845B (zh) 一种基于深度学习的遥感影像自动标注方法
CN106909924A (zh) 一种基于深度显著性的遥感影像快速检索方法
CN105243154B (zh) 基于显著点特征和稀疏自编码的遥感图像检索方法及系统
CN111340814A (zh) 一种基于多模态自适应卷积的rgb-d图像语义分割方法
CN107391709A (zh) 一种基于新型注意模型进行图像字幕生成的方法
Xiao et al. TTST: A top-k token selective transformer for remote sensing image super-resolution
CN111325271B (zh) 图像分类方法及装置
CN107392130A (zh) 基于阈值自适应和卷积神经网络的多光谱图像分类方法
CN106503729A (zh) 一种基于顶层权值的图像卷积特征的生成方法
CN108062421A (zh) 一种大规模图片多尺度语义检索方法
CN109117894B (zh) 一种基于全卷积神经网络的大尺度遥感图像楼房分类方法
CN104298974A (zh) 一种基于深度视频序列的人体行为识别方法
CN108932455B (zh) 遥感图像场景识别方法及装置
CN106203442B (zh) 一种基于深度学习的拷贝图像特征提取方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant