CN111507360A

CN111507360A - 一种基于深度学习的曲线特征描述方法

Info

Publication number: CN111507360A
Application number: CN202010284244.2A
Authority: CN
Inventors: 霍占强; 杜光星; 雒芬; 乔应旭; 宋素玲
Original assignee: Henan University of Technology
Current assignee: Henan University of Technology
Priority date: 2020-04-13
Filing date: 2020-04-13
Publication date: 2020-08-07

Abstract

本发明涉及一种基于深度学习的曲线特征描述方法，包括：利用现有曲线检测方法获取图像对中的曲线；获取正确匹配曲线对；确定曲线对应的图像块；构建图像块数据集；对输入数据进行预处理；搭建卷积神经网络；利用三元组边际损失函数计算新的网络参数；更新神经网络参数直到达到指定的次数；获取输入曲线的描述子。本发明提供的方法可以获得可区分性更强和鲁棒性更高的曲线特征描述子。

Description

一种基于深度学习的曲线特征描述方法

技术领域

本发明涉及深度学习领域和计算机视觉中的图像特征描述领域，特别是数字图像中曲线特征描述方法。

背景技术

曲线特征描述技术是计算机视觉、模式识别和图像理解等领域的一项关键技术，在物体识别、图像匹配以及三维重建等领域中都有很重要的应用。曲线特征描述与匹配主要是对在同一场景中处于不同时间或不同视角下的两幅或多幅图像中寻找曲线之间的对应关系，首先采用特定的方法对待匹配图像进行曲线提取，然后用相应的算法对曲线进行描述，最后利用匹配准则计算两条曲线间的相似性来实现匹配。目前主流的曲线特征描述方法为手工设计的方法，随深度学习在不同领域的成功应用，使得利用深度学习技术进一步提高曲线描述方法的可区分性高和鲁棒性成为可能。

已知的手工设计的曲线特征描述子主要有MSCD、IOMSD[1]、IOCD[2]、GOCD[3]等。其中MSCD是由直线描述子MSLD[4]推广到曲线得到的，MSCD基于SIFT[5]的邻域位置划分思想，统计曲线上所有像素点各子区域的不变特征，解决了不同长度的曲线的统一描述问题，但在主方向计算不稳定。IOMSD在划分曲线支撑区域时用圆形区域代替矩形区域，避免主方向的计算不稳定问题，但匹配性能不高且不适用于弱纹理图像。IOCD和GOCD这两种曲线特征描述方法，前者是根据亮度序划分子区域及构建描述子，后者依据梯度序划分子区域构建描述子，两种算法对几何光学变换较大的图像都匹配良好，但是匹配耗时较多，无法达到实时匹配的效果。同时，上述四种描述子在复杂条件下都存在可区分性和鲁棒性不强的问题。

参考文献：

1.王志衡,智珊珊,刘红敏.基于亮度序的均值标准差描述子[J].模式识别与人工智能,2012,26(4):409-416.

2.Liu H.M,Zhi S.S,Wang Z.H.,IOCD:Intensity Order Curve Descriptor[J].International Journal of Pattern Recognition and Artificial Intelligence,2013,27(7):1355011-135037.

3.Liu H,Chen L,Wang Z,et al.GOCD:Gradient Order Curve Descriptor[J].Ieice Transactionson Information and Systems,2017,100(12):2973-2983.

4.Wang Zhiheng,Wu Fuchao,Hu Zhanyi.MSLD:A Robust Descriptor for LineMatching[J].Pattern Recognition,2009,42(5):941－953.

5.Lowe D.G.,Distinctive image features from scale-invariant key-points[J].International Journal of Computer Vision,2004,60(2):91-110.

发明内容

本发明针对现有手工设计的曲线特征描述算法在复杂条件下存在的可区分性不强和鲁棒性不高的问题，本发明提出一种可区分性更强和鲁棒性更高的基于深度学习的曲线特征描述方法，包括以下步骤：

步骤S1：构建卷积神经网络的输入图像块数据集，具体如下：

步骤S11：收集图像并进行预处理，组成图像数据集；

步骤S12：利用现有的曲线检测方法获取图像对中的曲线；

步骤S13：获取正确匹配曲线对；

步骤S14：确定曲线对应的图像块，构建图像块数据集；

步骤S2：训练卷积神经网络；

步骤S21：对输入数据进行预处理；

步骤S22：搭建卷积神经网络；

步骤S23：利用三元组边际损失函数计算新的网络参数；

步骤S24：利用步骤S23获得的网络模型参数更新步骤S22搭建的卷积神经网络的参数值；

步骤S25：重复步骤S23、S24，直到参数更新达到指定的次数；

步骤S3：获取输入曲线的描述子。

针对现有手工设计的曲线特征描述方法在复杂条件下存在的可区分性和鲁棒性不强等问题，本发明提出了基于深度学习的曲线特征描述方法。通过将曲线的支撑区域纵向压缩为类似点的支撑区域，获取每条曲线的均值与方差图像块，然后将其输入卷积神经网络中进行训练，最终得到所需的曲线描述子。本发明提供的方法可以获得可区分性更强和鲁棒性更高的曲线特征描述子。

附图说明

图1为本发明基于深度学习的曲线特征描述方法流程图。

图2为本发明卷积神经网络模型的结构图。

具体实施方式

图1所示为本发明基于深度学习的曲线特征描述方法流程图，该方法的主要步骤包括：利用现有曲线检测方法获取图像对中的曲线；获取正确匹配曲线对；确定曲线对应的图像块；构建图像块数据集；对输入数据进行预处理；搭建卷积神经网络；利用三元组边际损失函数计算新的网络参数；更新神经网络参数直到达到指定的次数；获取输入曲线的描述子。各步骤具体实施细节如下：

步骤S1：构建卷积神经网络的输入图像块数据集，具体方式包括步骤S11、S12、S13、S14：

步骤S11：收集图像并进行预处理，组成图像数据集，具体方式为，收集不同场景下的图像，对其进行光照、噪音、模糊以及压缩等不同情况的变化处理，原图像与处理后的图像构成图像对，输入计算机。

步骤S12：利用现有的曲线检测方法获取图像对中的曲线。

步骤S13：获取正确匹配曲线对，具体方式为，对于任一图像对，利用现有的曲线匹配方法进行曲线匹配，然后剔除错误匹配，获得图像对中的正确匹配曲线对集合{(C_j,C_j')_,j＝1,2,…,N_C}，其中C_j表示图像对中第1幅图像中的曲线，C_j'表示图像对中第2幅图像中与C_j正确匹配的曲线，N_C为匹配曲线对的个数。

步骤S14：确定曲线对应的图像块，具体方式为，对于步骤S13获得的正确匹配曲线对集合中的任一由Num(C)个点组成的曲线C，记C上任一像素点为P_{k,k＝1,2,…},Num(C)，将以P_k为中心、沿曲线C方向和曲线C垂直方向的长度均为64的方形区域定义为点Pk的支撑区域，点P_k支撑区域的亮度值矩阵记为I(P_k)，计算曲线C的均值矩阵M(C)＝Mean(I(P₁),I(P₂),…,I(P_Num(C)))和标准差矩阵STD(C)＝Std(I(P₁),I(P₂),…,I(P_Num(C)))，其中Mean表示计算亮度矩阵的均值，Std表示计算亮度矩阵的标准差，则曲线C对应的图像块为A_C＝[M(C),STD(C)]。

步骤S2：训练卷积神经网络，具体方式包括步骤S21、S22、S23、S24、S25：

步骤S21：对输入数据进行预处理，具体方式为，对于步骤S14获得的任一输入图像块A_C＝[M(C),STD(C)]，将AC转换为大小为64×64×2的矩阵A_C'，其中A_C'(:,:,1)＝M(C),A_C'(:,:,2)＝STD(C)，然后对A_C'进行归一化获得

步骤S22：构建卷积神经网络，具体方式为，搭建HardNet卷积神经网络，如图2所示，采用七层的全卷积结构，输入大小为64×64×2的图像块，在每个卷积层之后都使用批量归一化，改变卷积的步长实现下采样，将最后一层卷积核的大小由为8×8修改为16×32，网络输出经过L2归一化处理，输出256维的曲线特征描述子。

步骤S23：利用三元组边际损失函数计算新的网络参数，具体方式为，从步骤S1获得的输入图像块中随机选取n对匹配曲线对应的图像块，经过步骤S21处理后合并为

其中

为曲线C_j对应的归一化矩阵，

为曲线C_j'对应的归一化矩阵，曲线C_j和C_j'为匹配曲线对；计算n×n大小的距离矩阵D，其中

a_i、b_j分别为

作为输入时步骤S22构建的卷积神经网络输出的特征向量；计算三元组损失函数

其中

代表最接近a_i的非匹配描述子，j_min＝arg min_{j＝1,…,n,j≠i} d(a_i,b_j)，

代表最接近b_i的非匹配描述子，k_min＝arg min_{k＝1,…,n,k≠i} d(a_k,b_i)，利用梯度下降法获取新的网络参数。

步骤S24：利用步骤S23获得的网络模型参数更新步骤S22构建的卷积神经网络的参数值。

步骤S25：重复步骤S23、S24，直到参数更新达到指定的次数。

步骤S3：获取输入曲线的描述子，具体方式为，对于给定的任一图像，根据步骤S12、S13和S14获取图像中任意一条曲线对应的图像块，根据步骤S21对任意一条曲线的图像块进行处理，将结果输入到步骤S2构造的卷积神经网络中，即可输出该曲线的描述子。

Claims

1.一种基于深度学习的曲线特征描述方法，其特征在于，该方法具体包括以下步骤：

步骤S11：收集图像并进行预处理，组成图像数据集，具体方式为，收集不同场景下的图像，对其进行光照、噪音、模糊以及压缩等不同情况的变化处理，原图像与处理后的图像构成图像对，输入计算机；

步骤S12：利用现有的曲线检测方法获取图像对中的曲线；

步骤S13：获取正确匹配曲线对，具体方式为，对于任一图像对，利用现有的曲线匹配方法进行曲线匹配，然后剔除错误匹配，获得图像对中的正确匹配曲线对集合{(C_j,C_j'),_j＝1,2,…,N_C}，其中C_j表示图像对中第1幅图像中的曲线，C_j'表示图像对中第2幅图像中与C_j正确匹配的曲线，N_C为匹配曲线对的个数；

步骤S14：确定曲线对应的图像块，具体方式为，对于步骤S13获得的正确匹配曲线对集合中的任一由Num(C)个点组成的曲线C，记C上任一像素点为P_k,_k＝1,2,…,Num(C)，将以P_k为中心、沿曲线C方向和曲线C垂直方向的长度均为64的方形区域定义为点Pk的支撑区域，点P_k支撑区域的亮度值矩阵记为I(P_k)，计算曲线C的均值矩阵M(C)＝Mean(I(P₁),I(P₂),…,I(P_Num(C)))和标准差矩阵STD(C)＝Std(I(P₁),I(P₂),…,I(P_Num(C)))，其中Mean表示计算亮度矩阵的均值，Std表示计算亮度矩阵的标准差，则曲线C对应的图像块为A_C＝[M(C),STD(C)]；

步骤S22：构建卷积神经网络，具体方式为，搭建HardNet卷积神经网络，采用七层的全卷积结构，输入大小为64×64×2的图像块，在每个卷积层之后都使用批量归一化，改变卷积的步长实现下采样，将最后一层卷积核的大小由为8×8修改为16×32，网络输出经过L2归一化处理，输出256维的曲线特征描述子；

其中

为曲线C_j对应的归一化矩阵，

a_i、b_j分别为

其中

代表最接近a_i的非匹配描述子，j_min＝arg min_{j＝1,…,n,j≠i}d(a_i,b_j)，

代表最接近b_i的非匹配描述子，k_min＝arg min_{k＝1,…,n,k≠i}d(a_k,b_i)，利用梯度下降法获取新的网络参数；

步骤S24：利用步骤S23获得的网络模型参数更新步骤S22构建的卷积神经网络的参数值；

步骤S25：重复步骤S23、S24，直到参数更新达到指定的次数；