CN110147828B

CN110147828B - 一种基于语义信息的局部特征匹配方法及系统

Info

Publication number: CN110147828B
Application number: CN201910356650.2A
Authority: CN
Inventors: 陈凯锐; 叶培楚
Original assignee: Guangdong University of Technology
Current assignee: Guangdong University of Technology
Priority date: 2019-04-29
Filing date: 2019-04-29
Publication date: 2022-12-16
Anticipated expiration: 2039-04-29
Also published as: CN110147828A

Abstract

本发明公开了一种基于语义信息的局部特征匹配方法及系统，该方法的步骤包括：S1.获取图像，包括预先注册的标准图像和待匹配的目标图像；S2.通过卷积神经网络提取所述图像的卷积特征图，构建所述图像的深度学习特征向量；S3.对所述图像的深度学习特征向量进行特征匹配，确定最优的匹配对，将所述匹配对映射到所述图像的对应区域；S4.对所述映射的对应区域提取手工特征向量；S5.对所述手工特征向量进行基于语义信息的特征匹配，得到匹配分数，基于分数阈值条件对所述匹配分数进行筛选得到匹配结果。本发明通过结合语义信息进行特征匹配，将特征匹配的搜索范围大大缩小，提高了匹配的效率和准确率。

Description

一种基于语义信息的局部特征匹配方法及系统

技术领域

本发明涉及图像处理技术领域，尤其涉及一种基于语义信息的局部特征匹配方法及系统。

背景技术

局部特征匹配技术是一种利用人工设计的基于图像局部信息生成对应特征描述子并基于此类特征描述子在两帧图像之间计算对应匹配关系的技术。特征匹配目前被广泛应用于人脸识别、三维重建和机器人视觉定位等众多需要基于重叠信息的图像处理领域。

目前局部特征匹配技术主要有两大类，其一是最近邻匹配法，即对当前帧的每一个特征描述子都与参考帧中的所有描述子计算匹配距离，取参考帧中匹配距离最近的特征描述子与预设阈值进行比较，确定其是否为最优匹配；其二是基于最近邻法改进的最近邻比例法，即对当前帧的每一个特征描述子都与参考帧中的所有描述子计算匹配距离，取参考帧中匹配距离最近和匹配距离次近的比例与预设阈值进行比较，确定匹配距离最近的特征描述子是否为最优匹配。然而，上述两种匹配方法在匹配过程中，对于当前帧每个特征描述子都需要与参考帧中所有特征描述子一一计算匹配距离，因此这两种匹配方法非常耗时，且无法保证匹配的准确性。

发明内容

本发明为解决现有的局部特征匹配技术匹配效率低并且无法保证匹配的准确性等问题，提供了一种基于语义信息的局部特征匹配方法及系统。

为实现以上发明目的，而采用的技术手段是：

一种基于语义信息的局部特征匹配方法，包括：

S1.获取图像，包括预先注册的标准图像和待匹配的目标图像；

S2.通过卷积神经网络提取所述图像的卷积特征图，构建所述图像的深度学习特征向量；

S3.对所述图像的深度学习特征向量进行特征匹配，确定最优的匹配对，将所述匹配对映射到所述图像的对应区域；

S4.对所述映射的对应区域提取手工特征向量；

S5.对所述手工特征向量进行基于语义信息的特征匹配，得到匹配分数，基于分数阈值条件对所述匹配分数进行筛选得到匹配结果。

上述方案中，通过卷积神经网络提取图像的卷积特征图，并基于卷积特征图构建深度学习特征向量，对深度学习特征向量进行特征匹配确定匹配区域，然后对匹配区域提取手工特征向量并进一步基于语义信息进行特征匹配，基于分数阈值条件确定匹配结果。

优选的，所述步骤S2具体包括：

S21.对获取的所有图像分别按照所述卷积神经网络规定的图像尺寸大小W_O×H_O×D_O进行下采样与裁剪处理，处理后分别得到标准图像

以及目标图像

S22.构建卷积神经网络，所述卷积神经网络由N个卷积层组成，即h_Vgg＝{h₁,h₂,…,h_N}，其中N为正整数；

S23.将目标图像

以及标准图像

分别依次与所述卷积神经网络中的前L个卷积层进行卷积，即

生成目标图像I_in的卷积特征图

其中所述目标图像I_in的卷积特征图的大小为W×H，深度为D其中L∈[1,N]；

生成标准图像I_re的卷积特征图

其中所述标准图像I_re的卷积特征图的大小为W×H，深度为D其中L∈[1,N]；

在本优选方案中，将目标图像I_in和标准图像I_re进行压缩提炼，得到大小为W×H，深度为D的卷积特征图，该卷积特征图中的每一个像素对应所述图像的一个区域，并用D个深度的信息来描述对应区域；

S24.利用所述目标图像I_in和标准图像I_re的卷积特征图分别构建深度学习特征向量，分别为：

其中，

即对所述目标图像I_in和标准图像I_re构建W×H个维度为D的深度学习特征向量。

优选的，所述步骤S3具体包括以下步骤：

S31.为所述目标图像I_in的每一个深度学习特征向量在所述标准图像I_re的深度学习特征向量中进行匹配，即：

记录在所述匹配中分数最高的深度学习特征向量的对应ID，得到所述目标图像I_in深度学习特征向量在所述标准图像I_re深度学习特征向量中最优的匹配对，即：

其中，m₁,m₂,…,m_W×H∈[1,W×H]；

S32.将所述匹配对映射到所述图像，具体为：

每一个所述深度学习特征向量dⁱ∈dF对应所述目标图像I_in和标准图像I_re的区域大小为：

其中所述目标图像I_in和标准图像I_re的大小为W_o×H_o，对应卷积特征图的大小为W×H；

对任意一个所述深度学习特征向量d^i×j∈dF，其映射到所述目标图像I_in和标准图像I_re的对应区域表示为：

优选的，所述步骤S4具体包括以下步骤：

对所述目标图像I_in和标准图像I_re的每个映射的对应区域提取手工特征向量，分别为：

。其中，k不一定等于K，m不一定等于M，n不一定等于N。

在本优选方案中，所述目标图像I_in和标准图像I_re各有W×H个区域，由于图像纹理不同，不同区域提取的手工特征向量数量不同，不同图像相同区域提取的手工特征向量也不同。其中提取手工特征向量可以提取如SIFT、HOG、DOG、ORB、SURF等特征向量。

优选的，所述步骤S5具体包括以下步骤：

S51.根据步骤S3中所述的最优的匹配对，建立基于语义信息的匹配区域：

其中，m₁，m₂,…,m_W×H∈[1，W×H]；

S52.根据所述基于语义信息的匹配区域，在对应的匹配区域进行手工特征向量匹配，其中对于所述目标图像I_in的第一个匹配区域

所述标准图像I_re的匹配区域

计算匹配分数：

其中任意两个手工特征向量的匹配分数为：

其中i表示第一个匹配区域的第i个手工特征向量，j表示对应匹配区域的第j个手工特征向量；

S53.选取所述匹配分数siftMatchScores每行中最大的为最优匹配，

则筛选后所述目标图像I_in所有匹配区域的手工特征向量匹配分数为：

即得到局部特征匹配的匹配结果。

本发明还提供了一种基于语义信息的局部特征匹配系统，包括图像采集模块、深度学习模块、深度学习特征处理模块、手工特征向量提取模块和图像识别模块；

所述图像采集模块，用于获取图像，包括预先注册的标准图像和待匹配的目标图像；

所述深度学习模块，用于通过卷积神经网络提取所述图像的卷积特征图，构建所述图像的深度学习特征向量；

所述深度学习特征处理模块，用于对所述图像的深度学习特征向量进行特征匹配，确定最优的匹配对，将所述匹配对映射到所述图像的对应区域；

所述手工特征向量提取模块，用于对所述映射的对应区域提取手工特征向量；

所述图像识别模块，用于对所述手工特征向量进行基于语义信息的特征匹配，得到匹配分数，基于分数阈值条件对所述匹配分数进行筛选得到匹配结果。

上述方案中，通过图像采集模块获取图像，经过深度学习模块中的卷积神经网络提取图像的卷积特征图，并基于卷积特征图构建深度学习特征向量，然后通过深度学习特征处理模块对深度学习特征向量进行特征匹配确定匹配区域，通过手工特征向量提取模块对匹配区域提取手工特征向量，最后由图像识别模块对所述手工特征向量进行基于语义信息的特征匹配，得到匹配分数，基于分数阈值条件对所述匹配分数进行筛选得到匹配结果。

优选的，所述深度学习模块包括图像预处理子模块、卷积神经网络构建子模块、卷积特征图提取子模块和深度学习特征向量构建子模块；

所述图像预处理子模块，用于对获取的所有图像分别按照所述卷积神经网络规定的图像尺寸大小W_O×H_O×D_O进行下采样与裁剪处理，处理后分别得到标准图像

以及目标图像

所述卷积神经网络构建子模块，用于构建卷积神经网络，所述卷积神经网络由N个卷积层组成，即h_Vgg＝{h₁,h₂,…,h_N}，其中N为正整数；

所述卷积特征图提取子模块，用于将目标图像

以及标准图像

分别依次与所述卷积神经网络中的前L个卷积层进行卷积，即

生成目标图像I_in的卷积特征图

生成标准图像I_re的卷积特征图

所述深度学习特征向量构建子模块，用于利用所述目标图像I_in和标准图像I_re的卷积特征图分别构建深度学习特征向量，分别为：

其中，

优选的，所述深度学习特征处理模块包括深度学习特征匹配子模块和匹配对映射子模块；

所述深度学习特征匹配子模块，用于为所述目标图像I_in的每一个深度学习特征向量在所述标准图像I_re的深度学习特征向量中进行匹配，即：

其中，m₁，m₂,…,m_W×H∈[1，W×H]；

所述匹配对映射子模块，用于将所述匹配对映射到原始图像，具体为：

优选的，所述手工特征向量提取模块具体用于：对所述目标图像I_in和标准图像I_re的每个映射的对应区域提取手工特征向量，分别为：

。其中，k不一定等于K，m不一定等于M，n不一定等于N。

优选的，所述图像识别模块包括匹配区域建立子模块、匹配分数计算子模块、匹配结果确定子模块；

所述匹配区域建立子模块，用于根据所述深度学习特征处理模块中得到的最优的匹配对，建立基于语义信息的匹配区域：

其中，m₁，m₂,…,m_W×H∈[1，W×H]；

所述匹配分数计算子模块，用于根据所述基于语义信息的匹配区域，在对应的匹配区域进行手工特征向量匹配，其中对于所述目标图像I_in的第一个匹配区域

所述标准图像I_re的匹配区域

计算匹配分数：

其中任意两个手工特征向量的匹配分数为：

所述匹配结果确定子模块，用于选取所述匹配分数siftMatchScores每行中最大的为最优匹配，

即得到局部特征匹配的匹配结果。

与现有技术相比，本发明技术方案的有益效果是：

本发明的方法以及系统，在图像的局部特征匹配过程，通过卷积神经网络提取图像的卷积特征图，并基于卷积特征图构建深度学习特征向量，对深度学习特征向量进行特征匹配确定匹配区域，构建了深度学习特征向量与匹配区域的一一映射关系，然后对匹配区域提取手工特征向量并进一步基于语义信息进行特征匹配，基于分数阈值条件进行筛选从而确定匹配结果。由于结合了语义信息，将特征匹配的搜索范围大大缩小，匹配过程中无需将当前帧每个特征描述子与参考帧中所有特征描述子一一计算匹配距离，极大地提高了局部特征匹配的效率以及准确率，解决了现有的局部特征匹配技术匹配效率低并且无法保证匹配的准确性等问题。

附图说明

图1为本发明方法的流程图。

图2位本发明系统的模块图。

具体实施方式

附图仅用于示例性说明，不能理解为对本专利的限制；

为了更好说明本实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；

对于本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。

下面结合附图和实施例对本发明的技术方案做进一步的说明。

实施例1

如图1所示，一种基于语义信息的局部特征匹配方法，包括：

S2.通过卷积神经网络提取所述图像的卷积特征图，构建所述图像的深度学习特征向量；其中本实施例1选用的为VggFace卷积神经网络；

S21.对获取的所有图像分别按照VggFace卷积神经网络规定的图像尺寸大小W_O×H_O×D_O，224×224×3具体为进行下采样与裁剪处理，处理后分别得到标准图像

以及目标图像

S22.构建VggFace卷积神经网络，VggFace卷积神经网络由16个卷积层组成，即h_Vgg＝{h₁,h₂,…,h₁₆}；

S23.将目标图像

以及标准图像

分别依次与VggFace卷积神经网络h_Vgg中的前L个卷积层进行卷积，即

分别生成目标图像I_in和标准图像I_re的卷积特征图

和

其中L∈[1,16]；

其中，

其中，m₁,m₂,…,m_W×H∈[1,W×H]；

S32.将所述匹配对映射到所述图像，具体为：

S4.对所述映射的对应区域提取手工特征向量；本实施例1提取的手工特征向量为SIFT特征向量，实际使用本发明方法时可提取其他手工特征向量，如HOG,DOG,ORB,SURF特征向量等；

对所述目标图像I_in和标准图像I_re的每个映射的对应区域提取SIFT特征向量，分别为：

其中，k不一定等于K，m不一定等于M，n不一定等于N。

其中，m₁，m₂,…,m_W×H∈[1，W×H]；

所述标准图像I_re的匹配区域

计算匹配分数：

其中任意两个手工特征向量的匹配分数为：

S53.选取所述匹配分数siftMatchScores每行中最大的为最优匹配，

则筛选后所述目标图像I_in所有匹配区域的手工特征向量匹配结果为：

即得到局部特征匹配的匹配结果。

本实施例1通过VggFace卷积神经网络提取图像的卷积特征图，并基于卷积特征图构建深度学习特征向量，对深度学习特征向量进行特征匹配确定匹配区域，构建了深度学习特征向量与匹配区域的一一映射关系，然后对匹配区域提取SIFT特征向量并进一步基于语义信息进行特征匹配，基于分数阈值条件进行筛选从而确定匹配结果。由于结合了语义信息，将特征匹配的搜索范围大大缩小，匹配过程中无需将当前帧每个特征描述子与参考帧中所有特征描述子一一计算匹配距离，极大地提高了局部特征匹配的效率以及准确率。

实施例2

如图2所示，一种基于语义信息的局部特征匹配系统，包括图像采集模块1、深度学习模块2、深度学习特征处理模块3、手工特征向量提取模块4和图像识别模块5；

所述图像采集模块1，用于获取图像，包括预先注册的标准图像和待匹配的目标图像；

所述深度学习模块2，用于通过卷积神经网络提取所述图像的卷积特征图，构建所述图像的深度学习特征向量；

所述深度学习特征处理模块3，用于对所述图像的深度学习特征向量进行特征匹配，确定最优的匹配对，将所述匹配对映射到所述图像的对应区域；

所述手工特征向量提取模块4，用于对所述映射的对应区域提取手工特征向量；

所述图像识别模块5，用于对所述手工特征向量进行基于语义信息的特征匹配，得到匹配分数，基于分数阈值条件对所述匹配分数进行筛选得到匹配结果。

其中，所述深度学习模块2包括图像预处理子模块、卷积神经网络构建子模块、卷积特征图提取子模块和深度学习特征向量构建子模块；

以及目标图像

所述卷积特征图提取子模块，用于将目标图像

以及标准图像

分别依次与所述卷积神经网络中的前L个卷积层进行卷积，即

分别生成目标图像I_in和标准图像I_re的卷积特征图

和

其中L∈[1,N]；

其中，

其中，所述深度学习特征处理模块3包括深度学习特征匹配子模块和匹配对映射子模块；

其中，m₁，m₂,…,m_W×H∈[1，W×H]；

其中，所述手工特征向量提取模块4具体用于：对所述目标图像I_in和标准图像I_re的每个映射的对应区域提取手工特征向量，分别为：

其中，所述图像识别模块5包括匹配区域建立子模块、匹配分数计算子模块、匹配结果确定子模块；

其中，m₁，m₂,…,m_W×H∈[1，W×H]；

所述标准图像I_re的匹配区域

计算匹配分数：

其中任意两个手工特征向量的匹配分数为：

即得到局部特征匹配的匹配结果。

本实施例2用于进行人脸的局部特征匹配，在图像采集模块中，选用相机进行拍摄从而获取待匹配的人脸目标图像。

另外，本实施例2还增设了结果反馈模块，所述结果反馈模块用于从图像识别模块中接收匹配结果，然后通过语音提示或屏幕显示的方式反馈匹配结果。

附图中描述位置关系的用语仅用于示例性说明，不能理解为对本专利的限制；

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。