CN110211164B

CN110211164B - 基于神经网络学习基础图形的特征点算子的图片处理方法

Info

Publication number: CN110211164B
Application number: CN201910487712.3A
Authority: CN
Inventors: 崔岩
Original assignee: China Germany Zhuhai Artificial Intelligence Institute Co ltd; 4Dage Co Ltd
Current assignee: China Germany Zhuhai Artificial Intelligence Institute Co ltd; 4Dage Co Ltd
Priority date: 2019-06-05
Filing date: 2019-06-05
Publication date: 2021-05-07
Anticipated expiration: 2039-06-05
Also published as: CN110211164A

Abstract

本发明公开了基于神经网络学习基础图形的特征点算子的图片处理方法，包括：渲染合成几何模型的数据集，标出感兴趣点；搭建包括双分支的层归一化全卷积神经网络；将几何模型数据集用于神经网络训练；神经网络对真实图片匹配集进行适应域迁移，获得真实图片的感兴趣点标签；获得真实图片的感兴趣点标签；将真实图片及该真实图片的Affine变换后的孪生图片一并喂入S6中最新训练好的第神经网络进行训练，及获得感兴趣点的概率图及每个感兴趣点作描述子编码；利用神经网络对任意两个不同视角的图片进行处理，获得每张图片的感兴趣点以及其描述子，匹配两张照片的特征点。本发明使图像的特征点算子的提取更加稳固、更加可靠。

Description

基于神经网络学习基础图形的特征点算子的图片处理方法

技术领域

本发明涉及照相机图片处理技术领域，具体涉及一种基于神经网络学习基础图形的特征点算子的图片处理方法。

背景技术

图片的特征点是理想状态下图片上具有唯一表示的点，比如，线段的端点以及几何模式的角点等，均拥有比普通像素点更具有特殊意义的点，也就是我们所需要的寻找的感兴趣点，在传统的特征点描述子算法中，例如SIFT、AKAZE、ORB等特征点，往往是根据图像块的梯度方向、尺度不变性、方向不变性等人工设计的模式提取算法来获得感兴趣点，以及计算感兴趣点的描述子，而这种基于传统计算机图像处理的方法往往存在一定的局限性，因为人不可能把所有情况都考虑周全，特别是在纹理缺失或者纹理重复的区域，特征点描述子往往表现的不够稳固，常常出现错误匹配的问题。

发明内容

基于现有技术的不足，本发明的目的在于提供一种基于神经网络学习基础图形的特征点算子的图片处理方法，使图像的特征点算子的提取更加稳固、更加可靠，即使在纹理重复以及纹理缺失的情景下也仍然能够取得稳固的结果。

本发明的技术方案为：

基于神经网络学习基础图形的特征点算子的图片处理方法，其特征在于包括：

S1，渲染合成几何模型的数据集，其中，数据集中包括了包括灰度信息的各种基础几何图像，标出图像中的感兴趣点；

S2，搭建包括一个双分支的层归一化全卷积神经网络，即第一神经网络，其中第一分支用于感兴趣点检测，第二分支用于特征点描述子编码；

S3，将渲染合成好的几何模型数据集用于第一神经网络训练，让第一神经网络学习图像的基本特征，通过第一神经网络中的第一分支来检测合成图像的感兴趣点，当第一神经网络能够检测出所有几何图像的关键点时为训练好的第二神经网络；

S4，利用图片的Affine变化对真实图片处理，获得原始图片的变换后的匹配集及其变换关系，并利用S3中第二神经网络对真实图片匹配集进行适应域迁移，并为真实图片进行标注，获得真实图片的感兴趣点标签；

S5，在S4中的真实图片上训练S3中训练好的第二神经网络，使第二神经网络能够检测真实图片的感兴趣点，得到第三神经网络，并测量第三神经网络在真实图片上感兴趣点的重复匹配率；

S6，利用S5中的第三神经网络，重新对步骤S4中的真实图片匹配集进行适应域迁移，并为真实图片进行标注，重新获得真实图片的感兴趣点标签，重复S5和S6 N次，重新训练神经网络，在获得稳固的神经网络适应域变换关系及原始图片变换后的匹配集的同时，获得真实图片感兴趣点的重复匹配率满意时的真实图片感兴趣点标签及最新训练好的第M神经网络；

S7，在获得满意的真实图片感兴趣点标签后，将真实图片及该真实图片的Affine变换后的孪生图片一并喂入S6中最新训练好的第M神经网络进行训练，其中，第M神经网络的第一分支用于计算感兴趣点的位置，及分析获得感兴趣点的概率图，第二分支对图片上的每个感兴趣点作描述子编码，取得计算结果后，对第M神经网络的两个分支做联合训练，最后得到训练后的第M+1神经网络；

S8，利用第M+1神经网络对任意两个不同视角的图片进行处理，获得每张图片的感兴趣点以及其描述子，匹配两张照片的特征点。

进一步地，S1中数据集中的基础几何图形包括三角面、线段、几何体、棋盘格。

进一步地，S1中在合成几何模型的数据集时在合成图片上需加入高斯噪声。

进一步地，S7中在取得计算结果后，还包括反向传播感兴趣点的回归损失以及两张图片上每个感兴趣点的描述子的匹配损失，进而再对第M神经网络的两个分支做联合训练。

进一步地，对M神经网络的两个分支做联合训练还包括对任意输入的图片进行前向推断。

进一步地，S8中匹配两张图片的特征点包括双向最邻近匹配方法匹配两张图片的特征点。

进一步地，S7中获得感兴趣的概率图包括采用对感兴趣点选择合适的阈值的方法获得理想的感兴趣点。

本发明的有益效果为：基于卷积神经网络，对图片的感兴趣点及感兴趣点描述子进行提取并计算，使图像的特征点算子的提取更加稳固、更加可靠，即使在纹理重复以及纹理缺失的情景下也仍然能够取得稳固的结果，提高的图像处理的效果和精度。

附图说明

图1为本发明方法的流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，基于神经网络学习基础图形的特征点算子的图片处理方法，包括：

S1，渲染合成几何模型的数据集，数据集包括三角面、线段、复杂的几何体、棋盘格等基础几何图像，并标出他们的感兴趣点，与传统方法处理灰度图像一样，本实施例只渲染了灰度图片，为了让训练的卷积神经网络可以不被噪声干扰，在这些合成图片上加入高斯噪声；

S2，搭建一个包括一个双分支的层归一化全卷积神经网络，即第一神经网络，其中第一分支用于感兴趣点检测，第二分支用于特征点描述子编码；

S3，将渲染合成好的几何模型数据集用于第一神经网络训练，让第一神经网络学习图像的基本特征，通过第一神经网络中的第一分支来检测合成图像的感兴趣点，训练好的神经网络能够检测出所有几何图片的关键点，并表现出对真实照片的良好泛化能力；

S6，利用S5中的第三神经网络，重新对步骤S4中的真实图片匹配集进行适应域迁移，并为真实图片进行标注，重新获得真实图片的感兴趣点标签，重复S5和S6 N次，重新训练神经网络，以一种蒸馏的方式来获得更稳固的神经网络适应域变换，在获得稳固的神经网络适应域变换关系及原始图片变换后的匹配集的同时，获得真实图片感兴趣点的重复匹配率满意时的真实图片感兴趣点标签及最新训练好的第M神经网络；

S7，在获得满意的真实图片感兴趣点标签后，将真实图片及该真实图片的Affine变换后的孪生图片一并喂入S6中最新训练好的第M神经网络进行训练，其中，第M神经网络的第一分支用于计算感兴趣点的位置，及分析获得感兴趣点的概率图，第二分支对图片上的每个感兴趣点作描述子编码，取得计算结果后，反向传播感兴趣点的回归损失以及两张图片上每个感兴趣点的描述子的匹配损失，对第M神经网络的两个分支做联合训练，最后得到训练后的第M+1神经网络，对M神经网络的两个分支做联合训练可以对任意输入的图片进行前向推断，神经网络的第一分支获得每张图片的感兴趣点的概率图，选择合适的阈值以获得理想的感兴趣点，神经网络的第二分支取得每个感兴趣点的描述子编码；

基于卷积神经网络，对图片的感兴趣点及感兴趣点描述子进行提取并计算，使图像的特征点算子的提取更加稳固、更加可靠，即使在纹理重复以及纹理缺失的情景下也仍然能够取得稳固的结果，提高的图像处理的效果和精度。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.基于神经网络学习基础图形的特征点算子的图片处理方法，其特征在于包括：

S7，在获得满意的真实图片感兴趣点标签后，将真实图片及该真实图片的Affine变换后的孪生图片一并喂入S6中最新训练好的第M神经网络进行训练，其中，第M神经网络的第一分支用于计算感兴趣点的位置，及获得感兴趣点的概率图，第二分支对图片上的每个感兴趣点作描述子编码，取得计算结果后，对第M神经网络的两个分支做联合训练，最后得到训练后的第M+1神经网络；

2.如权利要求1所述的基于神经网络学习基础图形的特征点算子的图片处理方法，其特征在于：S1中数据集中的基础几何图形包括三角面、线段、几何体、棋盘格。

3.如权利要求1所述的基于神经网络学习基础图形的特征点算子的图片处理方法，其特征在于：S1中在合成几何模型的数据集时在合成图片上需加入高斯噪声。

4.如权利要求1所述的基于神经网络学习基础图形的特征点算子的图片处理方法，其特征在于：S7中在取得计算结果后，还包括反向传播感兴趣点的回归损失以及两张图片上每个感兴趣点的描述子的匹配损失，进而再对第M神经网络的两个分支做联合训练。

5.如权利要求4所述的基于神经网络学习基础图形的特征点算子的图片处理方法，其特征在于：对M神经网络的两个分支做联合训练还包括对任意输入的图片进行前向推断。

6.如权利要求5所述的基于神经网络学习基础图形的特征点算子的图片处理方法，其特征在于：S8中匹配两张图片的特征点包括双向最邻近匹配方法匹配两张图片的特征点。

7.如权利要求1所述的基于神经网络学习基础图形的特征点算子的图片处理方法，其特征在于：S7中获得感兴趣的概率图包括采用对感兴趣点选择合适的阈值的方法获得理想的感兴趣点。