CN110197254B - 基于深度迁移学习的线特征描述方法 - Google Patents

基于深度迁移学习的线特征描述方法 Download PDF

Info

Publication number
CN110197254B
CN110197254B CN201910340616.6A CN201910340616A CN110197254B CN 110197254 B CN110197254 B CN 110197254B CN 201910340616 A CN201910340616 A CN 201910340616A CN 110197254 B CN110197254 B CN 110197254B
Authority
CN
China
Prior art keywords
straight line
line
image
net
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910340616.6A
Other languages
English (en)
Other versions
CN110197254A (zh
Inventor
付苗苗
张一帆
霍占强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongke Nanjing Artificial Intelligence Innovation Research Institute
Henan University of Technology
Original Assignee
Nanjing Artificial Intelligence Chip Innovation Institute Institute Of Automation Chinese Academy Of Sciences
Henan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Artificial Intelligence Chip Innovation Institute Institute Of Automation Chinese Academy Of Sciences, Henan University of Technology filed Critical Nanjing Artificial Intelligence Chip Innovation Institute Institute Of Automation Chinese Academy Of Sciences
Priority to CN201910340616.6A priority Critical patent/CN110197254B/zh
Publication of CN110197254A publication Critical patent/CN110197254A/zh
Application granted granted Critical
Publication of CN110197254B publication Critical patent/CN110197254B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于深度迁移学习的线特征描述方法,包括:采集图像并进行预处理、利用已有技术提取图像中的直线、获取正确匹配直线对、确定直线对应的图像块;构建用于线特征描述的卷积神经网络;利用点特征描述网络的参数初始化线特征描述网络的参数;利用线匹配数据集对网络参数进行调整;利用步骤S4获取的网络参数更新CL2‑Net的参数值;重复参数更新步骤,直到参数更新达到指定的次数;获取输入直线的描述子。本发明提供的方法可获得具有较好辨别能力和鲁棒性的描述子。

Description

基于深度迁移学习的线特征描述方法
技术领域
本发明涉及图像特征描述的技术领域,特别是一种基于深度迁移学习的线特征描述方法。
背景技术
图像特征检测以及匹配一直都是计算机视觉中即重要又备受关注的问题之一,在计算机视觉的各个应用领域中有很多的应用。尤其是在三维重建、物体识别以及图像分类和检索等很多领域中都有非常重要的应用。过去的几年中对该问题的研究已经取得了一些突破性的发展,并且已经为宽基线点、线和区域匹配提出了各种方法。大多数此类的方法都是把局部区域描述成一个具有唯一性的特征描述子并且大多数都是手工设计的描述子,其中最经典和著名的就是shift描述子。所期望的描述子对于匹配块而言不会因为视角、光照、旋转、模糊和噪音等的变化而变化,而同时对于非匹配块而言却要保持不同图像块之间的区分性。
在最近几年中,由于手工设计描述子的蓬勃发展和深度学习在众多领域中的成功应用,以及文献中提供的大规模的点匹配数据集,因此点匹配中出现了基于学习的点特征描述子,其中有Tian等人提出了基于不带度量学习层的全卷积结构的CNN模型L2-net,L2-net的训练是建立在渐进式抽样策略和由三个误差项组成的损失函数之上,并且他们通过优化批次中描述子之间的相对距离来训练L2-net;以及Anastasiya Mishchuk等人受到Lowe的SIFT匹配标准的启发提出了将度量学习的损失应用于L2-net架构的一个名为HardNet的紧凑描述子。然而,直线特征也是最重要的图像特征之一,其在很多场合都有不可替代的作用,比如图像定位和三维重建等。但遗憾的是,与基于学习的点特征描述子相比,文献中还尚未出现基于学习的线特征描述子。原因之一是深度学习依赖于大量的具有标签的训练数据,但是,要构建大规模的高质量的线匹配数据集又需要大量的人力和财力。
发明内容
本发明针对文献中还尚未出现基于学习的线特征描述子、深度学习依赖于大量的具有标签的训练数据、以及构建大规模的高质量的线匹配数据集又需要大量的人力和财力等问题,目的是提供一种具有更强稳定性的基于学习的直线描述子。为了实现本目的,基于深度迁移学习的线特征描述方法,包括以下步骤:
步骤S1:构造线匹配数据集;
步骤S11:采集图像并进行预处理;
步骤S12:利用已有技术提取图像中的直线;
步骤S13:获取正确匹配直线对;
步骤S14:确定直线对应的图像块;
步骤S2:构建用于线特征描述的卷积神经网络;
步骤S3:利用点特征描述网络的参数初始化线特征描述网络的参数;
步骤S4:利用线匹配数据集对网络参数进行调整;
步骤S5:利用步骤S4获取的网络参数更新CL2-Net的参数值;
步骤S6:重复步骤S4、S5,直到参数更新达到指定的次数;
步骤S7:获取输入直线的描述子。
针对上述的问题,本发明提出一种基于深度迁移学习的线特征描述方法,通过首先构建线匹配数据集、然后利用迁移学习,将用大量点匹配数据训练好的具有七层卷积层的全卷积模型参数迁移到线特征描述网络模型中用以初始化线特征描述网络的模型参数,使得在该线匹配数据上获得具有更强辨别能力和鲁棒性的线特征描述子。本发明提供的方法能够克服上述的问题,具有更优的性能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的基于深度迁移学习的线特征描述方法的流程图;
图2为基于深度迁移学习的线特征描述方法的网络架构图。
具体实施方式
如图1所示为本发明基于深度迁移学习的线特征描述方法的流程图,该方法的主要步骤包括:采集图像并进行预处理、利用已有技术提取图像中的直线、获取正确匹配直线对、确定直线对应的图像块、构建用于线特征描述的卷积神经网络、利用点特征描述网络的参数初始化线特征描述网络的参数、利用线匹配数据集对网络参数进行调整、利用获取的网络参数更新CL2-Net的参数值、重复参数更新步骤,直到参数更新达到指定的次数,获取输入直线的描述子。各步骤的具体实施细节如下:
步骤S1:构造线匹配数据集,具体方式包括步骤S11、S12、S13、S14;
步骤S11:采集图像并进行预处理,具体方式为,采集不同场景且不同视角下的图像,然后对其做光照、模糊、噪音以及压缩等变化以形成同一场景不同变化的图像对;
步骤S12:利用已有技术提取图像中的直线;
步骤S13:获取正确匹配直线对,具体方式为,对于任一图像对,利用已有直线匹配技术获取图像对中的匹配直线对,然后人工剔除错误匹配,获得图像对中的正确匹配直线对集合{(Lj,Lj′),j=1,2,...,NL},其中Lj表示图像对中第1幅图像中的直线,Lj′表示图像对中第2幅图像中与Lj正确匹配的直线,NL为匹配直线对的个数;
步骤S14:确定直线对应的图像块,具体方式为,对于步骤S13获得的正确匹配直线对集合中的任一由Num(L)个点组成的直线L,记L上任一像素点为Pk,k=1,2,...,Num(L),将以Pk为中心、64为长和宽的方形区域定义为点Pk的支撑区域,点Pk支撑区域的亮度值矩阵记为I(Pk),计算直线L的均值矩阵M(L)=Mean(I(P1),I(P2),...,I(PNum(L)))和标准差矩阵STD(L)=Std(I(P1),I(P2),...,I(PNum(L))),其中Mean表示计算矩阵的均值,Std表示计算矩阵的标准差,记直线L对应的64×64×2的归一化矩阵为
Figure GDA0003567787890000041
其中AL(:,:,1)=M(L),AL(:,:,2)=STD(L);
步骤S2:构建用于线特征描述的卷积神经网络,卷积神经网络的结构如图2所示:具体方式为,搭建L2-Net卷积神经网络,将第一层卷积核的大小由3×3修改为3×3×2、最后一层卷积核的大小由为8×8修改为16×16,其他设置与L2-Net相同,获得用于线特征描述的卷积神经网络,记为CL2-Net;
步骤S3:利用点特征描述网络的参数初始化线特征描述网络的参数,具体方式为,对于步骤S2获得的CL2-Net,其前三层参数的初始值为训练好的L2-Net的前三层参数值,其中对于第一层2通道的3×3卷积核,任一通道3×3卷积核的值均等于L2-Net第一层3×3卷积核的值;CL2-Net后四层的参数值使用Pytorch中默认的初始化值;
步骤S4:利用线匹配数据集对网络参数进行调整,具体方式为,从步骤S1获得的线匹配数据集中随机选取n对匹配直线,将直线对应的归一化矩阵合并为
Figure GDA0003567787890000051
其中
Figure GDA0003567787890000052
为直线Lj对应的归一化矩阵,
Figure GDA0003567787890000053
为直线Lj′对应的归一化矩阵,直线Lj和Lj′为匹配直线对;计算大小为n×n的距离矩阵D,其中
Figure GDA0003567787890000054
ai、bj分别为
Figure GDA0003567787890000055
作为输入时CL2-Net输出的特征向量;计算三元组损失函数
Figure GDA0003567787890000056
其中
Figure GDA0003567787890000057
代表最接近ai的非匹配描述子,jmin=arg minj=1...n,j≠id(ai,bj),
Figure GDA0003567787890000058
代表最接近bi的非匹配描述子,kmin=arg mink=1...n,k≠id(ak,bi),根据Loss函数利用随机梯度下降法获取新的网络模型参数;
步骤S5:利用步骤S4获取的网络参数更新CL2-Net的参数值;
步骤S6:重复步骤S4、S5,直到参数更新达到指定的次数;
步骤S7:获取输入直线的描述子,具体方式为,对于给定的任一图像,将步骤S1获取的任一直线对应的矩阵输入到步骤S6获得的卷积神经网络中,即可输出该直线的描述子。
针对上述的问题,本发明提出一种基于深度迁移学习的线特征描述方法,通过首先构建线匹配数据集、然后利用迁移学习,将用大量点匹配数据训练好的具有七层卷积层的全卷积模型的参数迁移到线特征描述网络模型中用以初始化线特征描述网络的模型参数,使得在该线匹配数据上获得具有更强辨别能力和鲁棒性的线特征描述子。本发明提供的方法能够克服上述的问题,具有更优的性能。

Claims (1)

1.一种基于深度迁移学习的线特征描述方法,其特征在于,该方法具体包括以下步骤:
步骤S1:构造线匹配数据集,具体方式包括步骤S11、S12、S13、S14;
步骤S11:采集图像并进行预处理,具体方式为,采集不同场景且不同视角下的图像,然后对其做光照、模糊、噪音以及压缩等变化以形成同一场景不同变化的图像对;
步骤S12:利用已有技术提取图像中的直线;
步骤S13:获取正确匹配直线对,具体方式为,对于任一图像对,利用已有直线匹配技术获取图像对中的匹配直线对,然后人工剔除错误匹配,获得图像对中的正确匹配直线对集合{(Lj,Lj′),j=1,2,...,NL},其中Lj表示图像对中第1幅图像中的直线,Lj′表示图像对中第2幅图像中与Lj正确匹配的直线,NL为匹配直线对的个数;
步骤S14:确定直线对应的图像块,具体方式为,对于步骤S13获得的正确匹配直线对集合中的任一由Num(L)个点组成的直线L,记L上任一像素点为Pk,k=1,2,...,Num(L),将以Pk为中心、64为长和宽的方形区域定义为点Pk的支撑区域,点Pk支撑区域的亮度值矩阵记为I(Pk),计算直线L的均值矩阵M(L)=Mean(I(P1),I(P2),...,I(PNum(L)))和标准差矩阵STD(L)=Std(I(P1),I(P2),...,I(PNum(L))),其中Mean表示计算矩阵的均值,Std表示计算矩阵的标准差,记直线L对应的64×64×2的归一化矩阵为
Figure FDA0003567787880000011
其中AL(:,:,1)=M(L),AL(:,:,2)=STD(L);
步骤S2:构建用于线特征描述的卷积神经网络,具体方式为,搭建L2-Net卷积神经网络,将第一层卷积核的大小由3×3修改为3×3×2、最后一层卷积核的大小由为8×8修改为16×16,其他设置与L2-Net相同,获得用于线特征描述的卷积神经网络,记为CL2-Net;
步骤S3:利用点特征描述网络的参数初始化线特征描述网络的参数,具体方式为,对于步骤S2获得的CL2-Net,其前三层参数的初始值为训练好的L2-Net的前三层参数值,其中对于第一层2通道的3×3卷积核,任一通道3×3卷积核的值均等于L2-Net第一层3×3卷积核的值;CL2-Net后四层的参数值使用Pytorch中默认的初始化值;
步骤S4:利用线匹配数据集对网络参数进行调整,具体方式为,从步骤S1获得的线匹配数据集中随机选取n对匹配直线,将直线对应的归一化矩阵合并为
Figure FDA0003567787880000021
其中
Figure FDA0003567787880000022
为直线Lj对应的归一化矩阵,
Figure FDA0003567787880000023
为直线Lj′对应的归一化矩阵,直线Lj和Lj′为匹配直线对;计算大小为n×n的距离矩阵D,其中
Figure FDA0003567787880000024
ai、bj分别为
Figure FDA0003567787880000025
作为输入时CL2-Net输出的特征向量;计算三元组损失函数
Figure FDA0003567787880000026
,其中
Figure FDA0003567787880000027
代表最接近ai的非匹配描述子,jmin=arg minj=1...n,j≠id(ai,bj),
Figure FDA0003567787880000028
代表最接近bi的非匹配描述子,kmin=arg mink=1...n,k≠id(ak,bi),根据Loss函数利用随机梯度下降法获取新的网络模型参数;
步骤S5:利用步骤S4获取的网络参数更新CL2-Net的参数值;
步骤S6:重复步骤S4、S5,直到参数更新达到指定的次数;
步骤S7:获取输入直线的描述子,具体方式为,对于给定的任一图像,将步骤S1获取的任一直线对应的矩阵输入到步骤S6获得的卷积神经网络中,即可输出该直线的描述子。
CN201910340616.6A 2019-04-25 2019-04-25 基于深度迁移学习的线特征描述方法 Active CN110197254B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910340616.6A CN110197254B (zh) 2019-04-25 2019-04-25 基于深度迁移学习的线特征描述方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910340616.6A CN110197254B (zh) 2019-04-25 2019-04-25 基于深度迁移学习的线特征描述方法

Publications (2)

Publication Number Publication Date
CN110197254A CN110197254A (zh) 2019-09-03
CN110197254B true CN110197254B (zh) 2022-05-24

Family

ID=67752180

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910340616.6A Active CN110197254B (zh) 2019-04-25 2019-04-25 基于深度迁移学习的线特征描述方法

Country Status (1)

Country Link
CN (1) CN110197254B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110910433A (zh) * 2019-10-29 2020-03-24 太原师范学院 一种基于深度学习的点云匹配方法
CN111027616B (zh) * 2019-12-06 2023-05-05 中科南京人工智能创新研究院 一种基于端到端学习的线特征描述系统
CN111091577B (zh) * 2019-12-06 2023-06-23 中科南京人工智能创新研究院 基于伪孪生网络的线特征描述方法
CN111507360A (zh) * 2020-04-13 2020-08-07 河南理工大学 一种基于深度学习的曲线特征描述方法
CN112700534B (zh) * 2020-12-30 2022-07-08 华东师范大学 一种基于特征迁移的超声或ct医学影像三维重建方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101315698A (zh) * 2008-06-25 2008-12-03 中国人民解放军国防科学技术大学 基于直线特征图像配准中的特征匹配方法
CN101488223A (zh) * 2008-01-16 2009-07-22 中国科学院自动化研究所 基于曲线均值标准差描述子的图像曲线特征匹配方法
KR20150043697A (ko) * 2013-10-15 2015-04-23 한국과학기술연구원 이분된 로컬 영역을 가지는 윤곽선 분할 기반 특징을 이용한 물체 인식 방법
CN109086782A (zh) * 2018-08-21 2018-12-25 广东工业大学 特征描述子生成方法、装置、设备及计算机可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101488223A (zh) * 2008-01-16 2009-07-22 中国科学院自动化研究所 基于曲线均值标准差描述子的图像曲线特征匹配方法
CN101315698A (zh) * 2008-06-25 2008-12-03 中国人民解放军国防科学技术大学 基于直线特征图像配准中的特征匹配方法
KR20150043697A (ko) * 2013-10-15 2015-04-23 한국과학기술연구원 이분된 로컬 영역을 가지는 윤곽선 분할 기반 특징을 이용한 물체 인식 방법
CN109086782A (zh) * 2018-08-21 2018-12-25 广东工业大学 特征描述子生成方法、装置、设备及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
结合区域仿射变换的MSLD描述子与直线段匹配;王竞雪等;《信号处理》;20180215;全文 *

Also Published As

Publication number Publication date
CN110197254A (zh) 2019-09-03

Similar Documents

Publication Publication Date Title
CN110197254B (zh) 基于深度迁移学习的线特征描述方法
US11715258B2 (en) Method for reconstructing a 3D object based on dynamic graph network
CN109416727B (zh) 一种人脸图像中眼镜去除方法及装置
CN111401452B (zh) 一种基于偏微分算子的等变卷积网络模型的图像分类方法
CN105138973B (zh) 人脸认证的方法和装置
Faraji et al. Face recognition under varying illuminations using logarithmic fractal dimension-based complete eight local directional patterns
CN101458763B (zh) 基于图像加权平均的自动人脸识别方法
CN109949255A (zh) 图像重建方法及设备
CN110909796B (zh) 一种图像分类方法及相关装置
CN110415250B (zh) 一种基于深度学习的重叠染色体分割方法及装置
CN109902585A (zh) 一种基于图模型的手指三模态融合识别方法
CN108734677B (zh) 一种基于深度学习的盲去模糊方法及系统
JP6997369B2 (ja) プログラム、測距方法、及び測距装置
CN113657404B (zh) 一种东巴象形文字的图像处理方法
US20200005078A1 (en) Content aware forensic detection of image manipulations
CN110738660A (zh) 基于改进U-net的脊椎CT图像分割方法及装置
CN108491863A (zh) 基于非负矩阵分解和卷积神经网络的彩色图像处理方法
CN113936176B (zh) 一种基于图卷积和形状描述子的三维点云分类方法
CN109165675A (zh) 基于周期性局部连接卷积神经网络的图像分类方法
CN111091577B (zh) 基于伪孪生网络的线特征描述方法
CN115311691B (zh) 一种基于腕部静脉和腕部纹理的联合识别方法
CN111160262A (zh) 一种融合人体关键点检测的人像分割方法
CN108492256B (zh) 无人机视频快速拼接方法
WO2023060575A1 (zh) 图像识别方法、装置、电子设备及存储介质
US11989927B2 (en) Apparatus and method for detecting keypoint based on deep learning using information change across receptive fields

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 211135 floor 3, building 3, Qilin artificial intelligence Industrial Park, 266 Chuangyan Road, Nanjing, Jiangsu

Patentee after: Zhongke Nanjing artificial intelligence Innovation Research Institute

Patentee after: HENAN POLYTECHNIC University

Address before: 211135 3rd floor, building 3, 266 Chuangyan Road, Jiangning District, Nanjing City, Jiangsu Province

Patentee before: NANJING ARTIFICIAL INTELLIGENCE CHIP INNOVATION INSTITUTE, INSTITUTE OF AUTOMATION, CHINESE ACADEMY OF SCIENCES

Patentee before: HENAN POLYTECHNIC University