CN109614980A - 一种基于半监督广域迁移度量学习的小样本目标识别方法 - Google Patents

一种基于半监督广域迁移度量学习的小样本目标识别方法 Download PDF

Info

Publication number
CN109614980A
CN109614980A CN201811203085.8A CN201811203085A CN109614980A CN 109614980 A CN109614980 A CN 109614980A CN 201811203085 A CN201811203085 A CN 201811203085A CN 109614980 A CN109614980 A CN 109614980A
Authority
CN
China
Prior art keywords
source domain
sample
intermediate field
target
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811203085.8A
Other languages
English (en)
Inventor
陈华杰
侯新雨
姚勤炜
张杰豪
韦玉谭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN201811203085.8A priority Critical patent/CN109614980A/zh
Publication of CN109614980A publication Critical patent/CN109614980A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于半监督广域迁移度量学习的小样本目标识别方法;本发明在源域与目标域之间,利用大量的无标签样本,构建中间域样本;以中间域为桥梁,将单步长距离迁移分解为多步短距离迁移,控制“负迁移”风险;此外,建立选择机制,在源域与中间域样本集合中,选择部分高“正迁移”概率样本,进一步降低“负迁移”风险。本发明的关键在于充分利用目标的先验信息。本发明由于有机结合了多种机器学习方法,突破现有小样本学习方法的局限,方法简单易于实现,对使用传统方法的工程无需重新构造,详细兼容,能够节省大量人力。并且可以与其它小样本目标识别的方法相结合,对提高目标检测识别精度有重要意义。

Description

一种基于半监督广域迁移度量学习的小样本目标识别方法
技术领域
本发明属于深度学习及目标识别技术领域,涉及一种基于半监督 广域迁移度量学习的小样本目标识别方法。
背景技术
在机器学习领域,小样本学习相关的研究工作是近年的发展重 点,其中包括:1)半监督学习:是监督学习与无监督学习相结合的 一种学习方法。半监督学习同时使用标记数据与大量的未标记数据, 来进行模式识别工作。通过挖掘未标记数据中所蕴藏的对标记数据有 补充作用的信息,提高分类器的泛化能力。2)迁移学习:是指利用 数据、任务、或模型之间的相似性,将在旧领域(源域)学习过的模 型,应用于新领域(目标域)的一种学习过程。迁移学习作为机器学 习的一个重要分支,侧重于将已经学习过的知识迁移应用于新的问题 中。迁移学习的核心问题是,找到新问题和原问题之间的相似性,实 现知识的顺利迁移。3)度量学习:亦即相似度学习,是对样本间距 离分布进行建模,使得属于同类样本靠近,异类样本远离。目前比较 好的方法可学习一个端到端的最近邻分类器,它同时受益于带参数和 无参数的优点,对已知样本有很好的泛化性,且对新样本有良好的拓 展能力。
针对遥感影像小样本目标检测识别问题,上述的机器学习方法提 供了可借鉴之处,但若直接套用,则还存在诸多局限:1)半监督学 习对未标记样本的真实类别也有限制等等;2)迁移学习对源域有较 严格的限制,为了保证“正迁移”,要求源域与目标域有强关联。
发明内容
本发明的目的在于针对传统小样本目标识别方法的不足,为深度 学习及视频分析研究提供一种半监督广域迁移度量学习的小样本目 标识别方法。
本发明方法包括以下步骤:
步骤(1)、选择源域图像对、中间域图像对和目标域图像对;
目标域图像对是两个某类具体型号的目标图像,源域图像对是和 目标域图像对类似的图像对,中间域图像对是利用大量的无标签样本 构建的;
步骤(2)、构建特征子网络;
直接提取典型深度网络的前几个卷积层,构建特征子网络;直接 提取典型深度网络为AlexNet、VGG-16或VGG-19。
步骤(3)、构建差异特征向量;
用差异特征向量表示图像对在特征空间上的相对距离,拟将图像 对相应的特征子网络输出相减并转换为一维向量,从而获得差异特征 向量;
步骤(4)、构建编码器、二分类器和解码器;
源域、中间域样本选择依据之一是:入选的源域、中间域样本与 目标域样本一起,经编码与解码后的重构误差对应的代价函数是:
其中fe,fd分别为编码器与解码器,xS,xI,xT分别为源域、中 间域、目标域的差异特征向量,是经编码-解码处理后的 源域、中间域、目标域的重构差异特征向量;νSI分别是源域、中间 域样本是否入选的标示,1代表入选,0代表未入选;nS、nI、nT分 别表示源域、中间域、目标域样本的数量,Lr表征的是入选的源域、 中间域样本与目标域样本的重构误差;
源域、中间域样本选择的另外一个依据是:入选的源域、中间域 样本与目标域样本一起,编码后得到的特征所具备的鉴别性对应的代 价函数是:
其中fc是二分类器,yS,yT是源域、目标域样本的标签;δ(·,·)表 征两个输入参数值是否一致,一致为0,不一致为1;g(z)用于衡量 输入参数的预测的可信度:g(z)=-zlnz-(1-z)ln(1-z);
总的优化目标函数为:
其中θ是fc,fe,fd的参数集合;
当θ固定不变时,源域、中间域样本可根据下式进行选择:
当νSI固定不变时,θ通过误差后向传播算法进行寻优求解;由 此,可通过迭代的方式,学习得到θ与νSI
本发明的有益效果是:广域迁移的目的是拓展源域范围,让更多 的源域样本能够参与到学习中来。广域迁移需要解决的问题是如何将 与目标域相距较远的源域做合理迁移。在源域与目标域中间,引入了 中间域作为一个桥梁来连接二者。为了保证“正迁移”,降低“负迁 移”风险,建立了源域/中间域样本的选择机制,从中挑选出对目标 域样本分类有用的部分样本。本项目给出了一种非目标域样本对目标 域样本的有用性描述方式,进而设计了样本选择算法。
本发明的关键在于充分利用目标的先验信息。本发明由于有机结 合了多种机器学习方法,突破现有小样本学习方法的局限,方法简单 易于实现,对使用传统方法的工程无需重新构造,详细兼容,能够节 省大量人力。并且可以与其它小样本目标识别的方法相结合,对提高 目标检测识别(特别是目标具体型号识别)精度有重要意义。
附图说明
图1为本发明的流程图。
图2为本发明各网络构建设计图。
具体实施方式
本发明所提出的基于半监督广域迁移度量学习的小样本目标识 别方法就是为了拓宽源域的范围,引入中间域概念,利用更多已标注 /未标注的数据。
具体内容包括:
1)半监督广域迁移度量学习的网络结构设计
包含前端的特征子网络以及后端的以自编码器为基本框架的网 络结构设计。
2)源域/中间域样本选择算法
在源域中选择部分已标注样本,在中间域中选择部分未标注样 本,确保入选的样本对目标域的度量学习有“正迁移”效果。
广域迁移的目的是拓宽源域的范围,通过迁移能够利用更多已标 注的数据,从而为目标域的任务带来更多有效信息。广域迁移存在的 问题是当范围拓宽时,源域与目标域的“距离”增大,直接利用源域 样本,“负迁移”的风险增大。解决的思路是:在源域与目标域之间, 利用大量的无标签样本,构建中间域样本;以中间域为桥梁,将单步 长距离迁移分解为多步短距离迁移,控制“负迁移”风险;此外,建 立选择机制,在源域与中间域样本集合中,选择部分高“正迁移”概 率样本,进一步降低“负迁移”风险。
下面结合具体实施例对本发明做进一步的分析。
本实施例采用舰船图像作为样本数据集。在基于半监督广域迁移 度量学习的小样本目标识别过程中具体包括以下步骤,如图1、图2 所示:
步骤(1)、选择源域/中间域/目标域图像对。
目标域图像是某类具体型号目标图像,源域图像对是类似的图像 对,如具体型号的相近类的目标图像。在同一型号或不同型号图像集 中选择图像对,如果2张图像来自同一型号,则该图像对视为正例, 反之则为反例。在源域与目标域之间,利用大量的无标签样本,构建 中间域样本。
步骤(2)、构建特征子网络。
直接提取典型深度网络(AlexNet,VGG-16/VGG-19)的前几个 卷积层,构建特征子网络。
步骤(3)、构建差异特征向量。
用差异特征向量表示图像对在特征空间上的相对距离,拟将图像 对相应的特征子网络输出相减并转换为一维向量,从而获得差异特征 向量。
步骤(4)、构建编码器、二分类器、解码器。
源域/中间域样本选择依据之一是:入选的源域/中间域样本与目 标域样本一起,经编码与解码后的重构误差要小。对应的代价函数是:
其中fe,fd分别为编码器与解码器,xS,xI,xT分别为源域/中 间域/目标域的差异特征向量,是经编码-解码处理后的源 域/中间域/目标域的重构差异特征向量;νSI分别是源域/中间域样本 是否入选的标示,1代表入选,0代表未入选。Lr表征的是入选的源 域/中间域样本与目标域样本的重构误差。
源域/中间域样本选择的另外一个依据是:入选的源域/中间域样 本与目标域样本一起,编码后得到的特征具备较高的鉴别性,有助于 正确分类。对应的代价函数是:
其中fc是二分类器,yS,yT是源域,目标域样本的标签;δ(·,·)表 征2个输入参数值是否一致,一致为0,不一致为1;g(z)用于衡量 输入参数(属于某类的概率)的预测的可信度:
g(z)=-zlnz-(1-z)ln(1-z)。
总的优化目标函数为:
其中θ是fc,fe,fd的参数集合。
当θ固定不变时,源域/中间域样本可根据下式进行选择:
当νSI固定不变时,θ可通过误差后向传播算法进行寻优求解。 由此,可通过迭代的方式,学习得到θ与νSI
上述实施例并非是对于本发明的限制,本发明并非仅限于上述实 施例,只要符合本发明要求,均属于本发明的保护范围。

Claims (2)

1.一种基于半监督广域迁移度量学习的小样本目标识别方法,其特征在于,该方法具体包括以下步骤:
步骤(1)、选择源域图像对、中间域图像对和目标域图像对;
目标域图像对是两个某类具体型号的目标图像,源域图像对是和目标域图像对类似的图像对,中间域图像对是利用大量的无标签样本构建的;
步骤(2)、构建特征子网络;
直接提取典型深度网络的前几个卷积层,构建特征子网络;
步骤(3)、构建差异特征向量;
用差异特征向量表示图像对在特征空间上的相对距离,拟将图像对相应的特征子网络输出相减并转换为一维向量,从而获得差异特征向量;
步骤(4)、构建编码器、二分类器和解码器;
源域、中间域样本选择依据之一是:入选的源域、中间域样本与目标域样本一起,经编码与解码后的重构误差对应的代价函数是:
其中fe,fd分别为编码器与解码器,xS,xI,xT分别为源域、中间域、目标域的差异特征向量,是经编码-解码处理后的源域、中间域、目标域的重构差异特征向量;νSI分别是源域、中间域样本是否入选的标示,1代表入选,0代表未入选;nS、nI、nT分别表示源域、中间域、目标域样本的数量,Lr表征的是入选的源域、中间域样本与目标域样本的重构误差;
源域、中间域样本选择的另外一个依据是:入选的源域、中间域样本与目标域样本一起,编码后得到的特征所具备的鉴别性对应的代价函数是:
其中fc是二分类器,yS,yT是源域、目标域样本的标签;δ(·,·)表征两个输入参数值是否一致,一致为0,不一致为1;g(z)用于衡量输入参数的预测的可信度:g(z)=-zlnz-(1-z)ln(1-z);
总的优化目标函数为:
其中θ是fc,fe,fd的参数集合;
当θ固定不变时,源域、中间域样本可根据下式进行选择:
当νSI固定不变时,θ通过误差后向传播算法进行寻优求解;由此,可通过迭代的方式,学习得到θ与νSI
2.根据权利要求1所述的一种基于半监督广域迁移度量学习的小样本目标识别方法,其特征在于:所述的步骤(2)中直接提取典型深度网络为AlexNet、VGG-16或VGG-19。
CN201811203085.8A 2018-10-16 2018-10-16 一种基于半监督广域迁移度量学习的小样本目标识别方法 Pending CN109614980A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811203085.8A CN109614980A (zh) 2018-10-16 2018-10-16 一种基于半监督广域迁移度量学习的小样本目标识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811203085.8A CN109614980A (zh) 2018-10-16 2018-10-16 一种基于半监督广域迁移度量学习的小样本目标识别方法

Publications (1)

Publication Number Publication Date
CN109614980A true CN109614980A (zh) 2019-04-12

Family

ID=66001641

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811203085.8A Pending CN109614980A (zh) 2018-10-16 2018-10-16 一种基于半监督广域迁移度量学习的小样本目标识别方法

Country Status (1)

Country Link
CN (1) CN109614980A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110161480A (zh) * 2019-06-18 2019-08-23 西安电子科技大学 基于半监督深度概率模型的雷达目标识别方法
CN110555060A (zh) * 2019-09-09 2019-12-10 山东省计算中心(国家超级计算济南中心) 基于成对样本匹配的迁移学习方法
CN110717526A (zh) * 2019-09-23 2020-01-21 华南理工大学 一种基于图卷积网络的无监督迁移学习方法
CN111191510A (zh) * 2019-11-29 2020-05-22 杭州电子科技大学 基于关系网络的复杂场景下遥感图像小样本目标识别方法
CN111583201A (zh) * 2020-04-26 2020-08-25 浙江大学 一种用于构建超分辨率病理显微镜的迁移学习方法
CN113762466A (zh) * 2021-08-02 2021-12-07 国网河南省电力公司信息通信公司 电力物联网流量分类方法及装置
CN114072807A (zh) * 2020-09-10 2022-02-18 南京航空航天大学 基于小样本迁移学习的铣削机器人多模态频响预测方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110320387A1 (en) * 2010-06-28 2011-12-29 International Business Machines Corporation Graph-based transfer learning
CN105787513A (zh) * 2016-03-01 2016-07-20 南京邮电大学 多示例多标记框架下基于域适应迁移学习设计方法和系统
CN105891422A (zh) * 2016-04-08 2016-08-24 重庆大学 基于源域迁移极限学习漂移补偿的电子鼻气体识别方法
CN106055576A (zh) * 2016-05-20 2016-10-26 大连理工大学 一种大规模数据背景下的快速有效的图像检索方法
CN106934235A (zh) * 2017-03-09 2017-07-07 中国科学院软件研究所 一种基于迁移学习的疾病领域间病人相似性度量迁移系统
CN107657279A (zh) * 2017-09-26 2018-02-02 中国科学院大学 一种基于少量样本的遥感目标检测方法
CN107958286A (zh) * 2017-11-23 2018-04-24 清华大学 一种领域适应性网络的深度迁移学习方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110320387A1 (en) * 2010-06-28 2011-12-29 International Business Machines Corporation Graph-based transfer learning
CN105787513A (zh) * 2016-03-01 2016-07-20 南京邮电大学 多示例多标记框架下基于域适应迁移学习设计方法和系统
CN105891422A (zh) * 2016-04-08 2016-08-24 重庆大学 基于源域迁移极限学习漂移补偿的电子鼻气体识别方法
CN106055576A (zh) * 2016-05-20 2016-10-26 大连理工大学 一种大规模数据背景下的快速有效的图像检索方法
CN106934235A (zh) * 2017-03-09 2017-07-07 中国科学院软件研究所 一种基于迁移学习的疾病领域间病人相似性度量迁移系统
CN107657279A (zh) * 2017-09-26 2018-02-02 中国科学院大学 一种基于少量样本的遥感目标检测方法
CN107958286A (zh) * 2017-11-23 2018-04-24 清华大学 一种领域适应性网络的深度迁移学习方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BEN TAN等: "Distant domain transfer learning", 《PROCEEDINGS OF THE THIRTY-FIRST AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110161480A (zh) * 2019-06-18 2019-08-23 西安电子科技大学 基于半监督深度概率模型的雷达目标识别方法
CN110555060B (zh) * 2019-09-09 2023-05-02 山东省计算中心(国家超级计算济南中心) 基于成对样本匹配的迁移学习方法
CN110555060A (zh) * 2019-09-09 2019-12-10 山东省计算中心(国家超级计算济南中心) 基于成对样本匹配的迁移学习方法
CN110717526A (zh) * 2019-09-23 2020-01-21 华南理工大学 一种基于图卷积网络的无监督迁移学习方法
CN110717526B (zh) * 2019-09-23 2023-06-02 华南理工大学 一种基于图卷积网络的无监督迁移学习方法
CN111191510A (zh) * 2019-11-29 2020-05-22 杭州电子科技大学 基于关系网络的复杂场景下遥感图像小样本目标识别方法
CN111191510B (zh) * 2019-11-29 2022-12-09 杭州电子科技大学 基于关系网络的复杂场景下遥感图像小样本目标识别方法
CN111583201A (zh) * 2020-04-26 2020-08-25 浙江大学 一种用于构建超分辨率病理显微镜的迁移学习方法
CN111583201B (zh) * 2020-04-26 2022-04-05 浙江大学 一种用于构建超分辨率病理显微镜的迁移学习方法
CN114072807A (zh) * 2020-09-10 2022-02-18 南京航空航天大学 基于小样本迁移学习的铣削机器人多模态频响预测方法
CN114072807B (zh) * 2020-09-10 2023-04-04 南京航空航天大学 基于小样本迁移学习的铣削机器人多模态频响预测方法
CN113762466A (zh) * 2021-08-02 2021-12-07 国网河南省电力公司信息通信公司 电力物联网流量分类方法及装置
CN113762466B (zh) * 2021-08-02 2023-06-20 国网河南省电力公司信息通信公司 电力物联网流量分类方法及装置

Similar Documents

Publication Publication Date Title
CN109614980A (zh) 一种基于半监督广域迁移度量学习的小样本目标识别方法
CN110796186A (zh) 基于改进的YOLOv3网络的干湿垃圾识别分类方法
CN110414462A (zh) 一种无监督的跨域行人重识别方法及系统
AU2020103716A4 (en) Training method and device of automatic identification device of pointer instrument with numbers in natural scene
CN109063740A (zh) 超声影像关键目标的检测模型构建及检测方法、装置
CN111402259A (zh) 一种基于多层次结构关系学习网络的脑肿瘤分割方法
CN107808375B (zh) 融合多种上下文深度学习模型的水稻病害图像检测方法
CN109671102A (zh) 一种基于深度特征融合卷积神经网络的综合式目标跟踪方法
CN108256464A (zh) 基于深度学习的高分辨率遥感影像城市道路提取方法
CN111968127B (zh) 一种基于全切片病理图像的癌灶区域识别方法及系统
CN105824756B (zh) 一种基于代码依赖关系的过时需求自动检测方法及系统
CN112288013A (zh) 基于元度量学习的小样本遥感场景分类方法
Al-Huda et al. Weakly supervised pavement crack semantic segmentation based on multi-scale object localization and incremental annotation refinement
CN108986142A (zh) 基于置信图峰值旁瓣比优化的遮挡目标跟踪方法
CN112329559A (zh) 一种基于深度卷积神经网络的宅基地目标检测方法
CN110264311A (zh) 一种基于深度学习的商业推广信息精准推荐方法及系统
CN109656808A (zh) 一种基于混合式主动学习策略的软件缺陷预测方法
Sarkar et al. Revolutionizing concrete analysis: An in-depth survey of AI-powered insights with image-centric approaches on comprehensive quality control, advanced crack detection and concrete property exploration
CN117217368A (zh) 预测模型的训练方法、装置、设备、介质及程序产品
Yang et al. PDNet: Improved YOLOv5 nondeformable disease detection network for asphalt pavement
CN113920379B (zh) 一种基于知识辅助的零样本图像分类方法
Zhou et al. SWDet: Anchor-based object detector for solid waste detection in aerial images
CN110414575A (zh) 一种融合局部度量的半监督多标记距离度量学习方法
CN104199649B (zh) 一种用于父子进程间交互信息的路径剖析方法
CN116935329A (zh) 一种类级别对比学习的弱监督文本行人检索方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190412

RJ01 Rejection of invention patent application after publication