CN110909783A - 一种基于增强重建分类网络的盲领域图像分类与重建方法 - Google Patents

一种基于增强重建分类网络的盲领域图像分类与重建方法 Download PDF

Info

Publication number
CN110909783A
CN110909783A CN201911118540.9A CN201911118540A CN110909783A CN 110909783 A CN110909783 A CN 110909783A CN 201911118540 A CN201911118540 A CN 201911118540A CN 110909783 A CN110909783 A CN 110909783A
Authority
CN
China
Prior art keywords
classification
reconstruction
data
model
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911118540.9A
Other languages
English (en)
Inventor
陶洋
胡昊
鲍灵浪
孙雨浩
郭坦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201911118540.9A priority Critical patent/CN110909783A/zh
Publication of CN110909783A publication Critical patent/CN110909783A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

在实际场景中,测试数据通常与训练数据的分布不同,并且在训练数据上训练的模型在测试数据中的表现可能会更差,从而导致较差的视觉分类性能。该问题主要是由于域偏差引起的,而域适应通过设计减少分布差异的模型来解决此问题。目前的方法依赖自目标域数据样本参与训练。但是,目标域的测试数据一般无法获取。对于这个盲领域适应问题,提出了一种基于增强重建分类网络的盲领域图像分类与重建方法。使用已训练的源域模型的重建管道增强目标域特征,使其更接近源域的正确类。最后可以使用源域模型的分类管道进行分类。在基准数据集上进行的实验证明,方法在跨域视觉识别方面明显优于最新方法。

Description

一种基于增强重建分类网络的盲领域图像分类与重建方法
技术领域
本发明属于图像分类和模式识别领域,特别涉及一种基于增强重建分类网络的盲领域图像分类与重建方法
背景技术
传统机器学习分类算法的基本假设是,训练和测试数据是从同一分布中提取的。但是,在许多现实世界中的计算机视觉应用中,训练和测试数据很少以相同的方式分布。例如,用于面部识别系统的高分辨率ID卡照片和低分辨率嘈杂的监视图像之间的分配可能会有所不同。类似地,从互联网下载用于训练的图像与来自真实场景中不同照明或角度的图像之间的分布也不同。在这种情况下,训练和测试集之间的较大分布差异将削弱训练和测试集所具有的类间差异。因此,设计对分布不匹配具有鲁棒性的分类器非常重要。此问题可以通过领域自适应DA方法解决。
DA算法旨在减少域之间的差异并消除分布不匹配对类间差异的影响。通常,传统的DA方法可以分为半监督和非监督方法。对于半监督方法,训练数据由大量标记的源域数据和有限的标记目标域数据组成。对于无监督方法,训练数据由标记的源域数据和未标记的目标域数据组成。确保无监督的方法更符合实际情况。
从适用场景可以看出,在半监督和非监督域适配中,需要目标域数据参与训练。例如,子空间学习算法主要将项目域与子空间之间的差异最小化以进行域自适应,从而找到一种从源子空间转换为目标子空间的方法或对齐通过投影将源子空间和目标子空间。因此,这些方法的性能将由于目标域的欠采样而受到影响,而后者无法准确计算目标子空间。同样,试图减小源域和目标域之间的分布差异的方法,通常经验最大均值(MMD)等。作为不同分布之间的距离度量。但是这些方法还依赖于足够的目标域数据来准确计算目标域的概率分布。
本发明提出了一种特征增强方法,以减少源域和盲目标域之间的分布不匹配。图2和3展示了我们方法的架构框图。我们的方法主要包括三个步骤:1)首先在源域上学习重构分类网络(RCN)模型。特别是,RCN模型包含重建流水线和分类流水线,仅在全局源域中建立高级语义知识与原始观测数据之间的关联。2)通过训练有素的RCN模型增强目标域样本,以便增强的目标域数据可以在RCN模型重建管道中实现更好的性能。3)使用已经在源域中训练的分类管道对增强数据进行分类。我们在基准数据集上对提出的算法进行了广泛的评估。大量的实验结果表明,即使所提出的方法进行盲学习,它也优于现有的非盲学习方法。
发明内容
本发明提出的一种基于增强重建分类网络的盲领域图像分类与重建方法,针对目标域数据无法获取,导致在训练的模型泛化性差的问题。使用重建分类网络在源域数据上进行联合学习,获得模型后,对目标域数据进行增强,从而得到与源域分布相近的目标与数据,提升图像分类算法精度。
本发明方法的技术方案如下:
步骤1、图像数据集预处理,形成训练集。
对原始数据进行预处理,每个训练样本的原始数据信息为
Figure BDA0002274763260000021
得到包含图像数据的原始数据信息和高层语义信息(标签)矩阵,其中yi∈{0,1}m,m为类别数量。
步骤2、建立源域模型和训练,保证该网络模型包含一个输入通道和两个输出通道。
定义为
Figure BDA0002274763260000022
源域数据和
Figure BDA0002274763260000023
相应的源域标签。fc:
Figure BDA0002274763260000024
为分类管道,fr:
Figure BDA0002274763260000025
为RCN的无监督源域数据重建管道。通过两条管道,建立了原始感知数据与高级语义分类的关系。
定义有关RCN模型的3个函数:编码器部分genc:
Figure BDA0002274763260000026
重建部分grec:
Figure BDA0002274763260000027
和分类部分gcla:
Figure BDA0002274763260000028
对于m类分类问题,通常使用独热编码来表示。给定一个输入源域数据
Figure BDA0002274763260000029
可以得到模型fc和fr,如下所示:
Figure BDA00022747632600000210
Figure BDA00022747632600000211
其中θc={θenccla}表示监督分类和θr={θenccla}无监督重建模型的参数。θenc是编码器genc的共享参数。
目标是找到最优的θcla、θrec和θenc参数。给定标记的源域样本
Figure BDA00022747632600000212
yi∈{0,1}m。将经验损失定义:
Figure BDA00022747632600000213
Figure BDA00022747632600000214
其中
Figure BDA00022747632600000215
采用softmax方式,
Figure BDA00022747632600000216
采用最小均方误差。我们的目标是解决以下目标:
Figure BDA00022747632600000217
目标函数使用Adam优化方法,交替最小化
Figure BDA0002274763260000031
Figure BDA0002274763260000032
当重建损失稳定时,训练过程停止。
步骤3、利用步骤2中的fr(xs)数据重建通道对目标域数据xt进行数据增强;
Figure BDA0002274763260000033
定义为目标域待检测数据。定义一个特征增强器:
Figure BDA0002274763260000034
确保增强的目标域数据的同时减少信息丢失,得到模型fa
fa(xt)=(gaug)(xt)
定义θa表示增强模型gaug的矩阵参数。此时,通过步骤2已经获得了经过训练的参数θenccla和θenc,即获得重建分类网络模型,利用以获得的模型ARCN模型建立如下:
Figure BDA0002274763260000035
此时存在目标域样本
Figure BDA0002274763260000036
我们将经验损失定义为:
Figure BDA0002274763260000037
Figure BDA0002274763260000038
目标获得θa,采用交替优化方法解决以下目标函数:
Figure BDA0002274763260000039
步骤4、一种基于增强重建分类网络的盲领域图像分类与重建方法,将待识别的目标域图像信息输入已训练好的重建分类网络模型,可以同时得到图像分类和图像重建结果。
yt=fc(fa(xt))
附图说明
图1 RCN网络架构图
图2 ARCN网络架构图
图3 ARCN图像重建能力
具体实施方式
基于超限隐表示学习的图像分类与重建方法,架构如图1所示:包含一个输入层、两个输出层,共有一个输入通道和两个输出通道。之后通过联合学习,对网络参数进行更新优化。得到好的分类效果的同时保证了数据的完整性。
下面通过一个实施实例对本发明作进一步说明,其目的仅在于更好地理解本发明的研究内容而非限制本发明的保护范围。具体技术步骤如下:
步骤1、本实施例采用此任务是使用Office和Caltech-256数据集执行的。也是最流行的领域适应数据集。
Office和Caltech-256包含四个不同的域包括C(Caltech-256),A(Amazon),W(Webcam)和D(DSLR)。通过源域和目标域的组合,我们构造了4×3=12个跨域对象数据集C→{A,W,D},A→{C,W,D},W→{C,A,D},D→{C,A,W}。并采用800维SURF特征。
步骤2、本实施例将12个训练集的样本标准化,数据维度为D=800,本实施例取800为输入层大小,并将语义信息标准化为Y,确定隐藏层维度后,随机网络隐藏层和权重参数θencreccla
确定超限学习机图像分类通道输出层大小为10的维度,重建通道维度为800,等于输入通道参数。
确定学习率为αcr,确定惩罚参数λ,β。这时已经将RCN模型设置完毕。包含一个输入通道,两个输出通道。采用交替优化方法进行训练。当参数变化不明显时,停止训练,得到RCN模型。
步骤3、利用RCN模型对目标域数据特征增强得到ARCN模型;
根据模型增强模型,设置输入维度为800,输出维度为800,将目标域数据输入增强器,将增强器的输出连接至RCN模型;
初始化学习率,惩罚系数和权重矩阵。对下式θa进行优化。
Figure BDA0002274763260000041
Figure BDA0002274763260000042
循环运行,直至θa收敛。得到β矩阵。
步骤4、将增强后的目标域测试的样本数据,作为RCN网络输入层的大小,即D=800。将强后的目标域测试输入模型,得到输出的分类信息的数据重建信息。数据重建能力如图3所示,图3中(b)为原始图像,(a)为数据重建后的图像,(c)为重建的误差图像。通过图3,可以看到本模型对数据增强的性能较佳。
本实例将ARCN与传统相关算法作为对比,在12个数据集上进行实验,本实例实验运行10次后取平均值与标准差,实验结果如表1:
Figure BDA0002274763260000051
观察上述图表可知:在测试准确率方面,ARCN算法测试准确率比传统学习算法高,且部分情况远远高于传统的NN和PCA算法;
我们采用了一种新的特征增强方式,使得目标域数据更加的接近于源域数据,效果见图3,可以明显地看到模型对目标域数据的迁移效果。
因此可以说明ARCN算法在准确率、稳定性方面均优于传统算法;而且ARCN算法可以非常有效的迁移目标域特征。

Claims (4)

1.一种基于增强重建分类网络的盲领域图像分类与重建方法,其特征在于包括以下4个步骤:
步骤1、预处理:源域图像数据集,获得源域训练数据集。训练集中包含源域图像数据的原始数据信息Xs和高层语义信息Ys
步骤2、建立源域模型和训练:根据重建分类神经网络模型,将网络模型设置成为单输入通道和双输出通道。两个输出通道分别对应图像分类通道和图像重建通道。根据权重更新和结束规则,联合学习训练网络;
步骤3、建立增强模型并增强:将待识别的目标域图像样本数据,分类和数据重建通道联合学习训练,网络权重更新和结束规则;
步骤4、利用源域模型进行分类:将待识别的图像样本信息输入已训练好的超限隐表示学习模型,得到样本的目标分类和重建信息。
2.一种基于增强重建分类网络的盲领域图像分类与重建方法,其特征在于,所述步骤2中,建立源域模型和训练,保证该网络模型包含一个输入通道和两个输出通道;
输入通道用于接收原始数据或特征信息为xs
重建分类网络图像分类通道输出数据分类信息,重建分类网络图像分类通道和重建分类网络图像重建通道可以分别看作解决如下学习模型:
Figure FDA0002274763250000011
Figure FDA0002274763250000012
其中genc为共享编码函数方法,grec为数据重建函数方法,gcla为数据分类函数方法;交替优化目标函数:
min(fc(xs)-ys)+(fr(xs)-xs)。
3.一种基于增强重建分类网络的盲领域图像分类与重建方法,其特征在于,所述步骤3中,利用步骤2中的fr(xs)数据重建通道对目标域数据xt进行数据增强;
基于重建分类网络的盲领域图像增强模型如下:
Figure FDA0002274763250000013
交替优化目标函数:
min(fr(fa(xt))-xt)+(fa(xt)-xt)。
4.一种基于增强重建分类网络的盲领域图像分类与重建方法,其特征在于,所述步骤4中,将待识别的目标域图像信息输入已训练好的重建分类网络模型,可以同时得到图像分类和图像重建结果。
CN201911118540.9A 2019-11-15 2019-11-15 一种基于增强重建分类网络的盲领域图像分类与重建方法 Pending CN110909783A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911118540.9A CN110909783A (zh) 2019-11-15 2019-11-15 一种基于增强重建分类网络的盲领域图像分类与重建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911118540.9A CN110909783A (zh) 2019-11-15 2019-11-15 一种基于增强重建分类网络的盲领域图像分类与重建方法

Publications (1)

Publication Number Publication Date
CN110909783A true CN110909783A (zh) 2020-03-24

Family

ID=69817512

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911118540.9A Pending CN110909783A (zh) 2019-11-15 2019-11-15 一种基于增强重建分类网络的盲领域图像分类与重建方法

Country Status (1)

Country Link
CN (1) CN110909783A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111597760A (zh) * 2020-05-18 2020-08-28 哈尔滨工业大学(威海) 一种实现小样本条件下获取气路参数偏差值的方法
CN112734643A (zh) * 2021-01-15 2021-04-30 重庆邮电大学 一种基于级联网络的轻量图像超分辨率重建方法
CN116070696A (zh) * 2023-01-10 2023-05-05 中国兵器装备集团自动化研究所有限公司 一种跨域数据深度迁移方法、装置、设备及存储介质
US11704804B2 (en) * 2020-04-02 2023-07-18 GE Precision Healthcare LLC Domain adaptation using post-processing model correction

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107180248A (zh) * 2017-06-12 2017-09-19 桂林电子科技大学 基于联合损失增强网络的高光谱图像分类方法
CN109934295A (zh) * 2019-03-18 2019-06-25 重庆邮电大学 一种基于超限隐特征学习模型的图像分类与重建方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107180248A (zh) * 2017-06-12 2017-09-19 桂林电子科技大学 基于联合损失增强网络的高光谱图像分类方法
CN109934295A (zh) * 2019-03-18 2019-06-25 重庆邮电大学 一种基于超限隐特征学习模型的图像分类与重建方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MUHAMMAD GHIFARY等: "Deep Reconstruction-Classification Networks for Unsupervised Domain Adaptation", 《EUROPEAN CONFERENCE ON COMPUTER VISION》 *
MUHAMMAD UZAIR等: "Blind Domain Adaptation With Augmented Extreme Learning Machine Features", 《IEEE TRANSACTIONS ON CYBERNETICS》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11704804B2 (en) * 2020-04-02 2023-07-18 GE Precision Healthcare LLC Domain adaptation using post-processing model correction
CN111597760A (zh) * 2020-05-18 2020-08-28 哈尔滨工业大学(威海) 一种实现小样本条件下获取气路参数偏差值的方法
CN111597760B (zh) * 2020-05-18 2022-07-22 哈尔滨工业大学(威海) 一种实现小样本条件下获取气路参数偏差值的方法
CN112734643A (zh) * 2021-01-15 2021-04-30 重庆邮电大学 一种基于级联网络的轻量图像超分辨率重建方法
CN116070696A (zh) * 2023-01-10 2023-05-05 中国兵器装备集团自动化研究所有限公司 一种跨域数据深度迁移方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN110909783A (zh) 一种基于增强重建分类网络的盲领域图像分类与重建方法
CN108647583B (zh) 一种基于多目标学习的人脸识别算法训练方法
CN110111297B (zh) 一种基于迁移学习的注塑制品表面图像缺陷识别方法
CN107316061B (zh) 一种深度迁移学习的不平衡分类集成方法
CN111814871A (zh) 一种基于可靠权重最优传输的图像分类方法
CN110929679B (zh) 一种基于gan的无监督自适应行人重识别方法
CN114492574A (zh) 基于高斯均匀混合模型的伪标签损失无监督对抗域适应图片分类方法
CN108052862B (zh) 年龄预估方法和装置
CN112861616B (zh) 一种无源领域自适应目标检测方法
KR20190140824A (ko) 트리플릿 기반의 손실함수를 활용한 순서가 있는 분류문제를 위한 딥러닝 모델 학습 방법 및 장치
CN108446676B (zh) 基于有序编码及多层随机投影的人脸图像年龄判别方法
CN114842267A (zh) 基于标签噪声域自适应的图像分类方法及系统
CN107292272B (zh) 一种在实时传输的视频中人脸识别的方法及系统
CN113436197B (zh) 基于生成对抗和类特征分布的域适应无监督图像分割方法
CN110598759A (zh) 一种基于多模态融合的生成对抗网络的零样本分类方法
CN112699833A (zh) 基于卷积神经网络复杂光照环境下的舰船目标识别方法
CN111126155B (zh) 一种基于语义约束生成对抗网络的行人再识别方法
CN116777896B (zh) 一种表观缺陷跨域分类识别的负迁移抑制方法
CN114140645A (zh) 基于改进自监督特征学习的摄影图像美学风格分类方法
CN113011523A (zh) 一种基于分布对抗的无监督深度领域适应方法
CN117078656A (zh) 一种新型基于多模态提示学习的无监督图像质量评估方法
CN105160336B (zh) 基于Sigmoid函数的人脸识别方法
Adaimi et al. Rethinking person re-identification with confidence
CN116451179A (zh) 一种基于投影重构的领域适应字典对学习方法
CN112541859B (zh) 一种光照自适应的人脸图像增强方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200324