CN110909783A - 一种基于增强重建分类网络的盲领域图像分类与重建方法 - Google Patents
一种基于增强重建分类网络的盲领域图像分类与重建方法 Download PDFInfo
- Publication number
- CN110909783A CN110909783A CN201911118540.9A CN201911118540A CN110909783A CN 110909783 A CN110909783 A CN 110909783A CN 201911118540 A CN201911118540 A CN 201911118540A CN 110909783 A CN110909783 A CN 110909783A
- Authority
- CN
- China
- Prior art keywords
- classification
- reconstruction
- data
- model
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
在实际场景中,测试数据通常与训练数据的分布不同,并且在训练数据上训练的模型在测试数据中的表现可能会更差,从而导致较差的视觉分类性能。该问题主要是由于域偏差引起的,而域适应通过设计减少分布差异的模型来解决此问题。目前的方法依赖自目标域数据样本参与训练。但是,目标域的测试数据一般无法获取。对于这个盲领域适应问题,提出了一种基于增强重建分类网络的盲领域图像分类与重建方法。使用已训练的源域模型的重建管道增强目标域特征,使其更接近源域的正确类。最后可以使用源域模型的分类管道进行分类。在基准数据集上进行的实验证明,方法在跨域视觉识别方面明显优于最新方法。
Description
技术领域
本发明属于图像分类和模式识别领域,特别涉及一种基于增强重建分类网络的盲领域图像分类与重建方法
背景技术
传统机器学习分类算法的基本假设是,训练和测试数据是从同一分布中提取的。但是,在许多现实世界中的计算机视觉应用中,训练和测试数据很少以相同的方式分布。例如,用于面部识别系统的高分辨率ID卡照片和低分辨率嘈杂的监视图像之间的分配可能会有所不同。类似地,从互联网下载用于训练的图像与来自真实场景中不同照明或角度的图像之间的分布也不同。在这种情况下,训练和测试集之间的较大分布差异将削弱训练和测试集所具有的类间差异。因此,设计对分布不匹配具有鲁棒性的分类器非常重要。此问题可以通过领域自适应DA方法解决。
DA算法旨在减少域之间的差异并消除分布不匹配对类间差异的影响。通常,传统的DA方法可以分为半监督和非监督方法。对于半监督方法,训练数据由大量标记的源域数据和有限的标记目标域数据组成。对于无监督方法,训练数据由标记的源域数据和未标记的目标域数据组成。确保无监督的方法更符合实际情况。
从适用场景可以看出,在半监督和非监督域适配中,需要目标域数据参与训练。例如,子空间学习算法主要将项目域与子空间之间的差异最小化以进行域自适应,从而找到一种从源子空间转换为目标子空间的方法或对齐通过投影将源子空间和目标子空间。因此,这些方法的性能将由于目标域的欠采样而受到影响,而后者无法准确计算目标子空间。同样,试图减小源域和目标域之间的分布差异的方法,通常经验最大均值(MMD)等。作为不同分布之间的距离度量。但是这些方法还依赖于足够的目标域数据来准确计算目标域的概率分布。
本发明提出了一种特征增强方法,以减少源域和盲目标域之间的分布不匹配。图2和3展示了我们方法的架构框图。我们的方法主要包括三个步骤:1)首先在源域上学习重构分类网络(RCN)模型。特别是,RCN模型包含重建流水线和分类流水线,仅在全局源域中建立高级语义知识与原始观测数据之间的关联。2)通过训练有素的RCN模型增强目标域样本,以便增强的目标域数据可以在RCN模型重建管道中实现更好的性能。3)使用已经在源域中训练的分类管道对增强数据进行分类。我们在基准数据集上对提出的算法进行了广泛的评估。大量的实验结果表明,即使所提出的方法进行盲学习,它也优于现有的非盲学习方法。
发明内容
本发明提出的一种基于增强重建分类网络的盲领域图像分类与重建方法,针对目标域数据无法获取,导致在训练的模型泛化性差的问题。使用重建分类网络在源域数据上进行联合学习,获得模型后,对目标域数据进行增强,从而得到与源域分布相近的目标与数据,提升图像分类算法精度。
本发明方法的技术方案如下:
步骤1、图像数据集预处理,形成训练集。
步骤2、建立源域模型和训练,保证该网络模型包含一个输入通道和两个输出通道。
其中θc={θenc,θcla}表示监督分类和θr={θenc,θcla}无监督重建模型的参数。θenc是编码器genc的共享参数。
步骤3、利用步骤2中的fr(xs)数据重建通道对目标域数据xt进行数据增强;
fa(xt)=(gaug)(xt)
定义θa表示增强模型gaug的矩阵参数。此时,通过步骤2已经获得了经过训练的参数θenc,θcla和θenc,即获得重建分类网络模型,利用以获得的模型ARCN模型建立如下:
目标获得θa,采用交替优化方法解决以下目标函数:
步骤4、一种基于增强重建分类网络的盲领域图像分类与重建方法,将待识别的目标域图像信息输入已训练好的重建分类网络模型,可以同时得到图像分类和图像重建结果。
yt=fc(fa(xt))
附图说明
图1 RCN网络架构图
图2 ARCN网络架构图
图3 ARCN图像重建能力
具体实施方式
基于超限隐表示学习的图像分类与重建方法,架构如图1所示:包含一个输入层、两个输出层,共有一个输入通道和两个输出通道。之后通过联合学习,对网络参数进行更新优化。得到好的分类效果的同时保证了数据的完整性。
下面通过一个实施实例对本发明作进一步说明,其目的仅在于更好地理解本发明的研究内容而非限制本发明的保护范围。具体技术步骤如下:
步骤1、本实施例采用此任务是使用Office和Caltech-256数据集执行的。也是最流行的领域适应数据集。
Office和Caltech-256包含四个不同的域包括C(Caltech-256),A(Amazon),W(Webcam)和D(DSLR)。通过源域和目标域的组合,我们构造了4×3=12个跨域对象数据集C→{A,W,D},A→{C,W,D},W→{C,A,D},D→{C,A,W}。并采用800维SURF特征。
步骤2、本实施例将12个训练集的样本标准化,数据维度为D=800,本实施例取800为输入层大小,并将语义信息标准化为Y,确定隐藏层维度后,随机网络隐藏层和权重参数θenc,θrec,θcla。
确定超限学习机图像分类通道输出层大小为10的维度,重建通道维度为800,等于输入通道参数。
确定学习率为αc,αr,确定惩罚参数λ,β。这时已经将RCN模型设置完毕。包含一个输入通道,两个输出通道。采用交替优化方法进行训练。当参数变化不明显时,停止训练,得到RCN模型。
步骤3、利用RCN模型对目标域数据特征增强得到ARCN模型;
根据模型增强模型,设置输入维度为800,输出维度为800,将目标域数据输入增强器,将增强器的输出连接至RCN模型;
初始化学习率,惩罚系数和权重矩阵。对下式θa进行优化。
循环运行,直至θa收敛。得到β矩阵。
步骤4、将增强后的目标域测试的样本数据,作为RCN网络输入层的大小,即D=800。将强后的目标域测试输入模型,得到输出的分类信息的数据重建信息。数据重建能力如图3所示,图3中(b)为原始图像,(a)为数据重建后的图像,(c)为重建的误差图像。通过图3,可以看到本模型对数据增强的性能较佳。
本实例将ARCN与传统相关算法作为对比,在12个数据集上进行实验,本实例实验运行10次后取平均值与标准差,实验结果如表1:
观察上述图表可知:在测试准确率方面,ARCN算法测试准确率比传统学习算法高,且部分情况远远高于传统的NN和PCA算法;
我们采用了一种新的特征增强方式,使得目标域数据更加的接近于源域数据,效果见图3,可以明显地看到模型对目标域数据的迁移效果。
因此可以说明ARCN算法在准确率、稳定性方面均优于传统算法;而且ARCN算法可以非常有效的迁移目标域特征。
Claims (4)
1.一种基于增强重建分类网络的盲领域图像分类与重建方法,其特征在于包括以下4个步骤:
步骤1、预处理:源域图像数据集,获得源域训练数据集。训练集中包含源域图像数据的原始数据信息Xs和高层语义信息Ys;
步骤2、建立源域模型和训练:根据重建分类神经网络模型,将网络模型设置成为单输入通道和双输出通道。两个输出通道分别对应图像分类通道和图像重建通道。根据权重更新和结束规则,联合学习训练网络;
步骤3、建立增强模型并增强:将待识别的目标域图像样本数据,分类和数据重建通道联合学习训练,网络权重更新和结束规则;
步骤4、利用源域模型进行分类:将待识别的图像样本信息输入已训练好的超限隐表示学习模型,得到样本的目标分类和重建信息。
4.一种基于增强重建分类网络的盲领域图像分类与重建方法,其特征在于,所述步骤4中,将待识别的目标域图像信息输入已训练好的重建分类网络模型,可以同时得到图像分类和图像重建结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911118540.9A CN110909783A (zh) | 2019-11-15 | 2019-11-15 | 一种基于增强重建分类网络的盲领域图像分类与重建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911118540.9A CN110909783A (zh) | 2019-11-15 | 2019-11-15 | 一种基于增强重建分类网络的盲领域图像分类与重建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110909783A true CN110909783A (zh) | 2020-03-24 |
Family
ID=69817512
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911118540.9A Pending CN110909783A (zh) | 2019-11-15 | 2019-11-15 | 一种基于增强重建分类网络的盲领域图像分类与重建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110909783A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111597760A (zh) * | 2020-05-18 | 2020-08-28 | 哈尔滨工业大学(威海) | 一种实现小样本条件下获取气路参数偏差值的方法 |
CN112734643A (zh) * | 2021-01-15 | 2021-04-30 | 重庆邮电大学 | 一种基于级联网络的轻量图像超分辨率重建方法 |
CN116070696A (zh) * | 2023-01-10 | 2023-05-05 | 中国兵器装备集团自动化研究所有限公司 | 一种跨域数据深度迁移方法、装置、设备及存储介质 |
US11704804B2 (en) * | 2020-04-02 | 2023-07-18 | GE Precision Healthcare LLC | Domain adaptation using post-processing model correction |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107180248A (zh) * | 2017-06-12 | 2017-09-19 | 桂林电子科技大学 | 基于联合损失增强网络的高光谱图像分类方法 |
CN109934295A (zh) * | 2019-03-18 | 2019-06-25 | 重庆邮电大学 | 一种基于超限隐特征学习模型的图像分类与重建方法 |
-
2019
- 2019-11-15 CN CN201911118540.9A patent/CN110909783A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107180248A (zh) * | 2017-06-12 | 2017-09-19 | 桂林电子科技大学 | 基于联合损失增强网络的高光谱图像分类方法 |
CN109934295A (zh) * | 2019-03-18 | 2019-06-25 | 重庆邮电大学 | 一种基于超限隐特征学习模型的图像分类与重建方法 |
Non-Patent Citations (2)
Title |
---|
MUHAMMAD GHIFARY等: "Deep Reconstruction-Classification Networks for Unsupervised Domain Adaptation", 《EUROPEAN CONFERENCE ON COMPUTER VISION》 * |
MUHAMMAD UZAIR等: "Blind Domain Adaptation With Augmented Extreme Learning Machine Features", 《IEEE TRANSACTIONS ON CYBERNETICS》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11704804B2 (en) * | 2020-04-02 | 2023-07-18 | GE Precision Healthcare LLC | Domain adaptation using post-processing model correction |
CN111597760A (zh) * | 2020-05-18 | 2020-08-28 | 哈尔滨工业大学(威海) | 一种实现小样本条件下获取气路参数偏差值的方法 |
CN111597760B (zh) * | 2020-05-18 | 2022-07-22 | 哈尔滨工业大学(威海) | 一种实现小样本条件下获取气路参数偏差值的方法 |
CN112734643A (zh) * | 2021-01-15 | 2021-04-30 | 重庆邮电大学 | 一种基于级联网络的轻量图像超分辨率重建方法 |
CN116070696A (zh) * | 2023-01-10 | 2023-05-05 | 中国兵器装备集团自动化研究所有限公司 | 一种跨域数据深度迁移方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110909783A (zh) | 一种基于增强重建分类网络的盲领域图像分类与重建方法 | |
CN108647583B (zh) | 一种基于多目标学习的人脸识别算法训练方法 | |
CN110111297B (zh) | 一种基于迁移学习的注塑制品表面图像缺陷识别方法 | |
CN107316061B (zh) | 一种深度迁移学习的不平衡分类集成方法 | |
CN111814871A (zh) | 一种基于可靠权重最优传输的图像分类方法 | |
CN110929679B (zh) | 一种基于gan的无监督自适应行人重识别方法 | |
CN114492574A (zh) | 基于高斯均匀混合模型的伪标签损失无监督对抗域适应图片分类方法 | |
CN108052862B (zh) | 年龄预估方法和装置 | |
CN112861616B (zh) | 一种无源领域自适应目标检测方法 | |
KR20190140824A (ko) | 트리플릿 기반의 손실함수를 활용한 순서가 있는 분류문제를 위한 딥러닝 모델 학습 방법 및 장치 | |
CN108446676B (zh) | 基于有序编码及多层随机投影的人脸图像年龄判别方法 | |
CN114842267A (zh) | 基于标签噪声域自适应的图像分类方法及系统 | |
CN107292272B (zh) | 一种在实时传输的视频中人脸识别的方法及系统 | |
CN113436197B (zh) | 基于生成对抗和类特征分布的域适应无监督图像分割方法 | |
CN110598759A (zh) | 一种基于多模态融合的生成对抗网络的零样本分类方法 | |
CN112699833A (zh) | 基于卷积神经网络复杂光照环境下的舰船目标识别方法 | |
CN111126155B (zh) | 一种基于语义约束生成对抗网络的行人再识别方法 | |
CN116777896B (zh) | 一种表观缺陷跨域分类识别的负迁移抑制方法 | |
CN114140645A (zh) | 基于改进自监督特征学习的摄影图像美学风格分类方法 | |
CN113011523A (zh) | 一种基于分布对抗的无监督深度领域适应方法 | |
CN117078656A (zh) | 一种新型基于多模态提示学习的无监督图像质量评估方法 | |
CN105160336B (zh) | 基于Sigmoid函数的人脸识别方法 | |
Adaimi et al. | Rethinking person re-identification with confidence | |
CN116451179A (zh) | 一种基于投影重构的领域适应字典对学习方法 | |
CN112541859B (zh) | 一种光照自适应的人脸图像增强方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200324 |