CN113627433A - 基于数据扰动的跨域自适应语义分割方法及装置 - Google Patents
基于数据扰动的跨域自适应语义分割方法及装置 Download PDFInfo
- Publication number
- CN113627433A CN113627433A CN202110680850.0A CN202110680850A CN113627433A CN 113627433 A CN113627433 A CN 113627433A CN 202110680850 A CN202110680850 A CN 202110680850A CN 113627433 A CN113627433 A CN 113627433A
- Authority
- CN
- China
- Prior art keywords
- data
- domain
- semantic segmentation
- target domain
- cross
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000011218 segmentation Effects 0.000 title claims abstract description 129
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000006870 function Effects 0.000 claims abstract description 40
- 230000003044 adaptive effect Effects 0.000 claims description 38
- 238000012549 training Methods 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 11
- 238000013508 migration Methods 0.000 claims description 11
- 230000005012 migration Effects 0.000 claims description 11
- 230000006978 adaptation Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 238000013499 data model Methods 0.000 abstract description 5
- 238000013461 design Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 8
- 238000002372 labelling Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明提供的一种基于数据扰动的跨域自适应语义分割方法及装置,该方法包括,获取待处理数据以及添加数据扰动后的语义分割特征;基于所述待处理数据以及所述语义分割特征确定损失函数;基于所述损失函数通过误差反向传播算法训练模型得到跨域自适应语义分割模型,通过对目标域中大量无标签数据,本发明对这部分数据随机加入扰动,并保证经过扰动处理的图像能够保持语义的一致性,从数据扰动和跨域原型分类器两个角度解决了源域和目标域之间的领域不一致问题,并且针对在现实应用中更具实际应用价值的少量监督问题做了针对性的设计,并在基于对抗的学习框架下,取得了优秀的分割性能,将现有的标注样本的知识迁移到新数据模型中。
Description
技术领域
本发明涉及机器视觉技术领域,尤其涉及一种基于数据扰动的跨域自适应语义分割方法及装置。
背景技术
领域自适应作为迁移学习的一种,是机器学习领域一个重要且具有挑战性的任务,在图像识别,目标检测以及图像语义分割等领域具有广泛应用。在大数据时代,每天都会有海量的数据产生,但能够用于机器学习的标注数据却很难获取,因为这些数据的标注有些需要耗时的精细标注,比如像素级别的语义分割标注,有些需要标注者有足够的主业知识及经验,比如医学影像的标注,还有些由于数据量极大,标注困难。
因此,如何提供一种基于数据扰动的跨域自适应语义分割方案,将现有的标注样本的知识迁移到新数据模型中是本领域技术人员亟待处理的技术问题。
发明内容
本发明提供一种基于数据扰动的跨域自适应语义分割方法及装置,将现有的标注样本的知识迁移到新数据模型中。
第一方面,本发明提供一种基于数据扰动的跨域自适应语义分割方法,包括:
获取待处理数据以及添加数据扰动后的语义分割特征;
基于所述待处理数据以及所述语义分割特征确定损失函数;
基于所述损失函数通过误差反向传播算法训练模型得到跨域自适应语义分割模型。
进一步地,所述获取待处理数据以及添加数据扰动后的语义分割特征包括:
基于所述待处理数据以及所述目标域图像数据处理得到各自对应的语义分割特征;所述语义分割特征包括:有标签的源域数据特征Fs=G(xs),有标签的目标域数据特征Ft=G(xt),无标签的目标域数据特征Fu=G(xu)以及扰动后的目标域图像数据特征Fa=G(xa)。
进一步地,所述数据扰动包括以下至少一种:颜色抖动处理、高斯模糊处理以及亮度处理。
进一步地,所述基于所述待处理数据以及所述语义分割特征确定损失函数包括:
将基于所述有标签的源域数据特征Fs=G(xs)以及无标签的目标域数据特征Fu=G(xu)传入到领域判别器网络,得到数据来源结果;所述判别器网络用于判别输出的特征来自于源数据或目标域数据;
进一步地,所述基于所述待处理数据以及所述语义分割特征确定损失函数包括:
构造基于原型分类器的迁移损失,所述迁移损失包括:类别层面的适应损失其中和分别表示基于源域数据和目标域数据得到的类别原型;任务层面对齐损失:Ltask(xu)=DKL(Ps(G,xu)||Pt(G,xu)),DKL表示KL散度约束;
基于无标签的目标域数据构造语义一致性损失Ls_cyc(G)=DKLPu(G,xu)||Pa(G,xa)。
进一步地,所述基于所述损失函数通过误差反向传播算法训练模型得到跨域自适应语义分割模型包括:
将训练样本输入到待训练模型,计算待训练模型的各层输出数据;
基于所述损失函数计算待训练模型的网络输出误差,得到各层误差信息;
基于所述各层误差信息调整待训练模型各层权值,直到网络总误差是否达到预设条件。
第二方面,本发明提供一种基于数据扰动的跨域自适应语义分割装置,包括:
数据获取模块,用于获取待处理数据以及添加数据扰动后的语义分割特征;
损失确定模块,用于基于所述待处理数据以及所述语义分割特征确定损失函数;
模型训练模块,用于基于所述损失函数通过误差反向传播算法训练模型得到跨域自适应语义分割模型。
进一步地,所述数据获取模块包括:
第一单元,用于获取待处理数据,所述待处理数据包括:有标签的源域数据有标签的目标域数据和无标签的目标域数据其中,ns、nt和nu分别依次表示源域数据的数量、有标签的目标域的数量以及无标签的目标域数据的数量;
第三单元,用于基于所述待处理数据以及所述目标域图像数据处理得到各自对应的语义分割特征;所述语义分割特征包括:有标签的源域数据特征Fs=G(xs),有标签的目标域数据特征Ft=G(xt),无标签的目标域数据特征Fu=G(xu)以及扰动后的目标域图像数据特征Fa=G(xa)。
进一步地,所述数据扰动包括以下至少一种:颜色抖动处理、高斯模糊处理以及亮度处理。
进一步地,所述损失确定模块包括:
来源判别单元,用于将基于所述有标签的源域数据特征Fs=G(xs)以及无标签的目标域数据特征Fu=G(xu)传入到领域判别器网络,得到数据来源结果;所述判别器网络用于判别输出的特征来自于源数据或目标域数据;
进一步地,所述损失确定模块包括:
第五单元,用于构造基于原型分类器的迁移损失,所述迁移损失包括:类别层面的适应损失其中和分别表示基于源域数据和目标域数据得到的类别原型;任务层面对齐损失:Ltask(xu)=DKL(Ps(G,xu)||Pt(G,xu)),DKL表示KL散度约束;
第七单元,用于基于无标签的目标域数据构造语义一致性损失Ls_cyc(G)=DKLPu(G,xu)||Pa(G,xa)。
进一步地,所述模型训练模块包括:
数据输出单元,一股脑油将训练样本输入到待训练模型,计算待训练模型的各层输出数据;
误差分析单元,用于基于所述损失函数计算待训练模型的网络输出误差,得到各层误差信息;
权值调整单元,用于基于所述各层误差信息调整待训练模型各层权值,直到网络总误差是否达到预设条件。
第三方面,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于数据扰动的跨域自适应语义分割方法的步骤。
第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于数据扰动的跨域自适应语义分割方法的步骤。
本发明提供的一种基于数据扰动的跨域自适应语义分割方法及装置,通过对目标域中大量无标签数据,本发明对这部分数据随机加入扰动,并保证经过扰动处理的图像能够保持语义的一致性,通过构建跨域原型分类器来对齐源域和目标域的数据分布,从数据扰动和跨域原型分类器两个角度解决了源域和目标域之间的领域不一致问题,并且针对在现实应用中更具实际应用价值的少量监督问题做了针对性的设计,并在基于对抗的学习框架下,取得了优秀的分割性能,将现有的标注样本的知识迁移到新数据模型中。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于数据扰动的跨域自适应语义分割方法的流程示意图;
图2为本发明实施例提供的一种基于数据扰动的跨域自适应语义分割方法的源域和目标域数据示意图;
图3为本发明实施例提供的一种基于数据扰动的跨域自适应语义分割方法的跨域自适应语义分割模型示意图;
图4为本发明实施例提供的一种基于数据扰动的跨域自适应语义分割方法的算法流程图;
图5为本发明实施例提供的一种基于数据扰动的跨域自适应语义分割装置的组成结构示意图;
图6为本发明实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图4描述一种基于数据扰动的跨域自适应语义分割方法。
图1为本发明实施例提供的一种基于数据扰动的跨域自适应语义分割方法的流程示意图;图2为本发明实施例提供的一种基于数据扰动的跨域自适应语义分割方法的源域和目标域数据示意图;图3为本发明实施例提供的一种基于数据扰动的跨域自适应语义分割方法的跨域自适应语义分割模型示意图;图4为本发明实施例提供的一种基于数据扰动的跨域自适应语义分割方法的算法流程图。
在本发明一种具体实施方式中,本发明提供一种基于数据扰动的跨域自适应语义分割方法,包括:
步骤110:获取待处理数据以及添加数据扰动后的语义分割特征;
具体地,可以获取待处理数据,所述待处理数据包括:有标签的源域数据有标签的目标域数据和无标签的目标域数据其中,ns、nt和nu分别依次表示源域数据的数量、有标签的目标域的数量以及无标签的目标域数据的数量;对所述无标签的目标域数据添加随机扰动,得到扰动后的目标域图像数据基于所述待处理数据以及所述目标域图像数据处理得到各自对应的语义分割特征;所述语义分割特征包括:有标签的源域数据特征Fs=G(xs),有标签的目标域数据特征Ft=G(xt),无标签的目标域数据特征Fu=G(xu)以及扰动后的目标域图像数据特征Fa=G(xa)。
进一步地,所述数据扰动包括以下至少一种:颜色抖动处理、高斯模糊处理以及亮度处理。针对S0中的无标签目标域数据加入随机扰动,包括但不限于ColorJitter、GaussianBlur、Brightness等,经过扰动后的目标域图像标记为,所有用于训练的数据如图2所示。
将源域数据和目标域数据归一化至统一的大小(如512×1024×3像素),并将其输入到同一个语义分割网络(G)中。在本发明中,采用DeepLabV2作为语义分割网络模型,并且模型基于ImageNet数据预训练结果作为初始化参数,如图3所示,可以得到不同数据的语义分割特征,分别标记为Fs=G(xs)、Ft=G(xt)、Fu=G(xu)和Fa=G(xa)。基于源域数据和目标与数据的特征,将其传入到领域判别器网络D中。判别器网络由三层卷积网络构成,是一个二分网络,用于判别特征来自于源于数据还是目标域数据,如图3所示。
步骤120:基于所述待处理数据以及所述语义分割特征确定损失函数。
具体地,可以将基于所述有标签的源域数据特征Fs=G(xs)以及无标签的目标域数据特征Fu=G(xu)传入到领域判别器网络,得到数据来源结果;所述判别器网络用于判别输出的特征来自于源数据或目标域数据;基于所述数据来源结果构建对抗损失函数: 其中,E表示期望,p(x)表示数据x来自于分布p(x)。
当然,也可以构造其他的损失函数,具体地,可以基于有标签的源域数据以及有标签的目标域数据构造基于标签监督信息的语义分割损失:其中lseg表示交叉熵损失,并且在数据x和标签y之间的定义为: H、W表示图像长和宽并且C代表分割类别总数。
还可以构造基于原型分类器的迁移损失,所述迁移损失包括:类别层面的适应损失其中和分别表示基于源域数据和目标域数据得到的类别原型;任务层面对齐损失:Ltask(xu)=DKL(Ps(G,xu)||Pt(G,xu)),DKL表示KL散度约束;基于有标签的源域数据构造出基于有监督的语义分割损失 其中,H,W,C分别表示图像的长宽以及类别;基于无标签的目标域数据构造语义一致性损失Ls_cyc(G)=DKLPu(G,xu)||Pa(G,xa)。
步骤130:基于所述损失函数通过误差反向传播算法训练模型得到跨域自适应语义分割模型。
具体地,可以将训练样本输入到待训练模型,计算待训练模型的各层输出数据;基于所述损失函数计算待训练模型的网络输出误差,得到各层误差信息;基于所述各层误差信息调整待训练模型各层权值,直到网络总误差是否达到预设条件。
本发明实施例从数据扰动角度更好的解决源域和目标域数据之间分布不一致的问题。在具体实现上,首先对原有的域自适应问题做了进一步改进,在目标域数据中加入少量标注信息,这些标注样本并不会带来太大的标注成本,却可以大幅度的提高适应性能,具有实际应用意义。在方法层面,主要包括四个部分,一是针对有标注的源域和少量标注的目标域数据,构造有标签的语义分割损失;二是在源域数据和目标域数据之间构造对抗损失函数,用于对齐源域数据和目标域数据之间的分布,学习不同域数据之间的域不变表达;第三,针对大量无标注的目标域数据,本发明通过对其加入随机扰动,改变数据原始分布,但保持原有语义信息不变,因此在扰动前和扰动后的数据之间在预测结果上应保持一致性;最后,本发明为充分利用标签信息学习,在不同域直接学习类别原型,构造基于原型分类器的可迁移知识学习。以某通用跨域自适应语义分割数据集为例,包含合成图像的源域数据和真实数据的目标域数据,其中源域数据具有像素级别的标注信息,目标域数据有少量标注。
请参考图4,如图所示,在本发明的又一具体实施例中,具体包括如下步骤:
步骤S0,构造输入数据,将数据集中不同域数据分为有标签的源域数据有标签的目标域数据和无标签的目标域数据作为网络的输入,其中ns、nt和nu分别表示源域数据的数量、有标签目标域的数量以及无标签目标域数据的数量;
步骤S2,将S0和S1中的源域数据和目标域数据归一化至统一的大小(如512×1024×3像素),并将其输入到同一个语义分割网络(G)中。在本发明中,采用DeepLabV2作为语义分割网络模型,并且模型基于ImageNet数据预训练结果作为初始化参数,如图2所示;
步骤S3,经过步骤S2,可以得到不同数据的语义分割特征,分别标记为Fs=G(xs)、Ft=G(xt)、Fu=G(xu)和Fa=G(xa)。
步骤S4,基于步骤S3中得到的源域数据和目标与数据的特征,将其传入到领域判别器网络D中。判别器网络由三层卷积网络构成,是一个二分网络,用于判别特征来自于源于数据还是目标域数据,如图2所示;
步骤S6,针对有标签的源域和数据和少量标签的目标域数据,构造基于标签监督信息的语义分割损失:其中lseg表示交叉熵损失,并且在数据x和标签y之间的定义为: H、W表示图像长和宽并且C代表分割类别总数,可以看出有标签的监督;
步骤S7:基于S6中得到的类别原型,构造基于原型分类器的迁移损失,主要包括两部分,首先是在源域数据和目标域数据中得到的类别原型应该是一致的,称为类别层面的适应,具体表述为其中和分别表示基于源域数据和目标域数据得到的类别原型。其次,在任务层面,基于源域和目标域原型得到的分类器,对无标签的目标域数据的预测结果应该是一致的,因此本发明提出一种基于原型分类器的任务层面的对齐方式:Ltask(xu)=DKL(Ps(G,xu)||Pt(G,xu)),DKL表示KL散度约束;
步骤S8,针对有标签的源域数据,我们构造出基于有监督的语义分割损失该损失是一个交叉熵损失,由于语义分割是一个像素到像素级别的任务,所以H,W,C分别表示图像的长宽以及类别,由于在目标域数据中也存在部分标签信息,因此本发明针对有标注的目标域图像也同样保持语义分割监督;
步骤S9,在该步骤中,主要针对无标签的目标域数据,构造语义一致性损失。具体来说,针对无标注的目标域数据,本发明通过加入随机扰动得到增强后的图像,基于在步骤S3中得到的语义分割特征,分类器对于扰动前和扰动后的图像特征应该具有相同的预测结果,因此语义一致性损失约束表示为:Ls_cyc(G)=DKLPu(G,xu)||Pa(G,xa);
步骤S10,通过梯度反传算法训练模型,利用训练好的跨域自适应语义分割模型在目标域数据集进行测试。首先将目标域测试数据归一化为统一的大小(如512×1024×3像素),送入训练好的跨域自适应模型,得到目标域数据的分割结果,并与测试数据标签进行对比,得到最终的识别性能。
下面对本发明提供的基于数据扰动的跨域自适应语义分割装置进行描述,下文描述的基于数据扰动的跨域自适应语义分割装置与上文描述的基于数据扰动的跨域自适应语义分割方法可相互对应参照。
请参考图5,图5为本发明实施例提供的一种基于数据扰动的跨域自适应语义分割装置的组成结构示意图。
在本发明又一具体实施方式中,本发明提供一种基于数据扰动的跨域自适应语义分割装置500,包括:
数据获取模块510,用于获取待处理数据以及添加数据扰动后的语义分割特征;
损失确定模块520,用于基于所述待处理数据以及所述语义分割特征确定损失函数;
模型训练模块530,用于基于所述损失函数通过误差反向传播算法训练模型得到跨域自适应语义分割模型。
进一步地,所述数据获取模块包括:
第一单元,用于获取待处理数据,所述待处理数据包括:有标签的源域数据有标签的目标域数据和无标签的目标域数据其中,ns、nt和nu分别依次表示源域数据的数量、有标签的目标域的数量以及无标签的目标域数据的数量;
第三单元,用于基于所述待处理数据以及所述目标域图像数据处理得到各自对应的语义分割特征;所述语义分割特征包括:有标签的源域数据特征Fs=G(xs),有标签的目标域数据特征Ft=G(xt),无标签的目标域数据特征Fu=G(xu)以及扰动后的目标域图像数据特征Fa=G(xa)。
进一步地,所述数据扰动包括以下至少一种:颜色抖动处理、高斯模糊处理以及亮度处理。
进一步地,所述损失确定模块包括:
来源判别单元,用于将基于所述有标签的源域数据特征Fs=G(xs)以及无标签的目标域数据特征Fu=G(xu)传入到领域判别器网络,得到数据来源结果;所述判别器网络用于判别输出的特征来自于源数据或目标域数据;
函数构造单元,用于基于所述数据来源结果构建对抗损失函数:
进一步地,所述损失确定模块包括:
第五单元,用于构造基于原型分类器的迁移损失,所述迁移损失包括:类别层面的适应损失其中和分别表示基于源域数据和目标域数据得到的类别原型;任务层面对齐损失:Ltask(xu)=DKL(Ps(G,xu)||Pt(G,xu)),BKL表示KL散度约束;
第七单元,用于基于无标签的目标域数据构造语义一致性损失Ls_cyc(G)=BKLPu(G,xu)||Pa(G,xa)。
进一步地,所述模型训练模块包括:
数据输出单元,一股脑油将训练样本输入到待训练模型,计算待训练模型的各层输出数据;
误差分析单元,用于基于所述损失函数计算待训练模型的网络输出误差,得到各层误差信息;
权值调整单元,用于基于所述各层误差信息调整待训练模型各层权值,直到网络总误差是否达到预设条件。
本发明提供的一种基于数据扰动的跨域自适应语义分割装置,通过对目标域中大量无标签数据,本发明对这部分数据随机加入扰动,并保证经过扰动处理的图像能够保持语义的一致性,通过构建跨域原型分类器来对齐源域和目标域的数据分布,从数据扰动和跨域原型分类器两个角度解决了源域和目标域之间的领域不一致问题,并且针对在现实应用中更具实际应用价值的少量监督问题做了针对性的设计,并在基于对抗的学习框架下,取得了优秀的分割性能,将现有的标注样本的知识迁移到新数据模型中。
图6示例了一种电子设备的实体结构示意图,如图6所示,该电子设备可以包括:处理器(processor)610、通信接口(Communications Interface)620、存储器(memory)630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑指令,以执行基于数据扰动的跨域自适应语义分割方法,该方法包括:获取待处理数据以及添加数据扰动后的语义分割特征;基于所述待处理数据以及所述语义分割特征确定损失函数;基于所述损失函数通过误差反向传播算法训练模型得到跨域自适应语义分割模型。
此外,上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的基于数据扰动的跨域自适应语义分割方法,该方法包括:获取待处理数据以及添加数据扰动后的语义分割特征;基于所述待处理数据以及所述语义分割特征确定损失函数;基于所述损失函数通过误差反向传播算法训练模型得到跨域自适应语义分割模型。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的基于数据扰动的跨域自适应语义分割方法,该方法包括:获取待处理数据以及添加数据扰动后的语义分割特征;基于所述待处理数据以及所述语义分割特征确定损失函数;基于所述损失函数通过误差反向传播算法训练模型得到跨域自适应语义分割模型。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于数据扰动的跨域自适应语义分割方法,其特征在于,包括:
获取待处理数据以及添加数据扰动后的语义分割特征;
基于所述待处理数据以及所述语义分割特征确定损失函数;
基于所述损失函数通过误差反向传播算法训练模型得到跨域自适应语义分割模型。
2.根据权利要求1所述的基于数据扰动的跨域自适应语义分割方法,其特征在于,
所述获取待处理数据以及添加数据扰动后的语义分割特征包括:
基于所述待处理数据以及所述目标域图像数据处理得到各自对应的语义分割特征;所述语义分割特征包括:有标签的源域数据特征Fs=G(xs),有标签的目标域数据特征Ft=G(xt),无标签的目标域数据特征Fu=G(xu)以及扰动后的目标域图像数据特征Fa=G(xa)。
3.根据权利要求2所述的基于数据扰动的跨域自适应语义分割方法,其特征在于,
所述数据扰动包括以下至少一种:颜色抖动处理、高斯模糊处理以及亮度处理。
5.根据权利要求1所述的基于数据扰动的跨域自适应语义分割方法,其特征在于,
所述基于所述待处理数据以及所述语义分割特征确定损失函数包括:
构造基于原型分类器的迁移损失,所述迁移损失包括:类别层面的适应损失其中和分别表示基于源域数据和目标域数据得到的类别原型;任务层面对齐损失:Ltask(xu)=DKL(Ps(G,xu)||Pt(G,xu)),DKL表示KL散度约束;
基于无标签的目标域数据构造语义一致性损失Ls_cyc(G)=DKLPu(G,xu)||Pa(G,xa)。
6.根据权利要求1至5任一项所述的基于数据扰动的跨域自适应语义分割方法,其特征在于,
所述基于所述损失函数通过误差反向传播算法训练模型得到跨域自适应语义分割模型包括:
将训练样本输入到待训练模型,计算待训练模型的各层输出数据;
基于所述损失函数计算待训练模型的网络输出误差,得到各层误差信息;
基于所述各层误差信息调整待训练模型各层权值,直到网络总误差是否达到预设条件。
7.一种基于数据扰动的跨域自适应语义分割装置,其特征在于,包括:
数据获取模块,用于获取待处理数据以及添加数据扰动后的语义分割特征;
损失确定模块,用于基于所述待处理数据以及所述语义分割特征确定损失函数;
模型训练模块,用于基于所述损失函数通过误差反向传播算法训练模型得到跨域自适应语义分割模型。
8.根据权利要求7所述的基于数据扰动的跨域自适应语义分割装置,其特征在于,
所述数据获取模块包括:
第一单元,用于获取待处理数据,所述待处理数据包括:有标签的源域数据有标签的目标域数据和无标签的目标域数据其中,ns、nt和nu分别依次表示源域数据的数量、有标签的目标域的数量以及无标签的目标域数据的数量;
第三单元,用于基于所述待处理数据以及所述目标域图像数据处理得到各自对应的语义分割特征;所述语义分割特征包括:有标签的源域数据特征Fs=G(xs),有标签的目标域数据特征Ft=G(xt),无标签的目标域数据特征Fu=G(xu)以及扰动后的目标域图像数据特征Fa=G(xa)。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述基于数据扰动的跨域自适应语义分割方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6任一项所述基于数据扰动的跨域自适应语义分割方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110680850.0A CN113627433B (zh) | 2021-06-18 | 2021-06-18 | 基于数据扰动的跨域自适应语义分割方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110680850.0A CN113627433B (zh) | 2021-06-18 | 2021-06-18 | 基于数据扰动的跨域自适应语义分割方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113627433A true CN113627433A (zh) | 2021-11-09 |
CN113627433B CN113627433B (zh) | 2024-04-09 |
Family
ID=78378161
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110680850.0A Active CN113627433B (zh) | 2021-06-18 | 2021-06-18 | 基于数据扰动的跨域自适应语义分割方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113627433B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114419323A (zh) * | 2022-03-31 | 2022-04-29 | 华东交通大学 | 基于跨模态学习与领域自适应rgbd图像语义分割方法 |
CN114783072A (zh) * | 2022-03-17 | 2022-07-22 | 哈尔滨工业大学(威海) | 一种基于远域迁移学习的图像识别方法 |
CN118015287A (zh) * | 2024-04-09 | 2024-05-10 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 一种基于域纠正适应器的跨域小样本分割方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190325163A1 (en) * | 2018-04-20 | 2019-10-24 | NEC Laboratories Europe GmbH | Method and system for securing machine learning models |
CN111340819A (zh) * | 2020-02-10 | 2020-06-26 | 腾讯科技(深圳)有限公司 | 图像分割方法、装置和存储介质 |
CN111723814A (zh) * | 2020-06-05 | 2020-09-29 | 中国科学院自动化研究所 | 基于跨图像关联的弱监督图像语义分割方法、系统、装置 |
CN111898172A (zh) * | 2019-05-06 | 2020-11-06 | 达索系统公司 | 虚拟世界中的经验学习 |
US20200356712A1 (en) * | 2019-05-06 | 2020-11-12 | Dassault Systemes | Experience learning in virtual world |
AU2020103905A4 (en) * | 2020-12-04 | 2021-02-11 | Chongqing Normal University | Unsupervised cross-domain self-adaptive medical image segmentation method based on deep adversarial learning |
CN112861616A (zh) * | 2020-12-31 | 2021-05-28 | 电子科技大学 | 一种无源领域自适应目标检测方法 |
-
2021
- 2021-06-18 CN CN202110680850.0A patent/CN113627433B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190325163A1 (en) * | 2018-04-20 | 2019-10-24 | NEC Laboratories Europe GmbH | Method and system for securing machine learning models |
CN111898172A (zh) * | 2019-05-06 | 2020-11-06 | 达索系统公司 | 虚拟世界中的经验学习 |
US20200356712A1 (en) * | 2019-05-06 | 2020-11-12 | Dassault Systemes | Experience learning in virtual world |
CN111340819A (zh) * | 2020-02-10 | 2020-06-26 | 腾讯科技(深圳)有限公司 | 图像分割方法、装置和存储介质 |
CN111723814A (zh) * | 2020-06-05 | 2020-09-29 | 中国科学院自动化研究所 | 基于跨图像关联的弱监督图像语义分割方法、系统、装置 |
AU2020103905A4 (en) * | 2020-12-04 | 2021-02-11 | Chongqing Normal University | Unsupervised cross-domain self-adaptive medical image segmentation method based on deep adversarial learning |
CN112861616A (zh) * | 2020-12-31 | 2021-05-28 | 电子科技大学 | 一种无源领域自适应目标检测方法 |
Non-Patent Citations (4)
Title |
---|
FAN JUNSONG等: "Toward few-shot domain adaptation with perturbation-invariant representation and transferable prototypes", FRONTIERS OF COMPUTER SCIENCE, vol. 16, no. 3, pages 1 - 11, XP037814197, DOI: 10.1007/s11704-022-2015-7 * |
SERGEY ZAKHAROV等: "DeceptionNet: Network-Driven Domain Randomization", 2019 IEEE/CVF INTERNATIONAL CONFERENCE ON COMPUTER VISION (ICCV), pages 532 - 541 * |
刘西蒙等: "深度学习中的对抗攻击与防御", 网络与信息安全学报, vol. 6, no. 5, pages 36 - 53 * |
张桂梅等: "结合自集成和对抗学习的域自适应城市场景语义分割", 模式识别与人工智能, vol. 34, no. 1, pages 58 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114783072A (zh) * | 2022-03-17 | 2022-07-22 | 哈尔滨工业大学(威海) | 一种基于远域迁移学习的图像识别方法 |
CN114783072B (zh) * | 2022-03-17 | 2022-12-30 | 哈尔滨工业大学(威海) | 一种基于远域迁移学习的图像识别方法 |
CN114419323A (zh) * | 2022-03-31 | 2022-04-29 | 华东交通大学 | 基于跨模态学习与领域自适应rgbd图像语义分割方法 |
CN114419323B (zh) * | 2022-03-31 | 2022-06-24 | 华东交通大学 | 基于跨模态学习与领域自适应rgbd图像语义分割方法 |
CN118015287A (zh) * | 2024-04-09 | 2024-05-10 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 一种基于域纠正适应器的跨域小样本分割方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113627433B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10289909B2 (en) | Conditional adaptation network for image classification | |
US20200065673A1 (en) | Pre-training system for self-learning agent in virtualized environment | |
US10552712B2 (en) | Training device and training method for training image processing device | |
US11640532B2 (en) | Contrastive explanations for images with monotonic attribute functions | |
CN110334742B (zh) | 一种用于文档分类的基于强化学习的通过添加虚假节点的图对抗样本生成方法 | |
CN109919209B (zh) | 一种领域自适应深度学习方法及可读存储介质 | |
WO2022206498A1 (zh) | 一种基于联邦迁移学习的模型训练方法及计算节点 | |
CN114912612A (zh) | 鸟类识别方法、装置、计算机设备及存储介质 | |
CN113627433A (zh) | 基于数据扰动的跨域自适应语义分割方法及装置 | |
US11334773B2 (en) | Task-based image masking | |
CN110414581B (zh) | 图片检测方法和装置、存储介质及电子装置 | |
CN113841161A (zh) | 用于自动生成内容分发图像的可扩展体系架构 | |
CN113052150B (zh) | 活体检测方法、装置、电子设备和计算机可读存储介质 | |
CN114600196A (zh) | 特定领域的人类模型协同注释工具 | |
CN114170484B (zh) | 图片属性预测方法、装置、电子设备和存储介质 | |
Jin et al. | Improving the Performance of Deep Learning Model‐Based Classification by the Analysis of Local Probability | |
CN115146788A (zh) | 分布式机器学习模型的训练方法、装置、电设备存储介质 | |
CN114078203A (zh) | 一种基于改进pate的图像识别方法和系统 | |
CN113537389A (zh) | 基于模型嵌入的鲁棒图像分类方法和装置 | |
CN113569081A (zh) | 图像识别方法、装置、设备及存储介质 | |
Gogineni et al. | Machine learning based encoder-decoder for captcha recognition | |
Okada et al. | CycleGAN using Semi-Supervised Learning. | |
CN111414922A (zh) | 特征提取方法、图像处理方法、模型训练方法及装置 | |
KR102580958B1 (ko) | 드론 탑재용 산불 여부 결정 학습 장치, 산불 여부 결정 학습 방법, 산불 여부 결정 장치 및 산불 여부 결정 방법 | |
US20240095525A1 (en) | Building an explainable machine learning model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |