CN112966559A - 可靠主动域适应方法、环境感知方法、装置及存储介质 - Google Patents

可靠主动域适应方法、环境感知方法、装置及存储介质 Download PDF

Info

Publication number
CN112966559A
CN112966559A CN202110150615.2A CN202110150615A CN112966559A CN 112966559 A CN112966559 A CN 112966559A CN 202110150615 A CN202110150615 A CN 202110150615A CN 112966559 A CN112966559 A CN 112966559A
Authority
CN
China
Prior art keywords
classifier
sample
data set
module
target domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110150615.2A
Other languages
English (en)
Other versions
CN112966559B (zh
Inventor
吕文君
康宇
李泽瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN202110150615.2A priority Critical patent/CN112966559B/zh
Publication of CN112966559A publication Critical patent/CN112966559A/zh
Application granted granted Critical
Publication of CN112966559B publication Critical patent/CN112966559B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种可靠主动域适应方法、环境感知方法、装置及存储介质,属于技术领域,包括:构建数据集包括源域数据集和目标域数据集;计算数据集的投影矩阵和特征矩阵;设定模型参数;参数初始化;计算分类器预测误差;计算分类器样本权重矩阵;利用目标函数最小化求解分类器第ξ次迭代的输出层权重;令ξ自增1,如果ξ<Γ则计算分类器预测误差,否则进行样本均衡处理;令τ自增1,如果τ<Φ进行参数初始化,否则预测目标域无标注样本的类别。本发明能够在标签存在噪声的情况下,保持一定的鲁棒性;在出现较大漂移的情况下,能够主动请求目标域的关键样本打上标签并进行主动学习;能够防止数据类别不均衡情况下的过拟合问题。

Description

可靠主动域适应方法、环境感知方法、装置及存储介质
技术领域
本发明涉及环境感知技术领域,特别涉及一种可靠主动域适应方法、环境感知方法、装置及存储介质。
背景技术
在迁移学习中,当源域和目标的数据分布不同,但两个任务相同时,这种特殊的迁移学习叫做域适应。领域自适应问题定义为:源域和目标域共享相同的特征和类别,但是特征分布不同,可以利用信息丰富的源域样本来提升目标域模型的性能。源域表示与测试样本不同的领域,具有丰富的监督标注信息;目标域表示测试样本所在的领域,无标签或者只有少量标签。源域和目标域往往属于同一类任务,但是分布不同。
目前,已经出现了较多出色的域适应(DA)方法,主要分为三个部分:1)基于参数的DA;2)基于实例的DA;以及3)基于特征的DA。这其中深度学习域适应方法大多是基于特征的,这些方法可以进一步分为基于差异的DA和基于对抗的DA。域适应方法在环境感知中有较多的应用,比如轮式机器人在地面上运动时会遇到各种地形,而保证机器人安全地穿越地形、避免其处于危险环境是十分重要的。已有的研究主要集中于基于激光雷达或视觉传感器的对障碍物的识别。对于墙壁、石块等无法通过的障碍物,我们称之为“几何威胁”;对于地面本身可能也会对机器人产生威胁,这种威胁我们称之为“非几何威胁”,例如:机器人穿越疏松的沙地时可能陷入其中。通过实时的地形感知,机器人可以根据不用的地形采用不同的控制策略,使其能够安全有效的穿越不同的地形。因此,实时的地形感知对在野外工作的轮式机器人是十分重要的。
但由于训练集不可能包含所有可能的环境,而环境会随着地理位置不同、温度变化、天气情况而改变,也就是存在数据漂移问题,现有的域适应方法存在标签噪声敏感、无法解决较大漂移的问题、且没有考虑数据类别不均衡问题;特别是对于环境感知,还没有一种方法来解决数据漂移问题。
发明内容
本发明的目的在于克服上述背景技术中的不足,解决现有技术中存在的数据漂移问题,提高环境感知的精度。
为实现以上目的,第一方面,采用一种可靠主动域适应方法,包括如下步骤:
S1、构建有标签的源域数据集
Figure BDA0002932570680000021
和无标签的目标域数据集
Figure BDA0002932570680000022
令主动域适应迭代次数τ=1,源域数据集和目标域数据集中的数据为序列数据;
S2、令第一分类器和第二分类器初始的输出层权重
Figure BDA0002932570680000023
Figure BDA0002932570680000024
令分类器优化迭代次数ξ=1;
S3、分别计算第一分类器和第二分类器的预测误差e1,i和e2,i
S4、利用目标域数据集的投影矩阵Pt和样本矩阵Xt、预测误差e1,i和e2,i,基于目标函数最小化得到第ξ次迭代时第一分类器和第二分类器的输出层权重
Figure BDA0002932570680000025
S5、令ξ自增1,并判断是否满足ξ<Γ,Γ是分类器优化最大迭代次数,若是则执行步骤S3,若否则令
Figure BDA0002932570680000026
然后执行步骤S6;
S6、对
Figure BDA0002932570680000027
按行求二范数得到
Figure BDA0002932570680000028
并将δY中na个最大元素序号对应的样本打上标签,将na个打上标签后的样本从
Figure BDA0002932570680000029
中移至
Figure BDA00029325706800000210
中,更新源域数据集
Figure BDA00029325706800000211
和目标域数据集
Figure BDA00029325706800000212
的样本数量,其中,nt为目标域数据集中的样本数量,na是样本请求数量,
Figure BDA0002932570680000031
是第一分类器的预测结果,
Figure BDA0002932570680000032
是第二分类器的预测结果;
S7、令τ自增1,并判断是否满足τ<Φ,则执行步骤S2,否则执行步骤S8;
S8、对于目标域数据集中的无标注样本x,采用
Figure BDA0002932570680000033
预测x对应的类别。
进一步地,所述分别计算第一分类器和第二分类器的预测误差e1,i和e2,i,包括:
计算所述第一分类器的预测误差
Figure BDA0002932570680000034
Figure BDA0002932570680000035
计算所述第二分类器的预测误差
Figure BDA0002932570680000036
Figure BDA0002932570680000037
其中,
Figure BDA0002932570680000038
为样本
Figure BDA0002932570680000039
对应的标签,C是标签的类别数量,ns为源域样本数量,
Figure BDA00029325706800000310
为所述第一分类器在第ξ-1次迭代时的输出层权重,
Figure BDA00029325706800000311
为所述第二分类器在第ξ-1次迭代时的输出层权重,
Figure BDA00029325706800000312
为源域特征矩阵的元素。
进一步地,所述目标函数为:
Figure BDA00029325706800000313
其中,ρ和λ均是权衡系数,Q是高斯函数的数量,
Figure BDA00029325706800000314
是所述目标域数据集的投影矩阵的转置,
Figure BDA00029325706800000315
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,||·||F是F范数,所述目标域数据集的投影矩阵
Figure BDA0002932570680000041
其中,d表示特征维度,D为样本维度;
所述目标域数据集的样本矩阵
Figure BDA0002932570680000042
Figure BDA0002932570680000043
表示所述目标域数据集中的样本,nt为所述目标域数据集中的样本数量。
进一步地,还包括:
设定主动域适应最大迭代次数Φ>2,分类器优化最大迭代次数Γ>2,设定样本请求数量na>0,设置权衡系数ρ>0、权重参数λ>0,特征维度d,设定高斯函数的数量Q、第q个高斯核宽σq(q=1,2,…,Q)、高斯函数中心c以及高斯函数权重γq(q=1,2,…,Q)的值;
还包括:
计算所述第一分类器和第二分类器的样本权重矩阵Λ1和Λ2,其中,样本权重矩阵Λ1的第i(i=1,2,…,ns)个元素
Figure BDA0002932570680000044
Figure BDA0002932570680000045
样本权重矩阵Λ2的第i(i=1,2,…,ns)个元素
Figure BDA0002932570680000046
Figure BDA0002932570680000047
Q表示使用的高斯核函数数量,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure BDA0002932570680000048
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,满足
Figure BDA0002932570680000049
第二方面,采用一种可靠主动域适应装置,包括构建模块、初始化模块、预测误差计算模块、目标函数处理模块、第一判断模块、样本均衡模块、第二判断模块以及预测模块,其中:
构建模块用于构建有标签的源域数据集
Figure BDA0002932570680000051
和无标签的目标域数据集
Figure BDA0002932570680000052
令主动域适应迭代次数τ=1,源域数据集和目标域数据集中的数据为序列数据;
初始化模块用于令第一分类器和第二分类器初始的输出层权重
Figure BDA0002932570680000053
令分类器优化迭代次数ξ=1;
预测误差计算模块用于分别计算第一分类器和第二分类器的预测误差e1,i和e2,i
目标函数处理模块用于利用目标域数据集的投影矩阵Pt和样本矩阵Xt、预测误差e1,i和e2,i,基于目标函数最小化得到第ξ次迭代时第一分类器和第二分类器的输出层权重
Figure BDA0002932570680000054
第一判断模块用于令ξ自增1,并判断是否满足ξ<Γ,Γ是分类器优化最大迭代次数,以及预测误差计算模块用于在第一判断模块判断结果为是时分别计算第一分类器和第二分类器的预测误差e1,i和e2,i
样本均衡模块用于在第一判断模块输出结果为否时,对
Figure BDA0002932570680000055
按行求二范数得到
Figure BDA0002932570680000056
并将δY中na个最大元素序号对应的样本打上标签,将na个打上标签后的样本从
Figure BDA0002932570680000057
中移至
Figure BDA0002932570680000058
中,更新源域数据集
Figure BDA0002932570680000059
和目标域数据集
Figure BDA00029325706800000510
的样本数量,其中,nt为目标域数据集中的样本数量,na是样本请求数量,
Figure BDA00029325706800000511
是第一分类器的预测结果,
Figure BDA00029325706800000512
是第二分类器的预测结果;
第二判断模块用于令τ自增1,并判断是否满足τ<Φ,以及初始化模块用于在第二判断模块输出结果为是时,令第一分类器和第二分类器初始的输出层权重
Figure BDA0002932570680000061
令分类器优化迭代次数ξ=1;
预测模块用于在第二判断模块输出结果为否时,用于对目标域数据集中的无标注样本x,采用
Figure BDA0002932570680000062
预测x对应的类别。
进一步地,所述预测误差计算模块具体用于:
计算所述第一分类器的预测误差
Figure BDA0002932570680000063
Figure BDA0002932570680000064
计算所述第二分类器的预测误差
Figure BDA0002932570680000065
Figure BDA0002932570680000066
其中,
Figure BDA0002932570680000067
为样本
Figure BDA0002932570680000068
对应的标签,C是标签的类别数量,ns为源域样本数量,
Figure BDA0002932570680000069
为所述第一分类器在第ξ-1次迭代时的输出层权重,
Figure BDA00029325706800000610
为所述第二分类器在第ξ-1次迭代时的输出层权重,
Figure BDA00029325706800000611
为源域特征矩阵的元素。
进一步地,所述目标函数为:
Figure BDA00029325706800000612
其中,ρ和λ均是权衡系数,Q是高斯函数的数量,
Figure BDA00029325706800000613
是所述目标域数据集的投影矩阵的转置,
Figure BDA00029325706800000614
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,||·||F是F范数,所述目标域数据集的投影矩阵
Figure BDA00029325706800000615
其中,d表示特征维度,D为样本维度;
所述目标域数据集的投影矩阵
Figure BDA00029325706800000616
其中,d表示特征维度,D为样本维度;
所述目标域数据集的样本矩阵
Figure BDA0002932570680000071
Figure BDA0002932570680000072
表示所述目标域数据集中的样本,nt为所述目标域数据集中的样本数量。
进一步地,还包括参数设置模块,用于设定主动域适应最大迭代次数Φ>2,分类器优化最大迭代次数Г>2,设定样本请求数量na>0,设置权衡系数ρ>0、权重参数λ>0,特征维度d,设定高斯函数的数量Q、第q个高斯核宽σq(q=1,2,…,Q)、高斯函数中心c以及高斯函数权重γq(q=1,2,…,Q)的值;
还包括样本权重矩阵计算模块,用于:
计算所述第一分类器和第二分类器的样本权重矩阵Λ1和Λ2,其中,样本权重矩阵Λ1的第q(i=1,2,…,ns)个元素
Figure BDA0002932570680000073
Figure BDA0002932570680000074
样本权重矩阵Λ2的第i(i=1,2,…,ns)个元素
Figure BDA0002932570680000075
Figure BDA0002932570680000076
Q表示使用的高斯核函数数量,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure BDA0002932570680000077
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,满足
Figure BDA0002932570680000078
第三方面,采用一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行可实现如上所述的可靠主动域适应方法。
第四方面,采用一种环境感知方法,包括:
T1、收集周围环境的振动序列数据,并对振动序列数据请求其对应的分类标签,得到有标签的源域数据集
Figure BDA0002932570680000081
和无标签的目标域数据集
Figure BDA0002932570680000082
令主动域适应迭代次数τ=1;
T2、令第一分类器和第二分类器初始的输出层权重
Figure BDA0002932570680000083
Figure BDA0002932570680000084
令分类器优化迭代次数ξ=1;
T3、分别计算第一分类器和第二分类器的预测误差e1,i和e2,i
T4、利用目标域数据集的投影矩阵Pt和样本矩阵Xt、预测误差e1,i和e2,i,基于目标函数最小化得到第ξ次迭代时第一分类器和第二分类器的输出层权重
Figure BDA0002932570680000085
T5、令ξ自增1,并判断是否满足ξ<Г,Г是分类器优化最大迭代次数,若是则执行步骤T3,若否则令
Figure BDA0002932570680000086
然后执行步骤T6;
T6、对
Figure BDA0002932570680000087
按行求二范数得到
Figure BDA0002932570680000088
并将δY中na个最大元素序号对应的样本打上标签,将na个打上标签后的样本从
Figure BDA0002932570680000089
中移至
Figure BDA00029325706800000810
中,更新源域数据集
Figure BDA00029325706800000811
和目标域数据集
Figure BDA00029325706800000812
的样本数量,其中,nt为目标域数据集中的样本数量,na是样本请求数量,
Figure BDA00029325706800000813
是第一分类器的预测结果,
Figure BDA00029325706800000814
是第二分类器的预测结果;
T7、令τ自增1,并判断是否满足τ<Φ,则执行步骤T2,否则执行步骤T8;
T8、对于目标域数据集中的无标注样本x,采用
Figure BDA00029325706800000815
预测其对应的环境类别。
进一步地,所述分别计算第一分类器和第二分类器的预测误差e1,i和e2,i,包括:
计算所述第一分类器的预测误差
Figure BDA0002932570680000091
Figure BDA0002932570680000092
计算所述第二分类器的预测误差
Figure BDA0002932570680000093
Figure BDA0002932570680000094
其中,
Figure BDA0002932570680000095
为样本
Figure BDA0002932570680000096
对应的标签,C是标签的类别数量,ns为源域样本数量,
Figure BDA0002932570680000097
为所述第一分类器在第ξ-1次迭代时的输出层权重,
Figure BDA0002932570680000098
为所述第二分类器在第ξ-1次迭代时的输出层权重,
Figure BDA0002932570680000099
为源域特征矩阵的元素。
进一步地,所述目标函数为:
Figure BDA00029325706800000910
其中,ρ和λ均是权衡系数,Q是高斯函数的数量,
Figure BDA00029325706800000911
是所述目标域数据集的投影矩阵的转置,
Figure BDA00029325706800000912
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,||·||F是F范数,所述目标域数据集的投影矩阵
Figure BDA00029325706800000913
其中,d表示特征维度,D为样本维度;
所述目标域数据集的投影矩阵
Figure BDA00029325706800000914
其中,d表示特征维度,D为样本维度;
所述目标域数据集的样本矩阵
Figure BDA00029325706800000915
Figure BDA00029325706800000916
表示所述目标域数据集中的样本,nt为所述目标域数据集中的样本数量。
进一步地,还包括:
设定主动域适应最大迭代次数Φ>2,分类器优化最大迭代次数Γ>2,设定样本请求数量na>0,设置权衡系数ρ>0、权重参数λ>0,特征维度d,设定高斯函数的数量Q、第q个高斯核宽σq(q=1,2,…,Q)、高斯函数中心c以及高斯函数权重γq(q=1,2,…,Q)的值;
还包括:
计算所述第一分类器和第二分类器的样本权重矩阵Λ1和Λ2,其中,样本权重矩阵Λ1的第i(i=1,2,…,ns)个元素
Figure BDA0002932570680000101
Figure BDA0002932570680000102
样本权重矩阵Λ2的第i(i=1,2,…,ns)个元素
Figure BDA0002932570680000103
Figure BDA0002932570680000104
Q表示使用的高斯核函数数量,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure BDA0002932570680000105
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,满足
Figure BDA0002932570680000106
第五方面,采用一种环境感知装置,包括构建模块、初始化模块、预测误差计算模块、目标函数处理模块、第一判断模块、样本均衡模块、第二判断模块以及预测模块,其中:
构建模块用于收集周围环境的振动序列数据,并对振动序列数据请求其对应的分类标签,得到有标签的源域数据集
Figure BDA0002932570680000107
和无标签的目标域数据集
Figure BDA0002932570680000108
令主动域适应迭代次数τ=1;
初始化模块用于令第一分类器和第二分类器初始的输出层权重
Figure BDA0002932570680000111
令分类器优化迭代次数ξ=1;
预测误差计算模块用于分别计算第一分类器和第二分类器的预测误差e1,i和e2,i
目标函数处理模块用于利用目标域数据集的投影矩阵Pt和样本矩阵Xt、预测误差e1,i和e2,i,基于目标函数最小化得到第ξ次迭代时第一分类器和第二分类器的输出层权重
Figure BDA0002932570680000112
第一判断模块用于令ξ自增1,并判断是否满足ξ<Γ,Γ是分类器优化最大迭代次数,以及预测误差计算模块用于在第一判断模块判断结果为是时分别计算第一分类器和第二分类器的预测误差e1,i和e2,i
样本均衡模块用于在第一判断模块输出结果为否时,对
Figure BDA0002932570680000113
按行求二范数得到
Figure BDA0002932570680000114
并将δY中na个最大元素序号对应的样本打上标签,将na个打上标签后的样本从
Figure BDA0002932570680000115
中移至
Figure BDA0002932570680000116
中,更新源域数据集
Figure BDA0002932570680000117
和目标域数据集
Figure BDA0002932570680000118
的样本数量,其中,nt为目标域数据集中的样本数量,na是样本请求数量,
Figure BDA0002932570680000119
是第一分类器的预测结果,
Figure BDA00029325706800001110
是第二分类器的预测结果;
第二判断模块用于令τ自增1,并判断是否满足τ<Φ,以及初始化模块用于在第二判断模块输出结果为是时,令第一分类器和第二分类器初始的输出层权重
Figure BDA00029325706800001111
令分类器优化迭代次数ξ=1;
预测模块用于在第二判断模块输出结果为否时,用于对目标域数据集中的无标注样本x,采用
Figure BDA00029325706800001112
预测其对应的环境类别。
进一步地,所述预测误差计算模块具体用于:
计算所述第一分类器的预测误差
Figure BDA0002932570680000121
Figure BDA0002932570680000122
计算所述第二分类器的预测误差
Figure BDA0002932570680000123
Figure BDA0002932570680000124
其中,
Figure BDA0002932570680000125
为样本
Figure BDA0002932570680000126
对应的标签,C是标签的类别数量,ns为源域样本数量,
Figure BDA0002932570680000127
为所述第一分类器在第ξ-1次迭代时的输出层权重,
Figure BDA0002932570680000128
为所述第二分类器在第ξ-1次迭代时的输出层权重,
Figure BDA0002932570680000129
为源域特征矩阵的元素。
进一步地,所述目标函数为:
Figure BDA00029325706800001210
其中,ρ和λ均是权衡系数,Q是高斯函数的数量,
Figure BDA00029325706800001211
是所述目标域数据集的投影矩阵的转置,
Figure BDA00029325706800001212
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,||·||F是F范数,所述目标域数据集的投影矩阵
Figure BDA00029325706800001213
其中,d表示特征维度,D为样本维度;
所述目标域数据集的投影矩阵
Figure BDA00029325706800001214
其中,d表示特征维度,D为样本维度;
所述目标域数据集的样本矩阵
Figure BDA00029325706800001215
Figure BDA00029325706800001216
表示所述目标域数据集中的样本,nt为所述目标域数据集中的样本数量。
进一步地,还包括参数设置模块,用于设定主动域适应最大迭代次数Φ>2,分类器优化最大迭代次数Г>2,设定样本请求数量na>0,设置权衡系数ρ>0、权重参数λ>0,特征维度d,设定高斯函数的数量Q、第q个高斯核宽σq(q=1,2,…,Q)、高斯函数中心c以及高斯函数权重γq(q=1,2,…,Q)的值;
还包括样本权重矩阵计算模块,以消除错误标签,用于:
计算所述第一分类器和第二分类器的样本权重矩阵Λ1和Λ2,其中,样本权重矩阵Λ1的第q(i=1,2,…,ns)个元素
Figure BDA0002932570680000131
Figure BDA0002932570680000132
样本权重矩阵Λ2的第i(i=1,2,…,ns)个元素
Figure BDA0002932570680000133
Figure BDA0002932570680000134
Q表示使用的高斯核函数数量,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure BDA0002932570680000135
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,满足
Figure BDA0002932570680000136
第六方面,采用一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行可实现如上所述的环境感知方法。
与现有技术相比,本发明存在以下技术效果:本发明能够在标签存在噪声的情况下,保持一定的鲁棒性;在出现较大漂移的情况下,能够主动请求目标域的关键样本打上标签并进行主动学习;能够防止数据类别不均衡情况下的过拟合问题。
附图说明
下面结合附图,对本发明的具体实施方式进行详细描述:
图1是数据集构建示意图;
图2是一种可靠主动域适应方法的流程图。
具体实施方式
为了更进一步说明本发明的特征,请参阅以下有关本发明的详细说明与附图。所附图仅供参考与说明之用,并非用来对本发明的保护范围加以限制。
如图2所示,本实施例公开了一种可靠主动域适应方法,包括如下步骤:
(1)构建数据集,数据集中存储有序列数据,该序列数据包括振动数据、测井数据、语音数据、脑电波以及心电图等:
有标签的源域数据集
Figure BDA0002932570680000141
无标签的目标域数据集
Figure BDA0002932570680000142
其中
Figure BDA0002932570680000143
表示源域样本,ns为源域样本数量,D为样本维度,
Figure BDA0002932570680000144
表示目标域样本,nt为目标域样本数量,
Figure BDA0002932570680000145
为xi对应的标签,类别数量为C;则源域样本矩阵为
Figure BDA0002932570680000146
源域标签矩阵为
Figure BDA0002932570680000147
目标域样本矩阵为
Figure BDA0002932570680000148
(2)计算投影矩阵和特征矩阵:
随机生成源域和目标域的投影矩阵分别为
Figure BDA0002932570680000149
Figure BDA00029325706800001410
其中d表示特征维度;计算得到源域特征矩阵
Figure BDA00029325706800001411
目标域特征矩阵
Figure BDA00029325706800001412
Figure BDA00029325706800001413
(3)参数设定:
设定主动域适应最大迭代次数Φ>2,分类器优化最大迭代次数Г>2,设定样本请求数量na>0,设置权衡系数ρ>0、λ>0,设定特征维度d,设定高斯函数数量Q、第q个高斯核宽σq(q=1,2,…,Q)、高斯函数中心c、高斯函数权重γq(q=1,2,…,Q)的值;
(4)令主动域适应迭代次数τ=1;
(5)初始化:
令初始的输出层权重
Figure BDA0002932570680000151
令分类器优化迭代次数ξ=1;
(6)计算预测误差:
计算第一分类器的预测误差
Figure BDA0002932570680000152
Figure BDA0002932570680000153
计算第二分类器的预测误差
Figure BDA0002932570680000154
Figure BDA0002932570680000155
(7)计算样本权重矩阵:
计算第一分类器的样本权重矩阵Λ1,其中第i(i=1,2,…,ns)个元素
Figure BDA0002932570680000156
其中Q表示使用的高斯核函数数量,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure BDA0002932570680000157
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,满足
Figure BDA0002932570680000158
类似地,计算第二分类器的样本权重矩阵Λ2,其中,第i(i=1,2,…,ns)个元素
Figure BDA0002932570680000159
Figure BDA00029325706800001510
(8)目标函数最小化:
通过最小化如下目标函数得到第ξ次迭代的输出层权重
Figure BDA0002932570680000161
Figure BDA0002932570680000162
Figure BDA0002932570680000163
其中,ρ,λ>0为权衡系数;
(9)令ξ自增1,如果ξ<Γ,转到步骤(6);否则,
Figure BDA0002932570680000164
进入步骤(10);
(10)样本均衡处理:
求解
Figure BDA0002932570680000165
Figure BDA0002932570680000166
Figure BDA0002932570680000167
按行求二范数得到
Figure BDA0002932570680000168
将δY中na个最大元素序号对应的样本打上标签,并将这些样本从
Figure BDA0002932570680000169
中移至
Figure BDA00029325706800001610
中,更新nt和ns的值;
(11)令τ自增1,如果τ<Φ,则跳至步骤(5),否则进入步骤(12);
(12)对于目标域无标注样本x,采用
Figure BDA00029325706800001611
预测x的类别。
作为进一步优选的技术方案,本实施例公开一组可选的参数:Γ=100、ρ=100、λ=0.1、d=20、Q=2、σ1=1、σ2=0.1、c=0、γ1=0.5、γ2=0.5。
本实施例还公开了一种可靠主动域适应装置,包括构建模块、初始化模块、预测误差计算模块、目标函数处理模块、第一判断模块、样本均衡模块、第二判断模块以及预测模块,其中:
构建模块用于构建有标签的源域数据集
Figure BDA00029325706800001612
和无标签的目标域数据集
Figure BDA00029325706800001613
令主动域适应迭代次数τ=1,源域数据集和目标域数据集中的数据为序列数据;
初始化模块用于令第一分类器和第二分类器初始的输出层权重
Figure BDA0002932570680000171
令分类器优化迭代次数ξ=1;
预测误差计算模块用于分别计算第一分类器和第二分类器的预测误差e1,i和e2,i
目标函数处理模块用于利用目标域数据集的投影矩阵Pt和样本矩阵Xt、预测误差e1,i和e2,i,基于目标函数最小化得到第ξ次迭代时第一分类器和第二分类器的输出层权重
Figure BDA0002932570680000172
第一判断模块用于令ξ自增1,并判断是否满足ξ<Γ,Γ是分类器优化最大迭代次数,以及预测误差计算模块用于在第一判断模块判断结果为是时分别计算第一分类器和第二分类器的预测误差e1,i和e2,i
样本均衡模块用于在第一判断模块输出结果为否时,对
Figure BDA0002932570680000173
按行求二范数得到
Figure BDA0002932570680000174
并将δY中na个最大元素序号对应的样本打上标签,将na个打上标签后的样本从
Figure BDA0002932570680000175
中移至
Figure BDA0002932570680000176
中,更新源域数据集
Figure BDA0002932570680000177
和目标域数据集
Figure BDA0002932570680000178
的样本数量,其中,nt为目标域数据集中的样本数量,na是样本请求数量,
Figure BDA0002932570680000179
是第一分类器的预测结果,
Figure BDA00029325706800001710
是第二分类器的预测结果;
第二判断模块用于令τ自增1,并判断是否满足τ<Φ,以及初始化模块用于在第二判断模块输出结果为是时,令第一分类器和第二分类器初始的输出层权重
Figure BDA00029325706800001711
令分类器优化迭代次数ξ=1;
预测模块用于在第二判断模块输出结果为否时,用于对目标域数据集中的无标注样本x,采用
Figure BDA0002932570680000181
预测x对应的类别。
作为进一步优选的技术方案,所述预测误差计算模块具体用于:
计算所述第一分类器的预测误差
Figure BDA0002932570680000182
Figure BDA0002932570680000183
计算所述第二分类器的预测误差
Figure BDA0002932570680000184
Figure BDA0002932570680000185
其中,
Figure BDA0002932570680000186
为样本
Figure BDA0002932570680000187
对应的标签,C是标签的类别数量,ns为源域样本数量,
Figure BDA0002932570680000188
为所述第一分类器在第ξ-1次迭代时的输出层权重,
Figure BDA0002932570680000189
为所述第二分类器在第ξ-1次迭代时的输出层权重,
Figure BDA00029325706800001810
为源域特征矩阵的元素。
所述目标函数为:
Figure BDA00029325706800001811
其中,ρ和λ均是权衡系数,Q是高斯函数的数量,
Figure BDA00029325706800001812
是所述目标域数据集的投影矩阵的转置,
Figure BDA00029325706800001813
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,||·||F是F范数,所述目标域数据集的投影矩阵
Figure BDA00029325706800001814
其中,d表示特征维度,D为样本维度;
所述目标域数据集的投影矩阵
Figure BDA00029325706800001815
其中,d表示特征维度,D为样本维度;
所述目标域数据集的样本矩阵
Figure BDA00029325706800001816
Figure BDA0002932570680000191
表示所述目标域数据集中的样本,nt为所述目标域数据集中的样本数量。
作为进一步优选的技术方案,还包括参数设置模块,用于设定主动域适应最大迭代次数Φ>2,分类器优化最大迭代次数Γ>2,设定样本请求数量na>0,设置权衡系数ρ>0、权重参数λ>0,特征维度d,设定高斯函数的数量Q、第q个高斯核宽σq(q=1,2,…,Q)、高斯函数中心c以及高斯函数权重γq(q=1,2,…,Q)的值;
还包括样本权重矩阵计算模块,用于:
计算所述第一分类器和第二分类器的样本权重矩阵Λ1和Λ2,其中,样本权重矩阵Λ1的第i(i=1,2,…,ns)个元素
Figure BDA0002932570680000192
Figure BDA0002932570680000193
样本权重矩阵Λ2的第i(i=1,2,…,ns)个元素
Figure BDA0002932570680000194
Figure BDA0002932570680000195
Q表示使用的高斯核函数数量,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure BDA0002932570680000196
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,满足
Figure BDA0002932570680000197
本实施例还公开了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行可实现所述的可靠主动域适应方法
本实施例公开了一种环境感知方法,其中序列数据为振动数据,包括如下步骤:
(1)构建数据集:
如图1所示,控制机器人分别在不同地形上匀速运动一段时间,期间利用安装在机器人上的加速度计检测X/Y/Z轴方向的振动信号,得到振动信号的时间序列,简称振动序列;对振动序列以秒为单位进行数据分割,得到振动帧集合;振动帧是以秒为单位截断后的较短的振动序列;对每个振动帧采用快速傅里叶变换即可得到特征向量,一个数据集由特征向量组成。机器人上同时安装有朝向地面的摄像头,能够拍摄地面图像,因此可以利用时间戳将振动帧和地面图像对应起来,进而人工观察图像来为振动帧打上标签,标签可以是地面类型,例如草地、水泥地等。如此构建有标签的源域数据集
Figure BDA0002932570680000201
构建无标签的目标域数据集
Figure BDA0002932570680000202
其中
Figure BDA0002932570680000203
Figure BDA0002932570680000204
表示源域样本,ns为源域样本数量,D为样本维度,
Figure BDA0002932570680000205
表示目标域样本,nt为目标域样本数量,
Figure BDA0002932570680000206
为xi对应的标签,类别数量为C;则源域样本矩阵为
Figure BDA0002932570680000207
源域标签矩阵为
Figure BDA0002932570680000208
目标域样本矩阵为
Figure BDA0002932570680000209
(2)计算投影矩阵和特征矩阵:
随机生成源域和目标域的投影矩阵分别为
Figure BDA00029325706800002010
Figure BDA00029325706800002011
其中d表示特征维度;计算得到源域特征矩阵
Figure BDA00029325706800002012
目标域特征矩阵
Figure BDA00029325706800002013
Figure BDA00029325706800002014
(3)参数设定:
设定主动域适应最大迭代次数Φ>2,分类器优化最大迭代次数Г>2,设定样本请求数量na>0,设置权衡系数ρ>0、λ>0,设定特征维度d,设定高斯函数数量Q、第q个高斯核宽σQ(Q=1,2,…,Q)、高斯函数中心c、高斯函数权重γQ(q=1,2,…,Q)的值;
(4)令主动域适应迭代次数τ=1;
(5)初始化:
令初始的输出层权重
Figure BDA0002932570680000211
令分类器优化迭代次数ξ=1;
(6)计算预测误差:
计算第一分类器的预测误差
Figure BDA0002932570680000212
Figure BDA0002932570680000213
计算第二分类器的预测误差
Figure BDA0002932570680000214
Figure BDA0002932570680000215
(7)计算样本权重矩阵,以消除错误标签:
计算第一分类器的样本权重矩阵Λ1,其中第i(i=1,2,…,ns)个元素
Figure BDA0002932570680000216
其中Q表示使用的高斯核函数数量,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure BDA0002932570680000217
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,满足
Figure BDA0002932570680000218
类似地,计算第二分类器的样本权重矩阵Λ2,其中,第i(i=1,2,…,ns)个元素
Figure BDA0002932570680000219
Figure BDA0002932570680000221
(8)目标函数最小化:
通过最小化如下目标函数得到第ξ次迭代的输出层权重
Figure BDA0002932570680000222
Figure BDA0002932570680000223
Figure BDA0002932570680000224
其中,ρ,λ>0为权衡系数;
(9)令ξ自增1,如果ξ<Г,转到步骤(6);否则,
Figure BDA0002932570680000225
进入步骤(10);
(10)样本均衡处理:
求解
Figure BDA0002932570680000226
Figure BDA0002932570680000227
Figure BDA0002932570680000228
按行求二范数得到
Figure BDA0002932570680000229
将δY中na个最大元素序号对应的样本打上标签,并将这些样本从
Figure BDA00029325706800002210
中移至
Figure BDA00029325706800002211
中,更新nt和ns的值;
(11)令τ自增1,如果τ<Φ,则跳至步骤(5),否则进入步骤(12);
(12)对于目标域无标注样本x,采用
Figure BDA00029325706800002212
预测x的类别。
作为进一步优选的技术方案,本实施例公开一组可选的参数:Γ=100、ρ=100、λ=0.1、d=20、Q=2、σ1=1、σ2=1、c=0、γ1=0.5、γ2=0.5。
本实施例还公开了一种环境感知装置,包括构建模块、初始化模块、预测误差计算模块、目标函数处理模块、第一判断模块、样本均衡模块、第二判断模块以及预测模块,其中:
构建模块用于收集周围环境的振动序列数据,并对振动序列数据请求其对应的分类标签,得到有标签的源域数据集
Figure BDA0002932570680000231
和无标签的目标域数据集
Figure BDA0002932570680000232
令主动域适应迭代次数τ=1;
初始化模块用于令第一分类器和第二分类器初始的输出层权重
Figure BDA0002932570680000233
令分类器优化迭代次数ξ=1;
预测误差计算模块用于分别计算第一分类器和第二分类器的预测误差e1,i和e2,i
目标函数处理模块用于利用目标域数据集的投影矩阵Pt和样本矩阵Xt、预测误差e1,i和e2,i,基于目标函数最小化得到第ξ次迭代时第一分类器和第二分类器的输出层权重
Figure BDA0002932570680000234
第一判断模块用于令ξ自增1,并判断是否满足ξ<Г,Г是分类器优化最大迭代次数,以及预测误差计算模块用于在第一判断模块判断结果为是时分别计算第一分类器和第二分类器的预测误差e1,i和e2,i
样本均衡模块用于在第一判断模块输出结果为否时,对
Figure BDA0002932570680000235
按行求二范数得到
Figure BDA0002932570680000236
并将δY中na个最大元素序号对应的样本打上标签,将na个打上标签后的样本从
Figure BDA0002932570680000237
中移至
Figure BDA0002932570680000238
中,更新源域数据集
Figure BDA0002932570680000239
和目标域数据集
Figure BDA00029325706800002310
的样本数量,其中,nt为目标域数据集中的样本数量,na是样本请求数量,
Figure BDA00029325706800002311
是第一分类器的预测结果,
Figure BDA00029325706800002312
是第二分类器的预测结果;
第二判断模块用于令τ自增1,并判断是否满足τ<Φ,以及初始化模块用于在第二判断模块输出结果为是时,令第一分类器和第二分类器初始的输出层权重
Figure BDA0002932570680000241
令分类器优化迭代次数ξ=1;
预测模块用于在第二判断模块输出结果为否时,用于对目标域数据集中的无标注样本x,采用
Figure BDA0002932570680000242
预测其对应的环境类别。
作为进一步优选的技术方案,所述预测误差计算模块具体用于:
计算所述第一分类器的预测误差
Figure BDA0002932570680000243
Figure BDA0002932570680000244
计算所述第二分类器的预测误差
Figure BDA0002932570680000245
Figure BDA0002932570680000246
其中,
Figure BDA0002932570680000247
为样本
Figure BDA0002932570680000248
对应的标签,C是标签的类别数量,ns为源域样本数量,
Figure BDA0002932570680000249
为所述第一分类器在第ξ-1次迭代时的输出层权重,
Figure BDA00029325706800002410
为所述第二分类器在第ξ-1次迭代时的输出层权重,
Figure BDA00029325706800002411
为源域特征矩阵的元素。
所述目标函数为:
Figure BDA00029325706800002412
其中,ρ和λ均是权衡系数,Q是高斯函数的数量,
Figure BDA00029325706800002413
是所述目标域数据集的投影矩阵的转置,
Figure BDA00029325706800002414
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,||·||F是F范数,所述目标域数据集的投影矩阵
Figure BDA00029325706800002416
其中,d表示特征维度,D为样本维度;
所述目标域数据集的投影矩阵
Figure BDA00029325706800002415
其中,d表示特征维度,D为样本维度;
所述目标域数据集的样本矩阵
Figure BDA0002932570680000251
Figure BDA0002932570680000252
表示所述目标域数据集中的样本,nt为所述目标域数据集中的样本数量。
作为进一步优选的技术方案,还包括参数设置模块,用于设定主动域适应最大迭代次数Φ>2,分类器优化最大迭代次数Γ>2,设定样本请求数量na>0,设置权衡系数ρ>0、权重参数λ>0,特征维度d,设定高斯函数的数量Q、第q个高斯核宽σq(q=1,2,…,Q)、高斯函数中心c以及高斯函数权重γq(q=1,2,…,Q)的值;
还包括样本权重矩阵计算模块,用于:
计算所述第一分类器和第二分类器的样本权重矩阵Λ1和Λ2,其中,样本权重矩阵Λ1的第q(i=1,2,…,ns)个元素
Figure BDA0002932570680000253
Figure BDA0002932570680000254
样本权重矩阵Λ2的第i(i=1,2,…,ns)个元素
Figure BDA0002932570680000255
Figure BDA0002932570680000256
Q表示使用的高斯核函数数量,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure BDA0002932570680000257
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,满足
Figure BDA0002932570680000258
本实施例公开了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行可实现所述的环境感知方法。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (18)

1.一种可靠主动域适应方法,其特征在于,包括:
S1、构建有标签的源域数据集
Figure FDA0002932570670000011
和无标签的目标域数据集
Figure FDA0002932570670000012
令主动域适应迭代次数τ=1,源域数据集和目标域数据集中的数据为序列数据;
S2、令第一分类器和第二分类器初始的输出层权重
Figure FDA0002932570670000013
Figure FDA0002932570670000014
令分类器优化迭代次数ξ=1;
S3、分别计算第一分类器和第二分类器的预测误差e1,i和e2,i
S4、利用目标域数据集的投影矩阵Pt和样本矩阵Xt、预测误差e1,i和e2,i,基于目标函数最小化得到第ξ次迭代时第一分类器和第二分类器的输出层权重
Figure FDA0002932570670000015
S5、令ξ自增1,并判断是否满足ξ<Γ,Γ是分类器优化最大迭代次数,若是则执行步骤S3,若否则令
Figure FDA0002932570670000016
然后执行步骤S6;
S6、对
Figure FDA0002932570670000017
按行求二范数得到
Figure FDA0002932570670000018
并将δY中na个最大元素序号对应的样本打上标签,将na个打上标签后的样本从
Figure FDA0002932570670000019
中移至
Figure FDA00029325706700000110
中,更新源域数据集
Figure FDA00029325706700000111
和目标域数据集
Figure FDA00029325706700000112
的样本数量,其中,nt为目标域数据集中的样本数量,na是样本请求数量,
Figure FDA00029325706700000113
是第一分类器的预测结果,
Figure FDA00029325706700000114
是第二分类器的预测结果;
S7、令τ自增1,并判断是否满足τ<Φ,则执行步骤S2,否则执行步骤S8;
S8、对于目标域数据集中的无标注样本x,采用
Figure FDA00029325706700000115
预测x对应的类别。
2.如权利要求1所述的可靠主动域适应方法,其特征在于,所述分别计算第一分类器和第二分类器的预测误差e1,i和e2,i,包括:
计算所述第一分类器的预测误差
Figure FDA0002932570670000021
Figure FDA0002932570670000022
计算所述第二分类器的预测误差
Figure FDA0002932570670000023
Figure FDA0002932570670000024
其中,
Figure FDA0002932570670000025
为样本
Figure FDA0002932570670000026
对应的标签,C是标签的类别数量,ns为源域样本数量,
Figure FDA0002932570670000027
为所述第一分类器在第ξ-1次迭代时的输出层权重,
Figure FDA0002932570670000028
为所述第二分类器在第ξ-1次迭代时的输出层权重,
Figure FDA0002932570670000029
为源域特征矩阵的元素。
3.如权利要求1所述的可靠主动域适应方法,其特征在于,所述目标函数为:
Figure FDA00029325706700000210
其中,ρ和λ均是权衡系数,Q是高斯函数的数量,
Figure FDA00029325706700000211
是所述目标域数据集的投影矩阵的转置,
Figure FDA00029325706700000212
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,||·||F是F范数,所述目标域数据集的投影矩阵
Figure FDA00029325706700000213
其中,d表示特征维度,D为样本维度;
所述目标域数据集的样本矩阵
Figure FDA00029325706700000214
Figure FDA00029325706700000215
表示所述目标域数据集中的样本,nt为所述目标域数据集中的样本数量。
4.如权利要求1-3任一项所述的可靠主动域适应方法,其特征在于,还包括:
设定主动域适应最大迭代次数Φ>2,分类器优化最大迭代次数Γ>2,设定样本请求数量na>0,设置权衡系数ρ>0、权重参数λ>0,特征维度d,设定高斯函数的数量Q、第q个高斯核宽σq(q=1,2,…,Q)、高斯函数中心c以及高斯函数权重γq(q=1,2,…,Q)的值;
还包括:
计算所述第一分类器和第二分类器的样本权重矩阵Λ1和Λ2,其中,样本权重矩阵Λ1的第i(i=1,2,…,ns)个元素
Figure FDA0002932570670000031
样本权重矩阵Λ2的第i(i=1,2,…,ns)个元素
Figure FDA0002932570670000032
Figure FDA0002932570670000033
Q表示使用的高斯核函数数量,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure FDA0002932570670000034
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,满足
Figure FDA0002932570670000035
5.一种可靠主动域适应装置,其特征在于,包括构建模块、初始化模块、预测误差计算模块、目标函数处理模块、第一判断模块、样本均衡模块、第二判断模块以及预测模块,其中:
构建模块用于构建有标签的源域数据集
Figure FDA0002932570670000036
和无标签的目标域数据集
Figure FDA0002932570670000037
令主动域适应迭代次数τ=1,源域数据集和目标域数据集中的数据为序列数据;
初始化模块用于令第一分类器和第二分类器初始的输出层权重
Figure FDA0002932570670000041
令分类器优化迭代次数ξ=1;
预测误差计算模块用于分别计算第一分类器和第二分类器的预测误差e1,i和e2,i
目标函数处理模块用于利用目标域数据集的投影矩阵Pt和样本矩阵Xt、预测误差e1,i和e2,i,基于目标函数最小化得到第ξ次迭代时第一分类器和第二分类器的输出层权重
Figure FDA0002932570670000042
第一判断模块用于令ξ自增1,并判断是否满足ξ<Γ,Γ是分类器优化最大迭代次数,以及预测误差计算模块用于在第一判断模块判断结果为是时分别计算第一分类器和第二分类器的预测误差e1,i和e2,i
样本均衡模块用于在第一判断模块输出结果为否时,对
Figure FDA0002932570670000043
按行求二范数得到
Figure FDA0002932570670000044
并将δY中na个最大元素序号对应的样本打上标签,将na个打上标签后的样本从
Figure FDA0002932570670000045
中移至
Figure FDA0002932570670000046
中,更新源域数据集
Figure FDA0002932570670000047
和目标域数据集
Figure FDA0002932570670000048
的样本数量,其中,nt为目标域数据集中的样本数量,na是样本请求数量,
Figure FDA0002932570670000049
是第一分类器的预测结果,
Figure FDA00029325706700000410
是第二分类器的预测结果;
第二判断模块用于令τ自增1,并判断是否满足τ<Φ,以及初始化模块用于在第二判断模块输出结果为是时,令第一分类器和第二分类器初始的输出层权重
Figure FDA00029325706700000411
令分类器优化迭代次数ξ=1;
预测模块用于在第二判断模块输出结果为否时,用于对目标域数据集中的无标注样本x,采用
Figure FDA00029325706700000412
预测x对应的类别。
6.如权利要求5所述的可靠主动域适应装置,其特征在于,所述预测误差计算模块具体用于:
计算所述第一分类器的预测误差
Figure FDA0002932570670000051
Figure FDA0002932570670000052
计算所述第二分类器的预测误差
Figure FDA0002932570670000053
Figure FDA0002932570670000054
其中,
Figure FDA0002932570670000055
为样本
Figure FDA0002932570670000056
对应的标签,C是标签的类别数量,ns为源域样本数量,
Figure FDA0002932570670000057
为所述第一分类器在第ξ-1次迭代时的输出层权重,
Figure FDA0002932570670000058
为所述第二分类器在第ξ-1次迭代时的输出层权重,
Figure FDA0002932570670000059
为源域特征矩阵的元素。
7.如权利要求5所述的可靠主动域适应装置,其特征在于,所述目标函数为:
Figure FDA00029325706700000510
其中,ρ和λ均是权衡系数,Q是高斯函数的数量,
Figure FDA00029325706700000511
是所述目标域数据集的投影矩阵的转置,
Figure FDA00029325706700000512
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,||·||F是F范数,所述目标域数据集的投影矩阵
Figure FDA00029325706700000513
其中,d表示特征维度,D为样本维度;
所述目标域数据集的投影矩阵
Figure FDA00029325706700000514
其中,d表示特征维度,D为样本维度;
所述目标域数据集的样本矩阵
Figure FDA00029325706700000515
Figure FDA0002932570670000061
表示所述目标域数据集中的样本,nt为所述目标域数据集中的样本数量。
8.如权利要求5-7任一项所述的可靠主动域适应装置,其特征在于,还包括参数设置模块,用于设定主动域适应最大迭代次数Φ>2,分类器优化最大迭代次数Γ>2,设定样本请求数量na>0,设置权衡系数ρ>0、权重参数λ>0,特征维度d,设定高斯函数的数量Q、第q个高斯核宽σq(q=1,2,…,Q)、高斯函数中心c以及高斯函数权重γq(q=1,2,…,Q)的值;
还包括样本权重矩阵计算模块,用于:
计算所述第一分类器和第二分类器的样本权重矩阵Λ1和Λ2,其中,样本权重矩阵Λ1的第i(i=1,2,…,ns)个元素
Figure FDA0002932570670000062
样本权重矩阵Λ2的第i(i=1,2,…,ns)个元素
Figure FDA0002932570670000063
Figure FDA0002932570670000064
Q表示使用的高斯核函数数量,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure FDA0002932570670000065
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,满足
Figure FDA0002932570670000066
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行可实现如权利要求1-4中任意一项所述的可靠主动域适应方法。
10.一种环境感知方法,其特征在于,包括:
T1、收集周围环境的振动序列数据,并对振动序列数据请求其对应的分类标签,得到有标签的源域数据集
Figure FDA0002932570670000071
和无标签的目标域数据集
Figure FDA0002932570670000072
令主动域适应迭代次数τ=1;
T2、令第一分类器和第二分类器初始的输出层权重
Figure FDA0002932570670000073
Figure FDA0002932570670000074
令分类器优化迭代次数ξ=1;
T3、分别计算第一分类器和第二分类器的预测误差e1,i和e2,i
T4、利用目标域数据集的投影矩阵Pt和样本矩阵Xt、预测误差e1,i和e2,i,基于目标函数最小化得到第ξ次迭代时第一分类器和第二分类器的输出层权重
Figure FDA0002932570670000075
T5、令ξ自增1,并判断是否满足ξ<Γ,Γ是分类器优化最大迭代次数,若是则执行步骤T3,若否则令
Figure FDA0002932570670000076
然后执行步骤T6;
T6、对
Figure FDA0002932570670000077
按行求二范数得到
Figure FDA0002932570670000078
并将δY中na个最大元素序号对应的样本打上标签,将na个打上标签后的样本从
Figure FDA0002932570670000079
中移至
Figure FDA00029325706700000710
中,更新源域数据集
Figure FDA00029325706700000711
和目标域数据集
Figure FDA00029325706700000712
的样本数量,其中,nt为目标域数据集中的样本数量,na是样本请求数量,
Figure FDA00029325706700000713
是第一分类器的预测结果,
Figure FDA00029325706700000714
是第二分类器的预测结果;
T7、令τ自增1,并判断是否满足τ<Φ,则执行步骤T2,否则执行步骤T8;
T8、对于目标域数据集中的无标注样本x,采用
Figure FDA00029325706700000715
预测其对应的环境类别。
11.如权利要求10所述的环境感知方法,其特征在于,所述分别计算第一分类器和第二分类器的预测误差e1,i和e2,i,包括:
计算所述第一分类器的预测误差
Figure FDA0002932570670000081
Figure FDA0002932570670000082
计算所述第二分类器的预测误差
Figure FDA0002932570670000083
Figure FDA0002932570670000084
其中,
Figure FDA0002932570670000085
为样本
Figure FDA0002932570670000086
对应的标签,C是标签的类别数量,ns为源域样本数量,
Figure FDA0002932570670000087
为所述第一分类器在第ξ-1次迭代时的输出层权重,
Figure FDA0002932570670000088
为所述第二分类器在第ξ-1次迭代时的输出层权重,
Figure FDA0002932570670000089
为源域特征矩阵的元素。
12.如权利要求10所述的环境感知方法,其特征在于,所述目标函数为:
Figure FDA00029325706700000810
其中,ρ和λ均是权衡系数,Q是高斯函数的数量,
Figure FDA00029325706700000811
是所述目标域数据集的投影矩阵的转置,
Figure FDA00029325706700000812
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,||·||F是F范数,所述目标域数据集的投影矩阵
Figure FDA00029325706700000813
其中,d表示特征维度,D为样本维度;
所述目标域数据集的投影矩阵
Figure FDA00029325706700000814
其中,d表示特征维度,D为样本维度;
所述目标域数据集的样本矩阵
Figure FDA00029325706700000815
Figure FDA00029325706700000816
表示所述目标域数据集中的样本,nt为所述目标域数据集中的样本数量。
13.如权利要求10-12任一项所述的环境感知方法,其特征在于,还包括:
设定主动域适应最大迭代次数Φ>2,分类器优化最大迭代次数Γ>2,设定样本请求数量na>0,设置权衡系数ρ>0、权重参数λ>0,特征维度d,设定高斯函数的数量Q、第q个高斯核宽σq(q=1,2,…,Q)、高斯函数中心c以及高斯函数权重γq(q=1,2,…,Q)的值;
还包括:
计算所述第一分类器和第二分类器的样本权重矩阵Λ1和Λ2,其中,样本权重矩阵Λ1的第i(i=1,2,…,ns)个元素
Figure FDA0002932570670000091
样本权重矩阵Λ2的第i(i=1,2,…,ns)个元素
Figure FDA0002932570670000092
Figure FDA0002932570670000093
Q表示使用的高斯核函数数量,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure FDA0002932570670000094
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,满足
Figure FDA0002932570670000095
14.一种环境感知装置,其特征在于,包括构建模块、初始化模块、预测误差计算模块、目标函数处理模块、第一判断模块、样本均衡模块、第二判断模块以及预测模块,其中:
构建模块用于收集周围环境的振动序列数据,并对振动序列数据请求其对应的分类标签,得到有标签的源域数据集
Figure FDA0002932570670000096
和无标签的目标域数据集
Figure FDA0002932570670000097
令主动域适应迭代次数τ=1;
初始化模块用于令第一分类器和第二分类器初始的输出层权重
Figure FDA0002932570670000101
令分类器优化迭代次数ξ=1;
预测误差计算模块用于分别计算第一分类器和第二分类器的预测误差e1,i和e2,i
目标函数处理模块用于利用目标域数据集的投影矩阵Pt和样本矩阵Xt、预测误差e1,i和e2,i,基于目标函数最小化得到第ξ次迭代时第一分类器和第二分类器的输出层权重
Figure FDA0002932570670000102
第一判断模块用于令ξ自增1,并判断是否满足ξ<Γ,Γ是分类器优化最大迭代次数,以及预测误差计算模块用于在第一判断模块判断结果为是时分别计算第一分类器和第二分类器的预测误差e1,i和e2,i
样本均衡模块用于在第一判断模块输出结果为否时,对
Figure FDA0002932570670000103
按行求二范数得到
Figure FDA0002932570670000104
并将δY中na个最大元素序号对应的样本打上标签,将na个打上标签后的样本从
Figure FDA0002932570670000105
中移至
Figure FDA0002932570670000106
中,更新源域数据集
Figure FDA0002932570670000107
和目标域数据集
Figure FDA0002932570670000108
的样本数量,其中,nt为目标域数据集中的样本数量,na是样本请求数量,
Figure FDA0002932570670000109
是第一分类器的预测结果,
Figure FDA00029325706700001010
是第二分类器的预测结果;
第二判断模块用于令τ自增1,并判断是否满足τ<Φ,以及初始化模块用于在第二判断模块输出结果为是时,令第一分类器和第二分类器初始的输出层权重
Figure FDA00029325706700001011
令分类器优化迭代次数ξ=1;
预测模块用于在第二判断模块输出结果为否时,用于对目标域数据集中的无标注样本x,采用
Figure FDA00029325706700001012
预测其对应的环境类别。
15.如权利要求14所述的环境感知装置,其特征在于,所述预测误差计算模块具体用于:
计算所述第一分类器的预测误差
Figure FDA0002932570670000111
Figure FDA0002932570670000112
计算所述第二分类器的预测误差
Figure FDA0002932570670000113
Figure FDA0002932570670000114
其中,
Figure FDA0002932570670000115
为样本
Figure FDA0002932570670000116
对应的标签,C是标签的类别数量,ns为源域样本数量,
Figure FDA0002932570670000117
为所述第一分类器在第ξ-1次迭代时的输出层权重,
Figure FDA0002932570670000118
为所述第二分类器在第ξ-1次迭代时的输出层权重,
Figure FDA0002932570670000119
为源域特征矩阵的元素。
16.如权利要求14所述的环境感知装置,其特征在于,所述目标函数为:
Figure FDA00029325706700001110
其中,ρ和λ均是权衡系数,Q是高斯函数的数量,
Figure FDA00029325706700001111
是所述目标域数据集的投影矩阵的转置,
Figure FDA00029325706700001112
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,||·||F是F范数,所述目标域数据集的投影矩阵
Figure FDA00029325706700001113
其中,d表示特征维度,D为样本维度;
所述目标域数据集的投影矩阵
Figure FDA00029325706700001114
其中,d表示特征维度,D为样本维度;
所述目标域数据集的样本矩阵
Figure FDA00029325706700001115
Figure FDA0002932570670000121
表示所述目标域数据集中的样本,nt为所述目标域数据集中的样本数量。
17.如权利要求14-16任一项所述的环境感知装置,其特征在于,还包括参数设置模块,用于设定主动域适应最大迭代次数Φ>2,分类器优化最大迭代次数Γ>2,设定样本请求数量na>0,设置权衡系数ρ>0、权重参数λ>0,特征维度d,设定高斯函数的数量Q、第q个高斯核宽σq(q=1,2,…,Q)、高斯函数中心c以及高斯函数权重γq(q=1,2,…,Q)的值;
还包括样本权重矩阵计算模块,用于:
计算所述第一分类器和第二分类器的样本权重矩阵Λ1和Λ2,其中,样本权重矩阵Λ1的第i(i=1,2,…,ns)个元素
Figure FDA0002932570670000122
样本权重矩阵Λ2的第i(i=1,2,…,ns)个元素
Figure FDA0002932570670000123
Figure FDA0002932570670000124
Q表示使用的高斯核函数数量,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure FDA0002932570670000125
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,满足
Figure FDA0002932570670000126
18.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行可实现如权利要求10-13中任意一项所述的环境感知方法。
CN202110150615.2A 2021-02-03 2021-02-03 可靠主动域适应方法、环境感知方法、装置及存储介质 Active CN112966559B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110150615.2A CN112966559B (zh) 2021-02-03 2021-02-03 可靠主动域适应方法、环境感知方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110150615.2A CN112966559B (zh) 2021-02-03 2021-02-03 可靠主动域适应方法、环境感知方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN112966559A true CN112966559A (zh) 2021-06-15
CN112966559B CN112966559B (zh) 2022-09-06

Family

ID=76274608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110150615.2A Active CN112966559B (zh) 2021-02-03 2021-02-03 可靠主动域适应方法、环境感知方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN112966559B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113537458A (zh) * 2021-06-21 2021-10-22 中国科学技术大学 一种有理式函数神经网络构建方法、系统及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180032900A1 (en) * 2016-07-27 2018-02-01 International Business Machines Corporation Greedy Active Learning for Reducing Labeled Data Imbalances
CN109308485A (zh) * 2018-08-02 2019-02-05 中国矿业大学 一种基于字典域适应的迁移稀疏编码图像分类方法
CN110147826A (zh) * 2019-04-23 2019-08-20 中国科学技术大学 一种动态环境下机器人地面分类方法及系统
KR102039138B1 (ko) * 2019-04-02 2019-10-31 주식회사 루닛 적대적 학습에 기반한 도메인 어댑테이션 방법 및 그 장치
CN111767674A (zh) * 2020-05-29 2020-10-13 中国科学技术大学 一种基于主动域适应的测井岩性识别方法
CN112308147A (zh) * 2020-11-02 2021-02-02 西安电子科技大学 基于多源域锚适配器集成迁移的旋转机械故障诊断方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180032900A1 (en) * 2016-07-27 2018-02-01 International Business Machines Corporation Greedy Active Learning for Reducing Labeled Data Imbalances
CN109308485A (zh) * 2018-08-02 2019-02-05 中国矿业大学 一种基于字典域适应的迁移稀疏编码图像分类方法
KR102039138B1 (ko) * 2019-04-02 2019-10-31 주식회사 루닛 적대적 학습에 기반한 도메인 어댑테이션 방법 및 그 장치
CN110147826A (zh) * 2019-04-23 2019-08-20 中国科学技术大学 一种动态环境下机器人地面分类方法及系统
CN111767674A (zh) * 2020-05-29 2020-10-13 中国科学技术大学 一种基于主动域适应的测井岩性识别方法
CN112308147A (zh) * 2020-11-02 2021-02-02 西安电子科技大学 基于多源域锚适配器集成迁移的旋转机械故障诊断方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CLAUDIO PERSELLO ETAL.: "A novel active learning strategy for domain adaptation in the classification of remote sensing images", 《2011 IEEE INTERNATIONAL GEOSCIENCE AND REMOTE SENSING SYMPOSIUM》 *
周军娜等: "通过域适应实现人脸识别", 《计算机应用研究》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113537458A (zh) * 2021-06-21 2021-10-22 中国科学技术大学 一种有理式函数神经网络构建方法、系统及可读存储介质

Also Published As

Publication number Publication date
CN112966559B (zh) 2022-09-06

Similar Documents

Publication Publication Date Title
Fan et al. Watching a small portion could be as good as watching all: Towards efficient video classification
Pathak et al. Feature selection for image steganalysis using levy flight-based grey wolf optimization
García et al. A Distributed K‐Means Segmentation Algorithm Applied to Lobesia botrana Recognition
US20210187733A1 (en) Data-efficient hierarchical reinforcement learning
CN112966559B (zh) 可靠主动域适应方法、环境感知方法、装置及存储介质
Dzieciuch et al. Non-linear convolutional neural network for automatic detection of mine-like objects in sonar imagery
Ganesan et al. Robust malware detection using residual attention network
CN115358305A (zh) 一种基于边界样本迭代生成的增量学习鲁棒性提升方法
Gonçalves et al. Automatic detection of Acacia longifolia invasive species based on UAV-acquired aerial imagery
CN110618854B (zh) 基于深度学习与内存镜像分析的虚机行为分析系统
Hosseini et al. Android malware classification using convolutional neural network and LSTM
Fiza et al. Improved chimp optimization algorithm (ICOA) feature selection and deep neural network framework for internet of things (IOT) based android malware detection
CN116630268A (zh) 一种道路病害检测方法、系统、设备及介质
Paluszek et al. Machine learning examples in Matlab
CN115880572A (zh) 一种基于异步学习因子的前视声呐目标识别方法
Wu et al. Unsupervised domain adaptation for vibration-based robotic ground classification in dynamic environments
CN113901932A (zh) 融合人工鱼与粒子群算法的工程机械图像识别方法及系统
Amer et al. Weight map layer for noise and adversarial attack robustness
CN114707572A (zh) 一种基于损失函数敏感度的深度学习样本测试方法与装置
Jaworska Image segment classification using CNN
Sykes et al. Computer vision for plant pathology: A review with examples from cocoa agriculture
Goel et al. Swarm and artificial immune system-based intelligence techniques for geo-spatial feature extraction
KR20230015284A (ko) 머신 학습을 위한 디바이스, 컴퓨터 프로그램 및 컴퓨터로 구현된 방법
US20220101196A1 (en) Device for and computer implemented method of machine learning
US20240144097A1 (en) Universal Post-Training Backdoor Detection and Mitigation for Classifiers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant