CN115062689A - 一种面向多传感器融合信息的特征迁移方法 - Google Patents

一种面向多传感器融合信息的特征迁移方法 Download PDF

Info

Publication number
CN115062689A
CN115062689A CN202210565144.6A CN202210565144A CN115062689A CN 115062689 A CN115062689 A CN 115062689A CN 202210565144 A CN202210565144 A CN 202210565144A CN 115062689 A CN115062689 A CN 115062689A
Authority
CN
China
Prior art keywords
network
data
domain
target
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210565144.6A
Other languages
English (en)
Inventor
芦楠楠
闫彤
马占国
张大亮
李吉祥
黄晓冉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Mining and Technology CUMT
Original Assignee
China University of Mining and Technology CUMT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Mining and Technology CUMT filed Critical China University of Mining and Technology CUMT
Priority to CN202210565144.6A priority Critical patent/CN115062689A/zh
Publication of CN115062689A publication Critical patent/CN115062689A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)

Abstract

本发明公开了一种面向多传感器融合信息的特征迁移方法,包括采集多个传感器数据得到多个源域数据集和目标域数据集;设计能够同时提取源域和目标域特征的源网络,对于有标签的源域数据计算监督损失,对于无标签的目标域数据进行数据变换并计算其一致性损失,保证预训练网络的无偏性;通过元学习对源网络和目标网络进行逐层匹配,确保知识迁移的准确性;设计领域自适应网络并使用元伪标签方法来更新源网络,实现源网络和领域自适应网络的相互反馈,使提取的特征更准确,提高目标网络的分类性能和域适应能力,实现端到端的领域自适应;最后将目标域数据集的测试数据输入到模型中,得到最终分类诊断结果。本发明可提高多传感器数据分类的准确率。

Description

一种面向多传感器融合信息的特征迁移方法
技术领域
本发明属于感知数据分类领域,特别一种面向多传感器融合信息的特征迁移方法。
背景技术
随着科学技术和信息技术的不断发展,物联网技术在人们生活和工业生产中的应用越来越广泛,传感器作为一种感应装置,主要是通过物体检测过程中对外界环境变化产生感应,并产生海量数据来传输信号,实现对物体的控制。大多传感器数据是按照时间顺序获得的连续数据序列,具有非线性非平稳的时序数据的特点。各种类型的传感器器可以被有效地利用在众多的应用中,包括人体行为识别,机械故障诊断以及煤矿巷道安全监测等。
以煤矿巷道安全监测为例,由于煤矿巷道所处地层条件复杂多变,安全事故频繁发生,因此对应变状态进行现场实时监测非常重要。行业相关人员研发了各种各样的传感器来获取大量煤矿巷道相关的数据信息,如电阻应变传感器、温度传感器、光纤传感器等,能够很好地满足煤矿恶劣的作业环境,保证煤矿的安全开采。在这些应用中,对传感器数据进行分类是至关重要的环节。随着传感器获取的时序数据的需求快速增长,传感器数据时序数据分类已经成为许多实际应用中必不可少的任务。
近年来,随着数据量的增长和计算性能的提高,卷积神经网络(CNN)和递归神经网络(RNN)在处理大规模时序数据的分类任务情况上表现出了优异的性能。然而,深度学习在时序数据分类任务中取得了成功是以繁琐的数据标注为代价的。此外,基于深度学习的方法总是假设训练数据(源域)和测试数据(目标域)来自相同的分布,这在实际应用中很难满足。
为了解决深度学习的在传感器时序数据分类任务上的局限性,提出了迁移学习技术,旨在将学习到的知识从源领域转移到目标领域。但是在目前的基于迁移学习的算法中存在两个显著的问题,一是用到的预训练网络大多都是用源域有标签的数据训练出来的,然而当传感器数据中源域和目标域的数据分布差异过大时,网络不可避免地会偏向源域,产生低质量的伪标签。二是目前的传感器数据的迁移算法范式,都是“预训练+微调”,用于领域自适应的网络参数大多是从预训练网络迁移而来,在确定网络参数时没有考虑预训练网络的哪一层可以迁移到目标网络的哪一层,且都忽略了目标网络对预训练网络的反馈作用,当预训练网络向目标网络传递的知识不准确时,会严重影响目标网络的分类性能,从而导致分类精度不高。
发明内容
为了解决上述背景技术提到的技术问题,本发明提出了一种面向多传感器融合信息的特征迁移方法。
为了实现上述技术目的,本发明的技术方案为:
一种面向多传感器融合信息的特征迁移方法,包括以下步骤:
(1)采用多种不同的传感器对数据进行采集,采集到的数据为时间序列数据,将采集到的传感器数据分为源域数据
Figure RE-GDA0003770087510000021
和目标域数据
Figure RE-GDA0003770087510000022
ns和nt分别对应Ds和Dt的数量,
Figure RE-GDA0003770087510000023
表示源域的类别,两个域共享标签集。
对于源域数据,计算监督损失,对于目标域数据,我们首先进行数据转换
Figure RE-GDA0003770087510000024
转换后的数据为
Figure RE-GDA0003770087510000025
表示
Figure RE-GDA0003770087510000026
的数量。然后计算原始目标域数据和转换后的目标域数据的无监督一致性训练损失,重复最小化损失函数以更新源网络F1的模型参数θ1,直至损失函数收敛;
(2)首先利用传感器数据数据集中的源域数据训练一个元网络gm,n,利用源网络找到可学习的参数ωm,n,ωm,n可以自动决定哪个源层应该转移到哪个目标层。然后计算特征匹配损失和监督损失,对目标网络进行训练,重复最小化损失函数以更新目标网络F2的模型参数θ2,直至损失函数收敛;
(3)通过源目标网络F2预测传感器数据集中目标域数据初始伪标签
Figure RE-GDA0003770087510000031
以及对应的置信度
Figure RE-GDA0003770087510000032
其中nt表示目标域中不带标签的数据个数,
Figure RE-GDA0003770087510000033
表示目标域数据中第j个数据对应的标签。
目标网络为一个多层的网络结构,以“锁定”的形式迁移目标网络F2前几层卷积的参数至领域自适应网络F3,并以微调的形式迁移剩余参数。采用 K-means算法对目标域数据的特征进行聚类,生成另一组伪标签。
对生成的两组标签构造一个关于伪标签的映射字典,根据伪标签的预测概率和聚类结果的映射比例值设为目标域数据的聚类置信度
Figure RE-GDA0003770087510000034
并利用“强簇规则”进一步更新滚动轴承数据集中伪标签
Figure RE-GDA0003770087510000035
将更新后的预测值设为对应样本伪标签的置信度σ(k),取整体的平均值作为类的整体置信度。
计算目标域与源域的边缘分布距离DM和条件分布距离DC以及条件分布的自适应权重因子μ,最小化损失函数以更新领域自适应网络F3的模型参数θ3,直至损失函数收敛;
(4)领域自适应网络F3训练好之后,将传感器数据集中的源域测试数据
Figure RE-GDA0003770087510000036
输入到域适应网络中F3计算其交叉熵的损失,nst表示Dst的数量。最后,利用产生的损失来更新一次源网络F1的参数θ1
(5)重复步骤(2),(3)和(4),直至数据集中目标域的伪标签不再更新;将目标域测试数据输入到更新后的领域自适应网络F3中,得到传感器数据分类识别的准确率。
进一步地,步骤(1)中的损失函数的表达式如下:
Figure RE-GDA0003770087510000041
其中为θ1源网络F1参数,
Figure RE-GDA0003770087510000042
设为源网络固定的网络参数,即不通过梯度更新。对传感器数据集中目标域数据进行了一次小波变换,交叉熵损失函数J(·)和KL 散度
Figure RE-GDA0003770087510000043
分别设为监督损失和一致性损失。pθ(y|x)表示网络的输出分布,α为加权因子来平衡这两个损失。源网络为一个8层的网络结构,包括4层卷积, 1层平均池化,2层全连接,和1层输出层。
在这个阶段,本发明还提出两个技巧:第一,在计算一致性损失时,对于预测效果较差的样本,即锐化前置信度小于某一阈值β的数据,不计入一致性损失;其第二,利用知识蒸馏中的温度τ来锐化变换后的目标域样本的预测概率;对于一致性损失计算,对应的公式为:
Figure RE-GDA0003770087510000044
Figure RE-GDA0003770087510000045
其中,I(·)是指标函数,zy是样本x对应标签y的输出概率值,B是数据的小批量大小。
进一步地,步骤(2)中,引入了一个可学习的参数ωm,n>0。对于每个传输层对(m,n)(源网络第m层和目标网络第n层构成一个传输层对),学习一个参数ωm,n表示要传输的量。
本步骤设计了一个元网络gm,n来学习对目标网络重要的传输层对,所以
Figure RE-GDA0003770087510000046
其中φ为元网络参数。在这一步骤中,目标是利用源网络的知识来训练目标网络F2的参数θ2。匹配损失函数可以写如下:
Figure RE-GDA0003770087510000051
其中
Figure RE-GDA0003770087510000052
为源网络第m层的输出,
Figure RE-GDA0003770087510000053
为目标网络第n层的输出。
Figure RE-GDA0003770087510000054
是一个参数化的线性变换。转换的目的是确保源网络和目标网络的大小相同。 H×W,i∈{1,2,…,H}i∈{1,2,…,H}j∈{1,2,…,W}为
Figure RE-GDA0003770087510000055
Figure RE-GDA0003770087510000056
的大小。S是所有可能的层对的集合。
本步骤总损失表达式如下:
Figure RE-GDA0003770087510000057
Figure RE-GDA0003770087510000058
其中J(·)为交叉熵损失,目的是为了保证传递准确性,最小化源域分类误差。γ是超参数。目标网络为一个8层的网络结构,包括4层卷积,1层平均池化, 2层全连接,和1层输出层。本设计将元网络构建为对(m,n)的1层全连接网络。
进一步地,在步骤(3)中,所述的“强簇规则”为:将同一批次网络预测伪标签和聚类生成的伪标签生成字典映射,先设置字典映射的阈值α和最小样本数n=batch/N·β,其中batch为批大小,N为类别数,β是决定最小样本大小的参数,若对于聚类生成伪标签的第i类与网络预测伪标签的第j类字典映射比例大于阈值α且字典映射的样本数量大于最小样本数n,则把聚类生成的伪标签 i及置信度作为网络的伪标签及置信度,该置信度为
Figure RE-GDA0003770087510000059
否则将网络预测的伪标签j及置信度作为网络的伪标签及置信度
Figure RE-GDA00037700875100000510
置信度
Figure RE-GDA00037700875100000511
的表达式如下:
Figure RE-GDA00037700875100000512
其中,
Figure RE-GDA00037700875100000513
是预测为其他标签而不是聚类标签的样本数。
置信度
Figure RE-GDA0003770087510000061
的表达式如下:
Figure RE-GDA0003770087510000062
其中,
Figure RE-GDA0003770087510000063
是滚动轴承故障诊断数据集中目标域数据
Figure RE-GDA0003770087510000064
全部类别C中某一类k的样本总数,
Figure RE-GDA0003770087510000065
为样本属于相应类别的概率,
Figure RE-GDA0003770087510000066
的表达式如下:
Figure RE-GDA0003770087510000067
其中,
Figure RE-GDA0003770087510000068
为滚动轴承故障诊断数据集中目标域数据
Figure RE-GDA0003770087510000069
通过两域迁移网络F3产生预测类别的概率值θ3是两域迁移网络F3的参数,概率最高的类别被选为伪标签
Figure RE-GDA00037700875100000610
在步骤(3)中,计算传感器数据集中源域与目标域的边缘分布距离DM和条件分布距离DC表达式如下:
Figure RE-GDA00037700875100000611
Figure RE-GDA00037700875100000612
其中,
Figure RE-GDA00037700875100000613
指在再生核希尔伯特空间映射,
Figure RE-GDA00037700875100000614
是传感器数据集中源域数据
Figure RE-GDA00037700875100000615
全部类别C中某一类k的样本总数,σ(k)为第k类样本的置信度,其初始值为
Figure RE-GDA00037700875100000616
后续的σ(k)为强簇规则更新后的置信度;
计算条件分布的自适应权重因子μ表达式如下:
Figure RE-GDA00037700875100000617
其中,
Figure RE-GDA00037700875100000618
为DM简化的其无偏估计,
Figure RE-GDA00037700875100000619
为DC简化的其无偏估计。
本步骤总损失函数表达式如下:
Figure RE-GDA0003770087510000071
其中,第一部分是最小化源域监督学习的分类误差,保证所提取的域不变特征与源域标签之间的相关性,λ是正则化参数,
Figure RE-GDA0003770087510000072
为两域数据的联合分布适配距离:
Figure RE-GDA0003770087510000073
其中λ为正则化参数,λ=2/1+e(-10*epoch/epochs)-1,领域自适应网络为一个8层的网络结构,包括4层卷积,1层平均池化,2层全连接,和1层输出层。
进一步地,在步骤(4)中,损失函数表达式如下:
Figure RE-GDA0003770087510000074
其中J(·)为交叉熵损失,θ3为领域自适应网络F3的参数。
采用上述技术方案带来的有益效果:
本发明基于自监督学习的源网络通过对有标签和无标签轴承数据同时进行训练,更加公平纯粹地提取两域数据的无偏向特征。本发明利用元学习算法,对源网络和目标网络进行逐层匹配,并实现了源网络和领域自适应网络的相互反馈,实现了端到端的领域自适应。可以提高了伪标签的准确性。
附图说明
图1是本发明提供的一种面向多传感器融合信息的特征迁移方法的整体流程图;
图2是本发明提供的基于自监督学习源网络的示意图;
图3是本发明提供的端到端的领域自适应的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明设计了一种面向多传感器融合信息的特征迁移方法,如图1所示,包括三个环节:1)数据采集;2)模型训练;3)分类识别。
数据采集:本方案使用的数据集为OPPORTUNITY数据集(OPP)、PAMAP2 数据集和UCI daily and sports数据集(DSADS)。OPPORTUNITY数据集(OPP)是一个记录在传感器丰富的环境下的多功能人类活动数据集,由4个受试者的5个身体部位的5个活动组成。
PAMAP2数据集是活动监测的基线数据集,由9名受试者使用来自3个身体部位的传感器执行18个活动集合。UCI daily and sports(DSADS)是一个日常和体育活动数据集,包括19项活动,收集自8名受试者在5个身体部位佩戴的可穿戴传感器。表1简要介绍了用于人类活动识别的三个数据集。
三个数据集都使用了加速度计、陀螺仪和磁力计传感器收集数据。OPP数据集的采样频率为32hz,PAMAP2数据集的采样频率为100Hz,DSADS数据集的采样频率为25Hz。本方案在以下两种情况下进行了综合实验:
(1)相同数据集中的相似身体部位,指的是高度相似的身体部位,如左、右手臂。具体来说,我们从OPP和DSADS中提取数据(PAMAP2没有相似的部分,不包括在内),构建了8个任务:RA→LA,LA→RA,RL→LL,LL→RL, RUA→LUA,LUA→RUA,RLA→LLA,LLA→RLA。
(2)同一数据集中的不同身体部位,指的是躯干和手臂等不同的身体部位。具体地,我们从三个数据集构建了18个任务:RA→T,T→RA,RA→RL,RL→RA, RL→T,T→RL,H→C,C→H,A→C,C→A,H→A,A→H,RLA→B,B→RLA, RUA→B,B→RUA,RUA→RLA,RLA→RUA。
本实验采用的网络结构和参数如表2所示,
表1如下:
Figure RE-GDA0003770087510000091
表2如下:
编号 名称 卷积核数量 卷积核参数 步长 激活函数
1 卷积层1 32 1*128 1*6 PReLU
2 卷积层2 64 1*64 1*4 PReLU
3 卷积层3 128 1*8 1*2 PReLU
4 卷积层4 256 1*2 1*2 PReLU
5 平均池化 - 2*2 2*2 PReLU
6 全连接 1 256 - -
7 全连接 1 64 - -
8 输出 1 n - Softmax
模型训练:其中包含两部分,第一,源网络的训练:如图2所示将采集到的传感器分为源域数据和目标域数据,对于目标域数据,我们首先进行小波变换
Figure RE-GDA0003770087510000092
转换后的数据为
Figure RE-GDA0003770087510000093
然后计算原始目标域数据和转换后的目标域数据的无监督一致性训练损失,重复最小化损失函数以更新源网络F1的模型参数θ1,直至损失函数收敛;损失函数的表达式如下:
Figure RE-GDA0003770087510000094
其中为θ1源网络F1参数,
Figure RE-GDA0003770087510000095
设为源网络固定的网络参数,即不通过梯度更新。对传感器数据集数据集中目标域数据进行了一次小波变换,交叉熵损失函数J(·) 和KL散度
Figure RE-GDA0003770087510000101
分别设为监督损失和一致性损失。
α为加权因子来平衡这两个损失。源网络为一个8层的网络结构,包括4 层卷积,1层平均池化,2层全连接,和1层输出层。在这个阶段,本实例还提出两个技巧:1、在计算一致性损失时,预测效果较差的样本,即锐化前置信度小于某一阈值β的数据,不计入一致性损失;2、利用知识蒸馏中的温度τ来锐化变换后的目标域样本的预测概率;对于一致性损失计算,对应的公式为:
Figure RE-GDA0003770087510000102
Figure RE-GDA0003770087510000103
其中,I(·)是指标函数,zy是样本x对应标签y的输出概率值,B是数据的小批量大小。
第二、端到端的领域自适应,如图3所示,这其中又包含三部分。一是源网络和目标网络的逐层匹配:首先利用传感器数据集中的源域数据训练一个元网络 gm,n,找到可学习的参数ωm,n,ωm,n可以自动决定哪个源层应该转移到哪个目标层。然后计算特征匹配损失和监督损失,对目标网络进行训练,重复最小化损失函数以更新目标网络F2的模型参数θ2,直至损失函数收敛;匹配特征损失函数可以写如下:
Figure RE-GDA0003770087510000104
其中
Figure RE-GDA0003770087510000105
为源网络第m层的输出,
Figure RE-GDA0003770087510000106
为目标网络第n层的输出。
Figure RE-GDA0003770087510000107
是一个参数化的线性变换。转换的目的是确保源网络和目标网络的大小相同。 H×W,i∈{1,2,...,H}i∈{1,2,...,H}j∈{1,2,...,W}为
Figure RE-GDA0003770087510000108
Figure RE-GDA0003770087510000109
的大小。S是所有可能的层对的集合。
本步骤总损失函数表达式如下:
Figure RE-GDA0003770087510000111
Figure RE-GDA0003770087510000112
其中
Figure RE-GDA0003770087510000113
为交叉熵损失,目的是为了保证传递准确性,最小化源域分类误差。γ是超参数。目标网络为一个8层的网络结构,包括4层卷积,1层平均池化,2 层全连接,和1层输出层。元网络为每一对(m,n)的1层全连接网络。
二是领域自适应的训练:通过源目标网络F2预测传感器数据集中目标域的初始伪标签
Figure RE-GDA0003770087510000114
以及对应的置信度
Figure RE-GDA0003770087510000115
其中nt表示目标域中不带标签的数据个数,
Figure RE-GDA0003770087510000116
表示目标域数据中第j个数据对应的标签。
本实施例目标网络为一个8层的网络结构,以“锁定”的形式迁移目标网络 F2前4层卷积的参数至领域自适应网络F3,并以微调的形式迁移剩余参数。
采用K-means算法对目标域数据的特征进行聚类,生成另一组伪标签。对生成的两组标签构造一个关于伪标签的映射字典,根据伪标签的预测概率和聚类结果的映射比例值设为目标域数据的聚类置信度
Figure RE-GDA0003770087510000117
并利用“强簇规则”进一步更新传感器数据集中伪标签
Figure RE-GDA0003770087510000118
将更新后的预测值设为对应样本伪标签的置信度σ(k),取整体的平均值作为类的整体置信度。
所述的“强簇规则”为,将同一批次网络预测伪标签和聚类生成的伪标签生成字典映射,先设置字典映射的阈值α和最小样本数n=batch/N·β,其中batch 为批大小,N为类别数,β是决定最小样本大小的参数,若对于聚类生成伪标签的第i类与网络预测伪标签的第j类字典映射比例大于阈值α且字典映射的样本数量大于最小样本数n,则把聚类生成的伪标签i及置信度作为网络的伪标签及置信度,该置信度为
Figure RE-GDA0003770087510000119
否则将网络预测的伪标签j及置信度作为网络的伪标签及置信度
Figure RE-GDA0003770087510000121
置信度
Figure RE-GDA0003770087510000122
的表达式如下:
Figure RE-GDA0003770087510000123
其中,
Figure RE-GDA0003770087510000124
是预测为其他标签而不是聚类标签的样本数。计算目标域与源域的边缘分布距离DM和条件分布距离DC以及条件分布的自适应权重因子μ,最小化损失函数以更新领域自适应网络F3的模型参数θ3,直至损失函数收敛。源域与目标域的边缘分布距离DM和条件分布距离DC表达式如下:
Figure RE-GDA0003770087510000125
Figure RE-GDA0003770087510000126
其中,
Figure RE-GDA0003770087510000127
指在再生核希尔伯特空间映射,
Figure RE-GDA0003770087510000128
是传感器数据集中源域数据
Figure RE-GDA0003770087510000129
全部类别CT中某一类k的样本总数,σ(k)为第k类样本的置信度,其初始值为
Figure RE-GDA00037700875100001210
后续的σ(k)为强簇规则更新后的置信度;
计算条件分布的自适应权重因子μ表达式如下:
Figure RE-GDA00037700875100001211
其中,
Figure RE-GDA00037700875100001212
为DM简化的其无偏估计,
Figure RE-GDA00037700875100001213
为DC简化的其无偏估计。
本步骤总损失函数表达式如下:
Figure RE-GDA00037700875100001214
其中,第一部分是最小化源域监督学习的分类误差,保证所提取的域不变特征与源域标签之间的相关性,λ是正则化参数,
Figure RE-GDA00037700875100001215
为两域数据的联合分布适配距离:
Figure RE-GDA0003770087510000131
其中λ为正则化参数,λ=2/1+e(-10*epoch/epochs)-1,领域自适应网络为一个8层的网络结构,包括4层卷积,1层平均池化,2层全连接,和1层输出层。
三是源网络的更新:领域适应网络F3训练好之后,将传感器数据集中的源域的测试数据
Figure RE-GDA0003770087510000132
输入到域适应网络中F3计算其交叉熵的损失。最后,利用产生的损失来更新一次源网络F1的参数θ1。损失函数表达式如下:
Figure RE-GDA0003770087510000133
分类识别:通过对训练至收敛领域自适应模型的测试,采用目标域数据进行测试来验证算法的有效性,实现分类识别。
本方案将在人类活动识别数据集上比较本发明的方法与最近的领域自适应方法。DDC方法在常规的深度CNN中加入特征适应层,学习具有鉴别性和域不变性的特征。DAN设计了多层自适应多核MMD,以最小化域之间的差异。
JAN提出了最小化联合最大平均偏差的方法来度量网络最后一层的联合分布差异。以往的DDC或DAN只考虑单个隐层源域与目标域之间的距离,但有时测量联合分布之间的差异会更好。此外,DDC和DAN只考虑了边际分布差异, JAN也考虑了条件分布差异的差异。
STL提出了一种行为识别任务的迭代协同训练方法。利用训练标注源数据的分类模型,将源数据和目标数据投影到公共空间中,并在投影数据上训练分类器,以确定目标域中更可靠的伪标签。
如果源域和目标域共享标签集,则该方法有效。TNNAR提出了一种无监督源域选择算法用于活动识别,该算法可以从可用域列表中选择K个最相似的源域。同时,提出了一种用于活动识别的有效深度迁移网络。SPL提出了一种基于监督局部保持投影(SLPP)子空间学习和选择性伪符号策略的模型迭代学习算法。
利用结构预测方法挖掘目标域的结构信息,提高伪标记和域对齐的精度。为了提高人类活动识别的准确性和鲁棒性,JTS提出了一种联合转移策略。利用联合传输策略将源和目标域数据映射到共享域不变子空间,保留数据结构信息,学习自适应分类器对目标数据进行标记。
表3显示了相同数据集在相似位置的传输结果。表4显示了不同部位的转移结果。从表3中相似的身体部位可以看出,我们方法的准确率分别为84%和 83.9%,优于其他方法。对于不同的身体部位,由于相关性较弱,表4中相同数据集在不同身体部位的传递效果不如表3中好,表3、表4如下:
表3为相同数据集在相似位置的传输结果,如下
Figure RE-GDA0003770087510000141
表4为不同身体部位的识别精度,如下:
Figure RE-GDA0003770087510000142
Figure RE-GDA0003770087510000151
Figure RE-GDA0003770087510000161
然而,本发明的方法的准确性仍然高于其他方法。可以证明,自监督学习和端到端域适应相结合也可以提高行为识别性能。因此,本发明提出的方法在时间序列分类任务中具有泛化性。
实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (5)

1.一种面向多传感器融合信息的特征迁移方法,其特征在于,包括以下步骤:
(1)采用多种不同的传感器对数据进行采集,采集到的数据为时间序列数据,将采集到的传感器数据分为源域数据
Figure FDA0003657649080000011
和目标域数据
Figure FDA0003657649080000012
ns和nt分别对应Ds和Dt的数量,
Figure FDA0003657649080000013
表示源域的类别,两个域共享标签集;
对于源域数据,计算监督损失,对于目标域数据,首先进行数据转换
Figure FDA0003657649080000014
转换后的数据为
Figure FDA0003657649080000015
Figure FDA0003657649080000016
表示
Figure FDA0003657649080000017
的数量;
然后计算原始目标域数据和转换后的目标域数据的无监督一致性训练损失,重复最小化损失函数以更新源网络F1的模型参数θ1,直至损失函数收敛;
(2)首先利用数据集中的源域数据训练一个元网络gm,n,利用源网络找到可学习的参数ωm,n,ωm,n可自动决定哪个源层应该转移到哪个目标层;
然后计算特征匹配损失和监督损失,对目标网络进行训练,重复最小化损失函数以更新目标网络F2的模型参数θ2,直至损失函数收敛;
(3)通过源目标网络F2预测传感器数据集中目标域数据初始伪标签
Figure FDA0003657649080000018
以及对应的置信度
Figure FDA0003657649080000019
其中nt表示目标域中不带标签的数据个数,
Figure FDA00036576490800000110
表示目标域数据中第j个数据对应的标签;
目标网络为一个多层的网络结构,以“锁定”的形式迁移目标网络F2前几层卷积的参数至领域自适应网络F3,并以微调的形式迁移剩余参数;
采用K-means算法对目标域数据的特征进行聚类,生成另一组伪标签,对生成的两组标签构造一个关于伪标签的映射字典,根据伪标签的预测概率和聚类结果的映射比例值设为目标域数据的聚类置信度
Figure FDA00036576490800000111
并利用“强簇规则”进一步更新滚动轴承数据集中伪标签
Figure FDA0003657649080000021
将更新后的预测值设为对应样本伪标签的置信度σ(k),取整体的平均值作为类的整体置信度;
计算目标域与源域的边缘分布距离DM和条件分布距离DC以及条件分布的自适应权重因子μ,最小化损失函数以更新领域自适应网络F3的模型参数θ3,直至损失函数收敛;
(4)领域自适应网络F3训练好之后,将传感器数据集中的源域测试数据
Figure FDA0003657649080000022
输入到域适应网络中F3计算其交叉熵的损失,nst表示Dst的数量;最后,利用产生的损失来更新一次源网络F1的参数θ1
(5)重复步骤(2),(3)和(4),直至数据集中目标域的伪标签不再更新;将目标域测试数据输入到更新后的领域自适应网络F3中,得到传感器数据分类识别的准确率。
2.根据权利要求1所述一种面向多传感器融合信息的特征迁移方法,其特征在于,步骤(1)中的损失函数的表达式如下:
Figure FDA0003657649080000023
其中为θ1源网络F1参数,
Figure FDA0003657649080000024
设为源网络固定的网络参数,即不通过梯度更新;对传感器数据集中目标域数据进行一次小波变换,交叉熵损失函数J(·)和KL散度
Figure FDA0003657649080000025
分别设为监督损失和一致性损失;pθ(y|x)表示网络的输出分布,α为加权因子来平衡这两个损失;源网络为一个8层的网络结构,包括4层卷积,1层平均池化,2层全连接,和1层输出层;
在这个阶段有两个技巧:第一,在计算一致性损失时,对于预测效果较差的样本,即锐化前置信度小于某一阈值β的数据,不计入一致性损失;其第二,利用知识蒸馏中的温度τ来锐化变换后的目标域样本的预测概率;对于一致性损失计算,对应的公式为:
Figure FDA0003657649080000031
Figure FDA0003657649080000032
其中,I(·)是指标函数,zy是样本x对应标签y的输出概率值,B是数据的小批量大小。
3.根据权利要求1所述一种面向多传感器融合信息的特征迁移方法,其特征在于,步骤(2)中,引入一个可学习的参数ωm,n>0;对于每个传输层对(m,n),(m,n)指源网络第m层和目标网络第n层构成一个传输层对,学习一个参数ωm,n表示要传输的量;本步骤设计了一个元网络gm,n来学习对目标网络重要的传输层对,所以
Figure FDA0003657649080000033
其中φ为元网络参数;
在这一步骤中,目标是利用源网络的知识来训练目标网络F2的参数θ2,匹配损失函数如下:
Figure FDA0003657649080000034
其中F1 m(x)为源网络第m层的输出,
Figure FDA0003657649080000035
为目标网络第n层的输出,
Figure FDA0003657649080000036
是一个参数化的线性变换;转换的目的是确保源网络和目标网络的大小相同;H×W,i∈{1,2,...,H}i∈{1,2,...,H}j∈{1,2,...,W}为F1 m
Figure FDA0003657649080000037
的大小;S是所有可能的层对的集合;
本步骤总损失表达式如下:
Figure FDA0003657649080000038
Figure FDA0003657649080000039
其中J(·)为交叉熵损失,目的是为了保证传递准确性,最小化源域分类误差;γ是超参数;目标网络为一个8层的网络结构,包括4层卷积,1层平均池化,2层全连接,和1层输出层;本设计将元网络构建为对(m,n)的1层全连接网络。
4.根据权利要求1所述一种面向多传感器融合信息的特征迁移方法,其特征在于,在步骤(3)中,所述的“强簇规则”为:将同一批次网络预测伪标签和聚类生成的伪标签生成字典映射,先设置字典映射的阈值α和最小样本数n=batch/N·β,其中batch为批大小,N为类别数,β是决定最小样本大小的参数,若对于聚类生成伪标签的第i类与网络预测伪标签的第j类字典映射比例大于阈值α且字典映射的样本数量大于最小样本数n,则把聚类生成的伪标签i及置信度作为网络的伪标签及置信度,该置信度为
Figure FDA0003657649080000041
否则将网络预测的伪标签j及置信度作为网络的伪标签及置信度
Figure FDA0003657649080000042
置信度
Figure FDA0003657649080000043
的表达式如下:
Figure FDA0003657649080000044
其中,
Figure FDA0003657649080000045
是预测为其他标签而不是聚类标签的样本数;
置信度
Figure FDA0003657649080000046
的表达式如下:
Figure FDA0003657649080000047
其中,
Figure FDA0003657649080000048
是滚动轴承故障诊断数据集中目标域数据
Figure FDA0003657649080000049
全部类别C中某一类k的样本总数,
Figure FDA00036576490800000410
为样本属于相应类别的概率,
Figure FDA00036576490800000411
的表达式如下:
Figure FDA00036576490800000412
其中,
Figure FDA00036576490800000413
为滚动轴承故障诊断数据集中目标域数据
Figure FDA00036576490800000414
通过两域迁移网络F3产生预测类别的概率值θ3是两域迁移网络F3的参数,概率最高的类别被选为伪标签
Figure FDA0003657649080000051
在步骤(3)中,计算传感器数据集中源域与目标域的边缘分布距离DM和条件分布距离DC表达式如下:
Figure FDA0003657649080000052
Figure FDA0003657649080000053
其中,
Figure FDA0003657649080000054
指在再生核希尔伯特空间映射,
Figure FDA0003657649080000055
是传感器数据集中源域数据
Figure FDA0003657649080000056
全部类别C中某一类k的样本总数,σ(k)为第k类样本的置信度,其初始值为
Figure FDA0003657649080000057
后续的σ(k)为强簇规则更新后的置信度;
计算条件分布的自适应权重因子μ表达式如下:
Figure FDA0003657649080000058
其中,
Figure FDA0003657649080000059
为DM简化的其无偏估计,
Figure FDA00036576490800000510
为DC简化的其无偏估计;
本步骤总损失函数表达式如下:
Figure FDA00036576490800000511
其中,第一部分是最小化源域监督学习的分类误差,保证所提取的域不变特征与源域标签之间的相关性,λ是正则化参数,
Figure FDA00036576490800000512
为两域数据的联合分布适配距离:
Figure FDA00036576490800000513
其中λ为正则化参数,λ=2/1+e(-10*epoch/epochs)-1,领域自适应网络为一个8层的网络结构,包括4层卷积,1层平均池化,2层全连接,和1层输出层。
5.根据权利要求1所述一种面向多传感器融合信息的特征迁移方法,其特征在于,在步骤(4)中,损失函数表达式如下:
Figure FDA0003657649080000061
其中J(·)为交叉熵损失,θ3为领域自适应网络F3的参数。
CN202210565144.6A 2022-05-23 2022-05-23 一种面向多传感器融合信息的特征迁移方法 Pending CN115062689A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210565144.6A CN115062689A (zh) 2022-05-23 2022-05-23 一种面向多传感器融合信息的特征迁移方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210565144.6A CN115062689A (zh) 2022-05-23 2022-05-23 一种面向多传感器融合信息的特征迁移方法

Publications (1)

Publication Number Publication Date
CN115062689A true CN115062689A (zh) 2022-09-16

Family

ID=83197744

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210565144.6A Pending CN115062689A (zh) 2022-05-23 2022-05-23 一种面向多传感器融合信息的特征迁移方法

Country Status (1)

Country Link
CN (1) CN115062689A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116010804A (zh) * 2023-02-01 2023-04-25 南京邮电大学 基于深度学习与知识迁移的物联网设备小样本识别方法
CN117131214A (zh) * 2023-10-26 2023-11-28 北京科技大学 基于特征分布对齐与聚类的零样本草图检索方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116010804A (zh) * 2023-02-01 2023-04-25 南京邮电大学 基于深度学习与知识迁移的物联网设备小样本识别方法
CN117131214A (zh) * 2023-10-26 2023-11-28 北京科技大学 基于特征分布对齐与聚类的零样本草图检索方法及系统
CN117131214B (zh) * 2023-10-26 2024-02-09 北京科技大学 基于特征分布对齐与聚类的零样本草图检索方法及系统

Similar Documents

Publication Publication Date Title
Wang et al. Time series feature learning with labeled and unlabeled data
Wang et al. A deformable CNN-DLSTM based transfer learning method for fault diagnosis of rolling bearing under multiple working conditions
Diallo et al. Deep embedding clustering based on contractive autoencoder
CN110580482B (zh) 图像分类模型训练、图像分类、个性化推荐方法及装置
Pasini Artificial neural networks for small dataset analysis
Yan et al. Correcting instrumental variation and time-varying drift: A transfer learning approach with autoencoders
CN115062689A (zh) 一种面向多传感器融合信息的特征迁移方法
CN109993100B (zh) 基于深层特征聚类的人脸表情识别的实现方法
CN110674323B (zh) 基于虚拟标签回归的无监督跨模态哈希检索方法及系统
CN105095863B (zh) 基于相似性权值的半监督字典学习的人体行为识别方法
Wu et al. A weighted deep domain adaptation method for industrial fault prognostics according to prior distribution of complex working conditions
CN111881671B (zh) 一种属性词提取方法
CN114912612A (zh) 鸟类识别方法、装置、计算机设备及存储介质
CN111582506A (zh) 基于全局和局部标记关系的偏多标记学习方法
Chen et al. Negative-ResNet: noisy ambulatory electrocardiogram signal classification scheme
Li et al. Profile decomposition based hybrid transfer learning for cold-start data anomaly detection
CN114998995A (zh) 基于度量学习和时空双流网络的跨视角步态识别方法
Vrbačič et al. Hyper-parameter optimization of convolutional neural networks for classifying COVID-19 X-ray images
Jain et al. Machine learning-based monitoring system with IoT using wearable sensors and pre-convoluted fast recurrent neural networks (P-FRNN)
Fu et al. MCA-DTCN: A novel dual-task temporal convolutional network with multi-channel attention for first prediction time detection and remaining useful life prediction
Tayeb et al. A new neural architecture for feature extraction of remote sensing data
Geng et al. Hatching egg classification based on CNN with channel weighting and joint supervision
Mikhaylenko et al. Analysis of the predicting neural network person recognition system by picture image
CN117036760A (zh) 一种基于图对比学习的多视图聚类模型实现方法
CN114495265B (zh) 多跨域场景下基于活动图加权的人体行为识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination