CN114495265B

CN114495265B - 多跨域场景下基于活动图加权的人体行为识别方法

Info

Publication number: CN114495265B
Application number: CN202111668405.9A
Authority: CN
Inventors: 叶娅兰; 刘紫奇; 孟千贺
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2021-07-15
Filing date: 2021-12-31
Publication date: 2023-04-07
Anticipated expiration: 2041-12-31
Also published as: CN114495265A

Abstract

本发明公开了一种多跨域场景下基于活动图加权的人体行为识别方法。本发明包括人体生理信号预处理、信号活动图转换、模型预训练、样本加权、训练模型和运动状态识别六部分；对预处理后的信号样本提取每一维度重新排列组合，应用二维离散傅里叶变化转换为活动图形式；接着基于同一类别数据会映射到子空间相近位置这一假设，应用源域数据和三元组损失预训练模型，提升模型泛化能力；利用域判别器的概率预测分别对源域和目标域的样本加权；计算源域加权交叉熵损失和目标域加权信息熵损失，用整体预测概率的熵作为正则项，达到跨域知识迁移的目的；最后，目标域数据输入模型，其输出经过softmax函数对人体活动进行分类。

Description

多跨域场景下基于活动图加权的人体行为识别方法

技术领域

本发明涉及生物医学信号处理领域，尤其涉及一种多跨域场景下基于活动图加权的人体行为识别方法。

背景技术

人体行为识别(Human Activity Recognition)由于其潜在的应用价值成为近年来一个非常有吸引力的研究领域，如医疗保健监测、跌倒检测和智能家居感知等。传统人类行为识别方法的核心是使用足够多的带标记人体生理信号训练准确和健壮的模型。然而获取充足的标记数据十分费时费力。迁移学习由于能够将知识从被标记的源域转移到未标记的目标域，被广泛应用于人类行为识别中以解决标签短缺和跨域识别问题。现有基于迁移学习的人体行为识别算法往往是针对场景定制模型(如针对传感器或者个体定制模型)。最近提出的一些跨域人体行为识别方法主要解决在单一跨域(跨个体或者跨身体部位)场景下的人体行为识别，可以分为以下两类：

第一类利用类的内聚性，基于同一类的数据样本应该位于一个固有子空间上的假设，将源域和目标域的各个类同时转换到公共子空间。对目标域样本打伪标签，通过基于统计的方式挖掘目标域数据分布的的约束条件，利用聚类子监督方法指导模型更新，进行领域间的类内知识转移。

第二类是利用数据集中拥有多个个体数据的特点，结合多源域适应方法实现跨域人体行为识别。可分为两种方式，其中一种是通过提取多个源域和目标域的公共特征进行多个域之间的知识迁移；第二种是通过距离衡量方式选择与目标域性质最相似的源域，进行单个源域和目标域之间的知识迁移来缓解域差异；

上述技术在一定程度上取得了令人满意的结果。但是现有研究方法主要解决单一跨域场景下的行为识别问题(如限定在跨个体场景下的知识迁移)，当在多跨域人体行为识别场中时(如模型需要同时满足跨个体、跨传感器、跨身体部位的行为识别需求)，由于各场景下数据分布差异的情况不一致(如跨传感器的数据分布差异和跨个体的数据分布差异显然不同)，会导致模型在新的跨域场景中性能急剧下降，需要重新训练模型才能达到在新场景中的使用标准。同时，这些方法从原始传感器读数中提取复杂的手工特征作为模型的输入。例如通过获得提取时域和频域的平均值、标准差等手工特征。实际上手工特性的复杂性增加了知识迁移的难度，因为基于统计的手工特征并不一定包含可迁移知识，且增加了计算复杂度。因此这些方法仅适用于单一跨域场景，难以应用在多跨域场景下的人体行为识别中。如何统一各个跨域场景下的数据分布差异、设计实现不需要提取复杂手工特征的多跨域场景人体行为识别方法存在大的挑战。

发明内容

本发明的发明目的在于：针对上述存在的问题，提供了一种多跨域场景下基于活动图加权的人体行为识别方法，以提升人体行为识别的识别精度，降低计算复杂度，实现多跨域场景下(跨个体、跨传感器、跨身体部位)的人体行为识别。

本发明提供的多跨域场景下基于活动图加权的人体行为识别方法，包括下列步骤：

步骤S1：分别对源域的数据集和目标域数据集中的人体生理信号进行信号预处理，得到预处理后的信号s₀，其中，信号预处理为：采用滑窗的方式进行时间窗划分、去噪处理和标准化处理；

在多跨域场景的(跨个体、跨身体部位和跨传感器)人体行为识别中，由于各领域内人体生理数据格式不一致，会导致模型难以学习领域间的可迁移知识，因此分别对源域数据集和目标域数据集中的人体生理信号采用滑窗的方式进行时间窗划分、去噪处理和标准化处理，使各个领域内数据格式统一，便于模型进行知识迁移；

步骤S2：对预处理之后的信号s₀进行活动图编码：

使信号s₀中每一维度都与其他维度相邻，对信号s₀的每一维度信号重新排列，得到排列后的信号s₁；

对信号s₁进行二维离散傅里叶变换得到频域数据s_f，将频域原点移到s_f的中心得到活动图数据；并将源域的数据集和目标域的数据集的活动图数据分别记为s_s和s_t；

不同跨域场景下数据分布差异的情况不同，利用不同领域内活动图数据拥有相似分布的特性，使用活动图数据统一各场景下的数据分布差异情况。即将基于步骤S1预处理之后的信号s₀处理成活动图形式，后续将活动图作为深度模型的输入以提升模型跨域识别效果；

步骤S3：通过源域的活动图数据s_s预训练人体行为识别模型M₀，即基于源域数据有充足标签的特点，使用交叉熵函数和源域活动图数据s_s预训练深度模型M₀，使M₀初步具有分类能力；使用三元组损失辅助训练，以增加每个类别中样本的内聚性提升模型的泛化能力；

所述人体行为识别模型M₀包含一个特征提取器F和一个分类器C，使用源域交叉熵损失进行监督训练更新模型M₀，所述特征提取器F用于提取源域类别相关特征，所述分类器C用于根据特征提取器F提取的特征对源域的活动图数据s_s进行分类；使用源域交叉熵损失进行监督训练更新M₀，是为了使特征提取器F能够提取源域类别相关的特征，使分类器C能够根据F提取的特征正确分类源域数据；

使用三元组损失辅助更新模型M₀，对于三元组损失，将支撑样本、正样本、负样本分别记为

采用在线生成方法获取源域的活动图数据s_s所有可能的三元组

其中f(·)表示对样本提取特征，即通过特征提取器F得到的样本特征；

使用三元组损失辅助更新模型M₀，增加F所提取特征在映射空间中的内聚性，即提升所提取特征的可分性，基于同一类别样本在映射空间中处于相似空间位置的假设，该步骤同时提升特征提取器F所提取目标域特征的可分性。

步骤S4：加权源域和目标域样本：

将源域和目标域的活动图数据s_s和s_t分别打上域标签0和1；

活动图数据s_s和s_t分别送入特征提取器F得到特征f_s和f_t，并将特征f_s和f_t送入域判别器D进行对抗学习；

根据域判别器D的概率预测输出计算样本权重，其中，采用二分类交叉熵损失作为域判别器D的训练损失函数；

基于样本的概率预测，设置源域样本和目标域样本的权重

分别为：

其中，

表示源域的第i个样本的概率预测，

表示目标域的第i个样本的概率预测，e表示自然底数

该步骤是为了提升模型知识迁移能力，在跨域场景中会出现部分样本偏向于携带域相关特征的情况，将这部分样本和其他样本同等对待容易导致负迁移。对源域和目标域的活动图数据s_s和s_t进行相似度衡量，利用概率预测对其加权，将两个域之间相似度大的活动图样本赋予较大权重，反之权重较小，以保证模型在跨域场景下的知识迁移能力。由于特征提取器F的目标是尽可能混淆分类器D，使D难以分辨样本来自哪个域；域判别器D优化目标为尽可能准确判断出样本来自哪个域；最终使特征提取器F获得提取域不变特征的能力，然后根据域判别器的概率预测输出计算样本权重。

步骤S5：使用加权的交叉熵损失和信息熵损失更新模型M₀，并采用正则项约束目标域概率预测输出；

并将更新后的模型M₀作为跨域场景下的人体行为识别模型M₁；

该步骤中，使具有较大权重的样本对知识迁移做出相对较大的贡献；反之，使权重较小的样本对知识迁移产生较小的影响。同时，为防止模型向错误预测的方向迭代，采用正则项约束目标域概率预测输出。

步骤S6：通过模型M₁最后一层的输出和softmax函数对活动图数据进行运动转状态识别。

综上所述，由于采用了上述技术方案，本发明的有益效果是：

计算复杂度低，无需提取手工特征，能够有效统一各跨域场景下的数据分布差异，完成域间知识迁移，实现多跨域场景下(跨设备、跨身体部位、跨个体)的人体行为识别。

附图说明

图1是本发明实施例提供的多跨域场景下基于活动图加权的人体行为识别方法处理示意图；

图2是本发明实施例提供的多跨域场景下基于活动图加权的人体行为识别方法的处理流程示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面结合实施方式和附图，对本发明作进一步地详细描述。

本发明实施例提供了一种多跨域场景下基于活动图加权的人体行为识别方法，包括人体生理信号预处理、信号活动图编码、模型预训练、样本加权、训练模型和运动状态识别六部分。人体生理信号预处理为：将原始人体加速度信号按窗口划分，应用带通滤波去除噪声，对所有样本进行标准化；信号活动图编码为：不同领域内活动图数据拥有相似分布的特性将活动图数据作为模型输入，对预处理后的信号样本提取每一维度重新排列组合，应用二维离散傅里叶变化转换为活动图形式；模型预训练为：基于同一类别数据会映射到子空间相近位置这一假设，应用源域数据和三元组损失预训练模型，提升模型泛化能力，使模型初步具有提取域不变特征的能力；加权样本为：利用域判别器的概率预测分别对源域和目标域的样本加权，使适合知识迁移的样本拥有较大权重，不适合知识迁移的样本拥有较小的权重；训练模型为：计算源域加权交叉熵损失和目标域加权信息熵损失，用整体预测概率的熵作为正则项，达到跨域知识迁移的目的；运动状态识别为：目标域数据输入模型，其输出经过softmax函数对人体活动进行分类。本发明用于多跨域场景下人体行为识别，其无需提取复杂的手工特征、复杂度，能有效统一各跨域场景下的数据分布差异情况，模型识别准确率高，适用于识各种不同跨域情况下的人体行为状态。

参见图1，2，本发明实施例提供的多跨域场景下基于活动图加权的人体行为识别方法的具体实现包括：

信号预处理步骤，对采集的原始信号(人体生理信号)进行时间窗划分并进行带通滤波处理和标准化处理，以得到运动信号a_raw；

作为一种可能的实现方式，信号预处理利用滑动窗方法对原始信号划分时间窗同时利用带通滤波器对信号进行带通滤波，本实施例中，首先对源信号进行分割，使用滑动窗方法，窗口大小设为2.56秒，滑动步长设为1.28秒，对当前时间窗的人体行为进行识别。根据不同传感器采样频率存在差异这一特点，将采样频率高于50hz的信号数据降采样、采样频率低于50hz的信号数据升采样，使信号采样频率固定至50hz。然后对信号进行去噪处理，以及对每个时间窗进行标准化，经过预处理后的加速度信号记为s_raw，六轴加速度信号记为s₀(三轴线性加速度和三轴陀螺仪加速度)。

活动图转换步骤，不同跨域场景下数据分布差异的情况不同，利用不同领域内活动图数据拥有相似分布的特性，将预处理之后的信号s₀转换为活动图数据作为深度模型的输入，以提升模型在不同跨域场景下的泛化能力。

活动图转换的具体过程为：将不同运动状态下的六轴加速度信号作为活动图转换步骤的输入。记当前时间窗的运动信号s₀＝[d₁，d₂，d₃，d₄，d₅，d₆]∈R^128×6，即每个时间窗包含6个维度和128个采样点。

单独取出每个时间窗的各个维度数据，得到6个向量d₁，d₂，d₃，d₄，d₅，d₆。重新排列组合这些向量得到新的信号数据，使每个维度的向量都有机会与其他维度向量相邻，主要目的是保证信号数据送入下一步的卷积神经网络中时，卷积窗口能够充分挖掘各个维度数据之间的关系，以提升模型对人体行为的识别准确率。记经过重新排列组合后的加速度信号数据为s₁＝[d₁，...，d₆，d₁，d₃，d₅，d₂，d₄，d₆，...]∈R^128×22。

将信号s₁经过二维离散傅里叶变化到频域，对于信号s₁∈R^128×22，先对每一行一维点序列进行离散傅里叶变换得到中间结果，再对中间结果按列对每一列进行离散傅里叶变换，然后得到对应的频域数据；利用频域数据的平移性质，把画面分成四分的基础上进行移位，使直流成分出项在图像中央，频域原点移到中心；将频域数据作为活动图数据，记源域和目标域的活动图数据分别为s_s和s_t。

模型预训练步骤，充分利用源域数据带有充足标记的特点，挖掘人体生理数据类别之间的关系，尽可能在不用到目标域数据的情况下提升模型的泛化能力。使用源域交叉熵损失学习分类知识，利用三元组损失辅助训练，增加每个类别中样本的内聚性以提升模型的泛化能力。

模型预训练具体过程为：初始模型包含一个特征提取器F和一个分类器C。特征提取器F由卷积神经网络和线性层组成；分类器C由线性层组成，输出是一个K维向量，其中K为运动类别数目。

利用交叉熵函数和三元组损失函数对源域活动图数据s_s预训练模型。在三元组损失中，输入是一个三元组

其中

分别为支撑样本点、正样本点(与

是同一类别的样本)和负样本点(与

是不同类别的样本)，且满足关系

最终的优化目标是拉近

之间的距离，拉远

之间的距离。优化目标为：

其中，

表示第二范数的平方，用来衡量样本点之间的距离，(·)₊表示负值取零；

与

之间的距离和

与

之间的距离需要保持一个最小间隔，由α表示。即通过预设的最小间隔α表征

与

之间的距离和

与

之间的距离需要保持间隔；当距离间隔α较小时，

与

之间距离较大，

与

距离较小时也能使目标函数的值趋于0；当距离间隔α较大时可能导致模型不收敛，目标函数值难以趋近于0。因此实验中需要设置合适的距离间隔，本发明实施例中，α设置为1。

在三元组损失中，可分为简单三元组(easy triplets)、困难三元组(hardtriplets)和中间三元组(semi-hard triplets)。其中简单三元组指

由该三元组计算的损失为0；困难三元组指

即

之间距离远；中间三元组指

即

之间距离较近。

在本实施例中，使用batch hard在线生成方式获取可用的三元组。假设一个batch数据具有P个类别，每个类别包含K个样本，共计P*K个样本。采用batch hard方法，所有样本通过深度模型映射到嵌入空间中得到深层特征f，将每一个样本看作一个支撑点

计算所有其他样本到该支撑点的距离

选择与支撑点

距离最大的同类别样本作为正样本

与支撑点

距离最小的非同类别样本作为负样本

由此产生P*K个三元组，这些三元组是最难分的且满足条件：

样本加权步骤，对源域和目标域的活动图数据s_s和s_t进行相似度衡量，利用概率预测对其加权，将两个域之间相似度大的活动图样本赋予较大权重，反之权重较小，以统一各种跨域场景下的数据分布差异情况，保证模型在跨域场景下的知识迁移能力。

利用域判别器D判断样本来自哪个域，其优化目标是尽可能分辨出样本来自哪个域，与特征提取器F一起做对抗学习；特征提取器F的优化目标是尽可能混淆D的判别结果，使D无法区别样本来自哪个域。最终特征提取器F得到提取能够提取域不变特征的能力，域判别器D被混淆，对样本判别能力减弱。对抗损失为：

其中|D_s|和|D_t|分别表示源域和目标域样本数量，

和

表示源域和目标域的概率预测向量，L_bce为二分类交叉熵损失。

以域判别器D概率预测的信息熵作为样本的权重，此时两个域相似的样本拥有较大权重，反之赋予较小的权重。这样可以保证拥有较大权重的样本将对后续知识迁移做出更大贡献，反之非相似样本对知识迁移影响较小。记第i个样本的概率预测为

源域和目标域样本的权重可表示为：

训练模型步骤在原始交叉熵损失和信息熵损失的求和子项中乘以样本权重计算加权交叉熵损失和加权信息熵，使具有较大权重的样本对知识迁移做出相对较大的贡献；反之，使权重较小的样本对知识迁移产生较小的影响。同时，为防止模型向错误预测的方向迭代，采用正则项约束目标域概率预测输出。最终获得能够适用于多种跨域(跨个体、跨身体部位和跨传感器)场景下的人体行为识别模型M₁。记源域样本和目标域样本的概率预测分别为

和

优化目标为：

其中|D_s|和|D_t|分别表示源域和目标域的样本数量，λ＞0为可调参数，用来调整目标域信息熵所占的比重。

加权信息熵在优化时趋向于0，即目标域样本概率预测逐渐向高置信度方向迭代，可表示为C(f(x_t))→[0，...，1，...，0]。当样本被错误分类时，信息熵会加剧这种错误，因此采用P^N＝(P¹，P²，...，P^N)的熵作为正则项，其中

n为样本所属类别，N为类别总数，

表示条件概率。正则项损失可表示为：

模型的整体优化目标为L＝L_w+ηL_e，其中η＞0为可调参数。

运动状态识别步骤，在得到网络输出后用softmax函数对人体运动状态进行识别。

作为一种可能的实现方式，本发明实施例提供的多跨域场景下基于活动图加权的人体行为识别方法的步骤包括：

步骤1：预处理人体生理信号。对加速度传感器采集的人体运动状态下的原始生理信号(3轴线性加速度信号、3轴陀螺仪加速度信号)划分时间窗并对各时间窗进行人体行为识别：

若原始信号采样频率不足50hz则对其进行升采样，若采样频率超过50hz则对其降采样，将原始信号采样频率固定至50hz；按采样窗口时长2.56S，窗口重叠50％采样，每个时间窗拥有128个采样点。对所有时间窗的人体加速度信号进行带通滤波处理和标准化处理，得到初始信号s₀∈R^128×6，将s₀记为[d₁，d₂，d₃，d₄，d₅，d₆]。

步骤2：对预处理之后的人体生理信号进行活动图编码。对初始信号s₀每一维度重新排列组合，得到排列后信号s₁∈R^n×22，s₁可表示为[d₁，...，d₆，d₁，d₃，d₅，d₂，d₄，d₆，...]∈Rⁿ ^×22；利用频域数据的平移性质，将频域原点移到中心得到活动图。将源域和目标域生理信号的活动图数据分别记为s_s和s_t。

步骤3：利用源域数据预训练模型M₀。基于同一类别映射到公共子空间时位于相似空间位置的假设，利用三元组损失和带标记源域数据预训练模型M₀；

采用batchhard在线生成方式获取三元组样本，将训练时每个batch中所有样本看作支撑点

计算所有其他样本与

的欧氏距离；

选择与支撑点

距离最大的同类别样本作为正样本

选择与支撑点

距离最小的非同类别样本作为负样本

设有P个类别，每个批次中每类含有K个样本，则采用batch hard方式每次得到P*K个三元组；计算三元组损失

和源域交叉熵损失，相加得到与训练阶段整体优化目标函数，利用反向传播算法迭代更新模型，直至模型M₀收敛。

步骤4：加权源域和目标域样本，提升模型知识迁移能力。对源域和目标域数据相似度衡量，使相似度大的样本较于相似度小的样本对知识迁移做出更大贡献。

将源域和目标域数据s_s和s_t送入特征提取器F得到特征f_s和f_t，将特征f_s和f_t输入到域判别器D中做对抗学习，最终使判别器D无法区别样本来自哪个域，特征提取器F能提取到域不变特征。通过D的概率预测输出计算每个样本的信息熵作为样本权重。最终结果为两个域相似的样本拥有较大权重，反之赋予较小的权重。记第i个样本的概率预测为

源域和目标域样本的权重可表示为：

步骤5：利用加权交叉熵损失和加权信息熵损失更新初始模型M₀，原始交叉熵损失和信息熵损失由每个样本单独计算损失项然后求和。

在步骤4中获取样本权重源域和目标域之间相似的样本被赋予较大权重，差异较大的样本被赋予较小权重；在原始交叉熵基础上，对每个样本的损失项乘以样本权重，使相似度高的样本对知识迁移做出更大贡献，反之减少差异较大样本对知识迁移的影响程度。记源域样本和目标域样本的概率预测分别为

和

优化目标为：

采用正则项约束目标域概率预测输出以防止模型向负迁移方向迭代，加权信息熵在优化时趋向于0，即目标域样本概率预测逐渐向高置信度方向迭代，可表示为C(G(x_t))→[0，...，1，...，0]。当样本被错误分类时，信息熵会加剧这种错误，因此采用P^N＝(P¹，P²，...，P^N)的熵作为正则项，其中

n为样本所属类别，N为类别总数。正则项可表示为：

步骤6：模型训练至收敛时，使用softmax函数对模型输出进行处理，得到人体行为分类结果。

最后，以时间窗为单位，实时显示人体行为的类别，即当前时间窗的人体行为识别分类结果。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。