CN112329692B

CN112329692B - 一种有限样本条件下跨场景人体行为无线感知方法及装置

Info

Publication number: CN112329692B
Application number: CN202011286824.1A
Authority: CN
Inventors: 景晓军; 张荣辉; 穆俊生; 黄海; 崔原豪; 张芳沛
Original assignee: Beijing University of Posts and Telecommunications
Current assignee: Beijing University of Posts and Telecommunications
Priority date: 2020-11-17
Filing date: 2020-11-17
Publication date: 2022-01-11
Anticipated expiration: 2040-11-17
Also published as: CN112329692A

Abstract

本发明实施例提供了一种有限样本条件下跨场景人体行为无线感知方法及装置，获取源域对应的预先训练得到的源模型；其中，源域为用于获取非有限的源样本感知数据的无线信号场景；源模型为利用多个所述源样本感知数据训练得到的人体行为无线感知模型；基于所述源模型以及有限的目标样本感知数据，以最小化输出差异为训练目标，对与所述源域属于不同场景的目标域对应的人体行为无线感知模型进行训练；其中，输出差异为进行训练的模型的输出与所述目标样本感知数据中相应的人体行为标签之间的差异值；当训练目标达成时，获得目标模型，并利用目标模型对所述目标域进行人体行为感知。本方案可以提高人体行为无线感知的跨场景迁移能力。

Description

一种有限样本条件下跨场景人体行为无线感知方法及装置

技术领域

本发明涉及无线感知技术领域，特别是涉及一种有限样本条件下跨场景人体行为无线感知方法及装置。

背景技术

随着通信和计算机技术的发展，无线信号在无线设备之间传递信息之外，还可以用来实现人体行为无线感知。具体的，当人处于无线信号环绕的空间时，会不可避免地对无线信号的传播产生影响。对此，可以挖掘人体行为影响下的无线信号波动数据，作为人体行为感知数据，并为人体行为感知数据标注相应的人体行为标签，得到样本感知数据，进而利用样本感知数据训练得到人体行为无线感知模型。该模型相当于人体行为与无线信号波动之间的映射关系，可以用于实现人体行为无线感知。例如，将人体行为感知数据输入人体行为无线感知模型，可以实现人体定位、行为监测、生命体征监测等等。

但是，在具体应用中，往往需要针对不同的无线信号场景，获取不同的样本感知数据，会耗费大量的人工以及时间成本，导致人体行为无线感知的跨场景迁移成本高，跨场景迁移能力较差。

发明内容

本发明实施例的目的在于提供一种有限样本条件下跨场景人体行为无线感知方法及装置，以实现提高人体行为无线感知的跨场景迁移能力。具体技术方案如下：

第一方面，本发明实施例提供了一种有限样本条件下跨场景人体行为无线感知方法，所述方法包括：

获取源域对应的预先训练得到的源模型；其中，所述源域为用于获取非有限的源样本感知数据的无线信号场景；所述源模型为利用多个所述源样本感知数据训练得到的人体行为无线感知模型；

基于所述源模型以及有限的目标样本感知数据，以最小化输出差异为训练目标，对与所述源域属于不同场景的目标域对应的人体行为无线感知模型进行训练；其中，所述输出差异为进行训练的模型的输出与所述目标样本感知数据中相应的人体行为标签之间的差异值；

当所述训练目标达成时，获得目标模型，并利用所述目标模型对所述目标域进行人体行为感知。

第二方面，本发明实施例提供了一种有限样本条件下跨场景人体行为无线感知装置，所述装置包括：

源模型获取模块，用于获取源域对应的预先训练得到的源模型；其中，所述源域为用于获取非有限的源样本感知数据的无线信号场景；所述源模型为利用多个所述源样本感知数据训练得到的人体行为无线感知模型；

目标模型训练模块，用于基于所述源模型以及有限的目标样本感知数据，以最小化输出差异为训练目标，对与所述源域属于不同场景的目标域对应的人体行为无线感知模型进行训练，当所述训练目标达成时，获得目标模型；其中，所述输出差异为进行训练的模型的输出与所述目标样本感知数据中相应的人体行为标签之间的差异值；

行为感知模型，用于利用所述目标模型对所述目标域进行人体行为感知。

本发明实施例有益效果：

本发明实施例提供的方案中，基于源模型以及有限的目标样本感知数据，以最小化输出差异为训练目标，对与源域属于不同场景的目标域对应的人体行为无线感知模型进行训练，进而当训练目标达成时，获得目标模型，并利用所述目标模型对所述目标域进行人体行为感知。其中，源域为用于获取非有限的源样本感知数据的无线信号场景；源模型为利用源样本感知数据训练得到的人体行为无线感知模型。因此，相当于将在源域中学习到的知识迁移到目标域中，从而降低获得目标模型的训练对有限的目标样本感知数据的依赖，实现有限样本条件下的人体行为无线感知，减少跨场景的人体行为无线感知中，获取样本感知数据的成本，提高人体行为无线感知的跨场景迁移能力。

当然，实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的实施例。

图1为本发明一实施例提供的一种有限样本条件下跨场景人体行为无线感知方法的流程示意图；

图2为本发明另一实施例提供的一种有限样本条件下跨场景人体行为无线感知方法的应用场景示例图；

图3为本发明另一实施例提供的一种有限样本条件下跨场景人体行为无线感知方法中，对抗训练的示例图；

图4为本发明一实施例提供的一种有限样本条件下跨场景人体行为无线感知装置的结构示意图；

图5为本发明一实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供的一种有限样本条件下跨场景人体行为无线感知方法，可以应用于进行人体行为无线感知的电子设备，该电子设备可以是多种的。示例性的，该电子设备可以包括：计算机，网络电视，移动终端，可穿戴设备，以及服务器等等。

如图1所示，本发明一实施例提供的一种有限样本条件下跨场景人体行为无线感知方法的流程，该方法可以包括如下步骤：

S101，获取源域对应的预先训练得到的源模型。

其中，源域为用于获取非有限的源样本感知数据的无线信号场景；源模型为利用多个源样本感知数据训练得到的人体行为无线感知模型。

在具体应用中，非有限的源样本感知数据是指获取的源样本感知数据的数量，足以训练得到源模型。因此，多个源样本感知数据的数量，为足以训练得到源模型的数量。源域具体可以是无线信号环绕的家庭、教室以及办公室等等场景。无线信号环绕可以是场景中安装有无线信号发生设备，例如WiFi设备。

S102，基于源模型以及有限的目标样本感知数据，以最小化输出差异为训练目标，对与源域属于不同场景的目标域对应的人体行为无线感知模型进行训练。

其中，输出差异为进行训练的模型的输出与目标样本感知数据中相应的人体行为标签之间的差异值。

基于源模型以及有限的目标样本感知数据，以最小化输出差异为训练目标，对与源域属于不同场景的目标域对应的人体行为无线感知模型进行训练，具体可以是按照知识迁移的思想，以对抗训练的方式将源模型学习到的知识迁移至目标域对应的人体行为无线感知模型中，从而减少目标域对应的人体行为无线感知模型的训练对目标样本感知数据的依赖，实现在有限的目标样本感知数据条件下依然可以训练得到目标模型的效果。为了便于理解和合理布局，后续以可选实施例的形式对该训练过程进行具体描述。

S103，当训练目标达成时，获得目标模型，并利用目标模型对目标域进行人体行为感知。

当训练目标达成时，表明此时进行训练的模型满足如下条件：

其中，X_t为目标样本感知数据的集合，Y_t为目标样本感知数据中标签的集合，该标签用于表明人体无线感知的结果，例如，人体的动作类型，生命体征等等。H为交叉熵，用于度量两个概率分布间的差异信息：进行训练的模型的输出与目标样本感知数据中相应的人体行为标签之间的差异值。训练目标达成时，进行训练的模型在目标域中进行人体行为无线感知的准确度达到期望水平，因此，可以将此时进行训练的模型作为目标模型，并利用目标模型对目标域进行人体行为感知。

在一种可选的实施方式中，上述源样本感知数据的获取，具体可以包括如下步骤：

基于源域中无线信号发生设备的信道状态信息，获得源样本感知数据；其中，信道状态信息如下式所示：

其中，

为信道状态信息，L为无线信号发生设备接接收数据的多径的数量，α_l和τ_l分别为路径l下的衰落和传播延迟，ε^(f,t)为针对子载波f，在t时刻由时序对准偏移，采样频率偏移以及载波频率偏移引起的相位误差，j为复数的虚部标志。另外，衰落具体可以由复值表示。

无线信号发生设备的信道状态信息(Channel State Information，CSI)可以环境对无线信号发生设备在t时刻的的多径影响，以及子载波f的接收数据的多径影响。因此，可以基于源域中无线信号发生设备的信道状态信息，获得源样本感知数据。

在一种可选的实施方式中，上述无线信号为多径信号；

为了减少噪音的静态偏移的影响，上述基于源域中无线信号发生设备的信道状态信息，获得源样本感知数据，具体可以包括如下步骤：

利用多普勒频移表示多径信号的相位，将信道状态信息转换为：

其中，H_S(f)为稳态信号的和，P_d为动态信号集合，

为子载波f在路径l上的传播时长；

为路径l的传播延迟；

对无线信号发生设备的多个天线分别对应的转换后的信道状态信息共轭相乘，得到源样本感知数据。

在具体应用中，稳态信号的和不产生多普勒频移(Doppler frequency shifts，DFS)，而动态信号集合会由动态目标的反射信号产生多普勒频移。其中，动态目标指人体。并且，对无线信号发生设备的多个天线分别对应的转换后的信道状态信息共轭相乘可以滤除带外噪声，静态偏移以及随机偏移，仅保留含有非零多普勒频移的多径分量。因此，可以提高源样本感知数据的准确度，提高利用源样本感知数据训练得到的源模型的准确度。另外，示例性的，无线信号发生的多个天线，具体可以是WiFi网卡或者网络接口(NetworkInterface Card，NIC)上的两个天线。

在一种可选的实施方式中，上述基于源模型以及有限的目标样本感知数据，以最小化输出差异为训练目标，对与源域属于不同场景的目标域对应的人体行为无线感知模型进行训练，具体可以包括如下步骤：

利用目标样本感知数据对目标域对应的人体行为无线感知模型进行训练，得到进行训练的模型的输出；

获取进行训练的模型的输出和目标样本感知数据中标签之间的第一差异值；

利用判别模型，对进行训练的模型与源模型进行对抗训练，并获取判别模型的输出与不同域对应模型的输出之间的第二差异值；

当第一差异值和第二差异值均为最小时，将进行训练的模型作为目标模型，否则，调整进行训练的模型的参数，以及判别模型的参数，并重复对调整后的模型进行训练和调整参数的步骤，直到第一差异值和第二差异值均为最小。

在具体应用中，对抗训练可以是通过生成式对抗网络(Generative AdversarialNetworks,GAN)进行的。生成式对抗网络是一种深度学习模型，模型生成模型(GenerativeModel)和判别模型(Discriminative Model)的互相博弈学习产生相当好的输出。在本可选实施例中，生成模型即为进行训练的模型。判别模型具体可以是分类器，用于区分输入属于哪个域，源域对应的源模型的输出和目标域对应的进行训练的模型的输出为判别模型的输入。

示例性的，如图2所示。本发明实施例可以包括感知信号获取，信号预处理以及模型训练与行为识别的过程。其中，感知信号获取包括：人体在无线网络场景中时，影响无线网络的信号传输，该影响表现在信道状态信息上，因此，可以获取信道状态信息。信号预处理包括：对信道状态信息进行时频变换获取多普勒频移以及去噪，得到源样本感知数据。类似的，可以获得目标样本感知数据，区别在于获取数据的场景不同。模型训练与行为识别包括：利用源样本感知数据集进行源域模型训练，用于获得源模型；基于源模型和目标样本感知数据，按照知识迁移的思想，利用对抗训练进行目标域模型训练，获得目标模型；将目标模型用于人体行为识别，得到人体行为状态信息。

其中，示例性的，如图3所示。对抗训练所利用的生成式对抗网络可以包括：源模型对应的输入，用于输入源样本感知数据；进行训练的模型对应的输入，用于输入目标样本感知数据；源模型的输出和进行训练的模型的输出可以作为模型的输出，输入至判别模型中。

在一种可选的实施方式中，上述获取进行训练的模型的输出和目标样本感知数据中标签之间的第一差异值，具体可以包括：

将进行训练的模型的输出和目标样本感知数据中的标签，输入进行训练的模型的损失函数：L_T＝kL_GAN+L_C，得到第一差异值；

其中，L_T为第一差异值，k为权重，L_GAN为判别模型的损耗，

L_C为分类损耗，

为目标样本感知数据的期望，D(M_t(x_t))为针对进行训练的模型的输出M_t(x_t)，判别模型的分类结果，x_t为目标样本感知数据，属于目标样本感知数据集合X_t，y_t为目标样本感知数据中的标签，属于目标样本感知数据中标签的集合Y_t。

为了防止模型崩溃，并保持M_t的分类识别能力，可以将判别模型的损耗L_GAN和分类损失L_C的加权和作为M_t的损失函数L_T。并且，可以保持源模型M_s的参数不变，用源域模型的参数初始化进行训练的模型M_t的参数，将初始化后的模型M_t作为进行训练的模型，在进行训练时交替针对L_GAN和L_C的结果，调整进行训练的模型的参数，直到L_GAN和L_C达到最小值，实现第一差异值达到最小值。

在一种可选的实施方式中，上述获取判别模型的输出与不同域对应模型的输出之间的第二差异值，具体可以包括如下步骤：

将判别模型的输出，源域对应的源模型的输出以及目标域对应的进行训练的模型的输出，输入对抗训练的损失函数，得到第二差异值；

对抗训练的损失函数为：

其中，L_D为第二差异值，

为源样本感知数据的期望，X_s为源样本感知数据的集合，D(M_s(x_s))为针对源模型的输出M_s(x_s)，判别模型的分类结果，D(M_t(x_t))为针对进行训练的模型的输出M_t(x_t)，判别模型的分类结果，Ε_xt为目标样本感知数据的期望，D(M_t(x_t))为针对进行训练的模型的输出M_t(x_t)，判别模型的分类结果，X_t为目标样本感知数据的集合。

在具体应用中，D(M_s(x_s)越大越好，理想结果是1，D(M_t(x_t))越小越好，理想结果是0。另外，可以利用一阶优化算法Adam和反向传播算法对进行训练的模型的参数，以及判别模型的参数进行调整。其中，一阶优化算法Adam是一种可以替代传统随机梯度下降过程的算法，能基于训练数据迭代地更新神经网络权重。反向传播算法(Backpropagationalgorithm，BP)是适合于多层神经元网络的学习算法，建立在梯度下降法的基础上，信息处理能力来源于简单非线性函数的多次复合，因此具有很强的函数复现能力。

相应于上述方法实施例，本发明实施例还提供了一种有限样本条件下跨场景人体行为无线感知装置。

如图4所示，本发明一实施例提供的一种有限样本条件下跨场景人体行为无线感知装置的结构，该装置可以包括：

源模型获取模块401，用于获取源域对应的预先训练得到的源模型；其中，所述源域为用于获取非有限的源样本感知数据的无线信号场景；所述源模型为利用多个所述源样本感知数据训练得到的人体行为无线感知模型；

目标模型训练模块402，用于基于所述源模型以及有限的目标样本感知数据，以最小化输出差异为训练目标，对与所述源域属于不同场景的目标域对应的人体行为无线感知模型进行训练，当所述训练目标达成时，获得目标模型；其中，所述输出差异为进行训练的模型的输出与所述目标样本感知数据中相应的人体行为标签之间的差异值；

行为感知模型403，用于利用所述目标模型对所述目标域进行人体行为感知。

在一种可选的实施方式中，上述源模型获取模块401，具体用于：

基于所述源域中无线信号发生设备的信道状态信息，获得所述源样本感知数据；其中，所述信道状态信息如下式所示：

其中，所述

为信道状态信息，所述L为所述无线信号发生设备接接收数据的多径的数量，所述α_l和所述τ_l分别为路径l下的衰落和传播延迟，ε^(f,t)为针对子载波f，在t时刻由时序对准偏移，采样频率偏移以及载波频率偏移引起的相位误差，所述j为。

在一种可选的实施方式中，上述无线信号为多径信号；

所述源模型获取模块401，具体用于：

利用多普勒频移表示所述多径信号的相位，将所述信道状态信息转换为：

其中，所述H_S(f)为稳态信号的和，所述P_d为动态信号集合，所述

为子载波f在路径l上的传播时长；所述

为所述路径l的传播延迟；

对所述无线信号发生设备的多个天线分别对应的转换后的信道状态信息共轭相乘，得到所述源样本感知数据。

在一种可选的实施方式中，上述目标模型训练模块402，用于：

利用所述目标样本感知数据对所述目标域对应的人体行为无线感知模型进行训练，得到进行训练的模型的输出；

获取所述进行训练的模型的输出和所述目标样本感知数据中标签之间的第一差异值；

利用判别模型，对所述进行训练的模型与所述源模型进行对抗训练，并获取所述判别模型的输出与不同域对应模型的输出之间的第二差异值；

当所述第一差异值和第二差异值均为最小时，将所述进行训练的模型作为所述目标模型，否则，调整所述进行训练的模型的参数，以及所述判别模型的参数，并重复对调整后的模型进行训练和调整参数的步骤，直到所述第一差异值和所述第二差异值均为最小。

本发明实施例还提供了一种电子设备，如图5所示，包括处理器501、通信接口502、存储器503和通信总线504，其中，处理器501，通信接口502，存储器503通过通信总线504完成相互间的通信，

存储器503，用于存放计算机程序；

处理器501，用于执行存储器503上所存放的程序时，实现如下步骤：

基于所述源模型以及有限的目标样本感知数据，以最小化输出差异为训练目标，对与所述源域属于不同场景的目标域对应的人体行为无线感知模型进行训练，当所述训练目标达成时，获得目标模型；其中，所述输出差异为进行训练的模型的输出与所述目标样本感知数据中相应的人体行为标签之间的差异值；

利用所述目标模型对所述目标域进行人体行为感知。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一有限样本条件下跨场景人体行为无线感知方法的步骤。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一有限样本条件下跨场景人体行为无线感知方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。