CN113744318A

CN113744318A - 一种rfid无设备人体追踪系统的择优标签方法

Info

Publication number: CN113744318A
Application number: CN202111083051.1A
Authority: CN
Inventors: 鲁建厦; 包秦
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2021-09-15
Filing date: 2021-09-15
Publication date: 2021-12-03
Anticipated expiration: 2041-09-15
Also published as: CN113744318B

Abstract

本发明公开了一种RFID无设备人体追踪系统的择优标签方法，包括如下步骤：S1，区域划分，将监控区域划分为N个位置；S2，特征提取及计算，提取每个位置一段时间内采样的T个RSSI的均值和方差，并且将该段时间RSSI的分布与所在位置建立映射关系；S3，构建深度学习模型，根据T的RSSI序列，解析相应的位置序列，即人体真实的移动轨迹；S4，标签布局方式选择，根据深度学习模型对于位置的分类正确率，择优选择标签。本发明通过深度学习模型，在保持人体追踪精度的同时，减少了标签数量，提高了模型灵活性，避免了精度下降，提高了处理长路径序列的性能，弥合了位置序列预测任务的训练和推断之间的差距。

Description

一种RFID无设备人体追踪系统的择优标签方法

技术领域

本发明涉及人员定位技术领域，尤其是涉及一种RFID无设备人体追踪系统的择优标签方法。

背景技术

随着现代社会老龄化加剧，老年人的监护是如今不得不面对的一个重大问题。如何让现代智能设备更好地支持老年群体的独立生活越来越收到工业界和学术界的关注，这个问题的核心为在环境复杂的生活环境中如何准确地定位到人体，虽然传统的基于设备的技术相比无设备受环境影响更小，实现起来会更容易，但是要使用这些系统的话必须要求用户携带相应的传感器或通信设备，而对于老年人群体来说还经常会发生设备遗忘和丢失的问题，并且使用者还需要有意识地配合或者愿意佩戴设备，且同意分享自己的位置信息。

RFID是一种通过电磁传输到射频兼容集成电路来存储和检索数据的方法，以低成本、体积小和非侵入式等优点近年来备受青睐。通过RFID读取到无源标签的功率信号值RSSI(Received Signal Strength Indication，RSSI)，判断人员所在的位置。

随着深度学习的的发展，深度学习已逐渐深入各个领域，在人员定位上，RFID无设备人员追踪的任务可以描述为：在RFID监控区域内，阅读器天线发出射频信号，无源标签获得信号中的能量并反射给天线。有人体干扰射频信号时，会使原来的信号强度衰减或增强，造成标签获得的能量发生改变，利用这一特性建立人体移动与信号变化的模型，通过对输入信号序列处理后输出人体真实移动路径。

解决的难点：1)由于受环境影响，功率信号变化范围大且不稳定，如直接用来训练深度学习模型会使得跟踪效果较差；2)目前深度学习模型种类多，不同结构和训练方式效果不同，如何根据当前任务选择二者是一个难点；3)现有的研究未考虑标签使用量的问题，多数是因为系统本身受限，减少标签会造成系统追踪或定位误差提升，还会造成阅读器的漏读次数增加、环境过于复杂和系统计算量庞大等问题，如何使用数量相对少的标签是该研究的难点。传统的追踪系统通常为一个整体，耦合度大，要对标签数量进行控制是一个非常棘手的问题，也正是该问题被忽略的一个原因。

发明内容

为解决现有技术的不足，实现保持人体追踪精度的同时，实现标签数量最优的目的，本发明采用如下的技术方案：

一种RFID无设备人体追踪系统的择优标签方法，包括如下步骤：

S1，区域划分，将监控区域划分为N个位置；

S2，特征提取及计算，为了将原始RSSI的分布变得更加密集，在不破坏数据真实值的情况下，提取每个位置一段时间内采样的T个RSSI的均值和方差，一段时间内RSSI的均值和方差可以很好地表达该段数据的分布情况，而且增加了数据的特征，利于训练，并且将该段时间RSSI的分布与所在位置建立映射关系，训练出的模型更好地量化RSSI特征与位置的关系；

S3，构建深度学习模型，根据T的RSSI序列

解析相应的位置序列

即人体真实的移动轨迹，i表示第i个位置，包括如下步骤：

S31，采用循环神经网络对RSSI序列进行解析，给定单个输入RSSI序列和输出位置序列对(Xⁱ，Yⁱ)，对数概率P(Xⁱ，Yⁱ)的计算方法为：

其中：

Y同理，表示长度为T的序列标记，

表示第i个训练向量中第t时刻的数据，t∈T表示神经网络第t时刻，即第t次采样，

表示第i个训练向量对应的标s记向量中第t个时刻的标记(token)，

表示第i个训练向量对应的标s记向量中第1到T个时刻的标记；

S32，θ由带参数θ^*的循环神经网络，通过隐层状态向量h进行计算，当前时刻的隐层状态向量

由上个时刻的

和输入

得到，计算式为

式中，

由循环神经网络计算式为：

式中，f(·)为tanh函数；

S33，

由当前时刻隐层状态向量

线性投影到分数向量实现，其输出经过线性层转换维度和softmax层归一化，输出所有位置L₀～L_N的分数，最后选取分数最高的位置作为输出；

S4，标签布局方式选择，由于在一个天线的监控区域内，放置过多的标签会带来诸多缺点，如增加阅读器的读取负担、环境过于复杂和系统的稳定性较弱，根据深度学习模型对于位置的分类正确率，择优选择标签。

进一步地，所述S3中，针对输入和输出序列的长度有时会不一致问题，将2个循环神经网络进行连接得到seq2seq模型，其优势在于高灵活性，很适合用来解决追踪任务中序列长度不统一的问题；seq2seq模型由一个编码器和解码器构成，编码器和解码器都可以用循环神经网络充当，它的优势在于输入与输出长度可以不必相同，而且相比传统循环神经网络具有更好的记忆力，更加适合用于人员追踪任务；为了使RSSI序列更好地适应模型的输入，将RSSI序列通过词嵌入扩展成1个多维的列向量(维度取决于嵌入层大小)，随后经过编码器输出1个统一的语义向量h_T，即维度大小为h的隐层状态向量，由公式(3)中的f(.)函数非线性激活后产生，随后将语义向量h_T传给解码器，h_T向量记录着原始RSSI序列的所有信息，用于后续协助解码器获得更准确的位置序列S。

进一步地，由于seq2seq结构仍然存在不足，如果处理较长的RSSI特征序列时，语义向量的长度限制就成了解析路径轨迹的瓶颈，原因是它装不下那么多原始的信息，造成的后果是精度下降，再者，原始seq2seq模型的编码器只是用了最后1层的隐状态h_T，这样的做法造成原始数据的利用率极低。为了减小以上影响，该研究对解码器引入注意力机制，给解码器添加额外的信息，将c_t向量与隐层向量h_t拼接，然后通过全连接层恢复维度，为了得到c_t向量，首先计算解码器中t时刻隐层状态h_t对编码器中每个隐层状态

的权值a_t(s)：

式中，

为t时刻解码器隐层状态向量的转置，s’表示编码器长度，

表示编码器隐层向量，exp(·)表示指数函数；

利用权值a_t(s)计算所有隐层状态加权和c_t：

然后将得到的c_t与解码器中t时刻原始的隐层向量h_t进行拼接为：

h′_t＝tanh(W_c·[c_t；h_t]) (6)

式中，W_c为全连接矩阵，目的是将拼接向量的维度降低；

然后将h′_t乘以权重W_ho和偏置b_ho进行输出：

y_t＝softmax(W_hoh′+b_ho) (7)

式中，softmax(·)为归一化函数。

注意力机制相当于在seq2seq结构上进行了包装，计算解码器和编码器的分数和注意力向量c_t，给解码器加入额外信息提高处理长路径序列的性能。

进一步地，所述神经网络，采用循环神经网络RNN，RNN网络中权值是共享的，即W_ho与b_ho相等。

进一步地，为了降低训练时间，提升模型效果，该部分使用多种训练方式，最后选择训练时间短，正确率高的训练方式，模型的编码器和解码器的2个部分被联合训练，训练目标是最大化对数似然函数，神经网络的训练任务是使用梯度下降法来寻找一组参数θ*，为模型的训练数据对

传给模型数据对中的输入数据x_i，以最大化正确的序列y_i的对数似然，条件似然函数为：

式中，θ表示网络中所有参数的集合；

训练模型所使用的损失函数如下，目的是为了更好地反映模型的训练情况，模型损失函数的值越低越好，损失函数为：

式中，M为数据量，即采样数，在一定程度上，损失值越小，模型预测与真实情况越接近，可以大致反映模型的训练程度。

进一步地，seq2seq结构在训练时会存在一个问题，模型的解码器会使用上一时刻的输出y_t-1作为当前时刻t的输入，即y_t-1→x_t，这样做会有一现象：如果某一时刻的位置y_t预测错误，那么这个错误的位置编号还是会作为输入传入模型，并且可能被迅速放大，发生蝴蝶效应，由于训练时模型还没有收敛，正处于在训练时从未见过的状态空间的一部分之中。于是本发明通过scheduled sampling方法，以弥合位置序列预测任务的训练和推断之间的差距，在每个训练期间随机决定使用y_t-1还是y’_t-1，y表示真实确定的标记(token)，而y’表示模型预测的标记(特点是不知道正确与否)，每个时刻都像是抛1次硬币来抉择，在不同的epoch使用不同的p，由p的概率选取y_t-1，1-p的概率选取y’_t-1。根据经验，总是使用自身的推断结果会表现得很糟糕，反过来偶尔的使用自身推测结果却有助于消除过拟合。

进一步地，所述S1，中对监控区域进行了网格划分，监控的位置由集合L^*＝{L₀，L₁，L₂，...，L_N}表示，其中L₀表示当前的监控区域没有目标，即只需要知道位置序号，就可以知道人体所在的位置；所述S2，当发现监控区域内有目标出现时，RSSI的分布开始变化，采集RSSI，作为训练数据，根据监控区域内布局的标签所反射回天线的1个信号，得到1个RSSI矩阵，形状为N×T其中T为采样数，然后对RSSI进行了平均值和方差的特征抽取，在监控区域内的不同位置L_i，L_i∈L^*，天线不断地采集RSSI信号。

进一步地，所述S1中使用N个列表对象来存储RSSI，代表每个标签收集到的RSSI。

进一步地，根据单位时间内，对监控区域内标签的平均采样数，当列表的长度超过预设值时，求列表这段长度对应的RSSI的平均值和方差。

进一步地，所述S4中，在RFID天线信号覆盖的区域内，考虑到一开始并不知道什么样的标签布局方式才是最好的，因此采取的标签的布局方式是在区域外围的所有交点处放置标签，评判一个标签布局方式的好坏主要有两个方面：电子标签的个数和位置分类的正确率，在监控区域内，每个标签自身都有解析RSSI信号的能力，并且对每个位置的解析能力还各有不同，训练完成后观察每一个模型在测试数据集上的表现，对每个位置筛选一个正确率最高的模型，即标签，对每个位置都筛选完后，去掉未被选中的模型，即标签。

本发明的优势和有益效果在于：

本发明通过深度学习模型，在保持人体追踪精度的同时，减少了标签数量；对于深度学习模型，克服了模型输入输出序列长度不一致的问题，提高了模型灵活性；对于较长的RSSI特征序列，克服了路径轨迹解析的瓶颈，避免了精度下降；通过注意力机制，给解码器加入额外信息提高处理长路径序列的性能；通过scheduled sampling方法，弥合位置序列预测任务的训练和推断之间的差距。

附图说明

图1是发明中计算信号特征的示意图。

图2是发明中筛选标签的示意图。

图3区域划分示意图。

图4标签和位置正确率统计图。

具体实施方式

以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本发明，并不用于限制本发明。

本文的目的在于，建立低耦合度的系统，由若干个标签训练出的若干个模型组成，然后为每个位置选择出精度最高的标签，最后得到标签数量最优的追踪系统。

使用商用RFID和无源电子标签完成，无需对设备做任何的改变，通过注意力模型将信号特征与人的位置关系联系在一起，利用模型优势弥补信号噪声带来的误差以及多径效应。首先把每个标签的信号单独送入模型训练，得到的每个模型，对不同位置的分类能力有所不同，保留每个位置上分类正确率最高的模型，所有位置对比后丢弃未被选中的模型，既标签。此做法只保留了监控区域内各个位置与之对应正确率最高的标签，也就是说，当一个区域被划分成n个位置时，系统最多使用n个标签完成追踪任务，极大地减少了标签的使用。

由多径效应引起功率信号变化的不稳定，导致难以用来追踪人体，本发明找到一种将功率信号的分布由离散转变成密集的方式，目的是使模型更好地建立目标位置和信号之间的映射关系。

接收的信号强度指示(Received Signal Strength Indication，RSSI)为标签反射的功率信号，它在一定程度上反映了天线与标签之间的距离。在理想环境中，利用RSSI可以建立起标签与天线之间的距离关系，不过，由于多径效应的影响，使用RSSI定位和追踪目标是一项巨大的挑战。原始的RSSI无法直接作为训练的数据，因为在复杂的环境中会呈现的极度不确定，功率信号波动很大，直接将原始的信号用来建模是不可靠的，原因是RSSI不稳定，分布过于稀疏，需要找到合适的信号特征，使数据更密集便于模型训练。

如图1、2所示，一种RFID无设备人体追踪系统的择优标签方法，包括如下步骤：

步骤一，区域划分，将监控区域划分为N个位置；

对监控区域进行了网格划分，监控的位置由集合L^*＝{L₀，L₁，L₂，...，L_N}表示，网格大小一般为60cm×60cm，其中L₀表示当前的监控区域没有目标，即只需要知道位置序号，就可以知道人体所在的位置；

步骤二，特征提取及计算，为了将原始RSSI的分布变得更加密集，在不破坏数据真实值的情况下，提取每个位置一段时间内RSSI的均值和方差，一段时间内RSSI的均值和方差可以很好地表达该段数据的分布情况，而且增加了数据的特征，利于训练，并且将该段时间RSSI的分布与所在位置建立映射关系，训练出的模型更好地量化RSSI特征与位置的关系；

当发现监控区域内有目标出现时，RSSI的分布开始变化，采集RSSI，作为训练数据，由于监控区域内存在N个位置对应的多个标签，即每个标签都会反射回1个信号给天线，得到1个RSSI矩阵，形状为N×T其中T为采样数，然后对RSSI进行了平均值和方差的特征抽取，在监控区域内的不同位置L_i，L_i∈L^*，天线不断地采集RSSI信号，使用N个列表对象来存储RSSI，代表每个标签收集到的RSSI，读取软件使用VIKITEK公司提供的C#语言接口开发。

根据单位时间内，对区域内标签的平均采样数，当列表的长度超过预设值时，求列表这段长度对应的RSSI的平均值和方差。考虑到阅读器每秒对区域内每个标签的平均读取次数为60次，所以每当列表的长度超过30时(即为每0.5s采集到的RSSI推断出1个位置编号，0.5s为经验值，同时，将1秒分成两部分也便于控制采样时间)求RSSI的平均值和方差。

步骤三，构建深度学习模型，包括如下步骤：

采集的RSSI，根据当前人员的位置状态，推断下一时刻的位置状态，在人员跟踪的任务中，将已知长度，即采样数为T的RSSI序列

解析为相应的位置序列

即人体真实的移动轨迹，i表示第i个位置。

循环神经网络(Recurrent Neural Network，RNN)具有输出序列的能力，作为生成模型，它的每一个时刻都会输出给定输入RSSI情况下所有位置状态的可能性，利用它可以将输入序列转化为输出序列的能力，且序列前后具有一定关联的特性，本发明采用循环神经网络对RSSI序列进行解析，给定单个输入RSSI序列和输出位置序列对(Xⁱ，Yⁱ)，对数概率P(Xⁱ，Yⁱ)的计算方法为：

其中：

Y同理，表示长度为T的序列标记，

表示第i个训练向量对应的标s记向量中第1到T个时刻的标记。

公式(1)中，后一项由带参数θ^*的循环神经网络，通过隐层状态向量h来计算，而当前时刻的隐层状态向量

由上个时刻的

和输入

得到，计算式为

式中，

由循环神经网络计算式为：

式中，f(·)为tanh函数。

由当前时刻隐层状态向量

线性投影到分数向量实现，其输出会经过线性层转换维度和softmax层归一化，输出所有位置L₀～L_N的分数，最后选取分数最高的位置作为输出。

针对输入和输出序列的长度有时会不一致问题，将2个循环神经网络进行连接得到seq2seq(Sequence-to-sequence，seq2seq)模型，其优势在于高灵活性，很适合用来解决追踪任务中序列长度不统一的问题。

seq2seq模型本质上是由一个编码器和解码器构成，编码器和解码器都可以用循环神经网络充当，它的优势在于输入与输出长度可以不必相同，而且相比传统循环神经网络具有更好的记忆力，更加适合用于人员追踪任务。为了使RSSI序列更好地适应模型的输入，将RSSI序列通过词嵌入扩展成1个多维的列向量(维度取决于嵌入层大小)，随后经过编码器输出1个统一的语义向量h_T，即维度大小为h的隐层状态向量，由(3)中的f(.)函数非线性激活后产生，随后把语义向量h_T传给解码器，h_T向量记录着原始RSSI序列的所有信息，用于后续协助解码器获得更准确的位置序列S。

由于seq2seq结构仍然存在不足，如果处理较长的RSSI特征序列时，语义向量的长度限制就成了解析路径轨迹的瓶颈，原因是它装不下那么多原始的信息，造成的后果是精度下降，再者，原始seq2seq模型的编码器只是用了最后1层的隐状态h_T，这样的做法造成原始数据的利用率极低。为了减小以上影响，该研究对解码器引入注意力机制。

注意力机制本质上就是给作为解码器的循环神经网络添加额外的信息，本发明选择将c_t向量与隐层向量h_t拼接，然后通过全连接层恢复维度，为了得到c_t向量，首先计算解码器中t时刻隐层状态h_t对编码器中每个隐层状态

的权值a_t(s)：

式中，

为t时刻解码器隐层状态向量的转置，s’表示编码器长度，

表示编码器隐层向量，exp(·)表示指数函数。

利用权值a_t(s)计算所有隐层状态加权和c_t：

h′_t＝tanh(W_c·[c_t；h_t]) (6)

式中，W_c为全连接矩阵，目的是将拼接向量的维度降低。

然后将h′_t乘以权重W_ho和偏置b_ho进行输出：

y_t＝softmax(W_hoh′+b_ho) (7)

式中，softmax(·)为归一化函数，而RNN网络中权值是共享的，即只有一个参数，W_ho与b_ho相等。

为了降低训练时间，提升模型效果，该部分使用6种训练方式，最后选择训练时间短，正确率高的训练方式，模型的编码器和解码器的2个部分被联合训练，训练目标是最大化对数似然函数，神经网络的训练任务通常是使用梯度下降法来寻找一组参数θ*，本发明为模型的训练数据对

式中，θ表示网络中所有参数的集合。

式中，M为数据量，即采样数，在一定程度上，损失值越小，代表模型预测与真实情况越接近，可以大致反映模型的训练程度。

seq2seq结构在训练时会存在一个问题，模型的解码器会使用上一时刻的输出yt-1作为当前时刻t的输入，即y_t-1→x_t。这样做会有一现象：如果某一时刻的位置y_t预测错误，那么这个错误的位置编号还是会作为输入传入模型，并且可能被迅速放大，发生蝴蝶效应，由于训练时模型还没有收敛，正处于在训练时从未见过的状态空间的一部分之中。于是本发明使用scheduled sampling方法，以弥合位置序列预测任务的训练和推断之间的差距，让模型逐步处理预测结果的错误，最终实现较好的泛化能力，它的基本思想即在每个训练期间随机决定使用y_t-1还是y’_t-1，y表示真实确定的标记(token)，而y’表示模型预测的标记(特点是不知道正确与否)，每个时刻都像是抛1次硬币来抉择，在不同的epoch使用不同的p，由p的概率选取y_t-1，1-p的概率选取y’_t-1。根据经验，总是使用自身的推断结果会表现得很糟糕，反过来偶尔的使用自身推测结果却有助于消除过拟合。

步骤四，标签布局方式选择，由于在一个天线的监控区域内，放置过多的标签会带来诸多缺点，如增加阅读器的读取负担、环境过于复杂和系统的稳定性较弱。针对这些问题，本发明提出筛选最优标签的方法，根据位置的分类正确率，择优选择标签。

在RFID天线信号覆盖的区域内，考虑到一开始并不知道什么样的标签布局方式才是最好的，因此采取的标签的布局方式是在区域外围的所有交点处放置标签。评判一个标签布局方式的好坏主要有两个方面：电子标签的个数和位置分类的正确率。

在监控区域内，每个标签自身都有解析RSSI信号的能力，并且对每个位置的解析能力还各有不同，训练完成后观察每一个模型在测试数据集上的表现，对每个位置筛选一个正确率最高的模型，即标签，对每个位置都筛选完后，去掉未被选中的模型，即标签。

具体地，RFID数据格式为＜EPC，RSSI，Ante，Loc＞，其中EPC表示无源电子标签的编号，RSSI表示读写器获得该标签的功率值，Aten表示天线编号，Loc表示子区域编号(位置编号)。

RFID天线信号覆盖的区域称为监控区域，将其进行网格划分，如图3所示，把一个1.8m×1.8m的正方形区域等分为9个子区域，每个子区域面积大小为0.6m×0.6m，并进行位置编号L1～L9(L*代表Location*)，然后在整个区域外围的交点布置标签。即对人的定位追踪可以理解成，让系统分析出人在哪个子区域。

1.采集数据

在一个较大的范围内，布置多个天线即可(一个阅读器通常可以扩展4个天线)。测试人员需要在所有被监控到的子区域上采集RSSI数据，只需要在天线工作的情况下，测试人员站在子区域中即可，采集时间5分钟以上即可。在L1采集到的数据为：

[＜tag1，RSSI，#3，L1＞，＜tag1，RSSI，#3，L1＞，……，＜tag1，RSSI，#3，L1＞]

[＜tag2，RSSI，#3，L1＞，＜tag2，RSSI，#3，L1＞，……，＜tag2，RSSI，#3，L1＞]

[＜tag9，RSSI，#3，L1＞，＜tag1，RSSI，#3，L1＞，……，＜tag9，RSSI，#3，L1＞]

L1采集完成后，对剩余的位置采集。

2.提取特征

对于采集到的RSSI数据需要进行一个特征提取的操作。将每个天线采集到的RSSI数据以30个为一组，并求这30个RSSI的平均值与方差。例如：针对3号天线读到的RSSI数据：

[＜tag1，44.1，#3，L1＞，＜tag1，46.2，#3，L1＞，......，＜tag1，43.5，#3，L1＞]

[＜tag1，43.6，#3，L2＞，＜tag1，45.4，#3，L2＞，......，＜tag1，43.2，#3，L2＞]

[＜tag1，41.6，#3，L9＞，＜tag1，42.4，#3，L9＞，......，＜tag1，48.2，#3，L9＞]

例如该矩阵形状9×1500，进行特征提取得到

[＜tag1，Avg of30RSSI，#3，L1＞，＜tag1，～，#3，L1＞，......，＜tag1，～，#3，L1＞]

[＜tag1，Avg of 30RSSI，#3，L2＞，＜tag1，～，#3，L2＞，......，＜tag1，～，#3，L2＞]

[＜tag1，Avg of 30RSSI，#3，L9＞，＜tag1，～，#3，L9＞，......，＜tag1，～，#3，L9＞]

矩阵形状9×50，“～”表示Avg of 30RSSI，该步骤仅仅针对3号天线的标签1操作，之后还需要对3号天线的其他标签进行该操作，例如＜tag2,RSSI,#3,L1～L9＞

3.模型的输入数据

为每一个标签训练一个注意力模型。如图3所示，有12个标签tag1-12，训练出12个模型model1-12。在训练model1时(取60％的tag1数据作为训练数据，剩余的40％作为验证数据)：

[＜tag1,Avg of 30RSSI,#3,L1＞,……,＜tag1,Avg of 30RSSI,#3,L1＞],

[＜tag1,Avg of 30RSSI,#3,L2＞,……,＜tag1,Avg of 30RSSI,#3,L2＞],

……,

[＜tag1,Avg of 30RSSI,#3,L9＞,……,＜tag1,Avg of 30RSSI,#3,L9＞]

对应数据对(X,Y)等同([Avg of 30RSSI,～,…,～],S)，其中S＝[L1,L3,L2,…,L5]

4.筛选标签

例如对图3的区域，已经获得了12个模型model1-12，将剩下的40％测试集数据输入给模型，将模型的输出位置序列与真实位置序列比较，统计正确率：

model1输入：[Avg of 30RSSI,～,…,～]

model1输出：S’＝[L1……]

将真实序列S与模型输出的序列S’比较，观察各位置是否相同，如果不一致则该位置错误数+1，例如S(3)＝L2，S’(3)＝L3，则tag1也就是model1在位置L2出的错误数+1。所有测试集测试完毕后，比较model1-12对L1～L9的正确率。

如图4所示，左侧标签列填充的Tag为筛选后保留的标签，中间填充的数字为标签列及对应位置的最小错误数。选取最小错误数的标签。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的范围。

Claims

1.一种RFID无设备人体追踪系统的择优标签方法，其特征在于包括如下步骤：

S1，区域划分，将监控区域划分为N个位置；

S2，特征提取及计算，提取每个位置一段时间内采样的T个RSSI的均值和方差，并且将该段时间RSSI的分布与所在位置建立映射关系；

S3，构建深度学习模型，根据T的RSSI序列

解析相应的位置序列

即人体真实的移动轨迹，i表示第i个位置，包括如下步骤：

S31，采用神经网络对RSSI序列进行解析，给定单个输入RSSI序列和输出位置序列对(Xⁱ,Yⁱ)，对数概率P(Xⁱ,Yⁱ)的计算方法为：

其中：

Y同理，表示长度为T的序列标记，

表示第i个训练向量对应的标s记向量中第t个时刻的标记，

表示第i个训练向量对应的标s记向量中第1到T个时刻的标记；

由上个时刻的

和输入

得到，计算式为

式中，

由循环神经网络计算式为：

式中，f(·)为tanh函数；

S33，

由当前时刻隐层状态向量

线性投影到分数向量实现，其输出经过线性层转换维度和归一化，输出所有位置的分数，最后选取分数最高的位置作为输出；

S4，标签布局方式选择，根据深度学习模型对于位置的分类正确率，择优选择标签。

2.根据权利要求1所述的一种RFID无设备人体追踪系统的择优标签方法，其特征在于所述S3中，将2个神经网络进行连接得到seq2seq模型，seq2seq模型由一个编码器和解码器构成将RSSI序列通过词嵌入扩展成多维的列向量，随后经过编码器输出统一的语义向量h_T，即维度大小为h的隐层状态向量，随后将语义向量h_T传给解码器，用于解码器获得更准确的位置序列S。

3.根据权利要求2所述的一种RFID无设备人体追踪系统的择优标签方法，其特征在于对解码器引入注意力机制，将c_t向量与隐层向量h_t拼接，然后通过全连接层恢复维度，为了得到c_t向量，首先计算解码器中t时刻隐层状态h_t对编码器中每个隐层状态

的权值a_t(s)：

式中，

为t时刻解码器隐层状态向量的转置，s’表示编码器长度，

表示编码器隐层向量，exp(·)表示指数函数；

利用权值a_t(s)计算所有隐层状态加权和c_t：

h′_t＝tanh(W_c·[c_t；h_t]) (6)

式中，W_c为全连接矩阵，目的是将拼接向量的维度降低；

然后将h′_t乘以权重W_ho和偏置b_ho进行输出：

y_t＝softmax(W_hoh'+b_ho) (7)

式中，softmax(·)为归一化函数。

4.根据权利要求3所述的一种RFID无设备人体追踪系统的择优标签方法，其特征在于所述神经网络，采用循环神经网络RNN，RNN网络中权值是共享的，即W_ho与b_ho相等。

5.根据权利要求2所述的一种RFID无设备人体追踪系统的择优标签方法，其特征在于使用多种训练方式，最后选择训练时间短，正确率高的训练方式，模型的编码器和解码器的2个部分被联合训练，训练目标是最大化对数似然函数，神经网络的训练任务是使用梯度下降法来寻找一组参数θ*，为模型的训练数据对

式中，θ表示网络中所有参数的集合；

训练模型所使用的损失函数如下：

式中，M为数据量，即采样数，损失值越小，模型预测与真实情况越接近。

6.根据权利要求2所述的一种RFID无设备人体追踪系统的择优标签方法，其特征在于训练时，模型的解码器会使用上一时刻的输出y_t-1作为当前时刻t的输入，即y_t-1→x_t，在每个训练期间随机决定使用y_t-1还是y’_t-1，y表示真实确定的标记，而y’表示模型预测的标记，在不同的epoch使用不同的p，由p的概率选取y_t-1，1-p的概率选取y’_t-1。

7.根据权利要求1所述的一种RFID无设备人体追踪系统的择优标签方法，其特征在于所述S1，中对监控区域进行了网格划分，监控的位置由集合L^*＝{L₀,L₁,L₂,…,L_N}表示，其中L₀表示当前的监控区域没有目标；所述S2，当发现监控区域内有目标出现时，RSSI的分布开始变化，采集RSSI，作为训练数据，根据监控区域内布局的标签所反射回的信号，得到1个RSSI矩阵，形状为N×T其中T为采样数，然后对RSSI进行了平均值和方差的特征抽取，在监控区域内的不同位置L_i，L_i∈L^*，不断地采集RSSI信号。

8.根据权利要求1所述的一种RFID无设备人体追踪系统的择优标签方法，其特征在于所述S1中使用N个列表对象来存储RSSI，代表每个标签收集到的RSSI。

9.根据权利要求8所述的一种RFID无设备人体追踪系统的择优标签方法，其特征在于根据单位时间内，对监控区域内标签的平均采样数，当列表的长度超过预设值时，求列表这段长度对应的RSSI的平均值和方差。

10.根据权利要求1所述的一种RFID无设备人体追踪系统的择优标签方法，其特征在于所述S4中，在RFID信号覆盖的区域内，在区域外围的所有交点处放置标签，在监控区域内，每个标签自身都有解析RSSI信号的能力，并且对每个位置的解析能力各有不同，训练完成后观察每一个模型在测试数据集上的表现，对每个位置筛选一个正确率最高的模型，即标签，对每个位置都筛选完后，去掉未被选中的模型，即标签。