CN113744318A - 一种rfid无设备人体追踪系统的择优标签方法 - Google Patents

一种rfid无设备人体追踪系统的择优标签方法 Download PDF

Info

Publication number
CN113744318A
CN113744318A CN202111083051.1A CN202111083051A CN113744318A CN 113744318 A CN113744318 A CN 113744318A CN 202111083051 A CN202111083051 A CN 202111083051A CN 113744318 A CN113744318 A CN 113744318A
Authority
CN
China
Prior art keywords
rssi
vector
model
training
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111083051.1A
Other languages
English (en)
Other versions
CN113744318B (zh
Inventor
鲁建厦
包秦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202111083051.1A priority Critical patent/CN113744318B/zh
Publication of CN113744318A publication Critical patent/CN113744318A/zh
Application granted granted Critical
Publication of CN113744318B publication Critical patent/CN113744318B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K19/00Record carriers for use with machines and with at least a part designed to carry digital markings
    • G06K19/06Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code
    • G06K19/067Record carriers with conductive marks, printed circuits or semiconductor circuit elements, e.g. credit or identity cards also with resonating or responding marks without active components
    • G06K19/07Record carriers with conductive marks, printed circuits or semiconductor circuit elements, e.g. credit or identity cards also with resonating or responding marks without active components with integrated circuit chips
    • G06K19/0723Record carriers with conductive marks, printed circuits or semiconductor circuit elements, e.g. credit or identity cards also with resonating or responding marks without active components with integrated circuit chips the record carrier comprising an arrangement for non-contact communication, e.g. wireless communication circuits on transponder cards, non-contact smart cards or RFIDs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Hardware Design (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

本发明公开了一种RFID无设备人体追踪系统的择优标签方法,包括如下步骤:S1,区域划分,将监控区域划分为N个位置;S2,特征提取及计算,提取每个位置一段时间内采样的T个RSSI的均值和方差,并且将该段时间RSSI的分布与所在位置建立映射关系;S3,构建深度学习模型,根据T的RSSI序列,解析相应的位置序列,即人体真实的移动轨迹;S4,标签布局方式选择,根据深度学习模型对于位置的分类正确率,择优选择标签。本发明通过深度学习模型,在保持人体追踪精度的同时,减少了标签数量,提高了模型灵活性,避免了精度下降,提高了处理长路径序列的性能,弥合了位置序列预测任务的训练和推断之间的差距。

Description

一种RFID无设备人体追踪系统的择优标签方法
技术领域
本发明涉及人员定位技术领域,尤其是涉及一种RFID无设备人体追踪系统的择优标签方法。
背景技术
随着现代社会老龄化加剧,老年人的监护是如今不得不面对的一个重大问题。如何让现代智能设备更好地支持老年群体的独立生活越来越收到工业界和学术界的关注,这个问题的核心为在环境复杂的生活环境中如何准确地定位到人体,虽然传统的基于设备的技术相比无设备受环境影响更小,实现起来会更容易,但是要使用这些系统的话必须要求用户携带相应的传感器或通信设备,而对于老年人群体来说还经常会发生设备遗忘和丢失的问题,并且使用者还需要有意识地配合或者愿意佩戴设备,且同意分享自己的位置信息。
RFID是一种通过电磁传输到射频兼容集成电路来存储和检索数据的方法,以低成本、体积小和非侵入式等优点近年来备受青睐。通过RFID读取到无源标签的功率信号值RSSI(Received Signal Strength Indication,RSSI),判断人员所在的位置。
随着深度学习的的发展,深度学习已逐渐深入各个领域,在人员定位上,RFID无设备人员追踪的任务可以描述为:在RFID监控区域内,阅读器天线发出射频信号,无源标签获得信号中的能量并反射给天线。有人体干扰射频信号时,会使原来的信号强度衰减或增强,造成标签获得的能量发生改变,利用这一特性建立人体移动与信号变化的模型,通过对输入信号序列处理后输出人体真实移动路径。
解决的难点:1)由于受环境影响,功率信号变化范围大且不稳定,如直接用来训练深度学习模型会使得跟踪效果较差;2)目前深度学习模型种类多,不同结构和训练方式效果不同,如何根据当前任务选择二者是一个难点;3)现有的研究未考虑标签使用量的问题,多数是因为系统本身受限,减少标签会造成系统追踪或定位误差提升,还会造成阅读器的漏读次数增加、环境过于复杂和系统计算量庞大等问题,如何使用数量相对少的标签是该研究的难点。传统的追踪系统通常为一个整体,耦合度大,要对标签数量进行控制是一个非常棘手的问题,也正是该问题被忽略的一个原因。
发明内容
为解决现有技术的不足,实现保持人体追踪精度的同时,实现标签数量最优的目的,本发明采用如下的技术方案:
一种RFID无设备人体追踪系统的择优标签方法,包括如下步骤:
S1,区域划分,将监控区域划分为N个位置;
S2,特征提取及计算,为了将原始RSSI的分布变得更加密集,在不破坏数据真实值的情况下,提取每个位置一段时间内采样的T个RSSI的均值和方差,一段时间内RSSI的均值和方差可以很好地表达该段数据的分布情况,而且增加了数据的特征,利于训练,并且将该段时间RSSI的分布与所在位置建立映射关系,训练出的模型更好地量化RSSI特征与位置的关系;
S3,构建深度学习模型,根据T的RSSI序列
Figure BDA0003264685070000021
解析相应的位置序列
Figure BDA0003264685070000022
即人体真实的移动轨迹,i表示第i个位置,包括如下步骤:
S31,采用循环神经网络对RSSI序列进行解析,给定单个输入RSSI序列和输出位置序列对(Xi,Yi),对数概率P(Xi,Yi)的计算方法为:
Figure BDA0003264685070000023
其中:
Figure BDA0003264685070000024
Y同理,表示长度为T的序列标记,
Figure BDA0003264685070000025
表示第i个训练向量中第t时刻的数据,t∈T表示神经网络第t时刻,即第t次采样,
Figure BDA0003264685070000026
表示第i个训练向量对应的标s记向量中第t个时刻的标记(token),
Figure BDA0003264685070000027
表示第i个训练向量对应的标s记向量中第1到T个时刻的标记;
S32,θ由带参数θ*的循环神经网络,通过隐层状态向量h进行计算,当前时刻的隐层状态向量
Figure BDA0003264685070000028
由上个时刻的
Figure BDA0003264685070000029
和输入
Figure BDA00032646850700000210
得到,计算式为
Figure BDA00032646850700000211
式中,
Figure BDA00032646850700000212
由循环神经网络计算式为:
Figure BDA00032646850700000213
式中,f(·)为tanh函数;
S33,
Figure BDA00032646850700000214
由当前时刻隐层状态向量
Figure BDA00032646850700000215
线性投影到分数向量实现,其输出经过线性层转换维度和softmax层归一化,输出所有位置L0~LN的分数,最后选取分数最高的位置作为输出;
S4,标签布局方式选择,由于在一个天线的监控区域内,放置过多的标签会带来诸多缺点,如增加阅读器的读取负担、环境过于复杂和系统的稳定性较弱,根据深度学习模型对于位置的分类正确率,择优选择标签。
进一步地,所述S3中,针对输入和输出序列的长度有时会不一致问题,将2个循环神经网络进行连接得到seq2seq模型,其优势在于高灵活性,很适合用来解决追踪任务中序列长度不统一的问题;seq2seq模型由一个编码器和解码器构成,编码器和解码器都可以用循环神经网络充当,它的优势在于输入与输出长度可以不必相同,而且相比传统循环神经网络具有更好的记忆力,更加适合用于人员追踪任务;为了使RSSI序列更好地适应模型的输入,将RSSI序列通过词嵌入扩展成1个多维的列向量(维度取决于嵌入层大小),随后经过编码器输出1个统一的语义向量hT,即维度大小为h的隐层状态向量,由公式(3)中的f(.)函数非线性激活后产生,随后将语义向量hT传给解码器,hT向量记录着原始RSSI序列的所有信息,用于后续协助解码器获得更准确的位置序列S。
进一步地,由于seq2seq结构仍然存在不足,如果处理较长的RSSI特征序列时,语义向量的长度限制就成了解析路径轨迹的瓶颈,原因是它装不下那么多原始的信息,造成的后果是精度下降,再者,原始seq2seq模型的编码器只是用了最后1层的隐状态hT,这样的做法造成原始数据的利用率极低。为了减小以上影响,该研究对解码器引入注意力机制,给解码器添加额外的信息,将ct向量与隐层向量ht拼接,然后通过全连接层恢复维度,为了得到ct向量,首先计算解码器中t时刻隐层状态ht对编码器中每个隐层状态
Figure BDA0003264685070000031
的权值at(s):
Figure BDA0003264685070000032
式中,
Figure BDA0003264685070000033
为t时刻解码器隐层状态向量的转置,s’表示编码器长度,
Figure BDA0003264685070000034
表示编码器隐层向量,exp(·)表示指数函数;
利用权值at(s)计算所有隐层状态加权和ct
Figure BDA0003264685070000035
然后将得到的ct与解码器中t时刻原始的隐层向量ht进行拼接为:
h′t=tanh(Wc·[ct;ht]) (6)
式中,Wc为全连接矩阵,目的是将拼接向量的维度降低;
然后将h′t乘以权重Who和偏置bho进行输出:
yt=softmax(Whoh′+bho) (7)
式中,softmax(·)为归一化函数。
注意力机制相当于在seq2seq结构上进行了包装,计算解码器和编码器的分数和注意力向量ct,给解码器加入额外信息提高处理长路径序列的性能。
进一步地,所述神经网络,采用循环神经网络RNN,RNN网络中权值是共享的,即Who与bho相等。
进一步地,为了降低训练时间,提升模型效果,该部分使用多种训练方式,最后选择训练时间短,正确率高的训练方式,模型的编码器和解码器的2个部分被联合训练,训练目标是最大化对数似然函数,神经网络的训练任务是使用梯度下降法来寻找一组参数θ*,为模型的训练数据对
Figure BDA0003264685070000036
传给模型数据对中的输入数据xi,以最大化正确的序列yi的对数似然,条件似然函数为:
Figure BDA0003264685070000041
式中,θ表示网络中所有参数的集合;
训练模型所使用的损失函数如下,目的是为了更好地反映模型的训练情况,模型损失函数的值越低越好,损失函数为:
Figure BDA0003264685070000042
式中,M为数据量,即采样数,在一定程度上,损失值越小,模型预测与真实情况越接近,可以大致反映模型的训练程度。
进一步地,seq2seq结构在训练时会存在一个问题,模型的解码器会使用上一时刻的输出yt-1作为当前时刻t的输入,即yt-1→xt,这样做会有一现象:如果某一时刻的位置yt预测错误,那么这个错误的位置编号还是会作为输入传入模型,并且可能被迅速放大,发生蝴蝶效应,由于训练时模型还没有收敛,正处于在训练时从未见过的状态空间的一部分之中。于是本发明通过scheduled sampling方法,以弥合位置序列预测任务的训练和推断之间的差距,在每个训练期间随机决定使用yt-1还是y’t-1,y表示真实确定的标记(token),而y’表示模型预测的标记(特点是不知道正确与否),每个时刻都像是抛1次硬币来抉择,在不同的epoch使用不同的p,由p的概率选取yt-1,1-p的概率选取y’t-1。根据经验,总是使用自身的推断结果会表现得很糟糕,反过来偶尔的使用自身推测结果却有助于消除过拟合。
进一步地,所述S1,中对监控区域进行了网格划分,监控的位置由集合L*={L0,L1,L2,...,LN}表示,其中L0表示当前的监控区域没有目标,即只需要知道位置序号,就可以知道人体所在的位置;所述S2,当发现监控区域内有目标出现时,RSSI的分布开始变化,采集RSSI,作为训练数据,根据监控区域内布局的标签所反射回天线的1个信号,得到1个RSSI矩阵,形状为N×T其中T为采样数,然后对RSSI进行了平均值和方差的特征抽取,在监控区域内的不同位置Li,Li∈L*,天线不断地采集RSSI信号。
进一步地,所述S1中使用N个列表对象来存储RSSI,代表每个标签收集到的RSSI。
进一步地,根据单位时间内,对监控区域内标签的平均采样数,当列表的长度超过预设值时,求列表这段长度对应的RSSI的平均值和方差。
进一步地,所述S4中,在RFID天线信号覆盖的区域内,考虑到一开始并不知道什么样的标签布局方式才是最好的,因此采取的标签的布局方式是在区域外围的所有交点处放置标签,评判一个标签布局方式的好坏主要有两个方面:电子标签的个数和位置分类的正确率,在监控区域内,每个标签自身都有解析RSSI信号的能力,并且对每个位置的解析能力还各有不同,训练完成后观察每一个模型在测试数据集上的表现,对每个位置筛选一个正确率最高的模型,即标签,对每个位置都筛选完后,去掉未被选中的模型,即标签。
本发明的优势和有益效果在于:
本发明通过深度学习模型,在保持人体追踪精度的同时,减少了标签数量;对于深度学习模型,克服了模型输入输出序列长度不一致的问题,提高了模型灵活性;对于较长的RSSI特征序列,克服了路径轨迹解析的瓶颈,避免了精度下降;通过注意力机制,给解码器加入额外信息提高处理长路径序列的性能;通过scheduled sampling方法,弥合位置序列预测任务的训练和推断之间的差距。
附图说明
图1是发明中计算信号特征的示意图。
图2是发明中筛选标签的示意图。
图3区域划分示意图。
图4标签和位置正确率统计图。
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
本文的目的在于,建立低耦合度的系统,由若干个标签训练出的若干个模型组成,然后为每个位置选择出精度最高的标签,最后得到标签数量最优的追踪系统。
使用商用RFID和无源电子标签完成,无需对设备做任何的改变,通过注意力模型将信号特征与人的位置关系联系在一起,利用模型优势弥补信号噪声带来的误差以及多径效应。首先把每个标签的信号单独送入模型训练,得到的每个模型,对不同位置的分类能力有所不同,保留每个位置上分类正确率最高的模型,所有位置对比后丢弃未被选中的模型,既标签。此做法只保留了监控区域内各个位置与之对应正确率最高的标签,也就是说,当一个区域被划分成n个位置时,系统最多使用n个标签完成追踪任务,极大地减少了标签的使用。
由多径效应引起功率信号变化的不稳定,导致难以用来追踪人体,本发明找到一种将功率信号的分布由离散转变成密集的方式,目的是使模型更好地建立目标位置和信号之间的映射关系。
接收的信号强度指示(Received Signal Strength Indication,RSSI)为标签反射的功率信号,它在一定程度上反映了天线与标签之间的距离。在理想环境中,利用RSSI可以建立起标签与天线之间的距离关系,不过,由于多径效应的影响,使用RSSI定位和追踪目标是一项巨大的挑战。原始的RSSI无法直接作为训练的数据,因为在复杂的环境中会呈现的极度不确定,功率信号波动很大,直接将原始的信号用来建模是不可靠的,原因是RSSI不稳定,分布过于稀疏,需要找到合适的信号特征,使数据更密集便于模型训练。
如图1、2所示,一种RFID无设备人体追踪系统的择优标签方法,包括如下步骤:
步骤一,区域划分,将监控区域划分为N个位置;
对监控区域进行了网格划分,监控的位置由集合L*={L0,L1,L2,...,LN}表示,网格大小一般为60cm×60cm,其中L0表示当前的监控区域没有目标,即只需要知道位置序号,就可以知道人体所在的位置;
步骤二,特征提取及计算,为了将原始RSSI的分布变得更加密集,在不破坏数据真实值的情况下,提取每个位置一段时间内RSSI的均值和方差,一段时间内RSSI的均值和方差可以很好地表达该段数据的分布情况,而且增加了数据的特征,利于训练,并且将该段时间RSSI的分布与所在位置建立映射关系,训练出的模型更好地量化RSSI特征与位置的关系;
当发现监控区域内有目标出现时,RSSI的分布开始变化,采集RSSI,作为训练数据,由于监控区域内存在N个位置对应的多个标签,即每个标签都会反射回1个信号给天线,得到1个RSSI矩阵,形状为N×T其中T为采样数,然后对RSSI进行了平均值和方差的特征抽取,在监控区域内的不同位置Li,Li∈L*,天线不断地采集RSSI信号,使用N个列表对象来存储RSSI,代表每个标签收集到的RSSI,读取软件使用VIKITEK公司提供的C#语言接口开发。
根据单位时间内,对区域内标签的平均采样数,当列表的长度超过预设值时,求列表这段长度对应的RSSI的平均值和方差。考虑到阅读器每秒对区域内每个标签的平均读取次数为60次,所以每当列表的长度超过30时(即为每0.5s采集到的RSSI推断出1个位置编号,0.5s为经验值,同时,将1秒分成两部分也便于控制采样时间)求RSSI的平均值和方差。
步骤三,构建深度学习模型,包括如下步骤:
采集的RSSI,根据当前人员的位置状态,推断下一时刻的位置状态,在人员跟踪的任务中,将已知长度,即采样数为T的RSSI序列
Figure BDA0003264685070000061
解析为相应的位置序列
Figure BDA0003264685070000062
即人体真实的移动轨迹,i表示第i个位置。
循环神经网络(Recurrent Neural Network,RNN)具有输出序列的能力,作为生成模型,它的每一个时刻都会输出给定输入RSSI情况下所有位置状态的可能性,利用它可以将输入序列转化为输出序列的能力,且序列前后具有一定关联的特性,本发明采用循环神经网络对RSSI序列进行解析,给定单个输入RSSI序列和输出位置序列对(Xi,Yi),对数概率P(Xi,Yi)的计算方法为:
Figure BDA0003264685070000063
其中:
Figure BDA0003264685070000064
Y同理,表示长度为T的序列标记,
Figure BDA0003264685070000065
表示第i个训练向量中第t时刻的数据,t∈T表示神经网络第t时刻,即第t次采样,
Figure BDA0003264685070000066
表示第i个训练向量对应的标s记向量中第t个时刻的标记(token),
Figure BDA0003264685070000067
表示第i个训练向量对应的标s记向量中第1到T个时刻的标记。
公式(1)中,后一项由带参数θ*的循环神经网络,通过隐层状态向量h来计算,而当前时刻的隐层状态向量
Figure BDA0003264685070000071
由上个时刻的
Figure BDA0003264685070000072
和输入
Figure BDA0003264685070000073
得到,计算式为
Figure BDA0003264685070000074
式中,
Figure BDA0003264685070000075
由循环神经网络计算式为:
Figure BDA0003264685070000076
式中,f(·)为tanh函数。
Figure BDA0003264685070000077
由当前时刻隐层状态向量
Figure BDA0003264685070000078
线性投影到分数向量实现,其输出会经过线性层转换维度和softmax层归一化,输出所有位置L0~LN的分数,最后选取分数最高的位置作为输出。
针对输入和输出序列的长度有时会不一致问题,将2个循环神经网络进行连接得到seq2seq(Sequence-to-sequence,seq2seq)模型,其优势在于高灵活性,很适合用来解决追踪任务中序列长度不统一的问题。
seq2seq模型本质上是由一个编码器和解码器构成,编码器和解码器都可以用循环神经网络充当,它的优势在于输入与输出长度可以不必相同,而且相比传统循环神经网络具有更好的记忆力,更加适合用于人员追踪任务。为了使RSSI序列更好地适应模型的输入,将RSSI序列通过词嵌入扩展成1个多维的列向量(维度取决于嵌入层大小),随后经过编码器输出1个统一的语义向量hT,即维度大小为h的隐层状态向量,由(3)中的f(.)函数非线性激活后产生,随后把语义向量hT传给解码器,hT向量记录着原始RSSI序列的所有信息,用于后续协助解码器获得更准确的位置序列S。
由于seq2seq结构仍然存在不足,如果处理较长的RSSI特征序列时,语义向量的长度限制就成了解析路径轨迹的瓶颈,原因是它装不下那么多原始的信息,造成的后果是精度下降,再者,原始seq2seq模型的编码器只是用了最后1层的隐状态hT,这样的做法造成原始数据的利用率极低。为了减小以上影响,该研究对解码器引入注意力机制。
注意力机制本质上就是给作为解码器的循环神经网络添加额外的信息,本发明选择将ct向量与隐层向量ht拼接,然后通过全连接层恢复维度,为了得到ct向量,首先计算解码器中t时刻隐层状态ht对编码器中每个隐层状态
Figure BDA0003264685070000079
的权值at(s):
Figure BDA00032646850700000710
式中,
Figure BDA00032646850700000711
为t时刻解码器隐层状态向量的转置,s’表示编码器长度,
Figure BDA00032646850700000712
表示编码器隐层向量,exp(·)表示指数函数。
利用权值at(s)计算所有隐层状态加权和ct
Figure BDA00032646850700000713
然后将得到的ct与解码器中t时刻原始的隐层向量ht进行拼接为:
h′t=tanh(Wc·[ct;ht]) (6)
式中,Wc为全连接矩阵,目的是将拼接向量的维度降低。
然后将h′t乘以权重Who和偏置bho进行输出:
yt=softmax(Whoh′+bho) (7)
式中,softmax(·)为归一化函数,而RNN网络中权值是共享的,即只有一个参数,Who与bho相等。
注意力机制相当于在seq2seq结构上进行了包装,计算解码器和编码器的分数和注意力向量ct,给解码器加入额外信息提高处理长路径序列的性能。
为了降低训练时间,提升模型效果,该部分使用6种训练方式,最后选择训练时间短,正确率高的训练方式,模型的编码器和解码器的2个部分被联合训练,训练目标是最大化对数似然函数,神经网络的训练任务通常是使用梯度下降法来寻找一组参数θ*,本发明为模型的训练数据对
Figure BDA0003264685070000081
传给模型数据对中的输入数据xi,以最大化正确的序列yi的对数似然,条件似然函数为:
Figure BDA0003264685070000082
式中,θ表示网络中所有参数的集合。
训练模型所使用的损失函数如下,目的是为了更好地反映模型的训练情况,模型损失函数的值越低越好,损失函数为:
Figure BDA0003264685070000083
式中,M为数据量,即采样数,在一定程度上,损失值越小,代表模型预测与真实情况越接近,可以大致反映模型的训练程度。
seq2seq结构在训练时会存在一个问题,模型的解码器会使用上一时刻的输出yt-1作为当前时刻t的输入,即yt-1→xt。这样做会有一现象:如果某一时刻的位置yt预测错误,那么这个错误的位置编号还是会作为输入传入模型,并且可能被迅速放大,发生蝴蝶效应,由于训练时模型还没有收敛,正处于在训练时从未见过的状态空间的一部分之中。于是本发明使用scheduled sampling方法,以弥合位置序列预测任务的训练和推断之间的差距,让模型逐步处理预测结果的错误,最终实现较好的泛化能力,它的基本思想即在每个训练期间随机决定使用yt-1还是y’t-1,y表示真实确定的标记(token),而y’表示模型预测的标记(特点是不知道正确与否),每个时刻都像是抛1次硬币来抉择,在不同的epoch使用不同的p,由p的概率选取yt-1,1-p的概率选取y’t-1。根据经验,总是使用自身的推断结果会表现得很糟糕,反过来偶尔的使用自身推测结果却有助于消除过拟合。
步骤四,标签布局方式选择,由于在一个天线的监控区域内,放置过多的标签会带来诸多缺点,如增加阅读器的读取负担、环境过于复杂和系统的稳定性较弱。针对这些问题,本发明提出筛选最优标签的方法,根据位置的分类正确率,择优选择标签。
在RFID天线信号覆盖的区域内,考虑到一开始并不知道什么样的标签布局方式才是最好的,因此采取的标签的布局方式是在区域外围的所有交点处放置标签。评判一个标签布局方式的好坏主要有两个方面:电子标签的个数和位置分类的正确率。
在监控区域内,每个标签自身都有解析RSSI信号的能力,并且对每个位置的解析能力还各有不同,训练完成后观察每一个模型在测试数据集上的表现,对每个位置筛选一个正确率最高的模型,即标签,对每个位置都筛选完后,去掉未被选中的模型,即标签。
具体地,RFID数据格式为<EPC,RSSI,Ante,Loc>,其中EPC表示无源电子标签的编号,RSSI表示读写器获得该标签的功率值,Aten表示天线编号,Loc表示子区域编号(位置编号)。
RFID天线信号覆盖的区域称为监控区域,将其进行网格划分,如图3所示,把一个1.8m×1.8m的正方形区域等分为9个子区域,每个子区域面积大小为0.6m×0.6m,并进行位置编号L1~L9(L*代表Location*),然后在整个区域外围的交点布置标签。即对人的定位追踪可以理解成,让系统分析出人在哪个子区域。
1.采集数据
在一个较大的范围内,布置多个天线即可(一个阅读器通常可以扩展4个天线)。测试人员需要在所有被监控到的子区域上采集RSSI数据,只需要在天线工作的情况下,测试人员站在子区域中即可,采集时间5分钟以上即可。在L1采集到的数据为:
[<tag1,RSSI,#3,L1>,<tag1,RSSI,#3,L1>,……,<tag1,RSSI,#3,L1>]
[<tag2,RSSI,#3,L1>,<tag2,RSSI,#3,L1>,……,<tag2,RSSI,#3,L1>]
[<tag9,RSSI,#3,L1>,<tag1,RSSI,#3,L1>,……,<tag9,RSSI,#3,L1>]
L1采集完成后,对剩余的位置采集。
2.提取特征
对于采集到的RSSI数据需要进行一个特征提取的操作。将每个天线采集到的RSSI数据以30个为一组,并求这30个RSSI的平均值与方差。例如:针对3号天线读到的RSSI数据:
[<tag1,44.1,#3,L1>,<tag1,46.2,#3,L1>,......,<tag1,43.5,#3,L1>]
[<tag1,43.6,#3,L2>,<tag1,45.4,#3,L2>,......,<tag1,43.2,#3,L2>]
[<tag1,41.6,#3,L9>,<tag1,42.4,#3,L9>,......,<tag1,48.2,#3,L9>]
例如该矩阵形状9×1500,进行特征提取得到
[<tag1,Avg of30RSSI,#3,L1>,<tag1,~,#3,L1>,......,<tag1,~,#3,L1>]
[<tag1,Avg of 30RSSI,#3,L2>,<tag1,~,#3,L2>,......,<tag1,~,#3,L2>]
[<tag1,Avg of 30RSSI,#3,L9>,<tag1,~,#3,L9>,......,<tag1,~,#3,L9>]
矩阵形状9×50,“~”表示Avg of 30RSSI,该步骤仅仅针对3号天线的标签1操作,之后还需要对3号天线的其他标签进行该操作,例如<tag2,RSSI,#3,L1~L9>
3.模型的输入数据
为每一个标签训练一个注意力模型。如图3所示,有12个标签tag1-12,训练出12个模型model1-12。在训练model1时(取60%的tag1数据作为训练数据,剩余的40%作为验证数据):
[<tag1,Avg of 30RSSI,#3,L1>,……,<tag1,Avg of 30RSSI,#3,L1>],
[<tag1,Avg of 30RSSI,#3,L2>,……,<tag1,Avg of 30RSSI,#3,L2>],
……,
[<tag1,Avg of 30RSSI,#3,L9>,……,<tag1,Avg of 30RSSI,#3,L9>]
对应数据对(X,Y)等同([Avg of 30RSSI,~,…,~],S),其中S=[L1,L3,L2,…,L5]
4.筛选标签
例如对图3的区域,已经获得了12个模型model1-12,将剩下的40%测试集数据输入给模型,将模型的输出位置序列与真实位置序列比较,统计正确率:
model1输入:[Avg of 30RSSI,~,…,~]
model1输出:S’=[L1……]
将真实序列S与模型输出的序列S’比较,观察各位置是否相同,如果不一致则该位置错误数+1,例如S(3)=L2,S’(3)=L3,则tag1也就是model1在位置L2出的错误数+1。所有测试集测试完毕后,比较model1-12对L1~L9的正确率。
如图4所示,左侧标签列填充的Tag为筛选后保留的标签,中间填充的数字为标签列及对应位置的最小错误数。选取最小错误数的标签。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。

Claims (10)

1.一种RFID无设备人体追踪系统的择优标签方法,其特征在于包括如下步骤:
S1,区域划分,将监控区域划分为N个位置;
S2,特征提取及计算,提取每个位置一段时间内采样的T个RSSI的均值和方差,并且将该段时间RSSI的分布与所在位置建立映射关系;
S3,构建深度学习模型,根据T的RSSI序列
Figure FDA0003264685060000011
解析相应的位置序列
Figure FDA0003264685060000012
即人体真实的移动轨迹,i表示第i个位置,包括如下步骤:
S31,采用神经网络对RSSI序列进行解析,给定单个输入RSSI序列和输出位置序列对(Xi,Yi),对数概率P(Xi,Yi)的计算方法为:
Figure FDA0003264685060000013
其中:
Figure FDA0003264685060000014
Y同理,表示长度为T的序列标记,
Figure FDA0003264685060000015
表示第i个训练向量中第t时刻的数据,t∈T表示神经网络第t时刻,即第t次采样,
Figure FDA0003264685060000016
表示第i个训练向量对应的标s记向量中第t个时刻的标记,
Figure FDA0003264685060000017
表示第i个训练向量对应的标s记向量中第1到T个时刻的标记;
S32,θ由带参数θ*的循环神经网络,通过隐层状态向量h进行计算,当前时刻的隐层状态向量
Figure FDA0003264685060000018
由上个时刻的
Figure FDA0003264685060000019
和输入
Figure FDA00032646850600000110
得到,计算式为
Figure FDA00032646850600000111
式中,
Figure FDA00032646850600000112
由循环神经网络计算式为:
Figure FDA00032646850600000113
式中,f(·)为tanh函数;
S33,
Figure FDA00032646850600000114
由当前时刻隐层状态向量
Figure FDA00032646850600000115
线性投影到分数向量实现,其输出经过线性层转换维度和归一化,输出所有位置的分数,最后选取分数最高的位置作为输出;
S4,标签布局方式选择,根据深度学习模型对于位置的分类正确率,择优选择标签。
2.根据权利要求1所述的一种RFID无设备人体追踪系统的择优标签方法,其特征在于所述S3中,将2个神经网络进行连接得到seq2seq模型,seq2seq模型由一个编码器和解码器构成将RSSI序列通过词嵌入扩展成多维的列向量,随后经过编码器输出统一的语义向量hT,即维度大小为h的隐层状态向量,随后将语义向量hT传给解码器,用于解码器获得更准确的位置序列S。
3.根据权利要求2所述的一种RFID无设备人体追踪系统的择优标签方法,其特征在于对解码器引入注意力机制,将ct向量与隐层向量ht拼接,然后通过全连接层恢复维度,为了得到ct向量,首先计算解码器中t时刻隐层状态ht对编码器中每个隐层状态
Figure FDA0003264685060000021
的权值at(s):
Figure FDA0003264685060000022
式中,
Figure FDA0003264685060000023
为t时刻解码器隐层状态向量的转置,s’表示编码器长度,
Figure FDA0003264685060000024
表示编码器隐层向量,exp(·)表示指数函数;
利用权值at(s)计算所有隐层状态加权和ct
Figure FDA0003264685060000025
然后将得到的ct与解码器中t时刻原始的隐层向量ht进行拼接为:
h′t=tanh(Wc·[ct;ht]) (6)
式中,Wc为全连接矩阵,目的是将拼接向量的维度降低;
然后将h′t乘以权重Who和偏置bho进行输出:
yt=softmax(Whoh'+bho) (7)
式中,softmax(·)为归一化函数。
4.根据权利要求3所述的一种RFID无设备人体追踪系统的择优标签方法,其特征在于所述神经网络,采用循环神经网络RNN,RNN网络中权值是共享的,即Who与bho相等。
5.根据权利要求2所述的一种RFID无设备人体追踪系统的择优标签方法,其特征在于使用多种训练方式,最后选择训练时间短,正确率高的训练方式,模型的编码器和解码器的2个部分被联合训练,训练目标是最大化对数似然函数,神经网络的训练任务是使用梯度下降法来寻找一组参数θ*,为模型的训练数据对
Figure FDA0003264685060000026
传给模型数据对中的输入数据xi,以最大化正确的序列yi的对数似然,条件似然函数为:
Figure FDA0003264685060000027
式中,θ表示网络中所有参数的集合;
训练模型所使用的损失函数如下:
Figure FDA0003264685060000028
式中,M为数据量,即采样数,损失值越小,模型预测与真实情况越接近。
6.根据权利要求2所述的一种RFID无设备人体追踪系统的择优标签方法,其特征在于训练时,模型的解码器会使用上一时刻的输出yt-1作为当前时刻t的输入,即yt-1→xt,在每个训练期间随机决定使用yt-1还是y’t-1,y表示真实确定的标记,而y’表示模型预测的标记,在不同的epoch使用不同的p,由p的概率选取yt-1,1-p的概率选取y’t-1
7.根据权利要求1所述的一种RFID无设备人体追踪系统的择优标签方法,其特征在于所述S1,中对监控区域进行了网格划分,监控的位置由集合L*={L0,L1,L2,…,LN}表示,其中L0表示当前的监控区域没有目标;所述S2,当发现监控区域内有目标出现时,RSSI的分布开始变化,采集RSSI,作为训练数据,根据监控区域内布局的标签所反射回的信号,得到1个RSSI矩阵,形状为N×T其中T为采样数,然后对RSSI进行了平均值和方差的特征抽取,在监控区域内的不同位置Li,Li∈L*,不断地采集RSSI信号。
8.根据权利要求1所述的一种RFID无设备人体追踪系统的择优标签方法,其特征在于所述S1中使用N个列表对象来存储RSSI,代表每个标签收集到的RSSI。
9.根据权利要求8所述的一种RFID无设备人体追踪系统的择优标签方法,其特征在于根据单位时间内,对监控区域内标签的平均采样数,当列表的长度超过预设值时,求列表这段长度对应的RSSI的平均值和方差。
10.根据权利要求1所述的一种RFID无设备人体追踪系统的择优标签方法,其特征在于所述S4中,在RFID信号覆盖的区域内,在区域外围的所有交点处放置标签,在监控区域内,每个标签自身都有解析RSSI信号的能力,并且对每个位置的解析能力各有不同,训练完成后观察每一个模型在测试数据集上的表现,对每个位置筛选一个正确率最高的模型,即标签,对每个位置都筛选完后,去掉未被选中的模型,即标签。
CN202111083051.1A 2021-09-15 2021-09-15 一种rfid无设备人体追踪系统的择优标签方法 Active CN113744318B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111083051.1A CN113744318B (zh) 2021-09-15 2021-09-15 一种rfid无设备人体追踪系统的择优标签方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111083051.1A CN113744318B (zh) 2021-09-15 2021-09-15 一种rfid无设备人体追踪系统的择优标签方法

Publications (2)

Publication Number Publication Date
CN113744318A true CN113744318A (zh) 2021-12-03
CN113744318B CN113744318B (zh) 2024-03-05

Family

ID=78739215

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111083051.1A Active CN113744318B (zh) 2021-09-15 2021-09-15 一种rfid无设备人体追踪系统的择优标签方法

Country Status (1)

Country Link
CN (1) CN113744318B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115238717A (zh) * 2022-08-16 2022-10-25 中国建筑一局(集团)有限公司 一种区域人口走向计算系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110442707A (zh) * 2019-06-21 2019-11-12 电子科技大学 一种基于seq2seq的多标签文本分类方法
CN112434159A (zh) * 2020-11-17 2021-03-02 东南大学 一种利用深度神经网络进行论文多标签分类的方法
US10963792B1 (en) * 2020-03-26 2021-03-30 StradVision, Inc. Method for training deep learning network based on artificial intelligence and learning device using the same

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110442707A (zh) * 2019-06-21 2019-11-12 电子科技大学 一种基于seq2seq的多标签文本分类方法
US10963792B1 (en) * 2020-03-26 2021-03-30 StradVision, Inc. Method for training deep learning network based on artificial intelligence and learning device using the same
CN112434159A (zh) * 2020-11-17 2021-03-02 东南大学 一种利用深度神经网络进行论文多标签分类的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115238717A (zh) * 2022-08-16 2022-10-25 中国建筑一局(集团)有限公司 一种区域人口走向计算系统及方法
CN115238717B (zh) * 2022-08-16 2023-07-04 中国建筑一局(集团)有限公司 一种区域人口走向计算系统及方法

Also Published As

Publication number Publication date
CN113744318B (zh) 2024-03-05

Similar Documents

Publication Publication Date Title
Zhang et al. Deep neural networks for wireless localization in indoor and outdoor environments
Luo et al. Temporal convolutional networks for multiperson activity recognition using a 2-d lidar
Yang Activity recognition: linking low-level sensors to high-level intelligence.
CN114449452B (zh) 一种基于CNN-RNN的Wi-Fi室内定位方法
CN102804208A (zh) 为视觉搜索应用自动挖掘名人的个人模型
CN110880369A (zh) 基于径向基函数神经网络的气体标志物检测方法及应用
CN111726765A (zh) 一种面向大规模复杂场景的wifi室内定位方法及系统
CN113744318B (zh) 一种rfid无设备人体追踪系统的择优标签方法
CN111191475A (zh) 一种基于uhf rfid的被动式行为识别方法
CN113923589B (zh) 一种非接触式多目标定位方法
CN103076595A (zh) 一种多元离散雷达辐射源信号的异常类型识别方法
CN113899948B (zh) 一种电磁频谱目标特征数据快速提取系统及方法
CN116910526A (zh) 模型训练方法、装置、通信设备及可读存储介质
CN115153476A (zh) 基于多维数据的睡眠评估方法、装置、电子设备及介质
CN114998731A (zh) 智能终端导航场景感知识别的方法
CN113780573A (zh) 一种抗噪的高精度测距方法及装置
Zhang et al. RFlow-ID: Unobtrusive workflow recognition with COTS RFID
EP3328112A1 (en) Determining coverage efficiency of an access point in a wireless network
Sansano Sansano Machine learning-based techniques for indoor localization and human activity recognition through wearable devices
CN115493592B (zh) 基于多目标进化算法的室内定位方法及系统
CN117709732B (zh) 结合气象监测数据的农业灾害报告生成方法及系统
Xueying Human activity recognition based on random forest
Hartvigsen et al. Finding Short Signals in Long Irregular Time Series with Continuous-Time Attention Policy Networks
Luo et al. Bluetooth indoor positioning combination algorithm based on fingerprint matching technology
Zhou et al. A shop-level location algorithm based on CNN for crowdsourcing fingerprint

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant