基于D2D通信技术的移动群智感知可靠数据收集方法
技术领域
本发明属于数据处理技术领域,涉及基于D2D通信技术的移动群智感知可靠数据收集方法。
背景技术
移动群智感知应用,利用了人和移动终端设备的力量进行数据收集、信息整理和知识发现,最近被广泛应用于解决传统传感网络所不能做到的传感问题,例如我们能利用移动群智感知在城市任意地方通过参与者拍照方式来监控城市交通堵塞、城市安全等信息。移动群智感知结合众包思想成为一种新的数据获取模式,移动群智感知通过感知个体的信息而挖掘群体信息,从而反作用于个体或者群体,感知通过个体与携带的移动终端设备实现,挖掘通过后台移动群智感知服务器实现。
然而,随着移动终端设备嵌入越来越多传感器例如视觉移动群智感知场景的提出,所产生传感数据变得越来越大且复杂,如此大规模数据传输给参与各方带来了挑战。首先,参与者通过蜂窝网上传传感数据的成本与之上升;其次,位于大流量区域的基站负担也与之增加;最后,接受传感数据的服务器也需要加强数据处理性能。由于移动群智感知应用需要足够多的参与者来获取传感数据并加以分析,高成本花销会打击参与者积极性从而影响移动群智感知应用准确性。
现有移动群智感知系统中,云端服务器发布任务,参加任务的参与者产生相应传感数据并上传至服务器,服务器从所有上传传感数据中选择可靠的传感数据进行分析。然而,对不满足任务所需的传感数据进行上传和筛选将浪费通信和计算资源,因此如何收集可靠传感数据成为移动群智感知领域急需解决的问题之一,然而过去的研究集中于通过激励更多参与者和选择可靠参与者来提高传感数据质量,而不是直接考虑传感数据可靠性,这并不能解决移动群智感知成本花销问题且选出的参与者仍可能产生不可靠传感数据。
5G网络的到来提供了更好的无线系统,终端直通(D2D)通信技术是5G网络中最重要的技术之一,D2D通信技术是指通信网络中近邻设备之间直接交换信息的技术,通过D2D通信技术,基站内的移动终端设备可以不通过基站直接相连,从而充分利用网络频谱效能、降低基站负担。边缘计算是在网络边缘执行计算的一种计算模型,将计算任务在接近数据源的计算资源上运行。在D2D通信技术和边缘计算的启发下,本发明在移动终端设备端以D2D方式处理传感数据。
针对本领域现存不足,研发一种低成本的可靠数据收集算法具有较大的研究意义和实用价值。
发明内容
本发明所要解决的技术问题是克服现有移动群智感知系统中对不可靠数据的收集及其带来的无效成本花销问题,提供了一种基于D2D通信技术的移动群智感知可靠数据收集方法。
本发明针对上述技术问题提出的技术方案如下:
基于D2D通讯技术的可靠数据传输流程具体步骤如下:
步骤一:移动群智感知系统有一系列任务T={t1,t2,...,tN},服务器通过基站发布任务tn及其所需传感数据的要求。
步骤二:位于相应基站下的参与者们Wn={w1,w2,...,wM},参与任务tn并生成任务所需传感数据,并以D2D方式将传感数据传输给附近其他参与者,参与者对收到的传感数据进行可靠性验证,并将验证信息上传至服务器。
步骤三:服务器根据验证信息执行数据可靠性验证,计算获得各传感数据可靠率并将可靠率大于可信阈值的传感数据判定为可靠。
步骤四:将被服务器选出的可靠数据上传至服务器执行移动群智感知任务tn。
数据可靠性验证算法具体步骤如下:
3.1:初始化未知参数θ为0到1任意值,可靠数据集H为空集。
3.2:θ(t)收敛前循环执行,对数据j从j=1循环至j=J分别计算P(zj=1|QCj,θ(t))
E步求出第t次迭代Q函数即Q(θ|θ(t))
第t次迭代传感数据Cj可靠的概率为:
3.3:θ
(t)收敛前循环执行,对参与者i从i=1循至到i=I分别计算
δ
(t+1)
M步在第t次迭代时用对未知参数求导方法求Q函数极大化,并完成一次迭代θ(t)→θ(t+1),得到结果为:
3.4:重复3.2、3.3步直至θ(t)收敛,对数据j判断是否P(zj=1|QCj,θ(t))大于可信阈值,可靠性大于可信阈值的数据加入可靠数据集H。
本发明具有如下优点:
相比其他移动群智感知系统获取可靠数据的方法,本发明既考虑参与者可靠性也利用参与者以D2D模式在终端验证数据可靠性,本发明即使在参与者可靠性较低情况下准确率依然有所保证。本发明在终端验证数据可靠性并只将可靠数据上传,能大量降低参与者上传成本、基站通信负担和服务器计算资源,更好的激励参与者参与移动群智感知任务。
附图说明
图1是本发明基于D2D的移动群智感知可靠数据传输流程场景图。
图2是本发明基于D2D的移动群智感知可靠数据传输流程时序图。
图3是本发明数据可靠性验证算法流程图。
图4是本发明数据可靠性验证算法与现存数据验证算法基于预测误差比较图。
图5是本发明数据可靠性验证算法与现存数据验证算法基于节约成本比较图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面将结合附图,对本发明的具体实施方式进行详细的描述。
请见图1,为本发明基于D2D的移动群智感知可靠数据传输流程场景图,移动群智感知系统由移动群智感知服务器和参与者组成,基站下的参与者以D2D模式直接通信。如图2中所示,本发明提供一种基于D2D的可靠数据传输流程,流程具体包括以下步骤:
步骤一:移动群智感知系统有一系列任务T={t1,t2,...,tN},服务器通过基站发布任务tn及其所需传感数据的要求。
步骤二:位于相应基站下的参与者们Wn={w1,w2,...,wM},参与任务tn并生成任务所需传感数据,并以D2D方式将传感数据传输给附近其他参与者,参与者对收到的传感数据进行可靠性验证,并将验证信息上传至服务器。
步骤三:服务器根据验证信息执行数据可靠性验证,计算获得各传感数据可靠率并将可靠率大于可信阈值的传感数据判定为可靠。
步骤四:将被服务器选出的可靠数据上传至服务器执行移动群智感知任务tn。
在详解本发明数据可靠性验证算法前,对问题进行以下描述:
设定移动群智感知任务中参与者人数为I,参与者集为Q={Q
1,Q
2,...,Q
I},参与者会产生J个传感数据且传感数据集为C={C
1,C
2,...,C
J},附近参与者利用D2D技术对传感数据C
j(1≤j≤J)进行验证,其中C
j=1表示传感数据可靠,服务器收到验证信息QC,QC表示为参与者对传感数据可靠性的验证声明,即为一个I行J列验证矩阵。由于服务器端只知道QC验证信息,问题即表示成已知QC情况下求所有传感数据可靠的概率,即
本发明中主要符号定义为:
z:隐变量向量,定义为[z1,z2,...,zJ]
zj:隐变量向量中第j个隐变量
θ:未知参数向量,定义为θ=[δ,α1,α2,...,α1,β1,β2,...,βI]
θ(t):迭代至第t轮θ值
δ:随机传感数据可靠的先验概率
αi:参与者Qi将可靠传感数据验证为可靠的概率,即αi=P(QiCj=1|Cj=1)
βi:参与者Qi将不可靠传感数据验证为可靠的概率,即βi=P(QiCj=1|Cj=0)
其中隐变量zj=1表示传感数据Cj可靠,zj=0表示传感数据Cj不可靠,P(zj=1)表示传感数据Cj可靠概率,P(zj=0)表示传感数据Cj不可靠概率,QiCj=1表示参与者Qi验证传感数据Cj可靠,QiCj=0表示参与者Qi验证传感数据Cj不可靠。
本发明利用最大期望化算法(EM)设计数据可靠性验证算法,EM算法是一种在数据不完整或似然函数涉及隐变量情况下寻找参数最大似然估计的通用算法,具体来说,EM算法估计隐变量值并把估计值视为真值去重新估计参数,EM算法是一种迭代算法且每次迭代有两步组成:E步,求期望;M步,求极大。给定QC验证信息,定义似然函数来估计未知参数,似然函数定义为:
进一步,用验证信息QC作为观测随机变量的数据、Z作为隐随机变量数据和用θ=[δ,α1,α2,...,αI,β1,β2,...,βI]作为预估计模型的参数,似然函数L(θ;QC,Z)定义为:
面对一个含有隐变量的概率模型,目标便是极大化观测数据QC关于参数θ的似然函数。
图3为本发明数据可靠性验证算法流程图,流程具体包括以下步骤:
步骤一:初始化未知参数θ为0到1任意值,可靠数据集H为空集。
随机选择0到1区间任意值作为未知参数θ初值即θ(0)值,算法开始可靠数据集设为空。
步骤二:θ(t)收敛前循环执行,对数据j从j=1循环至j=J分别计算P(zj=1|QCj,θ(t))
该步骤为EM算法E步骤,给定隐变量和观测数据的条件概率分布求出期望对数似然函数即Q函数,Q函数表示为Q(θ|θ(t)),其中第一个变元表示要进行极大化的参数,第二个变元表示参数第t轮迭代估计值。Q函数定义为:
E步骤利用上次迭代θ值计算隐变量向量Z,在第t次迭代P(Cj=1|θ(t),QC)表示为:
其中:
P(zj=0|QCj,θ(t))=1-P(zj=1|QCj,θ(t))
QCj为QC验证矩阵第j列,表示所有参与者对传感数据Cj的验证信息。
P(zj=1|QCj,θ(t))表示给定QCj和θ(t)传感数据Cj可靠的条件概率。
步骤三:θ
(t)收敛前循环执行,对参与者i从i=1循至到i=I分别计算
δ
(t+1)
该步骤为EM算法M步骤,求使Q函数极大化的θ并确定第t+1次迭代参数估计值θ(t+)
θ(t+1)=arg max Q(θ|θ(t))
用θ*表示每次迭代极大化Q函数的值,通过对未知参数求导获得θ*值
展开为:
解上述方程得到优解:
其中QJi表示参与者Qi验证传感数据可靠的验证集。
步骤四:重复步骤二、三直至θ(t)收敛,对数据j判断是否P(zj=1|QCj,θ(t))大于可信阈值,可靠性大于可信阈值的数据加入可靠数据集H。
可信阈值为一个概率,一般可以取大于0.5的数值。
图4为本发明数据可靠性验证算法与现存数据验证算法基于预测误差比较图。
在参与者人数变化的情况下,本发明算法与基于排名机制的投票算法和不进行可靠性验证的随机算法相比,传感数据验证误差均为最低。其中用假负率与假正率指标衡量验证误差,假负率表示将可靠数据验证成不可靠数据概率,假正率表示将不可靠数据验证成可靠数据概率。
图5为本发明数据可靠性验证算法与现存数据验证算法基于节约成本比较图。
在参与者人数变化的情况下,本发明算法与投票算法和随机算法相比,节约的成本均为最大。其中用有效节约率与有效上传率衡量节约的成本,有效节约率表示节约了多少不可靠数据上传所产生的花销,有效上传率表示有多少可靠数据被上传至服务器。