CN114896101A - 存在数据错误和缺失的无线传感器网络收集数据重建方法 - Google Patents

存在数据错误和缺失的无线传感器网络收集数据重建方法 Download PDF

Info

Publication number
CN114896101A
CN114896101A CN202210500635.2A CN202210500635A CN114896101A CN 114896101 A CN114896101 A CN 114896101A CN 202210500635 A CN202210500635 A CN 202210500635A CN 114896101 A CN114896101 A CN 114896101A
Authority
CN
China
Prior art keywords
data
matrix
collected
error
reconstructing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210500635.2A
Other languages
English (en)
Inventor
陈正宇
胡国兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinling Institute of Technology
Original Assignee
Jinling Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinling Institute of Technology filed Critical Jinling Institute of Technology
Priority to CN202210500635.2A priority Critical patent/CN114896101A/zh
Publication of CN114896101A publication Critical patent/CN114896101A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1471Saving, restoring, recovering or retrying involving logging of persistent data for recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1443Transmit or communication errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/30Services specially adapted for particular environments, situations or purposes
    • H04W4/38Services specially adapted for particular environments, situations or purposes for collecting sensor information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W84/00Network topologies
    • H04W84/18Self-organising networks, e.g. ad-hoc networks or sensor networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Arrangements For Transmission Of Measured Signals (AREA)

Abstract

一种存在数据错误和缺失的无线传感器网络收集数据重建方法,根据监测区域内传感器节点收集的环境数据,构建采样矩阵;利用采样矩阵重建环境数据矩阵,将环境数据的重建问题建模为基于弹性网正则化的结构化噪声矩阵补全模型;利用交替迭代优化方法,并设计基于算子分裂技术的数据恢复算法求解基于弹性网正则化的结构化噪声矩阵补全模型,进而重建环境数据矩阵。本发明基于环境数据矩阵的低秩特性,将不完整数据的重建问题建模为一类弹性网正则化的结构化噪声矩阵补全模型,同时设计了基于算子分裂技术的数据恢复算法,实现对缺失数据有效恢复,能准确判断收集到错误数据的传感器节点。本发明的性能优于现有算法,能以较高的精度重建环境数据。

Description

存在数据错误和缺失的无线传感器网络收集数据重建方法
技术领域
本发明属于数据恢复领域,具体涉及一种存在数据错误和缺失的无线传感器网络收集数据重建方法。
背景技术
无线传感器网络在环境监测、生物行为监测、智能交通系统、基础设施保护和军事监控等领域都有着巨大的应用价值。数据收集是将传感器采集到的数据收集到基站的过程,它在无线传感器网络众多应用中占据非常重要的地位。在气象、海洋、森林、土壤成分、农作物生长和生物习性监测与研究中,通常需要利用无线传感器网络收集的感知数据重建物理世界模型,并以此作为科学研究的依据。相关研究和决策的准确性很大程度上依赖于重构模型的精确程度。
由于传感器节点和链路固有特性以及无线传感器网络所处的特殊环境,数据收集过程中通常会出现数据丢失和数据错误。造成数据丢失和错误的原因众多,例如,无线信道的不稳定、信道间相互干扰、网络拥塞、节点损坏或意外失效等因素都会造成数据丢失;另外为了节省能量而采用的duty-cycle技术也是造成数据丢失的重要原因。而数据采集过程中受到量化、信道错误、节点故障、接收器或基站错误、节点部署区域的不确定性、外界干扰等系列因素的影响,部分传感器节点采集到的数据有可能与实际环境数据产生明显偏差,造成这部分传感器节点采集的数据发生错误。收集过程中的数据丢失和数据错误给准确重建物理世界带来了巨大的挑战。因此,需要设计有效的途径能从存在错误数据元素的不完整数据集中恢复缺失的数据,以便重建物理世界。
目前,对于无线传感器网络中缺失数据的恢复问题,已有很多重构算法被提出。传统算法通常利用收集数据的时空相关性来恢复数据,例如各类插值算法等。这类算法能够应对特定应用场景下的数据恢复问题,并在数据丢失率较低的情况下效果较好。但当数据丢失率较高时,数据恢复性能则急剧下降。现有的算法往往仅考虑缺失数据的恢复问题,对于无线传感器网络收集数据的错误问题,数据错误对缺失数据恢复精度的影响,以及数据缺失对于错误数据检测性能的影响,均没有考虑。
发明内容
本发明针对现有技术中的不足,提供一种存在数据错误和缺失的无线传感器网络收集数据重建方法。
为实现上述目的,本发明采用以下技术方案:
存在数据错误和缺失的无线传感器网络收集数据重建方法,其特征在于,包括:
步骤1:根据监测区域内传感器节点收集的环境数据,构建采样矩阵;
步骤2:利用采样矩阵重建环境数据矩阵,将环境数据的重建问题建模为基于弹性网正则化的结构化噪声矩阵补全模型;
步骤3:利用交替迭代优化方法,并设计基于算子分裂技术的数据恢复算法求解基于弹性网正则化的结构化噪声矩阵补全模型,进而重建环境数据矩阵。
为优化上述技术方案,采取的具体措施还包括:
进一步地,所述步骤1中,构建采样矩阵的过程具体如下:
监测区域内部署有N个传感器节点υ1,υ2,..,υN,采用周期性的数据收集方法,每一个时隙内每个传感器节点将其在该时隙感知的环境数据发送至Sink节点;监测时间包含T个时隙,环境数据的总数据量为N×T;将感知的原始环境数据用矩阵表示,得到原始环境数据矩阵:
X=(X(i,j))N×T (1)
其中,X(i,j),i=1,2,…N,j=1,2,...T表示第i个传感器节点在第j个时隙感知的环境数据;
将Sink节点实际收集到的数据矩阵称为采样矩阵R,采样矩阵为包含错误数据的不完整矩阵,采样矩阵中的元素R(i,j)为收集到的原始环境数据、收集到的错误数据和缺失元素三种情况之一,R(i,j)表示为:
Figure BDA0003634310470000021
其中,ΩO为收集到的原始环境数据下标索引集,ΩE为错误数据元素的下标索引集,ΩM表示缺失元素的下标索引集,E(i,j)为收集到的错误数据,将错误数据表示为原始环境数据叠加上噪声值:
E(i,j)=X(i,j)+Z(i,j) (3)
其中,Z(i,j)为噪声值;
令Ω为采样矩阵R中非空元素的下标索引集且
Figure BDA0003634310470000022
定义PΩ(·)为正交投影算子,表示当(i,j)∈Ω时,[PΩ(R)]i,j为X(i,j)或E(i,j),否则当
Figure BDA0003634310470000023
时,[PΩ(R)]i,j=0;因此,将采样矩阵表示为:
PΩ(R)=PΩ(X+Z)(4)
其中,Z=(Z(i,j))N×T为噪声矩阵;在噪声矩阵Z中,如果节点υi在时隙j收集到错误数据,则Z(i,j)≠0,否则Z(i,j)=0。
进一步地,所述步骤2中,基于弹性网正则化的结构化噪声矩阵补全模型如下:
Figure BDA0003634310470000031
其中,R为Sink节点收集到的采样矩阵,X为待优化的目标矩阵,Z为结构化噪声矩阵,||Z||2,1为L2,1范数正则化项,λ是用来平衡行结构化噪声和矩阵低秩程度的可调参数,||X||F表示矩阵X的Frobenius范数,||X||*表示矩阵X的核范数,
Figure BDA0003634310470000032
与||X||*一起构成弹性网正则化约束,τ为弹性网正则化约束的可调参数。
进一步地,所述步骤3中,求解基于弹性网正则化的结构化噪声矩阵补全模型的过程具体如下:
首先将式(5)松弛为如下罚函数形式:
Figure BDA0003634310470000033
其中,μ为罚函数的可调参数;
令:
Figure BDA0003634310470000034
将式(6)按照如下形式求解:
Figure BDA0003634310470000035
其中,X*,Z*分别为X,Z的最优解;
采用交替迭代法对其进行求解,将优化问题转换为迭代求解如下两个子问题:
子问题1:
Figure BDA0003634310470000036
子问题2:
Figure BDA0003634310470000037
其中,Xk+1和Zk+1为迭代序列,上标k表示迭代次数。
进一步地,所述子问题1的求解方式如下:
将式(7)代入子问题1后,得:
Figure BDA0003634310470000041
令F1(X)=μ||X||*
Figure BDA0003634310470000042
子问题1存在唯一解,依据PFBS定理,通过迭代序列收敛到该唯一解,即:
Figure BDA0003634310470000043
其中,prox表示近邻算子,δX表示迭代步长;
令Uk=XkXμτXkXPΩ(R-Xk-Zk),根据定理对任意τ,μ>0,
Figure BDA0003634310470000044
Figure BDA0003634310470000045
得:
Figure BDA0003634310470000046
按如下方法估算参数δX的值:
Figure BDA0003634310470000047
其中,X1,X2表示X的两个任意取值;
令Lipschitz常数
Figure BDA0003634310470000048
根据PFBS定理,δX
Figure BDA0003634310470000049
中取值,取
Figure BDA00036343104700000410
为此,子问题1按下式迭代求解:
Figure BDA00036343104700000411
进一步地,所述子问题2的求解方式如下:
将式(7)代入子问题2后,得:
Figure BDA0003634310470000051
依据PFBS定理,得:
Figure BDA0003634310470000052
依如下方法估算δZ的值:
Figure BDA0003634310470000053
令Lipschitz常数LZ=1,根据PFBS定理,δZ
Figure BDA0003634310470000054
中取值,取δZ=1;
式(17)中令Wk=ZkZPΩ(R-Xk+1-Zk),则:
Figure BDA0003634310470000055
根据定理对任意τ,μ>0,
Figure BDA0003634310470000056
函数
Figure BDA0003634310470000057
存在全局最小点X*:(X*)(i)=max{||W(i)||2-τ/μ,0}·W(i)/||W(i)||2,i=1,2,…,n1,||·||2表示向量L2范数,得:
(Zk+1)(i)=max{||(Wk)(i)||2-μλδZ,0}(Wk)(i)/||(Wk)(i)||2,i=1,2,...,N (19)
其中,(Zk+1)(i)表示矩阵Zk+1的第i行;
因此,子问题2的迭代求解方法如下式:
Figure BDA0003634310470000058
本发明的有益效果是:
(1)将存在数据错误和缺失的无线传感器网络收集数据重建问题建模为一类基于弹性网正则化的结构化噪声矩阵补全模型,该模型不仅利用环境数据矩阵固有的近似低秩特性来恢复缺失数据,而且通过采用矩阵L2,1范数建模错误数据来识别收集到错误数据的传感器节点,模型还引入弹性网正则化项以期能更好地逼近目标矩阵的低秩性和增强目标矩阵解的稳定性;
(2)基于交替迭代优化方法,引入算子分裂技术设计一种有效的数据恢复算法迭代求解该模型;
(3)真实数据集上的实验结果表明,该方法不仅能以较高的精度重建环境数据,而且能精确地辨识出收集到错误数据的传感器节点,并以恢复的数据行替代收集到错误数据的传感器节点所采集的数据,从而进一步提升数据重建精度。
附图说明
图1a-1c是恢复数据矩阵的直观对比图;图1a表示原始数据矩阵,图1b表示联合矩阵补全和稀疏限定的数据恢复方法(DRMCSC:Data Recovery method with joint MatrixCompletion and Sparsity Constraints)恢复的数据矩阵,图1c表示本发明所采用的基于算子分裂技术的数据恢复算法(DRvOST:Data Recovery Algorithm via OperatorSplitting Technique)恢复的数据矩阵。
图2a-2b是不同数据丢失率下的缺失元素恢复误差示意图;图2a表示数据丢失率10%到80%,图2b表示数据丢失率80%到95%。
图3是不同传感器节点错误率下的缺失元素恢复误差示意图。
图4是DRvOST算法对收集到错误数据传感器节点识别性能示意图。
图5是不同传感器节点错误率下的含错数据行整体恢复误差示意图。
具体实施方式
现在结合附图对本发明作进一步详细的说明。
本发明提出了一种存在数据错误和缺失的无线传感器网络收集数据重建方法,在本实施例中,首先对该方法所涉及的基本定义和相关定理进行说明,然后从系统模型、问题描述和算法设计这三个方面对方法进行进一步阐述,最后通过仿真实验来验证本发明的有效性。
一、数学预备知识
1.1基本定义
假设矩阵
Figure BDA0003634310470000061
的奇异值分解为X=U∑VT,∑=diag({σi|1≤i≤min(n1,n2)}),其中,σi为矩阵X第i大的奇异值,则:
(1)矩阵X的Frobenius范数定义为:
Figure BDA0003634310470000062
(2)矩阵X的核范数定义为:
Figure BDA0003634310470000063
(3)矩阵X的L2,1范数定义为:
Figure BDA0003634310470000064
其中,X(i)表示矩阵X的第i行;
(4)矩阵X的奇异值阈值算子定义为:Dτ(X)=USτ(∑)VT,其中Sτ(∑)=diag({max(0,σi-τ)|i=1,2,...min(n1,n2)})。
1.2相关定理
定理1对任意τ,μ>0,
Figure BDA0003634310470000071
Figure BDA0003634310470000072
证明详见文献“CAI JF,CANDES EJ,SHEN Z.A singular value thresholdingalgorithm for matrix completion[J].SIAM Journal of Optimization,2010,20(4):1956-1982.”。
定理2近邻前向后向分裂(PFBS,proximal forward backward splitting),假设F1(X),F2(X)是
Figure BDA0003634310470000073
上两个下半连续凸函数,F2(X)可微且对某个常数β>0具有β-Lipschitz连续梯度,即
Figure BDA0003634310470000074
F1和F2满足条件:
Figure BDA0003634310470000075
且F1(X)+F2(X)是严格凸的,则凸优化问题
Figure BDA0003634310470000076
存在唯一解,且对任意初始值X0以及0<δ<2/β,迭代序列
Figure BDA0003634310470000077
收敛到该凸优化问题的唯一解。
证明详见文献“COMBETTES P L and WAJS V R.Signal recovery by proximalforward-backward splitting[J].Multiscale Modeling and Simulation,2005,4(4):1168-1200.”。
定理3对任意τ,μ>0,
Figure BDA0003634310470000078
函数
Figure BDA0003634310470000079
存在全局最小点X*:(X*)(i)=max{||W(i)||2-τ/μ,0}·W(i)/||w(i)||2,i=1,2,…,n1,||·||2表示向量L2范数。
证明详见文献“陈蕾,杨庚,陈正宇,等.基于结构化噪声矩阵补全的Web服务QoS预测[J].通信学报,2015,36(6):49-59.”。
二、系统模型与问题描述
2.1系统模型
针对无线传感器网络数据收集应用场景,将大量传感器节点部署于监测区域,如室内、田野、森林和海洋等,在不同场景中感知并收集环境数据到Sink节点。这些环境数据所构成的数据集能反映网络所处环境的物理特征,并能应用到科学研究中。假设监测区域内部署有N个传感器节点υ1,υ2,...,υN,每个节点配备一个或多个环境数据传感器,用于感知不同类型的环境数据,如温度、湿度等。采用周期性的数据收集方法。将每一轮数据收集时间间隔称为一个时隙。一个时隙内每个传感器节点将其在该时隙感知的环境数据通过无线传感器网络发送至Sink节点。假设监测时间包含T个时隙,则对于某一类环境数据,总的数据量应为N×T。这些感知的原始环境数据可以用矩阵表示,也称为原始环境数据矩阵,可表示为:
X=(X(i,j))N×T (1)
其中,X(i,j),i=1,2,...N,j=1,2,...T表示第i个传感器节点,在第j个时隙感知的某一类环境数据。
将Sink节点实际收集到的数据矩阵称为采样矩阵,用R表示。由于数据缺失和错误问题的存在,采样矩阵为一个包含错误数据的不完整矩阵。采样矩阵中的元素R(i,j)可能有三种情况,即收集到的原始环境数据、收集到的错误数据和缺失元素。R(i,j)可以表示为:
Figure BDA0003634310470000081
其中,ΩO为收集到的原始环境数据下标索引集,ΩE为错误数据元素的下标索引集,ΩM表示缺失元素的下标索引集,E(i,j)为收集到的错误数据。可以将该错误数据表示为原始环境数据叠加上噪声值,即:
E(i,j)=X(i,j)+Z(i,j) (3)
其中,Z(i,j)为噪声值。
假设Ω为采样矩阵R中非空元素的下标索引集且
Figure BDA0003634310470000082
[T]={1,…,T})。显然,Ω=ΩO∪ΩE,表示当(i,j)∈Ω时,R(i,j)为非空采样元素。定义PΩ(·)为正交投影算子,表示当(i,j)∈Ω时,[PΩ(R)]i,j为X(i,j)或E(i,j);否则,当
Figure BDA0003634310470000083
时,[PΩ(R)]i,j=0。为此,可将采样矩阵表示为:
PΩ(R)=PΩ(X+Z) (4)
其中,Z=(Z(i,j))N×T为噪声矩阵。在噪声矩阵Z中,如果节点υi在时隙j收集到错误数据,则Z(i,j)≠0,否则Z(i,j)=0。在实际应用中,网络中的某些传感器节点容易收集到错误数据。这些节点在采样矩阵中所对应的数据行中会含有错误元素,也就是噪声矩阵Z的某些行含有非零元素,其余的行为全零元素。因此,矩阵Z也被称为行形式的结构化噪声矩阵。
2.2问题描述
数据恢复就是利用Sink节点收集到的采样矩阵R来重建环境数据矩阵X。利用环境数据矩阵的近似低秩特性,将环境数据重建问题建模为一类弹性网正则化的结构化噪声矩阵补全模型。引入弹性网正则化项,对目标函数施加相应的弹性网正则化约束,一方面能组合目标矩阵X中的高度相关变量,有利于克服数据强相关所导致的解不稳定性;另一方面由于弹性网正则化项中的Frobenius范数等同于其奇异值向量的L2范数,因此有利于目标矩阵奇异值收缩,从而更好地逼近原始矩阵的真实秩。另外,为了有效地平滑行结构化噪声,并尽可能降低其对数据恢复所带来的不利影响,进一步引入行结构化噪声矩阵的L2,1范数正则化项到标准矩阵补全问题中,从而将含有错误数据元素条件下的无线传感器网络缺失数据恢复问题建模为基于弹性网正则化的结构化噪声矩阵补全模型,即:
Figure BDA0003634310470000091
其中,R为Sink节点收集到的采样矩阵,X为待优化的目标矩阵,Z为结构化噪声矩阵,||Z||2,1为L2,1范数正则化项,λ是用来平衡行结构化噪声和矩阵低秩程度的可调参数,
Figure BDA0003634310470000092
与||X||*一起构成弹性网正则化约束,τ为弹性网正则化约束的可调参数。
三、算法设计
本发明利用交替迭代优化方法,并设计基于算子分裂技术的数据恢复算法求解上述基于弹性网正则化的结构化噪声矩阵补全模型。首先,将式(5)松弛为如下罚函数形式:
Figure BDA0003634310470000093
其中,μ为罚函数的可调参数。
为便于描述,不妨令:
Figure BDA0003634310470000094
则问题(6)可按如下形式求解:
Figure BDA0003634310470000095
其中,带*的变量表示该优化问题的最优解,X*,Z*为X,Z的最优解。
由于上述问题不存在解析解,因此可以采用交替迭代法对其进行求解。从而将上述优化问题转换为迭代求解如下2个子问题:
子问题(1):
Figure BDA0003634310470000096
子问题(2):
Figure BDA0003634310470000097
其中,上标k代表迭代次数。
下面将详细阐述上述2个子问题的求解方案。
I.子问题(1)求解
Figure BDA0003634310470000101
将式(7)代入子问题(1)后,得:
Figure BDA0003634310470000102
令F1(X)=μ||X||*
Figure BDA0003634310470000103
易知函数F1(X)和F2(X)满足定理2中的基本条件,因此子问题(1)存在唯一解,依据PFBS定理,可以通过迭代序列收敛到该唯一解,即
Figure BDA0003634310470000104
其中,prox表示近邻算子,δX表示迭代步长
令Uk=XkXμτXkXPΩ(R-Xk-Zk),根据定理1可得
Figure BDA0003634310470000105
进一步,可按如下方法估算参数δX的值:
Figure BDA0003634310470000106
其中,X1,X2表示X的两个任意取值。
可令Lipschitz常数
Figure BDA0003634310470000107
根据定理2,δX一般在
Figure BDA0003634310470000108
中取值,本实施例δX
Figure BDA0003634310470000109
为此,子问题(1)可按下式迭代求解:
Figure BDA00036343104700001010
II.子问题(2)求解
Figure BDA0003634310470000111
参照子问题(1)的分析方法,可得:
Figure BDA0003634310470000112
依据定理2,同理可知
Figure BDA0003634310470000113
类似地,可依如下方法估算δZ的值:
Figure BDA0003634310470000114
可令Lipschitz常数LZ=1,δZ一般在
Figure BDA0003634310470000115
中取值,即δZ在(0,2)中取值。本实施例取δZ的值为1。
式(17)中令Wk=ZkZPΩ(R-Xk+1-Zk),则
Figure BDA0003634310470000116
根据定理3可得
(Zk+1)(i)=max{||(Wk)(i)||2-μλδZ,0}(Wk)(i)/||(Wk)(i)||2,i=1,2,…,N (19)
其中,(Zk+1)(i)表示矩阵Zk+1的第i行。因此,子问题(2)的迭代求解方法如下式(20):
Figure BDA0003634310470000117
将求解子问题(1)和子问题(2)的步骤归纳起来,可以整理得到基于弹性网正则化的结构化噪声矩阵补全模型的迭代求解算法,即基于算子分裂技术的数据恢复算法(DRvOST),详细步骤如算法1所示。
算法1基于算子分裂技术的数据恢复算法(DRvOST)
输入:采样矩阵PΩ(R),参数μ,λ,τ,最大迭代次数Max
输出:恢复的数据矩阵Xopt,恢复的结构化噪声矩阵Zopt
1)初始化X0=0,Z0=0,
Figure BDA0003634310470000121
δZ=1;
2)FOR k=0 TO Max
3)Uk=XkXμτXkXPΩ(R-Xk-Zk);
4)
Figure BDA0003634310470000122
5)Wk=ZkZPΩ(R-Xk+1-Zk);
6)FOR i=1 TO N
7)(Zk+1)(i)=max{||(Wk)(i)||2-μλδZ,0}(Wk)(i)/||(Wk)(i)||2
8)END FOR
9)END FOR
10)RETURN Xopt,Zopt.
利用恢复的Xopt和Zopt可以重建环境数据矩阵。首先可以通过分析恢复的噪声矩阵Zopt来识别收集到错误数据的传感器节点。在Zopt中,含有非零元素的行所对应的传感器节点为收集到错误数据的传感器节点;所有元素为0的行所对应的传感器节点为正常传感器节点。在识别出收集到错误数据的传感器节点后,既可以重建环境矩阵。首先将采样矩阵中缺失的数据元素用恢复数据矩阵Xopt中对应位置的元素来填充,从而实现对缺失数据的恢复;其次将重建环境矩阵中含错误数据的行用Xopt中所对应的行替代,从而实现对错误数据行的纠正,以提升数据重建精度。
四,仿真实验
4.1实验条件
采用Intel室内项目的真实数据进行算法验证。Intel室内项目在室内部署54个传感器节点,每隔31秒测量一次环境参数,包括温度、湿度、光强和电压等。本实施例采用温度数据作为实验数据,收集52个传感器节点在连续300个时隙中采集的数据作为原始环境数据XN×T,其中,N=52,T=300。温度值的范围为[15.8195,27.7836]。设n为采样矩阵中缺失的数据元素数量,则pn=n/N×T为数据丢失率。未丢失数据的比例为ps=1-pn,也称为数据采样率。m表示收集到错误数据的传感器节点数,将收集到错误数据的传感器节点占所有传感器节点的比例称为传感器节点错误率,记pm=m/N。
本实施例利用原始环境数据XN×T合成得到用于实验的采样矩阵RN×T。具体过程为:首先根据数据采样率ps,随机产生采样元素的下标索引集合Ω。依据Ω从环境数据矩阵XN×T中采样元素,得到合成数据矩阵RN×T,满足:
Figure BDA0003634310470000131
再依据设置的传感器节点错误率pm,确定收集到错误数据的传感器节点数
Figure BDA0003634310470000135
,从RN×T中随机选取m行,并将这m行中50%的非零元素叠加随机噪声Zij,即
Figure BDA0003634310470000132
其中,ΩE为错误数据元素的下标索引集合,Z(i,j)是均值为0,方差为δ2的正态分布随机变量,即Z(i,j)~N(0,δ2)。本实施例设置δ2=4。通过上述过程,最终得到合成的采样矩阵RN×T。利用RN×T进行实验仿真,并将实验结果与原始环境数据XN×T对比,以验证算法性能。仿真过程中,参数λ和τ的值依据所处理问题的先验知识,采用交叉验证的方法进设置。同时,为了加快算法的收敛速度,本发明不固定参数μ的取值,而是设置参数μ的初值为采样矩阵的L2范数,然后让其以0.2的速率连续迭代到0.01。
4.2性能参数的定义
为了衡量算法性能,本实施例给出一些性能参数的定义。
(1)缺失元素恢复误差εmiss,表示恢复缺失环境数据的精确程度。其可以表示为:
Figure BDA0003634310470000133
其中,Xopt为通过DRvOST算法恢复的数据矩阵,ΩM表示缺失数据元素下标索引集。
(2)收集到错误数据传感器节点识别率rnode,用来衡量算法识别错误数据行的能力。引入信息检索领域常用的评价指标F1-measure来定义rnode,即
Figure BDA0003634310470000134
其中,precision=m_true/m_all,recal1=m_true/m,式中,m_all表示依据算法判断出的收集到错误数据的传感器节点数,m_true表示算法正确识别出的收集到错误数据的传感器节点数,m为实际的收集到错误数据的传感器节点数目。
(3)含错数据行整体恢复误差εerror,表示将重建环境矩阵中含错误数据的行用恢复数据矩阵Xopt中所对应的行替代,所产生的恢复误差。该参数反映对错误数据行的恢复精度。可以表示为:
Figure BDA0003634310470000141
其中,Θ表示含有错误数据的行的集合。
4.3仿真结果和分析
本实施例将DRvOST算法与空时压缩数据收集方法(STCDG:Spatial TemporalCompressive Data Gathering)和DRMCSC进行对比分析。首先从直观上展示DRvOST算法相比于其他算法的优越性。图1a-1c给出了传感器节点错误率pm=15%,数据丢失率pn=50%的情况下,数据恢复性能对比。分别展示了3个数据矩阵的三维图,图1a为原始环境矩阵,图1b为DRMCSC算法恢复的数据矩阵,图1c为DRvOST算法恢复的数据矩阵。从直观上可以看出,DRvOST算法恢复的数据矩阵最接近于原始数据矩阵,对缺失数据进行恢复的同时,能纠正错误数据元素。由于错误数据的存在严重影响了DRMCSC算法的恢复性能,其恢复矩阵受到错误数据的影响比较严重。
图2a-2b给出了在相同传感器节点错误率、不同数据丢失率的情况下,三种算法的恢复性能。设置传感器节点错误率pm=20%。数据丢失率pn被设定在10%到95%之间。为了便于观察,将性能对比通过两张图片显示。图2a设置数据丢失率从10%到80%,以10%递增。图2b设置数据丢失率从80%到95%,以5%递增。如图所示,所有算法对缺失元素的恢复误差随着数据丢失率的增加而增加,但DRvOST算法对缺失元素的恢复误差明显低于其它算法。在数据丢失率比较低的情况下,缺失元素恢复误差都比较小;在数据丢失率为90%时,DRvOST算法的恢复误差只为另外两个算法的一半;当数据丢失率超过90%时,恢复误差则急剧增加。另外,在数据丢失率比较高的时候,DRvOST算法相比于其它算法有着更明显的优势。
图3给出相同数据丢失率,不同传感器节点错误率的情况下,算法的性能对比。设置数据丢失率pn=50%,传感器节点错误率从5%到50%,每次递增5%。随着采集到错误数据的传感器节点数量的增加,所有算法对缺失元素的恢复误差也随之增加,这反映了错误数据对数据恢复性能的负面影响。然而,DRvOST算法始终优于其它算法,并且当传感器节点错误率增加时,DRvOST算法的优势更加明显。
由于算法STCDG和DRMCSC只具有恢复缺失数据的功能,而不能辨别含有错误数据的传感器节点,本发明主要分析DRvOST算法的识别性能。图4展示了在不同数据丢失率和传感器节点错误率条件下,对错误节点的识别性能。图4中,分别设置了三种不同的数据丢失率,传感器节点错误率从10%递增到90%。当传感器节点错误率比较低的情况下,DRvOST算法能100%识别收集到错误数据的传感器节点。即使当传感器节点错误率达到60%时,识别率依然接近100%。随着传感器节点错误率的继续增加,识别率略有下降。另外,在相同的传感器节点错误率情况下,随着数据丢失率增加,识别性能略有下降。然而,即使数据丢失率达到60%且传感器节点错误率也达到60%,识别率仍接近95%。这些都说明,DRvOST具有较强的错误传感器节点识别能力。在识别出收集到错误数据的传感器节点后,可将重建环境矩阵中含错误数据的行用恢复的数据矩阵xopt中所对应的行替代,以纠正错误数据行,从而提升数据重建质量。含错数据行整体恢复误差性能对比如图5所示,由于STCDG和DRMCSC算法不具有错误节点的识别能力,对应的恢复误差大,而本发明算法的性能明显优于其他算法。这一性能在图1c恢复数据矩阵的直观观察中也有了明确地体现。
综上所述,针对无线传感器网络数据收集过程中普遍存在的数据丢失和数据错误等问题,本发明提出一种收集数据重建方法。该方法利用环境数据矩阵低秩特性,将收集数据重建问题建模为基于弹性网正则化的结构化噪声矩阵补全模型,并设计基于算子分裂技术的数据恢复算法。相比于在先的研究,本发明引入弹性网正则化项,对目标函数施加相应的弹性网正则化约束,一方面能组合目标矩阵中的高度相关变量,有利于克服数据强相关所导致的解不稳定性;另一方面由于弹性网正则化项中的Frobenius范数等同于其奇异值向量的L2范数,因此有利于目标矩阵奇异值收缩,从而更好地逼近原始矩阵的真实秩。实验结果表明,该方法可以显著提高缺失数据元素的恢复精度,还能准确识别收集到错误数据的传感器节点,再将收集到错误数据的传感器节点所收集的数据用恢复数据矩阵中对应的数据来替代,从而能进一步提升数据重建精度。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

Claims (7)

1.存在数据错误和缺失的无线传感器网络收集数据重建方法,其特征在于,包括:
步骤1:根据监测区域内传感器节点收集的环境数据,构建采样矩阵;
步骤2:利用采样矩阵重建环境数据矩阵,将环境数据的重建问题建模为基于弹性网正则化的结构化噪声矩阵补全模型;
步骤3:利用交替迭代优化方法,并设计基于算子分裂技术的数据恢复算法求解基于弹性网正则化的结构化噪声矩阵补全模型,进而重建环境数据矩阵。
2.如权利要求1所述的存在数据错误和缺失的无线传感器网络收集数据重建方法,其特征在于:所述步骤1中,构建采样矩阵的过程具体如下:
监测区域内部署有N个传感器节点υ1,υ2,...,υN,采用周期性的数据收集方法,每一个时隙内每个传感器节点将其在该时隙感知的环境数据发送至Sink节点;监测时间包含T个时隙,环境数据的总数据量为N×T;将感知的原始环境数据用矩阵表示,得到原始环境数据矩阵:
X=(X(i,j))N×T (1)
其中,X(i,j),i=1,2,...N,j=1,2,...T表示第i个传感器节点在第j个时隙感知的环境数据;
将Sink节点实际收集到的数据矩阵称为采样矩阵R,采样矩阵为包含错误数据的不完整矩阵,采样矩阵中的元素R(i,j)为收集到的原始环境数据、收集到的错误数据和缺失元素三种情况之一,R(i,j)表示为:
Figure FDA0003634310460000011
其中,ΩO为收集到的原始环境数据下标索引集,ΩE为错误数据元素的下标索引集,ΩM表示缺失元素的下标索引集,E(i,j)为收集到的错误数据,将错误数据表示为原始环境数据叠加上噪声值:
E(i,j)=X(i,j)+Z(i,j) (3)
其中,Z(i,j)为噪声值;
令Ω为采样矩阵R中非空元素的下标索引集且
Figure FDA0003634310460000012
[N]={1,…,N},[T]={1,…,T};定义PΩ(·)为正交投影算子,表示当(i,j)∈Ω时,[PΩ(R)]i,j为X(i,j)或E(i,j),否则当
Figure FDA0003634310460000013
时,[PΩ(R)]i,j=0;因此,将采样矩阵表示为:
PΩ(R)=PΩ(X+Z) (4)
其中,Z=(Z(i,j))N×T为噪声矩阵;在噪声矩阵Z中,如果节点υi在时隙j收集到错误数据,则Z(i,j)≠0,否则Z(i,j)=0。
3.如权利要求2所述的存在数据错误和缺失的无线传感器网络收集数据重建方法,其特征在于:所述步骤2中,基于弹性网正则化的结构化噪声矩阵补全模型如下:
Figure FDA0003634310460000021
其中,R为Sink节点收集到的采样矩阵,X为待优化的目标矩阵,Z为结构化噪声矩阵,||Z||2,1为L2,1范数正则化项,λ是用来平衡行结构化噪声和矩阵低秩程度的可调参数,||X||F表示矩阵X的Frobenius范数,||X||*表示矩阵X的核范数,
Figure FDA0003634310460000022
与||X||*一起构成弹性网正则化约束,τ为弹性网正则化约束的可调参数。
4.如权利要求3所述的存在数据错误和缺失的无线传感器网络收集数据重建方法,其特征在于:所述步骤3中,求解基于弹性网正则化的结构化噪声矩阵补全模型的过程具体如下:
首先将式(5)松弛为如下罚函数形式:
Figure FDA0003634310460000023
其中,μ为罚函数的可调参数;
令:
Figure FDA0003634310460000024
将式(6)按照如下形式求解:
Figure FDA0003634310460000025
其中,X*,Z*分别为X,Z的最优解;
采用交替迭代法对其进行求解,将优化问题转换为迭代求解如下两个子问题:
子问题1:
Figure FDA0003634310460000026
子问题2:
Figure FDA0003634310460000027
其中,Xk+1和Zk+1为迭代序列,上标k表示迭代次数。
5.如权利要求4所述的存在数据错误和缺失的无线传感器网络收集数据重建方法,其特征在于:所述子问题1的求解方式如下:
将式(7)代入子问题1后,得:
Figure FDA0003634310460000031
令F1(X)=μ||X||*
Figure FDA0003634310460000032
子问题1存在唯一解,依据PFBS定理,通过迭代序列收敛到该唯一解,即:
Figure FDA0003634310460000033
其中,prox表示近邻算子,δX表示迭代步长;
令Uk=XkXμτXkXPΩ(R-Xk-Zk),根据定理对任意τ,μ>0,
Figure FDA0003634310460000034
Figure FDA0003634310460000035
得:
Figure FDA0003634310460000036
按如下方法估算参数δX的值:
Figure FDA0003634310460000037
其中,X1,X2表示X的两个任意取值;
令Lipschitz常数
Figure FDA0003634310460000038
根据PFBS定理,δX
Figure FDA0003634310460000039
中取值,取
Figure FDA00036343104600000310
为此,子问题1按下式迭代求解:
Figure FDA00036343104600000311
6.如权利要求4所述的存在数据错误和缺失的无线传感器网络收集数据重建方法,其特征在于:所述子问题2的求解方式如下:
将式(7)代入子问题2后,得:
Figure FDA0003634310460000041
依据PFBS定理,得:
Figure FDA0003634310460000042
依如下方法估算δZ的值:
Figure FDA0003634310460000043
令Lipschitz常数LZ=1,根据PFBS定理,δZ
Figure FDA0003634310460000044
中取值,取δZ=1;
式(17)中令Wk=ZkZPΩ(R-Xk+1-Zk),则:
Figure FDA0003634310460000045
根据定理对任意τ,μ>0,
Figure FDA0003634310460000046
函数
Figure FDA0003634310460000047
存在全局最小点X*:(X*)(i)=max{|W(i)||2-τ/μ,0}·W(i)/||W(i)||2,i=1,2,…,n1,||·||2表示向量L2范数,得:
(Zk+1)(i)=max{||(Wk)(i)||2-μλδZ,0}(Wk)(i)/||(Wk)(i)||2,i=1,2,...,N (19)
其中,(Zk+1)(i)表示矩阵Zk+1的第i行;
因此,子问题2的迭代求解方法如下式:
Figure FDA0003634310460000048
7.如权利要求4所述的存在数据错误和缺失的无线传感器网络收集数据重建方法,其特征在于:所述步骤3中,基于算子分裂技术的数据恢复算法求解得到恢复的环境数据矩阵Xopt和恢复的结构化噪声矩阵Zopt,利用Xopt和Zopt重建环境数据矩阵,具体如下:
首先通过分析Zopt来识别收集到错误数据的传感器节点,在识别出收集到错误数据的传感器节点后,将采样矩阵中缺失的数据元素用Xopt中对应位置的元素来填充,实现对缺失数据的恢复;然后将含错误数据的行用Xopt中所对应的行替代,实现对错误数据的纠正。
CN202210500635.2A 2022-05-09 2022-05-09 存在数据错误和缺失的无线传感器网络收集数据重建方法 Withdrawn CN114896101A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210500635.2A CN114896101A (zh) 2022-05-09 2022-05-09 存在数据错误和缺失的无线传感器网络收集数据重建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210500635.2A CN114896101A (zh) 2022-05-09 2022-05-09 存在数据错误和缺失的无线传感器网络收集数据重建方法

Publications (1)

Publication Number Publication Date
CN114896101A true CN114896101A (zh) 2022-08-12

Family

ID=82721229

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210500635.2A Withdrawn CN114896101A (zh) 2022-05-09 2022-05-09 存在数据错误和缺失的无线传感器网络收集数据重建方法

Country Status (1)

Country Link
CN (1) CN114896101A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115314133A (zh) * 2022-10-11 2022-11-08 中国人民解放军战略支援部队航天工程大学 一种基于矩阵补全的路径损耗数据增强方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115314133A (zh) * 2022-10-11 2022-11-08 中国人民解放军战略支援部队航天工程大学 一种基于矩阵补全的路径损耗数据增强方法及系统
CN115314133B (zh) * 2022-10-11 2023-01-31 中国人民解放军战略支援部队航天工程大学 一种基于矩阵补全的路径损耗数据增强方法及系统

Similar Documents

Publication Publication Date Title
Rahmani et al. High dimensional low rank plus sparse matrix decomposition
Frigui et al. A robust algorithm for automatic extraction of an unknown number of clusters from noisy data
Zhou et al. Accurate traffic matrix completion based on multi-Gaussian models
CN109684314B (zh) 一种基于空间结构的无线传感器网络缺失值估计方法
CN107786959A (zh) 在无线传感器网络中基于自适应测量的压缩数据收集方法
CN112788699B (zh) 一种飞行自组织网网络拓扑确定方法及系统
US20220291326A1 (en) A system and method for event recognition
JP2020119505A (ja) マルチカメラシステム内のダブルエンベディング構成を利用して、道路利用者イベントを検出するために用いられるセグメンテーション性能向上のための学習方法及び学習装置、そしてこれを利用したテスティング方法及びテスティング装置。{learning method and learning device for improving segmentation performance to be used for detecting road user events using double embedding configuration in multi−camera system and testing method and testing device using the same}
CN111881840B (zh) 一种基于图网络的多目标跟踪方法
CN114896101A (zh) 存在数据错误和缺失的无线传感器网络收集数据重建方法
Sirat et al. Application of artificial neural networks to fracture analysis at the Äspö HRL, Sweden: fracture sets classification
CN105740212A (zh) 一种基于正则化向量自回归模型的传感器异常检测方法
Jain et al. PCI-MDR: Missing data recovery in wireless sensor networks using partial canonical identity matrix
Jung et al. Scalable graph signal recovery for big data over networks
Murtagh et al. Decision boundaries using Bayes factors: the case of cloud masks
Chen et al. Data reconstruction in wireless sensor networks from incomplete and erroneous observations
Le Borgne et al. Unsupervised and supervised compression with principal component analysis in wireless sensor networks
CN108834043B (zh) 基于先验知识的压缩感知多目标无源定位方法
CN115982573B (zh) 多功能送料机及其控制方法
Shivakumar et al. Classification of landsat 8 imagery using Kohonen’s self organizing maps and learning vector quantization
Miani et al. Laplacian autoencoders for learning stochastic representations
Zérah et al. Physics-guided interpretable probabilistic representation learning for high resolution image time series
CN113361392B (zh) 无监督的基于相机和无线定位的多模态行人重识别方法
CN107070459B (zh) 一种分布式过程监控信源低计算复杂度高可靠编解码方法
CN115908419A (zh) 一种利用贝叶斯网络优化伪标签的无监督高光谱图像变化检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20220812

WW01 Invention patent application withdrawn after publication