CN105142164A - 待估节点的数据填补方法和装置 - Google Patents

待估节点的数据填补方法和装置 Download PDF

Info

Publication number
CN105142164A
CN105142164A CN201510355716.8A CN201510355716A CN105142164A CN 105142164 A CN105142164 A CN 105142164A CN 201510355716 A CN201510355716 A CN 201510355716A CN 105142164 A CN105142164 A CN 105142164A
Authority
CN
China
Prior art keywords
data
estimated
node
moment
sample set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510355716.8A
Other languages
English (en)
Other versions
CN105142164B (zh
Inventor
高志鹏
程伟静
牛琨
邱雪松
杨杨
孟洛明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN201510355716.8A priority Critical patent/CN105142164B/zh
Publication of CN105142164A publication Critical patent/CN105142164A/zh
Application granted granted Critical
Publication of CN105142164B publication Critical patent/CN105142164B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W84/00Network topologies
    • H04W84/18Self-organising networks, e.g. ad-hoc networks or sensor networks

Abstract

本发明提供一种待估节点的数据填补方法和装置,该方法包括:通过选择与缺失数据时空相关性较高的数据集合作为基础数据样本集合,并根据该基础数据样本集合中的待估节点在当前待估时刻之前的所有时刻的数据变化规律,以及,与待估节点空间相关性较高的节点在当前待估时刻的数据变化规律,为缺失数据确定评估数据,并将该评估数据填补至数据集合中。通过本发明提供的待估节点的数据填补方法,可以对无线传感器网络的管理节点存储的数据集合中的缺失数据进行填补,使用户可以根据数据集合中的数据进行分析,并得到正确的分析结果。

Description

待估节点的数据填补方法和装置
技术领域
本发明涉及通信技术领域,尤其涉及一种待估节点的数据填补方法和装置。
背景技术
无线传感器网络是一种分布式传感网络,包括大量的传感器节点、汇聚节点和管理节点等,用于实时监测和采集监测区域内的监测对象的信息(简称:数据),处理后发送给用户进行分析。
通常,大量的传感器节点随机部署在监测区域内,通过自组织和多跳方式构成无线传感网络。每个传感器节点实时监测和采集所述监测区域内的数据,并以无线通信的方式将数据通过其他传感器节点逐跳地传输,直至传输至汇聚节点,最终由汇聚节点通过基站、互联网或卫星发送给管理节点,以使得管理节点侧的用户可以根据接收到的数据进行分析。
但是,无线传感器网络在采用上述方式将传感器节点采集的数据发送给用户时,由于每个传感器节点均通过其他传感器节点逐跳地传输所采集的数据,使得一个数据可能会被多个传感器节点传输,且由于传感器节点之间通过无线通信的方式进行传输,因此受监测区域的噪声和环境的干扰,以及传感器节点自身的计算能力、存储容量、通信能力、电量的影响,无线传感器网络在数据传输过程中经常会发生数据缺失的现象,导致用户无法根据接收的数据进行分析,或者导致用户根据接收的数据得到错误的分析结果。
发明内容
本发明提供一种待估节点的数据填补方法和装置,用以解决现有技术中无线传感器网络在数据传输过程中经常会发生数据缺失的现象,导致用户无法根据管理节点接收的数据进行分析,或者导致用户根据管理节点接收的数据得到错误的分析结果的技术问题。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,本发明提供一种待估节点的数据填补方法,所述方法适用于数据集合,所述数据集合中的数据所属的节点包括至少一个所述待估节点,所述待估节点为缺失数据的节点;所述待估节点上缺失数据的时刻为待估时刻,所述待估节点上的待估时刻为至少一个;所述方法包括:
步骤A:根据所述待估节点上当前待估时刻对应的第一数据序列与所述数据集合中所述当前待估时刻之前的第一时刻对应的第二数据序列之间的平均相关值,确定基础数据样本集合;所述第一数据序列包括所述数据集合中除所述待估节点之外的其他节点在所述当前待估时刻的数据,所述第二数据序列包括所述待估节点在所述第一时刻的数据和所述其他节点在所述第一时刻的数据;
步骤B:根据所述基础数据样本集合中在所述当前待估时刻之前的每一时刻的所述待估节点的数据变化率、在所述当前待估时刻之前的每一时刻的所述待估节点的权重、在所述当前待估时刻相邻的前一时刻的所述待估节点的数据、所述当前待估时刻和所述当前待估时刻相邻的前一时刻,确定所述待估节点在所述当前待估时刻的时间评估数据;
步骤C:根据所述基础数据样本集合中所述待估节点的第三数据序列与所述基础数据样本集合中的每个节点的第四数据序列的空间距离,和,预设的空间距离阈值,从所述基础数据样本集合中确定空间数据样本集合;所述空间数据样本集合中的每个样本数据所属的节点均为与所述第三数据序列的空间距离小于等于所述空间距离阈值的所述第四数据序列所在的节点;
步骤D:根据所述空间数据样本集合中的所述每个样本数据所属的节点的权重、所述每个样本数据所属的节点在所述当前待估时刻的数据变化率和所述待估节点在所述当前待估时刻相邻的前一时刻的数据,确定所述待估节点在所述当前待估时刻的空间评估数据;
步骤E:根据所述空间评估数据、所述时间评估数据和第一权重因子,确定所述待估节点在所述当前待估时刻的评估数据,并将所述评估数据填补至所述待估节点中;其中,所述第一权重因子为所述空间数据样本集合中所述每个样本数据所属的节点的权重之和。
第二方面,本发明提供一种待估节点的数据填补装置,所述装置包括:
基础数据样本集合确定模块,用于根据所述待估节点上当前待估时刻对应的第一数据序列与数据集合中所述当前待估时刻之前的第一时刻对应的第二数据序列之间的平均相关值,确定基础数据样本集合;所述第一数据序列包括所述数据集合中除所述待估节点之外的其他节点在所述当前待估时刻的数据,所述第二数据序列包括所述待估节点在所述第一时刻的数据和所述其他节点在所述第一时刻的数据;
时间评估数据确定模块,用于根据所述基础数据样本集合确定模块确定的所述基础数据样本集合中在所述当前待估时刻之前的每一时刻的所述待估节点的数据变化率、在所述当前待估时刻之前的每一时刻的所述待估节点的权重、在所述当前待估时刻相邻的前一时刻的所述待估节点的数据、所述当前待估时刻和所述当前待估时刻相邻的前一时刻,确定所述待估节点在所述当前待估时刻的时间评估数据;
空间评估数据确定模块,用于根据所述基础数据样本集合确定模块确定的所述基础数据样本集合中所述待估节点的第三数据序列与所述基础数据样本集合中的每个节点的第四数据序列的空间距离,和,预设的空间距离阈值,从所述基础数据样本集合中确定空间数据样本集合;所述空间数据样本集合中的每个样本数据所属的节点均为与所述第三数据序列的空间距离小于等于所述空间距离阈值的所述第四数据序列所在的节点;
所述空间评估数据确定模块,还用于根据所述空间数据样本集合中的所述每个样本数据所属的节点的权重、所述每个样本数据所属的节点在所述当前待估时刻的数据变化率和所述待估节点在所述当前待估时刻相邻的前一时刻的数据,确定所述待估节点在所述当前待估时刻的空间评估数据;
数据填补模块,用于根据所述空间评估数据确定模块确定的所述空间评估数据、所述时间评估数据确定模块确定的所述时间评估数据和第一权重因子,确定所述待估节点在所述当前待估时刻的评估数据,并将所述评估数据填补至所述待估节点中;其中,所述第一权重因子为所述空间数据样本集合中所述每个样本数据所属的节点的权重之和。
本发明提供的待估节点的数据填补方法和装置,通过选择与缺失数据时空相关性较高的数据集合作为基础数据样本集合,并根据该基础数据样本集合中的待估节点在当前待估时刻之前的所有时刻的数据变化规律,以及,与待估节点空间相关性较高的节点在当前待估时刻的数据变化规律,为缺失数据确定评估数据,并将该评估数据填补至数据集合中。通过本发明提供的待估节点的数据填补方法,可以对无线传感器网络的管理节点存储的数据集合中的缺失数据进行填补,使用户可以根据数据集合中的数据进行分析,并得到正确的分析结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的待估节点的数据填补方法实施例一的流程图;
图2为本发明提供的待估节点的数据填补方法实施例二的流程图;
图3为本发明提供的待估节点的数据填补方法实施例三的流程图;
图4为本发明提供的待估节点的数据填补装置实施例一的结构示意图;
图5为本发明提供的待估节点的数据填补装置实施例二的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
通常,无线传感器网络中的每个传感器节点均同时、且周期性的将采集的数据发送给汇聚节点,由汇聚节点统一发送给管理节点进行存储。其中,管理节点所存储的数据可以看作是一个数据集合,该数据集合包括每个传感器节点(简称:节点)上在所有时刻的数据。示例性的,假设无线传感器网络中包括5个节点,则管理节点存储的数据集合可以表示为如下矩阵(1):
S 1 t 1 S 2 t 1 S 3 t 1 S 4 t 1 S 5 t 1 S 1 t 2 S 2 t 2 S 3 t 2 S 4 t 2 S 5 t 2 S 1 t 3 S 2 t 3 S 3 t 3 S 4 t 3 S 5 t 3 · · · · · · · · · · · · · · · S 1 t n S 2 t n S 3 t n S 4 t n S 5 t n - - - ( 1 )
其中,上述数据集合中的每个数据均有所属的节点,每个数据均对应一个时刻。例如:所属的节点为传感器节点1,对应的时刻为t1时刻,即为节点1在t1时刻的数据。
上述数据集合中的每一行数据可以视为一个数据序列,该数据序列为某一时刻对应的数据序列,其中,每个时刻对应的数据序列均包括所有节点在该时刻的数据,例如:t1时刻对应的数据序列为: S 1 t 1 S 2 t 1 S 3 t 1 S 4 t 1 S 5 t 1 . 上述数据集合中的每一列数据也可以视为一个数据序列,该数据序列为某一节点的数据序列,其中,每个节点的数据序列包括该节点在所有时刻的数据,例如:节点3的数据序列为: S 3 t 1 S 3 t 2 S 3 t 3 ... S 3 t n . 也就是说,矩阵(1)中的每行为某一时刻对应的数据序列,矩阵(1)中的每列为某一节点的数据序列。
由于现有技术中在通过无线传感器逐跳传输数据的时候,受监测区域的噪声和环境的干扰,以及传感器节点自身的计算能力、存储容量、通信能力、电量的影响,无线传感器网络在数据传输过程中经常会发生数据缺失的现象,也就是说,上述管理节点中存储的数据集合中可能会有一个或多个数据缺失。这样,当用户使用管理节点中存储的数据集合进行分析时,由于数据集合中存在数据缺失,使得用户无法根据数据集合进行分析,或者导致用户根据数据集合进行分析时会得到错误的分析结果。
本发明提供的待估节点的数据填补方法和装置,旨在解决上述现有技术中由于无线传感器网络在数据传输过程中经常会发生数据缺失的现象,导致用户无法根据管理节点接收的数据进行分析,或者导致用户根据管理节点接收的数据得到错误的分析结果的技术问题。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1为本发明提供的待估节点的数据填补方法实施例一的流程图。该方法的执行主体可以为具有数据填补功能的通信设备,或者还可以为一具有数据填补功能的通信系统,该通信系统可以包括具有接收、判断、评估、填补等功能的各种硬件设备。该方法适用于数据集合,数据集合中的数据所属的节点包括至少一个待估节点,待估节点为缺失数据的节点;待估节点上缺失数据的时刻为待估时刻,待估节点上的待估时刻为至少一个。如图1所示,该方法可以包括如下步骤:
步骤S101:根据待估节点上当前待估时刻对应的第一数据序列与数据集合中当前待估时刻之前的第一时刻对应的第二数据序列之间的平均相关值,确定基础数据样本集合;第一数据序列包括数据集合中除待估节点之外的其他节点在当前待估时刻的数据,第二数据序列包括待估节点在第一时刻的数据和其他节点在第一时刻的数据。
具体的,本发明提供的待估节点的数据填补方法适用于有缺失数据的数据集合,该有缺失数据的数据集合可以为无线传感器网络中管理节点存储的数据集合。本申请将以无线传感器网络中管理节点存储的有缺失数据的数据集合(简称:数据集合)对本发明进行详细的介绍。
上述数据集合中的缺失数据所属的节点为待估节点,每个待估节点上缺失数据的时刻为每个待估节点的待估时刻。上述数据集合包括的数据为待估节点除待估时刻之外的其他时刻的数据,以及其他节点在所有时刻的数据。若待估节点的待估时刻为多个,则对该待估节点在某一待估时刻的缺失数据进行填补时,该待估时刻即为该待估节点的当前待估时刻。示例性的:假设无线传感器网络包括5个节点,其中,管理节点存储的数据集合为如下矩阵(2):
S 1 t 1 m i s sin g 1 S 3 t 1 S 4 t 1 S 5 t 1 S 1 t 2 S 2 t 2 S 3 t 2 S 4 t 2 S 5 t 2 S 1 t 3 S 2 t 3 m i s sin g 2 S 4 t 3 S 5 t 3 S 1 t 4 S 2 t 4 S 3 t 4 S 4 t 4 S 5 t 4 S 1 t 5 S 2 t 5 m i s sin g 3 S 4 t 5 S 5 t 5 - - - ( 2 )
如矩阵(2)所示,该数据集合中的缺失数据为missing1、missing2和missing3,missing1所属的节点为节点2,missing2和missing3所属的节点为节点3,则对于该数据集合,节点2和节点3均为待估节点,t1时刻为节点2的待估时刻,t3时刻和t5时刻为节点3的待估时刻。当对节点2在t1时刻的缺失数据进行填补时,t1时刻为节点2的当前待估时刻;当对节点3在t3时刻的缺失数据进行填补时,t3时刻为节点3的当前待估时刻;当对节点3在t5时刻的缺失数据进行填补时,t5时刻为节点3的当前待估时刻。
上述待估节点的当前待估时刻对应的第一数据序列,包括除待估节点之外的其他节点在当前待估时刻的数据。以数据集合为上述矩阵(2)为例,当对节点2的t1时刻的缺失数据进行填补时,t1时刻为节点2的当前待估时刻,则t1时刻对应的第一数据序列就为 S 1 t 1 m i s sin g 1 S 3 t 1 S 4 t 1 S 5 t 1 (即矩阵(2)中t1时刻对应的行)。
上述待估节点的当前待估时刻之前的每一时刻都可以称为第一时刻,也就是说,待估节点的当前待估时刻之前有多少个时刻,就有多少个第一时刻。每个第一时刻对应的第二数据序列包括待估节点在该第一时刻的数据和其他节点在该第一时刻的数据。示例性的,假定无线传感器网络中包括5个节点,待估节点为节点3,待估节点上的当前待估时刻为t5,管理节点存储的数据集合包括节点3在t1时刻至t4时刻的数据,以及其他4个节点上在t1时刻至t5时刻的数据,该数据集合具体可以为如下矩阵(3):
S 1 t 1 S 2 t 1 S 3 t 1 S 4 t 1 S 5 t 1 S 1 t 2 S 2 t 2 S 3 t 2 S 4 t 2 S 5 t 2 S 1 t 3 S 2 t 3 S 3 t 3 S 4 t 3 S 5 t 3 S 1 t 4 S 2 t 4 S 3 t 4 S 4 t 4 S 5 t 4 S 1 t 5 S 2 t 5 m i s sin g S 4 t 5 S 5 t 5 - - - ( 5 )
如矩阵(3)所示,待估节点的当前待估时刻t5对应的第一数据序列A5为: S 1 t 5 S 2 t 5 m i s sin g S 4 t 5 S 5 t 5 (即矩阵(3)中t5时刻对应的行),待估节点上当前待估时刻t5之前的时刻一共有4个,即第一时刻为4个,分别为:第一时刻t4、第一时刻t3、第一时刻t2和第一时刻t1,其中,每个第一时刻和每个第一时刻对应的第二数据序列具体可以如表1所示:
表1
在获取到数据集合中当前待估时刻之前的第一时刻对应的第二数据序列之后,就可以确定待估节点的当前待估时刻对应的第一数据序列与数据集合中当前待估时刻之前的第一时刻对应的第二数据序列之间的平均相关值,该平均相关值用于标识当前待估时刻对应的第一数据序列与一个或多个第一时刻对应的第二数据序列的相关性。其中,该一个或多个第一时刻为待估节点的当前待估时刻之前、且与当前待估时刻相邻的多个连续的时刻(具体可以参见下述的例子)。当相关性越大,说明第一时刻对应的数据序列中的数据所属的节点的空间位置与缺失数据所属的待估节点所在空间位置近似相同,所有节点在该段时刻的数据与待估节点的缺失数据相近,即时空相关性较高。为了使根据平均相关值确定的基础数据样本集合的数据与缺失数据的时空相关性较高,可以通过较大平均相关值确定基础数据样本集合。
上述平均相关值可以通过如下方式获得:首先,计算第一数据序列与每个第一时刻对应的第二数据序列之间的相关值。其中,第一数据序列与每个第一时刻对应的第二数据序列之间的相关值的计算方式,完全可以采用已知的计算两个数据序列之间的相关值的方式,本发明对此不再赘述。其次,根据第一数据序列与每个第一时刻对应的第二数据序列之间的相关值,分别计算“第一数据序列与当前待估时刻之前的且与当前待估时刻相邻的一个第一时刻对应的第二数据序列”之间的平均相关值、“第一数据序列与当前待估时刻之前的且与当前待估时刻相邻的两个第一时刻对应的第二数据序列”之间的平均相关值,以此类推,直至计算“第一数据序列与当前待估时刻之前的所有第一时刻对应的第二数据序列”之间的平均相关值。本发明对计算第一数据序列与第一时刻对应的第二数据序列之间的平均相关值的方式不进行限定,例如:该平均相关值可以为第一数据序列与第一时刻对应的第二数据序列之间的相关值之和的平均数,还可以为第一数据序列与第一时刻对应的第二数据序列之间的相关值之积的平均数,还可以采用现有技术中任一计算平均相关值的方式。
示例性的,以上述矩阵(3)所示的数据集合为例,参考表1所示的第一时刻,则待估节点的当前待估时刻对应的第一数据序列与数据集合中当前待估时刻之前的第一时刻对应的第二数据序列之间的平均相关值的获取过程,具体可以为:
首先,分别计算待估节点的当前待估时刻t5对应的第一数据序列A5与每个第一时刻对应的第二数据序列的相关值,具体如表2所示:
表2
其次,根据待估节点的当前待估时刻t5对应的第一数据序列A5与每个第一时刻对应的第二数据序列之间的相关值,确定待估节点的当前待估时刻t5对应的第一数据序列A5与数据集合中当前待估时刻之前的第一时刻对应的第二数据序列之间的平均相关值,以该平均相关值为第一数据序列与第一时刻对应的第二数据序列之间的相关值之和的平均数为例,则各平均相关值可以如表3所示:
表3
当根据上述方式获得“待估节点的当前待估时刻对应的第一数据序列与第一时刻对应的第二数据序列之间的平均相关值”,就可以通过“待估节点的当前待估时刻对应的第一数据序列与第一时刻对应的第二数据序列之间的平均相关值”中的较大平均相关值确定基础数据样本集合,例如,可以根据最大的平均相关值确定基础数据样本集合,还可以根据次大的平均相关值确定基础数据样本集合。具体实现时,可以根据用户的需求来选择合适的平均相关值。以最大平均相关值确定基础数据样本集合为例,确定该最大平均相关值对应的所有第一时刻,由确定的所有第一时刻对应的第二数据序列和第一数据序列组成基础数据样本集合。示例性的:假定上述表3中的R2为最大平均相关值,其中,R2对应的所有第一时刻为t3和t4,R2所对应的第二数据序列为A4和A3,则基础数据样本集合可以为如下矩阵(4):
S 1 t 3 S 2 t 3 S 3 t 3 S 4 t 3 S 5 t 3 S 1 t 4 S 2 t 4 S 3 t 4 S 4 t 4 S 5 t 4 S 1 t 5 S 2 t 5 m i s sin g S 4 t 5 S 5 t 5 - - - ( 4 )
由于上述基础数据样本集合为根据待估节点的当前待估时刻对应的第一数据序列与数据集合中当前待估时刻之前的第一时刻对应的第二数据序列之间的较大平均相关值确定,使得基础数据样本集合中的数据与待估节点在当前待估时刻的缺失数据的时空相关性较高,这样,在采用该基础数据样本集合中的数据对缺失数据进行填补时,可以确保对缺失数据评估的准确性。
步骤S102:根据基础数据样本集合中在当前待估时刻之前的每一时刻的待估节点的数据变化率、在当前待估时刻之前的每一时刻的待估节点的权重、在当前待估时刻相邻的前一时刻的待估节点的数据、当前待估时刻和当前待估时刻相邻的前一时刻,确定待估节点在当前待估时刻的时间评估数据。
具体的,上述基础数据样本集合中在当前待估时刻之前的每一时刻的待估节点的数据变化率,用于标识待估节点的当前时刻的数据所发生的变化,该变化可以为当前时刻的数据相对于当前时刻相邻的前一时刻的数据所发生的变化。具体实现时,可以根据上述确定的基础数据样本集合,获取基础数据样本集合中待估节点的数据序列,根据待估节点的数据序列中待估节点的当前待估时刻之前的任一个时刻的数据和该时刻相邻的前一时刻的数据,确定该时刻的待估节点的数据变化率。
上述当前待估时刻之前的每一时刻的待估节点的权重,用于标识待估节点在该时刻的数据对时间评估数据的重要程度。在待估节点的当前待估时刻之前的所有时刻中,越接近当前待估时刻的时刻,其上的数据与缺失数据的相似度越高,则可以将当前待估时刻之前的每一时刻的待估节点的权重设置为:与当前待估时刻相距越近的时刻的待估节点的权重越高,与当前待估时刻相距越远的时刻的待估节点的权重越低;也就是说,当前待估时刻相邻的前一时刻的待估节点的权重最高,当前待估时刻之前且与当前待估时刻相距最远的时刻的待估节点的权重最低。这样,在使用当前待估时刻之前的每一时刻的待估节点的权重来确定时间评估数据时,可以确保与缺失数据相似度高的数据在计算时间评估数据时的影响力最大,进而可以提高时间评估数据的准确性。具体实现时,该当前待估时刻之前的每一时刻的待估节点的权重可以根据用户的需求进行设定,也可以通过当前待估时刻之前的每个时刻和当前待估时刻之前的所有时刻的个数之和进行确定。
当确定当前待估时刻之前的每一时刻的待估节点的数据变化率和当前待估时刻之前的每一时刻的待估节点的权重之后,就可以根据当前待估时刻之前的每一时刻的待估节点的数据变化率、当前待估时刻之前的每一时刻的待估节点的权重、当前待估时刻相邻的前一时刻的待估节点的数据、当前待估时刻和当前待估时刻相邻的前一时刻,确定待估节点在当前待估时刻的时间评估数据。由于为待估节点在当前待估时刻之前的每一时刻赋予了数据变化率和权重,所以可以综合衡量待估节点在当前待估时刻之前的所有时刻的数据变化规律,以时间为维度,为缺失数据确定时间评估数据。
步骤S103:根据基础数据样本集合中待估节点的第三数据序列与基础数据样本集合中的每个节点的第四数据序列的空间距离,和,预设的空间距离阈值,从基础数据样本集合中确定空间数据样本集合;空间数据样本集合中的每个样本数据所属的节点均为与第三数据序列的空间距离小于等于空间距离阈值的第四数据序列所在的节点。
具体的,上述基础数据样本集合中待估节点的数据序列为第三数据序列。基础数据样本集合中每个节点的数据序列均为第四数据序列。也就是说,基础数据样本集合中有多少个“节点的数据序列”,就有多少个第四数据序列。需要说明的是,由于基础数据样本集合中也包括待估节点的数据序列,所以待估节点的数据序列也为第四数据序列。以基础样本数据集合为上述矩阵(4)为例,该数据集合中的缺失数据为missing,missing所属的节点为节点3,即节点3为待估节点。对于该数据集合,待估节点的第三数据序列为 S 3 t 3 S 3 t 4 m i s sin g , 基础数据样本集合中的每个节点的第四数据序列具体如表4所示:
表4
上述待估节点的第三数据序列与基础数据样本集合中的每个节点的第四数据序列的空间距离,用于标识第四数据序列所在的节点与待估节点的空间相关性。空间距离越小,说明空间相关性越大,即说明该节点与待估节点在空间上的位置相近,因而该节点在当前待估时刻的数据也就与待估节点在当前待估时刻缺失的数据越相似,反之亦然。因此,在获取到上述待估节点的第三数据序列与每个节点的第四数据序列的空间距离之后,就可以根据预设的空间距离阈值,确定与第三数据序列的空间距离小于等于空间距离阈值的第四数据序列,并由这些第四数据序列组成空间数据样本集合。即,空间数据样本集合中的每个样本数据所属的节点均为与第三数据序列的空间距离小于等于空间距离阈值的第四数据序列所在的节点。也就是说,空间数据样本集合中的所有数据所属的节点均与待估节点空间相关性较大。
其中,上述预设的空间距离阈值可以根据用户的需求设定。上述第三数据序列与第四数据序列的空间距离,可以通过第三数据序列与第四数据序列的数据相异度、同时丢失数据的频率、以及第三数据序列或第四数据序列的序列大小来确定。
步骤S104:根据空间数据样本集合中的每个样本数据所属的节点的权重、每个样本数据所属的节点在当前待估时刻的数据变化率和待估节点在当前待估时刻相邻的前一时刻的数据,确定待估节点在当前待估时刻的空间评估数据。
具体的,上述空间数据样本集合中的每个样本数据所属的节点的权重,用于标识每个节点在空间评估数据中占据的比重。其中,每个样本数据所属的节点的权重,可以通过该节点的数据序列与待估节点的数据序列的平均相关系数确定。该平均相关系数可以为本领域技术人员公知的系数。
上述每个样本数据所属的节点在当前待估时刻的数据变化率,用于标识每个节点在当前待估时刻的数据所发生的变化,该变化可以为当前待估时刻的数据相对于当前待估时刻相邻的前一时刻的数据所发生的变化。上述每个样本数据所属的节点在当前待估时刻的数据变化率,可以通过该节点在当前待估时刻的数据与当前待估时刻相邻的前一时刻的数据之差确定,还可以通过该节点在当前待估时刻的数据与当前待估时刻相邻的前一时刻的数据相除确定。
当确定空间数据样本集合中的每个样本数据所属的节点的权重、每个样本数据所属的节点在当前待估时刻的数据变化率之后,就可以根据空间数据样本集合中的每个样本数据所属的节点的权重、每个样本数据所属的节点在当前待估时刻的数据变化率和待估节点在当前待估时刻相邻的前一时刻的数据,确定待估节点在当前待估时刻的空间评估数据。由于空间数据样本集合中的所有数据所属的节点均与待估节点的空间相关性较大,所以在根据空间数据样本集合确定空间评估数据时,可以综合衡量与待估节点空间相关性较大的其他节点在当前待估时刻的数据变化规律,以空间为纬度,为缺失数据确定空间评估数据。
步骤S105:根据空间评估数据、时间评估数据和第一权重因子,确定待估节点在当前待估时刻的评估数据,并将评估数据填补至待估节点中;其中,第一权重因子为空间数据样本集合中每个样本数据所属的节点的权重之和。
具体的,当根据上述方式确定空间评估数据和时间评估数据之后,就可以根据空间评估数据、时间评估数据和第一权重因子,确定待估节点在当前待估时刻的评估数据。其中,时间评估数据和空间评估数据的权重之和为1。可选的,若时间评估数据的权重为第一权重因子时,则空间评估数据的权重为1与第一权重因子的差值。可选的,若空间评估数据的权重为第一权重因子时,则时间评估数据的权重为1与第一权重因子的差值。
当确定待估节点在当前待估时刻的评估数据后,就可以将评估数据填补至数据集合中待估节点在当前待估时刻的缺失数据所在位置。至此,就完成了对待估节点在当前待估时刻的缺失数据的填补。
本发明提供的待估节点的数据填补方法,通过选择与缺失数据时空相关性较高的数据集合作为基础数据样本集合,并根据该基础数据样本集合中的待估节点在当前待估时刻之前的所有时刻的数据变化规律,以及,与待估节点空间相关性较高的节点在当前待估时刻的数据变化规律,为缺失数据确定评估数据,并将该评估数据填补至数据集合中。通过本发明提供的待估节点的数据填补方法,可以对无线传感器网络的管理节点存储的数据集合中的缺失数据进行填补,使用户可以根据数据集合中的数据进行分析,并得到正确的分析结果。
进一步地,在上述图1所示实施例的基础上,本实施例涉及的是通信设备或通信系统在获取基础数据样本集合之后,根据待估节点的数据缺失率对待估节点在当前待估时刻的缺失数据进行填补的过程。图2为本发明提供的待估节点的数据填补方法实施例二的流程图,如图2所示,在步骤S101之后,该方法还可以包括如下步骤:
步骤S201:根据待估节点的第三数据序列,确定待估节点的数据缺失率。
具体的,上述待估节点的数据缺失率,用于标识待估节点的第三数据序列的数据缺失程度,即待估节点在当前待估时刻以及在当前待估时刻之前的所有时刻的缺失数据占数据序列中数据总数的比例。
步骤S202:若待估节点的数据缺失率大于等于第一阈值,则将当前待估时刻之前的任一待估时刻作为新的当前待估时刻,返回执行步骤S101至步骤S105,以对待估节点的新的当前待估时刻的数据进行填补,直至待估节点的数据缺失率小于第一阈值时,对待估节点的当前待估时刻的数据进行填补。
具体的,由于在确定时间评估数据时,需要综合衡量待估节点在当前待估时刻之前的所有时刻的数据变化规律,因此,为了提高时间评估数据的准确性,可以在待估节点的数据缺失率超过第一阈值时,先对待估节点在当前待估时刻之前的一个或多个待估时刻的缺失数据进行填补,直至待估节点的数据缺失率小于第一阈值后,再对待估节点上当前待估时刻的缺失数据的填补。其中,第一阈值可以为预先设置的一个阈值,具体实现时,可以根据用户的需求或者无线传感器网络的类型设置第一阈值。例如:可以将第一阈值设置为0.5。
示例性的,假定无线传感器网络中包括5个节点,待估节点为节点3,待估节点的待估时刻一共有3个,分别为t2时刻、t3时刻和t5时刻,其中,当前待估时刻为t5,第一阈值为0.5,根据最大平均相关值确定的基础数据样本集合为如下矩阵(5):
S 1 t 2 S 2 t 2 J w · s sin g 1 S 4 t 2 S 5 t 2 S 1 t 3 S 2 t 3 J w · sin g 2 S 4 t 3 S 5 t 3 S 1 t 4 S 2 t 4 S 3 t 4 S 4 t 4 S 5 t 4 S 1 t 5 S 2 t 5 n u · sin g 3 S 4 t 5 S 5 t 5 - - - ( 5 )
如矩阵(5)所示,节点3(待估节点)的第三数据序列为 m i s sin g 1 m i s sin g 2 S 3 t 4 m i s sin g 3 , 该第三数据序列中一共有3个缺失数据,则该待估节点的数据缺失率为3/4,即0.75。将确定的待估节点的数据缺失率与第一阈值相0.5比可知,该待估节点的数据缺失率大于第一阈值,则先停止对节点3的当前待估时刻t5的缺失数据的填补,将节点3的当前待估时刻t5之前的待估时刻t2和待估时刻t3分别作为新的当前待估时刻,并对节点3在新的当前待估时刻的缺失数据采用步骤S101-步骤S105进行填补,直至节点3的数据缺失率小于第一阈值后,再对节点3在当前待估时刻t5的缺失数据进行填补。
本发明提供的待估节点的数据填补方法,可以在待估节点的数据缺失率大于等于第一阈值时,先对待估节点在当前待估时刻之前的缺失数据进行填补,再对待估节点在当前待估时刻的缺失数据进行填补,使得在确定待估节点在当前待估时刻的评估数据时,可以综合衡量待估节点上在当前待估时刻之前的所有时刻的数据变化规律,进而使得在待估节点的数据缺失严重的情况下,仍然可以确保待估节点在当前待估时刻的评估数据的准确性。
图3为本发明提供的待估节点的数据填补方法实施例三的流程图。本实施例涉及的是通信设备在获取到有缺失数据的数据集合之后,对数据集合中的缺失数据进行填补的过程。其中,可以假设第一阈值为0.5、预设的空间距离阈值为0.2(需要说明的是,这里的第一阈值和预设的空间距离阈值的数值是一种举例)。则该方法可以包括如下步骤:
需要说明的是,为了便于对本实施例的理解,本实施例将以如下数据集合对每个步骤进行说明,该数据集合涉及的无线传感器网络包括5个节点,假定节点3为待估节点,待估节点的待估时刻为t5时刻,本实施例将以对点节点3在t5时刻的缺失数据进行填补来详细介绍数据集合中缺失数据的填补过程。其中,通信设备获取到的有缺失数据的数据集合为如下矩阵(6):
S 1 t 1 S 2 t 1 S 3 t 1 S 4 t 1 S 5 t 1 S 1 t 2 S 2 t 2 S 3 t 2 S 4 t 2 S 5 t 2 S 1 t 3 S 2 t 3 S 3 t 3 S 4 t 3 S 5 t 3 S 1 t 4 S 2 t 4 S 3 t 4 S 4 t 4 S 5 t 4 S 1 t 5 S 2 t 5 m i s sin g S 4 t 5 S 5 t 5 - - - ( 6 )
步骤S301:根据数据集合中缺失数据所属的节点,确定待估节点和待估节点的当前待估时刻。
示例性的,参考上述矩阵(6),该数据集合中的缺失数据为missing,missing所属的节点为节点3,则对于该数据集合,节点3为待估节点,t5时刻为节点3的待估时刻。在对节点3的t5时刻的缺失数据进行填补时,t5时刻为节点3的当前待估时刻。
步骤S302:确定待估节点上当前待估时刻对应的第一数据序列与数据集合中当前待估时刻之前的每个第一时刻对应的第二数据序列。
示例性的,如上述步骤S301所述,对于该数据集合,t5时刻为节点3的当前待估时刻,则继续参照矩阵(6),待估节点上当前待估时刻对应的第一数据序列C5为 S 1 t 5 S 2 t 5 m i s sin g S 4 t 5 S 5 t 5 , 即矩阵(6)中t5时刻对应的矩阵的行。
继续参照矩阵(6),在当前待估时刻t5之前,一共有4个时刻,即第一时刻为4个,分别为:第一时刻t4、第一时刻t3、第一时刻t2和第一时刻t1,其中,每个第一时刻和每个第一时刻对应的第二数据序列具体可以如表5所示:
表5
步骤S303:根据公式(1)确定第一数据序列与至少一个第二数据序列的平均相关值。
R = 1 n - k Σ a = n - 1 k R s s ( S t n , S t a ) 公式(1)
其中,1≤a≤n-1,a为大于等于1的正整数,n为大于1的正整数,tn为当前待估时刻,ta为第一时刻,为当前待估时刻tn对应的第一数据序列,为第一时刻ta对应的第二数据序列,的相关值,R为第一数据序列与至少一个第二数据序列之间的平均相关值。
具体的,上述公式1计算得到的平均相关值为至少一个,为了更好的说明上述平均相关值的计算过程,此处举一个简单的例子来说明:(上述为第一数据序列的标准化结果与第二数据序列的标准化结果之积)。
上述公式(1)中的可以为任一第一时刻ta对应的第二数据序列。在使用公式(1)时,通过将每个第一时刻ta对应的第二数据序列分别代入该公式中,就可以得到多个平均相关值,具体可以参见下述举例。
示例性的,继续参考上述矩阵(6)和表5,在该数据集合中,当前待估时刻为t5,当前待估时刻t5对应的第一数据序列为C5。在表5中,第一时刻ta为t4、t3、t2或t1,第一时刻ta对应的第二数据序列为C4、C3、C2或C1,则具体如表6所示:
表6
上述为第一数据序列与第一时刻对应的第二数据序列的相关值,根据该相关值就可以得到第一数据序列与每个第一时刻对应的第二数据序列的平均相关值,具体如表7所示:
表7
其中,R1指的是待估节点的当前待估时刻对应的第一数据序列C5与t4时刻对应的第二数据序列C4之间的平均相关值,R2指的是待估节点的当前待估时刻对应的第一数据序列C5与t3时刻对应的第二数据序列C3之间的平均相关值;R3指的是待估节点的当前待估时刻对应的第一数据序列C5与t2时刻对应的第二数据序列C2之间的平均相关值;R4指的是待估节点的当前待估时刻对应的第一数据序列C5与t1时刻对应的第二数据序列C1之间的平均相关值。由上述表7可以看出,若所计算的平均相关值所涉及的第一数据序列C5与第二数据序列之间不是连续的(例如C5与C2就不是连续的,但C5与C4是连续的;其中,因为C5对应的t5时刻与C4对应的t4时刻是连续的,所以C5与C4是连续的,但C5对应的t5时刻与C2对应的t2时刻是不连续的,所以C5与C2就不是连续的),则在计算该“第一数据序列”和“与第一数据序列不连续的第二数据序列”之间平均相关值时,需要将“第一数据序列”和“与第一数据序列不连续的第二数据序列”之间所间隔的所有第二数据序列与第一数据序列的相关值计算在内。
需要说明的是,在对第一数据序列和每个第二数据序列进行相关值计算之前时,可以预设一个阈值,并对第二数据序列的数据缺失率进行判断,若该第二数据序列的数据缺失率超过该阈值时,则忽略该第二数据序列,即不计算该第二数据序列与第一数据序列的相关值计算,且在计算第一数据序列与第二数据序列之间的平均相关值时,也不将该数据缺失率超过阈值的第二数据序列纳入计算的范围。
步骤S304:根据第一数据序列与至少一个第二数据序列的平均相关值,确定第一数据序列对应的最大平均相关值。
示例性的,继续参照步骤S303所述示例,在获取到表7所示的第一数据序列与至少一个第二数据序列的平均相关值之后,确定出最大平均相关值,该最大平均相关值对应的所有第一时刻对应的第二数据序列中的数据与缺失数据的时空相关性最强。
继续参照上述表7,在根据公式(1)计算平均相关值之后,一共获取到4个平均相关值,分别为R1、R2、R3和R4,其中,假定R3为R1、R2、R3和R4中的最大值,则第一数据序列C5对应的最大平均相关值即为R3。
步骤S305:根据最大平均相关值对应的a的取值范围,确定基础数据样本集合。
具体的,在确定最大平均相关值后,可以根据公式(1),确定最大平均相关值对应的a的取值范围,并根据a的取值范围所对应的第二数据序列,确定基础数据样本集合。其中,该基础数据样本集合包括:a的取值范围对应的第二数据序列和当前待估时刻对应的第一数据序列。
示例性的,根据步骤S304所述示例,第一数据序列C5对应的最大平均相关值为R3,则在上述表7中根据R3所在的行确定的R3对应的a的取值范为4、3和2,将a的取值范围中的所有a值分别代入中,就可以得到R3对应的第二数据序列,即C4、C3和C2,则根据最大平均相关值对应的a的取值范围,确定基础数据样本集合为如下矩阵(7):
S 1 t 2 S 2 t 2 S 3 t 2 S 4 t 2 S 5 t 2 S 1 t 3 S 2 t 3 S 3 t 3 S 4 t 3 S 5 t 3 S 1 t 4 S 2 t 4 S 3 t 4 S 4 t 4 S 5 t 4 S 1 t 5 S 2 t 5 m i s sin g S 4 t 5 S 5 t 5 - - - ( 7 )
步骤S306:根据基础数据样本集合中待估节点的第三数据序列,确定待估节点的数据缺失率。
示例性的,继续参考步骤S305中的矩阵(7),在该基础数据样本集合中,待估节点为节点3,待估节点的第三数据序列为节点3的第三数据序列S3,即 S 3 t 2 S 3 t 3 S 3 t 4 m i s sin g . 根据该第三数据序列S3可知,该第三数据序列S3一共有4个数据,其中有1个缺失数据,则该待估节点的数据缺失率为1/4,即0.25。
步骤S307:判断待估节点的数据缺失率是否大于等于第一阈值。
具体的,若判断待估节点的数据缺失率小于第一阈值,则说明该待估节点的数据缺失率较低,可以根据该待估节点的数据对待估节点在当前待估时刻的缺失数据进行填补,则执行步骤S308和步骤S312;若判断待估节点的数据缺失率大于等于第一阈值,则说明该待估节点的数据缺失率过高,无法根据该待估节点的数据对待估节点在当前待估时刻的缺失数据进行填补,需要先对待估节点在当前待估时刻之前的一个或多个待估时刻的缺失数据进行填补,即重新执行步骤S301,将待估节点在当前待估时刻之前的一个或多个待估时刻分别作为新的当前待估时刻,对待估节点在新的当前待估时刻的缺失数据进行填补,直至待估节点的数据缺失率小于第一阈值后,再对待估节点在当前待估时刻的缺失数据的填补。
示例性的,继续参照步骤S306所述示例,在该示例中,待估节点(节点3)的数据缺失率为0.25,即小于第一阈值,则说明该待估节点的数据缺失率较低,可以根据该待估节点的数据对待估节点在当前待估时刻的缺失数据进行填补,则执行步骤S308和步骤S312。
步骤S308:根据公式(2)确定基础数据样本集合中在当前待估时刻之前的第m时刻的待估节点的数据变化率
r ( Sj t m ) = Sj t m - Sj t m - 1 t m - t m - 1 公式(2)
其中,1<m<n,m为正整数,j为待估节点,tm为基础数据样本集合中在当前待估时刻之前的第m时刻,tm-1为基础数据样本集合中在当前待估时刻之前的第m-1时刻,为待估节点j在tm时刻的数据,为待估节点j在tm-1时刻的数据。
具体的,上述公式(2)用于计算基础数据样本集合中在当前待估时刻之前的每一时刻的待估节点的数据变化率。在本实施例中,上述在当前待估时刻之前的每一时刻的待估节点的数据变化率为当前时刻的数据相对于当前待估时刻相邻的前一时刻的数据所发生的变化。其中,公式(2)中的第m时刻可以为当前待估时刻之前的任一时刻。在使用公式(2)时,将当前待估时刻之前的每一个第m时刻分别代入公式(2)中,就可以得到待估节点在当前待估时刻之前的每个第m时刻的数据变化率。
示例性的,继续参考步骤S305中的矩阵(7),在该基础数据样本集合中,待估节点为节点3,待估节点的当前待估时刻为t5,则在当前待估时刻t5之前一共有3个时刻,为:t4、t3和t2,即tm分别为t4、t3和t2,则将每个tm、tm-1、节点3在tm时刻的数据和在tm-1时刻的数据代入公式(2)中就可以得到待估节点在当前待估时刻之前的每个第m时刻的数据变化率,具体可以如表8所示:
表8
需要说明的是,由于在本示例的基础数据样本集合中,t2时刻为基础数据样本集合中的数据对应的第一个时刻,所以在该基础数据样本集合中并不包括待估节点在t1时刻的数据,因此在计算待估节点在t2时刻的数据变化率时,可以在数据集合(即矩阵(6))中去获取待估节点在t1时刻的数据可选的,为了降低数据填补计算过程的复杂度,还可以选择不计算待估节点在t2时刻的数据变化率,默认该待估节点在t2时刻的数据变化率为0。
步骤S309:根据公式(3)确定在当前待估时刻之前的第m时刻的待估节点的权重
w ( Sj t m ) = m - b &Sigma; q = 1 n - 1 - b q 公式(3)
其中,b为m的最小值,q为大于等于1的正整数。
具体的,在上述公式(3)中,第m时刻可以为当前待估时刻之前的任一时刻。在使用公式(3)时,将当前待估时刻之前的每一个第m时刻和该第m时刻对应的m值代入公式(3)中,就可以得到待估节点在当前待估时刻之前的每个第m时刻的权重。
示例性的,继续参考步骤S305中的矩阵(7),在该基础数据样本集合中,待估节点为节点3,待估节点的当前待估时刻为t5,则在当前待估时刻之前一共有3个时刻:t4、t3和t2,即tm分别为t4、t3和t2,tm对应的m值为4,3和2,b为m的最小值,即b为2。n为当前待估时刻tn对应的n值,即n为5,则将每个tm、每个tm对应的m和n代入公式(3)中就可以得到待估节点在当前待估时刻之前的每个第m时刻的权重,具体可以如表9所示:
表9
步骤S310:根据公式(4)确定待估节点在当前待估时刻的时间评估数据V_Temple。
V _ T e m p l e = Sj t n - 1 + &lsqb; &Sigma; r ( Sj t m ) * w ( Sj t m ) &rsqb; * ( t n - t n - 1 ) 公式(4)
其中,tn-1为当前待估时刻tn相邻的前一时刻,为待估节点j在当前待估时刻相邻的前一时刻tn-1的数据。
具体的,上述公式(4)中,为通过公式(2)确定的待估节点在当前待估时刻之前的第m时刻的数据变化率,为通过公式(3)确定的待估节点在当前待估时刻之前的第m时刻的权重,为待估节点在当前待估时刻之前的第m时刻的数据变化率和权重之积,将当前待估时刻之前的每一个第m时刻代入中,就可以得到待估节点在当前待估时刻之前的所有第m时刻的数据变化率和权重之积。对待估节点在当前待估时刻之前的所有第m时刻的数据变化率和权重之积进行求和,就可以得到待估节点的加权变化率将获得的加权变化率待估节点j的当前待估时刻相邻的前一时刻tn-1、待估节点j的当前待估时刻tn、待估节点j在当前待估时刻相邻的前一时刻tn-1的数据代入公式(4)中,就可以得到待估节点在当前待估时刻的时间评估数据。
示例性的,继续参照上述表8,表9和矩阵(7),如矩阵(7)所示,在该基础数据样本集合中,待估节点为节点3,待估节点的当前待估时刻为t5,待估节点的当前待估时刻相邻的前一时刻为t4,则待估节点在当前待估时刻相邻的前一时刻的数据为节点3在t4时刻的数据将表8中的每个“当前待估时刻之前的第m时刻的待估节点的数据变化率”、表9中的每个“当前待估时刻之前的第m时刻的待估节点的权重”、t5、t4代入公式(4)中,就可以得出待估节点在当前待估时刻的时间评估数据V_Temple,该时间评估数据V_Temple具体为:
V _ T e m p l e = S 3 t 4 + &lsqb; r ( Sj t 2 ) * w ( Sj t 2 ) + r ( Sj t 3 ) * w ( Sj t 3 ) + r ( Sj t 4 ) * w ( Sj t 4 ) &rsqb; * ( t 5 - t 4 )
步骤S311:根据公式(5)确定待估节点的第三数据序列与每个节点的第四数据序列的数据相异度d_diff(Si,Sj)。
d_diff(Si,Sj)=|Si-Sj|公式(5)
其中,Si为基础数据样本集合中第i个节点的第四数据序列,Sj为基础数据样本集合中待估节点j的第三数据序列。
具体的,上述Si可以为基础数据样本集合中任一节点的第四数据序列。在使用公式(5)时,将基础数据样本集合中每一个节点的第四数据序列分别代入公式(5)中,就可以得到待估节点的第三数据序列与每个节点的第四数据序列的数据相异度d_diff(Si,Sj)。其中,所述待估节点的第三数据序列与每个节点的第四数据序列的数据相异度可以通过如下方式确定:对待估节点的第三数据序列中与某一节点的第四数据序列中相同时刻的数据求差,若同一时刻的数据相同,则差值为0,则不进行计数,若同一时刻的数据不同,则进行计数,最终的计数总和即为待估节点的第三数据序列与该节点的第四数据序列的数据相异度d_diff(Si,Sj)。
示例性的,继续参照上述矩阵(7),该基础数据样本集合中,矩阵一共有5列,每一列为某一节点的第四数据序列,则矩阵中有5个节点的第四数据序列,其中,i可以为节点1至节点5中的任一个,即Si为节点1对应的第四数据序列至节点5的第四数据序列的中的任一个,待估节点j为节点3,则节点j的第三数据序列Sj为S3,具体如表10所示:
表10
需要说明的是,在该基础数据样本集合中,由于待估节点为节点3,所以节点3的数据序列既为第三数据序列,也为第四数据序列。
根据上述表10中的“节点i的第四数据序列Si”和“待估节点j的第三数据序列Sj”,通过公式(5)就可以得到待估节点的第三数据序列与每个节点的第四数据序列的数据相异度,具体如表11所示:
表11
步骤S312:根据公式(6)确定待估节点的第三数据序列与每个节点的第四数据序列同时丢失数据的频率d_miss(Si,Sj)。
d_miss(Si,Sj)=|Si_miss∩Sj_miss|公式(6)
其中,Si_miss为基础数据样本集合中的第i个节点丢失数据的时刻,Sj_miss为所述待估节点j丢失数据的时刻。
具体的,上述Si可以为基础数据样本集合中任一节点的第四数据序列。在使用公式(6)时,将基础数据样本集合中每一个节点的第四数据序列分别代入公式(6)中,就可以得到待估节点的第三数据序列与每个节点的第四数据序列同时丢失数据的频率d_miss(Si,Sj)。其中,待估节点的第三数据序列与每个节点的第四数据序列同时丢失数据的频率可以通过如下方式确定:将每个节点的第四数据序列中与待估节点的第三数据序列中丢失数据的时刻进行比较,若丢失数据的时刻相同,则进行计数,最终的计数总和即为该节点的第四数据序列与待估节点的第三数据序列同时丢失数据的频率。
示例性的,继续参照表10,根据上述表10中的“节点i的第四数据序列Si”和“待估节点j的第三数据序列Sj”,通过公式(6)就可以得到待估节点的第三数据序列与每个节点的第四数据序列同时丢失数据的频率,具体如表12所示:
表12
步骤S313:根据公式(7)确定待估节点的第三数据序列与每个节点的第四数据序列的序列大小sample_size。
sample_size=|Sj|公式(7)
具体的,上述待估节点的第三数据序列与每个节点的第四数据序列的序列大小,可以为是第三数据序列和第四数据序列中均没有缺失数据时的所包括的数据数量。由于在没有缺失数据的情况下,待估节点的第三数据序列的序列大小和每个节点的第四数据序列的序列大小相同,所以,可以通过选择确定任意一个数据序列的序列大小,以确定待估节点的第三数据序列的与每个节点的第四数据序列的序列大小。在上述公式(7)中,以确定的待估节点的第三数据序列的序列大小,作为待估节点的第三数据序列的与每个节点的第四数据序列的序列大小。
示例性的,继续参照表10,将上述表10中的“待估节点的第三数据序列S3”代入公式(7)中可知,该S3的序列大小为4,则说明在基础数据样本集合中,每个节点的第四数据序列的序列大小也均为4,具体如表13所示:
表13
步骤S314:根据公式(8)确定待估节点的第三数据序列与每个节点的第四数据序列的空间距离集合。
d ( S i , S j ) = d _ d i f f ( S i , S j ) 2 + d _ m i s s ( S i , S j ) 2 s a m p l e _ s i z e 公式(8)
其中,d(Si,Sj)为Si与所述Sj的空间距离。
具体的,上述公式(8)中,d_diff(Si,Sj)为通过公式(5)确定的待估节点的第三数据序列与每个节点的第四数据序列的数据相异度,d_miss(Si,Sj)为通过公式(6)确定的待估节点的第三数据序列与每个节点的第四数据序列同时丢失数据的频率,sample_size通过公式(7)确定的待估节点的第三数据序列与每个节点的第四数据序列的序列大小。上述Si可以为基础数据样本集合中任一节点的第四数据序列,将每个Si对应的d_diff(Si,Sj)、d_miss(Si,Sj)和sample_size分别代入公式(8)中,就可以得到每个的Si与待估节点的第三数据序列的空间距离,由每个Si与待估节点的第三数据序列的空间距离组成了空间距离集合。
示例性的,参考上述表11至表13,根据每个节点i的第四数据序列Si,将该Si在表11中对应的d_diff(Si,Sj)、在表12中对应的d_miss(Si,Sj)、在表13中对应的sample_size代入公式(8)中,就可以得到待估节点的第三数据序列与该节点的第四数据序列的空间距离,具体如表14所示:
表14
其中,表14中的d(S1,S3)、d(S2,S3)、d(S3,S3)、d(S4,S3)和d(S5,S3)就组成了空间距离集合。
需要说明的是,由于待估节点的数据序列既为第三数据序列,同时也为第四数据序列,为了提高数据填补的效率,可选的,当待估节点的数据序列为第四数据序列时,可以不计算该空间距离,默认该空间距离为一较大值,该较大值可以为大于空间距离阈值的一个值。例如:假定基础数据样本集合中的数据所属的第三个节点为待估节点,第三个节点的数据序列为S3,则可以默认d(S3,S3)=1。
需要进一步说明的是,当其他节点的第四数据序列在当前待估时刻也有缺失数据时,则在对当前待估节点的缺失数据填补时,该节点的第四数据序列无法被使用,因此,为了提高数据填补的效率,可选的,当某一节点的第四数据序列在当前待估时刻也有缺失数据时,可以不计算该第四数据序列与待估节点的第三数据序列的空间距离,默认该空间距离为一较大值,该较大值可以为大于空间距离阈值的一个值。
步骤S315:根据空间距离集合和预设的空间距离阈值,确定空间数据样本集合。
具体的,在根据上述公式(8)获取到待估节点j的第三数据序列与每个节点i的第四数据序列的空间距离d(Si,Sj)所组成的空间距离集合后,可以将空间距离集合中的每个空间距离与预设的空间距离阈值进行比较,将小于空间距离阈值的空间距离所对应的第四数据序列从基础样本数据集合中分离出来,由这些第四数据序列组成空间数据样本集合。
示例性的,继续参照矩阵(7)和表14,假定由d(S1,S3)、d(S2,S3)、d(S3,S3)、d(S4,S3)和d(S5,S3)组成的空间距离集合中,d(S1,S3),d(S2,S3)和d(S4,S3)的空间距离小于预设的空间距离阈值,其中,d(S1,S3)对应的第四数据序列为S1,d(S2,S3)对应的第四数据序列为S2,d(S4,S3)对应的第四数据序列为S4,则该空间数据样本集合为如下矩阵(8)(需要说明的是,空间数据样本集合中样本数据所属的节点均为与所述第三数据序列的空间距离小于等于所述空间距离阈值的所述第四数据序列所在的节点):
S 1 t 2 S 2 t 2 S 4 t 2 S 1 t 3 S 2 t 3 S 4 t 3 S 1 t 4 S 2 t 4 S 4 t 4 S 1 t 5 S 2 t 5 S 4 t 5 - - - ( 8 )
步骤S316:根据公式(9)确定空间数据样本集合中样本数据所属的第x个节点的权重wx。
w x = E &lsqb; ( S x - E ( S x ) ) * ( S j - E ( S j ) ) &rsqb; &sigma; S x * &sigma; S j * | S c o r r e l a t e | 公式(9)
其中,Sx为空间数据样本集合中样本数据所属的第x个节点的第四数据序列,Sj为待估节点j的第三数据序列,Scorrelate为空间数据样本集合。
具体的,上述第x个节点为空间数据样本集合中的任一节点,将空间数据样本集合中的每个节点分别作为第x个节点代入该公式(9)中,就可以得到空间数据样本集合中的每个第x个节点的权重wx。
示例性的,继续参照矩阵(8),在该空间数据样本集合中样本数据所属的节点一共有3个,分别为节点1、节点2和节点4,即第x个节点可以为节点1、节点2和节点4中的任一个,将节点1的第四数据序列S1、节点2的第四数据序列S2和节点4的第四数据序列S4分别代入公式(9)中,就可以得到空间数据样本集合中样本数据所属的所有第x个节点的权重wx,具体如表15所示:
表15
其中,上述节点1的第四数据序列S1即为基础数据样本集合中节点1的第四数据序列S1,节点2的第四数据序列S2即为基础数据样本集合中节点2的第四数据序列S2,节点4的第四数据序列S4即为基础数据样本集合中节点4的第四数据序列S4。
步骤S317:根据公式(10)确定空间评估数据V_Spatial;
V _ S p a t i a l = &Sigma; S x ( w x * Sj t n - 1 * Sx t n - Sx t n - 1 t n - t n - 1 ) 公式(10)
其中,为第x个节点在当前待估时刻tn的数据,为第x个节点在当前待估时刻相邻的前一时刻tn-1的数据。
具体的,在根据上述公式(9)确定每个节点的权重wx之后,就可以对每个第x个节点的“wx、该第x个节点在当前待估时刻tn的数据变化率和待估节点j在当前待估时刻之前的相邻的前一时刻tn-1的数据之积”求和,该求和所获得的数据即为待估节点在当前待估时刻的空间评估数据V_Spatial。其中,第x个节点在当前待估时刻tn的数据变化率为
示例性的,继续参照矩阵8和表15,根据矩阵(8)可知,在该空间样本数据集合中样本数据所属的节点一共有3个,即第x个节点可以为节点1、节点2和节点4中的任一节点,则第x个节点的权重、第x个节点在当前待估时刻tn的数据第x个节点在当前待估时刻之前相邻的前一时刻tn-1的数据待估节点j在当前待估时刻之前相邻的前一时刻tn-1的数据具体如表16所示:
表16
则将上述表16中的每一个第x个节点所在的行中的所有数据代入公式(10)中,就可以得到待估节点在当前待估时刻的空间评估数据V_Spatial,该空间评估数据V_Spatial具体为:
V _ S P a t i a l = w 1 * S 3 t 4 * S 1 t 5 - S 1 t 4 t 5 - t 4 + w 2 * S 3 t 4 * S 2 t 5 - S 2 t 4 t 5 - t 4 + w 4 * S 3 t 4 * S 4 t 5 - S 4 t 4 t 5 - t 4
步骤S318:根据公式(11)确定待估节点在当前待估时刻的评估数据Estimate。
Estimate=∑wx*V_Spatial+(1-∑wx)*V_Temple公式(11)
其中,∑wx为第一权重因子。
具体的,在根据上述公式(10)和上述公式(4)分别确定待估节点在当前待估时刻的空间评估数据V_Spatial和时间评估数据V_Temple之后,就可以以空间数据样本集合中每个样本数据所属的节点的权重之和作为第一权重因子,使用公式(11)确定待估节点在当前待估时刻的评估数据Estimate。
示例性的,将上述步骤S310的示例所确定的待估节点在当前待估时刻的时间评估数据、上述步骤S317的示例所确定的待估节点在当前待估时刻的空间评估数据、上述表15中“空间数据样本集合中样本数据所属的第x个节点的权重wx”代入公式(11)中就可以得到本实施例中的待估节点(节点3)在当前待估时刻t5的评估数据Estimate,该Estimate具体为:
Estimate=(w1+w2+w3)*V_Spatial+(1-(w1+w2+w3))*V_Temple
其中, V _ T e m p l e = S 3 t 4 + &lsqb; r ( Sj t 2 ) * w ( Sj t 2 ) + r ( Sj t 3 ) * w ( Sj t 3 ) + r ( Sj t 4 ) * w ( Sj t 4 ) &rsqb; * ( t 5 - t 4 ) ;
V _ S p a t i a l = w 1 * S 3 t 4 * S 1 t 5 - S 1 t 4 t 5 - t 4 + w 2 * S 3 t 4 * S 2 t 5 - S 2 t 4 t 5 - t 4 + w 4 * S 3 t 4 * S 4 t 5 - S 4 t 4 t 5 - t 4 .
步骤S319:将待估节点在当前待估时刻的评估数据Estimate填补至待估节点中。
示例性的,在根据步骤S318确定待估节点在当前待估时刻的评估数据Estimate之后,就可以将该Estimate填补至矩阵(6)中missing所在的位置,至此就完成了数据集合(矩阵(6))中缺失数据的填补。
执行步骤S319之后,则结束。
本发明提供的待估节点的数据填补方法,通过选择与缺失数据时空相关性较高的数据集合作为基础数据样本集合,并根据该基础数据样本集合中的待估节点在当前待估时刻之前的所有时刻的数据变化规律,以及,与待估节点空间相关性较高的节点在当前待估时刻的数据变化规律,为缺失数据确定评估数据,并将该评估数据填补至数据集合中。通过本发明提供的待估节点的数据填补方法,可以对无线传感器网络的管理节点存储的数据集合中的缺失数据进行填补,使用户可以根据数据集合中的数据进行分析,并得到正确的分析结果。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
图4为本发明提供的待估节点的数据填补装置实施例一的结构示意图。如图4所示,该装置包括:基础数据样本集合确定模块401、时间评估数据确定模块402、空间评估数据确定模块403和数据填补模块404。
基础数据样本集合确定模块401,用于根据所述待估节点上当前待估时刻对应的第一数据序列与数据集合中所述当前待估时刻之前的第一时刻对应的第二数据序列之间的平均相关值,确定基础数据样本集合;所述第一数据序列包括所述数据集合中除所述待估节点之外的其他节点在所述当前待估时刻的数据,所述第二数据序列包括所述待估节点在所述第一时刻的数据和所述其他节点在所述第一时刻的数据。
时间评估数据确定模块402,用于根据所述基础数据样本集合确定模块401确定的所述基础数据样本集合中在所述当前待估时刻之前的每一时刻的所述待估节点的数据变化率、在所述当前待估时刻之前的每一时刻的所述待估节点的权重、在所述当前待估时刻相邻的前一时刻的所述待估节点的数据、所述当前待估时刻和所述当前待估时刻相邻的前一时刻,确定所述待估节点在所述当前待估时刻的时间评估数据;
空间评估数据确定模块403,用于根据所述基础数据样本集合确定模块401确定的所述基础数据样本集合中所述待估节点的第三数据序列与所述基础数据样本集合中的每个节点的第四数据序列的空间距离,和,预设的空间距离阈值,从所述基础数据样本集合中确定空间数据样本集合;所述空间数据样本集合中的每个样本数据所属的节点均为与所述第三数据序列的空间距离小于等于所述空间距离阈值的所述第四数据序列所在的节点;
所述空间评估数据确定模块403,还用于根据所述空间数据样本集合中的所述每个样本数据所属的节点的权重、所述每个样本数据所属的节点在所述当前待估时刻的数据变化率和所述待估节点在所述当前待估时刻相邻的前一时刻的数据,确定所述待估节点在所述当前待估时刻的空间评估数据;
数据填补模块404,用于根据所述空间评估数据确定模块403确定的所述空间评估数据、所述时间评估数据确定模块402确定的所述时间评估数据和第一权重因子,确定所述待估节点在所述当前待估时刻的评估数据,并将所述评估数据填补至所述待估节点中;其中,所述第一权重因子为所述空间数据样本集合中所述每个样本数据所属的节点的权重之和。
本实施例的装置,可以用于执行图1和图3所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
进一步地,在上述图4所示实施例的基础上,图5为本发明提供的待估节点的数据填补装置实施例二的结构示意图。如图5所示,该装置还包括:数据缺失率确定模块405和处理模块406。
数据缺失率确定模块405,用于根据所述基础数据样本集合确定模块401确定的所述基础数据样本集合中所述待估节点的第三数据序列,确定所述待估节点的数据缺失率;
处理模块406,用于在所述待估节点的数据缺失率大于等于第一阈值时,将所述当前待估时刻之前的任一待估时刻作为新的当前待估时刻,对所述待估节点的所述新的当前待估时刻的数据进行填补,直至所述数据缺失率确定模块405所确定的所述待估节点的数据缺失率小于所述第一阈值时,对所述待估节点的所述当前待估时刻的数据进行填补。
本实施例的装置,可以用于执行图1-3所示任一方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (9)

1.一种待估节点的数据填补方法,其特征在于,所述方法适用于数据集合,所述数据集合中的数据所属的节点包括至少一个所述待估节点,所述待估节点为缺失数据的节点;所述待估节点上缺失数据的时刻为待估时刻,所述待估节点上的待估时刻为至少一个;所述方法包括:
步骤A:根据所述待估节点上当前待估时刻对应的第一数据序列与所述数据集合中所述当前待估时刻之前的第一时刻对应的第二数据序列之间的平均相关值,确定基础数据样本集合;所述第一数据序列包括所述数据集合中除所述待估节点之外的其他节点在所述当前待估时刻的数据,所述第二数据序列包括所述待估节点在所述第一时刻的数据和所述其他节点在所述第一时刻的数据;
步骤B:根据所述基础数据样本集合中在所述当前待估时刻之前的每一时刻的所述待估节点的数据变化率、在所述当前待估时刻之前的每一时刻的所述待估节点的权重、在所述当前待估时刻相邻的前一时刻的所述待估节点的数据、所述当前待估时刻和所述当前待估时刻相邻的前一时刻,确定所述待估节点在所述当前待估时刻的时间评估数据;
步骤C:根据所述基础数据样本集合中所述待估节点的第三数据序列与所述基础数据样本集合中的每个节点的第四数据序列的空间距离,和,预设的空间距离阈值,从所述基础数据样本集合中确定空间数据样本集合;所述空间数据样本集合中的每个样本数据所属的节点均为与所述第三数据序列的空间距离小于等于所述空间距离阈值的所述第四数据序列所在的节点;
步骤D:根据所述空间数据样本集合中的所述每个样本数据所属的节点的权重、所述每个样本数据所属的节点在所述当前待估时刻的数据变化率和所述待估节点在所述当前待估时刻相邻的前一时刻的数据,确定所述待估节点在所述当前待估时刻的空间评估数据;
步骤E:根据所述空间评估数据、所述时间评估数据和第一权重因子,确定所述待估节点在所述当前待估时刻的评估数据,并将所述评估数据填补至所述待估节点中;其中,所述第一权重因子为所述空间数据样本集合中所述每个样本数据所属的节点的权重之和。
2.根据权利要求1所述的方法,其特征在于,所述步骤A,具体包括:
根据确定所述第一数据序列与至少一个所述第二数据序列的平均相关值;
其中,1≤a≤n-1,所述a为大于等于1的正整数,所述n为大于1的正整数,所述tn为所述当前待估时刻,所述ta为所述第一时刻,所述为所述当前待估时刻tn对应的第一数据序列,所述为所述第一时刻ta对应的第二数据序列,所述为所述与所述的相关值,所述R为所述第一数据序列与至少一个所述第二数据序列之间的平均相关值;
根据所述第一数据序列与至少一个所述第二数据序列的平均相关值,确定所述第一数据序列对应的最大平均相关值;
根据所述最大平均相关值对应的a的取值范围,确定所述基础数据样本集合。
3.根据权利要求2所述的方法,其特征在于,所述步骤B,具体包括:
根据确定所述基础数据样本集合中在所述当前待估时刻之前的第m时刻的所述待估节点的数据变化率其中,1<m<n,所述m为正整数,所述j为所述待估节点,所述tm为所述基础数据样本集合中在所述当前待估时刻之前的第m时刻,所述tm-1为所述基础数据样本集合中在所述当前待估时刻之前的第m-1时刻,所述为所述待估节点j在所述tm时刻的数据,所述为所述待估节点j在所述tm-1时刻的数据;
根据确定在所述当前待估时刻之前的第m时刻的所述待估节点的权重其中,所述b为所述m的最小值,所述q为大于等于1的正整数;
根据 V _ T e m p l e = Sj t n - 1 + &lsqb; &Sigma; r ( Sj t m ) * w ( Sj t m ) &rsqb; * ( t n - t n - 1 ) 确定所述待估节点在所述当前待估时刻的时间评估数据V_Temple;其中,所述tn-1为所述当前待估时刻tn相邻的前一时刻,所述为所述待估节点j在所述当前待估时刻相邻的前一时刻tn-1的数据。
4.根据权利要求3所述的方法,其特征在于,所述步骤C,具体包括:
根据d_diff(Si,Sj)=|Si-Sj|确定所述待估节点的第三数据序列与所述每个节点的第四数据序列的数据相异度d_diff(Si,Sj);其中,所述Si为所述基础数据样本集合中第i个节点的第四数据序列,所述Sj为所述基础数据样本集合中所述待估节点j的第三数据序列;
根据d_miss(Si,Sj)=|Si_miss∩Sj_miss|确定所述待估节点的第三数据序列与所述每个节点的第四数据序列同时丢失数据的频率d_miss(Si,Sj);其中,所述Si_miss为所述基础数据样本集合中的第i个节点丢失数据的时刻,所述Sj_miss为所述待估节点j丢失数据的时刻;
根据sample_size=|Sj|确定所述待估节点的第三数据序列与所述每个节点的第四数据序列的序列大小sample_size;
根据 d ( S i , S j ) = d _ d i f f ( S i , S j ) 2 + d _ m i s s ( S i , S j ) 2 s a m p l _ s i z e , 确定所述待估节点的第三数据序列与所述每个节点的第四数据序列的空间距离集合;其中,所述d(Si,Sj)为所述Si与所述Sj的空间距离;
根据所述空间距离集合和所述预设的空间距离阈值,确定所述空间数据样本集合。
5.根据权利要求4所述的方法,其特征在于,所述步骤D,具体包括:
根据确定所述空间数据样本集合中样本数据所属的第x个节点的权重wx;其中,所述Sx为所述空间数据样本集合中样本数据所属的第x个节点的第四数据序列,所述Sj为所述待估节点j的第三数据序列,所述Scorrelate为所述空间数据样本集合;
根据 V _ S p a t i a l = &Sigma; S x ( w x * Sj t n - 1 * Sx t n - Sx t n - 1 t n - t n - 1 ) 确定所述空间评估数据V_Spatial;
其中,所述为所述第x个节点在所述当前待估时刻tn的数据,所述为所述第x个节点在所述当前待估时刻相邻的前一时刻tn-1的数据。
6.根据权利要求5所述的方法,其特征在于,所述根据所述空间评估数据、所述时间评估数据和第一权重因子,确定所述待估节点在所述当前待估时刻的评估数据,具体包括:
根据Estimate=∑wx*V_Spatial+(1-∑wx)*V_Temple确定所述待估节点在所述当前待估时刻的评估数据Estimate,其中,所述∑wx为所述第一权重因子。
7.根据权利要求1-6任一项所述的方法,其特征在于,在所述步骤A之后,所述方法还包括:
根据所述待估节点的第三数据序列,确定所述待估节点的数据缺失率;
若所述待估节点的数据缺失率大于等于第一阈值,则将所述当前待估时刻之前的任一待估时刻作为新的当前待估时刻,返回执行所述步骤A至所述步骤E,以对所述待估节点的所述新的当前待估时刻的数据进行填补,直至所述待估节点的数据缺失率小于所述第一阈值时,对所述待估节点的所述当前待估时刻的数据进行填补。
8.一种待估节点的数据填补装置,其特征在于,所述装置包括:
基础数据样本集合确定模块,用于根据所述待估节点上当前待估时刻对应的第一数据序列与数据集合中所述当前待估时刻之前的第一时刻对应的第二数据序列之间的平均相关值,确定基础数据样本集合;所述第一数据序列包括所述数据集合中除所述待估节点之外的其他节点在所述当前待估时刻的数据,所述第二数据序列包括所述待估节点在所述第一时刻的数据和所述其他节点在所述第一时刻的数据;
时间评估数据确定模块,用于根据所述基础数据样本集合确定模块确定的所述基础数据样本集合中在所述当前待估时刻之前的每一时刻的所述待估节点的数据变化率、在所述当前待估时刻之前的每一时刻的所述待估节点的权重、在所述当前待估时刻相邻的前一时刻的所述待估节点的数据、所述当前待估时刻和所述当前待估时刻相邻的前一时刻,确定所述待估节点在所述当前待估时刻的时间评估数据;
空间评估数据确定模块,用于根据所述基础数据样本集合确定模块确定的所述基础数据样本集合中所述待估节点的第三数据序列与所述基础数据样本集合中的每个节点的第四数据序列的空间距离,和,预设的空间距离阈值,从所述基础数据样本集合中确定空间数据样本集合;所述空间数据样本集合中的每个样本数据所属的节点均为与所述第三数据序列的空间距离小于等于所述空间距离阈值的所述第四数据序列所在的节点;
所述空间评估数据确定模块,还用于根据所述空间数据样本集合中的所述每个样本数据所属的节点的权重、所述每个样本数据所属的节点在所述当前待估时刻的数据变化率和所述待估节点在所述当前待估时刻相邻的前一时刻的数据,确定所述待估节点在所述当前待估时刻的空间评估数据;
数据填补模块,用于根据所述空间评估数据确定模块确定的所述空间评估数据、所述时间评估数据确定模块确定的所述时间评估数据和第一权重因子,确定所述待估节点在所述当前待估时刻的评估数据,并将所述评估数据填补至所述待估节点中;其中,所述第一权重因子为所述空间数据样本集合中所述每个样本数据所属的节点的权重之和。
9.根据权利要求8所述的待估节点的数据填补装置,其特征在于,所述装置还包括:
数据缺失率确定模块,用于根据所述基础数据样本集合确定模块确定的所述基础数据样本集合中所述待估节点的第三数据序列,确定所述待估节点的数据缺失率;
处理模块,用于在所述待估节点的数据缺失率大于等于第一阈值时,将所述当前待估时刻之前的任一待估时刻作为新的当前待估时刻,对所述待估节点的所述新的当前待估时刻的数据进行填补,直至所述数据缺失率确定模块所确定的所述待估节点的数据缺失率小于所述第一阈值时,对所述待估节点的所述当前待估时刻的数据进行填补。
CN201510355716.8A 2015-06-24 2015-06-24 待估节点的数据填补方法和装置 Active CN105142164B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510355716.8A CN105142164B (zh) 2015-06-24 2015-06-24 待估节点的数据填补方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510355716.8A CN105142164B (zh) 2015-06-24 2015-06-24 待估节点的数据填补方法和装置

Publications (2)

Publication Number Publication Date
CN105142164A true CN105142164A (zh) 2015-12-09
CN105142164B CN105142164B (zh) 2018-10-30

Family

ID=54727341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510355716.8A Active CN105142164B (zh) 2015-06-24 2015-06-24 待估节点的数据填补方法和装置

Country Status (1)

Country Link
CN (1) CN105142164B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649832A (zh) * 2016-12-29 2017-05-10 北京奇艺世纪科技有限公司 一种基于缺失数据的预估方法及装置
WO2017111832A1 (en) * 2015-12-26 2017-06-29 Intel Corporation Dynamic sampling of sensor data
CN109992579A (zh) * 2019-03-28 2019-07-09 湖北交投智能检测股份有限公司 一种公路基础设施多源异质数据的数据修复方法及系统
CN111064796A (zh) * 2019-12-19 2020-04-24 北京明略软件系统有限公司 伴随关系的分析方法及装置、分析模型的训练方法
CN114724276A (zh) * 2022-04-12 2022-07-08 广州文远知行科技有限公司 一种多类型日志数据的处理方法、播放方法及相关设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090037465A1 (en) * 2007-07-31 2009-02-05 Lukas Michael Marti Method of improving database integrity for driver assistance applications
CN102684935A (zh) * 2011-03-18 2012-09-19 北京邮电大学 基于信息量的流量矩阵估测方法
CN102819682A (zh) * 2012-08-02 2012-12-12 清华大学 一种多阈值空间相关的浮动车数据清洗和修复算法
CN103916896A (zh) * 2014-03-26 2014-07-09 浙江农林大学 基于多维Epanechnikov核密度估计的异常检测方法
CN104462238A (zh) * 2014-11-17 2015-03-25 北京邮电大学 一种基于数据离散度无关性的数据立方体构建方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090037465A1 (en) * 2007-07-31 2009-02-05 Lukas Michael Marti Method of improving database integrity for driver assistance applications
CN102684935A (zh) * 2011-03-18 2012-09-19 北京邮电大学 基于信息量的流量矩阵估测方法
CN102819682A (zh) * 2012-08-02 2012-12-12 清华大学 一种多阈值空间相关的浮动车数据清洗和修复算法
CN103916896A (zh) * 2014-03-26 2014-07-09 浙江农林大学 基于多维Epanechnikov核密度估计的异常检测方法
CN104462238A (zh) * 2014-11-17 2015-03-25 北京邮电大学 一种基于数据离散度无关性的数据立方体构建方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
潘立强等: "传感器网络中一种基于时-空相关性的缺失值估计算法", 《计算机学报》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017111832A1 (en) * 2015-12-26 2017-06-29 Intel Corporation Dynamic sampling of sensor data
CN106649832A (zh) * 2016-12-29 2017-05-10 北京奇艺世纪科技有限公司 一种基于缺失数据的预估方法及装置
CN106649832B (zh) * 2016-12-29 2020-04-17 北京奇艺世纪科技有限公司 一种基于缺失数据的预估方法及装置
CN109992579A (zh) * 2019-03-28 2019-07-09 湖北交投智能检测股份有限公司 一种公路基础设施多源异质数据的数据修复方法及系统
CN109992579B (zh) * 2019-03-28 2021-10-01 湖北交投智能检测股份有限公司 一种公路基础设施多源异质数据的数据修复方法及系统
CN111064796A (zh) * 2019-12-19 2020-04-24 北京明略软件系统有限公司 伴随关系的分析方法及装置、分析模型的训练方法
CN114724276A (zh) * 2022-04-12 2022-07-08 广州文远知行科技有限公司 一种多类型日志数据的处理方法、播放方法及相关设备
CN114724276B (zh) * 2022-04-12 2023-10-24 广州文远知行科技有限公司 一种多类型日志数据的处理方法、播放方法及相关设备

Also Published As

Publication number Publication date
CN105142164B (zh) 2018-10-30

Similar Documents

Publication Publication Date Title
CN105142164A (zh) 待估节点的数据填补方法和装置
CN110225525B (zh) 一种基于认知无线电网络的频谱共享方法、装置及设备
CN104506378A (zh) 一种预测数据流量的装置及方法
US9713119B2 (en) Position estimation method, system, and position estimation apparatus
CN103139804A (zh) 无线传感器网络的节能传播自适应rls分布式检测方法
Mahmoud et al. Optimal operational parameters for 5G energy harvesting cognitive wireless sensor networks
CN103491551B (zh) 一种基于特征向量的加权协作频谱感知方法
CN102457360B (zh) 预编码处理方法、预编码处理装置以及基站
Haapola et al. Peer-to-peer energy trading and grid control communications solutions' feasibility assessment based on key performance indicators
CN105357707B (zh) 基于克里金插值算法的室内分布式移动通信信号覆盖预测方法
Pla et al. Discrete-time analysis of cognitive radio networks with nonsaturated source of secondary users
Zimmerman et al. Market‐based frequency domain decomposition for automated mode shape estimation in wireless sensor networks
Howlader et al. Estimation in underwater sensor networks taking into account capture
CN103152751B (zh) 无线传感器网络的节能传播自适应lms分布式检测方法
CN104113590B (zh) 一种基于副本响应时间预测的副本选择方法
CN106921985A (zh) 一种超密集网络的自组织优化方法及装置
Li et al. Optimal power control with channel uncertainty in ad hoc networks
CN101335538A (zh) 一种扩频序列生成的方法和装置
CN104282308B (zh) 频域包络的矢量量化方法和装置
CN102694700B (zh) 一种基于奇异值分解的可用带宽预测方法
CN104796995A (zh) 分布式信道探测和序贯接入的方法和系统
Talabeigi et al. A dynamic web recommender system based on cellular learning automata
Yan et al. Efficient simulation budget allocation for selecting the best set of simplest good enough designs
CN101860884A (zh) 一种同频邻小区信道估计的方法及装置
CN103763732B (zh) 移动通信系统的容量仿真系统和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant