CN108650065A - 基于窗口的流式数据缺失处理方法 - Google Patents

基于窗口的流式数据缺失处理方法 Download PDF

Info

Publication number
CN108650065A
CN108650065A CN201810215615.4A CN201810215615A CN108650065A CN 108650065 A CN108650065 A CN 108650065A CN 201810215615 A CN201810215615 A CN 201810215615A CN 108650065 A CN108650065 A CN 108650065A
Authority
CN
China
Prior art keywords
data
window
missing
size
lacks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810215615.4A
Other languages
English (en)
Other versions
CN108650065B (zh
Inventor
沈中
秦超
杨清海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201810215615.4A priority Critical patent/CN108650065B/zh
Publication of CN108650065A publication Critical patent/CN108650065A/zh
Application granted granted Critical
Publication of CN108650065B publication Critical patent/CN108650065B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/12Arrangements for detecting or preventing errors in the information received by using return channel
    • H04L1/16Arrangements for detecting or preventing errors in the information received by using return channel in which the return channel carries supervisory signals, e.g. repetition request signals
    • H04L1/18Automatic repetition systems, e.g. Van Duuren systems
    • H04L1/1829Arrangements specially adapted for the receiver end
    • H04L1/1832Details of sliding window management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/27Evaluation or update of window size, e.g. using information derived from acknowledged [ACK] packets

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明属于信息检索及其数据库结构技术领域,公开了一种基于窗口的流式数据缺失处理方法,包括:输入需要处理的含有缺失数据的数据流;判断流式数据是否缺失;动态滑动窗口评估;窗口锁定;不完备信息处理;输出处理后的完备数据流结果。通过对流式数据提供滑动窗口,根据数据流的大小动态调整窗口大小;利用数据内部的时间和空间特性对缺失数据进行填补,对流式数据的缺失填补。本发明具有分类精度较高,运行时间复杂度低,计算资源利用率高等特点,有效的克服了现有处理方法存在的方式单一,时空复杂度高等问题。

Description

基于窗口的流式数据缺失处理方法
技术领域
本发明属于无线通信、信息检索及其数据库结构技术及领域,尤其涉及一种基于窗口的流式数据缺失处理方法。
背景技术
目前,业内常用的现有技术是这样的:传感器网络通常用来监测不同位置的物理或环境状况,网络在获取数据后会传输到数据中心对数据进行分析和显示。在节点所环境中,通常由于传感器网络自身硬件和软件的局限性,加上监测中遭到各种不利因素例如天气、人为、电磁辐射以及向中心传输过程中传输信道不稳定等影响,传感器网络中的节点在监测和获取信息的过程中,会出现数据缺失的情况,在数据中心接收到的数据将会是不完备的数据。数据的缺失,一般分为数据单重缺失和数据多重缺失,单重缺失是指数据中单一属性值的缺失,而多重缺失是存在多重属性值的缺失。传感器网络中数据通常是具有时间相关性和空间相关性的,时间相关性是指对同一个传感器而言,其获得的数据在时间上是具有前后关系的,而空间相关性是指网络中各个节点之间在位置接近,它们获得的数据之间具有一定的内在关系,这种内在关系就是空间相关性。在传感器网络的正常工作中,中心获得的各个传感器的数据是流式数据。在对含有缺失数据的流式数据进行处理中,通常需要计算数据的相关特性,同时需要存储一定数据。这些在处理过程所需要的计算量通常用时间复杂度度量,需要的存储空间通常用空间复杂度度量,流式数据由于其数据量大的特点,通常在处理中需要较大的时间复杂度和空间复杂度,这也会带来一些获取数据具有一定时延的问题。在一些特殊的场景例如实时监控领域,数据中心需要具有较小时延的数据来实时反映监控区域的状态,因此在处理的过程中需要很好的解决时延问题。
现有技术一提出采用三阶段法进行填充,第一阶段特征挑选阶段即挑选具有缺失数据的特征和完备数据特征,然后利用K最近邻方法填充,最后利用贝叶斯定理进行后验校正。但是利用K最近邻方法本身具有一定缺陷,参数的选取对结果的影响很大,可能由于K值的选取不合适而造成结果误差较大,而且K最近邻方法计算复杂度高在流式数据处理过程中会造成很大时延,同时因为使用贝叶斯定理需要数据的统计特性,而在流式数据的情况下,无法精确获得数据的统计结果,因此该方法不适用于具有流式数据的缺失处理。现有技术二利用分类器方法来对数据进行分类,然后基于同类数据中的相关性,对同一类中的缺失数据利用该类数据集数据均值进行填充,从而提高缺失数据处理精度。但该方法利用的分类器方法是基于不相关数据来进行,即具有不相关属性的一些数据才可以进行分类,如果数据集内部数据的关联性很大,即每种数据之间都是关联的,那么该方法就无法将它们分开,因此就无法进行填充。传感器网络中的数据本身就存在时间和空间相关性,对同一环境数据进行感知时,各个传感器获得的数据内部具有相关,利用该方法无法将它们分类开,因此在此场景之下该方法不适用,而且分类器方法本身存在一个分类的过程,该过程耗时计算量大,在面对流失数据时同样会存在处理延时较大的问题,因此该方法不适用于流式数据处理。
综上所述,现有技术存在的问题是:
(1)采用三阶段法进行填充形式单一,无法解决多重缺失填补问题,同时无法满足流式数据处理需要的低时延的条件。
(2)利用分类器来分类并利用分类后的数据进行缺失数据填充,该方法无法解决具有内部数据属性之间具有较关联大关系的数据的分类问题
(3)现有技术主要针对静态数据集的数据填充,在面对流式数据的缺失处理问题时,其方法在计算时时间复杂度和空间复杂度高,同时没有解决数据流的流量控制问题。
解决上述技术问题的难度和意义:
针对上述计算问题,面对流失数据缺失处理的问题时存在以下难点:(1)数据的缺失可能存在单一也可能存在多重,如何解决不同缺失模式下的数据填充处理;(2)如何对内部具有关联关系的数据进行分类,处理不同内部特性下的缺失数据;(3)如何减小流式数据缺失处理时延;(4)如何在流式数据处理时进行流量控制。
上述问题是在传感器网络中对具有缺失数据的数据流进行数据预处理时遇到的一些急需解决的问题。传感器网络中采集到的数据流会因为传感器精度、灵敏度以及数据传输中的一些因素影响而存在缺失,在数据中心分析、显示过程中,缺失的数据会减小有用信息量,同时对中心处理以及信息显示造成困难,因此对流式数据的缺失处理是很重要的。
发明内容
针对现有技术存在的问题,本发明提供了一种基于窗口的流式数据缺失处理方法。
一种基于窗口的流式数据缺失处理方法,所述基于窗口的流式数据缺失处理方法通过采用动态大小的滑动窗口,根据数据流的输入速率动态调整窗口大小;利用数据内部的时间和空间特性对缺失数据进行填补。
进一步,所述基于窗口的流式数据缺失处理方法包括以下步骤:
步骤一,输入数据流;
步骤二,选取初始窗口大小,判断窗口中的数据是否缺失;
步骤三,滑动窗口大小调整;计算饱和可用窗口大小Wmax;计算当前窗口Wcur大小,计算数据为空的子窗口NSWnull大小,其中空子窗口指数据流数据为空时窗口的大小;然后调整窗口大小;
步骤四,窗口锁定,保持窗口大小并存储窗口中的数据;
步骤五,进行不完备信息处理,判断数据是部分缺失还是整体缺失;是部分缺失判断是位置信息确实还是信号信息缺失,或者两部分都缺失,利用算法填充;全部缺失,判断是什么情况缺失,利用算法填充;
步骤六,输出完备数据流。
进一步,所述步骤二的数据流中数据缺失判断方法具体包括:
选取初始窗口大小,初始窗口大小的选取根据数据流入速率进行设置,例如可采用数据初始速率大小,然后对窗口中的数据进行判断,读取窗口中的数据,如果存在缺失则进行下一步处理,如果不存在缺失则进行窗口滑动。
进一步,所述步骤三的动态滑动窗口评估方法具体包括:
(1)窗口Wcur大小计算,采用最大饱和可用窗口Wmax的一定比例来获取得;
(2)调整窗口大小的方法,保持η的大小为较高的比例,并且在一定的范围内波动,然后动态调整SW的大小,当窗口占比增大到一定比例则减小Wcur的大小,否则增加Wcur的大小但是要满足Wcur小于最大可用窗口,其中表示数据窗口占比,SW表示窗口大小。
进一步,所述步骤五缺失信息类型的判断方法如下:
在读取窗口中的数据时,根据数据帧的情况,在读取到缺失数据位以后,根据缺失部分位于数据帧中的位置来判断具体缺失情况。
进一步,所述步骤五位置信息部分缺失的填充方法采用差值法填充,任意第i项数据与第j项数据之间的相关性采用数据相关性公式计算,可以采用但不仅限于如下计算公式:
其中:j=1,2,...,i-1,i+1,...,n;yik代表第i条数据项的第k个属性值,yjk代表第j条数据的第k个属性值;yi代表第i数据项的平均值,yj代表第j条数据项的平均值。
进一步,所述步骤五信号信息部分缺失情况方法采用空间最近邻方法具体包括:对各个传感器节点找到自己空间相关的节点信息,保存在本身的信息存储单元中;找到缺失数据节点的缺失数据项,相邻的空间相关性节点的相同或相近的时刻点的数据项,对数据项进行求均值,把结果填充到缺失的数据位。
进一步,所述步骤五特征全部缺失情况采用如下步骤:
(1)位置信号全而信号信息缺失,对缺失信息不处理,直接输出;
(2)信息中的信号信息是全的,位置信息全部缺失,采用灰度预测方法进行填充;
(3)位置信息全部缺失时,并存在信号信息缺失的情况,对信息无法进行处理的,丢弃数据。
本发明的另一目的在于提供一种应用所述基于窗口的流式数据缺失处理方法的无线通信系统。
综上所述,本发明的优点及积极效果为:通过对流式数据提供滑动窗口,根据数据流的大小动态调整窗口大小,然后利用数据内部的时间和空间特性对缺失数据进行填补,从而达到对流失数据的缺失填补的目的;以提高缺失数据填充的精度,克服信息缺陷问题,减少处理流式数据时的时间复杂度和空间复杂度,保证填补数据的恢复精确度。
本发明引入时空相关性、数据仓库比对以及灰度预测等特性和方法,克服了单一特征差值填充的不足,使得本发明提高了缺失数据的填充精确度。本发明引入动态滑动窗口评估技术,克服了流失数据的动态和无限特性而造成的计算复杂度高和时延大的问题,提高了流失数据处理的精度。由于本发明综合考虑不同情况下的缺失数据处理场景和方法,对传感器网络中的不同场景流数据的缺失处理具有较好的应用型,克服现有方法太多假设条件的问题。
附图说明
图1是本发明实施例提供的基于窗口的流式数据缺失处理方法流程图。
图2是本发明实施例提供的滑动窗口动态评估算法流程图。
图3是本发明实施例提供的不完备信息综合处理框图。
图4是本发明实施例提供的缺失数据恢复性能仿真对比图。
图5是本发明实施例提供的滑动窗口动态调整资源利用率仿真结果图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明利用无线传感网络中节点数据的时空相关性,通过动态滑动窗口调整方法,提高无线传感网络中的缺失数据恢复精度。可适用于军事侦查、环境感知和目标识别等领域的缺失信息处理,提高缺失数据填充的精度和处理效率。
如图1所示,本发明实施例提供的基于窗口的流式数据缺失处理方法包括以下步骤:
S101:输入需要处理的含有缺失数据的数据流;
S102:判断流失数据是否缺失;
S103:动态滑动窗口评估;
S104:窗口锁定;
S105:不完备信息处理;
S106:输出处理后的完备数据流结果。
下面结合附图对本发明的应用原理作进一步的描述。
如图2和图3所示,本发明实施例提供的基于窗口的流式数据缺失处理方法包括以下步骤:
步骤一,判断数据流中数据是否缺失;根据数据初始流入速率选取初始窗口大小,例如可采用数据初始速率大小,然后读取窗口中的数据,如果存在缺失则进行下一步处理,如果不存在缺失则进行窗口滑动,滑动大小为当前窗口大小。
步骤二,滑动窗口大小调整,方法流程如图2所示,图2仅仅给出一种系数计算和窗口调整的计算实例,但方法不局限于图2中的具体实例。流程具体为;首先计算计算饱和可用窗口大小Wmax;然后计算当前窗口Wcur大小,计算数据为空子窗口NSWnull大小;
保持η的大小为较高的比例,并且在一定的范围内波动,然后动态调整SW的大小,当窗口占比增大到一定比例则减小Wcur的大小,否则增加Wcur的大小但是要满足Wcur小于最大可用窗口,如果η满足波动范围则进行下一步处理。
步骤三,窗口锁定,保持窗口大小并存储窗口中的数据;
步骤四,进行不完备信息处理,处理方法流程如图3所示;判断数据是部分缺失还是整体缺失;如果位置信息部分缺失的填充方法采用差值法填充,填充方法中任意第i项数据与第j项数据之间的相关性采用数据相关性公式计算,可以采用但不仅限于如下计算公式:
其中:j=1,2,...,i-1,i+1,...,n;yik代表第i条数据项的第k个属性值,yjk代表第j条数据的第k个属性值;yi代表第i数据项的平均值,yj代表第j条数据项的平均值。
如果信号信息部分缺失情况,方法采用空间最近邻方法(SKNN)如下:
对各个传感器节点找到自己空间相关的节点信息,并保存在本身的信息存储单元中;找到缺失数据节点的缺失数据项,找其相邻的空间相关性节点的相同或相近的时刻点(此处存在误差的定义系数r)的侦查的数据项。对这些数据项进行求均值,并把结果填充到缺失的数据位。
如果特征全部缺失采用方法如下:
如果位置信号全而信号信息缺失,这种情况下,对缺失信息不处理,直接输出。如果信息中的信号信息是全的,而位置信息全部缺失。此种情况之下,采用灰度预测方法进行填充。如果位置信息全部缺失时,并存在信号信息缺失的情况,这种情况下是对信息无法进行处理的,丢弃数据。
步骤五,输出完备数据流。
下面结合仿真对本发明的应用效果作详细的描述。
1.仿真条件
在CPU为AMD CPU、内存8G、WINDOWS 7系统上进行了仿真,采用C++语言在Visualstudio 2015的环境下进行编程实现,结果数据利用MATLAB画图显示。
2.仿真内容
(1)静态数据缺失处理仿真:基于系统处理所需数据的格式,信息缺失填补的好坏以输出数据的有效性为依据,根据数据的有效性来反映缺失数据处理结果性能,有效的数据包括完备数据以及空间相关性完备的数据。
实验采用综合不完备信息处理(Comprehensive Miss-Data Process,CMDP)方法、SKNN以及TRA算法对比,展现数据恢复性能。所产生的数据恢复结果如图4所示。由图4,综合不完备数据处理方法对数据的缺失填补具有一定的优越性。在数据的缺失数据率不高的情况下,三种方法都具有较好的恢复性能,其中SKNN方法具有更好的恢复效率,原因在于,在大规模无线传感器网络中,当环境中的传感器几点足够多的时候,每个传感器节点都会与几个节点在空间上具有相关性,传感器节点的密布造成了空间相关性更高,因此通过空间相关性达到的回复效率会更高。随着数据缺失率的增加,所有方法的缺失数据恢复率都呈现下降趋势。其中SKNN的恢复效率会在0.6值附近呈现陡降,原因在于,随着缺失率的增加,数据集中的缺失数据增多,虽然有空间相关性节点,但是各个节点的数据都或多或少会存在缺失,数据呈现缺失特性,不能再通过空间相关性直接进行填补。CMDP和TRA法都呈现慢下降趋势,而本发明提出的CMDP在缺失数据流较高的情况下也具有很好的恢复效率,是因为该方法兼顾了SKNN与TRA算法的优点,同时该方法还增加了不同情况下的处理方法,对缺失数据的填补具有更好的结果。
(2)动态滑动窗口仿真:仿真分析采用三个场景,数据密集,数据稀疏和数据交替密集稀疏,在三种场景下以计算资源利用率来反映算法好坏。计算资源利用率ε:表示计算资源在动态滑动窗口下计算资源的利用率,计算方式为:
仿真数据采用5000个时刻的数据模拟流式数据的部分时间窗口内,分别使得数据密集、数据稀疏和数据交替密集稀疏的情况下,计算中的计算资源利用率。实验采用的数据集中,数据密集的数据中完整数据为95%,即数据流中存在5%的空白数据;数据稀疏的数据集中数据完整数据为35%,即数据流存在60%的空白数据;数据交替密集稀疏情况下,数据整体平均完整性为50%。实验仿真结果如图5所示。
由图5分析可以知道,在数据密集的情况下,固定大小窗口的方法具有较高的计算利用率,而动态窗口大小的会存在部分计算利用率低的情况,因为系统会有一部分计算资源被用来计算窗口大小和动态调整,在密集数据情况下二者结果差异不大。在稀疏数据和交替数据的情况下,动态调整算法可以很好的利用系统的计算资源,提高系统计算资源利用率,同时可以保证系统计算资源利用率处在一种平稳的状态下,减小CPU的发热,提高系统生存时间。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于窗口的流式数据缺失处理方法,其特征在于,所述基于窗口的流式数据缺失处理方法通过对流式数据提供滑动窗口,根据数据流的大小动态调整窗口大小;利用数据内部的时间和空间特性对缺失数据进行填补,实现流失数据的缺失填补。
2.如权利要求1所述的基于窗口的流式数据缺失处理方法,其特征在于,所述基于窗口的流式数据缺失处理方法包括以下步骤:
步骤一,输入数据流;
步骤二,选取初始窗口大小,判断窗口中的数据是否缺失;
步骤三,滑动窗口大小调整;计算饱和可用窗口大小Wmax;计算当前窗口Wcur大小,计算数据为空的子窗口NSWnull大小;调整窗口大小;
步骤四,窗口锁定,保持窗口大小并存储窗口中的数据;
步骤五,进行不完备信息处理,判断数据是部分缺失还是整体缺失;是部分缺失判断是位置信息确实还是信号信息缺失,或者两部分都缺失,利用算法填充;全部缺失,判断是什么情况缺失,利用算法填充;
步骤六,输出完备数据流。
3.如权利要求2所述的基于窗口的流式数据缺失处理方法,其特征在于,所述步骤二的窗口大小选取和数据流数据缺失判断方法具体包括:
初始窗口大小的选取根据数据流入速率进行设置,例如可采用数据初始速率大小,然后读取窗口中的数据,如果存在缺失则进行下一步处理,如果不存在缺失则进行窗口滑动,滑动大小为当前窗口大小。
4.如权利要求2所述的基于窗口的流式数据缺失处理方法,其特征在于,所述步骤三的动态滑动窗口评估方法具体包括:
(1)当前窗口Wcur大小计算,采用最大饱和可用窗口Wmax的一定比例来获取得;
(2)调整窗口大小的方法,保持η的大小为较高的比例,并且在一定的范围内波动,然后动态调整SW的大小,当窗口占比增大到一定比例则减小Wcur的大小,否则增加小于最大可用窗口的Wcur,其中表示数据窗口占比,SW为窗口大小。
5.如权利要求2所述的基于窗口的流式数据缺失处理方法,其特征在于,所述步骤五位置信息部分缺失的填充方法采用差值法填充,任意第i项数据与第j项数据之间的相关性采用数据相关性公式计算,可以采用但不仅限于如下计算公式:
其中:j=1,2,...,i-1,i+1,...,n;yik代表第i条数据项的第k个属性值,yjk代表第j条数据的第k个属性值;yi代表第i数据项的平均值,yj代表第j条数据项的平均值。
6.如权利要求2所述的基于窗口的流式数据缺失处理方法,其特征在于,所述步骤五缺失类型判断方法具体如下:
在读取窗口中的数据时,根据数据帧的情况,在读取到缺失数据位以后,根据缺失部分位于数据帧中的位置来判断具体缺失情况。
信号信息部分缺失情况方法采用空间最近邻方法具体包括:对各个传感器节点找到自己空间相关的节点信息,保存在本身的信息存储单元中;找到缺失数据节点的缺失数据项,相邻的空间相关性节点的相同或相近的时刻点的数据项,对数据项进行求均值,把结果填充到缺失的数据位。
7.如权利要求2所述的基于窗口的流式数据缺失处理方法,其特征在于,所述步骤五特征全部缺失情况采用如下步骤:
(1)位置信号全而信号信息缺失,对缺失信息不处理,直接输出;
(2)信息中的信号信息是全的,位置信息全部缺失,采用灰度预测方法进行填充;
(3)位置信息全部缺失时,并存在信号信息缺失的情况,对信息无法进行处理的,丢弃数据。
8.一种应用权利要求1~6任意一项所述基于窗口的流式数据缺失处理方法的无线通信系统。
CN201810215615.4A 2018-03-15 2018-03-15 基于窗口的流式数据缺失处理方法 Active CN108650065B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810215615.4A CN108650065B (zh) 2018-03-15 2018-03-15 基于窗口的流式数据缺失处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810215615.4A CN108650065B (zh) 2018-03-15 2018-03-15 基于窗口的流式数据缺失处理方法

Publications (2)

Publication Number Publication Date
CN108650065A true CN108650065A (zh) 2018-10-12
CN108650065B CN108650065B (zh) 2021-09-10

Family

ID=63744175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810215615.4A Active CN108650065B (zh) 2018-03-15 2018-03-15 基于窗口的流式数据缺失处理方法

Country Status (1)

Country Link
CN (1) CN108650065B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110911011A (zh) * 2019-11-27 2020-03-24 医惠科技有限公司 一种脓毒血症的预警装置、设备及存储介质
US20200302324A1 (en) * 2019-03-20 2020-09-24 Fujitsu Limited Data complementing method, data complementing apparatus, and non-transitory computer-readable storage medium for storing data complementing program
CN112859793A (zh) * 2021-02-04 2021-05-28 中南大学 基于改进滑动时间窗口的工业生产过程动态时延辨识方法
CN113297191A (zh) * 2021-05-28 2021-08-24 湖南大学 一种网络缺失数据在线填充的流处理方法及系统
CN113723559A (zh) * 2021-09-08 2021-11-30 湖北天天数链技术有限公司 一种异常值检测方法、装置、电子设备及可读存储介质
CN114634391A (zh) * 2022-03-21 2022-06-17 广东宏大韶化民爆有限公司 一种膨化结晶机的运行状态实时评估方法及系统
CN117520011A (zh) * 2023-11-09 2024-02-06 中国三峡建工(集团)有限公司 一种实时数据内存的共享管理方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014121419A1 (zh) * 2013-02-07 2014-08-14 中国种子集团有限公司 水稻全基因组育种芯片及其应用
CN104035779A (zh) * 2014-06-25 2014-09-10 中国科学院软件研究所 一种数据流决策树分类中的缺失值处理方法
CN104461772A (zh) * 2014-11-07 2015-03-25 沈阳化工大学 一种对缺失数据进行恢复处理的方法
CN106407258A (zh) * 2016-08-24 2017-02-15 广东工业大学 一种缺失数据预测方法及装置
CN106407464A (zh) * 2016-10-12 2017-02-15 南京航空航天大学 一种基于knn的改进缺失数据填补算法
CN107038460A (zh) * 2017-04-10 2017-08-11 南京航空航天大学 一种基于改进knn的船舶监控数据缺失值填补方法
CN107273445A (zh) * 2017-05-26 2017-10-20 电子科技大学 一种大数据分析中缺失数据混合多重插值的装置和方法
CN107507152A (zh) * 2017-09-13 2017-12-22 鲁东大学 一种基于多图像局部插值的遥感图像缺失数据修复方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014121419A1 (zh) * 2013-02-07 2014-08-14 中国种子集团有限公司 水稻全基因组育种芯片及其应用
CN104035779A (zh) * 2014-06-25 2014-09-10 中国科学院软件研究所 一种数据流决策树分类中的缺失值处理方法
CN104461772A (zh) * 2014-11-07 2015-03-25 沈阳化工大学 一种对缺失数据进行恢复处理的方法
CN106407258A (zh) * 2016-08-24 2017-02-15 广东工业大学 一种缺失数据预测方法及装置
CN106407464A (zh) * 2016-10-12 2017-02-15 南京航空航天大学 一种基于knn的改进缺失数据填补算法
CN107038460A (zh) * 2017-04-10 2017-08-11 南京航空航天大学 一种基于改进knn的船舶监控数据缺失值填补方法
CN107273445A (zh) * 2017-05-26 2017-10-20 电子科技大学 一种大数据分析中缺失数据混合多重插值的装置和方法
CN107507152A (zh) * 2017-09-13 2017-12-22 鲁东大学 一种基于多图像局部插值的遥感图像缺失数据修复方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
吕爱玲: "传感器网络中不完全数据填充方法研究", 《中国优秀硕士学位论文全文数据库(电子期刊)》 *
朱小栋: "一种基于变尺度滑动窗口的数据流频繁集挖掘算法", 《控制与决策》 *
王馨: "RFID中间件的数据清洗方法研究", 《中国优秀硕士学位论文全文数据库(电子期刊)》 *
蒋晨阳: "基于时空相关性的连续缺失值填补算法", 《计算机与现代化》 *
邱保志: "无线传感器网络中缺失数据估计算法", 《计算机应用》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200302324A1 (en) * 2019-03-20 2020-09-24 Fujitsu Limited Data complementing method, data complementing apparatus, and non-transitory computer-readable storage medium for storing data complementing program
US11562275B2 (en) * 2019-03-20 2023-01-24 Fujitsu Limited Data complementing method, data complementing apparatus, and non-transitory computer-readable storage medium for storing data complementing program
CN110911011A (zh) * 2019-11-27 2020-03-24 医惠科技有限公司 一种脓毒血症的预警装置、设备及存储介质
CN112859793A (zh) * 2021-02-04 2021-05-28 中南大学 基于改进滑动时间窗口的工业生产过程动态时延辨识方法
CN113297191A (zh) * 2021-05-28 2021-08-24 湖南大学 一种网络缺失数据在线填充的流处理方法及系统
CN113297191B (zh) * 2021-05-28 2022-04-05 湖南大学 一种网络缺失数据在线填充的流处理方法及系统
CN113723559A (zh) * 2021-09-08 2021-11-30 湖北天天数链技术有限公司 一种异常值检测方法、装置、电子设备及可读存储介质
CN114634391A (zh) * 2022-03-21 2022-06-17 广东宏大韶化民爆有限公司 一种膨化结晶机的运行状态实时评估方法及系统
CN114634391B (zh) * 2022-03-21 2022-10-11 广东宏大韶化民爆有限公司 一种膨化结晶机的运行状态实时评估方法及系统
CN117520011A (zh) * 2023-11-09 2024-02-06 中国三峡建工(集团)有限公司 一种实时数据内存的共享管理方法及系统

Also Published As

Publication number Publication date
CN108650065B (zh) 2021-09-10

Similar Documents

Publication Publication Date Title
CN108650065A (zh) 基于窗口的流式数据缺失处理方法
CN108921051B (zh) 基于循环神经网络注意力模型的行人属性识别网络及技术
AU2018101946A4 (en) Geographical multivariate flow data spatio-temporal autocorrelation analysis method based on cellular automaton
Bhatti et al. Outlier detection in indoor localization and Internet of Things (IoT) using machine learning
Abdalzaher et al. A deep learning model for earthquake parameters observation in IoT system-based earthquake early warning
Kersten et al. Unsupervised classification of polarimetric synthetic aperture radar images using fuzzy clustering and EM clustering
Mugglin et al. Hierarchical statistical modelling of influenza epidemic dynamics in space and time
Yuan et al. Multivariate spatiotemporal hawkes processes and network reconstruction
CN110213244A (zh) 一种基于时空特征融合的网络入侵检测方法
CN111783589B (zh) 基于场景分类和多尺度特征融合的复杂场景人群计数方法
Nie et al. Network traffic prediction in industrial Internet of Things backbone networks: A multitask learning mechanism
Xie et al. Accurate recovery of missing network measurement data with localized tensor completion
CN103473786A (zh) 基于多目标模糊聚类的灰度图像分割方法
CN102752784B (zh) 无线传感器网络中基于图论的分布式事件域的检测方法
CN105323024B (zh) 一种网络信号强度检测及融合方法
CN113642403B (zh) 基于边缘计算的人群异动智能安全检测系统
CN107333294A (zh) 一种结合AdaBoost和支持向量机的链路质量预测方法
CN109919921B (zh) 基于生成对抗网络的环境影响程度建模方法
CN113051604B (zh) 一种基于生成式对抗网络的涉密地理表格类数据保护方法
CN110287798A (zh) 基于特征模块化和上下文融合的矢量网络行人检测方法
CN106815563A (zh) 一种基于人体表观结构的人群数量预测方法
CN108320027B (zh) 一种基于量子计算的大数据处理方法
Fouedjio Clustering of multivariate geostatistical data
Zhang et al. Duplicate report detection in urban crowdsensing applications for smart city
CN111865690B (zh) 基于网络结构和时序的机会网络链路预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant