CN108090558B - 一种基于长短期记忆网络的时间序列缺失值自动填补方法 - Google Patents

一种基于长短期记忆网络的时间序列缺失值自动填补方法 Download PDF

Info

Publication number
CN108090558B
CN108090558B CN201810004118.XA CN201810004118A CN108090558B CN 108090558 B CN108090558 B CN 108090558B CN 201810004118 A CN201810004118 A CN 201810004118A CN 108090558 B CN108090558 B CN 108090558B
Authority
CN
China
Prior art keywords
value
missing
rsu
time
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810004118.XA
Other languages
English (en)
Other versions
CN108090558A (zh
Inventor
马千里
沈礼锋
李森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201810004118.XA priority Critical patent/CN108090558B/zh
Publication of CN108090558A publication Critical patent/CN108090558A/zh
Application granted granted Critical
Publication of CN108090558B publication Critical patent/CN108090558B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于长短期记忆网络的时间序列缺失值自动填补方法,包括以下步骤:获取没有缺失值的原数据集,并进行预处理;按照给定的缺失率随机删除某些值构成含有不同缺失率的缺失数据集;根据深度残差网络与图结构依赖的思想,引入基于图依赖的残差连接到LSTM模型,形成RSU,同时将LSTM模型的每一时刻的隐藏状态和RSU的历史状态信息进行融合与传递;训练构建的新模型,在网络训练前向传播过程中根据数据是否缺失利用RSU的值进行填补。RSU整合了先前的残差和隐藏的状态信息,使得构建的模型能够关联足够多的关于缺失数据历史信息,同时实现了对含缺失值的时序数据可端到端含缺失值训练的过程。

Description

一种基于长短期记忆网络的时间序列缺失值自动填补方法
技术领域
本发明涉及时间序列缺失值自动填补的技术领域,特别是涉及一种基于长短期记忆网络可端到端学习含缺失值数据的时间序列缺失值自动填补方法。
背景技术
时间序列是实际应用中最常见的数据形式之一,包括气象,健康和医疗,动作捕捉,金融市场和城市交通管制等。然而,这些实际的时间序列数据不可避免地由于传感器故障而包含缺失值。一般处理缺失值的方法有零填补,均值填补,多项式拟合方法或者EM算法等等对缺失值进行填补。
然而与静态数据填补相比,时间序列填补是一项非常具有挑战性的任务。因为缺失值与其先前的值往往存在非线性和动态的相关性,利用传统的数据填补方法很可能会造成很大的误差。如果数据缺失比例较大,传统方法更难对于在该种情况下的非线性和动态的相关性进行有效的时序建模。
在现有的研究中,Anava等人使用自回归模型来处理在线时间序列的缺失值,他们假设缺失值可以表示为其以前的非缺失值和缺失值的递归自回归形式。类似地,Dhillon等人提出的时序正则化矩阵分解(Temporal Regularized Matrix Factorization,TRMF)模型使用自回归来模拟相应的潜在变量之间的时间依赖性,他们将这种自回归的结构概括为一个图,用于在不同阶段建立缺失值和其先前的非缺失值的依赖关系,但是这依赖于人的先验知识,需要手工设计图的结构。除了上述基于图的方法之外,长短期记忆网络(LongShort-Term Memory,LSTM)也可以用于建立时间的转态转换关系,然而传统的LSTM模型无法处理含有缺失值的时间序列数据,从而不能进行端到端的网络训练。
因此,亟待提出一种面向时间序列缺失值自动填补的可端到端学习的神经网络模型,并期待获得优于传统填补方法的实验效果。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,提供一种基于长短期记忆网络的时间序列缺失值自动填补方法。
本发明的目的可以通过采取如下技术方案达到:
一种基于长短期记忆网络的时间序列缺失值自动填补方法,所述的时间序列缺失值填补方法包括下列步骤:
S1、获取时间序列数据集,对数据进行预处理;
S2、对预处理后的数据按照给定的缺失率随机删除某些值构成含有不同缺失率的数据集;
S3、将基于图依赖的残差连接引入到LSTM模型,形成RSU,同时将LSTM模型的每一时刻的隐藏状态和RSU的历史状态信息进行融合;
S4、训练步骤S3中构建的LSTM模型,在网络训练的前向传播过程中,如果下一个时刻输入值已知,则训练输出的RSU值乘以一个权值矩阵去近似下一时刻输入值;如果下一个时刻输入值缺失,将当前的RSU值乘以相同的权值矩阵去填补该缺失值;在网络训练的反向传播过程中,如果当前时刻的目标值缺失,该时刻的损失不加入到网络总的损失函数中去;
S5、基于训练后的LSTM模型对含缺失值的时序数据进行填补形成完整数据集。
进一步地,所述的时间序列缺失值填补方法还包括有效性检验步骤,过程如下:
计算原真实数据集和填补后数据之间的均方根误差RMSE,并且和传统的数据填补方法进行结果的比较,以此检验LSTM模型的有效性。
进一步地,所述的步骤S3中RSU的计算方式与LSTM模型的隐藏状态和RSU的历史状态信息进行融合过程如下:
Figure BDA0001538043940000031
其中,g和f是恒等映射函数,ht定义为t时刻LSTM模型单元输出的隐藏值,rt定义为t时刻残差和单元RSU的值,f(ht+g(Wrrt-1))定义为t时刻LSTM模型的隐藏状态和RSU的历史状态信息进行融合的过程,
Figure BDA0001538043940000032
是参数矩阵,
Figure BDA0001538043940000033
是引入基于图依赖的残差连接。
进一步地,所述的步骤S4中的训练过程如下:
S401、网络训练前向传播过程分为两种情况:近似过程和填补过程,如果下一个时刻输入值xt已知,则训练残差和单元RSU输出的值rt-1乘以一个权值矩阵Wimp得到的zt-1近似下一个时刻输入值xt;如果下一个输入值xt是缺失值,则用zt-1填补xt,其中zt-1定义如下公式:
zt-1=Wimprt-1
并且根据当前的输入是否为缺失值,用一个统一的形式ut来表示当前的输入值:
Figure BDA0001538043940000034
其中,
Figure BDA0001538043940000035
Figure BDA0001538043940000036
分别表示逐元素的乘法和加法,I{xt}表示指示函数,返回一个n维二进制向量表示当前输入值xt的缺失属性情况,因此,如果xt已知,则xt正常作为网络的输入值;如果xt是缺失值,则将zt-1作为网络的输入值;
S402、根据上述的定义,LSTM模型的前向传播过程隐藏状态ht的更新公式为:
it=σ(Wi[ht-1,ut]+bi)
ft=σ(Wf[ht-1,ut]+bf)
ot=σ(Wo[ht-1,ut]+bo)
Figure BDA0001538043940000041
Figure BDA0001538043940000042
Figure BDA0001538043940000043
其中,Wi,Wf,Wo,Wc,bi,bf,bo,bc代表可学习参数,it,ft,ot,
Figure BDA0001538043940000044
ct分别代表在t时刻输入门、遗忘门、输出门、当前新知识与当前记忆的数值,σ(·)和tanh(·)分别代表sigmoid和双曲函数;
S403、在网络训练的反向传播过程中,定义时刻t损失函数的计算方式如下:
Figure BDA0001538043940000045
其中I{xt}表示指示函数,t=2,3,…,T,该函数表示如果当前时刻的目标值缺失,则不计算该时刻的损失,从而使得反向传播过程得以正常进行;
S404、如果定义上标k表示时间序列集合的第k个样本,k=1,2,3,…,T,则整体训练损失函数计算方式如下:
Figure BDA0001538043940000051
其中d(k)表示第k个样本值,
Figure BDA0001538043940000052
的第二项表示任务相关的损失函数,最后一项的
Figure BDA0001538043940000053
表示正则项;
S405、根据上述定义的损失函数,利用BPTT算法来最小化损失函数,以达到最优化网络参数。
进一步地,所述的均方根误差RMSE的计算方式为
Figure BDA0001538043940000054
其中,n代表缺失值的数量,
Figure BDA0001538043940000055
Figure BDA0001538043940000056
分别代表第i个缺失值相对应的真实值和填补值。
本发明相对于现有技术具有如下的优点及效果:
1、本发明以可端到端含缺失值的网络训练方式处理含有缺失值的时间序列,真正实现了含缺失值的网络训练方式。
2、本发明中引入了基于图的残差连接直接考虑了缺失值和其之前的缺失值的关联性,避免了手工设计图依赖结构。
附图说明
图1是本发明中面向时间序列缺失值自动填补的可端到端学习的长短期记忆网络模型的具体流程图;
图2是本发明中面向时间序列缺失值自动填补的可端到端学习的长短期记忆网络模型的结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
如图1所示,本实施例公开了一种基于长短期记忆网络的时间序列缺失值自动填补方法包括以下步骤:
步骤S1、获取时间序列训练数据集,对数据进行预处理。数据集分别采用人工合成的数据集和现实世界真实的数据集来对模型进行检测。人工合成的数据集采用的是Sanitycheck数据集,这是由五阶自回归方程合成的时间序列,自回归方程如下:
Figure BDA0001538043940000061
其中,φ0和自回归系数{φi}(i∈1,…5)分别设置为{0,0.6,-0.5,0.4,-0.4,0.3},{εt}是噪声并且服从正态分布N(0,0.032)。{xi}(i∈1,2,…5)初始化为1,2,3,4,5,该时间序列数据集长度为496。真实的数据集采用的是从1956年至1970年阿苏萨(Azuza)每月的臭氧浓度,并对其进行均值归一化处理,该真实数据集共有180条记录。
步骤S2、对步骤S1中的数据按照给定的缺失率随机删除某些值构成含有不同缺失率的数据集。缺失率定义为缺失数据个数占原数据总数的比例,本实施例缺失率设定为从10%提高到30%,其中增幅为5%。
步骤S3、将基于图依赖的残差连接引入到长短期记忆网络(Long Short-TermMemory,LSTM)模型,形成残差和单元(Residual Sum Unit,RSU),同时将LSTM模型的每一时刻的隐藏状态和RSU的历史状态信息进行融合。
残差和单元RSU的定义与融合过程如下:
Figure BDA0001538043940000071
其中,g和f是恒等映射函数,ht定义为t时刻LSTM模型单元输出的隐藏值,rt定义为t时刻残差和单元RSU的值,f(ht+g(Wrrt-1))定义为t时刻LSTM模型的隐藏状态和RSU的历史状态信息进行融合的过程,Wr∈Rm×m是参数矩阵。Wrrt-1∈Rm是引入基于图依赖的残差连接。
步骤S4、训练步骤S3中构建的模型,在网络训练的前向传播过程中,如果下一个时刻输入值已知,则训练输出的RSU值乘以一个权值矩阵去近似下一时刻输入值;如果下一个时刻输入值缺失,将当前的RSU值乘以相同的权值矩阵去填补该缺失值。在网络训练的反向传播过程中,如果当前时刻的目标值缺失,该时刻的损失不加入到网络总的损失函数中去。具体的训练过如下:
S401、网络训练前向传播过程分为两种情况:近似过程和填补过程。如图2所示,虚线圆代表残差和单元,实线圆代表已知输入值,M代表缺失值,黑色实心圆的代表任务相关的输出。黑色虚线表示的是近似过程,黑色实线表示的是填补过程。如果下一个时刻输入值xt已知,则训练残差和单元RSU输出的值乘以一个权值矩阵Wimp得到的zt-1近似下一个时刻输入值xt,旨在利用序列中不缺失的值来指导网络进行有效学习;如果下一个输入值xt是缺失值,则用zt-1填补xt。其中zt-1的定义如下公式:
zt-1=Wimprt-1
并且根据当前的输入是否为缺失值,我们可以用一个统一的形式ut来表示当前的输入值:
Figure BDA0001538043940000081
其中,
Figure BDA0001538043940000082
Figure BDA0001538043940000083
分别表示逐元素的乘法和加法,I{xt}表示指示函数,返回一个n维二进制向量表示当前输入值xt的缺失属性情况。因此,如果xt已知,则xt正常作为网络的输入值;如果xt是缺失值,则将zt-1作为网络的输入值。
S402、根据上述的定义,LSTM模型的前向传播过程隐藏状态的更新公式为:
it=σ(Wi[ht-1,ut]+bi)
ft=σ(Wf[ht-1,ut]+bf)
ot=σ(Wo[ht-1,ut]+bo)
Figure BDA0001538043940000084
Figure BDA0001538043940000085
Figure BDA0001538043940000086
S403、在网络训练的反向传播过程中,由于如果当前时刻的目标值缺失,则该时刻的损失是不可定义的。因此,定义时刻t损失函数的计算方式如下:
Figure BDA0001538043940000087
其中I{xt}表示指示函数,t=2,3,…,T。该函数表示了如果当前时刻的目标值缺失,我们不计算该时刻的损失,从而使得反向传播过程得以正常进行。
S404、如果定义上标k表示时间序列集合的第k个样本(k=1,2,3,…,T),则整体训练损失函数计算方式如下:
Figure BDA0001538043940000091
其中d(k)表示第k个样本值,
Figure BDA0001538043940000092
的第二项表示任务相关的损失函数,例如在一个预测任务中,
Figure BDA0001538043940000093
的具体形式为平方损失。最后一项的
Figure BDA0001538043940000094
表示正则项,该模型的训练求解方法和其他的递归神经网络(Recurrent Neural Network,RNN)模型相同。
S405、根据上述定义的损失函数,利用时间反向传播(Backpropagation ThroughTime,BPTT)算法来最小化损失函数,以达到最优化网络参数。
步骤S5、基于训练后的LSTM模型对含缺失值的时序数据进行填补形成完整数据集。
步骤S6、根据步骤S5对于含缺失值的时序数据进行填补完成后的完整数据集,计算原真实数据集和填补后数据之间的均方根误差,并且和传统的数据填补方法进行结果的比较,以此检验模型的有效性。其中均方根误差RMSE计算方式如下:
Figure BDA0001538043940000095
其中n代表缺失值的数量,
Figure BDA0001538043940000101
Figure BDA0001538043940000102
分别代表第i个缺失值相对应的真实值和填补值。
采用相同的数据集,将本发明的实验结果和分别采用传统的多项式拟合填补,EM填补得到实验结果相比较。所得结果如下表1:
表1.实验结果表
Figure BDA0001538043940000103
表中的数据代表均方根误差RMSE的值,由表中可知,无论是合成的数据集还是现实的数据集,在不同的数据缺失率下,本发明的填补误差都是最小的。综上所述,本发明提出的方法能够有效的对时间序列中的缺失值进行填补。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (4)

1.一种基于长短期记忆网络的时间序列缺失值自动填补方法,其特征在于,应用于含缺失值的气象、交通流在内的时空数据的填补,所述的时间序列缺失值填补方法包括下列步骤:
S1、获取气象数据或交通流的时间序列数据集,对数据进行预处理;
S2、对预处理后的数据按照给定的缺失率随机删除某些值构成含有不同缺失率的数据集;
S3、将基于图依赖的残差连接引入到LSTM模型,形成残差和单元,以下残差和单元简称RSU,同时将LSTM模型的每一时刻的隐藏状态和RSU的历史状态信息进行融合,融合过程如下:
Figure FDA0002987676220000011
其中,g和f是恒等映射函数,ht定义为t时刻LSTM模型单元输出的隐藏值,rt定义为t时刻残差和单元RSU的值,f(ht+g(Wrrt-1))定义为t时刻LSTM模型的隐藏状态和RSU的历史状态信息进行融合的过程,
Figure FDA0002987676220000012
是参数矩阵,
Figure FDA0002987676220000013
是引入基于图依赖的残差连接;
S4、训练步骤S3中构建的LSTM模型,在网络训练的前向传播过程中,如果下一个时刻输入值已知,则训练输出的RSU值乘以一个权值矩阵去近似下一时刻输入值;如果下一个时刻输入值缺失,将当前的RSU值乘以相同的权值矩阵去填补该缺失值;在网络训练的反向传播过程中,如果当前时刻的目标值缺失,该时刻的损失不加入到网络总的损失函数中去;
S5、基于训练后的LSTM模型对含缺失值的交通流量时序数据进行填补形成完整数据集。
2.根据权利要求1所述的一种基于长短期记忆网络的时间序列缺失值自动填补方法,其特征在于,所述的时间序列缺失值填补方法还包括有效性检验步骤,过程如下:
计算原真实数据集和填补后数据之间的均方根误差RMSE,并且和传统的数据填补方法进行结果的比较,以此检验LSTM模型的有效性。
3.根据权利要求1所述的一种基于长短期记忆网络的时间序列缺失值自动填补方法,其特征在于,所述的步骤S4中的训练过程如下:
S401、网络训练前向传播过程分为两种情况:近似过程和填补过程,如果下一个时刻输入值xt已知,则训练残差和单元RSU输出的值rt-1乘以一个权值矩阵Wimp得到的zt-1近似下一个时刻输入值xt;如果下一个输入值xt是缺失值,则用zt-1填补xt,其中zt-1定义如下公式:
zt-1=Wimprt-1
并且根据当前的输入是否为缺失值,用一个统一的形式ut来表示当前的输入值:
Figure FDA0002987676220000021
其中,
Figure FDA0002987676220000022
Figure FDA0002987676220000023
分别表示逐元素的乘法和加法,I{xt}表示指示函数,返回一个n维二进制向量表示当前输入值xt的缺失属性情况,因此,如果xt已知,则xt正常作为网络的输入值;如果xt是缺失值,则将zt-1作为网络的输入值;
S402、根据上述的定义,LSTM模型的前向传播过程隐藏状态ht的更新公式为:
it=σ(Wi[ht-1,ut]+bi)
ft=σ(Wf[ht-1,ut]+bf)
ot=σ(Wo[ht-1,ut]+bo)
Figure FDA0002987676220000031
Figure FDA0002987676220000032
Figure FDA0002987676220000033
其中,Wi,Wf,Wo,Wc,bi,bf,bo,bc代表可学习参数,it,ft,ot,
Figure FDA0002987676220000034
ct分别代表在t时刻输入门、遗忘门、输出门、当前新知识与当前记忆的数值,σ(·)和tanh(·)分别代表sigmoid和双曲函数;
S403、在网络训练的反向传播过程中,定义时刻t损失函数的计算方式如下:
Figure FDA0002987676220000035
其中I{xt}表示指示函数,t=2,3,...,T,该函数表示如果当前时刻的目标值缺失,则不计算该时刻的损失,从而使得反向传播过程得以正常进行;
S404、如果定义上标k表示时间序列集合的第k个样本,k=1,2,3,...,T,则整体训练损失函数计算方式如下:
Figure FDA0002987676220000036
其中d(k)表示第k个样本值,
Figure FDA0002987676220000037
的第二项表示任务相关的损失函数,
Figure FDA0002987676220000038
的最后一项的表示正则项;
S405、根据上述定义的损失函数,利用BPTT算法来最小化损失函数,以达到最优化网络参数。
4.根据权利要求2所述的一种基于长短期记忆网络的时间序列缺失值自动填补方法,其特征在于,所述的均方根误差RMSE的计算方式为
Figure FDA0002987676220000041
其中,n代表缺失值的数量,
Figure FDA0002987676220000042
Figure FDA0002987676220000043
分别代表第i个缺失值相对应的真实值和填补值。
CN201810004118.XA 2018-01-03 2018-01-03 一种基于长短期记忆网络的时间序列缺失值自动填补方法 Active CN108090558B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810004118.XA CN108090558B (zh) 2018-01-03 2018-01-03 一种基于长短期记忆网络的时间序列缺失值自动填补方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810004118.XA CN108090558B (zh) 2018-01-03 2018-01-03 一种基于长短期记忆网络的时间序列缺失值自动填补方法

Publications (2)

Publication Number Publication Date
CN108090558A CN108090558A (zh) 2018-05-29
CN108090558B true CN108090558B (zh) 2021-06-08

Family

ID=62181509

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810004118.XA Active CN108090558B (zh) 2018-01-03 2018-01-03 一种基于长短期记忆网络的时间序列缺失值自动填补方法

Country Status (1)

Country Link
CN (1) CN108090558B (zh)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109947812B (zh) * 2018-07-09 2023-11-10 平安科技(深圳)有限公司 连续缺失值填充方法、数据分析装置、终端及存储介质
CN109086737B (zh) * 2018-08-21 2021-11-02 武汉恒视途安科技有限公司 基于卷积神经网络的航运货物监控视频识别方法及系统
CN109583570B (zh) * 2018-11-30 2022-11-29 重庆大学 基于深度学习确定桥梁健康监测系统异常数据来源的方法
CN109726503B (zh) * 2019-01-12 2020-12-18 国电联合动力技术有限公司 缺失数据填补方法及装置
CN109918503B (zh) * 2019-01-29 2020-12-22 华南理工大学 基于动态窗口自注意力机制提取语义特征的槽填充方法
CN110222840B (zh) * 2019-05-17 2023-05-05 中山大学 一种基于注意力机制的集群资源预测方法和装置
CN110457295A (zh) * 2019-07-05 2019-11-15 国网浙江省电力有限公司电力科学研究院 基于社会关系感知的时序数据补全系统
CN110597799B (zh) * 2019-09-17 2023-01-24 上海仪电(集团)有限公司中央研究院 一种时序数据缺失值自动填补方法、系统和设备
CN110767279A (zh) * 2019-10-21 2020-02-07 山东师范大学 基于lstm的电子健康记录缺失数据补全方法及系统
CN110991696B (zh) * 2019-11-04 2022-11-04 广州丰石科技有限公司 一种客流数据缺失填补的方法
CN110781449B (zh) * 2019-11-05 2022-11-25 国网冀北电力有限公司智能配电网中心 用于台区线损计算的用户数据缺失的估计方法
CN111027591B (zh) * 2019-11-13 2022-07-12 西安交通大学 一种面向大规模集群系统的节点故障预测方法
CN110837888A (zh) * 2019-11-13 2020-02-25 大连理工大学 一种基于双向循环神经网络的交通缺失数据补全方法
CN111257754B (zh) * 2020-03-23 2021-03-16 北京航空航天大学 一种基于plstm序列映射的电池soc鲁棒评估方法
CN111597175B (zh) * 2020-05-06 2023-06-02 天津大学 融合时空信息的传感器缺失值的填充方法
CN111651935B (zh) * 2020-05-25 2023-04-18 成都千嘉科技股份有限公司 一种非平稳时间序列数据的多维度扩充预测方法与装置
CN111753911A (zh) * 2020-06-28 2020-10-09 北京百度网讯科技有限公司 用于融合模型的方法和装置
CN112231307A (zh) * 2020-09-18 2021-01-15 苏州冷王网络科技有限公司 一种基于lstm的冷链监测温湿度数据拟合方法
CN112164468B (zh) * 2020-10-09 2023-04-07 北京航空航天大学 一种孕期检查数据的缺失数据处理方法
CN112417000B (zh) * 2020-11-18 2022-01-07 杭州电子科技大学 一种基于双向循环编解码器神经网络的时间序列缺失值填充方法
CN112381171B (zh) * 2020-11-25 2023-04-07 河海大学 一种基于组合模型的多传感器节点缺失数据填充方法
CN112527862A (zh) * 2020-12-10 2021-03-19 国网河北省电力有限公司雄安新区供电公司 一种时间序列数据的处理方法及装置
CN112712855B (zh) * 2020-12-28 2022-09-20 华南理工大学 一种基于联合训练的含缺失值基因微阵列的聚类方法
CN112948743B (zh) * 2021-03-26 2022-05-03 重庆邮电大学 一种基于时空融合的煤矿瓦斯浓度缺失值填充方法
CN113298131B (zh) * 2021-05-17 2022-08-05 南京邮电大学 一种基于注意力机制的时序数据缺失值插补方法
CN113392139B (zh) * 2021-06-04 2023-10-20 中国科学院计算技术研究所 一种基于关联融合的环境监测数据补全方法及系统
CN113313194B (zh) * 2021-06-17 2023-04-07 西北工业大学 一种基于线性插值偏差的推进剂制备数据缺失值填补方法
CN115935807B (zh) * 2021-06-28 2024-06-14 山东华科信息技术有限公司 基于图马尔可夫神经网络的诊断模型的训练方法
CN113554105B (zh) * 2021-07-28 2023-04-18 桂林电子科技大学 一种基于时空融合的物联网缺失数据补全方法
CN113554106B (zh) * 2021-07-28 2022-03-18 桂林电子科技大学 一种面向电力缺失数据的协同补全方法
CN113569972A (zh) * 2021-08-03 2021-10-29 中国科学院地理科学与资源研究所 气象数据插补方法、装置、电子设备及存储介质
CN113960925A (zh) * 2021-08-30 2022-01-21 中科苏州微电子产业技术研究院 基于人工智能的楼宇能耗控制方法及装置
CN114037551A (zh) * 2021-11-15 2022-02-11 中国水产科学研究院渔业机械仪器研究所 池塘养殖pH值缺失数据插补方法
CN114118373A (zh) * 2021-11-25 2022-03-01 福州大学 基于回声状态网络的多维时间序列缺失补全方法
CN114238297A (zh) * 2021-12-15 2022-03-25 华北电力大学 一种风机运行缺失数据填补方法、装置、电子设备及介质
CN114328742B (zh) * 2021-12-31 2023-02-03 广东泰迪智能科技股份有限公司 一种中央空调的缺失数据预处理方法
CN114595427B (zh) * 2022-03-10 2024-06-04 华南理工大学 基于非自回归模型的含缺失值车辆轨迹序列填补修复方法
CN114944057B (zh) * 2022-04-21 2023-07-25 中山大学 一种路网交通流量数据的修复方法与系统
CN116129148B (zh) * 2023-04-19 2023-06-27 清华大学 一种数据处理方法、装置、电子设备及存储介质
CN116502544B (zh) * 2023-06-26 2023-09-12 武汉新威奇科技有限公司 一种基于数据融合的电动螺旋压力机寿命预测方法及系统
CN116933055B (zh) * 2023-07-21 2024-04-16 重庆邮电大学 一种基于大数据的短视频用户点击预测方法
CN116953677A (zh) * 2023-09-18 2023-10-27 海底鹰深海科技股份有限公司 基于深度学习的声呐目标识别算法
CN117390502A (zh) * 2023-12-13 2024-01-12 国网江苏省电力有限公司苏州供电分公司 一种基于ResIOFNN网络的电压数据缺失值填补方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102034350A (zh) * 2009-09-30 2011-04-27 北京四通智能交通系统集成有限公司 交通流数据短时预测方法及系统
CN103473408A (zh) * 2013-08-28 2013-12-25 河南大学 一种融合时空信息的气温缺失记录重建方法
WO2014160388A1 (en) * 2013-03-14 2014-10-02 Hrl Laboratories, Llc Predicting system trajectories toward critical transitions
CN106650813A (zh) * 2016-12-27 2017-05-10 华南理工大学 一种基于深度残差网络和lstm的图像理解方法
CN107330410A (zh) * 2017-07-03 2017-11-07 南京工程学院 复杂环境下基于深度学习的异常检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9098801B2 (en) * 2012-12-17 2015-08-04 John L. Breckenridge Time series classifying memory, systems and methods

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102034350A (zh) * 2009-09-30 2011-04-27 北京四通智能交通系统集成有限公司 交通流数据短时预测方法及系统
WO2014160388A1 (en) * 2013-03-14 2014-10-02 Hrl Laboratories, Llc Predicting system trajectories toward critical transitions
CN103473408A (zh) * 2013-08-28 2013-12-25 河南大学 一种融合时空信息的气温缺失记录重建方法
CN106650813A (zh) * 2016-12-27 2017-05-10 华南理工大学 一种基于深度残差网络和lstm的图像理解方法
CN107330410A (zh) * 2017-07-03 2017-11-07 南京工程学院 复杂环境下基于深度学习的异常检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
《End-to-End Time Series Imputation via Residual Short Paths》;Lifeng Shen et al;;《Proceedings of Machine Learning Research》;20181031;第248-263页; *
《High-dimensional Time Series Prediction with Missing Values》;Hsiang-Fu Yu et al;;《arXiv:1509.08333v3 [cs.LG]》;20160217;第1-16页; *
《具有超父结点时间序列贝叶斯网络集成回归模型》;王双成 等;;《计算机学报》;20171231;第40卷(第12期);第2748-2761页; *

Also Published As

Publication number Publication date
CN108090558A (zh) 2018-05-29

Similar Documents

Publication Publication Date Title
CN108090558B (zh) 一种基于长短期记忆网络的时间序列缺失值自动填补方法
US20230325557A1 (en) Estimating physical parameters of a physical system based on a spatial-temporal emulator
CN111639787A (zh) 一种基于图卷积网络的时空数据预测方法
Tencaliec et al. Flexible semiparametric generalized Pareto modeling of the entire range of rainfall amount
CN111563706A (zh) 一种基于lstm网络的多变量物流货运量预测方法
CN110223509B (zh) 一种基于贝叶斯增强张量的缺失交通数据修复方法
US11954579B2 (en) Synaptic weight training method, target identification method, electronic device and medium
CN113379071B (zh) 一种基于联邦学习的噪声标签修正方法
CN115545334A (zh) 土地利用类型预测方法、装置、电子设备及存储介质
CN110688484B (zh) 一种基于不平衡贝叶斯分类的微博敏感事件言论检测方法
CN115902806A (zh) 一种基于多模态的雷达回波外推方法
Robati et al. Inflation rate modeling: adaptive neuro-fuzzy inference system approach and particle swarm optimization algorithm (ANFIS-PSO)
Kathmann Neural networks for the mass appraisal of real estate
Galán et al. Reforestation planning using Bayesian networks
CN110852415B (zh) 基于神经网络算法的植被指数预测方法、系统及设备
CN110986946A (zh) 一种动态位姿估计方法及装置
CN115860802A (zh) 产品价值预测方法、装置、计算机设备和存储介质
CN116306277A (zh) 一种滑坡位移预测方法、装置及相关组件
EP3477493A1 (en) Machine learning system
Vidyarthi et al. Does ANN really acquire the physics of the system? A study using conceptual components from an established water balance model
KR20190129422A (ko) 뉴럴 네트워크를 이용한 변분 추론 방법 및 장치
CN114819325A (zh) 基于图神经网络的成绩预测方法、系统、装置及存储介质
CN114611673A (zh) 神经网络压缩方法、装置、设备及可读存储介质
CN111626472A (zh) 一种基于深度混合云模型的场景趋势判断指标计算系统及方法
CN117909658B (zh) 一种基于循环神经网络的插补方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant