CN112179455A - 一种基于双向lstm的超声波水表数据修复方法 - Google Patents

一种基于双向lstm的超声波水表数据修复方法 Download PDF

Info

Publication number
CN112179455A
CN112179455A CN202010869973.4A CN202010869973A CN112179455A CN 112179455 A CN112179455 A CN 112179455A CN 202010869973 A CN202010869973 A CN 202010869973A CN 112179455 A CN112179455 A CN 112179455A
Authority
CN
China
Prior art keywords
representing
output
input
gate
water meter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010869973.4A
Other languages
English (en)
Inventor
付明磊
范婷超
张文安
仇翔
郑乐进
吴德
周力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Laison Technology Co ltd
Zhejiang University of Technology ZJUT
Original Assignee
Hangzhou Laison Technology Co ltd
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Laison Technology Co ltd, Zhejiang University of Technology ZJUT filed Critical Hangzhou Laison Technology Co ltd
Priority to CN202010869973.4A priority Critical patent/CN112179455A/zh
Publication of CN112179455A publication Critical patent/CN112179455A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01FMEASURING VOLUME, VOLUME FLOW, MASS FLOW OR LIQUID LEVEL; METERING BY VOLUME
    • G01F25/00Testing or calibration of apparatus for measuring volume, volume flow or liquid level or for metering by volume
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01FMEASURING VOLUME, VOLUME FLOW, MASS FLOW OR LIQUID LEVEL; METERING BY VOLUME
    • G01F1/00Measuring the volume flow or mass flow of fluid or fluent solid material wherein the fluid passes through a meter in a continuous flow
    • G01F1/66Measuring the volume flow or mass flow of fluid or fluent solid material wherein the fluid passes through a meter in a continuous flow by measuring frequency, phase shift or propagation time of electromagnetic or other waves, e.g. using ultrasonic flowmeters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Abstract

一种基于双向LSTM的超声波水表数据修复方法,通过超声波水表时间芯片计算超声波飞行时间差,获得超声波水表时间序列原始数据rm,采用动态阈值法对上述超声波水表时序数据集进行异常值筛选;进行超声波水表时序数据预处理,剔除数据集中的异常数值,并根据LSTM模型特征进行训练集、测试集的配置;采用自适应矩估计法对双向LSTM中的正、反LSTM网络进行优化参数设置;构建双向LSTM模型,结合超声波水表时序数据,进行双向LSTM模型训练;将超声波水表时序的测试集导入训练完成的双向LSTM模型中,输出yt的预测值Yt。本发明提供一种修复精度较高、修复效率较高的基于双向LSTM的超声波水表数据修复方法。

Description

一种基于双向LSTM的超声波水表数据修复方法
技术领域
本发明属于超声波水表数据处理领域,尤其涉及一种基于双向LSTM的超声波水表数据修复方法。
背景技术
物联网时代来临,传统的机械式水表逐渐被智能水表取代。其中,超声波水表是智能水表中备受关注的产品。超声波水表和超声波流量计测量的数据都属于时间序列数据(简称时序数据)。在实际工作中,外界环境变化、传感器损坏、系统故障、人为失误等因素,都可能使得获得的数据存在异常值、缺失和损坏等情况,从而导致数据质量的降低。这对于超声波测量数据的处理、分析和挖掘都会造成不利的影响。所以,对时序数据异常数据的修复是一个重要的技术问题,具有较强的实用性。
目前国内外在时序数据上做得较多的工作是利用时序数据进行预测。通过对目标自身时间序列的分析,建立体现其动态依存关系的数学模型,研究其变化趋势,从而探知某现象随时间的变化规律,推测所分析变量未来发展走向。同时也提高工作的主动性和预见性,避免盲目性。
现有对超声波水表时序数据的修复方法主要是利用整体时序数据的平均值、中值等去修复,或者通过构建算法模型(如卡尔曼滤波模型)预测异常值的数据。前者往往精度不高,只适用于幅值变化较小数据;后者通常复杂度较高,只适用于小范围数据修复且效率低。
发明内容
为了克服现有超声波水表时序数据修复方法的修复精度较低、修复效率较低的不足,本发明提供一种修复精度较高、修复效率较高的基于双向LSTM的超声波水表数据修复方法。
本发明解决其技术问题所采用的技术方案是:
一种基于双向LSTM的超声波水表数据修复方法,包括以下步骤:
步骤1:通过超声波水表时间芯片计算超声波飞行时间差,获得超声波水表时间序列原始数据rm,其中1<m≤M,M表示超声波水表在测试时段内测量所得时序数据集的总数,采用动态阈值法对上述超声波水表时序数据集进行异常值筛选;
步骤2:进行超声波水表时序数据预处理,剔除数据集中的异常数值,并根据LSTM模型特征进行训练集、测试集的配置;
步骤3:采用自适应矩估计法(Adam)对双向LSTM中的正、反LSTM网络进行优化参数设置,过程如下:
步骤3.1:结合超声波水表时序数据,采用Adam算法,对正向LSTM网络的优化参数进行设置;
步骤3.2:结合超声波水表时序数据,采用Adam算法,对反向LSTM网络的优化参数进行设置;
步骤4:构建双向LSTM模型,结合超声波水表时序数据,进行双向LSTM模型训练;
步骤5:将超声波水表时序的测试集导入训练完成的双向LSTM模型中,输出yt的预测值Yt
进一步,所述步骤1的处理过程如下:
步骤1.1:采用加权移动平均法计算超声波水表时序数据的动态平均值,其计算公式如下:
Figure BDA0002650745790000021
其中,μm表示rm处的动态平均值;2N+1为加权移动平均值计算所选数据段周期;vn(-N≤n≤N)表示各项的权值;N的值及各项权值,根据超声波水表时序数据量及数据特征进行设置;
步骤1.2:定义所选数据段的平均权值为rm处的平均权值,记为
Figure BDA0002650745790000031
采用加权标准差法计算超声波水表时序数据的动态标准差,其计算公式如下:
Figure BDA0002650745790000032
步骤1.3:结合上述动态平均值、动态标准差,采用3σ准则设置超声波水表时序数据的动态阈值,定义:
Figure BDA0002650745790000033
Figure BDA0002650745790000034
其中,maxm表示rm处动态阈值范围的上边界;minm表示rm处动态阈值范围的下边界;
步骤1.4:结合上述动态阈值,若minm≤rm≤maxm,那么rm判定为正常数据,无需修复;若rm<minm或rm>maxm,那么rm判定为异常数据,需要进行修复。
再进一步,所述步骤2的处理过程如下:
步骤2.1:剔除超声波水表时序数据集中的异常数值,其判定方式如下:
Figure BDA0002650745790000035
步骤2.2:根据超声波水表时序数据集的数据特征及LSTM模型对训练集的基础要求,选取适合时长的数据集作为训练集,根据上述异常数据判定结果,将异常数值前p项至异常数值后q项(共p+q+1项)作为测试集,并将测试集中数据记为yt,其中1≤t≤p+q+1。
更进一步,所述步骤3的处理过程如下:
步骤3.1:结合超声波水表时序数据,采用Adam算法,对正向LSTM网络的优化参数进行设置;
步骤3.1.1:初始化参数
Figure BDA00026507457900000412
一阶矩估计、二阶矩估计,计算梯度,更新一阶矩估计、二阶矩估计:
m0=0,n0=0,t=0 (6)
Figure BDA0002650745790000041
mt+1=ρ1mt+(1-ρ1)gt+1 (8)
Figure BDA0002650745790000042
其中,gt表示t时刻梯度;
Figure BDA00026507457900000411
表示随即目标函数;mt表示t时刻一阶矩估计;ρ1=0.9表示一阶矩估计衰减指数;nt表示t时刻二阶矩估计;ρ2=0.999表示二阶矩估计衰减指数;
Figure BDA0002650745790000043
表示gt⊙gt
步骤3.1.2:计算偏差修正的一阶矩估计及偏差修正的二阶矩估计:
Figure BDA0002650745790000044
Figure BDA0002650745790000045
其中,
Figure BDA0002650745790000046
表示t时刻偏差修正的一阶矩估计;
Figure BDA0002650745790000047
表示t时刻偏差修正的二阶矩估计;
步骤3.1.3:更新模型参数
Figure BDA00026507457900000413
Figure BDA0002650745790000048
其中,q=0.001表示学习率;ε=10-8表示数值稳定量;
步骤3.2:结合超声波水表时序数据,采用Adam算法,对反向LSTM网络的优化参数进行设置;
步骤3.2.1:初始化参数θ、一阶矩估计、二阶矩估计,计算梯度,更新一阶矩估计、二阶矩估计:
M0=0,N0=0,t=0 (13)
Figure BDA0002650745790000049
Mt+1=ρ1Mt+(1-ρ1)Gt+1 (15)
Figure BDA00026507457900000410
其中,Gt表示t时刻梯度;Q(θ)表示随即目标函数;Mt表示t时刻一阶矩估计;Nt表示t时刻二阶矩估计;
Figure BDA0002650745790000051
表示Gt⊙Gt
步骤3.2.2:计算偏差修正的一阶矩估计及偏差修正的二阶矩估计:
Figure BDA0002650745790000052
Figure BDA0002650745790000053
其中,
Figure BDA0002650745790000054
表示t时刻偏差修正的一阶矩估计;
Figure BDA0002650745790000055
表示t时刻偏差修正的二阶矩估计;
步骤3.2.3:更新模型参数θ:
Figure BDA0002650745790000056
所述步骤4的处理过程如下:
步骤4.1:构建正向LSTM网络,过程如下:
步骤4.1.1:创建神经网络,设置输入层节点数、输出层节点数、隐含层节点数,三者关系满足如下经验公式:
Figure BDA0002650745790000057
其中,hidden1表示隐含层节点数;in1表示输入层节点数;out1表示输出层节点数;α为[1,10]之间的常数;
步骤4.1.2:设置正向LSTM网络输入门、遗忘门及输出门的输入、输出函数,设置Cell单元的当前状态及输出函数:
输入门的输入、输出:
Figure BDA0002650745790000058
Figure BDA0002650745790000059
其中,
Figure BDA00026507457900000510
表示t时刻输入门的输入;wji表示训练样本输入到输入门的权值;
Figure BDA00026507457900000511
表示t时刻训练样本的输入;whi表示隐含层到输入门的权值;
Figure BDA00026507457900000512
表示t-1时刻隐含层的输出;wci表示Cell单元到输入门的权值;
Figure BDA00026507457900000513
表示t-1时刻Cell单元的状态;
Figure BDA00026507457900000514
表示t时刻输入门的输出;f表示门的激活函数;
遗忘门的输入、输出:
Figure BDA0002650745790000061
Figure BDA0002650745790000062
其中,
Figure BDA0002650745790000063
表示t时刻输入门的输入;wjf表示训练样本输入到遗忘门的权值;whf表示隐含层到遗忘门的权值;wcf表示Cell单元到输入门的权值;
Figure BDA0002650745790000064
表示t时刻遗忘门的输出;
首先定义
Figure BDA0002650745790000065
Figure BDA0002650745790000066
Cell单元的当前状态为:
Figure BDA0002650745790000067
其中,wjc表示训练样本输入到Cell单元的权值;whc表示隐含层到Cell单元的权值;
Figure BDA0002650745790000068
表示Cell单元的当前状态;g表示Cell单元的输入激活函数;
输出门的输入、输出:
Figure BDA0002650745790000069
Figure BDA00026507457900000610
其中,
Figure BDA00026507457900000611
表示t时刻输出门的输入;wjo表示训练样本输入到输出门的权值;who表示隐含层到输出门的权值;wco表示Cell单元到输出门的权值;
Figure BDA00026507457900000612
表示t时刻输出门的输出;
Cell单元的输出:
Figure BDA00026507457900000613
其中,h表示Cell单元的输出激活函数;
步骤4.2:构建反向LSTM网络,过程如下:
步骤4.2.1:创建神经网络,设置输入层节点数、输出层节点数、隐含层节点数,三者关系满足如下经验公式:
Figure BDA0002650745790000071
其中,hidden2表示隐含层节点数;in2表示输入层节点数;out2表示输出层节点数;β为[1,10]之间的常数;
步骤4.2.2:设置反向LSTM网络输入门、遗忘门及输出门的输入、输出函数,设置Cell单元的当前状态及输出函数:
输入门的输入、输出:
Figure BDA0002650745790000072
Figure BDA0002650745790000073
其中,
Figure BDA0002650745790000074
表示t时刻输入门的输入;uji表示训练样本输入到输入门的权值;uhi表示隐含层到输入门的权值;
Figure BDA0002650745790000075
表示t+1时刻隐含层的输出;uci表示Cell单元到输入门的权值;
Figure BDA0002650745790000076
表示t+1时刻Cell单元的状态;
Figure BDA0002650745790000077
表示t时刻输入门的输出;F表示门的激活函数;
遗忘门的输入、输出:
Figure BDA0002650745790000078
Figure BDA0002650745790000079
其中,
Figure BDA00026507457900000710
表示t时刻输入门的输入;ujf表示训练样本输入到遗忘门的权值;uhf表示隐含层到遗忘门的权值;ucf表示Cell单元到输入门的权值;
Figure BDA00026507457900000711
表示t时刻遗忘门的输出;
首先定义
Figure BDA00026507457900000712
Figure BDA00026507457900000713
Cell单元的当前状态为:
Figure BDA00026507457900000714
其中,ujc表示训练样本输入到Cell单元的权值;uhc表示隐含层到Cell单元的权值;
Figure BDA00026507457900000715
表示Cell单元的当前状态;G表示Cell单元的输入激活函数;
输出门的输入、输出:
Figure BDA0002650745790000081
Figure BDA0002650745790000082
其中,
Figure BDA0002650745790000083
表示t时刻输出门的输入;ujo表示训练样本输入到输出门的权值;uho表示隐含层到输出门的权值;uco表示Cell单元到输出门的权值;
Figure BDA0002650745790000084
表示t时刻输出门的输出;
Cell单元的输出:
Figure BDA0002650745790000085
其中,H表示Cell单元的输出激活函数;
步骤4.3:设置双向LSTM模型输出层的输入、输出函数:
Figure BDA0002650745790000086
Yt=V(yt) (41)
其中,yt表示输出层的输入;wck表示Cell单元到输出层的权值;uck表示Cell单元到输出层的权值;V表示输出层的输出激活函数;Yt表示t时刻双向LSTM模型输出的预测值;
步骤4.4:结合上述优化参数设置及初始双向LSTM模型,导入超声波水表时序训练数据集,进行双向LSTM模型训练;
步骤4.4.1:正向LSTM网络计算损失函数:
Figure BDA0002650745790000087
其中,yt表示t时刻超声波真实值;
步骤4.4.2:根据双向LSTM模型的误差反向传播调整优化各项权值,定义
Figure BDA0002650745790000088
Figure BDA0002650745790000089
步骤4.4.3:根据正向LSTM网络的误差反向传播调整优化权值,定义
Figure BDA00026507457900000810
Figure BDA00026507457900000811
Figure BDA00026507457900000812
输出门、Cell单元、遗忘门及输入门的误差反向传播为:
Figure BDA0002650745790000091
Figure BDA0002650745790000092
Figure BDA0002650745790000093
Figure BDA0002650745790000094
Figure BDA0002650745790000095
步骤4.4.4:根据反向LSTM模型的误差反向传播调整优化权值,定义
Figure BDA0002650745790000096
Figure BDA0002650745790000097
Figure BDA0002650745790000098
输出门、Cell单元、遗忘门及输入门的误差反向传播为:
Figure BDA0002650745790000099
Figure BDA00026507457900000910
Figure BDA00026507457900000911
Figure BDA00026507457900000912
Figure BDA00026507457900000913
本发明的有益效果表现在:本方法结合双向LSTM预测模型预测值,以其各自准确度作为参考权值,从而得出超声波水表时间序列数据修复值,理论上具有较高可信度。
附图说明
图1是基于时间序列的超声波水表数据修复算法示意图。
图2是双向LSTM模型结构示意图。
图3是正向LSTM网络隐含单元结构示意图。
图4是反向LSTM网络隐含单元结构示意图。
图5是基于时间序列的超声波水表数据修复算法训练流程图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1~图5,一种基于时间序列的超声波水表数据修复方法,包括以下步骤:
步骤1:通过超声波水表时间芯片计算超声波飞行时间差,获得超声波水表时间序列原始数据rm,其中1<m≤M,M表示超声波水表在测试时段内测量所得时序数据集的总数,采用动态阈值法对上述超声波水表时序数据集进行异常值筛选,过程如下:
步骤1.1:采用加权移动平均法计算超声波水表时序数据的动态平均值,其计算公式如下:
Figure BDA0002650745790000101
其中,μm表示rm处的动态平均值;2N+1为加权移动平均值计算所选数据段周期;vn(-N≤n≤N)表示各项的权值;N的值及各项权值,根据超声波水表时序数据量及数据特征进行设置;
步骤1.2:定义所选数据段的平均权值为rm处的平均权值,记为
Figure BDA0002650745790000102
采用加权标准差法计算超声波水表时序数据的动态标准差,其计算公式如下:
Figure BDA0002650745790000103
步骤1.3:结合上述动态平均值、动态标准差,采用3σ准则设置超声波水表时序数据的动态阈值,定义:
Figure BDA0002650745790000104
Figure BDA0002650745790000105
其中,maxm表示rm处动态阈值范围的上边界;minm表示rm处动态阈值范围的下边界;
步骤1.4:结合上述动态阈值,若minm≤rm≤maxm,那么rm判定为正常数据,无需修复;若rm<minm或rm>maxm,那么rm判定为异常数据,需要进行修复;
步骤2:进行超声波水表时序数据预处理,剔除数据集中的异常数值,并根据LSTM模型特征进行训练集、测试集的配置,过程如下:
步骤2.1:剔除超声波水表时序数据集中的异常数值,其判定方式如下:
Figure BDA0002650745790000111
步骤2.2:根据超声波水表时序数据集的数据特征及LSTM模型对训练集的基础要求,选取适合时长的数据集作为训练集。根据上述异常数据判定结果,将异常数值前p项至异常数值后q项(共p+q+1项)作为测试集,并将测试集中数据记为yt,其中1≤t≤p+q+1;
步骤3:采用自适应矩估计法(Adam)对双向LSTM中的正、反LSTM网络进行优化参数设置,过程如下:
步骤3.1:结合超声波水表时序数据,采用Adam算法,对正向LSTM网络的优化参数进行设置;
步骤3.1.1:初始化参数
Figure BDA0002650745790000112
一阶矩估计、二阶矩估计,计算梯度,更新一阶矩估计、二阶矩估计:
m0=0,n0=0,t=0 (6)
Figure BDA0002650745790000113
mt+1=ρ1mt+(1-ρ1)gt+1 (8)
Figure BDA0002650745790000114
其中,gt表示t时刻梯度;
Figure BDA0002650745790000115
表示随即目标函数;mt表示t时刻一阶矩估计;ρ1=0.9表示一阶矩估计衰减指数;nt表示t时刻二阶矩估计;ρ2=0.999表示二阶矩估计衰减指数;
Figure BDA0002650745790000116
表示gt⊙gt
步骤3.1.2:计算偏差修正的一阶矩估计及偏差修正的二阶矩估计:
Figure BDA0002650745790000121
Figure BDA0002650745790000122
其中,
Figure BDA0002650745790000123
表示t时刻偏差修正的一阶矩估计;
Figure BDA0002650745790000124
表示t时刻偏差修正的二阶矩估计;
步骤3.1.3:更新模型参数
Figure BDA0002650745790000125
Figure BDA0002650745790000126
其中,q=0.001表示学习率;ε=10-8表示数值稳定量;
步骤3.2:结合超声波水表时序数据,采用Adam算法,对反向LSTM网络的优化参数进行设置;
步骤3.2.1:初始化参数θ、一阶矩估计、二阶矩估计,计算梯度,更新一阶矩估计、二阶矩估计:
M0=0,N0=0,t=0 (13)
Figure BDA0002650745790000127
Mt+1=ρ1Mt+(1-ρ1)Gt+1 (15)
Figure BDA0002650745790000128
其中,Gt表示t时刻梯度;Q(θ)表示随即目标函数;Mt表示t时刻一阶矩估计;Nt表示t时刻二阶矩估计;
Figure BDA0002650745790000129
表示Gt⊙Gt
步骤3.2.2:计算偏差修正的一阶矩估计及偏差修正的二阶矩估计:
Figure BDA00026507457900001210
Figure BDA00026507457900001211
其中,
Figure BDA00026507457900001212
表示t时刻偏差修正的一阶矩估计;
Figure BDA00026507457900001213
表示t时刻偏差修正的二阶矩估计;
步骤3.2.3:更新模型参数θ:
Figure BDA00026507457900001214
步骤4:构建双向LSTM模型,结合超声波水表时序数据,进行双向LSTM模型训练;
步骤4.1:构建正向LSTM网络:
步骤4.1.1:创建神经网络,设置输入层节点数、输出层节点数、隐含层节点数,三者关系满足如下经验公式:
Figure BDA0002650745790000131
其中,hidden1表示隐含层节点数;in1表示输入层节点数;out1表示输出层节点数;α为[1,10]之间的常数;
步骤4.1.2:设置正向LSTM网络输入门、遗忘门及输出门的输入、输出函数,设置Cell单元的当前状态及输出函数:
输入门的输入、输出:
Figure BDA0002650745790000132
Figure BDA0002650745790000133
其中,
Figure BDA0002650745790000134
表示t时刻输入门的输入;wji表示训练样本输入到输入门的权值;
Figure BDA0002650745790000135
表示t时刻训练样本的输入;whi表示隐含层到输入门的权值;
Figure BDA0002650745790000136
表示t-1时刻隐含层的输出;wci表示Cell单元到输入门的权值;
Figure BDA0002650745790000137
表示t-1时刻Cell单元的状态;
Figure BDA0002650745790000138
表示t时刻输入门的输出;f表示门的激活函数;
遗忘门的输入、输出:
Figure BDA0002650745790000139
Figure BDA00026507457900001310
其中,
Figure BDA00026507457900001311
表示t时刻输入门的输入;wjf表示训练样本输入到遗忘门的权值;whf表示隐含层到遗忘门的权值;wcf表示Cell单元到输入门的权值;
Figure BDA00026507457900001312
表示t时刻遗忘门的输出;
首先定义
Figure BDA00026507457900001313
Figure BDA00026507457900001314
Cell单元的当前状态为:
Figure BDA0002650745790000141
其中,wjc表示训练样本输入到Cell单元的权值;whc表示隐含层到Cell单元的权值;
Figure BDA0002650745790000142
表示Cell单元的当前状态;g表示Cell单元的输入激活函数;
输出门的输入、输出:
Figure BDA0002650745790000143
Figure BDA0002650745790000144
其中,
Figure BDA0002650745790000145
表示t时刻输出门的输入;wjo表示训练样本输入到输出门的权值;who表示隐含层到输出门的权值;wco表示Cell单元到输出门的权值;
Figure BDA0002650745790000146
表示t时刻输出门的输出;
Cell单元的输出:
Figure BDA0002650745790000147
其中,h表示Cell单元的输出激活函数;
步骤4.2:构建反向LSTM网络,过程如下:
步骤4.2.1:创建神经网络,设置输入层节点数、输出层节点数、隐含层节点数,三者关系满足如下经验公式:
Figure BDA0002650745790000148
其中,hidden2表示隐含层节点数;in2表示输入层节点数;out2表示输出层节点数;β为[1,10]之间的常数;
步骤4.2.2:设置反向LSTM网络输入门、遗忘门及输出门的输入、输出函数,设置Cell单元的当前状态及输出函数:
输入门的输入、输出:
Figure BDA0002650745790000149
Figure BDA00026507457900001410
其中,
Figure BDA00026507457900001411
表示t时刻输入门的输入;uji表示训练样本输入到输入门的权值;uhi表示隐含层到输入门的权值;
Figure BDA0002650745790000151
表示t+1时刻隐含层的输出;uci表示Cell单元到输入门的权值;
Figure BDA0002650745790000152
表示t+1时刻Cell单元的状态;
Figure BDA0002650745790000153
表示t时刻输入门的输出;F表示门的激活函数;
遗忘门的输入、输出:
Figure BDA0002650745790000154
Figure BDA0002650745790000155
其中,
Figure BDA0002650745790000156
表示t时刻输入门的输入;ujf表示训练样本输入到遗忘门的权值;uhf表示隐含层到遗忘门的权值;ucf表示Cell单元到输入门的权值;
Figure BDA0002650745790000157
表示t时刻遗忘门的输出;
首先定义
Figure BDA0002650745790000158
Figure BDA0002650745790000159
Cell单元的当前状态为:
Figure BDA00026507457900001510
其中,ujc表示训练样本输入到Cell单元的权值;uhc表示隐含层到Cell单元的权值;
Figure BDA00026507457900001511
表示Cell单元的当前状态;G表示Cell单元的输入激活函数;
输出门的输入、输出:
Figure BDA00026507457900001512
Figure BDA00026507457900001513
其中,
Figure BDA00026507457900001514
表示t时刻输出门的输入;ujo表示训练样本输入到输出门的权值;uho表示隐含层到输出门的权值;uco表示Cell单元到输出门的权值;
Figure BDA00026507457900001515
表示t时刻输出门的输出;
Cell单元的输出:
Figure BDA00026507457900001516
其中,H表示Cell单元的输出激活函数;
步骤4.3:设置双向LSTM模型输出层的输入、输出函数:
Figure BDA0002650745790000161
Yt=V(yt) (41)
其中,yt表示输出层的输入;wck表示Cell单元到输出层的权值;uck表示Cell单元到输出层的权值;V表示输出层的输出激活函数;Yt表示t时刻双向LSTM模型输出的预测值;
步骤4.4:结合上述优化参数设置及初始双向LSTM模型,导入超声波水表时序训练数据集,进行双向LSTM模型训练;
步骤4.4.1:正向LSTM网络计算损失函数:
Figure BDA0002650745790000162
其中,yt表示t时刻超声波真实值;
步骤4.4.2:根据双向LSTM模型的误差反向传播调整优化各项权值,定义
Figure BDA0002650745790000163
Figure BDA0002650745790000164
步骤4.4.3:根据正向LSTM网络的误差反向传播调整优化权值,定义
Figure BDA0002650745790000165
Figure BDA0002650745790000166
Figure BDA0002650745790000167
输出门、Cell单元、遗忘门及输入门的误差反向传播为:
Figure BDA0002650745790000168
Figure BDA0002650745790000169
Figure BDA00026507457900001610
Figure BDA00026507457900001611
Figure BDA00026507457900001612
步骤4.4.4:根据反向LSTM模型的误差反向传播调整优化权值,定义
Figure BDA00026507457900001613
Figure BDA00026507457900001614
Figure BDA00026507457900001615
输出门、Cell单元、遗忘门及输入门的误差反向传播为:
Figure BDA0002650745790000171
Figure BDA0002650745790000172
Figure BDA0002650745790000173
Figure BDA0002650745790000174
Figure BDA0002650745790000175
步骤5:将超声波水表时序的测试集导入训练完成的双向LSTM模型中,输出yt的预测值Yt

Claims (5)

1.一种基于双向LSTM的超声波水表数据修复方法,其特征在于,所述方法包括以下步骤:
步骤1:通过超声波水表时间芯片计算超声波飞行时间差,获得超声波水表时间序列原始数据rm,其中1<m≤M,M表示超声波水表在测试时段内测量所得时序数据集的总数,采用动态阈值法对上述超声波水表时序数据集进行异常值筛选;
步骤2:进行超声波水表时序数据预处理,剔除数据集中的异常数值,并根据LSTM模型特征进行训练集、测试集的配置;
步骤3:采用自适应矩估计法Adam对双向LSTM中的正、反LSTM网络进行优化参数设置,过程如下:
步骤3.1:结合超声波水表时序数据,采用Adam算法,对正向LSTM网络的优化参数进行设置;
步骤3.2:结合超声波水表时序数据,采用Adam算法,对反向LSTM网络的优化参数进行设置;
步骤4:构建双向LSTM模型,结合超声波水表时序数据,进行双向LSTM模型训练;
步骤5:将超声波水表时序的测试集导入训练完成的双向LSTM模型中,输出yt的预测值Yt
2.如权利要求1所述的一种基于双向LSTM的超声波水表数据修复方法,其特征在于,所述步骤1的处理过程如下:
步骤1.1:采用加权移动平均法计算超声波水表时序数据的动态平均值,其计算公式如下:
Figure FDA0002650745780000011
其中,μm表示rm处的动态平均值;2N+1为加权移动平均值计算所选数据段周期;vn表示各项的权值,-N≤n≤N;N的值及各项权值,根据超声波水表时序数据量及数据特征进行设置;
步骤1.2:定义所选数据段的平均权值为rm处的平均权值,记为
Figure FDA0002650745780000012
采用加权标准差法计算超声波水表时序数据的动态标准差,其计算公式如下:
Figure FDA0002650745780000013
步骤1.3:结合上述动态平均值、动态标准差,采用3准则设置超声波水表时序数据的动态阈值,定义:
Figure FDA0002650745780000014
Figure FDA0002650745780000015
其中,maxm表示rm处动态阈值范围的上边界;minm表示rm处动态阈值范围的下边界;
步骤1.4:结合上述动态阈值,若minm≤rm≤maxm,那么rm判定为正常数据,无需修复;若rm<minm或rm>maxm,那么rm判定为异常数据,需要进行修复。
3.如权利要求2所述的一种基于双向LSTM的超声波水表数据修复方法,其特征在于,所述步骤2的处理过程如下:
步骤2.1:剔除超声波水表时序数据集中的异常数值,其判定方式如下:
Figure FDA0002650745780000021
步骤2.2:根据超声波水表时序数据集的数据特征及LSTM模型对训练集的基础要求,选取适合时长的数据集作为训练集,根据上述异常数据判定结果,将异常数值前p项至异常数值后q项(共p+q+1项)作为测试集,并将测试集中数据记为yt,其中1≤t≤p+q+1。
4.如权利要求3所述的一种基于双向LSTM的超声波水表数据修复方法,其特征在于,所述步骤3的处理过程如下:
步骤3.1:结合超声波水表时序数据,采用Adam算法,对正向LSTM网络的优化参数进行设置;
步骤3.1.1:初始化参数θ、一阶矩估计、二阶矩估计,计算梯度,更新一阶矩估计、二阶矩估计:
m0=0,n0=0,t=0 (6)
Figure FDA0002650745780000022
mt+1=ρ1mt+(1-ρ1)gt+1 (8)
Figure FDA0002650745780000023
其中,gt表示t时刻梯度;
Figure FDA00026507457800000214
表示随即目标函数;mt表示时刻一阶矩估计;ρ1=0.9表示一阶矩估计衰减指数;nt表示t时刻二阶矩估计;ρ2=0.999表示二阶矩估计衰减指数;
Figure FDA0002650745780000024
表示gt⊙gt
步骤3.1.2:计算偏差修正的一阶矩估计及偏差修正的二阶矩估计:
Figure FDA0002650745780000025
Figure FDA0002650745780000026
其中,
Figure FDA0002650745780000027
表示t时刻偏差修正的一阶矩估计;
Figure FDA0002650745780000028
表示t时刻偏差修正的二阶矩估计;
步骤3.1.3:更新模型参数
Figure FDA00026507457800000215
Figure FDA0002650745780000029
其中,q=0.001表示学习率;ε=10-8表示数值稳定量;
步骤3.2:结合超声波水表时序数据,采用Adam算法,对反向LSTM网络的优化参数进行设置;
步骤3.2.1:初始化参数θ、一阶矩估计、二阶矩估计,计算梯度,更新一阶矩估计、二阶矩估计:
M0=0,N0=0,t=0 (13)
Figure FDA00026507457800000210
Mt+1=ρ1Mt+(1-ρ1)Gt+1 (15)
Figure FDA00026507457800000211
其中,Gt表示时刻梯度;Q(θ)表示随即目标函数;Mt表示时刻一阶矩估计;Nt表示t时刻二阶矩估计;
Figure FDA00026507457800000212
表示Gt⊙Gt
步骤3.2.2:计算偏差修正的一阶矩估计及偏差修正的二阶矩估计:
Figure FDA00026507457800000213
Figure FDA0002650745780000031
其中,
Figure FDA0002650745780000032
表示t时刻偏差修正的一阶矩估计;
Figure FDA0002650745780000033
表示t时刻偏差修正的二阶矩估计;
步骤3.2.3:更新模型参数θ:
Figure FDA0002650745780000034
5.如权利要求4所述的一种基于双向LSTM的超声波水表数据修复方法,其特征在于,所述步骤4的处理过程如下:
步骤4.1:构建正向LSTM网络,过程如下:
步骤4.1.1:创建神经网络,设置输入层节点数、输出层节点数、隐含层节点数,三者关系满足如下经验公式:
Figure FDA0002650745780000035
其中,hidden1表示隐含层节点数;in1表示输入层节点数;out1表示输出层节点数;α为[1,10]之间的常数;
步骤4.1.2:设置正向LSTM网络输入门、遗忘门及输出门的输入、输出函数,设置Cell单元的当前状态及输出函数:
输入门的输入、输出:
Figure FDA0002650745780000036
Figure FDA0002650745780000037
其中,
Figure FDA0002650745780000038
表示时刻输入门的输入;wji表示训练样本输入到输入门的权值;
Figure FDA0002650745780000039
表示时刻训练样本的输入;whi表示隐含层到输入门的权值;
Figure FDA00026507457800000310
表示-1时刻隐含层的输出;wci表示Cell单元到输入门的权值;
Figure FDA00026507457800000311
表示-1时刻Cell单元的状态;
Figure FDA00026507457800000312
表示时刻输入门的输出;f表示门的激活函数;
遗忘门的输入、输出:
Figure FDA00026507457800000313
Figure FDA00026507457800000314
其中,
Figure FDA00026507457800000315
表示时刻输入门的输入;wjf表示训练样本输入到遗忘门的权值;whf表示隐含层到遗忘门的权值;wcf表示Cell单元到输入门的权值;
Figure FDA00026507457800000316
表示时刻遗忘门的输出;
首先定义
Figure FDA00026507457800000325
Figure FDA00026507457800000318
Cell单元的当前状态为:
Figure FDA00026507457800000319
其中,wic表示训练样本输入到Cell单元的权值;whc表示隐含层到Cell单元的权值;
Figure FDA00026507457800000320
表示Cell单元的当前状态;g表示Cell单元的输入激活函数;
输出门的输入、输出:
Figure FDA00026507457800000321
Figure FDA00026507457800000322
其中,
Figure FDA00026507457800000323
表示时刻输出门的输入;wjo表示训练样本输入到输出门的权值;who表示隐含层到输出门的权值;co表示Cell单元到输出门的权值;
Figure FDA00026507457800000324
表示时刻输出门的输出;
Cell单元的输出:
Figure FDA0002650745780000041
其中,h表示Cell单元的输出激活函数;
步骤4.2:构建反向LSTM网络,过程如下:
步骤4.2.1:创建神经网络,设置输入层节点数、输出层节点数、隐含层节点数,三者关系满足如下经验公式:
Figure FDA0002650745780000042
其中,hidden2表示隐含层节点数;in2表示输入层节点数;out2表示输出层节点数;β为[1,10]之间的常数;
步骤4.2.2:设置反向LSTM网络输入门、遗忘门及输出门的输入、输出函数,设置Cell单元的当前状态及输出函数:
输入门的输入、输出:
Figure FDA0002650745780000043
Figure FDA0002650745780000044
其中,
Figure FDA0002650745780000045
表示时刻输入门的输入;uji表示训练样本输入到输入门的权值;uhi表示隐含层到输入门的权值;
Figure FDA0002650745780000046
表示+1时刻隐含层的输出;uci表示Cell单元到输入门的权值;
Figure FDA0002650745780000047
表示t+1时刻Cell单元的状态;
Figure FDA0002650745780000048
表示时刻输入门的输出;F表示门的激活函数;
遗忘门的输入、输出:
Figure FDA0002650745780000049
Figure FDA00026507457800000410
其中,
Figure FDA00026507457800000411
表示时刻输入门的输入;ujf表示训练样本输入到遗忘门的权值;uhf表示隐含层到遗忘门的权值;ucf表示Cell单元到输入门的权值;
Figure FDA00026507457800000412
表示时刻遗忘门的输出;
首先定义
Figure FDA00026507457800000423
Figure FDA00026507457800000414
Cell单元的当前状态为:
Figure FDA00026507457800000415
其中,ujc表示训练样本输入到Cell单元的权值;uhc表示隐含层到Cell单元的权值;
Figure FDA00026507457800000416
表示Cell单元的当前状态;G表示Cell单元的输入激活函数;
输出门的输入、输出:
Figure FDA00026507457800000417
Figure FDA00026507457800000418
其中,
Figure FDA00026507457800000419
表示时刻输出门的输入;ujo表示训练样本输入到输出门的权值;uho表示隐含层到输出门的权值;uco表示Cell单元到输出门的权值;
Figure FDA00026507457800000420
表示t时刻输出门的输出;
Cell单元的输出:
Figure FDA00026507457800000421
其中,H表示Cell单元的输出激活函数;
步骤4.3:设置双向LSTM模型输出层的输入、输出函数:
Figure FDA00026507457800000422
Yt=V(yt) (41)
其中,yt表示输出层的输入;wck表示Cell单元到输出层的权值;uck表示Cell单元到输出层的权值;V表示输出层的输出激活函数;Yt表示时刻双向LSTM模型输出的预测值;
步骤4.4:结合上述优化参数设置及初始双向LSTM模型,导入超声波水表时序训练数据集,进行双向LSTM模型训练;
步骤4.4.1:正向LSTM网络计算损失函数:
Figure FDA0002650745780000051
其中,yt表示时刻超声波真实值;
步骤4.4.2:根据双向LSTM模型的误差反向传播调整优化各项权值,定义
Figure FDA0002650745780000052
Figure FDA0002650745780000053
步骤4.4.3:根据正向LSTM网络的误差反向传播调整优化权值,定义
Figure FDA0002650745780000054
Figure FDA0002650745780000055
Figure FDA0002650745780000056
输出门、Cell单元、遗忘门及输入门的误差反向传播为:
Figure FDA0002650745780000057
Figure FDA0002650745780000058
Figure FDA0002650745780000059
Figure FDA00026507457800000510
Figure FDA00026507457800000511
步骤4.4.4:根据反向LSTM模型的误差反向传播调整优化权值,定义
Figure FDA00026507457800000512
Figure FDA00026507457800000513
Figure FDA00026507457800000514
输出门、Cell单元、遗忘门及输入门的误差反向传播为:
Figure FDA00026507457800000515
Figure FDA00026507457800000516
Figure FDA00026507457800000517
Figure FDA00026507457800000518
Figure FDA00026507457800000519
CN202010869973.4A 2020-08-26 2020-08-26 一种基于双向lstm的超声波水表数据修复方法 Pending CN112179455A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010869973.4A CN112179455A (zh) 2020-08-26 2020-08-26 一种基于双向lstm的超声波水表数据修复方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010869973.4A CN112179455A (zh) 2020-08-26 2020-08-26 一种基于双向lstm的超声波水表数据修复方法

Publications (1)

Publication Number Publication Date
CN112179455A true CN112179455A (zh) 2021-01-05

Family

ID=73924464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010869973.4A Pending CN112179455A (zh) 2020-08-26 2020-08-26 一种基于双向lstm的超声波水表数据修复方法

Country Status (1)

Country Link
CN (1) CN112179455A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117309079A (zh) * 2023-11-28 2023-12-29 中国空气动力研究与发展中心计算空气动力研究所 基于时差法的超声飞渡时间测量方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104964719A (zh) * 2015-06-30 2015-10-07 安徽工业大学 一种基于bp神经网络的户用电子水表流量计量方法
CN105046321A (zh) * 2015-06-25 2015-11-11 河海大学 一种基于相似性搜索的组合模型预测水位的方法
WO2019034846A1 (en) * 2017-08-14 2019-02-21 Unify Group (Emea) Ltd DETECTION OF FLUID FLOW
CN109489931A (zh) * 2018-11-29 2019-03-19 西南交通大学 一种异常冲击实时检测方法
CN109724657A (zh) * 2018-12-29 2019-05-07 杭州莱宸科技有限公司 基于改进的Elman神经网络的水表流量计量方法和系统
CN110346005A (zh) * 2019-06-11 2019-10-18 华南理工大学 基于深度学习的科里奥利质量流量计数字信号处理方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046321A (zh) * 2015-06-25 2015-11-11 河海大学 一种基于相似性搜索的组合模型预测水位的方法
CN104964719A (zh) * 2015-06-30 2015-10-07 安徽工业大学 一种基于bp神经网络的户用电子水表流量计量方法
WO2019034846A1 (en) * 2017-08-14 2019-02-21 Unify Group (Emea) Ltd DETECTION OF FLUID FLOW
CN109489931A (zh) * 2018-11-29 2019-03-19 西南交通大学 一种异常冲击实时检测方法
CN109724657A (zh) * 2018-12-29 2019-05-07 杭州莱宸科技有限公司 基于改进的Elman神经网络的水表流量计量方法和系统
CN110346005A (zh) * 2019-06-11 2019-10-18 华南理工大学 基于深度学习的科里奥利质量流量计数字信号处理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
庄瑞刚: "基于双向循环神经网络的交通流预测算法研究", 《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑》 *
陈敏: "《人工智能通信理论与算法》", 31 January 2020, 华中科技大学出版社 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117309079A (zh) * 2023-11-28 2023-12-29 中国空气动力研究与发展中心计算空气动力研究所 基于时差法的超声飞渡时间测量方法、装置、设备及介质
CN117309079B (zh) * 2023-11-28 2024-03-12 中国空气动力研究与发展中心计算空气动力研究所 基于时差法的超声飞渡时间测量方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN111310968B (zh) 一种基于互信息的lstm神经网络循环水文预报方法
CN109343505A (zh) 基于长短期记忆网络的齿轮剩余寿命预测方法
Capobianco et al. Nourishment design and evaluation: applicability of model concepts
CN109948863B (zh) 基于长短期记忆模型lstm的排水管网窨井液位预测方法
CN103389472B (zh) 一种基于nd-ar模型的锂离子电池循环寿命的预测方法
CN112036075A (zh) 一种基于环境监测数据关联关系的异常数据判定方法
CN110363349B (zh) 一种基于ascs的lstm神经网络水文预测方法及系统
Zio et al. Failure and reliability predictions by infinite impulse response locally recurrent neural networks
CN112132324A (zh) 一种基于深度学习模型的超声波水表数据修复方法
CN102032935A (zh) 城市排水汇流管网污水泵站流量的软测量方法
CN115169733B (zh) 基于深度学习的内孤立波对深海沉积物再悬浮量预测方法
CN106568647B (zh) 一种基于神经网络的混凝土强度预测方法
CN112487732B (zh) 一种冲积性河道冲淤模拟方法及系统
CN111860839A (zh) 基于多信号融合及Adam优化算法的岸桥故障监测方法
CN110991776A (zh) 一种基于gru网络实现水位预测的方法及系统
CN114492211A (zh) 一种基于自回归网络模型的剩余油分布预测方法
CN114219131A (zh) 一种基于lstm的流域径流预测方法
CN114492217B (zh) 一种基于混合时间序列感知机模型的台风浪高预测方法
CN112179455A (zh) 一种基于双向lstm的超声波水表数据修复方法
CN110163419B (zh) 一种中小河流流域洪水预报的方法
CN110378518A (zh) 一种采用lstm-narx混合模型的水下潮流预测方法
CN116303786B (zh) 一种基于多维数据融合算法的区块链金融大数据管理系统
CN113887119B (zh) 一种基于sarima-lstm的河流水质预测方法
CN110308254B (zh) 低溶解氧的精准监测方法
CN104200269A (zh) 一种基于在线学习最小嵌入维网络的实时故障诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210105