CN110457296B - 一种定速泵运行数据的清洗方法 - Google Patents

一种定速泵运行数据的清洗方法 Download PDF

Info

Publication number
CN110457296B
CN110457296B CN201910605872.3A CN201910605872A CN110457296B CN 110457296 B CN110457296 B CN 110457296B CN 201910605872 A CN201910605872 A CN 201910605872A CN 110457296 B CN110457296 B CN 110457296B
Authority
CN
China
Prior art keywords
data
pump
formula
pressure
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910605872.3A
Other languages
English (en)
Other versions
CN110457296A (zh
Inventor
刘现星
李凤宇
曹光明
吴国东
彭柳
李勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
719th Research Institute of CSIC
Original Assignee
719th Research Institute of CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 719th Research Institute of CSIC filed Critical 719th Research Institute of CSIC
Priority to CN201910605872.3A priority Critical patent/CN110457296B/zh
Publication of CN110457296A publication Critical patent/CN110457296A/zh
Application granted granted Critical
Publication of CN110457296B publication Critical patent/CN110457296B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Control Of Positive-Displacement Pumps (AREA)
  • Control Of Non-Positive-Displacement Pumps (AREA)

Abstract

本发明公开了一种定速泵运行数据的清洗方法,先根据泵试验数据得到基准数据,然后根据时间顺序对运行数据进行分组;先基于基准数据对第一组泵运行数据进行数据补全、剔除等数据清洗,然后基于本组运行数据对基准数据进行更新;依次开展下一组泵运行数据的清洗和基准数据的更新。本发明考虑了测量仪表误差对定速泵运行数据的影响,以及定速泵的运行寿期内因磨损等原因对定速泵性能参数的影响,能够确保运行数据补全的合理性和数据剔除的准确性,从而可以提高数据清洗的精确度,提升定速泵运行数据挖掘的合理有效性。

Description

一种定速泵运行数据的清洗方法
技术领域
本发明涉及动力装置运行数据分析处理技术领域,具体涉及一种定速泵运行数据的清洗方法。
背景技术
在动力装置的运行过程中,泵占有重要地位,作为流体流动的主要动力源,起着增压供水的功能。多数泵启动工作后,转速保持恒定,但流量可能发生较大变化。为保证动力装置的正常运行,一般会在泵前后设置温度、流量、压力等测量仪表,对泵入口流体的温度、流体流量、泵进出口压力等运行参数进行监测。在泵的运行过程中,会产生海量的运行数据,这些数据中可能会存在数据的缺失和数据的失真。在基于泵运行数据开展数据挖掘时,这些不完整的数据和失真的数据,轻则导致分析精度不高,重则导致分析结果失真。因此,在基于泵的运行数据开展建模、分析等工作前,需要采用比较精确的方法对这些数据进行清洗,从而提升数据的质量,为数据挖掘、展示等提供合理有效的数据。
泵运行数据的清洗主要包括数据的补全和无效值的剔除。
传统的数据补全方法包括平均值、最大值、最小值或概率估计法。
无效值的剔除方法包括统计分析、基于规则库的识别等方法。
对于定速运行的泵(即定速泵)而言,其主要参数包括入口流体温度、质量流量、进/出口压力,这些参数不仅随运行状态的变化而变化,也受传感器不确定的采集、转换、传递误差的影响,传统的数据清洗方法主要用于交易、移动通信和人为数据的清洗,难以满足定速泵运行数据的高质量清洗要求。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种定速泵运行数据的清洗方法,可以提高数据清洗的精确度。
为达到以上目的,本发明采取的技术方案是:
一种定速泵运行数据的清洗方法,包括如下步骤:
S1、获取关于试验容积流量Q与试验泵扬程H的一组试验数据,基于所述试验数据,获取基准数据,并令阈值[H]0=HR,HR为额定泵扬程;
获取关于泵入口流体温度、泵质量流量、泵入口压力和泵出口压力的一组运行数据,按照时间先后顺序,将所述运行数据划分为Y组;
S2、令当前组X=1;
S3、将当前组X的运行数据进行类型划分,所述类型包括离散型数据缺失的类型,以及泵入口流体温度、泵质量流量、泵入口压力、泵出口压力中的其中一个参数出现连续型数据缺失的类型;对属于离散型数据缺失类型的运行数据和属于连续型数据缺失类型的运行数据分别进行数据补全;
S4、获取当前组X经数据补全后的关于泵入口流体温度、泵质量流量、泵入口压力和泵出口压力的一组补全数据,并根据公式(1)、公式(2)、公式(3)、公式(4)和公式(5)计算所述补全数据对应的关于容积流量和泵扬程的一组数据点
Figure BDA0002120765100000021
Figure BDA0002120765100000031
Figure BDA0002120765100000032
式中,Q为容积流量,G为泵质量流量,ρ为泵入口流体密度,H为泵扬程,p1为泵入口压力,p2为泵出口压力,z1为泵入口压力测点到基准面的位差,z2为泵出口压力测点到基准面的位差,g为重力加速度,Δpζ为泵入口压力测点到泵出口压力测点间管路的压降,Δpζ,R为额定工况下泵入口压力测点到泵出口压力测点间管路的压降,ρR为额定工况下泵入口流体的密度,GR为额定工况下的泵质量流量,V1为泵入口管道流体流速,V2为泵出口管道流体流速,d1为泵入口管道直径,d2为泵出口管道直径;
采用线性差值法,根据公式(6),计算所述的一组数据点
Figure BDA0002120765100000033
Figure BDA0002120765100000034
中,
Figure BDA0002120765100000035
所对应的泵扬程
Figure BDA0002120765100000036
Figure BDA0002120765100000037
式中,Q1和Q2为基于所述基准数据所获取的容积流量Q前后的两个容积流量,H1和H2分别为Q1和Q2所对应的泵扬程;
对所述的一组数据点
Figure BDA0002120765100000038
逐一判断每一个数据点的
Figure BDA0002120765100000039
是否满足
Figure BDA00021207651000000310
若是,则保留该数据点,否则,剔除;
式中,p10为泵入口压力仪表最大量程对应压力值,p20为泵出口压力仪表最大量程对应压力值,εp1=εp11p12p13为泵入口压力总误差,εp2=εp21p22p23为泵出口压力总误差,εp11、εp12、εp13分别为泵入口压力仪表测量误差、变送器误差和信号转换误差;εp21、εp22、εp23分别为泵出口压力仪表测量误差、变送器误差和信号转换误差;
将所述的一组数据点
Figure BDA0002120765100000041
经剔除处理后,保留下来的数据点所组成的一组数据点记为
Figure BDA0002120765100000042
其中,
Figure BDA0002120765100000043
按照从小到大的顺序排列;
S5、判断基准数据是否需要更新:从关于
Figure BDA0002120765100000044
的一组数据点中,筛选出所有满足
Figure BDA0002120765100000045
时的
Figure BDA0002120765100000046
所对应的
Figure BDA0002120765100000047
求取所筛选出的
Figure BDA0002120765100000048
的算数平均值
Figure BDA0002120765100000049
并计算
Figure BDA00021207651000000410
QR为额定容积流量;
若|Δ|≤ε2,则基准数据不进行更新,[H]0保持不变,转入S7;
若|Δ|>ε2,则转入S6,且令
Figure BDA00021207651000000411
其中ε1、ε2为偏差量;
S6:基于关于
Figure BDA00021207651000000412
的一组数据点,对基准数据进行更新;
S7:令X=X+1,若X≤Y,则返回步骤S3,否则,结束。
进一步地,基于关于
Figure BDA00021207651000000413
的一组数据点,对基准数据进行更新,包括如下步骤:
S60:计算更新后的基准数据点的数量
Figure BDA00021207651000000414
其中,
Figure BDA00021207651000000415
Figure BDA00021207651000000416
的最大值,
Figure BDA00021207651000000417
N1为不小于预设值的整数;
S61:令j=1;
S62:统计关于
Figure BDA0002120765100000051
的一组数据点中,
Figure BDA0002120765100000052
满足
Figure BDA0002120765100000053
时的数据点的数量M,其中,Qj=(j-1)·ΔQ;
S63:判断M是否为0,若M=0,则将所述基准数据中第j个数据点作为更新后的基准数据中的第j个数据点,并转入S64;
若M≠0,标记所述的M个数据点为
Figure BDA0002120765100000054
Figure BDA0002120765100000055
则根据公式(11)和公式(12)计算更新后的基准数据中第j个数据点
Figure BDA0002120765100000056
并转入S64:
Figure BDA0002120765100000057
S64:令j=j+1,若j≤N3,则返回步骤S62,否则,转入S65;
S65:将得到的关于
Figure BDA0002120765100000058
的一组数据点,作为更新后的基准数据。
进一步地,步骤S1中,基于所述试验数据,获取基准数据具体包括如下步骤:
S10:按照试验容积流量Q从小到大的顺序进行排序,得到关于(Q,H)的一组试验数据点;
S11:计算基准数据点的数量
Figure BDA0002120765100000059
其中,
Figure BDA00021207651000000510
为Q的最大值,N1为不小于预设值的整数;
S12:令i=1;
S13:计算第i个基准数据点(Q基,i,H基,i),其中,
Figure BDA00021207651000000511
Figure BDA0002120765100000061
(Qi1,Hi1)、(Qi2,Hi2)为关于(Q,H)的一组试验数据点中与Q基,i前后相邻的两个试验数据点;
S14:令i=i+1,若i≤N2,则返回步骤S13,否则,转入S15;
S15:获取N2个基准数据点,得到所述基准数据。
进一步地,步骤S3中,当出现离散型的数据缺失时,取缺失数据的前后相邻数据的算术平均值,然后赋值,进行数据补全。
进一步地,步骤S3中,当泵入口流体温度T出现连续型的数据缺失时,数据补全包括如下步骤:
S310:判断是否泵出口管路中有温度测量仪表,且泵与该温度测量仪表间流体没有被加热或冷却,若是,则泵入口流体温度T的缺失数据由泵出口管路流体温度替代;否则,转到S311;
S311:判断是否泵入口为处于饱和状态的换热设备,若是,则泵入口流体温度T的缺失数据根据该换热设备的饱和压力,通过查水性质表得到;否则,转到S312;
S312:取泵入口流体温度T的未缺失数据替代泵入口流体温度T的缺失数据。
进一步地,步骤S3中,当泵质量流量出现连续型的数据缺失时,数据补全包括如下步骤:
根据公式(2)、公式(3)、公式(4)和公式(5),并令G=G0,计算泵质量流量出现连续型的数据缺失时的泵扬程H,G0为当前泵质量流量缺失数据的前一个泵质量流量数据值;
采用线性插值法,根据公式(7),计算H所对应的容积流量Q
Figure BDA0002120765100000062
式中,H1和H2为基于所述基准数据所获取的泵扬程H前后的两个泵扬程,Q1和Q2分别为H1和H2所对应的容积流量;
根据公式(1),并令Q=Q,计算并得到用于补全的泵质量流量G
进一步地,步骤S3中,当泵入口压力出现连续型的数据缺失时,数据补全包括如下步骤:
采用线性差值法,根据公式(6),计算泵入口压力出现连续型的数据缺失时的容积流量所对应的泵扬程H
根据公式(3)、公式(4)、公式(5)、公式(8)和公式(9),并令H=H,计算并得到用于补全的泵入口压力p1,缺
Figure BDA0002120765100000071
其中,Δp为泵出口与入口压差。
进一步地,步骤S3中,当泵出口压力出现连续型的数据缺失时,数据补全包括如下步骤:
采用线性差值法,根据公式(6),计算泵出口压力出现连续型的数据缺失时的容积流量所对应的泵扬程H
根据公式(3)、公式(4)、公式(5)、公式(8)和公式(10),并令H=H,计算并得到用于补全的泵出口压力p2,缺
Figure BDA0002120765100000072
其中,Δp为泵出口与入口压差。
进一步地,当缺乏泵的试验数据时,采用泵的理论数据替代试验数据。
进一步地,偏差量ε1<0.01,和/或偏差量ε2<0.01。
与现有技术相比,本发明的优点在于:
本发明先根据泵试验数据得到基准数据,然后根据时间顺序对运行数据进行分组;先基于基准数据对第一组泵运行数据进行数据补全、剔除等数据清洗,然后基于本组运行数据对基准数据进行更新;依次开展下一组泵运行数据的清洗和基准数据的更新。本发明考虑了测量仪表误差对定速泵运行数据的影响,以及定速泵的运行寿期内因磨损等原因对泵性能参数的影响,能够确保运行数据补全的合理性和数据剔除的准确性,从而可以提高数据清洗的精确度,提升定速泵运行数据挖掘的合理有效性。
附图说明
图1为本发明实施例提供的定速泵运行数据的清洗方法流程图。
具体实施方式
以下结合附图及实施例对本发明作进一步详细说明。
参见图1所示,本发明实施例提供了一种定速泵运行数据的清洗方法,包括如下步骤:
A1、获取关于试验容积流量Q与试验泵扬程H的一组试验数据,基于该试验数据,计算并获取基准数据,并令阈值[H]0=HR,HR为额定泵扬程;获取关于泵入口流体温度、泵质量流量、泵入口压力和泵出口压力的一组运行数据,按照时间先后顺序,将所述运行数据划分为Y组,比如相邻两组的时间跨度可以取半年、1年等;当缺乏定速泵的试验数据时,可以采用定速泵的理论数据替代试验数据;
其中,基于该试验数据,获取基准数据具体包括如下步骤:
A10:按照试验容积流量Q从小到大的顺序进行排序,得到关于(Q,H)的一组试验数据点;
A11:计算基准数据点的数量
Figure BDA0002120765100000091
其中,
Figure BDA0002120765100000092
为Q的最大值,N1为不小于预设值的整数,预设值大于等于10,比如,可以取10,int()为取整函数;
A12:令i=1;
A13:计算第i个基准数据点(Q基,i,H基,i),其中,
Figure BDA0002120765100000093
Figure BDA0002120765100000094
(Qi1,Hi1)、(Qi2,Hi2)为关于(Q,H)的一组试验数据点中与Q基,i前后相邻的两个试验数据点,若Q基,i=Qi1,则H基,i=Hi1,若Q基,i=Qi2,则H基,i=Hi2
A14:令i=i+1,若i≤N2,则返回步骤A13,否则,转入A15;
A15:获取N2个基准数据点,得到所述基准数据。
A2、令当前组X=1;
A3、数据缺失的类型包括离散型数据缺失的类型,以及泵入口流体温度、泵质量流量、泵入口压力、泵出口压力中的其中一个参数出现连续型数据缺失的类型,先判断当前组X的运行数据是否存在数据缺失,如果不存在,直接进入A4,如果存在,则将当前组X的运行数据进行类型划分,如果是离散型数据缺失,就对属于离散型数据缺失类型的运行数据进行数据补全,完成补全后,进入A4;如果是连续型数据缺失,就对连续型数据缺失的运行数据进行数据补全,完成补全后,进入A4;如果两种类型同时存在,则对属于离散型数据缺失类型的运行数据和属于连续型数据缺失类型的运行数据分别进行数据补全,完成补全后,进入A4;
具体数据补全方法如下:
第一、当出现离散型的数据缺失时,取缺失数据的前后相邻数据的算术平均值,然后赋值,进行数据补全。
第二、当出现连续型的数据缺失时,需要逐一对各个数据进行补全,各个补全方法分别如下:
(1)当泵入口流体温度T出现连续型的数据缺失时,数据补全包括如下步骤:
A310:判断是否泵出口管路中有温度测量仪表,且泵与该温度测量仪表间流体没有被加热或冷却,若是,则泵入口流体温度T的缺失数据由泵出口管路流体温度替代;否则,转到A311;
A311:判断是否泵入口为处于饱和状态的换热设备,若是,则泵入口流体温度T的缺失数据根据该换热设备的饱和压力,通过查水性质表得到;否则,转到A312;
A312:取泵入口流体温度T的未缺失数据替代泵入口流体温度T的缺失数据。
(2)当泵质量流量出现连续型的数据缺失时,数据补全包括如下步骤:
A320:根据公式(2)、公式(3)、公式(4)和公式(5),并令G=G0,计算泵质量流量出现连续型的数据缺失时的泵扬程H,G0为当前泵质量流量缺失数据的前一个泵质量流量数据值;
Figure BDA0002120765100000101
Figure BDA0002120765100000102
式中,Q为容积流量,G为泵质量流量,ρ为泵入口流体密度,此时的ρ通过泵入口压力p1和泵入口流体温度T经过查询水性质表得到,H为泵扬程,p1为泵入口压力,p2为泵出口压力,z1为泵入口压力测点到基准面的位差,z2为泵出口压力测点到基准面的位差,g为重力加速度,Δpζ为泵入口压力测点到泵出口压力测点间管路的压降,Δpζ,R为额定工况下泵入口压力测点到泵出口压力测点间管路的压降,ρR为额定工况下泵入口流体的密度,GR为额定工况下的泵质量流量,V1为泵入口管道流体流速,V2为泵出口管道流体流速,d1为泵入口管道直径,d2为泵出口管道直径;
A321:采用线性插值法,根据公式(7),计算H所对应的容积流量Q
Figure BDA0002120765100000111
式中,H1和H2为基于所述基准数据所获取的泵扬程H前后的两个泵扬程,Q1和Q2分别为H1和H2所对应的容积流量;
A322:根据公式(1),并令Q=Q,计算并得到用于补全的泵质量流量G
(3)当泵入口压力出现连续型的数据缺失时,数据补全包括如下步骤:
A330:采用线性差值法,根据公式(6),计算泵入口压力出现连续型的数据缺失时的容积流量所对应的泵扬程H
Figure BDA0002120765100000112
式中,Q1和Q2为基于所述基准数据所获取的容积流量Q前后的两个容积流量,H1和H2分别为Q1和Q2所对应的泵扬程;
A331:根据公式(3)、公式(4)、公式(5)、公式(8)和公式(9),并令H=H,计算并得到用于补全的泵入口压力p1,缺
Figure BDA0002120765100000121
其中,Δp为泵出口与入口压差,由于此时是泵入口压力数据缺失,因此,此时的ρ通过泵出口压力p2和泵入口流体温度T经过查询水性质表得到。
(4)当泵出口压力出现连续型的数据缺失时,数据补全包括如下步骤:
A340:采用线性差值法,根据公式(6),计算泵出口压力出现连续型的数据缺失时的容积流量所对应的泵扬程H
Figure BDA0002120765100000122
式中,Q1和Q2为基于所述基准数据所获取的容积流量Q前后的两个容积流量,H1和H2分别为Q1和Q2所对应的泵扬程;
A341:根据公式(3)、公式(4)、公式(5)、公式(8)和公式(10),并令H=H,计算并得到用于补全的泵出口压力p2,缺
Figure BDA0002120765100000123
其中,Δp为泵出口与入口压差,此时的ρ通过泵入口压力p1和泵入口流体温度T经过查询水性质表得到。
A4、对当前组X进行数据剔除,包括如下步骤:
A40:获取当前组X经数据补全后的关于泵入口流体温度、泵质量流量、泵入口压力和泵出口压力的一组补全数据,并根据公式(1)、公式(2)、公式(3)、公式(4)和公式(5)计算所述补全数据对应的关于容积流量和泵扬程的一组数据点
Figure BDA0002120765100000124
Figure BDA0002120765100000131
Figure BDA0002120765100000132
式中,Q为容积流量,G为泵质量流量,ρ为泵入口流体密度,H为泵扬程,p1为泵入口压力,p2为泵出口压力,z1为泵入口压力测点到基准面的位差,z2为泵出口压力测点到基准面的位差,对于水平布置的泵,基准面为泵中心对应的水平面;对于垂直布置的泵,基准面为泵入口处的水平面,g为重力加速度,Δpζ为泵入口压力测点到泵出口压力测点间管路的压降,Δpζ,R为额定工况下泵入口压力测点到泵出口压力测点间管路的压降,ρR为额定工况下泵入口流体的密度,GR为额定工况下的泵质量流量,V1为泵入口管道流体流速,V2为泵出口管道流体流速,d1为泵入口管道直径,d2为泵出口管道直径;
A41:采用线性差值法,根据公式(6),计算所述的一组数据点
Figure BDA0002120765100000133
中,
Figure BDA0002120765100000134
所对应的泵扬程
Figure BDA0002120765100000135
Figure BDA0002120765100000136
式中,Q1和Q2为基于所述基准数据所获取的容积流量Q前后的两个容积流量,H1和H2分别为Q1和Q2所对应的泵扬程;
A42:对所述的一组数据点
Figure BDA0002120765100000137
逐一判断每一个数据点的
Figure BDA0002120765100000138
是否满足
Figure BDA0002120765100000139
若是,则保留该数据点,否则,剔除;
式中,p10为泵入口压力仪表最大量程对应压力值,p20为泵出口压力仪表最大量程对应压力值,εp1=εp11p12p13为泵入口压力总误差,εp2=εp21p22p23为泵出口压力总误差,εp11、εp12、εp13分别为泵入口压力仪表测量误差、变送器误差和信号转换误差;εp21、εp22、εp23分别为泵出口压力仪表测量误差、变送器误差和信号转换误差;
A43:将所述的一组数据点
Figure BDA0002120765100000141
经剔除处理后,保留下来的数据点所组成的一组数据点记为
Figure BDA0002120765100000142
其中,
Figure BDA0002120765100000143
按照从小到大的顺序排列;
A5、判断基准数据是否需要更新:从关于
Figure BDA0002120765100000144
的一组数据点中,筛选出所有满足
Figure BDA0002120765100000145
时的
Figure BDA0002120765100000146
所对应的
Figure BDA0002120765100000147
求取所筛选出的
Figure BDA0002120765100000148
的算数平均值
Figure BDA0002120765100000149
并计算
Figure BDA00021207651000001410
QR为额定容积流量;
若|Δ|≤ε2,则基准数据不进行更新,[H]0保持不变,转入A7;
若|Δ|>ε2,则转入A6,且令
Figure BDA00021207651000001411
其中ε1、ε2为偏差量,本实施例中,偏差量ε1<0.01,偏差量ε2<0.01;
A6:基于关于
Figure BDA00021207651000001412
的一组数据点,对基准数据进行更新,完成更新后,转入S7;
本步骤具体包括如下步骤:
A60:计算更新后的基准数据点的数量
Figure BDA00021207651000001413
其中,
Figure BDA00021207651000001414
Figure BDA00021207651000001415
的最大值,
Figure BDA00021207651000001416
N1为不小于预设值的整数,预设值大于等于10,比如,可以取10,int()为取整函数;
A61:令j=1;
A62:统计关于
Figure BDA0002120765100000151
的一组数据点中,
Figure BDA0002120765100000152
满足
Figure BDA0002120765100000153
时的数据点的数量M,其中,Qj=(j-1)·ΔQ;
A63:判断M是否为0,若M=0,则将所述基准数据中第j个数据点作为更新后的基准数据中的第j个数据点,并转入A64;
若M≠0,标记所述的M个数据点为
Figure BDA0002120765100000154
Figure BDA0002120765100000155
则根据公式(11)和公式(12)计算更新后的基准数据中第j个数据点
Figure BDA0002120765100000156
并转入A64:
Figure BDA0002120765100000157
A64:令j=j+1,若j≤N3,则返回步骤A62,否则,转入A65;
A65:将得到的关于
Figure BDA0002120765100000158
的一组数据点,作为更新后的基准数据。
A7:令X=X+1,并判断此时是否X≤Y,若是,则返回步骤A3,进行循环计算,否则,证明已经完成了Y组的清洗,转入A8。
A8:结束。
本发明提供的实施例中,数据的补全用于当定速泵运行数据中某一个或某些运行数据缺失时,通过基于基准数据和其他相关的未缺失数据参数反推计算出相应的数据值,并作为该缺失值的真实值,从而保证数据的连续性和完整性;数据剔除基于基准数据和测量仪表误差,通过识别和剔除明显超出合理范围的运行数据,从而保证数据的精确性和有效性;基准数据的更新为数据剔除提供与定速泵的实际运行状态相一致的基准计算数据,提高数据清洗的精确度。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有以下有益效果:本发明先根据泵试验数据得到基准数据,然后根据时间顺序对运行数据进行分组;先基于基准数据对第一组泵运行数据进行数据补全、剔除等数据清洗,然后基于本组运行数据对基准数据进行更新;依次开展下一组泵运行数据的清洗和基准数据的更新。本发明考虑了测量仪表误差对定速泵运行数据的影响,以及定速泵的运行寿期内因磨损等原因对泵性能参数的影响,能够确保运行数据补全的合理性和数据剔除的准确性,从而可以提升定速泵运行数据挖掘的合理有效性。
本发明不局限于上述实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围之内。本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims (10)

1.一种定速泵运行数据的清洗方法,其特征在于,包括如下步骤:
S1、获取关于试验容积流量Q与试验泵扬程H的一组试验数据,基于所述试验数据,获取基准数据,并令阈值[H]0=HR,HR为额定泵扬程;
获取关于泵入口流体温度、泵质量流量、泵入口压力和泵出口压力的一组运行数据,按照时间先后顺序,将所述运行数据划分为Y组;
S2、令当前组X=1;
S3、将当前组X的运行数据进行类型划分,所述类型包括离散型数据缺失的类型,以及泵入口流体温度、泵质量流量、泵入口压力、泵出口压力中的其中一个参数出现连续型数据缺失的类型;对属于离散型数据缺失类型的运行数据和属于连续型数据缺失类型的运行数据分别进行数据补全;
S4、获取当前组X经数据补全后的关于泵入口流体温度、泵质量流量、泵入口压力和泵出口压力的一组补全数据,并根据公式(1)、公式(2)、公式(3)、公式(4)和公式(5)计算所述补全数据对应的关于容积流量和泵扬程的一组数据点
Figure FDA0003248034170000011
Figure FDA0003248034170000012
Figure FDA0003248034170000013
式中,Q为容积流量,G为泵质量流量,ρ为泵入口流体密度,H为泵扬程,p1为泵入口压力,p2为泵出口压力,z1为泵入口压力测点到基准面的位差,z2为泵出口压力测点到基准面的位差,g为重力加速度,△pζ为泵入口压力测点到泵出口压力测点间管路的压降,△pζ,R为额定工况下泵入口压力测点到泵出口压力测点间管路的压降,ρR为额定工况下泵入口流体的密度,GR为额定工况下的泵质量流量,V1为泵入口管道流体流速,V2为泵出口管道流体流速,d1为泵入口管道直径,d2为泵出口管道直径;
采用线性插值法,根据公式(6),计算所述的一组数据点
Figure FDA0003248034170000021
Figure FDA0003248034170000022
中,
Figure FDA0003248034170000023
所对应的泵扬程
Figure FDA0003248034170000024
Figure FDA0003248034170000025
式中,Q1和Q2为基于所述基准数据所获取的容积流量Q前后的两个容积流量,H1和H2分别为Q1和Q2所对应的泵扬程;
对所述的一组数据点
Figure FDA0003248034170000026
逐一判断每一个数据点的
Figure FDA0003248034170000027
是否满足
Figure FDA0003248034170000028
若是,则保留该数据点,否则,剔除;
式中,p10为泵入口压力仪表最大量程对应压力值,p20为泵出口压力仪表最大量程对应压力值,εp1=εp11p12p13为泵入口压力总误差,εp2=εp21p22p23为泵出口压力总误差,εp11、εp12、εp13分别为泵入口压力仪表测量误差、变送器误差和信号转换误差;εp21、εp22、εp23分别为泵出口压力仪表测量误差、变送器误差和信号转换误差;
将所述的一组数据点
Figure FDA0003248034170000029
经剔除处理后,保留下来的数据点所组成的一组数据点记为
Figure FDA00032480341700000210
其中,
Figure FDA00032480341700000211
按照从小到大的顺序排列;
S5、判断基准数据是否需要更新:从关于
Figure FDA00032480341700000212
的一组数据点中,筛选出所有满足
Figure FDA0003248034170000031
时的
Figure FDA0003248034170000032
所对应的
Figure FDA0003248034170000033
求取所筛选出的
Figure FDA0003248034170000034
的算数平均值
Figure FDA0003248034170000035
并计算
Figure FDA0003248034170000036
QR为额定容积流量;
若|△|≤ε2,则基准数据不进行更新,[H]0保持不变,转入S7;
若|△|>ε2,则转入S6,且令
Figure FDA0003248034170000037
其中ε1、ε2为偏差量;
S6:基于关于
Figure FDA0003248034170000038
的一组数据点,对基准数据进行更新;
S7:令X=X+1,若X≤Y,则返回步骤S3,否则,结束。
2.如权利要求1所述的定速泵运行数据的清洗方法,其特征在于,基于关于
Figure FDA0003248034170000039
的一组数据点,对基准数据进行更新,包括如下步骤:
S60:计算更新后的基准数据点的数量
Figure FDA00032480341700000310
其中,
Figure FDA00032480341700000311
Figure FDA00032480341700000312
的最大值,
Figure FDA00032480341700000313
N1为不小于预设值的整数;
S61:令j=1;
S62:统计关于
Figure FDA00032480341700000314
的一组数据点中,
Figure FDA00032480341700000315
满足
Figure FDA00032480341700000316
时的数据点的数量M,其中,Qj=(j-1)·△Q;
S63:判断M是否为0,若M=0,则将所述基准数据中第j个数据点作为更新后的基准数据中的第j个数据点,并转入S64;
若M≠0,标记所述的M个数据点为
Figure FDA0003248034170000041
m=1、2、…、M,则根据公式(11)和公式(12)计算更新后的基准数据中第j个数据点
Figure FDA0003248034170000042
并转入S64:
Figure FDA0003248034170000043
S64:令j=j+1,若j≤N3,则返回步骤S62,否则,转入S65;
S65:将得到的关于
Figure FDA0003248034170000044
的一组数据点,作为更新后的基准数据。
3.如权利要求1所述的定速泵运行数据的清洗方法,其特征在于,步骤S1中,基于所述试验数据,获取基准数据具体包括如下步骤:
S10:按照试验容积流量Q从小到大的顺序进行排序,得到关于(Q,H)的一组试验数据点;
S11:计算基准数据点的数量
Figure FDA0003248034170000045
其中,
Figure FDA0003248034170000046
为Q的最大值,N1为不小于预设值的整数;
S12:令i=1;
S13:计算第i个基准数据点(Q基,i,H基,i),其中,
Figure FDA0003248034170000047
Figure FDA0003248034170000048
(Qi1,Hi1)、(Qi2,Hi2)为关于(Q,H)的一组试验数据点中与Q基,i前后相邻的两个试验数据点;
S14:令i=i+1,若i≤N2,则返回步骤S13,否则,转入S15;
S15:获取N2个基准数据点,得到所述基准数据。
4.如权利要求1所述的定速泵运行数据的清洗方法,其特征在于:步骤S3中,当出现离散型的数据缺失时,取缺失数据的前后相邻数据的算术平均值,然后赋值,进行数据补全。
5.如权利要求1所述的定速泵运行数据的清洗方法,其特征在于,步骤S3中,当泵入口流体温度T出现连续型的数据缺失时,数据补全包括如下步骤:
S310:判断是否泵出口管路中有温度测量仪表,且泵与该温度测量仪表间流体没有被加热或冷却,若是,则泵入口流体温度T的缺失数据由泵出口管路流体温度替代;否则,转到S311;
S311:判断是否泵入口为处于饱和状态的换热设备,若是,则泵入口流体温度T的缺失数据根据该换热设备的饱和压力,通过查水性质表得到;否则,转到S312;
S312:取泵入口流体温度T的未缺失数据替代泵入口流体温度T的缺失数据。
6.如权利要求1所述的定速泵运行数据的清洗方法,其特征在于,步骤S3中,当泵质量流量出现连续型的数据缺失时,数据补全包括如下步骤:
根据公式(2)、公式(3)、公式(4)和公式(5),并令G=G0,计算泵质量流量出现连续型的数据缺失时的泵扬程H,G0为当前泵质量流量缺失数据的前一个泵质量流量数据值;
采用线性插值法,根据公式(7),计算H所对应的容积流量Q
Figure FDA0003248034170000051
式中,H1和H2为基于所述基准数据所获取的泵扬程H前后的两个泵扬程,Q1和Q2分别为H1和H2所对应的容积流量;
根据公式(1),并令Q=Q,计算并得到用于补全的泵质量流量G
7.如权利要求1所述的定速泵运行数据的清洗方法,其特征在于,步骤S3中,当泵入口压力出现连续型的数据缺失时,数据补全包括如下步骤:
采用线性插值法,根据公式(6),计算泵入口压力出现连续型的数据缺失时的容积流量所对应的泵扬程H
根据公式(3)、公式(4)、公式(5)、公式(8)和公式(9),并令H=H,计算并得到用于补全的泵入口压力p1,缺
△p=ρgH (8),
Figure FDA0003248034170000061
其中,△p为泵出口与入口压差。
8.如权利要求1所述的定速泵运行数据的清洗方法,其特征在于,步骤S3中,当泵出口压力出现连续型的数据缺失时,数据补全包括如下步骤:
采用线性插值法,根据公式(6),计算泵出口压力出现连续型的数据缺失时的容积流量所对应的泵扬程H
根据公式(3)、公式(4)、公式(5)、公式(8)和公式(10),并令H=H,计算并得到用于补全的泵出口压力p2,缺
△p=ρgH (8),
Figure FDA0003248034170000062
其中,△p为泵出口与入口压差。
9.如权利要求1所述的定速泵运行数据的清洗方法,其特征在于:当缺乏泵的试验数据时,采用泵的理论数据替代试验数据。
10.如权利要求1所述的定速泵运行数据的清洗方法,其特征在于:偏差量ε1<0.01,和/或偏差量ε2<0.01。
CN201910605872.3A 2019-07-05 2019-07-05 一种定速泵运行数据的清洗方法 Active CN110457296B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910605872.3A CN110457296B (zh) 2019-07-05 2019-07-05 一种定速泵运行数据的清洗方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910605872.3A CN110457296B (zh) 2019-07-05 2019-07-05 一种定速泵运行数据的清洗方法

Publications (2)

Publication Number Publication Date
CN110457296A CN110457296A (zh) 2019-11-15
CN110457296B true CN110457296B (zh) 2021-12-03

Family

ID=68482315

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910605872.3A Active CN110457296B (zh) 2019-07-05 2019-07-05 一种定速泵运行数据的清洗方法

Country Status (1)

Country Link
CN (1) CN110457296B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106930934A (zh) * 2017-03-15 2017-07-07 中国石油化工股份有限公司 一种主输泵故障诊断方法和系统
CN109816166A (zh) * 2019-01-17 2019-05-28 山东大学 一种地源热泵系统性能预测方法
CN109871862A (zh) * 2018-12-28 2019-06-11 北京航天测控技术有限公司 一种基于合成少数类过采样和深度学习的故障预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6432721B1 (en) * 1999-10-29 2002-08-13 Honeywell International Inc. Meso sniffer: a device and method for active gas sampling using alternating flow

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106930934A (zh) * 2017-03-15 2017-07-07 中国石油化工股份有限公司 一种主输泵故障诊断方法和系统
CN109871862A (zh) * 2018-12-28 2019-06-11 北京航天测控技术有限公司 一种基于合成少数类过采样和深度学习的故障预测方法
CN109816166A (zh) * 2019-01-17 2019-05-28 山东大学 一种地源热泵系统性能预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
大数据分析技术在供水泵站节能降耗中的应用;张凤涛;《供水技术》;20180831;第12卷(第4期);全文 *

Also Published As

Publication number Publication date
CN110457296A (zh) 2019-11-15

Similar Documents

Publication Publication Date Title
JPH01161115A (ja) データ処理方法
CN109990712B (zh) 一种测宽仪在线校准方法
JP2008065812A (ja) 制御弁の性能を評価するための方法およびそのためのシステム
CN103900666B (zh) 膜式燃气表长期运行的计量精度控制方法
CN110209150B (zh) 基于多工序故障影响的作业车间调度方案鲁棒性测度方法
CN105651361B (zh) 超声波水表自动调压检测标定装置及方法
CN108500083B (zh) 小批量多规格板材产品辊式矫直机工艺参数设定方法
CN110457296B (zh) 一种定速泵运行数据的清洗方法
CN102879061A (zh) 一种基于拟合方程的水表误差校正方法
CN105090084B (zh) 风机在线监测系统及其监测方法
Sonmez et al. Using accurately measured production amounts to obtain calibration curve corrections of production line speed and stoppage duration consisting of measurement errors
CN110163480A (zh) 一种卷包车间质量辅助决策的方法
CN105865741B (zh) 一种测量风洞试验段横向气流偏角的简易方法
CN109614758A (zh) 具有空间相关性的圆形形状误差的监控方法
CN109933031A (zh) 一种根据化验数据自动校正软测量仪表的系统及方法
CN113959511B (zh) 基于射流水表的流量计量方法、设备、介质及产品
CN115824363A (zh) 一种计量槽的体积校验方法、装置及设备
CN114646373B (zh) 一种水表机电示值一致性检定方法、系统、存储介质及智能终端
CN106289459A (zh) 超声波燃气表流量点系数校正装置及方法
CN109145258A (zh) 基于非线性拟合的威布尔分布参数置信区间估计方法
CN114323210A (zh) 燃气表机芯误差检测系统及方法
CN114861810A (zh) 煤气化装置工艺诊断方法及系统
CN111428396B (zh) 一种在线装载机铰链销轴磨损程度评估方法
CN115059631A (zh) 一种航空发动机压缩系统特性修正方法
CN209445940U (zh) 一种电机轴计量器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant