CN112628132A - 一种基于机器学习的水泵关键指标预测方法 - Google Patents

一种基于机器学习的水泵关键指标预测方法 Download PDF

Info

Publication number
CN112628132A
CN112628132A CN202011547935.3A CN202011547935A CN112628132A CN 112628132 A CN112628132 A CN 112628132A CN 202011547935 A CN202011547935 A CN 202011547935A CN 112628132 A CN112628132 A CN 112628132A
Authority
CN
China
Prior art keywords
water pump
data
key index
machine learning
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011547935.3A
Other languages
English (en)
Other versions
CN112628132B (zh
Inventor
曾丹
姚文迪
张亦驰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN202011547935.3A priority Critical patent/CN112628132B/zh
Publication of CN112628132A publication Critical patent/CN112628132A/zh
Application granted granted Critical
Publication of CN112628132B publication Critical patent/CN112628132B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04BPOSITIVE-DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS
    • F04B49/00Control, e.g. of pump delivery, or pump pressure of, or safety measures for, machines, pumps, or pumping installations, not otherwise provided for, or of interest apart from, groups F04B1/00 - F04B47/00
    • F04B49/06Control using electricity
    • F04B49/065Control using electricity and making use of computers
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Computer Hardware Design (AREA)
  • Mechanical Engineering (AREA)
  • General Engineering & Computer Science (AREA)
  • Control Of Positive-Displacement Pumps (AREA)

Abstract

本发明提供一种基于机器学习的水泵关键指标预测方法,包括以下步骤:提取水泵日常工作数据,根据水泵运行关键指标对水泵日常工作数据进行预处理,得到训练集和验证集;根据水泵运行关键指标与其他数据之间的关系构建预测模型,并将训练集输入到预测模型进行模型的训练以及调参,并对模型进行评估;构建测试集,根据测试集及预测模型对水泵关键指标进行预测,指导水泵关键指标的工作条件寻优。本发明可以根据水泵工作过程中产生的数据,精准预测出水泵设备关键指标的状态值,并且输出影响水泵关键因素的重要特征,指导设备工作人员寻找最优的工作状态。

Description

一种基于机器学习的水泵关键指标预测方法
技术领域
本发明涉及水力发电技术领域,具体涉及一种基于机器学习的水泵关键指标预测方法。
背景技术
水泵是火电厂、灌溉排水一起其他工农业生产中的重要设备。对其关键指标进行监测,分析与预测运行发展趋势,可以提高水泵的工作效率和保障设备运行正常。
目前,水泵控制领域大多依赖于传统的工控软件,对整个控制做一些状态的仿真预测和监控。这样的操作存在一些问题,比如不能及时反应量化效果,不能对工况进行精细化控制,缺乏对关键指标的精确预测。人工线下通过对磨煤机指标的实时监测和设备参数的调控,会存在较高的人力、金钱和时间成本。而机器学习的方法可以通过对水泵系统中的时序数据进行建模仿真,实现对关键指标的精准预测。
发明内容
本发明的目的在于提出一种基于机器学习的水泵关键指标预测发法,可以根据水泵工作过程中产生的数据,精准预测出水泵设备关键指标的状态值,并且输出影响水泵关键因素的重要特征,指导设备工作人员寻找最优的工作状态。
为实现上述目的,本发明提供了如下方案:本发明提供一种基于机器学习的水泵关键指标预测方法,包括以下步骤:
提取水泵日常工作数据,根据水泵运行关键指标对水泵日常工作数据进行预处理,得到水泵关键指标训练集和验证集;
根据水泵运行关键指标与其他数据之间的关系构建预测模型,并将水泵关键指标训练集输入到预测模型进行模型的训练以及调参,并使用验证集对模型进行评估;
构建水泵关键指标测试集,根据水泵关键指标测试集及预测模型对水泵关键指标进行预测,指导水泵关键指标的工作条件寻优。
优选地,所述水泵关键运行指标包括水泵转速和水泵给水流量。
优选地,所述预处理的过程为:根据水泵的实际工作状况,剔除所述水泵转速小于50转时刻的数据,并使用箱线图的方法剔除数据中数值过大或过小的异常值;使用最邻近均值填充的方法填充数据中的缺失值。
优选地,所述使用箱线图的方法剔除数据中数值过大或过小的异常值的具体过程为:计算每个数据的第一四分位数Q1和第三四分位数Q3,大小处在Q1-1.5*IQR~Q3+1.5*IQR的值为正常值,超过这个范围的数值为异常值;其中,IQR=Q3-Q1。
优选地,所述根据水泵运行关键指标与其他数据之间的关系构建预测模型的过程为:根据数据中的稀疏程度选用不同的模型进行建模,对于稀疏数据使用套索算法构建模型,其他数据使用梯度提升决策树模型进行建模。
优选地,所述稀疏数据的获取过程为:统计数据中的非零元素个数,并根据数据个数及非零元素计算稀疏因子,当稀疏因子小于特定值时,则为稀疏数据。
优选地,所述稀疏因子的计算方式为:
Figure BDA0002856922220000031
其中:δ为稀疏因子;n×m为的数据集A的数据个数;t为非零元素个数。
本发明公开了以下技术效果:
(1)本发明仅需要水泵工作产生的数据,无需对水泵的先验知识,就可模拟预测出水泵关键指标的状态值;
(2)本发明根据数据稀疏程度选择不同的模型,并根据不同的模型选择不同的超参数搜索方法,从而在较短的时间里获得较好的模型性能。
(3)本发明所提出的方法可以输出特征重要度,从而指导水泵操纵人员调整水泵工作状态,寻找水泵更优的工作状态。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种基于机器学习的水泵关键指标预测方法流程示意图;
图2为本发明实施例中对水泵转速排名前50的特征重要度示意图;
图3为本发明实施例中对水泵给水流量排名前50的特征重要度示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明提供一种基于机器学习的水泵关键指标预测方法,包括以下步骤:
S1、提取水泵日常工作数据,得到水泵日常工作数据集,选取水泵运行关键指标,根据水泵的实际工作状况进行分析,对水泵数据集异常数据进行检测并处理,并划分为训练集与验证集。
本实施例选取某大型电厂水泵运行一年的真实数据,包括小汽机控制阀阀位、冷再至小汽机压力、机组小机进汽压力、气泵最小流量阀位、气泵出入口给水压力在内的共390个与水泵转速和给水流量相关的变量。
根据不同的水泵运行环境,尽可能地提取水泵设备相应的传感器在工作状态时可以采集到的特征,筛选其中与关键指标相关的特征,以时间为索引,并以10s为频度单位进行整合,得到一个完整的csv格式的数据集。
本实施例选取的关键指标为水泵转速和水泵给水流量,并根据水泵的实际工作状况,剔除水泵转速小于50转时刻的数据,同时使用箱线图的方法剔除数据中数值过大或过小的异常值,具体为:
计算每个特征的第一四分位数Q1和第三四分位数Q3,第一四分位数和第三四分位数分别对应着将数据从小到大的顺序排序后,大小处于25%和75%的数字。则大小处在Q1-1.5*IQR~Q3+1.5*IQR的值都认为是正常值,超过这个范围的都认为是异常值。其中,IQR=Q3-Q1。
使用最邻近均值填充的方法填充数据中的缺失值。并按照80%和20%的比例将数据集划分为训练集和测试集。
S2、根据水泵运行关键指标与其他数据之间的关系,选取合适的机器学习模型,并将训练数据输入到水泵关键指标的预测模型,进行模型的训练以及调参,并对模型进行评估。
根据数据中的稀疏程度选用不同的模型进行建模,对于稀疏数据使用套索算法构建模型(Least absolute shrinkage and selection operator,Lasso),其他数据使用梯度提升决策树(Gradient Boosting Decision Tree,GBDT)模型进行建模,具体为:
统计每个特征中值为0的数据的个数,判别整合后的数据集是否是稀疏矩阵,若数值为0的元素数目远远多于非0元素的数目时,则称为该矩阵为稀疏矩阵,具体为:如果一个n×m的数据集A中有t个非零元素,则稀疏因子δ的计算公式如下:
Figure BDA0002856922220000061
当δ的值小于等于0.05时,则认为是稀疏矩阵。
本实施例数据中有23个特征为稀疏特征,所以本数据总体不是稀疏矩阵,因此选用GBDT回归模型进行建模。使用随机搜索调参的方法对GBDT的参数n_estimators、learning_rate、subsample、max_features、max_depth、min_samples_split、min_samples_leaf这7个参数进行参数寻优,交叉验证选择3折作为模型评估。
根据模型选择的不同,本实施例使用网格搜索的方法对Lasso模型进行超参数优化,使用随机搜索的方法对GBDT模型进行超参数优化。随机搜索调参通过从指定的分布中采样固定数量的参数,按照设定的搜索次数来进行参数搜索。本实施例设定搜索次数50次,n_estimators设定范围为100~200,max_depth设定范围为5~12,min_samples_split设定范围500~1000,min_samples_leaf设定范围60~100。根据初步搜索结果,再缩小搜索范围精调参数。
将调参之后的最优模型保存下来,并输出模型对于水泵转速和给水流量的特征重要度。
使用均方根误差(Root Mean Squared Error,RMSE)作为模型的评价指标,对验证集的预测结果进行评估。将优化后模型保存下来,并将模型输出的特征重要度保存成可读的csv格式文件。
RMSE定义为:
Figure BDA0002856922220000071
其中:yi为水泵日常工作数据真实值,
Figure BDA0002856922220000072
是模型的预测值;m是预测数据样本总数。
本实例水泵转速最优模型和水泵给水流量最优模型在验证集上RMSE评估结果如表1和表2所示。
本实施例水泵转速最优模型和水泵给水流量最优模型排名前50的重要特征分别如图2、图3所示,其中横轴为特征对应的字段,纵轴为特征对于的特征得分。
表1
评价指标 指标值
RMSE 33.70
表2
评价指标 指标值
RMSE 30.99
S3、构建测试集,在测试集上对水泵关键指标进行预测,指导水泵关键指标的工作条件寻优。
在原始数据集的基础上,依据模型的特征重要度,修改重要特征的数值来构建测试集。依次修改最重要的特征,尝试不同的特征组合。通过单一变量法,修改一个变量的数值大小,保持其他特征变量数值大小不变,构成新的数据来进行预测。观察重要特征变化时,关键指标的变化情况。
通过模型预测的方式进行实验,寻找水泵关键指标在模型中的最优工作状态,指导水泵设备工作人员寻找真实条件下的最优工作状态。
本实施例以天为时间段,选取水泵数据中转速和给水流量最大的十天数据。从输出的特征重要度文件中选择排名较高的特征,并设定特征变化范围。在十天数据的基础上,依据设定的变化范围更改特征值,来构成测试集。通过模型预测的方式来预测状态更改后的水泵指标变化情况。本实施例选取了一段抽汽压力、二段抽汽压力、2B高压加热器进汽压力、冷再热汽压力等共计十个参数,分别设定不同的变化范围,进行了水泵工作状态寻优实验。
以上所述的实施例仅是对本发明优选方式进行的描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。

Claims (7)

1.一种基于机器学习的水泵关键指标预测方法,其特征在于,包括以下步骤:
提取水泵日常工作数据,根据水泵运行关键指标对水泵日常工作数据进行预处理,得到水泵关键指标训练集和验证集;
根据水泵运行关键指标与其他数据之间的关系构建预测模型,并将水泵关键指标训练集输入到预测模型进行模型的训练以及调参,并使用验证集对模型进行评估;
构建水泵关键指标测试集,根据水泵关键指标测试集及预测模型对水泵关键指标进行预测,指导水泵关键指标的工作条件寻优。
2.根据权利要求1所述的基于机器学习的水泵关键指标预测方法,其特征在于,所述水泵关键运行指标包括水泵转速和水泵给水流量。
3.根据权利要求2所述的基于机器学习的水泵关键指标预测方法,其特征在于,所述预处理的过程为:根据水泵的实际工作状况,剔除所述水泵转速小于50转时刻的数据,并使用箱线图的方法剔除数据中数值过大或过小的异常值;使用最邻近均值填充的方法填充数据中的缺失值。
4.根据权利要求3所述的基于机器学习的水泵关键指标预测方法,其特征在于,所述使用箱线图的方法剔除数据中数值过大或过小的异常值的具体过程为:计算每个数据的第一四分位数Q1和第三四分位数Q3,大小处在Q1-1.5*IQR~Q3+1.5*IQR的值为正常值,超过这个范围的数值为异常值;其中,IQR=Q3-Q1。
5.根据权利要求1所述的基于机器学习的水泵关键指标预测方法,其特征在于,所述根据水泵运行关键指标与其他数据之间的关系构建预测模型的过程为:根据数据中的稀疏程度选用不同的模型进行建模,对于稀疏数据使用套索算法构建模型,其他数据使用梯度提升决策树模型进行建模。
6.根据权利要求5所述的基于机器学习的水泵关键指标预测方法,其特征在于,所述稀疏数据的获取过程为:统计数据中的非零元素个数,并根据数据个数及非零元素计算稀疏因子,当稀疏因子小于特定值时,则为稀疏数据。
7.根据权利要求6所述的基于机器学习的水泵关键指标预测方法,其特征在于,所述稀疏因子的计算方式为:
Figure FDA0002856922210000021
其中:δ为稀疏因子;n×m为的数据集A的数据个数;t为非零元素个数。
CN202011547935.3A 2020-12-24 2020-12-24 一种基于机器学习的水泵关键指标预测方法 Active CN112628132B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011547935.3A CN112628132B (zh) 2020-12-24 2020-12-24 一种基于机器学习的水泵关键指标预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011547935.3A CN112628132B (zh) 2020-12-24 2020-12-24 一种基于机器学习的水泵关键指标预测方法

Publications (2)

Publication Number Publication Date
CN112628132A true CN112628132A (zh) 2021-04-09
CN112628132B CN112628132B (zh) 2022-04-26

Family

ID=75324671

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011547935.3A Active CN112628132B (zh) 2020-12-24 2020-12-24 一种基于机器学习的水泵关键指标预测方法

Country Status (1)

Country Link
CN (1) CN112628132B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114662857A (zh) * 2022-02-28 2022-06-24 深圳市深水龙岗水务集团有限公司 一种二供泵房运维分析评估模型及实现方法
CN116771655A (zh) * 2023-04-01 2023-09-19 东莞市爱迪机电科技有限公司 水泵的智能控制系统及智能控制方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160245279A1 (en) * 2015-02-23 2016-08-25 Biplab Pal Real time machine learning based predictive and preventive maintenance of vacuum pump
US20170328194A1 (en) * 2016-04-25 2017-11-16 University Of Southern California Autoencoder-derived features as inputs to classification algorithms for predicting failures
CN108375808A (zh) * 2018-03-12 2018-08-07 南京恩瑞特实业有限公司 Nriet基于机器学习的大雾预报方法
CN108681633A (zh) * 2018-05-11 2018-10-19 上海电力学院 一种基于状态参数的凝结水泵故障预警方法
CN109344201A (zh) * 2018-10-17 2019-02-15 国网江苏省电力有限公司信息通信分公司 一种基于机器学习的数据库性能负载评估系统和方法
CN111079891A (zh) * 2019-01-18 2020-04-28 兰州理工大学 一种基于双隐含层bp神经网络的离心泵性能预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160245279A1 (en) * 2015-02-23 2016-08-25 Biplab Pal Real time machine learning based predictive and preventive maintenance of vacuum pump
US20170328194A1 (en) * 2016-04-25 2017-11-16 University Of Southern California Autoencoder-derived features as inputs to classification algorithms for predicting failures
CN108375808A (zh) * 2018-03-12 2018-08-07 南京恩瑞特实业有限公司 Nriet基于机器学习的大雾预报方法
CN108681633A (zh) * 2018-05-11 2018-10-19 上海电力学院 一种基于状态参数的凝结水泵故障预警方法
CN109344201A (zh) * 2018-10-17 2019-02-15 国网江苏省电力有限公司信息通信分公司 一种基于机器学习的数据库性能负载评估系统和方法
CN111079891A (zh) * 2019-01-18 2020-04-28 兰州理工大学 一种基于双隐含层bp神经网络的离心泵性能预测方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114662857A (zh) * 2022-02-28 2022-06-24 深圳市深水龙岗水务集团有限公司 一种二供泵房运维分析评估模型及实现方法
CN116771655A (zh) * 2023-04-01 2023-09-19 东莞市爱迪机电科技有限公司 水泵的智能控制系统及智能控制方法
CN116771655B (zh) * 2023-04-01 2024-02-13 东莞市爱迪机电科技有限公司 水泵的智能控制系统及智能控制方法

Also Published As

Publication number Publication date
CN112628132B (zh) 2022-04-26

Similar Documents

Publication Publication Date Title
CN106709662B (zh) 一种电力设备运行工况划分方法
CN112628132B (zh) 一种基于机器学习的水泵关键指标预测方法
CN111539553B (zh) 基于svr算法和偏峰度的风电机组发电机故障预警方法
CN111159844B (zh) 一种电站燃气轮机排气温度的异常检测方法
CN113017132A (zh) 一种基于烘丝机工艺参数预测的烟丝质量优化的方法
CN113570138B (zh) 一种时间卷积网络的设备剩余使用寿命预测方法及装置
CN111720296B (zh) 一种基于自编码器的汽动给水泵设备异常状态预警方法
CN104865827B (zh) 一种基于多工况模型的抽油机采油优化方法
CN110262450A (zh) 面向汽轮机的多种故障特性协同分析的故障预测方法
CN109538311B (zh) 面向高端发电装备中汽轮机的控制性能实时监测方法
CN104657596A (zh) 一种基于模型迁移的大型新压缩机性能预测快速建模方法
CN115294671A (zh) 一种空压机出口压力预测方法和预测系统
CN102135021A (zh) 一种工业抽汽冷凝式蒸汽轮机的轴功率预测方法
CN109356798B (zh) 一种基于协整分析的风力发电机齿轮箱状态监测方法
CN114358116A (zh) 油浸式变压器故障诊断方法、系统及可读存储介质
CN114565209A (zh) 一种基于聚类的流程工业能耗状态评估方法
CN115163424A (zh) 基于神经网络的风电机组齿轮箱油温故障检测方法和系统
CN115310216A (zh) 一种基于优化XGBoost的磨煤机故障预警方法
CN117744859A (zh) 基于自适应双控制策略的风电机组发电机故障预警方法
CN117633690A (zh) 一种基于数据驱动的旋转机械健康状态监测方法及设备
CN117216640A (zh) 一种电力时序数据异常检测方法
CN116757354A (zh) 一种基于多层感知机的烟叶复烤段关键参数筛选方法
CN109522657A (zh) 一种基于相关性网络和svdd的燃气轮机异常检测方法
CN113554203B (zh) 基于高维网格化和LightGBM的风电预测方法及装置
CN113379093B (zh) 油气集输系统能耗分析与优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant