CN114035468B - 基于XGBoost算法的风机检修流程预测性监控方法与系统 - Google Patents
基于XGBoost算法的风机检修流程预测性监控方法与系统 Download PDFInfo
- Publication number
- CN114035468B CN114035468B CN202111311627.5A CN202111311627A CN114035468B CN 114035468 B CN114035468 B CN 114035468B CN 202111311627 A CN202111311627 A CN 202111311627A CN 114035468 B CN114035468 B CN 114035468B
- Authority
- CN
- China
- Prior art keywords
- prediction
- model
- training
- features
- track
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 139
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 26
- 238000012544 monitoring process Methods 0.000 title claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 115
- 230000008569 process Effects 0.000 claims abstract description 53
- 238000011156 evaluation Methods 0.000 claims abstract description 43
- 238000012423 maintenance Methods 0.000 claims abstract description 37
- 238000004458 analytical method Methods 0.000 claims abstract description 21
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 238000012360 testing method Methods 0.000 claims description 69
- 238000013528 artificial neural network Methods 0.000 claims description 23
- 230000000694 effects Effects 0.000 claims description 20
- 230000002159 abnormal effect Effects 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000010586 diagram Methods 0.000 claims description 8
- 238000010801 machine learning Methods 0.000 claims description 8
- 238000013145 classification model Methods 0.000 claims description 6
- 125000004122 cyclic group Chemical group 0.000 claims description 6
- 230000005611 electricity Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 230000007787 long-term memory Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 239000003550 marker Substances 0.000 claims description 3
- 230000002776 aggregation Effects 0.000 claims description 2
- 238000004220 aggregation Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 3
- 230000008439 repair process Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/04—Programme control other than numerical control, i.e. in sequence controllers or logic controllers
- G05B19/042—Programme control other than numerical control, i.e. in sequence controllers or logic controllers using digital processors
- G05B19/0428—Safety, monitoring
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/20—Pc systems
- G05B2219/24—Pc safety
- G05B2219/24024—Safety, surveillance
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于XGBoost算法的风机检修流程预测性监控方法与系统,包括步骤:1)获取日志,确定预测任务;2)日志分析和预处理;3)特征选取;4)特征编码;5)确定模型分组,选取预测方法和轨迹前缀;6)构建、训练和调试预测模型;7)预测模型的评估和分析。本发明将业务预测性监控技术应用到风机检修工作票的工作流程之中,通过在工作过程中实现预测业务的下一事件、下一事件执行时间和剩余执行时间预测,以便于了解业务流程、分析执行过程和避免风险。
Description
技术领域
本发明涉及业务流程预测的技术领域,尤其是指一种基于XGBoost算法的风机检修流程预测性监控方法与系统。
背景技术
随着我国经济发展的不断提高,不可再生能源日益紧张的情况下,风电厂规模不断扩大,截止2020年6月底,全国风电累计装机2.17亿千瓦,预计2060年,中国风电装机将达到20.07亿千瓦,约为2020年的7.1倍。然而,风电运行过程中需要进行大量的故障处理、巡检维修等工作,为保证电力安全生产以及人员安全企业采用工作票制度。工作票流程的业务预测性监控能够帮助工作人员及时、有效的进行票据的填写和管理工作。
目前,工作票的业务流程已从传统的手工填写逐步转化为在计算机的信息系统中在线填写,实现了业务数据在各个工作环节中的自动传递与流转,提高了自动化程度与工作效率,降低出错率,有利于后期的统计分析与流程优化。同时,也有很多研究人员针对业务流程系统的设计进行了探讨和优化。但在业务流程的实时进行时,仍然存在许多票据填写错误、处理不及时和工作延期的问题。而业务预测性监控方法可以根据当前流程的执行情况预判未来的执行流程,不仅能够给予工作人员工作和时间安排上的提示,也可以根据预判结果更改当前的执行任务以规避风险。因此业务流程预测在风机检修工作票的应用中发挥着十分重要的作用。
发明内容
本发明的第一目的在于应用业务预测性监控技术到风机检修工作票的工作流程之中,提出一种基于XGBoost算法的风机检修流程预测性监控方法,通过在工作过程中实现预测业务的下一事件、下一事件执行时间和剩余执行时间预测,以便于了解业务流程、分析执行过程和避免一定的风险。
本发明的第二目的在于提供一种基于XGBoost算法的风机检修流程预测性监控系统。
本发明的第一目的通过下述技术方案实现:一种基于XGBoost算法的风机检修流程预测性监控方法,包括以下步骤:
1)获取日志,确定预测任务:
获取风机检修工作票的日志,根据风机流程确定预测任务;
2)日志分析和预处理:
分析获取的日志,按照工作票类型划分日志为三个数据集,删除无关属性列和异常值,将每个数据集再划分为训练集和测试集;
3)特征选取:
根据训练集和测试集,采用XGBoost算法计算各特征的重要性值,确定特征选取策略并选取重要特征;
4)特征编码:
将选取的特征进行编码,并更新至训练集和测试集中,使编码后的值能代表该特征;
5)确定模型分组,选取预测方法和轨迹前缀:
根据日志特点确定模型分组,分别选取XGBoost和LSTM神经网络作为预测方法,选取不同预测方法对应的轨迹前缀;
6)构建、训练和调试预测模型:
采用步骤5)选取的预测方法构建预测模型,利用训练集训练预测模型,调试超参数直至达到最优预测效果;
7)预测模型的评估和分析:
将测试集输入到训练好的预测模型得到预测结果,选用Accuracy和MAE指标来评估和分析预测结果的准确率,分析评估指标值选择更好的模型应用于实际的风机检修工作票业务流程中。
优选的,在步骤1)中,从洁源票据工作流系统中导出风机检修工作票流程的日志,了解系统的业务处理过程,根据风机检修工作票的业务需要,确定开票流程中需要的预测任务为下一事件预测、下一事件执行时间预测和剩余时间预测,所述下一事件预测是指在业务流程执行过程中预测下一项需执行的任务,下一事件执行时间预测是指完成任务执行所需要的时间,剩余时间预测是指到整个流程全部结束所需要的时间。
优选的,在步骤2)中,需借助风机检修工作票的业务背景分析和处理步骤1)获取的日志,并划分为训练集和测试集,包括以下步骤:
2.1)分析日志,按照工作票类型划分日志,根据日志中“工作业务主键”这一属性按照三种工作票类型将日志划分为三个数据集,记电气一种票、电气二种票和风机检修票的工作票类型分别为A、B、C,所述“工作业务主键”是指每项开票业务流程的唯一标记;
2.2)对步骤2.1)中的三个数据集分别进行预处理,包括删除无关、重复属性列、异常值和异常轨迹,并筛选、删除不完整轨迹,所述轨迹是指某一次开票业务从开始到结束的整个具体过程;
2.3)经过步骤2.2)预处理后的各类型数据集,采用基于时间增量抽取的方法划分成训练集和测试集,将数据集按照时间顺序均分为5个部分,每一部分均分为5组并选用第一组进行组合作为测试集,剩下的数据作为训练集,划分结果用于预测模型的训练和测试。
优选的,在步骤3)中,根据选取策略选取重要属性作为预测模型的输入特征,具体包括以下步骤:
3.1)将步骤2)得到的训练集和测试集中的类别属性转化为数值类型,以便程序识别,另外计算并拓展时间属性,包括执行时间、总执行时间、月份、日期、星期和时间点;
3.2)采用XGBoost算法,将处理后的训练集训练树模型,将所有属性都作为模型输入特征,根据得到的树模型计算各特征的重要性值,得到按特征重要性值排列的统计图,其中,所述XGBoost是一个优化的分布式梯度增强库,能够根据训练得到的树模型进行预测,并且根据树模型能够计算出各特征的重要性值;
3.3)从训练集和测试集中,删除步骤3.2)得到的统计图所示除日志标志性特征——“活动”外重要性值最低的特征;
3.4)当步骤3.3)没有能够删除的特征时,选取最佳预测结果所对应的特征组作为预测模型的输入值;否则重复步骤3.2)-步骤3.3)。
优选的,在步骤4)中,将步骤3)中选取的重要特征采用合适的编码方式进行编码,特征包含类别特征和数值特征,具体如下:
类别特征选用基于索引的编码方法,并将编码后的特征更新到步骤3)处理后的训练集和测试集中,所述基于索引的编码是将离散属性基于下标索引进行简单顺序编码;
数值特征同属一个量级无需进行归一化或标准化操作。
优选的,在步骤5)中,确定模型分组,选取流程预测采用的机器学习方法,根据预测方法和预测效果选择轨迹前缀,包括如下步骤:
5.1)每类工作票流程作为一组,共分为三组,每组训练一个模型;
5.2)采用机器学习中的XGBoost和LSTM神经网络分别构建两种预测模型,所述XGBoost是一个优化的分布式梯度增强库,能够根据训练得到的树模型进行预测,并且根据树模型能够计算出各特征的重要性值,所述LSTM是一种循环神经网络的变体,具有长期记忆能力,能够根据先前的事件信息进行预测,能够处理有前后关联关系的整条轨迹上的预测任务;
5.3)根据步骤5.2)中两种预测模型的不同特点选用相应的轨迹前缀,其中,使用XGBoost构建的预测模型仅采用当前状态特征作为输入,即长度为1的固定滑动窗口,使用LSTM神经网络构建的预测模型采用变长前缀作为输入,所述轨迹前缀是在某条轨迹上的任意活动节点或时刻前的轨迹信息。
优选的,在步骤6)中,构建、训练和调试预测模型,具体步骤如下所示:
6.1)依据步骤1)中确定的预测任务、步骤4)选取的特征数量、步骤5)所选的预测方法和相应方法的经验参数,构建初步的预测模型;
6.2)根据不同模型所选取的轨迹前缀调整步骤4)更新后的训练集和测试集的数据结构,将训练集用于步骤6.1)中构建的预测模型的训练;
6.3)训练过程中不断调整超参数和模型结构使之在步骤4)更新后的测试集上达到最优预测效果,所述轨迹前缀是在某条轨迹上的任意活动节点或时刻前的轨迹信息,轨迹前缀能够用聚合、变长和固定滑动窗口方式表示。
优选的,在步骤7)中,评估预测结果需利用步骤6)训练好的模型和调整后的测试集,评估的优劣通过评估指标反映出来,分析评估指标值选择更好的模型应用于实际的风机检修工作票业务流程中,评估指标根据预测任务的不同采取不同的评估方法,具体如下:
下一事件预测的预测模型属于分类模型,采用Accuracy评估指标,计算正确分类的比例,计算公式如下:
其中,n为样本总数,l为分类数,si为第i类的样本数,TPi、TNi、FNi、FPi分别为i类中正确划分为正例的个数、错误划分为正例的个数、错误划分为负例的个数以及正确划分为负例的个数;
下一事件执行时间预测和剩余时间预测的预测模型属于回归模型,采用MAE评估指标,计算真实值与预测值的平均绝对误差,计算公式如下:
其中,y为真实值,为预测值。
本发明的第二目的通过下述技术方案实现:基于XGBoost算法的风机检修流程预测性监控系统,包括预测任务确定模块、日志处理模块、特征选取模块、特征编码模块、预测方法选取模块、预测模型训练模块和评估与分析模块;
所述预测任务确定模块用于获取风机检修工作票的日志后,根据风机流程确定预测任务;
所述日志处理模块用于日志分析和预处理,划分训练集和测试集;
所述特征选取模块用于根据选取策略选取日志的重要属性作为预测模型的输入特征;
所述特征编码模块用于选取的重要特征采用合适的编码方式进行编码;
所述预测方法选取模块用于确定模型分组,选取预测方法,选取轨迹前缀;
所述预测模型训练模块用于构建、训练和调试预测模型;
所述评估与分析模块用于评估预测模型的优劣,分析适用于风机检修工作票业务的方法。
优选的,所述预测任务确定模块具体执行如下操作:
从洁源票据工作流系统中导出风机检修工作票流程的日志,了解系统的业务处理过程,根据风机检修工作票的业务需要,确定开票流程中需要的预测任务为下一事件预测、下一事件执行时间预测和剩余时间预测。
优选的,所述日志处理模块具体执行如下操作:
分析日志,按照工作票类型划分日志,根据日志中“工作业务主键”这一属性按照三种工作票类型将日志划分为三个数据集,记电气一种票、电气二种票和风机检修票的工作票类型分别为A、B、C,所述“工作业务主键”是指每项开票业务流程的唯一标记;
对划分后的三个数据集分别进行预处理,包括删除无关、重复属性列、异常值和异常轨迹,并筛选、删除不完整轨迹,所述轨迹是指某一次开票业务从开始到结束的整个具体过程;
对于预处理后的各类型数据集,采用基于时间增量抽取的方法划分成训练集和测试集,将数据集按照时间顺序均分为5个部分,每一部分均分为5组并选用第一组进行组合作为测试集,剩下的数据作为训练集,划分结果用于预测模型的训练和测试。
优选的,所述特征选取模块具体执行如下操作:
将训练集和测试集中的类别属性转化为数值类型,以便程序识别,另外计算并拓展时间属性,包括执行时间、总执行时间、月份、日期、星期和时间点;
采用XGBoost算法,将处理后的训练集训练树模型,将所有属性都作为模型输入特征,根据得到的树模型计算各特征的重要性值,得到按特征重要性值排列的统计图,其中,所述XGBoost是一个优化的分布式梯度增强库,能够根据训练得到的树模型进行预测,并且根据树模型能够计算出各特征的重要性值;
从训练集和测试集中,删除得到的统计图所示除日志标志性特征——“活动”外重要性值最低的特征,当没有能够删除的特征时,选取最佳预测结果所对应的特征组作为预测模型的输入值;否则重复训练树模型、计算特征重要性值和删除特征过程。
优选的,所述特征编码模块具体执行如下操作:
将特征选取模块选取的重要特征采用合适的编码方式进行编码,特征包含类别特征和数值特征,具体如下:
类别特征选用基于索引的编码方法,并将编码后的特征更新到训练集和测试集中,所述基于索引的编码是将离散属性基于下标索引进行简单顺序编码;
数值特征同属一个量级无需进行归一化或标准化操作。
优选的,所述预测方法选取模块具体执行如下操作:
每类工作票流程作为一组,共分为三组,每组训练一个模型;
采用机器学习中的XGBoost和LSTM神经网络分别构建两种预测模型,所述XGBoost是一个优化的分布式梯度增强库,能够根据训练得到的树模型进行预测,并且根据树模型能够计算出各特征的重要性值,LSTM是一种循环神经网络的变体,具有长期记忆能力,能够根据先前的事件信息进行预测,能够处理有前后关联关系的整条轨迹上的预测任务;
根据选用两种预测模型的不同特点选用相应的轨迹前缀,其中,使用XGBoost构建的预测模型仅采用当前状态特征作为输入,即长度为1的固定滑动窗口,使用LSTM神经网络构建的预测模型采用变长前缀作为输入,所述轨迹前缀是在某条轨迹上的任意活动节点或时刻前的轨迹信息。
优选的,所述预测模型训练模块具体执行如下操作:
依据预测任务确定模块中确定的预测任务、特征选取模块中选取的特征数量和相应方法的经验参数,构建初步的预测模型;
根据不同模型所选取的轨迹前缀调整训练集和测试集的数据结构,将训练集用于构建模型的训练;
训练过程中不断调整超参数和模型结构使之在测试集上达到最优预测效果,所述轨迹前缀是在某条轨迹上的任意活动节点或时刻前的轨迹信息。
优选的,所述评估与分析模块具体执行如下操作:
评估预测结果需利用预测模型训练模块训练好的模型和调整后的测试集,评估的优劣通过评估指标反映出来,分析评估指标值选择更好的模型应用于实际的风机检修工作票业务流程中,评估指标根据预测任务的不同采取不同的评估方法,具体如下:
下一事件预测的预测模型属于分类模型,采用Accuracy评估指标,计算正确分类的比例,计算公式如下:
其中,n为样本总数,l为分类数,si为第i类的样本数,TPi、TNi、FNi、FPi分别为i类中正确划分为正例的个数、错误划分为正例的个数、错误划分为负例的个数以及正确划分为负例的个数;
下一事件执行时间预测和剩余时间预测的预测模型属于回归模型,采用MAE评估指标,计算真实值与预测值的平均绝对误差,计算公式如下:
其中,y为真实值,为预测值。
本发明与现有技术相比,具有如下优点与有益效果:
1、本发明首次将业务预测性监控技术应用于风机流程中,实现了风机检修工作票流程业务执行过程中的实时预测。
2、本发明首次实现了风机检修工作票业务流程预测性监控中特征的自选取方法,自动选取对预测结果有积极影响的特征作为输入。
3、本发明通过对风机检修工作票业务流程中的下一事件预测,了解业务流程的下一步骤以做好工作准备。
4、本发明通过对风机检修工作票业务流程中的下一事件执行时间预测,实现了根据时间预测信息调整当前的工作,以保证后续事件的顺利展开。
5、本发明通过对风机检修工作票业务流程中的剩余时间预测,以确保业务在需要的时间内完成办理,若出现延期情况可及时采取措施,不影响后续进度。
附图说明
图1为本发明逻辑流程示意图。
图2为本发明风机检修工作票下一事件预测的特征重要性值统计图。
图3为本发明风机检修工作票下一事件执行时间预测的特征重要性值统计图。
图4为本发明风机检修票工作剩余时间预测的特征重要性值统计图。
图5为本发明的系统架构图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
如图1所示,本实施例所提供的基于XGBoost算法的风机检修流程预测性监控方法,包括以下步骤:
1)获取风机检修工作票的日志,根据风机流程确定预测任务:
从洁源票据工作流系统中导出风机检修工作票流程的日志,了解系统的业务处理过程,根据风机检修工作票的业务需要,确定开票流程中需要的预测任务为下一事件预测、下一事件执行时间预测和剩余时间预测。
所述下一事件预测是指在业务流程执行过程中预测下一项需执行的任务,下一事件执行时间预测是指完成该任务执行所需要的时间,剩余时间预测是指到整个流程全部结束所需要的时间。
在本步骤中,选用风机检修工作票日志。
2)日志分析和预处理,划分训练集和测试集:
2.1)分析日志,按照工作票类型划分日志,根据日志中“工作业务主键”这一属性按照三种工作票类型将日志划分为三个数据集,记电气一种票、电气二种票和风机检修票的工作票类型分别为A、B、C,所述“工作业务主键”是指每项开票业务流程的唯一标记;
2.2)对步骤2.1)中的三个数据集分别进行预处理,包括删除无关、重复属性列、异常值和异常轨迹,并筛选、删除不完整轨迹;
在本步骤中,首先,删除风机检修工作票日志中的无关属性列工作ID、流程ID、工作活动ID和工作活动项签字时间,删除重复属性列工作名称、工作创建时间、活动ID和工作活动项时间;其次,删除异常值和异常轨迹,其中包含空值或“null”并且与前后事件具有相同记录信息的视为异常值,删除该事件记录行,整条轨迹都存在大量重复事件和“null”值的视为异常轨迹,删除整条轨迹信息;最后,筛选并删除不完整轨迹,将最后一个事件不是“完善方案”的案例从数据集中删除出来。
2.3)经过步骤2.2)预处理后的各类型数据集,采用一种基于时间增量抽取的方法划分成训练集和测试集,将数据集按照时间顺序均分为5个部分,每一部分均分为5组并选用第一组进行组合作为测试集,剩下的数据作为训练集。
在本步骤中,三种数据集的统计属性如表1所示,由于电气一种票数据样本量太少不予划分。本发明将表1的数据集按上述方法进行划分,划分结果用于预测模型的训练和测试。
表1三种工作票数据集的统计属性
3)特征选取,确定特征选取策略并选取重要特征:
3.1)将步骤2)得到的训练集和测试集中的类别属性转化为数值类型,以便程序识别,另外计算并拓展时间属性,根据开始和结束的时间戳转化为每个事件的执行时间、从开票流程开始到该事件的总执行时间、月份、日期、星期以及一天中的时间点;
3.2)采用XGBoost算法,将处理后的训练集训练树模型,将所有属性都作为模型输入特征,根据得到的树模型计算各特征的重要性值,得到按特征重要性值排列的统计图,所述XGBoost是一个优化的分布式梯度增强库,可根据训练得到的树模型进行预测,并且根据树模型能够计算出各特征的重要性值;
在本步骤中,以风机检修票数据为例,特征的重要性值统计如图2至图4所示。
3.3)从训练集和测试集中,删除步骤3.2)得到的统计图所示除日志标志性特征——“活动”外重要性值最低的特征;
3.4)当步骤3.3)没有可删除的特征时,选取最佳预测结果所对应的特征组作为预测模型的输入值;否则重复步骤3.2)-步骤3.3)。
在本步骤中,以风机检修票数据的下一个事件预测为例,特征选取结果如表2所示,根据预测准确率选定下一事件的输入特征为活动、状态、资源、执行时间和总执行时间。采用此方法,分别确定下一事件时间的输入特征为活动和资源,剩余时间的输入特征为活动和状态。
4)特征编码,使编码后的值能代表该特征:
将步骤3)中选取的重要特征采用合适的编码方式进行编码,特征包含类别特征和数值特征,具体如下:
类别特征选用基于索引的编码方法,并将编码后的特征更新到步骤3)处理后的训练集和测试集中,所述基于索引的编码是将离散属性基于下标索引进行简单顺序编码;
数值特征同属一个量级无需进行归一化或标准化操作。
表2下一事件的特征组合预测结果
5)确定模型分组,选取预测方法,选取轨迹前缀:
5.1)每类工作票流程作为一组,共分为三组,每组训练一个模型;
5.2)采用机器学习中的XGBoost和LSTM神经网络分别构建两种预测模型,所述XGBoost是一个优化的分布式梯度增强库,可根据训练得到的树模型进行预测,并且根据树模型能够计算出各特征的重要性值,所述LSTM是一种循环神经网络的变体,具有长期记忆能力,能够根据先前的事件信息进行预测,可处理有前后关联关系的整条轨迹上的预测任务;
5.3)根据步骤5.2)中两种预测模型的不同特点选用相应的轨迹前缀,其中,使用XGBoost构建的预测模型仅采用当前状态特征作为输入,即长度为1的固定滑动窗口,使用LSTM神经网络构建的预测模型采用变长前缀作为输入,所述轨迹前缀是在某条轨迹上的任意活动节点或时刻前的轨迹信息。
6)构建、训练和调试预测模型:
6.1)依据步骤1)中确定的预测任务、步骤4)选取的特征数量和相应方法的经验参数,构建初步的预测模型;
6.2)根据不同模型所选取的轨迹前缀调整步骤4)更新后的训练集和测试集的数据结构,将训练集用于步骤6.1)中构建模型的训练;
6.3)训练过程中不断调整超参数和模型结构使之在步骤4)更新后的测试集上达到最优预测效果,所述轨迹前缀是在某条轨迹上的任意活动节点或时刻前的轨迹信息。
在本步骤中,程序采用Python语言,在Python3.7环境中实现,其中XGBoost采用框架中的默认参数即可得到较好地结果,LSTM神经网络采用pytorch框架搭建,根据经验值设置网络结构和超参数,然后在训练过程中不断调试找到较合适的结构和参数设置。
以风机检修票数据的下一个事件预测为例,调试结果如表3所示,其中LSTM(5,64,1)表示LSTM网络层接收5个特征输入,每层包含64个网络单元,1层网络单元,Linear(64,32)表示全连接层接收64个特征输入,包含32个网络单元。另外学习率依经验值设置为0.005,迭代次数设置为1000。
表3下一事件的LSTM神经网络模型结构调试结果
网络结构 | Accuracy |
LSTM(5,64,1)Linear(64,32)Linear(32,1) | 94.04% |
LSTM(5,128,1)Linear(128,64)Linear(64,1) | 95.86% |
LSTM(5,128,2)Linear(128,64)Linear(64,1) | 96.37% |
LSTM(5,128,3)Linear(128,64)Linear(64,1) | 96.68% |
7)预测结果评估和分析:
评估估预测结果需利用步骤6)训练好的模型和调整后的测试集,评估的优劣通过评估指标反映出来,分析评估指标值选择更好的模型应用于实际的风机检修工作票业务流程中,评估指标根据预测任务的不同采取不同的评估方法,具体如下:
下一事件预测的预测模型属于分类模型,采用Accuracy评估指标,计算正确分类的比例,计算公式如下:
其中,n为样本总数,l为分类数,si为第i类的样本数,TPi、TNi、FNi、FPi分别为i类中正确划分为正例的个数、错误划分为正例的个数、错误划分为负例的个数以及正确划分为负例的个数;
b)下一事件执行时间预测和剩余时间预测的预测模型属于回归模型,采用MAE评估指标,计算真实值与预测值的平均绝对误差,计算公式如下:
其中,y为真实值,为预测值。
在本步骤中,整个业务流程预测任务的预测模型测试结果如表4所示。
表4风机检修工作票业务流程预测结果
由表4可以看出在该业务流程中XGBoost的模型比LSTM神经网络表现更好。在类型C风机检修票数据中下一事件的预测准确率高达98.5%,时间预测方面的平均误差也在合理的时间范围内,在业务流程相对简单的情况下,LSTM的表现略低于XGBoost。在类型B电气二种票数据中,由于样本数量太少,难以训练复杂的神经网络结构,因此XGBoost的表现更好。类型A电气一种票数据量太少不足以划分训练和测试,故不对A进行训练。根据分析可得,以目前的数据量采用XGBoost方法即可很好的进行预测,未来随着数据量日益增多或流程日趋复杂,可充分发挥LSTM网络的特性,以得到更好的预测模型。
综上所述,在采用以上方案后,本发明将流程预测性监控技术应用到风机检修工作票业务流程中,并给出了顺序的执行步骤和详细的步骤说明,预测了风机检修工作票任务执行过程中的下一事件、下一事件执行时间和剩余时间,有效的实现了风险的提前了解、早期预备和防范,以更高效、便捷的方式完善风机维修的票据流程。
实施例2
本实施例公开了一种基于XGBoost算法的风机检修流程预测性监控系统,如图5所示,包括预测任务确定模块、日志处理模块、特征选取模块、特征编码模块、预测方法选取模块、预测模型训练模块和评估与分析模块。
所述预测任务确定模块具体执行如下操作:
从洁源票据工作流系统中导出风机检修工作票流程的日志,了解系统的业务处理过程,根据风机检修工作票的业务需要,确定开票流程中需要的预测任务为下一事件预测、下一事件执行时间预测和剩余时间预测。
所述日志处理模块具体执行如下操作:
分析日志,按照工作票类型划分日志,根据日志中“工作业务主键”这一属性按照三种工作票类型将日志划分为三个数据集,记电气一种票、电气二种票和风机检修票的工作票类型分别为A、B、C,所述“工作业务主键”是指每项开票业务流程的唯一标记;
对划分后的三个数据集分别进行预处理,包括删除无关、重复属性列、异常值和异常轨迹,并筛选、删除不完整轨迹,所述轨迹是指某一次开票业务从开始到结束的整个具体过程;
对于预处理后的各类型数据集,采用基于时间增量抽取的方法划分成训练集和测试集,将数据集按照时间顺序均分为5部分,每一部分均分为5组并选用第一组进行组合作为测试集,剩下的数据作为训练集,划分结果用于预测模型的训练和测试。
所述特征选取模块具体执行如下操作:
将训练集和测试集中的类别属性转化为数值类型,以便程序识别,另外计算并拓展时间属性,包括执行时间、总执行时间、月份、日期、星期和时间点;
采用XGBoost算法,将处理后的训练集训练树模型,将所有属性都作为模型输入特征,根据得到的树模型计算各特征的重要性值,得到按特征重要性值排列的统计图,所述XGBoost是一个优化的分布式梯度增强库,可根据训练得到的树模型进行预测,并且根据树模型能够计算出各特征的重要性值;
从训练集和测试集中,删除得到的统计图所示除日志标志性特征——“活动”外重要性值最低的特征,当没有可删除的特征时,选取最佳预测结果所对应的特征组作为预测模型的输入值;否则重复训练树模型、计算特征重要性值和删除特征过程。
所述特征编码模块具体执行如下操作:
将特征选取模块选取的重要特征采用合适的编码方式进行编码,特征包含类别特征和数值特征,具体如下:
类别特征选用基于索引的编码方法,并将编码后的特征更新到训练集和测试集中,所述基于索引的编码是将离散属性基于下标索引进行简单顺序编码;
数值特征同属一个量级无需进行归一化或标准化操作。
所述预测方法选取模块具体执行如下操作:
每类工作票流程作为一组,共分为三组,每组训练一个模型;
采用机器学习中的XGBoost和LSTM神经网络分别构建两种预测模型,所述XGBoost是一个优化的分布式梯度增强库,可根据训练得到的树模型进行预测,并且根据树模型能够计算出各特征的重要性值,LSTM是一种循环神经网络的变体,具有长期记忆能力,能够根据先前的事件信息进行预测,可处理有前后关联关系的整条轨迹上的预测任务;
根据选用两种预测模型的不同特点选用相应的轨迹前缀,其中,使用XGBoost构建的预测模型仅采用当前状态特征作为输入,即长度为1的固定滑动窗口,使用LSTM神经网络构建的预测模型采用变长前缀作为输入,所述轨迹前缀是在某条轨迹上的任意活动节点或时刻前的轨迹信息。
所述预测模型训练模块具体执行如下操作:
依据预测任务确定模块中确定的预测任务、特征选取模块中选取的特征数量和相应方法的经验参数,构建初步的预测模型;
根据不同模型所选取的轨迹前缀调整训练集和测试集的数据结构,将训练集用于构建模型的训练;
训练过程中不断调整超参数和模型结构使之在测试集上达到最优预测效果,所述轨迹前缀是在某条轨迹上的任意活动节点或时刻前的轨迹信息。
所述评估与分析模块具体执行如下操作:
评估预测结果需利用预测模型训练模块训练好的模型和调整后的测试集,评估的优劣通过评估指标反映出来,分析评估指标值选择更好的模型应用于实际的风机检修工作票业务流程中,评估指标根据预测任务的不同采取不同的评估方法,具体如下:
下一事件预测的预测模型属于分类模型,采用Accuracy评估指标,计算正确分类的比例,计算公式如下:
其中n为样本总数,l为分类数,si为第i类的样本数,TPi、TNi、FNi、FPi分别为i类中正确划分为正例的个数、错误划分为正例的个数、错误划分为负例的个数以及正确划分为负例的个数;
下一事件执行时间预测和剩余时间预测的预测模型属于回归模型,采用MAE评估指标,计算真实值与预测值的平均绝对误差,计算公式如下:
其中,y为真实值,为预测值。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (7)
1.基于XGBoost算法的风机检修流程预测性监控方法,其特征在于,包括以下步骤:
1)获取日志,确定预测任务:
获取风机检修工作票的日志,根据风机流程确定预测任务;
2)日志分析和预处理:
分析获取的日志,按照工作票类型划分日志为三个数据集,删除无关属性列和异常值,将每个数据集再划分为训练集和测试集;
需借助风机检修工作票的业务背景分析和处理步骤1)获取的日志,并划分为训练集和测试集,包括以下步骤:
2.1)分析日志,按照工作票类型划分日志,根据日志中“工作业务主键”这一属性按照三种工作票类型将日志划分为三个数据集,记电气一种票、电气二种票和风机检修票的工作票类型分别为A、B、C,所述“工作业务主键”是指每项开票业务流程的唯一标记;
2.2)对步骤2.1)中的三个数据集分别进行预处理,包括删除无关、重复属性列、异常值和异常轨迹,并筛选、删除不完整轨迹,所述轨迹是指某一次开票业务从开始到结束的整个具体过程;
2.3)经过步骤2.2)预处理后的各类型数据集,采用基于时间增量抽取的方法划分成训练集和测试集,将数据集按照时间顺序均分为5个部分,每一部分均分为5组并选用第一组进行组合作为测试集,剩下的数据作为训练集,划分结果用于预测模型的训练和测试;
3)特征选取:
根据训练集和测试集,采用XGBoost算法计算各特征的重要性值,确定特征选取策略并选取重要特征;
根据选取策略选取重要属性作为预测模型的输入特征,具体包括以下步骤:
3.1)将步骤2)得到的训练集和测试集中的类别属性转化为数值类型,以便程序识别,另外计算并拓展时间属性,包括执行时间、总执行时间、月份、日期、星期和时间点;
3.2)采用XGBoost算法,将处理后的训练集训练树模型,将所有属性都作为模型输入特征,根据得到的树模型计算各特征的重要性值,得到按特征重要性值排列的统计图,其中,所述XGBoost是一个优化的分布式梯度增强库,能够根据训练得到的树模型进行预测,并且根据树模型能够计算出各特征的重要性值;
3.3)从训练集和测试集中,删除步骤3.2)得到的统计图所示除日志标志性特征——“活动”外重要性值最低的特征;
3.4)当步骤3.3)没有能够删除的特征时,选取最佳预测结果所对应的特征组作为预测模型的输入值;否则重复步骤3.2)-步骤3.3);
4)特征编码:
将选取的特征进行编码,并更新至训练集和测试集中,使编码后的值能代表该特征;
5)确定模型分组,选取预测方法和轨迹前缀:
根据日志特点确定模型分组,分别选取XGBoost和LSTM神经网络作为预测方法,选取不同预测方法对应的轨迹前缀;
确定模型分组,选取流程预测采用的机器学习方法,根据预测方法和预测效果选择轨迹前缀,包括如下步骤:
5.1)每类工作票流程作为一组,共分为三组,每组训练一个模型;
5.2)采用机器学习中的XGBoost和LSTM神经网络分别构建两种预测模型,所述XGBoost是一个优化的分布式梯度增强库,能够根据训练得到的树模型进行预测,并且根据树模型能够计算出各特征的重要性值,所述LSTM是一种循环神经网络的变体,具有长期记忆能力,能够根据先前的事件信息进行预测,能够处理有前后关联关系的整条轨迹上的预测任务;
5.3)根据步骤5.2)中两种预测模型的不同特点选用相应的轨迹前缀,其中,使用XGBoost构建的预测模型仅采用当前状态特征作为输入,即长度为1的固定滑动窗口,使用LSTM神经网络构建的预测模型采用变长前缀作为输入,所述轨迹前缀是在某条轨迹上的任意活动节点或时刻前的轨迹信息;
6)构建、训练和调试预测模型:
采用步骤5)选取的预测方法构建预测模型,利用训练集训练预测模型,调试超参数直至达到最优预测效果;
7)预测模型的评估和分析:
将测试集输入到训练好的预测模型得到预测结果,选用Accuracy和MAE指标来评估和分析预测结果的准确率,分析评估指标值选择更好的模型应用于实际的风机检修工作票业务流程中。
2.根据权利要求1所述的基于XGBoost算法的风机检修流程预测性监控方法,其特征在于:在步骤1)中,从洁源票据工作流系统中导出风机检修工作票流程的日志,了解系统的业务处理过程,根据风机检修工作票的业务需要,确定开票流程中需要的预测任务为下一事件预测、下一事件执行时间预测和剩余时间预测,所述下一事件预测是指在业务流程执行过程中预测下一项需执行的任务,下一事件执行时间预测是指完成任务执行所需要的时间,剩余时间预测是指到整个流程全部结束所需要的时间。
3.根据权利要求1所述的基于XGBoost算法的风机检修流程预测性监控方法,其特征在于:在步骤4)中,将步骤3)中选取的重要特征采用合适的编码方式进行编码,特征包含类别特征和数值特征,具体如下:
类别特征选用基于索引的编码方法,并将编码后的特征更新到步骤3)处理后的训练集和测试集中,所述基于索引的编码是将离散属性基于下标索引进行简单顺序编码;
数值特征同属一个量级无需进行归一化或标准化操作。
4.根据权利要求1所述的基于XGBoost算法的风机检修流程预测性监控方法,其特征在于:在步骤6)中,构建、训练和调试预测模型,具体步骤如下所示:
6.1)依据步骤1)中确定的预测任务、步骤4)选取的特征数量、步骤5)所选的预测方法和相应方法的经验参数,构建初步的预测模型;
6.2)根据不同模型所选取的轨迹前缀调整步骤4)更新后的训练集和测试集的数据结构,将训练集用于步骤6.1)中构建的预测模型的训练;
6.3)训练过程中不断调整超参数和模型结构使之在步骤4)更新后的测试集上达到最优预测效果,所述轨迹前缀是在某条轨迹上的任意活动节点或时刻前的轨迹信息,轨迹前缀能够用聚合、变长和固定滑动窗口方式表示。
5.根据权利要求1所述的基于XGBoost算法的风机检修流程预测性监控方法,其特征在于:在步骤7)中,评估预测结果需利用步骤6)训练好的模型和调整后的测试集,评估的优劣通过评估指标反映出来,分析评估指标值选择更好的模型应用于实际的风机检修工作票业务流程中,评估指标根据预测任务的不同采取不同的评估方法,具体如下:
下一事件预测的预测模型属于分类模型,采用Accuracy评估指标,计算正确分类的比例,计算公式如下:
其中,n为样本总数,l为分类数,si为第i类的样本数,TPi、TNi、FNi、FPi分别为i类中正确划分为正例的个数、错误划分为正例的个数、错误划分为负例的个数以及正确划分为负例的个数;
下一事件执行时间预测和剩余时间预测的预测模型属于回归模型,采用MAE评估指标,计算真实值与预测值的平均绝对误差,计算公式如下:
其中,y为真实值,为预测值。
6.基于XGBoost算法的风机检修流程预测性监控系统,其特征在于,用于实现权利要求1-5任意一项所述的基于XGBoost算法的风机检修流程预测性监控方法,包括预测任务确定模块、日志处理模块、特征选取模块、特征编码模块、预测方法选取模块、预测模型训练模块和评估与分析模块;
所述预测任务确定模块用于获取风机检修工作票的日志后,根据风机流程确定预测任务;
所述日志处理模块用于日志分析和预处理,划分训练集和测试集;
所述特征选取模块用于根据选取策略选取日志的重要属性作为预测模型的输入特征;
所述特征编码模块用于选取的重要特征采用合适的编码方式进行编码;
所述预测方法选取模块用于确定模型分组,选取预测方法,选取轨迹前缀;
所述预测模型训练模块用于构建、训练和调试预测模型;
所述评估与分析模块用于评估预测模型的优劣,分析适用于风机检修工作票业务的方法。
7.根据权利要求6所述的基于XGBoost算法的风机检修流程预测性监控系统,其特征在于:
所述预测任务确定模块具体执行如下操作:
从洁源票据工作流系统中导出风机检修工作票流程的日志,了解系统的业务处理过程,根据风机检修工作票的业务需要,确定开票流程中需要的预测任务为下一事件预测、下一事件执行时间预测和剩余时间预测;
所述日志处理模块具体执行如下操作:
分析日志,按照工作票类型划分日志,根据日志中“工作业务主键”这一属性按照三种工作票类型将日志划分为三个数据集,记电气一种票、电气二种票和风机检修票的工作票类型分别为A、B、C,所述“工作业务主键”是指每项开票业务流程的唯一标记;
对划分后的三个数据集分别进行预处理,包括删除无关、重复属性列、异常值和异常轨迹,并筛选、删除不完整轨迹,所述轨迹是指某一次开票业务从开始到结束的整个具体过程;
对于预处理后的各类型数据集,采用基于时间增量抽取的方法划分成训练集和测试集,将数据集按照时间顺序均分为5个部分,每一部分均分为5组并选用第一组进行组合作为测试集,剩下的数据作为训练集,划分结果用于预测模型的训练和测试;
所述特征选取模块具体执行如下操作:
将训练集和测试集中的类别属性转化为数值类型,以便程序识别,另外计算并拓展时间属性,包括执行时间、总执行时间、月份、日期、星期和时间点;
采用XGBoost算法,将处理后的训练集训练树模型,将所有属性都作为模型输入特征,根据得到的树模型计算各特征的重要性值,得到按特征重要性值排列的统计图,其中,所述XGBoost是一个优化的分布式梯度增强库,能够根据训练得到的树模型进行预测,并且根据树模型能够计算出各特征的重要性值;
从训练集和测试集中,删除得到的统计图所示除日志标志性特征——“活动”外重要性值最低的特征,当没有能够删除的特征时,选取最佳预测结果所对应的特征组作为预测模型的输入值;否则重复训练树模型、计算特征重要性值和删除特征过程;
所述特征编码模块具体执行如下操作:
将特征选取模块选取的重要特征采用合适的编码方式进行编码,特征包含类别特征和数值特征,具体如下:
类别特征选用基于索引的编码方法,并将编码后的特征更新到训练集和测试集中,所述基于索引的编码是将离散属性基于下标索引进行简单顺序编码;
数值特征同属一个量级无需进行归一化或标准化操作;
所述预测方法选取模块具体执行如下操作:
每类工作票流程作为一组,共分为三组,每组训练一个模型;
采用机器学习中的XGBoost和LSTM神经网络分别构建两种预测模型,所述XGBoost是一个优化的分布式梯度增强库,能够根据训练得到的树模型进行预测,并且根据树模型能够计算出各特征的重要性值,LSTM是一种循环神经网络的变体,具有长期记忆能力,能够根据先前的事件信息进行预测,能够处理有前后关联关系的整条轨迹上的预测任务;
根据选用两种预测模型的不同特点选用相应的轨迹前缀,其中,使用XGBoost构建的预测模型仅采用当前状态特征作为输入,即长度为1的固定滑动窗口,使用LSTM神经网络构建的预测模型采用变长前缀作为输入,所述轨迹前缀是在某条轨迹上的任意活动节点或时刻前的轨迹信息;
所述预测模型训练模块具体执行如下操作:
依据预测任务确定模块中确定的预测任务、特征选取模块中选取的特征数量和相应方法的经验参数,构建初步的预测模型;
根据不同模型所选取的轨迹前缀调整训练集和测试集的数据结构,将训练集用于构建模型的训练;
训练过程中不断调整超参数和模型结构使之在测试集上达到最优预测效果,所述轨迹前缀是在某条轨迹上的任意活动节点或时刻前的轨迹信息;
所述评估与分析模块具体执行如下操作:
评估预测结果需利用预测模型训练模块训练好的模型和调整后的测试集,评估的优劣通过评估指标反映出来,分析评估指标值选择更好的模型应用于实际的风机检修工作票业务流程中,评估指标根据预测任务的不同采取不同的评估方法,具体如下:
下一事件预测的预测模型属于分类模型,采用Accuracy评估指标,计算正确分类的比例,计算公式如下:
其中,n为样本总数,l为分类数,si为第i类的样本数,TPi、TNi、FNi、FPi分别为i类中正确划分为正例的个数、错误划分为正例的个数、错误划分为负例的个数以及正确划分为负例的个数;
下一事件执行时间预测和剩余时间预测的预测模型属于回归模型,采用MAE评估指标,计算真实值与预测值的平均绝对误差,计算公式如下:
其中,y为真实值,为预测值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111311627.5A CN114035468B (zh) | 2021-11-08 | 2021-11-08 | 基于XGBoost算法的风机检修流程预测性监控方法与系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111311627.5A CN114035468B (zh) | 2021-11-08 | 2021-11-08 | 基于XGBoost算法的风机检修流程预测性监控方法与系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114035468A CN114035468A (zh) | 2022-02-11 |
CN114035468B true CN114035468B (zh) | 2024-05-28 |
Family
ID=80143299
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111311627.5A Active CN114035468B (zh) | 2021-11-08 | 2021-11-08 | 基于XGBoost算法的风机检修流程预测性监控方法与系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114035468B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114358445A (zh) * | 2022-03-21 | 2022-04-15 | 山东建筑大学 | 一种业务流程剩余时间预测模型推荐方法及系统 |
CN114662793B (zh) * | 2022-04-24 | 2024-08-23 | 山东理工大学 | 基于可解释分层模型的业务流程剩余时间预测方法与系统 |
CN115238583B (zh) * | 2022-07-27 | 2024-02-13 | 山东理工大学 | 一种支持增量日志的业务流程剩余时间预测方法与系统 |
CN117311283B (zh) * | 2023-10-24 | 2024-03-19 | 风凯换热器制造(常州)有限公司 | 换热器内部预装体的车间行车控制智能化监测方法及系统 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102009284B1 (ko) * | 2018-11-28 | 2019-08-09 | 주식회사 피엠아이지 | 비즈니스 프로세스의 마지막 액티비티의 수행 시점을 예측하기 위해 동적 순환신경망을 학습시키는 비즈니스 프로세스 학습 장치 |
CN110826791A (zh) * | 2019-10-31 | 2020-02-21 | 东北电力大学 | 一种基于长短时记忆神经网络的混合风功率预测方法 |
CN111178623A (zh) * | 2019-12-26 | 2020-05-19 | 杭州电子科技大学 | 一种基于多层机器学习的业务流程剩余时间预测方法 |
CN111444940A (zh) * | 2020-02-28 | 2020-07-24 | 山东大学 | 风机关键部位故障诊断方法 |
CN111738462A (zh) * | 2020-06-08 | 2020-10-02 | 国网江苏省电力有限公司常州供电分公司 | 电力计量装置故障抢修主动服务预警方法 |
CN112035716A (zh) * | 2020-08-21 | 2020-12-04 | 华风数据(深圳)有限公司 | 基于XGBoost算法的风机发电机故障监测与诊断方法 |
CN112052990A (zh) * | 2020-08-21 | 2020-12-08 | 杭州电子科技大学 | 一种基于CNN-BiLSTM混合模型的多角度业务流程下一活动预测方法 |
CN112052273A (zh) * | 2020-07-27 | 2020-12-08 | 杭州电子科技大学 | 一种多角度业务流程下一候选活动提取方法 |
CN112990284A (zh) * | 2021-03-04 | 2021-06-18 | 安徽大学 | 一种基于XGBoost算法的个体出行行为预测方法、系统及终端 |
CN113096814A (zh) * | 2021-05-28 | 2021-07-09 | 哈尔滨理工大学 | 一种基于多分类器融合的阿尔兹海默症分类预测方法 |
CN113159413A (zh) * | 2021-04-19 | 2021-07-23 | 山东理工大学 | 业务流程剩余时间预测方法、系统、存储介质及计算设备 |
CN113361663A (zh) * | 2021-08-09 | 2021-09-07 | 国网浙江省电力有限公司金华供电公司 | 基于人工智能的电网事件诊断自主学习方法及系统 |
CN113591924A (zh) * | 2021-07-01 | 2021-11-02 | 中山大学新华学院 | 一种网络诈骗号码检测方法、系统、存储介质及终端设备 |
-
2021
- 2021-11-08 CN CN202111311627.5A patent/CN114035468B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102009284B1 (ko) * | 2018-11-28 | 2019-08-09 | 주식회사 피엠아이지 | 비즈니스 프로세스의 마지막 액티비티의 수행 시점을 예측하기 위해 동적 순환신경망을 학습시키는 비즈니스 프로세스 학습 장치 |
CN110826791A (zh) * | 2019-10-31 | 2020-02-21 | 东北电力大学 | 一种基于长短时记忆神经网络的混合风功率预测方法 |
CN111178623A (zh) * | 2019-12-26 | 2020-05-19 | 杭州电子科技大学 | 一种基于多层机器学习的业务流程剩余时间预测方法 |
CN111444940A (zh) * | 2020-02-28 | 2020-07-24 | 山东大学 | 风机关键部位故障诊断方法 |
CN111738462A (zh) * | 2020-06-08 | 2020-10-02 | 国网江苏省电力有限公司常州供电分公司 | 电力计量装置故障抢修主动服务预警方法 |
CN112052273A (zh) * | 2020-07-27 | 2020-12-08 | 杭州电子科技大学 | 一种多角度业务流程下一候选活动提取方法 |
CN112052990A (zh) * | 2020-08-21 | 2020-12-08 | 杭州电子科技大学 | 一种基于CNN-BiLSTM混合模型的多角度业务流程下一活动预测方法 |
CN112035716A (zh) * | 2020-08-21 | 2020-12-04 | 华风数据(深圳)有限公司 | 基于XGBoost算法的风机发电机故障监测与诊断方法 |
CN112990284A (zh) * | 2021-03-04 | 2021-06-18 | 安徽大学 | 一种基于XGBoost算法的个体出行行为预测方法、系统及终端 |
CN113159413A (zh) * | 2021-04-19 | 2021-07-23 | 山东理工大学 | 业务流程剩余时间预测方法、系统、存储介质及计算设备 |
CN113096814A (zh) * | 2021-05-28 | 2021-07-09 | 哈尔滨理工大学 | 一种基于多分类器融合的阿尔兹海默症分类预测方法 |
CN113591924A (zh) * | 2021-07-01 | 2021-11-02 | 中山大学新华学院 | 一种网络诈骗号码检测方法、系统、存储介质及终端设备 |
CN113361663A (zh) * | 2021-08-09 | 2021-09-07 | 国网浙江省电力有限公司金华供电公司 | 基于人工智能的电网事件诊断自主学习方法及系统 |
Non-Patent Citations (4)
Title |
---|
倪维健 ; 孙宇健 ; 刘彤 ; 曾庆田 ; 刘聪 ; .基于注意力双向循环神经网络的业务流程剩余时间预测方法.计算机集成制造系统.2020,(06),全文. * |
基于注意力双向循环神经网络的业务流程剩余时间预测方法;倪维健;孙宇健;刘彤;曾庆田;刘聪;;计算机集成制造系统;20200615(06);全文 * |
深度学习方法在业务流程进度预测中的应用;郑婷婷;;现代计算机(专业版);20180915(26);全文 * |
郑婷婷 ; .深度学习方法在业务流程进度预测中的应用.现代计算机(专业版).2018,(26),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN114035468A (zh) | 2022-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114035468B (zh) | 基于XGBoost算法的风机检修流程预测性监控方法与系统 | |
CN107967485B (zh) | 用电计量设备故障分析方法及装置 | |
CN112508053A (zh) | 基于集成学习框架的智能诊断方法、装置、设备及介质 | |
CN111639783A (zh) | 一种基于lstm神经网络的线损预测方法及系统 | |
CN110716512A (zh) | 一种基于燃煤电站运行数据的环保装备性能预测方法 | |
CN106909933A (zh) | 一种三阶段多视角特征融合的窃电分类预测方法 | |
CN110571792A (zh) | 一种电网调控系统运行状态的分析评估方法及系统 | |
CN114580291B (zh) | 一种基于lstm-vae的动设备健康状况评估方法 | |
CN114154716B (zh) | 一种基于图神经网络的企业能耗预测方法及装置 | |
CN111241755A (zh) | 电力负荷预测方法 | |
CN110852496A (zh) | 一种基于lstm循环神经网络的天然气负荷预测方法 | |
CN111091292A (zh) | 一种核电站实时风险动态建模分析系统 | |
CN114662793B (zh) | 基于可解释分层模型的业务流程剩余时间预测方法与系统 | |
CN115034485A (zh) | 一种基于数据空间的风电功率区间预测方法及装置 | |
CN115564310A (zh) | 一种基于卷积神经网络的新能源电力系统可靠性评估方法 | |
CN115600722A (zh) | 企业电碳因子长期预测方法 | |
CN110781206A (zh) | 一种学习拆回表故障特征规则预测在运电能表是否故障的方法 | |
CN115238573A (zh) | 考虑工况参数的水电机组性能劣化趋势预测方法和系统 | |
CN118261562A (zh) | 一种基于大型水电站设备分析的智慧运行系统及方法 | |
CN117578440A (zh) | 一种基于神经网络的电网负荷预测方法 | |
CN117371752A (zh) | 一种建筑施工人力调度方法、介质及系统 | |
CN112418662A (zh) | 一种利用人工神经网络的配电网运行可靠性分析方法 | |
CN115600695B (zh) | 一种计量设备的故障诊断方法 | |
CN114970698B (zh) | 一种基于改进lwpls的计量设备运行性能预测方法 | |
CN115238583B (zh) | 一种支持增量日志的业务流程剩余时间预测方法与系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |