CN113361811A - 运行状态预测方法、系统、设备及计算机可读存储介质 - Google Patents

运行状态预测方法、系统、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN113361811A
CN113361811A CN202110747345.3A CN202110747345A CN113361811A CN 113361811 A CN113361811 A CN 113361811A CN 202110747345 A CN202110747345 A CN 202110747345A CN 113361811 A CN113361811 A CN 113361811A
Authority
CN
China
Prior art keywords
data
training data
training
operation state
running state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110747345.3A
Other languages
English (en)
Inventor
张凡
谢渊
李�杰
刘斌
郭宇翔
傅慧初
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Exx Intelligent Technology Co ltd
Original Assignee
Zhuhai Exx Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Exx Intelligent Technology Co ltd filed Critical Zhuhai Exx Intelligent Technology Co ltd
Priority to CN202110747345.3A priority Critical patent/CN113361811A/zh
Publication of CN113361811A publication Critical patent/CN113361811A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种运行状态预测方法、系统、设备及计算机可读存储介质,该方法包括:获取工厂生产设备的运行状态数据以及运行状态数据对应的时间节点,根据运行状态数据和时间节点确定训练数据;基于所述训练数据,对xgboost算法模型进行训练,确定xgboost算法模型对应的模型评估值;若模型评估值大于第一预设阈值,训练xgboost算法模型完成,得到设备状态预测模型;基于设备状态预测模型,对工厂生产设备的运行状态进行预测,得到工厂生产设备的运行状态的预估结果。本发明能够根据工厂生产设备的实时运行状态提前预测工厂生产设备的运行状态,解决了现有技术中无法及时地判断工厂生产设备的运行状态的技术问题。

Description

运行状态预测方法、系统、设备及计算机可读存储介质
技术领域
本发明涉及设备维护技术领域,尤其涉及一种运行状态预测方法、系统、设备及计算机可读存储介质。
背景技术
随着工业生产数据采集技术的日趋完善,工业生产设备的预测性维护日渐成为工业界和学术界讨论的热门话题。
通常来说,工业生产设备的预测性维护指的是利用实时产生的工业生产数据,借鉴数据分析技术分析工业生产设备的运行状态,并进一步预测设备潜在的故障和威胁,从而提高工业设备的可靠性。半导体工厂在加工时,对于流程的控制要求极高,一些微小的错误就可能导致晶圆报废,所以一旦产生故障,会造成一定的经济损害,并且如果此类故障维护不及时,可能对设备造成长久的影响,维修成本很高。
传统的设备运行状态的判断方法大多是基于一系列各种复杂的流程控制,以及维修人员多年的维修经验,传统的设备运行状态的判断方法更多依赖维修人员的经验进行判断,而通常维修人员数量有限以及工厂生产设备数量较多,依靠维修人员难以兼顾众多的生产设备,难以及时地判断工厂生产设备的运行状态。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种运行状态预测方法、系统、设备及计算机可读存储介质,旨在解决现有技术难以及时地判断工厂生产设备的运行状态的技术问题。
为实现上述目的,本发明提供一种运行状态预测方法,所述运行状态预测方法包括以下步骤:
获取工厂生产设备的运行状态数据以及所述运行状态数据对应的时间节点,根据所述运行状态数据和所述时间节点确定训练数据,其中,所述时间节点为采集所述运行状态数据的采集时间;
基于所述训练数据,对xgboost算法模型进行训练,确定所述xgboost算法模型对应的模型评估值;
若所述模型评估值大于第一预设阈值,训练所述xgboost算法模型完成,得到设备状态预测模型;
基于所述设备状态预测模型,对所述工厂生产设备的运行状态进行预测,得到所述工厂生产设备的运行状态的预估结果。
可选地,所述基于所述训练数据,对xgboost算法模型进行训练,确定所述xgboost算法模型对应的模型评估值的步骤包括:
对所述训练数据进行特征筛选,得到新的训练数据;
将所述新的训练数据作为所述训练数据,并执行所述步骤:基于所述训练数据,对xgboost算法模型进行训练,确定所述xgboost算法模型对应的模型评估值。
可选地,所述对所述训练数据进行特征筛选,得到新的训练数据的步骤包括:
根据所述训练数据,确定所述训练数据的皮尔逊相关系数,其中,所述皮尔逊相关系数表示任意两项训练数据之间的相关性;
筛选出所述皮尔逊相关系数大于第二预设阈值对应的训练数据,并将所述皮尔逊相关系数大于第二预设阈值对应的训练数据作为新的训练数据。
可选地,所述根据所述训练数据,确定所述训练数据的皮尔逊相关系数的公式为:
Figure BDA0003142604990000021
其中,X表示所述训练数据中的任意项训练数据,Y表示所述训练数据中的另一任意项训练数据。
可选地,所述根据所述运行状态数据和所述时间节点确定训练数据的步骤包括:
将所述运行状态数据和所述时间节点对应存储于所述数据库;
获取所述运行状态数据中的预设时段内的第一运行状态数据,其中,所述第一运行状态数据为任意的所述运行状态数据,所述预设时段为任意时段;
根据所述运行状态数据和所述时间节点,确定在所述预设时段后的且与所述第一运行状态数据每隔预设时长的第二运行状态数据;
根据所述第一运行状态数据和所述第二运行状态数据,确定训练数据。
可选地,所述根据所述第一运行状态数据和所述第二运行状态数据,确定训练数据的步骤包括:
对所述第一运行状态数据进行统计,得到第一统计结果;
对所述第一运行状态数据进行傅里叶变换,得到所述第一运行状态数据对应的频域信息;
对所述第二运行状态数据进行统计,得到第二统计结果,并根据第二统计结果确定设备运行结果;
将所述第一统计结果和所述频域信息作为训练数据中的特征,将所述设备运行结果作为训练数据中的标签。
可选地,所述将所述第一统计结果和所述频域信息作为训练数据中的特征,将所述设备运行结果作为训练数据中的标签的步骤包括:
删除所述第一统计结果和所述频域信息中的重复数据以及异常数据,以及补全所述第一统计结果和所述频域信息中的缺失数据,得到第一数据处理结果;
删除所述第二统计结果中的重复数据以及异常数据,以及补全所述第二统计结果中的缺失数据,得到所述第二统计结果对应的第二数据处理结果;
将所述第一数据处理结果作为训练数据中的特征,将所述第二数据处理结果作为训练数据中的标签。
此外,为实现上述目的,本发明还提供一种运行状态预测系统,所述运行状态预测系统包括:
获取模块,用于获取工厂生产设备的运行状态数据以及所述运行状态数据对应的时间节点,根据所述运行状态数据和所述时间节点确定训练数据,其中,所述时间节点为采集所述运行状态数据的采集时间;
确定模块,用于基于所述训练数据,对xgboost算法模型进行训练,确定所述xgboost算法模型对应的模型评估值;
判定模块,用于若所述模型评估值大于第一预设阈值,训练所述xgboost算法模型完成,得到设备状态预测模型;
预测模块,用于基于所述设备状态预测模型,对所述工厂生产设备的运行状态进行预测,得到所述工厂生产设备的运行状态的预估结果。
此外,为实现上述目的,本发明还提供一种运行状态预测设备,所述运行状态预测设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的运行状态预测程序,所述运行状态预测程序被所述处理器执行时实现如上述的运行状态预测方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有运行状态预测程序,所述运行状态预测程序被处理器执行时实现如上述的运行状态预测方法的步骤。
本发明通过获取工厂生产设备的运行状态数据以及所述运行状态数据对应的时间节点,根据所述运行状态数据和所述时间节点确定训练数据,其中,所述时间节点为采集所述运行状态数据的采集时间;基于所述训练数据,对xgboost算法模型进行训练,确定所述xgboost算法模型对应的模型评估值;若所述模型评估值大于第一预设阈值,训练所述xgboost算法模型完成,得到设备状态预测模型;基于所述设备状态预测模型,对所述工厂生产设备的运行状态进行预测,得到所述工厂生产设备的运行状态的预估结果。在本实施例中,采集工厂生产设备的运行状态数据来对xgboost算法模型进行训练,以构建设备状态预测模型,并依据训练好的设备状态预测模型对工厂生产设备的实时运行状态进行预测,能够实时预测工厂设备运行状态变化,能够根据工厂生产设备的实时运行状态提前预测工厂生产设备的运行状态,解决了现有技术中无法及时地判断工厂生产设备的运行状态的技术问题。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的运行状态预测设备结构示意图;
图2为本发明运行状态预测方法第一实施例的流程示意图;
图3为本发明运行状态预测方法第二实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的运行状态预测设备结构示意图。
本发明实施例运行状态预测设备可以是PC,也可以是智能手机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、便携计算机等具有显示功能的可移动式终端设备。
如图1所示,该运行状态预测设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,运行状态预测设备还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。
本领域技术人员可以理解,图1中示出的运行状态预测设备结构并不构成对运行状态预测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及运行状态预测程序。
在图1所示的运行状态预测设备中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的运行状态预测程序。
在本实施例中,运行状态预测设备包括:存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的运行状态预测程序,其中,处理器1001调用存储器1005中存储的运行状态预测程序时,并执行以下操作:
获取工厂生产设备的运行状态数据以及所述运行状态数据对应的时间节点,根据所述运行状态数据和所述时间节点确定训练数据,其中,所述时间节点为采集所述运行状态数据的采集时间;
基于所述训练数据,对xgboost算法模型进行训练,确定所述xgboost算法模型对应的模型评估值;
若所述模型评估值大于第一预设阈值,训练所述xgboost算法模型完成,得到设备状态预测模型;
基于所述设备状态预测模型,对所述工厂生产设备的运行状态进行预测,得到所述工厂生产设备的运行状态的预估结果。
进一步地,处理器1001可以调用存储器1005中存储的运行状态预测程序,还执行以下操作:
对所述训练数据进行特征筛选,得到新的训练数据;
将所述新的训练数据作为所述训练数据,并执行所述步骤:基于所述训练数据,对xgboost算法模型进行训练,确定所述xgboost算法模型对应的模型评估值。
进一步地,处理器1001可以调用存储器1005中存储的运行状态预测程序,还执行以下操作:
根据所述训练数据,确定所述训练数据的皮尔逊相关系数,其中,所述皮尔逊相关系数表示任意两项训练数据之间的相关性;
筛选出所述皮尔逊相关系数大于第二预设阈值对应的训练数据,并将所述皮尔逊相关系数大于第二预设阈值对应的训练数据作为新的训练数据。
进一步地,处理器1001可以调用存储器1005中存储的运行状态预测程序,还执行以下操作:
将所述运行状态数据和所述时间节点对应存储于所述数据库;
获取所述运行状态数据中的预设时段内的第一运行状态数据,其中,所述第一运行状态数据为任意的所述运行状态数据,所述预设时段为任意时段;
根据所述运行状态数据和所述时间节点,确定在所述预设时段后的且与所述第一运行状态数据每隔预设时长的第二运行状态数据;
根据所述第一运行状态数据和所述第二运行状态数据,确定训练数据。
进一步地,处理器1001可以调用存储器1005中存储的运行状态预测程序,还执行以下操作:
对所述第一运行状态数据进行统计,得到第一统计结果;
对所述第一运行状态数据进行傅里叶变换,得到所述第一运行状态数据对应的频域信息;
对所述第二运行状态数据进行统计,得到第二统计结果,并根据第二统计结果确定设备运行结果;
将所述第一统计结果和所述频域信息作为训练数据中的特征,将所述设备运行结果作为训练数据中的标签。
进一步地,处理器1001可以调用存储器1005中存储的运行状态预测程序,还执行以下操作:
删除所述第一统计结果和所述频域信息中的重复数据以及异常数据,以及补全所述第一统计结果和所述频域信息中的缺失数据,得到第一数据处理结果;
删除所述第二统计结果中的重复数据以及异常数据,以及补全所述第二统计结果中的缺失数据,得到所述第二统计结果对应的第二数据处理结果;
将所述第一数据处理结果作为训练数据中的特征,将所述第二数据处理结果作为训练数据中的标签。
本发明还提供一种运行状态预测方法,参照图2,图2为本发明运行状态预测方法第一实施例的流程示意图。
在本实施例中,该运行状态预测方法包括以下步骤:
步骤S10,获取工厂生产设备的运行状态数据以及所述运行状态数据对应的时间节点,根据所述运行状态数据和所述时间节点确定训练数据,其中,所述时间节点为采集所述运行状态数据的采集时间;
在本实施例中,训练数据包括正样本和负样本,其中,将运行状态数据中正常的运行状态数据作为训练数据中的正样本,以及将运行状态数据中产生异常的运行状态数据作为训练数据中的负样本。xgboost算法模型是一种分类树模型,其包含多棵决策树。在训练xgboost算法模型之前,先采集工厂生产设备的运行状态数据以及在采集运行状态数据时,记录下采集运行状态数据时对应的采集时间,并将采集运行状态数据时对应的采集时间作为运行状态数据对应的时间节点。在采集到工厂生产设备的运行状态数据后,需要说明的是,需要对运行状态数据进行分析处理后,运行状态数据才能作为训练xgboost算法模型的训练数据,即根据运行状态数据和时间节点对运行状态数据进行分析处理,以确定训练数据。
进一步地,通过传感器进行采集工厂生产设备的运行状态数据,并且传感器在采集工厂生产设备的运行状态数据时同时记录下运行状态数据的时间节点,并将运行状态数据和与运行状态数据对应的时间节点对应存储于数据库中,以供从数据库中获取训练数据来训练xgboost算法模型,其中,运行状态数据包括工厂生产设备在每个运行阶段的温度数据、线路状况数据或工具警报数据。
步骤S20,基于所述训练数据,对xgboost算法模型进行训练,确定所述xgboost算法模型对应的模型评估值;
在本实施例中,基于训练数据对xgboost算法模型进行训练的过程中,将训练数据输入至xgboost算法模型中,以通过运行状态数据对应的训练数据对xgboost算法模型进行训练。在基于训练数据对xgboost算法模型进行训练时,每一轮训练完成后计算xgboost算法模型的模型评估值,模型评估值表示xgboost算法模型的训练效果,一般而言,模型评估值越高,xgboost算法模型的训练效果越佳。其中,模型评估值可以是xgboost算法模型的准确率、精确率、召回率、或者精确率和召回率的调和平均值等。精确率为在xgboost算法模型的预测为正的样本中,实际上为正样本所占的比重;召回率为在实际的正样本中,预测为正样本所占比重,准确率为xgboost算法模型的预测结果中,预测正确的占比。精确率、召回率以及精确率和召回率的调和平均值的计算方式如下:
Figure BDA0003142604990000091
精确率:P=TP/(TP+FP)
召回率:R=TP/(TP+TN)
精确率和召回率的调和平均值:F1,其中,2/F1=1/P+1/R。
进一步地,xgboost算法(eXtreme Gradient Boosting,极端梯度提升)算法是一种机器学习算法,实质上是一种分类树模型,其包含多棵决策树,具有速度快、效果好、能处理大规模数据、支持多种语言、支持自定义损失函数等优点。对于xgboost算法模型的训练过程,首先通过不断调试其模型参数的值,找到模型最优解;之后,使用k倍交叉验证方法对模型进行训练,然后将训练出来的模型参数进行重要性排序,选择最为重要的一系列模型参数重新进行建模,然后通过不断的重复求解模型的目标函数找出每一轮的最优解,进行不断的更新模型参数,直至模型训练完毕,得到训练完成的xgboost算法模型。
步骤S30,若所述模型评估值大于第一预设阈值,训练所述xgboost算法模型完成,得到设备状态预测模型;
在本实施例中,在对xgboost算法模型训练时,每一轮训练完成后都计算xgboost算法模型的模型评估值,并判断模型评估值是否大于第一预设阈值,需要说明的是,若模型评估值大于第一预设阈值,说明xgboost算法模型训练完成,此时则停止继续对xgboost算法模型进行训练,得到设备状态预测模型;若模型评估值小于或等于第一预设阈值,说明当前xgboost算法模型未训练完成,则需要继续对xgboost算法模型进行训练,直至模型评估值大于第一预设阈值。
步骤S40,基于所述设备状态预测模型,对所述工厂生产设备的运行状态进行预测,得到所述工厂生产设备的运行状态的预估结果。
在本实施例中,在得到设备状态预测模型后,可以根据该设备状态预测模型对工厂里面的所有生产设备进行预测其是否会产生故障。具体地,采集工厂生产设备的实时运行状态数据,并将实时运行状态数据输入至已经训练完成的xgboost算法模型对应的设备状态预测模型中,以使设备状态预测模型根据实时运行状态数据,确定工厂生产设备的运行状态的预估结果,并根据预估结果来绘制工厂生产设备的运行状态数据曲线,以实时预测工厂生产设备运行状态变化,并结合历史维护数据、行业先验性方法对工厂生产设备进行预测维护。
本实施例提出的运行状态预测方法,通过获取工厂生产设备的运行状态数据以及所述运行状态数据对应的时间节点,根据所述运行状态数据和所述时间节点确定训练数据,其中,所述时间节点为采集所述运行状态数据的采集时间;基于所述训练数据,对xgboost算法模型进行训练,确定所述xgboost算法模型对应的模型评估值;若所述模型评估值大于第一预设阈值,训练所述xgboost算法模型完成,得到设备状态预测模型;基于所述设备状态预测模型,对所述工厂生产设备的运行状态进行预测,得到所述工厂生产设备的运行状态的预估结果。在本实施例中,采集工厂生产设备的运行状态数据来对xgboost算法模型进行训练,以构建设备状态预测模型,并依据训练好的设备状态预测模型对工厂生产设备的实时运行状态进行预测,能够实时预测工厂设备运行状态变化,能够根据工厂生产设备的实时运行状态提前预测工厂生产设备的运行状态,解决了现有技术中无法及时地判断工厂生产设备的运行状态的技术问题。
基于第一实施例,提出本发明运行状态预测方法的第二实施例,参照图3,在本实施例中,步骤S20包括:
步骤S21,对所述训练数据进行特征筛选,得到新的训练数据;
步骤S22,将所述新的训练数据作为所述训练数据,并执行所述步骤:基于所述训练数据,对xgboost算法模型进行训练,确定所述xgboost算法模型对应的模型评估值。
在本实施例中,在对xgboost算法模型进行训练之前,可以先对训练数据进行特征筛选,以筛选出训练数据中的特征相关性较大的训练数据,而剔除训练数据中特征相关性较低的训练数据,之后根据特征的相关性较大的训练数据对xgboost算法模型进行训练,从而可以提升xgboost算法模型的模型训练效果。具体地,对训练数据进行特征筛选,对训练数据进行进一步的筛选,以筛选出新的训练数据。之后,根据筛选出来的新的训练数据对xgboost算法模型进行训练,直至模型评估值大于预设阈值,才停止训练xgboost算法模型。
进一步地,所述对所述训练数据进行特征筛选,得到新的训练数据的步骤包括:
步骤S211,根据所述训练数据,确定所述训练数据的皮尔逊相关系数,其中,所述皮尔逊相关系数表示任意两项训练数据之间的相关性;
步骤S212,筛选出所述皮尔逊相关系数大于第二预设阈值对应的训练数据,并将所述皮尔逊相关系数大于第二预设阈值对应的训练数据作为新的训练数据。
在本实施例中,对训练数据进行特征筛选的具体过程为:根据训练数据,计算训练数据任意两项训练数据对应的皮尔逊相关系数,以供根据皮尔逊相关系数来筛选训练数据,其中,皮尔逊相关系数表示任意两项训练数据之间的相关性。之后根据训练数据任意两项训练数据对应的皮尔逊相关系数,筛选出皮尔逊相关系数大于第二预设阈值对应的训练数据,并将皮尔逊相关系数大于第二预设阈值对应的训练数据作为新的训练数据。本实施例通过计算任意两项训练数据之间的相关性来筛选训练数据,并筛选出相关性更高的训练数据,以使后续根据新的训练数据来训练模型,从而进一步地提升模型的训练效果。
进一步地,可以在对xgboost算法模型迭代预设次数之后,再对训练数据进行特征筛选,以在训练xgboost算法模型达到一定的效果之后再进行筛选训练数据进行进一步地训练,避免所计算的皮尔逊相关系数可靠性程度太低,能够提升模型训练的效率以及提升模型的训练效果。
进一步地,计算训练数据中任意两项训练数据的皮尔逊相关系数的公式如下:
Figure BDA0003142604990000121
其中,X表示训练数据中的任意项训练数据,Y表示训练数据中的另一任意项训练数据,Xi为X所包含的各项特征,Yi为Y所包含的各项特征。
进一步地,所述根据所述运行状态数据和所述时间节点确定训练数据的步骤包括:
步骤S11,将所述运行状态数据和所述时间节点对应存储于所述数据库;
步骤S12,获取所述运行状态数据中的预设时段内的第一运行状态数据,其中,所述第一运行状态数据为任意的所述运行状态数据,所述预设时段为任意时段;
步骤S13,根据所述运行状态数据和所述时间节点,确定在所述预设时段后的且与所述第一运行状态数据每隔预设时长的第二运行状态数据;
步骤S14,根据所述第一运行状态数据和所述第二运行状态数据,确定训练数据。
在本实施例中,在采集工厂生产设备的运行状态数据时同时记录下运行状态数据的时间节点,并将运行状态数据和与运行状态数据对应的时间节点对应存储于数据库中,以将运行状态数据收集至数据库中,以供后续可以从数据库中获取训练数据来训练xgboost算法模型,以及对数据库中存储的海量的运行状态数据进行分析处理。
在将运行状态数据和时间节点对应存储于数据库后,这些运行状态数据均是未经过处理的,在收集运行状态数据至数据库后,需要对数据库中所存储的运行状态数据进行处理。具体地,获取在预设时段t1内的运行状态数据,得到第一运行状态数据,第一运行状态数据为任意的运行状态数据,预设时段为任意时段;由于运行状态数据均对应于唯一一个时间节点,因此能够在运行状态数据中确定在预设时段后的且与第一运行状态数据每隔预设时长t2的运行状态数据,得到第二运行状态数据,所确定的第二运行状态数据用于确定第一运行状态数据对应的设备运行结果(包括设备运行产生警报和设备运行正常)。在确定第一运行状态数据和第一运行状态数据对应的第二运行状态数据后,确定第一运行状态数据对应的统计结果以及第二运行状态数据对应的设备运行结果,将第一运行状态数据对应的统计结果作为训练数据的特征,将第二运行状态数据对应的设备运行结果作为训练数据的标签,得到训练数据。
进一步地,所述根据所述第一运行状态数据和所述第二运行状态数据,确定训练数据的步骤包括:
步骤S141,对所述第一运行状态数据进行统计,得到第一统计结果;
步骤S142,对所述第一运行状态数据进行傅里叶变换,得到所述第一运行状态数据对应的频域信息;
步骤S143,对所述第二运行状态数据进行统计,得到第二统计结果,并根据第二统计结果确定设备运行结果;
步骤S144,将所述第一统计结果和所述频域信息作为训练数据中的特征,将所述设备运行结果作为训练数据中的标签。
在本实施例中,得到第一运行状态数据和第二运行状态数据后,分别对第一运行状态数据和第二运行状态数据进行统计,可以包括统计此二者的最大值、最小值、平均值、标准差或斜率等数据,得到第一运行状态数据对应的第一统计结果以及第二运行状态数据对应的第二统计结果,以及对第一运行状态数据进行傅里叶变换,以获取运行状态数据在频域上的信息,得到第一运行状态数据对应的频域信息,以供后续将第一运行状态数据对应的频域信息增加至训练数据的特征,从而提升模型训练效果。在确定第一统计结果和第一统计结果对应的第二统计结果后,根据第二统计结果确定设备运行结果,将第一统计结果和第一运行状态对应的频域信息作为训练数据中的特征,将设备运行结果作为训练数据中的标签,其中,设备运行结果包括设备运行产生警报和设备运行正常。
进一步地,所述将所述第一统计结果和所述频域信息作为训练数据中的特征,将所述设备运行结果作为训练数据中的标签的步骤包括:
步骤S1441,删除所述第一统计结果和所述频域信息中的重复数据以及异常数据,以及补全所述第一统计结果和所述频域信息中的缺失数据,得到第一数据处理结果;
步骤S1442,删除所述第二统计结果中的重复数据以及异常数据,以及补全所述第二统计结果中的缺失数据,得到所述第二统计结果对应的第二数据处理结果;
步骤S1443,将所述第一数据处理结果作为训练数据中的特征,将所述第二数据处理结果作为训练数据中的标签。
在本实施例中,在确定第一运行状态数据对应的第一统计结果和频域信息后,还可以再对第一运行状态数据对应的第一统计结果和频域信息中的重复数据、缺失数据以及异常数据进行处理,并在对应处理其重复数据、缺失数据以及异常数据后,将对应处理其重复数据、缺失数据以及异常数据后的第一统计结果和频域信息作为训练数据中的特征。其中,对于第一统计结果和频域信息中的重复数据和异常数据,对应删除其中的重复数据和异常数据;对于第一统计结果和频域信息中的缺失数据,对应补全其中的缺失数据。进一步地,可以通过计算缺失数据对应的相似数据,再将相似数据对应补全至其中。对于第二运行状态数据同理。
本实施例提出的运行状态预测方法,通过对所述训练数据进行特征筛选,得到新的训练数据;将所述新的训练数据作为所述训练数据,并执行所述步骤:基于所述训练数据,对xgboost算法模型进行训练,确定所述xgboost算法模型对应的模型评估值。本实施例中,在对xgboost算法模型进行训练之前,先对训练数据进行特征筛选,以筛选出训练数据中的特征相关性较大的训练数据,而剔除训练数据中特征相关性较低的训练数据,之后根据特征的相关性较大的训练数据对xgboost算法模型进行训练,从而提升xgboost算法模型的模型训练效果。
此外,本发明实施例还提出一种运行状态预测系统,所述运行状态预测系统包括:
获取模块,用于获取工厂生产设备的运行状态数据以及所述运行状态数据对应的时间节点,根据所述运行状态数据和所述时间节点确定训练数据,其中,所述时间节点为采集所述运行状态数据的采集时间;
确定模块,用于基于所述训练数据,对xgboost算法模型进行训练,确定所述xgboost算法模型对应的模型评估值;
判定模块,用于若所述模型评估值大于第一预设阈值,训练所述xgboost算法模型完成,得到设备状态预测模型;
预测模块,用于基于所述设备状态预测模型,对所述工厂生产设备的运行状态进行预测,得到所述工厂生产设备的运行状态的预估结果。
进一步地,所述确定模块,还用于:
对所述训练数据进行特征筛选,得到新的训练数据;
将所述新的训练数据作为所述训练数据,并执行所述步骤:基于所述训练数据,对xgboost算法模型进行训练,确定所述xgboost算法模型对应的模型评估值。
进一步地,所述确定模块,还用于:
根据所述训练数据,确定所述训练数据的皮尔逊相关系数,其中,所述皮尔逊相关系数表示任意两项训练数据之间的相关性;
筛选出所述皮尔逊相关系数大于第二预设阈值对应的训练数据,并将所述皮尔逊相关系数大于第二预设阈值对应的训练数据作为新的训练数据。
进一步地,所述根据所述训练数据,确定所述训练数据的皮尔逊相关系数的公式为:
Figure BDA0003142604990000151
其中,X表示所述训练数据中的任意项训练数据,Y表示所述训练数据中的另一任意项训练数据。
进一步地,所述获取模块,还用于:
将所述运行状态数据和所述时间节点对应存储于所述数据库;
获取所述运行状态数据中的预设时段内的第一运行状态数据,其中,所述第一运行状态数据为任意的所述运行状态数据,所述预设时段为任意时段;
根据所述运行状态数据和所述时间节点,确定在所述预设时段后的且与所述第一运行状态数据每隔预设时长的第二运行状态数据;
根据所述第一运行状态数据和所述第二运行状态数据,确定训练数据。
进一步地,所述获取模块,还用于:
对所述第一运行状态数据进行统计,得到第一统计结果;
对所述第一运行状态数据进行傅里叶变换,得到所述第一运行状态数据对应的频域信息;
对所述第二运行状态数据进行统计,得到第二统计结果,并根据第二统计结果确定设备运行结果;
将所述第一统计结果和所述频域信息作为训练数据中的特征,将所述设备运行结果作为训练数据中的标签。
进一步地,所述获取模块,还用于:
删除所述第一统计结果和所述频域信息中的重复数据以及异常数据,以及补全所述第一统计结果和所述频域信息中的缺失数据,得到第一数据处理结果;
删除所述第二统计结果中的重复数据以及异常数据,以及补全所述第二统计结果中的缺失数据,得到所述第二统计结果对应的第二数据处理结果;
将所述第一数据处理结果作为训练数据中的特征,将所述第二数据处理结果作为训练数据中的标签。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有运行状态预测程序,所述运行状态预测程序被处理器执行时实现如上述中任一项所述的运行状态预测方法的步骤。
本发明计算机可读存储介质具体实施例与上述运行状态预测方法的各实施例基本相同,在此不再详细赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种运行状态预测方法,其特征在于,所述运行状态预测方法包括以下步骤:
获取工厂生产设备的运行状态数据以及所述运行状态数据对应的时间节点,根据所述运行状态数据和所述时间节点确定训练数据,其中,所述时间节点为采集所述运行状态数据的采集时间;
基于所述训练数据,对xgboost算法模型进行训练,确定所述xgboost算法模型对应的模型评估值;
若所述模型评估值大于第一预设阈值,训练所述xgboost算法模型完成,得到设备状态预测模型;
基于所述设备状态预测模型,对所述工厂生产设备的运行状态进行预测,得到所述工厂生产设备的运行状态的预估结果。
2.如权利要求1所述的运行状态预测方法,其特征在于,所述基于所述训练数据,对xgboost算法模型进行训练,确定所述xgboost算法模型对应的模型评估值的步骤包括:
对所述训练数据进行特征筛选,得到新的训练数据;
将所述新的训练数据作为所述训练数据,并执行所述步骤:基于所述训练数据,对xgboost算法模型进行训练,确定所述xgboost算法模型对应的模型评估值。
3.如权利要求2所述的运行状态预测方法,其特征在于,所述对所述训练数据进行特征筛选,得到新的训练数据的步骤包括:
根据所述训练数据,确定所述训练数据的皮尔逊相关系数,其中,所述皮尔逊相关系数表示任意两项训练数据之间的相关性;
筛选出所述皮尔逊相关系数大于第二预设阈值对应的训练数据,并将所述皮尔逊相关系数大于第二预设阈值对应的训练数据作为新的训练数据。
4.如权利要求3所述的运行状态预测方法,其特征在于,所述根据所述训练数据,确定所述训练数据的皮尔逊相关系数的公式为:
Figure FDA0003142604980000021
其中,X表示所述训练数据中的任意项训练数据,Y表示所述训练数据中的另一任意项训练数据。
5.如权利要求1至4任一项所述的运行状态预测方法,其特征在于,所述根据所述运行状态数据和所述时间节点确定训练数据的步骤包括:
将所述运行状态数据和所述时间节点对应存储于所述数据库;
获取所述运行状态数据中的预设时段内的第一运行状态数据,其中,所述第一运行状态数据为任意的所述运行状态数据,所述预设时段为任意时段;
根据所述运行状态数据和所述时间节点,确定在所述预设时段后的且与所述第一运行状态数据每隔预设时长的第二运行状态数据;
根据所述第一运行状态数据和所述第二运行状态数据,确定训练数据。
6.如权利要求5所述的运行状态预测方法,其特征在于,所述根据所述第一运行状态数据和所述第二运行状态数据,确定训练数据的步骤包括:
对所述第一运行状态数据进行统计,得到第一统计结果;
对所述第一运行状态数据进行傅里叶变换,得到所述第一运行状态数据对应的频域信息;
对所述第二运行状态数据进行统计,得到第二统计结果,并根据第二统计结果确定设备运行结果;
将所述第一统计结果和所述频域信息作为训练数据中的特征,将所述设备运行结果作为训练数据中的标签。
7.如权利要求6所述的运行状态预测方法,其特征在于,所述将所述第一统计结果和所述频域信息作为训练数据中的特征,将所述设备运行结果作为训练数据中的标签的步骤包括:
删除所述第一统计结果和所述频域信息中的重复数据以及异常数据,以及补全所述第一统计结果和所述频域信息中的缺失数据,得到第一数据处理结果;
删除所述第二统计结果中的重复数据以及异常数据,以及补全所述第二统计结果中的缺失数据,得到所述第二统计结果对应的第二数据处理结果;
将所述第一数据处理结果作为训练数据中的特征,将所述第二数据处理结果作为训练数据中的标签。
8.一种运行状态预测系统,其特征在于,所述运行状态预测系统包括:
获取模块,用于获取工厂生产设备的运行状态数据以及所述运行状态数据对应的时间节点,根据所述运行状态数据和所述时间节点确定训练数据,其中,所述时间节点为采集所述运行状态数据的采集时间;
确定模块,用于基于所述训练数据,对xgboost算法模型进行训练,确定所述xgboost算法模型对应的模型评估值;
判定模块,用于若所述模型评估值大于第一预设阈值,训练所述xgboost算法模型完成,得到设备状态预测模型;
预测模块,用于基于所述设备状态预测模型,对所述工厂生产设备的运行状态进行预测,得到所述工厂生产设备的运行状态的预估结果。
9.一种运行状态预测设备,其特征在于,所述运行状态预测设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的运行状态预测程序,所述运行状态预测程序被所述处理器执行时实现如权利要求1至7中任一项所述的运行状态预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有运行状态预测程序,所述运行状态预测程序被处理器执行时实现如权利要求1至7中任一项所述的运行状态预测方法的步骤。
CN202110747345.3A 2021-06-30 2021-06-30 运行状态预测方法、系统、设备及计算机可读存储介质 Pending CN113361811A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110747345.3A CN113361811A (zh) 2021-06-30 2021-06-30 运行状态预测方法、系统、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110747345.3A CN113361811A (zh) 2021-06-30 2021-06-30 运行状态预测方法、系统、设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN113361811A true CN113361811A (zh) 2021-09-07

Family

ID=77537757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110747345.3A Pending CN113361811A (zh) 2021-06-30 2021-06-30 运行状态预测方法、系统、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113361811A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114580792A (zh) * 2022-04-28 2022-06-03 深圳丰尚智慧农牧科技有限公司 膨化机工作状态识别方法、装置、计算机设备、存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832581A (zh) * 2017-12-15 2018-03-23 百度在线网络技术(北京)有限公司 状态预测方法和装置
CN109120451A (zh) * 2018-08-31 2019-01-01 深圳市麦斯杰网络有限公司 基于物联网的设备评估方法、设备及计算机可读存储介质
CN110334562A (zh) * 2018-03-30 2019-10-15 北京金风慧能技术有限公司 轴承振动运行状态预测模型训练方法及预测方法、装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832581A (zh) * 2017-12-15 2018-03-23 百度在线网络技术(北京)有限公司 状态预测方法和装置
CN110334562A (zh) * 2018-03-30 2019-10-15 北京金风慧能技术有限公司 轴承振动运行状态预测模型训练方法及预测方法、装置
CN109120451A (zh) * 2018-08-31 2019-01-01 深圳市麦斯杰网络有限公司 基于物联网的设备评估方法、设备及计算机可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114580792A (zh) * 2022-04-28 2022-06-03 深圳丰尚智慧农牧科技有限公司 膨化机工作状态识别方法、装置、计算机设备、存储介质
CN114580792B (zh) * 2022-04-28 2022-08-30 深圳丰尚智慧农牧科技有限公司 膨化机工作状态识别方法、装置、计算机设备、存储介质

Similar Documents

Publication Publication Date Title
Tran et al. Anomaly detection using long short term memory networks and its applications in supply chain management
JP7007243B2 (ja) 異常検知システム
US20060282189A1 (en) Manufacturing control apparatus, manufacturing control method, and computer product
CN108197177B (zh) 业务对象的监测方法、装置、存储介质和计算机设备
CN111931809A (zh) 数据的处理方法、装置、存储介质及电子设备
CN116523181B (zh) 一种基于大数据的智慧绿色能源监测分析方法及系统
US20240192672A1 (en) System and method of monitoring an industrial environment
CN116257663A (zh) 面向无人地面车辆的异常检测与关联分析方法及相关设备
CN111681049A (zh) 用户行为的处理方法、存储介质及相关设备
CN113361811A (zh) 运行状态预测方法、系统、设备及计算机可读存储介质
CN107256254B (zh) 一种行业景气指数获取方法、存储设备及终端
CN113110961A (zh) 设备异常检测方法、装置、计算机设备及可读存储介质
WO2021059291A1 (en) Method and system for identification and analysis of regime shift
CN116755974A (zh) 云计算平台运维方法、装置、电子设备及存储介质
US20230034061A1 (en) Method for managing proper operation of base station and system applying the method
CN113570070B (zh) 流式数据采样与模型更新方法、装置、系统与存储介质
KR102437917B1 (ko) 장비 운영 시스템
CN111798237B (zh) 基于应用日志的异常交易诊断方法及系统
CN113887932A (zh) 基于人工智能的运维管控方法、装置、计算机设备
CN113610225A (zh) 质量评估模型训练方法、装置、电子设备及存储介质
CN111046909A (zh) 一种负荷预测的方法及装置
CN114237915B (zh) 分布式环境下基于机器学习的数据修复方法、装置及设备
CN114428887B (zh) 点击数据去噪方法、装置、电子设备及存储介质
TWI773539B (zh) 依據離群值篩選資料以預測測試時間之系統及方法
CN116467297A (zh) 监管数据推送和异常自查方法、装置、设备及其存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210907

RJ01 Rejection of invention patent application after publication