CN110956331A - 数字工厂运营状态预测方法、系统、装置 - Google Patents

数字工厂运营状态预测方法、系统、装置 Download PDF

Info

Publication number
CN110956331A
CN110956331A CN201911224538.XA CN201911224538A CN110956331A CN 110956331 A CN110956331 A CN 110956331A CN 201911224538 A CN201911224538 A CN 201911224538A CN 110956331 A CN110956331 A CN 110956331A
Authority
CN
China
Prior art keywords
data
factory
sphere
operation state
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911224538.XA
Other languages
English (en)
Inventor
韩彩亮
程宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huiding Data Technology Shanghai Co Ltd
Original Assignee
Huiding Data Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huiding Data Technology Shanghai Co Ltd filed Critical Huiding Data Technology Shanghai Co Ltd
Priority to CN201911224538.XA priority Critical patent/CN110956331A/zh
Publication of CN110956331A publication Critical patent/CN110956331A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Operations Research (AREA)
  • Computational Linguistics (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明属于工厂运营状态监管领域,具体涉及了一种数字工厂运营状态预测方法、系统、装置,旨在解决现有技术模型训练样本为高维、未标记且非平衡数据,模型评判及预测结果准确性低的问题。本发明方法包括:通过GBDT法对获取的工厂运营数据进行特征向量提取及扩充;通过深度神经网络进行特征降维;通过具有移动窗口的单类支持向量机预警模型获取实时工厂运营状态数据异常距离度量,从而获得工厂预测运营状态。本发明采用正常状态的训练数据,结合移动窗口和单类支持向量机算法构建代表该数据集的移动窗口单类别预警模型,获得实时工厂运营状态数据异常距离度量,并能够适时的调整状态预警阈值,模型预测结果准确性高、鲁棒性好。

Description

数字工厂运营状态预测方法、系统、装置
技术领域
本发明属于工厂运营状态监管领域,具体涉及了一种数字工厂运营状态预测方法、系统、装置。
背景技术
数字工厂运营状态指数,不仅涉及非平衡样本数据处理,基于工厂产能状态、库存状态、产销平衡状态、安全环保状态、工厂董事状态、监事状态、高管状态、工厂上下游行业舆情的单类支持向量机对工厂运营状态预警模型的构建方法,还涉及单类支持向量机的评分模型及滑动窗口的训练集改进。
当前工业大数据分析,主要建模流程如图2所示,即选择与工厂实际问题相关的数据,针对工厂运营状态监管,需采集尽可能有关的输入特征,开展数据建模、模型验证以及模型测试等工作,才能得到一个完整有效的工业大数据分析模型。
在实际场景中,工厂运营的异常状态在工厂中是不常见或极小概率发生的事件,尤其对于极端异常事件,如果一旦发生将对工厂产生十分严重的后果。因此,在工厂运营过程中,很难大量收集用于工厂运营状态指数建模的异常状态等代表性数据样本(负样本),所以,我们面对的问题属于一种非平衡数据的工厂运营状态监管问题。
目前,工厂生产运营状态的评判通常采用分类算法对不同运营状况进行类别区分,譬如SVM、随机森林、GBDT和Logistic回归等常用机器学习算法。这些算法程序的主要任务是使用具有标注的训练数据生成的模型区分测试数据所属的类别,属于监督式学习,用于分析数据和识别模式。训练数据的标注通常通过人为的判定,对有限的指标进行单独评分,并结合某些事先确定的法则给与综合评判,譬如产品产量,原材料库存量,用电量,炉温,机器振动等指标。算法利用上述进行过标注的实例数据,属于某个类的训练数据生成模型,并根据原始数据进行维度转换,如图3所示,从而通过寻找一个超级平面或专家式投票的方法将训练数据中的实例样本点准确的划分到各自的类别,同时惩罚落在错误一侧的训练样本。
基于上述的实际场景中训练数据的问题,现有技术还有很多不足之处:第一,非平衡数据会影响最后的评判效果,严重的会带来过拟合的效果,即模型总是把样本划分到样本量较多的一类;第二,模型通常能够对新来的测试实例进行类别的区分,但无法准确有效地进行预警分数的设置;第三,模型在高维数据中,不能很好的获得预测结果;第四,模型训练中采用的带标注的训练数据多由人工标注,片面性大,易产生较大误差。
发明内容
为了解决现有技术中的上述问题,即现有技术模型训练样本为高维、未标记且非平衡数据,模型评判及预测结果准确性低的问题,本发明提供了一种数字工厂运营状态预测方法,该运营状态预测方法包括:
步骤S10,获取数字工厂预设时间运营数据作为待处理数据;所述运营数据包括工厂设计产量、电单耗、煤单耗、硫酸单耗、矿浆单耗、各车辆吨位;
步骤S20,通过GBDT法对所述待处理数据进行特征向量提取及扩充,获得特征向量集合;
步骤S30,通过深度神经网络对所述特征向量集合进行降维,获得降维后的特征向量集合;
步骤S40,基于所述降维后的特征向量集合,通过预警模型获取所述待处理数据的异常距离度量,并基于所述异常距离度量,获取工厂预测运营状态;
其中,所述预警模型基于one-class SVM模型构建,并通过获取的数字工厂设定的移动窗口范围内的运营数据为训练集进行训练。
在一些优选的实施例中,所述预警模型,其构建及训练方法为:
步骤G10,获取设定的移动窗口范围内的数字工厂运营数据为训练集,并通过上述的数字工厂运营状态预测方法步骤S20-步骤S30对应的方法获取所述训练集对应的降维后的训练特征向量集合;
步骤G20,基于所述降维后的训练特征向量集合,构建支撑向量域;
步骤G30,通过核函数抑制所述支撑向量域的半径在大量特征空间中的增长,获得训练好的预警模型。
在一些优选的实施例中,步骤G20中“基于所述降维后的训练特征向量集合,构建支撑向量域”,其方法为:
步骤G21,基于所述降维后的训练特征向量集合,构建球体域;
步骤G22,基于所述球体域以及设定的球体半径松弛变量限制条件,构建球体域对应的拉格朗日函数;
步骤G23,对所述球体域对应的拉格朗日函数进行最小化优化求解,获取训练特征向量集合对应的支撑向量域。
在一些优选的实施例中,所述球体域为:
Figure BDA0002301783650000041
其中,a代表球体域中心,R代表球体域半径,ξi代表球体半径松弛变量,C为惩罚系数。
在一些优选的实施例中,所述设定的球体半径松弛变量限制条件为:
Figure BDA0002301783650000042
其中,a代表球体域中心,R代表球体域半径,ξi代表球体半径松弛变量,xi代表第i个训练数据,T代表转置。
在一些优选的实施例中,步骤G22中“基于所述球体域以及设定的球体半径松弛变量限制条件,构建球体域对应的拉格朗日函数”,其方法为:
Figure BDA0002301783650000043
其中,αi、αj为拉格朗日系数,xi、xj分别代表第i个、第j个训练数据,C为惩罚系数。
在一些优选的实施例中,所述核函数为:
Figure BDA0002301783650000044
其中,xi、xj分别代表第i个、第j个训练数据,s代表核函数带宽。
本发明的另一方面,提出了一种数字工厂运营状态预测系统,该运营状态预测系统包括输入模块、特征提取及扩充模块、特征降维模块、预警模块、输出模块;
所述输入模块,配置为获取数字工厂预设时间运营数据作为待处理数据并输入;所述运营数据包括工厂设计产量、电单耗、煤单耗、硫酸单耗、矿浆单耗、各车辆吨位;
所述特征提取及扩充模块,配置为通过GBDT法对所述待处理数据进行特征向量提取及扩充,获得特征向量集合;
所述特征降维模块,通过深度神经网络对所述特征向量集合进行降维,获得降维后的特征向量集合;
所述预警模块,配置为基于所述降维后的特征向量集合,通过预警模型获取所述待处理数据的异常距离度量,并基于所述异常距离度量,获取工厂预测运营状态;
所述输出模块,配置为输出获取的数字工厂预测运营状态。
本发明的第三方面,提出了一种存储装置,其中存储有多条程序,所述程序适于由处理器加载并执行以实现上述的数字工厂运营状态预测方法。
本发明的第四方面,提出了一种处理装置,包括处理器、存储装置;所述处理器,适于执行各条程序;所述存储装置,适于存储多条程序;所述程序适于由处理器加载并执行以实现上述的数字工厂运营状态预测方法。
本发明的有益效果:
(1)本发明数字工厂运营状态预测方法,针对极端非平衡数据,选用单类支持向量机的自然扩展算法,即移动窗口单类支持向量机算法,实现工厂运营状态预测。通过仅提供正常状态下的训练数据实例样本,结合移动窗口和单类支持向量机算法构建代表该数据集的移动窗口单类别预警模型。当移动窗口所涵盖新的测试数据经过所提出的算法可以获得当前新实例点所处的运营状态距离度量,该实例点离支撑边界越接近,越可能存在运营异常状态,并且随着移动窗口的滑动,异常结果作为原始实例的影响逐渐减弱,同时本发明能够适时的调整状态预警阈值,模型预测结果准确性高、鲁棒性好。
(2)本发明数字工厂运营状态预测方法,通过深度神经网络替代传统高斯核函数,将特征工程中的特征作为深度神经网络输入层节点,通过控制中间层的数量和中间层的参数可以控制输出层的特征数量,模型消耗小,响应快。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本发明数字工厂运营状态预测方法流程示意图;
图2是当前工业大数据分析中主要的建模流程示意图;
图3是当前工业大数据分析中原始数据维度转换示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
本发明的一种数字工厂运营状态预测方法,该运营状态预测方法包括:
步骤S10,获取数字工厂预设时间运营数据作为待处理数据;所述运营数据包括工厂设计产量、电单耗、煤单耗、硫酸单耗、矿浆单耗、各车辆吨位;
步骤S20,通过GBDT法对所述待处理数据进行特征向量提取及扩充,获得特征向量集合;
步骤S30,通过深度神经网络对所述特征向量集合进行降维,获得降维后的特征向量集合;
步骤S40,基于所述降维后的特征向量集合,通过预警模型获取所述待处理数据的异常距离度量,并基于所述异常距离度量,获取工厂预测运营状态;
其中,所述预警模型基于one-class SVM模型构建,并通过获取的数字工厂设定的移动窗口范围内的运营数据为训练集进行训练。
为了更清晰地对本发明数字工厂运营状态预测方法进行说明,下面结合图1对本发明方法实施例中各步骤展开详述。
本发明一种实施例的数字工厂运营状态预测方法,包括步骤S10-步骤S40,各步骤详细描述如下:
步骤S10,获取数字工厂预设时间运营数据作为待处理数据;所述运营数据包括工厂设计产量、电单耗、煤单耗、硫酸单耗、矿浆单耗、各车辆吨位。
异常检测是检测数据中异常值的过程。工厂运营状态预测任务是分析潜在的生产问题或运营的偏差。异常也被称为偏差、噪声或非正。分析数据包括工厂正常和异常的行为,将工厂产能、库存、产销平衡、安全环保、工厂董事状态、监事状态、高管状态、工厂上下游行业舆情等作为特征,根据这些特征的历史数据构建常态族,采用非监督One-class SVM算法,通过工厂常态运营数据为训练集预测工厂运营状态,并对已进行训练的One-classSVM保存作为最终预警模型,用于工厂任一天运营状态预测。
为了更适应后续数据应用,采集的数据可进行预处理,通常可采用以下方法进行数据预处理:
第一,数据重采样
(1)拷贝一部分样本偏少的数据,增加其数据量,样本数据达到平衡(过采样);
(2)删除一部分样本偏多的数据,减少其数据量,样本数据达到平衡(欠采样)。
第二,人工合成
常用的方法为SMOTE:它是一种过采样方法,从样本比较少的类别中创建新的样本实例,一般,从相近对的几个样本中,随机扰动一个特征,直至样本数据达到平衡。
第三,变更数据视角
非平衡数据集,变更视角,采用异常检测方法进行模型构建。异常检测通常在数据预处理、病毒木马检测、工业制造产品检测、网络流量检测等场景中得到应用,相应的相关算法有局部异常因子算法(LOF,Local Outlier Factor)、孤立森林(IF,IsolationForest)、one-class SVM以及Elliptic Envelope等。
步骤S20,通过GBDT法对所述待处理数据进行特征向量提取及扩充,获得特征向量集合。
数据的特征分析,在工厂运营状态预测中起到了非常关键的作用,由于从工厂采集的数据具有不同类型,种类繁多,比如工厂设计产量、电单耗、煤单耗、硫酸单耗、矿浆单耗、不同车辆吨位等,对于所采集的用电量,采集频率为每分钟上传一次,那在模型中是使用当日总电流,还是当日每小时用电量作为输入特征,都需要进行考虑。
步骤S30,通过深度神经网络对所述特征向量集合进行降维,获得降维后的特征向量集合。
模型的维度对模型预测的准确性有很重要的影响,维度过高易导致模型过于敏感,某一特征的微小变化就会导致模型预警,而维度过低则容易导致模型迟钝,真正异常发生时模型难以捕捉。传统的异常检测模型往通过特征工程来控制维度,无法自动调控模型维度。本发明将异常检测模型与深度神经网络模型结合构建可伸缩的模型架构,通过深度神经网络取代传统特征工程映射中采用的高斯核函数,将特征工程中的特征作为深度神经网络输入层节点,通过控制中间层的数量和中间层的参数可以控制输出层的特征数量,实现特征有向放缩,调整模型处于相对最优的维度。
降维后的特征向量还需要通过选取滚动窗口大小的方法去除异常数据,这里所说的异常数据为实际情况为正常的异常数据,例如,工厂休息日的数据显示为异常,但休息日工厂运营数据与工作日的运行数据有很大的差异是正常情况,需要通过滚动窗口去除。
步骤S40,基于所述降维后的特征向量集合,通过预警模型获取所述待处理数据的异常距离度量,并基于所述异常距离度量,获取工厂预测运营状态;所述预警模型基于one-class SVM模型构建,并通过获取的数字工厂设定的移动窗口范围内的运营数据为训练集进行训练。
当工厂新的一天数据导入时,通过滑动窗口的数据,即只考虑最近设定时间段的数据,包含当天实例,可以针对当天的工厂运营状态进行预测。将新的一天实例纳入训练集,该点离支撑球体表面的距离越近,代表其属于异常的可能性越高。
本发明预警模型与监督分类相比最显着的差异是训练数据仅包括与正常实例数据相对应的单个类别,训练数据集不需要任何标签。这与监督训练形成对比,在督训练中将使用来自正面和负类别的数据。由异常检测器检测实例点在移动窗口范围内数据构建的支撑球体表面的距离度量,可以通过检查评估模块中的ROC曲线来选择检测阈值距离。
预警模型,其构建及训练方法为:
步骤G10,获取设定的移动窗口范围内的数字工厂运营数据为训练集,并通过上述的数字工厂运营状态预测方法步骤S20-步骤S30对应的方法获取所述训练集对应的降维后的训练特征向量集合。
步骤G20,基于所述降维后的训练特征向量集合,构建支撑向量域。
步骤G21,基于所述降维后的训练特征向量集合,构建球体域,如式(1)所示:
Figure BDA0002301783650000101
其中,a代表球体域中心,R代表球体域半径,ξi代表球体半径松弛变量,C为惩罚系数。
步骤G22,基于所述球体域以及设定的球体半径松弛变量限制条件,构建球体域对应的拉格朗日函数。
设定的球体半径松弛变量限制条件如式(2)所示:
Figure BDA0002301783650000102
其中,a代表球体域中心,R代表球体域半径,ξi代表球体半径松弛变量,xi代表第i个训练数据,T代表转置。
结合式(1)和式(2),构建拉格朗日函数,如式(3)所示:
Figure BDA0002301783650000103
其中,αi≥0、γi≥0分别代表两个不同约束条件的拉格朗日系数。
根据式(3),可获取新的限制条件,如式(4)所示:
Figure BDA0002301783650000111
最终球体域对应的拉格朗日函数如式(5)所示:
Figure BDA0002301783650000112
其中,αi、αj为拉格朗日系数,xi、xj分别代表第i个、第j个训练数据,C为惩罚系数。
步骤G23,对所述球体域对应的拉格朗日函数进行最小化优化求解,获取训练特征向量集合对应的支撑向量域。
对球体域对应的拉格朗日函数最小化优化求解,如式(6)所示:
Figure BDA0002301783650000113
其中,z代表新的训练实例数据。
步骤G30,通过核函数抑制所述支撑向量域的半径在大量特征空间中的增长,获得训练好的预警模型。
核函数如式(7)所示:
Figure BDA0002301783650000114
其中,xi、xj分别代表第i个、第j个训练数据,s代表核函数带宽。
从而,抑制后的球体域对应的拉格朗日函数如式(8)所示:
Figure BDA0002301783650000121
因此,对抑制后的各球体域对应的拉格朗日函数最小化优化求解,如式(9)所示:
Figure BDA0002301783650000122
其中,CX代表拉格朗日系数约束值。
在模型评价中,摒弃了已经失去原有意义的准确度作为性能评价标准,可采取如下度量标准:
第一,混淆矩阵;
第二,查准率
Figure BDA0002301783650000123
TP为正样本被标记为正的比例,FP为负样本被标记为正的比例;
第三,查全率
Figure BDA0002301783650000124
FN为正样本被标记为负的比例;
第四,F1分数(权衡查准率和查全率的参数)
Figure BDA0002301783650000125
第五,Kappa(衡量分类精度);
第六,ROC曲线(曲线下的面积为AUC)。
对于短期预测,经过上述步骤模型将工厂当天所有特征数据整合、加工、处理,计算得到在特征空间里的一个点。通过计算点到球体支撑边界的距离,即可以得到工厂当天的运营情况。当点到球体支撑边界的距离越近就说明工厂当日运行情况与正常运行情况差异越大。对于工厂长期运营情况的判断也可以通过上述模型实现。如果我们以一周作为时间窗口,每天可以对包括当天在内的前一周的数据进行指数平滑平均,并对其求导。那么得到的导数在零附近说明工厂在过去一段时间里的经营没有什么变化。如果得到的数值为负且绝对值较大,则说明工厂在过去一段时间内生产有异常,并且异常在加速。如果数值为正且绝对数值较大,则说明工厂运营情况在改善,并且加速回归到正常。
本发明根据F1-Score分数最大时对应的参数进行阈值设置,如表1所示:
表1
True Positive False Negative Accuracy Precision
91 23 0.64 0.723
False Positive True Negative Recall F1 Score
35 13 0.8 0.76
如上表所示,最终阈值设置为0.8。
本发明第二实施例的数字工厂运营状态预测系统,该运营状态预测系统包括输入模块、特征提取及扩充模块、特征降维模块、预警模块、输出模块;
所述输入模块,配置为获取数字工厂预设时间运营数据作为待处理数据并输入;所述运营数据包括工厂设计产量、电单耗、煤单耗、硫酸单耗、矿浆单耗、各车辆吨位;
所述特征提取及扩充模块,配置为通过GBDT法对所述待处理数据进行特征向量提取及扩充,获得特征向量集合;
所述特征降维模块,通过深度神经网络对所述特征向量集合进行降维,获得降维后的特征向量集合;
所述预警模块,配置为基于所述降维后的特征向量集合,通过预警模型获取所述待处理数据的异常距离度量,并基于所述异常距离度量,获取工厂预测运营状态;
所述输出模块,配置为输出获取的数字工厂预测运营状态。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
需要说明的是,上述实施例提供的数字工厂运营状态预测系统,仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块来完成,即将本发明实施例中的模块或者步骤再分解或者组合,例如,上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块,以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称,仅仅是为了区分各个模块或者步骤,不视为对本发明的不当限定。
本发明第三实施例的一种存储装置,其中存储有多条程序,所述程序适于由处理器加载并执行以实现上述的数字工厂运营状态预测方法。
本发明第四实施例的一种处理装置,包括处理器、存储装置;处理器,适于执行各条程序;存储装置,适于存储多条程序;所述程序适于由处理器加载并执行以实现上述的数字工厂运营状态预测方法。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的存储装置、处理装置的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的模块、方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,软件模块、方法步骤对应的程序可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
术语“第一”、“第二”等是用于区别类似的对象,而不是用于描述或表示特定的顺序或先后次序。
术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims (10)

1.一种数字工厂运营状态预测方法,其特征在于,该运营状态预测方法包括:
步骤S10,获取数字工厂预设时间运营数据作为待处理数据;所述运营数据包括工厂设计产量、电单耗、煤单耗、硫酸单耗、矿浆单耗、各车辆吨位;
步骤S20,通过GBDT法对所述待处理数据进行特征向量提取及扩充,获得特征向量集合;
步骤S30,通过深度神经网络对所述特征向量集合进行降维,获得降维后的特征向量集合;
步骤S40,基于所述降维后的特征向量集合,通过预警模型获取所述待处理数据的异常距离度量,并基于所述异常距离度量,获取工厂预测运营状态;
其中,所述预警模型基于one-class SVM模型构建,并通过获取的数字工厂设定的移动窗口范围内的运营数据为训练集进行训练。
2.根据权利要求1所述的数字工厂运营状态预测方法,其特征在于,所述预警模型,其构建及训练方法为:
步骤G10,获取设定的移动窗口范围内的数字工厂运营数据为训练集,并通过权利要求1所述的数字工厂运营状态预测方法步骤S20-步骤S30对应的方法获取所述训练集对应的降维后的训练特征向量集合;
步骤G20,基于所述降维后的训练特征向量集合,构建支撑向量域;
步骤G30,通过核函数抑制所述支撑向量域的半径在大量特征空间中的增长,获得训练好的预警模型。
3.根据权利要求2所述的数字工厂运营状态预测方法,其特征在于,步骤G20中“基于所述降维后的训练特征向量集合,构建支撑向量域”,其方法为:
步骤G21,基于所述降维后的训练特征向量集合,构建球体域;
步骤G22,基于所述球体域以及设定的球体半径松弛变量限制条件,构建球体域对应的拉格朗日函数;
步骤G23,对所述球体域对应的拉格朗日函数进行最小化优化求解,获取训练特征向量集合对应的支撑向量域。
4.根据权利要求3所述的数字工厂运营状态预测方法,其特征在于,所述球体域为:
Figure FDA0002301783640000021
其中,a代表球体域中心,R代表球体域半径,ξi代表球体半径松弛变量,C为惩罚系数。
5.根据权利要求3或4所述的数字工厂运营状态预测方法,其特征在于,所述设定的球体半径松弛变量限制条件为:
Figure FDA0002301783640000022
其中,a代表球体域中心,R代表球体域半径,ξi代表球体半径松弛变量,xi代表第i个训练数据,T代表转置。
6.根据权利要求3所述的数字工厂运营状态预测方法,其特征在于,步骤G22中“基于所述球体域以及设定的球体半径松弛变量限制条件,构建球体域对应的拉格朗日函数”,其方法为:
Figure FDA0002301783640000023
其中,αi、αj为拉格朗日系数,xi、xj分别代表第i个、第j个训练数据,C为惩罚系数。
7.根据权利要求2所述的数字工厂运营状态预测方法,其特征在于,所述核函数为:
Figure FDA0002301783640000031
其中,xi、xj分别代表第i个、第j个训练数据,s代表核函数带宽。
8.一种数字工厂运营状态预测系统,其特征在于,该运营状态预测系统包括输入模块、特征提取及扩充模块、特征降维模块、预警模块、输出模块;
所述输入模块,配置为获取数字工厂预设时间运营数据作为待处理数据并输入;所述运营数据包括工厂设计产量、电单耗、煤单耗、硫酸单耗、矿浆单耗、各车辆吨位;
所述特征提取及扩充模块,配置为通过GBDT法对所述待处理数据进行特征向量提取及扩充,获得特征向量集合;
所述特征降维模块,通过深度神经网络对所述特征向量集合进行降维,获得降维后的特征向量集合;
所述预警模块,配置为基于所述降维后的特征向量集合,通过预警模型获取所述待处理数据的异常距离度量,并基于所述异常距离度量,获取工厂预测运营状态;
所述输出模块,配置为输出获取的数字工厂预测运营状态。
9.一种存储装置,其中存储有多条程序,其特征在于,所述程序适于由处理器加载并执行以实现权利要求1-7任一项所述的数字工厂运营状态预测方法。
10.一种处理装置,包括
处理器,适于执行各条程序;以及
存储装置,适于存储多条程序;
其特征在于,所述程序适于由处理器加载并执行以实现:
权利要求1-7任一项所述的数字工厂运营状态预测方法。
CN201911224538.XA 2019-12-04 2019-12-04 数字工厂运营状态预测方法、系统、装置 Pending CN110956331A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911224538.XA CN110956331A (zh) 2019-12-04 2019-12-04 数字工厂运营状态预测方法、系统、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911224538.XA CN110956331A (zh) 2019-12-04 2019-12-04 数字工厂运营状态预测方法、系统、装置

Publications (1)

Publication Number Publication Date
CN110956331A true CN110956331A (zh) 2020-04-03

Family

ID=69979789

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911224538.XA Pending CN110956331A (zh) 2019-12-04 2019-12-04 数字工厂运营状态预测方法、系统、装置

Country Status (1)

Country Link
CN (1) CN110956331A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111898916A (zh) * 2020-08-05 2020-11-06 辽宁工程技术大学 一种煤炭产业链风险监控系统及其监控方法
WO2021232595A1 (zh) * 2020-05-22 2021-11-25 平安国际智慧城市科技股份有限公司 企业状态监管方法、装置、设备及计算机可读存储介质
CN115473804A (zh) * 2022-09-06 2022-12-13 中国建设银行股份有限公司 一种基于交易量负载进行弹性伸缩的方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108537273A (zh) * 2018-04-08 2018-09-14 焦点科技股份有限公司 一种针对不均衡样本执行自动化机器学习的方法
CN109612513A (zh) * 2018-12-17 2019-04-12 安徽农业大学 一种面向大规模高维传感器数据的在线式异常检测方法
CN109670676A (zh) * 2018-11-26 2019-04-23 安徽继远软件有限公司 基于支持向量数据描述的配网台区风险预警方法及系统
CN110310047A (zh) * 2019-07-09 2019-10-08 上海新增鼎网络技术有限公司 一种工厂生产状态异常检测模型设计方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108537273A (zh) * 2018-04-08 2018-09-14 焦点科技股份有限公司 一种针对不均衡样本执行自动化机器学习的方法
CN109670676A (zh) * 2018-11-26 2019-04-23 安徽继远软件有限公司 基于支持向量数据描述的配网台区风险预警方法及系统
CN109612513A (zh) * 2018-12-17 2019-04-12 安徽农业大学 一种面向大规模高维传感器数据的在线式异常检测方法
CN110310047A (zh) * 2019-07-09 2019-10-08 上海新增鼎网络技术有限公司 一种工厂生产状态异常检测模型设计方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
刘三(女牙);铁璐;刘智;孙建文: ""基于多元概率推理模型的中文书写纹识别"", 《计算机工程》, vol. 39, no. 11, pages 158 - 162 *
李冬领: ""基于数据挖掘的育龄妇女二孩生育意愿预测"", 《软件》, vol. 38, no. 11, pages 55 - 59 *
樊重俊: "《大数据的分析与应用》", 30 January 2016, 上海立信会计出版社, pages: 232 *
沈功田: "《特种设备安全与节能技术进展三—2016年全国特种设备安全与节能学术会议论文集(下)》", 30 November 2017, 中国质检出版社, pages: 163 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021232595A1 (zh) * 2020-05-22 2021-11-25 平安国际智慧城市科技股份有限公司 企业状态监管方法、装置、设备及计算机可读存储介质
CN111898916A (zh) * 2020-08-05 2020-11-06 辽宁工程技术大学 一种煤炭产业链风险监控系统及其监控方法
CN115473804A (zh) * 2022-09-06 2022-12-13 中国建设银行股份有限公司 一种基于交易量负载进行弹性伸缩的方法及装置

Similar Documents

Publication Publication Date Title
US11467570B2 (en) Anomalous sound detection apparatus, anomaly model learning apparatus, anomaly detection apparatus, anomalous sound detection method, anomalous sound generation apparatus, anomalous data generation apparatus, anomalous sound generation method and program
CN110132598B (zh) 旋转设备滚动轴承故障噪声诊断算法
Lee et al. A convolutional neural network for fault classification and diagnosis in semiconductor manufacturing processes
Lieber et al. Quality prediction in interlinked manufacturing processes based on supervised & unsupervised machine learning
CN111597651B (zh) 一种基于hwpso-svdd模型的滚动轴承性能退化评估方法
Malhi et al. PCA-based feature selection scheme for machine defect classification
CN108073158A (zh) 基于pca和knn密度算法风电机组轴承故障诊断方法
CN110956331A (zh) 数字工厂运营状态预测方法、系统、装置
CN110110804B (zh) 基于cnn和lstm的飞控系统剩余寿命预测方法
Chen et al. Data quality evaluation and improvement for prognostic modeling using visual assessment based data partitioning method
CN109623489B (zh) 一种改进的机床健康状态评定方法及数控机床
CN111538311B (zh) 一种基于数据挖掘的机械设备柔性多状态自适应预警方法及装置
Thoppil et al. Deep learning algorithms for machinery health prognostics using time-series data: A review
CN116559598B (zh) 一种智慧配电网故障定位方法及系统
Carino et al. Remaining useful life estimation of ball bearings by means of monotonic score calibration
CN114563150B (zh) 桥梁健康在线检测模块生成方法、检测方法、工具箱及装置
Jiménez et al. Machine learning and neural network for maintenance management
Arul et al. Data anomaly detection for structural health monitoring of bridges using shapelet transform
CN115130499A (zh) 基于振动信号的变工况下轴承保持架打滑率在线测量及预测方法
Ghorbani et al. Estimating remaining useful life of turbofan engine using data-level fusion and feature-level fusion
JP7331369B2 (ja) 異常音追加学習方法、データ追加学習方法、異常度算出装置、指標値算出装置、およびプログラム
Wang et al. Three‐stage feature selection approach for deep learning‐based RUL prediction methods
Sylligardos et al. Choose wisely: An extensive evaluation of model selection for anomaly detection in time series
CN116204825A (zh) 一种基于数据驱动的生产线设备故障检测方法
Zhou et al. Degradation state recognition of rolling bearing based on K-means and CNN algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination