CN113807418A - 一种基于高斯混合模型的注塑机能耗异常检测方法及系统 - Google Patents

一种基于高斯混合模型的注塑机能耗异常检测方法及系统 Download PDF

Info

Publication number
CN113807418A
CN113807418A CN202111027292.4A CN202111027292A CN113807418A CN 113807418 A CN113807418 A CN 113807418A CN 202111027292 A CN202111027292 A CN 202111027292A CN 113807418 A CN113807418 A CN 113807418A
Authority
CN
China
Prior art keywords
data
model
energy consumption
real
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111027292.4A
Other languages
English (en)
Inventor
谢永良
王喜开
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lechuangda Investment Guangdong Co ltd
Original Assignee
Lechuangda Investment Guangdong Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lechuangda Investment Guangdong Co ltd filed Critical Lechuangda Investment Guangdong Co ltd
Priority to CN202111027292.4A priority Critical patent/CN113807418A/zh
Publication of CN113807418A publication Critical patent/CN113807418A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2132Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B29WORKING OF PLASTICS; WORKING OF SUBSTANCES IN A PLASTIC STATE IN GENERAL
    • B29CSHAPING OR JOINING OF PLASTICS; SHAPING OF MATERIAL IN A PLASTIC STATE, NOT OTHERWISE PROVIDED FOR; AFTER-TREATMENT OF THE SHAPED PRODUCTS, e.g. REPAIRING
    • B29C45/00Injection moulding, i.e. forcing the required volume of moulding material through a nozzle into a closed mould; Apparatus therefor
    • B29C45/17Component parts, details or accessories; Auxiliary operations
    • B29C45/76Measuring, controlling or regulating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Manufacturing & Machinery (AREA)
  • Mechanical Engineering (AREA)
  • Injection Moulding Of Plastics Or The Like (AREA)

Abstract

本发明公开了一种基于高斯混合模型的注塑机能耗异常检测方法及系统,其包括:通过对第一注塑机的能耗数据进行实时采集,获得第一实时能耗数据;通过对所述第一实时能耗数据进行数据预处理,获得第二实时能耗数据;将所述第二实时能耗数据输入高斯混合模型中进行聚类特征学习,获得第一聚类数据集并生成第一标记训练数据集;根据所述第一标记训练数据集进行模型训练,获得第一异常检测模型;将所述第一注塑机的第一测试训练数据集输入所述第一异常检测模型中,获得第一输出信息。解决了现有技术中存在工业注塑机能耗异常检测时,由于数据特征不够全面和完善,多维数据分类不够准确,误报率较高,导致检测精度不高的技术问题。

Description

一种基于高斯混合模型的注塑机能耗异常检测方法及系统
技术领域
本发明涉及计算机相关领域,尤其涉及一种基于高斯混合模型的注塑机能耗异常检测方法及系统。
背景技术
注塑机是塑料制品生产的关键设备,传统全液压驱动的注塑机在其行业中占主导地位,该类型注塑机动力主要来源于三相异步电机恒定转速驱动的定量泵,注塑过程的各个阶段依靠液压系统阀控完成,而各个阶段所需要流量与压力不断变化,导致严重的高压节流及溢流损失,从而使全液压驱动型注塑机能耗较大。因此,节能、高效和精密是当前注塑机发展的趋势。经济全球化的环境下,低污染、低能耗的生产方式逐渐成为制造业的重点发展方向,传统液压注塑机生产过程能源利用率较低的问题越来越突出,因此对注塑机动力驱动技术的节能改造具有重要的社会意义。
但本申请发明人在实现本申请实施例中发明技术方案的过程中,发现上述技术至少存在如下技术问题:
现有技术中存在工业注塑机能耗异常检测时,由于数据特征不够全面和完善,多维数据分类不够准确,误报率较高,导致检测精度不高的技术问题。
发明内容
本申请实施例通过提供一种基于高斯混合模型的注塑机能耗异常检测方法及系统,解决了现有技术中存在工业注塑机能耗异常检测时,由于数据特征不够全面和完善,多维数据分类不够准确,误报率较高,导致检测精度不高的技术问题,达到了通过提取数据分类的最优特征,进而提高对注塑机能耗的异常检测精度、降低误报率的技术效果。
鉴于上述问题,提出了本申请实施例提供一种基于高斯混合模型的注塑机能耗异常检测方法及系统。
第一方面,本申请实施例提供了一种基于高斯混合模型的注塑机能耗异常检测方法,所述方法包括:通过对第一注塑机的能耗数据进行实时采集,获得第一实时能耗数据;通过对所述第一实时能耗数据进行数据预处理,获得第二实时能耗数据;将所述第二实时能耗数据输入高斯混合模型中进行聚类特征学习,获得第一聚类数据集;根据所述第一聚类数据集,生成第一标记训练数据集;根据所述第一标记训练数据集进行模型训练,获得第一异常检测模型;获得所述第一注塑机的第一测试训练数据集;将所述第一测试训练数据集输入所述第一异常检测模型中,获得第一输出信息,其中,所述第一输出信息包括异常检测分类结果。
另一方面,本申请还提供了一种基于高斯混合模型的注塑机能耗异常检测系统,所述系统包括:第一获得单元,所述第一获得单元用于通过对第一注塑机的能耗数据进行实时采集,获得第一实时能耗数据;第二获得单元,所述第二获得单元用于通过对所述第一实时能耗数据进行数据预处理,获得第二实时能耗数据;第一输入单元,所述第一输入单元用于将所述第二实时能耗数据输入高斯混合模型中进行聚类特征学习,获得第一聚类数据集;第一生成单元,所述第一生成单元用于根据所述第一聚类数据集,生成第一标记训练数据集;第三获得单元,所述第三获得单元用于根据所述第一标记训练数据集进行模型训练,获得第一异常检测模型;第四获得单元,所述第四获得单元用于获得所述第一注塑机的第一测试训练数据集;第五获得单元,所述第五获得单元用于将所述第一测试训练数据集输入所述第一异常检测模型中,获得第一输出信息,其中,所述第一输出信息包括异常检测分类结果。
第三方面,本发明提供了一种基于高斯混合模型的注塑机能耗异常检测系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现第一方面所述方法的步骤。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
由于采用了通过对注塑机的实时能耗数据进行采集,从而对实时的采集数据进行数据预处理,进一步的,再基于高斯混合模型–线性判别分析(GMM-LDA)对经过预处理后的数据进行特征聚合,并根据聚合结果进行数据标记,再通过获得注塑机的原始测试数据,将标记的数据作为训练数据训练SVM模型,并通过PSO算法优化SVM模型来获得最优模型,将原始测试数据作为基准数据输入经过优化的最优模型中,进而输出异常检测分类结果的方式,达到了通过提取数据分类的最优特征,进而提高对注塑机能耗的异常检测精度、降低误报率的技术效果。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
图1为本申请实施例一种基于高斯混合模型的注塑机能耗异常检测方法的流程示意图;
图2为本申请实施例一种基于高斯混合模型的注塑机能耗异常检测方法的聚类特征学习流程示意图;
图3为本申请实施例一种基于高斯混合模型的注塑机能耗异常检测方法的检测模型优化流程示意图;
图4为本申请实施例一种基于高斯混合模型的注塑机能耗异常检测方法的数据质量评估流程示意图;
图5为本申请实施例一种基于高斯混合模型的注塑机能耗异常检测系统的结构示意图;
图6为本申请实施例示例性电子设备的结构示意图。
附图标记说明:第一获得单元11,第二获得单元12,第一输入单元13,第一生成单元14,第三获得单元15,第四获得单元16,第五获得单元17,计算设备90,存储器91,处理器92,输入输出接口93。
具体实施方式
本申请实施例通过提供一种基于高斯混合模型的注塑机能耗异常检测方法及系统,解决了现有技术中存在工业注塑机能耗异常检测时,由于数据特征不够全面和完善,多维数据分类不够准确,误报率较高,导致检测精度不高的技术问题,达到了通过提取数据分类的最优特征,进而提高对注塑机能耗的异常检测精度、降低误报率的技术效果。下面,将参考附图详细的描述根据本申请的示例实施例。显然,所描述的实施例仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
申请概述
注塑机是塑料制品生产的关键设备,传统全液压驱动的注塑机在其行业中占主导地位,该类型注塑机动力主要来源于三相异步电机恒定转速驱动的定量泵,注塑过程的各个阶段依靠液压系统阀控完成,而各个阶段所需要流量与压力不断变化,导致严重的高压节流及溢流损失,从而使全液压驱动型注塑机能耗较大。因此,节能、高效和精密是当前注塑机发展的趋势。经济全球化的环境下,低污染、低能耗的生产方式逐渐成为制造业的重点发展方向,传统液压注塑机生产过程能源利用率较低的问题越来越突出,因此对注塑机动力驱动技术的节能改造具有重要的社会意义。但现有技术中存在工业注塑机能耗异常检测时,由于数据特征不够全面和完善,多维数据分类不够准确,误报率较高,导致检测精度不高的技术问题。
针对上述技术问题,本申请提供的技术方案总体思路如下:
本申请实施例提供了一种基于高斯混合模型的注塑机能耗异常检测方法,所述方法包括:通过对第一注塑机的能耗数据进行实时采集,获得第一实时能耗数据;通过对所述第一实时能耗数据进行数据预处理,获得第二实时能耗数据;将所述第二实时能耗数据输入高斯混合模型中进行聚类特征学习,获得第一聚类数据集;根据所述第一聚类数据集,生成第一标记训练数据集;根据所述第一标记训练数据集进行模型训练,获得第一异常检测模型;获得所述第一注塑机的第一测试训练数据集;将所述第一测试训练数据集输入所述第一异常检测模型中,获得第一输出信息,其中,所述第一输出信息包括异常检测分类结果。
在介绍了本申请基本原理后,下面结合附图,对本申请的实施例进行描述。本领域普通技术人员可知,随着技术的发展和新场景的出现,本申请实施例提供的技术方案对于类似的技术问题同样适用。
实施例一
如图1所示,本申请实施例提供了一种基于高斯混合模型的注塑机能耗异常检测方法,所述方法包括:
步骤S100:通过对第一注塑机的能耗数据进行实时采集,获得第一实时能耗数据;
步骤S200:通过对所述第一实时能耗数据进行数据预处理,获得第二实时能耗数据;
具体而言,通过在一定环境条件下对注塑机的数据进行实时采集,其中,采集数据的过程还可以通过对某个注塑机生产企业能源管理系统的数据库进行通信连接后完成数据采集,采集的数据还需要对注塑机生产能耗影响因素的数据进行采集。进一步的,将电量等累计数据进行偏移量计算,得到固定时间间隔的电量偏移量集合,其余数据进行时间间隔等距采样。所述数据预处理是数据的归一化处理,由于采集的原始数据中,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性,经过处理后的数据能够处于同一数量级,适合进行综合性的对比和评价,因此,通过实时采集数据并在训练前对数据进行数据预处理,提高数据分析准确性。
步骤S300:将所述第二实时能耗数据输入高斯混合模型中进行聚类特征学习,获得第一聚类数据集;
步骤S400:根据所述第一聚类数据集,生成第一标记训练数据集;
具体而言,高斯混合模型–线性判别分析(GMM-LDA)聚类特征学习,是一种基于无标签数据集的聚类算法,GMM-LDA聚类特征学习聚类属于无监督机器学习算法,可以代替传统的人工判别方法对样本数据集进行分类,当有一些点过于靠近给定聚类的边界时,这些点可能会被错误地标记,通过高斯混合模型能够将数据进行准确的聚类,由于聚类的过程是对标签正常或者异常的样本进行聚类,根据生成的第一聚类数据集进行类别的标记,即正常和异常分类数据的标签,更新模式动态生成最近的正常模式库和异常模式库来提高数据库的自适应能力,使得所提出的方法可以适应网络环境的动态变化,并标记了数据集,便于数据的训练计算,进而提高分类精度。
进一步而言,如图2所示,其中,所述将所述第二实时能耗数据输入高斯混合模型中进行聚类特征学习,获得第一聚类数据集,本申请实施例步骤S300还包括:
步骤S310:通过对所述第二实时能耗数据的正常能耗数据和异常能耗数据进行分类,生成第一正常数据库和第一异常数据库;
步骤S320:根据所述第一正常数据库和所述第一异常数据库进行高斯混合模型中进行聚类操作,获得第一聚类结果,所述第一聚类结果为聚类最优特征;
步骤S330:根据所述第一聚类结果,生成所述第一聚类数据集。
具体而言,由于塑机能耗检测的实质是将能耗数据分为正常能耗和异常能耗的二元分类问题,因此,通过聚类分析能够将提高分类精度,其中,GMM聚类方法,其本质是一种基于概率密度模型的聚类方法。设x∈Rd,对于GMM来说,x的概率密度p(x)可用k个高斯随机变量的加权模型表示的就是,每个高斯模型代表一个聚类。其中,GMM模型可表示为:
Figure BDA0003244036280000081
式中:k是高斯模型的数量,πk是第k个高斯模型的权重,μk和∑k分别是第k个高斯模型的均值和方差。GMM参数可以通过最大期望算法(EM)迭代求解。通过对标签正常样本或者异常的样本进行聚类分析可以得到正常和异常数据的最优特征,从而提高了对于数据分类时特征获取的精度。高斯混合模型–线性判别分(GMM-LDA)算法需预先给出簇数K,根据GMM-LDA算法原理可知在特征聚类过程中,高斯模型的初始值会对模型参数的结果有很大影响,如若初始值设定不合适,会造成迭代次数过大、不容易收敛,因此不能保证得到最优的聚类结果。在本发明中,基于LDA的信息增益算法用于自动确认聚类的数目K。LDA算法全面探讨了分类标签的情况,力求在投影后最大化不同类型的数据点之间的距离和减少了相同类型的数据点之间的距离。因此,通过使用LDA可以得到最佳的聚类结果,进而获得准确的所述第一聚类数据集,提高数据分类精度。
步骤S500:根据所述第一标记训练数据集进行模型训练,获得第一异常检测模型;
具体而言,将基于GMM-LDA聚类特征学习后的带有标签的第一标记训练数据集作为SVM模型输入数据进行模型训练,SVM(Sup port Vector Machine)指的是支持向量机,是常见的一种判别方法。在机器学习领域,是一个有监督的学习模型,通常用来进行模式识别、分类以及回归分析,即通过对标记好的训练样本进行监督学习,进而根据训练后构建出所述第一异常检测模型,所述第一异常检测模型用于输出注塑机的异常检测数据,且所述第一异常检测模型为最优模型,当经过判断和分析后,若所述第一异常检测模型不是最优模型,需要通过使用PSO算法优化SVM模型来获得最优模型,从而保证模型最优性能,提高注塑机能耗异常检测时模型的精度,降低误报率。
步骤S600:获得所述第一注塑机的第一测试训练数据集;
步骤S700:将所述第一测试训练数据集输入所述第一异常检测模型中,获得第一输出信息,其中,所述第一输出信息包括异常检测分类结果。
具体而言,通过获得所述第一注塑机的第一测试训练数据集输入所述第一异常检测模型中进行输入,其中,所述第一测试训练数据集作为注塑机的基准数据从而输入模型中,且由于所述第一异常检测模型为最优模型,因此,所述第一异常检测模型输入的异常检测分类结果精度较高,准确率也较高,达到了通过提取数据分类的最优特征,进而提高对注塑机能耗的异常检测精度、降低误报率的技术效果。
进一步而言,其中,所述根据所述第一聚类结果,生成所述第一聚类数据集,本申请实施例步骤S330还包括:
步骤S331:基于LDA算法对所述第一聚类结果进行评估,获得第一评估指标;
步骤S332:判断所述第一评估指标是否处于预设评估条件中;
步骤S333:当所述第一评估指标处于所述预设评估条件中,获得第一输出指令;
步骤S334:根据所述第一输出指令,获得第一最优聚类特征;
步骤S335:将所述第一最优聚类特征作为所述第一聚类数据集。
具体而言,高斯混合模型–线性判别分析(GMM-LDA)聚类算法使用GMM对数据库里的正常数据和异常数据进行聚类操作,然后使用LDA算法评估每个GMM聚类的数据。根据目标函数J(W),来评估当前聚类数K对聚类结果的影响。依次迭代聚类结果,直到目标函数已经收敛或满足最小值。基于LDA的信息增益算法用于自动确认聚类的数目K。LDA算法全面探讨了分类标签的情况,力求在投影后最大化不同类型的数据点之间的距离和减少了相同类型的数据点之间的距离。因此,通过使用LDA可以得到最佳的聚类结果。
进一步的,假设数据集D={(x1,y1),...,(xn,yn)},xi是数据预处理后的D维向量,yi∈{C1,C2,...,Ck}。GMM聚类后,将μj(j=1,2,...,K)设为j类样本的均值向量,∑j(j=1,2,...,K)作为j类样本的协方差矩阵。在m维超平面中,对应的基向量为(ω12,...,ωm),基向量的矩阵为WR∈d×m
根据LDA算法的原理,在投影后增加了不同类别数据点之间的距离,同时也减少了同一类别数据点之间的距离。该算法的优化目标如下:
Figure BDA0003244036280000101
此时,J(W)的最小值是矩阵
Figure BDA0003244036280000102
的最大特征值,最大值是矩阵
Figure BDA0003244036280000103
的最小特征值。簇数K由目标函数J(W)确定。对于每次迭代中的簇数K,当J(W)随K值的变化至最小值时,则为最优的簇数。同时,使用更新模式动态生成最近的正常模式库和异常模式库,通过对当前目标函数的最小值进行评估,当满足预设条件时再输出最佳数据集。
进一步而言,其中,如图3所示,所述根据所述第一标记训练数据集进行模型训练,获得第一异常检测模型,本申请实施例步骤S500还包括:
步骤S510:将所述第一标记训练数据集作为输入数据训练进行SVM模型的训练,获得第一SVM模型;
步骤S520:通过PSO算法获得第一模型优化参数;
步骤S530:根据所述第一模型优化参数对所述第一SVM模型进行优化,获得第二SVM模型;
步骤S540:将所述第二SVM模型作为所述第一异常检测模型。
具体而言,SVM算法不仅可以应用于线性可分离的数据集,而且还可以应用于数据集不可线性分离的情况,对于不同的研究对象,SVM模型的核函数选择也会不同。SVM模型常用的核函数有:多项式核函数和径向基函数等。在所有的核函数中,针对非线性预测问题表现最优的是径向基函数。结合注塑机生产工艺流程和能耗特性分析,本发明选用径向基核函数
Figure BDA0003244036280000111
针对训练模型的参数进行优化可以得到训练模型的最佳参数,提高分类准确率,PSO是一种基于种群的随机优化技术算法,被普遍使用在改进统计模型中。与传统的网格搜索优化和遗传算法优化(GA)相比,PSO不需要对网格中的全部点进行搜索,并且没有变异操作,因此,通过对模型进行优化,保证模型输出结果的准确性,进而达到了高对注塑机能耗的异常检测精度的技术效果。
进一步而言,其中,所述通过PSO算法获得第一模型优化参数,本申请实施例步骤S520还包括:
步骤S521:通过对所述第一SVM模型进行模型验证,获得第一验证结果,其中,所述第一验证结果包括第一结果和第二结果,所述第一结果为验证通过,所述第二结果为验证不通过;
步骤S522:当所述第一验证结果为验证通过时,将所述第一SVM模型的训练参数输入第一目标函数;
步骤S523:根据所述第一目标函数判断是否达到预设迭代次数;
步骤S524:若所述第一目标函数达到所述预设迭代次数,获得所述第一模型优化参数。
具体而言,将基于GMM-LDA聚类特征学习后的带有标签的数据集输入SVM模型,进行模型训练后,进一步的将所述第一SVM模型输入至模型自检模块中进行模型验证,从而获得是否验证通过的结果,根据验证的结果将输入到目标函数(适应函数)中,并判断是否达到预设迭代次数,其中,预设迭代次数为最大的迭代次数,当达到最大的迭代次数时,输出SVM最优参数,否则调用PSO算法优化SVM模型中的惩罚因子c和核函数参数g,将调用的优化参数对SVM模型进行训练,再对训练后的模型进行模型验证和输入到目标函数中,从而能够通过不断优化模型提高模型的输出精度。
进一步而言,其中,所述根据所述第一目标函数判断是否达到最大迭代次数,本申请实施例S523还包括:
步骤S5231:若所述第一目标函数未达到所述预设迭代次数,获得第一调用指令;
步骤S5232:根据所述第一调用指令调用PSO算法,生成第一优化因子;
步骤S5233:根据所述第一优化因子,获得所述第一模型优化参数。
具体而言,针对训练模型的参数进行优化可以得到训练模型的最佳参数,提高分类准确率。PSO是一种基于种群的随机优化技术算法,被普遍使用在改进统计模型中。与传统的网格搜索优化和遗传算法优化(GA)相比,PSO不需要对网格中的全部点进行搜索,并且没有变异操作。而对于SVM模型来说,影响其性能的主要的关键参数是c和g。因此,主要使用PSO算法优化这两个参数,即所述第一优化因子,基于PSO算法优化SVM模型的惩罚因子c和核函数参数g,将基于GMM-LDA聚类特征学习后的带有标签的数据集输入SVM模型,进行模型训练。使用粒子群优化支持向量机(PSO-SVM),具有更高的检测精度和更低的误报率。
进一步而言,如图4所示,其中,所述通过对所述第一实时能耗数据进行数据预处理,获得第二实时能耗数据,本申请实施例S200还包括:
步骤S210:根据多个评估指标,构建数据质量评估模型;
步骤S220:将所述第二实时能耗数据输入所述数据质量评估模型中,根据所述数据质量评估模型,获得数据质量系数;
步骤S230:根据所述数据质量系数判断是否需要进行二次数据采集,若需要,获得第一数据采集规则;
步骤S240:根据所述第一数据采集规则,获得第三实时能耗数据。
具体而言,所述多个评估指标为评估数据质量的评估因子,比如数据的完整度、数据多样性、数据特征性等多个评估指标,所述数据质量评估模型是根据所述多个评估指标建立的数学模型,能够针对多个评估指标输出多维度的对应输出信息,因此,通过在数据训练前对经过预处理的数据进行分析,进而输入到所述数据质量评估模型中进行评估,根据数据质量评估模型的输出结果对应获得质量系数,当数据质量系数较小,表示目前数据样本不够完善,根据模型在多维度上的评估结果对应构建出数据采集规则,比如当数据样本数量的维度中评估系数较低,进而以平均增加样本数为逻辑来构建数据采集规则,从而实现对数据的完善,进而提高模型训练的准确性,保证数据特征的全面性,
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本申请而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘、U盘,移动硬盘、ROM、RAM、磁碟或者光盘等,包括若干指令用以使得一台计算机设备执行本申请各个实施例所述的方法。
综上所述,本申请实施例所提供的一种基于高斯混合模型的注塑机能耗异常检测方法及系统具有如下技术效果:
1、由于采用了通过对注塑机的实时能耗数据进行采集,从而对实时的采集数据进行数据预处理,进一步的,再基于高斯混合模型–线性判别分析(GMM-LDA)对经过预处理后的数据进行特征聚合,并根据聚合结果进行数据标记,再通过获得注塑机的原始测试数据,将标记的数据作为训练数据训练SVM模型,并通过PSO算法优化SVM模型来获得最优模型,将原始测试数据作为基准数据输入经过优化的最优模型中,进而输出异常检测分类结果的方式,达到了通过提取数据分类的最优特征,进而提高对注塑机能耗的异常检测精度、降低误报率的技术效果。
2、由于采用了通过聚类特征学习对数据进行聚类处理并标记了数据集,以正常模式库和异常模式库来提高数据库的自适应能力,使得所提出的方法可以适应网络环境的动态变化,保证数据特征的全面性。
3、由于采用了使用粒子群优化支持向量机(PSO-SVM)对训练的模型进行优化,使得模型的输出结果具有更高的检测精度和更低的误报率。
实施例二
基于与前述实施例中一种基于高斯混合模型的注塑机能耗异常检测方法同样发明构思,本发明还提供了一种基于高斯混合模型的注塑机能耗异常检测系统,如图5所示,所述系统包括:
第一获得单元11,所述第一获得单元11用于通过对第一注塑机的能耗数据进行实时采集,获得第一实时能耗数据;
第二获得单元12,所述第二获得单元12用于通过对所述第一实时能耗数据进行数据预处理,获得第二实时能耗数据;
第一输入单元13,所述第一输入单元13用于将所述第二实时能耗数据输入高斯混合模型中进行聚类特征学习,获得第一聚类数据集;
第一生成单元14,所述第一生成单元14用于根据所述第一聚类数据集,生成第一标记训练数据集;
第三获得单元15,所述第三获得单元15用于获得所述第一注塑机的第一测试训练数据集;
第四获得单元16,所述第四获得单元16用于将所述第一标记训练数据集和所述第一测试训练数据集作为输入数据进行模型训练,获得第一异常检测模型;
第五获得单元17,所述第五获得单元17用于根据所述第一异常检测模型,获得第一输出信息,其中,所述第一输出信息包括异常检测分类结果。
进一步的,所述系统还包括:
第一生成单元,所述第一生成单元用于通过对所述第二实时能耗数据的正常能耗数据和异常能耗数据进行分类,生成第一正常数据库和第一异常数据库;
第六获得单元,所述第六获得单元用于根据所述第一正常数据库和所述第一异常数据库进行高斯混合模型中进行聚类操作,获得第一聚类结果,所述第一聚类结果为聚类最优特征;
第二生成单元,所述第二生成单元用于根据所述第一聚类结果,生成所述第一聚类数据集。
进一步的,所述系统还包括:
第七获得单元,所述第七获得单元用于基于LDA算法对所述第一聚类结果进行评估,获得第一评估指标;
第一判断单元,所述第一判断单元用于判断所述第一评估指标是否处于预设评估条件中;
第八获得单元,所述第八获得单元用于当所述第一评估指标处于所述预设评估条件中,获得第一输出指令;
第九获得单元,所述第九获得单元用于根据所述第一输出指令,获得第一最优聚类特征;
第一操作单元,所述第一操作单元用于将所述第一最优聚类特征作为所述第一聚类数据集。
进一步的,所述系统还包括:
第十获得单元,所述第十获得单元用于将所述第一标记训练数据集作为输入数据训练进行SVM模型的训练,获得第一SVM模型;
第十一获得单元,所述第十一获得单元用于通过PSO算法获得第一模型优化参数;
第十二获得单元,所述第十二获得单元用于根据所述第一模型优化参数对所述第一SVM模型进行优化,获得第二SVM模型;
第二操作单元,所述第二操作单元用于将所述第二SVM模型作为所述第一异常检测模型。
进一步的,所述系统还包括:
第十三获得单元,所述第十三获得单元用于通过对所述第一SVM模型进行模型验证,获得第一验证结果,其中,所述第一验证结果包括第一结果和第二结果,所述第一结果为验证通过,所述第二结果为验证不通过;
第二输入单元,所述第二输入单元用于当所述第一验证结果为验证通过时,将所述第一SVM模型的训练参数输入第一目标函数;
第二判断单元,所述第二判断单元用于根据所述第一目标函数判断是否达到预设迭代次数;
第十四获得单元,所述第十四获得单元用于若所述第一目标函数达到所述预设迭代次数,获得所述第一模型优化参数。
进一步的,所述系统还包括:
第十五获得单元,所述第十五获得单元用于若所述第一目标函数未达到所述预设迭代次数,获得第一调用指令;
第三生成单元,所述第三生成单元用于根据所述第一调用指令调用PSO算法,生成第一优化因子;
第十六获得单元,所述第十六获得单元用于根据所述第一优化因子,获得所述第一模型优化参数。
进一步的,所述系统还包括:
第一构建单元,所述第一构建单元用于根据多个评估指标,构建数据质量评估模型;
第十七获得单元,所述第十七获得单元用于将所述第二实时能耗数据输入所述数据质量评估模型中,根据所述数据质量评估模型,获得数据质量系数;
第十八获得单元,所述第十八获得单元用于根据所述数据质量系数判断是否需要进行二次数据采集,若需要,获得第一数据采集规则;
第十九获得单元,所述第十九获得单元用于根据所述第一数据采集规则,获得第三实时能耗数据。
本申请实施例可以根据上述方法示例对网络设备和终端设备进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个接收模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。通过前述对一种基于高斯混合模型的注塑机能耗异常检测方法的详细描述,本领域技术人员可以清楚的知道本实施例中一种基于高斯混合模型的注塑机能耗异常检测系统的实施方法,所以为了说明书的简洁,在此不再详述。
示例性电子设备
图6是本申请的计算设备的示意图。图6所示的计算设备90可以包括:存储器91、处理器92、输入/输出接口93。其中,存储器91、处理器92和输入/输出接口93通过内部连接通路相连,该存储器33用于存储指令,该处理器92用于执行该存储器91存储的指令,以控制输入/输出接口93接收输入的数据和信息,输出操作结果等数据。
图6是本申请另一实施例的计算设备的示意图。图6所示的计算设备90可以包括:存储器91、处理器92、输入/输出接口93。其中,存储器91、处理器92和输入/输出接口93通过内部连接通路相连,该存储器91用于存储指令,该处理器92用于执行该存储器92存储的指令,以控制输入/输出接口93接收输入的数据和信息,输出操作结果等数据。
在实现过程中,上述方法的各步骤可以通过处理器92中的硬件的集成逻辑电路或者软件形式的指令完成。结合本申请实施例所公开的异常消息的识别方法和/或异常消息识别模型的训练方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器﹑寄存器等本领域成熟的存储介质中。该存储介质位于存储器91,处理器92读取存储器91中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
应理解,本申请实施例中,该处理器可以为中央处理单元(central processingunit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(digital signalprocessor,DSP),专用集成电路(application specific integrated circuit,ASIC)、现成可编程门阵列(field programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
应理解,本申请实施例中,该存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。处理器的一部分还可以包括非易失性随机存取存储器。例如,处理器还可以存储设备类型的信息。
应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机,服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(Digital Subscriber Line,DSL))或无线(例如红外,无线,微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够读取的任何可用介质或者是包含一个或多个可用介质集成的服务器,数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,数字通用光盘(Digital Video Disc,DVD))或者半导体介质(例如,固态硬盘(Solid State Disk,SSD))等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (9)

1.一种基于高斯混合模型的注塑机能耗异常检测方法,其中,所述方法包括:
通过对第一注塑机的能耗数据进行实时采集,获得第一实时能耗数据;
通过对所述第一实时能耗数据进行数据预处理,获得第二实时能耗数据;
将所述第二实时能耗数据输入高斯混合模型中进行聚类特征学习,获得第一聚类数据集;
根据所述第一聚类数据集,生成第一标记训练数据集;
根据所述第一标记训练数据集进行模型训练,获得第一异常检测模型;
获得所述第一注塑机的第一测试训练数据集;
将所述第一测试训练数据集输入所述第一异常检测模型中,获得第一输出信息,其中,所述第一输出信息包括异常检测分类结果。
2.如权利要求1所述的方法,其中,所述将所述第二实时能耗数据输入高斯混合模型中进行聚类特征学习,获得第一聚类数据集,所述方法还包括:
通过对所述第二实时能耗数据的正常能耗数据和异常能耗数据进行分类,生成第一正常数据库和第一异常数据库;
根据所述第一正常数据库和所述第一异常数据库进行高斯混合模型中进行聚类操作,获得第一聚类结果,所述第一聚类结果为聚类最优特征;
根据所述第一聚类结果,生成所述第一聚类数据集。
3.如权利要求2所述的方法,其中,所述根据所述第一聚类结果,生成所述第一聚类数据集,所述方法还包括:
基于LDA算法对所述第一聚类结果进行评估,获得第一评估指标;
判断所述第一评估指标是否处于预设评估条件中;
当所述第一评估指标处于所述预设评估条件中,获得第一输出指令;
根据所述第一输出指令,获得第一最优聚类特征;
将所述第一最优聚类特征作为所述第一聚类数据集。
4.如权利要求1所述的方法,其中,所述将所述第一标记训练数据集和所述第一测试训练数据集作为输入数据进行模型训练,获得第一异常检测模型,所述方法还包括:
将所述第一标记训练数据集作为输入数据训练进行SVM模型的训练,获得第一SVM模型;
通过PSO算法获得第一模型优化参数;
根据所述第一模型优化参数对所述第一SVM模型进行优化,获得第二SVM模型;
将所述第二SVM模型作为所述第一异常检测模型。
5.如权利要求4所述的方法,其中,所述通过PSO算法获得第一模型优化参数,所述方法还包括:
通过对所述第一SVM模型进行模型验证,获得第一验证结果,其中,所述第一验证结果包括第一结果和第二结果,所述第一结果为验证通过,所述第二结果为验证不通过;
当所述第一验证结果为验证通过时,将所述第一SVM模型的训练参数输入第一目标函数;
根据所述第一目标函数判断是否达到预设迭代次数;
若所述第一目标函数达到所述预设迭代次数,获得所述第一模型优化参数。
6.如权利要求5所述的方法,其中,所述根据所述第一目标函数判断是否达到最大迭代次数,所述方法还包括:
若所述第一目标函数未达到所述预设迭代次数,获得第一调用指令;
根据所述第一调用指令调用PSO算法,生成第一优化因子;
根据所述第一优化因子,获得所述第一模型优化参数。
7.如权利要求1所述的方法,其中,所述通过对所述第一实时能耗数据进行数据预处理,获得第二实时能耗数据,所述方法还包括:
根据多个评估指标,构建数据质量评估模型;
将所述第二实时能耗数据输入所述数据质量评估模型中,根据所述数据质量评估模型,获得数据质量系数;
根据所述数据质量系数判断是否需要进行二次数据采集,若需要,获得第一数据采集规则;
根据所述第一数据采集规则,获得第三实时能耗数据。
8.一种基于高斯混合模型的注塑机能耗异常检测系统,其中,所述系统包括:
第一获得单元,所述第一获得单元用于通过对第一注塑机的能耗数据进行实时采集,获得第一实时能耗数据;
第二获得单元,所述第二获得单元用于通过对所述第一实时能耗数据进行数据预处理,获得第二实时能耗数据;
第一输入单元,所述第一输入单元用于将所述第二实时能耗数据输入高斯混合模型中进行聚类特征学习,获得第一聚类数据集;
第一生成单元,所述第一生成单元用于根据所述第一聚类数据集,生成第一标记训练数据集;
第三获得单元,所述第三获得单元用于根据所述第一标记训练数据集进行模型训练,获得第一异常检测模型;
第四获得单元,所述第四获得单元用于获得所述第一注塑机的第一测试训练数据集;
第五获得单元,所述第五获得单元用于将所述第一测试训练数据集输入所述第一异常检测模型中,获得第一输出信息,其中,所述第一输出信息包括异常检测分类结果。
9.一种基于高斯混合模型的注塑机能耗异常检测系统,包括至少一个处理器和存储器,所述至少一个处理器与所述存储器耦合,用于读取并执行所述存储器中的指令,以执行如权利要求1-7中任一项所述的方法。
CN202111027292.4A 2021-09-02 2021-09-02 一种基于高斯混合模型的注塑机能耗异常检测方法及系统 Pending CN113807418A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111027292.4A CN113807418A (zh) 2021-09-02 2021-09-02 一种基于高斯混合模型的注塑机能耗异常检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111027292.4A CN113807418A (zh) 2021-09-02 2021-09-02 一种基于高斯混合模型的注塑机能耗异常检测方法及系统

Publications (1)

Publication Number Publication Date
CN113807418A true CN113807418A (zh) 2021-12-17

Family

ID=78894621

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111027292.4A Pending CN113807418A (zh) 2021-09-02 2021-09-02 一种基于高斯混合模型的注塑机能耗异常检测方法及系统

Country Status (1)

Country Link
CN (1) CN113807418A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113255440A (zh) * 2021-04-13 2021-08-13 山东农业大学 一种基于机器学习的农作物叶片异常检测方法及系统
CN116893297A (zh) * 2023-09-11 2023-10-17 常州旭泰克系统科技有限公司 旋转设备能耗的监测方法、监测系统
CN117421618A (zh) * 2023-11-24 2024-01-19 上海东方低碳科技产业股份有限公司 一种建筑能耗监测方法及系统
CN117644624A (zh) * 2024-01-29 2024-03-05 南通浩澄科技有限公司 一种汽车外饰件注塑成型控制系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109145948A (zh) * 2018-07-18 2019-01-04 宁波沙塔信息技术有限公司 一种基于集成学习的注塑机堵料异常检测方法
CN110070304A (zh) * 2019-04-30 2019-07-30 深圳市超算科技开发有限公司 一种大数据资产质量评估方法
CN111339215A (zh) * 2019-05-31 2020-06-26 北京东方融信达软件技术有限公司 结构化数据集质量评价模型生成方法、评价方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109145948A (zh) * 2018-07-18 2019-01-04 宁波沙塔信息技术有限公司 一种基于集成学习的注塑机堵料异常检测方法
CN110070304A (zh) * 2019-04-30 2019-07-30 深圳市超算科技开发有限公司 一种大数据资产质量评估方法
CN111339215A (zh) * 2019-05-31 2020-06-26 北京东方融信达软件技术有限公司 结构化数据集质量评价模型生成方法、评价方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LEPING ZHANG ET AL: "Anomaly Detection method of Smart Meters data based on GMM-LDA clustering feature Learning and PSO Support Vector Machine", 《2019 IEEE SUSTAINABLE POWER AND ENERGY CONFERENCE (ISPEC)》 *
马小科等: "《数据挖掘基础及其应用》", 31 August 2020 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113255440A (zh) * 2021-04-13 2021-08-13 山东农业大学 一种基于机器学习的农作物叶片异常检测方法及系统
CN116893297A (zh) * 2023-09-11 2023-10-17 常州旭泰克系统科技有限公司 旋转设备能耗的监测方法、监测系统
CN116893297B (zh) * 2023-09-11 2024-01-12 常州旭泰克系统科技有限公司 旋转设备能耗的监测方法、监测系统
CN117421618A (zh) * 2023-11-24 2024-01-19 上海东方低碳科技产业股份有限公司 一种建筑能耗监测方法及系统
CN117421618B (zh) * 2023-11-24 2024-04-05 上海东方低碳科技产业股份有限公司 一种建筑能耗监测方法及系统
CN117644624A (zh) * 2024-01-29 2024-03-05 南通浩澄科技有限公司 一种汽车外饰件注塑成型控制系统
CN117644624B (zh) * 2024-01-29 2024-04-09 南通浩澄科技有限公司 一种汽车外饰件注塑成型控制系统

Similar Documents

Publication Publication Date Title
CN113807418A (zh) 一种基于高斯混合模型的注塑机能耗异常检测方法及系统
CN109639739B (zh) 一种基于自动编码器网络的异常流量检测方法
Wang et al. Unsupervised soft-label feature selection
CN112767106B (zh) 自动化审计方法、系统、计算机可读存储介质及审计设备
CN116126945B (zh) 基于数据分析的传感器运行状态分析方法和系统
CN113542241B (zh) 一种基于CNN-BiGRU混合模型的入侵检测方法及装置
CN110795690A (zh) 风电场运行异常数据检测方法
CN110765587A (zh) 基于动态正则化判别局部保留投影的复杂石化过程故障诊断方法
Zhang et al. A novel assessable data augmentation method for mechanical fault diagnosis under noisy labels
CN115112372A (zh) 轴承故障诊断方法、装置、电子设备及存储介质
Xu et al. Industrial process fault detection and diagnosis framework based on enhanced supervised kernel entropy component analysis
Sharma et al. A semi-supervised generalized vae framework for abnormality detection using one-class classification
CN115034278A (zh) 性能指标异常检测方法、装置、电子设备和存储介质
Wan et al. Software Defect Prediction Using Dictionary Learning.
CN116628584A (zh) 电力敏感数据处理方法、装置、电子设备及存储介质
CN110674882A (zh) 一种基于傅立叶函数变换的异常点检测方法
CN116467141A (zh) 日志识别模型训练、日志聚类方法和相关系统、设备
CN116150687A (zh) 一种基于多分类g-wlstsvm模型的流体管道泄漏识别方法
CN115081514A (zh) 一种数据不平衡情况下的工业设备故障识别方法
Lu et al. A modified active learning intelligent fault diagnosis method for rolling bearings with unbalanced samples
CN116365519B (zh) 一种电力负荷预测方法、系统、存储介质及设备
He et al. An effective clustering scheme for high-dimensional data
CN117647697B (zh) 一种基于知识图谱的电力计量流水线故障定位方法及系统
CN113723835B (zh) 火电厂用水评估方法和终端设备
CN214118451U (zh) 一种基于熵权法的水泵特征优选装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20211217

RJ01 Rejection of invention patent application after publication