CN117762113A - 基于集成模型的自动监控迭代调参方法及系统 - Google Patents

基于集成模型的自动监控迭代调参方法及系统 Download PDF

Info

Publication number
CN117762113A
CN117762113A CN202410196073.6A CN202410196073A CN117762113A CN 117762113 A CN117762113 A CN 117762113A CN 202410196073 A CN202410196073 A CN 202410196073A CN 117762113 A CN117762113 A CN 117762113A
Authority
CN
China
Prior art keywords
model
integrated model
production
parameter
integrated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410196073.6A
Other languages
English (en)
Other versions
CN117762113B (zh
Inventor
何盛华
韩超逸
何晓衡
宋佳
姜云倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningbo Shuyi Union Technology Co ltd
Original Assignee
Ningbo Shuyi Union Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningbo Shuyi Union Technology Co ltd filed Critical Ningbo Shuyi Union Technology Co ltd
Priority to CN202410196073.6A priority Critical patent/CN117762113B/zh
Publication of CN117762113A publication Critical patent/CN117762113A/zh
Application granted granted Critical
Publication of CN117762113B publication Critical patent/CN117762113B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了基于集成模型的自动监控迭代调参方法和系统,包括以下模块,参数采集模块,采集实时生产参数;参数预处理模块,对生产参数进行预处理,建立生产参数集;参数存储模块,存储生产参数和生产参数集;集成模型生成模块,使用多个一级训练模型对生产参数集进行模型训练,并对结果进行加权堆叠,输出最优的二级集成模型;监控调参模块,实时读取生产参数集,输入给二级集成模型进行模型计算;若结果为报废,将合格率最高的集成模型监测结果对应的生产参数集反向传输给被控对象;模型更新模块,进行二级集成模型更新;其优点在于,集成模型适应多样性,自动化更新迭代,实现高预测性、高稳定性、高智能自动化的生产实时监测和反向调参。

Description

基于集成模型的自动监控迭代调参方法及系统
技术领域
本发明涉及工业物联网数据处理领域,尤其涉及一种基于集成模型的自动监控迭代调参方法及系统,对生产设备参数进行实时监测和自动化调整调优。
背景技术
随着工业制造4.0由概念向现实的推进,越来越多的工厂积极推动工业物联网的建设落地,生产设备通过数据物联上网,设备参数通过采集协议上传至数据库,进行数据监控和分析,更为先进地,采用AI人工智能进行深度学习和模型训练。
例如申请公布号为CN116090805A发明专利公开文本公开了一种基于铸造工艺及AI深度学习算法下镁合金铸件制造方法,在镁合金压铸的生产设备进行联网实现实时监控,并对铸造工艺数据实时采集,将数据进行分析并上传数据库,所有数据通过终端的AI学习及智能工艺优化。
又如申请公布号为CN113496360A发明专利公开文本公开了一种注塑成型生产管理方法,在注塑设备上安装智能化数据采集模块,由数据采集模块自动采集注塑设备在生产过程中的数据,通过5G数据传输模块将由数据采集模块采集的生产数据通过第三方软件上传至云服务器统一管理。
但在实际生产过程中,受限于工业数据体量庞大、特征参数复杂,导致数据污染严重,进而导致正负样本数量严重失衡,大量的生产参数无法成体系地、有效地指导生产参数的调整调优,反而产生大量冗余。
其次,尽管有AI人工智能的投入应用,但面对严重的数据污染和单一的模型结构,实际生产应用时AI的自适应和更新能力不足,并不能在工业场景中发挥最佳功能。
基于前述现实性问题,即便工厂投入了自动化监控系统,设备生产参数的控制和调整调优绝大部分仍需依赖人工经验和手动调整,才能确保其高效、准确、可靠。这就导致生产过程中的调参存在延时,异常相应即时性无法得到保证,同时导致现有的自动参数监控和调参系统的功能基于人为设定而固定上下限阈值,缺乏灵活度。
为了解决以上问题,亟需一种集合实时数据采集清洗加工功能、人工智能集成模型训练和部署功能、设备实时监测功能、自动反向控制调参功能和模型自动更新迭代功能的综合性调参方法和系统,全周期、正反馈地实现生产参数的自动监控和迭代调参。
发明内容
本发明致力于解决现有技术中的以下技术问题:1、解决生产参数大数据自动化预处理和特征提取的问题,清理脏数据,减少数据污染;2、解决训练模型单一、功能重复、稳定性和可靠性差的问题;3、解决生产设备调参依赖人工经验和人工操作的问题;4、解决模型自适应程度差,相对实际时序生产存在滞后性的问题。
本发明解决上述技术问题所采用的技术方案为:基于集成模型的自动监控迭代调参方法,包括以下步骤:
步骤S10:采集被控对象的实时生产参数;
步骤S20:对采集的所述生产参数进行预处理,消除数据污染,执行黄金特征提取,建立生产参数集;
步骤S30:存储所述步骤S10中采集的所述生产参数和所述步骤S20中建立的所述生产参数集;
步骤S40:使用多个一级训练模型对所述生产参数集进行模型训练,输出多个一级训练结果;对多个所述一级训练结果进行加权堆叠,输出并存储最优的二级集成模型;
步骤S50:实时读取所述步骤S30中存储的所述生产参数集,输入给所述二级集成模型进行模型计算,输出集成模型监测结果;
步骤S60:判断所述集成模型监测结果:
若集成模型监测结果为合格,将所述集成模型监测结果存储至监测结果集,并重复所述步骤S50;若集成模型监测结果为报废,则执行步骤S70;
步骤S70:比较所述监测结果集中各所述集成模型监测结果的合格率,将合格率最高的所述集成模型监测结果对应的所述生产参数集反向传输给被控对象;
步骤S80:判断是否需要进行二级集成模型更新:
若是,重复所述步骤S40,输出并存储新的最优的二级集成模型。
本发明解决上述技术问题所采用的优选的技术方案为:还包括步骤S90:判断是否需要进行二级集成模型迭代:
若是,比较历史的所述二级集成模型,得出综合评价最高的所述二级集成模型,作为所述步骤S50中用于模型计算的当前所述二级集成模型。
本发明解决上述技术问题所采用的优选的技术方案为:所述步骤S10中,开启通信消息队列,将所述生产参数按采集时序排列,并根据被控对象的不同通信协议对所述生产参数进行分类打标,记录被控对象的输出状态。
本发明解决上述技术问题所采用的优选的技术方案为:所述步骤S20中,根据所述生产参数的分布情况进行脏数据剔除,以消除数据污染,包括以下步骤:
步骤S211:判断所述生产参数是否符合正态分布,若是,执行步骤S212,若否,执行步骤S213;
步骤S212:使用格拉布斯准则和置信区间筛选合规的所述生产参数,进入步骤S214;
步骤S213:使用拉依达准则和区间系数筛选合规的所述生产参数,进入步骤S214;
步骤S214:剔除所有空值数据。
本发明解决上述技术问题所采用的优选的技术方案为:所述步骤S20中,判断所述生产参数是否存在正负样本不平衡的情况,若是,执行以下步骤进行数据平衡:
步骤S221:对不平衡的所述生产参数进行过采样和欠采样处理;
步骤S222:对不平衡的所述生产参数进行升降维度处理;
步骤S223:对不平衡的所述生产参数进行类聚分析。
本发明解决上述技术问题所采用的优选的技术方案为:所述步骤S30中,将已采集但尚未预处理的所述生产参数存储在数据湖中,将经过预处理的所述生产参数集存储在标准数据库中,形成湖仓一体架构体系。
本发明解决上述技术问题所采用的优选的技术方案为:所述步骤S40还包括以下步骤:
步骤S401:判断被控对象是否支持实时采集其生产报废与合格状态:若否,执行步骤S411至步骤S412;若是,执行步骤S421至步骤S422;
步骤S411:使用无监督模型中的多个所述一级训练模型对所述生产参数集进行模型训练,输出多个一级训练结果;
步骤S412:使用贪心算法对所述步骤S411得到的多个所述一级训练结果进行加权堆叠,输出并存储最优的二级集成模型;
步骤S421:分别使用无监督模型、半监督模型、有监督模型中的多个所述一级训练模型对所述生产参数集进行模型训练,输出多个一级训练结果;
步骤S422:使用贪心算法对所述步骤S421得到的多个所述一级训练结果进行加权堆叠,输出并存储最优的二级集成模型。
本发明解决上述技术问题所采用的优选的技术方案为:所述无监督模型包括K均值类聚、主成分分析和奇异值分解;
所述半监督模型包括协同训练和图训练,根据损失函数求最优解;
所述有监督模型包括神经网络训练、增强混合随机森林训练和回归训练,根据损失函数求最优解。
本发明解决上述技术问题所采用的优选的技术方案为:所述步骤S70中,直接使用被控对象的通信协议,并开放所述二级集成模型的通信接口,以将所述生产参数集低延时反向传输给被控对象。
本发明解决上述技术问题所采用的优选的技术方案为:所述步骤S80中,存储新的所述二级集成模型,同时记录版本号、准确率、精准度信息;判断采集的所述生产参数的数据量是否达到训练迭代量级,以判断是否需要进行二级集成模型更新;或者预设模型更新周期,以判断是否需要进行二级集成模型更新。
本发明解决上述技术问题所采用的优选的技术方案为:所述步骤S90中,对历史的所述二级集成模型的准确率、精准度信息进行对比以得出综合评价最高的所述二级集成模型;
判断存储的所述二级集成模型的数量是否达到模型迭代量级,以判断是否需要进行二级集成模型迭代;或者预设模型迭代周期,以判断是否需要进行二级集成模型迭代。
本发明解决上述技术问题所采用的另一技术方案为:基于集成模型的自动监控迭代调参系统,包括以下模块:
参数采集模块,用于采集被控对象的实时生产参数;
参数预处理模块,用于对采集的所述生产参数进行预处理,消除数据污染,执行黄金特征提取,建立生产参数集;
参数存储模块,用于存储采集的所述生产参数和建立的所述生产参数集;
集成模型生成模块,用于使用多个一级训练模型对所述生产参数集进行模型训练,输出多个一级训练结果;并用于对多个所述一级训练结果进行加权堆叠,输出并存储最优的二级集成模型;
监控调参模块,用于实时读取所述生产参数集,输入给所述二级集成模型进行模型计算,输出集成模型监测结果;并用于判断所述集成模型监测结果:若集成模型监测结果为合格,将所述集成模型监测结果存储至监测结果集;若集成模型监测结果为报废,则比较所述监测结果集中各所述集成模型监测结果的合格率,将合格率最高的所述集成模型监测结果对应的所述生产参数集反向传输给被控对象;
模型更新模块,用于判断是否需要进行二级集成模型更新:若是,指示所述集成模型生成模块输出并存储新的最优的二级集成模型。
本发明解决上述技术问题所采用的另一技术方案的优选为:还包括模型迭代模块,用于判断是否需要进行二级集成模型迭代:若是,比较历史的所述二级集成模型,得出综合评价最高的所述二级集成模型,作为所述监控调参模块用于模型计算的当前所述二级集成模型。
本发明解决上述技术问题所采用的另一技术方案为:一种计算机设备,包括存储器和处理器,所述存储器存储计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现基于集成模型的自动监控迭代调参方法的步骤。
本发明解决上述技术问题所采用的另一技术方案为:一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现基于集成模型的自动监控迭代调参方法的步骤。
本发明解决上述技术问题所采用的另一技术方案为:一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现基于集成模型的自动监控迭代调参方法的步骤。
与现有技术相比,本发明的优点是:1、使用多结构集成人工智能模型以及多种模型混合架构生成集成模型,解决了现有技术中模型单一、功能重复、稳定性和可靠性差的问题,能够提高整体预测性能,综合各一级训练模型的不同侧重,适应多样性,增加鲁棒性,减少过拟合风险,建立基于数据驱动的生产参数体系,替代了传统依靠人工经验决策的模式。
2、实现了集成模型预测输出的最优生产参数对实际生产过程进行实时监控和反向控制调参调优,让作为被控对象的生产设备始终处于最佳生产状态,解决了现有技术中依赖人工判断和操作对生产设备进行调参,以及人为预设阈值参数的问题,实现了机器生产智能化、自动化反向控制。
3、以时序生产参数为原料对集成模型进行自动更新迭代,使集成模型保持尽可能高新鲜度和高优化度,解决了现有技术中模型自适应程度差,面对不同时序生产情况存在滞后性的问题。
4、通过对生产参数进行污染清除和黄金特征提取,以建立预处理后生产参数集的方式,为后续集成模型训练和实时监测调参提供优质数据,解决了现有技术中数据污染严重,正负样本数量失衡,大量的生产参数无法成体系,产生大量冗余的问题。进一步地,采用通用化和自动化的数据预处理和特征提取方法,对未处理的生产参数进行标准化统一编码,形成高质量、通用性强的数据支持体系,为后续数据处理的高效实用夯实基础。
附图说明
以下将结合附图和优选实施例来对本发明进行进一步详细描述,但是本领域技术人员将领会的是,这些附图仅是出于解释优选实施例的目的而绘制的,并且因此不应当作为对本发明范围的限制。此外,除非特别指出,附图仅示意在概念性地表示所描述对象的组成或构造并可能包含夸张性显示,并且附图也并非一定按比例绘制。
图1为本发明一个优选实施例的基于集成模型的自动监控迭代调参系统框图;
图2为本发明实施例一的基于集成模型的自动监控迭代调参方法的流程图;
图3为本发明实施例二的基于集成模型的自动监控迭代调参方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
从宏观视角来看,工业物联网中采用自动化监控系统的底层逻辑是:监控生产设备的生产参数和产品产出的合格率,寻找一组最优生产参数集,使其对应的产品产出的合格率最高。例如,设生产设备的输入生产参数集为矩阵X,预测产品产出结果为Y(0,1),其中,0代表报废,1代表合格,通过大数据计算拟合X-Y的对应关系,寻找一组生产参数集矩阵X,能使Y为1的概率最大。
以下分别以注塑机车间和压铸机车间为例,对本发明提供的基于集成模型的自动监控迭代调参方法和系统进行介绍。
在工业物联网搭建的过程中,需考虑到注塑机与压铸机的区别:区别一是设备参数,通常注塑机的生产参数有10种,压铸机的生产参数6种,因此生产参数集矩阵X不同;区别二是设备通信协议;区别三是是否支持实时采集其生产报废与合格状态,其中,注塑机不支持实时采集其生产报废与合格状态,即属于有输入X,无输出Y的情况,相反,压铸机支持实时采集其生产报废与合格状态,即属于有输入X,输出Y(0,1)的情况,这项区别将影响采用何种模型训练方式生成集成模型。
实施例一
如图1所示为本实施例提供的基于集成模型的自动监控迭代调参系统,能够实时采集作为被控对象的生产设备的生产参数,对生产参数进行预处理,经过两级、多个模型训练加权堆叠,创建最优集成模型,而后以该集成模型为基础,对实时采集的生产参数进行监控,预测结果为报废时,自动对生产设备进行反向调参,并进一步自动进行集成模型的更新迭代。
在本实施例中,基于集成模型的自动监控迭代调参系统被应用于注塑机车间中,作为被控对象的生产设备为注塑机,具体包括以下七大模块:
模块一:参数采集模块,用于采集被控对象的实时生产参数;
为每台注塑机安装上参数采集模块,对应每台注塑机的通信协议进行设置,开启通信消息队列,将采集到的生产参数按采集时序排列、分类打标,记录每台注塑机的输出状态,等待落入参数存储模块。
需说明的是,不同的生产设备可能采用不同的通信协议,因此,根据被控对象的不同通信协议对生产参数进行分类打标。优选地,本实施例采用Protobuf即ProtocolBuffers进行协议解析和文件采集,可不受语言和平台的制约,可扩展可序列化,通用性更佳。
模块二:参数预处理模块,用于对采集的生产参数进行预处理,消除数据污染,执行黄金特征提取,建立生产参数集;
在本实施例中,参数预处理模块根据生产参数的分布情况进行脏数据剔除,以消除数据污染,并对正负样本不平衡的生产参数进行过采样、欠采样、升降维度处理和类聚分析处理,下文中关于基于集成模型的自动监控迭代调参方法的介绍进一步阐释该模块的工作逻辑。
模块三:参数存储模块,用于存储参数采集模块采集的生产参数和参数预处理模块建立的生产参数集;
在本实施例中,建构高质量数据湖仓,将已采集但尚未预处理的生产参数存储在数据湖中,将经过预处理的生产参数集存储在标准数据库中,形成湖仓一体架构体系。
模块四:集成模型生成模块,用于使用多个一级训练模型对生产参数集进行模型训练,输出多个一级训练结果;并用于对多个一级训练结果进行加权堆叠,输出并存储最优的二级集成模型;
集成模块生成模块中预先存储了多个一级训练模型,包括无监督模型、半监督模型和有监督模型,其中,无监督模型下还包括K均值类聚、主成分分析和奇异值分解等,半监督模型下还包括协同训练和图训练等,有监督模型下还包括神经网络训练、增强混合随机森林训练和回归训练等。
集成模块生成模块首先判断被控对象是否支持实时采集其生产报废与合格状态,进而选择适用的多个一级训练模型进行模型训练。由于注塑机不支持实时采集其生产报废与合格状态,因此适用于无监督模型下的模型训练。此外,在本实施例中,本模块使用贪心算法对得到的多个一级训练结果进行加权堆叠,下文中关于基于集成模型的自动监控迭代调参方法的介绍进一步阐释该模块的工作逻辑。
模块五:监控调参模块,用于实时读取生产参数集,输入给二级集成模型进行模型计算,输出集成模型监测结果;并用于判断集成模型监测结果:若集成模型监测结果为合格,将集成模型监测结果存储至监测结果集;若集成模型监测结果为报废,则比较监测结果集中各集成模型监测结果的合格率,将合格率最高的集成模型监测结果对应的生产参数集反向传输给被控对象;
本模块执行的工作是基于集成模型的自动监控迭代调参系统与生产设备之间的数据交互和反向控制调参。需说明的是,集成模型生成模块用于输入一级训练模型进行模型训练的生产参数集和本模块用于输入二级集成模型进行模型计算的的生产参数集,均从参数存储模块中读取。
模块六:模型更新模块,用于判断是否需要进行二级集成模型更新:若是,指示集成模型生成模块输出并存储新的最优的二级集成模型。
模块七:模型迭代模块,用于判断是否需要进行二级集成模型迭代:若是,比较历史的二级集成模型,得出综合评价最高的二级集成模型,作为监控调参模块用于模型计算的当前二级集成模型。
模型更新模块实现了二级集成模型的初级更新迭代和自适应升级,同时记录版本号、准确率、精准度信息。模型迭代模块则进一步地实现历史二级集成模型各版本之间的跨时间对比,不断迭代出选定综合性能好、时间颗粒度新的集成模型,实现集成模型的次级更新迭代。
以下介绍依托本实施例提供的基于集成模型的自动监控迭代调参系统实现的基于集成模型的自动监控迭代调参方法,同样以应用于注塑机车间为例,包括以下步骤:
步骤S10:采集作为被控对象的各注塑机的实时生产参数;
在此步骤中,开启通信消息队列,将生产参数按采集时序排列,并根据注塑机的通信协议对生产参数进行分类打标,记录各注塑机的输出状态。
步骤S20:对采集的生产参数进行预处理,消除数据污染,执行黄金特征提取,建立生产参数集;
在步骤S20中,根据生产参数的分布情况进行脏数据剔除,以消除数据污染,进一步包括以下步骤:
步骤S211:判断生产参数是否符合正态分布,若是,执行步骤S212,若否,执行步骤S213;
步骤S212:使用格拉布斯准则和置信区间筛选合规的生产参数,进入步骤S214;
步骤S213:使用拉依达准则和区间系数筛选合规的生产参数,进入步骤S214;
步骤S214:剔除所有空值数据。
其中,格拉布斯准则属于正态分布的分支,而置信区间属于区间估计方法。步骤S212中,针对生产参数符合正态分布的情况,通过同时计算误差值和数值区间两种方法,能够尽可能多地定位到异常数据,最大概率消除数据污染,提高正常数据的总量。
拉依达准则主要用于识别和剔除异常数据,从而避免其对参数估计的影响,而区间系数则提供置信水平的估计,辅助参数估计的可靠性和精确度。步骤S213中,针对数据不符合正态分布的情况,采用同时使用拉依达准则和区间系数的混合排除方式,能够提高参数估计的准确性和可靠性。
进一步地,在步骤S20中,判断生产参数是否存在正负样本不平衡的情况,若是,执行以下步骤进行数据平衡:
步骤S221:对不平衡的生产参数进行过采样和欠采样处理;
步骤S222:对不平衡的生产参数进行升降维度处理;
步骤S223:对不平衡的生产参数进行类聚分析。
其中,过采样处理负责生成稀缺类的样本,欠采样处理负责减少大量类的样本,从而平衡了生产参数集的样本量,令平衡过后的生产参数集更有助于提升模型训练的效果。降维处理降低特征的复杂度,升维处理将数据映射到高维以有利于特征分类,升降维度处理使得生产参数产生差异性,有助于后续模型识别关键特征,提升计算性能。类聚分析在生产参数集中发现描述对象及其关系的信息,将其进行分组,从而标记区别特征值的重要度,为后续提升模型训练的速度打下基础。
步骤S30:存储步骤S10中采集的生产参数和步骤S20中建立的生产参数集;
在此步骤中,将已采集但尚未预处理的生产参数存储在数据湖中,将经过预处理的生产参数集存储在标准数据库中,形成湖仓一体架构体系。后续的模型训练和实时监测的生产数据集均从此步骤建立的高质量数据湖仓中读取。
步骤S40:使用多个一级训练模型对生产参数集进行模型训练,输出多个一级训练结果;对多个一级训练结果进行加权堆叠,输出并存储最优的二级集成模型;
在此步骤中,首先执行步骤S401:判断被控对象是否支持实时采集其生产报废与合格状态:由于本实施例中作为被控对象的注塑机不支持实时采集其生产报废与合格状态,因此执行步骤S411至步骤S412:
步骤S411:使用无监督模型中的多个所述一级训练模型对生产参数集进行模型训练,输出多个一级训练结果;
步骤S412:使用贪心算法对步骤S411得到的多个一级训练结果进行加权堆叠,输出并存储最优的二级集成模型;
本实施例中,无监督模型包括K均值类聚、主成分分析和奇异值分解,因此步骤S411中,分别使用K均值类聚、主成分分析和奇异值分解对生产参数集矩阵X进行分析,得到的三个一级训练结果没有结果标签。随后步骤S412使用贪心算法对三个没有结果标签的一级训练结果进行加权堆叠,得到二级集成模型。
其中,K均值类聚可以提供生产参数集矩阵X的类聚信息,主成分分析可以去除生产参数集矩阵X中的冗余信息,奇异值分解可以提供生产参数集矩阵X的内在结构信息。通过贪心算法进行加权堆叠,可以综合考虑这些信息,得到更全面、准确的分析结果,具有灵活性、高效性、可解释性、稳定性和易于实现性。
本实施例中,贪心算法使用向前步频筛选方式,目标为寻找到一个性能最强的模型集合子集,即二级集成模型,具体包括如下步骤:
步骤S4120:创建若干空子集;
步骤S4121:将多个一级训练结果分别加入空子集,对多个一级训练结果初始化堆叠权重;例如在本实施例中,K均值类聚的一级训练结果的初始权重设为30%,主成分分析的一级训练结果的初始权重设为30%,主成分分析的一级训练结果的初始权重设为40%;
步骤S4122:向前步频筛选,逐步增加其中一个子集的权重,保持权重总和为1,在验证数据集上进行验证,寻找损失最低的子集,并输出该子集;
步骤S4123:贪心探索,重复步骤S4122,每次只以一个子集的权重作为变量进行验证,直到输出最优的加权子集,即最优的二级集成模型。
从而,步骤S40完成了最优二级集成模型的训练和生成,步骤S50至步骤S70基于该最优的二级集成模型,以数据湖仓中实时存储的生产数据集为生产参数集矩阵X输入到二级集成模型中,计算得到集成模型监测结果,监测产品合格率,并对作为被控对象的注塑机反向控制调参调优,具体如下:
步骤S50:实时读取步骤S30中存储的生产参数集,输入给二级集成模型进行模型计算,输出集成模型监测结果;
步骤S60:判断集成模型监测结果:
若集成模型监测结果为合格,将集成模型监测结果存储至监测结果集,并重复步骤S50;若集成模型监测结果为报废,则执行步骤S70;
步骤S70:比较监测结果集中各集成模型监测结果的合格率,将合格率最高的集成模型监测结果对应的生产参数集反向传输给作为被控对象的注塑机;
其中,在步骤S70中,直接使用作为被控对象的注塑机的通信协议,并开放二级集成模型的通信接口,以将生产参数集高实时、低延时反向传输给被控对象。
步骤S80:判断是否需要进行二级集成模型更新:
若是,重复步骤S40,输出并存储新的最优的二级集成模型。
在此步骤中,存储新的二级集成模型的同时,记录版本号、准确率、精准度信息,以便进行二级集成模型的次级更新迭代。
此外,判断是否需要进行初级更新迭代可以采用以下两种方式:方式一,判断采集的生产参数的数据量是否达到训练迭代量级,若是,则需要进行二级集成模型更新,以此判断是否需要进行二级集成模型更新;方式二,预设模型更新周期,当到达预设模型更新周期,则需要进行二级集成模型更新,以此判断是否需要进行二级集成模型更新。
步骤S90:判断是否需要进行二级集成模型迭代:
若是,比较历史的二级集成模型,得出综合评价最高的二级集成模型,作为步骤S50中用于模型计算的当前二级集成模型。
在此步骤中,对历史的二级集成模型的准确率、精准度信息进行对比以得出综合评价最高的二级集成模型。
同样,判断是否需要进行次级更新迭代也可以采用以下两种方式:方式一,判断存储的二级集成模型的数量是否达到模型迭代量级,若是,则需要进行二级集成模型迭代,以此判断是否需要进行二级集成模型迭代;方式二,预设模型迭代周期,当到达预设模型迭代周期,则需要进行二级集成模型迭代,以此判断是否需要进行二级集成模型迭代。
进一步地,在步骤S80和步骤S90中,采用梯度上升模式进行集成模型初级、次级更新迭代,以监测结果集中各集成模型监测结果的合格率计算损失函数的梯度,直至损失函数值减小到预设阈值以下或梯度小于预设阈值,得到更新迭代后的最优二级集成模型,作为步骤S50中用于模型计算的当前二级集成模型。
此外,可以在步骤S80和步骤S90的集成模型初级、次级更新迭代的过程中,记录每个更新迭代的过程和模型解释文件,帮助日后人工理解各个集成模型对应的生产参数的具体意义。
实施例二
在本实施例中,基于集成模型的自动监控迭代调参系统被应用于压铸机车间中,作为被控对象的生产设备为压铸机。
前述的压铸机与注塑机作为被控对象的三点区别中,针对区别一,基于集成模型的自动监控迭代调参方法和基于集成模型的自动监控迭代调参系统通过预设的采集解析协议和字段编码,可以对不同生产设备的不同协议特征进行转换,形成统一的字典参数格式,从而使得集成模型能够兼容不同种类的生产参数。
针对区别二,参数采集模块在步骤S10进行生产参数的采集时,根据作为被控对象的不同生产设备采用的不同通信协议对生产参数进行分类打标,即可解决通信协议的兼容问题。
针对区别三,由于本实施例中作为被控对象的压铸机支持实时采集其生产报废与合格状态,因此适用于无监督模型、半监督模型、有监督模型下的模型训练,体现在本实施例提供的基于集成模型的自动监控迭代调参方法的步骤40中:
首先执行步骤S401:判断被控对象是否支持实时采集其生产报废与合格状态:由于本实施例中作为被控对象的压铸机支持实时采集其生产报废与合格状态,因此执行步骤S421至步骤S422;
步骤S421:分别使用无监督模型、半监督模型、有监督模型中的多个一级训练模型对生产参数集进行模型训练,输出多个一级训练结果;
步骤S422:使用贪心算法对步骤S421得到的多个一级训练结果进行加权堆叠,输出并存储最优的二级集成模型。
其中无监督模型在实施例一中已作介绍,此处不再赘述,半监督模型包括协同训练和图训练,根据损失函数求最优解;有监督模型包括神经网络训练、增强混合随机森林训练和回归训练,根据损失函数求最优解。
在半监督模型中,协同训练关注于数据的不同视图或特征集,适用于具有多个独立视图的数据集,通过迭代地利用分类器之间的预测来增强学习;而图训练关注数据点之间的结构关系,适用于可以表示为图结构的数据集,利用图上的连接性来传播信息或学习表示。通过贪心算法对二者的一级训练结果进行加权堆叠,能够提高泛化性能,减少过拟合,有效利用模型的多样性,具有更好的鲁棒性。
在有监督模型中,神经网络训练基于神经元的连接结构,通过优化算法进行权重调整,适用于复杂的模式识别和预测任务;增强混合随机森林训练基于决策树的集成结构,通过组合多个弱学习器来提高性能,适用于分类和回归任务,尤其是当数据存在噪声或特征维度较高时;回归训练可以是多种形式的,如线性回归、多项式回归等,通过最小化预测误差来训练模型,专门用于预测连续值输出。通过贪心算法对三者的一级训练结果进行加权堆叠,能够提高预测性能,增加模型多样性,减少模型选择的风险。
对多个一级训练结果使用贪心算法进行加权堆叠的方法步骤,在实施例一中已作介绍,在本实施例中,首先分别对无监督模型、半监督模型、有监督模型下的多个一级训练结果分别进行一级贪心堆叠,执行步骤S4120至步骤S4123,再对三个输出的加权子集重复进行二级贪心堆叠,执行步骤S4120至步骤S4123,最终得到最优的加权子集,即二级集成模型。
例如,一级贪心堆叠时,在对无监督模型、半监督模型、有监督模型分别执行步骤S4121时,无监督模型中,K均值类聚的一级训练结果的初始权重设为30%,主成分分析的一级训练结果的初始权重设为30%,主成分分析的一级训练结果的初始权重设为40%;半监督模型中,协同训练和图训练的一级训练结果的初始权重均设为50%;有监督模型中,神经网络训练的一级训练结果的初始权重设为30%,增强混合随机森林训练的一级训练结果的初始权重设为30%,回归训练的一级训练结果的初始权重设为40%。
二级贪心堆叠过程中,执行步骤S4121时,无监督模型的加权子集的初始权重设为20%,半监督模型的加权子集的初始权重设为20%,有监督模型的加权子集的初始权重设为60%。
其他基于集成模型的自动监控迭代调参系统的配置和基于集成模型的自动监控迭代调参方法的具体步骤,与实施例一基本一致,此处不再赘述。
此外,本发明还要求保护一种计算机设备,包括存储器和处理器,存储器存储计算机程序,处理器执行计算机程序时,实现本发明提供的基于集成模型的自动监控迭代调参方法的步骤;一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本发明提供的基于集成模型的自动监控迭代调参方法的步骤;以及一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本发明提供的基于集成模型的自动监控迭代调参方法的步骤。
由于本发明提供的基于集成模型的自动监控迭代调参方法及系统具有良好的通用性和适配性,不仅仅局限于前述两个实施例提供的注塑机和压铸机车间的具体实施方式,也能够应用在以其他作为被控对象的生产设备的工厂当中。
综合前述可以看出,本发明提供的基于集成模型的自动监控迭代调参方法及系统,使用多结构集成人工智能模型以及多种模型混合架构生成集成模型,解决了现有技术中模型单一、功能重复、稳定性和可靠性差的问题,能够提高整体预测性能,综合各一级训练模型的不同侧重,适应多样性,增加鲁棒性,减少过拟合风险,建立基于数据驱动的生产参数体系,替代了传统依靠人工经验决策的模式。
实现了集成模型预测输出的最优生产参数对实际生产过程进行实时监控和反向控制调参调优,让作为被控对象的生产设备始终处于最佳生产状态,解决了现有技术中依赖人工判断和操作对生产设备进行调参,以及人为预设阈值参数的问题,实现了机器生产智能化、自动化反向控制。
以时序生产参数为原料对集成模型进行自动更新迭代,使集成模型保持尽可能高新鲜度,解决了现有技术中模型自适应程度差,面对不同时序生产情况存在滞后性的问题。
通过对生产参数进行污染清除和黄金特征提取,以建立预处理后生产参数集的方式,为后续集成模型训练和实时监测调参提供优质数据,解决了现有技术中数据污染严重,正负样本数量失衡,大量的生产参数无法成体系,产生大量冗余的问题。进一步地,采用通用化和自动化的数据预处理和特征提取方法,对未处理的生产参数进行标准化统一编码,形成高质量、通用性强的数据支持体系,为后续数据处理的高效实用夯实基础。
应注意到:相似的标号在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中可能不再对其进行进一步定义和解释。
以上对本发明所提供的基于集成模型的自动监控迭代调参方法及系统进行了介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明及核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (16)

1.基于集成模型的自动监控迭代调参方法,其特征在于,包括以下步骤:
步骤S10:采集被控对象的实时生产参数;
步骤S20:对采集的所述生产参数进行预处理,消除数据污染,执行黄金特征提取,建立生产参数集;
步骤S30:存储所述步骤S10中采集的所述生产参数和所述步骤S20中建立的所述生产参数集;
步骤S40:使用多个一级训练模型对所述生产参数集进行模型训练,输出多个一级训练结果;对多个所述一级训练结果进行加权堆叠,输出并存储最优的二级集成模型;
步骤S50:实时读取所述步骤S30中存储的所述生产参数集,输入给所述二级集成模型进行模型计算,输出集成模型监测结果;
步骤S60:判断所述集成模型监测结果:
若集成模型监测结果为合格,将所述集成模型监测结果存储至监测结果集,并重复所述步骤S50;若集成模型监测结果为报废,则执行步骤S70;
步骤S70:比较所述监测结果集中各所述集成模型监测结果的合格率,将合格率最高的所述集成模型监测结果对应的所述生产参数集反向传输给被控对象;
步骤S80:判断是否需要进行二级集成模型更新:
若是,重复所述步骤S40,输出并存储新的最优的二级集成模型。
2.根据权利要求1所述的基于集成模型的自动监控迭代调参方法,其特征在于:
还包括步骤S90:判断是否需要进行二级集成模型迭代:
若是,比较历史的所述二级集成模型,得出综合评价最高的所述二级集成模型,作为所述步骤S50中用于模型计算的当前所述二级集成模型。
3.根据权利要求1所述的基于集成模型的自动监控迭代调参方法,其特征在于:
所述步骤S10中,开启通信消息队列,将所述生产参数按采集时序排列,并根据被控对象的不同通信协议对所述生产参数进行分类打标,记录被控对象的输出状态。
4.根据权利要求1所述的基于集成模型的自动监控迭代调参方法,其特征在于:
所述步骤S20中,根据所述生产参数的分布情况进行脏数据剔除,以消除数据污染,包括以下步骤:
步骤S211:判断所述生产参数是否符合正态分布,若是,执行步骤S212,若否,执行步骤S213;
步骤S212:使用格拉布斯准则和置信区间筛选合规的所述生产参数,进入步骤S214;
步骤S213:使用拉依达准则和区间系数筛选合规的所述生产参数,进入步骤S214;
步骤S214:剔除所有空值数据。
5.根据权利要求1所述的基于集成模型的自动监控迭代调参方法,其特征在于:
所述步骤S20中,判断所述生产参数是否存在正负样本不平衡的情况,若是,执行以下步骤进行数据平衡:
步骤S221:对不平衡的所述生产参数进行过采样和欠采样处理;
步骤S222:对不平衡的所述生产参数进行升降维度处理;
步骤S223:对不平衡的所述生产参数进行类聚分析。
6.根据权利要求1所述的基于集成模型的自动监控迭代调参方法,其特征在于:
所述步骤S30中,将已采集但尚未预处理的所述生产参数存储在数据湖中,将经过预处理的所述生产参数集存储在标准数据库中,形成湖仓一体架构体系。
7.根据权利要求1所述的基于集成模型的自动监控迭代调参方法,其特征在于:
所述步骤S40还包括以下步骤:
步骤S401:判断被控对象是否支持实时采集其生产报废与合格状态:若否,执行步骤S411至步骤S412;若是,执行步骤S421至步骤S422;
步骤S411:使用无监督模型中的多个所述一级训练模型对所述生产参数集进行模型训练,输出多个一级训练结果;
步骤S412:使用贪心算法对所述步骤S411得到的多个所述一级训练结果进行加权堆叠,输出并存储最优的二级集成模型;
步骤S421:分别使用无监督模型、半监督模型、有监督模型中的多个所述一级训练模型对所述生产参数集进行模型训练,输出多个一级训练结果;
步骤S422:使用贪心算法对所述步骤S421得到的多个所述一级训练结果进行加权堆叠,输出并存储最优的二级集成模型。
8.根据权利要求7所述的基于集成模型的自动监控迭代调参方法,其特征在于:
所述无监督模型包括K均值类聚、主成分分析和奇异值分解;
所述半监督模型包括协同训练和图训练,根据损失函数求最优解;
所述有监督模型包括神经网络训练、增强混合随机森林训练和回归训练,根据损失函数求最优解。
9.根据权利要求1所述的基于集成模型的自动监控迭代调参方法,其特征在于:
所述步骤S70中,直接使用被控对象的通信协议,并开放所述二级集成模型的通信接口,以将所述生产参数集低延时反向传输给被控对象。
10.根据权利要求1所述的基于集成模型的自动监控迭代调参方法,其特征在于:
所述步骤S80中,存储新的所述二级集成模型,同时记录版本号、准确率、精准度信息;判断采集的所述生产参数的数据量是否达到训练迭代量级,以判断是否需要进行二级集成模型更新;或者预设模型更新周期,以判断是否需要进行二级集成模型更新。
11.根据权利要求2所述的基于集成模型的自动监控迭代调参方法,其特征在于:
所述步骤S90中,对历史的所述二级集成模型的准确率、精准度信息进行对比以得出综合评价最高的所述二级集成模型;
判断存储的所述二级集成模型的数量是否达到模型迭代量级,以判断是否需要进行二级集成模型迭代;或者预设模型迭代周期,以判断是否需要进行二级集成模型迭代。
12.基于集成模型的自动监控迭代调参系统,其特征在于,包括以下模块:
参数采集模块,用于采集被控对象的实时生产参数;
参数预处理模块,用于对采集的所述生产参数进行预处理,消除数据污染,执行黄金特征提取,建立生产参数集;
参数存储模块,用于存储采集的所述生产参数和建立的所述生产参数集;
集成模型生成模块,用于使用多个一级训练模型对所述生产参数集进行模型训练,输出多个一级训练结果;并用于对多个所述一级训练结果进行加权堆叠,输出并存储最优的二级集成模型;
监控调参模块,用于实时读取所述生产参数集,输入给所述二级集成模型进行模型计算,输出集成模型监测结果;并用于判断所述集成模型监测结果:若集成模型监测结果为合格,将所述集成模型监测结果存储至监测结果集;若集成模型监测结果为报废,则比较所述监测结果集中各所述集成模型监测结果的合格率,将合格率最高的所述集成模型监测结果对应的所述生产参数集反向传输给被控对象;
模型更新模块,用于判断是否需要进行二级集成模型更新:若是,指示所述集成模型生成模块输出并存储新的最优的二级集成模型。
13.根据权利要求12所述的基于集成模型的自动监控迭代调参系统,其特征在于:
还包括模型迭代模块,用于判断是否需要进行二级集成模型迭代:若是,比较历史的所述二级集成模型,得出综合评价最高的所述二级集成模型,作为所述监控调参模块用于模型计算的当前所述二级集成模型。
14.一种计算机设备,包括存储器和处理器,所述存储器存储计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现权利要求1-11中任一所述的基于集成模型的自动监控迭代调参方法的步骤。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-11中任一所述的基于集成模型的自动监控迭代调参方法的步骤。
16.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-11中任一所述的基于集成模型的自动监控迭代调参方法的步骤。
CN202410196073.6A 2024-02-22 2024-02-22 基于集成模型的自动监控迭代调参方法及系统 Active CN117762113B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410196073.6A CN117762113B (zh) 2024-02-22 2024-02-22 基于集成模型的自动监控迭代调参方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410196073.6A CN117762113B (zh) 2024-02-22 2024-02-22 基于集成模型的自动监控迭代调参方法及系统

Publications (2)

Publication Number Publication Date
CN117762113A true CN117762113A (zh) 2024-03-26
CN117762113B CN117762113B (zh) 2024-05-10

Family

ID=90314838

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410196073.6A Active CN117762113B (zh) 2024-02-22 2024-02-22 基于集成模型的自动监控迭代调参方法及系统

Country Status (1)

Country Link
CN (1) CN117762113B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118068796A (zh) * 2024-04-22 2024-05-24 杭州电缆股份有限公司 一种电缆生产设备的生产参数监测控制方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020259582A1 (zh) * 2019-06-25 2020-12-30 腾讯科技(深圳)有限公司 神经网络模型的训练方法、装置和电子设备
CN112257874A (zh) * 2020-11-13 2021-01-22 腾讯科技(深圳)有限公司 分布式机器学习系统的机器学习方法、装置、系统
CN113741189A (zh) * 2021-08-31 2021-12-03 广东工业大学 一种注塑机自适应学习快速控制方法
CN114330935A (zh) * 2022-03-10 2022-04-12 南方电网数字电网研究院有限公司 基于多种结合策略集成学习的新能源功率预测方法和系统
CN114500325A (zh) * 2022-01-27 2022-05-13 重庆邮电大学 一种基于无监督迁移学习的sdn控制器故障自适应智能检测方法
US20220300805A1 (en) * 2021-03-16 2022-09-22 Hyundai Mobis Co., Ltd. Device and method for defect inspection based on explainable artificial intelligence
CN116956105A (zh) * 2023-01-10 2023-10-27 腾讯科技(深圳)有限公司 一种分类模型训练方法、缺陷识别方法、装置及电子设备
CN117390960A (zh) * 2023-10-25 2024-01-12 西京学院 一种数控机床用加工精度智能分析方法
CN117495070A (zh) * 2023-12-27 2024-02-02 中控技术股份有限公司 一种工业流水线的工艺参数推荐方法及系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020259582A1 (zh) * 2019-06-25 2020-12-30 腾讯科技(深圳)有限公司 神经网络模型的训练方法、装置和电子设备
CN112257874A (zh) * 2020-11-13 2021-01-22 腾讯科技(深圳)有限公司 分布式机器学习系统的机器学习方法、装置、系统
US20220300805A1 (en) * 2021-03-16 2022-09-22 Hyundai Mobis Co., Ltd. Device and method for defect inspection based on explainable artificial intelligence
CN113741189A (zh) * 2021-08-31 2021-12-03 广东工业大学 一种注塑机自适应学习快速控制方法
CN114500325A (zh) * 2022-01-27 2022-05-13 重庆邮电大学 一种基于无监督迁移学习的sdn控制器故障自适应智能检测方法
CN114330935A (zh) * 2022-03-10 2022-04-12 南方电网数字电网研究院有限公司 基于多种结合策略集成学习的新能源功率预测方法和系统
CN116956105A (zh) * 2023-01-10 2023-10-27 腾讯科技(深圳)有限公司 一种分类模型训练方法、缺陷识别方法、装置及电子设备
CN117390960A (zh) * 2023-10-25 2024-01-12 西京学院 一种数控机床用加工精度智能分析方法
CN117495070A (zh) * 2023-12-27 2024-02-02 中控技术股份有限公司 一种工业流水线的工艺参数推荐方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118068796A (zh) * 2024-04-22 2024-05-24 杭州电缆股份有限公司 一种电缆生产设备的生产参数监测控制方法及系统

Also Published As

Publication number Publication date
CN117762113B (zh) 2024-05-10

Similar Documents

Publication Publication Date Title
CN117762113B (zh) 基于集成模型的自动监控迭代调参方法及系统
CN113240011B (zh) 一种深度学习驱动的异常识别与修复方法及智能化系统
CN110929843A (zh) 一种基于改进深度自编码网络的异常用电行为辨识方法
CN112685504B (zh) 一种面向生产过程的分布式迁移图学习方法
CN113361559B (zh) 基于深宽度联合神经网络的多模态数据知识信息提取方法
CN118260689A (zh) 一种基于自适应低秩参数高效微调的日志异常检测方法
CN116720095A (zh) 一种基于遗传算法优化模糊c均值的电特性信号聚类方法
CN117574776A (zh) 一种面向任务规划的模型自学习优化方法
CN113049249A (zh) 一种电机轴承故障诊断方法及系统
CN109635008B (zh) 一种基于机器学习的设备故障检测方法
CN115795035A (zh) 基于进化神经网络的科技服务资源分类方法、系统及其计算机可读存储介质
CN113537339B (zh) 一种基于多标签图像分类的识别共生或伴生矿物的方法与系统
CN112991093B (zh) 一种基于边缘计算的窃电检测方法及系统
CN115291019A (zh) 基于多任务学习模型的电能质量扰动分类识别系统
CN112201340B (zh) 一种基于贝叶斯网络过滤的心电图病症确定方法
CN112348275A (zh) 一种基于在线增量学习的区域生态环境变化预测方法
CN113313417B (zh) 一种基于决策树模型的涉诉风险信号分级方法及装置
CN114710451B (zh) 基于扩展哈希和knn的区块链应用流量识别方法及系统
CN118313735B (zh) 一种适用于工业智能制造的产品质量虚拟量测方法
CN118446340A (zh) 基于异常值检测的自适应集成学习模型及构建方法与应用
CN111859682A (zh) 基于GroupLasso的变量自动选择方法、系统及可读介质
CN117873837A (zh) 一种存储设备容量耗尽趋势的分析方法
Imsirovic et al. Autoencoders for Anomaly Detection in Commercial Truck Gearshifts
CN116911726A (zh) 一种基于机器学习的最优快递员匹配方法、设备和计算机程序产品
CN115221797A (zh) 一种水电机组状态异常分析方法、系统、终端及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant