CN116468160A - 基于生产大数据的铝合金压铸件质量预测方法 - Google Patents
基于生产大数据的铝合金压铸件质量预测方法 Download PDFInfo
- Publication number
- CN116468160A CN116468160A CN202310350260.0A CN202310350260A CN116468160A CN 116468160 A CN116468160 A CN 116468160A CN 202310350260 A CN202310350260 A CN 202310350260A CN 116468160 A CN116468160 A CN 116468160A
- Authority
- CN
- China
- Prior art keywords
- data
- quality
- die casting
- training
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004512 die casting Methods 0.000 title claims abstract description 63
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 50
- 229910000838 Al alloy Inorganic materials 0.000 title claims abstract description 18
- 238000001514 detection method Methods 0.000 claims abstract description 13
- 238000005266 casting Methods 0.000 claims abstract description 12
- 230000002159 abnormal effect Effects 0.000 claims abstract description 10
- 230000010354 integration Effects 0.000 claims abstract description 4
- 238000007781 pre-processing Methods 0.000 claims abstract description 3
- 238000012549 training Methods 0.000 claims description 40
- 238000012360 testing method Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000013139 quantization Methods 0.000 claims description 6
- 238000005507 spraying Methods 0.000 claims description 4
- 230000001133 acceleration Effects 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000007637 random forest analysis Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 238000005259 measurement Methods 0.000 claims description 2
- 238000012216 screening Methods 0.000 claims description 2
- 238000004422 calculation algorithm Methods 0.000 abstract description 6
- 238000010801 machine learning Methods 0.000 abstract description 5
- 230000004927 fusion Effects 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001125 extrusion Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Manufacturing & Machinery (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于生产大数据的铝合金压铸件质量预测方法,属于汽车压铸件质量预测领域。包括:1)设备采集单元获得压铸过程生产参数数据,人工检测单元获得质量指标数据,并将参数数据和质量指标数据整合成原始数据集;2)结合业务对数据进行预处理,包括重复数据、缺失值和异常值,并进行质量预测关键特征选择;(3)利用stacking集成方法将不同的机器学习算法结合在一起,提高融合模型的泛化能力和准确性,最后根据实时采集的生产数据对压铸件质量进行预测,得到具体结果。本发明解决了人工检测压铸件质量费时且不准确的问题,利用训练好的算法模型,能够快速准确的对铸件质量进行评估,提高工厂的生产效率,为铝合金压铸件质量生产提供参考和建议。
Description
技术领域
本发明属于汽车压铸件质量预测领域,涉及一种生产大数据的铝合金压铸件质量预测方法。
背景技术
压铸质量预测在压铸制造业中起着至关重要的作用,产品质量是企业的生命线,而压铸质量的预测是质量控制体制中的关键环节,利用数据挖掘等相关技术对生产过程中挤压、喷淋时间、温度等工艺参数建立预测模型从而能够实现生产过程的质量指标预测,提高压铸件质量,无论对于压铸企业的经济利益,还是减少资源浪费的社会效益,都是非常有利的。
随着制造业信息化、智能化的发展,信息技术应用于生产过程中的各个关节,其中产生了海量的工业大数据,工业大数据是指在工业领域的信息应用中产生的海量数据,包括为决策问题服务的大数据集、大数据应用和大数据技术。这为产品的质量预测提供了可能。由于缺少有效的分析工具和高效的计算技术来提取有用信息,工业大数据价值没有得到充分利用。对于大多数制造企业来说,大数据应用仍以内部数据为主,且多数停留在扩大数据来源与增加数量的初级阶段,他们实时收集和归档生产数据、设备运行数据和质量检验数据,提供数据的统计查询,并仅在必要时恢复和分析数据,没有将历史数据视为数据资产而用于运营与决策过程中。在工业大数据技术的支撑下,利用机器学习充分挖掘产品相关数据的价值,对提高质量管理水平和产品质量有重要的意义。
产品的表面质量是压铸产品外观质量检测的一个重要部分,其检测的准确程度直接会影响产品最终的质量优劣,并且产品的料饼厚度也是一个重要质量评价指标。传统的人工检测或半自动检测的方法难以满足现代工艺生产制造的高效需求。工序检测多依靠人工处理,成本高,效率低。人工检测单元或半自动监测,生产线检查的劳动力量很大,效率低;工作时间的长短影响人为专注力,影响判断品质;而利用机器学习质量预测很好地克服了这一点。基于此,本发明提出一种基于生产大数据的铝合金压铸件质量预测方法。
发明内容
针对背景技术中所述的问题和现有技术的不足,本发明提出一种基于生产大数据的铝合金压铸件质量预测方法,能够高效对质量指标进行评估,降低了生产成本,提高了效率。
为了达到上述目的,本发明采用的技术方案如下:
一种基于生产大数据的铝合金压铸件质量预测方法,包括以下步骤:
(1)采集压铸过程的数据
通过数据采集单元获得压铸过程中铝合金压铸件的生产参数数据,通过人工检测单元测量获得铸件的质量指标数据,根据每个工件唯一的ID标识,将生产参数数据和质量指标数据整合成原始数据集;所述的质量指标为压铸件的料饼厚度;
(2)数据处理
对原始数据采集的数据进行预处理,包括重复数据、缺失值和异常值,并进行质量预测关键特征选择和特征构建,最终划分数据集,将数据集划分为训练集和测试集,训练集用来训练质量预测模型,测试集用来评估模型准确率;
(3)质量预测
采集到很多压铸设备运行数据、工艺参数数据等,这些数据具有高维特性,且与压铸件质量强相关,影响着压铸件质量的好坏。因此在压铸工艺,针对参数数据例如铸造力、模具温度和锁模力等,本发明利用stacking集成方法建立预测模型,用于准确预测目前压铸产品的质量,以步骤(2)处理后的数据为输入参数,然后预测压铸件的质量指标Y,得到具体结果(即该步骤中利用stacking集成方法将不同的机器学习算法结合在一起,提高融合模型的泛化能力和准确性,最后根据实时采集的生产数据对压铸件质量进行预测,得到具体结果)。
进一步的,所述步骤(1)数据采集包括以下步骤:
步骤1.1,通过HMI界面中寻找可以采集的数据,并读取记录每种压铸工艺参数数据的PLC地址;然后利用智能网关提取数据信号并转发到远程服务器,在智能网关管理界面设置数据区域、地址、字段和端口等参数,通过HTTP协议GET/POST请求上报发送数据到服务器,最终上传到数据库中,利用数据库可视化工具实时存储并监控;所述数据库为工厂MES系统;
步骤1.2,通过人工检测单元获得铸件质量指标,从数据库抽取批量数据,利用工件的唯一ID标识将工件生产数据和质量指标一一对应,将生产数据和质量指标数据整合成原始数据集。
进一步的,所述步骤1中采集到的压铸件生产参数包括升压时间、铸造压力、建筑时间、定模温度、锁模力、料饼厚度、加速位置、减速位置等一系列参数。
进一步的,所述步骤(2)数据处理包括以下步骤:
步骤2.1,缺失值处理,有两种处理方法,一是采用随机森林缺失值填充的方法,将缺失值用该特征的均值代替;二是对某些列而言由于绝大部分数据都是同一个固定值所以采取填充固定值的方法,选取该列中的固定值去填充缺失数据的训练样本和测试样本;
上述某列为喷淋时间、顶出时间、闭模进入时间等对模型影响不大的特征;
步骤2.2,重复值和异常值处理,采取对重复数据的筛选和去除,压铸过程中工艺参数比较稳定,对异常数据做了有针对的修改与调整,对于有问题数据直接删除整行数据,保证训练数据的质量;
步骤2.3,通过机理分析剔除个别极不相关的特征,然后计算特征和目标特性之间的距离相关系数,计算过程为:
其中,为u和v的距离相关系数,u表示某个特征,v表示目标特性,/>为u的均值,同理v。所述目标特性为质量指标。
距离相关系数为0时,表示两者相互独立,通过数值大小可以选择与目标特性相关性高特征;
步骤2.4,构建新的特征,将t-1时刻的质量特性值作为t时刻产品的一个输入特征弥补信息损失。将t-1时刻的质量特性值作为特征符合压铸制造产品生产特点;
步骤2.5,划分数据集,将数据集划分为训练集和测试集,训练集用来训练质量预测模型,测试集用来评估模型准确率。
进一步的,所述步骤(3)压铸件质量预测具体包括以下步骤:
对Stacking集成的方法是首先建立多个不同类型的基学习器,初始数据集作为输入训练得到每个基学习器的初级预测结果,然后将初级预测结果合并组成一个新的次级数据集,输入构建的一个元学习器,输出最终的预测结果。
步骤3.1,基学习器定义为B={B1,B2,B3},其中Bi为3个质量预测模型,定义元学习器M;具体的:将XGBoost、LightGBM、GBDT作为3个基学习器,选择XGBoost作为元学习器。
步骤3.2,将训练集XT进行随机5等分(分为五折数据),记为XT1,XT2,XT3,XT4,XT5,以B1基学习器为例,对于每一折数据做如下操作:在通过组合除第k次折(k=1,2,…,5)之外的所有折获得的训练数据上训练基础模型,训练完成后使用基学习器对第k次测试数据进行预测,得到预测结果Y1=[y1,y2,y3,y4,y5]。对剩下的两个基学习器都进行类似上述操作,得到Y2,Y3,最后用所有基学习器的预测结果集合得到二次训练集Y=[Y1,Y2,Y3]。
步骤3.3,将二次数据集输入元学习器M中再次训练,得到最终的集成模型MB,并输出最终的目标特征预测结果。
还可以引入R平方作为量化指标对集成模型进行评估,通过其计算过程为:
其中,R2是量化指标,分子部分是残差平方和,分母部分是总平方和,N是训练数据集样本数量,fi是质量预测方法得到的数值,yi是样本点i实际的数值标签,是真实数值标签的平均数。
本发明的优点及有益效果是:
(1)本发明所述的基于Stacking集成质量预测方法,能够利用与压铸产品质量有复杂关联特性的工艺参数预测出压铸件的料饼厚度,在弥补单一算法性能波动大问题的同时,提升了预测结果的准确性。
(2)本发明方法通过集成学习的思想融合了XGBoost、LightGBM、GBDT三种机器学习算法,发挥每个算法的优势来获得了最佳的预测性能,有效提高了压铸件质量预测的准确率。
(3)本发明通过分析压铸过程,因为加工设备随时间变化,工序随着加工时间的积累一定误差,还有铝液原料随时间变化等因素,整个生产工艺流程实时采集到的生产数据序列本质上是时间序列,而这部分误差又无法采集到,所以将t-1时刻的质量特性值作为t时刻产品的一个输入特征可以将信息损失最小化,明显提高模型准确率。
附图说明
图1为本发明的质量预测的系统图;
图2为预测值与真实值的对比图;
图3为预测值与真实值的残差图;
图4为5次R2对比图。
具体的实施方式
为了更加详细的阐述本发明的技术方案和技术特点,将结合下面的附图来进行详细的说明。
如图1所示,一种基于生产大数据的铝合金压铸件质量预测方法,包含以下步骤:
步骤1,数据采集,通过数据采集单元获得压铸过程中铝合金压铸件的生产参数数据,人工检测单元测量获得铸件的质量指标数据(料饼厚度),根据每个工件唯一的ID标识,将生产参数数据和质量指标数据整合成原始数据集;所述的质量指标为压铸件的料饼厚度,具体为:
在步骤1.1中,通过HMI界面中寻找可以采集的数据,并读取记录每种压铸工艺参数数据的PLC地址;然后利用智能网关提取数据信号并转发到远程服务器,在智能网关管理界面设置数据区域、地址、字段和端口等参数,通过HTTP协议GET/POST请求上报发送数据到服务器,最终上传到数据库中,利用数据库可视化工具实时存储并监控;所述数据库为工厂MES系统;
在步骤1.2中,通过人工检测单元获得铸件质量指标,从数据库抽取批量数据,利用工件的唯一ID标识将工件生产数据和质量指标一一对应,将生产数据和质量指标数据整合成原始数据集。
在整合到的信息中,数据集为7559条数据,时间跨度为2022年9月10号至2022年10月4号,每加工一个工件采集一条数据,以压铸件料饼厚度预测为例,部分数据如表1所示:
表1原始数据集
上表格中,N表示缺失值。
步骤2,数据处理,对原始数据集中的数据进行预处理,包括重复数据、缺失值和异常值,并进行质量预测关键特征选择和特征构建,具体为:
在步骤2.1中,缺失值处理,有两种处理方法,对于升压时间、铸造压力和浇筑时间采用随机森林缺失值填充的方法,将缺失值用该特征的均值代替,对于定出时间和喷淋时间由于绝大部分数据都是同一个固定值所以采取填充固定值的方法,选取该列中的固定值去填充缺失数据的训练样本和测试样本;
在步骤2.2中,重复值和异常值处理,采取对重复数据的筛选和去除,例如加工时间邻近的几组数据所有参数数据都是相同的,将其重复组删除,只留下一组数据,压铸过程中工艺参数比较稳定,对异常数据做了有针对的修改与调整,对于有问题数据直接删除整行数据,例如一组数据中定模温度远远高出其他组,保证训练数据的质量;
在步骤2.3中,通过机理分析剔除个别极不相关的特征;
本发明在步骤2.3中将模次,压铸机系统地址表,开模返回时间3个极不相关剔除;
然后计算特征和目标特性之间的距离相关系数,计算过程为:
其中为u和v的距离相关系数,u表示某个特征,v表示目标特性,/>为u的均值,同理v。所述目标特性为质量指标。
距离相关系数为0时,表示两者相互独立,通过数值大小可以选择与目标特性相关性高特征;
在步骤2.4中,构建新的特征,将t-1时刻的质量特性值作为t时刻产品的一个输入特征弥补信息损失。将t-1时刻的质量特性值作为t时刻产品的一个输入特征符合制造业产品生产特点,最终选定的特征如表2所示:
表2经过特征工程选择构建之后的特征表
特征编号 | 1 | 2 | 3 | 4 | 5 |
特征名称 | 升压时间 | 铸造压力 | 浇筑时间 | 定模温度1 | 定模温度2 |
特征编号 | 6 | 7 | 8 | 9 | 10 |
特征名称 | 定模温度3 | 锁模力 | 加速位置 | 减速位置 | t-1料饼厚度 |
在步骤2.5中,划分数据集,将数据集划分为训练集和测试集,训练集用来训练模型,测试集用来评估模型准确率。
步骤3,质量预测,对Stacking集成的方法是首先建立多个不同类型的基学习器,初始数据集作为输入训练得到每个基学习器的初级预测结果,然后将初级预测结果合并组成一个新的次级数据集,输入构建的一个元学习器,输出最终的预测结果。
步骤3.1,基学习器定义为B={B1,B2,B3},其中Bi为3个质量预测模型,定义元学习器M;将XGBoost、LightGBM、GBDT作为3个基学习器,选择XGBoost作为元学习器。
步骤3.2,将训练集XT进行随机5等分,记为XT1,XT2,XT3,XT4,XT5,以B1基学习器为例,对于每一折(k=1,2,…,5):在通过组合除第k次折之外的所有折获得的训练数据上训练基础模型,训练完成后使用基学习器对第k次测试数据进行预测,得到预测结果Y1=[y1,y2,y3,y4,y5]。对剩下的两个基学习器都进行类似上述操作,得到Y2,Y3,最后用所有基学习器的预测结果集合得到二次训练集Y=[Y1,Y2,Y3]。
步骤3.3,将二次数据集输入元学习器M中再次训练,得到最终的集成模型MB,并输出最终的目标特征预测结果。
本发明在步骤3.3中得到的预测性能如下图2、3所示:
图2中,圆形标记线为预测值,三角标记线为真实值,从图中可以看出,圆形标记线大部分在三角标记线附近,说明预测值有较高准确率。
图3为真实值和预测值对比残差曲线,从图中可以看出,实际值与预测值的绝对误差大多在±2mm之间。
引入R平方量化指标对改模型进行评估,通过其计算过程为:
其中,R2是量化指标,分子部分是残差平方和,分母部分是总平方和,N是样本数量,fi是质量预测方法得到的数值,yi是样本点i实际的数值标签,是真实数值标签的平均数。
本发明计算R平方的范围在0-1之间,且越靠近1说明模型效果越好。计算得到测试集的R2约为0.95,通过五折交叉验证计算得到结果如下图,5次R2都在0.83以上,平均结果为0.87,如图4所示,说明建立的模型具有较好的预测效果。
以上所述实施例仅表达本发明的实施方式,但并不能因此而理解为对本发明专利的范围的限制,应当指出,对于本领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些均属于本发明的保护范围。
Claims (6)
1.一种基于生产大数据的铝合金压铸件质量预测方法,其特征在于,包括以下步骤:
(1)采集压铸过程的数据
通过数据采集单元获得压铸过程中铝合金压铸件的生产参数数据,通过人工检测单元测量获得铸件的质量指标数据,根据每个工件唯一的ID标识,将生产参数数据和质量指标数据整合成原始数据集;所述的质量指标为压铸件的料饼厚度;
(2)数据处理
对原始数据采集的数据进行预处理,包括重复数据、缺失值、异常值,并进行质量预测关键特征选择和特征构建,划分处理后的数据集,将其划分为训练集和测试集,训练集用来训练质量预测模型,测试集用来评估模型准确率;
(3)质量预测
采用stacking集成方法建立预测模型,用于准确预测目前压铸产品的质量,以步骤(2)处理后的数据为输入参数,然后预测压铸件的质量指标Y,得到具体结果。
2.根据权利要求1所述的一种基于生产大数据的铝合金压铸件质量预测方法,其特征在于,所述步骤1中采集到的压铸件生产参数包括升压时间、铸造压力、建筑时间、定模温度、锁模力、料饼厚度、加速位置、减速位置等一系列参数。
3.根据权利要求1所述的一种基于生产大数据的铝合金压铸件质量预测方法,其特征在于,所述步骤(2)数据处理包括以下步骤:
步骤2.1,缺失值处理,有两种处理方法,一是采用随机森林缺失值填充的方法,将缺失值用该特征的均值代替;二是对某些列而言由于绝大部分数据都是同一个固定值所以采取填充固定值的方法,选取该列中的固定值去填充缺失数据的训练样本和测试样本;上述某列为喷淋时间、顶出时间、闭模进入时间或其他对模型影响不大的特征;
步骤2.2,重复值和异常值处理,采取对重复数据的筛选和去除,对异常数据进行修改与调整,对有问题数据直接删除整行数据,保证训练数据的质量;
步骤2.3,通过机理分析剔除个别极不相关的特征,计算特征和目标特性之间的距离相关系数,计算过程为:
其中,为u和v的距离相关系数,u表示某个特征,v表示目标特性,/>为u的均值,同理v;所述目标特性为质量指标;
距离相关系数为0时,表示两者相互独立,通过数值大小可以选择与目标特性相关性高特征;
步骤2.4,构建新的特征,将t-1时刻的质量特性值作为t时刻产品的一个输入特征弥补信息损失;将t-1时刻的质量特性值作为特征符合压铸制造产品生产特点;
步骤2.5,划分数据集,将数据集划分为训练集和测试集,训练集用来训练质量预测模型,测试集用来评估模型准确率。
4.根据权利要求1所述的一种基于生产大数据的铝合金压铸件质量预测方法,其特征在于,所述步骤(3)压铸件质量预测具体包括以下步骤:
首先建立多个不同类型的基学习器,初始数据集作为输入训练得到每个基学习器的初级预测结果,然后将初级预测结果合并组成一个新的次级数据集,输入构建的一个元学习器,输出最终的预测结果;
步骤3.1,基学习器定义为B={B1,B2,B3},其中Bi为3个质量预测模型,定义元学习器M;
步骤3.2,将训练集XT进行随机5等分,即分为五折数据,记为XT1,XT2,XT3,XT4,XT5,以B1基学习器进行说明,对于每一折数据做如下操作:在通过组合除第k次折(k=1,2,…,5)之外的所有折获得的训练数据上训练基础模型,训练完成后使用基学习器对第k次测试数据进行预测,得到预测结果Y1=[y1,y2,y3,y4,y5];对剩下的两个基学习器都进行类似上述操作,得到Y2,Y3,最后用所有基学习器的预测结果集合得到二次训练集Y=[Y1,Y2,Y3];
步骤3.3,将二次数据集输入元学习器M中再次训练,得到最终的集成模型MB,并输出最终的目标特征预测结果。
5.根据权利要求4所述的一种基于生产大数据的铝合金压铸件质量预测方法,其特征在于,所述的步骤3.1中,将XGBoost、LightGBM、GBDT作为3个基学习器,选择XGBoost作为元学习器。
6.根据权利要求4所述的一种基于生产大数据的铝合金压铸件质量预测方法,其特征在于,所述的步骤3还可以引入R2作为量化指标对集成模型进行评估,通过其计算过程为:
其中,R2是量化指标,分子部分是残差平方和,分母部分是总平方和,N是训练数据集样本数量,fi是质量预测方法得到的数值,yi是样本点i实际的数值标签,是真实数值标签的平均数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310350260.0A CN116468160A (zh) | 2023-04-04 | 2023-04-04 | 基于生产大数据的铝合金压铸件质量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310350260.0A CN116468160A (zh) | 2023-04-04 | 2023-04-04 | 基于生产大数据的铝合金压铸件质量预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116468160A true CN116468160A (zh) | 2023-07-21 |
Family
ID=87176402
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310350260.0A Pending CN116468160A (zh) | 2023-04-04 | 2023-04-04 | 基于生产大数据的铝合金压铸件质量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116468160A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117078105A (zh) * | 2023-08-30 | 2023-11-17 | 深圳市三泰信息科技有限公司 | 基于人工智能的生产质量监控方法及系统 |
CN117273554A (zh) * | 2023-11-23 | 2023-12-22 | 江苏洁瑞雅纺织品有限公司 | 一种基于数据识别的纺织品生产质量预测方法 |
CN117649906A (zh) * | 2024-01-30 | 2024-03-05 | 浙江大学 | 一体化铝合金结构件铸造质量预测方法、电子设备、介质 |
CN117852972A (zh) * | 2024-02-01 | 2024-04-09 | 宝应县鑫龙铸造有限公司 | 一种基于铸造过程监控数据的铸造质量控制系统及方法 |
CN118095579A (zh) * | 2024-04-26 | 2024-05-28 | 宁德时代新能源科技股份有限公司 | 制程参数的确定方法、装置及系统、电子设备和存储介质 |
-
2023
- 2023-04-04 CN CN202310350260.0A patent/CN116468160A/zh active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117078105A (zh) * | 2023-08-30 | 2023-11-17 | 深圳市三泰信息科技有限公司 | 基于人工智能的生产质量监控方法及系统 |
CN117078105B (zh) * | 2023-08-30 | 2024-05-14 | 深圳市三泰信息科技有限公司 | 基于人工智能的生产质量监控方法及系统 |
CN117273554A (zh) * | 2023-11-23 | 2023-12-22 | 江苏洁瑞雅纺织品有限公司 | 一种基于数据识别的纺织品生产质量预测方法 |
CN117273554B (zh) * | 2023-11-23 | 2024-04-19 | 江苏洁瑞雅纺织品有限公司 | 一种基于数据识别的纺织品生产质量预测方法 |
CN117649906A (zh) * | 2024-01-30 | 2024-03-05 | 浙江大学 | 一体化铝合金结构件铸造质量预测方法、电子设备、介质 |
CN117649906B (zh) * | 2024-01-30 | 2024-04-26 | 浙江大学 | 一体化铝合金结构件铸造质量预测方法、电子设备、介质 |
CN117852972A (zh) * | 2024-02-01 | 2024-04-09 | 宝应县鑫龙铸造有限公司 | 一种基于铸造过程监控数据的铸造质量控制系统及方法 |
CN118095579A (zh) * | 2024-04-26 | 2024-05-28 | 宁德时代新能源科技股份有限公司 | 制程参数的确定方法、装置及系统、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116468160A (zh) | 基于生产大数据的铝合金压铸件质量预测方法 | |
CN107273924B (zh) | 基于模糊聚类分析的多数据融合的电厂故障诊断方法 | |
CN110619691B (zh) | 一种板坯表面裂纹的预测方法及装置 | |
CN112446597B (zh) | 贮箱质量评估方法、系统、存储介质、计算机设备及应用 | |
CN111783544B (zh) | 加工陶瓷手机背板的金刚石铣磨头状态监测系统搭建方法 | |
CN114201374A (zh) | 基于混合机器学习的运维时序数据异常检测方法及系统 | |
CN113221441A (zh) | 一种电厂设备健康评估的方法及装置 | |
CN116485020B (zh) | 一种基于大数据的供应链风险识别预警方法、系统及介质 | |
CN112231971A (zh) | 基于相对整体趋势扩散故障样本生成的高炉故障诊断方法 | |
CN113221442B (zh) | 一种电厂设备健康评估模型的构建方法及装置 | |
CN117408519A (zh) | 基于深度学习算法的化工反应过程风险预警方法及装置 | |
CN117541095A (zh) | 一种农用地土壤环境质量类别划分的方法 | |
CN117168861A (zh) | 污水处理设备的异常监测方法及其系统 | |
CN114926075B (zh) | 基于工时预测的机械零件生产调度方法 | |
CN115115213A (zh) | 一种钢铁产品质量特性的追溯分析方法及装置 | |
CN112966449A (zh) | 基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法 | |
CN115114968A (zh) | 基于随机森林的铸坯裂纹智能预测方法 | |
CN111340095A (zh) | 基于深度学习的环境监测数据质量控制方法 | |
CN117077983B (zh) | 一种基于物联网的塑料制品再制造处理方法及系统 | |
CN117273467B (zh) | 一种基于多因素耦合的工业安全风险管控方法及系统 | |
CN112508320B (zh) | 一种批生产的自动过程阶段划分工作流 | |
CN117665221B (zh) | 一种复合材料制品的性能检测方法及系统 | |
CN117076454B (zh) | 一种工程质量验收表单数据结构化存储方法及系统 | |
CN117112857B (zh) | 一种适用于工业智能制造的加工路径推荐方法 | |
CN116595889B (zh) | 基于peek材料的薄型筋体均布结构加工方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |