CN112966449B - 基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法 - Google Patents

基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法 Download PDF

Info

Publication number
CN112966449B
CN112966449B CN202110348334.8A CN202110348334A CN112966449B CN 112966449 B CN112966449 B CN 112966449B CN 202110348334 A CN202110348334 A CN 202110348334A CN 112966449 B CN112966449 B CN 112966449B
Authority
CN
China
Prior art keywords
quality
factors
manufacturing process
prediction
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110348334.8A
Other languages
English (en)
Other versions
CN112966449A (zh
Inventor
臧阳阳
栗仕强
梁昭磊
汪启华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Aero Polytechnology Establishment
Original Assignee
China Aero Polytechnology Establishment
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Aero Polytechnology Establishment filed Critical China Aero Polytechnology Establishment
Priority to CN202110348334.8A priority Critical patent/CN112966449B/zh
Publication of CN112966449A publication Critical patent/CN112966449A/zh
Application granted granted Critical
Publication of CN112966449B publication Critical patent/CN112966449B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Factory Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法,该方法包括:确定质量数据的来源、组成要素和采集方式,构建装配过程影响因素和产品质量指标的映射管理,开展针对性的数据预处理分析,构建制造过程质量数据集;基于变量选择的方法筛选制造过程质量因素,建立基于特征选择的制造过程和产品质量等级之间的质量预测模型;基于概率神经网络估计质量预测模型,设计基于后向选择的关键过程因素选择算法。本发明可为产品质量特性的预测和导致产品质量问题的根源定位,提升产品制造过程能力和产品质量的一致性、稳定性,为基于数据驱动的定量化技术支撑和决策提供依据。

Description

基于变量选择和概率神经网络的制造过程质量缺陷根源诊断 方法
技术领域
本发明属于质量与可靠性工程技术领域,特别涉及一种基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法。
背景技术
产品质量是一个企业的立足根本,如何控制生产过程产品质量一直是制造单位关注的重点问题。在进行质量监控时,首先需要确定被监控对象的异常能够准确及时反映产品质量问题。然而,由于大多数产品的制造过程工艺复杂、工序繁多,如果不针对具体产品开展长期深入的研究,则很难对制造过程因素间的关联性及对产品质量特性的影响关系建立“白箱”式的数学模型。此时,传统质量监控方法通常无法对生产过程中产品的质量问题进行定位及追溯分析,不能及时反馈控制调整参数,难以实现流程的实时反馈和管控。
预测控制作为一种超前控制成为了智能制造质量监控的重要需求之一。预测控制是针对单件产品关键质量特性的生产过程,通过采集产品的生产数据,基于制造过程关键工艺参数建立产品质量状态预测模型,实现对产品质量特性指标的预测评估,继而获取生产数据中蕴藏的重要过程知识,进而判断过程参数满足要求的程度,从而实现对每个产品质量问题的定位追溯和根源分析。在制造过程产品质量状态预测方面,国内外的研究机构和学者们开展了大量工作,并取得了多样化的研究成果,开发了若干数据分析、机器学习方法用于解决产品制造过程中的产品质量监控、根源诊断、质量提升等诸多问题。例如,基于阿里巴巴众智任务数据,采用XGBoost、随机森林、gcForest等预测模型进行预测;采用BP神经网络预测织机工艺质量指标和生产效率;基于多调节参数的递推偏最小二乘方法构建多元线性回归模型,用于质量特征的预测;针对陶瓷管生产过程的质量预测工作,构建工艺特征参数与质量指标间的CART决策树模型。然而,一般复杂产品的装配较为繁杂,影响因素较多且相互耦合,不过对产品质量起到关键影响因素的往往只有少数。例如,在某航空高精度产品的装配过程,根据经验收集到的过程影响因素有103个,而关键影响因素只有10个左右,非关键因素的存在减弱了关键影响因素在预测模型中的贡献度,同时可能导致“维度灾难”或“过拟合”等问题。上述传统基于机器学习算法的质量预测模型一般不具有关键影响因素筛选的功能。因此,基于变量选择和概率神经网络,寻求一种在众多的装配影响因素中定位到关键少数影响因素的制造过程质量缺陷根源诊断方法是十分迫切且必要的。
发明内容
本发明针对上述现有技术中的缺陷,提出一种基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法。该方法包括确定质量数据的来源、组成要素和采集方式,构建装配过程影响因素和产品质量指标的映射管理,开展针对性的数据预处理分析,构建制造过程质量数据集;基于变量选择的方法筛选制造过程质量因素,建立基于特征选择的制造过程和产品质量等级之间的质量预测模型;基于概率神经网络估计质量预测模型,设计基于后向选择的关键过程因素选择算法。本发明可为产品质量特性的预测和导致产品质量问题的根源定位,提升产品制造过程能力和产品质量的一致性、稳定性,为基于数据驱动的定量化技术支撑和决策提供依据。
本发明提供一种基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法,所述方法包括以下步骤:
S1、构建制造过程质量数据集:确定质量数据的来源、组成要素和采集方式,构建装配过程影响因素和产品质量指标的映射管理,开展针对性的数据预处理分析,构建制造过程质量数据集,所述步骤S1具体包括以下步骤:
S11、确定质量数据的来源、组成要素和采集方式:质量影响因素包含各零件的加工精度、表面粗糙度、零件间的配合参数、零件变形参数、装配工艺参数、检验数据和环境参数,形成涵盖零件参数、过程变量、过程精度和产品质量状态在内全过程的质量预测分析数据集;
S12、构建装配过程影响因素和产品质量指标的映射管理:梳理装配过程各因素对装配质量特性形成过程的影响关系,以及零部件质量特性与产品质量特性的映射关系,分析工艺要素、工艺过程、工艺输出参数对性能参数和产品质量指标等的影响,实现零部件级质量特性到产品级质量特性的传递;
S13、开展针对性的数据预处理分析:对采集的数据进行预处理,包括数据清洗、数据可信度检验和标准化处理,构建制造过程质量数据集;
S2、基于变量选择构建质量预测模型:基于变量选择的方法筛选制造过程质量因素,建立基于特征选择的制造过程和产品质量等级之间的质量预测模型;
S3、基于概率神经网络估计质量预测模型:提出采用概率神经网络分类算法进行质量预测模型的估计,得到产品质量特性的估计值,所述质量预测模型包含输入层、模式层、求和层和输出层;
S4、设计基于后向选择的关键过程因素选择算法:在所有过程因素中选取最优因素从质量预测模型中剔除,并重复继续在剩余的过程因素中选取最优因素从质量预测模型中剔除,直至剔除p-sn个因素即选出sn个模型因素时停止。
进一步,所述步骤S2具体包括以下步骤;
S21、基于制造过程质量数据集,其质量预测模型为:
y=f(x1,x2,…,xp)+ξ (1)
其中:f(·)表示从过程因素x到质量等级y的映射;xj表示第j个过程因素且j=1,…,p;ξ表示均值为0的预测误差;
S22、提出基于变量选择的影响因素识别方法:采用惩罚函数L0惩罚和L1惩罚来筛选变量,将非关键质量影响因素从模型中剔除,进而从众多因素中识别出重要的关键影响因素;
S23、以多分类马修斯相关系数为基础,构建质量预测目标函数中的损失函数,并设计为多分类马修斯相关系数的相反数,基于变量选择的质量预测模型为:
Figure BDA0003001587000000031
其中:δmk表示真实质量等级矩阵δn×q的第m行第k列值,δn×q矩阵为质量等级y的One-Hot编码表示;
Figure BDA0003001587000000032
表示预测质量等级矩阵
Figure BDA0003001587000000033
的第m行第k列值,n表示样本总个数,q表示样本类别数;
Figure BDA0003001587000000034
Figure BDA0003001587000000035
分别表示δn×q矩阵和
Figure BDA0003001587000000036
矩阵第k列的均值,且
Figure BDA0003001587000000037
Figure BDA0003001587000000038
I为指示函数,当条件满足时为1,否则为0;αj表示产品质量特征的重要性指标;sn表示关键质量影响因素个数,即模型应包含的变量个数且sn≤p。
优选的,所述步骤S3具体包括以下步骤;
S31、输入层将特征向量传入网络,输入层个数是预测样本中过程因素的个数,基于概率神经网络的质量预测模型接收来自预测样本的过程参数值,采用后向特征选择方法,初始时模型包含所有过程参数,节点数为p,各节点输入值为预测样本x的各个维度上取值;
S32、模式层为径向基层,通过连接权值与输入层连接,计算输入特征向量与训练集中各个模式的匹配程度,将其距离送入核函数得到模式层的输出,基于训练样本,采用高斯核估计方法,估计概率神经网络隐含层至求和层的输入/输出关系,即向量x=[x1,x2,…,xp]T输入到模式层,模式层中第k类模式的第i个神经元节点的输出为:
Figure BDA0003001587000000039
其中:xki表示第k类模式的第i个样本的过程参数向量;n表示训练样本总个数;nk表示yk对应的训练样本总数,
Figure BDA0003001587000000041
σ表示可调整的平滑参数,其值在0到1之间;
S33、求和层将各个类的模式层单元连接起来,第k个节点的输出结果为:
Figure BDA0003001587000000042
S34、输出层将输出求和层中得分最高的质量等级作为最终预测结果,其预测值为:
Figure BDA0003001587000000043
由式(3)~(5)可得预测样本x的预测质量等级为:
Figure BDA0003001587000000044
优选的,所述步骤S4具体包括以下步骤;
S41、在所有过程因素中选取最优因素xj1从质量预测模型中剔除,剔除的因素为:
Figure BDA0003001587000000045
其中:
Figure BDA0003001587000000046
表示元素剔除后估计的协方差相关系数,nt表示预测样本个数;
此时,式(6)中x与xki分别表示预测目标集和训练集中剔除第j个元素后的向量,即xA={xc/xj1},xB={xj1};
S42、重复步骤S41,继续在剩余的过程因素中选取最优因素xji从质量预测模型中剔除,
Figure BDA0003001587000000047
其中:
Figure BDA0003001587000000048
表示第i次元素剔除后估计的协方差相关系数;
此时,式(6)中x与xki分别表示p-i维向量,即从原始过程因素中剔除了
Figure BDA0003001587000000049
后组成的因素集,即
Figure BDA00030015870000000410
直至剔除p-sn个因素即选出sn个模型因素时停止。
优选的,步骤S42的停止条件中所述参数sn即关键过程因素个数是一个常数,一般由特定制造过程的工艺知识和现场经验来确定,在工艺知识不足时,采用F统计量来实现停止条件,在第i步剔除选出的过程因素后,模型中包含p-i个因素,计算:
Figure BDA0003001587000000051
随着因素的剔除,协方差相关系数逐渐降低,F统计量逐渐增大,当其超过Fd时,算法停止,此时模型保留的过程因素为关键过程因素。
优选的,所述式(7)对于式(1)中质量预测模型的估计加入约束条件,即增加了模型约束条件——关键质量影响因素个数小于等于sn
优选的,所述Fd采用Boostrap重抽样的方式,由F统计量的分位数估计得到。
优选的,输入层个数是样本中过程因素的个数,求和层节点个数与样本类别数相同,分别对应不同的质量等级。
与现有技术相比,本发明的技术效果为:
1、本发明设计的一种基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法,通过对“5M1E(人、机、料、法、环、测)”等工艺要素、产品制造工艺过程、工艺过程输出参数、产品性能参数和产品质量指标等之间的映射管理,并通过数据预处理,建立制造过程质量数据集;提出基于变量选择的方法筛选制造过程质量因素,建立基于特征选择的制造过程和产品质量等级之间的质量预测模型;提出采用概率神经网络分类算法进行预测模型的估计,从而得到产品质量特性的估计值;设计了基于后向选择的关键过程因素选择算法,实现了制造过程关键质量因素的筛选。
2、本发明设计的一种基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法,该方法应用前景广阔,可以为产品质量特性的预测和导致产品质量问题的根源定位,提升产品制造过程能力和产品质量的一致性、稳定性,为基于数据驱动的定量化技术支撑和决策提供依据。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显。
图1是本发明的基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法的流程图;
图2是本发明的基于概率神经网络的质量预测模型;
图3a是本发明的某航空产品制造过程关键过程因素选择多分类马修斯相关系数(MCC)效果图。
图3b是本发明的某航空产品制造过程关键过程因素选择F统计量效果图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了本发明的基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法,该方法包括以下步骤:
S1、构建制造过程质量数据集:确定质量数据的来源、组成要素和采集方式,构建装配过程影响因素和产品质量指标的映射管理,开展针对性的数据预处理分析,构建制造过程质量数据集。
S11、确定质量数据的来源、组成要素和采集方式:质量影响因素包含各零件的加工精度、表面粗糙度、零件间的配合参数、零件变形参数、装配工艺参数、检验数据和环境参数,形成涵盖零件参数、过程变量、过程精度和产品质量状态在内全过程的质量预测分析数据集。
S12、构建装配过程影响因素和产品质量指标的映射管理:梳理装配过程各因素对装配质量特性形成过程的影响关系,以及零部件质量特性与产品质量特性的映射关系,分析工艺要素、工艺过程、工艺输出参数对性能参数和产品质量指标等的影响,实现零部件级质量特性到产品级质量特性的传递。
S13、开展针对性的数据预处理分析:对采集的数据进行预处理,包括数据清洗、数据可信度检验和标准化处理,构建制造过程质量数据集。
S2、基于变量选择构建质量预测模型:基于变量选择的方法筛选制造过程质量因素,建立基于特征选择的制造过程和产品质量等级之间的质量预测模型。
S21、基于制造过程质量数据集,其质量预测模型为:
y=f(x1,x2,…,xp)+ξ (1)
其中:f(·)表示从过程因素x到质量等级y的映射;xj表示第j个过程因素且j=1,…,p;ξ表示均值为0的预测误差。
S22、提出基于变量选择的影响因素识别方法:采用惩罚函数L0惩罚和L1惩罚来筛选变量,将非关键质量影响因素从模型中剔除,进而从众多因素中识别出重要的关键影响因素。
S23、以多分类马修斯相关系数为基础,构建质量预测目标函数中的损失函数,并设计为多分类马修斯相关系数的相反数,基于变量选择的质量预测模型为:
Figure BDA0003001587000000071
其中:δmk表示真实质量等级矩阵δn×q的第m行第k列值,δn×q矩阵为质量等级y的One-Hot编码表示;
Figure BDA0003001587000000072
表示预测质量等级矩阵
Figure BDA0003001587000000073
的第m行第k列值,n表示样本总个数,q表示样本类别数;
Figure BDA0003001587000000074
Figure BDA0003001587000000075
分别表示δn×q矩阵和
Figure BDA0003001587000000076
矩阵第k列的均值,且
Figure BDA0003001587000000077
Figure BDA0003001587000000078
I为指示函数,当条件满足时为1,否则为0;αj表示产品质量特征的重要性指标;sn表示关键质量影响因素个数,即模型应包含的变量个数且sn≤p。
S3、基于概率神经网络估计质量预测模型:提出采用概率神经网络分类算法进行质量预测模型的估计,得到产品质量特性的估计值,质量预测模型包含输入层、模式层、求和层和输出层。
S31、输入层将特征向量传入网络,输入层个数是预测样本中过程因素的个数,基于概率神经网络的质量预测模型接收来自预测样本的过程参数值,采用后向特征选择方法,初始时模型包含所有过程参数,节点数为p,各节点输入值为预测样本x的各个维度上取值。
S32、模式层为径向基层,通过连接权值与输入层连接,计算输入特征向量与训练集中各个模式的匹配程度,将其距离送入核函数得到模式层的输出,基于训练样本,采用高斯核估计方法,估计概率神经网络隐含层至求和层的输入/输出关系,即向量x=[x1,x2,…,xp]T输入到模式层,模式层中第k类模式的第i个神经元节点的输出为:
Figure BDA0003001587000000079
其中:xki表示第k类模式的第i个样本的过程参数向量;n表示训练样本总个数;nk表示yk对应的训练样本总数,
Figure BDA00030015870000000710
σ表示可调整的平滑参数,其值在0到1之间。
S33、求和层将各个类的模式层单元连接起来,求和层节点个数与样本类别数相同,分别对应不同的质量等级,第k个节点的输出结果为:
Figure BDA00030015870000000711
S34、输出层将输出求和层中得分最高的质量等级作为最终预测结果,其预测值为:
Figure BDA0003001587000000081
由式(3)~(5)可得预测样本x的预测质量等级为,
Figure BDA0003001587000000082
所述式(7)对于式(1)中质量预测模型的估计加入约束条件,即增加了模型约束条件——关键质量影响因素个数小于等于sn
S4、设计基于后向选择的关键过程因素选择算法:在所有过程因素中选取最优因素从质量预测模型中剔除,并重复继续在剩余的过程因素中选取最优因素从质量预测模型中剔除,直至剔除p-sn个因素即选出sn个模型因素时停止。
S41、在所有过程因素中选取最优因素
Figure BDA0003001587000000083
从质量预测模型中剔除,剔除的因素为:
Figure BDA0003001587000000084
其中:
Figure BDA0003001587000000085
表示元素剔除后估计的协方差相关系数,nt表示预测样本个数;
此时,式(6)中x与xki分别表示预测目标集和训练集中剔除第j个元素后的向量,即
Figure BDA0003001587000000086
S42、重复步骤S41,继续在剩余的过程因素中选取最优因素
Figure BDA0003001587000000087
从质量预测模型中剔除,
Figure BDA0003001587000000088
其中:
Figure BDA0003001587000000089
表示第i次元素剔除后估计的协方差相关系数。
此时,式(6)中x与xki分别表示p-i维向量,即从原始过程因素中剔除了
Figure BDA00030015870000000810
后组成的因素集,即
Figure BDA00030015870000000811
直至剔除p-sn个因素即选出sn个模型因素时停止。
步骤S42的停止条件中所述参数sn即关键过程因素个数是一个常数,一般由特定制造过程的工艺知识和现场经验来确定,在工艺知识不足时,采用F统计量来实现停止条件,在第i步剔除选出的过程因素后,模型中包含p-i个因素,计算:
Figure BDA0003001587000000091
随着因素的剔除,协方差相关系数逐渐降低,F统计量逐渐增大,当其超过Fd时,算法停止,此时模型保留的过程因素为关键过程因素。Fd采用Boostrap重抽样的方式,由F统计量的分位数估计得到。
下面结合具体的案例对本发明做进一步的详细说明。
S1、构建制造过程质量数据集:某航空高精度产品是现代航空、航海、航天和国防工业中广泛使用的一种仪器,其加工制造过程主要包含零部件加工、总体结构加工、过程装配、调试等流程,从下料到制造完成历时半年。目前其装配过程共有57道工序,形成103个装配过程因素,主要包含各零件加工完成后的尺寸、性能参数,装配部件各项性能参数、装配工艺参数等。根据客户及工艺要求,产品装配完成后形成的质量特征为产品定级结果,分为0、1、2、3、4五个等级,其中,0、1、2为可交付的合格产品。
通过数据清理,采用基于分类的中心度量填充方法对缺失值进行填充,在纠正错误数据、离群值,剔除冗余因素和重复元组后,共采集到400个产品的完整数据,每个产品包含72个装配过程参数和1个定级结果指标,且根据生产现场经验及物理机理,其中的12个过程参数可能为关键过程参数,构建形成某航空产品制造过程质量数据集。此外,将所有过程因素进行标准化,使得每个变量的均值为0,标准差为1,样本数据如表1所示。分层随机抽取70%的样本数据作为训练集,剩余30%的样本数据作为预测目标集,即n=280,nt=120。
Figure BDA0003001587000000092
表1
S2、基于变量选择构建质量预测模型:根据式(2)建立该航空产品装配过程参数与定级结果的质量预测模型,并通过预测效果进行关键过程参数的选择。模型中的预测变量为72个装配过程参数,即p=72,且xc=(x1,x2,…,x72)T,响应变量为定级结果指标,y∈{0,1,2,3,4},即q=5。
S3、基于概率神经网络的质量预测模型估计:如图2所示,设定初始设置概率神经网络输入层节点数为72,模式层总节点数为280个,分别对应5个类别训练样本,其中0类节点个数与训练集中样本定级结果为0的个数相同,其他类节点设置亦同,根据交叉验证方法选定式(8)中平滑参数σ=0.2;求和层节点数为5,分别对应5类定级结果;输出层的输出结果只有1个,表示根据输入的过程参数预测的定级结果。此时,根据式(6)得到在预测目标集上的预测质量等级矩阵与真实质量等级矩阵的协方差相关系数
Figure BDA0003001587000000101
预测准确率92.3%,预测精度基本满足实际生产需要。
S4、设计基于后向选择的关键过程因素选择算法:运行基于后向选择的关键过程因素选择算法,逐步剔除一个过程因素,并重新计算更新的协方差相关系数,计算结果如图3a和图3b所示,其中,横坐标迭代次数等于从模型中剔除的过程因素数,图3a为MCC值随迭代次数的变化值,图3b为式(9)中F统计量随迭代次数的变化值。从左图可以看出,随着过程因素的剔除,MCC值先增加后逐渐降低,且降低速度逐渐加快。其原因是在模型初始阶段,采用全部过程因素的模型存在“过拟合”的问题,使得模型的泛化能力较差;随着因素的进一步剔除,被剔除因素对产品质量特征的影响被忽略,从而使得模型的预测准确性逐渐降低,且越在后面被剔除的因素,其重要性越大。从图3b可以看出,随着过程因素的剔除,F统计量逐渐增加,且从61开始迅速上升。
采用Boostrap重抽样的方式,F统计量的90%分位数估计为Fd=6.67。关键过程因素选择算法在63次迭代时停止,此时,质量预测模型中保留的过程因素个数为8个,分别为{x9,x12,x24,x29,x48,x55,x59,x67},经与现场工艺工程师、技术人员等进行沟通,其中,{x9,x12,x24,x29,x48,x59}与预期过程因素相同,而{x55,x67}与产品质量特征关系不大,基本达到了产品质量特征预测和关键过程因素选择的目的。
本发明设计的一种基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法,通过对“5M1E(人、机、料、法、环、测)”等工艺要素、产品制造工艺过程、工艺过程输出参数、产品性能参数和产品质量指标等之间的映射管理,并通过数据预处理,建立制造过程质量数据集;提出基于变量选择的方法筛选制造过程质量因素,建立基于特征选择的制造过程和产品质量等级之间的质量预测模型;提出采用概率神经网络分类算法进行预测模型的估计,从而得到产品质量特性的估计值;设计了基于后向选择的关键过程因素选择算法,实现了制造过程关键质量因素的筛选;该方法应用前景广阔,可以为产品质量特性的预测和导致产品质量问题的根源定位,提升产品制造过程能力和产品质量的一致性、稳定性,为基于数据驱动的定量化技术支撑和决策提供依据。
最后所应说明的是:以上实施例仅以说明而非限制本发明的技术方案,尽管参照上述实施例对本发明进行了详细说明,本领域的普通技术人员应当理解:依然可以对本发明进行修改或者等同替换,而不脱离本发明的精神和范围的任何修改或局部替换,其均应涵盖在本发明的权利要求范围当中。

Claims (8)

1.一种基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法,其特征在于,所述方法包括以下步骤:
S1、构建制造过程质量数据集:确定质量数据的来源、组成要素和采集方式,构建装配过程影响因素和产品质量指标的映射管理,开展针对性的数据预处理分析,构建制造过程质量数据集,所述步骤S1具体包括以下步骤:
S11、确定质量数据的来源、组成要素和采集方式:质量影响因素包含各零件的加工精度、表面粗糙度、零件间的配合参数、零件变形参数、装配工艺参数、检验数据和环境参数,形成涵盖零件参数、过程变量、过程精度和产品质量状态在内全过程的质量预测分析数据集;
S12、构建装配过程影响因素和产品质量指标的映射管理:梳理装配过程各因素对装配质量特性形成过程的影响关系,以及零部件质量特性与产品质量特性的映射关系,分析工艺要素、工艺过程、工艺输出参数对性能参数和产品质量指标等的影响,实现零部件级质量特性到产品级质量特性的传递;
S13、开展针对性的数据预处理分析:对采集的数据进行预处理,包括数据清洗、数据可信度检验和标准化处理,构建制造过程质量数据集;
S2、基于变量选择构建质量预测模型:基于变量选择的方法筛选制造过程质量因素,建立基于特征选择的制造过程和产品质量等级之间的质量预测模型;
S3、基于概率神经网络估计质量预测模型:提出采用概率神经网络分类算法进行质量预测模型的估计,得到产品质量特性的估计值,所述质量预测模型包含输入层、模式层、求和层和输出层;
S4、设计基于后向选择的关键过程因素选择算法:在所有过程因素中选取最优因素从质量预测模型中剔除,并重复继续在剩余的过程因素中选取最优因素从质量预测模型中剔除,直至剔除p-sn个因素即选出sn个模型因素时停止。
2.根据权利要求1所述的基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法,其特征在于,所述步骤S2具体包括以下步骤;
S21、基于制造过程质量数据集,其质量预测模型为:
y=f(x1,x2,…,xp)+ξ (1)
其中:f(·)表示从过程因素x到质量等级y的映射;xj表示第j个过程因素且j=1,…,p;ξ表示均值为0的预测误差;
S22、提出基于变量选择的影响因素识别方法:采用惩罚函数L0惩罚和L1惩罚来筛选变量,将非关键质量影响因素从模型中剔除,进而从众多因素中识别出重要的关键影响因素;
S23、以多分类马修斯相关系数为基础,构建质量预测目标函数中的损失函数,并设计为多分类马修斯相关系数的相反数,基于变量选择的质量预测模型为:
Figure FDA0003001586990000021
其中:δmk表示真实质量等级矩阵δn×q的第m行第k列值,δn×q矩阵为质量等级y的One-Hot编码表示;
Figure FDA0003001586990000022
表示预测质量等级矩阵
Figure FDA0003001586990000023
的第m行第k列值,n表示样本总个数,q表示样本类别数;
Figure FDA0003001586990000024
Figure FDA0003001586990000025
分别表示δn×q矩阵和
Figure FDA0003001586990000026
矩阵第k列的均值,且
Figure FDA0003001586990000027
Figure FDA0003001586990000028
I为指示函数,当条件满足时为1,否则为0;αj表示产品质量特征的重要性指标;sn表示关键质量影响因素个数,即模型应包含的变量个数且sn≤p。
3.根据权利要求1所述的基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法,其特征在于,所述步骤S3具体包括以下步骤;
S31、输入层将特征向量传入网络,输入层个数是预测样本中过程因素的个数,基于概率神经网络的质量预测模型接收来自预测样本的过程参数值,采用后向特征选择方法,初始时模型包含所有过程参数,节点数为p,各节点输入值为预测样本x的各个维度上取值;
S32、模式层为径向基层,通过连接权值与输入层连接,计算输入特征向量与训练集中各个模式的匹配程度,将其距离送入核函数得到模式层的输出,基于训练样本,采用高斯核估计方法,估计概率神经网络隐含层至求和层的输入/输出关系,即向量x=[x1,x2,…,xp]T输入到模式层,模式层中第k类模式的第i个神经元节点的输出为:
Figure FDA0003001586990000029
其中:xki表示第k类模式的第i个样本的过程参数向量;n表示训练样本总个数;nk表示yk对应的训练样本总数,
Figure FDA00030015869900000210
σ表示可调整的平滑参数,其值在0到1之间;
S33、求和层将各个类的模式层单元连接起来,第k个节点的输出结果为:
Figure FDA00030015869900000211
S34、输出层将输出求和层中得分最高的质量等级作为最终预测结果,其预测值为:
Figure FDA0003001586990000031
由式(3)~(5)可得预测样本x的预测质量等级为,
Figure FDA0003001586990000032
4.根据权利要求1所述的基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法,其特征在于,所述步骤S4具体包括以下步骤;
S41、在所有过程因素中选取最优因素
Figure FDA00030015869900000310
从质量预测模型中剔除,剔除的因素为:
Figure FDA0003001586990000033
其中:
Figure FDA0003001586990000034
表示元素剔除后估计的协方差相关系数,nt表示预测样本个数;
此时,式(6)中x与xki分别表示预测目标集和训练集中剔除第j个元素后的向量,即
Figure FDA00030015869900000311
S42、重复步骤S41,继续在剩余的过程因素中选取最优因素
Figure FDA00030015869900000312
从质量预测模型中剔除,
Figure FDA0003001586990000035
其中:
Figure FDA0003001586990000036
表示第i次元素剔除后估计的协方差相关系数;
此时,式(6)中x与xki分别表示p-i维向量,即从原始过程因素中剔除了
Figure FDA0003001586990000037
后组成的因素集,即
Figure FDA0003001586990000038
直至剔除p-sn个因素即选出sn个模型因素时停止。
5.根据权利要求1或4所述的基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法,其特征在于,步骤S42的停止条件中所述参数sn即关键过程因素个数是一个常数,一般由特定制造过程的工艺知识和现场经验来确定,在工艺知识不足时,采用F统计量来实现停止条件,在第i步剔除选出的过程因素后,模型中包含p-i个因素,计算
Figure FDA0003001586990000039
随着因素的剔除,协方差相关系数逐渐降低,F统计量逐渐增大,当其超过Fd时,算法停止,此时模型保留的过程因素为关键过程因素。
6.根据权利要求1或者2或者4所述的基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法,其特征在于,所述式(7)对于式(1)中质量预测模型的估计加入约束条件,即增加了模型约束条件——关键质量影响因素个数小于等于sn
7.根据权利要求1或者5所述的基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法,其特征在于,所述Fd采用Boostrap重抽样的方式,由F统计量的分位数估计得到。
8.根据权利要求1或者3所述的基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法,其特征在于,输入层个数是样本中过程因素的个数,求和层节点个数与样本类别数相同,分别对应不同的质量等级。
CN202110348334.8A 2021-03-31 2021-03-31 基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法 Active CN112966449B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110348334.8A CN112966449B (zh) 2021-03-31 2021-03-31 基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110348334.8A CN112966449B (zh) 2021-03-31 2021-03-31 基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法

Publications (2)

Publication Number Publication Date
CN112966449A CN112966449A (zh) 2021-06-15
CN112966449B true CN112966449B (zh) 2022-12-09

Family

ID=76280563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110348334.8A Active CN112966449B (zh) 2021-03-31 2021-03-31 基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法

Country Status (1)

Country Link
CN (1) CN112966449B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015172560A1 (zh) * 2014-05-16 2015-11-19 华南理工大学 基于bp神经网络的中央空调冷负荷的预测方法
CN110738307A (zh) * 2019-09-16 2020-01-31 天津大学 Bp神经网络模型在桃林口水库水质预测中的应用
AU2020101854A4 (en) * 2020-08-17 2020-09-24 China Communications Construction Co., Ltd. A method for predicting concrete durability based on data mining and artificial intelligence algorithm

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015172560A1 (zh) * 2014-05-16 2015-11-19 华南理工大学 基于bp神经网络的中央空调冷负荷的预测方法
CN110738307A (zh) * 2019-09-16 2020-01-31 天津大学 Bp神经网络模型在桃林口水库水质预测中的应用
AU2020101854A4 (en) * 2020-08-17 2020-09-24 China Communications Construction Co., Ltd. A method for predicting concrete durability based on data mining and artificial intelligence algorithm

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于支持向量机和顺序前项选择算法的PNN风电机组液压变桨的故障诊断;王绍平等;《液压气动与密封》;20200415(第04期);全文 *

Also Published As

Publication number Publication date
CN112966449A (zh) 2021-06-15

Similar Documents

Publication Publication Date Title
Lvovich et al. Analysis of integral characteristics in the iot system
CN111222290B (zh) 一种基于多参数特征融合的大型设备剩余使用寿命预测方法
CN107273924B (zh) 基于模糊聚类分析的多数据融合的电厂故障诊断方法
CN110555230B (zh) 基于集成gmdh框架的旋转机械剩余寿命预测方法
CN110757510B (zh) 一种机器人剩余寿命预测方法及系统
CN116448419A (zh) 基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法
CN108510180B (zh) 一种生产设备所处性能区间的计算方法
CN112116198A (zh) 数据驱动的流程工业状态感知网络关键节点筛选方法
CN114330549A (zh) 一种基于深度图网络的化工过程故障诊断方法
CN113935535A (zh) 一种面向中长期预测模型的主成分分析方法
CN111077876A (zh) 一种电站设备状态智能评价和预警方法、装置及系统
CN112241832B (zh) 一种产品质量分级评价标准设计方法及系统
CN112966449B (zh) 基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法
CN117235606A (zh) 特种不锈钢的生产质量管理方法及系统
CN115841184A (zh) 一种基于工序聚类的工时预测方法
CN114800036B (zh) 一种设备健康状态评估方法
CN115018162B (zh) 一种工业精加工过程加工质量实时预测方法和系统
CN111160464B (zh) 基于多隐层加权动态模型的工业高阶动态过程软测量方法
CN115718880A (zh) 一种复杂装备退化阶段的预测方法
CN115985411A (zh) 基于高斯过程回归模型的高分子熔融指数软测量方法
CN112258472B (zh) 一种汽车外造型自动评分方法
CN114154896A (zh) 基于mes的智能工厂产品质量监控方法及系统
Sallehuddin et al. Forecasting small data set using hybrid cooperative feature selection
CN112069621A (zh) 基于线性可靠度指标的滚动轴承剩余使用寿命的预测方法
Liu et al. Performance similarity based method for enhanced prediction of manufacturing process performance

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant