CN111985826A - 一种多指标工业产品的可视化质量分级方法和系统 - Google Patents

一种多指标工业产品的可视化质量分级方法和系统 Download PDF

Info

Publication number
CN111985826A
CN111985826A CN202010868883.3A CN202010868883A CN111985826A CN 111985826 A CN111985826 A CN 111985826A CN 202010868883 A CN202010868883 A CN 202010868883A CN 111985826 A CN111985826 A CN 111985826A
Authority
CN
China
Prior art keywords
index
sample
distribution
data
product
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010868883.3A
Other languages
English (en)
Other versions
CN111985826B (zh
Inventor
郑英
汪培鸣
汪上晓
苏厚胜
王兆静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN202010868883.3A priority Critical patent/CN111985826B/zh
Publication of CN111985826A publication Critical patent/CN111985826A/zh
Application granted granted Critical
Publication of CN111985826B publication Critical patent/CN111985826B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling

Abstract

本发明公开了一种多指标工业产品的可视化质量分级方法和系统,属于工业产品的质量监测领域。本发明采用基于多元统计分析的建模方法,选取多元数据方差较大的方向表征相关性信息,并依此划分主元空间和残差空间,分别构造统计量进行监控,能在测量指标数量较多的情况下,将不同指标间的相关性信息纳入检测范围,针对多指标工业产品能准确有效地制定分级标准并监测产品质量。本发明使用基维亚特图确定分级边界,能保留主要相关性信息,且直观高效,提高了质量监测效率;本发明利用极大似然估计法提取了各个指标的分布特征,并依据分布特征产生大量随机采样,避免了历史数据数目较少的情况下,可能造成的质量分级范围缺失,也确保了分级的准确性。

Description

一种多指标工业产品的可视化质量分级方法和系统
技术领域
本发明属于工业产品的质量监测领域,更具体地,涉及一种多指标工业产品的可视化质量分级方法和系统。
背景技术
现代工业系统趋于复杂化、精细化,其产品的质量可能对经济效益造成直接影响。基于用户需求和实际特性,一件产品的质量往往需要通过多个指标共同反映,合理结合多个检测指标、准确直观地对产品进行质量分级具有重要的意义。
目前广泛使用的质量分级方法主要是基于单变量监控的一类方法,这类方法针对不同指标分别制定了等级界限。在实际应用中,可能存在多个指标互相关联,即指标间具有相关性的情况,此时应用上述方法可能导致一定程度的误判,同时影响分级界限的合理性。此外,为了构建科学、均衡的分级边界,测量指标本身的分布特征也应当作为质量分级的重要参考。在检测指标数量较多时,分级、核验步骤的直观性也会随之下降,关于质量的趋势信息也将难以提取。
综上所述,现有的质量分级方法没有考虑各个指标之间的相关性,没有考虑到各个指标数据本身的分布特征,同时没有充分整合各个指标所反映的质量信息,因而存在准确度不足、不够直观的问题。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种多指标工业产品的可视化质量分级方法和系统,其目的在于解决现有单变量方法由于未考虑指标相关性和分布特征,造成分级边界不合理以及准确度不足;由于需要分别监控各个指标,在检测指标数量较多时,存在不够直观的问题。
为实现上述目的,按照本发明的一个方面,提供了一种多指标工业产品的可视化质量分级方法,包括:
S1.采集合格产品的全部测量指标数据X0∈RM×N,作为训练样本;其中,M为样本个数,N为测量指标个数;
S2.对X0中的各个测量指标进行处理得到X,使X中各指标数值分别与质量正相关;
S3.基于主成分分析法对得到的X建立多元监控统计模型;
S4.对所有测量指标分别采用正态分布、韦布尔分布和指数分布进行拟合,并用分位数图示法检验拟合效果,选取拟合效果最优的分布方式用于反映各个测量指标的分布特征;
S5.利用选取得到的分布拟合结果,对每个指标随机产生设定数量的采样,取每个指标数值均大于上α分位点的采样,组成α值对应等级产品的初步模拟测量指标数据
Figure BDA0002649605720000021
其中,I为所生成的对应等级产品的样本数量,α为表征产品质量等级的百分比;
S6.对
Figure BDA0002649605720000022
进行预处理并利用多元监控统计模型进行测试,记录通过测试的样本为
Figure BDA0002649605720000023
其中,G为通过测试的样本数量;
S7.利用基维亚特图绘制
Figure BDA0002649605720000024
中的样本;
S8.用椭圆方程拟合样本重心簇外围的点,所求椭圆即为当前等级产品的置信区间边界范围;
S9.改变步骤S5中的α,重复执行步骤S6-S8,分别确定不同等级产品的边界范围;
S10.对于待测试的样本,依次进行步骤S2和步骤S6中的预处理,根据步骤S7绘制待测样本并求取样本重心,根据样本重心所处的边界范围,确定当前测试样本对应质量等级。
进一步地,步骤S2具体包括:
S2.1.对于数值越大表征产品质量越好的指标,不做处理;
S2.2.对于数值越小表征产品质量越好的指标,对相应数值取相反数;
S2.3.对于越接近固定值
Figure BDA0002649605720000031
表征产品质量越好的指标,采取设定的正态分布的概率密度值
Figure BDA0002649605720000032
代替原值;其中,x表示原数据,
Figure BDA0002649605720000033
表示变换后的数据,σ取原始数据的样本标准差。
进一步地,步骤S3具体包括:
S3.1.记X的每一行为xm,X的每一列为vn,对X进行标准化处理,得到
Figure BDA0002649605720000034
Figure BDA0002649605720000035
Figure BDA0002649605720000036
S3.2.对样本的协方差矩阵进行特征值分解:
Figure BDA0002649605720000037
其中,
Figure BDA0002649605720000038
为标准化处理后的数据,Λ=diag{λ1,λ2,...,λN}为特征值矩阵,且λ1≥λ2≥…≥λN,矩阵P的每一列为对应的特征向量;
S3.3.确定主元个数k使得累计方差百分比
Figure BDA0002649605720000039
高于90%;
S3.4.计算主元控制限和残差控制限,得到由主元控制限和残差控制限表征的多元监控统计模型;
其中,主元控制限计算公式为:
Figure BDA00026496057200000310
式中,Fk,N-k;α对应于自由度为k,N-k,置信水平为α的F分布临界值;残差控制限计算公式为:
Figure BDA00026496057200000311
Cα表示置信水平为α的标准正态分布的临界值,
Figure BDA00026496057200000312
进一步地,步骤S4具体包括:
S4.1.对第n个指标的全部采集数据Xn(x1n,x2n,...,xMn)利用极大似然法分别估计其在正态分布、韦布尔分布和指数分布下的参数;
Figure BDA0002649605720000041
其中,p(xmn,θ)表示分布参数为θ的分布中xmn处的概率密度;
S4.2.将估计得到的分布参数代入对应分布后获得分布函数
Figure BDA0002649605720000042
S4.3.将同一指标的原采集数据从小到大排列,计算每个数据在其中的分位数
Figure BDA0002649605720000043
并求取每个数据对应的理论分位点
Figure BDA0002649605720000044
其中r表示排序后的序号;
S4.4.将所有数据的分位数作为纵坐标,对应理论分位点作为横坐标,在二维平面上绘制散点图,在所述散点图上连接四分之一位点和四分之三位点的直线,选取散点最接近该直线的分布方式用于反映各个测量指标的分布特征。
进一步地,步骤S6具体包括:
S6.1.记
Figure BDA0002649605720000045
的元素为xin,对
Figure BDA0002649605720000046
内的所有数据进行预处理:
Figure BDA0002649605720000047
其中,i=1,2,...,I;n=1,2,...,N;
S6.2.计算主元统计量:
Figure BDA0002649605720000048
其中,
Figure BDA0002649605720000049
Figure BDA00026496057200000410
表示
Figure BDA00026496057200000411
Figure BDA00026496057200000412
所组成的向量,
Figure BDA00026496057200000413
S6.3.计算残差统计量:
Figure BDA00026496057200000414
其中,
Figure BDA00026496057200000415
为对应λ1≥λ2≥…≥λk的负载矩阵;E表示单位矩阵;
S6.4.对比主元统计量与主元控制限,残差统计量与残差控制限,在
Figure BDA00026496057200000416
中选取能使两个统计量都小于对应控制限的样本,组成
Figure BDA00026496057200000417
进一步地,步骤S7具体包括:
S7.1.在二维平面中构建基维亚特图坐标系,其中,第n个指标以一条从原点出发,角度为
Figure BDA0002649605720000051
的射线为轴表示;n=1,2,...,N;
S7.2.
Figure BDA0002649605720000052
中第p个样本的第n个指标应表示在对应坐标轴上距离原点
Figure BDA0002649605720000053
处;p=1,2,...,G;
S7.3.依序连接同一个样本中,代表不同指标数值的点,得到的多边形即为该样本的基维亚特图表示。
进一步地,步骤S8具体包括:
S8.1.计算第p个样本重心的局部密度ρp=∑qF′(dpq-dc),其中F′(x)为分段函数,当括号内的部分小于0时函数值为1,否则为0;dpq为第p个样本重心与第q个样本重心之间的欧式距离;q=1,2,...,G,p≠q;dc为设定阈值;
S8.2.将所有样本重心的ρ值从小到大排序,选取序号在设定范围内的样本重心作为重心簇外围的点,记录上述点的二维直角坐标S(x,y);
S8.3.用椭圆方程Ax2+Bxy+Cy2+Dx+Ey+F=0拟合重心簇外围,将S(x,y)代入U=[x2,xy,y2,x,y,1]T后,有UUTW=λHW,其中,W=[A,B,C,D,E,F]T,
Figure BDA0002649605720000054
将λ视为特征值,求解UUT的广义特征向量即可获取多种W的解,选取其中满足WTHW=1的解,即为椭圆方程的参数。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果。
(1)本发明采用基于多元统计分析的建模方法,选取多元数据方差较大的方向表征相关性信息,并依此划分主元空间和残差空间,分别构造统计量进行监控,能在测量指标数量较多的情况下,将不同指标间的相关性信息同样纳入检测范围,因此针对多指标工业产品能准确有效地制定分级标准并监测产品质量。
(2)本发明使用基维亚特图确定分级边界,以实现可视化需求,基维亚特图能在保留主要相关性信息的同时,兼具直观高效的优点,提高了多指标工业产品的质量监测效率;由于各指标数据与质量方向的相关性并不统一,同时存在量纲差异,因此本发明同时提出了一种对数据进行预处理的策略,以拓展基维亚特图对工业数据的泛用性。
(3)本发明利用极大似然估计法,结合工业实例中的常见分布,对各个指标进行参数估计,提取了各个指标的分布特征,并依据分布特征产生大量随机采样,避免了历史数据数目较少的情况下,可能造成的质量分级范围缺失,也确保了分级的准确性。
附图说明
图1是本发明实施例提供的一种多指标工业产品的可视化质量分级方法的流程图;
图2是本发明实施例提供的最大电压指标的频数分布直方图与拟合韦布尔分布的概率密度函数;
图3是本发明实施例提供的光谱半高宽指标对拟合正态分布的分位数图示法检验结果;
图4是本发明实施例提供的主成分分析对历史样本和模拟样本的监控图;
图5是本发明实施例提供的部分模拟样本的基维亚特图表示;
图6(a)是本例选取的一等品样本重心簇外围点;
图6(b)表示一等品样本重心簇置信边界的椭圆拟合结果;
图7是采用本发明方法对实际工业产品样本进行质量分级的结果。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
如图1所示,本发明提供了一种多指标工业产品的可视化质量分级方法,包括:
S1.采集合格产品的全部测量指标数据X0∈RM×N,作为训练样本;其中,M为样本个数,N为测量指标个数;
S2.对X0中的各个测量指标进行处理得到X,使各指标数值分别与质量正相关;
经过步骤S2的处理和后续标准化处理,在数据可视化时,样本将能够聚集在视图中心,并依照质量等级呈现出有规律的分布。
步骤S2具体包括:S2.1.对于数值越大表征产品质量越好的指标,不做处理;S2.2.对于数值越小表征产品质量越好的指标,对相应数值取相反数;S2.3.对于越接近固定值
Figure BDA0002649605720000071
表征产品质量越好的指标,采取设定的正态分布的概率密度值
Figure BDA0002649605720000072
代替原值;其中,x表示原数据,
Figure BDA0002649605720000073
表示变换后的数据,σ取原始数据的样本标准差。
S3.基于主成分分析法对得到的X建立多元监控统计模型;
步骤S3具体包括:
S3.1.记X的每一行为xi,X的每一列为vj,对X进行标准化处理,得到
Figure BDA0002649605720000074
Figure BDA0002649605720000075
其中,m=1,2,...,M;n=1,2,...,N,
Figure BDA0002649605720000076
Figure BDA0002649605720000077
S3.2.求取样本
Figure BDA0002649605720000078
的协方差矩阵并进行特征值分解:
Figure BDA0002649605720000081
其中,
Figure BDA0002649605720000082
为标准化处理后的数据,Λ=diaf{λ1,λ2,...,λN}为特征值矩阵,且λ1≥λ2≥…≥λN,矩阵P的每一列为对应的特征向量;
S3.3.确定主元个数k使得累计方差百分比
Figure BDA0002649605720000083
高于90%;
S3.4.计算主元控制限和残差控制限,得到由主元控制限和残差控制限表征的多元监控统计模型;
其中,主元控制限计算公式:
Figure BDA0002649605720000084
式中,Fk,N-k;α对应于自由度为k,N-k,置信水平为α的F分布临界值;残差控制限计算公式:
Figure BDA0002649605720000085
式中,Cα表示置信水平为α的标准正态分布的临界值,
Figure BDA0002649605720000086
通过S3.2对样本的协方差矩阵进行特征值分解,能够选出多元数据中方差较大的方向,这些方向能够表征指标间最主要的相关性信息,S3.3依照累计方差百分比划分出主元空间和残差空间,S3.4对两个空间分别构造统计量进行监控。其中,主元控制限可以视为对多元数据主要相关性信息的监控阈值,而残差控制限则可以视为对多元数据剩余信息的监控阈值。通过对两个空间的分别监控,能在测量指标数量较多并且指标间具有相关性的情况下,形成更加准确的产品质量评价标准。
S4.对所有测量指标分别采用正态分布、韦布尔分布和指数分布进行拟合,并用分位数图示法检验拟合效果,选取拟合效果最优的分布方式用于反映各个测量指标的分布特征;
根据实际工程应用的经验,几乎所有质量指标的数据均能通过正态分布、韦布尔分布和指数分布三种分布中的某一种进行分布拟合,选取这三种分布能以较小计算量的代价取得最好的拟合效果,因此本发明对所有测量指标均进行基于上述三种分布的参数估计,并结合后续步骤选取最优分布以描述指标的分布特征。
步骤S4具体包括:
S4.1.对第n个指标的全部采集数据Xn(x1n,x2n,...,xMn)利用极大似然法分别估计其在正态分布、韦布尔分布和指数分布下的参数;
记分布参数为θ的分布中xmn处的概率密度为p(xmn,θ),则有似然函数
Figure BDA0002649605720000091
取似然函数的对数,求取对数关于θ的偏导并令偏导等于0:
Figure BDA0002649605720000092
解出上式的θ即为分布参数的极大似然估计。
S4.2.将估计得到的分布参数代入对应分布后获得分布函数
Figure BDA0002649605720000093
S4.3.将同一指标的原采集数据从小到大排列,计算每个数据在其中的分位数
Figure BDA0002649605720000094
并求取每个数据对应的理论分位点
Figure BDA0002649605720000095
其中r表示排序后的序号;
S4.4.将所有数据的分位数作为纵坐标,对应理论分位点作为横坐标,在二维平面上绘制散点图,在所述散点图上连接四分之一位点和四分之三位点的直线,选取散点最接近该直线的分布方式用于反映各个测量指标的分布特征。
S5.利用选取得到的分布拟合结果,对每个指标随机产生设定数量的采样,取每个指标数值均大于上α分位点的采样,组成α值对应等级产品的初步模拟测量指标数据
Figure BDA0002649605720000096
其中,I为所生成的对应等级产品的样本数量,α为表征产品质量等级的百分比;
本发明实施例中,一二三等品的α值分别选取为15%,35%,70%。以一等品为例,依据分布拟合结果,应对所有指标分别产生尽可能多的采样,并组合所有指标形成若干样本,随后取每个指标数值均位于相应分布前15%的样本作为本步骤所生成的一等品样本。
S6.对
Figure BDA0002649605720000101
进行预处理并利用多元监控统计模型进行测试,记录通过测试的样本为
Figure BDA0002649605720000102
其中,G为通过测试的样本数量;
步骤S6具体包括:
Figure BDA0002649605720000103
的元素为xin,对
Figure BDA0002649605720000104
内的所有数据进行预处理:
Figure BDA0002649605720000105
其中,i=1,2,...,I;n=1,2,...,N;
经过预处理,所有指标均依照与步骤S3.1相同的标准消除了量纲差异,并实现了中心化。
S6.2.计算主元统计量:
Figure BDA0002649605720000106
其中,
Figure BDA0002649605720000107
Figure BDA0002649605720000108
表示
Figure BDA0002649605720000109
所组成的向量,
Figure BDA00026496057200001010
S6.3.计算残差统计量:
Figure BDA00026496057200001011
其中,
Figure BDA00026496057200001012
为对应λ1≥λ2≥…≥λk的负载矩阵;E表示单位矩阵;
S6.4.对比主元统计量与主元控制限,残差统计量与残差控制限,在
Figure BDA00026496057200001013
中选取能使两个统计量都小于对应控制限的样本,组成
Figure BDA00026496057200001014
其中,主元统计量是样本主要相关性信息的反映,而残差统计量则是样本偏离主要相关性方向的距离,能够反映样本的剩余信息。
S7.利用基维亚特图绘制
Figure BDA00026496057200001015
中的样本;
基维亚特图是一种使用多根从同一原点出发的等角度间隔射线对多元数据进行可视化的图形方法。为了使基维亚特图适用于工业数据,本发明在前面的步骤中对样本采取了一系列数据预处理措施,使得样本的各个指标能均衡地反映在基维亚特图的中心部分。样本在基维亚特图上的重心能够构成一片二维区间,比起传统的一维监控阈值,二维平面闭合曲线形成的闭合域能够反映更多信息,数据具有相关性的主要方向投影到二维平面后,也能通过闭合区域的轴线得以反映,因此通过基维亚特图进行可视化能够达到比传统监控图更加直观准确的效果。
步骤S7具体包括:
S7.1.在二维平面中构建基维亚特图坐标系,其中,第n个指标以一条从原点出发,角度为
Figure BDA0002649605720000111
的射线为轴表示;(n=1,2,...,N);
S7.2.
Figure BDA0002649605720000112
中第p个样本的第n个指标应表示在对应坐标轴上距离原点
Figure BDA0002649605720000113
处;p=1,2,...,G;
S7.3.依序连接同一个样本中,代表不同指标数值的点,得到的多边形即为该样本的基维亚特图表示。
S8.用椭圆方程拟合样本重心簇外围的点,所求椭圆即为当前等级产品的置信区间边界范围;
步骤S8具体包括:
S8.1.计算第p个样本重心的局部密度ρp=∑qF′(dpq-dc),其中F′(x)为分段函数,当括号内的部分小于0时函数值为1,否则为0;dpq为第p个样本重心与第q个样本重心之间的欧式距离p=1,2,...,G,q=1,2,...,G,p≠q;dc为设定阈值;
S8.2.将所有样本重心的ρ值从小到大排序,选取序号在设定范围内的样本重心作为重心簇外围的点,记录上述点的二维直角坐标S(x,y);
S8.3.用椭圆方程Ax2+Bxy+Cy2+Dx+Ey+F=0拟合重心簇外围,将S(x,y)代入U=[x2,xy,y2,x,y,1]T后,有UUTW=λHW,其中,W=[A,B,C,D,E,F]T
Figure BDA0002649605720000114
将λ视为特征值,求解UUT的广义特征向量即可获取多种W的解,选取其中满足WTHW=1的解,即为椭圆方程的参数。
与一般的椭圆拟合方法相比,本发明基于密度原理划定了椭圆边界,并利用最小二乘原理确定椭圆参数。这样的好处是能够排除小概率事件所产生的少量样本重心对于椭圆整体形状的影响,也不要求所有边界点都在椭圆内侧,减小了对边界点精确度的依赖,因而能在一定置信度下确定准确的边界范围。
S9.改变步骤S5中的α,重复执行步骤S6-S8,分别确定不同等级产品的边界范围;其中,α的取值范围是0<α<100%。
S10.对于待测试的样本,依次进行步骤S2和步骤S6中的预处理,根据步骤S7绘制待测样本并求取样本重心,根据样本重心所处的边界范围,确定当前测试样本对应质量等级。
本发明实施例通过某半导体企业的实际产品数据对本发明提供的质量分级方法进行验证。该半导体产品为光学半导体器件,总共涉及五个主要质量测量指标。本次验证利使用了390个合格产品样本进行离线建模。对5个指标分别进行各类分布的拟合并用极大似然估计分布参数,其中用韦布尔分布拟合指标A指标的结果如图2所示。在图中标注的参数条件下,曲线所代表的概率密度分布与频数直方图形状契合度较高,拟合效果较好。为直观对各类分布拟合进行择优,使用分位数图示法进行验证。图3是验证正态分布是否能拟合指标B指标数据的一个实例,观测图形可知,数据点集中于直线附近,因此可以使用该正态分布描述指标B的数据特征。在后面的步骤中,也可以直接利用正态分布对指标B指标产生特定等级的模拟数据。本例结合实际需求,将各指标均满足前15%,前35%,前70%的条件分别作为一二三等品的最低标准,也就是说,对于一等品,随机产生大量模拟样本时将取相应指标上15%分位点以上的数据组成初步样本。
图4是使用主成分分析的主元监控图对模拟样本进行筛选的结果,其中,前427个样本为实际产品样本,后1800个数据为模拟样本。在筛选过程中,为确保模拟样本的各指标与合格产品具有一致相关性,本例选择了99%置信度的控制限,主元统计量结果低于该控制限的模拟样本,才能被选为最终模拟样本,进入下个步骤。图5是最终模拟样本的基维亚特图表示,图上每一个五边形都分别代表一个模拟样本,五边形的每一个顶点都表征了样本在相应轴所代表指标上的表现,中心的点簇即为样本重心簇。选取一等品的最终模拟样本,根据密度原理选取重心簇的外围点,结果如图6(a)所示。用椭圆对外围点进行拟合,获得一个一等品在基维亚特图上的重心置信区间,将椭圆边界与一等品样本进行对比,结果如图6(b)所示。(图6(a)(b)和图7中的横纵轴构成二维直角坐标系,其数值仅反映重心的相对位置,不具有实际意义)。
对一二三等品的样本在基维亚特图上的重心分别建立椭圆置信区域,所得区域边界如图7中三个椭圆所示。对427个含有等级标记的实际样本进行验证,经过质量方向的关联和数据预处理后,画出它们在基维亚特图上的重心(图中不同标记表示不同质量等级的样本重心),其中等级标记为企业方面根据工程经验给出。从图7可以看到,本方法划定的一二三等品边界范围内的产品样本,基本上具有相应的实际质量等级,结果基本符合预期。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种多指标工业产品的可视化质量分级方法,其特征在于,包括:
S1.采集合格产品的全部测量指标数据X0∈RM×N,作为训练样本;其中,M为样本个数,N为测量指标个数;
S2.对X0中的各个测量指标进行处理得到X,使X中各指标数值分别与质量正相关;
S3.基于主成分分析法对得到的X建立多元监控统计模型;
S4.对所有测量指标分别采用正态分布、韦布尔分布和指数分布进行拟合,并用分位数图示法检验拟合效果,选取拟合效果最优的分布方式用于反映各个测量指标的分布特征;
S5.利用选取得到的分布拟合结果,对每个指标随机产生设定数量的采样,取每个指标数值均大于上α分位点的采样,组成α值对应等级产品的初步模拟测量指标数据
Figure FDA0002649605710000011
其中,I为所生成的对应等级产品的样本数量,α为表征产品质量等级的百分比;
S6.对
Figure FDA0002649605710000012
进行预处理并利用多元监控统计模型进行测试,记录通过测试的样本为
Figure FDA0002649605710000013
其中,G为通过测试的样本数量;
S7.利用基维亚特图绘制
Figure FDA0002649605710000014
中的样本;
S8.用椭圆方程拟合样本重心簇外围的点,所求椭圆即为当前等级产品的置信区间边界范围;
S9.改变步骤S5中的α,重复执行步骤S6-S8,分别确定不同等级产品的边界范围;
S10.对于待测试的样本,依次进行步骤S2和步骤S6中的预处理,根据步骤S7绘制待测样本并求取样本重心,根据样本重心所处的边界范围,确定当前测试样本对应质量等级。
2.根据权利要求1所述的一种多指标工业产品的可视化质量分级方法,其特征在于,步骤S2具体包括:
S2.1.对于数值越大表征产品质量越好的指标,不做处理;
S2.2.对于数值越小表征产品质量越好的指标,对相应数值取相反数;
S2.3.对于越接近固定值
Figure FDA0002649605710000021
表征产品质量越好的指标,采取设定的正态分布的概率密度值
Figure FDA0002649605710000022
代替原值;其中,x表示原数据,
Figure FDA0002649605710000023
表示变换后的数据,σ取原始数据的样本标准差。
3.根据权利要求1或2所述的一种多指标工业产品的可视化质量分级方法,其特征在于,步骤S3具体包括:
S3.1.记X的每一行为xm,X的每一列为vn,对X进行标准化处理,得到
Figure FDA0002649605710000024
Figure FDA0002649605710000025
m=1,2,...,M;n=1,2,...,N,
Figure FDA0002649605710000026
S3.2.求取样本
Figure FDA0002649605710000027
的协方差矩阵并进行特征值分解:
Figure FDA0002649605710000028
其中,
Figure FDA0002649605710000029
为标准化处理后的数据,Λ=diag{λ1,λ2,...,λN}为特征值矩阵,且λ1≥λ2≥…≥λN,矩阵P的每一列为对应的特征向量;
S3.3.确定主元个数k使得累计方差百分比
Figure FDA00026496057100000210
高于90%;
S3.4.计算主元控制限和残差控制限,得到由主元控制限和残差控制限表征的多元监控统计模型;
其中,主元控制限计算公式为:
Figure FDA00026496057100000211
式中,Fk,N-k;α对应于自由度为k,N-k,置信水平为α的F分布临界值;残差控制限计算公式为:
Figure FDA00026496057100000212
Cα表示置信水平为α的标准正态分布的临界值,
Figure FDA0002649605710000031
4.根据权利要求1-3任一项所述的一种多指标工业产品的可视化质量分级方法,其特征在于,步骤S4具体包括:
S4.1.对第n个指标的全部采集数据Xn(x1n,x2n,...,xMn)利用极大似然法分别估计其在正态分布、韦布尔分布和指数分布下的参数;
Figure FDA0002649605710000032
其中,p(xmn,θ)表示分布参数为θ的分布中xmn处的概率密度;
S4.2.将估计得到的分布参数代入对应分布后获得分布函数
Figure FDA0002649605710000033
S4.3.将同一指标的原采集数据从小到大排列,计算每个数据在其中的分位数
Figure FDA0002649605710000034
并求取每个数据对应的理论分位点
Figure FDA0002649605710000035
其中r表示排序后的序号;
S4.4.将所有数据的分位数作为纵坐标,对应理论分位点作为横坐标,在二维平面上绘制散点图,在所述散点图上连接四分之一位点和四分之三位点的直线,选取散点最接近该直线的分布方式用于反映各个测量指标的分布特征。
5.根据权利要求1-4任一项所述的一种多指标工业产品的可视化质量分级方法,其特征在于,步骤S6具体包括:
S6.1.记
Figure FDA0002649605710000036
的元素为xin,对
Figure FDA0002649605710000037
内的所有数据进行预处理:
Figure FDA0002649605710000038
其中,i=1,2,...,I;n=1,2,...,N;
S6.2.计算主元统计量:
Figure FDA0002649605710000039
其中,
Figure FDA00026496057100000310
Figure FDA00026496057100000311
表示
Figure FDA00026496057100000312
Figure FDA00026496057100000313
所组成的向量,
Figure FDA00026496057100000314
S6.3.计算残差统计量:
Figure FDA00026496057100000315
其中,
Figure FDA00026496057100000316
为对应λ1≥λ2≥…≥λk的负载矩阵;E表示单位矩阵;
S6.4.对比主元统计量与主元控制限,残差统计量与残差控制限,在
Figure FDA0002649605710000047
中选取能使两个统计量都小于对应控制限的样本,组成
Figure FDA0002649605710000041
6.根据权利要求1-5任一项所述的一种多指标工业产品的可视化质量分级方法,其特征在于,步骤S7具体包括:
S7.1.在二维平面中构建基维亚特图坐标系,其中,第n个指标以一条从原点出发,角度为
Figure FDA0002649605710000042
的射线为轴表示;n=1,2,...,N;
S7.2.
Figure FDA0002649605710000043
中第p个样本的第n个指标应表示在对应坐标轴上距离原点
Figure FDA0002649605710000044
处;p=1,2,...,G;
S7.3.依序连接同一个样本中,代表不同指标数值的点,得到的多边形即为该样本的基维亚特图表示。
7.根据权利要求6所述的一种多指标工业产品的可视化质量分级方法,其特征在于,步骤S8具体包括:
S8.1.计算第p个样本重心的局部密度ρp=∑qF′(dpq-dc)其中F′(x)为分段函数,当括号内的部分小于0时函数值为1,否则为0;dpq为第p个样本重心与第q个样本重心之间的欧式距离;q=1,2,...,G,p≠q;dc为设定阈值;
S8.2.将所有样本重心的ρ值从小到大排序,选取序号在设定范围内的样本重心作为重心簇外围的点,记录上述点的二维直角坐标S(x,y);
S8.3.用椭圆方程Ax2+Bxy+Cy2+Dx+Ey+F=0拟合重心簇外围,将S(x,y)代入U=[x2,xy,y2,x,y,1]T后,有UUTW=λHW,其中,W=[A,B,C,D,E,F]T
Figure FDA0002649605710000046
将λ视为特征值,求解UUT的广义特征向量即可获取多种W的解,选取其中满足WTHW=1的解,即为椭圆方程的参数。
8.一种多指标工业产品的可视化质量分级系统,其特征在于,包括:计算机可读存储介质和处理器;
所述计算机可读存储介质用于存储可执行指令;所述处理器用于读取所述计算机可读存储介质中存储的可执行指令,执行权利要求1至7任一项所述的多指标工业产品的可视化质量分级方法。
CN202010868883.3A 2020-08-25 2020-08-25 一种多指标工业产品的可视化质量分级方法和系统 Active CN111985826B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010868883.3A CN111985826B (zh) 2020-08-25 2020-08-25 一种多指标工业产品的可视化质量分级方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010868883.3A CN111985826B (zh) 2020-08-25 2020-08-25 一种多指标工业产品的可视化质量分级方法和系统

Publications (2)

Publication Number Publication Date
CN111985826A true CN111985826A (zh) 2020-11-24
CN111985826B CN111985826B (zh) 2024-03-19

Family

ID=73443294

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010868883.3A Active CN111985826B (zh) 2020-08-25 2020-08-25 一种多指标工业产品的可视化质量分级方法和系统

Country Status (1)

Country Link
CN (1) CN111985826B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113298126A (zh) * 2021-05-12 2021-08-24 浙江大学 一种半导体功率芯片的批量分类方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512466A (zh) * 2015-11-30 2016-04-20 华北电力大学 基于极值理论的电网工程实施阶段风险预警方法
CN107272667A (zh) * 2017-08-07 2017-10-20 华中科技大学 一种基于平行的偏最小二乘法的工业过程故障检测方法
CN108762228A (zh) * 2018-05-25 2018-11-06 江南大学 一种基于分布式pca的多工况故障监测方法
CN109062196A (zh) * 2018-10-31 2018-12-21 东北大学 一种集成pca-ica的高炉过程监测及故障诊断方法
CN109739214A (zh) * 2019-01-14 2019-05-10 中国石油大学(华东) 工业过程间歇故障的检测方法
CN109947076A (zh) * 2019-03-14 2019-06-28 华中科技大学 一种基于贝叶斯信息准则的工业过程故障诊断方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512466A (zh) * 2015-11-30 2016-04-20 华北电力大学 基于极值理论的电网工程实施阶段风险预警方法
CN107272667A (zh) * 2017-08-07 2017-10-20 华中科技大学 一种基于平行的偏最小二乘法的工业过程故障检测方法
CN108762228A (zh) * 2018-05-25 2018-11-06 江南大学 一种基于分布式pca的多工况故障监测方法
CN109062196A (zh) * 2018-10-31 2018-12-21 东北大学 一种集成pca-ica的高炉过程监测及故障诊断方法
CN109739214A (zh) * 2019-01-14 2019-05-10 中国石油大学(华东) 工业过程间歇故障的检测方法
CN109947076A (zh) * 2019-03-14 2019-06-28 华中科技大学 一种基于贝叶斯信息准则的工业过程故障诊断方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
易当祥;张仕念;张国彬;刘春和;: "最佳失效分布模型的模糊综合评判研究", 质量与可靠性, no. 06, 15 December 2014 (2014-12-15) *
肖应旺;黄业安;杨军;张承忠;杜瑛;: "基于故障子空间与PCA监测模型的故障可检测性研究", 计算机与应用化学, no. 11, 28 November 2014 (2014-11-28) *
韦洁;张和生;贾利民;: "面向状态监测的改进主元分析方法", 电子测量与仪器学报, no. 07, 15 July 2009 (2009-07-15) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113298126A (zh) * 2021-05-12 2021-08-24 浙江大学 一种半导体功率芯片的批量分类方法

Also Published As

Publication number Publication date
CN111985826B (zh) 2024-03-19

Similar Documents

Publication Publication Date Title
Choi et al. Morphological analysis and classification of types of surface corrosion damage by digital image processing
CN108764676B (zh) 一种高维多目标评价方法及系统
White et al. Methodological tools
CN111338972A (zh) 基于机器学习的软件缺陷与复杂度关联关系分析方法
CN113298162A (zh) 一种基于K-means算法的桥梁健康监测方法及系统
CN114266289A (zh) 一种复杂装备健康状态评估方法
CN107016416B (zh) 基于邻域粗糙集和pca融合的数据分类预测方法
CN110221590B (zh) 一种基于判别分析的工业过程多故障诊断方法
CN111985826A (zh) 一种多指标工业产品的可视化质量分级方法和系统
CN116909901B (zh) 基于富样本径向投影可信聚类的软件性能可视评价方法
Shao et al. Engineering fusion spatial modeling to enable areal measurement system analysis for optical surface metrology
CN116433333B (zh) 基于机器学习的数字商品交易风险防控方法及装置
US20200166497A1 (en) Analysis apparatus, stratum age estimation apparatus, analysis method, stratum age estimation method, and program
CN115752243A (zh) 一种测量数据融合方法
Vidaurre et al. A quick assessment of topology preservation for SOM structures
Häggblom Basics of Multivariate Modelling and Data Analysis
Олійник et al. Automated system for identification of data distribution laws by analysis of histogram proximity with sample reduction
Alipourjeddi et al. Evaluating Generative Adversarial Networks: A Topological Approach
CN115902814B (zh) 基于信息空间度量的目标识别模型性能评估方法和装置
Ling et al. Usage Space Sampling for Fringe Customer Identification.
CN110490216A (zh) 一种自学式数据分类系统和方法
CN117649157B (zh) 基于视线追踪的仪表判别能力评估方法
CN117076293B (zh) 基于贫样本层次可信聚类热力图的软件性能可视评价方法
CN116702521B (zh) 一种自动驾驶场景一致性对比方法、装置及电子设备
CN111507639B (zh) 理财风险分析方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant