CN112446597A - 贮箱质量评估方法、系统、存储介质、计算机设备及应用 - Google Patents
贮箱质量评估方法、系统、存储介质、计算机设备及应用 Download PDFInfo
- Publication number
- CN112446597A CN112446597A CN202011272825.0A CN202011272825A CN112446597A CN 112446597 A CN112446597 A CN 112446597A CN 202011272825 A CN202011272825 A CN 202011272825A CN 112446597 A CN112446597 A CN 112446597A
- Authority
- CN
- China
- Prior art keywords
- data
- feature
- importance
- storage box
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 146
- 238000003860 storage Methods 0.000 title claims abstract description 118
- 238000013441 quality evaluation Methods 0.000 title claims abstract description 46
- 238000004519 manufacturing process Methods 0.000 claims abstract description 115
- 230000008569 process Effects 0.000 claims abstract description 51
- 230000004927 fusion Effects 0.000 claims abstract description 18
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 238000012545 processing Methods 0.000 claims description 58
- 230000006870 function Effects 0.000 claims description 32
- 239000013598 vector Substances 0.000 claims description 31
- 238000011156 evaluation Methods 0.000 claims description 30
- 238000004422 calculation algorithm Methods 0.000 claims description 24
- 238000001514 detection method Methods 0.000 claims description 23
- 238000007637 random forest analysis Methods 0.000 claims description 19
- 238000003801 milling Methods 0.000 claims description 18
- 238000010438 heat treatment Methods 0.000 claims description 17
- 230000002159 abnormal effect Effects 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000004458 analytical method Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 10
- 238000012937 correction Methods 0.000 claims description 10
- 238000007493 shaping process Methods 0.000 claims description 10
- 238000001303 quality assessment method Methods 0.000 claims description 9
- 238000005259 measurement Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 230000007613 environmental effect Effects 0.000 claims description 3
- 239000000047 product Substances 0.000 description 49
- 238000010276 construction Methods 0.000 description 14
- 238000004321 preservation Methods 0.000 description 8
- 238000003825 pressing Methods 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000003064 k means clustering Methods 0.000 description 4
- 239000002184 metal Substances 0.000 description 4
- 238000010791 quenching Methods 0.000 description 4
- 230000000171 quenching effect Effects 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000013210 evaluation model Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 238000009966 trimming Methods 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003754 machining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于自动化控制技术领域,公开了一种贮箱质量评估方法、系统、存储介质、计算机设备及应用,获取贮箱生产过程数据集:根据生产流程,对贮箱采集的装配与检测过程中各数据进行采集,得到贮箱原始数据集;判断贮箱原始数据集中数据类型,根据数据类型不同,将数据分为时序数据部分和宽表数据部分;全生产周期数据的数据预处理与特征重构;特征权重提取:输入数据,基于树模型和经验知识,进行特征重要度分析,得到特征重要度;对重要度值使用softmax函数进行输出,得到融合特征权重;对贮箱进行质量评估。本发明对聚类中心使用加权最小二乘,得出类别标签,保证特征在数据聚类与评级中具有不同的影响程度,给出了更为精准的贮箱质量评估模型。
Description
技术领域
本发明属于自动化控制技术领域,尤其涉及一种贮箱质量评估方法、系统、存储介质、计算机设备及应用。
背景技术
目前:火箭贮箱是火箭箭体的重要组成部分,其生产质量直接影响火箭制造质量及其服役性能。火箭贮箱箱底加工流程为下料、冲压、热处理、切边、校形、镜像铣、整形、性能检测等,工序较多且产生的数据形式不同,每道工序都会对最终产品检测性能产生影响。然而,目前对于贮箱产品进行质量评估,仅仅通过产品检测质量进行判定,并未考虑加工过程质量对产品最终使用的影响,对产品质量评估并不全面。因此,需要结合贮箱箱底加工过程质量和产品检测质量,对产品实施差异化管理。
全生产周期数据是指零件从来料开始至产品生产完成进行性能检测为止,所产生的所有数据,数据来源多样且数据种类及形态具有复杂性。随着自动化、信息化、智能化等技术在制造业中的广泛应用,在生产过程中必然会产生大量的数据。目前对于数据的清洗与转换,针对生产过程中不同的问题数据,经常使用相关数据处理方法,如数据插补、数据关联、Filter特征选择、遗传算法等方法,基于数据驱动进行数据类型转换,对数据进行形式上统一。然而,在实际使用中发现,由于数据采集的方式、部位等原因,纯靠数据进行特征构建,在工程实践中,并不具有很好的实际效果,而仅靠机理知识,则没有从数据关系层面分析数据规律。如沈克佳在对产品质量管理中使用分类提取法,提取机理经验作为分类指标,作为综合评估依据。陈磊在对电能进行质量评估时,通过提取数据电流谐波、电压偏差等数据进行电能质量划分。本方案在对数据进行构建时,将数据构建时将经验知识融入数据特征构建的过程中,使特征能够反映知识和数据规律,更具合理性。
在对产品质量评估目前的主要方法是通过获取产品各道工序的输出参数指标构建产品质量评价体系对产品质量进行评估。如林春荣2017年在组合机床与自动化加工技术期刊第10期卷中基于熵值法和序关系分析法的产品质量评估的论文中公开了一种基于熵值法和序关系分析法相结合的产品质量评估方法,分析了输出参数与产品质量之间的影响关系,建立了以各道工序的输出参数为指标的产品质量评价体系,利用熵值法和序关系分析法相结合的组合权重法确定了产品质量评估指标权重,从而获得产品质量评价结果。该方法在分析输出参数与产品质量影响关系的时候,权重计算较为复杂,且使用序关系法,受主观影响较大,同时也增加了评估的难度。贮箱等典型关键产品的制造质量一致性评价是一种系统性工作,需要依托相应的控制指标体系才能开展。但是,现有的质量控制指标体系多依靠历史经验搭建,导致体系内存在部分指标冗余,而部分关键指标未被覆盖的现象,难以全面、切实地展现产品的质量状态。并且当前工程实际应用中,仍然主要采用SPC控制图对贮箱等典型关键产品的各指标进行质量评价与控制,不具备针对单一产品的具体质量描述,所以使用合理的特征指标体系与准确的特征权重对贮箱质量评估至关重要。
通过上述分析,现有技术存在的问题及缺陷为:现有技术未针对数据源与数据形式不同结合知识进行综合分析,评估不全面、结果不合理。在获取特征权重时,现有技术未结合生产情况,指标冗余且受主观影响较强,最终评估效果不准确。
解决以上问题及缺陷的难度为:
产品全周期生产产生的数据量庞大,数据形式复杂多样,在对特征的构建既要表现数据规律,也要反映工艺知识,合理的特征是一个难点。在特征权重构建时,全生命周期数据内部逻辑层层环扣,在合理的减少主观因素在指标体系中的影响程度的同时,能挖掘特征对质量影响关系与规则,是工作的另一个难点。
解决以上问题及缺陷的意义为:
本发明在切实研究产线流程基础上,通过合理特征构建,解决全生产周期数据处理困难问题,提高对产品的质量评估的客观性,降低主观性所带来的不全面、不深入的问题。此外,产品生产流程较长,本方法给出一个快速、准确的权重特征指标,降低评估工作量,节约财力物力,提升评估模型准确性。
发明内容
针对现有技术存在的问题,本发明提供了一种贮箱质量评估方法、系统、存储介质、计算机设备及应用。
本发明是这样实现的,一种贮箱质量评估方法,所述贮箱质量评估方法包括:
获取贮箱生产过程数据集I1:根据生产流程,对贮箱采集的装配与检测过程中各数据进行采集,得到贮箱原始数据集I1;
判断I1中数据类型,根据数据类型不同,将数据分为时序数据部分It和宽表数据部分Ib;
全生产周期数据的数据处理:
特征权重提取:输入数据I2,基于树模型和经验知识,进行特征重要度分析,得到特征重要度;然后对重要度值使用softmax函数进行输出,得到融合特征权重Iw;
对贮箱进行质量评估。
进一步,所述全生产周期数据的数据处理包括:
(1)对于时序数据It:使用小波降噪,去除噪音;结合工艺知识和滑窗分析方法,将时序数据梳理为宽表数据形式;
(2)对于宽表数据Ib:使用数据预处理方法,对异常值、缺失值和冗余数据进行处理;最后对数据进行归一化,去除数据范围影响;
(3)对数据It和Ib,根据产品编号进行合并,得到统一形式后数据集I2。
进一步,所述全生产周期数据的数据处理的全生产周期数据的数据处理进行数据构建,构建为分析数据集I2,包括如下实现步骤:
(1)对于时序数据It处理中,热处理环节和镜像铣环节的含噪模型公式为:
S(k)=f(k)+ε*e(k);
在模型中,f(k)为真实的工艺时序数据,e(k)是在加工过程中由于设备和环境问题,产生的影响测量结果的噪音,ε为噪音系数的标准偏差;在处理过程中,通过小波变化,对信号进行小波分解,消除噪音e(k),保留真实信号f(k);
(2)对于宽表数据Ib处理中,对冲压、校形、整形、性能检测环节中的数据进行异常值处理时,采用箱线图和3σ方法进行剔除,方法如下:
UP=Q3+1.5*IQR;
LO=Q1-1.5*IQR;
其中UP是数据上界,数据超过UP认为是异常数据,Q3是第三四分位数,IQR是Q3-Q1的值,Q1是第一四分位数,LO是数据下界,低于LO认为数据异常,剔除,将剔除数值替换为众数。
进一步,所述特征权重提取的输入数据I2,基于树模型和经验知识,进行特征重要度分析,得到特征重要度,然后对重要度值使用softmax函数进行输出,得到融合特征权重Iw,实现步骤为:利用树模型-随机森林算法计算构造后数据I2特征的重要度ji,随机森林算法利用袋外数据评估特征重要性;对于随机森林算法中的一颗树Ti,用OOB样本得到误差e1,使用高斯抽取随机改变OOB中的ji列,保持其它列不变,对ji列进行随机的上下置换,得到误差e2;使用e1-e2来刻画特征ji的重要性。e1-e2越大,则表示特征i的重要度ji越大;
利用树模型xgboost算法计算构造后数据I2特征的重要度ji,xgboost算法利用基尼指数评估特征重要性,基尼指数计算公式为:
其中,k代表k个类别,pk代表类别k的样本权重,Gini(ji)的数值大小表示了每个特征在随机森林每棵树上做的贡献值大小,Gini(ji)越大,则表示特征i的重要度ji越大;
根据专家经验知识,获取数据特征重要度ji;
利用三种方式获得的数据特征重要度,利用softmax进行输出,计算公式如下:
其中x采用第x种方式获得特征重要度,w表示数据I2中m个特征的第w个特征,Iw表示通过softmax函数输出后的第w个特征权重值;利用随机森林、xgboost和经验知识提取特征重要度,将特征重要度相加按照softmax函数输出,则将特征权重量化。
进一步,所述对贮箱进行质量评估包括:
(1)将特征权重Iw作为各特征的权重系数,对数据集I2进行加权聚类,通过肘腋法,得出最佳聚类数目k,并得到数据k个类中心向量μ;
(2)对各类中心向量μ与各特征标准值,使用特征权重Iw进行加权最小二乘法计算,得出k个类标签L,实现贮箱的等级评估。
进一步,将特征权重Iw作为各特征的权重系数,对数据集I2进行加权聚类,根据肘腋法得到最佳聚类数目k,并得到数据类中心向量μ,实现步骤为:
数据I2={i1,i2...in},I2中的样本属性用A1,A2...Ak表示。样本数据xi=(xi1,xi2...xin),聚类中心向量u=(xj1,xj2...xjk),其中(xi1,xi2...xin)和(xj1,xj2...xjk)分别是样本数据xi和u对应数据I2和k个属性A1,A2...Ak的具体取值,样本数据xi和u之间的相似度,即是聚类评价准则,聚类评价准则具体公式如下所示:
dij代表样本数据xi与聚类中心向量的最近加权距离,Iw为特征权重.得到聚类评价指标后,还需要评价聚类性能的准则函数,聚类准则函数为:
xij指子集xi的第j个元素,E代表了所有k个簇中样本与数据类中心向量μ的最小误差平方和,也就是样本所有元素与其中心点最小距离的和。当E最小时,迭代终止;
肘腋法分析最佳聚类数目k,是在1到n的范围内进行n次聚类,得到每次聚类的损失Ei,将n个Ei使用折线图进行绘制,最大拐点处即为最佳的聚类数目k;
本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
获取贮箱生产过程数据集:根据生产流程,对贮箱采集的装配与检测过程中各数据进行采集,得到贮箱原始数据集;
判断贮箱原始数据集中数据类型,根据数据类型不同,将数据分为时序数据部分和宽表数据部分;
全生产周期数据的数据处理;
特征权重提取:输入数据,基于树模型和经验知识,进行特征重要度分析,得到特征重要度;对重要度值使用softmax函数进行输出,得到融合特征权重;
对贮箱进行质量评估。
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
获取贮箱生产过程数据集:根据生产流程,对贮箱采集的装配与检测过程中各数据进行采集,得到贮箱原始数据集;
判断贮箱原始数据集中数据类型,根据数据类型不同,将数据分为时序数据部分和宽表数据部分;
全生产周期数据的数据处理;
特征权重提取:输入数据,基于树模型和经验知识,进行特征重要度分析,得到特征重要度;对重要度值使用softmax函数进行输出,得到融合特征权重;
对贮箱进行质量评估。
本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现所述的贮箱质量评估方法。
本发明的另一目的在于提供一种实施所述贮箱质量评估方法的贮箱质量评估系统,所述贮箱质量评估系统包括:
获取贮箱生产过程数据集模块,用于根据生产流程,对贮箱采集的装配与检测过程中各数据进行采集,得到贮箱原始数据集;
数据类型划分模块,用于判断贮箱原始数据集中数据类型,根据数据类型不同,将数据分为时序数据部分和宽表数据部分;
数据处理模块,用于实现全生产周期数据的数据处理;
特征权重提取模块,用于输入数据,基于树模型和经验知识,进行特征重要度分析,得到特征重要度;对重要度值使用softmax函数进行输出,得到融合特征权重;
质量评估模块,用于对贮箱进行质量评估。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明给出了一个更为合理的贮箱制造数据处理方法:本发明在参与贮箱质量等级评估的实践过程中,发现制造过程数据源较多且数据形式不一,不针对不同生产工艺特点,实行适应的数据特征构造方法,数据无法刻画生产过程造成的质量差异。本发明针对制造过程中的全生产周期数据,针对各自工艺特点,使用合理的方法进行特征提取,能更加准确的实现数据对制造流程的表征。
本发明给出了一个更为精准的贮箱质量等级评估模型:本发明在参与贮箱质量等级评估的实践过程中,发现贮箱的制造过程包含多个特征项,不同特征对产品质量的影响程度不同,若忽视不同特征间对质量的影响差异,进行质量评估会影响评估的精度。本发明通过计算不同特征重要度,得出特征的权重,结合特征权重,实现数据加权聚类,然后对聚类中心使用加权最小二乘,得出类别标签,保证特征在数据聚类与评级中具有不同的影响程度,给出了一个更为精准的贮箱质量评估模型。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的贮箱质量评估方法流程图。
图2是本发明实施例提供的贮箱质量评估系统的结构示意图;
图2中:1、获取贮箱生产过程数据集模块;2、数据类型划分模块;3、数据处理模块;4、特征权重提取模块;5、质量评估模块。
图3是本发明实施例提供的贮箱质量评估方法的实现流程图。
图4是本发明实施例提供的肘腋法确定最佳聚类数目图。
具体实施方式
本发明为了解决全生产周期数据的数据形式多样质量评估不准确问题,实现特征构造自动化、合理化以及特征分析差异化、精细化。将信号处理部分方法结合进工业生产中全生产周期数据的特征提取中,提升数据特征客观性,将机器学习算法使用到质量影响因素分析中,提升模型准确性,减少工作量。为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种贮箱质量评估方法、系统、存储介质、计算机设备及应用,下面结合附图对本发明作详细的描述。
如图1所示,本发明提供的贮箱质量评估方法包括以下步骤:
S101:获取贮箱生产过程数据集:根据生产流程,对贮箱采集的装配与检测过程中各数据进行采集,得到贮箱原始数据集;
S102:判断贮箱原始数据集中数据类型,根据数据类型不同,将数据分为时序数据部分和宽表数据部分;
S103:全生产周期数据的数据处理;
S104:特征权重提取:输入数据,基于树模型和经验知识,进行特征重要度分析,得到特征重要度;对重要度值使用softmax函数进行输出,得到融合特征权重;
S105:对贮箱进行质量评估。
本发明提供的贮箱质量评估方法业内的普通技术人员还可以采用其他的步骤实施,图1的本发明提供的贮箱质量评估方法仅仅是一个具体实施例而已。
如图2所示,本发明提供的贮箱质量评估系统包括:
获取贮箱生产过程数据集模块1,用于根据生产流程,对贮箱采集的装配与检测过程中各数据进行采集,得到贮箱原始数据集;
数据类型划分模块2,用于判断贮箱原始数据集中数据类型,根据数据类型不同,将数据分为时序数据部分和宽表数据部分;
数据处理模块3,用于实现全生产周期数据的数据处理;
特征权重提取模块4,用于输入数据,基于树模型和经验知识,进行特征重要度分析,得到特征重要度;对重要度值使用softmax函数进行输出,得到融合特征权重;
质量评估模块5,用于对贮箱进行质量评估。
下面结合具体实施例对本发明的技术方案作进一步的描述。
实施例1
目前对产品质量评估利用熵值法和序关系分析法相结合的组合权重法确定了产品质量评估指标权重,实现产品质量等级评估,该方法在质量评估的时候,1)没有考虑数据形式不一所应该做的特征构造问题;2)在质量评估时,聚类过程中没有将特征对质量评估结果进行基于经验和数据的融合定量考虑;针对此问题,本发明提出了一种全生产周期数据下的贮箱质量评估方法。如图3所示,包括以下步骤:
(1)获取贮箱生产过程数据集I1:根据生产流程,对贮箱采集的装配与检测过程中各数据进行采集,得到贮箱原始数据集I1。根据制造环节下料、冲压、热处理、切边、校形、镜像铣、整形、性能检测等,提取压边力、压制力、入水时间、喷水速度、前序积累变形、成型精度、力学性能、厚度分布等数据。
(2)判断I1中数据类型,根据数据类型不同,将数据分为时序数据部分It和宽表数据部分Ib。其中时序数据为热处理和镜像铣生产部分数据,包括淬火温度变化曲线和镜像铣蒙皮加工厚度变化。
(3)全生产周期数据的数据处理部分:
(3a)对于时序数据It:使用小波降噪,去除噪音;结合工艺知识和滑窗分析方法,将时序数据梳理为宽表数据形式。对热处理部分时序数据,结合生产经验知识,提取数据保温温度、保温时长、升温斜率、升温时长、温度均值、温度标准差等数据;对镜像铣部分时序数据,提取加工电涡流最大值与最小值差、实际厚度、加工误差,厚度标准差等。
(3b)对于宽表数据Ib:对冲压过程(压边力、压制力),校形,整形(前序积累误差),性能检测(力学性能、成形精度、厚度分布)等特征,使用箱线图和3σ方法进行异常值检测,剔除离群点;对正常数据和异常数据分别进行重复数据检测,并删除重复数据,只保留一条即可;对缺失的特征数据进行众数填充;最后对数据进行归一化,去除数据范围影响。
(3c)对数据It和Ib,根据产品编号进行合并,得到统一形式后数据集I2。
(4)特征权重提取:输入数据I2,分别使用xgboost模型、随机森林,进行特征重要度分析,得到特征重要度,然后结合经验知识,对三个重要度进行平均输出。最后对重要度值使用softmax函数进行输出,得到结合数据与经验知识的融合特征权重Iw。
(5)对贮箱进行质量评估:
(5a)将融合特征权重Iw作为各特征的权重系数,对数据集I2进行加权K-means聚类,根据肘腋法,分析聚类曲线拐点,得到数据的最佳聚类数目k,然后根据最佳聚类数目k,得出数据k个类中心向量μ。
在本例中,首先将K-means算法中的成本函数使用融合特征权重Iw进行加权,使得成本函数在下降过程中,能够按特征重要度进行定量分析。然后,在确定最佳聚类数目中,通过分析对数据集I2聚类过程中的平均畸变程度曲线,用肘方法分析曲线拐点,确定加权K-means聚类的最佳类数目k。最后,依据最佳数目k,使用加权K-means对进行聚类,确定各类的类中心向量μ。
(5b)对各类中心向量μ与各特征标准值,使用特征权重Iw进行加权最小二乘法计算,得出类标签L,实现贮箱的等级评估。
实施例2
本发明全生产周期数据下的贮箱质量评估方法同实施例1,步骤(3)中所叙述的全生产周期数据的数据处理进行数据构建,构建为分析数据集I2,包括如下实现步骤:
(3a)对于时序数据It处理中,热处理环节和镜像铣环节的含噪模型公式为:
S(k)=f(k)+ε*e(k);
在上式模型中,f(k)为真实的工艺时序数据,e(k)是在加工过程中由于设备和环境问题,产生的影响测量结果的噪音,ε为噪音系数的标准偏差。在处理过程中,通过小波变化,对信号进行小波分解,消除噪音e(k),保留真实信号f(k)。
(3b)对于宽表数据Ib处理中,对冲压、校形、整形、性能检测环节中的数据进行异常值处理时,采用箱线图和3σ方法进行剔除,方法如下:
UP=Q3+1.5*IQR;
LO=Q1-1.5*IQR;
其中UP是数据上界,数据超过UP认为是异常数据,Q3是第三四分位数,IQR是Q3-Q1的值,Q1是第一四分位数,LO是数据下界,低于LO认为数据异常,可以剔除,将剔除数值替换为众数。
本发明通过针对全生产周期数据,使用符合工艺特点的方式,对数据进行了重构,构建后的特征能够很好展示实际对产品质量造成影响的原因,提取出真实的质量影响因素,整体上已经对整个生产周期对产品质量产生影响的原因进行提取,消除了不重要特征。
实施例3
本发明全生产周期数据下的贮箱质量评估方法同实施例1-实施例2,步骤(4)中所描述的输入数据I2,基于树模型和经验知识,进行特征重要度分析,得到特征重要度。然后对重要度值使用softmax函数进行输出,得到融合特征权重Iw,实现步骤为:
本发明利用树模型-随机森林算法计算构造后数据I2特征的重要度ji,随机森林算法利用袋外数据评估特征重要性。对于随机森林算法中的一颗树Ti,用OOB样本可以得到误差e1,然后使用高斯抽取随机改变OOB中的ji列,保持其它列不变,对ji列进行随机的上下置换,得到误差e2。至此,可以使用e1-e2来刻画特征ji的重要性。e1-e2越大,则表示特征i的重要度ji越大。
利用树模型xgboost算法计算构造后数据I2特征的重要度ji,xgboost算法利用基尼指数评估特征重要性,基尼指数计算公式为:
其中,k代表k个类别,pk代表类别k的样本权重,Gini(ji)的数值大小表示了每个特征在随机森林每棵树上做的贡献值大小,Gini(ji)越大,则表示特征i的重要度ji越大。
根据专家经验知识,获取数据特征重要度ji。
利用上述三种方式获得的数据特征重要度,利用softmax进行输出,计算公式如下:
其中x采用第x种方式获得特征重要度,w表示数据I2中m个特征的第w个特征,Iw表示通过softmax函数输出后的第w个特征权重值。利用随机森林、xgboost和经验知识提取特征重要度,能更加全面、完善的评估不同特征对贮箱全生产周期质量的影响程度,将特征重要度相加按照softmax函数输出,则将特征权重量化,降低了对专家经验的依赖,方便后续评估工作进行,同时更加充分挖掘全生产周期数据内部逻辑和规则。
本发明通过不同方式计算特征重要度,对特征重要度进行相加,利用softmax输出得到不同特征权重,本发明解决了数据特征提取后难以依赖专家经验评定特征权重的问题,给出了一个更为有说服力、有效的特征权重提取方式。
实施例4
本发明基于一种全生产周期数据下的贮箱质量评估方法同实施例1-实施例3,步骤(5a)中所描述,将特征权重Iw作为各特征的权重系数,对数据集I2进行加权聚类,根据肘腋法得到最佳聚类数目k,参照图2,并得到数据类中心向量μ,实现步骤为:
数据I2={i1,i2...in},I2中的样本属性用A1,A2...Ak表示。样本数据xi=(xi1,xi2...xin),聚类中心向量u=(xj1,xj2...xjk),其中(xi1,xi2...xin)和(xj1,xj2...xjk)分别是样本数据xi和u对应数据I2和k个属性A1,A2...Ak的具体取值,样本数据xi和u之间的相似度,即是聚类评价准则。聚类评价准则具体公式如下所示:
dij代表样本数据xi与聚类中心向量的最近加权距离,Iw为特征权重.得到聚类评价指标后,还需要评价聚类性能的准则函数,聚类准则函数为:
xij指子集xi的第j个元素,E代表了所有k个簇中样本与数据类中心向量μ的最小误差平方和,也就是样本所有元素与其中心点最小距离的和。当E最小时,迭代终止。
肘腋法分析最佳聚类数目k,是在1到n的范围内进行n次聚类,得到每次聚类的损失Ei,将n个Ei使用折线图进行绘制,最大拐点处即为最佳的聚类数目k。
本发明使用加权聚类算法处理全生产周期数据,采用加权距离函数代替传统K-means算法的欧氏距离,解决了数据内相邻的簇之间离散程度差异大,属性区间分布相差大造成的聚类效果不明显的问题,优化了聚类结果,提高了全生产周期数据下的贮箱的质量等级评估的准确性。
下面结合实验对本发明的技术效果作详细的描述。
实验1
本发明全生产周期数据下的贮箱质量评估数据构造方法同实施例1-实施例4,本发明实施步骤如下:
步骤1,贮箱生产过程数据集获取:
(1)获取贮箱生产过程数据集,根据贮箱生产流程,从下料、冲压、热处理、校形、镜像铣、整形、性能检测环节,参照表1,获取所需数据特征。
表1各工艺环节数据所需特征
步骤2,判断数据类型并对全生产周期数据的数据处理:
(2)数据类型的定性,需要根据生产方式进行判断。热处理通过加热、保温和冷却的手段,以获得预期组织和性能的一种金属热加工工艺,本身工艺过程就是通过温度变化进行金属性能提升,所以温度在淬火过程中的变化曲线,会对产品力学性能产生影响,影响产品质量等级。镜像铣过程中,铣刀在运行中的位置,造成贮箱厚度变化,会对最终成形精度造成影响,影响产品力学性能和精度。所以对这两部分划分为时序数据,采集数据特征。下料、冲压、校形、整形、性能检测部分,对质量造成影响的是工艺环节最终结果,过程数据对质量判断影响极小,所以为宽表数据。
(3a)时序数据处理:参照表2进行时序数据处理。对热处理部分,结合生产经验知识,提取数据保温温度、保温时长、升温斜率、升温时长、温度均值、温度标准差等数据;对镜像铣部分时序数据,提取加工电涡流最大值与最小值差、实际厚度等,将数据转为宽表形式It。
表2时序数据重构数据形式
(3b)宽表数据处理:
在数据处理中,使用使用箱线图和3σ方法,对超过界限的异常值剔除,并采用众数填充。对正常数据和异常数据分别进行重复数据检测,删除重复数据,只保留一条;对缺失的特征数据进行众数填充;最后对数据进行归一化,去除数据范围影响,得到数据Ib。归一化公式如下:
其中x为当前特征采集的真实数据,xmax和xmin为当前特征的最大值和最小值,y为归一化后的值,归一化能够去除量纲对于数据聚类产生的影响。
(3c)对数据It和Ib,根据产品编号进行合并,得到统一形式后数据集I2。
实验2
本发明贮箱质量评估的特征权重设定与聚类评估方法同实施例1-实施例5,本发明实施步骤如下:
(4)特征权重构建提取。
随机森林算法采用bagging策略,随机选取特征进行树构建,泛化能力较强,采用此算法进行特征重要度有助于提升泛化性能。Xgboost算法基于梯度提升树发展而来,对数据拟合能力较强,准确率较高。经验知识是人员对工艺过程的直观认知,通过工作积累而来。将三者重要度进行平均,能够较好均衡模型的准确性、泛化性和人员知识,保证特征的准确性。然后通过softmax函数输出,作为特征权重。操作时加权方式如表3:
表3:特征权重提取
淬火温度 | 积累变形 | 电涡流 | 测厚 | … | |
随机森林 | 0.23 | 0.03 | 0.1 | 0.32 | … |
xgboost | 0.3 | 0.05 | 0.09 | 0.35 | … |
经验知识 | 0.32 | 0.05 | 0.11 | 0.32 | … |
平均 | 0.283 | 0.043 | 0.1 | 0.33 | … |
对得到的平均权重,利用softmax进行输出,计算公式如下:
wi是第i个特征平均权重,Ii是输出的最终权重。
(5)对贮箱进行质量评估:
(5a)将融合特征权重Iw作为各特征的权重系数,对数据集I2进行加权K-means聚类,根据肘腋法,分析聚类曲线拐点,得到数据的最佳聚类数目k,然后根据最佳聚类数目k,得出数据k个类中心向量μ。肘腋法判断最佳聚类数目曲线图参照图。
(5b)对各类中心向量μ与各特征标准值,使用特征权重Iw进行加权最小二乘法计算,得出类标签L,实现贮箱的等级评估:
实验3
本发明全生产周期数据下的贮箱质量评估方法同实施例1-实施例6。
步骤1
(1)获取贮箱生产过程数据集I1。
按照产线生产流程,收集所有生产数据,包含从下料、冲压、热处理、校形、镜像铣、整形、性能检测环节。收集产品数据量总和有528条。部分数据如表4。
表4产线数据形式
(2)数据类型的定性,需要根据生产方式进行判断。热处理部分,温度在淬火过程中的变化曲线,根据知识会对产品力学性能产生影响,影响产品质量等级。镜像铣过程中,铣刀在运行中的位置,造成贮箱厚度变化,会对最终成形精度造成影响,影响产品力学性能和精度。所以对这两部分划分为时序数据,采集数据特征。下料、冲压、校形、整形、性能检测部分,对质量造成影响的是工艺环节最终结果,过程数据对质量判断影响极小,所以为宽表数据。
步骤2
(3a)时序数据处理。
热处理通过加热、保温和冷却的手段,以获得预期组织和性能的一种金属热加工工艺,本身工艺过程就是通过温度变化进行金属性能提升。热处理数据原数据形式参照表5。
表5热处理采集的时序数据
产品编号 | - |
2020/3/2/9:30:01 | 890 |
2020/3/2/9:30:02 | 889 |
2020/3/2/9:30:03 | 890 |
2020/3/2/9:30:04 | 886 |
2020/3/2/9:30:05 | 892 |
2020/3/2/9:30:06 | 891 |
2020/3/2/9:30:07 | 890 |
2020/3/2/9:30:08 | 892 |
2020/3/2/9:30:09 | 895 |
2020/3/2/9:30:10 | 893 |
2020/3/2/9:30:11 | 892 |
2020/3/2/9:30:12 | 886 |
结合生产经验知识,提取数据保温温度、保温时长、升温斜率、升温时长、温度均值、温度标准差等数据,数据构建后数据形式参照表7。
表6热处理数据构建后形式
镜像铣数据产线原数据参照表7
表7镜像铣数据产线原数据形式
测厚 | 电涡流1 | 电涡流2 | 电涡流3 | 电涡流4 | |
20-05-22-15:48:41.317 | 6.072 | 2.523 | 2.473 | 2.462 | 2.507 |
20-05-22-15:48:41.373 | 6.072 | 2.524 | 2.475 | 2.464 | 2.51 |
20-05-22-15:48:41.429 | 6.072 | 2.524 | 2.474 | 2.464 | 2.51 |
20-05-22-15:48:41.517 | 6.072 | 2.524 | 2.471 | 2.462 | 2.508 |
20-05-22-15:48:41.557 | 6.072 | 2.522 | 2.471 | 2.461 | 2.508 |
20-05-22-15:48:41.625 | 6.073 | 2.522 | 2.472 | 2.462 | 2.508 |
20-05-22-15:48:41.690 | 6.073 | 2.522 | 2.471 | 2.465 | 2.508 |
20-05-22-15:48:41.757 | 6.073 | 2.522 | 2.468 | 2.464 | 2.507 |
20-05-22-15:48:41.813 | 6.073 | 2.523 | 2.468 | 2.462 | 2.507 |
20-05-22-15:48:41.866 | 6.073 | 2.523 | 2.473 | 2.46 | 2.509 |
20-05-22-15:48:41.954 | 6.073 | 2.523 | 2.476 | 2.464 | 2.51 |
提取加工电涡流最大值与最小值差、实际厚度后数据形式参照表8。
表8镜像铣数据构建后形式
产品 | 电涡流 | 测厚 |
1 | 0.102 | 6 |
2 | 0.108 | 6.01 |
3 | 0.21 | 6.4 |
4 | 0.062 | 5.8 |
5 | 0.159 | 5.92 |
6 | 0.184 | 5.96 |
7 | 0.32 | 6.13 |
(3b)宽表数据处理。
数据按照产品编号进行合并,合并后进行数据处理对异常值与空值进行众数填充,然后进行冗余数据剔除,最后对数据进行归一化,去除数据范围影响,得到数据Ib,处理后部分数据参照表9。
表9宽表数据处理后形式
产品编号 | 压制力 | 压边力 | 积累变形 | 测厚 | 电涡流 | 屈服强度 | 抗拉强度 | … |
1 | 0.271523 | 0.481095 | 0.802647 | 0.315457 | 0.357412 | 0.576455 | 0.768672 | … |
2 | 0.267108 | 0.316192 | 0.448337 | 0.520505 | 0.403841 | 0.320185 | 0.440353 | … |
3 | 0.368653 | 0.365509 | 0.058666 | 0.413249 | 0.358945 | 0.478441 | 0.44917 | … |
步骤3
(4)特征权重构建。
对处理后的数据,分别使用xgboost模型、随机森林,进行特征重要度分析,得到特征重要度,然后结合经验知识,对三个重要度进行平均输出。最后对重要度值使用softmax函数进行输出,得到结合数据与经验知识的融合特征权重Iw。数据参加表10。
表10特征权重Iw
压边力 | 0.4216 |
入水时间 | 0.0357 |
喷水速度 | 0.0497 |
… | … |
前序积累变形 | 0.0791 |
(5)对贮箱进行质量评估:
(5a)将融合特征权重Iw作为各特征的权重系数,对数据集I2进行加权K-means聚类,根据肘腋法,分析聚类曲线拐点,得到数据的最佳聚类数目k,然后根据最佳聚类数目k,得出数据k个类中心向量μ。
聚类使用伪代码如下:
输入:样本集I2,聚类数据k由1-9。
过程:从I2中随机选择k个样本作为初始均值向量{μ1,μ2,...,μk}。
Repeat:
Until当前均值向量均为更新。
根据肘腋法确定最佳聚类数目为3,确定聚类中心向量参照表11。
表11聚类中心向量
成形精度 | 入水时间 | … | 屈服强度 | 抗拉强度 | 测厚 |
-0.0607 | -0.0778 | … | 0.0533 | -0.4743 | -0.0077 |
0.0421 | 0.0721 | … | 0.2066 | 0.918 | 0.0095 |
0.3101 | 0.2485 | … | -2.2702 | -2.4046 | 0.0055 |
(5b)对各类中心向量μ与各特征标准值,使用特征权重Iw进行加权最小二乘法计算,得出类标签L,实现贮箱的等级评估,评估后数据形式参照表12。
表12贮箱的等级评估后数据形式
本发明基于贮箱制造过程从下料到质量检测全生产周期下的数据,结合生产工艺知识,对数据进行特征提取与重构,解决生产数据形式多样和信息冗余问题。在此基础上,结合算法与知识经验,对每个特征进行重要度分析,对特征与产品质量间关系进行定性与定量分析,并基于特征重要度,对贮箱质量进行更为合理精准评估。
本发明公开的一种全生产周期数据下的贮箱质量评估方法,解决了全生产周期下数据分析困难、数据特征表征不准确的问题,并能够结合数据特征与知识经验,对造成产品质量精准的评估,实现步骤为:获取贮箱全生产过程数据集I1;判断I1中数据类型,根据数据类型不同,将数据分为时序数据部分It和宽表数据部分Ib;对于时序数据It:使用小波降噪,去除噪音;结合工艺知识和滑窗分析方法,将时序数据梳理为宽表数据形式;对于宽表数据Ib:使用数据预处理方法,对异常值、缺失值和冗余数据进行处理;最后对数据进行归一化,去除数据范围影响;对数据It和Ib,根据产品编号进行合并,得到统一形式后数据集I2;输入数据I2,基于树模型和经验知识,进行特征重要度分析,得到特征重要度。然后对重要度值使用softmax函数进行输出,得到融合特征权重Iw;将特征权重Iw作为各特征的权重系数,对数据集I2进行加权聚类,通过肘腋法,得出最佳聚类数目k,并得到数据k个类中心向量μ;对各类中心向量μ与各特征标准值,使用特征权重Iw进行加权最小二乘法计算,得出k个类标签L,实现贮箱更为全面,更为精确,更为合理的等级评估模型。
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种贮箱质量评估方法,其特征在于,所述贮箱质量评估方法包括:
获取贮箱生产过程数据集I1:根据生产流程,对贮箱采集的装配与检测过程中各数据进行采集,得到贮箱原始数据集I1;
判断I1中数据类型,根据数据类型不同,将数据分为时序数据部分It和宽表数据部分Ib;
全生产周期数据的数据处理:
特征权重提取:输入数据I2,基于树模型和经验知识,进行特征重要度分析,得到特征重要度;然后对重要度值使用softmax函数进行输出,得到融合特征权重Iw;
对贮箱进行质量评估。
2.如权利要求1所述的贮箱质量评估方法,其特征在于,所述全生产周期数据的数据处理包括:
(1)对于时序数据It:使用小波降噪,去除噪音;结合工艺知识和滑窗分析方法,将时序数据梳理为宽表数据形式;
(2)对于宽表数据Ib:使用数据预处理方法,对异常值、缺失值和冗余数据进行处理;最后对数据进行归一化,去除数据范围影响;
(3)对数据It和Ib,根据产品编号进行合并,得到统一形式后数据集I2。
3.如权利要求2所述的贮箱质量评估方法,其特征在于,所述全生产周期数据的数据处理的全生产周期数据的数据处理进行数据构建,构建为分析数据集I2,包括如下实现步骤:
(1)对于时序数据It处理中,热处理环节和镜像铣环节的含噪模型公式为:
S(k)=f(k)+ε*e(k);
在模型中,f(k)为真实的工艺时序数据,e(k)是在加工过程中由于设备和环境问题,产生的影响测量结果的噪音,ε为噪音系数的标准偏差;在处理过程中,通过小波变化,对信号进行小波分解,消除噪音e(k),保留真实信号f(k);
(2)对于宽表数据Ib处理中,对冲压、校形、整形、性能检测环节中的数据进行异常值处理时,采用箱线图和3σ方法进行剔除,方法如下:
UP=Q3+1.5*IQR;
LO=Q1-1.5*IQR;
其中UP是数据上界,数据超过UP认为是异常数据,Q3是第三四分位数,IQR是Q3-Q1的值,Q1是第一四分位数,LO是数据下界,低于LO认为数据异常,剔除,将剔除数值替换为众数。
4.如权利要求1所述的贮箱质量评估方法,其特征在于,所述特征权重提取的输入数据I2,基于树模型和经验知识,进行特征重要度分析,得到特征重要度,然后对重要度值使用softmax函数进行输出,得到融合特征权重Iw,实现步骤为:利用树模型-随机森林算法计算构造后数据I2特征的重要度ji,随机森林算法利用袋外数据评估特征重要性;对于随机森林算法中的一颗树Ti,用OOB样本得到误差e1,使用高斯抽取随机改变OOB中的ji列,保持其它列不变,对ji列进行随机的上下置换,得到误差e2;使用e1-e2来刻画特征ji的重要性,e1-e2越大,则表示特征i的重要度ji越大;
利用树模型xgboost算法计算构造后数据I2特征的重要度ji,xgboost算法利用基尼指数评估特征重要性,基尼指数计算公式为:
其中,k代表k个类别,pk代表类别k的样本权重,Gini(ji)的数值大小表示了每个特征在随机森林每棵树上做的贡献值大小,Gini(ji)越大,则表示特征i的重要度ji越大;
根据专家经验知识,获取数据特征重要度ji;
利用三种方式获得的数据特征重要度,利用softmax进行输出,计算公式如下:
其中x采用第x种方式获得特征重要度,w表示数据I2中m个特征的第w个特征,Iw表示通过softmax函数输出后的第w个特征权重值;利用随机森林、xgboost和经验知识提取特征重要度,将特征重要度相加按照softmax函数输出,则将特征权重量化。
5.如权利要求1所述的贮箱质量评估方法,其特征在于,所述对贮箱进行质量评估包括:
(1)将特征权重Iw作为各特征的权重系数,对数据集I2进行加权聚类,通过肘腋法,得出最佳聚类数目k,并得到数据k个类中心向量μ;
(2)对各类中心向量μ与各特征标准值,使用特征权重Iw进行加权最小二乘法计算,得出k个类标签L,实现贮箱的等级评估。
6.如权利要求5所述的贮箱质量评估方法,其特征在于,将特征权重Iw作为各特征的权重系数,对数据集I2进行加权聚类,根据肘腋法得到最佳聚类数目k,并得到数据类中心向量μ,实现步骤为:
数据I2={i1,i2...in},I2中的样本属性用A1,A2...Ak表示,样本数据xi=(xi1,xi2...xin),聚类中心向量u=(xj1,xj2...xjk),其中(xi1,xi2...xin)和(xj1,xj2...xjk)分别是样本数据xi和u对应数据I2和k个属性A1,A2...Ak的具体取值,样本数据xi和u之间的相似度,即是聚类评价准则,聚类评价准则具体公式如下所示:
dij代表样本数据xi与聚类中心向量的最近加权距离,Iw为特征权重.得到聚类评价指标后,还需要评价聚类性能的准则函数,聚类准则函数为:
xij指子集xi的第j个元素,E代表了所有k个簇中样本与数据类中心向量μ的最小误差平方和,也就是样本所有元素与其中心点最小距离的和。当E最小时,迭代终止;
肘腋法分析最佳聚类数目k,是在1到n的范围内进行n次聚类,得到每次聚类的损失Ei,将n个Ei使用折线图进行绘制,最大拐点处即为最佳的聚类数目k。
7.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
获取贮箱生产过程数据集:根据生产流程,对贮箱采集的装配与检测过程中各数据进行采集,得到贮箱原始数据集;
判断贮箱原始数据集中数据类型,根据数据类型不同,将数据分为时序数据部分和宽表数据部分;
全生产周期数据的数据处理;
特征权重提取:输入数据,基于树模型和经验知识,进行特征重要度分析,得到特征重要度;对重要度值使用softmax函数进行输出,得到融合特征权重;
对贮箱进行质量评估。
8.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
获取贮箱生产过程数据集:根据生产流程,对贮箱采集的装配与检测过程中各数据进行采集,得到贮箱原始数据集;
判断贮箱原始数据集中数据类型,根据数据类型不同,将数据分为时序数据部分和宽表数据部分;
全生产周期数据的数据处理;
特征权重提取:输入数据,基于树模型和经验知识,进行特征重要度分析,得到特征重要度;对重要度值使用softmax函数进行输出,得到融合特征权重;
对贮箱进行质量评估。
9.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现权利要求1~6任意一项所述的贮箱质量评估方法。
10.一种实施权利要求1~6任意一项所述贮箱质量评估方法的贮箱质量评估系统,其特征在于,所述贮箱质量评估系统包括:
获取贮箱生产过程数据集模块,用于根据生产流程,对贮箱采集的装配与检测过程中各数据进行采集,得到贮箱原始数据集;
数据类型划分模块,用于判断贮箱原始数据集中数据类型,根据数据类型不同,将数据分为时序数据部分和宽表数据部分;
数据处理模块,用于实现全生产周期数据的数据处理;
特征权重提取模块,用于输入数据,基于树模型和经验知识,进行特征重要度分析,得到特征重要度;对重要度值使用softmax函数进行输出,得到融合特征权重;
质量评估模块,用于对贮箱进行质量评估。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011272825.0A CN112446597B (zh) | 2020-11-14 | 2020-11-14 | 贮箱质量评估方法、系统、存储介质、计算机设备及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011272825.0A CN112446597B (zh) | 2020-11-14 | 2020-11-14 | 贮箱质量评估方法、系统、存储介质、计算机设备及应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112446597A true CN112446597A (zh) | 2021-03-05 |
CN112446597B CN112446597B (zh) | 2024-01-12 |
Family
ID=74737294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011272825.0A Active CN112446597B (zh) | 2020-11-14 | 2020-11-14 | 贮箱质量评估方法、系统、存储介质、计算机设备及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112446597B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114998695A (zh) * | 2022-07-18 | 2022-09-02 | 深圳市前海泽金产融科技有限公司 | 一种提高图像识别速度的方法及系统 |
CN115238421A (zh) * | 2022-09-23 | 2022-10-25 | 中国人民解放军国防科技大学 | 多脉冲燃气发生器装药构型设计方法、装置和计算机设备 |
CN115629074A (zh) * | 2022-08-31 | 2023-01-20 | 中国航空工业集团公司北京长城计量测试技术研究所 | 一种用于光纤传感损伤监测的包络提取方法 |
CN115790720A (zh) * | 2022-11-30 | 2023-03-14 | 大连理工大学 | 一种可重复使用的航天低温液氧复合材料贮箱结构的健康监测系统及方法 |
CN117370827A (zh) * | 2023-12-07 | 2024-01-09 | 飞特质科(北京)计量检测技术有限公司 | 一种基于深度聚类模型的风机质量等级评估方法 |
CN118096733A (zh) * | 2024-04-22 | 2024-05-28 | 浙江宋氏实业有限公司 | 一种基于图像分析的包装纸箱质量评估方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190188416A1 (en) * | 2017-12-15 | 2019-06-20 | International Business Machines Corporation | Data de-identification based on detection of allowable configurations for data de-identification processes |
CN110264336A (zh) * | 2019-05-28 | 2019-09-20 | 浙江邦盛科技有限公司 | 一种基于大数据的智能案防系统 |
CN110516920A (zh) * | 2019-08-05 | 2019-11-29 | 西安电子科技大学 | 基于指标融合的陀螺仪质量等级评估方法 |
CN113673707A (zh) * | 2020-05-15 | 2021-11-19 | 第四范式(北京)技术有限公司 | 一种应用机器学习的方法、装置、电子设备及存储介质 |
-
2020
- 2020-11-14 CN CN202011272825.0A patent/CN112446597B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190188416A1 (en) * | 2017-12-15 | 2019-06-20 | International Business Machines Corporation | Data de-identification based on detection of allowable configurations for data de-identification processes |
CN110264336A (zh) * | 2019-05-28 | 2019-09-20 | 浙江邦盛科技有限公司 | 一种基于大数据的智能案防系统 |
CN110516920A (zh) * | 2019-08-05 | 2019-11-29 | 西安电子科技大学 | 基于指标融合的陀螺仪质量等级评估方法 |
CN113673707A (zh) * | 2020-05-15 | 2021-11-19 | 第四范式(北京)技术有限公司 | 一种应用机器学习的方法、装置、电子设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
TIANQI CHEN,AND ETC: "XGBoost: A Scalable Tree Boosting System", 《ARXIV:HTTPS://ARXIV.ORG/PDF/1603.02754.PDF》 * |
王纯麟;何建敏;: "基于AdaBoost的电信客户流失预测模型", 价值工程 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114998695A (zh) * | 2022-07-18 | 2022-09-02 | 深圳市前海泽金产融科技有限公司 | 一种提高图像识别速度的方法及系统 |
CN114998695B (zh) * | 2022-07-18 | 2022-11-15 | 深圳市前海泽金产融科技有限公司 | 一种提高图像识别速度的方法及系统 |
CN115629074A (zh) * | 2022-08-31 | 2023-01-20 | 中国航空工业集团公司北京长城计量测试技术研究所 | 一种用于光纤传感损伤监测的包络提取方法 |
CN115238421A (zh) * | 2022-09-23 | 2022-10-25 | 中国人民解放军国防科技大学 | 多脉冲燃气发生器装药构型设计方法、装置和计算机设备 |
CN115238421B (zh) * | 2022-09-23 | 2022-12-09 | 中国人民解放军国防科技大学 | 多脉冲燃气发生器装药构型设计方法、装置和计算机设备 |
CN115790720A (zh) * | 2022-11-30 | 2023-03-14 | 大连理工大学 | 一种可重复使用的航天低温液氧复合材料贮箱结构的健康监测系统及方法 |
CN117370827A (zh) * | 2023-12-07 | 2024-01-09 | 飞特质科(北京)计量检测技术有限公司 | 一种基于深度聚类模型的风机质量等级评估方法 |
CN118096733A (zh) * | 2024-04-22 | 2024-05-28 | 浙江宋氏实业有限公司 | 一种基于图像分析的包装纸箱质量评估方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112446597B (zh) | 2024-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112446597A (zh) | 贮箱质量评估方法、系统、存储介质、计算机设备及应用 | |
CN103927412B (zh) | 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法 | |
Hsu et al. | Hybrid data mining approach for pattern extraction from wafer bin map to improve yield in semiconductor manufacturing | |
Ghasemi et al. | Mahalanobis Taguchi system: a review | |
CN111080074B (zh) | 基于网络多特征关联的系统服役安全态势要素获取方法 | |
CN111340110B (zh) | 一种基于工业过程运行状态趋势分析的故障预警方法 | |
Pani et al. | A survey of data treatment techniques for soft sensor design | |
CN113627735A (zh) | 工程建设项目安全风险的预警方法及系统 | |
CN118154174B (zh) | 一种工业设备智慧运维云平台 | |
CN117493953B (zh) | 一种基于缺陷数据挖掘的避雷器状态评估方法 | |
Ji et al. | Application of SVM and PCA-CS algorithms for prediction of strip crown in hot strip rolling | |
CN114580934A (zh) | 基于无监督异常检测的食品检测数据风险的早预警方法 | |
CN114565209A (zh) | 一种基于聚类的流程工业能耗状态评估方法 | |
CN118428548A (zh) | 基于数据分解和残差修正的空气质量预测方法及系统 | |
CN113703422B (zh) | 一种基于特征分析处理的燃气轮机气动执行机构故障诊断方法 | |
CN116826745B (zh) | 一种电力系统背景下的分层分区短期负荷预测方法及系统 | |
CN116881798A (zh) | 用于气象等复杂系统的基于变量选择和反向时滞特征选择的条件格兰杰因果分析方法 | |
CN116862291A (zh) | 一种企业电碳监测模型的构建方法 | |
Campi et al. | Parametric cost modelling of components for turbomachines: Preliminary study | |
Yang et al. | Adaptive neural-fuzzy inference system for classification of rail quality data with bootstrapping-based over-sampling | |
CN112733903B (zh) | 基于svm-rf-dt组合的空气质量监测与告警方法、系统、装置和介质 | |
CN113656294A (zh) | 一种软件缺陷预测方法 | |
Zhang et al. | A multi-step prediction method of urban air quality index based on meteorological factors analysis | |
CN112966449A (zh) | 基于变量选择和概率神经网络的制造过程质量缺陷根源诊断方法 | |
CN117434911B (zh) | 设备运行状态监控方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |