CN111915184A - 汽车行业零件质量早期预警方法及存储介质 - Google Patents
汽车行业零件质量早期预警方法及存储介质 Download PDFInfo
- Publication number
- CN111915184A CN111915184A CN202010754272.6A CN202010754272A CN111915184A CN 111915184 A CN111915184 A CN 111915184A CN 202010754272 A CN202010754272 A CN 202010754272A CN 111915184 A CN111915184 A CN 111915184A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- mis
- quality
- rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000003860 storage Methods 0.000 title claims abstract description 8
- 238000004519 manufacturing process Methods 0.000 claims abstract description 34
- 230000003203 everyday effect Effects 0.000 claims abstract description 9
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 238000012360 testing method Methods 0.000 claims description 30
- 238000012549 training Methods 0.000 claims description 30
- 238000012423 maintenance Methods 0.000 claims description 21
- 238000012795 verification Methods 0.000 claims description 12
- 230000000694 effects Effects 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 9
- 238000005457 optimization Methods 0.000 claims description 9
- 238000009826 distribution Methods 0.000 claims description 8
- 238000005315 distribution function Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 6
- 230000010354 integration Effects 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 4
- 230000008094 contradictory effect Effects 0.000 claims description 4
- 230000001186 cumulative effect Effects 0.000 claims description 4
- 238000012217 deletion Methods 0.000 claims description 4
- 230000037430 deletion Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 4
- 238000012821 model calculation Methods 0.000 claims description 4
- 238000007637 random forest analysis Methods 0.000 claims description 4
- 238000007670 refining Methods 0.000 claims description 4
- 230000001360 synchronised effect Effects 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000010801 machine learning Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Manufacturing & Machinery (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- General Factory Administration (AREA)
Abstract
本发明提供了一种汽车行业零件质量早期预警方法及存储介质,包括:步骤S1:进行问题定义,从业务场景到模型抽象;步骤S2:问题定义后,确定目标定义及观测窗口;步骤S3:进行数据采集,设定时间为天,每一天采集加载索赔数据、销售数据、制造数据以及车辆属性数据;步骤S4:对采集到的数据进行数据预处理;步骤S5:数据可靠性判断。本发明通过采用多维度衍生指标,充分数据探索结合业务的方法,从指标的大小排列顺序、指标的增长幅度、指标的增长速度等扩张,实现了这些指标不仅在预测技术上使用,而且质量工程师在分析具体问题时,可根据这些足够多的可以理解的指标快速定位问题。
Description
技术领域
本发明涉及数据分析技术领域,具体地,涉及汽车行业零件质量早期预警方法及存储介质。
背景技术
汽车作为耐用消费品,质量问题往往发生在车辆行驶时间或里程数已达到一定程度的时候,当大量问题收集并反馈至车企质量部时,有些前期出现过征兆的问题距离爆发局面已是一触即发,较长的监控周期会导致问题不能及早发现及早解决,只能提高后续产品的可靠性,且需承担不菲的维修成本,甚至引起大规模的召回。为了确保质量,必须对汽车零件质量进行实时的监测并预警。
对于汽车行业来说,质量之于任何产品,意义相当于生命线,质量攸关消费者的人身安全,消费者自然格外重视;质量之于品牌,消费者对一个品牌越认可,对它的质量期待也会越高,再小的问题也会让消费者心中的品牌形象打折扣。一旦在保修期间汽车出现大批量的质量问题,车企将承担不菲的维修成本,甚至引起大规模的召回,影响品牌形象,危及消费者安全。在质量问题发生时,如何能及早发现及早解决,避免大规模爆发,是非常困难的。主要面临以下问题:
(1)汽车作为耐用消费品,质量问题往往发生在车辆行驶时间或里程数已达到一定程度的时候,当大量问题收集并反馈至车企质量部时,有些前期出现过征兆的问题距离爆发局面已是一触即发,较长的监控周期会导致问题不能及早发现及早解决,只能提高后续产品的可靠性。
(2)同一批次生产的车辆售出时间经常存在数月的间隔,造成收集到的维修数据样本差异明显,需要找到同批次、同使用月份的车,并计算故障率,且当数据量达到千万级以上时,这些工作的处理难度将会大大增加。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种汽车行业零件质量早期预警方法及存储介质。
根据本发明提供的一种汽车行业零件质量早期预警方法,其特征在于,包括:
步骤S1:进行问题定义,从业务场景到模型抽象;
步骤S2:问题定义后,确定目标定义及观测窗口;
步骤S3:进行数据采集,设定时间为天,每一天采集加载索赔数据、销售数据、制造数据以及车辆属性数据;
步骤S4:对采集到的数据进行数据预处理;
步骤S5:数据可靠性判断;
步骤S6:通过可靠性判断后,构建特征变量,构建特征变量考虑的维度包括零件的索赔率,索赔率的排名顺序、索赔数量的增长幅度、索赔数量的增长速度、索赔率的增长幅度、索赔率的增长速度;
步骤S7:将扩张的多维数据通过滑窗法划分为训练样本和测试样本;
步骤S8:采用机器学习多个分类器模型,用训练样本对模型进行训练,用测试样本对模型进行测试,得到模型的分类结果;
步骤S9:采用可靠性分析weibull分布概率模型,用训练样本对模型进行训练,用测试样本对模型进行测试,得到模型的分类结果;
步骤S10:模型比对及效果评估,采用正确率、覆盖率作为衡量指标,选择最优模型;
步骤S11:非同期模型验证;
步骤S12:验证通过后,模型运用到最新的数据中推广使用,并将预测结果返回数据仓库;
步骤S13:验证未通过,将返回步骤6,从调整特征变量开始进行优化。
优选地,所述步骤S1包括:
步骤S101:进行问题定义,通过维修中的索赔历史数据,预测未来关键MIS,大规模爆发质量问题的零件;
步骤S102:将问题转化为:对{xk|k∈[1,n]}集合,计算P(X=xk|t=T,s=S);
t表示当前时间,S表示当前零件质量现状,X表示预测的大规模爆发的质量零件;
所述关键MIS根据质量工程师考核指标设置为6MIS、12MIS、24MIS。
优选地,所述步骤S2包括:
步骤S201:同一批次车,即相同车型相同制造月的车辆,其服务时长MIS为6,12,24时零件索赔率最高的TOP20为预测目标,TOP20为同批次车中索赔率排名前20的零件;
步骤S202:预测6MIS时,观测窗口为2MIS,3MIS,4MIS,5MIS;预测12MIS时,观测窗口为7MIS,8MIS,9MIS,10MIS,11MIS;预测24MIS时,观测窗口为 13MIS,14MIS,15MIS,16MIS,17MIS,18MIS,19MIS,20MIS。
优选地,所述步骤S3包括:
步骤S301:每天增量采集维修数据,对事故车、运输过程等非车主正常使用的维修数据过滤,得到非外因造成的质量问题维修清单;
步骤S302:每天全量采集销售数据、制造数据,车辆属性数据。
优选地,所述步骤S4包括:
步骤S401:通过制造数据车架号关联索赔数据、制造数据、车辆主数据,得到每辆车的索赔信息、销售时间、制造月、车辆所属品牌及车型;
步骤S402:相同车型相同制造月的车辆,销售时间不同,使用的时长不同,时序数据的构建不能根据自然时间简单划分,时序数据的构建根据车主的服务时长MIS划分,构建出各批次车辆的时序数据;
优选地,所述步骤S5包括:
步骤S501:同批次的车辆销售时间不同,服务MIS不同,观测窗口所属MIS的车辆样本如果小于预设值,计算的索赔率不可靠,通过测算,确定所属MIS的车辆样本Pi>=0.3时,索赔率反映整体的索赔率情况;
步骤S502:Pi>=0.3可靠性判断通过,Pi<0.3样本持续积累,直至Pi>=0.3。
优选地,所述步骤S7包括:
步骤S701:预测关键节点6MIS、12MIS、24MIS的TOP20的故障零件,采用截止到iMIS的索赔数据,预警tMIS的故障零件TOP20问题,其中t是指{6,12,24},i指的是系统计算时的观测窗口MIS,iMIS需满足车辆样本Pi>=0.3;
步骤S702:回退所有的数据至各MIS满足样本条件的最初状态,作为特征提取区间,关键节点6MIS、12MIS、24MIS的TOP20的故障零件,作为标签序列区间;
步骤S703:不同批次车按批次比例预留训练样本和测试样本。
优选地,所述步骤S8包括:
步骤S801:采用全模型搜索,调大迭代次数,全量搜索模型和超参数,确定最优的模型,搜索的模型包括:svc_linear、Knn、gradient_boosting、random_forest、sgd、xgboost_classification以及multinomial_nb;
步骤S802:进行单个模型调优,在单个模型上通过多次迭代,缩减参数范围,精细化优化模型。
优选地,所述步骤S9采用概率模型模型,进行训练测试,包括:
步骤S901:z-score标准化数据;
步骤S902:计算失效时间、截尾时间、索赔数量标记截尾记号;
步骤S903:用LIFEREG回归weibull累计失效分布函数,获取结果数据中失效分布函数的形状参数m与尺度参数γ;
步骤S904:获得目标MIS处的失效概率及累计分布;按失效率排序,进行特定删选后,获得预警故障零件作为模型计算结果;
所述步骤S10包括:
步骤S1001:通过准确率和覆盖率一对指标对模型评估,并关注TOP5的覆盖情况;
步骤S1002:准确率和覆盖率是是一对矛盾的指标,对二者进行权衡,在解决问题精力有限的情况下,选择准确率符合一定标准的情况下,最大限度提升覆盖率;
步骤S1003:不同批次的车辆,不同的MIS采用多模型集成的方法,构成综合预测系统;
步骤S1004:各模型并行运算,选择最优模型;
所述步骤S11包括:
步骤S1101:在数据动态变化中,跟踪统计预测结果;
步骤S1102:根据实际结果,再次验证预测效果;
所述步骤S13包括:
步骤S1301:再对业务和数据进行分析,获得影响质量问题的因素,将影响质量问题的因素作为新的特征,作为模型的输入;
步骤S1301:对模型进行重新训练及评估。
根据本发明提供的一种存储有计算机程序的计算机可读存储介质,所述计算机程序被处理器执行时实现上述中任一项所述的汽车行业零件质量早期预警方法的步骤。
与现有技术相比,本发明具有如下的有益效果:
(1)通过采用MIS构建序列数据,从而实现了同一批次生产的车辆售出时间存在数月的间隔,不会造成收集到的维修数据样本差异,且精准计算出各MIS的故障率。
(2)通过采用多维度衍生指标,充分数据探索结合业务的方法,从指标的大小排列顺序、指标的增长幅度、指标的增长速度等扩张,实现了这些指标不仅在预测技术上使用,而且质量工程师在分析具体问题时,可根据这些足够多的可以理解的指标快速定位问题。
(3)通过采用多模型集成的方法,构成综合预测系统,以强化学习效果,实现了预测准确率和覆盖率的提升。采用机器学习分类器模型和可靠性分析相结合的方法,半年实际预测中取得了精准度80%以上,覆盖率65%以上的效果,预测时间平均提早了三分之一。
(4)通过各不同批次的车辆模型并行运算的逻辑,实现了数据更新时,模型自动训练选优的运算速度。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明提供的模型构建整体流程示意图。
图2为本发明提供的时序构建示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
根据本发明提供的一种汽车行业零件质量早期预警方法,其特征在于,包括:
步骤S1:进行问题定义,从业务场景到模型抽象;
步骤S2:问题定义后,确定目标定义及观测窗口;
步骤S3:进行数据采集,设定时间为天,每一天采集加载索赔数据、销售数据、制造数据以及车辆属性数据;
步骤S4:对采集到的数据进行数据预处理;
步骤S5:数据可靠性判断;
步骤S6:通过可靠性判断后,构建特征变量,构建特征变量考虑的维度包括零件的索赔率,索赔率的排名顺序、索赔数量的增长幅度、索赔数量的增长速度、索赔率的增长幅度、索赔率的增长速度;
步骤S7:将扩张的多维数据通过滑窗法划分为训练样本和测试样本;
步骤S8:采用机器学习多个分类器模型,用训练样本对模型进行训练,用测试样本对模型进行测试,得到模型的分类结果;
步骤S9:采用可靠性分析weibull分布概率模型,用训练样本对模型进行训练,用测试样本对模型进行测试,得到模型的分类结果;
步骤S10:模型比对及效果评估,采用正确率、覆盖率作为衡量指标,选择最优模型;
步骤S11:非同期模型验证;
步骤S12:验证通过后,模型运用到最新的数据中推广使用,并将预测结果返回数据仓库;
步骤S13:验证未通过,将返回步骤6,从调整特征变量开始进行优化。
具体地,所述步骤S1包括:
步骤S101:进行问题定义,通过维修中的索赔历史数据,预测未来关键MIS,大规模爆发质量问题的零件;
步骤S102:将问题转化为:对{xk|k∈[1,n]}集合,计算P(X=xk|t=T,s=S);
t表示当前时间,S表示当前零件质量现状,X表示预测的大规模爆发的质量零件;
所述关键MIS根据质量工程师考核指标设置为6MIS、12MIS、24MIS。
具体地,所述步骤S2包括:
步骤S201:同一批次车,即相同车型相同制造月的车辆,其服务时长MIS为6,12,24时零件索赔率最高的TOP20为预测目标,TOP20为同批次车中索赔率排名前20的零件;
步骤S202:预测6MIS时,观测窗口为2MIS,3MIS,4MIS,5MIS;预测12MIS时,观测窗口为7MIS,8MIS,9MIS,10MIS,11MIS;预测24MIS时,观测窗口为13MIS,14MIS,15MIS,16MIS,17MIS,18MIS,19MIS,20MIS。
具体地,所述步骤S3包括:
步骤S301:每天增量采集维修数据,对事故车、运输过程等非车主正常使用的维修数据过滤,得到非外因造成的质量问题维修清单;
步骤S302:每天全量采集销售数据、制造数据,车辆属性数据。
具体地,所述步骤S4包括:
步骤S401:通过制造数据车架号关联索赔数据、制造数据、车辆主数据,得到每辆车的索赔信息、销售时间、制造月、车辆所属品牌及车型;
步骤S402:相同车型相同制造月的车辆,销售时间不同,使用的时长不同,时序数据的构建不能根据自然时间简单划分,时序数据的构建根据车主的服务时长MIS划分,构建出各批次车辆的时序数据;
具体地,所述步骤S5包括:
步骤S501:同批次的车辆销售时间不同,服务MIS不同,观测窗口所属MIS的车辆样本如果小于预设值,计算的索赔率不可靠,通过测算,确定所属MIS的车辆样本Pi>=0.3时,索赔率反映整体的索赔率情况;
步骤S502:Pi>=0.3可靠性判断通过,Pi<0.3样本持续积累,直至Pi>=0.3。
具体地,所述步骤S7包括:
步骤S701:预测关键节点6MIS、12MIS、24MIS的TOP20的故障零件,采用截止到iMIS的索赔数据,预警tMIS的故障零件TOP20问题,其中t是指{6,12,24},i指的是系统计算时的观测窗口MIS,iMIS需满足车辆样本Pi>=0.3;
步骤S702:回退所有的数据至各MIS满足样本条件的最初状态,作为特征提取区间,关键节点6MIS、12MIS、24MIS的TOP20的故障零件,作为标签序列区间;
步骤S703:不同批次车按批次比例预留训练样本和测试样本。
具体地,所述步骤S8包括:
步骤S801:采用全模型搜索,调大迭代次数,全量搜索模型和超参数,确定最优的模型,搜索的模型包括:svc_linear、Knn、gradient_boosting、random_forest、sgd、xgboost_classification以及multinomial_nb;
步骤S802:进行单个模型调优,在单个模型上通过多次迭代,缩减参数范围,精细化优化模型。
具体地,所述步骤S9采用概率模型模型,进行训练测试,包括:
步骤S901:z-score标准化数据;
步骤S902:计算失效时间、截尾时间、索赔数量标记截尾记号;
步骤S903:用LIFEREG回归weibull累计失效分布函数,获取结果数据中失效分布函数的形状参数m与尺度参数γ;
步骤S904:获得目标MIS处的失效概率及累计分布;按失效率排序,进行特定删选后,获得预警故障零件作为模型计算结果;
所述步骤S10包括:
步骤S1001:通过准确率和覆盖率一对指标对模型评估,并关注TOP5的覆盖情况;
步骤S1002:准确率和覆盖率是是一对矛盾的指标,对二者进行权衡,在解决问题精力有限的情况下,选择准确率符合一定标准的情况下,最大限度提升覆盖率;
步骤S1003:不同批次的车辆,不同的MIS采用多模型集成的方法,构成综合预测系统;
步骤S1004:各模型并行运算,选择最优模型;
所述步骤S11包括:
步骤S1101:在数据动态变化中,跟踪统计预测结果;
步骤S1102:根据实际结果,再次验证预测效果;
所述步骤S13包括:
步骤S1301:再对业务和数据进行分析,获得影响质量问题的因素,将影响质量问题的因素作为新的特征,作为模型的输入;
步骤S1301:对模型进行重新训练及评估。
根据本发明提供的一种存储有计算机程序的计算机可读存储介质,所述计算机程序被处理器执行时实现上述中任一项所述的汽车行业零件质量早期预警方法的步骤。
下面通过优选例,对本发明进行更为具体地说明。
优选例1:
本发明提供一种基于机器学习方法的汽车零件质量早期预警方法,属于汽车行业质量管理领域。该方法通过使用售后维修信息中的索赔数据、销售数据、制造数据、车辆主数据,构建机器学习的大数据模型。车辆行驶时间长短和行驶里程不同时,发生故障的概率不同,故采用多模型集成的方法,构成综合预测系统,以强化学习效果,提升预测精度。
针对以上问题,如图1,提出一种综合预测方法的汽车零件质量早期预警方法,包括以下步骤:
步骤1:问题定义,从业务场景到模型抽象;
步骤2:问题定义后,确定目标定义及观测窗口;
步骤3:数据采集,设定时间为天,每一天采集加载索赔数据、销售数据、制造数据、车辆属性数据;
步骤4:数据预处理;
步骤5:数据可靠性判断;
步骤6:通过可靠性判断后,构建特征变量。构建特征变量考虑的维度包括零件的索赔率,索赔率的排名顺序、索赔数量的增长幅度、索赔数量的增长速度、索赔率的增长幅度、索赔率的增长速度;
步骤7:将扩张的多维数据通过滑窗法划分为训练样本和测试样本;
步骤8:采用机器学习多个分类器模型,用训练样本对模型进行训练,用测试样本对模型进行测试,得到模型的分类结果;
步骤9:采用可靠性分析weibull分布概率模型,用训练样本对模型进行训练,用测试样本对模型进行测试,得到模型的分类结果;
步骤10:模型比对及效果评估,采用正确率、覆盖率作为衡量指标,选择最优模型;
步骤11:非同期模型验证;
步骤12:验证通过后,模型运用到最新的数据中推广使用,并将预测结果返回数据仓库;
步骤13:验证未通过,将返回步骤6,从调整特征变量开始进行优化。
所述步骤1包括如下步骤:问题定义,从业务场景到模型抽象
步骤1.1:问题定义:通过维修中的索赔历史数据,预测未来关键MIS,大规模爆发质量问题的零件。关键MIS根据质量工程师考核指标定为6MIS、12MIS、24MIS,
步骤1.2:问题转化为:对{xk|k∈[1,n]}集合,计算P(X=xk|t=T,s=S)。T:当前时间,S:当前零件质量现状,X:预测的大规模爆发的质量零件;
所述步骤2包括如下步骤:确定目标定义及观测窗口
步骤2.1:同一批次车,即相同车型相同制造月的车辆,其服务时长MIS(Month InService)为6,12,24时零件索赔率最高的TOP20为预测目标,TOP20为同批次车中索赔率排名前20的零件;
步骤2.2:预测6MIS时,观测窗口为2MIS,3MIS,4MIS,5MIS;预测12MIS时,观测窗口为7MIS,8MIS,9MIS,10MIS,11MIS;预测24MIS时,观测窗口为 13MIS,14MIS,15MIS,16MIS,17MIS,18MIS,19MIS,20MIS;
所述步骤3包括如下步骤:数据采集
步骤3.1:每天增量采集维修数据,对事故车、运输过程等非车主正常使用的维修数据过滤,得到非外因造成的质量问题维修清单;
步骤3.2:每天全量采集销售数据、制造数据,车辆属性数据。
所述步骤4包括如下步骤:数据预处理
步骤4.1:通过制造数据车架号关联索赔数据、制造数据、车辆主数据,得到每辆车的索赔信息、销售时间、制造月、车辆所属品牌及车型;
步骤4.2:如图2,相同车型相同制造月的车辆,销售时间不同,使用的时长不同,时序数据的构建不能根据自然时间简单划分,时序数据的构建根据车主的服务时长MIS(Month In Service)划分,构建出各批次车辆的时序数据;
所述步骤5包括如下步骤:数据可靠性判断
步骤5.1:同批次的车辆销售时间不同,服务MIS不同,观测窗口所属MIS的车辆样本如果过小,计算的索赔率不可靠。通过测算,确定所属MIS的车辆样本Pi>=0.3时,索赔率反映整体的索赔率情况;
步骤5.2:Pi>=0.3可靠性判断通过,Pi<0.3样本持续积累,直至Pi>=0.3;
所述步骤7包括如下步骤:通过滑窗法划分为训练样本和测试样本
步骤7.1:预测关键节点6MIS、12MIS、24MIS的TOP20的故障零件。采用截止到iMIS的索赔数据,预警tMIS的故障零件TOP20问题。其中t是指{6,12,24},i指的是系统计算时的观测窗口MIS,iMIS需满足车辆样本Pi>=0.3;
步骤7.2:回退所有的数据至各MIS满足样本条件的最初状态,作为特征提取区间,关键节点6MIS、12MIS、24MIS的TOP20的故障零件,作为标签序列区间;
步骤7.3:不同批次车按批次比例预留训练样本和测试样本。
所述步骤8包括如下步骤:采用机器学习多个分类器模型,进行训练测试
步骤8.1:采用全模型搜索,调大迭代次数,全量搜索模型和超参数,确定最优的模型。搜索的模型包括svc_linear、Knn、gradient_boosting、random_forest、sgd、 xgboost_classification、multinomial_nb;
步骤8.2:单个模型调优,在单个模型上通过多次迭代,缩减参数范围,精细化优化模型。
所述步骤9包括如下步骤:采用概率模型模型,进行训练测试
步骤9.1:z-score标准化数据;
步骤9.2:计算失效时间、截尾时间、索赔数量标记截尾记号;
步骤9.3:用LIFEREG回归weibull累计失效分布函数,获取结果数据中失效分布函数的形状参数m与尺度参数γ;
步骤9.4:获得目标MIS处的失效概率及累计分布;按失效率排序,进行特定删选后,获得预警故障零件作为模型计算结果。
所述步骤10包括如下步骤:模型评估
步骤10.1:通过准确率和覆盖率一对指标对模型评估,并关注TOP5的覆盖情况;
步骤10.2:准确率和覆盖率是是一对矛盾的指标,需要对二者进行权衡,在解决问题精力有限的情况下,选择准确率符合一定标准的情况下,尽可能的提升覆盖率;
步骤10.3:不同批次的车辆,不同的MIS采用多模型集成的方法,构成综合预测系统;
步骤10.4:各模型并行运算。
所述步骤11具体包括:非同期模型验证
步骤11.1:数据动态变化中,跟踪统计预测结果;
步骤11.2:根据实际结果,再次验证预测效果。
所述步骤13具体包括:模型优化
步骤13.1:再对业务和数据进行理解,还有那些因素影响质量问题,将影响因素作为新的特征,作为模型的输入;
步骤13.2:对模型进行重新训练及评估。
在本申请的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
Claims (10)
1.一种汽车行业零件质量早期预警方法,其特征在于,包括:
步骤S1:进行问题定义,从业务场景到模型抽象;
步骤S2:问题定义后,确定目标定义及观测窗口;
步骤S3:进行数据采集,设定时间为天,每一天采集加载索赔数据、销售数据、制造数据以及车辆属性数据;
步骤S4:对采集到的数据进行数据预处理;
步骤S5:数据可靠性判断;
步骤S6:通过可靠性判断后,构建特征变量,构建特征变量考虑的维度包括零件的索赔率,索赔率的排名顺序、索赔数量的增长幅度、索赔数量的增长速度、索赔率的增长幅度、索赔率的增长速度;
步骤S7:将扩张的多维数据通过滑窗法划分为训练样本和测试样本;
步骤S8:采用机器学习多个分类器模型,用训练样本对模型进行训练,用测试样本对模型进行测试,得到模型的分类结果;
步骤S9:采用可靠性分析weibull分布概率模型,用训练样本对模型进行训练,用测试样本对模型进行测试,得到模型的分类结果;
步骤S10:模型比对及效果评估,采用正确率、覆盖率作为衡量指标,选择最优模型;
步骤S11:非同期模型验证;
步骤S12:验证通过后,模型运用到最新的数据中推广使用,并将预测结果返回数据仓库;
步骤S13:验证未通过,返回步骤6继续执行,从调整特征变量开始进行优化。
3.根据权利要求1所述的汽车行业零件质量早期预警方法,其特征在于,所述步骤S2包括:
步骤S201:同一批次车,即相同车型相同制造月的车辆,其服务时长MIS为6,12,24时零件索赔率最高的TOP20为预测目标,TOP20为同批次车中索赔率排名前20的零件;
步骤S202:预测6MIS时,观测窗口为2MIS,3MIS,4MIS,5MIS;预测12MIS时,观测窗口为7MIS,8MIS,9MIS,10MIS,11MIS;预测24MIS时,观测窗口为13MIS,14MIS,15MIS,16MIS,17MIS,18MIS,19MIS,20MIS。
4.根据权利要求1所述的汽车行业零件质量早期预警方法,其特征在于,所述步骤S3包括:
步骤S301:每天增量采集维修数据,对事故车、运输过程等非车主正常使用的维修数据过滤,得到非外因造成的质量问题维修清单;
步骤S302:每天全量采集销售数据、制造数据,车辆属性数据。
6.根据权利要求1所述的汽车行业零件质量早期预警方法,其特征在于,所述步骤S5包括:
步骤S501:同批次的车辆销售时间不同,服务MIS不同,观测窗口所属MIS的车辆样本如果小于预设值,计算的索赔率不可靠,通过测算,确定所属MIS的车辆样本Pi>=0.3时,索赔率反映整体的索赔率情况;
步骤S502:Pi>=0.3可靠性判断通过,Pi<0.3样本持续积累,直至Pi>=0.3。
7.根据权利要求1所述的汽车行业零件质量早期预警方法,其特征在于,所述步骤S7包括:
步骤S701:预测关键节点6MIS、12MIS、24MIS的TOP20的故障零件,采用截止到iMIS的索赔数据,预警tMIS的故障零件TOP20问题,其中t是指{6,12,24},i指的是系统计算时的观测窗口MIS,iMIS需满足车辆样本Pi>=0.3;
步骤S702:回退所有的数据至各MIS满足样本条件的最初状态,作为特征提取区间,关键节点6MIS、12MIS、24MIS的TOP20的故障零件,作为标签序列区间;
步骤S703:不同批次车按批次比例预留训练样本和测试样本。
8.根据权利要求1所述的汽车行业零件质量早期预警方法,其特征在于,所述步骤S8包括:
步骤S801:采用全模型搜索,调大迭代次数,全量搜索模型和超参数,确定最优的模型,搜索的模型包括:svc_linear、Knn、gradient_boosting、random_forest、sgd、xgboost_classification以及multinomial_nb;
步骤S802:进行单个模型调优,在单个模型上通过多次迭代,缩减参数范围,精细化优化模型。
9.根据权利要求1所述的汽车行业零件质量早期预警方法,其特征在于,所述步骤S9采用概率模型模型,进行训练测试,包括:
步骤S901:z-score标准化数据;
步骤S902:计算失效时间、截尾时间、索赔数量标记截尾记号;
步骤S903:用LIFEREG回归weibull累计失效分布函数,获取结果数据中失效分布函数的形状参数m与尺度参数γ;
步骤S904:获得目标MIS处的失效概率及累计分布;按失效率排序,进行特定删选后,获得预警故障零件作为模型计算结果;
所述步骤S10包括:
步骤S1001:通过准确率和覆盖率一对指标对模型评估,并关注TOP5的覆盖情况;
步骤S1002:准确率和覆盖率是是一对矛盾的指标,对二者进行权衡,在解决问题精力有限的情况下,选择准确率符合一定标准的情况下,最大限度提升覆盖率;
步骤S1003:不同批次的车辆,不同的MIS采用多模型集成的方法,构成综合预测系统;
步骤S1004:各模型并行运算,选择最优模型;
所述步骤S11包括:
步骤S1101:在数据动态变化中,跟踪统计预测结果;
步骤S1102:根据实际结果,再次验证预测效果;
所述步骤S13包括:
步骤S1301:再对业务和数据进行分析,获得影响质量问题的因素,将影响质量问题的因素作为新的特征,作为模型的输入;
步骤S1301:对模型进行重新训练及评估。
10.一种存储有计算机程序的计算机可读存储介质,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的汽车行业零件质量早期预警方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010754272.6A CN111915184A (zh) | 2020-07-30 | 2020-07-30 | 汽车行业零件质量早期预警方法及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010754272.6A CN111915184A (zh) | 2020-07-30 | 2020-07-30 | 汽车行业零件质量早期预警方法及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111915184A true CN111915184A (zh) | 2020-11-10 |
Family
ID=73286408
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010754272.6A Pending CN111915184A (zh) | 2020-07-30 | 2020-07-30 | 汽车行业零件质量早期预警方法及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111915184A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114897541A (zh) * | 2022-05-11 | 2022-08-12 | 襄阳达安汽车检测中心有限公司 | 车辆售后故障率预测方法、装置、设备及可读存储介质 |
CN117150348A (zh) * | 2023-10-30 | 2023-12-01 | 宁德时代新能源科技股份有限公司 | 电池外损数据处理方法、系统、电子设备和存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1520571A (zh) * | 2002-05-13 | 2004-08-11 | 本田技研工业株式会社 | 预测对配件的需求的系统 |
CN105868838A (zh) * | 2016-01-18 | 2016-08-17 | 深圳联友科技有限公司 | 一种车辆质量判别方法 |
CN107705157A (zh) * | 2017-10-19 | 2018-02-16 | 大连理工大学 | 基于统一动态集成模型和元启发式算法的汽车备件销量预测方法及系统 |
CN108803559A (zh) * | 2018-04-28 | 2018-11-13 | 北京汽车集团有限公司 | 车辆故障分析方法、装置和系统 |
CN109978229A (zh) * | 2019-02-12 | 2019-07-05 | 常伟 | 一种对动力电池组全电芯多点温度及连接点温度进行热失控预测的方法 |
CN110377793A (zh) * | 2019-06-21 | 2019-10-25 | 深圳市轱辘汽车维修技术有限公司 | 一种推荐视频制作信息的方法、装置及设备 |
CN110796487A (zh) * | 2019-10-18 | 2020-02-14 | 上海钧正网络科技有限公司 | 数量预测方法、装置、计算机设备和存储介质 |
-
2020
- 2020-07-30 CN CN202010754272.6A patent/CN111915184A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1520571A (zh) * | 2002-05-13 | 2004-08-11 | 本田技研工业株式会社 | 预测对配件的需求的系统 |
CN105868838A (zh) * | 2016-01-18 | 2016-08-17 | 深圳联友科技有限公司 | 一种车辆质量判别方法 |
CN107705157A (zh) * | 2017-10-19 | 2018-02-16 | 大连理工大学 | 基于统一动态集成模型和元启发式算法的汽车备件销量预测方法及系统 |
CN108803559A (zh) * | 2018-04-28 | 2018-11-13 | 北京汽车集团有限公司 | 车辆故障分析方法、装置和系统 |
CN109978229A (zh) * | 2019-02-12 | 2019-07-05 | 常伟 | 一种对动力电池组全电芯多点温度及连接点温度进行热失控预测的方法 |
CN110377793A (zh) * | 2019-06-21 | 2019-10-25 | 深圳市轱辘汽车维修技术有限公司 | 一种推荐视频制作信息的方法、装置及设备 |
CN110796487A (zh) * | 2019-10-18 | 2020-02-14 | 上海钧正网络科技有限公司 | 数量预测方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
吕鹏飞等: ""基于服务链业务科技资源的配件需求预测研究"", 《物流科技》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114897541A (zh) * | 2022-05-11 | 2022-08-12 | 襄阳达安汽车检测中心有限公司 | 车辆售后故障率预测方法、装置、设备及可读存储介质 |
CN117150348A (zh) * | 2023-10-30 | 2023-12-01 | 宁德时代新能源科技股份有限公司 | 电池外损数据处理方法、系统、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Manco et al. | Fault detection and explanation through big data analysis on sensor streams | |
Ait-Mlouk et al. | An improved approach for association rule mining using a multi-criteria decision support system: a case study in road safety | |
Zhang et al. | Traffic Accident Prediction Based on LSTM‐GBRT Model | |
CN106933956B (zh) | 数据挖掘方法和装置 | |
CN111179591B (zh) | 一种路网交通时序特征数据质量诊断与修复方法 | |
CA3050951A1 (en) | Factory risk estimation using historical inspection data | |
CN104636449A (zh) | 基于lsa-gcc的分布式大数据系统风险识别方法 | |
Srivastava et al. | Machine learning and knowledge discovery for engineering systems health management | |
CN109598931B (zh) | 基于交通安全风险的群体划分与差异性分析方法及系统 | |
Li | Application of finite mixture of logistic regression for heterogeneous merging behavior analysis | |
CN111915184A (zh) | 汽车行业零件质量早期预警方法及存储介质 | |
CN116579697A (zh) | 冷链全链路数据信息管理方法、装置、设备及存储介质 | |
Bleu-Laine et al. | Predicting adverse events and their precursors in aviation using multi-class multiple-instance learning | |
CN113920366A (zh) | 一种基于机器学习的综合加权主数据识别方法 | |
Barros et al. | Predicting weighing deviations in the dispatch workflow process: A case study in a cement industry | |
CN112506907A (zh) | 基于大数据的工程机械营销策略推送方法、系统及装置 | |
CN111849544B (zh) | 加氢裂化的产品质量自控方法、装置和存储器 | |
Obasi et al. | Evaluating the effectiveness of machine learning techniques in forecasting the severity of traffic accidents | |
US20230058076A1 (en) | Method and system for auto generating automotive data quality marker | |
WO2023193196A1 (zh) | 自动驾驶测试用例生成方法、装置、电子设备及存储介质 | |
CN116186507A (zh) | 一种特征子集的选取方法、装置及存储介质 | |
CN113688506B (zh) | 基于微站等多维数据的潜在大气污染源识别方法 | |
CN113011748A (zh) | 推荐效果的评估方法、装置、电子设备及可读存储介质 | |
Zhao et al. | Traffic risk assessment of lane-changing process in urban inter-tunnel weaving segment | |
Cheng et al. | A superposition assessment method of road crash risk and congestion risk: An empirical analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201110 |