CN106066935A - 损伤等级模型的性能分析方法及系统 - Google Patents

损伤等级模型的性能分析方法及系统 Download PDF

Info

Publication number
CN106066935A
CN106066935A CN201610364297.9A CN201610364297A CN106066935A CN 106066935 A CN106066935 A CN 106066935A CN 201610364297 A CN201610364297 A CN 201610364297A CN 106066935 A CN106066935 A CN 106066935A
Authority
CN
China
Prior art keywords
class
model
performance
disaggregated model
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610364297.9A
Other languages
English (en)
Inventor
田雨农
黄顺亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Roiland Technology Co Ltd
Original Assignee
Dalian Roiland Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Roiland Technology Co Ltd filed Critical Dalian Roiland Technology Co Ltd
Priority to CN201610364297.9A priority Critical patent/CN106066935A/zh
Publication of CN106066935A publication Critical patent/CN106066935A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

损伤等级模型的性能分析方法及系统,包括:对分类模型性能指标进行分析的步骤和对测试数据结果进行分析的步骤。在分类模型训练后,针对每个零件的分类模型都有其相对应的模型参数,对每个零件下的等级分别做出分析。通过对多个性能指标的综合评价,可以避免只根据准确率来判断模型性能而产生的错误判断。

Description

损伤等级模型的性能分析方法及系统
技术领域
本发明属于数据处理领域,具体说是损伤等级模型的性能分析方法及系统。
背景技术
目前汽车的保有量每年在逐渐的增加,道路交通的不断规划使车辆的行驶速度有所提升,交通事故的发生率也在增加,汽车再发生碰撞后主要的理赔流程为:出险--报案--查勘--定损--核价--核损--核赔--支付,其中定损是根据保险公司所派的专业人员到现场进行勘察之后,根据损失的部位痕迹及程度进行现场初步定损,或者直接到修理厂、4S店、定损中心去定损。这不但耗费了大量的人力物力,而且在定损的过程中对定损员的专业要求较高,所以利用目前较为成熟的机器学习方法对汽车碰撞进行远程定损,不但可以解决人力物力的资源浪费,而且也可更快速更全面的对车辆零件损坏进行判定,所以对车辆低速碰撞远程定损具有重要的意义。
怎样选择适合的模型及数据处理方法,提高对损伤等级判定的准确性是车辆远程定损技术中重要的步骤。分类模型的好坏是根据已训练好的模型进行测试而得到的结果来反映的,传统对模型好坏的分析主要是针对在测试后模型的准确率的观察,但是由于训练及测试样本分布的不均匀等诸多因素的影响,单纯依靠测试结果的准确率已经不能反映模型的好坏了。
发明内容
本发明是针对在损伤等级判断模型性能分析过程中单一性能指标不具有客观性而设计,采用多种性能指标对模型的性能进行分析。
一方面,本发明提供了损伤等级模型的性能分析方法,包括:对分类模型性能指标进行分析的步骤和对测试数据结果进行分析的步骤。
具体的,在分类模型训练后,针对每个零件的分类模型都有其相对应的模型参数,将当前等级作为正样例,其他等级作为负样例,具体为:
零件的整体准确度:Accuracy=(TP+TN)/(TP+FN+FP+TN),其中TN为真负类,FP为假正类,FN为假负类,TP为真正类;反映了分类模型对整体样本的判断能力;在正负样例均衡的情况下,该项指标越高证明分类模型对整体数据的分类能力越好,如果正负样例不均衡,该项指标无法正确反映分类模型的性能;
精准度Precision=TP/(TP+FP),其中TP为真正类,FP为假正类;该项指标也称为命中率,反映了被分类模型预测为正样例中真实的正样例所占的比重;
召回率Recall=TP/(TP+FN),其中FN为假负类,TP为真正类;反映了被分类模型预测为正样例的正样例与实际正样例数的比值。
转移性Specificity=TN/(TN+FP),其中TN为真负类,FP为假正类,反映了被分类模型预测为负样例的负样例与实际负样例数的比值,是与召回率相对应的指标。
所述的精准度、召回率、转移性越高,分类模型的分类能力越好;准确度是针对一个零件进行分析,其他评价指标是对零件下的每个等级进行分析。
具体的,该方法还包括F1-Score=2*召回率*准确率/(召 回率+准确率);该值越大,说明分类模型的分类效果越好。
具体的,该方法还包括:预测提升值Lift=精准度/k,该评价指标体现了使用分类模型对样例进行分类比传统的统计方法性能提高了多少倍,Lift值越大,表明在该等级下使用分类模型的效果越好。
具体的,所述的k=(FN+TP)/(TN+FN+FP+TP),其中TN为真负类,FP为假正类,FN为假负类,TP为真正类。
具体的,ROC曲线的横坐标是假正类率FPR,纵坐标为真正类率TPR,其中FPR=FP/(TN+FP),TPR=TP/(FN+TP),其中TN为真负类,FP为假正类,FN为假负类,TP为真正类;ROC曲线越接近左上角,该分类模型的性能越好。
更具体的,AUC被定义为ROC曲线下的面积,AUC值越大的分类模型效果更好。
更具体的,分类模型训练时,若是有两个模型精准度相同,召回率越高,分类模型性能越好;若是有两个模型召回率相同,精准度越高,分类模型性能越好。
另一方面,本发明还提供了一种损伤等级模型的性能分析系统,包括:分类模型性能分析系统和测试数据结果分析系统;
所述分类模型性能分析系统对零件的整体准确度、精准度、召回率和转移性进行求值;
所述测试数据结果分析系统对求值结果进行分析。
本发明由于采用以上技术方法,能够取得如下的技术效果:通过对多个性能指标的综合评价,可以避免只根据准确率来判断模型性能 而产生的错误判断。根据观察性能指标,可以观察到样例数据中存在的问题,如不同损伤等级的样例数不均衡等。
具体实施方式
为使本发明的实施例的目的、技术方案和优点更加清楚,下面对本发明实施例中的技术方案进行清楚完整的描述:
实施例1
损伤等级模型的性能分析方法,包括:对分类模型性能指标进行分析的步骤和对测试数据结果进行分析的步骤。
本分析中准确度是针对一个零件进行计算,其他评价指标是对零件下的每个等级进行分析,在分析过程中将分类视为二分类,即把当前等级视为正样例——Positive,其他等级视为负样例——Negative,混淆矩阵如下:
具体为:
零件的整体准确度:Accuracy=(TP+TN)/(TP+FN+FP+TN),其中TN为真负类,FP为假正类,FN为假负类,TP为真正类;反 映了分类模型对整体样本的判断能力;在正负样例均衡的情况下,该项指标越高证明分类模型对整体数据的分类能力越好,如果正负样例不均衡,该项指标无法正确反映分类模型的性能;
精准度Precision=TP/(TP+FP),其中TP为真正类,FP为假正类;该项指标也称为命中率,反映了被分类模型预测为正样例中真实的正样例所占的比重;
召回率Recall=TP/(TP+FN),其中FN为假负类,TP为真正类;也称为TruePositive Rate,反映了被分类模型预测为正样例的正样例与实际正样例数的比值;
分类模型训练时,若是有两个模型精准度相同,召回率越高,分类模型性能越好;若是有两个模型召回率相同,精准度越高,分类模型性能越好。
转移性Specificity=TN/(TN+FP),其中TN为真负类,FP为假正类,也称为TrueNegative Rate,反映了被分类模型预测为负样例的负样例与实际负样例数的比值,是与召回率相对应的指标;用来衡量负样例的判断能力;
所述的精准度、召回率、转移性越高,分类模型的分类能力越好。
F1-Score=2*召回率*准确率/(召回率+准确率);该项指标将召回率和准确率的重要权重的比值设定为1:1,该值越大,说明分类模型的分类效果越好;
预测提升值Lift=精准度/k,在不使用模型的情况下,估计正例的比例;其中k=(FN+TP)/(TN+FN+FP+TP),其中TN为真负类,FP为 假正类,FN为假负类,TP为真正类;该评价指标体现了使用分类模型对样例进行分类比传统的统计方法性能提高了多少倍,Lift值越大,表明在该等级下使用分类模型的效果越好。
ROC曲线的横坐标是假正类率False Positive Rate(FPR),纵坐标为真正类率True Positive Rate(TPR),其中FPR=FP/(TN+FP),TPR=TP/(FN+TP),TN为真负类,FP为假正类,FN为假负类,TP为真正类;ROC曲线越接近左上角,该分类模型的性能越好。ROC曲线有个很好的特性:当测试集中的正负样例的分布变化时,ROC曲线能够保持不变。在实际的数据集中经常会出现类不平衡现象,即负样本比正样本多很多或者负样本比正样本少很多,而且测试数据中的正负样本的分布也可能随着时间变化。
AUC(Area Under Curve)被定义为ROC曲线下的面积,这个面积的取值范围在0—1之间,又由于ROC曲线一般都处于y=x这条直线的上方,所以AUC的取值范围在0.5和1之间。使用AUC值作为评价标准是因为很多时候ROC曲线并不能清晰的说明哪个分类模型的效果更好,AUC值越大的分类模型效果更好。
另一方面,本发明还提供了一种损伤等级模型的性能分析系统,包括:分类模型性能分析系统和测试数据结果分析系统;
所述分类模型性能分析系统对零件的整体准确度、精准度、召回率和转移性进行求值;
所述测试数据结果分析系统对求值结果进行分析。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (10)

1.损伤等级模型的性能分析方法,其特征在于,包括:对分类模型性能指标进行分析的步骤和对测试数据结果进行分析的步骤。
2.根据权利要求1所述的损伤等级模型的性能分析方法,其特征在于,在分类模型训练后,针对每个零件的分类模型都有其相对应的模型参数,将当前等级作为正样例,其他等级作为负样例,具体为:
零件的整体准确度:Accuracy=(TP+TN)/(TP+FN+FP+TN),其中TN为真负类,FP为假正类,FN为假负类,TP为真正类;反映了分类模型对整体样本的判断能力;在正负样例均衡的情况下,该项指标越高证明分类模型对整体数据的分类能力越好,如果正负样例不均衡,该项指标无法正确反映分类模型的性能;
精准度Precision=TP/(TP+FP),其中TP为真正类,FP为假正类;反映了被分类模型预测为正样例中真实的正样例所占的比重;
召回率Recall=TP/(TP+FN),其中FN为假负类,TP为真正类;反映了被分类模型预测为正样例的正样例与实际正样例数的比值;
转移性Specificity=TN/(TN+FP),其中TN为真负类,FP为假正类,反映了被分类模型预测为负样例的负样例与实际负样例数的比值,是与召回率相对应的指标;
所述的精准度、召回率、转移性越高,分类模型的分类能力越好;准确度是针对一个零件进行分析,其他评价指标是对零件下的每个等级进行分析。
3.根据权利要求2所述的损伤等级模型的性能分析方法,其特征在于,该方法还包括F1-Score=2*召回率*准确率/(召回率+准确率);该值越大,说明分类模型的分类效果越好。
4.根据权利要求2所述的损伤等级模型的性能分析方法,其特征在于,该方法还包括:预测提升值Lift=精准度/k,该评价指标体现了使用分类模型对样例进行分类比传统的统计方法性能提高了多少倍,Lift值越大,表明在该等级下使用分类模型的效果越好。
5.根据权利要求4所述的损伤等级模型的性能分析方法,其特征在于,所述的k=(FN+TP)/(TN+FN+FP+TP),其中TN为真负类,FP为假正类,FN为假负类,TP为真正类。
6.根据权利要求2所述的损伤等级模型的性能分析方法,其特征在于,ROC曲线的横坐标是假正类率FPR,,纵坐标为真正类率TPR,ROC曲线越接近左上角,该分类模型的性能越好。
7.根据权利要求6所述的损伤等级模型的性能分析方法,其特征在于,FPR=FP/(TN+FP),TPR=TP/(FN+TP),其中TN为真负类,FP为假正类,FN为假负类,TP为真正类。
8.根据权利要求6所述的损伤等级模型的性能分析方法,其特征在于,AUC被定义为ROC曲线下的面积,AUC值越大的分类模型效果更好。
9.根据权利要求2所述的损伤等级模型的性能分析方法,其特征在于,分类模型训练时,若是有两个模型精准度相同,召回率越高,分类模型性能越好;若是有两个模型召回率相同,精准度越高,分类模型性能越好。
10.一种损伤等级模型的性能分析系统,其特征在于,包括:分类模型性能分析系统和测试数据结果分析系统;
所述分类模型性能分析系统对零件的整体准确度、精准度、召回率和转移性进行求值;
所述测试数据结果分析系统对求值结果进行分析。
CN201610364297.9A 2016-05-27 2016-05-27 损伤等级模型的性能分析方法及系统 Pending CN106066935A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610364297.9A CN106066935A (zh) 2016-05-27 2016-05-27 损伤等级模型的性能分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610364297.9A CN106066935A (zh) 2016-05-27 2016-05-27 损伤等级模型的性能分析方法及系统

Publications (1)

Publication Number Publication Date
CN106066935A true CN106066935A (zh) 2016-11-02

Family

ID=57420989

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610364297.9A Pending CN106066935A (zh) 2016-05-27 2016-05-27 损伤等级模型的性能分析方法及系统

Country Status (1)

Country Link
CN (1) CN106066935A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107967624A (zh) * 2017-11-24 2018-04-27 四川长虹电器股份有限公司 一种业务活动销售预测模型的评价方法
CN111081016A (zh) * 2019-12-18 2020-04-28 北京航空航天大学 一种基于复杂网络理论的城市交通异常识别方法
CN113516398A (zh) * 2021-07-22 2021-10-19 北京淇瑀信息科技有限公司 基于分层抽样的风险设备识别方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6064970A (en) * 1996-01-29 2000-05-16 Progressive Casualty Insurance Company Motor vehicle monitoring system for determining a cost of insurance
US20020016655A1 (en) * 2000-08-01 2002-02-07 Joao Raymond Anthony Apparatus and method for processing and/or for providing vehicle information and/or vehicle maintenance information
CN105243394A (zh) * 2015-11-03 2016-01-13 中国矿业大学 一种类不平衡对分类模型性能影响程度的评价方法
CN105303197A (zh) * 2015-11-11 2016-02-03 江苏省邮电规划设计院有限责任公司 一种基于机器学习的车辆跟车安全自动评估方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6064970A (en) * 1996-01-29 2000-05-16 Progressive Casualty Insurance Company Motor vehicle monitoring system for determining a cost of insurance
US20020016655A1 (en) * 2000-08-01 2002-02-07 Joao Raymond Anthony Apparatus and method for processing and/or for providing vehicle information and/or vehicle maintenance information
CN105243394A (zh) * 2015-11-03 2016-01-13 中国矿业大学 一种类不平衡对分类模型性能影响程度的评价方法
CN105303197A (zh) * 2015-11-11 2016-02-03 江苏省邮电规划设计院有限责任公司 一种基于机器学习的车辆跟车安全自动评估方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
刘祥凯等: "车辆装备战场损伤等级评估方法", 《装甲兵工程学院学报》 *
李军等: "一种新的分类器性能评估方法", 《吉林大学学报(工学版)》 *
胡可云等: "《数据挖掘理论与应用》", 30 April 2008 *
蔡立志等: "《大数据测评》", 31 January 2015 *
邹洪侠等: "二类分类器的ROC曲线生成算法", 《计算机技术与发展》 *
陈晓洪等: "舰艇系统损伤等级模糊神经网络评估模型", 《海军工程大学学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107967624A (zh) * 2017-11-24 2018-04-27 四川长虹电器股份有限公司 一种业务活动销售预测模型的评价方法
CN111081016A (zh) * 2019-12-18 2020-04-28 北京航空航天大学 一种基于复杂网络理论的城市交通异常识别方法
CN111081016B (zh) * 2019-12-18 2021-07-06 北京航空航天大学 一种基于复杂网络理论的城市交通异常识别方法
CN113516398A (zh) * 2021-07-22 2021-10-19 北京淇瑀信息科技有限公司 基于分层抽样的风险设备识别方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN111104981B (zh) 一种基于机器学习的水文预报精度评价方法及系统
CN112201038B (zh) 一种基于单车不良驾驶行为风险的路网风险评估方法
CN104050329B (zh) 一种检测船舶碰撞危险度的方法
CN107687924B (zh) 一种桥梁的安全预警方法及系统
CN106066935A (zh) 损伤等级模型的性能分析方法及系统
CN106022561A (zh) 驾驶行为综合评价方法
CN105976449A (zh) 车辆远程自动定损碰撞检测方法及系统
CN108764375B (zh) 高速公路货运车辆跨省匹配方法及装置
CN103969415B (zh) 一种移动式水污染数据采集方法
CN113436433B (zh) 一种高效的城市交通离群值检测方法
CN109649396B (zh) 一种营运车辆驾驶员安全性检测方法
CN111062093B (zh) 一种基于图像处理和机器学习的汽车轮胎寿命预测方法
CN106056451A (zh) 基于车辆obd传感器的远程无人定损系统
CN111797188B (zh) 一种基于开源地理空间矢量数据的城市功能区定量识别方法
CN109406898A (zh) 一种融合多特征量综合评估油纸绝缘老化程度的方法
CN108898292A (zh) 一种桥梁健康状态的安全评估方法
CN110223004A (zh) 一种指挥防护工程口部抢修作业风险评估系统
CN107220475A (zh) 一种基于线性判别分析的轴承特征数据分析方法
CN102207474B (zh) 一种基于xrf光谱仪合金牌号鉴定的智能方法
CN103984856A (zh) 一种基于神经网络的墙体纵向裂缝宽度预测系统及方法
CN112488463A (zh) 一种基于组合赋权法与优劣解距离法的滑坡评价方法
CN112950022A (zh) 基于模糊综合评价法的路面状况综合评价方法
CN106469503A (zh) 一种预测交通事件影响范围的方法和装置
CN117238126A (zh) 一种连续流道路场景下的交通事故风险评估方法
CN116778435A (zh) 一种基于计算机视觉技术的车辆轴重分布识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20161102

RJ01 Rejection of invention patent application after publication