CN108898504B

CN108898504B - 一种移动查勘定损系统的智能训练及完善方法

Info

Publication number: CN108898504B
Application number: CN201810744398.8A
Authority: CN
Inventors: 冯韩
Original assignee: Beijing Jingyou Century Software Technology Co ltd
Current assignee: Beijing Jingyou Century Software Technology Co ltd
Priority date: 2018-07-09
Filing date: 2018-07-09
Publication date: 2021-12-07
Anticipated expiration: 2038-07-09
Also published as: CN108898504A

Abstract

本发明公开了一种移动查勘定损系统的智能训练及完善方法，将样本划分成不同比例的训练样本、测试样本和验证样本，同时根据训练样本的模型因子数量，采用SMOTE算法对训练样本的模型因子进行均衡处理，丰富实际训练样本的数量，且提高样本的训练精度，得到初始模型；利用原始样本初次预测数据与实际数据进行比对，将二者的残差的标准差进行对比，用于调整初始模型的配置参数，可大大降低模型的误差率。在实际应用中，对新案例进行检查和筛选，形成增量样本，用于更新样本库，并且对模型进行抽检，利用更新样本库对模型重新进行训练，实现模型在增量样本的基础上持续优化完善。

Description

一种移动查勘定损系统的智能训练及完善方法

技术领域

本发明属于车险查勘技术领域，具体涉及一种移动查勘定损系统的智能训练及完善方法。

背景技术

对于保险行业来说“互联网+”是一个重要的发展方向。财产保险公司的业务开展，一般包含承保环节与理赔环节。其中，理赔环节中最重要和最困难的为现场查勘和定损。

随着竞争越来越激烈，因为事故现场的查勘定损是保险公司工作人员与客户直接面对沟通的最直接作业环节，该项工作的处理效果如何，将在客户心里造成最直观的体验，进而决定了客户对保险公司服务水平的判断。因此，多数的保险公司已经开始重视查勘定损的质量和速率。

传统的车险事故查勘定损环节，查勘人员到达现场，进行拍照取证、填写材料、初步确定损失等相关动作之后，需要将所有的材料带回公司，然后在业务系统安排信息录入，然而，在这个过程中，会增加工作人员的工作量，同时还会增加出错率。无法保证整个理赔流程公平和快速有效的进行。

随着互联网技术的发展与成熟，商业服务入口终端选择移动设备的现象日益增多。因此，车险移动查勘定损系统应运而生，成为了查勘人员必备的移动设备。可大大提高查勘人员对于时效性、便利性、准确性的要求。目前，国内多家大型的保险公司软件服务商在致力于此领域的开发和研究中，但是由于车险移动查勘定损系统本身具有很高的可信度，需要经过大量的可靠训练和完善进行极致优化，才能达到即便捷且准确率又高的目的，负责一旦准确率不够要求，即使再便捷也得不到客户良好的反馈，影响对企业形象的评价。由此可见，对于车险移动查勘定损系统前期的训练和完善极为重要。

发明内容

针对以上存在的技术问题，本发明提供一种移动查勘定损系统的智能训练及完善方法。

本发明的技术方案为：一种移动查勘定损系统的智能训练及完善方法，包括以下步骤：

(1)样本的获取与分类：从移动查勘定损系统的历史数据库中选取若干份完全不同的成功案例放入样本库，并随机分为训练样本、测试样本及验证样本三个组，提取所述训练样本、测试样本及验证样本的模型因子；

(2)样本的预处理：根据训练样本的模型因子数量，采用SMOTE算法对训练样本的模型因子进行均衡处理，丰富训练样本数量，且提高样本的训练精度；

(3)模型的训练：

S1：将原始训练样本及均衡处理后的训练样本的模型因子输入BP神经网络模型中按批次进行训练，得到初始模型；

S2：将原始训练样本使用所述初始模型进行一次训练，并计算出初次预测数据，将所述初次预测数据与实际数据进行比对，并计算出初次预测数据残差的标准差；判断初次预测数据残差的标准差是否满足对应的阈值范围，若否，调整初始模型中的配置参数，重新对原始训练样本进行二次训练，直至各数据残差的标准差满足对应的阈值时，得到优化模型1.0；

S3：使用所述测试样本对所述优化模型1.0进行测试，测试过程中优化模型 1.0的模型参数会发生改变，当模型参数不再发生改变时，测试结束，优化模型 1.0更新至优化模型2.0；

S4：使用验证样本对所述优化模型2.0的精确度进行验证，若精确度大于95％，即为满足精确度要求，否则调整模型参数和结构，重复S1-S3，直至满足精度要求；

(4)模型的完善：模型的训练完成后，即可投入实际应用中，依靠最新模型版本对实际应用中的案例进行实时处理，并对最新模型版本得出的评估结果进行检查和筛选，形成增量样本，将所述增量样本添加入所述样本库，更新样本库；同时，定期抽检模型的精准度，当达到一定条件后利用更新样本库对模型按照步骤(3)重新进行训练，实现模型在增量样本的基础上持续优化完善。

进一步地，步骤(1)中所述训练样本、测试样本及验证样本的数量比为8: 2:3，大量训练样本用于进行模型训练，最少占比的测试样本用于对初始模型进行测试微调，较大量的验证样本用于对测试完毕的模型进行最终验证和优化。

进一步地，步骤(1)中所述模型因子包括车主信息、车辆信息、时间信息、空间信息、伤损信息、保险信息。

进一步地，当训练样本、测试样本及验证样本中含有视频时，需采用等间隔时间段对视频图像进行帧采样，将视频转换为图片格式文件，再对图片格式文件进行图像降噪、图像分辨率、图像色彩及饱和度调节处理。

进一步地，步骤(3)所述残差的标准差方法为：以二倍标准差作为误差范围，计算出初次预测数据的第一次正常数据范围；结合原始训练样本的实际数据，综合比较得到正常数据范围的上限和下限，计算出初次预测数据的第二次正常数据范围。

进一步地，步骤(3)中所述阈值范围为所述实际数据的残差的标准差。

进一步地，步骤(3)中所述精确度包括图片特征识别、定损结果分析、赔偿款项的精确度。

进一步地，步骤(4)中所述定期抽检模型的方法为：以一天作为一个周期，获取最近一周或一月时间内每天24h的案例，作为单位样本，按照标准抽检法抽取部分案例作为抽检样本，其中抽检样本数量不少于单位样本数量的30％。

进一步地，步骤(4)中所述一定条件为抽检样本的精确度小于95％。

与现有技术相比，本发明的有益效果为：本发明的移动查勘定损系统的智能训练及完善方法，将样本划分成不同比例的训练样本、测试样本和验证样本，同时根据训练样本的模型因子数量，采用SMOTE算法对训练样本的模型因子进行均衡处理，丰富实际训练样本的数量，且提高样本的训练精度，得到初始模型；利用原始样本初次预测数据与实际数据进行比对，将初次预测数据与实际数据的残差的标准差进行对比，用于调整初始模型的配置参数，可大大降低模型的误差率。训练结束后，投入实际应用中，对新案例进行检查和筛选，形成增量样本，用于更新样本库，并且对模型进行抽检，利用更新样本库对模型重新进行训练，实现模型在增量样本的基础上持续优化完善。

附图说明

图1为本发明的训练及完善方法流程图。

具体实施方式

如图1所示，一种移动查勘定损系统的智能训练及完善方法，包括以下步骤：

(1)样本的获取与分类：从移动查勘定损系统的历史数据库中选取若干份完全不同的成功案例放入样本库，并随机分为训练样本、测试样本及验证样本三个组，提取所述训练样本、测试样本及验证样本的模型因子；其中，所述训练样本、测试样本及验证样本的数量比为8:2:3，具体训练样本为805份、测试样本202份，验证样本301份；大量训练样本用于进行模型训练，最少占比的测试样本用于对初始模型进行测试微调，较大量的验证样本用于对测试完毕的模型进行最终验证和优化。其中，所述模型因子包括车主信息、车辆信息、时间信息、空间信息、伤损信息、保险信息。其中，当训练样本、测试样本及验证样本中含有视频时，需采用等间隔时间段对视频图像进行帧采样，将视频转换为图片格式文件，再对图片格式文件进行图像降噪、图像分辨率、图像色彩及饱和度调节处理。

(3)模型的训练：

S2：将原始训练样本使用所述初始模型进行一次训练，并计算出初次预测数据，将所述初次预测数据与实际数据进行比对，并计算出初次预测数据残差的标准差；所述残差的标准差方法为：以二倍标准差作为误差范围，计算出初次预测数据的第一次正常数据范围；结合原始训练样本的实际数据，综合比较得到正常数据范围的上限和下限，计算出初次预测数据的第二次正常数据范围。判断初次预测数据残差的标准差是否满足对应的阈值范围，所述阈值范围为所述实际数据的残差的标准差。若否，调整初始模型中的配置参数，重新对原始训练样本进行二次训练，直至各数据残差的标准差满足对应的阈值时，得到优化模型1.0；

S4：使用验证样本对所述优化模型2.0的精确度进行验证，若精确度大于95％，即为满足精确度要求，所述精确度包括图片特征识别、定损结果分析、赔偿款项的精确度。否则调整模型参数和结构，重复S1-S3，直至满足精度要求；

(4)模型的完善：模型的训练完成后，即可投入实际应用中，依靠最新模型版本对实际应用中的案例进行实时处理，并对最新模型版本得出的评估结果进行检查和筛选，形成增量样本，将所述增量样本添加入所述样本库，更新样本库；同时，定期抽检模型的精准度，当达到一定条件(精确度小于95％)后利用更新样本库对模型按照步骤(3)重新进行训练，实现模型在增量样本的基础上持续优化完善。所述定期抽检模型的方法为：以一天作为一个周期，获取最近一周或一月时间内每天24h的案例，作为单位样本，按照标准抽检法抽取部分案例作为抽检样本，其中抽检样本数量不少于单位样本数量的30％。

值得说明的是，对于本领域技术人员来说，在本发明构思及具体实施例启示下，能够从本发明公开内容及常识直接导出或联想到的一些变形，本领域普通技术人员将意识到也可采用其他方法，或现有技术中常用公知技术的替代，以及特征间的相互不同组合等等的非实质性改动，同样可以被应用，都能实现本发明描述的功能和效果，不再一一举例展开细说，均属于本发明保护范围。

Claims

1.一种移动查勘定损系统的智能训练及完善方法，其特征在于，包括以下步骤：

(1)样本的获取与分类：从移动查勘定损系统的历史数据库中选取若干份完全不同的成功案例放入样本库，并随机分为训练样本、测试样本及验证样本三个组，提取所述训练样本、测试样本及验证样本的模型因子，当训练样本、测试样本及验证样本中含有视频时，需采用等间隔时间段对视频图像进行帧采样，将视频转换为图片格式文件，再对图片格式文件进行图像降噪、图像分辨率、图像色彩及饱和度调节处理；

(2)样本的预处理：根据训练样本的模型因子数量，采用SMOTE算法对训练样本的模型因子进行均衡处理；

(3)模型的训练：

S3：使用所述测试样本对所述优化模型1.0进行测试，测试过程中优化模型1.0的模型参数会发生改变，当模型参数不再发生改变时，测试结束，优化模型1.0更新至优化模型2.0；

2.如权利要求1所述一种移动查勘定损系统的智能训练及完善方法，其特征在于，步骤(1)中所述训练样本、测试样本及验证样本的数量比为8:2:3。

3.如权利要求1所述一种移动查勘定损系统的智能训练及完善方法，其特征在于，步骤(1)中所述模型因子包括车主信息、车辆信息、时间信息、空间信息、伤损信息、保险信息。

4.如权利要求1所述一种移动查勘定损系统的智能训练及完善方法，其特征在于，步骤(3)所述残差的标准差方法为：以二倍标准差作为误差范围，计算出初次预测数据的第一次正常数据范围；结合原始训练样本的实际数据，综合比较得到正常数据范围的上限和下限，计算出初次预测数据的第二次正常数据范围。

5.如权利要求1所述一种移动查勘定损系统的智能训练及完善方法，其特征在于，步骤(3)中所述阈值范围为所述实际数据的残差的标准差。

6.如权利要求1所述一种移动查勘定损系统的智能训练及完善方法，其特征在于，步骤(3)中所述精确度包括图片特征识别、定损结果分析、赔偿款项的精确度。

7.如权利要求1所述一种移动查勘定损系统的智能训练及完善方法，其特征在于，步骤(4)中所述定期抽检模型的方法为：以一天作为一个周期，获取最近一周或一月时间内每天24h的案例，作为单位样本，按照标准抽检法抽取部分案例作为抽检样本，其中抽检样本数量不少于单位样本数量的30％。

8.如权利要求1所述一种移动查勘定损系统的智能训练及完善方法，其特征在于，步骤(4)中所述定期抽检模型的方法为：获取最近一周或一月时间内每天24h的案例，作为单位样本，按照标准抽检法抽取部分案例作为抽检样本，其中抽检样本数量不少于单位样本数量的30％。

9.如权利要求1所述一种移动查勘定损系统的智能训练及完善方法，其特征在于，步骤(4)中所述一定条件为抽检样本的精确度小于95％。