CN108898504B - 一种移动查勘定损系统的智能训练及完善方法 - Google Patents
一种移动查勘定损系统的智能训练及完善方法 Download PDFInfo
- Publication number
- CN108898504B CN108898504B CN201810744398.8A CN201810744398A CN108898504B CN 108898504 B CN108898504 B CN 108898504B CN 201810744398 A CN201810744398 A CN 201810744398A CN 108898504 B CN108898504 B CN 108898504B
- Authority
- CN
- China
- Prior art keywords
- model
- samples
- training
- sample
- assessment system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种移动查勘定损系统的智能训练及完善方法,将样本划分成不同比例的训练样本、测试样本和验证样本,同时根据训练样本的模型因子数量,采用SMOTE算法对训练样本的模型因子进行均衡处理,丰富实际训练样本的数量,且提高样本的训练精度,得到初始模型;利用原始样本初次预测数据与实际数据进行比对,将二者的残差的标准差进行对比,用于调整初始模型的配置参数,可大大降低模型的误差率。在实际应用中,对新案例进行检查和筛选,形成增量样本,用于更新样本库,并且对模型进行抽检,利用更新样本库对模型重新进行训练,实现模型在增量样本的基础上持续优化完善。
Description
技术领域
本发明属于车险查勘技术领域,具体涉及一种移动查勘定损系统的智能训练 及完善方法。
背景技术
对于保险行业来说“互联网+”是一个重要的发展方向。财产保险公司的业 务开展,一般包含承保环节与理赔环节。其中,理赔环节中最重要和最困难的为 现场查勘和定损。
随着竞争越来越激烈,因为事故现场的查勘定损是保险公司工作人员与客户 直接面对沟通的最直接作业环节,该项工作的处理效果如何,将在客户心里造成 最直观的体验,进而决定了客户对保险公司服务水平的判断。因此,多数的保险 公司已经开始重视查勘定损的质量和速率。
传统的车险事故查勘定损环节,查勘人员到达现场,进行拍照取证、填写材 料、初步确定损失等相关动作之后,需要将所有的材料带回公司,然后在业务系 统安排信息录入,然而,在这个过程中,会增加工作人员的工作量,同时还会增 加出错率。无法保证整个理赔流程公平和快速有效的进行。
随着互联网技术的发展与成熟,商业服务入口终端选择移动设备的现象日益 增多。因此,车险移动查勘定损系统应运而生,成为了查勘人员必备的移动设备。 可大大提高查勘人员对于时效性、便利性、准确性的要求。目前,国内多家大型 的保险公司软件服务商在致力于此领域的开发和研究中,但是由于车险移动查勘 定损系统本身具有很高的可信度,需要经过大量的可靠训练和完善进行极致优化, 才能达到即便捷且准确率又高的目的,负责一旦准确率不够要求,即使再便捷也 得不到客户良好的反馈,影响对企业形象的评价。由此可见,对于车险移动查勘 定损系统前期的训练和完善极为重要。
发明内容
针对以上存在的技术问题,本发明提供一种移动查勘定损系统的智能训练及 完善方法。
本发明的技术方案为:一种移动查勘定损系统的智能训练及完善方法,包括 以下步骤:
(1)样本的获取与分类:从移动查勘定损系统的历史数据库中选取若干份 完全不同的成功案例放入样本库,并随机分为训练样本、测试样本及验证样本三 个组,提取所述训练样本、测试样本及验证样本的模型因子;
(2)样本的预处理:根据训练样本的模型因子数量,采用SMOTE算法对 训练样本的模型因子进行均衡处理,丰富训练样本数量,且提高样本的训练精度;
(3)模型的训练:
S1:将原始训练样本及均衡处理后的训练样本的模型因子输入BP神经网络 模型中按批次进行训练,得到初始模型;
S2:将原始训练样本使用所述初始模型进行一次训练,并计算出初次预测数 据,将所述初次预测数据与实际数据进行比对,并计算出初次预测数据残差的标 准差;判断初次预测数据残差的标准差是否满足对应的阈值范围,若否,调整初 始模型中的配置参数,重新对原始训练样本进行二次训练,直至各数据残差的标 准差满足对应的阈值时,得到优化模型1.0;
S3:使用所述测试样本对所述优化模型1.0进行测试,测试过程中优化模型 1.0的模型参数会发生改变,当模型参数不再发生改变时,测试结束,优化模型 1.0更新至优化模型2.0;
S4:使用验证样本对所述优化模型2.0的精确度进行验证,若精确度大于95%, 即为满足精确度要求,否则调整模型参数和结构,重复S1-S3,直至满足精度要 求;
(4)模型的完善:模型的训练完成后,即可投入实际应用中,依靠最新模 型版本对实际应用中的案例进行实时处理,并对最新模型版本得出的评估结果进 行检查和筛选,形成增量样本,将所述增量样本添加入所述样本库,更新样本库; 同时,定期抽检模型的精准度,当达到一定条件后利用更新样本库对模型按照步 骤(3)重新进行训练,实现模型在增量样本的基础上持续优化完善。
进一步地,步骤(1)中所述训练样本、测试样本及验证样本的数量比为8: 2:3,大量训练样本用于进行模型训练,最少占比的测试样本用于对初始模型进 行测试微调,较大量的验证样本用于对测试完毕的模型进行最终验证和优化。
进一步地,步骤(1)中所述模型因子包括车主信息、车辆信息、时间信息、 空间信息、伤损信息、保险信息。
进一步地,当训练样本、测试样本及验证样本中含有视频时,需采用等间隔 时间段对视频图像进行帧采样,将视频转换为图片格式文件,再对图片格式文件 进行图像降噪、图像分辨率、图像色彩及饱和度调节处理。
进一步地,步骤(3)所述残差的标准差方法为:以二倍标准差作为误差范 围,计算出初次预测数据的第一次正常数据范围;结合原始训练样本的实际数据, 综合比较得到正常数据范围的上限和下限,计算出初次预测数据的第二次正常数 据范围。
进一步地,步骤(3)中所述阈值范围为所述实际数据的残差的标准差。
进一步地,步骤(3)中所述精确度包括图片特征识别、定损结果分析、赔 偿款项的精确度。
进一步地,步骤(4)中所述定期抽检模型的方法为:以一天作为一个周期, 获取最近一周或一月时间内每天24h的案例,作为单位样本,按照标准抽检法 抽取部分案例作为抽检样本,其中抽检样本数量不少于单位样本数量的30%。
进一步地,步骤(4)中所述一定条件为抽检样本的精确度小于95%。
与现有技术相比,本发明的有益效果为:本发明的移动查勘定损系统的智能 训练及完善方法,将样本划分成不同比例的训练样本、测试样本和验证样本,同 时根据训练样本的模型因子数量,采用SMOTE算法对训练样本的模型因子进行 均衡处理,丰富实际训练样本的数量,且提高样本的训练精度,得到初始模型; 利用原始样本初次预测数据与实际数据进行比对,将初次预测数据与实际数据的 残差的标准差进行对比,用于调整初始模型的配置参数,可大大降低模型的误差 率。训练结束后,投入实际应用中,对新案例进行检查和筛选,形成增量样本, 用于更新样本库,并且对模型进行抽检,利用更新样本库对模型重新进行训练, 实现模型在增量样本的基础上持续优化完善。
附图说明
图1为本发明的训练及完善方法流程图。
具体实施方式
如图1所示,一种移动查勘定损系统的智能训练及完善方法,包括以下步骤:
(1)样本的获取与分类:从移动查勘定损系统的历史数据库中选取若干份 完全不同的成功案例放入样本库,并随机分为训练样本、测试样本及验证样本三 个组,提取所述训练样本、测试样本及验证样本的模型因子;其中,所述训练样 本、测试样本及验证样本的数量比为8:2:3,具体训练样本为805份、测试样 本202份,验证样本301份;大量训练样本用于进行模型训练,最少占比的测试 样本用于对初始模型进行测试微调,较大量的验证样本用于对测试完毕的模型进 行最终验证和优化。其中,所述模型因子包括车主信息、车辆信息、时间信息、 空间信息、伤损信息、保险信息。其中,当训练样本、测试样本及验证样本中含 有视频时,需采用等间隔时间段对视频图像进行帧采样,将视频转换为图片格式 文件,再对图片格式文件进行图像降噪、图像分辨率、图像色彩及饱和度调节处 理。
(2)样本的预处理:根据训练样本的模型因子数量,采用SMOTE算法对 训练样本的模型因子进行均衡处理,丰富训练样本数量,且提高样本的训练精度;
(3)模型的训练:
S1:将原始训练样本及均衡处理后的训练样本的模型因子输入BP神经网络 模型中按批次进行训练,得到初始模型;
S2:将原始训练样本使用所述初始模型进行一次训练,并计算出初次预测数 据,将所述初次预测数据与实际数据进行比对,并计算出初次预测数据残差的标 准差;所述残差的标准差方法为:以二倍标准差作为误差范围,计算出初次预测 数据的第一次正常数据范围;结合原始训练样本的实际数据,综合比较得到正常 数据范围的上限和下限,计算出初次预测数据的第二次正常数据范围。判断初次 预测数据残差的标准差是否满足对应的阈值范围,所述阈值范围为所述实际数据 的残差的标准差。若否,调整初始模型中的配置参数,重新对原始训练样本进行 二次训练,直至各数据残差的标准差满足对应的阈值时,得到优化模型1.0;
S3:使用所述测试样本对所述优化模型1.0进行测试,测试过程中优化模型 1.0的模型参数会发生改变,当模型参数不再发生改变时,测试结束,优化模型 1.0更新至优化模型2.0;
S4:使用验证样本对所述优化模型2.0的精确度进行验证,若精确度大于95%, 即为满足精确度要求,所述精确度包括图片特征识别、定损结果分析、赔偿款项 的精确度。否则调整模型参数和结构,重复S1-S3,直至满足精度要求;
(4)模型的完善:模型的训练完成后,即可投入实际应用中,依靠最新模 型版本对实际应用中的案例进行实时处理,并对最新模型版本得出的评估结果进 行检查和筛选,形成增量样本,将所述增量样本添加入所述样本库,更新样本库; 同时,定期抽检模型的精准度,当达到一定条件(精确度小于95%)后利用更新 样本库对模型按照步骤(3)重新进行训练,实现模型在增量样本的基础上持续 优化完善。所述定期抽检模型的方法为:以一天作为一个周期,获取最近一周或 一月时间内每天24h的案例,作为单位样本,按照标准抽检法抽取部分案例作 为抽检样本,其中抽检样本数量不少于单位样本数量的30%。
值得说明的是,对于本领域技术人员来说,在本发明构思及具体实施例启示 下,能够从本发明公开内容及常识直接导出或联想到的一些变形,本领域普通技 术人员将意识到也可采用其他方法,或现有技术中常用公知技术的替代,以及特 征间的相互不同组合等等的非实质性改动,同样可以被应用,都能实现本发明描 述的功能和效果,不再一一举例展开细说,均属于本发明保护范围。
Claims (9)
1.一种移动查勘定损系统的智能训练及完善方法,其特征在于,包括以下步骤:
(1)样本的获取与分类:从移动查勘定损系统的历史数据库中选取若干份完全不同的成功案例放入样本库,并随机分为训练样本、测试样本及验证样本三个组,提取所述训练样本、测试样本及验证样本的模型因子,当训练样本、测试样本及验证样本中含有视频时,需采用等间隔时间段对视频图像进行帧采样,将视频转换为图片格式文件,再对图片格式文件进行图像降噪、图像分辨率、图像色彩及饱和度调节处理;
(2)样本的预处理:根据训练样本的模型因子数量,采用SMOTE算法对训练样本的模型因子进行均衡处理;
(3)模型的训练:
S1:将原始训练样本及均衡处理后的训练样本的模型因子输入BP神经网络模型中按批次进行训练,得到初始模型;
S2:将原始训练样本使用所述初始模型进行一次训练,并计算出初次预测数据,将所述初次预测数据与实际数据进行比对,并计算出初次预测数据残差的标准差;判断初次预测数据残差的标准差是否满足对应的阈值范围,若否,调整初始模型中的配置参数,重新对原始训练样本进行二次训练,直至各数据残差的标准差满足对应的阈值时,得到优化模型1.0;
S3:使用所述测试样本对所述优化模型1.0进行测试,测试过程中优化模型1.0的模型参数会发生改变,当模型参数不再发生改变时,测试结束,优化模型1.0更新至优化模型2.0;
S4:使用验证样本对所述优化模型2.0的精确度进行验证,若精确度大于95%,即为满足精确度要求,否则调整模型参数和结构,重复S1-S3,直至满足精度要求;
(4)模型的完善:模型的训练完成后,即可投入实际应用中,依靠最新模型版本对实际应用中的案例进行实时处理,并对最新模型版本得出的评估结果进行检查和筛选,形成增量样本,将所述增量样本添加入所述样本库,更新样本库;同时,定期抽检模型的精准度,当达到一定条件后利用更新样本库对模型按照步骤(3)重新进行训练,实现模型在增量样本的基础上持续优化完善。
2.如权利要求1所述一种移动查勘定损系统的智能训练及完善方法,其特征在于,步骤(1)中所述训练样本、测试样本及验证样本的数量比为8:2:3。
3.如权利要求1所述一种移动查勘定损系统的智能训练及完善方法,其特征在于,步骤(1)中所述模型因子包括车主信息、车辆信息、时间信息、空间信息、伤损信息、保险信息。
4.如权利要求1所述一种移动查勘定损系统的智能训练及完善方法,其特征在于,步骤(3)所述残差的标准差方法为:以二倍标准差作为误差范围,计算出初次预测数据的第一次正常数据范围;结合原始训练样本的实际数据,综合比较得到正常数据范围的上限和下限,计算出初次预测数据的第二次正常数据范围。
5.如权利要求1所述一种移动查勘定损系统的智能训练及完善方法,其特征在于,步骤(3)中所述阈值范围为所述实际数据的残差的标准差。
6.如权利要求1所述一种移动查勘定损系统的智能训练及完善方法,其特征在于,步骤(3)中所述精确度包括图片特征识别、定损结果分析、赔偿款项的精确度。
7.如权利要求1所述一种移动查勘定损系统的智能训练及完善方法,其特征在于,步骤(4)中所述定期抽检模型的方法为:以一天作为一个周期,获取最近一周或一月时间内每天24h的案例,作为单位样本,按照标准抽检法抽取部分案例作为抽检样本,其中抽检样本数量不少于单位样本数量的30%。
8.如权利要求1所述一种移动查勘定损系统的智能训练及完善方法,其特征在于,步骤(4)中所述定期抽检模型的方法为:获取最近一周或一月时间内每天24h的案例,作为单位样本,按照标准抽检法抽取部分案例作为抽检样本,其中抽检样本数量不少于单位样本数量的30%。
9.如权利要求1所述一种移动查勘定损系统的智能训练及完善方法,其特征在于,步骤(4)中所述一定条件为抽检样本的精确度小于95%。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810744398.8A CN108898504B (zh) | 2018-07-09 | 2018-07-09 | 一种移动查勘定损系统的智能训练及完善方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810744398.8A CN108898504B (zh) | 2018-07-09 | 2018-07-09 | 一种移动查勘定损系统的智能训练及完善方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108898504A CN108898504A (zh) | 2018-11-27 |
CN108898504B true CN108898504B (zh) | 2021-12-07 |
Family
ID=64349176
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810744398.8A Active CN108898504B (zh) | 2018-07-09 | 2018-07-09 | 一种移动查勘定损系统的智能训练及完善方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108898504B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110009508A (zh) * | 2018-12-25 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 一种车险自动赔付方法和系统 |
CN110147719A (zh) * | 2019-04-09 | 2019-08-20 | 平安科技(深圳)有限公司 | 车辆定损方法、装置、计算机设备及存储介质 |
CN110046005A (zh) * | 2019-04-15 | 2019-07-23 | 珠海格力电器股份有限公司 | 降低传输流量的产品大数据的模型训练方法 |
CN111309706A (zh) * | 2020-01-20 | 2020-06-19 | 北京明略软件系统有限公司 | 模型训练方法、装置、可读存储介质及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107133436A (zh) * | 2016-02-26 | 2017-09-05 | 阿里巴巴集团控股有限公司 | 一种多重抽样模型训练方法及装置 |
CN108170909A (zh) * | 2017-12-13 | 2018-06-15 | 中国平安财产保险股份有限公司 | 一种智能建模的模型输出方法、设备及存储介质 |
CN108197737A (zh) * | 2017-12-29 | 2018-06-22 | 山大地纬软件股份有限公司 | 一种建立医保住院费用预测模型的方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7801748B2 (en) * | 2003-04-30 | 2010-09-21 | Genworth Financial, Inc. | System and process for detecting outliers for insurance underwriting suitable for use by an automated system |
-
2018
- 2018-07-09 CN CN201810744398.8A patent/CN108898504B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107133436A (zh) * | 2016-02-26 | 2017-09-05 | 阿里巴巴集团控股有限公司 | 一种多重抽样模型训练方法及装置 |
CN108170909A (zh) * | 2017-12-13 | 2018-06-15 | 中国平安财产保险股份有限公司 | 一种智能建模的模型输出方法、设备及存储介质 |
CN108197737A (zh) * | 2017-12-29 | 2018-06-22 | 山大地纬软件股份有限公司 | 一种建立医保住院费用预测模型的方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108898504A (zh) | 2018-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108898504B (zh) | 一种移动查勘定损系统的智能训练及完善方法 | |
CN112017056B (zh) | 一种智能双录方法及系统 | |
US20200242526A1 (en) | Method of improving risk assessment and system thereof | |
AU2018233021A1 (en) | Parcel change detection | |
Li et al. | Cost drivers of software corrective maintenance: An empirical study in two companies | |
CN109767024B (zh) | 件量预测方法及装置、电子设备和存储介质 | |
CN117237126A (zh) | 一种保险平台及保险数据处理方法 | |
KR101851367B1 (ko) | 신용도를 평가하는 방법, 장치 및 컴퓨터 판독 가능한 기록 매체 | |
Herraiz et al. | Impact of installation counts on perceived quality: A case study on debian | |
CN113567605A (zh) | 质量色谱图的自动化解释模型构建方法、装置和电子设备 | |
CN114820618B (zh) | 瑕疵检测模型的训练方法、装置、设备及存储介质 | |
CN116401601A (zh) | 基于逻辑回归模型的停电敏感用户优选处置方法 | |
CN115689331A (zh) | 一种基于mlp的输变电工程量合理性分析方法 | |
CN115239689A (zh) | 一种路面信息的检测、计算方法、检测系统、设备及计算机可读存储介质 | |
CN113537577A (zh) | 收入预测方法、系统、电子设备和计算机可读存储介质 | |
CN114328169A (zh) | 一种动态页面的测试方法及其系统 | |
CN112711933A (zh) | 一种利用电子表格进行寿险精算模型校验的方法 | |
US20150095099A1 (en) | Rapid assessment of emerging risks | |
Hassannezhad et al. | Dynamic modelling of relationships in complex service design systems | |
JP7343646B1 (ja) | 教師データの収集方法 | |
Paradita et al. | Application of Process Mining in the Process of IT Incidents Management by Utilizing Kaggle’s Dataset | |
US20240113936A1 (en) | Method and system for artificial intelligence-based acceleration of zero-touch processing | |
CN115660794A (zh) | 数据检查方法、装置,及电子设备 | |
Sanchez et al. | R&D, Attrition and Multiple Imputation in BRDIS | |
CN113128594A (zh) | 基于跨域数据的评估模型的优化方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |