CN116703612A - 一种汽车保险风险等级评估方法 - Google Patents
一种汽车保险风险等级评估方法 Download PDFInfo
- Publication number
- CN116703612A CN116703612A CN202310527241.0A CN202310527241A CN116703612A CN 116703612 A CN116703612 A CN 116703612A CN 202310527241 A CN202310527241 A CN 202310527241A CN 116703612 A CN116703612 A CN 116703612A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- risk
- data
- automobile insurance
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000012549 training Methods 0.000 claims abstract description 61
- 238000012502 risk assessment Methods 0.000 claims abstract description 23
- 238000011156 evaluation Methods 0.000 claims abstract description 16
- 238000013135 deep learning Methods 0.000 claims abstract description 11
- 238000007781 pre-processing Methods 0.000 claims abstract description 11
- 239000013598 vector Substances 0.000 claims description 78
- 230000004927 fusion Effects 0.000 claims description 18
- 206010039203 Road traffic accident Diseases 0.000 claims description 9
- 238000013527 convolutional neural network Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 9
- 239000000446 fuel Substances 0.000 claims description 8
- 230000001133 acceleration Effects 0.000 claims description 7
- 230000009194 climbing Effects 0.000 claims description 7
- 238000012417 linear regression Methods 0.000 claims description 6
- 238000012423 maintenance Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000011056 performance test Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提供了一种汽车保险风险等级评估方法,属于保险金融技术领域,该汽车保险风险等级评估方法包括采集人员特征数据、车辆特征数据、车辆性能数据;预测车辆出险率数据;对人员特征数据、车辆特征数据、车辆性能数据以及车辆出险率数据进行数据预处理;建立深度学习网络模型,以人员特征数据、车辆特征数据、车辆性能数据以及车辆出险率数据为输入层,以汽车保险风险等级为输出层,对所述深度学习网络模型进行训练,得到汽车保险风险评估模型;利用汽车保险风险评估模型对车辆实际承保风险进行汽车保险风险等级评估。本发明解决了现有的汽车保险风险评估算法存在的评估结果不准确的问题。
Description
技术领域
本发明属于保险金融技术领域,具体而言,涉及一种汽车保险风险等级评估方法。
背景技术
随着我国保险业不断发展壮大,保险在经济社会中发挥的功能和作用越来越突出,尤其是汽车保险(简称车险)在30多年间更得到了迅速发展。然而,近些年行业综合成本率居高不下,车险的发展理念逐渐从“销售为王”向“精细管理”转变。而且,目前行业内常用的车险费率模型中,用于定价的数据维度通常都比较少,从而使车主的个性化风险定价空间有限,好车主和坏车主的车险费差别不大,非常不公平。传统汽车保险风险评估算法技术所提供的车险评估方案,主要是考虑车辆自身的因素,例如车辆品牌、所属车系和车龄等,而车险承保不但与驾驶车辆有关,也与驾驶车辆的人员的自身情况例如有无突发性疾病的因素,或者与驾驶车辆的人员经常行驶的路线发生事故的概率有关,而仅考虑车辆自身因素会导致这种技术存在对车险评估的评估结果不够准确。
公开号为CN109285075B的中国发明专利(申请号CN201710592208.0)公开了一种理赔风险评估方法、装置及服务器,通过利用待估用户的多种行为数据,经预处理得到第一数量维度的初始特征数据,利用特征选择算法对其进行特征筛选,得到第二数量维度的特征变量,并将其划分成第三数量类型的特征集,从而利用机器学习算法,对这第三数量类型的特征集包含的特征变量进行计算,确定待估用户的目标赔付率。由此可见,本申请在预测用户的赔付风险时,充分考虑了待估用户各方面对理赔风险的影响,得到成千上万的预测模型输入变量,降低了个别输入变量扰动对预测结果的干扰,提高了用户赔付风险评估的准确性以及稳定性,以便业务人员针对待估用户指定合理且可靠的投保与理赔方案。
上述专利仅从用户的行为数据上进行车险理赔风险的评估,缺乏对车辆性能、车辆主要形势道路、区间等考虑。
因此,需要设计一款能够从用户行为、车辆向内以及车辆主要行驶道路上进行综合考虑的汽车保险风险评估的方法。
发明内容
有鉴于此,本发明提供一种汽车保险风险等级评估方法,旨在解决现有的汽车保险风险评估算法缺乏对于用户行为、车辆向内以及车辆主要行驶道路上进行综合考虑的技术问题。
本发明是这样实现的:
本发明提供一种汽车保险风险等级评估方法,其中,包括以下步骤:
S1:采集人员特征数据、车辆特征数据及车辆性能数据;
S2:预测车辆出险率数据;
S3:对人员特征数据、车辆特征数据、车辆性能数据以及车辆出险率数据进行数据预处理;
建立深度学习网络模型,以人员特征数据、车辆特征数据、车辆性能数据以及车辆出险率数据为输入层,以汽车保险风险等级为输出层,对所述深度学习网络模型进行训练,得到汽车保险风险评估模型;
S5:利用汽车保险风险评估模型对车辆实际承保风险进行汽车保险风险等级评估;
其中,所述车辆性能数据的获取步骤,具体包括:
第一步:检测得车辆的最高车速、最大爬坡度、起步加速度、百公里耗油量、制动距离的性能数据,作为车辆性能测试结果集,记为数据集;
第二步:根据OpenCV算法中skleam.model selection.train test split()方法用来划分所述数据集;
第三步:对所述数据集中的数据进行特征提取,将所述数据转化为数字特征,其中,获取所述车辆的最高车速的特征向量d、所述车辆最大爬坡度的特征向量e、所述车辆起步加速度的特征向量f、所述车辆百公里耗油量的特征向量g、所述车辆制动距离的性能的特征向量h,所述X′表示对所述数字特征进行归一化处理,实现对所述原始特征向量进行等比缩放,
其中,式中d可等量替换为e、f、g、h,
通过所述数据集中的原始特征向量进行变换把数据映射到[0,1]之间;
第四步:对所述数据特征进行标准化处理,
其中a为所述数据特征的标准差,
其中,式中d可等量替换为e、f、g、h,
通过对所述数据集进行变换把数据变换到均值为0,标准差为1的范围内。
其中,所述车辆的最高车速是指汽车满载时,在平直路况良好的路面上所能达到的最高行驶速度;
所述最大爬坡度是指汽车满载时,在平直路况良好的路面上以最低前进档所能爬行的最大坡度;
所述起步加速度是指是指汽车由静止状态迅速增加行驶速度的能力;
所述百公里油耗量是指汽车在平直路况良好的道路上行驶时每百公里平均燃料消耗量;
所述制动距离指驾驶员踩下制动踏板产生作用至汽车完全停止时,轮胎在路面上出现明显的拓印的距离。
在上述技术方案的基础上,本发明的一种汽车保险风险等级评估方法还可以做如下改进:
其中,所述预测车辆出险率数据的步骤,具体包括:
S2 1:根据车险大数据获取车辆出险信息;
S22:将地图网格化圈定事故高发区域;
S23:根据车辆历史行驶习惯预测车辆出险率数据;
其中,所述车辆出险信息包括所述驾驶人员的常规行驶路线、常规行驶区域以及过去m个时刻内出现过交通事故的数据;所述车辆出险率数据为未来Ts个时刻内该车辆的出现交通事故的概率。
进一步的,所述根据车辆历史行驶习惯预测车辆出险率数据的步骤,具体包括:
步骤一:根据车辆行驶历史划分出车辆行驶的高频路段;
步骤二:将高频路段划分为网格;
步骤三:将任意时刻t的高频道路行车风险抽象为高频道路行车风险的向量空间,即:
式中,Rt表示在时刻t高频道路行车风险向量,Rtn表示n号高频道路网格在时刻t的行车风险值;
步骤四:利用离散时间t,t+1,t+1,...,t+s,可以得到高频道路行车风险状态向量序列,即:
式中,R(t,t+s)为从时刻t到时刻t+s的行车风险序列,Rt表示在时刻t高频道路行车风险向量;R(t+s)表示在时刻t+s的高频道路行车风险向量;
步骤五:利用过去m个时刻来预测未来Ts个时刻的高频道路行车风险向量。
进一步的,所述利用过去m个时刻来预测未来Ts个时刻的高频道路行车风险向量的步骤中,采用多元线性回归模型算法与BP神经网络相结合预测风险结果,其中,
多元线性回归模型的基本定义为:
式中,y为因变量即为未来Ts个时刻的高频道路行车风险向量的预测风险结果,x1,x2,x3,…,xm为变量,β0,β1,β2,…,βm对应回归系数,φ为影响因子;
所述车辆出险率数据为:
式中,P为车辆出险率数据,ε为未来Ts个时刻的高频道路行车风险向量的预测风险结果的权重,y为未来Ts个时刻的高频道路行车风险向量的预测风险结果,θ为过去m个时刻内车辆历史出险总赔付金额的总数,hi为过去m个时刻内车辆历史出险单次赔付的金额,I为过去m个时刻内车辆历史出险的总次数。
进一步的,所述利用过去m个时刻来预测未来Ts个时刻的高频道路行车风险向量的步骤,具体包括以下步骤:
第一步:利用收集到的道路车辆信息进行道路风险评估得到评估结果tR;
第二步:将道路的评估结果发送给云端;
第三步:云端取出道路过去h个时刻的道路行车风险数据;
第四步:利用数据进行预测模型训练,然后得到预测模型数据Model Data;
第五步:利用模型数据Model Data和过去m个时刻道路行车风险数据预测得到未来一个时刻的数据;
第六步:将预测得到的行车风险进行增量训练并得到未来第二个时刻到s个时刻的行车风险向量;
第七步:返回高频道路实时行车风险评估结果和预测得到的未来Ts个时刻数据。
其中,所述对人员特征数据、车辆特征数据以及车辆出险率数据进行数据预处理的步骤中,数据预处理具体包括以下步骤:
步骤一:对数据进行清洗,去除特殊符号,无用的标签以及停用词;
步骤二:使用word2vec模型对数据进行特征采集。
进一步的,步骤二中word2vec模型,用于训练词向量,对输入的文本进行编码,其主要参数包括:
sentences:输入文本;
size:是指特征向量的维度,设置为300;
workers:并行训练的数量,设置为CPU核数;
min count:可以对字典做截断,词频少于min count次数的单词会被丢弃掉,设置值为5;
seed:用于随机数发生器,与初始化词向量有关,值设置为1;
sg:用于设置训练算法,设置sg=1,则采用skip-gram算法。
其中,所述步骤S4具体包括以下步骤:
第一步:构建训练样本,具体是:采集历史多组人员特征数据、车辆特征数据、车辆出险率数据组成人车信息融合数据集以及汽车保险风险等级,形成深度学习网络训练数据集,其中训练样本的输入为多组人车信息融合数据集,训练样本的输出为所述多组人车信息融合数据集对应的汽车保险风险等级;
第二步:设计网络架构和初始化,具体是:构建一个卷积神经网络,其中包含1个输入层,1个骨干层、1个Flatten层,1个输出层;其中,输入层输入的是训练样本中的人车信息融合数据集,骨干层用于将人车信息融合数据集进行归一处理后得到一个包含有人员特征数据、车辆特征数据、车辆出险率数据、车辆性能数据的四维向量,将得到的四维向量利用Flatten层进行展平,将展平后的数据输入4层的节点数为256的激活函数为Relu的全连接网络进行特征提取,得到表示人车信息融合数据的256维的向量,记为第一向量,骨干层进行特征提取所使用网络骨架是DenseNet121,其中,骨干网络DenseNet121由1个包含6个卷积层的Dense Block、1个包含12个卷积层的Dense Block块、1个包含24个卷积层的DenseBlock块和1个包含16个卷积层的Dense Block块依次堆叠而成;Dense Block中每个卷积层的输入为前面所有卷积层的输出;将骨干层的输出数据通过输出层输出为汽车保险风险等级;
第三步:通过卷积神经网络训练得到汽车保险风险评估模型,具体包括前向传播网络训练和反向传播网络训练两个阶段,所述前向传播网络训练是将根据训练样本的输入得到训练样本的输出;所述反向传播网络训练是:当前向传播网络训练的输出结果与期望输出不符时,采用随机梯度下降优化算法进行反向传播网络训练,更新骨干层的参数;
其中,所述评估数据包括人员的年龄、驾龄、历史出险情况、车龄、车辆里程、维修保养记录以及车辆出险率数据;所述评估数据得分的总分为100分;所述理赔额度为根据评估数据计算所得的该车辆在未来Ts个时刻内出险所能赔付的最高额度;所述车险额度为根据所述理赔额度计算所得的该车辆在未来Ts个时刻内所需要支付的总金额;所述车辆出险率数据为该车辆的出现交通事故的概率。
其中,步骤S1中,
所述人员特征数据包括年龄、性别、驾龄、历史出险情况;
所述车辆特征数据包括车龄、车辆购置价、初登日期、发证日期、车辆类型、品牌型号、出险情况、车辆里程、维修保养记录。
进一步的,所述汽车保险风险等级为车辆在未来Ts个时刻内理赔的概率等级,所述汽车保险风险等级为1~5级,其中,1~2级为低风险,3~4级中风险,5级为高风险;其中:
当所述汽车保险风险等级为1级时,所述理赔额度为10万元,所述车险额度为5000元;
当所述汽车保险风险等级为2级时,所述理赔额度为20万元,所述车险额度为8000元;
当所述汽车保险风险等级为3级时,所述理赔额度为50万元,所述车险额度为12000元;
当所述汽车保险风险等级为4级时,所述理赔额度为100万元,所述车险额度为15000元;
当所述汽车保险风险等级为5级时,所述理赔额度为150万元,所述车险额度为20000元。
与现有技术相比较,本发明提供的一种汽车保险风险等级评估方法的有益效果是:与现有技术相比较,本发明提供的一种汽车保险风险等级评估方法的有益效果是:与传统评估相比,能对用户行为、车辆向内以及车辆主要行驶道路上进行综合考虑,以使得评估结果更加准确。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为一种汽车保险风险等级评估方法的流程图;
图2为预测车辆出险率的流程图。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
如图1所示,是本发明提供的一种汽车保险风险等级评估方法的第一实施例,在本实施例中,包括以下步骤:
S1:采集人员特征数据、车辆特征数据及车辆性能数据;
S2:预测车辆出险率数据;
S3:对人员特征数据、车辆特征数据、车辆性能数据以及车辆出险率数据进行数据预处理;
建立深度学习网络模型,以人员特征数据、车辆特征数据、车辆性能数据以及车辆出险率数据为输入层,以汽车保险风险等级为输出层,对所述深度学习网络模型进行训练,得到汽车保险风险评估模型;
S5:利用汽车保险风险评估模型对车辆实际承保风险进行汽车保险风险等级评估;
其中,所述车辆性能数据的获取步骤,具体包括:
第一步:检测得车辆的最高车速、最大爬坡度、起步加速度、百公里耗油量、制动距离的性能数据,作为车辆性能测试结果集,记为数据集;
第二步:根据OpenCV算法中skleam.model selection.train test split()方法用来划分所述数据集;
第三步:对所述数据集中的数据进行特征提取,将所述数据转化为数字特征,其中,获取所述车辆的最高车速的特征向量d、所述车辆最大爬坡度的特征向量e、所述车辆起步加速度的特征向量f、所述车辆百公里耗油量的特征向量g、所述车辆制动距离的性能的特征向量h,所述X′表示对所述数字特征进行归一化处理,实现对所述原始特征向量进行等比缩放,
其中,式中d可等量替换为e、f、g、h,
通过所述数据集中的原始特征向量进行变换把数据映射到[0,1]之间;
第四步:对所述数据特征进行标准化处理,
其中a为所述数据特征的标准差,
其中,式中d可等量替换为e、f、g、h,
通过对所述数据集进行变换把数据变换到均值为0,标准差为1的范围内。
其中,在上述技术方案中,预测车辆出险率数据的步骤,具体包括:
S21:根据车险大数据获取车辆出险信息;
S22:将地图网格化固定事故高发区域;
S23:根据车辆历史行驶习惯预测车辆出险率数据;
其中,车辆出险信息包括驾驶人员的常规行驶路线、常规行驶区域以及过去m个时刻内出现过交通事故的数据;车辆出险率数据为未来Ts个时刻内该车辆的出现交通事故的概率。
进一步的,在上述技术方案中,根据车辆历史行驶习惯预测车辆出险率数据的步骤,具体包括:
步骤一:根据车辆行驶历史划分出车辆行驶的高频路段;
步骤二:将高频路段划分为网格;
步骤三:将任意时刻t的高频道路行车风险抽象为高频道路行车风险的向量空间,即:
式中,Rt表示在时刻t高频道路行车风险向量,Rtn表示n号高频道路网格在时刻t的行车风险值;
步骤四:利用离散时间t,t+1,t+1,...,t+s,可以得到高频道路行车风险状态向量序列,即:
式中,R(t,t+s)为从时刻t到时刻t+s的行车风险序列,Rt表示在时刻t高频道路行车风险向量;R(t+s)表示在时刻t+s的高频道路行车风险向量;
步骤五:利用过去m个时刻来预测未来Ts个时刻的高频道路行车风险向量。
进一步的,在上述技术方案中,利用过去m个时刻来预测未来Ts个时刻的高频道路行车风险向量的步骤中,采用多元线性回归模型算法与BP神经网络相结合预测风险结果,其中,
多元线性回归模型的基本定义为:
式中,y为因变量即为未来Ts个时刻的高频道路行车风险向量的预测风险结果,x1,x2,x3,...,xm为变量,β0,β1,β2,...,βm对应回归系数,为影响因子;
车辆出险率数据为:
式中,P为车辆出险率数据,ε为未来Ts个时刻的高频道路行车风险向量的预测风险结果的权重,y为未来Ts个时刻的高频道路行车风险向量的预测风险结果,θ为过去m个时刻内车辆历史出险总赔付金额的总数,hi为过去m个时刻内车辆历史出险单次赔付的金额,I为过去m个时刻内车辆历史出险的总次数。
进一步的,在上述技术方案中,利用过去m个时刻来预测未来Ts个时刻的高频道路行车风险向量的步骤,具体包括以下步骤:
第一步:利用收集到的道路车辆信息进行道路风险评估得到评估结果tR;
第二步:将道路的评估结果发送给云端;
第三步:云端取出道路过去h个时刻的道路行车风险数据;
第四步:利用数据进行预测模型训练,然后得到预测模型数据Model Data;
第五步:利用模型数据Model Data和过去m个时刻道路行车风险数据预测得到未来一个时刻的数据;
第六步:将预测得到的行车风险进行增量训练并得到未来第二个时刻到s个时刻的行车风险向量;
第七步:返回高频道路实时行车风险评估结果和预测得到的未来Ts个时刻数据。
其中,在上述技术方案中,对人员特征数据、车辆特征数据以及车辆出险率数据进行数据预处理的步骤中,数据预处理具体包括以下步骤:
步骤一:对数据进行清洗,去除特殊符号,无用的标签以及停用词;
步骤二:使用word2vec模型对数据进行特征采集。
进一步的,在上述技术方案中,步骤二中word2vec模型,用于训练词向量,对输入的文本进行编码,其主要参数包括:
sentences:输入文本;
size:是指特征向量的维度,设置为300;
workers:并行训练的数量,设置为CPU核数;
min count:可以对字典做截断,词频少于min count次数的单词会被丢弃掉,设置值为5;
seed:用于随机数发生器,与初始化词向量有关,值设置为1;
sg:用于设置训练算法,设置sg=1,则采用skip-gram算法。
其中,在上述技术方案中,步骤S4具体包括以下步骤:
第一步:构建训练样本,具体是:采集历史多组人员特征数据、车辆特征数据、车辆出险率数据组成人车信息融合数据集以及汽车保险风险等级,形成深度学习网络训练数据集,其中训练样本的输入为多组人车信息融合数据集,训练样本的输出为多组人车信息融合数据集对应的汽车保险风险等级;
第二步:设计网络架构和初始化,具体是:构建一个卷积神经网络,其中包含1个输入层,1个骨干层、1个Flatten层,1个输出层;其中,输入层输入的是训练样本中的人车信息融合数据集,骨干层用于将人车信息融合数据集进行归一处理后得到一个包含有人员特征数据、车辆特征数据、车辆出险率数据、车辆性能数据的四维向量,将得到的四维向量利用Flatten层进行展平,将展平后的数据输入4层的节点数为256的激活函数为Relu的全连接网络进行特征提取,得到表示人车信息融合数据的256维的向量,记为第一向量,骨干层进行特征提取所使用网络骨架是DenseNet121,其中,骨干网络DenseNet121由1个包含6个卷积层的Dense Block、1个包含12个卷积层的Dense Block块、1个包含24个卷积层的DenseBlock块和1个包含16个卷积层的Dense Block块依次堆叠而成;Dense Block中每个卷积层的输入为前面所有卷积层的输出;将骨干层的输出数据通过输出层输出为汽车保险风险等级;
第三步:通过卷积神经网络训练得到汽车保险风险评估模型,具体包括前向传播网络训练和反向传播网络训练两个阶段,前向传播网络训练是将根据训练样本的输入得到训练样本的输出;反向传播网络训练是:当前向传播网络训练的输出结果与期望输出不符时,采用随机梯度下降优化算法进行反向传播网络训练,更新骨干层的参数;
其中,评估数据包括人员的年龄、驾龄、历史出险情况、车龄、车辆里程、维修保养记录以及车辆出险率数据;评估数据得分的总分为100分;理赔额度为根据评估数据计算所得的该车辆在未来Ts个时刻内出险所能赔付的最高额度;车险额度为根据理赔额度计算所得的该车辆在未来Ts个时刻内所需要支付的总金额;所述车辆出险率数据为该车辆的出现交通事故的概率。
其中,在上述技术方案中,步骤S1中,
人员特征数据包括年龄、性别、驾龄、历史出险情况;
车辆特征数据包括车龄、车辆购置价、初登日期、发证日期、车辆类型、品牌型号、出险情况、车辆里程、维修保养记录。
进一步的,在上述技术方案中,汽车保险风险等级为车辆在未来Ts个时刻内理赔的概率等级,汽车保险风险等级为1~5级,其中,1~2级为低风险,3~4级中风险,5级为高风险;其中:
当汽车保险风险等级为1级时,理赔额度为10万元,车险额度为5000元;
当汽车保险风险等级为2级时,理赔额度为20万元,车险额度为8000元;
当汽车保险风险等级为3级时,理赔额度为50万元,车险额度为12000元;
当汽车保险风险等级为4级时,理赔额度为100万元,车险额度为15000元;
当汽车保险风险等级为5级时,理赔额度为150万元,车险额度为20000元。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种汽车保险风险等级评估方法,其特征在于,包括以下步骤:
S1:采集人员特征数据、车辆特征数据及车辆性能数据;
S2:预测车辆出险率数据;
S3:对人员特征数据、车辆特征数据、车辆性能数据以及车辆出险率数据进行数据预处理;
S4:建立深度学习网络模型,以人员特征数据、车辆特征数据、车辆性能数据以及车辆出险率数据为输入层,以汽车保险风险等级为输出层,对所述深度学习网络模型进行训练,得到汽车保险风险评估模型;
S5:利用汽车保险风险评估模型对车辆实际承保风险进行汽车保险风险等级评估;
其中,所述车辆性能数据的获取步骤,具体包括:
第一步:检测得车辆的最高车速、最大爬坡度、起步加速度、百公里耗油量、制动距离的性能数据,作为车辆性能测试结果集,记为数据集;
第二步:根据OpenCV算法中skleam.model selection.train test split()方法用来划分所述数据集;
第三步:对所述数据集中的数据进行特征提取,将所述数据转化为数字特征,其中,获取所述车辆的最高车速的特征向量d、所述车辆最大爬坡度的特征向量e、所述车辆起步加速度的特征向量f、所述车辆百公里耗油量的特征向量g、所述车辆制动距离的性能的特征向量h,所述X′表示对所述数字特征进行归一化处理,实现对所述原始特征向量进行等比缩放,
其中,式中d可等量替换为e、f、g、h,
通过所述数据集中的原始特征向量进行变换把数据映射到[0,1]之间;
第四步:对所述数据特征进行标准化处理,
其中a为所述数据特征的标准差,
其中,式中d可等量替换为e、f、g、h,
通过对所述数据集进行变换把数据变换到均值为0,标准差为1的范围内。
2.根据权利要求1所述的一种汽车保险风险等级评估方法,其特征在于,所述预测车辆出险率数据的步骤,具体包括:
S21:根据车险大数据获取车辆出险信息;
S22:将地图网格化圈定事故高发区域;
S23:根据车辆历史行驶习惯预测车辆出险率数据;
其中,所述车辆出险信息包括所述驾驶人员的常规行驶路线、常规行驶区域以及过去m个时刻内出现过交通事故的数据;所述车辆出险率数据为未来Ts个时刻内该车辆的出现交通事故的概率。
3.根据权利要求2所述的一种汽车保险风险等级评估方法,其特征在于,所述根据车辆历史行驶习惯预测车辆出险率数据的步骤,具体包括:
步骤一:根据车辆行驶历史划分出车辆行驶的高频路段;
步骤二:将高频路段划分为网格;
步骤三:将任意时刻t的高频道路行车风险抽象为高频道路行车风险的向量空间,即:
式中,Rt表示在时刻t高频道路行车风险向量,Rtn表示n号高频道路网格在时刻t的行车风险值;
步骤四:利用离散时间t,t+1,t+1,...,t+s,可以得到高频道路行车风险状态向量序列,即:
式中,R(t,t+s)为从时刻t到时刻t+s的行车风险序列,Rt表示在时刻t高频道路行车风险向量;R(t+s)表示在时刻t+s的高频道路行车风险向量;
步骤五:利用过去m个时刻来预测未来Ts个时刻的高频道路行车风险向量。
4.根据权利要求3所述的一种汽车保险风险等级评估方法,其特征在于,所述利用过去m个时刻来预测未来Ts个时刻的高频道路行车风险向量的步骤中,采用多元线性回归模型算法与BP神经网络相结合预测风险结果,其中,
多元线性回归模型的基本定义为:
式中,y为因变量即为未来Ts个时刻的高频道路行车风险向量的预测风险结果,x1,x2,x3,...,xm为变量,β0,β1,β2,...,βm对应回归系数,为影响因子;
所述车辆出险率数据为:
式中,P为车辆出险率数据,ε为未来Ts个时刻的高频道路行车风险向量的预测风险结果的权重,y为未来Ts个时刻的高频道路行车风险向量的预测风险结果,θ为过去m个时刻内车辆历史出险总赔付金额的总数,h_i为过去m个时刻内车辆历史出险单次赔付的金额,I为过去m个时刻内车辆历史出险的总次数。
5.根据权利要求4所述的一种汽车保险风险等级评估方法,其特征在于,所述利用过去m个时刻来预测未来Ts个时刻的高频道路行车风险向量的步骤,具体包括以下步骤:
第一步:利用收集到的道路车辆信息进行道路风险评估得到评估结果tR;
第二步:将道路的评估结果发送给云端;
第三步:云端取出道路过去h个时刻的道路行车风险数据;
第四步:利用数据进行预测模型训练,然后得到预测模型数据Model Data;
第五步:利用模型数据Model Data和过去m个时刻道路行车风险数据预测得到未来一个时刻的数据;
第六步:将预测得到的行车风险进行增量训练并得到未来第二个时刻到s个时刻的行车风险向量;
第七步:返回高频道路实时行车风险评估结果和预测得到的未来Ts个时刻数据。
6.根据权利要求1所述的一种汽车保险风险等级评估方法,其特征在于,所述对人员特征数据、车辆特征数据以及车辆出险率数据进行数据预处理的步骤中,数据预处理具体包括以下步骤:
步骤一:对数据进行清洗,去除特殊符号,无用的标签以及停用词;
步骤二:使用word2vec模型对数据进行特征采集。
7.根据权利要求6所述的一种汽车保险风险等级评估方法,其特征在于,步骤二中word2vec模型,用于训练词向量,对输入的文本进行编码,其主要参数包括:
sentences:输入文本;
size:是指特征向量的维度,设置为300;
workers:并行训练的数量,设置为CPU核数;
min count:可以对字典做截断,词频少于min count次数的单词会被丢弃掉,设置值为5;
seed:用于随机数发生器,与初始化词向量有关,值设置为1;
sg:用于设置训练算法,设置sg=1,则采用skip-gram算法。
8.根据权利要求1所述的一种汽车保险风险等级评估方法,其特征在于,所述步骤S4具体包括以下步骤:
第一步:构建训练样本,具体是:采集历史多组人员特征数据、车辆特征数据、车辆性能数据、车辆出险率数据组成人车信息融合数据集以及汽车保险风险等级,形成深度学习网络训练数据集,其中训练样本的输入为多组人车信息融合数据集,训练样本的输出为所述多组人车信息融合数据集对应的汽车保险风险等级;
第二步:设计网络架构和初始化,具体是:构建一个卷积神经网络,其中包含1个输入层,1个骨干层、1个Flatten层,1个输出层;其中,输入层输入的是训练样本中的人车信息融合数据集,骨干层用于将人车信息融合数据集进行归一处理后得到一个包含有人员特征数据、车辆特征数据、车辆性能数据、车辆出险率数据的四维向量,将得到的四维向量利用Flatten层进行展平,将展平后的数据输入4层的节点数为256的激活函数为Relu的全连接网络进行特征提取,得到表示人车信息融合数据的256维的向量,记为第一向量,骨干层进行特征提取所使用网络骨架是DenseNet121,其中,骨干网络DenseNet121由1个包含6个卷积层的Dense Block、1个包含12个卷积层的Dense Block块、1个包含24个卷积层的DenseBlock块和1个包含16个卷积层的Dense Block块依次堆叠而成;Dense Block中每个卷积层的输入为前面所有卷积层的输出;将骨干层的输出数据通过输出层输出为汽车保险风险等级;
第三步:通过卷积神经网络训练得到汽车保险风险评估模型,具体包括前向传播网络训练和反向传播网络训练两个阶段,所述前向传播网络训练是将根据训练样本的输入得到训练样本的输出;所述反向传播网络训练是:当前向传播网络训练的输出结果与期望输出不符时,采用随机梯度下降优化算法进行反向传播网络训练,更新骨干层的参数;
其中,所述评估数据包括人员的年龄、驾龄、历史出险情况、车龄、车辆里程、维修保养记录以及车辆出险率数据;所述评估数据得分的总分为100分;所述理赔额度为根据评估数据计算所得的该车辆在未来Ts个时刻内出险所能赔付的最高额度;所述车险额度为根据所述理赔额度计算所得的该车辆在未来Ts个时刻内所需要支付的总金额;所述车辆出险率数据为该车辆的出现交通事故的概率。
9.根据权利要求1所述的一种汽车保险风险等级评估方法,其特征在于,步骤S1中,
所述人员特征数据包括年龄、性别、驾龄、历史出险情况;
所述车辆特征数据包括车龄、车辆购置价、初登日期、发证日期、车辆类型、品牌型号、出险情况、车辆里程、维修保养记录。
10.根据权利要求8所述的一种汽车保险风险等级评估方法,其特征在于,所述汽车保险风险等级为车辆在未来Ts个时刻内理赔的概率等级,所述汽车保险风险等级为1~5级,其中,1~2级为低风险,3~4级中风险,5级为高风险;其中:
当所述汽车保险风险等级为1级时,所述理赔额度为10万元,所述车险额度为5000元;
当所述汽车保险风险等级为2级时,所述理赔额度为20万元,所述车险额度为8000元;
当所述汽车保险风险等级为3级时,所述理赔额度为50万元,所述车险额度为12000元;
当所述汽车保险风险等级为4级时,所述理赔额度为100万元,所述车险额度为15000元;
当所述汽车保险风险等级为5级时,所述理赔额度为150万元,所述车险额度为20000元。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310527241.0A CN116703612A (zh) | 2023-05-11 | 2023-05-11 | 一种汽车保险风险等级评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310527241.0A CN116703612A (zh) | 2023-05-11 | 2023-05-11 | 一种汽车保险风险等级评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116703612A true CN116703612A (zh) | 2023-09-05 |
Family
ID=87826805
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310527241.0A Pending CN116703612A (zh) | 2023-05-11 | 2023-05-11 | 一种汽车保险风险等级评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116703612A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117541403A (zh) * | 2023-11-17 | 2024-02-09 | 德联易控科技(北京)有限公司 | 一种风险数据库构建方法、装置、电子设备和可读介质 |
-
2023
- 2023-05-11 CN CN202310527241.0A patent/CN116703612A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117541403A (zh) * | 2023-11-17 | 2024-02-09 | 德联易控科技(北京)有限公司 | 一种风险数据库构建方法、装置、电子设备和可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109840660B (zh) | 一种车辆特征数据处理方法及车辆风险预测模型训练方法 | |
US20200134735A1 (en) | Enhancement using analytics based on vehicle kinematic data | |
CN104331953A (zh) | 一种基于物联网技术的汽车行为数据识别与管理方法 | |
CN111477005B (zh) | 一种基于车辆状态及行车环境的智能感知预警方法及系统 | |
CN111242484A (zh) | 基于转移概率的车辆风险综合评价方法 | |
Hu et al. | Advancing usage‐based insurance–a contextual driving risk modelling and analysis approach | |
CN111667693B (zh) | 用于确定预计到达时间的方法、装置、设备及介质 | |
CN116628455B (zh) | 一种城市交通碳排放监测与决策支持方法及系统 | |
CN116703612A (zh) | 一种汽车保险风险等级评估方法 | |
CN112508622A (zh) | 基于改进云模型的出租车服务水平评价系统及评价方法 | |
CN112579900A (zh) | 二手车置换信息推荐方法、系统及设备 | |
Gao et al. | What can we learn from telematics car driving data: A survey | |
Wang et al. | ARIMA model and few-shot learning for vehicle speed time series analysis and prediction | |
CN113962600A (zh) | 一种交通安全风险诊断方法及装置 | |
CN113379318A (zh) | 公共交通系统运营服务质量评价方法、装置和计算机设备 | |
CN116663742A (zh) | 基于多因素和模型融合的区域运力预测方法 | |
CN114580874B (zh) | 一种适用于高速公路风险评估的多维分布式数据分析系统 | |
CN115565376A (zh) | 融合graph2vec、双层LSTM的车辆行程时间预测方法及系统 | |
Yuan et al. | A gray prediction method for economic loss of road traffic accidents based on Logistic model. | |
Ping et al. | Spectral clustering based approach for evaluating the effect of driving behavior on fuel economy | |
Liu et al. | Using classification and regression tree and dimension reduction in analyzing motor vehicle traffic accidents | |
Kang | Data and Algorithmic Modeling Approaches in Crash Analysis | |
CN116665342B (zh) | 新能源汽车驾驶行为分析方法、系统及设备 | |
Ma et al. | A Scoping Review of Energy-Efficient Driving Behaviors and Applied State-of-the-Art AI Methods | |
CN113191595B (zh) | 车辆运营全生命周期成本关联数据分析方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |