CN109544351B

CN109544351B - 车辆风险评估方法、装置、计算机设备及存储介质

Info

Publication number: CN109544351B
Application number: CN201811187934.5A
Authority: CN
Inventors: 韩伟; 邓坤; 王建明; 肖京
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2018-10-12
Filing date: 2018-10-12
Publication date: 2024-05-07
Anticipated expiration: 2038-10-12
Also published as: CN109544351A

Abstract

本发明涉及预测模型领域，公开了一种车辆风险评估方法、装置、计算机设备及存储介质。所述方法包括：获取车辆的车险评估初始数据，根据所述车险评估初始数据生成车险评估数据，所述车险评估数据包括驾驶风险特征；根据预设高重要度特征列表，从所述车险评估数据的驾驶风险特征中提取高重要度特征；将所述高重要度特征输入预设逻辑斯蒂回归模型，计算并得到所述车辆的风险指数。相较于现有技术，本发明所获得的车辆的风险系数可以更客观地反映车辆发生事故的概率，进而确定一个更为合理的保险费用，兼顾保险公司与投保人之间的利益。

Description

车辆风险评估方法、装置、计算机设备及存储介质

技术领域

本发明涉及预测模型领域，尤其涉及一种车辆风险评估方法、装置、计算机设备及存储介质。

背景技术

现有车辆的保险费率通常依据车辆的价格、车龄和所行驶的城市等因素进行确定。然而，车辆发生事故的因素复杂多样，仅依据少量的因素进行参考，无法反映车辆发生风险的真实水平。这样常常会造成一些低风险的投保人投保意愿不足，而一些高风险的投保人会产生较多的理赔，影响保险公司的营收。

随着科学技术的进步，收集车辆、驾驶人以及车辆所在环境的信息已变得可行。但现有还没有合理的方案处理上述信息，计算车辆的风险系数，从而确定更为恰当的保险费用。

发明内容

基于此，有必要针对上述技术问题，提供一种车辆风险评估方法、装置、计算机设备及存储介质，以更好反映车辆的实际风险水平。

一种车辆风险评估方法，包括：

获取车辆的车险评估初始数据，根据所述车险评估初始数据生成车险评估数据，所述车险评估数据包括驾驶风险特征；

根据预设高重要度特征列表，从所述车险评估数据的驾驶风险特征中提取高重要度特征；

将所述高重要度特征输入预设逻辑斯蒂回归模型，计算并得到所述车辆的风险指数。

一种车辆风险评估装置，包括：

获取模块，用于获取车辆的车险评估初始数据，根据所述车险评估初始数据生成车险评估数据，所述车险评估数据包括驾驶风险特征；

输入模块，用于根据预设高重要度特征列表，从所述车险评估数据的驾驶风险特征中提取高重要度特征；

计算模块，用于将所述高重要度特征输入预设逻辑斯蒂回归模型，计算并得到所述车辆的风险指数。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述车辆风险评估方法的步骤。

一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如上述车辆风险评估方法的步骤。

本发明通过获取车辆的车险评估初始数据，车险评估初始数据经初步处理后获得车险评估数据，然后使用预设高重要度特征列表对车险评估数据中的驾驶风险特征进行筛选，获得高重要度特征，最后将高重要度特征输入预设逻辑斯蒂回归模型中，输出车辆的风险系数。由于经过预设高重要度特征列表的筛选，本发明可以减少车险评估初始数据中非重要的特征的干扰，同时减少运算量。相较于现有技术，本发明所获得的车辆的风险系数可以更客观地反映车辆发生事故的概率，进而确定一个更为合理的保险费用，兼顾保险公司与投保人之间的利益。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例中车辆风险评估方法的一应用环境示意图；

图2是本发明一实施例中车辆风险评估方法的一流程示意图；

图3是本发明一实施例中车辆风险评估方法的一流程示意图；

图4是本发明一实施例中车辆风险评估方法的一流程示意图；

图5是本发明一实施例中车辆风险评估方法的一流程示意图；

图6是本发明一实施例中车辆风险评估方法的一流程示意图；

图7是本发明一实施例中车辆风险评估方法的一流程示意图；

图8是本发明一实施例中车辆风险评估方法的一流程示意图；

图9是本发明一实施例中车辆风险评估装置的一结构示意图；

图10是本发明一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供的车辆风险评估方法，可应用在如图1的应用环境中，其中，客户端通过网络与服务端进行通信。其中，客户端包括但不限于各种车载导航仪、与车辆绑定的智能手机、行车记录仪或其他终端设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一实施例中，如图2所示，提供一种车辆风险评估方法，以该方法应用在图1中的服务器为例进行说明，包括如下步骤：

S10、获取车辆的车险评估初始数据，根据所述车险评估初始数据生成车险评估数据，所述车险评估数据包括驾驶风险特征。

具体的，车险评估初始数据可从车辆、驾驶人和车辆所处环境等方面获取，包括但不限定于车辆数据、驾驶数据、环境数据。其中，车辆数据指的是车辆本身的数据，包括但不限于车辆价格、购买时间。驾驶数据指的是车辆在行驶过程中产生的可测量数据，包括但不限于驾驶时间、速度、接听电话记录。环境数据指的是过去的一段时间内车辆所经过的行驶路线上的环境数据，包括但不限于车辆所在城市的天气信息、行驶路线上的交通状况、行驶路线的所在路段的道路质量。

也就是说车险评估初始数据可以从多个途径获取与车辆相关的信息。这些途径的源头包括但不限于驾驶人的智能手机、联网的车载设备、设置于行驶路线上的物联网设备。

车险评估数据可以沿用部分车险评估初始数据，如车辆价格、购买时间等，还包括基于车险评估初始数据生成的统计数据，如指定周期内的刹车次数、平均速度区间范围、加速度区间范围、开车时间段等。

车险评估数据可以如下表所示。

表1车险评估数据中的驾驶风险特征

车辆ID	特征1	特征2	特征3	……	特征n
						012345	A₁	A₂	A₃	……	A_n

上表中，车辆ID为车辆的标识，特征1表示第一个驾驶风险特征，特征n表示第n个驾驶风险特征；A₁为第一个驾驶风险特征对应的特征值，A_n为第n个驾驶风险特征对应的特征值，以此类推。

S20、根据预设高重要度特征列表，从所述车险评估数据的驾驶风险特征中提取高重要度特征。

本实施例中，预设高重要度特征列表包括多个高重要度特征。高重要度特征可以根据训练好的驾驶风险特征评价模型获得。驾驶风险特征评价模型是由包括多个不同用户的车险评估样本的第一训练集经多次迭代计算所构建的。经多次迭代计算后，建立驾驶风险特征评价模型，并获得各个驾驶风险特征的重要度，然后设置一重要度阈值，将重要度高于该重要度阈值的驾驶风险特征标记为高重要度特征；将重要度低于或等于重要度阈值的驾驶风险特征标记为低权重特征。例如，预设高重要度特征列表包括：特征3、特征8、特征10、……特征m；提取的高重要度特征可以表示为：

表2经预设高重要度特征列表提取的高重要度特征

车辆ID	特征3	特征8	特征10	……	特征m
						012345	A₃	A₈	A₁₀	……	A_m

上表中，特征3表示第三个驾驶风险特征，特征m表示第m个驾驶风险特征；A₃为第三个驾驶风险特征对应的特征值，A_m为第m个驾驶风险特征对应的特征值，以此类推。

经步骤S20处理，高重要度特征的数量将大大小于原来的车险评估数据所包含的驾驶风险特征的数量。在一实例中，高重要度特征的数量为驾驶风险特征的数量的三分之一或更低。

S30、将所述高重要度特征输入预设逻辑斯蒂回归模型，计算并得到所述车辆的风险指数。

本实施例中，预设逻辑斯蒂回归模型是基于包括多个车辆风险样本的第二训练集训练获得的，用于根据模型输入数据计算车辆的风险指数。其中，车辆风险样本包括多个高重要度特征及其特征值。预设逻辑斯蒂回归模型是基于逻辑斯蒂回归算法构建的。

步骤S10-S30中，获取车辆的车险评估初始数据，根据所述车险评估初始数据生成车险评估数据，所述车险评估数据包括驾驶风险特征，以获取车险评估数据，保证车险风险评估的准确性。根据预设高重要度特征列表，从所述车险评估数据的驾驶风险特征中提取高重要度特征，以对车险评估数据进行精简，减少数据处理量。将所述高重要度特征输入预设逻辑斯蒂回归模型，计算并得到所述车辆的风险指数，实现了对车辆风险进行客观的评估，计算速断快。相较于现有技术，本方法所获得的车辆的风险系数可以更客观地反映车辆发生事故的概率，进而确定一个更为合理的保险费用，兼顾保险公司与投保人之间的利益。

可选的，如图3所示，步骤S10包括：

S101、与所述车辆的车载终端建立连接；

具体的，车载终端具有无线通信功能或者与具有网络访问功能的终端相连接。若车载终端具有连接网络的功能，则可以建立服务端与车载终端的连接。若车载终端不具有连接网络的功能，但具有蓝牙连接功能，则可以使用智能手机与车载终端建立蓝牙连接，智能手机与服务端通过移动网络建立连接，从而建立“车载终端-智能手机-服务端”的连接。

S102、从所述车载终端获取指定时间内的车辆性能数据；

具体的，车辆性能数据包括但不限于购买时间、行驶里程、车辆价值、车辆型号、部件性能。其中，部件性能指的是发动机、底盘、车身、电器设备等的相关参数。部分车辆性能数据可以通过设置于车辆上的传感器而获得，这一部分的车辆性能数据可以是行驶里程、发动机故障率、汽车电池使已工作的时长。另外一部分车辆性能数据则由工作人员经调查后，通过输入终端传送给服务端。指定时间可以根据实际要求而设定，可以是半年，一年，或者其他时间。服务端从车载终端获取到一组包含不同特征的车辆性能数据。在获取车辆性能数据之前，服务端需经过授权操作，方可获得车载终端提供的数据。

S103、根据所述车辆性能数据生成所述车险评估数据。

本实施例中，可以设置处理规则，以将从不同车型的车载终端获得的差异化的车辆性能数据转化为统一形式的车险评估数据。例如，一些车辆的行驶里程使用英制单位，在车辆性能数据中表示为英里数，经处理后，车辆的行驶里程在车辆基础数据中表示为公里数。车险评估数据可以表示为：驾驶风险特征1，特征值1；驾驶风险特征2，特征值2；驾驶风险特征3，特征值3；……驾驶风险特征p，特征值p。本实施例所获得的车险评估数据包括与车辆性能相关的驾驶风险特征。

步骤S101-S103中，与所述车辆的车载终端建立连接，以实现服务端与车载终端建立数据传送通道。从所述车载终端获取指定时间内的车辆性能数据，以实现服务端直接从车载终端获取车辆性能数据，提高获取车辆性能数据的效率。根据所述车辆性能数据生成所述车险评估数据，以实现将车辆性能数据转化为车辆基础数据，提高了车辆性能数据的可利用率。

可选的，如图4所示，步骤S10包括：

S101、与所述车辆的车载终端建立连接；

S104、从所述车载终端获取指定时间内的车辆运行数据。

本实施例中，服务端还可以从车载终端获取指定时间内的车辆运行数据。车辆运行数据包括但不限于车速、使用起始时间、使用结束时间、方向控制记录、刹车次数、换挡记录。若车辆具有车载电话功能，车辆运行数据还可以包括接听电话记录。指定时间可以根据实际要求而设定，可以是半年，一年，或者其他时间。

S105、按预设驾驶行为规则处理所述车辆运行数据，生成车险评估数据。

具体的，预设驾驶行为规则可以根据车辆运行数据生成多样化的车险评估数据，如根据使用起始时间和使用结束时间生成开车时间段，根据车速生成平均速度区间范围、加速度区间范围等。在一实例中，车辆运行数据包括：开车时间段——0:30-1:20，该车辆运行数据经预设驾驶行为规则处理后，获得的车险评估数据为：疲劳驾驶风险等级——高。

车险评估数据还可以包括驾驶员的经验数据。驾驶员的经验数据包括但不限于驾龄、驾驶证等级、驾驶里程数。这一部分可以从其他途径获取。如，驾驶员的经验数据可在投保人购买保险服务时取得，并录入用于存储车险评估数据的服务器中。本实施例所获得的车险评估数据包括与驾驶行为相关的驾驶风险特征。

步骤S101、S104、S105中，与所述车辆的车载终端建立连接，从所述车载终端获取指定时间内的车辆运行数据，以获取用于反映驾驶员驾驶行为的车辆运行数据。按预设驾驶行为规则处理所述车辆运行数据，生成车险评估数据，以实现对驾驶员的驾驶行为进行合理地表征。

可选的，如图5所示，步骤S10包括：

S106、获取所述车辆指定时间内的行驶路线；

具体的，行驶路线指的是车辆在指定时间内驶过的所有路线。获取车辆指定时间内的行驶路线，可以获知该车辆的行驶偏好，进而计算该车辆发生风险的概率。指定时间可以根据实际要求而设定，可以是半年，一年，或者其他时间。

S107、根据所述车辆行驶路线从指定服务器获取与所述车辆行驶路线对应的环境数据；

具体的，环境数据包括但不限于行驶路线所包含的路段的路况信息和车辆所在地的天气信息。路况信息包括但不限于路段的路面质量、交通流量、路段事故发生率。天气信息包括但不限于车辆所在地的降水量及降水分布、温湿度、自然灾害发生率。指定服务器包括但不限于天气服务器、交通服务器。天气服务器是指提供天气信息查询服务的访问网点。交通服务器是指提供路面质量、交通流量、路段事故发生率等查询服务的访问网点。又如，如果一辆车辆的60％以上的行驶里程都是在道路质量较差的乡村道路上，则该车辆发生损耗的概率会有所上升。

S108、按预设环境数据处理规则处理所述环境数据，生成所述车险评估数据。

具体的，预设环境数据处理规则可以将不同类型的环境数据处理为同一形式的车险评估数据。例如，从天气服务器获得的数据主要是从表征天气的角度进行描述的，如每小时降雨量，而不是从驾驶员方面进行描述的，如雨天驾驶风险等级。因而可以设置一些对应规则将天气信息转化为车险评估数据。如，环境数据为气温38℃，则该环境数据经预设环境数据处理规则处理后，生成的环境数据为：自燃风险等级——高；又如环境数据为每天台风发生次数大于10，则该环境数据经预设环境数据处理规则处理后，生成的环境数据为：意外险发生等级——高。

预设环境数据处理规则也可以根据两个或两个以上的环境数据，或者车辆运行数据与环境数据结合，车辆性能数据与环境数据结合生成新的驾驶环境数据。例如，根据行驶路段与行驶时间，相结合而生成某路段的行驶时间；根据行驶路线统计获得的郊区行驶比例和城区行驶比例；根据车速与接听电话记录结合而生成接电话行驶速度特征等。本实施例所获得的车险评估数据包括与驾驶环境相关的驾驶风险特征。

步骤S106-S108中，获取所述车辆指定时间内的行驶路线，以获得车辆的行驶偏好。根据所述车辆行驶路线从指定服务器获取与所述车辆行驶路线对应的环境数据，以获取与车辆行驶路线相关的环境数据，进而可以根据这些环境数据对车辆风险进行合理客观评估。按预设环境数据处理规则处理所述环境数据，生成所述车险评估数据，以获得更适于计算车辆风险指数的驾驶环境数据，简化计算过程。

可选的，如图6所示，步骤S30之后，还包括：

S40、获取保单的配置信息；

保单是保险单的简称，是保险人与投保人签订保险合同的书面证明。在此处，保单可以以电子形式展示，是未确定保险费用的保单。保单的配置信息包括：(1)双方对有关保险标的事项的说明，包括被保险人名称，保险标的的名称及其存放地点或所处状态、保险金额、保险期限等；(2)双方的权利和义务，如承担责任和不予承担的责任等；(3)附注条件，指保险条款或双方约定的其他条件以及保单变更、转让和注销等事项。保单是签订保险合同的主要表现形式。在此处，保单主要是指车险保单。

S50、获取与所述配置信息对应的费用计算公式；

在此处，不同的配置信息对应不同的费用计算公式。费用计算公式主要与配置信息中的保险金额、保险期限等相关联。

S60、将所述风险指数及所述配置信息输入所述费用计算公式，计算出所述车辆的保险费用。

具体的，将风险指数及配置信息输入费用计算公式中，便可计算出车辆的保险费用。该保险费用是基于客观合理的风险指数计算出来的。风险指数高，则保险费用高；风险指数低，则保险费用低。

步骤S40-S60中，获取保单的配置信息，以获得计算保险费用的基本信息。获取与所述配置信息对应的费用计算公式，以计算公式的方式计算保险费用，较为简便。将所述风险指数及所述配置信息输入所述费用计算公式，以计算所述车辆的保险费用，在不同的风险指数的情况下，缴纳的保险费用也是不相同的，最大程度地平衡保险公司与投保人之间的利益。

可选的，如图7所示，步骤S20之前，包括：

S21、获取第一训练集，所述第一训练集包括多个车险评估样本，所述车险评估样本包括驾驶风险特征；

车险评估样本可以来源于已经完成的车险保单。车险评估样本可以是未经处理的车辆的车险评估初始数据，也可以是经处理过的车险评估数据。车险评估样本中可以包括车险评估数据中的所有或部分驾驶风险特征。在此处，驾驶风险特征包括车辆基础特征、车辆运行特征和驾驶环境特征。第一训练集包括多个车险评估样本。若第一训练集中包含q个车险评估样本，驾驶风险特征的总个数为t，第一训练集可表示为：

表3第一训练集

样本序号	特征1	特征2	特征3	……	特征t
						样本1
样本2
						……
样本q

表中，样本1指代序号为1的车险评估样本，特征1指代第一个驾驶风险特征。表中留空区域为样本对应的特征值，特征值可以是数值型数据，也可以是标称型数据。

每个车险评估样本还包括至少一个的类别标签，用于标识该车险评估样本的风险程度。类别标签可以基于该车险评估样本的赔付率而生成。

S22、通过梯度提升决策树算法训练所述第一训练集，构建驾驶风险特征评价模型；

本实施例中，梯度提升决策树算法，也可以表示为GBDT(英文Gradient BoostingDecision Tree的缩写)算法。梯度提升决策树算法基于二叉树原理，采用Gini数(基尼数)原则或者信息熵准则，选择第一训练集中的某一驾驶风险特征的最优的分叉点来分叉，之后计算每个车险评估样本的残差，并将余下的驾驶风险特征再次进行分叉，不断迭代，直到形成最优决策树。Gini数原则，也称基尼不纯度(Gini impurity)，简单地说就是从一个数据集中随机选取子项，度量其被错误分类到其他分组里的概率。信息熵准则，也可以称为香农熵，可以认为是信息的期望值。在模型训练时，驾驶风险特征评价模型输入的数据包括各个车险评估样本的所有驾驶风险特征。

S23、从所述驾驶风险特征评价模型获取各个驾驶风险特征的重要度；

可以从驾驶风险特征评价模型输出各个车险评估样本中驾驶风险特征的重要度。在驾驶风险特征评价模型中，每个驾驶风险特征对应一个重要度。在最终形成的最优决策树中，重要度与驾驶风险特征所在节点的参数相关。在此处，最优决策树可以视为驾驶风险特征评价模型的一种直观的表现形式。可在驾驶风险特征评价模型中输入相应的输出指令，输出驾驶风险特征的重要度。重要度可以用于表征驾驶风险特征对车辆风险的影响程度。对于重要度高的驾驶风险特征，其特征值的大小与车辆的风险呈显著的相关关系；而对于重要度低的驾驶风险特征，其特征值的大小与车辆的风险则不存在明显的相关关系。

S24、将重要度高于预设重要度阈值的驾驶风险特征标记为高重要度特征，得到所述预设高重要度特征列表。

具体的，可以通过预设重要度阈值筛选出重要度较大的驾驶风险特征。将重要度较大的驾驶风险特征标记为高重要度特征，并生成预设高重要度特征列表。值得注意的是，可定期或不定期对梯度提升决策树模型进行训练，因而，预设高重要度特征列表中包含的高重要度特征可能会产生一定的变化。预设重要度阈值不同，获得的预设高重要度特征列表也不相同。预设重要度阈值可以是所有驾驶风险特征的重要度的平均值。

步骤S21-S24中，获取第一训练集，所述第一训练集包括多个车险评估样本，所述车险评估样本包括驾驶风险特征，所述驾驶风险特征包括车辆基础特征、车辆运行特征和驾驶环境特征，以获得驾驶风险特征评价模型的训练数据。通过梯度提升决策树算法训练所述第一训练集，构建驾驶风险特征评价模型，用于评价驾驶风险特征的重要度。从所述驾驶风险特征评价模型获取各个驾驶风险特征的重要度，以输出驾驶风险特征的重要度数据。将重要度高于预设重要度阈值的驾驶风险特征标记为高重要度特征，得到所述预设高重要度特征列表，实现对所有驾驶风险特征进行筛选，减少计算量。

可选的，如图8所示，步骤S30之前，还包括：

S31、获取包括多个车辆风险样本的第二训练集，所述车辆风险样本包括高重要度特征；

本实施例中，可通过预设的处理方法对源数据进行处理，获得多个车辆风险样本。车辆风险样本可以与第一训练集中的车险评估样本来自相同的数据源。在此处，数据源可以是步骤S102中的车辆性能数据，可以是步骤S104中的车辆运行数据，也可以是步骤S107中的环境数据。可以根据预设高重要度特征列表对源数据进行处理，获得车辆风险样本，每个车辆风险样本包括预设高重要度特征列表中的所有高重要度特征。车辆风险样本中，部分高重要度特征可能缺乏相应的特征值，并将该高重要度特征的特征值标记为空值。例如，预设高重要度特征列表包括100个高重要度特征，在第二训练集中，样本A有95个高重要度特征具有特征值，则将剩下的5个高重要度特征的特征值设置为0。

S32、通过逻辑斯蒂回归算法训练所述第二训练集，得到所述预设逻辑斯蒂回归模型。

本实施例中，逻辑斯蒂回归算法，可简称为LR算法。LR算法是在线性回归的基础上，把特征进行线性组合，再把组合的结果通过一层sigmoid函数映射成结果是1或是0的概率。假设一个样本属于正样本的概率为P，则：

其中，x为车辆风险样本，Y为分类结果，w为车辆风险样本的系数，在LR模型建立之后可计算出w的数值。

在建模的过程中，还可加入正则化系数，以减少建模过程中过拟合的问题。预设LR模型可采用最小二乘法或岭回归的方式建模。

步骤S31-S32中，获取包括多个车辆风险样本的第二训练集，所述车辆风险样本包括高重要度特征，以获取构建预设逻辑斯蒂回归模型的训练集。通过逻辑斯蒂回归算法训练所述第二训练集，得到所述预设逻辑斯蒂回归模型，用于计算车辆风险系数。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

在一实施例中，提供一种车辆风险评估装置，该车辆风险评估装置与上述实施例中车辆风险评估方法一一对应。如图9所示，该车辆风险评估装置包括获取模块、输入模块和计算模块。各功能模块详细说明如下：

获取模块10，用于获取车辆的车险评估初始数据，根据所述车险评估初始数据生成车险评估数据，所述车险评估数据包括驾驶风险特征；

输入模块20，用于根据预设高重要度特征列表，从所述车险评估数据的驾驶风险特征中提取高重要度特征；

计算模块30，用于将所述高重要度特征输入预设逻辑斯蒂回归模型，计算并得到所述车辆的风险指数。

本实施例提供的车辆风险评估装置通过获取车辆的车险评估初始数据，车险评估初始数据经初步处理后获得车险评估数据，然后使用预设高重要度特征列表对车险评估数据中的驾驶风险特征进行筛选，获得高重要度特征，最后将高重要度特征输入预设逻辑斯蒂回归模型中，输出车辆的风险系数。由于经过预设高重要度特征列表的筛选，本装置可以减少车险评估初始数据中非重要的特征的干扰，同时减少运算量。相较于现有技术，本装置所获得的车辆的风险系数可以更客观地反映车辆发生事故的概率，进而确定一个更为合理的保险费用，兼顾保险公司与投保人之间的利益。

可选的，获取模块10包括：

连接单元，用于与所述车辆的车载终端建立连接；

获取性能数据单元，用于从所述车载终端获取指定时间内的车辆性能数据；

第一数据生成单元，用于根据所述车辆性能数据生成所述车险评估数据。

可选的，获取模块10包括：

连接单元，用于与所述车辆的车载终端建立连接；

获取运行数据单元，用于从所述车载终端获取指定时间内的车辆运行数据；

第二数据生成单元，用于按预设驾驶行为规则处理所述车辆运行数据，生成车险评估数据。

可选的，获取模块10包括：

获取路线单元，用于获取所述车辆指定时间内的行驶路线；

获取环境数据单元，用于根据所述车辆行驶路线从指定服务器获取与所述车辆行驶路线对应的环境数据；

第三数据生成单元，用于按预设环境数据处理规则处理所述环境数据，生成所述车险评估数据。

可选的，车辆风险评估装置还包括：

获取配置模块，用于获取保单的配置信息；

获取公式模块，用于获取与所述配置信息对应的费用计算公式；

计算费用模块，用于将所述风险指数及所述配置信息输入所述费用计算公式，计算出所述车辆的保险费用。

可选的，车辆风险评估装置还包括：

获取第一训练集模块，用于获取第一训练集，所述第一训练集包括多个车险评估样本，所述车险评估样本包括驾驶风险特征；

构建评价模型模块，用于通过梯度提升决策树算法训练所述第一训练集，构建驾驶风险特征评价模型；

计算重要度模块，用于从所述驾驶风险特征评价模型获取各个驾驶风险特征的重要度；

形成列表模块，用于将重要度高于预设重要度阈值的驾驶风险特征标记为高重要度特征，得到所述预设高重要度特征列表。

可选的，车辆风险评估装置还包括：

获取第二训练集模块，用于获取包括多个车辆风险样本的第二训练集，所述车辆风险样本包括高重要度特征；

构建回归模型模块，用于通过逻辑斯蒂回归算法训练所述第二训练集，得到所述预设逻辑斯蒂回归模型。

关于车辆风险评估装置的具体限定可以参见上文中对于车辆风险评估方法的限定，在此不再赘述。上述车辆风险评估装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储车辆风险评估方法中涉及到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种车辆风险评估方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现以下步骤：

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种车辆风险评估方法，其特征在于，包括：

获取车辆的车险评估初始数据，根据所述车险评估初始数据生成车险评估数据，所述车险评估数据包括驾驶风险特征；所述车险评估初始数据包括车辆数据、驾驶数据、环境数据；其中，所述车辆数据包括车辆价格、购买时间；所述驾驶数据包括驾驶时间、速度、接听电话记录；所述环境数据包括车辆所在城市的天气信息、行驶路线上的交通状况、行驶路线的所在路段的道路质量；

将所述高重要度特征输入预设逻辑斯蒂回归模型，计算并得到所述车辆的风险指数；

所述根据预设高重要度特征列表，从所述车险评估数据的驾驶风险特征中提取高重要度特征之前，包括：

获取第一训练集，所述第一训练集包括多个车险评估样本，所述车险评估样本包括驾驶风险特征；

通过梯度提升决策树算法训练所述第一训练集，构建驾驶风险特征评价模型；

从所述驾驶风险特征评价模型获取各个驾驶风险特征的重要度；

将重要度高于预设重要度阈值的驾驶风险特征标记为高重要度特征，得到所述预设高重要度特征列表；

所述将所述高重要度特征输入预设逻辑斯蒂回归模型，计算并得到所述车辆的风险指数之后，还包括：

获取保单的配置信息；

获取与所述配置信息对应的费用计算公式；

将所述风险指数及所述配置信息输入所述费用计算公式，计算出所述车辆的保险费用；

所述将所述高重要度特征输入预设逻辑斯蒂回归模型，计算并得到所述车辆的风险指数之前，还包括：

获取包括多个车辆风险样本的第二训练集，所述车辆风险样本包括高重要度特征；

通过逻辑斯蒂回归算法训练所述第二训练集，得到所述预设逻辑斯蒂回归模型。

2.如权利要求1所述的车辆风险评估方法，其特征在于，所述获取车辆的车险评估初始数据，根据所述车险评估初始数据生成车险评估数据，包括：

与所述车辆的车载终端建立连接；

从所述车载终端获取指定时间内的车辆性能数据；

根据所述车辆性能数据生成所述车险评估数据。

3.如权利要求1所述的车辆风险评估方法，其特征在于，所述获取车辆的车险评估初始数据，根据所述车险评估初始数据生成车险评估数据，包括：

与所述车辆的车载终端建立连接；

从所述车载终端获取指定时间内的车辆运行数据；

按预设驾驶行为规则处理所述车辆运行数据，生成车险评估数据。

4.如权利要求1所述的车辆风险评估方法，其特征在于，所述获取车辆的车险评估初始数据，根据所述车险评估初始数据生成车险评估数据，包括：

获取所述车辆指定时间内的行驶路线；

根据车辆行驶路线从指定服务器获取与所述车辆行驶路线对应的环境数据；

按预设环境数据处理规则处理所述环境数据，生成所述车险评估数据。

5.一种车辆风险评估装置，其特征在于，包括：

获取模块，用于获取车辆的车险评估初始数据，根据所述车险评估初始数据生成车险评估数据，所述车险评估数据包括驾驶风险特征；所述车险评估初始数据包括车辆数据、驾驶数据、环境数据；其中，所述车辆数据包括车辆价格、购买时间；所述驾驶数据包括驾驶时间、速度、接听电话记录；所述环境数据包括车辆所在城市的天气信息、行驶路线上的交通状况、行驶路线的所在路段的道路质量；

计算模块，用于将所述高重要度特征输入预设逻辑斯蒂回归模型，计算并得到所述车辆的风险指数；

形成列表模块，用于将重要度高于预设重要度阈值的驾驶风险特征标记为高重要度特征，得到所述预设高重要度特征列表；

获取配置模块，用于获取保单的配置信息；

计算费用模块，用于将所述风险指数及所述配置信息输入所述费用计算公式，计算出所述车辆的保险费用；

6.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述车辆风险评估方法的步骤。

7.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述车辆风险评估方法的步骤。