CN109635335B

CN109635335B - 驾驶风险预测方法、装置、计算机设备及存储介质

Info

Publication number: CN109635335B
Application number: CN201811339900.3A
Authority: CN
Inventors: 韩伟; 邓坤; 王建明; 肖京
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2018-11-12
Filing date: 2018-11-12
Publication date: 2024-05-28
Anticipated expiration: 2038-11-12
Also published as: CN109635335A

Abstract

本发明公开了一种驾驶风险预测方法、装置、计算机设备及存储介质.该方法包括：获取原始驾驶数据，使用清洗规则对原始驾驶数据进行清洗，获取有效驾驶数据；将有效驾驶数据分别输入到训练好的目标lightGBM模型和目标xgboost模型中，获取目标lightGBM模型输出的第一有效风险系数和目标xgboost模型输出的第二有效风险系数；对第一有效风险系数和第二有效风险系数进行归一化处理，获取第一标准风险系数和第二标准风险系数；将第一标准风险系数和第二标准风险系数进行融合处理，获取目标风险系数，使得获取目标风险系数更加准确。

Description

驾驶风险预测方法、装置、计算机设备及存储介质

技术领域

本发明涉及智能决策领域，尤其涉及一种驾驶风险预测方法、装置、计算机设备及存储介质。

背景技术

随着城镇化与机动化进程的加快，城市道路交通安全问题日益严峻，驾驶人员的人身安全问题也成为大众关注的焦点。驾驶人员的安全问题主要取决于两个方面，一个方面是驾驶人员驾驶车辆所在的环境安全，包括驾驶路况、驾驶位置和天气状况等；另一个方面是驾驶人员驾驶车辆时的驾驶行为安全，包括驾驶速度、行车时间段和驾驶加速度等。通过获取驾驶人员的驾驶行为和所处环境判断驾驶人员当前的驾驶风险系数，以确定用户在当前时间驾驶是否安全。目前驾驶风险系数多为单一模型识别，识别准确率不高，严重影响了驾驶人员通过驾驶风险系数判断当前驾驶是否安全的准确性。

发明内容

本发明实施例提供一种驾驶风险预测方法、装置、计算机设备及存储介质，以解决当前驾驶风险系数通过单一模型识别准确率不高的问题。

一种驾驶风险预测方法，包括：

获取原始驾驶数据，使用清洗规则对所述原始驾驶数据进行清洗，获取有效驾驶数据；

将所述有效驾驶数据分别输入到训练好的目标lightGBM模型和目标xgboost模型中，获取所述目标lightGBM模型输出的第一有效风险系数和所述目标xgboost模型输出的第二有效风险系数；

对所述第一有效风险系数和所述第二有效风险系数进行归一化处理，获取第一标准风险系数和第二标准风险系数；

将所述第一标准风险系数和所述第二标准风险系数进行融合处理，获取目标风险系数。

一种驾驶风险预测装置，包括：

原始驾驶数据处理模块，用于获取原始驾驶数据，使用清洗规则对所述原始驾驶数据进行清洗，获取有效驾驶数据；

模型处理模块，用于将所述有效驾驶数据分别输入到训练好的目标lightGBM模型和目标xgboost模型中，获取所述目标lightGBM模型输出的第一有效风险系数和所述目标xgboost模型输出的第二有效风险系数；

归一化处理模块，用于对所述第一有效风险系数和所述第二有效风险系数进行归一化处理，获取第一标准风险系数和第二标准风险系数；

目标风险系数获取模块，用于将所述第一标准风险系数和所述第二标准风险系数进行融合处理，获取目标风险系数。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述驾驶风险预测方法的步骤。

一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述驾驶风险预测方法的步骤。

上述驾驶风险预测方法、装置、计算机设备及存储介质，通过使用清洗规则对原始驾驶数据进行清洗，将不符合清洗规则的原始驾驶数据清洗掉，保留符合清洗规则的原始驾驶数据，既可有效减少后续根据有效驾驶数据预测用户的驾驶风险的计算量，又保证了数据输出的准确性。然后，使用训练好的目标lightGBM模型和目标xgboost模型对有效驾驶数据进行识别，获取第一有效风险系数和第二有效风险系数，并对第一有效风险系数和第二有效风险系数分别进行归一化处理，得到第一标准风险系数和第二标准风险系数，使得第一标准风险系数和第二标准风险系数具有可比性，为后续步骤对第一标准风险系数和第二标准风险系数进行融合处理提供了方便。最后，通过对第一标准风险系数和第二标准风险系数进行融合处理，可以使得获取目标风险系数更加准确。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例中驾驶风险预测方法的一应用场景图；

图2是本发明一实施例中驾驶风险预测方法的一流程图；

图3是图2中步骤S10的一具体流程图；

图4是本发明一实施例中驾驶风险预测方法的另一流程图；

图5是图4中步骤S23的一具体流程图；

图6是本发明一实施例中驾驶风险预测方法的另一流程图；

图7是本发明一实施例中驾驶风险预测装置的一示意图；

图8是本发明一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供的驾驶风险预测方法，可应用在如图1的应用环境中，其中，客户端通过网络与服务器进行通信。客户端可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一实施例中，如图2所示，提供一种驾驶风险预测方法，以该方法应用在图1中的服务器为例进行说明，包括如下步骤：

S10：获取原始驾驶数据，使用清洗规则对原始驾驶数据进行清洗，获取有效驾驶数据。

其中，原始驾驶数据指用户驾驶汽车的行驶数据。清洗规则指预先设置的用于清洗驾驶数据中不符合要求的数据的规则，该清洗规则包括但不限于对驾驶位置、驾驶速度、加速度和驾驶方向(汽车的转向角)等数据进行清洗的规则。

具体地，用户预先在客户端上安装特定应用程序，本实施例中的终端设备包括但不限于手机等移动终端。特定应用程序指获取原始驾驶数据，并通过原始驾驶数据计算用户在驾驶汽车过程中的风险系数的应用程序。用户在安装特定应用程序后，需要在该特定应用程序上完成注册，以使特定应用程序对应的服务器可获取相应的用户标识，用于将获取的原始驾驶数据与用户标识相关联。该用户标识可以为用户的手机号或身份证号等可唯一识别用户的标识。当用户携带手机出行时，手机内部的GPS、陀螺仪等采集用户驾驶位置的经纬度、汽车的行驶速度、加速度、驾驶方向、刹车次数和行车时间段等原始驾驶数据。

在获取上述原始驾驶数据后，服务器使用设置好的清洗规则对原始驾驶数据进行清洗，将不符合清洗规则好的原始驾驶数据清洗掉，只保留符合清洗规则的原始驾驶数据，使得获取的有效驾驶数据都是符合要求的数据，既有效减少后续根据有效驾驶数据预测用户的驾驶风险的计算量，又保证了数据输出的准确性。

S20：将有效驾驶数据分别输入到训练好的目标lightGBM模型和目标xgboost模型中，获取目标lightGBM模型输出的第一有效风险系数和目标xgboost模型输出的第二有效风险系数。

其中，目标lightGBM模型指预先训练好的用于对有效驾驶数据进行识别，获取有效驾驶数据对应的第一有效风险系数的模型。lightGBM(Light Gradient BoostingMachine，光速梯度提升器)模型是一个快速的、分布式的、高性能的基于决策树算法的梯度提升模型，可用于排序、分类、回归等机器学习。第一有效风险系数指根据目标lightGBM模型获取的有效驾驶数据的风险系数。

目标xgboost模型指预先训练好的用于对有效驾驶数据进行识别，获取有效驾驶数据对应的第二有效风险系数的模型。Xgboost(eXtreme Gradient Boosting，极端梯度增强算法)模型是一种在GBDT(Gradient Boosting Decision Tree，梯度提升决策树)上做出的改进的一种模型，与GBDT算法相比，xgboost主要是在损失函数上做了改进，采用的是二阶的泰勒展开，并在目标函数之外加入了正则项对整体求最优解，用以权衡目标函数的下降和模型的复杂程度，避免过拟合。第二有效风险系数指根据目标Xgboost模型获取的有效驾驶数据的风险系数。

具体地，在获取有效驾驶数据后，将有效驾驶数据分别输入到训练好的目标lightGBM模型和目标xgboost模型中，目标lightGBM模型和目标xgboost模型对有效驾驶数据进行分析，获取目标lightGBM模型输出的第一有效风险系数和目标xgboost模型输出的第二有效风险系数。根据目标lightGBM模型自身的特点，使得获取第一有效风险系数更加准确；根据目标lightGBM模型自身的特点，使用目标lightGBM模型获取的第二有效风险系数速度更快，提高速度，节省时间。

S30：对第一有效风险系数和第二有效风险系数进行归一化处理，获取第一标准风险系数和第二标准风险系数。

具体地，在获取第一有效风险系数和第二有效风险系数后，需要对第一有效风险系数和第二有效风险系数进行归一化处理，使得第一有效风险系数和第二有效风险系数的值落在(0,1)范围内，将归一化处理后的第一有效风险系数和第二有效风险系数称为第一标准风险系数和第二标准风险系数。可以理解地，对第一有效风险系数和第二有效风险系数进行归一化处理，可以使得获取的第一标准风险系数和第二标准风险系数为相同的标准范围内数值，具有可比性，从而方便后续步骤根据第一标准风险系数和第二标准风险系数获取目标风险系数。

S40：将第一标准风险系数和第二标准风险系数进行融合处理，获取目标风险系数。

具体地，为了使得获取的第一标准风险系数和第二标准风险系数可以更加准确地反映出用户驾驶汽车的风险系数，在获取第一标准风险系数和第二标准风险系数后，需要将第一标准风险系数和第二标准风险系数进行融合处理，使之成为目标风险系数。本实施例中的融合处理可以为对第一标准风险系数和第二标准风险系数进行平均值计算，也可以设置加权计算公式对第一标准风险系数和第二标准风险系数进行计算。通过对第一标准风险系数和第二标准风险系数进行融合处理，以使获取的目标风险系数充分考虑了目标lightGBM模型和目标xgboost模型进行风险系数评估的各种因素，提高目标风险系数的准确性。

步骤S10-步骤S40，通过使用清洗规则对原始驾驶数据进行清洗，将不符合清洗规则的原始驾驶数据清洗掉，保留符合清洗规则的原始驾驶数据，既可有效减少后续根据有效驾驶数据预测用户的驾驶风险的计算量，又保证了数据输出的准确性。然后，使用训练好的目标lightGBM模型和目标xgboost模型对有效驾驶数据进行识别，获取第一有效风险系数和第二有效风险系数，并对第一有效风险系数和第二有效风险系数分别进行归一化处理，得到第一标准风险系数和第二标准风险系数，使得第一标准风险系数和第二标准风险系数具有可比性，为后续步骤对第一标准风险系数和第二标准风险系数进行融合处理提供了方便。最后，通过对第一标准风险系数和第二标准风险系数进行融合处理，可以使得获取目标风险系数更加准确。

在一实施例中，原始驾驶数据包括原始驾驶环境数据和原始驾驶行为数据，其中，原始驾驶环境数据指用户驾驶汽车所在的驾驶位置对应的数据，包括但不限于驾驶位置对应的经纬度和海拔等数据。原始驾驶行为数据指用户驾驶汽车时汽车行驶的数据，包括但不限于驾驶速度、加速度、驾驶方向、刹车次数和行车时间段等数据。清洗规则包括环境清洗规则和行为清洗规则。其中，环境清洗规则指对驾驶环境数据进行清洗的规则，本实施例中的驾驶环境数据指原始驾驶环境数据。行为清洗规则指对驾驶行为数据进行清洗的规则，本实施例中的驾驶行为数据指原始驾驶行为数据。如图3所示，步骤S10中，即使用清洗规则对原始驾驶数据进行清洗，获取有效驾驶数据，具体包括如下步骤：

S11：使用环境清洗规则对原始驾驶环境数据进行清洗，获取有效驾驶环境数据。

本实施例中设置的环境清洗规则指用于清洗不符合客观事实的经纬度、海拔，以及不属于中国境内的驾驶环境数据的规则。根据中国所处地理位置的数据可知，中国地理位置最北端位于东八区，北纬53度33分；最南端位于东八区，北纬3度52分；最西端位于东五区，东经73度40分；最东端：位于东九区，东经135度2分。陆地海拔最高8844.43米，最低-154.31米。因此，本实施例中的环境清洗规则中设置的数值范围为上述数据所指范围内。

具体地，在获取到客户端发送的经纬度和海拔等原始驾驶数据后，服务器会使用环境清洗规则中设置的数值范围对获取到的原始驾驶数据进行清洗，将不符合环境清洗规则中数值范围的原始驾驶数据清洗掉，使得获取的有效驾驶环境数据满足环境清洗规则的要求。

S12：使用行为清洗规则对原始驾驶行为数据进行清洗，获取有效驾驶行为数据。

本实施例中的行为清洗规则包括根据需求设置的驾驶速度正常范围、加速度正常范围和驾驶方向正常范围。

具体地，在获取客户端发送的原始驾驶行为数据后，服务器会使用行为清洗规则中的驾驶速度正常范围、加速度正常范围和驾驶方向正常范围对原始驾驶行为数据中的驾驶速度、加速度和驾驶方向依次进行清洗，将不符合行为清洗规则的原始驾驶数据清洗，保留符合行为清洗规则的原始驾驶数据，使得获取的有效驾驶行为数据满足要求。

S13：将有效驾驶环境数据和有效驾驶行为数据作为有效驾驶数据。

在获取有效驾驶环境数据和有效驾驶行为数据后，将有效驾驶环境数据和有效驾驶行为数据作为有效驾驶数据，保证数据的客观性，为后续使用目标lightGBM模型和目标xgboost模型获取第一有效风险系数和第二有效风险系数提供完整的数据。

步骤S11-步骤S13，通过环境清洗规则将不符合环境清洗规则的原始驾驶环境数据清洗掉，只保留符合环境清洗规则的有效驾驶环境数据；通过行为清洗规则将不符合行为清洗规则的原始驾驶行为数据清洗掉，只保留符合行为清洗规则的有效驾驶行为数据，使得保留下的有效驾驶环境数据和有效驾驶行为数据均为符合要求的数据。将有效驾驶环境数据和有效驾驶行为数据作为有效驾驶数据，为后续获取第一有效风险系数和第二有效风险系数提供完整且准确的数据，保证了获取的第一有效风险系数和第二有效风险系数的准确性。

在一实施例中，如图4所示，驾驶风险预测方法还包括如下步骤：

S21：获取训练驾驶数据，使用清洗规则对训练驾驶数据进行清洗，对清洗后的训练驾驶数据进行标签处理，获取驾驶标签。

其中，训练驾驶数据指用于进行模型训练的驾驶数据。为了保证模型训练的准确性，在获取训练驾驶数据后，需使用清洗规则对训练驾驶数据进行清洗，将不符合清洗规则的训练驾驶数据清洗掉，只保留符合清洗规则的训练驾驶数据，减少后续进行标签处理的训练驾驶数据的数据量。

在对训练驾驶数据进行清洗后，为了方便后续确定原始xgboost模型和原始lightGBM模型训练是否训练完成，训练完成的有效xgboost模型和有效lightGBM模型是否准确，还需要根据清洗后的训练驾驶数据的标签对清洗后的训练驾驶数据进行标签处理，使得清洗后的训练驾驶数据携带有对应的驾驶标签。

本实施例中，驾驶标签包括驾驶环境标签和驾驶行为标签。其中，驾驶环境标签指根据训练驾驶环境数据确定的标签。如海拔500米以上的训练驾驶环境数据对应的驾驶环境标签为高原和山地，海拔200米以下的训练驾驶环境数据对应的驾驶环境标签为平原，海拔500米以下的训练驾驶环境数据对应的驾驶环境标签为丘陵。驾驶行为标签指根据训练驾驶行为数据确定的标签。如90km/h及以上的训练驾驶行为数据对应的驾驶行为标签为高速行驶；10km/h-90km/h为正常行驶；10km/h以内的训练驾驶行为数据对应的驾驶行为标签为低速行驶。行车时间段在5:00-17:00的训练驾驶行为数据对应的驾驶数行为标签白天；行车时间段在17:00-0:00的训练驾驶行为数据对应的驾驶数行标签为晚上；行车时间段在0:00-5:00的训练驾驶行为数据对应的驾驶数行为标签为凌晨。一用户的训练驾驶数据为海拔180米，驾驶速度为75km/h，行车时间段为13:00-16:00，该用户的训练驾驶数据对应的标签为平原、正常行驶和白天。

S22：基于驾驶标签查询驾驶风险系数表，获取与驾驶标签对应的标准驾驶风险系数，以使训练驾驶数据携带标准驾驶风险系数，将训练驾驶数据划分为训练集和测试集。

具体地，在获取驾驶标签后，根据驾驶标签查询驾驶风险系数表，获取与驾驶标签对应的标准驾驶风险系数，以使每一训练驾驶数据携带一标准驾驶风险系数。其中，驾驶风险系数表指根据驾驶标签获取标准驾驶风险系数的表。标准驾驶风险系数指预先设置好的驾驶风险系数，一个驾驶风险系数对应多个驾驶标签。在获取训练驾驶数据对应的标准风险系数后，还需将训练驾驶数据划分为训练集和测试集。其中，训练集指用于训练模型的训练驾驶数据。测试集指用于检测训练好的模型是否准确的训练驾驶数据。

S23：将训练集中的训练驾驶数据分别输入到原始xgboost模型和原始lightGBM模型，获取原始xgboost模型输出的第一训练结果和原始lightGBM模型输出的第二训练结果，根据第一训练结果获取有效xgboost模型,根据第二训练结果获取有效lightGBM模型。

其中，原始xgboost模型指没有经过训练驾驶数据训练的xgboost模型。原始lightGBM模型指没有经过训练驾驶数据训练的lightGBM模型。

具体地，对原始xgboost模型中的参数进行初始化设置，该原始xgboost模型中的参数包括但不限于原始xgboost模型的学习率、树的数量、最大树深度和最大叶子节点数等参数。其中，学习率指原始xgboost模型中用于控制叶子节点权重变化的快慢；最大数深度指原始xgboost模型中每棵树的最大深度；最大叶子节点数指原始xgboost模型中每棵树的对应的叶子节点的最大值。

在对原始xgboost模型中的参数进行初始化设置完成后，将训练集中的训练驾驶数据输入到原始xgboost模型进行训练具体包括如下步骤：(一)对训练驾驶数据中每个标签对应的数据进行预排序，然后选择增益最大的标签对应的数据作为分裂点进行分裂，依次类推，当分裂达到达到原始xgboost模型中的最大数深度和最大叶子节点时，停止分裂，获取原始xgboost模型中的第一棵树对应的预测值；(二)重复执行步骤(一)，当树的数量达到原始xgboost模型中预先设置的树的数量的时候，获取原始xgboost模型中的每棵树对应的预测值；(三)将原始xgboost模型中的所有预测值的结果相加，获取原始xgboost模型对应的第一训练结果。需要说明的是，本实施例中的预测值指的是训练集中的训练驾驶数据通过原始xgboost模型中的每棵树的训练，得到的关于训练驾驶数据对应的风险系数的值。第一训练结果指原始xgboost模型对训练集中的训练驾驶数据进行训练后输出的风险系数。

同样地，首先对原始lightGBM模型中的参数进行初始化设置，该原始lightGBM模型中的参数包括但不限于原始lightGBM模型的中的树的数量、最大树深度和最大叶子节点数等参数。然后使用GOSS(Gradient-based One-Side Sampling，基于梯度的单侧抽样)算法，将训练集中的训练驾驶数据按照梯度的绝对值进行降序排序，选取排在前面百分之a的训练驾驶数据和排在后面百分之b的训练驾驶数据作为用来计算的增益数据，然后在计算增益数据中选择增益最大的最大的标签对应的数据作为分裂点进行分裂，依次类推，当分裂达到达到原始lightGBM模型中的最大数深度和最大叶子节点时，停止分裂，获取原始lightGBM模型中的第一棵树对应的预测值；(二)重复执行步骤(一)，当树的数量达到原始lightGBM模型中预先设置的树的数量的时候，获取原始lightGBM模型中的每棵树对应的预测值；(三)将原始lightGBM模型中的所有预测值的结果相加，获取原始lightGBM模型对应的第二训练结果。其中，a和b为原始lightGBM模型中预先设置好的参数。需要说明的是，本实施例中的预测值指的是训练集中的训练驾驶数据通过原始lightGBM模型中的每棵树的训练，得到的关于训练驾驶数据对应的风险系数的值。第一训练结果指原始lightGBM模型对训练集中的训练驾驶数据进行训练后输出的风险系数。

在获取第一训练结果和第二训练结果后，将第一训练结果和第二训练结果与训练集中的训练驾驶数据携带的标准驾驶风险系数进行比较，获取第一训练结果与标准驾驶风险系数之间的差值，和第二训练结果与标准驾驶风险系数的差值。当第一训练结果与标准驾驶风险系数之间的差值在预设的误差范围内，则表示原始xgboost模型训练完成，将原始xgboost模型作为有效xgboost模型；当第一训练结果与标准驾驶风险系数之间的差值不在预设的误差范围内，则表示原始xgboost模型训练没有完成，需要获取更多的训练集的训练驾驶数据对原始xgboost模型进行训练。当第二训练结果与标准驾驶风险系数的差值在预设的误差范围内，则表示原始lightGBM模型训练完成，将原始lightGBM模型作为有效xlightGBM模型；当第二训练结果与标准驾驶风险系数的差值不在预设的误差范围内，则表示原始lightGBM模型训练没有完成，需要获取更多的训练集的训练驾驶数据对原始lightGBM模型进行训练。

使用原始xgboost模型对训练集中的训练驾驶数据进行训练，保证了训练驾驶数据中每个标签对应的数据都能够得到充分的训练，使得得到的第一训练结果能够完整且准确地反映输入到原始xgboost模型进行训练的训练驾驶数据的特点。使用原始lightGBM模型对训练集中的训练驾驶数据进行训练，根据原始lightGBM模型的特点，选择合适的部分训练驾驶数据进行训练，有效提高了原始lightGBM模型对训练驾驶数据的训练速度。

S24：将测试集中的训练驾驶数据分别输入到有效xgboost模型和有效lightGBM模型，获取有效xgboost模型输出的第一测试结果和有效lightGBM模型输出的第二测试结果。

具体地，在获取有效xgboost模型和有效lightGBM模型后，为了防止有效xgboost模型和有效lightGBM模型出现过拟合的情况，还需要使用测试集对有效xgboost模型和有效lightGBM模型进行验证，以获取测试集中的训练驾驶数据通过有效xgboost模型输出的第一测试结果，和通过有效lightGBM模型输出的第二测试结果。

S25：若第一测试结果与标准驾驶风险系数的误差在预设的误差范围内，则将有效xgboost模型作为目标xgboost模型；若第二测试结果与标准驾驶风险系数的误差在预设的误差范围内，则将有效lightGBM模型作为目标lightGBM模型。

具体地，当第一测试结果与测试集中的训练驾驶数据携带的标准驾驶风险系数的差值在预设的误差范围内，则表示训练好的有效xgboost模型符合要求，可以作为目标xgboost模型，为后续步骤中获取第一有效风险系数提供模型数据基础。如预设的误差范围为(0，1)，第一测试结果为5.7，训练驾驶数据携带的标准驾驶风险系数为6，第一测试结果与标准驾驶风险系数的差值为0.3，在预设的误差范围内，则表示训练好的有效xgboost模型符合要求，可以作为目标xgboost模型。

当第二测试结果与测试集中的训练驾驶数据携带的标准驾驶风险系数的差值在预设的误差范围内，则表示训练好的有效lightGBM模型符合要求，可以作为目标lightGBM模型，为后续步骤中获取第二有效风险系数提供模型数据基础。

步骤S21-步骤S25，通过使用清洗规则对训练驾驶数据进行清洗，只保留符合清洗规则的训练驾驶数据，减少对训练驾驶数据进行标签处理的数据量。在获取清洗后的训练驾驶数据后，对清洗后的训练驾驶数据进行标签处理，通过驾驶标签查询风险系数表，获取对应的标准驾驶风险系数，使得训练驾驶数据携带有对应的标准驾驶风险系数，方便后续验证模型训练是否准确。使用原始xgboost模型对训练集中的训练驾驶数据进行训练，保证了训练驾驶数据中每个标签对应的数据都能够得到充分的训练，使得得到的第一训练结果能够完整且准确地反映输入到原始xgboost模型进行训练的训练驾驶数据的特点。使用原始lightGBM模型对训练集中的训练驾驶数据进行训练，根据原始lightGBM模型的特点，选择合适的部分训练驾驶数据进行训练，有效提高了原始lightGBM模型对训练驾驶数据的训练速度。为了防止训练好的有效xgboost模型和有效lightGBM模型出现过拟合的情况，还需要使用测试集对应的训练驾驶数据进行测试验证，当第一测试结果和第二测试结果都在预设的误差范围内，则表示有效xgboost模型和有效lightGBM模型满足要求，可以用来对需要获取风险系数的有效驾驶数据进行识别。

在一实施例中，如图5所示，步骤S23，根据第一训练结果获取有效xgboost模型,根据第二训练结果获取有效lightGBM模型，具体包括如下步骤：

S231：将第一训练结果和标准驾驶风险系数进行比较，获取第一训练结果和标准驾驶风险系数的第一误差值，当第一误差值在预设的误差范围内，则停止训练原始xgboost模型，获取有效xgboost模型。

具体地，在获取原始xgboost模型输出的第一训练结果后，将第一训练结果和训练集中的驾驶数据携带的标准驾驶风险系数相减，为了防止出现负数，在两者相减后的值取绝对值，获取第一训练结果和标准驾驶风险系数的第一误差值，当第一误差值在预设的误差范围内，则表示原始xgboost模型训练完成，可以停止训练原始xgboost模型，并将原始xgboost模型作为有效xgboost模型。当第一误差值不在预设的误差范围内，则继续选取训练驾驶数据作为训练集对原始xgboost模型进行训练。

S232：将第二训练结果和标准驾驶风险系数进行比较，获取第二训练结果和标准驾驶风险系数的第二误差值，当第二误差值在预设的误差范围内，则停止训练原始lightGBM模型，获取有效lightGBM模型。

具体地，在获取原始lightGBM模型输出的第二训练结果后，将第二训练结果和训练集中的驾驶数据携带的标准驾驶风险系数相减，为了防止出现负数，在两者相减后的值取绝对值，获取第二训练结果和标准驾驶风险系数的第二误差值，当第二误差值在预设的误差范围内，则表示原始lightGBM模型训练完成，可以停止训练原始lightGBM模型，并将原始lightGBM模型作为有效lightGBM模型。当第二误差值不在预设的误差范围内，则继续选取训练驾驶数据作为训练集对原始lightGBM模型进行训练。

步骤S231-步骤S232，通过获取第一误差值和第二误差值，并判断第一误差值和第二误差值是否在预设的误差范围内，方便服务器决定是否停止训练原始xgboost和原始lightGBM模型。

在一实施例中，如图6所示，在步骤S40，获取目标风险系数的步骤之后，驾驶风险预测方法还包括：

S50：基于有效驾驶数据，获取与有效驾驶数据相对应的驾驶特征。

具体地，在获取目标风险系数后，由于会存在目标风险系数相同，但对应的驾驶特征不同的情况，还需要从有效驾驶数据中获取相对应的驾驶特征，为后续步骤获取符合用户情况的车险产品提供准确的数据来源。本实施例中的驾驶特征指表示有效驾驶数据中数据的特征，包括驾驶环境特征和驾驶行为特征。其中，驾驶环境特征指根据训练驾驶环境数据确定的特征。如海拔500米以上的训练驾驶环境数据对应的驾驶环境特征为高原和山地，海拔200米以下的训练驾驶环境数据对应的驾驶环境特征为平原，海拔500米以下的训练驾驶环境数据对应的驾驶环境特征为丘陵。高山和山地的驾驶行为特征指根据训练驾驶行为数据确定的特征。如90km/h及以上的训练驾驶行为数据对应的驾驶行为特征为高速行驶，10km/h-90km/h的训练驾驶行为数据对应的驾驶行为特征为正常行驶，10km/h以内的训练驾驶行为数据对应的驾驶行为特征为低速行驶。行车时间段在5:00-17:00的训练驾驶行为数据对应的驾驶数行为特征白天，行车时间段在17:00-0:00的训练驾驶行为数据对应的驾驶数行特征为晚上，行车时间段在0:00-5:00的训练驾驶行为数据对应的驾驶数行为特征为凌晨。

一用户的有效驾驶数据为海拔700米、车速为80km/h、行车时间段在17:00-20:00，通过模型训练得到的目标风险系数为6，其对应的对应的驾驶特征为山地、正常行驶、晚上。另一用户的有效驾驶数据为海拔480米、车速为100km/h、行车时间段在17:00-20:00，通过模型训练得到的目标风险系数也为6，但其对应的对应的驾驶特征为山地、正常行驶、晚上。

S60：基于驾驶特征和目标风险系数查询产品信息表，获取待推荐车险产品，并将待推荐车险产品发送给原始驾驶数据对应的客户端。

其中，产品信息表指用于记录驾驶特征、目标风险系数和对应的查车险产品信息的表。本实施例中车险产品指关于车险的产品。具体地，在获取驾驶特征后，基于驾驶特征和目标风险系数查询产品信息表，获取待推荐车险产品，该带推荐车险产品指通过驾驶特征和目标风险系数查询产品信息表得到的适合用户的车险产品。在获取带推荐车险产品后，将该待推荐车险产品发送给原始驾驶数据对应的客户端，使得用户根据需要决定是否购买该带推荐车险产品。

步骤S50-步骤S60，通过获取用户的驾驶特征和目标风险系数，查询产品信息表，给用户推荐合适的车险产品，提高带推荐车险产品的准确性，提高用户对车险产品的购买率。

本发明提供的驾驶风险预测方法，通过使用清洗规则对原始驾驶数据进行清洗，将不符合清洗规则的原始驾驶数据清洗掉，保留符合清洗规则的原始驾驶数据，为后续根据有效驾驶数据预测用户的驾驶风险有效减少了计算量，保证了驾驶风险系数输出的准确性。然后使用训练集对原始lightGBM模型和原始xgboost模型进行训练，为了防止出现过拟合的情况，使用测试集对训练好的有效lightGBM模型和有效xgboost模型进行测试，保证目标lightGBM模型和目标xgboost模型的准确性。最后使用训练好的目标lightGBM模型和目标xgboost模型对有效驾驶数据进行识别，获取第一有效风险系数和第二有效风险系数，并对第一有效风险系数和第二有效风险系数分别进行归一化处理，得到第一标准风险系数和第二标准风险系数，为后续步骤对第一标准风险系数和第二标准风险系数进行融合处理提供了方便。通过对第一标准风险系数和第二标准风险系数进行融合处理，可以使得获取目标风险系数更加准确。并通过获取用户的驾驶特征和目标风险系数，查询产品信息表，给用户推荐合适的车险产品，提高带推荐车险产品的准确性，提高用户对车险产品的购买率。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

在一实施例中，提供一种驾驶风险预测装置，该驾驶风险预测装置与上述实施例中驾驶风险预测方法一一对应。如图7所示，该驾驶风险预测装置包括原始驾驶数据处理模块10、模型处理模块20、归一化处理模块30和目标风险系数获取模块40。各功能模块详细说明如下：

原始驾驶数据处理模块10，用于获取原始驾驶数据，使用清洗规则对原始驾驶数据进行清洗，获取有效驾驶数据。

模型处理模块20，用于将有效驾驶数据分别输入到训练好的目标lightGBM模型和目标xgboost模型中，获取目标lightGBM模型输出的第一有效风险系数和目标xgboost模型输出的第二有效风险系数。

归一化处理模块30，用于对第一有效风险系数和第二有效风险系数进行归一化处理，获取第一标准风险系数和第二标准风险系数。

目标风险系数获取模块40，用于将第一标准风险系数和第二标准风险系数进行融合处理，获取目标风险系数。

进一步地，原始驾驶数据处理模块10包括第一清洗单元11、第二清洗单元12和有效驾驶数据获取单元13。

第一清洗单元11，用于使用环境清洗规则对原始驾驶环境数据进行清洗，获取有效驾驶环境数据。

第二清洗单元12，用于使用行为清洗规则对原始驾驶行为数据进行清洗，获取有效驾驶行为数据。

有效驾驶数据获取单元13，用于将有效驾驶环境数据和有效驾驶行为数据作为有效驾驶数据。

进一步地，驾驶风险预测装置还包括训练驾驶数据第一处理单元21、训练驾驶数据第二处理单元22、模型训练单元23、模型测试单元24和模型确认单元25。

训练驾驶数据第一处理单元21，用于获取训练驾驶数据，使用清洗规则对训练驾驶数据进行清洗，对清洗后的训练驾驶数据进行标签处理，获取驾驶标签。

训练驾驶数据第二处理单元22，用于基于驾驶标签查询驾驶风险系数表，获取与驾驶标签对应的标准驾驶风险系数，以使训练驾驶数据携带标准驾驶风险系数，将训练驾驶数据划分为训练集和测试集。

模型训练单元23，用于将训练集中的训练驾驶数据分别输入到原始xgboost模型和原始lightGBM模型，获取原始xgboost模型输出的第一训练结果和原始lightGBM模型输出的第二训练结果，根据第一训练结果获取有效xgboost模型,根据第二训练结果获取有效lightGBM模型。

模型测试单元24，用于将测试集中的训练驾驶数据分别输入到有效xgboost模型和有效lightGBM模型，获取有效xgboost模型输出的第一测试结果和有效lightGBM模型输出的第二测试结果。

模型确认单元25，用于若第一测试结果与标准驾驶风险系数的误差在预设的误差范围内，则将有效xgboost模型作为目标xgboost模型；若第二测试结果与标准驾驶风险系数的误差在预设的误差范围内，则将有效lightGBM模型作为目标lightGBM模型。

进一步地，模型训练单元23包括原始xgboost模型训练单元和原始lightGBM模型训练单元。

原始xgboost模型训练单元，用于将第一训练结果和标准驾驶风险系数进行比较，获取第一训练结果和标准驾驶风险系数的第一误差值，当第一误差值在预设的误差范围内，则停止训练原始xgboost模型，获取有效xgboost模型。

原始lightGBM模型训练单元，用于将第二训练结果和标准驾驶风险系数进行比较，获取第二训练结果和标准驾驶风险系数的第二误差值，当第二误差值在预设的误差范围内，则停止训练原始lightGBM模型，获取有效lightGBM模型。

进一步地，驾驶风险预测装置还包括驾驶特征获取模块和待推荐车险产品获取模块。

驾驶特征获取模块，用于基于有效驾驶数据，获取与有效驾驶数据相对应的驾驶特征。

待推荐车险产品获取模块，用于基于驾驶特征和目标风险系数查询产品信息表，获取待推荐车险产品，并将待推荐车险产品发送给原始驾驶数据对应的客户端。

关于驾驶风险预测装置的具体限定可以参见上文中对于驾驶风险预测方法的限定，在此不再赘述。上述驾驶风险预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储驾驶风险预测方法中涉及到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种驾驶风险预测方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述驾驶风险预测方法中的步骤，如图2所示的步骤S10-步骤S40。或者如图3至图6所示的步骤。为避免重复，不再赘述。或者，处理器执行计算机程序时实现上述驾驶风险预测装置中的步骤，如图7所示的原始驾驶数据处理模块10、模型处理模块20、归一化处理模块30和目标风险系数获取模块40。为避免重复，不再赘述。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述驾驶风险预测方法中的步骤，如图2所示的步骤S10-步骤S40。或者如图3至图6所示的步骤。为避免重复，不再赘述。或者，计算机程序被处理器执行时实现上述驾驶风险预测装置中的步骤，如图7所示的原始驾驶数据处理模块10、模型处理模块20、归一化处理模块30和目标风险系数获取模块40。为避免重复，不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种驾驶风险预测方法，其特征在于，包括：

将所述第一标准风险系数和所述第二标准风险系数进行融合处理，获取目标风险系数；

其中，所述驾驶风险预测方法还包括：

获取训练驾驶数据，使用所述清洗规则对所述训练驾驶数据进行清洗，对清洗后的训练驾驶数据进行标签处理，获取驾驶标签；

基于所述驾驶标签查询驾驶风险系数表，获取与所述驾驶标签对应的标准驾驶风险系数，以使所述训练驾驶数据携带所述标准驾驶风险系数，将所述训练驾驶数据划分为训练集和测试集；

将所述训练集中的训练驾驶数据分别输入到原始xgboost模型和原始lightGBM模型，获取所述原始xgboost模型输出的第一训练结果和所述原始lightGBM模型输出的第二训练结果，根据所述第一训练结果获取有效xgboost模型,根据所述第二训练结果获取有效lightGBM模型；

将所述测试集中的训练驾驶数据分别输入到有效xgboost模型和有效lightGBM模型，获取所述有效xgboost模型输出的第一测试结果和所述有效lightGBM模型输出的第二测试结果；

若所述第一测试结果与所述标准驾驶风险系数的误差在预设的误差范围内，则将所述有效xgboost模型作为目标xgboost模型；若所述第二测试结果与所述标准驾驶风险系数的误差在预设的误差范围内，则将所述有效lightGBM模型作为目标lightGBM模型。

2.如权利要求1所述的驾驶风险预测方法，其特征在于，所述原始驾驶数据包括原始驾驶环境数据和原始驾驶行为数据，所述清洗规则包括环境清洗规则和行为清洗规则；

所述使用清洗规则对所述原始驾驶数据进行清洗，获取有效驾驶数据，包括：

使用环境清洗规则对所述原始驾驶环境数据进行清洗，获取有效驾驶环境数据；

使用行为清洗规则对所述原始驾驶行为数据进行清洗，获取有效驾驶行为数据；

将所述有效驾驶环境数据和有效驾驶行为数据作为有效驾驶数据。

3.如权利要求1所述的驾驶风险预测方法，其特征在于，所述根据所述第一训练结果获取有效xgboost模型,根据所述第二训练结果获取有效lightGBM模型，包括：

将所述第一训练结果和所述标准驾驶风险系数进行比较，获取所述第一训练结果和所述标准驾驶风险系数的第一误差值，当所述第一误差值在预设的误差范围内，则停止训练所述原始xgboost模型，获取有效xgboost模型；

将所述第二训练结果和所述标准驾驶风险系数进行比较，获取所述第二训练结果和所述标准驾驶风险系数的第二误差值，当所述第二误差值在预设的误差范围内，则停止训练所述原始lightGBM模型，获取有效lightGBM模型。

4.如权利要求1所述的驾驶风险预测方法，其特征在于，在所述获取目标风险系数的步骤之后，所述驾驶风险预测方法还包括：

基于所述有效驾驶数据，获取与所述有效驾驶数据相对应的驾驶特征；

基于所述驾驶特征和所述目标风险系数查询产品信息表，获取待推荐车险产品，并将所述待推荐车险产品发送给所述原始驾驶数据对应的客户端。

5.一种驾驶风险预测装置，其特征在于，包括：

目标风险系数获取模块，用于将所述第一标准风险系数和所述第二标准风险系数进行融合处理，获取目标风险系数；

其中，还包括训练驾驶数据第一处理单元，用于获取训练驾驶数据，使用所述清洗规则对所述训练驾驶数据进行清洗，对清洗后的训练驾驶数据进行标签处理，获取驾驶标签；

训练驾驶数据第二处理单元，用于基于所述驾驶标签查询驾驶风险系数表，获取与所述驾驶标签对应的标准驾驶风险系数，以使所述训练驾驶数据携带所述标准驾驶风险系数，将所述训练驾驶数据划分为训练集和测试集；

模型训练单元，用于将所述训练集中的训练驾驶数据分别输入到原始xgboost模型和原始lightGBM模型，获取所述原始xgboost模型输出的第一训练结果和所述原始lightGBM模型输出的第二训练结果，根据所述第一训练结果获取有效xgboost模型,根据所述第二训练结果获取有效lightGBM模型；

模型测试单元，用于将所述测试集中的训练驾驶数据分别输入到有效xgboost模型和有效lightGBM模型，获取所述有效xgboost模型输出的第一测试结果和所述有效lightGBM模型输出的第二测试结果；

模型确认单元，用于若所述第一测试结果与所述标准驾驶风险系数的误差在预设的误差范围内，则将所述有效xgboost模型作为目标xgboost模型；若所述第二测试结果与所述标准驾驶风险系数的误差在预设的误差范围内，则将所述有效lightGBM模型作为目标lightGBM模型。

6.如权利要求5所述的驾驶风险预测装置，其特征在于，所述原始驾驶数据处理模块包括：

第一清洗单元，用于使用环境清洗规则对原始驾驶环境数据进行清洗，获取有效驾驶环境数据；

第二清洗单元，用于使用行为清洗规则对原始驾驶行为数据进行清洗，获取有效驾驶行为数据；

有效驾驶数据获取单元，用于将所述有效驾驶环境数据和有效驾驶行为数据作为有效驾驶数据。

7.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述驾驶风险预测方法的步骤。

8.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至4任一项所述驾驶风险预测方法的步骤。