CN117273964B

CN117273964B - 一种自适应行驶数据的智能车险策略生成系统及方法

Info

Publication number: CN117273964B
Application number: CN202311556445.3A
Authority: CN
Inventors: 房永斌; 高云; 肖振峰; 姚磊
Original assignee: Guoren Property Insurance Co ltd
Current assignee: Guoren Property Insurance Co ltd
Priority date: 2023-11-21
Filing date: 2023-11-21
Publication date: 2024-02-02
Anticipated expiration: 2043-11-21
Also published as: CN117273964A

Abstract

本发明公开了一种自适应行驶数据的智能车险策略生成系统及方法，包括步骤：S1：收集车辆的实时行驶数据；S2：采用DBSCAN算法对行驶数据进行聚类，识别出驾驶行为模式，为每个驾驶事件分配一个驾驶行为模式标签；S3：基于驾驶数据、路网信息构建交通网络图，使用训练好的图神经网络GNN对交通网络图进行分析；判断此次行驶的驾驶风险程度；S4：如果是高风险则自动生成高保费保险策略，否则输出低保费保险策略。本申请采用DBSCAN算法为每个驾驶事件分配一个驾驶行为模式标签，使用训练好的图神经网络GNN对交通网络图进行分析，判断行驶的驾驶风险程度，实现了危险程度的自动化准确判断，大大增强了保险出险自动化程度。

Description

一种自适应行驶数据的智能车险策略生成系统及方法

技术领域

本发明涉及保险自动处理技术领域，具体涉及一种自适应行驶数据的智能车险策略生成系统及方法。

背景技术

在现代交通系统中，汽车保险是不可或缺的一环。传统的汽车保险定价通常基于个人的基本信息，如年龄、驾驶经验以及车辆的型号和年龄。然而，这些静态的信息往往不能准确反应驾驶员的驾驶行为和相应的风险水平。且保险都是按年度收费，无论驾驶情况如何都是缴费相同金额，不能够根据每次出现进行针对性的提出保险方案，随着信息技术的发展，尤其是车联网、大数据和机器学习技术的崛起，为汽车保险领域带来了新的可能性。在传统的车险定价模型中，保险费率通常基于静态的因素，如驾驶员的年龄、驾驶经验、车辆类型等。然而，这种方法很难准确反映驾驶员的实际驾驶行为和风险水平。近年来，随着车联网、大数据和机器学习技术的发展，智能车险成为了一个新的研究和应用方向。智能车险通过收集和分析车辆的实时行驶数据，可以为每个驾驶员提供更为个性化和精准的保险定价方案。

且现有的智能算法不能够实现驾驶危险程度的准确判断，不能够结合道路、速度等情况进行针对性的设计计算，导致计算准确度较低，且在进行危险程度判断时，没有进行对行为的一个初步判断，进而根据初步判断结果结合行驶数据进一步实现危险程度的判断，从而理解和分析驾驶员的驾驶行为和风险水平。

发明内容

针对现有技术中提到的上述问题，为解决上述技术问题，本发明提供了一种自适应行驶数据的智能车险策略生成系统及方法，该方法通过采用DBSCAN算法对行驶数据进行聚类，识别出驾驶行为模式，为每个驾驶事件分配一个驾驶行为模式标签，构建交通图为每个节点和边分配特征向量，特征包括速度、加速度、由DBSCAN得到的驾驶行为标签，使用训练好的图神经网络GNN对交通网络图进行分析；判断此次行驶的驾驶风险程度，实现了危险程度的准确判断，实现了保险策略的自动化处理，大大增强了保险出险自动化程度。

本发明的一种自适应行驶数据的智能车险策略生成方法，包括步骤：

S1：收集车辆的实时行驶数据，包括速度、加速度、刹车次数、天气条件、转向角度、刹车频率、平均速度、急加速次数；

S2：采用DBSCAN算法对行驶数据进行聚类，识别出驾驶行为模式，为每个驾驶事件分配一个驾驶行为模式标签；驾驶行为模式标签包括正常驾驶或高速或低速或急加速或急刹车；

S21：选择DBSCAN参数包括：一个点的邻域半径，一个簇的最小点数/>;其中，一个点表示单次驾驶事件，即一次急刹车和/或急加速和/或一段时间的平均速度和/或刹车频率；邻域半径/>为特定值，在邻域半径/>范围内的速度变化和/或加速度变化和/或刹车次数变化则认定为相同驾驶行为，归为同一类别；特定路段上至少需要/>个驾驶事件才能形成一个独立的驾驶行为模式；

S22:对数据集中的每个点单次驾驶事件进行遍历，查询点驾驶事件在/>领域内的所有点：

其中，D为数据集包括速度和/或加速度和/或刹车频率和/或急加速次数数据，dist是距离函数；为数据集中两个不同的点即两个不同的驾驶事件，/>为对于/>点/>邻域中的点数；

其中，、/>为数据集中点/>驾驶事件和点/>驾驶事件分别对应的特征向量；/>是一个全为1的n×n矩阵，n是数据点的数量;/>为径向基函数作为核函数计算出的/>、/>之间的核矩阵；

S23:如果中的点数即驾驶事件数大于或等于/>，标记/>为核心点；并创建一个新的聚类；将/>和/>中的所有点添加到该聚类中；如果/>中的点数小于/>，则/>为边界点；对于每个边界点，找到最近的核心点，并将其分配到相应的聚类；数据集中未分配到任何聚类的点被标记为噪声点;

S24：得到聚类结果后，根据一个聚类的平均速度或急加速次数或急刹车次数与分别对应的设定阈值进行比较，若大于阈值，则为高速或急加速或急刹车标签；

S3：基于驾驶数据、路网信息构建交通网络图，使用训练好的图神经网络GNN对交通网络图进行分析；判断此次行驶的驾驶风险程度；

S4：如果是高风险则自动生成高保费保险策略，否则输出低保费保险策略；

是节点/>的保险费率，/>是基本保费率，/>是一个调整因子，是由GNN模型计算出的驾驶风险。

优选地，所述S3：使用训练好的图神经网络GNN对交通网络图进行分析；判断此次行驶的驾驶风险程度，包括：S31：基于驾驶数据、路网信息构建交通网络图，节点代表车辆、交叉口或道路段；边代表车辆之间的距离、道路连接；,/>是图，/>是节点集，/>是边集；

S32：为每个节点和边分配特征向量；对于车辆节点，特征包括速度、加速度、由DBSCAN得到的驾驶行为标签；

S33：使用训练好的GNN模型分析交通网络和驾驶数据，以识别高风险和低风险的驾驶行为，输出此次行驶的驾驶风险程度。

优选地，所述收集车辆的实时行驶数据，包括速度、加速度、刹车次数、行驶路线、天气条件、转向角度、刹车频率、平均速度、急加速次数；其中天气条件包括温度、湿度、风速、降雨量、雪量。

优选地，所述S2：采用DBSCAN算法对行驶数据进行聚类，识别出驾驶行为模式，为每个驾驶事件分配一个驾驶行为模式标签；驾驶行为模式标签包括正常驾驶或高速或低速或急加速或急刹车；其中驾驶事件为从时间点A到时间点B的行驶记录，或者从地点X到地点Y的行驶记录。

优选地，所述S33：使用训练好的GNN模型分析交通网络和驾驶数据，以识别高风险和低风险的驾驶行为，输出此次行驶的驾驶风险程度，其中，GNN模型包括多层图卷积层,图卷积操作如下：

其中，表示节点/>在/>层的特征向量即某个车辆的速度或加速度特征或某个交叉路口的交通流量特征或道路段的拥堵程度特征，其中节点/>是车辆或交叉口或道路段，/>、分别表示/>层的权重和偏置，是训练过程中学习到的参数；/>是ReLU激活函数；/>是节点/>的领域节点集合，在交通网络中，一个车辆节点，它的领域包括小于设定距离阈值的车辆或交叉口；

在通过多层图卷积操作后，每个节点将获得一个新的特征表示，通过一个全连接层和sigmoid激活函数/>，计算出每个节点/>的风险程度/>:

其中，、/>分别表示全连接层的权重和偏置，L是GNN的层数，全连接层将从多层图卷积层获得的特征合并成一个单一的输出。

本申请还提供一种自适应行驶数据的智能车险策略生成系统，包括：

传感器数据采集模块，收集车辆的实时行驶数据，包括速度、加速度、刹车次数、天气条件、转向角度、刹车频率、平均速度、急加速次数；

驾驶行为模式判断模块，采用DBSCAN算法对行驶数据进行聚类，识别出驾驶行为模式，为每个驾驶事件分配一个驾驶行为模式标签；驾驶行为模式标签包括正常驾驶或高速或低速或急加速或急刹车；

参数设置模块，选择DBSCAN参数包括：一个点的邻域半径，一个簇的最小点数;其中，一个点表示单次驾驶事件，即一次急刹车和/或急加速和/或一段时间的平均速度和/或刹车频率；邻域半径/>为特定值，在邻域半径/>范围内的速度变化和/或加速度变化和/或刹车次数变化则认定为相同驾驶行为，归为同一类别；特定路段上至少需要/>个驾驶事件才能形成一个独立的驾驶行为模式；

遍历模块，对数据集中的每个点单次驾驶事件进行遍历，查询点驾驶事件在/>领域内的所有点：

其中，D为数据集包括速度和/或加速度和/或刹车频率和/或急加速次数数据，dist是距离函数；为数据集中两个不同的点即两个不同的驾驶事件，

其中，、/>为数据集中点/>和点/>分别对应的特征向量；/>是一个全为1的n×n矩阵，n是数据点的数量;/>为径向基函数作为核函数计算出的/>、/>之间的核矩阵；

标记模块，如果中的点数大于或等于/>，标记/>为核心点；并创建一个新的聚类；将/>和/>中的所有点添加到该聚类中；如果/>中的点数小于/>，则/>为边界点；对于每个边界点，找到最近的核心点，并将其分配到相应的聚类；数据集中未分配到任何聚类的点被标记为噪声点;

标签生成模块，得到聚类结果后，根据一个聚类的平均速度或急加速次数或急刹车次数与分别对应的设定阈值进行比较，若大于阈值，则为高速或急加速或急刹车标签；

驾驶风险程度判断模块，基于驾驶数据、路网信息构建交通网络图，使用训练好的图神经网络GNN对交通网络图进行分析；判断此次行驶的驾驶风险程度；

保险策略生成模块，如果是高风险则自动生成高保费保险策略，否则输出低保费保险策略；

优选地，所述驾驶风险程度判断模块：使用训练好的图神经网络GNN对交通网络图进行分析；判断此次行驶的驾驶风险程度，包括：交通网络图构建模块：基于驾驶数据、路网信息构建交通网络图，节点代表车辆、交叉口或道路段；边代表车辆之间的距离、道路连接；,/>是图，/>是节点集，/>是边集；

特征向量生成模块：为每个节点和边分配特征向量；对于车辆节点，特征包括速度、加速度、由DBSCAN得到的驾驶行为标签；

GNN模型分析模块：使用训练好的GNN模型分析交通网络和驾驶数据，以识别高风险和低风险的驾驶行为，输出此次行驶的驾驶风险程度。

优选地，所述驾驶行为模式判断模块：采用DBSCAN算法对行驶数据进行聚类，识别出驾驶行为模式，为每个驾驶事件分配一个驾驶行为模式标签；驾驶行为模式标签包括正常驾驶或高速或低速或急加速或急刹车；其中驾驶事件为从时间点A到时间点B的行驶记录，或者从地点X到地点Y的行驶记录。

优选地，所述GNN模型分析模块：使用训练好的GNN模型分析交通网络和驾驶数据，以识别高风险和低风险的驾驶行为，输出此次行驶的驾驶风险程度，其中，GNN模型包括多层图卷积层,图卷积操作如下：

本发明提供了一种自适应行驶数据的智能车险策略生成系统及方法，所能实现的有益技术效果如下：

1、本申请通过采用DBSCAN算法对行驶数据进行聚类，识别出驾驶行为模式，为每个驾驶事件分配一个驾驶行为模式标签，构建交通图为每个节点和边分配特征向量，特征包括速度、加速度、由DBSCAN得到的驾驶行为标签，使用训练好的图神经网络GNN对交通网络图进行分析；判断此次行驶的驾驶风险程度，实现了危险程度的准确判断，实现了保险策略的自动化处理，大大增强了保险出险自动化程度。

2、本发明通过采用采用DBSCAN算法对行驶数据进行聚类，识别出驾驶行为模式，为每个驾驶事件分配一个驾驶行为模式标签；驾驶行为模式标签包括正常驾驶或高速或低速或急加速或急刹车；其中，dist是距离函数，计算过程中采用为径向基函数作为核函数计算出的/>、/>之间的核矩阵，提高了计算效率以及保险计算准确度。

3、本发明采用GNN模型分析模块：使用训练好的GNN模型分析交通网络和驾驶数据，以识别高风险和低风险的驾驶行为，输出此次行驶的驾驶风险程度，驾驶风险程度判断模块中使用训练好的图神经网络GNN对交通网络图进行分析；判断此次行驶的驾驶风险程度，在特征向量生成模块为每个节点和边分配特征向量；对于车辆节点，特征包括速度、加速度、由DBSCAN得到的驾驶行为标签；由DBSCAN得到的驾驶行为标签大大丰富了源数据，大大实现了判断准确度，实现了综合多项因素判断保险自动化理赔。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本发明的一种自适应行驶数据的智能车险策略生成方法步骤示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

实施例1：

针对现有技术中提到的上述问题，为解决上述技术问题，如附图1所示：本发明提供了一种自适应行驶数据的智能车险策略生成方法，包括步骤：

S1：收集车辆的实时行驶数据，包括速度、加速度、刹车次数、天气条件、转向角度、刹车频率、平均速度、急加速次数；天气条件包括多种指标，如温度、湿度、风速、降雨量、雪量等。聚类天气条件可能意味着找到具有相似天气特征的时间或事件。特征处理:首先，可以将各种天气条件指标标准化，以消除不同指标之间的量纲影响。如果有缺失值，可能需要进行填充或删除处理。

在一个实施例中收集车辆行驶数据，包括以下几类信息：

速度：车辆在不同时间点的速度。

加速度：车辆的加速度，即速度的变化率。

刹车次数：在一个行驶周期内车辆刹车的次数。

天气条件：行驶期间的天气状况，如晴朗、雨天、雪天等。

转向角度：车辆转向的角度数据。

数据预处理过程如下：

速度和加速度：这些是连续变量，可以直接用作特征向量的组成部分。例如，可以计算每个行驶周期内的平均速度和加速度。

刹车次数：这是一个整数，表示在特定时间段内的刹车频率。可以直接将此数字作为特征向量的一个维度。

天气条件：这是一个分类变量。可以使用独热编码（One-Hot Encoding）将其转换为特征向量。例如，晴朗、雨天、雪天可以编码为[1, 0, 0]、[0, 1, 0]、[0, 0, 1]。

转向角度：转向角度也是一个连续变量，可以直接包含在特征向量中，或者进行简单的数值转换（如将角度规范化到一定范围内）。

特征向量构建过程如下：

在一个实施例中对于一个特定的驾驶周期，我们收集到以下数据：

平均速度：60km/h；

平均加速度：0.03g（g为重力加速度）；

刹车次数：5次；

天气条件：雨天；

平均转向角度：30度；

将这些数据转换为特征向量过程如下：

速度和加速度可直接使用，例如[60, 0.03]。

刹车次数直接作为一个维度，如[5]。

天气条件（雨天）转换为独热编码，例如[0, 1, 0]。

转向角度可直接使用，例如[30]。

最终，这些数据合并成一个特征向量：60,0.03,5,0,1,0,30。

这个特征向量反映了车辆在特定行驶周期内的综合行驶特征，可以用于DBSCAN算法的聚类分析。通过这种方式，我们可以将原始的、多维度的行驶数据有效地转换为用于机器学习和数据分析的特征向量。

S2：采用DBSCAN算法对行驶数据进行聚类，识别出驾驶行为模式，为每个驾驶事件分配一个驾驶行为模式标签；

驾驶行为模式标签包括正常驾驶或高速或低速或急加速或急刹车；驾驶事件:时间段: 例如，从时间点A到时间点B的行驶记录，可能是几秒钟、几分钟或几小时的行驶数据。路段: 例如，从地点X到地点Y的行驶记录，包括该路段上车辆的速度、加速度、刹车次数等。数据记录: 在特定时间段或路段上，车辆的速度、加速度、刹车次数、转向角度、天气条件等的记录。

驾驶行为模式标签:正常驾驶: 根据行驶数据，驾驶行为符合通常的驾驶标准和规范。高速: 在特定时间段或路段上，车辆的速度超过某个特定阈值或超过正常速度范围。低速: 在特定时间段或路段上，车辆的速度低于某个特定阈值或低于正常速度范围。急加速: 在很短的时间内，车辆的速度增加了很多，超过了正常的加速范围。急刹车: 在很短的时间内，车辆的速度减少了很多，超过了正常的刹车范围。

S21：选择DBSCAN参数包括：一个点的邻域半径，一个簇的最小点数/>;其中，一个点表示单次驾驶事件，即一次急刹车和/或急加速和/或一段时间的平均速度和/或刹车频率；邻域半径/>为特定值，在邻域半径/>范围内的速度变化和/或加速度变化和/或刹车次数变化则认定为相同驾驶行为，归为同一类别；特定路段上至少需要/>个驾驶事件才能形成一个独立的驾驶行为模式；我们有一个数据库，记录了多个司机在不同路段的行驶数据，包括车速、加速度、刹车次数等。我们希望通过DBSCAN算法来识别驾驶行为模式，为了做到这一点，我们需要设置算法的两个关键参数：邻域半径（ε）和最小点数（MinPts）。

邻域半径（ε）:这代表我们在寻找驾驶行为模式时考虑的距离阈值。在实际应用中，假设我们设置ε为5km/h的速度变化和0.5m/s²的加速度变化。这意味着如果两次行驶事件中的速度变化和加速度变化都在这个阈值内，我们就认为这两次行驶事件是相似的。

最小点数（MinPts）:这个参数定义了一个驾驶行为模式成立所需的最小事件数量。在实际应用中，如果我们将MinPts设置为3，那么至少需要3个相似的行驶事件（比如在类似的加速度和速度变化内）来构成一个驾驶行为模式。

距离函数（dist）:在DBSCAN算法中，距离函数用来衡量两个数据点之间的相似度。在我们的场景中，dist可以定义为速度和加速度的欧几里得距离，也就是说，我们计算两个行驶事件中速度和加速度数据点的直线距离来评估它们的相似度。

S22:对数据集中的每个点进行遍历，查询点在/>领域内的所有点：

其中，D为数据集，dist是距离函数；为数据集中两个不同的点，/>为对于/>点/>邻域中的点数；dist是距离函数采用马氏距离是一种考虑数据分布的距离度量，将数据协方差矩阵的逆改为/>为径向基函数作为核函数，大大增强了准确度：

其中，、/>为数据集中点/>和点/>分别对应的特征向量；/>是一个全为1的n×n矩阵，n是数据点的数量;/>为径向基函数作为核函数计算出的/>、/>之间的核矩阵；核矩阵是一个将所有数据点之间的核函数值组织在一起的矩阵。在核矩阵中，每个元素Kij表示数据点i 和数据点j之间的核函数值。每个元素Kij表示数据点i 和数据点j之间的核函数值。计算核矩阵的过程主要是基于所选的核函数来计算数据点之间的核值。假设我们有两个数据向量a和b，并且我们选择径向基函数核（RBF Kernel）作为核函数。RBF核的公式为：

是一个正参数，我们可以按照以下步骤计算核矩阵K；假设我们有向量a=(1,2)和b=(3,4),c=(5,6),使用RBF核并且/>；

计算所有数据点对之间的核函数值:

构建核矩阵：

将计算得出的核函数值填充到核矩阵中，得到：

S23:如果中的点数大于或等于/>，标记/>为核心点；并创建一个新的聚类；将/>和/>中的所有点添加到该聚类中；如果/>中的点数小于/>，则/>为边界点；对于每个边界点，找到最近的核心点，并将其分配到相应的聚类；数据集中未分配到任何聚类的点被标记为噪声点;

S3：基于驾驶数据、路网信息构建交通网络图，使用训练好的图神经网络GNN对交通网络图进行分析；判断此次行驶的驾驶风险程度；图神经网络（Graph Neural Network,GNN）是一种在图结构数据上进行学习的神经网络。在交通网络和驾驶数据分析的应用中，GNN可以用来识别高风险和低风险的驾驶行为。以下是一个基本的GNN模型结构和操作的示例，用于分析交通网络和驾驶数据：GNN模型结构:

节点表示: 节点可以代表车辆，每个节点的特征可以包括速度、加速度以及通过前面步骤（如DBSCAN聚类）得到的驾驶行为标签等。

边表示: 边可以代表车辆之间的相对位置或道路连接，边的特征可以包括两个节点之间的距离、相对速度等。

图卷积层: GNN包含多层图卷积层，每层图卷积层都可以学习图中节点和边的局部模式。图卷积操作是GNN的核心。

风险评分: 在通过多层图卷积操作后，每个节点将获得一个新的特征表示，这个特征表示可以捕捉节点及其周围环境的信息。最后，通过一个全连接层和sigmoid激活函数，我们可以得到每个节点（或车辆）的风险程度判断：风险分类: 根据风险程度判断，我们可以将驾驶行为分为高风险和低风险。例如，如果风险评分大于0.5，我们可以将该驾驶行为分类为高风险；否则，分类为低风险。有一些被认为是交通高风险区域的交叉口，这些交叉口通常会有更多的交通事故。

图神经网络（Graph Neural Networks, GNN）提供了一种强大的框架，用于分析交通网络图，并在其中捕捉复杂的节点和边关系。在交通和驾驶行为分析的场景中，以下是GNN如何具体执行分析的例子：

1. 交通网络图输入：

将前面构建的交通网络图作为输入。在这个图中，每个节点（例如车辆、交叉口和道路段）和边（例如车辆之间的相对位置、道路连接）都具有相关的特征向量。

2. 图神经网络架构：

设计GNN架构，包括多个图卷积层，每层都能捕获节点和边之间的关系，并更新节点和边的特征表示。

3. 节点和边特征的传播：

在每个图卷积层中，节点和边的特征通过网络传播和更新，以捕获其邻居的信息。例如，如果一个车辆节点在高风险区域，并且与多个急刹车事件相关联，其特征表示将在网络传播过程中得到更新，以反映这些风险因素。

4. 特征学习：

通过多层传播，GNN能够学习交通网络中节点和边的高级特征表示，这些表示能够捕捉交通网络的复杂结构和驾驶行为的模式。

5. 风险分析：

利用学习到的特征表示，可以分析和识别高风险和低风险的驾驶行为，以及交通网络中的潜在风险区域。例如，如果某个区域中的节点（代表车辆或交叉口）具有与高风险驾驶行为相关联的特征，该区域可能被标记为高风险区域。

6. 保险策略生成：

根据风险分析的结果，可以为每个驾驶员生成个性化的保险策略。例如，如果GNN模型识别出某个驾驶员经常在高风险区域驾驶或展现出高风险的驾驶行为，保险公司可能会提供一个高保费的保险策略。

通过分析交通网络图，GNN模型可能会识别出这些高风险区域，并为经常在这些区域驾驶的驾驶员分配高风险标签。同时，通过分析驾驶员的驾驶行为标签和交通网络结构，GNN模型也可能会识别出哪些驾驶员更可能展现出危险的驾驶行为，例如急刹车或急加速。基于这些分析结果，保险公司可以为每个驾驶员提供个性化的保险策略，例如为高风险驾驶员提供高保费的保险策略，而为低风险驾驶员提供低保费的保险策略。

通过这种方式，GNN模型可以分析交通网络和驾驶数据，识别高风险和低风险的驾驶行为，并为每个驾驶行为输出一个风险评分

优选地，所述收集车辆的实时行驶数据，包括速度、加速度、刹车次数、行驶路线、天气条件、转向角度、刹车频率、平均速度、急加速次数；其中天气条件包括温度、湿度、风速、降雨量、雪量；基本统计特征：

计算基本的统计特征，例如平均速度、最大速度、最小速度、平均加速度、最大加速度等。

驾驶行为特征：急刹车次数：计算在某个时间窗口内急刹车的次数，例如通过检测速度的快速下降来识别急刹车事件。

急加速次数：类似地，计算在某个时间窗口内急加速的次数。

转向行为：通过分析方向盘角度变化和/或车辆的运动轨迹来提取转向行为特征，例如转向角速度、转向次数等。

时间和空间特征：

行驶时间：例如总行驶时间、夜间行驶时间等。

行驶距离：例如总行驶距离、高速行驶距离等。

地理位置：例如常驻区域、高风险区域逗留时间等。

频域特征：

通过对速度或加速度信号的频率分析（例如使用傅立叶变换），提取频域特征，例如主要频率成分和能量。

下面为一个实施例：

司机A在一座城市中驾驶。他的车辆配备了传感器，可以收集速度、加速度、刹车频率等数据。同时，我们也有该城市的交通网络数据，包括其他车辆的位置和速度，以及交叉口信息。

数据收集和处理:车辆数据: 假设在一个特定的早高峰时段，司机A的车辆数据显示他的平均速度为40公里/小时，频繁急加速和急刹车，平均每10分钟至少有一次急刹车事件。

交通网络数据: 同时，我们收集到了司机A周围交通网络的数据。比如，他所在的路段经常发生交通拥堵，且附近有一个交叉口是事故高发区。

构建交通网络图:

节点: 包括司机A的车辆节点和其他车辆节点，以及关键交叉口节点。

边: 节点间的距离和关系，如车辆之间的相对距离和位置。

GNN模型分析:图卷积层: 模型的第一层图卷积将更新每个节点（包括司机A的车辆）的特征，考虑邻居节点（其他车辆和交叉口）的数据。比如，司机A的节点将整合附近车辆的速度和刹车频率，以及交叉口的事故记录。

特征更新: 经过几层图卷积之后，每个节点获得了全局和局部交通情况的综合表示。

风险评估:基于GNN模型分析的结果，我们给司机A的行驶评估一个风险分数。假设这个分数范围是从0（最低风险）到1（最高风险）。

假设司机A的风险评分计算出来是0.75，这意味着他的驾驶行为和他所在的交通环境相结合，被认为是较高风险的。

这个高风险主要是因为他的急刹车行为频繁，以及他所驾驶的路段附近的交通拥堵和交叉口事故记录。

输出结果:根据评分，我们可以为司机A制定一个相应的车险策略。由于他的风险评分是0.75，这表明较高的风险，因此可能会推荐一个相对较高的保费率。

其中，表示节点/>在/>层的特征向量，/>、/>分别表示/>层的权重和偏置；/>是ReLU激活函数；/>是节点/>的领域节点集合；

在通过多层图卷积操作后，每个节点将获得一个新的特征表示，通过一个全连接层和sigmoid激活函数，计算出每个节点/>的风险程度/>:

其中，、/>分别表示全连接层的权重和偏置，L是GNN的层数。

参数设置模块，选择DBSCAN参数包括：一个点的邻域半径，一个簇的最小点数;其中，一个点表示单次驾驶事件，即一次急刹车和/或急加速和/或一段时间的平均速度和/或刹车频率；邻域半径/>为特定值，在邻域半径/>范围内的速度变化和/或加速度变化和/或刹车次数变化则认定为相同驾驶行为，归为同一类别；特定路段上至少需要/>个驾驶事件才能形成一个独立的驾驶行为模式；邻域半径（ε）: 我们观察到一个司机在城市中的行驶数据，如果司机在不同时间点的速度变化和加速度变化都在5km/h和0.5m/s²内，我们就将这些行驶数据视为彼此邻近。

最小点数（MinPts）: 如果在一个特定的路段上，我们发现至少有3次行驶事件显示出上述邻近的速度和加速度变化，我们就可以将这些行驶事件分类为一个独立的驾驶行为模式，如“经常在该路段急加速”。

距离函数（dist）: 假设我们有两个行驶事件，一个事件的速度和加速度分别是(50km/h, 1m/s²)，另一个是(53km/h, 1.3m/s²)，我们将使用欧几里得距离来计算这两个点之间的距离，并判断它们是否足够“邻近”来被视为同一个驾驶行为模式。

其中，、/>为数据集中点/>和点/>分别对应的特征向量；/>是一个全为1的n×n矩阵，n是数据点的数量;/>为径向基函数作为核函数计算出的/>、/>之间的核矩阵。

假设我们有一个包含速度和加速度特征的驾驶数据集。我们选择ε = 0.5和MinPts = 5，并运行DBSCAN算法。我们遍历数据集中的每个点。对于第一个点，我们找到其ε邻域内的所有点。如果ε邻域内的点数大于或等于5，我们创建一个新的聚类，将这些点添加到聚类中，并标记这个点为核心点。我们继续处理数据集中的其他点，重复步骤1和2，直到所有点都被访问。最后，我们将每个边界点分配到最近的核心点的聚类，并将未分配到任何聚类的点标记为噪声点。

/>

构建交通网络图是一个涉及多个步骤的过程，需要结合驾驶数据、交通基础设施数据和其他相关信息。以下是如何构建交通网络图，并将驾驶行为标签加入每个节点特征的详细步骤：

1. 数据准备：

驾驶数据：收集包括速度、加速度、位置、方向和时间戳等信息的驾驶数据。交通基础设施数据：获取路网信息，包括道路、交叉口、信号灯等的位置和属性。

2. 节点创建：

车辆节点：每个车辆在特定时刻可以表示为一个节点。节点的基本特征包括车辆的位置、速度和加速度等。交叉口和道路段节点：交叉口和道路段可以从交通基础设施数据中得到，每个交叉口和道路段也可以表示为一个节点。

3. 边创建：

车辆之间的边：根据车辆之间的相对位置和距离创建边，边的特征可以包括相对速度、距离等。车辆与交叉口/道路段的边：根据车辆与交叉口或道路段的相对位置和距离创建边。

4. 驾驶行为标签的加入：

根据之前DBSCAN聚类的结果，为每个车辆节点加入一个驾驶行为标签。例如，如果一个驾驶事件被归类为“急加速”，则该车辆节点的驾驶行为标签将是“急加速”。

5. 节点和边特征的组合：

组合每个节点的所有特征，包括基本特征和驾驶行为标签，形成一个综合特征向量。类似地，也可以为边创建一个包含所有相关特征的特征向量。

示例：

假设我们有两辆车A和B，以及一个交叉口X。在某个特定时间点：

车辆节点：车A的速度是60 km/h，加速度是2 m/s²，驾驶行为标签是“正常驾驶”。车B的速度是80 km/h，加速度是-5 m/s²，驾驶行为标签是“急刹车”。

交叉口节点：交叉口X的位置信息和相关交通规则等。边：车A与交叉口X之间的距离是200米。车B与交叉口X之间的距离是100米。车A与车B之间的距离是50米，相对速度是20km/h。

通过上述步骤，我们可以为每个节点和边构建一个特征向量，并构建一个交通网络图，该图反映了交通网络的结构和车辆的驾驶行为。在后续的分析中，这个图可以作为图神经网络模型的输入，以进一步分析交通网络和驾驶行为的复杂交互，并为智能保险策略的制定提供支持。

其中，、/>分别表示全连接层的权重和偏置，L是GNN的层数。ReLU激活函数：这是一种非线性函数，用于在模型的每一层引入非线性特性，帮助模型捕捉复杂的数据模式。在实际应用中，它可以帮助模型更好地区分不同的驾驶行为或交通情况。

N(i)：这个符号表示节点 i 的邻域节点集合。在交通网络中，对于一个车辆节点，它的邻域可能包括其他车辆或相邻的交叉口。这有助于模型理解某一节点在整个交通网络中的角色和影响。

全连接层：这一层负责将从多层图卷积层获得的特征合并成一个单一的输出，这个输出可以是一个预测值或分类结果。在我们的场景中，这可能是对某个节点（如一辆车或一个交叉口）的驾驶风险评级。

sigmoid激活函数：这是用于产生一个介于0和1之间的输出值，通常用于表示概率或某种形式的二分类输出。在智能车险策略中，这可以用来评估和输出某个节点（如一辆车）的高风险或低风险驾驶行为的概率。

以上对一种自适应行驶数据的智能车险策略生成系统及方法进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的核心思想；同时，对于本领域的一般技术人员，依据本发明的思想和方法，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种自适应行驶数据的智能车险策略生成方法，其特征在于，包括步骤：

S23:如果中的点数即驾驶事件数大于或等于/>，标记/>为核心点；并创建一个新的聚类；将/>和/>中的所有点添加到该聚类中；如果/>中的点数小于，则/>为边界点；对于每个边界点，找到最近的核心点，并将其分配到相应的聚类；数据集中未分配到任何聚类的点被标记为噪声点;

S31：基于驾驶数据、路网信息构建交通网络图，节点代表车辆、交叉口或道路段；边代表车辆之间的距离、道路连接；,/>是图，/>是节点集，/>是边集；

S33：使用训练好的GNN模型分析交通网络和驾驶数据，以识别高风险和低风险的驾驶行为，输出此次行驶的驾驶风险程度；

2.如权利要求1所述的一种自适应行驶数据的智能车险策略生成方法，其特征在于，所述收集车辆的实时行驶数据，包括速度、加速度、刹车次数、行驶路线、天气条件、转向角度、刹车频率、平均速度、急加速次数；其中天气条件包括温度、湿度、风速、降雨量、雪量。

3.如权利要求1所述的一种自适应行驶数据的智能车险策略生成方法，其特征在于，所述S2：采用DBSCAN算法对行驶数据进行聚类，识别出驾驶行为模式，为每个驾驶事件分配一个驾驶行为模式标签；驾驶行为模式标签包括正常驾驶或高速或低速或急加速或急刹车；其中驾驶事件为从时间点A到时间点B的行驶记录，或者从地点X到地点Y的行驶记录。

4.如权利要求1所述的一种自适应行驶数据的智能车险策略生成方法，其特征在于，所述S33：使用训练好的GNN模型分析交通网络和驾驶数据，以识别高风险和低风险的驾驶行为，输出此次行驶的驾驶风险程度，其中，GNN模型包括多层图卷积层,图卷积操作如下：

其中，表示节点/>在/>层的特征向量即某个车辆的速度或加速度特征或某个交叉路口的交通流量特征或道路段的拥堵程度特征，其中节点/>是车辆或交叉口或道路段，/>、/>分别表示/>层的权重和偏置，是训练过程中学习到的参数；/>是ReLU激活函数；/>是节点/>的领域节点集合，在交通网络中，一个车辆节点，它的领域包括小于设定距离阈值的车辆或交叉口；

5.一种自适应行驶数据的智能车险策略生成系统，其特征在于，包括：

参数设置模块，选择DBSCAN参数包括：一个点的邻域半径，一个簇的最小点数/>;其中，一个点表示单次驾驶事件，即一次急刹车和/或急加速和/或一段时间的平均速度和/或刹车频率；邻域半径/>为特定值，在邻域半径/>范围内的速度变化和/或加速度变化和/或刹车次数变化则认定为相同驾驶行为，归为同一类别；特定路段上至少需要/>个驾驶事件才能形成一个独立的驾驶行为模式；

标记模块，如果中的点数即驾驶事件数大于或等于/>，标记/>为核心点；并创建一个新的聚类；将/>和/>中的所有点添加到该聚类中；如果/>中的点数小于，则/>为边界点；对于每个边界点，找到最近的核心点，并将其分配到相应的聚类；数据集中未分配到任何聚类的点被标记为噪声点;

驾驶风险程度判断模块，基于驾驶数据、路网信息构建交通网络图，使用训练好的图神经网络GNN对交通网络图进行分析；判断此次行驶的驾驶风险程度；所述驾驶风险程度判断模块包括：交通网络图构建模块：基于驾驶数据、路网信息构建交通网络图，节点代表车辆、交叉口或道路段；边代表车辆之间的距离、道路连接；,/>是图，/>是节点集，/>是边集；特征向量生成模块：为每个节点和边分配特征向量；对于车辆节点，特征包括速度、加速度、由DBSCAN得到的驾驶行为标签；GNN模型分析模块：使用训练好的GNN模型分析交通网络和驾驶数据，以识别高风险和低风险的驾驶行为，输出此次行驶的驾驶风险程度；

6.如权利要求5所述的一种自适应行驶数据的智能车险策略生成系统，其特征在于，所述收集车辆的实时行驶数据，包括速度、加速度、刹车次数、行驶路线、天气条件、转向角度、刹车频率、平均速度、急加速次数；其中天气条件包括温度、湿度、风速、降雨量、雪量。

7.如权利要求5所述的一种自适应行驶数据的智能车险策略生成系统，其特征在于，所述驾驶行为模式判断模块：采用DBSCAN算法对行驶数据进行聚类，识别出驾驶行为模式，为每个驾驶事件分配一个驾驶行为模式标签；驾驶行为模式标签包括正常驾驶或高速或低速或急加速或急刹车；其中驾驶事件为从时间点A到时间点B的行驶记录，或者从地点X到地点Y的行驶记录。

8.如权利要求6所述的一种自适应行驶数据的智能车险策略生成系统，其特征在于，所述GNN模型分析模块：使用训练好的GNN模型分析交通网络和驾驶数据，以识别高风险和低风险的驾驶行为，输出此次行驶的驾驶风险程度，其中，GNN模型包括多层图卷积层,图卷积操作如下：