CN116127295A

CN116127295A - 基于空间群智大数据的交通事故热点识别方法及装置

Info

Publication number: CN116127295A
Application number: CN202310067004.0A
Authority: CN
Inventors: 陈龙彪; 王一高; 高健楠; 范晓亮; 王程
Original assignee: Xiamen University
Current assignee: Xiamen University
Priority date: 2023-01-16
Filing date: 2023-01-16
Publication date: 2023-05-16

Abstract

本发明公开了一种基于空间群智大数据的交通事故热点识别方法及装置，该方法通过获取轨迹数据，通过地图匹配模型对轨迹数据进行归一化处理，得到归一化轨迹，采用自适应滑动窗口方式从归一化轨迹中提取停车事件；将停车事件采用语义时间段进行分割，得到若干个停车组，每个停车组包括该语义时间段内的停车事件，并对每个停车组内的停车事件进行聚类，得到该语义时间段下的停车热点；对每个停车热点的环境特征进行提取，得到环境特征嵌入；将环境特征嵌入输入GCN模型，分类得到交通事故热点。该方法能够有效识别车辆轨迹中的交通事故热点，帮助城市交通管理部门对城市交通事故热点区域有更深入全面的了解与掌握。

Description

基于空间群智大数据的交通事故热点识别方法及装置

技术领域

本发明涉及交通热点识别领域，具体涉及一种基于空间群智大数据的交通事故热点识别方法及装置。

背景技术

为了减少交通事故的数量，每个城市实施了各种交通执法策略来发现交通事故的位置和模式，例如分析历史交通事故记录和检查道路交叉口的交通监控图像。鉴于昂贵的人力资源配置和基础设施投资，必须在资源有限的情况下推断交通事故热点。

然而，随着经济的快速增长和城市不断扩张，在一些城乡交界处或者开发区，缺乏相关的交通监管设备和警力，交通管理部门必须在人力资源和非人力资源有限的条件下部署警力和安装相关设备，传统的交通事故热点发现策略高度依赖历史交通事故记录和专家经验，无法应用于没有历史记录的新领域。近来，一些研究人员利用交通轨迹进行道路安全和交通相关的研究。其他人分析交通事故的时空特征，结合历史交通事故数据进行可视化并进行相关识别分析。然而，并未对车辆轨迹与交通事故热点的关系进行过深入研究。因此，迫切需要一种低成本、全面、动态的交通事故热点识别方法。

发明内容

针对上述提到的技术问题。本申请的实施例的目的在于提出了一种基于空间群智大数据的交通事故热点识别方法及装置，来解决以上背景技术部分提到的技术问题。

第一方面，本发明提供了一种基于空间群智大数据的交通事故热点识别方法，包括以下步骤：

S1，获取轨迹数据，通过地图匹配模型对轨迹数据进行归一化处理，得到归一化轨迹，采用自适应滑动窗口方式从归一化轨迹中提取停车事件；

S2，将停车事件采用语义时间段进行分割，得到若干个停车组，每个停车组包括该语义时间段内的停车事件，并对每个停车组内的停车事件进行聚类，得到该语义时间段下的停车热点；

S3，对每个停车热点的环境特征进行提取，得到环境特征嵌入；

S4，将环境特征嵌入输入GCN模型，分类得到交通事故热点。

作为优选，步骤S1中获取轨迹数据，具体包括：

S11，获取原始轨迹数据，对原始轨迹数据进行预处理，得到轨迹数据，预处理方式包括冗余数据去重、异常数据剔除和轨迹数据重构。

作为优选，地图匹配模型包括HMM模型，步骤S1中通过地图匹配模型对轨迹数据进行归一化处理，得到归一化轨迹，具体包括：

S12，将轨迹数据中的待匹配点作为观测变量输入HMM模型中，输出得到隐藏状态变量，隐藏状态变量为路网上与轨迹数据中的待匹配点对应的匹配点；

S13，对轨迹数据中的所有待匹配点重复步骤S12，得到归一化轨迹，每个归一化轨迹包括若干个停车序列。

作为优选，步骤S1中采用自适应滑动窗口方式从归一化轨迹中提取停车事件，具体包括：

S14，在每个归一化轨迹P_s＝{p^′ ₁→p^′ ₂→…→p^′ _n}中采用自适应滑动窗口选择滑动窗口停车序列p^′ _m→p^′ _m+1→…→p^′ _m+k，其中，1≤m<n,1≤k≤n-m，n为归一化轨迹中的停车序列的个数；

S15，在滑动窗口停车序列p^′ _m→p^′ _m+1→…→p^′ _m+k中根据下式提取得到停车事件：

其中，dist(p^′ _m,p_i ^′)是滑动窗口停车序列中的第一个点p^′ _m与其他任意一点p_i ^′之间的距离，Δt为滑动窗口停车序列中的第一个点p^′ _m与其他任意一点p_i ^′之间的时间差，δ为阈值；

S16，通过改变步骤S14中的m和k动态调整滑动窗口停车序列的大小，并重复步骤S14-15，提取得到停车事件。

作为优选，步骤S2具体包括：

将停车时间根据日期类型、时间范围和天气进行划分，得到若干个停车组；

采用基于密度的数据聚类方法将每个停车组中的停车事件进行聚类，得到该语义时间段下的停车热点。

作为优选，环境特征嵌入包括道路名称嵌入、兴趣点嵌入和交通流嵌入，步骤S3具体包括：

获取每个停车热点的中文路名，将中文路名输入Bert中文预训练模型，提取道路名称嵌入；

获取每个停车热点周围的兴趣点，通过自动编码器提取兴趣点嵌入；

在每个停车热点所在时间的前后第一时间阈值内间隔第二时间阈值统计停车热点周围的汽车数量，并进行归一化处理，得到流量数据，将流量数据输入递归神经网络，得到交通流嵌入。

作为优选，步骤S4中，采用Haversine公式计算每个停车热点的距离，通过停车热点的距离构造GCN模型中的拉普拉斯矩阵，GCN模型的输入为道路名称嵌入、兴趣点嵌入和交通流嵌入，输出是否为交通事故热点。

第二方面，本发明提供了一种基于空间群智大数据的交通事故热点识别装置，包括：

停车事件提取模块，被配置为获取轨迹数据，通过地图匹配模型对轨迹数据进行归一化处理，得到归一化轨迹，采用自适应滑动窗口方式从归一化轨迹中提取停车事件；

聚类模块，被配置为将停车事件采用语义时间段进行分割，得到若干个停车组，每个停车组包括该语义时间段内的停车事件，并对每个停车组内的停车事件进行聚类，得到该语义时间段下的停车热点；

环境特征提取模块，被配置为对每个停车热点的环境特征进行提取，得到环境特征嵌入；

分类模块，被配置为将环境特征嵌入输入GCN模型，分类得到交通事故热点。

第三方面，本发明提供了一种电子设备，包括一个或多个处理器；存储装置，用于存储一个或多个程序，当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。

第四方面，本发明提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。

相比于现有技术，本发明具有以下有益效果：

(1)本发明通过在不同的语义时间段下对停车热点进行聚类，得到车辆轨迹与交通事故热点之间的关系，并结合停车热点的环境特征，更加准确的识别出交通事故热点。

(2)本发明将城市大规模交通轨迹数据与环境数据相融合，能够有效识别车辆轨迹中的交通事故热点，尤其是发生在一些之前缺少交通事故数据的热点区域，帮助城市交通管理部门对城市交通事故热点区域有更深入全面的了解与掌握。

(3)本发明提出基于空间群智大数据的交通事故热点识别方法能够低成本、全面、动态的推断出城市交通事故热点。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请的一个实施例可以应用于其中的示例性装置架构图；

图2为本申请的实施例的基于空间群智大数据的交通事故热点识别方法的流程示意图；

图3为本申请的实施例的基于空间群智大数据的交通事故热点识别方法的工作日和周末语义时间段下停车事件的分布示意图；

图4为本申请的实施例的基于空间群智大数据的交通事故热点识别方法的结果示意图；

图5为本申请的实施例的基于空间群智大数据的交通事故热点识别方法的结果与真实结果对比示意图；

图6为本申请的实施例的基于空间群智大数据的交通事故热点识别装置的示意图；

图7是适于用来实现本申请实施例的电子设备的计算机装置的结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

图1示出了可以应用本申请实施例的基于空间群智大数据的交通事故热点识别方法或基于空间群智大数据的交通事故热点识别装置的示例性装置架构100。

如图1所示，装置架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种应用，例如数据处理类应用、文件处理类应用等。

终端设备101、102、103可以是硬件，也可以是软件。当终端设备101、102、103为硬件时，可以是各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时，可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块)，也可以实现成单个软件或软件模块。在此不做具体限定。

服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上传的文件或数据进行处理的后台数据处理服务器。后台数据处理服务器可以对获取的文件或数据进行处理，生成处理结果。

需要说明的是，本申请实施例所提供的基于空间群智大数据的交通事故热点识别方法可以由服务器105执行，也可以由终端设备101、102、103执行，相应地，基于空间群智大数据的交通事故热点识别装置可以设置于服务器105中，也可以设置于终端设备101、102、103中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。在所处理的数据不需要从远程获取的情况下，上述装置架构可以不包括网络，而只需服务器或终端设备。

图2示出了本申请的实施例提供的一种基于空间群智大数据的交通事故热点识别方法，包括以下步骤：

S1，获取轨迹数据，通过地图匹配模型对轨迹数据进行归一化处理，得到归一化轨迹，采用自适应滑动窗口方式从归一化轨迹中提取停车事件。

在具体的实施例中，地图匹配模型包括HMM模型，步骤S1具体包括：

S11，获取原始轨迹数据，对原始轨迹数据进行预处理，得到轨迹数据，预处理方式包括冗余数据去重、异常数据剔除和轨迹数据重构；

S14，在每个归一化轨迹P_s＝{p^′ ₁→p^′ ₂→…→p^′ _n}中采用自适应滑动窗口选择滑动窗口停车序列p^′ _m→p^′ _m+1→…→p^′ _m+k，其中，1≤m<n,1≤k≤n-m，n为所述归一化轨迹中的停车序列的个数；

S15，在所述滑动窗口停车序列p^′ _m→p^′ _m+1→…→p^′ _m+k中根据下式提取得到停车事件：

其中，dist(p^′ _m,p_i ^′)是所述滑动窗口停车序列中的第一个点p^′ _m与其他任意一点p_i ^′之间的距离，Δt为所述滑动窗口停车序列中的第一个点p^′ _m与其他任意一点p_i ^′之间的时间差，δ为阈值；

S16，通过改变步骤S14中的m和k动态调整所述滑动窗口停车序列的大小，并重复步骤S14-15，提取得到所述停车事件。

具体的，城市中的出租车等交通工具普遍安装有全球卫星定位系统(GlobalPositioning System)，同时定位系统也广泛应用于智能手机等移动设备中，因此每天城市中的车辆都能产生规模庞大的轨迹数据，这些轨迹数据生成的成本低廉，却具有极高的研究应用价值。大规模的轨迹数据则能够有效地弥补单条轨迹存在的误差，也能精准地勾勒出城市的道路网络，为后续进一步提取其中有价值的信息做好准备。在现实中所采集到的原始轨迹数据存在噪声且分布不均的问题，因此本申请的实施例采用地图匹配模型对GPS轨迹数据进行归一化处理，在优选的实施例中，地图匹配模型为基于隐马尔可夫模型(HMM模型)。

首先对原始轨迹数据进行预处理，主要包括冗余数据去重、异常数据剔除和轨迹数据重构，得到轨迹数据。

然后，在HMM模型中将轨迹数据中的待匹配点作为观测变量，将路网上与之对应的点作为隐藏状态变量，因此可将地图匹配问题看作是HMM模型的解码问题，即在给定观察变量的情况下找到最可能的隐藏状态变量，最可能的隐藏状态变量即为归一化轨迹。

在获得归一化轨迹后，采用基于自适应滑动窗口的方法从中提取停车事件。具体的，对于每个归一化轨迹P_s＝{p^′ ₁→p^′ ₂→…→p^′ _n}，通过每个滑动窗口停车序列p^′ _m→p^′ _m+1→

…→p^′ _m+k(1≤m<n,1≤k≤n-m)的第一个点与任何其他点之间的平均速度小于一个小的阈值δ提取停车事件。沿归一化轨迹使用具有自适应大小的滑动窗口来查找停车事件，通过改变滑动窗口停车序列内的停车训练的个数来动态扩展滑动窗口的大小，直至滑动窗口停车序列不满足公式(1)。

S2，将停车事件采用语义时间段进行分割，得到若干个停车组，每个停车组包括该语义时间段内的停车事件，并对每个停车组内的停车事件进行聚类，得到该语义时间段下的停车热点。

在具体的实施例中，步骤S2具体包括：

具体的，将停车事件的日期类型分为工作日和周末，并结合时间跨度和天气情况进行二元划分，定义出如表1所示的语义时间段。交通事故在一定空间和时间的分布呈聚集性，因此可将因事故发生而疑似造成停车事件的点进行聚类，得到如图3所示的工作日和周末语义时间段下停车事件的分布结果。图3中的网格表示一个停车组E_i＝{pk₁,pk₂,…,pk_l}，其中，l是该语义时间段内的停车事件的个数。对于每个停车组E_i，采用基于密度的数据聚类方法DBSCAN将停车事件聚类到不同的聚类C＝{y₁,y₂,…,y_j}，其中，j是聚类的数量，得到该语义时间段下的停车热点。

表1语义时间段描述

S3，对每个停车热点的环境特征进行提取，得到环境特征嵌入。

在具体的实施例中，环境特征嵌入包括道路名称嵌入、兴趣点嵌入和交通流嵌入，步骤S3具体包括：

具体的，对于每个停车热点需要从不同来源提取异构环境特征，并用来环境特征训练模型。近年来，环境特征已成功用于训练模型来推断交通事故热点。然而，不同停车热点的空间异质性不同，意味着交通事故热点难以推断。根据停车热点的道路名称、兴趣点和交通流环境特征可以为可能的交通事故热点提供强有力的证据。环境特征嵌入分别采用以下方式获取得到：

道路名称嵌入：由于交通事故热点的道路名称之间存在一定的相关性，可使用百度地图API提供的接口来获取每个停车热点的中文路，。Bert模型在自然语言处理方面具有出色的效果。因此，选择Bert中文预训练模型来提取每个道路名称的特征向量，得到道路名称嵌入。

兴趣点嵌入：兴趣点的分布导致区域路网拥堵，对交通事故的分布有显着影响。因此统计每个停车热点500米范围内的每种类型的兴趣点(POI)数量，POI数据是指厦门市内总共POI点个数，可通过开源数据得到。然后通过自动编码器提取在停车热点周围的POI特征，得到兴趣点嵌入。

交通流嵌入：交通事故的发生受交通流量的影响很大，通常交通流量越大，事故率越高。然而，在现实中，交通事故发生时的交通流量数据是很难获得的。在其中一个实施例中，在停车热点时间前后30分钟，每5分钟统计一次500米左右范围内的汽车数量，共12组数据，并进行归一化处理，通过递归神经网络(RNN)传递归一化处理后的数据，以获得停车热点周围的交通流嵌入。

S4，根据环境特征嵌入通过GCN模型得到交通事故热点。

在具体的实施例中，步骤S4中，采用Haversine公式计算每个停车热点的距离，通过停车热点的距离构造GCN模型中的拉普拉斯矩阵，GCN模型的输入为道路名称嵌入、兴趣点嵌入和交通流嵌入，输出是否为交通事故热点。

具体的，采用GCN模型进行建模。更具体地说，对于每个停车组E_i＝{pk₁,pk₂,…,pk_l}，使用Haversine公式计算每个停车热点的距离，用于构造GCN模型的拉普拉斯矩阵，其中图节点特征为道路名称嵌入、兴趣点嵌入和交通流嵌入，GCN模型的输出为二分类事件，即将每个停车热点分类为交通事故热点和非交通事故热点，最终得到在不同语义时间段下城市的交通事故热点，如图4所示。

分别来自中国厦门和成都两个城市的群智感知、大规模和真实的轨迹数据集来评估所本申请的实施例所提出的基于空间群智大数据的交通事故热点识别方法的性能。

厦门出租车轨迹数据的数据集由2016年8月21日至2016年11月30日厦门的5486辆出租车报告。成都网约车轨迹数据由GAIA Open Dataset提供。经过数据清洗得到了6096022个订单的车辆轨迹。这两个数据集的详细摘要如表2所示，而厦门真实交通事故数据集和成都交通事故高发区数据集的详细摘要显示在表3中。

表2车辆轨迹数据集描述

表3厦门真实交通事故数据集和成都交通事故高发区数据集

从Weather Underground API中获取每个停车热点的气象数据集，包括降雨量、温度、湿度和风速。道路环境数据集描述如表4所示。

表4道路环境数据集描述

将停车热点数据与真实交通事故数据进行比较，得到带有标签的数据集。再从收集到的数据集中随机抽取80％的样本进行训练，剩下的20％用于评估。具体的，对于每个停车热点，使用模型来分类这些停车热点是否是交通事故热点。为了衡量所提出方法的准确性，采用Precision、Recall和F1-Score作为评价指标。如果在地面实况数据集中发现交通事故热点，称其为True Positive(TP)，否则为False Positive(FP)。对于使用检测方法未检测到的真正交通事故热点，称其为未命中或假阴性(FN)。有了这些定义，采用以下指标来定量评估识别方法的性能：

采用以下模型作为在步骤S4中作为交通事故热点识别模型，将每个停车热点的环境特征嵌入输入交通事故热点识别模型，分类得到交通事故热点。

(1)随机森林(Random-Forest)模型：该方法基于随机森林使用训练数据训练出交通事故热点识别模型。

(2)XGBoost模型：该方法基于极端梯度提升(XGBoost)使用训练数据训练出交通事故热点识别模型。

(3)CNN模型：该方法基于卷积神经网络(CNN)使用训练数据训练出交通事故热点识别模型。

(4)GCN模型：该方法基于图卷积模型使用使用训练数据训练出交通事故热点识别模型。

使用Random-Forest模型、XGBoost模型、CNN模型和GCN模型的评价结果如下：

1)厦门结果：厦门市交通事故热点推断的评价结果见表5。表5中的结果表明，GCN模型在Precision和Recall方面均以显着的准确度实现了最佳性能。GCN模型的F1-score为79.4％，Precision为81.8％，Recall为77.1％，优于其他模型。

2)成都结果：成都交通事故热点推断的评价结果见表6。表6中的结果显示表明GCN模型在Precision和Recall方面均以显着的准确度实现了最佳性能。GCN模型的F1-score为83.6％，Precision为80.4％，Recall为84.9％，优于其他模型。

表5厦门评估结果

表6成都评估结果

对2016年厦门停车热点推断的两个交通事故热点进行案例研究，分别分析了交通流量、路况和酒后驾驶查处率，并获取了相关事件，使用了真实的交通事故数据来验证结果。选取GCN模型作为交通事故热点识别模型来识别城市在不同时间的交通事故热点，如图5所示。

图5(a)显示杏林大桥是厦门的交通事故热点。图中红点是停车热点，蓝点是本申请的实施例的方法所识别的交通事故热点。图5(b)显示嘉禾路是厦门的交通事故热点。图中红色点为停车热点，蓝色点为本申请的实施例的方法所识别的交通事故热点，均与真实结果相吻合。

进一步参考图6，作为对上述各图所示方法的实现，本申请提供了一种基于空间群智大数据的交通事故热点识别装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

本申请实施例提供了一种基于空间群智大数据的交通事故热点识别装置，包括：

停车事件提取模块1，被配置为获取轨迹数据，通过地图匹配模型对轨迹数据进行归一化处理，得到归一化轨迹，采用自适应滑动窗口方式从归一化轨迹中提取停车事件；

聚类模块2，被配置为将停车事件采用语义时间段进行分割，得到若干个停车组，每个停车组包括该语义时间段内的停车事件，并对每个停车组内的停车事件进行聚类，得到该语义时间段下的停车热点；

环境特征提取模块3，被配置为对每个停车热点的环境特征进行提取，得到环境特征嵌入；

分类模块4，被配置为根据环境特征嵌入通过GCN模型得到交通事故热点。

下面参考图7，其示出了适于用来实现本申请实施例的电子设备(例如图1所示的服务器或终端设备)的计算机装置700的结构示意图。图7示出的电子设备仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图7所示，计算机装置700包括中央处理单元(CPU)701和图形处理器(GPU)702，其可以根据存储在只读存储器(ROM)703中的程序或者从存储部分709加载到随机访问存储器(RAM)704中的程序而执行各种适当的动作和处理。在RAM 704中，还存储有装置700操作所需的各种程序和数据。CPU 701、GPU702、ROM 703以及RAM704通过总线705彼此相连。输入/输出(I/O)接口706也连接至总线705。

以下部件连接至I/O接口706：包括键盘、鼠标等的输入部分707；包括诸如、液晶显示器(LCD)等以及扬声器等的输出部分708；包括硬盘等的存储部分709；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分710。通信部分710经由诸如因特网的网络执行通信处理。驱动器711也可以根据需要连接至I/O接口706。可拆卸介质712，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器711上，以便于从其上读出的计算机程序根据需要被安装入存储部分709。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分710从网络上被下载和安装，和/或从可拆卸介质712被安装。在该计算机程序被中央处理单元(CPU)701和图形处理器(GPU)702执行时，执行本申请的方法中限定的上述功能。

需要说明的是，本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。计算机可读介质例如可以是——但不限于——电、磁、光、电磁、红外线或半导体的装置、装置或器件，或者任意以上的组合。计算机可读介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件或者上述的任意合适的组合。在本申请中，计算机可读介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行装置、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行装置、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，也可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本申请各种实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，该模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的装置来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备：获取轨迹数据，通过地图匹配模型对轨迹数据进行归一化处理，得到归一化轨迹，采用自适应滑动窗口方式从归一化轨迹中提取停车事件；将停车事件采用语义时间段进行分割，得到若干个停车组，每个停车组包括该语义时间段内的停车事件，并对每个停车组内的停车事件进行聚类，得到该语义时间段下的停车热点；对每个停车热点的环境特征进行提取，得到环境特征嵌入；将环境特征嵌入输入GCN模型，分类得到交通事故热点。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种基于空间群智大数据的交通事故热点识别方法，其特征在于，包括以下步骤：

S1，获取轨迹数据，通过地图匹配模型对所述轨迹数据进行归一化处理，得到归一化轨迹，采用自适应滑动窗口方式从所述归一化轨迹中提取停车事件；

S2，将所述停车事件采用语义时间段进行分割，得到若干个停车组，每个停车组包括该语义时间段内的停车事件，并对每个停车组内的停车事件进行聚类，得到该语义时间段下的停车热点；

S3，对每个所述停车热点的环境特征进行提取，得到环境特征嵌入；

S4，将所述环境特征嵌入输入GCN模型，分类得到交通事故热点。

2.根据权利要求1所述的基于空间群智大数据的交通事故热点识别方法，其特征在于，所述步骤S1中获取轨迹数据，具体包括：

S11，获取原始轨迹数据，对所述原始轨迹数据进行预处理，得到所述轨迹数据，所述预处理方式包括冗余数据去重、异常数据剔除和轨迹数据重构。

3.根据权利要求1所述的基于空间群智大数据的交通事故热点识别方法，其特征在于，所述地图匹配模型包括HMM模型，所述步骤S1中通过地图匹配模型对所述轨迹数据进行归一化处理，得到归一化轨迹，具体包括：

S12，将所述轨迹数据中的待匹配点作为观测变量输入所述HMM模型中，输出得到隐藏状态变量，所述隐藏状态变量为路网上与所述轨迹数据中的待匹配点对应的匹配点；

S13，对所述轨迹数据中的所有待匹配点重复步骤S12，得到归一化轨迹，每个归一化轨迹包括若干个停车序列。

4.根据权利要求3所述的基于空间群智大数据的交通事故热点识别方法，其特征在于，所述步骤S1中采用自适应滑动窗口方式从所述归一化轨迹中提取停车事件，具体包括：

5.根据权利要求1所述的基于空间群智大数据的交通事故热点识别方法，其特征在于，所述步骤S2具体包括：

将所述停车时间根据日期类型、时间范围和天气进行划分，得到若干个所述停车组；

6.根据权利要求1所述的基于空间群智大数据的交通事故热点识别方法，其特征在于，所述环境特征嵌入包括道路名称嵌入、兴趣点嵌入和交通流嵌入，所述步骤S3具体包括：

获取每个所述停车热点的中文路名，将所述中文路名输入Bert中文预训练模型，提取所述道路名称嵌入；

获取每个所述停车热点周围的兴趣点，通过自动编码器提取所述兴趣点嵌入；

在每个所述停车热点所在时间的前后第一时间阈值内间隔第二时间阈值统计所述停车热点周围的汽车数量，并进行归一化处理，得到流量数据，将所述流量数据输入递归神经网络，得到所述交通流嵌入。

7.根据权利要求6所述的基于空间群智大数据的交通事故热点识别方法，其特征在于，所述步骤S4中，采用Haversine公式计算每个停车热点的距离，通过所述停车热点的距离构造所述GCN模型中的拉普拉斯矩阵，所述GCN模型的输入为所述道路名称嵌入、兴趣点嵌入和交通流嵌入，输出是否为交通事故热点。

8.一种基于空间群智大数据的交通事故热点识别装置，其特征在于，包括：

停车事件提取模块，被配置为获取轨迹数据，通过地图匹配模型对所述轨迹数据进行归一化处理，得到归一化轨迹，采用自适应滑动窗口方式从所述归一化轨迹中提取停车事件；

聚类模块，被配置为将所述停车事件采用语义时间段进行分割，得到若干个停车组，每个停车组包括该语义时间段内的停车事件，并对每个停车组内的停车事件进行聚类，得到该语义时间段下的停车热点；

环境特征提取模块，被配置为对每个所述停车热点的环境特征进行提取，得到环境特征嵌入；

分类模块，被配置为将所述环境特征嵌入输入GCN模型，分类得到交通事故热点。

9.一种电子设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一所述的方法。