CN109766902B

CN109766902B - 对同区域的车辆聚类的方法、装置和设备

Info

Publication number: CN109766902B
Application number: CN201711098499.4A
Authority: CN
Inventors: 宣云飞; 达亚伟
Original assignee: Hangzhou Hikvision System Technology Co Ltd
Current assignee: Hangzhou Hikvision System Technology Co Ltd
Priority date: 2017-11-09
Filing date: 2017-11-09
Publication date: 2021-03-09
Anticipated expiration: 2037-11-09
Also published as: CN109766902A

Abstract

本申请公开了一种对同区域的车辆聚类的方法、装置和设备，该方法包括：获取第一预定时间段内的过车信息中车牌号码对应的第一车辆组数据的集合，该第一车辆组数据包括经过的卡口的标识及经过该卡口的时间戳信息；根据车牌号码对应的第一车辆组数据的集合确定该车牌号码对应的车辆经过的卡口的连续轨迹；根据车牌号码对应的车辆的连续轨迹的端点信息，对车牌号码对应的车辆信息进行同区域聚类。本申请实施例的方案能够将具有相同停留点的车辆归到相同的类中，为定位具有相同停留轨迹的车辆提供了有效的方案。

Description

对同区域的车辆聚类的方法、装置和设备

技术领域

本申请涉及计算机数据挖掘领域，尤其涉及一种对同区域的车辆聚类的方法、装置和设备。

背景技术

在现有技术中，关于同区域的车辆分析，主要是利用车辆的起点和终点的位置数据。例如，如果两个人住在同一个小区、在同一个公司上班，则这两个人开的车显然会具有相同的起点和终点，可以通过聚类方法，将这两个人的车辆聚类到相同的区域分类中，该区域分类可以是起点和终点构成的一种区域划分方式。

但是，现有的技术方案，只能适用于起点和终点的简单的区域聚类。对于具有多个停留点的车辆，难以进一步地对同区域车辆进行细分。此外，如果车辆具有不相同起点和/或终点，一般会归属到不同区域分类中。

如何更好地划分车辆的区域分类，是本申请所要解决的技术问题。

发明内容

本申请实施例提供了一种对同区域的车辆聚类的方法、装置和设备，能够将具有相同停留点的车辆归到相同的类中，为定位具有相同停留轨迹的车辆提供了有效的方案。

本申请实施例采用下述技术方案：

本申请实施例提供了一种对同区域的车辆聚类的方法，包括：

根据第一预定时间段内的过车信息获取车牌号码对应的第一车辆组数据的集合，该第一车辆组数据包括经过的卡口的标识及经过该卡口的时间戳信息；

根据车牌号码对应的第一车辆组数据确定该车牌号码对应的车辆经过的卡口的连续轨迹；

根据车牌号码对应的车辆的连续轨迹的端点信息，对车牌号码对应的车辆信息进行同区域聚类。

本申请实施例还提供一种车辆的区域聚类装置，包括：

获取单元，根据第一预定时间段内的过车信息获取车牌号码对应的第一车辆组数据的集合，该第一车辆组数据包括经过的卡口的标识及经过该卡口的时间戳信息；

确定单元，根据车牌号码对应的第一车辆组数据确定该车牌号码对应的车辆经过的卡口的连续轨迹；

聚类单元，根据车牌号码对应的车辆的连续轨迹的端点信息，对车牌号码对应的车辆信息进行同区域聚类。

本申请实施例还提供一种电子设备，包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，该可执行指令在被执行时使该处理器执行以下操作：

本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序当被包括多个应用程序的电子设备执行时，使得该电子设备执行以下操作：

本申请实施例采用的上述至少一个技术方案能够达到以下有益效果：

本申请实施例中，通过根据过车信息获取车牌号码对应的车辆组数据，以确定车牌号码对应的车辆的连续轨迹，进而根据连续轨迹的端点对车牌号码对应的车辆信息进行同区域聚类，从而能够将具有相同停留点的车辆信息归到相同的类中，为定位具有相同停留轨迹的车辆提供了有效的方案。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是本申请的一个实施例对同区域的车辆聚类的方法流程图。

图2是本申请的一个实施例对同区域的车辆聚类的具体流程图。

图3是本申请的一个实施例电子设备的结构示意图。

图4是本申请的一个实施例区域聚类装置的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

以下结合附图，详细说明本申请各实施例提供的技术方案。

起止点(ORIGIN-DESTINATION，OD)交通量：OD交通量就是指起终点间的交通出行量，可包括起止点分布、出行目的、出行方式、出行时间、出行距离、出行次数等。

OD向量：对车辆的轨迹的表示向量。

聚类：聚类是将数据分类到不同的类或者簇的过程。聚类是搜索簇的无监督学习过程，不依赖预先定义的类或带类标记的训练实例，需要由聚类学习算法自动确定标记。聚类分析是一种探索性的分析，在分类的过程中，不必事先给出一个分类的标准，聚类分析能够从样本数据出发，自动进行分类。聚类分析所使用方法的不同，常常会得到不同的结论。聚类能够作为一个独立的工具获得数据的分布状况，观察每一簇数据的特征，集中对特定的聚簇集合作进一步地分析；聚类分析还可以作为其他算法(如分类和定性归纳算法)的预处理步骤。

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一个比较有代表性的基于密度的聚类算法。与划分和层次聚类方法不同，它将簇定义为密度相连的点的最大集合，能够把具有足够高密度的区域划分为簇，并可在噪声的空间数据库中发现任意形状的聚类。其中，在DBSCAN算法中各名词概念如下：

邻域：给定对象半径ε内的区域称为该对象的ε邻域。

核心对象：如果给定对象ε邻域内的样本点数大于等于MinPts，则称该对象为核心对象。

直接密度可达：给定一个对象集合D，如果p在q的ε邻域内，且q是一个核心对象，则称对象p从对象q出发是直接密度可达。

密度可达：对于样本集合D，如果存在一个对象链

P₁＝p，P_n＝q，对于P_i∈D，P_i+1是从P_i关于ε和MinPts直接密度可达，则称对象p从对象q出发关于ε和MinPts是密度可达的。

密度相连：如果存在对象o∈D，使对象p和q都是从o关于ε和MinPts密度可达的，那么对象p到q是关于ε和MinPts密度相连的。

图1是本申请的一个实施例对同区域的车辆聚类的方法流程图。图1的方法由区域聚类装置执行。在具体的应用中，该区域聚类装置可以是一个能够直接或间接访问过车信息的电子设备或系统，本申请实施例对此不作限制。本申请实施例的方法可包括：

S101，根据第一预定时间段内的过车信息获取车牌号码对应的第一车辆组数据的集合。

其中，第一车辆组数据包括车牌号码对应的车辆经过的卡口信息及经过卡口时的时间戳信息。

应理解，一段时间内的过车信息，可能包括车辆的车牌号码、车辆的车型、车辆的图片信息、车辆经过卡口的时间戳信息，等等。

基于过车信息，可按照车牌号码进行分组，提取出各车牌号码对应的第一车辆组数据的集合。应理解，在本申请实施例中，第一车辆组数据可包括车辆经过的卡口的信息及该车辆经过该卡口时的时间戳信息。例如，车牌号码为X的车辆经过卡口KK的时间戳为T，则X的第一车辆组数据中至少包括如下内容{KK，T}，车牌号码对应的一个第一车辆组数据用于表示该车牌号码对应的车辆经过一个卡口的相关信息。当然，应理解，车辆组数据可能有其它的表示方式，例如，包括车牌号码、卡口信息和时间戳信息，即{X，KK，T}，本申请实施例对此不作限制。

应理解，车牌号码对应的第一车辆组数据的集合中，可包括该车牌号码对应的至少一个第一车辆组数据，每个第一车辆组数据包括一个卡口的信息及该车牌号码对应的车辆经过该卡口的时间戳信息。

S102，根据车牌号码对应的第一车辆组数据的集合确定该车牌号码对应的车辆经过的卡口的连续轨迹。

应理解，在本申请实施例中，对于某个车牌号码对应的第一车辆组数据的合集来说，如果该车牌号码对应的车辆在时间相邻的两个第一车辆组数据所对应的两个卡口未发生停留，则认为该车牌号码对应的车辆在这两个卡口上是连续的。基于车牌号码对应的第一车辆组数据的集合，按时间戳的先后将连续的卡口的信息进行连接，形成一个或多个连续的卡口构成的轨迹，每段连续的卡口构成的连续轨迹，即本申请实施例中该车牌号码对应的车辆经过的卡口的连续轨迹之一。

例如，车辆X依次经过卡口KK₁、KK₂、KK₃、KK₄，且未在任意两个卡口之间停留，则KK₁-KK₂-KK₃-KK₄可以称为车辆X经过的卡口的连续轨迹。

当然，对于某个车牌号码对应的第一车辆组数据的合集来说，如果该车牌号码对应的车辆在时间相邻的两个第一车辆组数据所对应的两个卡口发生停留，则认为该车牌号码对应车辆在这两个卡口是不连续的。例如，车辆X依次经过卡口KK₁、KK₂、KK₃、KK₄，且在KK₂、KK₃两个卡口之间停留，则KK₁-KK₂，KK₃-KK₄分别可以称为车辆X经过的卡口的连续轨迹，但KK₁-KK₂-KK₃-KK₄不能称为车辆X经过的卡口的连续轨迹。

S103，根据车牌号码对应的车辆的连续轨迹的端点信息，对车牌号码的车辆信息进行同区域聚类。

应理解，在本申请实施例中，连续轨迹的端点，可以只是连续轨迹的起点，例如KK₁-KK₂-KK₃-KK₄中的KK₁；或者只是连续轨迹的终点，例如KK₁-KK₂-KK₃-KK₄中的KK₄；或者是连续轨迹的起点和终点，例如KK₁-KK₂-KK₃-KK₄中的KK₁和KK₄，等等。

也就是说，步骤S103具体可实现为：根据连续轨迹的停留起点和/或停留终点，对车牌号码对应的车辆信息进行同区域聚类。

当然，还可以对停留点按照停留时间进行分类，例如，可以分为短期停留点和长期停留点。当然，也可分成多个停留时间级别的停留点。

可选地，步骤S102具体可实现为：

根据第一车牌号码对应的第一车辆组数据的集合中时间上相邻的两个卡口对应的第一车辆组数据，确定第一车牌号码对应的车辆在该两个卡口之间是否发生停留；

将第一车牌号码对应的第一车辆组数据的集合中，时间上相邻接且第一车牌号码对应的车辆未发生停留的任意两个卡口信息建立连接，以通过连接的卡口信息形成第一车牌号码对应的车辆经过的卡口的连续轨迹；

其中，第一车牌号码为第一预定时间段内的过车信息中的任意一个车牌号码。

例如，车辆X依次经过卡口KK₁、KK₂、KK₃、KK₄，且未在任意两个卡口之间停留，则可确定KK₁-KK₂、KK₂-KK₃、KK₃-KK₄连续。然后，可将KK₁-KK₂、KK₂-KK₃、KK₃-KK₄分别连接，得到车辆X的连续轨迹KK₁-KK₂-KK₃-KK₄。

可选地，作为一个实施例，确定第一车牌号码对应的车辆在所述两个卡口之间是否发生停留，包括：将是否发生停留的信息标记在所述两个卡口在第一车牌号码对应的第一车辆组数据中时间戳在后的一个卡口上。

例如，车辆从卡口KK1开往卡口KK2，则可将KK2标记为停留(STOP)或移动(MOVE)。

或者，可选地，作为另一个实施例，确定第一车牌号码对应的车辆在所述两个卡口之间是否发生停留，包括：

将是否发生停留的信息标记在所述两个卡口构成的卡口连接信息上。其中，两个卡口构成的卡口连接信息具有方向性。

例如，车辆从卡口KK1开往卡口KK2，则可将KK1-KK2标记为停留(STOPS)或未停留(MOVES)；车辆从卡口KK2开往卡口KK1，则可将KK2-KK1标记为停留(STOPS)或未停留(MOVES)，KK1-KK2与KK2-KK1不同。

可选地，作为一个实施例，根据第一车牌号码对应的第一车辆组数据的集合中时间上相邻的两个卡口对应的第一车辆组数据，确定第一车牌号码对应的车辆在该两个卡口之间是否发生停留，具体实现为：

根据经过该两个卡口的预设最小行驶速度和该两个卡口的距离确定该两个卡口的参考最大通过时间；

根据第一车牌号码对应的第一车辆组数据的集合中经过该两个卡口的时间戳信息，以及该参考最大通过时间，确定第一车牌号码对应的车辆在该两个卡口之间是否发生停留。

应理解，该参考最大通过时间，是一般情况下车辆未经停留经过两个卡口的最大通过时间。当然，对于特殊的情况，例如，发生拥堵的场景中，其通过时间会超出该参考最大通过时间。

进一步地，根据第一车牌号码对应的第一车辆组数据的集合中经过该两个卡口的时间戳信息，以及该参考最大通过时间，确定第一车牌号码对应的车辆在该两个卡口之间是否发生停留，包括：

根据第一预定时间段内车牌号码对应的第一车辆组数据的集合中时间上相邻且经过该两个卡口的多个车牌号码对应的第一车辆组数据，确定车辆经过该两个卡口的第一参考通过时间，其中，该第一参考通过时间用于区分发生停留和未发生停留，该第一参考通过时间指根据该多个车牌号码对应的第一车辆组数据计算得到的经过该两个卡口的通过时间中，超出该参考最大通过时间的通过时间的平均值或中位数；

如果第一车辆号码对应的车辆经过该两个卡口的通过时间大于该第一参考通过时间，则确定第一车辆号码对应的车辆在该两个卡口发生停留；

或者，如果第一车辆号码对应的车辆经过该两个卡口的通过时间小于或等于该第一参考通过时间，则确定第一车辆号码对应的车辆在该两个卡口未发生停留。

可选地，作为另一个实施例，根据第一车牌号码对应的第一车辆组数据的集合中时间上相邻的两个卡口对应的第一车辆组数据，确定第一车牌号码对应的车辆在该两个卡口之间是否发生停留，具体实现为：

根据第二预定时间内的过车信息，获取时间上相邻且经过该两个卡口的车牌号码对应的第二车辆组数据的集合，该第二预定时间在该第一预定时间之前，该第二车辆组数据包括车牌车号对应的车辆经过的卡口的标识及经过卡口的时间戳信息；

根据该时间上相邻且经过该两个卡口的车牌号码对应的第二车辆组数据的集合，确定经过该两个卡口的第二参考通过时间，其中，该第二参考通过时间用于区分发生停留和未发生停留；

如果第一车辆号码对应的车辆经过该两个卡口的通过时间大于该第二参考通过时间，则确定第一车辆号码对应的车辆在该两个卡口发生停留；

或者，如果第一车辆号码对应的车辆经过该两个卡口的通过时间小于或等于该第二参考通过时间，则确定第一车辆号码对应的车辆在该两个卡口未发生停留。

第二参考通过时间的计算方式可以有多种。例如，根据该时间上相邻且经过该两个卡口的车牌号码对应的第二车辆组数据的集合，确定计算得到的通过时间经排序后得到的箱型图的上四分位数为该第二参考通过时间，或者确定计算得到的通过时间的最大值为该第二参考通过时间，等等。又例如，根据该时间上相邻且经过该两个卡口的车牌号码对应的第二车辆组数据的集合，确定计算得到的通过时间构成的正态分布函数中μ+σ为该第二参考通过时间，其中，μ表示该正态分布函数的均值，σ表示该正态分布函数的标准差。

可选地，该方法还可包括：根据该时间上相邻且经过该两个卡口的车牌号码对应的第二车辆组数据的集合，确定经过该两个卡口的第三参考通过时间，其中，第三参考通过时间用于区分通过时间是否为异常数据，第三参考通过时间小于第二参考通过时间；

确定第一车辆号码对应的车辆在该两个卡口未发生停留，具体可实现为：如果第一车辆号码对应的车辆经过该两个卡口的通过时间小于或等于第二参考通过时间且大于或等于第三参考通过时间，则确定第一车辆号码对应的车辆在该两个卡口未发生停留。

类似地，第三参考通过时间的计算方式可以有多种。例如，根据该时间上相邻且经过该两个卡口的车牌号码对应的第二车辆组数据的集合，确定计算得到的通过时间经排序后得到的箱型图的下四分位数为该第三参考通过时间，或者确定计算得到的通过时间的最小值为该第三参考通过时间，等等。又例如，根据该时间上相邻且经过该两个卡口的车牌号码对应的第二车辆组数据的集合，确定计算得到的通过时间构成的正态分布函数中μ-σ为该第三参考通过时间，其中，μ表示该正态分布函数的均值，σ表示该正态分布函数的标准差。

可选地，该方法还可包括：

根据该时间上相邻且经过该两个卡口的车牌号码对应的第二车辆组数据的集合，确定经过该两个卡口的第四参考通过时间，其中，第四参考通过时间用于区分发生停留的类型，第四参考通过时间大于第二参考通过时间；

确定第一车辆号码对应的车辆在该两个卡口发生停留，具体可实现为：

如果第一车辆号码对应的车辆经过该两个卡口的通过时间大于该第二参考通过时间且小于或等于第四参考通过时间，则确定第一车辆号码对应的车辆在该两个卡口发生短期停留；

或者，如果第一车辆号码对应的车辆经过该两个卡口的通过时间大于该第四参考通过时间，则确定第一车辆号码对应的车辆在该两个卡口发生长期停留。

类似地，第四参考通过时间的计算方式可以有多种。例如，根据该时间上相邻且经过该两个卡口的车牌号码对应的第二车辆组数据的集合，确定计算得到的通过时间的最大值为该第四参考通过时间，等等。

当然，应理解，在得到连续轨迹后，可以得到车辆的轨迹表示向量，例如OD向量等。

应理解，步骤S103也存在多种不同的实现方式。

可选地，作为一个实施例，步骤S103具体可实现为：

根据车牌号码对应的车辆的连续轨迹的端点信息，确定车牌号码对应的车辆的OD表示集合，该OD表示集合用于表示该车牌号码对应的车辆以卡口作为指定类型的停留点的次数；

根据车牌号码对应的车辆的OD表示集合，对车牌号码对应的车辆信息进行同区域聚类。

具体地，该停留点的类型可按照连续轨迹起止位置和/或停留时间进行分类。

OD表示集合中，可以只包括以卡口作为指定类型的停留点的次数。该指定类型，可以是按照连续轨迹起止位置和/或停留时间进行分类后的一种或多种类型。

例如，OD表示集合可以只包括车牌号码对应的车辆中以某个卡口作为连续轨迹的起点的次数，例如KK₁作为连续轨迹的起点的次数；或者，OD表示集合可以只包括车牌号码对应的车辆中以某个卡口作为连续轨迹的终点的次数，例如KK₄作为连续轨迹的起点的次数；或者，OD表示集合可以包括车牌号码对应的车辆中以某个卡口作为连续轨迹的起点和终点分别对应的次数，等等。

基于上述分类方式，步骤S103具体可实现为：根据第一车牌号码对应的车辆的连续轨迹的端点信息，生成第一车牌号码中的如下至少一种OD表示集合：

第一车牌号码对应的车辆的连续轨迹的端点信息中停留起点对应的卡口信息及停留次数的集合；

第一车牌号码对应的车辆的连续轨迹的端点信息中停留终点对应的卡口信息的停留次数的集合；

第一车牌号码对应的车辆的连续轨迹的端点信息中长期停留起点对应的卡口信息及停留次数的集合；

第一车牌号码对应的车辆的连续轨迹的端点信息中长期停留终点对应的卡口信息的停留次数的集合；

第一车牌号码对应的车辆的连续轨迹的端点信息中短期停留起点对应的卡口信息及停留次数的集合；

第一车牌号码对应的车辆的连续轨迹的端点信息中短期停留终点对应的卡口信息的停留次数的集合。

此外，在本申请实施例中，可通过多种聚类算法，根据车牌号码对应的车辆的OD表示集合，对车牌号码对应的车辆信息进行同区域聚类，例如，对车牌号码对应的车辆按照DBSACN算法进行同区域聚类，等等。

可选地，在本实施例的一种具体实现方式中，根据车牌号码对应的车辆的OD表示集合，对车牌号码对应的车辆信息进行同区域聚类，具体实现为：

确定用于确定核心坐标点的邻域半径和最小邻域点数，其中，任意一个车牌号码对应的车辆在N个卡口中的指定M种停留点类型对应的停留次数构成N*M维坐标系的一个坐标点，该核心坐标点在该N*M维坐标系中该邻域半径范围内其它车牌号码对应的车辆对应的坐标点数量不小于该最小邻域点数；

遍历任意N个卡口中每个车牌号码对应的车辆对应的坐标点，确定核心坐标点；

确定该核心坐标点中在该邻域半径的所有直接密度可达坐标点，形成该核心坐标点对应的簇，每个簇中坐标点对应的车牌号码对应的车辆具有相同的停留区域。

下面，将结合具体的例子，对本申请实施例的方法做进一步的说明。

图2是本申请的一个实施例对同区域的车辆信息聚类的具体流程图。具体地，该流程可包括：

201，获取过车信息。

具体地，该区域聚类装置可以获取一段时间内的过车信息，例如，一周、10天或一月等等。

过车信息，一般可包括车辆标识、卡口标识、车辆经过卡口的时间戳等信息。

车辆标识，一般为车牌号码。

202，获取车牌号码对应的车辆组数据并按时间排序。

在得到过车信息后，可按照车牌号码进行分组处理，得到车牌号码对应的车辆组数据。车牌号码对应的车辆组数据中可包括卡口标识、车辆经过卡口的时间戳。

例如，车牌号码对应的车辆组数据可用如下表达式表示：

其中CP_j表示车辆j的车牌号牌，kk_i表示卡口ID，t_ij表示车辆CP_j通过卡口kk_i的时间戳，m表示车辆数量(忽略无号牌的车辆)，n表示车辆通过卡口的次数。

为便于判定车辆组数据中时间点相邻的两个卡口，不妨对同一车牌号码对应的车辆组数据按照时间戳进行排序。例如，可以规定：车辆组数据已按照时间戳参数t_ij排序，即t_1j<t_2j<…<t_nj。

203，获取车牌号码对应的车辆在时间相邻的两个卡口的车辆组数据。

对于车辆号牌为CP_j的车辆，根据时间戳参数，任意选两个相邻的车辆组数据，即(t_ij,kk_i)和(t_(i+1)j,kk_i+1)。

根据两个卡口的距离是否可度量，按照不同的方式分析两个卡口的车辆组数据，如果两个卡口的距离可度量，执行步骤204；如果两个卡口的距离不可度量，执行步骤205。当然，应理解，卡口可度量的情况下，也可按照步骤205的方式计算车辆在两个卡口间是否停留。

204，两个卡口的距离可度量的情况下计算车牌号码对应的车辆在时间相邻的两个卡口是否停留。

对于两个卡口的距离可度量的情况，例如，存在路网数据等，不妨将两个卡口距离记为d(i,i+1)，并设定车辆的最小行驶速度为v。

根据公式

可以得出车辆在kk_i和kk_i+1两卡口通过的理论最大通过时间，即图1所示实施例中的参考最大通过时间，不妨记为maxTime_i,i+1。

根据公式t_(i+1)j-t_ij，可以得出车辆在kk_i和kk_i+1两卡口通过的实际通过时间，不妨记为realTime_i,i+1。

如果realTime_i,i+1>maxTime_i,i+1，可以估算出超时时长为realTime_i,i+1-maxTime_i,i+1，不妨记为ΔTime_i,i+1。此时，可以认为该车辆在卡口间进行了停留，停留时间即该超时时长。

考虑到时间带来的误差影响，对于超时时长(停留时间)ΔTime_i,i+1,i＝1,2,…,n-1，可以取其中位数midTime或平均值avgTime作为判断标准，比较ΔTime_i,i+1与中位数midTime或平均值avgTime。若ΔTime_i,i+1＞midTime或ΔTime_i,i+1＞avgTime，则标记车辆号牌为CP_j的车辆在卡口kk_i和kk_i+1间停留；或者，如果ΔTime_i,i+1＜midTime或ΔTime_i,i+1＜avgTime，则标记车辆号牌为CP_j的车辆在卡口kk_i和kk_i+1间未停留。当然，应理解，对于ΔTime_i,i+1与中位数midTime或平均值avgTime的比较，实际上就是realTime_i,i+1与midTime+maxTime_i,i+1或avgTime+maxTime_i,i+1的比较，midTime+maxTime_i,i+1或avgTime+maxTime_i,i+1，就是图1所示实施例的第一参考通过时间。

具体地，例如，可用moves和stops表示车辆在两个卡口的轨迹的状态，其中，moves表示未停留，stops表示停留。该状态可以记录在时间戳靠后的卡口上，也可以记录在两个卡口构成的卡口连接信息上。该卡口连接信息具有方向性，即KK1-KK2与KK2-KK1是两个不同的卡口连接信息。

205，两个卡口的距离不可度量的情况下计算车牌号码对应的车辆在时间相邻的两个卡口是否停留。

若kk_i和kk_i+1的距离不可度量，可直接采用统计学思路，利用样本数据直接估计总体特征。样本数据的选取，可选择当前获取的过车信息之前的历史过车信息，或者选择当前获取的过车信息的部分或全部。

可选地，作为一个实施例，可利用箱型图分析数据。具体地，可以取样本数据中车辆通过kk_i和kk_i+1的通过时长的集合，按大小排序后，进行如下处理：

第一步，根据假设检验原理，取数据集的下四分位数到上四分位数的区间作为kk_i和kk_i+1的合理通过时长区间，即将上四分位数作为图1所示实施例的第二参考通过时间，将下四分位数作为图1所示实施例的第三参考通过时间。当然，也可以选择其它的区间，例如，数据集的下三分位数到上三分位数的区间作为kk_i和kk_i+1的合理通过时长区间，等等。

第二步，根据步骤201的过车信息，获取车牌号码对应的车辆组数据，然后将车牌号码对应的车辆组数据在kk_i和kk_i+1的通过时长与合理通过时长区间进行比较。

如果通过时长大于合理通过时长区间的上限，则确定车牌的车辆在kk_i和kk_i+1发生停留；

如果通过时长在合理通过时长区间的下限和合理通过时长区间的上限之间，则确定车牌的车辆在kk_i和kk_i+1未发生停留。

当然，如果通过时长小于合理通过时长区间的下限，则标记为异常数据。

此外，还可对发生停留的类型进行进一步的划分。例如，可将箱型图的上边缘对应的通过时长，作为图1所示实施例的第四参考通过时间。如果通过时长在合理通过时长区间的上限与箱型图的上边缘之间，则确定为短期停留；如果通过时长大于箱型图的上边缘，则确定为长期停留。

或者，可选地，作为一个实施例，可利用正态分布分析数据。具体地，可以取样本数据中车辆通过kk_i和kk_i+1的通过时长的集合，并生成集合对应的正态分布函数，其中，μ表示正态分布函数的均值，σ表示正态分布函数的标准差。样本数据的合理通过时长，例如，可确定为μ-σ和μ+σ，或者μ-2σ和μ+2σ，等等。类似地，为区别不同类型的停留，还可规定通过时长在μ+σ与μ+3σ之间为短期停留，通过时长在μ+3σ以上为长期停留，等等。

206，确定各车牌号码对应的车辆的连续轨迹。

对于车辆号牌为CP_j的车辆，通过步骤204和/或步骤205，可以得到CP_j经过的卡口轨迹的类型。

将标记为连续(未停留)的轨迹连接，将标记为不连续(停留)切分，可以得到多段连续的轨迹。

又例如，车辆X依次经过卡口KK₁、KK₂、KK₃、KK₄，且在KK₂、KK₃两个卡口之间停留，则KK₁-KK₂，KK₃-KK₄分别可以称为车辆X经过的卡口的连续轨迹。

此外，如果存在异常数据，则还可删除与异常数据相关的连续轨迹数据。

207，确定连续轨迹的端点构成的OD向量集。

根据步骤206分成的多段连续轨迹，可选择连续轨迹的端点进行OD分析。

例如，假设有连续轨迹{kk_i,kk_i+1,…,kk_t}，取(kk_i,kk_t)作为车辆的一段OD表示，利用该表示方法，对于车辆CP_j，可以得到其OD表示集，即{(kk_x′,kk_7′)}。

根据车辆OD表示集，给出其OD向量表示，采用类似于词包的表示方法，显示OD的重要性，形如：vector(CP_j)＝(a₁₁,a₂₁,…,a_l1)，这里a_i1表示第i个卡口作为车辆CP_j起点的次数，或者vector(CP_j)＝(a₁₂,a₂₂,…,a_l2)，这里a_i2表示第i个卡口作为车辆CP_j终点的次数,l表示卡口数量。

此时，可以将车辆CP_j按照轨迹的OD思维转换成向量表达，简称OD向量。注：vector(CP_j)＝(a₁₂,a₂₂,…,a_l2)即基于语义标注的stops表示，vector(CP_j)＝(a₁₁,a₂₁,…,a_l1)采用反向思路，是基于语义标注的starts表示。

208，根据OD向量集对车牌号码对应的车辆信息进行同区域聚类。

在得到OD向量集之后，可根据聚类算法，对车牌号码对应的车辆信息进行同区域聚类。

聚类方法可以有多种，传统的聚类算法可以被分为五类：划分方法、层次方法、基于密度方法、基于网格方法和基于模型方法。

根据实际应用，推荐选择基于层次的聚类方法或者基于密度的聚类方法，以取得较好的同区域划分效果。

基于层次的聚类方法，例如，利用层次方法的平衡迭代规约和聚类(BalancedIterative Reducing and Clustering using Hierarchies，BIRCH)方法，通过利用树的结构对对象集进行划分，然后再利用其它聚类方法对这些聚类进行优化。又例如，CURE(Clustering Using REprisentatives)方法，通过利用固定数目代表对象来表示相应聚类；然后对各聚类按照指定量向聚类中心进行收缩；又例如，ROCK方法，通过利用聚类间的连接进行聚类合并；又例如，CHEMALOEN方法，则是在层次聚类时构造动态模型，等等。

基于密度的聚类方法，例如，DBSCAN(Densit-based Spatial Clustering ofApplication with Noise)方法，通过不断生长足够高密度区域来进行聚类，能从含有噪声的空间数据库中发现任意形状的聚类；又例如，OPTICS(Ordering Points To Identifythe Clustering Structure)方法，不明确产生一个聚类，而是为自动交互的聚类分析计算出一个增强聚类顺序。

下面，以DBSCAN为例，对车牌的车辆进行同区域聚类。

首先，确定本申请实施例中坐标点的含义。

从车牌号码对应的车辆的OD表示集合中，选择出N个卡口，并指定M种停留点类型，车牌号码对应的车辆在该N个卡口的M种停留点类型对应的停留次数构成的N*M维向量，即为坐标点。应理解，M、N的取值都为正整数。应理解，N取值为1，表示簇中车牌号码对应的车辆具有1个相同区域(停留点)，N取值为2，表示簇中车牌号码对应的车辆具有2个相同区域(停留点)，以此类推。

例如，选择两个卡口，两种停留点类型(短期停留点和长期停留点)，则某个车牌号码对应的车辆在卡口KK1和KK2时对应的短期停留点和长期停留点的次数，构成一个4维的向量，该4维向量就是一个坐标点。

另外，在本申请实施例中，两个坐标点的距离，可参考欧氏距离的算法。例如，在二维坐标系中，坐标(x1，y1)和坐标(x2，y2)的距离

一种具体的算法如下：

输入：邻域半径ε，最小邻域点数MinPts，OD向量集D。

输出：目标类簇集合

步骤1：根据OD向量集D，选择出一个未处理的坐标点X。例如，取车牌号码CP1在卡口KK1和KK2的终点停留点作为坐标点X。

步骤2：判断坐标点X是否核心坐标点：如果坐标点X的邻域半径ε内其它车牌号码对应的车辆对应的坐标点数不小于最小邻域点数MinPts，则坐标点X是核心坐标点；否则，坐标点X不是核心坐标点，或者说，坐标点X是边缘坐标点。

步骤3：如果坐标点X不是核心坐标点，继续执行步骤1；

步骤4：如果坐标点X是核心坐标点，找出坐标点X的E邻域(邻域半径ε)中的所有直接密度可达点，形成坐标点X对应的簇，然后继续执行步骤1；

步骤5：当所有输入点都判断，则结束。

利用DBSCAN的聚类结果进行分析，若车辆CP_j和车辆CP_k在同一个簇中，则认为这两辆车的OD趋势比较类似，从而判定它们属于同区域。

当然，应理解，由于邻域半径和最小邻域点数设置的不同，可能会导致出现不同的簇的划分方式。

应理解，本申请聚类方法的目的是为了对车牌号码对应的车辆信息进行聚类，使得不同车牌号码对应的车辆信息属于不同的簇中。在优选的方案中，如果邻域半径和最小邻域点数的设置合理，所有车牌号码对应的车辆信息将会尽可能地出现在某个簇中，且每个车牌号码对应的车辆信息只在一个簇中。邻域半径和最小邻域点数的设置，可通过预先训练的样本数据来确定，或者通过其它方式确定，本申请实施例对此不作限制。

当然，应理解，前面只是示出了DBSCAN算法的聚类方法，在本申请实施例中，还可通过其它基于密度或基于层次的聚类算法进行同区域的车辆聚类，或者通过基于划分方法、基于网格方法或基于模型方法等的聚类方法进行同区域的车辆聚类，本申请实施例对此不作限制。

图3是本申请的一个实施例电子设备的结构示意图。请参考图3，在硬件层面，该电子设备包括处理器，可选地还包括内部总线、网络接口、存储器。其中，存储器可能包含内存，例如高速随机存取存储器(Random-Access Memory，RAM)，也可能还包括非易失性存储器(non-volatile memory)，例如至少1个磁盘存储器等。当然，该电子设备还可能包括其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是ISA(Industry Standard Architecture，工业标准体系结构)总线、PCI(PeripheralComponent Interconnect，外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture，扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图3中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

存储器，用于存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器，并向处理器提供指令和数据。

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成区域聚类装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：

根据车牌号码对应的第一车辆组数据的集合确定该车牌号码对应的车辆经过的卡口的连续轨迹；

上述如本申请图1、图2所示实施例揭示的区域聚类装置执行的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

该电子设备还可执行图1中区域聚类装置执行的方法，并实现区域聚类装置在图1、图2所示实施例的功能，本申请实施例在此不再赘述。

本申请实施例还提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当被包括多个应用程序的电子设备执行时，能够使该电子设备执行图1所示实施例中车辆的区域聚类装置执行的方法，并具体用于执行：

图4是本申请的一个实施例区域聚类装置400的结构示意图。请参考图4，在一种软件实施方式中，车辆的区域聚类装置400可包括：

获取单元410，根据第一预定时间段内的过车信息获取车牌号码对应的第一车辆组数据的集合，该第一车辆组数据包括经过的卡口的标识及经过该卡口的时间戳信息；

确定单元420，根据车牌号码对应的第一车辆组数据的集合确定该车牌号码对应的车辆经过的卡口的连续轨迹；

聚类单元430，根据车牌号码对应的车辆的连续轨迹的端点信息，对车牌号码对应的车辆信息进行同区域聚类。

可选地，作为一个实施例，确定单元420具体用于：

进一步地，确定单元420用于确定第一车牌号码对应的车辆在该两个卡口之间是否发生停留，包括：

确定单元420用于将是否发生停留的信息标记在该两个卡口在第一车牌号码对应的第一车辆组数据中时间戳在后的一个卡口上；

或者，确定单元420用于将是否发生停留的信息标记在该两个卡口构成的卡口连接信息上。

可选地，在本实施例的一种实现方式中，确定单元420具体用于：

更进一步地，在本实现方式中，确定单元420具体用于：

如果第一车辆号码对应的车辆经过该两个卡口的通过时间大于该第一参考通过时间，则确定第一车辆号码对应的车辆在该两个卡口发生停留；或者如果第一车辆号码对应的车辆经过该两个卡口的通过时间小于或等于该第一参考通过时间，则确定第一车辆号码对应的车辆在该两个卡口未发生停留。

可选地，在本实施例的另一种实现方式中，确定单元420具体用于：

根据第二预定时间内的过车信息获取时间上相邻且经过该两个卡口的车牌号码对应的第二车辆组数据的集合，该第二预定时间在该第一预定之间之前，该第二车辆组数据包括车牌车号对应的车辆经过的卡口的标识及经过卡口的时间戳信息；

更进一步地，在本实现方式中，确定单元420具体用于：

根据该时间上相邻且经过该两个卡口的车牌号码对应的第二车辆组数据的集合，确定经过该两个卡口的第三参考通过时间，其中，第三参考通过时间用于区分通过时间是否为异常数据，第三参考通过时间小于第二参考通过时间；

确定第一车辆号码对应的车辆在该两个卡口未发生停留，包括：

如果第一车辆号码对应的车辆经过该两个卡口的通过时间小于或等于第二参考通过时间且大于或等于第三参考通过时间，则确定第一车辆号码对应的车辆在该两个卡口未发生停留。

或者，更进一步地，在本实现方式中，确定单元420具体用于：

确定单元420具体用于：

确定第一车辆号码对应的车辆在该两个卡口发生停留，包括：

如果第一车辆号码对应的车辆经过该两个卡口的通过时间大于该第四参考通过时间，则确定第一车辆号码对应的车辆在该两个卡口发生长期停留。

当然，应理解，上述对是否异常数据的区分和对长期停留与短期停留的区分，也可以应用在同一个方案中。

可选地，作为一个实施例，聚类单元430具体用于：

进一步地，该停留点的类型按照连续轨迹起止位置和/或停留时间进行分类。

进一步地，聚类单元430具体用于：根据第一车牌号码对应的车辆的连续轨迹的端点信息，生成第一车牌号码中的如下至少一种OD表示集合：

车辆的区域聚类装置400还可执行图1中车辆的区域聚类装置执行的方法，并实现车辆的区域聚类装置在图1、图2所示实施例的功能，本申请实施例在此不再赘述。

本申请实施例还提供了一种区域聚类系统，该系统包括图3所示实施例电子设备中的内存或非易失性存储器所存储的区域聚类装置，或图4所示实施例中的区域聚类装置400。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种对同区域的车辆聚类的方法，其特征在于，包括：

根据第一预定时间段内的过车信息获取车牌号码对应的第一车辆组数据的集合，所述第一车辆组数据包括经过的卡口的标识及经过所述卡口的时间戳信息；

根据车牌号码对应的第一车辆组数据的集合确定所述车牌号码对应的车辆经过的卡口的连续轨迹；

根据车牌号码对应的车辆的连续轨迹的端点信息，确定车牌号码对应的车辆的OD表示集合，所述OD表示集合用于表示所述车牌号码对应的车辆以卡口作为指定类型的停留点的次数，停留点的类型按照连续轨迹起止位置和停留时间进行分类；

2.如权利要求1所述的方法，其特征在于，

根据车牌号码对应的第一车辆组数据的集合确定所述车牌号码对应的车辆的连续轨迹，包括：

根据第一车牌号码对应的第一车辆组数据的集合中时间上相邻的两个卡口对应的第一车辆组数据，确定第一车牌号码对应的车辆在所述两个卡口之间是否发生停留；

3.如权利要求2所述的方法，其特征在于，

确定第一车牌号码对应的车辆在所述两个卡口之间是否发生停留，包括：

将是否发生停留的信息标记在所述两个卡口在第一车牌号码对应的第一车辆组数据中时间戳在后的一个卡口上；或者

将是否发生停留的信息标记在所述两个卡口构成的卡口连接信息上。

4.如权利要求2或3所述的方法，其特征在于，

根据第一车牌号码对应的第一车辆组数据的集合中时间上相邻的两个卡口对应的第一车辆组数据，确定第一车牌号码对应的车辆在所述两个卡口之间是否发生停留，包括：

根据经过所述两个卡口的预设最小行驶速度和所述两个卡口的距离确定所述两个卡口的参考最大通过时间；

根据第一车牌号码对应的第一车辆组数据的集合中经过所述两个卡口的时间戳信息，以及所述参考最大通过时间，确定第一车牌号码对应的车辆在所述两个卡口之间是否发生停留。

5.如权利要求4所述的方法，其特征在于，

根据第一车牌号码对应的第一车辆组数据的集合中经过所述两个卡口的时间戳信息，以及所述参考最大通过时间，确定第一车牌号码对应的车辆在所述两个卡口之间是否发生停留，包括：

根据第一预定时间段内车牌号码对应的第一车辆组数据的集合中时间上相邻且经过所述两个卡口的多个车牌号码对应的第一车辆组数据，确定车辆经过所述两个卡口的第一参考通过时间，其中，所述第一参考通过时间用于区分发生停留和未发生停留，所述第一参考通过时间指根据所述多个车牌号码对应的第一车辆组数据计算得到的经过所述两个卡口的通过时间中，超出所述参考最大通过时间的通过时间的平均值或中位数；

如果第一车辆号码对应的车辆经过所述两个卡口的通过时间大于所述第一参考通过时间，则确定第一车辆号码对应的车辆在所述两个卡口发生停留；或者如果第一车辆号码对应的车辆经过所述两个卡口的通过时间小于或等于所述第一参考通过时间，则确定第一车辆号码对应的车辆在所述两个卡口未发生停留。

6.如权利要求2或3所述的方法，其特征在于，

根据第一车牌号码对应的第一车辆组数据中时间上相邻的两个卡口对应的第一车辆组数据，确定第一车牌号码对应的车辆在所述两个卡口之间是否发生停留，包括：

根据第二预定时间内的过车信息获取时间上相邻且经过所述两个卡口的车牌号码对应的第二车辆组数据的集合，所述第二预定时间在所述第一预定时间之前，所述第二车辆组数据包括车牌车号对应的车辆经过的卡口的标识及经过卡口的时间戳信息；

根据所述时间上相邻且经过所述两个卡口的车牌号码对应的第二车辆组数据的集合，确定经过所述两个卡口的第二参考通过时间，其中，所述第二参考通过时间用于区分发生停留和未发生停留；

如果第一车辆号码对应的车辆经过所述两个卡口的通过时间大于所述第二参考通过时间，则确定第一车辆号码对应的车辆在所述两个卡口发生停留；或者

如果第一车辆号码对应的车辆经过所述两个卡口的通过时间小于或等于所述第二参考通过时间，则确定第一车辆号码对应的车辆在所述两个卡口未发生停留。

7.如权利要求6所述的方法，其特征在于，所述方法还包括：

根据所述时间上相邻且经过所述两个卡口的车牌号码对应的第二车辆组数据的集合，确定经过所述两个卡口的第三参考通过时间，其中，第三参考通过时间用于区分通过时间是否为异常数据，第三参考通过时间小于第二参考通过时间；

确定第一车辆号码对应的车辆在所述两个卡口未发生停留，包括：

如果第一车辆号码对应的车辆经过所述两个卡口的通过时间小于或等于第二参考通过时间且大于或等于第三参考通过时间，则确定第一车辆号码对应的车辆在所述两个卡口未发生停留。

8.如权利要求6所述的方法，其特征在于，所述方法还包括：

根据所述时间上相邻且经过所述两个卡口的车牌号码对应的第二车辆组数据的集合，确定经过所述两个卡口的第四参考通过时间，其中，第四参考通过时间用于区分发生停留的类型，第四参考通过时间大于第二参考通过时间；

确定第一车辆号码对应的车辆在所述两个卡口发生停留，包括：

如果第一车辆号码对应的车辆经过所述两个卡口的通过时间大于所述第二参考通过时间且小于或等于第四参考通过时间，则确定第一车辆号码对应的车辆在所述两个卡口发生短期停留；或者

如果第一车辆号码对应的车辆经过所述两个卡口的通过时间大于所述第四参考通过时间，则确定第一车辆号码对应的车辆在所述两个卡口发生长期停留。

9.如权利要求1所述的方法，其特征在于，

根据车牌号码对应的车辆的连续轨迹的端点信息，确定车牌号码对应的车辆的OD表示集合，包括：

根据第一车牌号码对应的车辆的连续轨迹的端点信息，生成第一车牌号码中的如下至少一种OD表示集合：

10.一种区域聚类装置，其特征在于，包括：

获取单元，根据第一预定时间段内的过车信息获取车牌号码对应的第一车辆组数据的集合，所述第一车辆组数据包括经过的卡口的标识及经过所述卡口的时间戳信息；

确定单元，根据车牌号码对应的第一车辆组数据的集合确定所述车牌号码对应的车辆经过的卡口的连续轨迹；

聚类单元，根据车牌号码对应的车辆的连续轨迹的端点信息，确定车牌号码对应的车辆的OD表示集合，所述OD表示集合用于表示所述车牌号码对应的车辆以卡口作为指定类型的停留点的次数，停留点的类型按照连续轨迹起止位置和停留时间进行分类；

11.如权利要求10所述的装置，其特征在于，

所述确定单元具体用于：

12.如权利要求11所述的装置，其特征在于，

所述确定单元用于确定第一车牌号码对应的车辆在所述两个卡口之间是否发生停留，包括：

所述确定单元用于将是否发生停留的信息标记在所述两个卡口在第一车牌号码对应的第一车辆组数据中时间戳在后的一个卡口上；或者

所述确定单元用于将是否发生停留的信息标记在所述两个卡口构成的卡口连接信息上。

13.如权利要求11或12所述的装置，其特征在于，

所述确定单元具体用于：

14.如权利要求13所述的装置，其特征在于，

所述确定单元具体用于：

15.如权利要求11或12所述的装置，其特征在于，

所述确定单元具体用于：

根据第二预定时间内的过车信息获取时间上相邻且经过所述两个卡口的车牌号码对应的第二车辆组数据的集合，所述第二预定时间在所述第一预定之间之前，所述第二车辆组数据包括车牌车号对应的车辆经过的卡口的标识及经过卡口的时间戳信息；

16.如权利要求15所述的装置，其特征在于，

所述确定单元具体用于：

17.如权利要求15所述的装置，其特征在于，

所述确定单元具体用于：

如果第一车辆号码对应的车辆经过所述两个卡口的通过时间大于所述第二参考通过时间且小于或等于第四参考通过时间，则确定第一车辆号码对应的车辆在所述两个卡口发生短期停留；

18.如权利要求10所述的装置，其特征在于，

所述聚类单元具体用于：

19.一种电子设备，其特征在于，包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器执行如权利要求1-9中任一项所述的方法。

20.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行如权利要求1-9中任一项所述的方法。