CN111027644B - 出行模式分类方法、装置、计算机设备和存储介质 - Google Patents
出行模式分类方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN111027644B CN111027644B CN201911371262.8A CN201911371262A CN111027644B CN 111027644 B CN111027644 B CN 111027644B CN 201911371262 A CN201911371262 A CN 201911371262A CN 111027644 B CN111027644 B CN 111027644B
- Authority
- CN
- China
- Prior art keywords
- information
- time
- space
- sequence
- sequence information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000005065 mining Methods 0.000 claims abstract description 20
- 238000012545 processing Methods 0.000 claims description 24
- 230000002123 temporal effect Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 14
- 230000010365 information processing Effects 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 4
- 230000006399 behavior Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 230000033001 locomotion Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 230000001788 irregular Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000029305 taxis Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0133—Traffic data processing for classifying traffic situation
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Traffic Control Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种出行模式分类方法、装置、计算机设备和存储介质。一个实施例中的方法包括:获取目标车辆的轨迹信息;基于轨迹信息分别进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息;分别对时空语义序列信息、时间序列信息和空间序列信息进行序列模式挖掘,获得序列模式的支持度;根据序列模式的支持度以及预设的出行模式分类规则,确定目标车辆的出行模式。通过从时空语义、时间和空间三个维度对车辆的轨迹信息进行处理,从而实现用户出行模式的分类,可以有效提高出行模式的预测精度。
Description
技术领域
本申请涉及交通数据处理技术领域,特别是涉及一种出行模式分类方法、装置、计算机设备和存储介质。
背景技术
随着国民经济的快速发展和人民生活水平的不断提高,居民的出行方式已经发生了变化,从单一的出行方式,比如步行和骑自行车,到如今多样化的出行方式,包括出租车、公共汽车、地铁以及私人私家车等。
充分地了解用户出行方式对于交通管理部门满足居民出行的需求与偏好至关重要,而传统的用户出行行为预测往往针对整个用户群体,容易忽略该群体不同出行行为的小群体之间的差异性。即传统的用户出行行为预测存在维度单一导致精度不高的问题。
发明内容
基于此,有必要针对上述问题,提供一种可以提高预测精度的出行模式分类方法、装置、计算机设备和存储介质。
一种出行模式分类方法,所述方法包括:
获取目标车辆的轨迹信息;
基于所述轨迹信息分别进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息;
分别对所述时空语义序列信息、所述时间序列信息和所述空间序列信息进行序列模式挖掘,获得序列模式的支持度;
根据所述序列模式的支持度以及预设的出行模式分类规则,确定所述目标车辆的出行模式。
在一个实施例中,所述基于所述轨迹信息分别进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息包括:
获取时空语义匹配规则、时间匹配规则以及空间匹配规则;
根据所述时空语义匹配规则、所述时间匹配规则以及所述空间匹配规则分别对所述轨迹信息进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息。
在一个实施例中,所述根据所述时空语义匹配规则、所述时间匹配规则以及所述空间匹配规则分别对所述轨迹信息进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息包括:
获取所述轨迹信息的核心对象集合以及初始聚类簇信息;
当所述核心对象集合不为空集,且在目标车辆停等点的邻域半径范围内,车辆停等点数量大于预设阈值时,根据所述目标车辆停等点对所述初始聚类簇信息进行更新;
遍历所述核心对象集合中的各个车辆停等点,得到聚类处理后的时空语义序列信息、时间序列信息和空间序列信息。
在一个实施例中,所述获取所述轨迹信息的核心对象集合包括:
分别基于所述时空语义匹配规则、所述时间匹配规则以及所述空间匹配规则对所述轨迹信息进行处理,得到所述轨迹信息中车辆停等点的邻域集;
当所述邻域集的元素个数满足预设条件时,根据对应的车辆停等点得到核心对象集合。
在一个实施例中,所述分别对所述时空语义序列信息、所述时间序列信息和所述空间序列信息进行序列模式挖掘,获得序列模式的支持度包括:
将所述时空语义序列信息、所述时间序列信息以及所述空间序列信息以预设时间周期为单元进行切片,得到时空语义序列集、时间序列集以及空间序列集;
对所述时空语义序列集、所述时间序列集以及所述空间序列集分别进行序列模式挖掘,获得序列模式的支持度。
在一个实施例中,所述根据所述序列模式的支持度以及预设的出行模式分类规则,确定所述目标车辆的出行模式包括:
获取所述轨迹信息的统计周期;
计算所述序列模式的支持度与所述统计周期的比值,根据所述比值与预设阈值的比较结果,确定所述目标车辆的出行模式。
在一个实施例中,所述获取目标车辆的轨迹信息包括:
获取车辆位置初始信息以及车辆状态初始信息,所述车辆位置初始信息携带位置坐标点记录时间,所述车辆状态初始信息携带状态信息记录时间;
根据所述位置坐标点记录时间与所述状态信息记录时间,提取相同时间戳对应的车辆位置信息以及车辆状态信息;
根据所述车辆位置信息以及所述车辆自身状态信息,筛选出处于熄火状态时的车辆位置点作为车辆停等点;
根据所述车辆停等点生成所述目标车辆的轨迹信息。
一种出行模式分类装置,所述装置包括:
信息获取模块,用于获取目标车辆的轨迹信息;
聚类处理模块,用于基于所述轨迹信息分别进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息;
信息处理模块,用于分别对所述时空语义序列信息、所述时间序列信息和所述空间序列信息进行序列模式挖掘,获得序列模式的支持度;
模式分类模块,用于根据所述序列模式的支持度以及预设的出行模式分类规则,确定所述目标车辆的出行模式。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取目标车辆的轨迹信息;
基于所述轨迹信息分别进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息;
分别对所述时空语义序列信息、所述时间序列信息和所述空间序列信息进行序列模式挖掘,获得序列模式的支持度;
根据所述序列模式的支持度以及预设的出行模式分类规则,确定所述目标车辆的出行模式。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取目标车辆的轨迹信息;
基于所述轨迹信息分别进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息;
分别对所述时空语义序列信息、所述时间序列信息和所述空间序列信息进行序列模式挖掘,获得序列模式的支持度;
根据所述序列模式的支持度以及预设的出行模式分类规则,确定所述目标车辆的出行模式。
上述出行模式分类方法、装置、计算机设备和存储介质,通过获取目标车辆的轨迹信息,基于轨迹信息分别进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息;分别对时空语义序列信息、时间序列信息和空间序列信息进行序列模式挖掘,获得序列模式的支持度;根据序列模式的支持度以及预设的出行模式分类规则,确定目标车辆的出行模式;通过从时空语义、时间和空间三个维度对车辆的轨迹信息进行处理,从而实现用户出行模式的分类,可以有效提高出行模式的预测精度。
附图说明
图1为一个实施例中出行模式分类方法的应用环境图;
图2为一个实施例中出行模式分类方法的流程示意图;
图3为一个实施例中轨迹信息获取步骤的流程示意图;
图4为另一个实施例中出行模式分类方法的流程示意图;
图5为一个实施例中出行模式分类结果为强规律的行为特征图;
图6为一个实施例中出行模式分类结果为一般规律B型的行为特征图;
图7为一个实施例中出行模式分类装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的出行模式分类方法,可以应用于如图1所示的应用环境中。其中,客户终端102通过网络与服务器104进行通信。用户通过客户终端102导入目标车辆的轨迹信息。服务器104获取目标车辆的轨迹信息;基于轨迹信息分别进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息;分别对时空语义序列信息、时间序列信息和空间序列信息进行序列模式挖掘,获得序列模式的支持度;根据序列模式的支持度以及预设的出行模式分类规则,确定目标车辆的出行模式。其中,客户终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机和平板电脑,具体地,安装在车辆上的GPS(GlobalPositioning System,全球定位系统)和OBD(On Board Device,车载设备)可以与客户终端通过网络进行通信,其中,GPS记录车辆的位置移动信息,OBD记录车辆状态信息,客户终端获取到车辆的位置移动信息和车辆状态信息后,对其进行综合处理,得到车辆的轨迹信息。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在某些场景下,GPS设备和车载设备也可以直接向服务器发送自身采集到的数据,由服务器对车辆的位置移动信息和车辆状态信息进行综合处理,得到车辆的轨迹信息。
在一个实施例中,如图2所示,提供了一种出行模式分类方法,以出行模式分类方法应用于图1中的服务器为例,包括以下步骤:
步骤202,获取目标车辆的轨迹信息。
目标车辆是指待进行出行模式分类的车辆,比如可以是某个用户名下的私家车。轨迹信息是指车辆的路径信息,轨迹信息具体可以包括移动位置信息和车辆状态信息。
步骤204,基于轨迹信息分别进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息。
根据预先定义的时空语义匹配规则、时间匹配规则、空间匹配规则,通过聚类算法分别对轨迹信息中的停等点进行聚类,得到时空语义序列信息、时间序列信息和空间序列信息。比如可以通过基于密度的聚类算法,根据时空语义匹配规则、时间匹配规则、空间匹配规则对车辆的停等点进行聚类,返回的聚类结果以1-n将停等点进行编号,其中,n为分簇的总数量,将车辆的轨迹信息转化为时空语义序列信息、时间序列信息和空间序列信息。
步骤206,分别对时空语义序列信息、时间序列信息和空间序列信息进行序列模式挖掘,获得序列模式的支持度。
时空语义序列信息是指车辆轨迹信息在时间、空间以及语义上均相似的停等点,其中,语义上相似具体是指序列中两个停等点的停等时长的差值的绝对值不超过预设时长差值。时间序列信息是指车辆轨迹信息在时间上相似的停等点,具体是指序列中两个停等点的时刻的差值的绝对值不超过预设时刻差值。空间序列信息是指车辆轨迹信息在空间上相似的停等点,具体是指序列中两个停等点的经纬度坐标点之间的距离不超过预设距离阈值。其中,序列模式的支持度是指对时空语义序列信息、时间序列信息和空间序列信息分别进行频繁序列模式挖掘,以挖掘出满足最小支持度的频繁序列,此时对应的三种序列的支持度。
在一个实施例中,分别对时空语义序列信息、时间序列信息和空间序列信息进行序列模式挖掘,获得序列模式的支持度包括:将时空语义序列信息、时间序列信息以及空间序列信息以预设时间周期为单元进行切片,得到时空语义序列集、时间序列集以及空间序列集;对时空语义序列集、时间序列集以及空间序列集分别进行序列模式挖掘,获得序列模式的支持度。比如,获取目标车辆一个月的轨迹信息,基于轨迹信息分别进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息。将时空语义序列信息、时间序列信息以及空间序列信息以天为单元进行切片,得到时空语义序列集、时间序列集以及空间序列集,利用PrefixSpan算法进行频繁序列模式挖掘,挖掘出满足最大支持度的频繁序列,获得三种序列的支持度。
步骤208,根据序列模式的支持度以及预设的出行模式分类规则,确定目标车辆的出行模式。
通过预设的出行模式分类规则对三种序列模式的支持度分别进行处理,最终确定目标车辆的出行模式。具体地,获取轨迹信息的统计周期;计算序列模式的支持度与统计周期的比值,根据比值与预设阈值的比较结果,确定目标车辆的出行模式。以目标车辆轨迹信息的统计周期为一个月30天为例,分别计算时空语义、时间和空间三种序列模式的支持度与总天数的比值,将三种比值分别与预设的最小阈值进行比较,当三种比值均不超过最小阈值时,则该目标车辆对应的用户为无规律出行者。当三种比值均超过最小阈值或者任两种比值超过最小阈值时,选取三者中的最大值,该最大值对应的出行模式即为该用户的出行模式。当三种比值中只存在一种序列的比值超过最小阈值时,该序列对应的出行模式即为该用户的出行模式。
上述出行模式分类方法,通过获取目标车辆的轨迹信息,基于轨迹信息分别进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息;分别对时空语义序列信息、时间序列信息和空间序列信息进行序列模式挖掘,获得序列模式的支持度;根据序列模式的支持度以及预设的出行模式分类规则,确定目标车辆的出行模式;通过从时空语义、时间和空间三个维度对车辆的轨迹信息进行处理,从而实现用户出行模式的分类,可以有效提高出行模式的预测精度。
在一个实施例中,基于轨迹信息分别进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息包括:获取时空语义匹配规则、时间匹配规则以及空间匹配规则;根据时空语义匹配规则、时间匹配规则以及空间匹配规则分别对轨迹信息进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息。具体地,轨迹信息中的停等点对应的轨迹序列可以定义为:
<[S1.t,(S1.lat,S1.lon),S1.dur],[S2.t,(S2.lat,S1.lon),S2.dur],...,[Sn.t,(Sn.lat,Sn.lon),Sn.dur]>
为上述轨迹序列定义停等点相似匹配规则,停等点相似匹配规则包括空间匹配规则、时间匹配规则和时空语义匹配规则。其中,空间匹配规则是指两个经纬度坐标点之间的Haversine距离不超过所定义的阈值ρ,表征两个停等点的空间相似,即Haversine距离Distance(Si,Sj)≤ρ。时间匹配规则是指两个停等点的时刻信息的差值绝对值不超过所定义的阈值τ,表征时间上相似,|Si.t-Sj.t|≤τ。时空语义匹配规则是指同时满足时间、空间以及语义匹配的规则,其中,语义上匹配是指两个停等点的停等时长信息的差值绝对值不超过所定义的阈值θ,表征语义上相似,|Si.dur-Sj.dur|≤θ。两个停等点定义为强相似的条件是其时间、空间、语义须同时满足匹配规则,即:
对目标车辆的轨迹信息进行编码,将轨迹信息中的停等点转化为包含时间、空间及语义信息的数字编号,设置ρ,τ,θ三个阈值,定义最小簇数阈值MinPts。利用基于密度的聚类思想,通过时空语义匹配规则对停等点进行聚类,同一簇内的停等点在时空语义上相似。将聚类处理最终的簇按照数字1-n进行编号,完成转换。将停等点转化为仅包含时间信息的数字编号,通过时间匹配规则对停等点进行基于密度的聚类,簇内的停等点在时间上具有相似性,将最终的簇按照数字1-n进行编号,完成转换。将停等点转化为仅包含空间信息的数字编号,通过空间匹配规则对停等点进行基于密度的聚类,同一簇内的停等点在空间上具有相似性。将最终的簇按照数字1-n进行编号,完成转换。由此实现了将停等点的轨迹信息分别转化为时空语义序列、时间序列以及空间序列。此时,学习停等点轨迹的时间戳先后顺序,将已经转换为数字的停等点进行先后排列,最终形成与原始停等轨迹一致顺序的时空语义序列信息、时间序列信息以及空间序列信息。
在一个实施例中,根据时空语义匹配规则、时间匹配规则以及空间匹配规则分别对轨迹信息进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息包括:获取轨迹信息的核心对象集合以及初始聚类簇信息;当核心对象集合不为空集,且在目标车辆停等点的邻域半径范围内,车辆停等点数量大于预设阈值时,根据目标车辆停等点对初始聚类簇信息进行更新;遍历核心对象集合中的各个车辆停等点,得到聚类处理后的时空语义序列信息、时间序列信息和空间序列信息。其中,获取轨迹信息的核心对象集合包括:分别基于时空语义匹配规则、时间匹配规则以及空间匹配规则对轨迹信息进行处理,得到轨迹信息中车辆停等点的邻域集;当邻域集的元素个数满足预设条件时,根据对应的车辆停等点得到核心对象集合。利用基于密度的聚类算法,根据时空语义匹配规则、时间匹配规则、空间匹配规则,对车辆的停等点进行聚类,返回的聚类结果以1-n对停等点进行编号,将停等点轨迹转化为时空语义、时间、空间序列,其中,n为分簇的总数量。获取轨迹信息中的停等点轨迹序列如下所示,并设置邻域参数(∈,MinPts)。
<[S1.t,(S1.lat,S1.lon),S1.dur],[S2.t,(S2.lat,S1.lon),S2.dur],...,[Sn.t,(Sn.lat,Sn.lon),Sn.dur]>
初始化核心对象集合Ω1,Ω2,Ω3(Ω1=Ω2=Ω3),初始化簇数K1=0,K2=0,K3=0,初始未访问样本集合Γ=S,簇划分C为空集。对于i=1,2,...n,按步骤a)和b)找出所有的核心对象。a)通过时空语义规则、时间规则和空间规则,分别找到样本Si的∈-邻域子样本集N1∈(Si),N2∈(Si),N3∈(Si);b)如果子样本集的样本个数满足|N1~3∈(Si)|≥MinPts|,将样本点Si加入对应的核心对象集合Ωx=Ωx∪{Si}(x=1,2,3)。如果核心对象集合则空集对应的序列停止,转入核心点判断步骤;若均不为空集,则直接核心点判断步骤;若都为空集,则停止。判断核心对象集合中的点是否为核心点,即其邻域半径范围内停等点的数量是否大于MinPts,若是,则将该点对应的∈-邻域子样本集与当前的聚类簇合并,得到新的簇,直到所有的轨迹点都经过访问停止。保留最终的聚类状态,获取簇的总数目,为每个轨迹点进行编号,同一个簇内的点编号相同。在分簇过程中编号是从0开始的,0点作为了突发性点与一般情况偏离,最后将属于第0个簇的点删除不做考虑。
在一个实施例中,如图3所示,获取目标车辆的轨迹信息包括:步骤302,获取车辆位置初始信息以及车辆状态初始信息,车辆位置初始信息携带位置坐标点记录时间,车辆状态初始信息携带状态信息记录时间;步骤304,根据位置坐标点记录时间与状态信息记录时间,提取相同时间戳对应的车辆位置信息以及车辆状态信息;步骤306,根据车辆位置信息以及车辆自身状态信息,筛选出处于熄火状态时的车辆位置点作为车辆停等点;步骤308根据车辆停等点生成目标车辆的轨迹信息。可以通过安装在车辆上的GPS记录车辆的位置移动信息,通过OBD记录车辆状态信息。将GPS记录出行的位置移动信息与OBD记录的车辆本身状态信息结合,得到停等轨迹信息。停等轨迹信息既能够反映车辆在道路上移动的位置变化、速度变化、加减速行为,也能够体现车辆的停等在某一地点的熄火状态和从某一点出发的车辆引擎点火状态等状态信息。将GPS信息与OBD信息结合的方法具体可以是在GPS信息中寻找位置坐标点记录时间与OBD信息中状态信息记录时间相同的时间戳,保留该时间戳对应的两段信息,并将两段信息合并,删除其它无用记录。针对处理后的信息,将某时刻车辆引擎状态为熄火状态的位置点作为停等点,无间断连续的停等点即为车辆出行的停等轨迹。
在一个实施例中,本申请提供的出行模式分类方法的作用对象为私家车,轨迹信息为私家车的轨迹信息。公交车轨迹数据、地铁卡数据以及出租车轨迹数据等信息并不能反映以私家车作为主要出行方式的群体的出行行为。首先,分类过程同时考虑时间、空间和语义特征,其中,语义特征是通过从私家车出行轨迹中提取的停等时长进行表征的,这种表征仅对使用私家车的用户群体有效,因为一辆私家车的使用者是单一的,与出租车、公交车的公共载客属性不同,所以私家车的上一次停止和下一次启动之间的时间间隔必然为该用户离开车辆从事某一活动的时长,该时长可在一定程度上反映所进行的活动是长时间活动/短时间活动,例如工作或晚上回家休息,短时间活动例如喝杯咖啡或者购物,且又不局限于一种活动。其次,在判断时间和停等时长相似性的过程中,脱离原始的切分时间片的方式,采用灵活的时间、停等时长聚类判断停等点之间的相似,使提取到的对应序列模式更加精确。最后,将私家车的出行行为分类设定为多分类问题,对私家车用户的出行行为进行分类,分类的类型包括四类标签,分别为强规律、一般规律A型、一般规律B型和无规律,使分类预测结果不局限于有规律还是无规律这种粗粒度的分类,有助于交通管理部门设置更详细的管理标准。
以出行模式分类方法应用于私家车为例,如图4所示,获取预设时长内私家车GPS记录的位置数据以及OBD记录的车辆行驶状态数据,从位置数据中寻找位置坐标点记录时间与车辆行驶状态数据中状态记录时间相同的时间戳,由该时间戳对应的位置数据和行驶状态数据,得到车辆停等轨迹。通过基于密度的聚类算法,按照时空语义匹配规则、时间匹配规则和空间匹配规则三种匹配规则,对车辆停等轨迹中的私家车停等点进行聚类,聚类处理反馈结果以1-n对私家车停等点进行编号,其中,n为非0总的簇数,由此将车辆停等轨迹转换成数字序列。将转换后的数字序列以天为单位进行切割,对应的得到时空语义序列集、时间序列集合控件序列集三个序列集。利用PrefixSpan算法分别从三个序列集中提取序列模式,得到不同模式序列和对应的支持度,从三个序列集对应的模式序列中分别提取具有最大支持度的模式序列。计算三种序列的支持度与总时长天数的比值,当三种序列的比值均满足超过预设阈值,或者三种序列的比值中两种序列的比值满足超过预设阈值时,该私家车的出行模式分类结果为比值最大值所属类型。当三种序列的比值中只存在一种序列的比值满足超过预设阈值时,该私家车的出行模式分类结果为该序列对应的类型。当三种序列的比值中任一种序列的比值均不超过预设阈值,该私家车的出行模式分类结果为无规律。
图5为一个实施例中出行模式分类结果为强规律的行为特征图,其中,通过环形图表征车辆处于不同地点,从图中可以看出环形图被分割为不同区域,用于表征车辆的静止状态和移动状态。采集目标车辆2016年7月一个月的车辆行驶数据和车辆状态信息数据,将其转化为停等轨迹,停等轨迹包含一个月每一天产生停等行为的时刻、经纬度和停等时长等信息。将该停等轨迹转化为数字序列,以天为单位进行切割后,再利用PrefixSpan算法进行模式提取,最后得到时空语义模式的支持度与总天数的比例达到40%,设置的阈值为30%,由于其包含了时间和空间,因此不考虑另外两类情形。根据索引依据的数字序列返回至原始数据库中,找出对应的原始数据,获得其出行的时空语义普遍模式。经过本申请中出行模式分类方法对某实施例中的轨迹信息进行处理后,其时间模式的支持度与总天数的比例达到64%,设置的阈值为30%,另外两种模式均超过设置的阈值,由此得出在该实施例中车辆的出行模式分类为一般规律A型,私家车出发时刻大部分在7点-8点之间。图6是一个实施中出行模式分类结果为一般规律B型的行为特征图,经过本申请中出行模式分类方法进行处理后,其空间模式的支持度与总天数的比例达到85%,设置的阈值为30%,另外两种模式均超过设置的阈值,该用户一个月内的出行均在图中所示的左上和右下两地之间往返,但往返时刻与在两地的停等时长均不具规律性。
应该理解的是,虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,提供了一种出行模式分类装置,如图7所示,出行模式分类装置包括信息获取模块702、聚类处理模块704、信息处理模块706以及模式分类模块708。其中,信息获取模块702,用于获取目标车辆的轨迹信息。聚类处理模块704,用于基于轨迹信息分别进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息。信息处理模块706,用于分别对时空语义序列信息、时间序列信息和空间序列信息进行序列模式挖掘,获得序列模式的支持度。模式分类模块708,用于根据序列模式的支持度以及预设的出行模式分类规则,确定目标车辆的出行模式。
在一个实施例中,聚类处理模块还用于获取时空语义匹配规则、时间匹配规则以及空间匹配规则;根据时空语义匹配规则、时间匹配规则以及空间匹配规则分别对轨迹信息进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息。
在一个实施例中,聚类处理模块还用于获取轨迹信息的核心对象集合以及初始聚类簇信息;当核心对象集合不为空集,且在目标车辆停等点的邻域半径范围内,车辆停等点数量大于预设阈值时,根据目标车辆停等点对初始聚类簇信息进行更新;遍历核心对象集合中的各个车辆停等点,得到聚类处理后的时空语义序列信息、时间序列信息和空间序列信息。
在一个实施例中,聚类处理模块还用于分别基于时空语义匹配规则、时间匹配规则以及空间匹配规则对轨迹信息进行处理,得到轨迹信息中车辆停等点的邻域集;当邻域集的元素个数满足预设条件时,根据对应的车辆停等点得到核心对象集合。
在一个实施例中,信息处理模块还用于将时空语义序列信息、时间序列信息以及空间序列信息以预设时间周期为单元进行切片,得到时空语义序列集、时间序列集以及空间序列集;对时空语义序列集、时间序列集以及空间序列集分别进行序列模式挖掘,获得序列模式的支持度。
在一个实施例中,模式分类模块还用于获取轨迹信息的统计周期;计算序列模式的支持度与统计周期的比值,根据比值与预设阈值的比较结果,确定目标车辆的出行模式。
在一个实施例中,信息获取模块还用于获取车辆位置初始信息以及车辆状态初始信息,车辆位置初始信息携带位置坐标点记录时间,车辆状态初始信息携带状态信息记录时间;根据位置坐标点记录时间与状态信息记录时间,提取相同时间戳对应的车辆位置信息以及车辆状态信息;根据车辆位置信息以及车辆自身状态信息,筛选出处于熄火状态时的车辆位置点作为车辆停等点;根据车辆停等点生成目标车辆的轨迹信息。
关于出行模式分类装置的具体限定可以参见上文中对于出行模式分类方法的限定,在此不再赘述。上述出行模式分类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储轨迹信息、出行模式等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种出行模式分类方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现任一实施例中出行模式分类方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现任一实施例中出行模式分类方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种出行模式分类方法,其特征在于,所述方法包括:
获取目标车辆的轨迹信息;
基于所述轨迹信息分别进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息,所述时空语义序列信息为车辆轨迹信息在时间、空间以及语义上均相似的停等点,语义上相似是指序列中两个停等点的停等时长的差值的绝对值不超过预设时长差值;
将所述时空语义序列信息、所述时间序列信息以及所述空间序列信息以预设时间周期为单元进行切片,得到时空语义序列集、时间序列集以及空间序列集;
对所述时空语义序列集、所述时间序列集以及所述空间序列集分别进行序列模式挖掘,获得序列模式的支持度;
获取所述轨迹信息的统计周期;计算所述序列模式的支持度与所述统计周期的比值,根据所述比值与预设阈值的比较结果,确定所述目标车辆的出行模式。
2.根据权利要求1所述的方法,其特征在于,所述基于所述轨迹信息分别进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息包括:
获取时空语义匹配规则、时间匹配规则以及空间匹配规则;
根据所述时空语义匹配规则、所述时间匹配规则以及所述空间匹配规则分别对所述轨迹信息进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述时空语义匹配规则、所述时间匹配规则以及所述空间匹配规则分别对所述轨迹信息进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息包括:
获取所述轨迹信息的核心对象集合以及初始聚类簇信息;
当所述核心对象集合不为空集,且在目标车辆停等点的邻域半径范围内,车辆停等点数量大于预设阈值时,根据所述目标车辆停等点对所述初始聚类簇信息进行更新;
遍历所述核心对象集合中的各个车辆停等点,得到聚类处理后的时空语义序列信息、时间序列信息和空间序列信息。
4.根据权利要求3所述的方法,其特征在于,所述获取所述轨迹信息的核心对象集合包括:
分别基于所述时空语义匹配规则、所述时间匹配规则以及所述空间匹配规则对所述轨迹信息进行处理,得到所述轨迹信息中车辆停等点的邻域集;
当所述邻域集的元素个数满足预设条件时,根据对应的车辆停等点得到核心对象集合。
5.根据权利要求1所述的方法,其特征在于,所述获取目标车辆的轨迹信息包括:
获取车辆位置初始信息以及车辆状态初始信息,所述车辆位置初始信息携带位置坐标点记录时间,所述车辆状态初始信息携带状态信息记录时间;
根据所述位置坐标点记录时间与所述状态信息记录时间,提取相同时间戳对应的车辆位置信息以及车辆状态信息;
根据所述车辆位置信息以及所述车辆自身状态信息,筛选出处于熄火状态时的车辆位置点作为车辆停等点;
根据所述车辆停等点生成所述目标车辆的轨迹信息。
6.一种出行模式分类装置,其特征在于,所述装置包括:
信息获取模块,用于获取目标车辆的轨迹信息;
聚类处理模块,用于基于所述轨迹信息分别进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息,所述时空语义序列信息为车辆轨迹信息在时间、空间以及语义上均相似的停等点,语义上相似是指序列中两个停等点的停等时长的差值的绝对值不超过预设时长差值;
信息处理模块,用于将所述时空语义序列信息、所述时间序列信息以及所述空间序列信息以预设时间周期为单元进行切片,得到时空语义序列集、时间序列集以及空间序列集;对所述时空语义序列集、所述时间序列集以及所述空间序列集分别进行序列模式挖掘,获得序列模式的支持度;
模式分类模块,用于获取所述轨迹信息的统计周期;计算所述序列模式的支持度与所述统计周期的比值,根据所述比值与预设阈值的比较结果,确定所述目标车辆的出行模式。
7.根据权利要求6所述的装置,其特征在于,所述聚类处理模块还用于:
获取时空语义匹配规则、时间匹配规则以及空间匹配规则;根据所述时空语义匹配规则、所述时间匹配规则以及所述空间匹配规则分别对所述轨迹信息进行聚类处理,得到时空语义序列信息、时间序列信息和空间序列信息。
8.根据权利要求7所述的装置,其特征在于,所述聚类处理模块还用于:
获取所述轨迹信息的核心对象集合以及初始聚类簇信息;当所述核心对象集合不为空集,且在目标车辆停等点的邻域半径范围内,车辆停等点数量大于预设阈值时,根据所述目标车辆停等点对所述初始聚类簇信息进行更新;遍历所述核心对象集合中的各个车辆停等点,得到聚类处理后的时空语义序列信息、时间序列信息和空间序列信息。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911371262.8A CN111027644B (zh) | 2019-12-26 | 2019-12-26 | 出行模式分类方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911371262.8A CN111027644B (zh) | 2019-12-26 | 2019-12-26 | 出行模式分类方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111027644A CN111027644A (zh) | 2020-04-17 |
CN111027644B true CN111027644B (zh) | 2023-12-26 |
Family
ID=70215003
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911371262.8A Active CN111027644B (zh) | 2019-12-26 | 2019-12-26 | 出行模式分类方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111027644B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014012824A1 (fr) * | 2012-07-16 | 2014-01-23 | Egidium Technologies | Procede et systeme de reconstruction de trajectoire 3d en temps reel |
CN107016126A (zh) * | 2017-05-12 | 2017-08-04 | 西南交通大学 | 一种基于序列模式挖掘的多用户模型移动轨迹预测方法 |
CN110046218A (zh) * | 2019-05-13 | 2019-07-23 | 东软集团股份有限公司 | 一种用户出行模式的挖掘方法、装置、系统和处理器 |
CN110334133A (zh) * | 2019-07-11 | 2019-10-15 | 京东城市(北京)数字科技有限公司 | 规则挖掘方法和装置、电子设备和计算机可读存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8055081B2 (en) * | 2008-04-14 | 2011-11-08 | Eastman Kodak Company | Image classification using capture-location-sequence information |
US8384787B2 (en) * | 2011-02-24 | 2013-02-26 | Eastman Kodak Company | Method for providing a stabilized video sequence |
US8543320B2 (en) * | 2011-05-19 | 2013-09-24 | Microsoft Corporation | Inferring a behavioral state of a vehicle |
-
2019
- 2019-12-26 CN CN201911371262.8A patent/CN111027644B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014012824A1 (fr) * | 2012-07-16 | 2014-01-23 | Egidium Technologies | Procede et systeme de reconstruction de trajectoire 3d en temps reel |
CN107016126A (zh) * | 2017-05-12 | 2017-08-04 | 西南交通大学 | 一种基于序列模式挖掘的多用户模型移动轨迹预测方法 |
CN110046218A (zh) * | 2019-05-13 | 2019-07-23 | 东软集团股份有限公司 | 一种用户出行模式的挖掘方法、装置、系统和处理器 |
CN110334133A (zh) * | 2019-07-11 | 2019-10-15 | 京东城市(北京)数字科技有限公司 | 规则挖掘方法和装置、电子设备和计算机可读存储介质 |
Non-Patent Citations (3)
Title |
---|
Exploring Trajectory Behavior Model for Anomaly Detection in Maritime Moving Objects;Po-Ruey Lei;《2013 IEEE International Conference on Intelligence and Security Informatics》;第 271-271页 * |
基于语义的隐私保护车辆轨迹数据挖掘技术研究;陶健;《中国优秀硕士学位论文全文数据库信息科技辑》;第I138-2186页 * |
孟祥武等.基于用户轨迹数据的移动推荐系统研究.《软件学报》.2018,(第10期),第3125页. * |
Also Published As
Publication number | Publication date |
---|---|
CN111027644A (zh) | 2020-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11562020B2 (en) | Short-term and long-term memory on an edge device | |
Zheng | Trajectory data mining: an overview | |
CN105307121A (zh) | 一种信息处理方法及装置 | |
WO2018150228A1 (en) | Mobility gene for visit data | |
CN111190891A (zh) | 一种多语义轨迹数据分段存储方法 | |
CN106940929B (zh) | 交通数据预测方法及装置 | |
WO2023098339A1 (zh) | 数据处理方法、装置、设备、存储介质及程序产品 | |
CN113468283A (zh) | 数据处理方法、装置、设备、存储介质 | |
Makris et al. | Evaluating the effect of compressing algorithms for trajectory similarity and classification problems | |
CN110503032B (zh) | 基于监控摄像头轨迹数据的个体重要场所探测方法 | |
CN111027644B (zh) | 出行模式分类方法、装置、计算机设备和存储介质 | |
Ali et al. | Future connected vehicles: challenges and opportunities for spatio-temporal computing | |
CN111210634B (zh) | 智能交通信息处理方法、装置、智能交通系统及服务器 | |
Zhou et al. | Identification of taxi pick-up and drop-off hotspots using the density-based spatial clustering method | |
S. de Sousa et al. | A cluster-based framework for predicting large scale road-network constrained trajectories | |
Forke et al. | Feature engineering techniques and spatio-temporal data processing | |
CN108240818B (zh) | 一种路径确定方法及其装置 | |
Necula | Mining GPS data to learn driver's route patterns | |
Wang et al. | Grid‐Based Whole Trajectory Clustering in Road Networks Environment | |
CN117119384B (zh) | 出行热点提取方法、系统、设备及存储介质 | |
Tomaras et al. | Travel time estimation in real-time using buses as speed probes | |
CN114463571A (zh) | 一种车辆图片聚类方法、装置、设备和存储介质 | |
Haas et al. | Car ride classification for drive context recognition | |
EP3996065A1 (en) | System and method for parking tracking using vehicle event data | |
Jongeling | Segmenting trajectory data using the Brownian bridge movement model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |