CN113763712B - 基于出行事件知识图谱的区域交通拥堵溯因方法 - Google Patents

基于出行事件知识图谱的区域交通拥堵溯因方法 Download PDF

Info

Publication number
CN113763712B
CN113763712B CN202111224111.7A CN202111224111A CN113763712B CN 113763712 B CN113763712 B CN 113763712B CN 202111224111 A CN202111224111 A CN 202111224111A CN 113763712 B CN113763712 B CN 113763712B
Authority
CN
China
Prior art keywords
track
travel
event
entity
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111224111.7A
Other languages
English (en)
Other versions
CN113763712A (zh
Inventor
李天瑞
谢鹏
毛慧慧
杜圣东
滕飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Jiaotong University
Original Assignee
Southwest Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Jiaotong University filed Critical Southwest Jiaotong University
Priority to CN202111224111.7A priority Critical patent/CN113763712B/zh
Publication of CN113763712A publication Critical patent/CN113763712A/zh
Application granted granted Critical
Publication of CN113763712B publication Critical patent/CN113763712B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0133Traffic data processing for classifying traffic situation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于出行事件知识图谱的区域交通拥堵溯因方法,包括构建出行事件知识图谱和利用出行事件知识图谱进行区域交通拥堵溯因的步骤。本发明的有益效果在于,能够简洁有效地表示出行轨迹数据的时空动态性,刻画出车辆实体、轨迹实体、POI实体、事件实体的相互关系,适用于处理动态变化的出行轨迹。充分考虑了突发事件对出行轨迹的影响,出行事件知识图谱记录了事件的名称、类型、发生时间、发生地点、持续时间等,对于交通拥堵的溯因提供了一种可解释性的分析手段。综合出行轨迹的时空动态性和事件关系,可充分挖掘出行轨迹本身隐含的时空动态和因果知识。

Description

基于出行事件知识图谱的区域交通拥堵溯因方法
技术领域
本发明涉及轨迹数据挖掘技术领域,特别是一种基于出行事件知识图谱的区域交通拥堵溯因方法。
背景技术
出行轨迹数据作为城市时空大数据的一种重要类型,具有时空动态性,空间分布广泛的特点,隐含了个体和群体的出行模式和特征。如何从这些出行轨迹数据中发现有价值的知识,对于辅助城市区域的交通拥堵溯因具有重要的意义,也存在不小的挑战。
知识图谱是一种能够将数据中的知识以节点和边来进行形式化描述的框架,以结构化三元组的形式存储实体和实体之间的关系。因其能够将实体之间的多粒度、多层次的语义关联以一种统一的方式进行表示,知识图谱在搜索、问答、推荐等领域展现出了广阔的应用前景。
事件知识图谱以事件为节点,事件关系为边进行表示,相较于先前的知识图谱具有更加强大的知识表达能力,因为事件关系的引入使得事件知识图谱能够表达仅仅利用实体和实体关系无法表达的时间和空间的动态知识。事件知识图谱对于刻画事件的动态演化、进行事件预测以及事件因果推理具有独特的优势。
目前将出行轨迹数据与知识图谱结合的应用还比较少,大多是将出行轨迹数据转换成知识图谱三元组,构建轨迹知识图谱,进而用于轨迹的语义查询或者位置推荐,缺乏对轨迹数据本身的时空动态性以及事件对出行轨迹的影响的考虑,难以充分挖掘出行轨迹数据本身隐含的动态和因果知识。
(1)基于出行轨迹数据的轨迹知识图谱构建
参考文献1“Understanding People Lifestyles:Construction of UrbanMovement Knowledge Graph from GPS Trajectory”(Zhuang C,Yuan N J,Song R,et al,IJCAI.pp.3616-3623,August.2017)从时间、空间、时空三个视角,用GPS轨迹数据构建了一个城市移动知识图谱,其中位置和位置之间的关系分别代表节点和边,将节点和边在一个隐含的语义空间进行表示,进而利用这个知识图谱来预测用户对城市不同位置的关注程度高低。该方法将GPS轨迹数据中的时空信息进行了较为有效的表示,并利用知识图谱在下游的预测任务上进行实验,但是忽略了时空数据本身存在的动态性,构建的是一个静态的知识图谱。
参考文献2“轨迹图谱:一种基于知识图谱结构的轨迹信息抽取方法”(吴瑕,赵小明,余建坤,计算机应用研究,Vol.37,No.11,PP.1-5,Feb.2020)提出了一种将GPS轨迹数据转换成轨迹知识图谱的方法,抽取了用户、轨迹、地物三类实体,关系包括空间关系、时间关系和地理关系,基于构建好的轨迹知识图谱,可以进行轨迹的常见查询。然而这种方法,缺乏考虑事件对出行轨迹的影响,实现的下游功能也较为单一。
(2)城市交通拥堵区域发现及预测
参考文献3“刘畅.交通拥堵区域的发现与预测技术研究[D].2015.”首先利用GPS轨迹数据找出城市交通拥堵区域,然后预测每个区域在之后的时间段出现交通拥堵的几率,其中交通拥堵的状况是基于当前时刻的状态只依赖于上一个时刻的状态这一假设进行预测的,文中基于马尔科夫链预测模型建立了交通拥堵情况预测模型,然而导致交通拥堵的影响因素是复杂多变的,而且具有一定随机性,如果缺乏对交通拥堵的溯因分析,那么仅仅依靠单一数据源和上一时刻的状态,难以做出有效的交通拥堵预测。
参考文献4“张振龙,邱煜卿,蒋灵德,等.基于实时路况的交通拥堵时空特征及其影响因素分析——以苏州古城区为例[J].现代城市研究,2020,000(001):104-112.”通过实时路况数据,对苏州古城区的常发性拥堵路段的时空特征进行分析,并且分析了交通拥堵发生的主要原因,但是缺乏对交通拥堵区域的发现,没有考虑突发事件对交通拥堵的影响,由于研究的是苏州古城区,给出的交通拥堵治理对策也有一定的空间局限性。
发明内容
本发明的目的是提供一种基于出行事件知识图谱的区域交通拥堵溯因方法。
实现本发明的技术方案是:
基于出行事件知识图谱的区域交通拥堵溯因方法,包括:
步骤1:构建出行事件知识图谱,包括:
1.1从车辆出行轨迹数据集中抽取车辆实体和轨迹实体;使用基于时间和空间距离阈值的POI抽取算法从车辆出行轨迹数据集中抽取POI实体;采用预定义事件类型的方法构建事件实体;
1.2从车辆出行轨迹数据集中抽取关系,包括:车辆实体之间的相似关系、车辆实体与轨迹实体的产生关系、轨迹实体之间的相似关系、轨迹实体与POI实体的途经关系;构建事件实体之间的因果关系、事件实体与轨迹实体的影响关系;
步骤2:利用出行事件知识图谱,进行区域交通拥堵溯因,包括:
2.1利用基于路网的区域划分方法,对地图进行分割和聚类,得到区域;
2.2从出行事件知识图谱的轨迹实体中,获取在指定时间范围内从指定区域到目标区域的所有车辆轨迹数量,得到区域之间的车辆流量,形成区域链路流量矩阵;采用PCA算法从区域链路流量矩阵挖掘出异常的区域链路流量;
将异常的区域链路流量所对应的出行路径作为区域交通拥堵路径;
2.3构建区域交通拥堵原因候选集合,包括:
2.3.1从出行事件知识图谱的轨迹实体中,抽取出行路径的轨迹对应的出发时间和到达时间,并将其与节假日类型表和早晚高峰类型表的时间段进行匹配;如果其在对应的时间段内,则将节假日类型或早晚高峰类型标记纳入区域交通拥堵原因候选集合;
2.3.2从出行事件知识图谱得到轨迹途经的POI序列,获取出发地和到达地POI,得到其POI类型和位置;如果POI的中心坐标位置位于轨迹驻留区域地理范围内,则将区域本身的POI类型纳入区域交通拥堵原因候选集合;
2.3.3根据事件类型表的突发事件,结合出行事件知识图谱中的事件实体与轨迹实体的影响关系以及事件之间的因果关系,根据出行轨迹途经的POI序列,得到出行轨迹途经POI的时间和位置信息,将同时段发生的突发事件属性纳入区域交通拥堵候选集合;
2.4根据区域交通拥堵候选集合的值,给区域交通拥堵路径添加拥堵原因标记。
本发明的有益效果在于,能够简洁有效地表示出行轨迹数据的时空动态性,刻画出车辆实体、轨迹实体、POI实体、事件实体的相互关系,适用于处理动态变化的出行轨迹。充分考虑了突发事件对出行轨迹的影响,出行事件知识图谱记录了事件的名称、类型、发生时间、发生地点、持续时间等,对于交通拥堵的溯因提供了一种可解释性的分析手段。综合出行轨迹的时空动态性和事件关系,可充分挖掘出行轨迹本身隐含的时空动态和因果知识。
附图说明
图1为区域链路及出行路径示意图。
具体实施方式
一种基于出行事件知识图谱的区域交通拥堵溯因方法,包括:
步骤一:从出行轨迹数据集TD中直接抽取车辆实体和轨迹实体;使用基于时间和空间距离阈值的POI抽取算法从出行轨迹数据集TD中抽取出POI实体集,根据出行轨迹的起止点,抽取出起始地和到达地POI实体;采用预定义事件类型的方法构建事件实体,事件实体包含事件编号、名称、类型、发生时间、持续时间、发生地点等事件属性;
步骤二:构建出行事件知识图谱,包括:
2.1计算车辆的出发地之间的距离,然后通过归一化处理,得到相似度,构建车辆实体和车辆实体之间的双向相似关系PSP;
2.2从预处理后的轨迹数据集TR中直接提取并构建车辆实体和轨迹实体的单向产生关系PGT;
2.3采用DTW(Dynamic Time Warping)算法,来得到轨迹之间的相似度得分,进而构建轨迹实体和轨迹实体之间的双向相似关系TST;
2.4通过使用基于时间和空间距离阈值的POI抽取算法(SPD,Stay PointDetection)获取轨迹途经的POI序列,,构建轨迹实体和POI实体的途经关系TVO;
2.5采用基于主动学习的多轮人工因果关系标注,构建事件实体和事件实体之间的因果关系ECE;
2.6计算事件发生地与轨迹上的GPS点的距离最小值,构建事件实体和轨迹实体的影响关系EIT;
步骤三:根据出行事件知识图谱进行城市区域交通拥堵溯因分析,分为城市区域交通拥堵检测和城市区域交通拥堵原因标记,前者的步骤为首先采用基于路网的城市区域划分方法和聚类,得到不规则的城市区域,然后使用PCA(Principal Component Analysis)算法从区域链路流量矩阵中挖掘区域链路流量异常,最后求解L1约束优化问题,得到候选的区域交通拥堵路径;后者的步骤为首先从时间、空间、事件三个角度对城市交通拥堵产生的原因进行分析,包括节假日、早晚高峰、区域本身的POI类型、突发事件的影响等,然后根据同时间段、同地理范围内的约束条件,获取出行事件知识图谱中的实体、关系、属性信息进行原因匹配,最后得到城市区域交通拥堵产生的原因标记CL。
本发明的实施例,其步骤如下:
A、预处理出行轨迹数据集T-Drive,该数据集包含2008年北京10357辆出租车2月2日至2月8日的GPS轨迹,共有1500万个GPS点,轨迹总距离长度达到900多万公里。数据集中的每个文本文件以出租车ID命名,其中包含该出租车的所有轨迹。文件中的每一行记录了出租车ID、时间戳、经度、纬度。
出行轨迹数据集预处理的步骤如下所示:
A1、轨迹噪声过滤。采用基于速度的启发式方法完成轨迹噪声过滤,计算每个轨迹点的速度,轨迹点的速度由该轨迹点到它的下一个轨迹点的距离和时间通过速度公式计算得到,如果大于速度阈值,则可以判断该轨迹点是噪声点,去除该噪声点。其中,速度阈值通常为轨迹的平均速度;
A2、驻留点检测。采用基于距离阈值和时间阈值结合的驻留点检测方法。首先检测当前轨迹点pi与它的后继轨迹点之间的距离是否大于一个自定义的距离阈值Dmax,然后计算当前轨迹点到Dmax以内的最后一个后继轨迹点pj之间的时间间隔,如果时间间隔大于自定义的时间阈值Tmin,那么就检测到一个驻留点(pipj),接着,锚点移动到轨迹点pj的下一个点。否则,锚点移动到轨迹点pi的下一个点。重复此过程,直至锚点移动到轨迹末尾,即可检测出轨迹中的所有驻留点。其中,距离阈值设置为200m,时间阈值设置为15min;
A3、轨迹压缩。采用基于DP(Douglas-Peucker)算法的轨迹压缩方法。在轨迹的首尾两点连接一条直线,遍历轨迹上的所有点到直线的距离,找到与直线距离最大的点pmax,令最大距离为dmax,比较dmax与自定义的误差距离阈值d,如果dmax<d,则将该直线看作近似的线段,代替原来的轨迹,如果dmax≥d,则用点pmax把轨迹分成前后两段,分别对这两段重复执行上述步骤,最后依次连接这些折线,得到压缩后的轨迹。其中,误差距离阈值设置为10m;
A4、轨迹分段。采用基于驻留点的轨迹分段方法,根据步骤A2通过驻留点检测算法找出的驻留点,将步骤A3得到的压缩后的轨迹,以驻留点为切断点进行切分,得到分段后的轨迹,每个轨迹段都构成一条新的轨迹;
A5、路网匹配。将分段后的轨迹转换成一系列的路段序列。采用全局和局部相结合的路网匹配方法,首先针对轨迹中的每个点,找到离它距离最近的局部候选路段,然后根据每两个连续轨迹点的候选轨迹点转移概率,结合路网的全局拓扑信息,最大化全局匹配概率,将轨迹集TR匹配到路段上,最后用匹配到路段上的轨迹点代替原始的轨迹点。
通过步骤A,最终可以获得可用性好、精确度高、冗余度小的轨迹数据集TR,其数据集的组织结构与原始的T-Drive出行轨迹数据集相同,接下来将构建出行事件知识图谱,包括实体和关系抽取、属性值计算,知识图谱的组成结构如表1-1所示。
表1-1知识图谱组成结构
类型(Type) 具有相同特点或属性实体集合的抽象
实体(Entity) 对具体事物的客观抽象
关系(Relation) 刻画实体与实体之间的关联
属性(Property) 对实体性质的抽象
值(Value) 即属性值,用于描述实体
B、实体和关系抽取:
B1、实体包括出租车实体P、轨迹实体T、POI(Point of Interest)实体O和事件实体E。出租车实体P和轨迹实体T可直接从通过A步骤预处理后的轨迹数据集TR中抽取,该数据集中的每个文本文件对应一个出租车实体P,出租车的每条出行轨迹对应一个轨迹实体T。使用基于时间和空间距离阈值的POI抽取算法(SPD,Stay Point Detection)获取POI实体O,其中时间阈值(TT)和空间距离阈值(ST)根据经验自定义设置,一般TT=15分钟,DT=200米,POI实体按时间顺序排列,得到轨迹途经的POI序列。采用人工预定义事件类型的方式构建事件实体E,事件分为常规事件和突发事件两类,事件类型表如表1-2所示。
表1-2事件类型表
Figure BDA0003310096330000081
出租车实体的属性为Taxi ID、Trajectory Number,轨迹实体的属性为Trajectory ID、Origin、Destination、Departure Time、Arrival Time,POI实体的属性为POI ID、Name、Type、Location,事件实体的属性为Event ID、Event Name、Type、OccurTime、Duration Time、Occur Place,实体-属性映射表如表1-3所示。
表1-3实体-属性映射表
Figure BDA0003310096330000082
Figure BDA0003310096330000091
B2、关系包括出租车和出租车之间的相似关系PSP,出租车和轨迹之间的产生关系PGT,轨迹和轨迹之间的相似关系TST,轨迹和POI之间的途经关系TVO,事件和事件之间的因果关系ECE,事件和轨迹之间的影响关系EIT,实体-关系映射表如表1-4所示。PSP的属性是Similarity,PGT的属性是Generate Time,TST的属性是Similarity,TVO的属性是Via、Arrival Time、Leave Time,ECE的属性是Causality,EIT的属性是Influence。
表1-4实体-关系映射表
实体 关系 实体
出租车 相似(PSP) 出租车
出租车 产生(PGT) 轨迹
轨迹 相似(TST) 轨迹
轨迹 途经(TV0) POI
事件 因果(ECE) 事件
事件 影响(EIT) 轨迹
通过步骤B,可以得到从轨迹数据集TR中抽取出的出租车实体、轨迹实体、POI实体和事件实体,明确了实体之间的关系和实体和关系具有的属性。
C、根据从轨迹数据集中抽取出的实体、关系,构建关系,计算属性值,完成出行事件知识图谱的构建:
C1、构建出租车和出租车之间的相似关系PSP。采用PSP的属性Similarity记录出租车之间的相似度。采用层次图匹配算法来计算出租车之间的相似度,首先采用不同的层次图来表示每辆出租车的历史GPS轨迹途经的POI序列,然后采用序列匹配(SequenceMatching)算法计算两个层次图的对应层次上图的相似性的加权和,最后可以得到出租车之间的相似度;
C2、构建出租车和轨迹之间的产生关系PGT。每辆出租车会产生多条轨迹,采用PGT的属性Generate Time记录出租车实体产生轨迹实体的时间戳,从预处理后的轨迹数据集TR中直接提取出租车出行轨迹的出发时间;
C3、构建轨迹和轨迹之间的相似关系TST。采用TST的属性Similarity记录轨迹之间的相似度,相似度采用DTW(Dynamic Time Warping)算法计算得到,计算公式如下式所示:
Figure BDA0003310096330000101
其中,head(tr)=<p1>表示GPS轨迹的第一个轨迹点,rest(tr)=<p2,...,pn>表示除第一个轨迹点外的其他所有点组成的子轨迹序列。计算得到的两条轨迹之间距离越小,轨迹间的相似度越高;
C4、构建轨迹和POI之间的途经关系TVO。根据步骤B1得到的轨迹途经的POI序列,采用TVO的属性Via记录轨迹是否途经对应的POI,如果途经,其值为1,否则,其值为0。采用TVO的属性Arrival Time和Leave Time分别记录轨迹到达和离开途经的POI的时间;
C5、构建事件和事件之间的因果关系ECE。采用ECE的属性Causality记录事件和事件之间是否存在因果关系,从出行事件候选集中,选择待标注的事件,按照事件发生的时间先后顺序,进行基于主动学习的多轮人工因果关系标注,得到事件间存在因果关系或者不存在因果关系,存在因果关系,其属性值为1,不存在因果关系,其属性值为0;
C6、构建事件和轨迹之间的影响关系EIT。采用EIT的属性Influence记录事件对轨迹的影响关系,通过遍历轨迹上的所有点到事件发生地的中心点GPS坐标的距离,找到与其距离最大的点pmax,令最大距离为lmax,比较lmax与自定义的距离阈值d的大小,如果lmax<d,则事件对轨迹有影响,其属性值为1,否则没有影响,其属性值0;
通过C步骤,利用B步骤抽取出的实体和关系,完成实体之间关系的构建以及属性值的计算,构建出行事件知识图谱。
D、利用出行事件知识图谱,进行城市区域交通拥堵溯因分析:
D1、城市区域交通拥堵检测。首先,利用基于路网的城市区域划分方法,对地图进行分割和聚类,得到不规则的城市区域。然后,从步骤C构建的出行事件知识图谱的轨迹实体中获取在指定时间范围内,从指定区域到目标区域的所有出租车轨迹数量,进而得到区域之间的出租车流量,形成区域链路流量矩阵L(行是区域链路l,列为时间步t,值为区域链路流量x)。最后,采用PCA(Principal Component Analysis)算法从区域链路流量矩阵L,挖掘区域链路流量异常。其计算公式如下,
Figure BDA0003310096330000111
Figure BDA0003310096330000112
Cvi=λivi (3)
Ax=b (4)
其中,L是区域连接流量矩阵,μ是列样本平均矩阵,C是一个t×t的矩阵,t是时间步的数量,λi是特征值,vi是特征向量,A为区域链路-路径邻接矩阵,x为路径流量向量,b为区域链路流量向量。首先,计算L和μ的差值,对L进行归一化,得到
Figure BDA0003310096330000113
如公式(1)所示。然后,通过矩阵乘法,得到协方差矩阵C,可以捕获时序关系,t是时间步的大小,可以根据分析的时间粒度要求,限定在几个小时或1天,如公式(2)所示。接着,计算C的特征分解,如公式(3)所示,将(λi,vi)特征值-特征向量对按照特征值的大小降序排列,选择前r个特征向量作为正常子空间Pn,剩余的特征向量作为异常子空间Pa,投影所有的数据点到异常子空间Pa。最后,计算这些区域链路流量x偏离均值的平方,超过设定阈值θ的区域链路,就存在异常的区域链路流量。路径和区域链路流量满足如公式(4)所示的线性关系,通过求解L1约束优化问题的解,得到哪些路径有很大可能引起区域链路的拥堵。
为了更加清晰地阐述哪些出行路径有很大可能引起区域链路的拥堵,给出了一个应用示例,如图1所示,为区域链路及出行路径图。在本例中有6条出行路径轨迹{p1,p2,p3,p4,p5,p6}经过这4个区域{R1,R2,R3,R4},p1:R1→R3→R4,p2:R2→R3→R4,p3:R1→R2→R3→R4,p4:R2→R4,p5:R1→R2→R4,p6:R3→R4。首先构建链路-路径矩阵A,A是值为{0,1}的链路-路径邻接矩阵,其中,行是区域之间的链路{l1,l2,l3,l4,l5},列是路径轨迹{p1,p2,p3,p4,p5,p6}。
Figure BDA0003310096330000121
Figure BDA0003310096330000122
然后,通过出行事件知识图谱的轨迹实体获取在指定的时间段从区域1到区域4各条边上的区域之间出租车流量,可知区域链路l2和l4超过给定的乘客流量阈值,有较大的乘客流量,造成了区域链路拥堵。可以得到相应的区域链路异常向量b=[0,1,0,1,0]T,表示区域链路l2和l4存在较大乘客流量。最后,求解L1约束优化问题的解,得到x=(0,1,0,0,0,0),因此出行路径p2有很大可能引起区域链路l2和l4的拥堵。
D2、城市区域交通拥堵原因标记,对城市区域交通拥堵产生的原因进一步从时间、空间、事件三个维度进行分析,常见的原因包括节假日(HL)、早晚高峰(DP)、区域本身的POI类型(PL)、突发事件(SE)等,原因类型及示例如表1-5、1-6、1-7、1-8所示,给区域交通拥堵路径添加上拥堵原因标记。首先,从出行事件知识图谱的轨迹实体中,抽取出行路径轨迹对应的出发时间和到达时间,并将其与表1-5和表1-6中的节假日、早晚高峰的时间段进行同时段匹配,如果其在对应的时间段内,则将节假日或早晚高峰标记HL(DP),以“键-值”对的形式,“键”为原因名,如节假日,“值”为原因类型,如除夕,纳入区域交通拥堵原因候选集合CS。然后,根据步骤B1从出行事件知识图谱得到轨迹途经的POI序列,获取出发地和到达地POI,得到其POI类型和位置,如果POI的中心坐标位置位于轨迹驻留区域地理范围内,其中,轨迹驻留区域地理范围根据步骤A2计算得到,区域本身的POI类型根据其区域中心坐标位置的周边1公里的POI类型数量最多的POI作为其POI类型,POI类型如表1-7所示,则将区域本身的POI类型PL,以“原因名-原因类型”这样的键值对形式,纳入区域交通拥堵原因候选集合CS。接着,根据出行事件知识图谱中的事件实体对轨迹实体的影响以及事件间关系,在表1-2将事件分成常规事件RE和突发事件SE,并且进行两级事件分类,分为一级事件和二级事件。其中突发事件对交通拥堵的影响将结合出行事件知识图谱进行分析,根据出行轨迹途经的POI序列,可以得到出行轨迹途经POI的时间和位置信息,将同时段发生的事件名称(Event Name)、类型(Type)、发生时间(Occur Time)、持续时间(Duration Time)、发生地点(Occur place)以键-值对的形式,“键”为事件名称,如下雨,“值”为事件属性的值,如类型、发生时间、持续时间、发生地点等纳入到区域交通拥堵候选集合CS。不同的事件的持续时间不一样,进而会影响到乘客出行花费的时间和出行路径的选择;最后,根据区域交通拥堵候选集合CS的值,给步骤D1找出的区域交通拥堵路径添加上拥堵原因标记CL。
表1-5节假日类型表
节假日类型 时间段 举例
除夕 6:00-23:00 2008年2月6日
春节 6:00-23:00 2008年2月7日
表1-6早晚高峰类型表
早晚高峰类型 时间段 举例
早高峰 6:30-9:30 2008年2月1日
晚高峰 17:00-20:00 2008年2月1日
表1-7区域本身的POI类型表
区域本身的POI类型 举例
餐饮服务 中餐厅、冷饮店
购物服务 商场、文化用品店
生活服务 美容美发店、电讯营业厅
医疗保健服务 综合医院、专科医院
住宿服务 宾馆酒店、旅馆招待所
风景名胜 公园广场、风景名胜
科教文化服务 博物馆、图书馆
交通设施服务 火车站、公交车站
金融保险服务 银行、保险公司
其他 其他不属于上述类别的POI
表1-8突发事件类型表
突发事件类型 举例
一级事件 交通拥堵
二级事件 下雨、交通事故、道路施工

Claims (1)

1.基于出行事件知识图谱的区域交通拥堵溯因方法,其特征在于,包括:
步骤1:构建出行事件知识图谱,包括:
1.1从车辆出行轨迹数据集中抽取车辆实体和轨迹实体;使用基于时间和空间距离阈值的POI抽取算法从车辆出行轨迹数据集中抽取POI实体;采用预定义事件类型的方法构建事件实体;
1.2从车辆出行轨迹数据集中抽取关系,包括:车辆实体之间的相似关系、车辆实体与轨迹实体的产生关系、轨迹实体之间的相似关系、轨迹实体与POI实体的途经关系;构建事件实体之间的因果关系、事件实体与轨迹实体的影响关系;
步骤2:利用出行事件知识图谱,进行区域交通拥堵溯因,包括:
2.1利用基于路网的区域划分方法,对地图进行分割和聚类,得到区域;
2.2从出行事件知识图谱的轨迹实体中,获取在指定时间范围内从指定区域到目标区域的所有车辆轨迹数量,得到区域之间的车辆流量,形成区域链路流量矩阵;采用PCA算法从区域链路流量矩阵挖掘出异常的区域链路流量;将异常的区域链路流量所对应的出行路径作为区域交通拥堵路径;
2.3构建区域交通拥堵原因候选集合,包括:
2.3.1从出行事件知识图谱的轨迹实体中,抽取出行路径的轨迹对应的出发时间和到达时间,并将其与节假日类型表和早晚高峰类型表的时间段进行匹配;如果其在对应的时间段内,则将节假日类型或早晚高峰类型标记纳入区域交通拥堵原因候选集合;
2.3.2从出行事件知识图谱得到轨迹途经的POI序列,获取出发地和到达地POI,得到其POI类型和位置;如果POI的中心坐标位置位于轨迹驻留区域地理范围内,则将区域本身的POI类型纳入区域交通拥堵原因候选集合;
2.3.3根据事件类型表的突发事件,结合出行事件知识图谱中的事件实体与轨迹实体的影响关系以及事件之间的因果关系,根据出行轨迹途经的POI序列,得到出行轨迹途经POI的时间和位置信息,将同时段发生的突发事件属性纳入区域交通拥堵候选集合;
2.4根据区域交通拥堵候选集合的值,给区域交通拥堵路径添加拥堵原因标记。
CN202111224111.7A 2021-10-19 2021-10-19 基于出行事件知识图谱的区域交通拥堵溯因方法 Active CN113763712B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111224111.7A CN113763712B (zh) 2021-10-19 2021-10-19 基于出行事件知识图谱的区域交通拥堵溯因方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111224111.7A CN113763712B (zh) 2021-10-19 2021-10-19 基于出行事件知识图谱的区域交通拥堵溯因方法

Publications (2)

Publication Number Publication Date
CN113763712A CN113763712A (zh) 2021-12-07
CN113763712B true CN113763712B (zh) 2022-05-10

Family

ID=78784249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111224111.7A Active CN113763712B (zh) 2021-10-19 2021-10-19 基于出行事件知识图谱的区域交通拥堵溯因方法

Country Status (1)

Country Link
CN (1) CN113763712B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115100848B (zh) * 2022-05-20 2023-08-29 同济大学 一种地面交通拥堵的出行溯源方法和系统
CN115840857B (zh) * 2023-02-22 2023-05-09 昆明理工大学 一种联合多元时空轨迹的群体行为模式挖掘方法
CN116543561B (zh) * 2023-07-06 2023-10-31 之江实验室 一种基于知识和数据双驱动的交通拥堵传播预测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160753A (zh) * 2019-12-25 2020-05-15 大连理工大学 一种基于知识图谱的路网节点重要性评估的方法
CN112182410A (zh) * 2020-11-05 2021-01-05 西南交通大学 基于时空轨迹知识图谱的用户出行模式挖掘方法
CN112215435A (zh) * 2020-11-02 2021-01-12 银江股份有限公司 一种基于循环自回归模型的城市拥堵传播模式的预测方法
WO2021004333A1 (zh) * 2019-07-08 2021-01-14 平安科技(深圳)有限公司 基于知识图谱的事件处理方法、装置、设备和存储介质
CN112530157A (zh) * 2020-10-16 2021-03-19 浙江工业大学 基于知识图谱和Conv1D-LSTM-D的道路交通拥堵传播预测方法
CN113377567A (zh) * 2021-06-28 2021-09-10 东南大学 一种基于知识图谱技术的分布式系统故障根因溯源方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021004333A1 (zh) * 2019-07-08 2021-01-14 平安科技(深圳)有限公司 基于知识图谱的事件处理方法、装置、设备和存储介质
CN111160753A (zh) * 2019-12-25 2020-05-15 大连理工大学 一种基于知识图谱的路网节点重要性评估的方法
CN112530157A (zh) * 2020-10-16 2021-03-19 浙江工业大学 基于知识图谱和Conv1D-LSTM-D的道路交通拥堵传播预测方法
CN112215435A (zh) * 2020-11-02 2021-01-12 银江股份有限公司 一种基于循环自回归模型的城市拥堵传播模式的预测方法
CN112182410A (zh) * 2020-11-05 2021-01-05 西南交通大学 基于时空轨迹知识图谱的用户出行模式挖掘方法
CN113377567A (zh) * 2021-06-28 2021-09-10 东南大学 一种基于知识图谱技术的分布式系统故障根因溯源方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Real-time Traffic Jam Detection and Congestion Reduction Using Streaming Graph Analytics;Zainab Abbas 等;《2020 IEEE International Conference on Big Data (Big Data)》;20210319;全文 *
交通状态判别综述;李甜 等;《山东交通科技》;20210225(第1期);全文 *
基于知识图谱的城市交通拥塞预测和时空传播模式挖掘研究;蔡晓;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》;20210908(第01期);第49-61页 *

Also Published As

Publication number Publication date
CN113763712A (zh) 2021-12-07

Similar Documents

Publication Publication Date Title
CN113763712B (zh) 基于出行事件知识图谱的区域交通拥堵溯因方法
Tang et al. Inferring driving trajectories based on probabilistic model from large scale taxi GPS data
US20200149914A1 (en) Method and system for utilizing a trip history
US9109914B2 (en) Energy efficient routing using an impedance factor
Li et al. Transportation mode identification with GPS trajectory data and GIS information
US20160125307A1 (en) Air quality inference using multiple data sources
Veloso et al. Sensing urban mobility with taxi flow
Liang et al. Individual travel behavior modeling of public transport passenger based on graph construction
Zhang et al. Detecting taxi travel patterns using GPS trajectory data: A case study of Beijing
Garg et al. Mining bus stops from raw GPS data of bus trajectories
Yu et al. A feature-oriented vehicle trajectory data processing scheme for data mining: A case study for Statewide truck parking behaviors
Chen et al. An analysis of movement patterns between zones using taxi GPS data
Zhang et al. A framework of abnormal behavior detection and classification based on big trajectory data for mobile networks
Yao et al. Analysis of key commuting routes based on spatiotemporal trip chain
Pincay et al. Partitioning space to identify en-route movement patterns
CN112559909B (zh) 一种基于gcn嵌入空间聚类模型的商业区发现方法
Elleuch et al. Collection and exploration of GPS based vehicle traces database
Wang et al. Congestion prediction for urban areas by spatiotemporal data mining
Pokusaev et al. Anomalies in transport data
Wu et al. Travel mode classification based on GNSS trajectories and open geospatial data
Kumar Transit Origin Destination Estimation using Automated Data
Chen et al. Where to build new public toilets? Multi-source urban data tell the truth
Wang et al. A hybrid model towards moving route prediction under data sparsity
Ye et al. A hidden Markov model combined with RFID-based sensors for accurate vehicle route prediction
MoosaviNejadDaryakenari Telematics and Contextual Data Analysis and Driving Risk Prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant