CN114238491A - 一种基于异质图的多模式交通运行态势关联规则挖掘方法 - Google Patents

一种基于异质图的多模式交通运行态势关联规则挖掘方法 Download PDF

Info

Publication number
CN114238491A
CN114238491A CN202111463044.4A CN202111463044A CN114238491A CN 114238491 A CN114238491 A CN 114238491A CN 202111463044 A CN202111463044 A CN 202111463044A CN 114238491 A CN114238491 A CN 114238491A
Authority
CN
China
Prior art keywords
space
area
traffic
data
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111463044.4A
Other languages
English (en)
Other versions
CN114238491B (zh
Inventor
王亮
周聪
於志文
谷建华
郭斌
符宁
郝红升
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN202111463044.4A priority Critical patent/CN114238491B/zh
Publication of CN114238491A publication Critical patent/CN114238491A/zh
Application granted granted Critical
Publication of CN114238491B publication Critical patent/CN114238491B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Remote Sensing (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于异质图的多模式交通运行态势关联规则挖掘方法,首先获取多模式交通系统订单数据,基于订单数据的空间分布进行层次划分,构建用于表征区域内交通态势的异质图结构;然后获取城市POI数据,统计城市各区域的POI热度概率分布,并基于聚类方法对划分方法进行功能区分类;最后设计基于分层Eclat的关联规则挖掘方法,从超节点间提取事务数据集挖掘频繁项集,得到有价值的知识,针对知识所在的超节点,对其包含的子节点进行细粒度挖掘,以全面立体地挖掘多模式交通系统间的关联规则。本发明可以全面立体地在异质图上挖掘多模式交通系统间的关联规则,避免随着挖掘粒度增加导致的数据稀疏问题,给城市交通管理提供参考依据。

Description

一种基于异质图的多模式交通运行态势关联规则挖掘方法
技术领域
本发明属于大数据处理技术领域,具体涉及一种多模式交通运行态势关联规则挖掘方法。
背景技术
交通运行态势是对交通网络系统中车辆运行状态和趋势的描述,关联规则挖掘方法通常用于从大量数据中挖掘有价值的关联规则。当今社会,居民的出行方式已经逐渐转变为多元化复合化的多模式交通出行方式。通过挖掘多模式交通系统中的交通运行模式,发现不同交通系统间的关联规则,可以为城市规划,交通管控等方面提出重要参考。关联规则挖掘方法可以描述为,已知事务数据库D,从中挖掘频繁项集fset,使得对于频繁项fseti∈fset,使得其支持度spti≥spt,其中spt表示最小支持度阈值。此外,对于频繁项集fset,提取关联规则数据集rset,使得对于rseti∈rset,rseti={Ai→Bi},使得其置信度cfdi≥cfd,其中cfd表示最小支持度阈值。传统的交通模式挖掘方法,通常基于等粒度网格结构,挖掘区域内不同交通间运行态势的关联关系。然而,在现实的复杂城市环境中,从多模式交通系统的运行态势中挖掘有价值的知识存在一些问题。首先,城市区域内交通系统间的关联关系,既受交通系统本身运行态势的影响,还受到诸多外界因素,包括时间因素,地理空间因素,区域POI分布,区域间迁移关系等因素的影响。其次,不同粒度的城市区域的交通态势的含义不同,同一区域不同粒度的交通态势可以为真实的交通状态提供互补,比如某个功能区反映城市宏观的运行模式和居民的迁移关系,具体的街道反映该区域内细粒度的关联关系和居民的出门意图。再次,等粒度的城市划分结构不利于挖掘多粒度的关联规则,因为随着网格粒度的增加,数据分布更加稀疏,更难满足最小支持度要求。
发明内容
为了克服现有技术的不足,本发明提供了一种基于异质图的多模式交通运行态势关联规则挖掘方法,首先获取多模式交通系统订单数据,基于订单数据的空间分布进行层次划分,构建用于表征区域内交通态势的异质图结构;然后获取城市POI数据,统计城市各区域的POI热度概率分布,并基于聚类方法对划分方法进行功能区分类;最后设计基于分层Eclat的关联规则挖掘方法,从超节点间提取事务数据集挖掘频繁项集,得到有价值的知识,针对知识所在的超节点,对其包含的子节点进行细粒度挖掘,以全面立体地挖掘多模式交通系统间的关联规则。本发明可以全面立体地在异质图上挖掘多模式交通系统间的关联规则,避免随着挖掘粒度增加导致的数据稀疏问题,给城市交通管理提供参考依据。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤1:获取多模式交通数据并预处理;
步骤1-1:获取城市内多模式交通系统订单数据,包括网约车、共享单车和地铁三种交通系统的订单数据;订单数据包含订单起止坐标、订单起止时间、行驶距离信息;
步骤1-2:对订单数据的格式进行预处理,将每种订单数据的坐标统一转换为WGS84编码格式,将时间统一转换为时间戳;
步骤1-3:从订单数据中提取交通签到数据,定义三种交通系统的签到数据集Sign={sign1,…,signn},其中signi=<typei,lati,lngi,timei,odi>表示第i个上下车签到点,i=1,2,…,n,n表示签到点数量;其中typei∈{′bicycle′,′wyc′,′subway′},表示交通系统类型,bicycle表示共享单车,wyc表示网约车,subway表示地铁;lati表示签到点所在纬度,lngi表示所在经度,timei表示时间戳,odi∈{′in′,′out′}表示上车点签到点或下车签到点;
步骤2:基于交通数据分布对城市空间进行层次划分;首先基于KD-Tree算法对城市空间进行初次划分,用于描述城市内区域级空间的交通态势;然后对初次划分的城市空间进行细粒度划分,用于描述城市内街道级空间的交通态势;
步骤2-1:基于KD-Tree的空间多粒度划分方法,对城市空间进行初次划分;
基于KD-Tree原理,将城市空间划分为KD-Tree叶子节点代表的离散矩形空间,使签到数据Sign在各划分空间内均匀分布;对于城市空间C,当KD-Tree深度为d1时,划分为离散空间集
Figure BDA0003390007280000021
其中
Figure BDA0003390007280000022
表示离散划分空间的数量,
Figure BDA0003390007280000023
表示城市空间C的第k个离散划分空间;k=1,2,…,n1
步骤2-2:对于每个初次划分的离散划分空间areak∈Areas,再次对其进行细粒度划分,用于表示城市内街道级区域;
对于离散划分空间areak,当KD-Tree深度为d2时,划分为离散空间集
Figure BDA0003390007280000024
Figure BDA0003390007280000025
其中
Figure BDA0003390007280000026
表示离散划分空间areak的第jk个子空间;jk=1,2,…,n2
步骤2-3:基于层次划分结果构建用于多粒度异质图结构,用于全面立体地描述城市各区域的多模式交通运行态势和交通迁移关系;
定义t时刻多模式交通系统异质图表示为Grapht={Et,SVt},其中
Figure BDA0003390007280000031
Figure BDA0003390007280000032
表示超节点集,Et={et,1,…,et,m}表示有向边集,m表示边数;超节点svt,k={CVt,k,SAt,k,areak}表示第k个超节点代表的城市空间,
Figure BDA0003390007280000033
Figure BDA0003390007280000034
表示对svt,k细粒度划分得到的子节点集合,SAt,k={wyct,k,dtt,k,dct,k},wyct,k,dct,k,dct,k分别表示t时刻三种交通系统在区域areak内的订单量;子节点
Figure BDA0003390007280000035
表示svt,k内第jk个子节点代表的城市空间,,
Figure BDA0003390007280000036
分别表示t时刻三种交通系统在区域
Figure BDA0003390007280000037
内的订单量;et,z={vt,z,start,vt,z,end,wyct,z,dtt,z,dct,z}表示第z条有向边,其中z=1,…,m,vt,z,start表示边的起点,vt,z,end表示边的终点,wyct,z、dtt,z、dct,z分别表示t时刻两节点间网约车、地铁和共享单车的订单量;
步骤3:获取POI数据,根据POI的标签归为K种POI类型;
步骤4:基于聚类方法对离散划分空间进行功能区分类;
步骤4-1:对于离散划分空间areak,使用TF-IDF算法计算离散划分空间areak内第β种POI的概率分布probβ
Figure BDA0003390007280000038
其中nβ表示离散划分空间areak内第β种POI的数量,β=1,…,K;
步骤4-2:基于TF-IDF算法,构建划分空间集Areas内的POI概率分布矩阵
Figure BDA0003390007280000039
Figure BDA00033900072800000310
使用K-means聚类方法对POI概率分布矩阵Prob进行聚类,将离散划分空间分为np种功能区;
步骤5:基于分层挖掘的多模式交通系统关联规则挖掘方法;
步骤5-1:从异质图Grapht的超节点中提取事务数据集;
筛选出所有连接超节点的边es,从每条中提取事务数据,构建事务数据集
Figure BDA00033900072800000311
Figure BDA00033900072800000312
其中lα={tα,labelα,st,labelα,end,areaα,st,areaα,end,fα,dt,fα,dc,fα,wyc}表示第α行事务数据,tα表示时刻,areaα,st表示起点区域,areaα,end表示终点区域,labelα,st表示起点区域的POI分类,labelα,end表示终点区域的POI分类,fα,dt、fα,dc、fα,wyc分别表示三种交通系统t时段在areaα,st和areaα,end之间的迁移量;α=1,2,…,nl;nl表示事务数据的行数;
步骤5-2:基于Eclat算法对事务数据集L进行模式挖掘;
Eclat算法使用垂直数据格式挖掘频繁模式,生成一个能统计每个项在哪些事务中出现的倒排表,表中的每一行由项和它对应的TID集组成,TID集包含此项目的事务的集合;初始的频繁1项集为fset1,对于频繁p项集fsetp,la∈fsetp,lb∈fsetp,若满足lt=la∪lb,且|lt|=p+1,sptt≥spt,其中sptt表示lt的支持度,spt表示最小支持度阈值,则有lt∈fsetp+1;直到
Figure BDA0003390007280000041
最终生成所有的频繁项集Fset={fset1,…,fsetP},P为最大项集长度;
步骤5-3:筛选频繁项集;
对于筛选频繁项集Nset,任意la∈Nset,都有la∈Fset,且|la|≥4;
步骤5-4:挖掘关联规则,对于关联规则s={A→B},A∈Nset,且B∈Nset,s的置信度计算为
Figure BDA0003390007280000042
如果cfds≥cfd,其中cfd表示最小置信度阈值,则该条关联规则满足可信度要求;A表示s的先导事件,B表示s的后继事件;关联规则s的含义为事件A发生可能会导致事件B,该规则的可信度为cfds
步骤5-5:针对挖掘出有价值知识的超节点,从其包含的子节点中再次提取事务数据集,重复步骤5-1到步骤5-4,对子节点所在区域进行细粒度挖掘。
优选地,所述POI类型包括餐饮服务、风景名胜、公共设施服务、公司企业、交通设施服务、汽车服务、休闲服务和住宿服务。
优选地,所述d1=6,d2=3,K=8,np=6,spt=0.01,cfd=0.1。
本发明的有益效果如下:
本发明为一种基于异质图的多模式交通运行态势关联规则挖掘方法,在多模式交通场景下,使用异质图结构描述不同粒度的多模式交通系统运行态势和迁移关系,并基于异质图进行分层次挖掘,可以全面立体地在异质图上挖掘多模式交通系统间的关联规则,避免随着挖掘粒度增加导致的数据稀疏问题,给城市交通管理提供参考依据。
附图说明
图1为本发明方法系统结构图。
图2为本发明方法中多模式交通系统的异质图结构示意图。
图3为本发明方法中分层挖掘方法的系统结构图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
一种基于异质图的多模式交通运行态势关联规则挖掘方法,包括如下步骤:
步骤1:获取多模式交通数据并预处理;
步骤1-1:获取城市内多模式交通系统订单数据,包括网约车、共享单车和地铁三种交通系统的订单数据;订单数据包含订单起止坐标、订单起止时间、行驶距离信息;
步骤1-2:对订单数据的格式进行预处理,将每种订单数据的坐标统一转换为WGS84编码格式,将时间统一转换为时间戳;
步骤1-3:从订单数据中提取交通签到数据,定义三种交通系统的签到数据集Sign={sign1,…,signn},其中signi=<typei,lati,lngi,timei,odi>表示第i个上下车签到点,i=1,2,…,n,n表示签到点数量;其中typei∈{′bicycle′,′wyc′,′subway′},表示交通系统类型,bicycle表示共享单车,wyc表示网约车,subway表示地铁;lati表示签到点所在纬度,lngi表示所在经度,timei表示时间戳,odi∈{′in′,′out′}表示上车点签到点或下车签到点;
步骤2:基于交通数据分布对城市空间进行层次划分;首先基于KD-Tree算法对城市空间进行初次划分,用于描述城市内区域级空间的交通态势;然后对初次划分的城市空间进行细粒度划分,用于描述城市内街道级空间的交通态势;
步骤2-1:基于KD-Tree的空间多粒度划分方法,对城市空间进行初次划分;
基于KD-Tree原理,将城市空间划分为KD-Tree叶子节点代表的离散矩形空间,使签到数据Sign在各划分空间内均匀分布;对于城市空间C,当KD-Tree深度为6时,划分为离散空间集Areas={area1,…,area32},其中n1=32表示离散划分空间的数量,
Figure BDA0003390007280000051
表示城市空间C的第k个离散划分空间;k=1,2,…,32;
步骤2-2:对于每个初次划分的离散划分空间areak∈Areas,再次对其进行细粒度划分,用于表示城市内街道级区域;
对于离散划分空间areak,当KD-Tree深度为3时,划分为离散空间集Areask={areak,1,…,areak,4},其中n2=4;
Figure BDA0003390007280000052
表示离散划分空间areak的第jk个子空间;jk=1,2,3,4;
步骤2-3:基于层次划分结果构建用于多粒度异质图结构,用于全面立体地描述城市各区域的多模式交通运行态势和交通迁移关系;
定义t时刻多模式交通系统异质图表示为Grapht={Et,SVt},其中SVt={svt,1,…,svt,32}表示超节点集,Et={et,1,…,et,m}表示有向边集,m表示边数;超节点svt,k={CVt,k,SAt,k,areak}表示第k个超节点代表的城市空间,CVt,k={cvt,k,1,…,cvt,k,4}表示对svt,k细粒度划分得到的子节点集合,SAt,k={wyct,k,dtt,k,dct,k},wyct,k,dtt,k,dct,k分别表示t时刻三种交通系统在区域areak内的订单量;子节点
Figure BDA0003390007280000061
表示svt,k内第jk个子节点代表的城市空间,,
Figure BDA0003390007280000062
分别表示t时刻三种交通系统在区域
Figure BDA0003390007280000063
内的订单量;et,z={vt,z,start,vt,z,end,wyct,z,dtt,z,dct,z}表示第z条有向边,其中z=1,…,m,vt,z,start表示边的起点,vt,z,end表示边的终点,wyct,z、dtt,z、dct,z分别表示t时刻两节点间网约车、地铁和共享单车的订单量;
步骤3:获取POI数据,根据POI的标签归为K种POI类型,包括餐饮服务、风景名胜、公共设施服务、公司企业、交通设施服务、汽车服务、休闲服务和住宿服务;
步骤4:基于聚类方法对离散划分空间进行功能区分类;
步骤4-1:对于离散划分空间areak,使用TF-IDF算法计算离散划分空间areak内第β种POI的概率分布probβ
Figure BDA0003390007280000064
其中nβ表示离散划分空间areak内第β种POI的数量,β=1,…,8;
步骤4-2:基于TF-IDF算法,构建划分空间集Areas内的POI概率分布矩阵Prob∈R32 ×8,使用K-means聚类方法对POI概率分布矩阵Prob进行聚类,将离散划分空间分为6种功能区;
步骤5:基于分层挖掘的多模式交通系统关联规则挖掘方法;
步骤5-1:从异质图Grapht的超节点中提取事务数据集;
筛选出所有连接超节点的边es,从每条中提取事务数据,构建事务数据集
Figure BDA0003390007280000065
Figure BDA0003390007280000066
其中lα={tα,labelα,st,labelα,end,areaα,st,areaα,end,fα,dt,fα,dc,fα,wyc}表示第α行事务数据,tα表示时刻,areaα,st表示起点区域,areaα,end表示终点区域,labelα,st表示起点区域的POI分类,labelα,end表示终点区域的POI分类,fα,dt、fα,dc、fα,wyc分别表示三种交通系统t时段在areaα,st和areaα,end之间的迁移量;α=1,2,…,nl;nl表示事务数据的行数;
步骤5-2:基于Eclat算法对事务数据集L进行模式挖掘;
Eclat算法使用垂直数据格式挖掘频繁模式,生成一个能统计每个项在哪些事务中出现的倒排表,表中的每一行由项和它对应的TID集组成,TID集包含此项目的事务的集合;初始的频繁1项集为fset1,对于频繁p项集fsetp,la∈fsetp,lb∈fsetp,若满足lt=la∪lb,且|lt|=p+1,sptt≥spt,其中sptt表示lt的支持度,spt=0.01表示最小支持度阈值,则有lt∈fsetp+1;直到
Figure BDA0003390007280000071
最终生成所有的频繁项集Fset={fset1,…,fsetP},P为最大项集长度;
步骤5-3:筛选频繁项集;
对于筛选频繁项集Nset,任意la∈Nset,都有la∈Fset,且|la|≥4;
步骤5-4:挖掘关联规则,对于关联规则s={s→B},A∈Nset,且B∈Nset,s的置信度计算为
Figure BDA0003390007280000072
如果cfds≥cfd,其中cfd=0.1表示最小置信度阈值,则该条关联规则满足可信度要求;A表示s的先导事件,B表示s的后继事件;关联规则s的含义为事件A发生可能会导致事件B,该规则的可信度为cfds
步骤5-5:针对挖掘出有价值知识的超节点,从其包含的子节点中再次提取事务数据集,重复步骤5-1到步骤5-4,对子节点所在区域进行细粒度挖掘。

Claims (3)

1.一种基于异质图的多模式交通运行态势关联规则挖掘方法,其特征在于,包括如下步骤:
步骤1:获取多模式交通数据并预处理;
步骤1-1:获取城市内多模式交通系统订单数据,包括网约车、共享单车和地铁三种交通系统的订单数据;订单数据包含订单起止坐标、订单起止时间、行驶距离信息;
步骤1-2:对订单数据的格式进行预处理,将每种订单数据的坐标统一转换为WGS84编码格式,将时间统一转换为时间戳;
步骤1-3:从订单数据中提取交通签到数据,定义三种交通系统的签到数据集Sign={sign1,...,signn},其中signi=<typei,lati,lngi,timei,odi>表示第i个上下车签到点,i=1,2,...,n,n表示签到点数量;其中typei∈{′bicycle′,′wyc′,′subway′},表示交通系统类型,bicycle表示共享单车,wyc表示网约车,subway表示地铁;lati表示签到点所在纬度,lngi表示所在经度,timei表示时间戳,odi∈{′in′,′out′}表示上车点签到点或下车签到点;
步骤2:基于交通数据分布对城市空间进行层次划分;首先基于KD-Tree算法对城市空间进行初次划分,用于描述城市内区域级空间的交通态势;然后对初次划分的城市空间进行细粒度划分,用于描述城市内街道级空间的交通态势;
步骤2-1:基于KD-Tree的空间多粒度划分方法,对城市空间进行初次划分;
基于KD-Tree原理,将城市空间划分为KD-Tree叶子节点代表的离散矩形空间,使签到数据Sign在各划分空间内均匀分布;对于城市空间C,当KD-Tree深度为d1时,划分为离散空间集
Figure FDA0003390007270000011
其中
Figure FDA0003390007270000012
表示离散划分空间的数量,
Figure FDA0003390007270000013
表示城市空间C的第k个离散划分空间;k=1,2,...,n1
步骤2-2:对于每个初次划分的离散划分空间areak∈Areas,再次对其进行细粒度划分,用于表示城市内街道级区域;
对于离散划分空间areak,当KD-Tree深度为d2时,划分为离散空间集
Figure FDA0003390007270000014
Figure FDA0003390007270000015
其中
Figure FDA0003390007270000016
Figure FDA0003390007270000017
表示离散划分空间areak的第jk个子空间;jk=1,2,...,n2
步骤2-3:基于层次划分结果构建用于多粒度异质图结构,用于全面立体地描述城市各区域的多模式交通运行态势和交通迁移关系;
定义t时刻多模式交通系统异质图表示为Grapht={Et,SVt},其中
Figure FDA0003390007270000021
Figure FDA0003390007270000022
表示超节点集,Et={et,1,...,et,m}表示有向边集,m表示边数;超节点svt,k={CVt,k,SAt,k,areak}表示第k个超节点代表的城市空间,
Figure FDA0003390007270000023
Figure FDA0003390007270000024
表示对svt,k细粒度划分得到的子节点集合,SAt,k={wyct,k,dtt,k,dct,k},wyct,k,dtt,k,dct,k分别表示t时刻三种交通系统在区域areak内的订单量;子节点
Figure FDA0003390007270000025
表示svt,k内第jk个子节点代表的城市空间,,
Figure FDA0003390007270000026
Figure FDA0003390007270000027
分别表示t时刻三种交通系统在区域
Figure FDA0003390007270000028
内的订单量;et,z={vt,z,stdrt,vt,z,end,wyct,z,dtt,z,dct,z}表示第z条有向边,其中z=1,...,m,vt,z,stdrt表示边的起点,vt,z,end表示边的终点,wyct,z、dtt,z、dct,z分别表示t时刻两节点间网约车、地铁和共享单车的订单量;
步骤3:获取POI数据,根据POI的标签归为K种POI类型;
步骤4:基于聚类方法对离散划分空间进行功能区分类;
步骤4-1:对于离散划分空间areak,使用TF-IDF算法计算离散划分空间areak内第β种POI的概率分布probβ
Figure FDA0003390007270000029
其中nβ表示离散划分空间areak内第β种POI的数量,β=1,...,K;
步骤4-2:基于TF-IDF算法,构建划分空间集Areas内的POI概率分布矩阵
Figure FDA00033900072700000210
Figure FDA00033900072700000211
使用K-means聚类方法对POI概率分布矩阵Prob进行聚类,将离散划分空间分为np种功能区;
步骤5:基于分层挖掘的多模式交通系统关联规则挖掘方法;
步骤5-1:从异质图Grapht的超节点中提取事务数据集;
筛选出所有连接超节点的边es,从每条中提取事务数据,构建事务数据集
Figure FDA00033900072700000212
Figure FDA00033900072700000213
其中lα={tα,labelα,st,labelα,end,areaα,st,areaα,end,fα,dt,fα,dc,fα,wyc}表示第α行事务数据,tα表示时刻,areaα,st表示起点区域,areaα,end表示终点区域,labelα,st表示起点区域的POI分类,labelα,end表示终点区域的POI分类,fα,dt、fα,dc、fα,wyc分别表示三种交通系统t时段在areaα,st和areaα,end之间的迁移量;α=1,2,...,nl;nl表示事务数据的行数;
步骤5-2:基于Eclat算法对事务数据集L进行模式挖掘;
Eclat算法使用垂直数据格式挖掘频繁模式,生成一个能统计每个项在哪些事务中出现的倒排表,表中的每一行由项和它对应的TID集组成,TID集包含此项目的事务的集合;初始的频繁1项集为fset1,对于频繁p项集fsetp,ld∈fsetp,lb∈fsetp,若满足lt=la∪lb,且|lt|=p+1,sptt≥spt,其中sptt表示lt的支持度,spt表示最小支持度阈值,则有lt∈fsetp+1;直到
Figure FDA0003390007270000031
最终生成所有的频繁项集Fset={fset1,...,fsetP},P为最大项集长度;
步骤5-3:筛选频繁项集;
对于筛选频繁项集Nset,任意la∈Nset,都有la∈Fset,且|la|≥4;
步骤5-4:挖掘关联规则,对于关联规则s={A→B},A∈Nset,且B∈Nset,s的置信度计算为
Figure FDA0003390007270000032
如果cfds≥cfd,其中cfd表示最小置信度阈值,则该条关联规则满足可信度要求;A表示s的先导事件,B表示s的后继事件;关联规则s的含义为事件A发生可能会导致事件B,该规则的可信度为cfds
步骤5-5:针对挖掘出有价值知识的超节点,从其包含的子节点中再次提取事务数据集,重复步骤5-1到步骤5-4,对子节点所在区域进行细粒度挖掘。
2.根据权利要求1所述的一种基于异质图的多模式交通运行态势关联规则挖掘方法,其特征在于,所述POI类型包括餐饮服务、风景名胜、公共设施服务、公司企业、交通设施服务、汽车服务、休闲服务和住宿服务。
3.根据权利要求1所述的一种基于异质图的多模式交通运行态势关联规则挖掘方法,其特征在于,所述d1=6,d2=3,K=8,np=6,spt=0.01,cfd=0.1。
CN202111463044.4A 2021-12-02 2021-12-02 一种基于异质图的多模式交通运行态势关联规则挖掘方法 Active CN114238491B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111463044.4A CN114238491B (zh) 2021-12-02 2021-12-02 一种基于异质图的多模式交通运行态势关联规则挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111463044.4A CN114238491B (zh) 2021-12-02 2021-12-02 一种基于异质图的多模式交通运行态势关联规则挖掘方法

Publications (2)

Publication Number Publication Date
CN114238491A true CN114238491A (zh) 2022-03-25
CN114238491B CN114238491B (zh) 2024-02-13

Family

ID=80752839

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111463044.4A Active CN114238491B (zh) 2021-12-02 2021-12-02 一种基于异质图的多模式交通运行态势关联规则挖掘方法

Country Status (1)

Country Link
CN (1) CN114238491B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117745035A (zh) * 2024-02-07 2024-03-22 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) 区域治理策略的生成方法、装置、计算机设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609107A (zh) * 2017-09-13 2018-01-19 大连理工大学 一种基于多源城市数据的出行共现现象可视化分析方法
WO2019041628A1 (zh) * 2017-08-30 2019-03-07 哈尔滨工业大学深圳研究生院 基于Eclat的多元时间序列关联规则挖掘方法
CN112241425A (zh) * 2020-11-03 2021-01-19 亿景智联(北京)科技有限公司 一种基于时空聚类的在线广告投放区域热点挖掘算法
CN113240265A (zh) * 2021-05-11 2021-08-10 西北工业大学 一种基于多模式交通数据的城市空间划分方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019041628A1 (zh) * 2017-08-30 2019-03-07 哈尔滨工业大学深圳研究生院 基于Eclat的多元时间序列关联规则挖掘方法
CN107609107A (zh) * 2017-09-13 2018-01-19 大连理工大学 一种基于多源城市数据的出行共现现象可视化分析方法
CN112241425A (zh) * 2020-11-03 2021-01-19 亿景智联(北京)科技有限公司 一种基于时空聚类的在线广告投放区域热点挖掘算法
CN113240265A (zh) * 2021-05-11 2021-08-10 西北工业大学 一种基于多模式交通数据的城市空间划分方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王玲;李树林;徐培培;孟建瑶;彭开香;: "基于频繁项集树的时态关联规则挖掘算法", 控制与决策, no. 04 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117745035A (zh) * 2024-02-07 2024-03-22 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) 区域治理策略的生成方法、装置、计算机设备和存储介质
CN117745035B (zh) * 2024-02-07 2024-05-28 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) 区域治理策略的生成方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN114238491B (zh) 2024-02-13

Similar Documents

Publication Publication Date Title
Tong et al. The simpler the better: a unified approach to predicting original taxi demands based on large-scale online platforms
Jia et al. Review of urban transportation network design problems based on CiteSpace
Psaraki et al. Access mode choice for relocated airports: the new Athens International Airport
CN108388970B (zh) 一种基于gis的公交站点选址方法
CN113763700B (zh) 信息处理方法、装置、计算机设备及存储介质
Liang et al. Individual travel behavior modeling of public transport passenger based on graph construction
Martínez et al. Formulating a new express minibus service design problem as a clustering problem
Zhou et al. Research on traffic situation analysis for urban road network through spatiotemporal data mining: a case study of Xi’an, China
CN110472999B (zh) 基于地铁和共享单车数据的客流模式分析方法及装置
Jiang et al. CrowdPatrol: A mobile crowdsensing framework for traffic violation hotspot patrolling
Shu et al. Data-driven shuttle service design for sustainable last mile transportation
CN110459050B (zh) 一种基于混合决策树的短期公交客流预测方法
Ma et al. Investigating the impact of spatial-temporal grid size on the microscopic forecasting of the inflow and outflow gap in a free-floating bike-sharing system
CN113240265B (zh) 一种基于多模式交通数据的城市空间划分方法
CN114238491A (zh) 一种基于异质图的多模式交通运行态势关联规则挖掘方法
CN112559909B (zh) 一种基于gcn嵌入空间聚类模型的商业区发现方法
Yun et al. Taxi cab service optimization using spatio-temporal implementation to hot-spot analysis with taxi trajectories: a case study in Seoul, Korea
CN111008730B (zh) 基于城市空间结构的人群聚集度预测模型构建方法及装置
Li et al. An efficient matching method for dispatching autonomous vehicles
Kong et al. Charging pile siting recommendations via the fusion of points of interest and vehicle trajectories
Hwang et al. Travel time prediction by weighted fusion of probing vehicles and vehicle detectors data sources
Nasiboglu et al. Origin-destination matrix generation using smart card data: Case study for Izmir
Akin et al. Modeling the change of urban spatial structure: Use interzonal travel data to estimate urban growth and expansion by hierarchical cluster analyses
Albalawneh et al. Evaluation of Using Genetic Algorithm and ArcGIS for Determining the Optimal‐Time Path in the Optimization of Vehicle Routing Applications
Lan et al. Inferring alighting bus stops from smart card data combined with cellular signaling data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant