CN112182410A - 基于时空轨迹知识图谱的用户出行模式挖掘方法 - Google Patents

基于时空轨迹知识图谱的用户出行模式挖掘方法 Download PDF

Info

Publication number
CN112182410A
CN112182410A CN202011219876.7A CN202011219876A CN112182410A CN 112182410 A CN112182410 A CN 112182410A CN 202011219876 A CN202011219876 A CN 202011219876A CN 112182410 A CN112182410 A CN 112182410A
Authority
CN
China
Prior art keywords
track
user
entity
poi
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011219876.7A
Other languages
English (en)
Other versions
CN112182410B (zh
Inventor
李天瑞
毛慧慧
谢鹏
杜圣东
尹恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Jiaotong University
Original Assignee
Southwest Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Jiaotong University filed Critical Southwest Jiaotong University
Priority to CN202011219876.7A priority Critical patent/CN112182410B/zh
Publication of CN112182410A publication Critical patent/CN112182410A/zh
Application granted granted Critical
Publication of CN112182410B publication Critical patent/CN112182410B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于时空轨迹知识图谱的用户出行模式挖掘方法,包括步骤:从轨迹数据集T中抽取用户实体、轨迹实体和POI实体;从轨迹数据集T中抽取时间和空间信息;构建以用户为中心的时空轨迹知识图谱;根据以用户为中心的时空轨迹知识图谱挖掘用户的出行模式或群体出行模式。本发明的有益效果在于,可对用户出行模式进行动态挖掘,通过挖掘单个用户在指定时间段内的频繁轨迹序列获取个体的动态出行模式,通过挖掘相似用户构成的群体在指定时间段内的频繁轨迹序列获取群体动态出行模式。其中,时空轨迹知识图谱构建能够动态表征用户的轨迹信息,简洁高效地完成轨迹信息的融合和更新,实现用户实体、轨迹实体、POI实体的动态添加和查询。

Description

基于时空轨迹知识图谱的用户出行模式挖掘方法
技术领域
本发明涉及轨迹大数据领域和知识图谱领域,特别是基于时空轨迹知识图谱的用户出行模式挖掘方法。
背景技术
GPS、GSM等位置获取技术的普及使得人们可以方便地使用时空数据记录他们访问过的位置历史信息,这些数据刻画了个体和群体的时空动态出行特征。随着与个人相关的大量时空轨迹数据的可用性不断增加,从这些轨迹中发现有价值的知识变得充满了机遇和挑战。
知识图谱是一项正在蓬勃发展的可用于知识整合和知识挖掘的热门技术,最早被应用于搜索引擎领域。由于具备良好的可解释性、可扩展性以及可动态更新融合的特性,知识图谱逐渐被引入到数据量巨大、数据获取频率快、数据获取方式多样的轨迹数据挖掘领域。
目前,知识图谱在轨迹数据中的应用较少。使用轨迹数据构建的知识图谱通常都会结合静态的路网数据,主要用于交通拥堵溯因、事故检测、城市路径规划等城市交通问题。大多数用轨迹数据构建的知识图谱都是根据具体应用针对某个局部区域构建的,主要利用知识图谱的图结构属性结合深度学习技术完成指定任务。但是,知识图谱在轨迹数据中的应用不应该仅仅局限于此。利用知识图谱的实体、关系、属性三元组能够很好地表征用户和轨迹之间的关系,可用于动态挖掘用户的出行模式,解决轨迹数据的异构问题和频繁更新问题。基于以用户为中心的时空轨迹知识图谱来挖掘用户出行模式的方法,能够充分利用异构的轨迹数据,挖掘用户最新的出行模式。
(1)基于轨迹数据构建知识图谱
参考文献1“Understanding People Lifestyles:Construction of UrbanMovement Knowledge Graph from GPS Trajectory”(Zhuang C,Yuan N J,Song R,et al,IJCAI.pp.3616-3623,August.2017)是基于轨迹数据构建的城市移动知识图谱。该知识图谱由位置实体以及位置实体之间的相互依赖关系构成,其中位置指的是对指定区域进行自定义网格划分后得到的网格单元。在构建时,同时从时间、空间以及时间-空间这三个角度分析观测到的GPS轨迹点,用抽取出的时空信息确定位置间的相互依赖程度。该方法利用知识图谱表达轨迹数据中的时空信息,能够对城市位置的依赖程度进行有效观测,但是其适用范围窄,能够实现的功能单一。
参考文献2“轨迹图谱:一种基于知识图谱结构的轨迹信息抽取方法”(吴瑕,赵小明,余建坤,计算机应用研究,Vol.37,No.11,pp.1-5,Feb.2020)提出了一种基于轨迹数据的知识图谱构建方法,首次用知识图谱表征完整的轨迹信息。使用该方法构建的轨迹知识图谱中包含的实体有用户实体、轨迹实体、地物实体,包含的关系是这三类实体两两之间产生的空间关系、时间关系、地理关系。该方法尝试用知识图谱取代原始轨迹信息,但是增加了轨迹知识图谱的复杂度,并且缺乏应用针对性。
(2)轨迹模式挖掘方法
参考文献3“Wherenext:a location predictor on trajectory patternmining”(Monreale A,Pinelli F,Trasarti R,et al.Proceedings of the 15th ACMSIGKDD international conference on Knowledge discovery and datamining.pp.637-646,June.2009)使用一种计算时间注释的顺序模式算法获取频繁轨迹序列。在顺序模式中,每个转换都用源数据派生的典型转换时间进行注释。进行频繁序列模式挖掘之前,需要将原始数据处理成T(s,α)数据对的形式,其中s代表原始数据,α代表时间标注。该算法的时间标注处理过程繁琐,使用固定的时间标注使得算法的灵活性较差。参考文献4“Finding time period-based most frequent path in big trajectory data”(LuoW,Tan H,Chen L,et al.Proceedings of the 2013ACM SIGMOD internationalconference on management of data.pp.713-724,2013)提出了一种使用足迹图挖掘基于时间周期的最频繁路径的方法。足迹图的构建较为困难,而且每次更新都需要扫描所有的轨迹。以上两种频繁轨迹挖掘方法都对原始轨迹信息做了较为复杂的预处理,并且实现轨迹信息更新较为困难。
发明内容
本发明的目的是提供基于时空轨迹知识图谱的用户出行模式挖掘方法。
实现本发明目的的技术方案是:
基于时空轨迹知识图谱的用户出行模式挖掘方法,包括:
步骤一:从轨迹数据集T中直接抽取用户实体和轨迹实体;使用基于时间阈值和距离阈值的POI抽取算法从轨迹数据集T中抽取POI实体;抽取出的POI实体按照时间顺序排列,得到轨迹途经的POI序列;
步骤二:从轨迹数据集T中抽取时间和空间信息,包括:
2.1抽取时间信息;所述时间信息包括时刻信息和时间序列信息;其中,时刻信息包括轨迹的起始时间和结束时间,以及轨迹到达POI的时间和离开POI的时间;从轨迹途经的POI序列中获取时间序列信息,即轨迹经过POI的顺序;
2.2抽取空间信息;所述空间信息是以POI为中心描绘轨迹的地理位置信息;从POI实体中获取轨迹途经的POI的数量和轨迹途经的POI,从轨迹数据集T
中获取轨迹的实际长度;
步骤三:构建以用户为中心的时空轨迹知识图谱,包括:
3.1使用基于层次图的历史轨迹匹配算法计算用户之间的相似度,构建用户实体和用户实体之间的双向相似关系USU;
3.2构建用户实体和轨迹实体的产生关系UPT;
3.3使用DTW算法获取轨迹间的相似度,构建轨迹实体和轨迹实体之间的双向相似关系TST;
3.4构建轨迹实体和POI实体的途经关系TCP;
步骤四:根据以用户为中心的时空轨迹知识图谱挖掘用户的出行模式,即使用SPADE算法获取单个用户的频繁轨迹序列,挖掘个体出行模式。
可替换的技术方案为,所述步骤四替换为:将轨迹数据集T使用谱聚类算法完成用户聚类,然后用SPADE算法获取用户集的频繁轨迹序列,挖掘群体出行模式。
本发明的有益效果在于,可对用户出行模式进行动态挖掘,通过挖掘单个用户在指定时间段内的频繁轨迹序列获取个体的动态出行模式,通过挖掘相似用户构成的群体在指定时间段内的频繁轨迹序列获取群体动态出行模式。其中,时空轨迹知识图谱构建能够动态表征用户的轨迹信息,简洁高效地完成轨迹信息的融合和更新,实现用户实体、轨迹实体、POI实体的动态添加和查询,适用于处理更新速度较快的用户轨迹信息。
具体实施方式
本发明的实施例,其步骤如下:
A、预处理GPS轨迹数据集GeoLife 1.3,该数据集包括182个子文件夹,每个子文件夹存储一位用户产生的所有轨迹文件,每个轨迹文件代表该用户的一条轨迹,轨迹文件中每一行数据记录了一个GPS点的经度、纬度、时间戳。轨迹数据预处理的步骤如下所示:
A1、轨迹噪声过滤。采用基于速度的启发式方法完成轨迹噪声过滤,若轨迹点的速度大于速度阈值,则该轨迹点是噪声点,将其从原始轨迹数据中移除。其中轨迹点的速度由该轨迹点到下一个轨迹点的距离和时间通过速度公式计算得到,速度阈值根据经验自定义,通常取轨迹的平均速度;
A2、轨迹分段。采用同时考虑时间信息和空间信息的轨迹分段方法,根据前后轨迹点的距离和时间间隔进行轨迹分段,这主要是为了解决用户产生轨迹数据的过程中出现的GPS信号消失的问题。若两点之间的时间间隔大于自定义的时间阈值且距离大于自定义的距离阈值,则在此处将轨迹分成两段。在Geolife1.3数据集中,时间阈值是GPS轨迹点的采样间隔时间——5秒钟,距离阈值由A1中定义的速度阈值和两个轨迹点之间的时间间隔计算得到。轨迹分段后每个轨迹段都构成一条新的轨迹;
A3、轨迹压缩。采用基于MDL(Minimal Description Length)原则的特征点抽取算法(ATP)实现轨迹压缩。从步骤A2得到的轨迹数据中抽取出轨迹特征点,用轨迹特征点取代原始轨迹点,去除轨迹数据中的冗余信息,完成轨迹压缩;
A4、路网匹配。使用基于拓扑信息和权重机制的算法进行路网匹配,该算法由InitialMapping()算法和Map()算法构成。先用InitialMapping()算法查找初始匹配,定位用户在网络中的位置,然后用Map()算法进行拓扑分析,将GPS轨迹点匹配到具体的路段中。路网匹配的目的是提高GPS轨迹点的精确度,所以匹配完成后需用匹配到路段中的轨迹点代替原始的轨迹点。
通过步骤A,最终可获得精确度高、冗余度低的可用性更强的轨迹数据集T,其数据的组织结构和原始轨迹的Geolife轨迹数据集相同。
B、抽取实体和关系:
B1、实体包括用户实体、轨迹实体以及POI(Point of Interest)实体。从通过A步骤预处理后的轨迹数据集T中直接获取用户实体和轨迹实体,该数据集中的每个子文件夹对应一个用户实体,子文件夹中的每个轨迹文件对应一个轨迹实体。使用基于时间阈值(TT)和距离阈值(DT)的POI抽取算法(SPD,Stay Point Detection)获取POI实体,抽取出的POI按照时间顺序排列,得到轨迹途经的POI序列,其中TT和DT根据经验自定义,取TT=5分钟,DT=200米时抽取效果较好。用户实体的属性为:User ID、Trajectory Number;轨迹实体的属性为:Trajectory ID、Length、Arrive Time、Time Span;POI实体的属性为:POI ID、Name、GPS;
B2、关系包括用户和用户之间的相似关系USU、用户和轨迹之间的产生关系UPT、轨迹和轨迹之间的相似关系TST以及轨迹和POI的途经关系TCP。USU的属性是Similarity,UPT的属性是Produce Time,TST的属性是Similarity,TCP的属性是Sequence、Arrive Time、Leave Time;
通过步骤B,最终可获得从轨迹数据集T中抽取出的用户实体、轨迹实体以及POI实体,明确了实体之间的关系以及实体和关系具有的属性。
C、抽取轨迹数据集中的时间和空间信息:
C1、从轨迹数据集T中抽取时间信息,其中时间信息包括时刻信息和时间序列信息。从T中获取时刻信息:轨迹的起始时间和结束时间以及轨迹到达POI的时间和离开POI的时间。从步骤B1得到的每条轨迹的POI序列中获取时间序列信息,即轨迹经过POI的顺序,决定了TCP关系的Sequence属性的取值;
C2、从轨迹数据集T中获取空间信息,其中空间信息指的是以POI为中心描绘轨迹的地理位置信息。从步骤B1得到的每条轨迹的POI中获取轨迹途经的POI的数量和轨迹途经的POI,从T中获取轨迹的实际长度;
通过C步骤,最终可从轨迹数据集T中抽取出轨迹的时间信息和空间信息,为后续搭建时空轨迹知识图谱做准备。
D、根据实体、关系以及抽取出的时空信息,完成以用户为中心的时空轨迹知识图谱的构建:
D1、构建用户和用户之间的双向相似关系USU。使用USU的属性Similarity记录用户之间的相似度,使用基于层次图的历史轨迹匹配算法计算Similarity。Similarity的计算包括两个部分,首先使用LHE(Location History Extraction)算法,根据所有用户产生的轨迹途经的POI构成的POI集合和单个用户产生的轨迹途经POI的顺序搭建单个用户的历史轨迹层次图,然后使用SM(Sequence Matching)算法在两个用户的历史轨迹层次图中进行序列匹配,获取用户间的相似度;
D2、构建用户和轨迹的产生关系UPT。每位用户产生多条轨迹,使用UPT的属性Produce Time记录用户实体产生轨迹实体的时间,即轨迹数据中的第一个GPS轨迹点的时间戳;
D3、构建轨迹和轨迹之间的双向相似关系TST。使用TST的属性Similarity记录轨迹之间的相似度,使用同时考虑了轨迹的时间信息和空间信息的DTW算法获取轨迹间的相似度。设T1=<p1,p2,…,pm>和T2=<q1,q2,…,qn>,其中m>1,n>1,分别表示轨迹T1和轨迹T2的GPS轨迹点,其中pi=(xi,yi),xi代表GPS轨迹点pi的经度,yi代表GPS轨迹点pi的纬度,轨迹T1由m个GPS轨迹点组成,轨迹T2由n个GPS轨迹点组成。两条轨迹的相似度计算公式如公式(1)和公式(2)所示,公式(2)中的i代表轨迹T1的第i个GPS轨迹点,j代表轨迹T2的第j个GPS轨迹点,||·||代表两点坐标的欧式距离。使用DTW算法计算得到两条轨迹之间的距离,距离越小,轨迹之间的相似度越高;
DTW(T1,T2)=f(m,n) (1)
Figure BDA0002761626560000071
D4、构建轨迹和POI的途经关系TCP,构建过程以步骤B1得到的轨迹途经的POI构成的POI序列为基础。每条轨迹中至少途经两个POI,即起点POI和终点POI。使用TCP的属性Sequence记录轨迹途经POI的顺序,轨迹实体与其第一个途经的POI实体之间的关系TCP的属性Sequence=1,使用TCP的属性Arrive Time和Leave Time分别记录轨迹到达和离开其所途经的某个POI的时间。
通过D步骤,最终可利用步骤B和步骤C中抽取出的实体以及实体之间的关系完成时空轨迹知识图谱的搭建。
E、根据以用户为中心的时空轨迹知识图谱挖掘用户的出行模式:
E1、使用SPADE(Sequential Pattern Discovery Use Equivalence Class)算法获取单个用户的频繁轨迹序列,挖掘个体出行模式;
获取指定用户在指定时间范围内的所有轨迹,时间范围>1周为宜,从步骤D构建的时间轨迹知识图谱中获取每条轨迹的POI序列,构成轨迹序列集合S,用SPADE算法获取集合S中的频繁轨迹序列。在该应用场景中,SPADE算法的输入是集合S和自定义的最小支持度minsup,输出的是频繁轨迹序列,即频繁的POI序列。
为了更清晰的阐述在该应用场景中如何使用SPADE算法,下面给出了在该应用场景中将原始序列数据转换成垂直存储方式的方法。给轨迹序列集合S中的所有序列分配序列ID,标记为AID。轨迹序列是由其途径的POI按途经顺序构成的POI序列,将轨迹途经POI的顺序标记为TID。SPADE算法在计算频繁1-序列时,将原始序列数据转换成以POI项为单位的垂直存储形式。表2-1展示了一个POI项的垂直存储方式,其中AID是集合S中途经清华大学这个POI的轨迹序列的ID,TID是清华大学这个POI在其对应AID中的途经顺序。如下:
表2-1清华大学在1-序列筛选过程中的垂直存储方式
Figure BDA0002761626560000091
E2、获取相似用户群体在指定时间范围内的频繁轨迹序列,挖掘用户群体的出行模式。该步骤与步骤E1是并列关系,步骤E1面向单个用户挖掘个体出行模式,本步骤面向用户群挖掘群体出行模式。具体实施方式如下所示:
首先,使用基于图论的谱聚类算法,根据时空轨迹知识图谱中用户实体之间的相似度完成用户聚类,获得用户集U:
在用本发明提出的方法构建的时空轨迹知识图谱中,用户实体之间通过具有Similarity属性的USU关系相互连接,可以看作已知节点间权重的无向全连接图G(V,E),其中V代表图G中的所有结点,对应知识图谱中的用户实体,E代表图G中的所有边,对应知识图谱中的USU关系,E上的权重值就是Similarity属性的值,谱聚类中的邻接矩阵可以由图G直接获得;
用Ncut方法将图G切成k个子图,每个子图中的用户实体为一个簇,构成一个用户集U。图G的切图目标是使子图内的点权重和高,子图间的点权重和低。Ncut方法通过最小化子图和图G中其他结点的权重和,由公式(3)定义,以及最大化子图自身包含的所有结点的权重和,由公式(4)定义,获取图G的最优切割,完成用户聚类。其中U1,U2,…Uk分别为图G中k个子图所包含结点的集合,它们满足
Figure BDA0002761626560000092
且U1∪U2∪…∪Uk=V;
Figure BDA0002761626560000093
是Ui的补集,即V中除去Ui子集后的结点集合;对于任意两个子图中结点的集合
Figure BDA0002761626560000094
我们定义A和B之间的切图权重如公式(5)所示,式中wij代表A集合中的i结点和B集合中的j结点之间的权重;vol(Ui)代表子图Ui的权重和;
Figure BDA0002761626560000101
Figure BDA0002761626560000102
Figure BDA0002761626560000103
然后,获取用户集U中包含的所有用户在指定时间范围内的所有轨迹,一条轨迹对应一个POI序列,所有轨迹的POI序列构成轨迹序列集合S;
最后,用步骤E1中定义的SPADE算法获取轨迹序列S中的频繁轨迹序列,挖掘用户群体的出行模式。

Claims (2)

1.基于时空轨迹知识图谱的用户出行模式挖掘方法,其特征在于,包括:
步骤一:从轨迹数据集T中直接抽取用户实体和轨迹实体;使用基于时间阈值和距离阈值的POI抽取算法从轨迹数据集T中抽取POI实体;抽取出的POI实体按照时间顺序排列,得到轨迹途经的POI序列;
步骤二:从轨迹数据集T中抽取时间和空间信息,包括:
2.1抽取时间信息;所述时间信息包括时刻信息和时间序列信息;其中,时刻信息包括轨迹的起始时间和结束时间,以及轨迹到达POI的时间和离开POI的时间;从轨迹途经的POI序列中获取时间序列信息,即轨迹经过POI的顺序;
2.2抽取空间信息;所述空间信息是以POI为中心描绘轨迹的地理位置信息;从POI实体中获取轨迹途经的POI的数量和轨迹途经的POI,从轨迹数据集T中获取轨迹的实际长度;
步骤三:构建以用户为中心的时空轨迹知识图谱,包括:
3.1使用基于层次图的历史轨迹匹配算法计算用户之间的相似度,构建用户实体和用户实体之间的双向相似关系USU;
3.2构建用户实体和轨迹实体的产生关系UPT;
3.3使用DTW算法获取轨迹间的相似度,构建轨迹实体和轨迹实体之间的双向相似关系TST;
3.4构建轨迹实体和POI实体的途经关系TCP;
步骤四:根据以用户为中心的时空轨迹知识图谱挖掘用户的出行模式,即使用SPADE算法获取单个用户的频繁轨迹序列,挖掘个体出行模式。
2.如权利要求1所述的基于时空轨迹知识图谱的用户出行模式挖掘方法,其特征在于,所述步骤四替换为:将轨迹数据集T使用谱聚类算法完成用户聚类,然后用SPADE算法获取用户集的频繁轨迹序列,挖掘群体出行模式。
CN202011219876.7A 2020-11-05 2020-11-05 基于时空轨迹知识图谱的用户出行模式挖掘方法 Active CN112182410B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011219876.7A CN112182410B (zh) 2020-11-05 2020-11-05 基于时空轨迹知识图谱的用户出行模式挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011219876.7A CN112182410B (zh) 2020-11-05 2020-11-05 基于时空轨迹知识图谱的用户出行模式挖掘方法

Publications (2)

Publication Number Publication Date
CN112182410A true CN112182410A (zh) 2021-01-05
CN112182410B CN112182410B (zh) 2023-04-21

Family

ID=73917759

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011219876.7A Active CN112182410B (zh) 2020-11-05 2020-11-05 基于时空轨迹知识图谱的用户出行模式挖掘方法

Country Status (1)

Country Link
CN (1) CN112182410B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112683286A (zh) * 2021-03-16 2021-04-20 季华实验室 拓扑路网地图的建立方法、系统、存储介质及电子设备
CN113408640A (zh) * 2021-06-30 2021-09-17 电子科技大学 一种顾及多维语义的移动对象时空轨迹聚类方法
CN113641832A (zh) * 2021-08-16 2021-11-12 中国科学院空天信息创新研究院 基于知识图谱面向多源离散数据的林火救援路径规划方法
CN113688332A (zh) * 2021-10-22 2021-11-23 北京数业专攻科技有限公司 基于频繁模式的轨迹重建方法及装置
CN113763712A (zh) * 2021-10-19 2021-12-07 西南交通大学 基于出行事件知识图谱的区域交通拥堵溯因方法
CN113836446A (zh) * 2021-09-23 2021-12-24 北京百度网讯科技有限公司 出行信息的向量化表示方法及装置
CN113837028A (zh) * 2021-09-03 2021-12-24 广州大学 一种基于时空知识图谱的道路流量分析方法和装置
CN114064922A (zh) * 2021-11-18 2022-02-18 西南交通大学 一种基于第三方云平台的服务价值链多链知识图谱构建方法
CN114543796A (zh) * 2022-02-14 2022-05-27 国网电力科学研究院有限公司 一种室外定位方法、系统及存储介质
CN114996586A (zh) * 2022-07-15 2022-09-02 湖南师范大学 一种基于时空大数据的个性化出行路径生成方法及系统
CN115344707A (zh) * 2022-08-01 2022-11-15 南京航空航天大学 一种城市交通知识图谱构建方法
CN115840857A (zh) * 2023-02-22 2023-03-24 昆明理工大学 一种联合多元时空轨迹的群体行为模式挖掘方法

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914563A (zh) * 2014-04-18 2014-07-09 中国科学院上海微系统与信息技术研究所 一种时空轨迹的模式挖掘方法
WO2014143974A1 (en) * 2013-03-15 2014-09-18 Bio-Tree Systems, Inc. Methods and system for linking geometry obtained from images
WO2016169192A1 (zh) * 2015-04-24 2016-10-27 百度在线网络技术(北京)有限公司 用户相似度确定方法和装置
CN106600960A (zh) * 2016-12-22 2017-04-26 西南交通大学 基于时空聚类分析算法的交通出行起讫点识别方法
CN107016126A (zh) * 2017-05-12 2017-08-04 西南交通大学 一种基于序列模式挖掘的多用户模型移动轨迹预测方法
CN107679661A (zh) * 2017-09-30 2018-02-09 桂林电子科技大学 一种基于知识图谱的个性化旅游路线规划方法
DE102017223856A1 (de) * 2017-01-23 2018-07-26 Hyundai Motor Company Dialogsystem, Fahrzeug mit diesem und Dialogverarbeitungsverfahren
CN108509434A (zh) * 2017-02-23 2018-09-07 中国移动通信有限公司研究院 一种群体用户的挖掘方法及装置
CN109918395A (zh) * 2019-02-19 2019-06-21 北京明略软件系统有限公司 一种群体挖掘方法及装置
CN110413707A (zh) * 2019-07-22 2019-11-05 百融云创科技股份有限公司 互联网中欺诈团伙关系的挖掘与排查方法及其系统
CN110533240A (zh) * 2019-08-26 2019-12-03 西南交通大学 基于轨迹数据的自行车道线网规划方法
CN111160753A (zh) * 2019-12-25 2020-05-15 大连理工大学 一种基于知识图谱的路网节点重要性评估的方法
CN111367902A (zh) * 2020-02-28 2020-07-03 重庆邮电大学 一种基于od数据的轨迹可视分析方法
CN111444243A (zh) * 2020-03-31 2020-07-24 北京信息科技大学 一种基于轨迹信息的用户行为预测画像方法及系统

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014143974A1 (en) * 2013-03-15 2014-09-18 Bio-Tree Systems, Inc. Methods and system for linking geometry obtained from images
CN103914563A (zh) * 2014-04-18 2014-07-09 中国科学院上海微系统与信息技术研究所 一种时空轨迹的模式挖掘方法
WO2016169192A1 (zh) * 2015-04-24 2016-10-27 百度在线网络技术(北京)有限公司 用户相似度确定方法和装置
CN106600960A (zh) * 2016-12-22 2017-04-26 西南交通大学 基于时空聚类分析算法的交通出行起讫点识别方法
DE102017223856A1 (de) * 2017-01-23 2018-07-26 Hyundai Motor Company Dialogsystem, Fahrzeug mit diesem und Dialogverarbeitungsverfahren
CN108509434A (zh) * 2017-02-23 2018-09-07 中国移动通信有限公司研究院 一种群体用户的挖掘方法及装置
CN107016126A (zh) * 2017-05-12 2017-08-04 西南交通大学 一种基于序列模式挖掘的多用户模型移动轨迹预测方法
CN107679661A (zh) * 2017-09-30 2018-02-09 桂林电子科技大学 一种基于知识图谱的个性化旅游路线规划方法
CN109918395A (zh) * 2019-02-19 2019-06-21 北京明略软件系统有限公司 一种群体挖掘方法及装置
CN110413707A (zh) * 2019-07-22 2019-11-05 百融云创科技股份有限公司 互联网中欺诈团伙关系的挖掘与排查方法及其系统
CN110533240A (zh) * 2019-08-26 2019-12-03 西南交通大学 基于轨迹数据的自行车道线网规划方法
CN111160753A (zh) * 2019-12-25 2020-05-15 大连理工大学 一种基于知识图谱的路网节点重要性评估的方法
CN111367902A (zh) * 2020-02-28 2020-07-03 重庆邮电大学 一种基于od数据的轨迹可视分析方法
CN111444243A (zh) * 2020-03-31 2020-07-24 北京信息科技大学 一种基于轨迹信息的用户行为预测画像方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHIH-CHIEH HUNG等: "Clustering and aggregating clues of trajectories for mining trajectory patterns and routes" *
MAZUMDAR, P等: "An approach to compute user similarity for GPS applications" *
赵斌;韩晶晶;史覃覃;吉根林;刘信陶;俞肇元;: "语义轨迹建模与挖掘研究进展" *
黎丹雨;陈怡华;: "一种多层多维的关联规则挖掘算法在推荐系统中的应用" *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112683286A (zh) * 2021-03-16 2021-04-20 季华实验室 拓扑路网地图的建立方法、系统、存储介质及电子设备
CN113408640A (zh) * 2021-06-30 2021-09-17 电子科技大学 一种顾及多维语义的移动对象时空轨迹聚类方法
CN113641832A (zh) * 2021-08-16 2021-11-12 中国科学院空天信息创新研究院 基于知识图谱面向多源离散数据的林火救援路径规划方法
CN113837028B (zh) * 2021-09-03 2024-05-14 广州大学 一种基于时空知识图谱的道路流量分析方法和装置
CN113837028A (zh) * 2021-09-03 2021-12-24 广州大学 一种基于时空知识图谱的道路流量分析方法和装置
CN113836446B (zh) * 2021-09-23 2024-04-30 北京百度网讯科技有限公司 出行信息的向量化表示方法及装置
CN113836446A (zh) * 2021-09-23 2021-12-24 北京百度网讯科技有限公司 出行信息的向量化表示方法及装置
CN113763712B (zh) * 2021-10-19 2022-05-10 西南交通大学 基于出行事件知识图谱的区域交通拥堵溯因方法
CN113763712A (zh) * 2021-10-19 2021-12-07 西南交通大学 基于出行事件知识图谱的区域交通拥堵溯因方法
CN113688332B (zh) * 2021-10-22 2022-02-15 北京数业专攻科技有限公司 基于频繁模式的轨迹重建方法及装置
CN113688332A (zh) * 2021-10-22 2021-11-23 北京数业专攻科技有限公司 基于频繁模式的轨迹重建方法及装置
CN114064922A (zh) * 2021-11-18 2022-02-18 西南交通大学 一种基于第三方云平台的服务价值链多链知识图谱构建方法
CN114064922B (zh) * 2021-11-18 2023-07-14 西南交通大学 一种基于第三方云平台的服务价值链多链知识图谱构建方法
CN114543796A (zh) * 2022-02-14 2022-05-27 国网电力科学研究院有限公司 一种室外定位方法、系统及存储介质
CN114543796B (zh) * 2022-02-14 2023-09-08 国网电力科学研究院有限公司 一种室外定位方法、系统及存储介质
CN114996586B (zh) * 2022-07-15 2022-11-04 湖南师范大学 一种基于时空大数据的个性化出行路径生成方法及系统
CN114996586A (zh) * 2022-07-15 2022-09-02 湖南师范大学 一种基于时空大数据的个性化出行路径生成方法及系统
CN115344707A (zh) * 2022-08-01 2022-11-15 南京航空航天大学 一种城市交通知识图谱构建方法
CN115344707B (zh) * 2022-08-01 2023-10-24 南京航空航天大学 一种城市交通知识图谱构建方法
CN115840857A (zh) * 2023-02-22 2023-03-24 昆明理工大学 一种联合多元时空轨迹的群体行为模式挖掘方法
CN115840857B (zh) * 2023-02-22 2023-05-09 昆明理工大学 一种联合多元时空轨迹的群体行为模式挖掘方法

Also Published As

Publication number Publication date
CN112182410B (zh) 2023-04-21

Similar Documents

Publication Publication Date Title
CN112182410B (zh) 基于时空轨迹知识图谱的用户出行模式挖掘方法
Chen et al. Map-matching algorithm for large-scale low-frequency floating car data
Han et al. Neat: Road network aware trajectory clustering
US9904932B2 (en) Analyzing semantic places and related data from a plurality of location data reports
CN109948701B (zh) 一种基于轨迹间时空关联性的数据聚类方法
CN106570062B (zh) 一种路网轨迹不确定移动对象范围查询系统及方法
CN107092638A (zh) 基于位置从地图历史提供相关元素信息的方法和计算装置
CN106156528A (zh) 一种轨迹数据停留识别方法及系统
Huang et al. Frequent pattern-based map-matching on low sampling rate trajectories
Ali et al. The maximum trajectory coverage query in spatial databases
CN107291963B (zh) 一种路网移动环境下的knn查询方法及系统
Ghosh et al. Traj-cloud: a trajectory cloud for enabling efficient mobility services
Lee et al. Crowd-sourced carpool recommendation based on simple and efficient trajectory grouping
CN113611115B (zh) 一种基于路网敏感特征的车辆轨迹聚类方法
Dai et al. Context-based moving object trajectory uncertainty reduction and ranking in road network
CN106682168B (zh) 一种跨域城市数据可视查询系统的构建方法
CN110232067B (zh) 一种基于BHR-Tree索引的共乘群体发现方法
Li et al. TORD problem and its solution based on big trajectories data
Cai et al. The mining of urban hotspots based on multi-source location data fusion
Ghosh et al. Movcloud: A cloud-enabled framework to analyse movement behaviors
Yu et al. RePiDeM: A refined POI demand modeling based on multi-source data
Dewan et al. Som-tc: Self-organizing map for hierarchical trajectory clustering
Liu et al. Mining method based on semantic trajectory frequent pattern
Huang et al. Continuous within query in road networks
Elleuch et al. Collection and exploration of GPS based vehicle traces database

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant