CN111651484B - 基于语义轨迹相似度移动对象伴随关系的分析方法和装置 - Google Patents

基于语义轨迹相似度移动对象伴随关系的分析方法和装置 Download PDF

Info

Publication number
CN111651484B
CN111651484B CN202010445749.2A CN202010445749A CN111651484B CN 111651484 B CN111651484 B CN 111651484B CN 202010445749 A CN202010445749 A CN 202010445749A CN 111651484 B CN111651484 B CN 111651484B
Authority
CN
China
Prior art keywords
seq
moving objects
accompanying
sequence
stop point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010445749.2A
Other languages
English (en)
Other versions
CN111651484A (zh
Inventor
杨慧
郭鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN202010445749.2A priority Critical patent/CN111651484B/zh
Publication of CN111651484A publication Critical patent/CN111651484A/zh
Application granted granted Critical
Publication of CN111651484B publication Critical patent/CN111651484B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/22Processing or transfer of terminal data, e.g. status or physical capabilities
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Remote Sensing (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于语义轨迹相似度移动对象伴随关系的分析方法和装置,属于信息技术领域。包括:在目标场景内的不同语义停留点设置采集器;采集目标场景内各个移动对象手机的WiFi数据,其包含了该移动对象手机的MAC地址和时间戳;基于每个MAC地址的信息,生成移动对象的语义轨迹序列;计算两个移动对象的语义轨迹序列的最长公共停留点序列和最长公共路径序列;计算两个移动对象的最长公共停留点的分数和最长公共路径的分数;基于上述两个分数计算伴随分数。本发明通过在计算伴随分数时分别对不同停留点、不同路径以及不同日期赋予不同的权重,从而更为准确地实现两两用户之间伴随行为关系的挖掘。

Description

基于语义轨迹相似度移动对象伴随关系的分析方法和装置
技术领域
本发明属于信息技术领域,更具体地,涉及基于语义轨迹相似度移动对象伴随关系的分析方法和装置。
背景技术
移动对象的伴随模式挖掘是指找到在给定时间段内,经常同时出现在某些地点的对象集合。移动对象的伴随模式挖掘在智慧城市与城市安全、基于地理位置的用户行为分析中有广阔的应用场景:在城市道路监控摄像头捕捉到的车辆过路信息数据集中挖掘伴随车辆,可以协助公安队伍寻找团伙犯罪的嫌疑车辆;在手机基站接入信息数据集中挖掘伴随人群,可以协助移动运营商分析用户的时空特性,进行基站的规划与建设;在社交网络地点签到数据集中挖掘伴随用户,可以协助社交软件进行好友、兴趣点等多维度的推荐,也可以提供拼团服务。
上述移动对象的伴随模式挖掘应用主要有以下两个新的特点:1)、对象(车辆、人群、用户等)在时间维度上密集地连续分布,但空间维度上则是离散分布(道路摄像头、手机基站、商铺等),这与传统的野生动物迁徙轨迹分析等轨迹相似性分析应用中,对象时空信息由安装的GPS传感器定期传输,也即时间离散、空间连续的特点完全不同;2)、数据量大,且中间结果冗余度高。
传统的伴随模式使用GPS轨迹数据进行挖掘,GPS轨迹稠密并且具体,不含有语义信息,并且传统方法使用的轨迹相似度算法的时间复杂度较高。
发明内容
针对现有技术由于GPS轨迹数据稠密且不含语义信息,以及传统的轨迹相似度算法复杂度高的缺陷和改进需求,本发明提供了一种基于语义轨迹相似度移动对象伴随关系的分析方法和装置,其目的在于基于语义轨迹的相似度挖掘移动对象的伴随行为,提高伴随行为挖掘算法的效率。
为实现上述目的,按照本发明的第一方面,提供了一种基于语义轨迹相似度移动对象伴随关系的分析方法,该方法包括以下步骤:
S1.在目标场景内的不同语义停留点设置采集器,不同停留点赋不同的伴随权重,不同路径赋不同的伴随权重;
S2.采集器采集目标场景内各个移动对象携带手机的WiFi数据,所述WiFi数据包含了该移动对象手机的MAC地址和时间戳;
S3.基于每个MAC地址的信息,生成该MAC地址对应的移动对象的语义轨迹序列;
S4.计算两个移动对象的语义轨迹序列的最长公共停留点序列和最长公共路径序列;
S5.基于最长公共停留点序列和停留点伴随权重,计算两个移动对象的最长公共停留点的分数,基于最长公共路径序列和路径伴随权重,计算两个移动对象的最长公共路径的分数;
S6.基于两个移动对象的最长公共停留点的分数和最长公共路径的分数,计算伴随分数。
优选地,该方法在步骤S2和S3之间,还包括:对WiFi数据进行以下预处理:
(1)按照IEEE802.11规范去除WiFi数据集中的伪MAC地址;
(2)将只出现在一个停留点的无效MAC地址的数据去除。
优选地,移动对象A的语义轨迹序列表示为:
UserA.seq=[(ArrT1)a1(LevT1),(ArrT2)a2(LevT2),...,(ArrTi)ai(LevTi),...]
其中,ai∈L,L是用户A的停留点的集合,ArrTi和LevTi分别是移动对象进入ai的时间戳以及离开ai的时间戳。
优选地,步骤S4包括以下步骤:
S41.判断两个移动对象的语义轨迹序列seq1和seq2中是否包含长度大于等于m的相同停留点子序列,若是,进入步骤S42,否则,认为两个移动对象没有伴随关系,结束分析;
S42.对于相同停留点子序列中的每一个停留点,判断是否至少满足以下一个条件:①两个移动对象同时出现在该停留点;②两个移动对象同时离开该停留点,若是,则将该停留点加入最长公共子序列LCA(seq1,seq2),否则,不加入LCA(seq1,seq2);
S43.对于LCA(seq1,seq2)中的每一个停留点,判断是否同时满足:①两个移动对象同时到达该停留点;②两个移动对象同时离开该停留点,若是,则将该停留点加入最长公共停留点序列LCL(seq1,seq2),否则,不加入LCL(seq1,seq2);对于LCA中的每两个相邻停留点,判断是否满足两个移动对象同时离开一个停留点并且同时到达相邻停留点,则将这段路径加入最长公共路径序列LCP(seq1,seq2),否则,不加入LCP(seq1,seq2)。
优选地,如果两个移动对象在停留点的出现时间的差值小于预设时间阈值,则认为两个移动对象同时进入该停留点;如果两个移动对象在停留点的离开时间的差值小于预设时间阈值,则认为两个移动对象同时离开该停留点。
优选地,步骤S5包括以下步骤:
S51.计算LCL序列中出现的所有停留点的伴随权重之和,将其作为两个移动对象的最长公共停留点的分数SWL(seq1,seq2);
S52.基于LCP序列中出现的所有路径的伴随权重之和,将其作为两个移动对象的最长公共路径的分数SWP(seq1,seq2)。
优选地,将SWL(seq1,seq2)和SWP(seq1,seq2)的和作为两个移动对象一天的伴随分数SWA(seq1,seq2)。
优选地,对于活动具有周期性的移动对象,两个移动对象一个活动周期T内的伴随分数计算公式如下:
Figure BDA0002504519330000041
其中,βk为第k个活动模式的伴随权重,Dk为第k个活动模式的持续天数,K为活动周期T内的活动模式数量,T=D1+…Dk+…DK
为实现上述目的,按照本发明的第二方面,提供了一种基于语义轨迹相似度移动对象伴随关系的分析装置,所述分析装置包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的分析程序,所述分析程序被所述处理器执行时实现如第一方面所述的基于语义轨迹相似度移动对象伴随关系的分析方法的步骤。
总体而言,通过本发明所构思的以上技术方案,能够取得以下有益效果:
本发明通过在不同语义轨迹停留点设置WiFi数据采集器收集移动对象的时空轨迹数据,将移动对象的时空轨迹数据转换为语义轨迹序列,挖掘出移动对象之间同时出现的语义停留点和路径,并对其赋予不同权重,计算两两移动对象之间的伴随分数,挖掘其是否存在伴随行为关系。由于具有伴随关系的移动对象的行为轨迹中有较多的重合部分,即具有伴随行为的两个移动对象会同时出现在同一停留点以及转移路径,且不同人群密度的语义停留点,不同人流量的路径,不同活动模式的日期对伴随行为挖掘有不同的影响,因此在计算伴随分数时分别对不同停留点、不同路径以及不同日期赋予不同的权重,从而能够更为准确地实现移动对象之间伴随行为关系的挖掘。
附图说明
图1为本发明实施例提供的一种基于语义轨迹相似度移动对象伴随关系的分析方法流程图;
图2为本发明实施例提供的WiFi数据采集过程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
如图1所示,本发明公开了一种基于语义轨迹相似度移动对象伴随关系的分析方法,该方法包括以下步骤:
步骤S1.在目标场景内的不同语义停留点设置采集器,不同停留点赋不同的伴随权重,不同路径赋不同的伴随权重。
本实施例中,所述目标场景为校园,所述移动对象为学生。本实施例采用WiFi探针采集校园内学生的时空轨迹数据,根据校园内不同语义停留点收集到的轨迹数据,提出不同停留点、不同路径以及不同日期应具有不同的伴随权重。人群密集程度越低的停留点,赋予该停留点的伴随权重越大;人流量越小的路径,赋予该路径的伴随权重越大。
在校学生每天的活动比较单一,只能在校内如食堂、教学楼、宿舍楼等楼宇停留或者进行转移,这些楼宇不仅是学生经常停留的轨迹点,同时可以反映学生的具体活动,具有一定的语义信息,如食堂对应着学生的用餐行为,因此将这些轨迹点称为语义轨迹点。
步骤S2.采集器采集目标场景内各个移动对象携带手机的WiFi数据,所述WiFi数据包含了该移动对象手机的MAC地址和时间戳。
如图2所示,本实施例中,在学校内学生日常出入的语义轨迹点处布置WiFi探针,可以收集到携带智能手机的学生的WiFi数据,并将其上传到服务器,WiFi数据中包含了学生手机的MAC地址以及时间戳等信息,学生在校园楼宇中进行转移,便可以采集到在校学生的时空轨迹信息。
WiFi探针收集到的WiFi数据样例如表1所示,设备ID为采集设备的id,可以唯一标识采集设备,手机类型为手机品牌,手机MAC能够唯一标识一个携带此智能手机的用户,热点MAC和热点名称为用户手机正在连接的AP的MAC地址及其名称,距离为手机到采集设备的距离,最后更新时间为采集到此条WiFi数据的时间。
Figure BDA0002504519330000061
表1
步骤S3.基于每个MAC地址的信息,生成该MAC地址对应的移动对象的语义轨迹序列。
MAC地址具有唯一性,因此一条MAC地址的信息对应这校园中一位学生的时空轨迹信息。
优选地,移动对象A的语义轨迹序列表示为:
UserA.seq=[(ArrT1)a1(LevT1),(ArrT2)a2(LevT2),...,(ArrTi)ai(LevTi),...]
其中,ai∈L,L是用户A的停留点的集合,ArrTi和LevTi分别是移动对象进入ai的时间戳以及离开ai的时间戳。
优选地,该方法在步骤S2和S3之间,还包括:对WiFi数据进行以下预处理:
(1)按照IEEE802.11规范去除WiFi数据集中的伪MAC地址。
某些手机厂商为了完善手机的安全机制,在手机没有连上AP(Acess Point)时,WiFi数据中暴露的MAC地址不是手机的真实MAC地址,而是随机发出的伪MAC地址,可以根据按照IEEE802.11规范去除WiFi数据集中的伪MAC地址。
(2)将只出现在一个停留点的无效MAC地址的数据去除。
WiFi数据集中存在不能代表移动对象携带设备的MAC地址,比如安装WiFi模块的电脑以及大型网络设备(交换机等)等非移动设备,通过对比不同楼宇的数据集,将只出现在一个数据集的无效MAC地址的数据去除。
步骤S4.计算两个移动对象的语义轨迹序列的最长公共停留点序列和最长公共路径序列。
对学生A和学生B的语义轨迹序列进行轨迹相似度计算,根据上述生成两个学生的语义轨迹序列:
seq1=[(ArrT1)a1(LevT1),(ArrT2)a2(LevT2),...,(ArrTi)ai(LevTi),...,(ArrTm)am(LevTm)]
seq2=[(ArrT1’)b1(LevT1’),(ArrT2’)b2(LevT2’),...,(ArrTi’)bi(LevTi’),...,(ArrTn’)bn(LevTn’)]
根据位置判定条件以及时间判定条件,得到两个学生语义轨迹序列的最长公共子序列LCA(seq1,seq2)。从最长公共子序列可以得到最长公共停留点序列LCL(seq1,seq2)和最长公共路径序列LCP(seq1,seq2)。
位置判定条件:
Figure BDA0002504519330000071
如果ai=bj,则判定两个用户共同在语义停留点ai处出现。为了降低时间复杂度,本发明设定一个阈值m,如果两名用户的语义轨迹序列中包含长度大于等于m的相同停留点的子序列,再进行时间判定条件。
时间判定条件:在停留点ai处,给定预先设定的时间阈值tth,如果|ArrTj’-ArrTi|≤tth,即用户A和用户B在语义停留点ai处的出现时间之差小于时间阈值,则认为用户A和用户B同时进入ai;如果|LevTj’-LevTi|≤tth,同理,本发明认为用户A和用户B同时离开ai;如果同时满足|ArrTj’-ArrTi|≤tth且|LevTj’-LevTi|≤tth,则认为用户A和用户B同时出现并离开停留点ai。
优选地,步骤S4包括以下步骤:
S41.判断两个移动对象的语义轨迹序列seq1和seq2中是否包含长度大于等于m的相同停留点子序列,若是,进入步骤S42,否则,认为两个移动对象没有伴随关系,结束分析。
本实施例中,m设为4。
S42.对于相同停留点子序列中的每一个停留点,判断是否至少满足以下一个条件:①两个移动对象同时出现在该停留点;②两个移动对象同时离开该停留点,若是,则将该停留点加入最长公共子序列LCA(seq1,seq2),否则,不加入LCA(seq1,seq2)。
S43.对于LCA(seq1,seq2)中的每一个停留点,判断是否同时满足:①两个移动对象同时到达该停留点;②两个移动对象同时离开该停留点,若是,则将该停留点加入最长公共停留点序列LCL(seq1,seq2),否则,不加入LCL(seq1,seq2);对于LCA中的每两个相邻停留点,判断是否满足两个移动对象同时离开一个停留点并且同时到达相邻停留点,则将这段路径加入最长公共路径序列LCP(seq1,seq2),否则,不加入LCP(seq1,seq2)。
优选地,如果两个移动对象在停留点的出现时间的差值小于预设时间阈值,则认为两个移动对象同时进入该停留点;如果两个移动对象在停留点的离开时间的差值小于预设时间阈值,则认为两个移动对象同时离开该停留点。
本实施例中,预设时间阈值tth设为2分钟。
步骤S5.基于最长公共停留点序列和停留点伴随权重,计算两个移动对象的最长公共停留点的分数,基于最长公共路径序列和路径伴随权重,计算两个移动对象的最长公共路径的分数。
优选地,步骤S5包括以下步骤:
S51.计算LCL序列中出现的所有停留点的伴随权重之和,将其作为两个移动对象的最长公共停留点的分数SWL(seq1,seq2)。
不同停留点具有不同的伴随权重,将LCL序列中出现的所有停留点的伴随权重之和作为两个移动对象的最长公共停留点的分数,能够反映这两个移动对象同时出现在同一停留点的程度,表示这两个移动对象在LCL序列中的所有停留点中存在着伴随行为。
S52.基于LCP序列中出现的所有路径的伴随权重之和,将其作为两个移动对象的最长公共路径的分数SWP(seq1,seq2)。
不同路径具有不同的伴随权重,将LCP序列中出现的所有路径的伴随权重之和作为两个移动对象的最长公共路径的分数,能够反映这两个移动对象同时出现在同一转移路径的程度,表示这两个移动对象在LCL序列的所有路径中存在着伴随行为。
步骤S6.基于两个移动对象的最长公共停留点的分数和最长公共路径的分数,计算伴随分数。
优选地,将SWL(seq1,seq2)和SWP(seq1,seq2)的和作为两个移动对象一天的伴随分数。
SWA(seq1,seq2)=SWP(seq1,seq2)+SWL(seq1,seq2)
优选地,对于活动具有周期性的移动对象,两个移动对象一个活动周期T内的伴随分数计算公式如下:
Figure BDA0002504519330000091
其中,βk为第k个活动模式的伴随权重,Dk为第k个活动模式的持续天数,K为活动周期T内的活动模式数量,T=D1+…Dk+…DK。当某一活动模式的持续天数在活动周期所占比例越小,赋予该日期的伴随权重越大。
在大学校园内学生的活动具有周期性,且周期为一周。本实施例给工作日的伴随分数赋予较低的权重,给休息日的伴随分数赋予较高的权重,即:
Figure BDA0002504519330000101
其中,SWAWeekDay为工作日的伴随分数,SWAWeekend为休息日的伴随分数,β1是工作日的伴随权重,β2是休息日中伴随权重。
更进一步地,使用社交关系网络图将计算得到的伴随分数可视化。本发明对社交网络进行定义:用伴随分数作为权值的无向图定义为社交网络图G(V,E,W),其中,V是节点的集合;E是边的集合,E={<u,v>|u,v∈V},<u,v>表示节点u和节点v之间有一条边连接;W是权值的集合,肛{wij∈Rand<i,j>∈E}。
下面对本发明中社交网络的组成部分进行详细的介绍:
节点集合V:MAC地址是唯一的,本发明将收集到的MAC地址作为移动对象的唯一标识,因此,本发明使用移动对象的MAC地址的集合作为社交网络的节点。
边集合E:对于社交网络图中的每一个节点,将其语义轨迹进行提取并根据STS-AB(Semantic Trajectory Similarity for Adjoint Behavior)算法计算用户之间的伴随分数,对伴随分数设置阈值,当伴随分数大于设定的阈值时,用一条边将两个节点相连,表示这两个用户之间有存在伴随行为。本实施例中,阈值设为70。
权重值集合W:对于社交网络图中的任意一对节点,通过STS-AB算法得到伴随分数后,用伴随分数作为两个节点之间的边的权重值。权重值越大,表明两个用户之间的存在伴随行为越多,值越小,表示两个用户之间伴随行为越少。
对应地,本发明还公开了一种基于语义轨迹相似度移动对象伴随关系的分析装置,所述分析装置包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的分析程序,所述分析程序被所述处理器执行时实现如上述基于语义轨迹相似度移动对象伴随关系的分析方法的步骤。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于语义轨迹相似度移动对象伴随关系的分析方法,其特征在于,该方法包括以下步骤:
S1.在目标场景内的不同语义停留点设置采集器,不同停留点赋不同的伴随权重,不同路径赋不同的伴随权重;
S2.采集器采集目标场景内各个移动对象携带手机的WiFi数据,所述WiFi数据包含了该移动对象手机的MAC地址和时间戳;
S3.基于每个MAC地址的信息,生成该MAC地址对应的移动对象的语义轨迹序列;
S4.计算两个移动对象的语义轨迹序列的最长公共停留点序列和最长公共路径序列;
S5.基于最长公共停留点序列和停留点伴随权重,计算两个移动对象的最长公共停留点的分数,基于最长公共路径序列和路径伴随权重,计算两个移动对象的最长公共路径的分数;
S6.基于两个移动对象的最长公共停留点的分数和最长公共路径的分数,计算伴随分数。
2.如权利要求1所述的方法,其特征在于,该方法在步骤S2和S3之间,还包括:对WiFi数据进行以下预处理:
(1)按照IEEE802.11规范去除WiFi数据集中的伪MAC地址;
(2)将只出现在一个停留点的无效MAC地址的数据去除。
3.如权利要求1或2所述的方法,其特征在于,移动对象A的语义轨迹序列表示为:
UserA.seq=[(ArrT1)a1(LevT1),(ArrT2)a2(LevT2),…,(ArrTi)ai(LevTi),…]
其中,ai∈L,L是用户A的停留点的集合,ArrTi和LevTi分别是移动对象进入ai的时间戳以及离开ai的时间戳。
4.如权利要求1至3任一项所述的方法,其特征在于,步骤S4包括以下步骤:
S41.判断两个移动对象的语义轨迹序列seq1和seq2中是否包含长度大于等于m的相同停留点子序列,若是,进入步骤S42,否则,认为两个移动对象没有伴随关系,结束分析;
S42.对于相同停留点子序列中的每一个停留点,判断是否至少满足以下一个条件:①两个移动对象同时出现在该停留点;②两个移动对象同时离开该停留点,若是,则将该停留点加入最长公共子序列LCA(seq1,seq2),否则,不加入LCA(seq1,seq2);
S43.对于LCA(seq1,seq2)中的每一个停留点,判断是否同时满足:①两个移动对象同时到达该停留点;②两个移动对象同时离开该停留点,若是,则将该停留点加入最长公共停留点序列LCL(seq1,seq2),否则,不加入LCL(seq1,seq2);对于LCA中的每两个相邻停留点,判断是否满足两个移动对象同时离开一个停留点并且同时到达相邻停留点,则将这段路径加入最长公共路径序列LCP(seq1,seq2),否则,不加入LCP(seq1,seq2)。
5.如权利要求4所述的方法,其特征在于,如果两个移动对象在停留点的出现时间的差值小于预设时间阈值,则认为两个移动对象同时进入该停留点;如果两个移动对象在停留点的离开时间的差值小于预设时间阈值,则认为两个移动对象同时离开该停留点。
6.如权利要求4或5所述的方法,其特征在于,步骤S5包括以下步骤:
S51.计算LCL序列中出现的所有停留点的伴随权重之和,将其作为两个移动对象的最长公共停留点的分数SWL(seq1,seq2);
S52.基于LCP序列中出现的所有路径的伴随权重之和,将其作为两个移动对象的最长公共路径的分数SWP(seq1,seq2)。
7.如权利要求6所述的方法,其特征在于,将SWL(seq1,seq2)和SWP(seq1,seq2)的和作为两个移动对象一天的伴随分数SWA(seq1,seq2)。
8.如权利要求7所述的方法,其特征在于,对于活动具有周期性的移动对象,两个移动对象一个活动周期T内的伴随分数计算公式如下:
Figure FDA0002504519320000031
其中,βk为第k个活动模式的伴随权重,Dk为第k个活动模式的持续天数,K为活动周期T内的活动模式数量,T=D1+…Dk+…DK
9.一种基于语义轨迹相似度移动对象伴随关系的分析装置,其特征在于,所述分析装置包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的分析程序,所述分析程序被所述处理器执行时实现如权利要求1至8任一项所述的基于语义轨迹相似度移动对象伴随关系的分析方法的步骤。
CN202010445749.2A 2020-05-22 2020-05-22 基于语义轨迹相似度移动对象伴随关系的分析方法和装置 Active CN111651484B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010445749.2A CN111651484B (zh) 2020-05-22 2020-05-22 基于语义轨迹相似度移动对象伴随关系的分析方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010445749.2A CN111651484B (zh) 2020-05-22 2020-05-22 基于语义轨迹相似度移动对象伴随关系的分析方法和装置

Publications (2)

Publication Number Publication Date
CN111651484A CN111651484A (zh) 2020-09-11
CN111651484B true CN111651484B (zh) 2023-03-28

Family

ID=72346662

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010445749.2A Active CN111651484B (zh) 2020-05-22 2020-05-22 基于语义轨迹相似度移动对象伴随关系的分析方法和装置

Country Status (1)

Country Link
CN (1) CN111651484B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114511816A (zh) * 2020-11-16 2022-05-17 杭州海康威视系统技术有限公司 数据处理方法、装置、电子设备及机器可读存储介质
CN112907385A (zh) * 2021-02-23 2021-06-04 深圳市广信安科技股份有限公司 社会关系分析方法、终端设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109657547A (zh) * 2018-11-13 2019-04-19 成都四方伟业软件股份有限公司 一种基于伴随模型的异常轨迹分析方法
CN109828967A (zh) * 2018-12-03 2019-05-31 深圳市北斗智能科技有限公司 一种伴随关系获取方法、系统、设备、存储介质
CN109947793A (zh) * 2019-03-20 2019-06-28 深圳市北斗智能科技有限公司 伴随关系的分析方法、装置和存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106033510B (zh) * 2015-03-13 2018-12-21 阿里巴巴集团控股有限公司 一种用户设备识别方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109657547A (zh) * 2018-11-13 2019-04-19 成都四方伟业软件股份有限公司 一种基于伴随模型的异常轨迹分析方法
CN109828967A (zh) * 2018-12-03 2019-05-31 深圳市北斗智能科技有限公司 一种伴随关系获取方法、系统、设备、存储介质
CN109947793A (zh) * 2019-03-20 2019-06-28 深圳市北斗智能科技有限公司 伴随关系的分析方法、装置和存储介质

Also Published As

Publication number Publication date
CN111651484A (zh) 2020-09-11

Similar Documents

Publication Publication Date Title
Zhao et al. Urban human mobility data mining: An overview
CN110505583B (zh) 一种基于卡口数据与信令数据的轨迹匹配方法
CN112182410B (zh) 基于时空轨迹知识图谱的用户出行模式挖掘方法
US8401771B2 (en) Discovering points of interest from users map annotations
Chen et al. Constructing and comparing user mobility profiles for location-based services
CN109446186B (zh) 一种基于移动轨迹的社会关系判断方法
CN111950937A (zh) 一种基于融合时空轨迹的重点人员风险评估方法
CN105532030A (zh) 用于分析目标实体的移动的装置、系统和方法
CN108256590B (zh) 一种基于复合元路径的相似出行者识别方法
CN111651484B (zh) 基于语义轨迹相似度移动对象伴随关系的分析方法和装置
Zhou et al. A data-driven method for trip ends identification using large-scale smartphone-based GPS tracking data
CN102595323A (zh) 基于手机定位数据的居民出行特征参数的获取方法
CN111930868A (zh) 一种基于多维数据采集的大数据行为轨迹分析方法
CN110610182A (zh) 用户轨迹相似度判断方法和相关装置
Lau et al. Extracting point of interest and classifying environment for low sampling crowd sensing smartphone sensor data
CN108898244B (zh) 一种耦合多源要素的数字标牌位置推荐方法
Guan et al. A unified framework for predicting kpis of on-demand transport services
Qian et al. Detecting taxi trajectory anomaly based on spatio-temporal relations
CN109672986A (zh) 一种时空大数据分析系统
Chen et al. An analysis of movement patterns between zones using taxi GPS data
Cai et al. The mining of urban hotspots based on multi-source location data fusion
Tiwari et al. Mining popular places in a geo-spatial region based on GPS data using semantic information
CN110502521B (zh) 一种档案库的建立方法
CN109710712B (zh) 一种基于案件要素分析的犯罪热点特征挖掘方法及系统
Xia et al. Deeprailway: a deep learning system for forecasting railway traffic

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant