CN116541721A - 一种面向信令数据的定位与路网匹配方法及系统 - Google Patents
一种面向信令数据的定位与路网匹配方法及系统 Download PDFInfo
- Publication number
- CN116541721A CN116541721A CN202310335072.0A CN202310335072A CN116541721A CN 116541721 A CN116541721 A CN 116541721A CN 202310335072 A CN202310335072 A CN 202310335072A CN 116541721 A CN116541721 A CN 116541721A
- Authority
- CN
- China
- Prior art keywords
- road
- base station
- learnable
- path
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 230000011664 signaling Effects 0.000 title claims abstract description 41
- 238000005070 sampling Methods 0.000 claims abstract description 102
- 230000007704 transition Effects 0.000 claims abstract description 50
- 239000004973 liquid crystal related substance Substances 0.000 claims description 26
- 238000013528 artificial neural network Methods 0.000 claims description 19
- 235000008694 Humulus lupulus Nutrition 0.000 claims description 15
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 6
- 239000002243 precursor Substances 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 6
- 238000002679 ablation Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012772 sequence design Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明提供一种面向信令数据的定位与路网匹配方法及系统,该方法包括基于隐式马尔科夫模型,构建用于实现路网匹配的框架;构建多关系图G,基于所述多关系图G构建异构图编码器,并利用异构图编码器提取基站采样点和路段之间的多重关系信息;根据提取到的基站采样点和路段之间的多重关系信息,获得可学习的观测概率和可学习的转移概率;基于所述可学习的观测概率和所述可学习的转移概率,进行路径搜索。发明解决了面对具有高定位误差的信令轨迹时,表现不佳的问题,提高了路网匹配的精确度。
Description
技术领域
本发明涉及智能交通技术领域,尤其涉及一种面向信令数据的定位与路网匹配方法及系统。
背景技术
近年来,随着5G通信技术的快速发展和智能手机用户数的迅速扩大,我国基站分布也愈加密集。根据工信部数据,截至2021年,移动电话用户总数为16.43亿户,全国移动通信基站总数达996万个。移动通信供应商收集到的海量用户移动轨迹数据,记录了人们的移动历史,广泛应用于安全跟踪、车流量管理、用户出行分析等多种应用场景。为了挖掘这些信令轨迹数据背后的价值,面向信令轨迹的路网匹配(Cellular Trajectory Map-matching,简称为CTMM)技术可以有效地将信令轨迹与道路网络对齐,返回用户真实的行进路径,为后续应用提供必要的路径信息。
路网匹配研究轨迹向交通网络的匹配问题,即找到将轨迹采样点序列转换为对应路网坐标序列的最优匹配方式。直观来讲,解决路网匹配最简单的算法就是将信令采样点关联到最近的路段上,然后通过最短路径连接这些道路,生成匹配结果路径。其算法简单,容易实现,计算速度快,但受道路网络上节点密度及分布影响,容易造成错误匹配,实用性不强。相关方法主要分为基于几何信息的匹配算法、基于拓扑信息的匹配算法、基于概率统计的匹配算法和高级路网匹配算法。目前高级路网匹配算法中的隐式马尔可夫模型(Hidden Markov Model,简称为HMM)为目前主流的路网匹配方法。HMM将每个路段视为隐藏状态,并基于观察到的轨迹点将路径恢复为道路序列。具体而言,它们依赖于观测概率来定位每个采样点对应的潜在路段,并依赖于转移概率来评估对象从一条道路移动到另一条道路的可能性。特别是,在现有方法中,这两种概率由显式特征计算(例如空间距离),可以很好地反映采样点-道路相关性,并在低定位误差的轨迹中获得令人满意的结果,但面对具有高定位误差的信令轨迹时,仍表现不佳。
因此,亟需一种路网匹配方法来解决上述问题。
发明内容
为此,本发明实施例提供了一种面向信令数据的定位与路网匹配方法及系统,用于解决现有技术中面对具有高定位误差的信令轨迹时,表现不佳的问题。
为了解决上述问题,本发明实施例提供一种面向信令数据的定位与路网匹配方法,该方法包括:
S1:基于隐式马尔科夫模型,构建用于实现路网匹配的框架;
S2:基于所述框架,构建表示基站采样点和路段之间关系类型的多关系图G,基于所述多关系图G,构建异构图编码器,并利用所述异构图编码器提取基站采样点和路段之间的多重关系信息;
S3:根据提取到的基站采样点和路段之间的多重关系信息,获得可学习的观测概率和可学习的转移概率;
S4:基于所述可学习的观测概率和所述可学习的转移概率,进行路径搜索。
优选地,基于隐式马尔科夫模型,构建用于实现路网匹配的框架的方法具体包括:
使用表示采样点xi的第j个候选路段,其中Ci是xi的候选道路集;
使用表示匹配路径,其中/>是从/>到/>的最短路径,|X|是路段总数;
通过如下公式评估匹配路径:
其中,PO(·)表示将采样点映射在候选路段上的观测概率;PT(·)表示通过最短路径从一个候选道路移动到另一个候选道路的转移概率,W(P)表示匹配路径的分数。
优选地,步骤S2中,所述多关系图G表示为:
G=(Ve,Vct,E)
其中,Ve和Vct分别包含所有路段和所有基站采样点,即Ve=G.E,G.E代表路网中所有的道路,使用V表示图中的所有节点,即V=Ve∪Vct,E是一个包含多种类型有向边的边集。
优选地,步骤S2中,利用所述异构图编码器提取基站采样点和路段之间的多重关系信息的方法为:
初始化嵌入:对于每个节点vi∈V,使用表示其One-Hot表示,然后通过可学习矩阵Winit∈R|V|×d:/>其中/>表示节点vi在第0层的嵌入,V表示图中的所有节点;
消息传递:每个节点从其相邻节点接收消息,并根据不同的关系类型分别处理它们;给定节点vi,为每个关系rel∈R生成其邻居群组Ni rel,其中R表示G中的三种类型的关系;则每个邻居群组Ni rel向节点vi发送关系rel的消息集为:
其中,表示每个邻居群组Ni rel向节点vi发送关系rel的消息集,/>可训练参数矩阵,/>表示节点vj在第i层的嵌入;
聚合来自所有相邻群组的消息,并将节点vi的嵌入更新为:
其中,W0、Wagg是可训练参数,将ReLU作为激活函数σ(·);
在执行q次迭代之后,将最后一步的节点表示作为基站采样点与路段的嵌入
优选地,步骤S3中,根据提取到的基站采样点和路段之间的多重关系信息,获得可学习的观测概率和可学习的转移概率的方法为:
根据提取到的基站采样点和路段之间的多重关系信息,使用注意力神经网络建立基站采样点和路段之间的隐式相关性,通过结合基站采样点和路段之间的隐式相关性和显示特征获得可学习的观测概率;使用注意力神经网络建立移动路径与轨迹的隐式相关性,通过结合移动路径与轨迹的隐式相关性和显示特征获得可学习的转移概率。
优选地,获得可学习的观测概率的方法具体包括:
将当前基站采样点嵌入到注意力神经网络的查询部分中,并将所有的采样点嵌入作为注意力神经网络的键和值,注意力神经网络的注意层自适应地使用重要性权重来聚合基站采样点的嵌入作为带有上下文感知的当前基站采样点表示:
其中,Wq、Wk和Wv是注意力权重的可训练参数,表示拼接运算符,xi,xj表示基站采样点,xi′表示当前基站采样点,|X|是路段总数;
在上下文感知的基站采样点表示的基础上,通过多层感知器评估隐式基站采样点和路段之间的隐式相关性:
其中,表示xi′映射在/>上的概率,/>表示基站采样点xi的第k个路段,MLP表示多层感知器;
将基站采样点和路段之间的隐式相关性和显式特征相结合,以获得可学习的观测概率:
其中,PO(·)表示将基站采样点映射在路段上的可学习的观测概率,表示基站采样点与路段之间的显式特征,包括欧氏距离和共现频率。
优选地,学习的转移概率的方法具体包括:
对于每条道路el,采用加权的方式合并基站采样点以生成轨迹为:
其中,表示轨迹,Wv′、Wq′、Wk′是注意力权重的可训练参数,xi表示基站采样点,|X|是路段总数,/>表示拼接运算符;
使用多层感知器通过下述公式预测道路属于轨迹的可能性:
其中,P(ei|X)表示道路属于轨迹的概率,MLP表示多层感知器;
基于P(el|X),评估移动路径与轨迹的隐式相关性:
其中,表示通过最短路径从一个道路移动到另一个道路的概率,从/>到/>的最短路径,sp是从/>到/>的最短路径,|sp|是其路段数;
结合移动路径与轨迹的隐式相关性和显式特征来获得可学习的转移概率:
其中,PT(·)表示通过最短路径从一个候选道路移动到另一个候选道路的可学习的转移概率,表示移动路径与轨迹之间的显式特征。
优选地,步骤S4中,基于所述可学习的观测概率和所述可学习的转移概率,进行路径搜索的方法具体包括:
选择具有观测概率的top-k路段作为基站采样点xi的候选道路,形成xi的候选道路集Ci,其中k的设置是效率和准确性之间的权衡;
给定所有候选道路集,生成候选图G′(V′,E′)来描述路径搜索空间,其中V′是从候选道路集C1∪C2∪…C|X|导出的,E′是表示任意两个相邻候选道路段之间最短路径的一组边
基于可学习的观测概率和可学习的转移概率,进行路径搜索,通过得分准确评估相邻候选路段之间的移动:
其中,W(P)表示候选路径分数;
在所有候选路径中,采用维特比算法来搜索具有最高候选路径分数的最优路径,实现路径搜索。
优选地,在候选图中构建一系列跳边,用于弥补不合格候选道路集的负面影响,所述跳边的构造为:对于每个候选路段从其一跳的前驱路段/>构建K个具有最短路径的跳边,其中一跳前驱由以下公式评估:
其中,K的设置是计算开销和准确性之间的权衡,argmax(·)为函数,W(·)表示候选路径分数。
本发明实施例还提供了一种面向信令数据的定位与路网匹配系统,该系统包括:
框架构建模块,用于基于隐式马尔科夫模型,构建用于实现路网匹配的框架;
多关系的表示学习模块,用于基于所述框架,构建表示基站采样点和路段之间关系类型的多关系图G,基于所述多关系图G,构建异构图编码器,并利用所述异构图编码器提取基站采样点和路段之间的多重关系信息;
观测概率和转移概率获取模块,用于根据提取到的基站采样点和路段之间的多重关系信息,获得可学习的观测概率和可学习的转移概率;
路径搜索模块,用于基于所述可学习的观测概率和所述可学习的转移概率,进行路径搜索。
从以上技术方案可以看出,本发明申请具有以下优点:
本发明实施例提供一种面向信令数据的定位与路网匹配方法及系统,本发明将深度神经网络的数据知识纳入HMM框架,以指导道路和路径的评估。首先基于HMM,构建用于实现路网匹配的框架,基于所述框架,构建表示基站采样点和路段之间关系类型的多关系图,并利用异构图编码器提取基站采样点和路段之间的多重关系信息,从而充分考虑了路网匹配中涉及到的多关系信息。然后为了准确定位采样点对应的潜在位置,本发明使用注意力神经网络精确地建模道路和采样点之间的动态相关性,以获得可学习的观测概率。另一方面,本发明设计了可学习的转移概率模型描述了移动路径和信令轨迹之间的隐藏关联。最后,本发明将这些可学习的概率集成到路径搜索过程中,同时为了消除噪声点带来的绕路匹配,在候选图中设计了一系列跳边,提供了跳过噪声采样点的机会。本发明解决了面对具有高定位误差的信令轨迹时,表现不佳的问题,提高了路网匹配的精确度。
附图说明
为了更清楚地说明本发明实施案例或现有技术中的技术方案,下边将对实施例中所需要使用的附图做简单说明,通过参考附图会更清楚的理解本发明的特征和优点,附图是示意性的而不应该理解为对本发明进行任何限制,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,可以根据这些附图获得其他的附图。其中:
图1为根据实施例中提供的一种面向信令数据的定位与路网匹配方法的流程图;
图2为利用异构图编码器提取基站采样点和路段之间的多重关系信息的示意图;
图3为路径搜索过程中的候选图;
图4为根据实施例中提供的一种面向信令数据的定位与路网匹配系统的框图;
图5为本发明方法(LHMM)与其他方法的实验对比图;
图6为消融实验的实验数据图。
具体实施方式
为使本发明实施例的目的、技术方案与优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提出一种面向信令数据的定位与路网匹配方法,该方法包括:
S1:基于隐式马尔科夫模型,构建用于实现路网匹配的框架;
S2:基于所述框架,构建表示基站采样点和路段之间关系类型的多关系图G,基于所述多关系图G,构建异构图编码器,并利用所述异构图编码器提取基站采样点和路段之间的多重关系信息;
S3:根据提取到的基站采样点和路段之间的多重关系信息,获得可学习的观测概率和可学习的转移概率;
S4:基于所述可学习的观测概率和所述可学习的转移概率,进行路径搜索。
本发明提供一种面向信令数据的定位与路网匹配方法,本发明将深度神经网络的数据知识纳入HMM框架,以指导道路和路径的评估。首先基于HMM,构建用于实现路网匹配的框架,基于所述框架,构建表示基站采样点和路段之间关系类型的多关系图,并利用异构图编码器提取基站采样点和路段之间的多重关系信息,从而充分考虑了路网匹配中涉及到的多关系信息。然后为了准确定位采样点对应的潜在位置,本发明使用注意力神经网络精确地建模道路和采样点之间的动态相关性,以获得可学习的观测概率。另一方面,本发明设计了可学习的转移概率模型描述了移动路径和信令轨迹之间的隐藏关联。最后,本发明将这些可学习的概率集成到路径搜索过程中,同时为了消除噪声点带来的绕路匹配,在候选图中设计了一系列跳边,提供了跳过噪声采样点的机会。本发明解决了面对具有高定位误差的信令轨迹时,表现不佳的问题,提高了路网匹配的精确度。
进一步地,在步骤S1中包括:
HMM算法由于其良好的鲁棒性和准确性而被广泛应用于地图匹配。基于HMM,构建用于实现路网匹配的框架。具体地,轨迹中每个采样点xi被投影到一个候选路段上。采样点的候选路段是一组道路,它们是该采样点的潜在位置。出于效率考虑,轨迹采样点仅与其候选路段匹配。本发明使用/>表示xi的第j个候选路段,其中Ci是xi的候选道路集。匹配路径可以转换为候选路段之间的一系列移动,即/>其中/> 是从/>到/>的最短路径,|X|是路段总数。然后,通过如下公式评估匹配路径:
其中,PO(·)表示将采样点映射在候选路段上的观测概率;PT(·)表示通过最短路径从一个候选道路移动到另一个候选道路的转移概率,W(P)表示匹配路径的分数。
进一步地,在步骤S2中包括:
为了通过神经网络实现可学习的观测和转移概率,首要任务是有效地表示路网匹配的所有元素(基站采样点和路段)。尤其重要的是,捕捉所有元素之间的多重关系,以便在表示中提供有用的语义信息,为后续学习PO(·)和PT(·)做准备。而One-Hot表示等简单表示技术的很难支持这些需求。因此,本发明提出了一种基于异构图建模的多关系表示学习方法。
首先构建表示基站采样点和路段之间关系类型的多关系图G,基于所述多关系图G构建异构图编码器,并利用异构图编码器提取基站采样点和路段之间的多重关系信息。
具体地,本发明构建了一个多关系图G表示为:G=(Ve,Vct,E),其中,Ve和Vct分别包含所有路段和所有基站采样点,即Ve=G.E,G.E代表路网中所有的道路,使用V表示图中的所有节点,即V=Ve∪Vct,E是一个包含多种类型有向边的边集。
所述多关系图G包含三种类型的关系,具体包括:
道路和单元塔之间的共现:给定一个轨迹点xi∈X和对应的行驶路径中的一个路段ej∈Pg,如果轨迹中距离ej最近的基站是xi,则表示它们具有共现关系,边(xi,CO,ej)∈E具有计算共现数的权重。高共现相关性意味着轨迹点更可能与其频繁交互的道路相匹配。
细胞塔之间的序列性:给定轨迹X:x1,x2,…,x|X|,轨迹在每个相邻的采样点xi和xi+1中都有一个顺序移动的关系,边(xi,SQ,xi+1)∈E反映了基站之间的移动模式。当采样点定位其实际位置时,可以通过轨迹上下文提供必要的校准信息,其中与当前采样点具有强顺序关系的采样点可能对其位置校准有更多贡献。
拓扑结构:当ei,ej∈Ve在路网上相邻可达,两个路段ei和ej之间有一条边,该边表示为(ei,TP,ej)∈E,表示道路之间的空间接近度和可达性。
通过上述方式,每个关系都由一种类型的边表示,并且多关系图G包含多个关系信息,这有利于面向信令轨迹的路网匹配任务。
由G是一个多关系图,表示学习不仅需要使G中的强相关节点具有相似的嵌入向量,还需要联合表示和平衡多个关系。这要求:(1)节点(即路段或基站采样点)的表示应考虑其邻居的信息;(2)从不同类型的邻居发送的信息应该被不同地和自适应地处理。受R-GCN的启发,本发明设计了多关系消息传播,如图2所示,利用异构图编码器提取基站采样点和路段之间的多重关系信息的方法为:
初始化嵌入:对于每个节点vi∈V,使用表示其One-Hot表示,然后通过可学习矩阵Winit∈R|V|×d:/>其中/>表示节点vi在第0层的嵌入,V表示图中的所有节点;
消息传递:每个节点从其相邻节点接收消息,并根据不同的关系类型分别处理它们;给定节点vi,为每个关系rel∈R生成其邻居群组Ni rel,其中R表示G中的三种类型的关系;则每个邻居群组Ni rel向节点vi发送关系rel的消息集为:
其中,表示每个邻居群组Ni rel向节点vi发送关系rel的消息集,/>可训练参数矩阵,/>表示节点vj在第i层的嵌入;
聚合来自所有相邻群组的消息,并将节点vi的嵌入更新为:
其中,W0、Wagg是可训练参数,将ReLU作为激活函数σ(·);
在执行q次迭代之后,将最后一步的节点表示作为基站采样点与路段的嵌入
进一步地,在步骤S3中包括:
由于不同轨迹中的同一基站可能匹配不同的位置,这需要对动态轨迹上下文进行建模,以克服位置模糊性和不确定性。使当前基站采样点能够感知轨迹上下文。本发明利用注意力神经网络将这些上下文信息合并到当前基站采样点的表示中,从而可以基于上下文知识评估采样点和候选道路之间的高阶相关性,具体包括:
将当前基站采样点嵌入到注意力神经网络的查询部分中,并将所有的采样点嵌入作为注意力神经网络的键和值,注意力神经网络的注意层自适应地使用重要性权重来聚合基站采样点的嵌入作为带有上下文感知的当前基站采样点表示:
其中,Wq、Wk和Wv是注意力权重的可训练参数,表示拼接运算符,xi,xj表示基站采样点,xi′表示当前基站采样点,|X|是路段总数;
在上下文感知的基站采样点表示的基础上,通过多层感知器评估隐式基站采样点和路段之间的隐式相关性:
其中,表示xi′映射在/>上的概率,/>表示基站采样点xi的第k个路段,MLP表示多层感知器;
将基站采样点和路段之间的隐式相关性和显式特征相结合,以获得可学习的观测概率:
其中,PO(·)表示将基站采样点映射在路段上的可学习的观测概率,表示基站采样点与路段之间的显式特征,包括欧氏距离和共现频率。
为了准确识别不合理的移动路径,本发明首先在细粒度级别捕获隐式轨迹-路径相关性。然后进一步结合隐式相关性和一些有用的显式特征来获得转移概率,具体包括:
对于每条道路el,采用加权的方式合并基站采样点以生成轨迹为:
其中,表示轨迹,Wv′、Wq′、Wk′是注意力权重的可训练参数,xi表示基站采样点,|X|是路段总数,/>表示拼接运算符;
使用多层感知器通过下述公式预测道路属于轨迹的可能性:
其中,P(el|X)表示道路属于轨迹的概率,MLP表示多层感知器;
基于P(el|X),评估移动路径与轨迹的隐式相关性:
其中,表示通过最短路径从一个道路移动到另一个道路的概率,从/>到/>的最短路径,sp是从/>到/>的最短路径,|sp|是其路段数;
结合移动路径与轨迹的隐式相关性和显式特征来获得可学习的转移概率:
其中,PT(·)表示通过最短路径从一个候选道路移动到另一个候选道路的可学习的转移概率,表示移动路径与轨迹之间的显式特征。
进一步地,在步骤S4包括:
基于上述可学习的观测概率和所述可学习的转移概率,进行路径搜索的方法具体包括:
选择具有观测概率的top-k路段作为基站采样点xi的候选道路,形成xi的候选道路集Ci,其中k的设置是效率和准确性之间的权衡;例如,图3中x3的候选路段为和/>
给定所有候选道路集,生成候选图G′(V′,E′)来描述路径搜索空间,其中V′是从候选道路集C1∪C2∪…C|X|导出的,E′是表示任意两个相邻候选道路段之间最短路径的一组边
基于可学习的观测概率和可学习的转移概率,进行路径搜索,通过得分准确评估相邻候选路段之间的移动:
其中,W(P)表示候选路径分数;
在所有候选路径中,采用维特比算法来搜索具有最高候选路径分数的最优路径,实现路径搜索。
此外,本发明在候选图中构建一系列跳边,用于弥补不合格候选道路集(对于给定候选道路集Ci,如果Ci与行驶路径没有重叠,则绕路匹配不可避免地会在路径查找过程发生。我们称这种Ci为不合格的候选道路集。)的负面影响。
跳边的构造:对于每个候选路段我们从其一跳的前驱路段/>构建K个具有最短路径的跳边。一跳前驱由以下公式评估:
其中,K的设置是计算开销和准确性之间的权衡,实验评估表明,一条跳边(即K=1)就足够了argmax(·)为函数,W(·)表示候选路径分数。
跳边的评分设定:将分数分配给带有跳边的候选路径。评估候选路径需要在候选道路之间具有相同数量的转移,但由于跳边跳过了一些候选道路集,因此具有跳边的路径的转移数量减少。因此,为了在候选路径之间进行公平比较,我们需要恢复跳过的候选道路集的道路段。具体来说,给定跳边我们在此跳边中将xi-1投影到其最近的路段并使用此投影路段将跳边转换为/>
如图4所示,本发明提供一种面向信令数据的定位与路网匹配系统,该系统包括:
框架构建模块10,用于基于隐式马尔科夫模型,构建用于实现路网匹配的框架;
多关系的表示学习模块20,用于基于所述框架,构建表示基站采样点和路段之间关系类型的多关系图G,基于所述多关系图G,构建异构图编码器,并利用所述异构图编码器提取基站采样点和路段之间的多重关系信息;
观测概率和转移概率获取模块30,用于根据提取到的基站采样点和路段之间的多重关系信息,获得可学习的观测概率和可学习的转移概率;
路径搜索模块40,用于基于所述可学习的观测概率和所述可学习的转移概率,进行路径搜索。
所述系统,用以实现上述所述的一种面向信令数据的定位与路网匹配方法,为了避免冗余,在此不再赘述。
为了评估本发明方法的有效性,进行了如下实验。
一、实验数据
在实验中,使用了两个来自移动通信运营商的真实轨迹数据集,分别位于中国杭州和中国厦门。数据集包含同一行进路径的信令轨迹和相应的GPS采样序列。真实路径由GPS采样序列通过经典HMM算法生成。在匹配之前,信令轨迹最初通过一系列滤波器去除噪声并平滑,包括速度滤波器、α-均值滤波器和方向滤波器。
二、实验设置
在实验中,将所有嵌入和潜在向量的维数设置为128。Adam基于训练集优化所有可训练参数,并基于验证集选择超参数。初始学习率和体重衰减率分别为1×10^(-3)和1×10^(-4)。交叉熵损失的标签平滑度为0.1。为了加速计算,我们用消息传递框架以并行方式实现了异构图编码器。通过实验比较,异构图编码器中的迭代次数q设置为2,表现出良好的性能。每个点的候选数k设置为30,HMM可以使用预计算表来避免重复最短路径搜索的瓶颈。
三、与其他方法对比
本发明将以下方法作为比较基准:
STM:ST-Matching(简称STM)是一种针对低采样率GPS序列设计的经典方法,它考虑了拓扑结构和时间约束。
IVMM:它使用投票策略来描述GPS点之间的相互影响。
IFM:IF-Matching(简称IFM)融合周围速度来描述移动目标。
DeepMM:它采用基于LSTM的seq2seq和注意力模型,用于稀疏和嘈杂的GPS轨迹。
MCM:它将路网匹配建模为在GPS轨迹和潜在路线之间找到一个共同的子序列的任务。
TransformerMM:它在seq2seq中使用Transformer而不是LSTM。
CLSTERS:它提供了平滑信令轨迹需要一系列校准方式。
SNet:SnapNet(简称SNet)在评估过程中结合了数字地图提示和一些启发式方法。
THMM:它为信令轨迹的路网匹配设计了几何、拓扑和概率特征。
DMM:它基于seq2seq模型,并采用强化学习组件来增强路网匹配器。
如图5所示,从图5中可以看出本发明提出的方法(LHMM)在所有指标上都达到了最佳精度。以CMF50为例,与最强的基于HMM的模型THMM和最强的基于seq2seq的模型DMM相比,LHMM分别实现了23.63%和22.69%的精度增益。这些巨大的改进证明了HMM和学习知识相结合的有效性,它集成了HMM的鲁棒性,并通过隐式特征来指导路径查找过程。提高准确性的可能原因如下:(1)LHMM充分捕获了对CTMM任务有用的多关系知识,而DMM仅将基站根据自动编码器和RNN进行嵌入,忽略了丰富的语义信息。(2)LHMM考虑轨迹上下文以消除歧义,并将学习到的知识嵌入到观测和转移概率中,而其他基于HMM的方法仅采用显式特征来评估道路和路径。
(3)跳边在候选图上提供关键的跳过边的机会,以减轻不合格候选道路集的影响。通过以上组件,LHMM实现了最先进的性能。
四、消融实验
本发明进一步进行消融试验,以研究LHMM所有组件的影响。如图6所示,报告了所有变体模型的结果。
异构图编码器的影响:为了研究异构图编码器的有效性,我们设计了以下变体:
LHMM-E:我们将基于图的编码器层替换为MLP嵌入层。
LHMM-H:我们将异构图编码器中的异构图神经网络替换为同构图神经网络(例如GCNs)。
从消融结果中,我们观察到LHMM-E的性能落后于LHMM-H,这证明了多关系图为CTMM提供了有用的信息,并且基于图的编码器比MLP嵌入层更好地捕获图的丰富语义信息。LHMM-H的性能落后于LHMM,这表明需要以平衡的方式嵌入这些为CTMM定制的多关系,以便充分提取多关系图的异构性。
可学习的观测和转移概率的影响。为了研究观测概率和转移概率中隐式特征的影响,我们设计了以下变体:
LHMM-O:我们去除了观测概率中的隐式采样点-路段相关性。
LHMM-T:我们去除了转移概率中的隐式轨迹-路径相关性。
通过集成隐式特征,我们发现性能显著提高(例如,在CMF50上从LHMM-O 0.178和LHMM-T 0.155提高到LHMM 0.126)。这证明了隐式知识赋予的观测和转移概率的优越性。
跳边的效果:为了研究跳边的有效性,我们设计了以下变体:
LHMM-S:我们从LHMM中删除了跳边结构。
STM、STM+S:我们将跳边添加到其他基于HMM的方法中。
从LHMM-S的结果中,我们观察到,在CMF50上,快捷方式结构明显提高了从LHMM-S0.140到LHMM0.125的性能,这表明跳边弥补了不合格候选道路集的影响。比较STM和STM+S,我们发现跳边是所有基于HMM的方法的通用组件,将其命中率从0.874提高到0.911。
五、实验总结
本发明提出方法(LHMM)是面向信令轨迹路网匹配所需要的。此外,一系列候选图中的跳边对于避免绕路匹配也具有重要意义。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,上述实施例仅仅是为清楚地说明所作的举例,并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (10)
1.一种面向信令数据的定位与路网匹配方法,其特征在于,包括:
S1:基于隐式马尔科夫模型,构建用于实现路网匹配的框架;
S2:基于所述框架,构建表示基站采样点和路段之间关系类型的多关系图G,基于所述多关系图G,构建异构图编码器,并利用所述异构图编码器提取基站采样点和路段之间的多重关系信息;
S3:根据提取到的基站采样点和路段之间的多重关系信息,获得可学习的观测概率和可学习的转移概率;
S4:基于所述可学习的观测概率和所述可学习的转移概率,进行路径搜索。
2.根据权利要求1所述的面向信令数据的定位与路网匹配方法,其特征在于,基于隐式马尔科夫模型,构建用于实现路网匹配的框架的方法具体包括:
使用表示采样点xi的第j个候选路段,其中Ci是xi的候选道路集;
使用表示匹配路径,其中/>是从/>到/>的最短路径,|X|是路段总数;
通过如下公式评估匹配路径:
其中,PO(·)表示将采样点映射在候选路段上的观测概率;PT(·)表示通过最短路径从一个候选道路移动到另一个候选道路的转移概率,W(P)表示匹配路径的分数。
3.根据权利要求1所述的面向信令数据的定位与路网匹配方法,其特征在于,步骤S2中,所述多关系图G表示为:
G=(Ve,Vct,E)
其中,Ve和Vct分别包含所有路段和所有基站采样点,即Ve=G.E,G.E代表路网中所有的道路,使用V表示图中的所有节点,即V=Ve∪Vct,E是一个包含多种类型有向边的边集。
4.根据权利要求1所述的面向信令数据的定位与路网匹配方法,其特征在于,步骤S2中,利用所述异构图编码器提取基站采样点和路段之间的多重关系信息的方法为:
初始化嵌入:对于每个节点vi∈V,使用表示其One-Hot表示,然后通过可学习矩阵Winit∈R|V|×d:/>其中/>表示节点vi在第0层的嵌入,V表示图中的所有节点;
消息传递:每个节点从其相邻节点接收消息,并根据不同的关系类型分别处理它们;给定节点vi,为每个关系rel∈R生成其邻居群组Ni rel,其中R表示G中的三种类型的关系;则每个邻居群组Ni rel向节点vi发送关系rel的消息集为:
其中,表示每个邻居群组Ni rel向节点vi发送关系rel的消息集,/>可训练参数矩阵,/>表示节点vj在第i层的嵌入;
聚合来自所有相邻群组的消息,并将节点vi的嵌入更新为:
其中,W0、Wagg是可训练参数,将ReLU作为激活函数σ(·);
在执行q次迭代之后,将最后一步的节点表示作为基站采样点与路段的嵌入
5.根据权利要求1所述的面向信令数据的定位与路网匹配方法,其特征在于,步骤S3中,根据提取到的基站采样点和路段之间的多重关系信息,获得可学习的观测概率和可学习的转移概率的方法为:
根据提取到的基站采样点和路段之间的多重关系信息,使用注意力神经网络建立基站采样点和路段之间的隐式相关性,通过结合基站采样点和路段之间的隐式相关性和显示特征获得可学习的观测概率;使用注意力神经网络建立移动路径与轨迹的隐式相关性,通过结合移动路径与轨迹的隐式相关性和显示特征获得可学习的转移概率。
6.根据权利要求5所述的面向信令数据的定位与路网匹配方法,其特征在于,获得可学习的观测概率的方法具体包括:
将当前基站采样点嵌入到注意力神经网络的查询部分中,并将所有的采样点嵌入作为注意力神经网络的键和值,注意力神经网络的注意层自适应地使用重要性权重来聚合基站采样点的嵌入作为带有上下文感知的当前基站采样点表示:
其中,Wq、Wk和Wv是注意力权重的可训练参数,表示拼接运算符,xi,xj表示基站采样点,x′i表示当前基站采样点,|X|是路段总数;
在上下文感知的基站采样点表示的基础上,通过多层感知器评估隐式基站采样点和路段之间的隐式相关性:
其中,表示x′i映射在/>上的概率,/>表示基站采样点xi的第k个路段,MLP表示多层感知器;
将基站采样点和路段之间的隐式相关性和显式特征相结合,以获得可学习的观测概率:
其中,PO(·)表示将基站采样点映射在路段上的可学习的观测概率,表示基站采样点与路段之间的显式特征,包括欧氏距离和共现频率。
7.根据权利要求5所述的面向信令数据的定位与路网匹配方法,其特征在于,获得可学习的转移概率的方法具体包括:
对于每条道路el,采用加权的方式合并基站采样点以生成轨迹为:
其中,表示轨迹,Wv′、Wq′、Wk′是注意力权重的可训练参数,xi表示基站采样点,|X|是路段总数,/>表示拼接运算符;
使用多层感知器通过下述公式预测道路属于轨迹的可能性:
其中,P(el|X)表示道路属于轨迹的概率,MLP表示多层感知器;
基于P(el|X),评估移动路径与轨迹的隐式相关性:
其中,表示通过最短路径从一个道路移动到另一个道路的概率,/>从/>到/>的最短路径,sp是从/>到/>的最短路径,|sp|是其路段数;
结合移动路径与轨迹的隐式相关性和显式特征来获得可学习的转移概率:
其中,PT(·)表示通过最短路径从一个候选道路移动到另一个候选道路的可学习的转移概率,表示移动路径与轨迹之间的显式特征。
8.根据权利要求1所述的面向信令数据的定位与路网匹配方法,其特征在于,步骤S4中,基于所述可学习的观测概率和所述可学习的转移概率,进行路径搜索的方法具体包括:
选择具有观测概率的top-k路段作为基站采样点xi的候选道路,形成xi的候选道路集Ci,其中k的设置是效率和准确性之间的权衡;
给定所有候选道路集,生成候选图G′(V′,E′)来描述路径搜索空间,其中V′是从候选道路集C1∪C2∪…C|X|导出的,E′是表示任意两个相邻候选道路段之间最短路径的一组边
基于可学习的观测概率和可学习的转移概率,进行路径搜索,通过得分准确评估相邻候选路段之间的移动:
其中,W(P)表示候选路径分数;
在所有候选路径中,采用维特比算法来搜索具有最高候选路径分数的最优路径,实现路径搜索。
9.根据权利要求1所述的面向信令数据的定位与路网匹配方法,其特征在于,在候选图中构建一系列跳边,用于弥补不合格候选道路集的负面影响,所述跳边的构造为:对于每个候选路段从其一跳的前驱路段/>构建K个具有最短路径的跳边,其中一跳前驱由以下公式评估:
其中,表示基站采样点xi的第k个候选路段,K的设置是计算开销和准确性之间的权衡,argmax(·)为函数,W(·)表示候选路径分数。
10.一种面向信令数据的定位与路网匹配系统,其特征在于,包括:
框架构建模块,用于基于隐式马尔科夫模型,构建用于实现路网匹配的框架;
多关系的表示学习模块,用于基于所述框架,构建表示基站采样点和路段之间关系类型的多关系图G,基于所述多关系图G,构建异构图编码器,并利用所述异构图编码器提取基站采样点和路段之间的多重关系信息;
观测概率和转移概率获取模块,用于根据提取到的基站采样点和路段之间的多重关系信息,获得可学习的观测概率和可学习的转移概率;
路径搜索模块,用于基于所述可学习的观测概率和所述可学习的转移概率,进行路径搜索。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310335072.0A CN116541721A (zh) | 2023-03-31 | 2023-03-31 | 一种面向信令数据的定位与路网匹配方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310335072.0A CN116541721A (zh) | 2023-03-31 | 2023-03-31 | 一种面向信令数据的定位与路网匹配方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116541721A true CN116541721A (zh) | 2023-08-04 |
Family
ID=87451337
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310335072.0A Pending CN116541721A (zh) | 2023-03-31 | 2023-03-31 | 一种面向信令数据的定位与路网匹配方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116541721A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117056747A (zh) * | 2023-10-11 | 2023-11-14 | 深圳健路网络科技有限责任公司 | 一种轨迹点与宿主的快速匹配装置、方法及存储介质 |
-
2023
- 2023-03-31 CN CN202310335072.0A patent/CN116541721A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117056747A (zh) * | 2023-10-11 | 2023-11-14 | 深圳健路网络科技有限责任公司 | 一种轨迹点与宿主的快速匹配装置、方法及存储介质 |
CN117056747B (zh) * | 2023-10-11 | 2024-01-30 | 深圳健路网络科技有限责任公司 | 一种轨迹点与宿主的快速匹配装置、方法及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jagadeesh et al. | Online map-matching of noisy and sparse location data with hidden Markov and route choice models | |
CN109405839B (zh) | 一种基于多路径的交通网络离线地图匹配算法 | |
CN111343585B (zh) | 一种基于隐马尔可夫模型的移动用户轨迹地图匹配方法 | |
Lin et al. | Enhanced fingerprinting and trajectory prediction for IoT localization in smart buildings | |
CN106912018B (zh) | 基于信令轨迹的地图匹配方法及系统 | |
Monreale et al. | Wherenext: a location predictor on trajectory pattern mining | |
US8976266B2 (en) | Picture locating method and system based on navigation function of mobile terminal | |
CN112015835B (zh) | Geohash压缩的地图匹配方法 | |
CN104462190A (zh) | 一种基于海量空间轨迹挖掘的在线的位置预测方法 | |
CN106408124B (zh) | 一种面向数据稀疏环境下的移动路径混合预测方法 | |
JP2011252844A (ja) | データ処理装置、データ処理方法、およびプログラム | |
CN103970733B (zh) | 一种基于图结构的中文新词识别方法 | |
CN108882172B (zh) | 一种基于hmm模型的室内移动轨迹数据的预测方法 | |
JP2011118776A (ja) | データ処理装置、データ処理方法、およびプログラム | |
CN106441316B (zh) | 一种基于历史数据的单点路网匹配方法 | |
CN111292356B (zh) | 运动轨迹与道路的匹配方法及装置 | |
Anagnostopoulos et al. | Intelligent trajectory classification for improved movement prediction | |
Szwed et al. | An incremental map-matching algorithm based on hidden markov model | |
Ozdemir et al. | A hybrid HMM model for travel path inference with sparse GPS samples | |
Sohn et al. | Space-based passing time estimation on a freeway using cell phones as traffic probes | |
CN116541721A (zh) | 一种面向信令数据的定位与路网匹配方法及系统 | |
Bonnetain et al. | Can we map-match individual cellular network signaling trajectories in urban environments? Data-driven study | |
Hou et al. | Fast online map matching for recovering travelling routes from low-sampling GPS data | |
CN111460277B (zh) | 一种基于移动社交网络树状传输路径的个性化推荐方法 | |
Chen et al. | Mining object similarity for predicting next locations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |