CN114461931A - 一种基于多关系融合分析的用户轨迹预测方法和系统 - Google Patents

一种基于多关系融合分析的用户轨迹预测方法和系统 Download PDF

Info

Publication number
CN114461931A
CN114461931A CN202111573021.9A CN202111573021A CN114461931A CN 114461931 A CN114461931 A CN 114461931A CN 202111573021 A CN202111573021 A CN 202111573021A CN 114461931 A CN114461931 A CN 114461931A
Authority
CN
China
Prior art keywords
track
users
user
similarity
lstm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111573021.9A
Other languages
English (en)
Inventor
井雅琪
佟玲玲
方芳
段东圣
任博雅
段运强
时磊
曹亚男
尚燕敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Information Engineering of CAS
National Computer Network and Information Security Management Center
Original Assignee
Institute of Information Engineering of CAS
National Computer Network and Information Security Management Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Information Engineering of CAS, National Computer Network and Information Security Management Center filed Critical Institute of Information Engineering of CAS
Priority to CN202111573021.9A priority Critical patent/CN114461931A/zh
Publication of CN114461931A publication Critical patent/CN114461931A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Computational Linguistics (AREA)
  • Game Theory and Decision Science (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于多关系融合分析的用户轨迹预测方法和系统。该方法根据用户的历史轨迹相似关系和位置邻近关系,构建轨迹关系图,然后基于轨迹关系图中用户间的关系,利用融入注意力机制的轨迹预测模型对目标用户的未来轨迹进行预测。本发明充分考虑了用户出行具有的时间规律性特征,并充分挖掘了人群中的社会行为信息,预测精度具有明显的提高;本发明使用融入注意力机制的轨迹关系图来计算影响力大小,融入了不同用户对轨迹影响的差异,更加符合实际情况;本发明不仅利用了位置相邻的行人的轨迹行为信息,也考虑了历史轨迹相似用户的轨迹情况,将两种影响人群结合在一起构建轨迹关系图,解决了怎样对多种类型信息进行建模的问题。

Description

一种基于多关系融合分析的用户轨迹预测方法和系统
技术领域
本发明涉及计算机数据挖掘分析技术领域,尤其涉及流数据挖掘技术领域,具体是指一种基于多关系融合分析的轨迹预测方法和系统。
背景技术
人类的运动轨迹预测课题,由于其复杂性,近年来一直是国内外学者研究的热点问题。随着人工智能技术的兴起和普及,智能安全系统、自动驾驶汽车、机器人导航系统等智能应用逐渐走入大众视野。如果可以了解和预测复杂现实场景中的人群轨迹,实时动态地预测各个个体的未来位置,可以使智能应用针对实时位置提升上述智能应用的服务精准性、可用性,对智能应用的发展具有重要的意义。
现有的轨迹预测方法大多仅依赖用户的历史轨迹数据来预测,大体可分为基于传统数据挖掘的预测方法和基于深度学习的预测方法两类。
基于传统数据挖掘的预测方法,大多基于受限路网,需先将一个固定且较大的位置区划分为多个小区域。对于用户处于每个子区域的可能性,该方法把每种可能性建模为单独的状态,将位置预测问题抽象成状态转移和状态选择的问题。在该研究中,根据相互作用关系建模、基于概率图模型和基于序列分析三类方法应用较广。这些方法在进行轨迹预测时一般需先划分路网,故根据划分粒度大小,均存在不同程度的预测不精确的问题。
基于深度学习的预测方法大多利用RNN及其变体,包括LSTM、GRU等,将轨迹预测抽象为序列预测问题。RNN系网络结构在轨迹预测任务中已经有了较为广泛且成功的应用。早期的方法大多将每个用户看做一条训练数据,每条数据的预测是独立的过程。为融入更多相关特征,近年涌现出一些将多个用户同时进行预测的方法。此类方法大多采取类似假设,即认为在地理位置上相近的个体,其轨迹行为可能会受到彼此影响。当目标个体所处区域人员较为密集时,大部分人的轨迹行为特点可以从一定程度上反映出人脑对于复杂场景的决策和反映,目标个体的行为也可能会更趋向于遵循或靠近多数人的行为特点。该类方法一般认为当前时刻目标个体的临近行人会影响目标在下一个时刻的位置,本质上是对热点路线的逼近,对用户的社会行为未进行深入挖掘,且大部分方法只进行细粒度轨迹预测试验,在时间范围较长的移动互联网用户轨迹预测任务上,其有效性还需进一步验证。同时,该类方法对用户影响的建模方式较为简单,在不同用户的影响力差异方面考虑欠缺。
发明内容
为解决现有用户轨迹预测算法需要划分粒度导致的预测不精确、对用户影响力信息利用不足、衡量影响方式较为简单的问题,本发明提供了一种基于多关系融合分析的用户轨迹预测方法和系统。
本发明解决其技术问题所采用的技术方案是:
一种基于多关系融合分析的用户轨迹预测方法,包括以下步骤:
根据用户的历史轨迹相似关系和位置邻近关系,构建轨迹关系图;
基于轨迹关系图中用户间的关系,利用融入注意力机制的轨迹预测模型对目标用户的未来轨迹进行预测。
进一步地,所述根据用户的历史轨迹相似关系和位置邻近关系,构建轨迹关系图,包括:
用户集合中每一个元素均被看作图中的一个顶点,如果某两个顶点所代表的用户被判定为历史轨迹相似关系,则在代表两用户的顶点之间添加一条边;对于当前时刻,如果时间片中某两个顶点代表的用户在当前时刻地理位置相邻,则在代表两用户的顶点之间添加一条边。
进一步地,采用以下步骤进行历史轨迹相似用户筛选,以获取所述历史轨迹相似关系:
对所有用户截取部分历史轨迹进行编码,作为用户初始编码;
使用用户初始编码对用户进行聚类,并计算用户间初始编码相似度,根据相似度获得历史轨迹相似人群。
进一步地,所述对所有用户截取部分历史轨迹进行编码,作为用户初始编码,包括:
确定一个固定长度作为历史轨迹编码时所使用的历史轨迹长度,设置一个长度为该固定长度的LSTM网络,并在数据集中随机抽取多段该长度的轨迹段,使用这些轨迹段对LSTM进行训练;
对每个用户,取前相等长度的时间片的轨迹数据作为用户的初始编码轨迹段,并将初始编码轨迹段输入训练完成的LSTM序列中,将轨迹点按顺序依次输入,其中每个LSTM单元的输出监督数据为下一个轨迹点的向量;用户的初始编码即为用户的初始编码轨迹段输入LSTM序列后,最后一个单元输出的隐状态。
进一步地,所述使用用户初始编码对用户进行聚类,并计算用户间初始编码相似度,根据相似度获得历史轨迹相似人群,包括:
在初始时刻采用获取的初始编码作为判断用户间历史轨迹相似度的依据,采用余弦相似度计算两两用户编码的相似度,作为用户对历史轨迹的相似度;对于获取的历史轨迹相似度,取一个阈值,当某对用户相似度大于阈值时,认为该对用户互为历史轨迹相似的用户;在实际预测过程中选择合适的时间间隔,每隔一段时间对历史轨迹相似情况进行一次更新。
进一步地,所述基于轨迹关系图中用户间的关系,利用融入注意力机制的轨迹预测模型对目标用户的未来轨迹进行预测,包括轨迹独立序列预测和关系融合预测:
在轨迹独立序列预测中,将单人作为一个序列,每个目标用户的轨迹按窗口分割成片段,每个片段构成一条单独的数据,然后构建LSTM网络,将轨迹数据输入LSTM序列中,完成每条数据的训练和预测;每个LSTM单元的输入为轨迹段当前时间片的位置点、LSTM序列中上一个单元的隐状态、与用户具有两种相似关系的用户轨迹LSTM序列中上一个时刻的隐状态;LSTM单元的输出为该单元的隐状态,以及一个预测出的位置向量;
在关系融合预测中,对LSTM的更新公式进行调整,利用轨迹关系图中的关系来对LSTM进行更新和预测。
一种采用上述方法的基于多关系融合分析的用户轨迹预测系统,其包括:
轨迹关系图构建模块,用于根据用户的历史轨迹相似关系和位置邻近关系,构建轨迹关系图;
轨迹预测模块,用于基于轨迹关系图中用户间的关系,利用融入注意力机制的轨迹预测模型对目标用户的未来轨迹进行预测。
本发明的有益效果如下:
1.本发明充分考虑了用户出行具有的时间规律性特征,并充分挖掘了人群中的社会行为信息,实验结果表明,本发明相较于没有利用社交行为信息的轨迹预测算法,预测精度具有明显的提高。
2.本发明的模型并非传统的数据挖掘方法,不需要划分区域网络,不受划分粒度的限制,提升了位置预测的精度,增强了预测方法对粗粒度轨迹数据的鲁棒性。
3.本发明主要采用注意力机制捕获节点与类型信息之间的影响,可以通过并行计算提高模型的时间效率。
4.本发明考虑到人群中相似关系的复杂性,使用融入注意力机制的轨迹关系图来计算影响力大小,融入了不同用户对轨迹影响的差异,更加符合实际情况。
5.本发明不仅利用了位置相邻的行人的轨迹行为信息,也考虑了历史轨迹相似用户的轨迹情况,将两种影响人群结合在一起构建轨迹关系图,解决了怎样对多种类型信息进行建模的问题。
附图说明
图1是本发明的基于多特征深度编码的模型图。图中u1、u2、u3分别代表数据集中的三个用户,
Figure BDA0003424411940000041
分别代表在第i时刻,所有其他用户与用户u1、u2、u3计算相似关系得到的权重,可用于计算所有与该用户具有相似关系用户的隐状态加权平均值。该示意图表示用户u2与用户u1、用户u2与用户u3之间存在位置相邻关系或历史轨迹相似关系。
图2是构建轨迹关系图的示意图。图中表明轨迹关系图的构建以位置邻近关系和历史轨迹相似关系作为依据,其中历史轨迹相似关系的判断通过对前端轨迹进行初始编码并计算相似度得到。
图3是LSTM序列模型的示意图。对于每个时刻的输入位置,其监督数据为下一个时刻的位置。
具体实施方式
下面通过具体实施例和附图,对本发明做进一步详细说明。
本发明提供一种基于多关系融合分析的用户轨迹预测技术。该方法提出了一种新的假设,不仅利用了位置相邻的行人的轨迹行为信息,也考虑了历史轨迹相似用户的轨迹情况,将两种影响人群结合在一起构建轨迹关系图。然后,基于轨迹关系图中用户间的关系,使用一种改进的LSTM模型,加入注意力机制对群体用户轨迹进行同步,对目标用户的未来轨迹进行预测,考虑了不同用户对轨迹影响的差异。图1是本发明的基于多特征深度编码的模型图,用户u2与用户u1、用户u2与用户u3之间存在位置相邻关系或历史轨迹相似关系。
本发明方法主要包括轨迹关系图构建和利用模型预测轨迹序列两个过程。其中,轨迹关系图构建又包括历史轨迹相似用户筛选和建图两个过程;模型预测又包括轨迹独立序列预测、关系融合预测两个过程。图2是构建轨迹关系图的示意图。
在历史轨迹相似用户筛选过程中,首先对所有用户,截取部分历史轨迹进行编码,作为该用户初始编码。具体的做法是,确定一个固定长度作为历史轨迹编码时所使用的历史轨迹长度。设置一个长度为该固定长度的LSTM网络,并在数据集中随机抽取多段该长度的轨迹段,使用这些轨迹段对LSTM进行训练。对数据集中每个用户,取前相等长度的时间片的轨迹数据作为该用户的初始编码轨迹段,并将该初始编码轨迹段输入训练完成的LSTM序列中。将轨迹点按顺序依次输入,其中每个LSTM单元的输出监督数据为下一个轨迹点的向量,如图3所示。此外,为获取更深层信息,在实际操作中应设置扩展维度。然后使用该用户初始编码对用户进行聚类,并计算用户间初始编码相似度,将相似度较高的用户归为历史轨迹相似人群。在初始时刻采用获取的初始编码作为判断用户间历史轨迹相似度的依据,采用余弦相似度计算两两用户编码的相似度,作为该用户对历史轨迹的相似值。对于获取的历史轨迹相似度,取一个阈值,当某对用户相似度大于阈值时,认为该对用户互为历史轨迹相似的用户。对于历史轨迹相似的用户对,保留该相似度的值,用于后续的权值计算。此外,考虑到在实际预测过程中,用户的轨迹特征可能随时间发生变化,同一用户的历史轨迹相似用户也可能出现改变,故在实际预测过程中应选择合适的时间间隔,每隔一段时间对历史轨迹相似情况进行一次更新。
建图过程利用初始编码相似度较高的用户和当前时刻位置相同的用户建立轨迹关系图。个体间的历史轨迹相似关系和相邻关系均可以表示成一种类似社交网络的无向图。将这两类关系建模无向图,其中,用户集合中每一个元素均可被看作图中的一个顶点,如果某两个属于顶点所代表的用户被判定为历史轨迹相似关系,则在代表两用户的顶点之间添加一条边。此外,对于当前时刻,如果该时间片中某两个顶点代表的用户在当前时刻地理位置相邻,则在代表两用户的顶点之间添加一条边。通过这两种规则形成轨迹关系图。
在轨迹预测部分,本方法基于轨迹关系图中的依赖关系,利用一种融入注意力机制的轨迹预测模型对目标用户的未来轨迹进行预测。
在轨迹独立序列预测中,将单人作为一个序列,每个目标用户的轨迹按窗口分割成片段,每个片段构成一条单独的数据,然后构建LSTM网络,将轨迹数据输入LSTM序列中,完成每条数据的训练和预测;轨迹信息在网络中的使用方式如下:每个LSTM单元的输入为该轨迹段当前时间片的位置点、该LSTM序列中上一个单元的隐状态、与该用户具有两种相似关系的用户轨迹LSTM序列中上一个时刻的隐状态;LSTM单元的输出为该单元的隐状态,以及一个预测出的位置向量。在训练时,输出监督数据为该轨迹序列下一个轨迹点的向量;预测时,使用上一个单元输出的位置点作为下一个单元的输入位置点。获取初始编码轨迹段输入LSTM序列后,最后一个单元输出的隐状态。
在关系融合预测中,对LSTM的更新公式进行调整,使得每个目标的隐状态受到两种关联用户的影响,即利用轨迹关系图中的关系来对LSTM进行更新和预测。为了在多个用户之间联合建模和预测,本发明可以使用LSTM序列的隐状态模拟用户所受到的影响。对于LSTM网络来讲,每个LSTM单元的隐状态可以从一定程度上代表轨迹在该时刻的运动特征及趋势。通过将用户的相互影响转移到隐状态上,可以将目标用户的关联用户轨迹特征纳入下一个LSTM单元的考虑范围内,在一定程度上达到使用关联用户进行轨迹预测的目的。
在本模型中,对于每一个LSTM单元,其隐状态由该LSTM序列上一个单元的隐状态、该用户在当前时间片的轨迹关系图中相邻用户上一个LSTM单元的隐状态共同决定。其具体更新公式如下:
Figure BDA0003424411940000061
其中,
Figure BDA0003424411940000062
表示最后一个LSTM单元的输出,即第n个用户的LSTM序列在t-1时刻的隐状态,H(t-1)表示所有用户的LSTM序列在第t-1时刻的隐状态。
Figure BDA0003424411940000063
其中,Sim(t)表示在t时刻两两用户间LSTM隐状态的相似度,Norm表示L2范数。
Figure BDA0003424411940000064
其中,A(t)表示所有与当前用户具有相似关系的用户的隐状态的加权平均值;
Figure BDA0003424411940000065
为掩码矩阵,是一个中间值,只保留具有相似关系用户间隐状态的相似度,将不具有相似关系(即不在图中相邻)用户的相似度置为0,以便进行下一步运算。
利用该公式将
Figure BDA0003424411940000066
与H(t-1)作乘运算,则对于每个用户,都可以得到所有与该用户具有相似关系用户的隐状态加权平均值。使用获得的输出值H(t)更新LSTM。
Zt=σ(WZA(t)+UZH(t-1))
Rt=σ(WRA(t)+URH(t-1))
Figure BDA0003424411940000067
以上公式为LSTM内部参数更新方法,其中,Zt表示LSTM单元中更新门部分的输出,σ表示sigmoid激活函数,Rt表示LSTM单元中遗忘门部分的输出,WZ表示对应于A(t)的更新门可训练权重参数,UZ表示对应于H(t-1)的更新门可训练权重参数,WR表示对应于A(t)的遗忘门可训练权重参数,UR表示对应于H(t-1)的遗忘门可训练权重参数,W表示对应于A(t)的输出门可训练权重参数,U表示对应于H(t-1)的输出门可训练权重参数,
Figure BDA0003424411940000068
表示LSTM单元的原始输出。
输出公式为Y(t)=LSTM(H(t-1),X(t-1)),其中X(t-1)为输入的位置信息矩阵,Y(t)为该时刻输出的位置信息矩阵。
每过固定个数个窗口,对轨迹关系图进行更新,并使用更新后的轨迹关系图继续利用前述方法进行预测。
本发明的一个实施例公开了一种基于多关系融合的用户轨迹预测方法,包括以下步骤:
假设给定用户i、用户j,序列
Figure BDA0003424411940000071
代表用户i的一个长为n的轨迹序列,其中
Figure BDA0003424411940000072
代表用户i在第k个时间片中的轨迹点,
Figure BDA0003424411940000073
分别表示该轨迹点的经度和纬度。预测用户i的轨迹的具体过程如下:
(1)确定一个固定长度lpre作为历史轨迹编码时所使用的历史轨迹长度。设置一个长度为lpre的LSTM网络,并在数据集中随机抽取多段长度为lpre的轨迹段,使用这些轨迹段对LSTM进行训练。
(2)取用户i的前lpre个时间片的轨迹数据作为用户i的初始编码轨迹段,并将该轨迹段输入训练完成的LSTM序列中。用户i的初始编码即为用户i的初始编码轨迹段输入LSTM序列后,最后一个单元输出的隐状态。
(3)以(2)中获的初始编码作为初值,对两两用户编码计算余弦相似度,作为用户i对历史轨迹的相似值。
(4)对于获取的历史轨迹相似度,取一个阈值δ,如果用户i与用户j的相似度大于阈值δ时,认为用户i与用户j互为历史轨迹相似的用户,将相似度较高的用户归为历史轨迹相似人群。重复该过程,获得所有与用户i历史轨迹相似的用户。对于历史轨迹相似的用户对,保留该相似度的值,用于后续的权值计算。
(5)利用用户i的初始编码相似度较高的用户和当前时刻位置相同的用户建立轨迹关系图G=(U,E)。其中,用户集合中每一个元素均可被看作图G中的一个顶点,U为顶点集合,E为边的集合。
(6)如果用户i与用户j被判定为历史轨迹相似关系,则在集合U中分别代表用户i与用户j的顶点a,b之间添加一条边,即则在E中添加一条边(a,b)。
(7)如果用户i与用户j被判定为当前时刻地理位置相邻,则在集合U中分别代表用户i与用户j的顶点a,b之间添加一条边,即则在E中添加一条边(a,b)。
(8)将用户i的轨迹按窗口分割成片段,每个片段构成一条单独的数据。对于每条轨迹,使用前半段轨迹进行模型训练,对后半段轨迹进行预测并和实际轨迹对照。设置一个与轨迹序列等长的LSTM网络,并对该网络进行预训练。将每条轨迹的时间片进行对应,并以时间片为时间参照,在每个时间片,对所有轨迹在该时刻的轨迹点输入各自的LSTM网络中。按顺序将
Figure BDA0003424411940000081
输入第k个LSTM单元中。对于第k个LSTM单元,其监督数据为
Figure BDA0003424411940000082
(9)获取所有用户的LSTM序列在t-1时刻的隐状态H(t-1)
(10)计算相似度
Figure BDA0003424411940000083
只保留与用户i具有相似关系的用户的隐状态的相似度,将不具有相似关系(即不在图中相邻)用户的相似度置为0。
(11)将
Figure BDA0003424411940000084
与H(t-1)作乘运算,获得与用户i具有相似关系用户的隐状态加权平均值A(t),与H(t-1)结合得到新的隐状态,并输入下一个LSTM单元中。使用获得的输出值H(t)更新LSTM。
(12)每过固定个数个窗口,对轨迹关系图进行更新,并使用更新后的轨迹关系图继续上述方法进行预测。
本发明进行了相关实验,以验证方法在轨迹预测任务上的准确性。实验中采用的数据集包括:
(1)ETH:包含2个场景中750个行人的轨迹。
(2)UCY:包含2个场景中786个行人的轨迹。
(3)群体行为分析业务数据:包含6000个用户的3个月轨迹。
本文在实验中采用了两类数据集:公开数据集和业务数据集。其中,ETH和UCY数据集为公开数据集,场景中包含行人伴随、相向而行等多种群体行进轨迹。业务数据集即群体行为分析业务数据,为本方法研究动机中的真实数据。由于该数据精度不足,本文所采用的对比实验无法应用在该数据上,故先将本方法与对比方法在公开数据集作对比实验,验证本文方法的有效性,再将本方法应用在业务数据集上作验证。
本方法使用社会力模型、基础LSTM模型、Social-LSTM模型作为实验对比模型。此外,由于本方法相对于以往的工作新增了对历史轨迹相似用户的考虑,并增加了注意力机制,故为了验证本模型中这两种全新实验设置的有效性,针对这两种假设,设置了两个模型变体进行消融实验。实验结果如表1所示。
表1中,ST代表社会力模型,LSTM代表仅使用LSTM对单人轨迹进行预测的方法,S-LSTM代表Social-LSTM模型。GBTP代表本方案所提出的基于多关系融合分析的轨迹预测模型。GBTP(Without ST)、GBTP(Without Attention)均在GBTP基础上去掉了部分模块。其中,GBTP(Without ST)代表在GBTP模型基础上,去掉了对历史轨迹相似用户轨迹特征的考虑,即在对目标用户关联用户无向图进行建模时,只考虑了目标用户与位置相邻用户的关系。GBTP(Without Attention)代表在GBTP模型基础上,去掉了注意力机制,即忽略了不同关联用户对目标用户轨迹影响的差异。
表1
Figure BDA0003424411940000091
分析实验结果,可以看出:利用本方案进行轨迹预测时,在所有实验数据集上,无论使用完整模型还是有部分缺失的模型,其实验效果相比现有方法均有较为明显的提升。同时,本方案在多数数据集上都取得了最好效果。
基于同一发明构思,本发明的另一实施例一种采用上述方法的基于多关系融合分析的用户轨迹预测系统,其包括:
轨迹关系图构建模块,用于根据用户的历史轨迹相似关系和位置邻近关系,构建轨迹关系图;
轨迹预测模块,用于基于轨迹关系图中用户间的关系,利用融入注意力机制的轨迹预测模型对目标用户的未来轨迹进行预测。
基于同一发明构思,本发明的另一实施例提供一种电子装置(计算机、服务器、智能手机等),其包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行本发明方法中各步骤的指令。
基于同一发明构思,本发明的另一实施例提供一种计算机可读存储介质(如ROM/RAM、磁盘、光盘),所述计算机可读存储介质存储计算机程序,所述计算机程序被计算机执行时,实现本发明方法的各个步骤。
以上公开的本发明的具体实施例,其目的在于帮助理解本发明的内容并据以实施,本领域的普通技术人员可以理解,在不脱离本发明的精神和范围内,各种替换、变化和修改都是可能的。本发明不应局限于本说明书的实施例所公开的内容,本发明的保护范围以权利要求书界定的范围为准。

Claims (10)

1.一种基于多关系融合分析的用户轨迹预测方法,其特征在于,包括以下步骤:
根据用户的历史轨迹相似关系和位置邻近关系,构建轨迹关系图;
基于轨迹关系图中用户间的关系,利用融入注意力机制的轨迹预测模型对目标用户的未来轨迹进行预测。
2.根据权利要求1所述的方法,其特征在于,所述根据用户的历史轨迹相似关系和位置邻近关系,构建轨迹关系图,包括:
用户集合中每一个元素均被看作图中的一个顶点,如果某两个顶点所代表的用户被判定为历史轨迹相似关系,则在代表两用户的顶点之间添加一条边;对于当前时刻,如果时间片中某两个顶点代表的用户在当前时刻地理位置相邻,则在代表两用户的顶点之间添加一条边。
3.根据权利要求1所述的方法,其特征在于,采用以下步骤进行历史轨迹相似用户筛选,以获取所述历史轨迹相似关系:
对所有用户截取部分历史轨迹进行编码,作为用户初始编码;
使用用户初始编码对用户进行聚类,并计算用户间初始编码相似度,根据相似度获得历史轨迹相似人群。
4.根据权利要求3所述的方法,其特征在于,所述对所有用户截取部分历史轨迹进行编码,作为用户初始编码,包括:
确定一个固定长度作为历史轨迹编码时所使用的历史轨迹长度,设置一个长度为该固定长度的LSTM网络,并在数据集中随机抽取多段该长度的轨迹段,使用这些轨迹段对LSTM进行训练;
对每个用户,取前相等长度的时间片的轨迹数据作为用户的初始编码轨迹段,并将初始编码轨迹段输入训练完成的LSTM序列中,将轨迹点按顺序依次输入,其中每个LSTM单元的输出监督数据为下一个轨迹点的向量;用户的初始编码即为用户的初始编码轨迹段输入LSTM序列后,最后一个单元输出的隐状态。
5.根据权利要求3所述的方法,其特征在于,所述使用用户初始编码对用户进行聚类,并计算用户间初始编码相似度,根据相似度获得历史轨迹相似人群,包括:
在初始时刻采用获取的初始编码作为判断用户间历史轨迹相似度的依据,采用余弦相似度计算两两用户编码的相似度,作为用户对历史轨迹的相似度;对于获取的历史轨迹相似度,取一个阈值,当某对用户相似度大于阈值时,认为该对用户互为历史轨迹相似的用户;在实际预测过程中选择合适的时间间隔,每隔一段时间对历史轨迹相似情况进行一次更新。
6.根据权利要求1所述的方法,其特征在于,所述基于轨迹关系图中用户间的关系,利用融入注意力机制的轨迹预测模型对目标用户的未来轨迹进行预测,包括轨迹独立序列预测和关系融合预测:
在轨迹独立序列预测中,将单人作为一个序列,每个目标用户的轨迹按窗口分割成片段,每个片段构成一条单独的数据,然后构建LSTM网络,将轨迹数据输入LSTM序列中,完成每条数据的训练和预测;每个LSTM单元的输入为轨迹段当前时间片的位置点、LSTM序列中上一个单元的隐状态、与用户具有两种相似关系的用户轨迹LSTM序列中上一个时刻的隐状态;LSTM单元的输出为该单元的隐状态,以及一个预测出的位置向量;
在关系融合预测中,对LSTM的更新公式进行调整,利用轨迹关系图中的关系来对LSTM进行更新和预测。
7.根据权利要求6所述的方法,其特征在于,所述利用轨迹关系图中的关系来对LSTM进行更新和预测,包括:
Figure FDA0003424411930000021
其中,
Figure FDA0003424411930000022
表示第n个用户的LSTM序列在t-1时刻的隐状态,H(t-1)表示所有用户的LSTM序列在第t-1时刻的隐状态;
Figure FDA0003424411930000023
其中,Sim(t)表示在t时刻两两用户间LSTM隐状态的相似度,Norm表示L2范数;
Figure FDA0003424411930000024
其中,A(t)表示所有与当前用户具有相似关系的用户的隐状态的加权平均值;
Figure FDA0003424411930000025
为掩码矩阵,是一个中间值,只保留具有相似关系用户间隐状态的相似度,将不具有相似关系用户的相似度置为0;利用该公式将
Figure FDA0003424411930000026
与H(t-1)作乘运算,对于每个用户,得到所有与该用户具有相似关系用户的隐状态加权平均值;使用获得的输出值H(t)更新LSTM。
8.一种采用权利要求1~7中任一权利要求所述方法的基于多关系融合分析的用户轨迹预测系统,其特征在于,包括:
轨迹关系图构建模块,用于根据用户的历史轨迹相似关系和位置邻近关系,构建轨迹关系图;
轨迹预测模块,用于基于轨迹关系图中用户间的关系,利用融入注意力机制的轨迹预测模型对目标用户的未来轨迹进行预测。
9.一种电子装置,其特征在于,包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行权利要求1~7中任一权利要求所述方法的指令。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机程序,所述计算机程序被计算机执行时,实现权利要求1~7中任一权利要求所述的方法。
CN202111573021.9A 2021-12-21 2021-12-21 一种基于多关系融合分析的用户轨迹预测方法和系统 Pending CN114461931A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111573021.9A CN114461931A (zh) 2021-12-21 2021-12-21 一种基于多关系融合分析的用户轨迹预测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111573021.9A CN114461931A (zh) 2021-12-21 2021-12-21 一种基于多关系融合分析的用户轨迹预测方法和系统

Publications (1)

Publication Number Publication Date
CN114461931A true CN114461931A (zh) 2022-05-10

Family

ID=81405290

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111573021.9A Pending CN114461931A (zh) 2021-12-21 2021-12-21 一种基于多关系融合分析的用户轨迹预测方法和系统

Country Status (1)

Country Link
CN (1) CN114461931A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115884094A (zh) * 2023-03-02 2023-03-31 江西师范大学 一种基于边缘计算的多场景协作优化缓存方法
CN117058627A (zh) * 2023-10-13 2023-11-14 阳光学院 一种公共场所人群安全距离监测方法、介质及系统
WO2024098956A1 (zh) * 2022-11-10 2024-05-16 中国测绘科学研究院 一种社交媒体数据与移动轨迹数据的融合方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024098956A1 (zh) * 2022-11-10 2024-05-16 中国测绘科学研究院 一种社交媒体数据与移动轨迹数据的融合方法
CN115884094A (zh) * 2023-03-02 2023-03-31 江西师范大学 一种基于边缘计算的多场景协作优化缓存方法
CN115884094B (zh) * 2023-03-02 2023-05-23 江西师范大学 一种基于边缘计算的多场景协作优化缓存方法
CN117058627A (zh) * 2023-10-13 2023-11-14 阳光学院 一种公共场所人群安全距离监测方法、介质及系统
CN117058627B (zh) * 2023-10-13 2023-12-26 阳光学院 一种公共场所人群安全距离监测方法、介质及系统

Similar Documents

Publication Publication Date Title
CN111612206B (zh) 一种基于时空图卷积神经网络的街区人流预测方法及系统
CN110827544B (zh) 一种基于图卷积循环神经网络的短时交通流控制方法
CN110928993B (zh) 基于深度循环神经网络的用户位置预测方法及系统
CN110147904B (zh) 一种城市聚集事件预测与定位方法及装置
CN113313947B (zh) 短期交通预测图卷积网络的路况评估方法
CN114461931A (zh) 一种基于多关系融合分析的用户轨迹预测方法和系统
CN107018493B (zh) 一种基于连续时序马尔科夫模型的地理位置预测方法
Vlahogianni et al. Temporal evolution of short‐term urban traffic flow: a nonlinear dynamics approach
CN115240425B (zh) 一种基于多尺度时空融合图网络的交通预测方法
CN107247961B (zh) 一种应用模糊轨迹序列的轨迹预测方法
CN111985710A (zh) 一种公交乘客出行站点预测方法、存储介质及服务器
CN114802296A (zh) 一种基于动态交互图卷积的车辆轨迹预测方法
CN114299723B (zh) 一种交通流量预测方法
CN110570035B (zh) 同时建模时空依赖性和每日流量相关性的人流量预测系统
CN112907970B (zh) 一种基于车辆排队长度变化率的可变车道转向控制方法
CN110826698A (zh) 一种通过上下文相关的图嵌入表示人群移动模式的方法
CN113570859B (zh) 一种基于异步时空膨胀图卷积网络的交通流量预测方法
CN106815563B (zh) 一种基于人体表观结构的人群数量预测方法
CN115829171B (zh) 一种联合时空信息和社交互动特征的行人轨迹预测方法
CN115455130B (zh) 一种社交媒体数据与移动轨迹数据的融合方法
CN113068131B (zh) 一种用户移动方式和轨迹的预测方法、装置、设备及存储介质
CN112785077A (zh) 基于时空数据的出行需求预测方法及系统
CN114299607A (zh) 一种基于自动驾驶汽车的人车碰撞危险度分析方法
CN115269758A (zh) 面向乘客诱导的路网客流状态推演方法及系统
CN113780665B (zh) 一种基于增强循环神经网络的私家车停留位置预测方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination