CN113505310A - 一种基于时空注意网络的校园用户下一个位置推荐方法 - Google Patents
一种基于时空注意网络的校园用户下一个位置推荐方法 Download PDFInfo
- Publication number
- CN113505310A CN113505310A CN202110768477.4A CN202110768477A CN113505310A CN 113505310 A CN113505310 A CN 113505310A CN 202110768477 A CN202110768477 A CN 202110768477A CN 113505310 A CN113505310 A CN 113505310A
- Authority
- CN
- China
- Prior art keywords
- frequent
- time
- space
- sequence
- track
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000000694 effects Effects 0.000 claims abstract description 29
- 238000005065 mining Methods 0.000 claims abstract description 17
- 239000013598 vector Substances 0.000 claims abstract description 14
- 230000002776 aggregation Effects 0.000 claims abstract description 10
- 238000004220 aggregation Methods 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 230000004931 aggregating effect Effects 0.000 claims abstract description 8
- 230000002441 reversible effect Effects 0.000 claims abstract description 7
- 230000002159 abnormal effect Effects 0.000 claims abstract description 6
- 239000011159 matrix material Substances 0.000 claims description 30
- 230000006399 behavior Effects 0.000 claims description 6
- 238000013179 statistical model Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 claims description 3
- 230000007787 long-term memory Effects 0.000 claims description 3
- 238000005192 partition Methods 0.000 claims description 3
- 230000007774 longterm Effects 0.000 abstract description 4
- 238000009412 basement excavation Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 239000004576 sand Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2477—Temporal data queries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种基于时空注意网络的校园用户下一个位置预测方法,首先依据时间序列分布特征,采用具有轨迹数据预处理的SMM算法,通过分段合并和自适应调整方法去除异常数据,解决轨迹数据存在的大量pingpong效应;其次采用频繁项集逆序挖掘序列模式,通过已挖掘的序列模式集迭代去除冗余项集得到待挖掘序列模式集;将用户整个历史轨迹分为若干个时间窗,学习每条历史数据用户编号、位置编号、签到时间和时空效应并转为向量表示构建多模态嵌入层;构建自注意聚合层,聚合用户轨迹内重要的相关位置,捕获长期依赖更新每次签到的表示;构建注意匹配层。本发明大幅度压缩数据库,提高轨迹模式挖掘性能,有效提高个性化预测召回率。
Description
技术领域
本发明属于下一个地理兴趣点推荐的技术领域,具体涉及一种基于时空注意网络的校园用户下一个位置预测方法。
背景技术
随着信息技术的快速发展和基于位置服务系统的广泛应用,智能手机、可穿戴设备和汽车等设施中记录大量基于时间地点的轨迹数据。最重要的应用之一是下一个POI推荐,它的目的是基于用户的历史签到活动序列来预测下一个POI。由于定位技术的广泛应用,对定位预测的研究由来已久。以前的工作[1-2]提出了基于马尔可夫链的序列推荐方法,但他们只考虑了来自上次签入活动的影响。受word2vec在序列问题中成功的启发,一些研究者提出了对POI的嵌入向量进行学习,并基于时态POI嵌入进行推荐,未能同时考虑时空背景对POI推荐的影响。
对于校园WiFi探测的轨迹数据集,由于AP接入点信号不稳定以及不同AP信号交叉等原因产生pingpong效应,导致行为轨迹数据过于庞杂,增加算法额外开销;传统轨迹数据以时间戳形式存储,缺少对用户特别是学生、通勤人员等强周期性特征的刻画,导致算法效率不高。
发明内容
基于现有技术的不足,本发明所要解决的技术问题是提供一种基于时空注意网络的校园用户下一个位置预测方法,能大幅度压缩数据库,提高轨迹模式挖掘性能,有效提高个性化预测召回率。
为了实现以上发明,提出了一种基于时空注意网络的校园用户下一个位置预测方法,包括以下步骤:
S1、数据预处理:针对pingpong效应提出移动统计模型算法;
S2、挖掘用户频繁序列轨迹:提出TDM-PrefixSpan算法,针对数据的周期性进行归一化,采用频繁项集逆序挖掘序列,提高算法效率,连接生成新的频繁项集,构造校园用户行为轨迹模型;
S3、划分时间窗、构建多模态嵌入层:用户轨迹嵌入层将用户编号u、位置编号l、签到时间t分别编码为潜在表示成eu,el,et,将标量转换成密集向量,提高计算效率,分别以小时和百米作为基本单位嵌入向量,对时空间隔进行单位化的向量表示,得到稀疏关系编码;
S4、构建自注意聚合层:首先构造掩模矩阵,通过嵌入轨迹矩阵维度定义的参数矩阵来计算一个新的序列,考虑不同的空间距离和时间间隔在一个轨迹上的两次访问,聚合相关的访问地点并更新每次访问的表示;
S5、构建注意匹配层:通过用户轨迹的更新表示与候选时空关联矩阵进行匹配,从所有候选位置中召回最可信的候选人。
进一步的,所述步骤S1的数据预处理具体步骤如下:
S101、给定子数据集dataSetSub、频繁元素阈值和划分长度length,将数据集按照以length长度进行分组并用中括号[]加以表示;
S102、依据分组结果,比较相邻两个分组是否相等,如果相等,则在序列数据集添加左花括号并将花括号位置索引记录到LeftBracketIndex数组中,按照相同方法添加右花括号,每对花括号表示一条以长度length为周期的频繁序列;
S103、如果LeftBracketIndex数组不为空,则说明数据集中存在pingpong效应,只保留异常数据的第一个元组项;
S104、依次检查pingpong效应序列所在花括号的左括号之前和右括号之后分组中的元素项,如果元素项属于花括号内元素则删除该元素;否则,删除花括号;
S105、调整length值,实验设置不超过频繁元素阈值,对于非pingpong效应部分子序列数据集再次分组循环处理。
进一步的,所述步骤S2中的挖掘用户频繁序列轨迹如下:
S201、扫描原始数据集,得到频繁1项集,按照时间先后顺序依照时间戳从大到小排序,并删除数据集中非频繁项;
S202、投影频繁元素得到子投影数据库,执行第1步,得到当前子投影数据库频繁1项集;
S203、扫描子投影数据库频繁1项集,如果频繁元素已经存在于频繁序列库中,统计该频繁元素所包含某频繁序列在子投影数据库中出现次数,如果频繁序列出现次数大于支持度,那么该频繁序列亦是子投影数据库频繁序列;
S204、如果子投影数据库频繁1项集频繁元素不存在于频繁序列库中,则迭代执行第2步,并将各层循环得到的频繁元素和频繁序列构成字典存入频繁序列库中;
S205、对于原始数据集未挖掘频繁元素循环执行第2步及剩余步骤。
进一步的,所述步骤S3中的划分时间窗、构建多模态嵌入层的具体步骤如下:
S301、考虑学生群体活动规律,按照以周期7天得整数倍时间间隔把时间序列划分成多个时间窗;
S302、计算轨迹内每个访问点之间的时空关联,分别得到时空关联矩阵Δt,s和候选时空关联矩阵Nt,s。
S303、用户轨迹嵌入层,将用户编号、位置编号、签到时间用三个独立的嵌入层转换为潜表示。对每个用户序列,将其嵌入表示写为:
每个签到的用户轨迹嵌入层的输出:
S304、时空嵌入层,将每个小时eΔt和每一百米eΔs作为基本单元,提出时间和空间差的单位嵌入层。对于每两个访问点之间的时间差和空间差的嵌入表示,计算其真实差值乘以单位嵌入表示:
进一步的,所述步骤S4中的构建自注意聚合层具体步骤如下:
使用自注意力机制可以捕捉长期记忆,聚合轨迹内相关的访问点并且以此更新每个访问点。每一个访问点对当前点的影响和时空关联均会被考虑。首先构建一个掩模矩阵,其左上角元素为1,其余元素为0;并根据轨迹数据特征维度构建参数矩阵,计算出该层输出:
Seq(u)=Attention(E(u)WQ,E(u)WK,E(u)WV,E(Δ),M) (11)
其中:
进一步的,所述步骤S5中的构建注意匹配层具体步骤如下:
通过用户轨迹更新后的表示Seq(u),地点集合的嵌入表示E(l)和候选时空关联矩阵E(N),计算每个候选地点为下一个访问点的概率,从候选地点集合中召回最有可能下一步访问的地点:
A(u)=Matching(E(l),S(u),E(N)) (13)
其中:
由上,本发明首先依据时间序列分布特征,采用具有轨迹数据预处理的SMM(移动统计模型)算法,通过分段合并和自适应调整方法去除异常数据,解决轨迹数据存在的大量pingpong效应;其次采用频繁项集逆序挖掘序列模式,通过已挖掘的序列模式集迭代去除冗余项集得到待挖掘序列模式集;将用户整个历史轨迹分为若干个时间窗,学习每条历史数据用户编号、位置编号、签到时间和时空效应并转为向量表示构建多模态嵌入层;构建自注意聚合层,聚合用户轨迹内重要的相关位置,捕获长期依赖更新每次签到的表示;构建注意匹配层,从加权签入表示计算softmax概率,与用户轨迹的更新表示进行匹配,召回最可信的候选人。本发明能大幅度压缩数据库,提高轨迹模式挖掘性能,有效提高个性化预测召回率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例的附图作简单地介绍。
图1为本发明的基于时空注意网络的校园用户下一个位置推荐方法的流程图;
图2为多Wi-Fi接入点重叠图;
图3为pingpong效应原理示意图。
具体实施方式
本发明的基于时空注意网络的校园用户下一个位置预测方法提出改进思路:(1)利用PrefixSpan算法挖掘用户频繁序列轨迹时,提出TDM-PrefixSpan算法,针对数据的周期性进行归一化,采用频繁项集逆序挖掘序列,提高算法效率,连接生成新的频繁项集,构造校园用户行为轨迹模型;(2)在数据预处理阶段,针对pingpong效应提出SMM(移动统计模型)算法,减少构建投影数据库和数据库扫描运行时间。
本发明的一种基于时空注意网络的校园用户下一个位置预测方法,其具体包括步骤如下:
S1、数据预处理:针对pingpong效应提出SMM(移动统计模型)算法;
S2、挖掘用户频繁序列轨迹:提出TDM-PrefixSpan算法,针对数据的周期性进行归一化,采用频繁项集逆序挖掘序列,提高算法效率,连接生成新的频繁项集,构造校园用户行为轨迹模型;
S3、划分时间窗、构建多模态嵌入层:用户轨迹嵌入层将用户编号u、位置编号l、签到时间t分别编码为潜在表示成eu,el,et,将标量转换成密集向量,提高计算效率。分别以小时和百米作为基本单位嵌入向量,对时空间隔进行单位化的向量表示,得到稀疏关系编码;
S4、构建自注意聚合层:首先构造掩模矩阵,通过嵌入轨迹矩阵维度定义的参数矩阵来计算一个新的序列,考虑不同的空间距离和时间间隔在一个轨迹上的两次访问,聚合相关的访问地点并更新每次访问的表示。自注意层可以捕获长期依赖,并对轨迹内的每次访问分配不同的权重。
S5、构建注意匹配层:通过用户轨迹的更新表示与候选时空关联矩阵进行匹配,从所有候选位置中召回最可信的候选人。
步骤S1的数据预处理具体步骤如下:
S101、给定子数据集dataSetSub、频繁元素阈值和划分长度length,将数据集按照以length长度进行分组并用中括号[]加以表示;
S102、依据分组结果,比较相邻两个分组是否相等,如果相等,则在序列数据集添加左花括号并将花括号位置索引记录到LeftBracketIndex数组中,按照相同方法添加右花括号,每对花括号表示一条以长度length为周期的频繁序列;
S103、如果LeftBracketIndex数组不为空,则说明数据集中存在pingpong效应,只保留异常数据的第一个元组项;
S104、依次检查pingpong效应序列所在花括号的左括号之前和右括号之后分组中的元素项,如果元素项属于花括号内元素则删除该元素;否则,删除花括号;
S105、调整length值,实验设置不超过频繁元素阈值,对于非pingpong效应部分子序列数据集再次分组循环处理。
步骤S2中的挖掘用户频繁序列轨迹如下:
S201、扫描原始数据集,得到频繁1项集,按照时间先后顺序依照时间戳从大到小排序,并删除数据集中非频繁项;
S202、投影频繁元素得到子投影数据库,执行第1步,得到当前子投影数据库频繁1项集;
S203、扫描子投影数据库频繁1项集,如果频繁元素已经存在于频繁序列库中,统计该频繁元素所包含某频繁序列在子投影数据库中出现次数,如果频繁序列出现次数大于支持度,那么该频繁序列亦是子投影数据库频繁序列;
S204、如果子投影数据库频繁1项集频繁元素不存在于频繁序列库中,则迭代执行第2步,并将各层循环得到的频繁元素和频繁序列构成字典存入频繁序列库中;
S205、对于原始数据集未挖掘频繁元素循环执行第2步及剩余步骤。
步骤S3中的划分时间窗、构建多模态嵌入层的具体步骤如下:
S301、考虑学生群体活动规律,按照以周期7天得整数倍时间间隔把时间序列划分成多个时间窗;
S302、计算轨迹内每个访问点之间的时空关联,分别得到时空关联矩阵Δt,s和候选时空关联矩阵Nt,s。
S303、用户轨迹嵌入层,将用户编号、位置编号、签到时间用三个独立的嵌入层转换为潜表示。对每个用户序列,将其嵌入表示写为:
每个签到的用户轨迹嵌入层的输出:
S304、时空嵌入层,将每个小时eΔt和每一百米eΔs作为基本单元,提出时间和空间差的单位嵌入层。对于每两个访问点之间的时间差和空间差的嵌入表示,计算其真实差值乘以单位嵌入表示:
步骤S4中的构建自注意聚合层具体步骤如下:
使用自注意力机制可以捕捉长期记忆,聚合轨迹内相关的访问点并且以此更新每个访问点。每一个访问点对当前点的影响和时空关联均会被考虑。首先构建一个掩模矩阵,其左上角元素为1,其余元素为0;并根据轨迹数据特征维度构建参数矩阵,计算出该层输出:
Seq(u)=Attention(E(u)WQ,E(u)WK,E(u)WV,E(Δ),M) (11)
其中:
步骤S5中的构建注意匹配层具体步骤如下:
通过用户轨迹更新后的表示Seq(u),地点集合的嵌入表示E(l)和候选时空关联矩阵E(N),计算每个候选地点为下一个访问点的概率,从候选地点集合中召回最有可能下一步访问的地点:
A(u)=Matching(E(l),S(u),E(N)) (13)
其中:
下面对本发明所涉及的关键技术进行说明:
(一)相关定理及证明
定义1 projected-k<item>。给定序列数据库S,扫描初始数据库,得到频繁1项集item=(<item1>,<item2>…<itemm>),则将序列数据库S做关于item中任意频繁项<itemj>(j≤len(item))所作投影数据库记为projected-1<itemj>,以此类推,扫描projected-(k-1)<item>,得到频繁1项集item'=(<item1>,<item2>…<itemn>),将序列数据库projected-(k-1)<item>做关于item'中任意频繁项<itemj>(j≤len(item'))所作投影数据库记为projected-k<itemj>。
定理1在具有周期性的行为轨迹数据中,对于数据点(ti,li)和(tj,lj),如果满足:li=lj,|tj-ti|=nΔT+ε,其中,n是任意正整数,ΔT是时间周期,ε是指定阈值,则称li或lj是频繁点,<(ti,li)>和<(tj,lj)>称为相同点。
定理2设数据库S中存在序列模式<(t1,l1)>,迭代挖掘投影数据库projected-1<(t1,l1)>,得到以<(t1,l1)>为前缀的序列模式集设为β;对于投影数据库projected-2<(t1,l1)>迭代挖掘得到以<(t1,l1)>为前缀的序列模式集α,那么
证明:设序列数据库向量形式为S=[λ1,λ2…λn],其中λi=(t1,l1),(t2,l2),(t3,l3)…(th,lh),扫描数据库得到频繁1模式[<(ti,li)>,<(tj,lj)>…<(tk,lk)>](ti<tj<tk)。数据库S关于频繁项<(tj,lj)>投影得到projected-1<(tj,lj)>=[λ'1,λ'2…λ'n],其中,如果λk(1≤k≤n)中不包含<(tj,lj)>,则λ'k=Φ;否则,λ'k是λk子集,同理,如果数据库S先关于频繁项<(ti,li)>投影,那么得到projected-1<(ti,li)>=[λ”1,λ”2…λ”n]。扫描数据库projected-1<(ti,li)>,如果<(tj,lj)>仍然为频繁1模式,那么数据库projected-1<(ti,li)>关于频繁项<(tj,lj)>投影,得到projected-2<(tj,lj)>=[λ”'1,λ”'2…λ”'n]。因为ti<tj,如果数据库S序列λk同时存在(ti,li)和(tj,lj),那么(ti,li)一定在(tj,lj)前,λ”'k=λ'k;如果数据库S序列λk仅存在(ti,li)不存在(tj,lj),那么λ”k=λ”'k=φ,如果数据库S序列λk仅存在(tj,lj)不存在(ti,li),那么λ'k=λ”'k=φ,综上所述,projected-2<(tj,lj)>是projected-1<(tj,lj)>的子集,所以projected-2<(tj,lj)>的序列模式集α是projected-1<(tj,lj)>的序列模式集β的子集。
(二)SMM算法
(三)TDM-PrefixSpan算法
本发明公开一种基于时空注意网络的校园用户下一个位置预测方法,该方法首先依据时间序列分布特征,采用具有轨迹数据预处理的SMM(移动统计模型)算法,通过分段合并和自适应调整方法去除异常数据,解决轨迹数据存在的大量pingpong效应;其次采用频繁项集逆序挖掘序列模式,通过已挖掘的序列模式集迭代去除冗余项集得到待挖掘序列模式集;将用户整个历史轨迹分为若干个时间窗,学习每条历史数据用户编号、位置编号、签到时间和时空效应并转为向量表示构建多模态嵌入层;构建自注意聚合层,聚合用户轨迹内重要的相关位置,捕获长期依赖更新每次签到的表示;构建注意匹配层,从加权签入表示计算softmax概率,与用户轨迹的更新表示进行匹配,召回最可信的候选人。本发明大幅度压缩数据库,提高轨迹模式挖掘性能,有效提高个性化预测召回率。
以上所述是本发明的优选实施方式而已,当然不能以此来限定本发明之权利范围,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和变动,这些改进和变动也视为本发明的保护范围。
Claims (6)
1.一种基于时空注意网络的校园用户下一个位置预测方法,其特征在于,包括以下步骤:
S1、数据预处理:针对pingpong效应提出移动统计模型算法;
S2、挖掘用户频繁序列轨迹:提出TDM-PrefixSpan算法,针对数据的周期性进行归一化,采用频繁项集逆序挖掘序列,提高算法效率,连接生成新的频繁项集,构造校园用户行为轨迹模型;
S3、划分时间窗、构建多模态嵌入层:用户轨迹嵌入层将用户编号u、位置编号l、签到时间t分别编码为潜在表示成eu,el,et,将标量转换成密集向量,提高计算效率,分别以小时和百米作为基本单位嵌入向量,对时空间隔进行单位化的向量表示,得到稀疏关系编码;
S4、构建自注意聚合层:首先构造掩模矩阵,通过嵌入轨迹矩阵维度定义的参数矩阵来计算一个新的序列,考虑不同的空间距离和时间间隔在一个轨迹上的两次访问,聚合相关的访问地点并更新每次访问的表示;
S5、构建注意匹配层:通过用户轨迹的更新表示与候选时空关联矩阵进行匹配,从所有候选位置中召回最可信的候选人。
2.如权利要求1所述的一种基于时空注意网络的校园用户下一个位置预测方法,其特征在于,所述步骤S1的数据预处理具体步骤如下:
S101、给定子数据集dataSetSub、频繁元素阈值和划分长度length,将数据集按照以length长度进行分组并用中括号[]加以表示;
S102、依据分组结果,比较相邻两个分组是否相等,如果相等,则在序列数据集添加左花括号并将花括号位置索引记录到LeftBracketIndex数组中,按照相同方法添加右花括号,每对花括号表示一条以长度length为周期的频繁序列;
S103、如果LeftBracketIndex数组不为空,则说明数据集中存在pingpong效应,只保留异常数据的第一个元组项;
S104、依次检查pingpong效应序列所在花括号的左括号之前和右括号之后分组中的元素项,如果元素项属于花括号内元素则删除该元素;否则,删除花括号;
S105、调整length值,实验设置不超过频繁元素阈值,对于非pingpong效应部分子序列数据集再次分组循环处理。
3.如权利要求1所述的一种基于时空注意网络的校园用户下一个位置预测方法,其特征在于,所述步骤S2中的挖掘用户频繁序列轨迹如下:
S201、扫描原始数据集,得到频繁1项集,按照时间先后顺序依照时间戳从大到小排序,并删除数据集中非频繁项;
S202、投影频繁元素得到子投影数据库,执行第1步,得到当前子投影数据库频繁1项集;
S203、扫描子投影数据库频繁1项集,如果频繁元素已经存在于频繁序列库中,统计该频繁元素所包含某频繁序列在子投影数据库中出现次数,如果频繁序列出现次数大于支持度,那么该频繁序列亦是子投影数据库频繁序列;
S204、如果子投影数据库频繁1项集频繁元素不存在于频繁序列库中,则迭代执行第2步,并将各层循环得到的频繁元素和频繁序列构成字典存入频繁序列库中;
S205、对于原始数据集未挖掘频繁元素循环执行第2步及剩余步骤。
4.如权利要求1所述的一种基于时空注意网络的校园用户下一个位置预测方法,其特征在于,所述步骤S3中的划分时间窗、构建多模态嵌入层的具体步骤如下:
S301、考虑学生群体活动规律,按照以周期7天得整数倍时间间隔把时间序列划分成多个时间窗;
S302、计算轨迹内每个访问点之间的时空关联,分别得到时空关联矩阵和候选时空关联矩阵;
S303、用户轨迹嵌入层,将用户编号、位置编号、签到时间用三个独立的嵌入层转换为潜表示;
S304、时空嵌入层,将每个小时和每一百米作为基本单元,提出时间和空间差的单位嵌入层,对于每两个访问点之间的时间差和空间差的嵌入表示,计算其真实差值乘以单位嵌入表示。
5.如权利要求1所述的一种基于时空注意网络的校园用户下一个位置预测方法,其特征在于,所述步骤S4中的构建自注意聚合层具体步骤如下:
使用自注意力机制可以捕捉长期记忆,聚合轨迹内相关的访问点并且以此更新每个访问点,每一个访问点对当前点的影响和时空关联均会被考虑,首先构建一个掩模矩阵,其左上角元素为1,其余元素为0;并根据轨迹数据特征维度构建参数矩阵,计算出该层输出。
6.如权利要求1所述的一种基于时空注意网络的校园用户下一个位置预测方法,其特征在于,所述步骤S5中的构建注意匹配层具体步骤如下:
通过用户轨迹更新后的表示Seq(u),地点集合的嵌入表示E(l)和候选时空关联矩阵E(N),计算每个候选地点为下一个访问点的概率,从候选地点集合中召回最有可能下一步访问的地点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110768477.4A CN113505310A (zh) | 2021-07-07 | 2021-07-07 | 一种基于时空注意网络的校园用户下一个位置推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110768477.4A CN113505310A (zh) | 2021-07-07 | 2021-07-07 | 一种基于时空注意网络的校园用户下一个位置推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113505310A true CN113505310A (zh) | 2021-10-15 |
Family
ID=78011883
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110768477.4A Pending CN113505310A (zh) | 2021-07-07 | 2021-07-07 | 一种基于时空注意网络的校园用户下一个位置推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113505310A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113722605A (zh) * | 2021-11-03 | 2021-11-30 | 北京奇岱松科技有限公司 | 实时兴趣信息的计算方法及系统 |
CN114398462A (zh) * | 2022-03-24 | 2022-04-26 | 之江实验室 | 一种基于多源异构信息网络的目的地推荐方法及系统 |
CN115658933A (zh) * | 2022-12-28 | 2023-01-31 | 四川大学华西医院 | 心理状态知识库构建方法、装置、计算机设备及存储介质 |
WO2023178608A1 (zh) * | 2022-03-24 | 2023-09-28 | 之江实验室 | 一种基于多源异构信息网络的目的地推荐方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0101503D0 (en) * | 2000-01-20 | 2001-03-07 | Ibm | Method and system for data mining |
CN104035396A (zh) * | 2014-04-18 | 2014-09-10 | 重庆大学 | 基于无线传感器网络的分布式行为识别方法 |
CN111400620A (zh) * | 2020-03-27 | 2020-07-10 | 东北大学 | 基于时空嵌入Self-Attention的用户轨迹位置预测方法 |
WO2020145839A1 (en) * | 2019-01-11 | 2020-07-16 | Limited Liability Company "Topcon Positioning Systems" | Method and apparatus for improving the quality of position determination |
CN111798260A (zh) * | 2019-04-09 | 2020-10-20 | Oppo广东移动通信有限公司 | 用户行为预测模型构建方法、装置、存储介质及电子设备 |
-
2021
- 2021-07-07 CN CN202110768477.4A patent/CN113505310A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0101503D0 (en) * | 2000-01-20 | 2001-03-07 | Ibm | Method and system for data mining |
CN104035396A (zh) * | 2014-04-18 | 2014-09-10 | 重庆大学 | 基于无线传感器网络的分布式行为识别方法 |
WO2020145839A1 (en) * | 2019-01-11 | 2020-07-16 | Limited Liability Company "Topcon Positioning Systems" | Method and apparatus for improving the quality of position determination |
CN111798260A (zh) * | 2019-04-09 | 2020-10-20 | Oppo广东移动通信有限公司 | 用户行为预测模型构建方法、装置、存储介质及电子设备 |
CN111400620A (zh) * | 2020-03-27 | 2020-07-10 | 东北大学 | 基于时空嵌入Self-Attention的用户轨迹位置预测方法 |
Non-Patent Citations (2)
Title |
---|
吉根林;赵斌: "时空轨迹大数据模式挖掘研究进展", 数据采集与处理, vol. 30, no. 1 * |
孟祥武;李瑞昌;张玉洁;纪威宇;: "基于用户轨迹数据的移动推荐系统研究", 软件学报, no. 10 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113722605A (zh) * | 2021-11-03 | 2021-11-30 | 北京奇岱松科技有限公司 | 实时兴趣信息的计算方法及系统 |
CN114398462A (zh) * | 2022-03-24 | 2022-04-26 | 之江实验室 | 一种基于多源异构信息网络的目的地推荐方法及系统 |
WO2023178608A1 (zh) * | 2022-03-24 | 2023-09-28 | 之江实验室 | 一种基于多源异构信息网络的目的地推荐方法及系统 |
CN115658933A (zh) * | 2022-12-28 | 2023-01-31 | 四川大学华西医院 | 心理状态知识库构建方法、装置、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113505310A (zh) | 一种基于时空注意网络的校园用户下一个位置推荐方法 | |
Tekouabou et al. | Improving parking availability prediction in smart cities with IoT and ensemble-based model | |
Di et al. | Traffic congestion prediction by spatiotemporal propagation patterns | |
CN108650614B (zh) | 一种自动推断社会关系的移动用户位置预测方法与装置 | |
Do et al. | A probabilistic kernel method for human mobility prediction with smartphones | |
WO2022217839A1 (zh) | 一种基于深度时空相似性的空气质量预测方法 | |
CN113139140B (zh) | 基于时空感知gru并结合用户关系偏好的旅游景点推荐方法 | |
Liu et al. | Fedgru: Privacy-preserving traffic flow prediction via federated learning | |
Wang et al. | Predictability and prediction of human mobility based on application-collected location data | |
CN110619082B (zh) | 一种基于重复搜索机制的项目推荐方法 | |
CN110570044A (zh) | 基于循环神经网络和注意力机制的下一个地点预测方法 | |
He et al. | Graph attention spatial-temporal network for deep learning based mobile traffic prediction | |
Truong et al. | Content-based sensor search for the Web of Things | |
CN113762595A (zh) | 通行时间预测模型训练方法、通行时间预测方法及设备 | |
CN114694379B (zh) | 一种基于自适应动态图卷积的交通流预测方法及系统 | |
CN115545758A (zh) | 城市服务设施自适应增量选址的方法和系统 | |
CN111949877A (zh) | 一种个性化兴趣点推荐方法及系统 | |
Bermingham et al. | Mining place-matching patterns from spatio-temporal trajectories using complex real-world places | |
CN116108984A (zh) | 基于流量-poi因果关系推理的城市流量预测方法 | |
CN113283576A (zh) | 一种基于鲸鱼算法优化lstm的频谱感知方法 | |
CN115860179A (zh) | 轨迹预测方法、装置、设备、存储介质及程序产品 | |
CN116186581A (zh) | 一种基于图脉冲神经网络的楼层识别方法及系统 | |
CN116049887A (zh) | 基于轨迹预测的隐私轨迹发布方法和装置 | |
Al-Molegi et al. | Regions-of-interest discovering and predicting in smartphone environments | |
Chan et al. | SeqiBloc: mining multi-time spanning blockmodels in dynamic graphs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |