CN114398462A - 一种基于多源异构信息网络的目的地推荐方法及系统 - Google Patents

一种基于多源异构信息网络的目的地推荐方法及系统 Download PDF

Info

Publication number
CN114398462A
CN114398462A CN202210295939.XA CN202210295939A CN114398462A CN 114398462 A CN114398462 A CN 114398462A CN 202210295939 A CN202210295939 A CN 202210295939A CN 114398462 A CN114398462 A CN 114398462A
Authority
CN
China
Prior art keywords
information
vehicle
module
track
heterogeneous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210295939.XA
Other languages
English (en)
Other versions
CN114398462B (zh
Inventor
陈红阳
方辉
肖竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lab
Original Assignee
Zhejiang Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lab filed Critical Zhejiang Lab
Priority to CN202210295939.XA priority Critical patent/CN114398462B/zh
Publication of CN114398462A publication Critical patent/CN114398462A/zh
Application granted granted Critical
Publication of CN114398462B publication Critical patent/CN114398462B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Remote Sensing (AREA)
  • Biophysics (AREA)
  • Fuzzy Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于多源异构信息网络的目的地推荐方法及系统,该系统包括数据预处理模块、多源信息融合模块、异构神经网络推荐模块。数据预处理模块包括数据采集和数据清洗模块,本发明采集来自私家车OBD接口的车辆驾驶状态和来自GPS接口的车辆轨迹信息的数据,并对异常进行排查和清洗。多源信息融合包括轨迹时空信息处理和基于元路径的异构图构建方案,将轨迹地理信息与语义信息结合,通过构建多重元路径来建模结构化的空间特征。异构神经网络推荐模块包括聚合模块和动态交互模块,挖掘潜在的用户交互,利用动态异构网络分析用户的目的地偏好。本发明通过分析用户的出行轨迹,能为用户进行相对精准的目的地推荐,将结果推送到用户终端。

Description

一种基于多源异构信息网络的目的地推荐方法及系统
技术领域
本发明主要涉及推荐系统领域,主要涉及一种基于多源异构信息网络的目的地推荐方法及系统。
背景技术
随着传感器种类的多样、移动互联部署范围的扩大、高性能计算和可靠性存储技术的快速发展,轨迹数据的提取变得快捷和智能。在当前的大数据背景下,学者们从群体、动态、时空的角度理解城市人群移动行为和空间结构的关系,从而解决各类城市应用的问题,如导航服务、广告推送、交通管理等。其中基于位置的推荐系统成为研究的热点,包括兴趣点(Point-of-interest, POI)推荐、下一POI推荐、目的地推荐等。现有的推荐方法主要侧重于利用关于用户偏好、社会影响和地理影响的信息来量化用户的访问偏好,比如将社会影响与基于用户的协同过滤模型相结合,或用贝叶斯模型对地理影响进行建模等。除此之外,潜在因子模型、马尔科夫链等方法也被广泛应用于序列数据分析和推荐。为了考虑相邻POI之间的时间间隔和地理距离,一些研究将扩展的循环神经网络(Recurrent NeuralNetwork, RNN)应用到下一POI的时间和空间建模中,如ST-RNN、HST-LSTM。但这些方法都存在着一些不足,首先因为用户的签到行为具有一定的随机性,因而导致了签到数据较为分散和稀疏;其次,用户的停留行为是挖掘用户潜在目的地的关键因素,但经常被忽视;因此目前的目的地推荐系统的准确性还存在很大的提升空间。
发明内容
本发明的目的在于针对现有技术的不足,提出了一种基于多源异构信息网络的目的地推荐系统。
为实现上述目的,本发明的技术方案为:
本发明实施例的第一方面提出了一种基于多源异构信息网络的目的地推荐方法,包括以下步骤:
S1,采集轨迹时空信息,计算车辆停留的时空地理信息,据此进行数据清洗得到合理的轨迹时空信息;
S2,去除清洗后的冗余的轨迹时空信息,对去除冗余的轨迹时空信息所在位置区域的地图进行爬取,获得POI信息,并将POI信息与去冗余的轨迹时空信息进行匹配,使得所述POI信息与所述去除冗余的轨迹时空信息一一对应,根据POI信息包括的语义信息和位置信息以及所述去除冗余的轨迹时空信息构建多重元路径,基于元路径构建异构图;
S3,基于构建的异构图进行邻居信息聚合,得到节点表征信息,利用节点表征信息构建多头注意机制模型,训练该模型输出得到目的地推荐结果。
进一步地,所述采集轨迹时空信息具体为:采集来自于机动车OBD接口的车辆驾驶状态数据和来源于机动车GPS接口的车辆轨迹数据;所述车辆驾驶状态数据包括车辆点火指令、熄火指令、速度和方向;所述车辆轨迹数据包括车辆匿名化ID、车辆所在经纬度、当前时刻和位置语义信息。
进一步地,所述数据清洗的过程具体为:计算车辆停留的时空地理信息,利用
Figure 545145DEST_PATH_IMAGE001
原则判断,删除或基于改进的LSTM网络进行轨迹预测以修正不合理的轨迹时空信息;所述 车辆停留的时空地理信息包括车辆的停留时间、停留经纬度、停留时长和停留时间编码。
进一步地,利用STKmeans聚类算法去除清洗后的冗余的轨迹时空信息;经STKmeans聚类算法后得到K个聚类中心,所述冗余的轨迹时空信息为K个聚类中心以外的所有点;去除冗余轨迹点即去除K个聚类中心以外的所有点,保留K个聚类中心。
进一步地,所述构建多重元路径的过程具体为:所述构建多重元路径的过程具体 为: 所述元路径有3条构建方案,分别为
Figure 418424DEST_PATH_IMAGE002
Figure 205114DEST_PATH_IMAGE003
Figure 189250DEST_PATH_IMAGE004
;其中
Figure 643366DEST_PATH_IMAGE005
表示起点,
Figure 421966DEST_PATH_IMAGE006
表示终点,
Figure 460067DEST_PATH_IMAGE007
表示两者连接的边;
Figure 982315DEST_PATH_IMAGE008
表示车辆 的唯一编号,
Figure 290936DEST_PATH_IMAGE009
表示车辆编号与起点的连接边,
Figure 240438DEST_PATH_IMAGE010
表示目的地与POI类型的连接边,
Figure 1720DEST_PATH_IMAGE011
表示匹配的POI类别。
进一步地,所述步骤S3具体包括以下子步骤:
S301,将步骤S2构建的异构图按连接边的类型分为异构子图;将异构子图中不同类型的节点进映射到同一特征空间,得到节点映射向量;
S302,将步骤S2构建的异构图中不同类型的边映射到同一特征空间,得到边映射向量;
S303,基于节点映射向量和边映射向量进行邻居聚合,获得每个节点的节点表征信息;
S304,将每个节点的节点表征信息进行合并,基于异构图中的时间序列构建多头注意机制模型,训练该模型输出得到目的地推荐结果。
本发明实施例的第二方面提供了一种基于多源异构信息网络的目的地推荐系统,具体包括数据预处理模块、多源信息融合模块和异构神经网络推荐模块;
所述数据预处理模块包括车辆目的地停留数据采集模块和数据清洗模块;所述车 辆目的地停留数据采集模块用于采集车辆的轨迹时空信息;所述数据清洗模块利用3
Figure 530922DEST_PATH_IMAGE012
原 则检测采集的轨迹时空信息中不合理的值,并对其删除或修正;
所述多源信息融合模块包括轨迹时空信息处理模块和异构图构建模块;所述轨迹时空信息处理模块用于处理冗余的轨迹时空信息、POI信息爬取和匹配;所述异构图构建模块用于构建多重元路径,并基于元路径构建异构图;
所述异构神经网络推荐模块包括信息聚合表征模块和序列推荐模块;所述信息聚合表征模块基于构建的异构图进行邻居信息聚合,得到节点表征信息;所述序列推荐模块用于利用节点表征信息构建多头注意机制模型,训练该模型输出得到目的地推荐结果。
本发明实施例的第三方面提供了一种电子设备,包括存储器和处理器,其中,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现上述的基于多源异构信息网络的目的地推荐方法。
本发明实施例的第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现上述的基于多源异构信息网络的目的地推荐方法。
本发明的有益效果为:本发明基于目的地推荐任务,引入了轨迹点匹配POI的方法,并且充分考虑了不同类型节点之间的交互关系,利用层次注意力机制进行多条路径下的信息聚合,提高了目的地推荐效果的准确性。
附图说明
图1为本发明方法的整体框架图;
图2为本发明提出的异构图的元路径构建方案;
图3为本发明提出的异构神经网络推荐模块;
图4为本发明提出的异构图聚合模块;
图5为本发明提出的异构图自注意力机制流程图;
图6为本发明装置的示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
下面对本发明的实施例作详细说明,本实施例以本发明的技术方案为依据开展,给出了详细的实施方式和具体的操作过程,对本发明的技术方案作进一步解释说明。
本实例提出了一种基于多源异构信息网络的目的地推荐系统,包括数据预处理模块、多源信息融合模块、异构神经网络推荐模块和用户终端。
所述数据预处理模块包括车辆目的地停留数据采集模块和数据清洗模块;所述车 辆目的地停留数据采集模块用于采集来自于机动车OBD接口的车辆驾驶状态数据和来源于 机动车GPS接口的车辆轨迹数据,并结合采集到的数据判断车辆的停留状态,从而得到车辆 停留的时空地理信息;所述数据清洗模块利用3
Figure 490788DEST_PATH_IMAGE013
原则检测采集的车辆目的地停留数据中 不合理的值,并对其删除或修正。
所述多源信息融合模块包括轨迹时空信息处理模块和异构图构建模块用于轨迹的时空信息处理和元路径的构建,时空信息处理过程包括去除冗余轨迹点、POI信息爬取和匹配。所述轨迹时空信息处理模块用于处理冗余的轨迹时空信息、POI信息爬取和匹配;所述异构图构建模块用于构建多重元路径,并基于元路径构建异构图。
所述异构神经网络推荐模块用于多层次邻居节点信息的聚合和节点信息的表征利用序列推荐模块获得最终的推荐结果。所述异构神经网络推荐模块包括信息聚合表征模块和序列推荐模块;所述信息聚合表征模块基于构建的异构图进行邻居信息聚合,得到节点表征信息;所述序列推荐模块用于利用节点表征信息构建多头注意机制模型,训练该模型输出得到目的地推荐结果。
所述用户终端用于将目的地推荐结果的发送到用户设备,并以可视化的方式呈现。
本方面实施例提出了一种基于多源异构信息网络的目的地推荐方法,参考图1所示,包括以下步骤:
(1)利用数据预处理模块进行数据预处理,所述数据预处理为采集车辆目的地停留数据,并对采集的数据进行数据清洗;具体包括以下子步骤:
(1.1)利用车辆目的地停留数据采集模块以采集频率为10s/次采集来自于机动车OBD接口的车辆驾驶状态数据和来源于机动车GPS接口的车辆轨迹数据;所述车辆驾驶状态数据包括车辆点火指令(即车辆开车)、熄火指令(即停车状态)、速度和方向;所述车辆轨迹数据包括车辆匿名化ID、车辆所在经纬度、当前时刻、位置语义信息。
(1.2)所述数据清洗模块利用
Figure 611190DEST_PATH_IMAGE014
原则对采集的不合理的车辆停留的时空地理信 息进行删除或修正;具体为:首先筛选或计算出车辆停留的时空地理信息,所述车辆停留的 时空地理信息包括车辆的停留时间、停留经纬度、停留时长(也称时间差)、和停留时间编 码,所述停留时间编码按照一周168小时进行编码。其次利用
Figure 626813DEST_PATH_IMAGE014
原则检测数据集中存在不 合理的值,并对其删除或修正;所述不合理的车辆停留的时空地理信息包括但不限于开车 时间间隔少于1分钟的数据、开车距离少于3米的数据、一个月内驾驶轨迹少于10条的数据, 以及根据历史和将来轨迹填充缺失轨迹。
其中,利用停留经纬度计算开车距离的计算公式为:
Figure 490864DEST_PATH_IMAGE015
其中,
Figure 508499DEST_PATH_IMAGE016
Figure 268644DEST_PATH_IMAGE017
分别为
Figure 4519DEST_PATH_IMAGE018
点的经度,
Figure 406682DEST_PATH_IMAGE019
Figure 544402DEST_PATH_IMAGE020
分别为
Figure 770722DEST_PATH_IMAGE018
点的维度,
Figure 728313DEST_PATH_IMAGE021
Figure 199746DEST_PATH_IMAGE022
表示任意两点的位置。
根据历史和将来轨迹填充缺失轨迹修正不合理的值具体为:利用基于改进的LSTM网络进行轨迹预测,将预测的经纬度作为缺失点的轨迹填充,其改进的LSTM网络具体包括:全连接层、长短时记忆网络层、随机失活层(dropout层)。另外还考虑了车辆历史时刻的方向和速度特征,编码后作为外部特征,与改进的LSTM网络级联,输入为车辆历史时刻的位置、方向、速度,输出为下一位置点。
(2)利用多源信息融合模块进行多源信息融合,包括轨迹时空信息处理和元路径构建,处理清洗后的轨迹时空信息,去除冗余轨迹点,对去除冗余的轨迹时空信息所在位置区域的地图进行爬取,获得POI信息(Point of Interest,兴趣点),并将POI信息与去冗余的轨迹时空信息进行匹配,使得所述POI信息与所述去除冗余的轨迹时空信息一一对应,根据POI信息包括的语义信息和位置信息以及所述去除冗余的轨迹时空信息构建多重元路径,基于元路径构建异构图;具体包括以下子步骤:
(2.1)首先通过STKmeans(Spatial-Temporal Kmeans)聚类算法去除冗余轨迹时空信息,进行轨迹时空信息处理,并选择评价指标来评估模型。具体包括以下子步骤:
(2.1.1)随机初始化参数距离差权重
Figure 191973DEST_PATH_IMAGE023
,时间差权重
Figure 825079DEST_PATH_IMAGE024
,K个聚类中心,其中
Figure 535546DEST_PATH_IMAGE025
(2.1.2)使用梯度下降法将样本集分配到最近邻聚类,聚类目标为是使各个点之间的距离最小以及时间差最小,计算公式如下:
Figure 545091DEST_PATH_IMAGE026
式中,
Figure 391824DEST_PATH_IMAGE027
属于第i类簇
Figure 962876DEST_PATH_IMAGE028
中的任一点,
Figure 895060DEST_PATH_IMAGE029
是第i类簇
Figure 708295DEST_PATH_IMAGE030
的中心点,时间差是计算 按24小时编码后的时间差;
Figure 675114DEST_PATH_IMAGE031
Figure 650023DEST_PATH_IMAGE032
点的停留时间编码,
Figure 335083DEST_PATH_IMAGE033
为中心点的停留时间编码。
(2.1.3)根据每个样本的位置均值更新聚类中心。
(2.1.4)重复步骤(2.1.2)~(2.1.3),直到梯度不在下降。
(2.1.5)得到K个聚类中心和所有点的聚类标签;所述冗余轨迹时空信息为K个聚类中心以外的所有点;去除冗余轨迹点即去除K个聚类中心以外的所有点,保留K个聚类中心。
所述的聚类算法的评估指标选用适用于时空数据的Davies-Bouldin指数(Dbi),其公式为:
Figure 686430DEST_PATH_IMAGE034
其中,
Figure 507755DEST_PATH_IMAGE035
Figure 152101DEST_PATH_IMAGE036
分别表示第i类和j类的类内分散度,公式表达为:
Figure 58877DEST_PATH_IMAGE037
Figure 213915DEST_PATH_IMAGE038
表示第i类和j类的类间距离,公式为:
Figure 472038DEST_PATH_IMAGE040
Figure 866110DEST_PATH_IMAGE041
表示第i类的中心点的第k个属性的值。
(2.2)对去除冗余的轨迹时空信息所在位置区域的地图利用python中的requests函数进行爬取,获得POI信息,并将POI信息与去冗余的轨迹时空信息进行匹配,使得所述POI信息与所述去除冗余的轨迹时空信息一一对应,根据POI信息包括的语义信息和位置信息以及所述去除冗余的轨迹时空信息构建多重元路径,基于元路径构建异构图。
所述POI信息还可包括POI的ID、POI点名称、POI类型、该POI的中心点到请求坐标的距离、方向、POI地址信息、坐标点、POI所在商圈名称等等。
所述时空轨迹信息包括车辆的停留时间
Figure 559259DEST_PATH_IMAGE042
、停留经纬度
Figure 355177DEST_PATH_IMAGE043
、停留时长(也称时间 差)
Figure 598116DEST_PATH_IMAGE044
、和停留时间编码
Figure 213905DEST_PATH_IMAGE045
;所述停留时间编码按照一天24小时进行编码。
所述元路径有3条构建方案,如图2所示为本发明实施例提出的异构图的元路径构 建方案,分别为
Figure 710745DEST_PATH_IMAGE046
Figure 361169DEST_PATH_IMAGE047
Figure 285263DEST_PATH_IMAGE048
这3条构建方案。其中,
Figure 653927DEST_PATH_IMAGE049
表示起点,
Figure 688879DEST_PATH_IMAGE050
表示终点,
Figure 459389DEST_PATH_IMAGE051
表示两者连接的边;
Figure 787340DEST_PATH_IMAGE052
表示车辆的唯一编号,
Figure 377722DEST_PATH_IMAGE053
表 示车辆编号与起点的连接边,
Figure 216365DEST_PATH_IMAGE054
表示目的地与POI类型的连接边,
Figure 106960DEST_PATH_IMAGE055
表示匹配的POI 类别。该POI类别由高德地图等导航地图软件的API接口获取,匹配原则优先考虑两者之间 的空间距离、POI面积大小、与待匹配坐标点的地理距离,所有类型的边的特征由停留时长 分布函数进行量化表示。
所述停留时长分布函数本发明实施例中选用基于逆高斯模型的概率密度分布函数,其公式为:
Figure 372856DEST_PATH_IMAGE056
其中,
Figure 450534DEST_PATH_IMAGE057
为逆高斯分布的超参数,
Figure 827289DEST_PATH_IMAGE058
作为所有类型边对应的停留时长的特征 值。
(3)基于步骤(2)构建的异构图,进行异构神经网络推荐,首先利用信息聚合模块进行邻居节点信息的聚合和节点表征,然后利用序列推荐模块获得最终的推荐结果。所述信息聚合模块利用基于元路径随机游走挖掘邻居,然后利用层次注意力机制进行邻居节点信息的集合,提高节点的表征效果;所述序列推荐模块是利用节点历史上的表征序列,利用transformer进行时间上的建模,获得推荐结果。
图3 为本发明提出的异构神经网络推荐模块,按如下步骤依次进行:
(3.1)将步骤(2)构建的异构图按连接边的类型分为异构子图;所述异构子图由异构图中的元路径所构建,只包括一种类型的连接边。即根据某一条元路径中的某一节点类型,搜索与它相邻类型的节点,并匹配两者之间的连接关系。
将异构子图中不同类型的节点进映射到同一特征空间,其公式为:
Figure 306812DEST_PATH_IMAGE059
其中,
Figure 245074DEST_PATH_IMAGE060
是从上一层的第m个头(head)中
Figure 810047DEST_PATH_IMAGE061
类型的空间到
Figure 990493DEST_PATH_IMAGE062
层的映 射,
Figure 590102DEST_PATH_IMAGE063
Figure 197801DEST_PATH_IMAGE064
类型空间的转换系数,节点(node)类型包括
Figure 984491DEST_PATH_IMAGE065
(3.2)将步骤(2)构建的异构图中不同类型的边映射到同一特征空间,公式为:
Figure 968627DEST_PATH_IMAGE066
其中,
Figure 422743DEST_PATH_IMAGE067
是从上一层的第m个头(head)中
Figure 434299DEST_PATH_IMAGE068
类型的空间到
Figure 973864DEST_PATH_IMAGE069
层的映 射,
Figure 496113DEST_PATH_IMAGE070
Figure 804734DEST_PATH_IMAGE071
类型空间的转换系数,
Figure 754236DEST_PATH_IMAGE072
是边的停留时间特征。edge类型包括
Figure 781097DEST_PATH_IMAGE073
类似的,边映射的公式为:
Figure 575878DEST_PATH_IMAGE074
Figure 270165DEST_PATH_IMAGE075
其中,
Figure 892032DEST_PATH_IMAGE067
是从上一层的第m个头(head)中
Figure 140611DEST_PATH_IMAGE068
类型的空间到
Figure 4662DEST_PATH_IMAGE069
层的映射,
Figure 287876DEST_PATH_IMAGE070
Figure 782442DEST_PATH_IMAGE071
类型空间的转换系数,
Figure 518317DEST_PATH_IMAGE072
是边的停留时间特征。edge类型包括
Figure 186059DEST_PATH_IMAGE076
。将m个head中
Figure 822314DEST_PATH_IMAGE077
类型的空间到
Figure 284519DEST_PATH_IMAGE078
层的映射合并得到第a条边的特征 表示
Figure 304428DEST_PATH_IMAGE079
(3.3)基于节点映射向量和边映射向量进行邻居聚合,如图4所示,然后进行邻居聚合来获得每个节点的节点表征信息,其具体步骤如下:
(3.3.1)对于节点类型相同的元路径,形如
Figure 979123DEST_PATH_IMAGE080
的信息聚合,主要关注节 点特征的变化,先随机失活节点防止模型过拟合,再经过节点注意力层计算各个邻居节点 的重要性;对于节点类型不相同的元路径,形如
Figure 971350DEST_PATH_IMAGE081
Figure 604456DEST_PATH_IMAGE082
的信息聚合, 主要关注边的特征,先随机失活连接边,再经过边注意力层计算各个连接边的重要性。
将多种类型的点或边根据步骤(3.2)的公式映射到同一特征空间,然后选用缩放点积模型的注意力得分系数来反映邻居特征向量对给定中心节点的重要程度,定义如下:
Figure 314923DEST_PATH_IMAGE083
其中,
Figure 324468DEST_PATH_IMAGE084
表示第a条边的特征表示
Figure 672666DEST_PATH_IMAGE085
的转置。在选择第a条边时,考虑其停留时间 分布,计算的概率
Figure 7832DEST_PATH_IMAGE086
如下公式:
Figure 674437DEST_PATH_IMAGE087
邻居信息聚合的公式表示如下:
Figure 487672DEST_PATH_IMAGE088
其中,E为连接边的条数,
Figure 188912DEST_PATH_IMAGE089
表示对于节点node的所有连接边信息的聚合 表征。
(3.3.2)将该步骤(3.3.1)的聚合表征结果经过SoftMax层进行归一化处理,再经由全连接层输出,得到节点表征信息。
(3.4)基于步骤(3.3)输出的的计算结果,将输出结果进行级联,经过异构图自注意力机制建模时间序列,产生推荐结果,将该推荐结果输入到用户终端中,图5为本发明提出的异构图自注意力机制流程图,其具体步骤如下:
(3.4.1)滑动选取
Figure 429400DEST_PATH_IMAGE090
个历史时间段的异构图的特征矩阵,并通过嵌入层将其映射 到同一特征空间,得到嵌入向量
Figure 848880DEST_PATH_IMAGE091
(3.4.2)初始化三个权重矩阵
Figure 465806DEST_PATH_IMAGE092
,根据权重矩阵计算嵌入向量的Q,K,V值, 再利用缩放点积公式计算向量相似度
Figure 785667DEST_PATH_IMAGE093
。公式如下:
Figure 197057DEST_PATH_IMAGE094
Figure 103833DEST_PATH_IMAGE095
其中,d表示Q,K,V的维度,用于调节内积过大的情况。
(3.4.3)基于步骤(3.4.2)计算的结果,将多个头产生的结果进行级联,通过经过线性层输出注意力分数的结果。
(3.4.4)基于步骤(3.4.3)输出的注意力分数的结果,将所选历史时间段的结果再 次级联,经由多层感知机输出所有地点选项的可能性分数,选取
Figure 258871DEST_PATH_IMAGE096
个可能性最大的结果,
(3.4.5)利用均方根作为损失函数对模型进行训练,重复步骤(3.4.2)~(3.4.4),直到达到预设的训练精度,完成该模型的训练,输出得到目的地推荐结果。
(3.4.6)将步骤(3.4.5)输出的推荐结果输入到用户终端中,完成目的地推荐。
与前述一种基于多源异构信息网络的目的地推荐方法的实施例相对应,本发明还提供了一种基于多源异构信息网络的目的地推荐装置的实施例。
参见图6,本发明实施例提供的一种基于多源异构信息网络的目的地推荐装置,包括一个或多个处理器,用于实现上述实施例中的基于多源异构信息网络的目的地推荐方法。
本发明基于多源异构信息网络的目的地推荐装置的实施例可以应用在任意具备数据处理能力的设备上,该任意具备数据处理能力的设备可以为诸如计算机等设备或装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在任意具备数据处理能力的设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图6所示,为本发明基于多源异构信息网络的目的地推荐装置所在任意具备数据处理能力的设备的一种硬件结构图,除了图6所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的任意具备数据处理能力的设备通常根据该任意具备数据处理能力的设备的实际功能,还可以包括其他硬件,对此不再赘述。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本发明实施例还提供一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时,实现上述实施例中的基于多源异构信息网络的目的地推荐方法。
所述计算机可读存储介质可以是前述任一实施例所述的任意具备数据处理能力的设备的内部存储单元,例如硬盘或内存。所述计算机可读存储介质也可以是任意具备数据处理能力的设备,例如所述设备上配备的插接式硬盘、智能存储卡(Smart Media Card,SMC)、SD卡、闪存卡(Flash Card)等。进一步的,所述计算机可读存储介质还可以既包括任意具备数据处理能力的设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述任意具备数据处理能力的设备所需的其他程序和数据,还可以用于暂时地存储已经输出或者将要输出的数据。
综上所述,本发明基于目的地推荐任务,引入了轨迹点匹配POI,并且充分考虑了不同类型节点之间的交互关系,利用层次注意力机制进行多条路径下的信息聚合,提高了目的地推荐效果的准确性。
以上实施例仅用于说明本发明的设计思想和特点,其目的在于使本领域内的技术人员能够了解本发明的内容并据以实施,本发明的保护范围不限于上述实施例。所以,凡依据本发明所揭示的原理、设计思路所作的等同变化或修饰,均在本发明的保护范围之内。

Claims (9)

1.一种基于多源异构信息网络的目的地推荐方法,其特征在于,包括以下步骤:
S1,采集轨迹时空信息,计算车辆停留的时空地理信息,据此进行数据清洗得到合理的轨迹时空信息;
S2,去除清洗后的冗余的轨迹时空信息,对去除冗余的轨迹时空信息所在位置区域的地图进行爬取,获得POI信息,并将POI信息与去冗余的轨迹时空信息进行匹配,使得所述POI信息与所述去除冗余的轨迹时空信息一一对应,根据POI信息包括的语义信息和位置信息以及所述去除冗余的轨迹时空信息构建多重元路径,基于元路径构建异构图;
S3,基于构建的异构图进行邻居信息聚合,得到节点表征信息,利用节点表征信息构建多头注意机制模型,训练该模型输出得到目的地推荐结果。
2.根据权利要求1所述的基于多源异构信息网络的目的地推荐方法,其特征在于,所述采集轨迹时空信息具体为:采集来自于机动车OBD接口的车辆驾驶状态数据和来源于机动车GPS接口的车辆轨迹数据;所述车辆驾驶状态数据包括车辆点火指令、熄火指令、速度和方向;所述车辆轨迹数据包括车辆匿名化ID、车辆所在经纬度、当前时刻和位置语义信息。
3.根据权利要求1所述的基于多源异构信息网络的目的地推荐方法,其特征在于,所述 数据清洗的过程具体为:计算车辆停留的时空地理信息,利用
Figure 645184DEST_PATH_IMAGE001
原则判断,删除或基于改 进的LSTM网络进行轨迹预测以修正不合理的轨迹时空信息;所述车辆停留的时空地理信息 包括车辆的停留时间、停留经纬度、停留时长和停留时间编码。
4.根据权利要求1所述的基于多源异构信息网络的目的地推荐方法,其特征在于,利用STKmeans聚类算法去除清洗后的冗余的轨迹时空信息;经STKmeans聚类算法后得到K个聚类中心,所述冗余的轨迹时空信息为K个聚类中心以外的所有点;去除冗余轨迹点即去除K个聚类中心以外的所有点,保留K个聚类中心。
5.根据权利要求1所述的基于多源异构信息网络的目的地推荐方法,其特征在于,所述 构建多重元路径的过程具体为: 所述元路径有3条构建方案,分别为
Figure 93483DEST_PATH_IMAGE002
Figure 810903DEST_PATH_IMAGE003
Figure 143795DEST_PATH_IMAGE004
;其中
Figure 895851DEST_PATH_IMAGE005
表示起点,
Figure 423040DEST_PATH_IMAGE006
表示终点,
Figure 831019DEST_PATH_IMAGE007
表示两者连接的 边;
Figure 561078DEST_PATH_IMAGE008
表示车辆的唯一编号,
Figure 433219DEST_PATH_IMAGE009
表示车辆编号与起点的连接边,
Figure 833107DEST_PATH_IMAGE010
表示目的地与POI 类型的连接边,
Figure 118595DEST_PATH_IMAGE011
表示匹配的POI类别。
6.根据权利要求1所述的基于多源异构信息网络的目的地推荐方法,其特征在于,所述步骤S3具体包括以下子步骤:
S301,将步骤S2构建的异构图按连接边的类型分为异构子图;将异构子图中不同类型的节点进映射到同一特征空间,得到节点映射向量;
S302,将步骤S2构建的异构图中不同类型的边映射到同一特征空间,得到边映射向量;
S303,基于节点映射向量和边映射向量进行邻居聚合,获得每个节点的节点表征信息;
S304,将每个节点的节点表征信息进行合并,基于异构图中的时间序列构建多头注意机制模型,训练该模型输出得到目的地推荐结果。
7.一种基于多源异构信息网络的目的地推荐系统,其特征在于,具体包括数据预处理模块、多源信息融合模块和异构神经网络推荐模块;
所述数据预处理模块包括车辆目的地停留数据采集模块和数据清洗模块;所述车辆目 的地停留数据采集模块用于采集车辆的轨迹时空信息;所述数据清洗模块利用3
Figure 760667DEST_PATH_IMAGE012
原则检 测采集的轨迹时空信息中不合理的值,并对其删除或修正;
所述多源信息融合模块包括轨迹时空信息处理模块和异构图构建模块;所述轨迹时空信息处理模块用于处理冗余的轨迹时空信息、POI信息爬取和匹配;所述异构图构建模块用于构建多重元路径,并基于元路径构建异构图;
所述异构神经网络推荐模块包括信息聚合表征模块和序列推荐模块;所述信息聚合表征模块基于构建的异构图进行邻居信息聚合,得到节点表征信息;所述序列推荐模块用于利用节点表征信息构建多头注意机制模型,训练该模型输出得到目的地推荐结果。
8.一种电子设备,包括存储器和处理器,其特征在于,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现上述权利要求1-6任一项所述的基于多源异构信息网络的目的地推荐方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-6中任一所述的基于多源异构信息网络的目的地推荐方法。
CN202210295939.XA 2022-03-24 2022-03-24 一种基于多源异构信息网络的目的地推荐方法及系统 Active CN114398462B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210295939.XA CN114398462B (zh) 2022-03-24 2022-03-24 一种基于多源异构信息网络的目的地推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210295939.XA CN114398462B (zh) 2022-03-24 2022-03-24 一种基于多源异构信息网络的目的地推荐方法及系统

Publications (2)

Publication Number Publication Date
CN114398462A true CN114398462A (zh) 2022-04-26
CN114398462B CN114398462B (zh) 2022-08-09

Family

ID=81235063

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210295939.XA Active CN114398462B (zh) 2022-03-24 2022-03-24 一种基于多源异构信息网络的目的地推荐方法及系统

Country Status (1)

Country Link
CN (1) CN114398462B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114896514A (zh) * 2022-07-14 2022-08-12 西安电子科技大学 一种基于图神经网络的Web API标签推荐方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011075474A (ja) * 2009-10-01 2011-04-14 Yupiteru Corp 位置軌跡データ処理装置、及び、そのプログラム
CN108256590A (zh) * 2018-02-23 2018-07-06 长安大学 一种基于复合元路径的相似出行者识别方法
CN113254803A (zh) * 2021-06-24 2021-08-13 暨南大学 一种基于多特征异质图神经网络的社交推荐方法
WO2021179838A1 (zh) * 2020-03-10 2021-09-16 支付宝(杭州)信息技术有限公司 一种基于异构图神经网络模型进行预测的方法和系统
CN113505310A (zh) * 2021-07-07 2021-10-15 辽宁工程技术大学 一种基于时空注意网络的校园用户下一个位置推荐方法
CN113505294A (zh) * 2021-06-15 2021-10-15 黄萌 一种融合元路径的异质网络表示推荐算法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011075474A (ja) * 2009-10-01 2011-04-14 Yupiteru Corp 位置軌跡データ処理装置、及び、そのプログラム
CN108256590A (zh) * 2018-02-23 2018-07-06 长安大学 一种基于复合元路径的相似出行者识别方法
WO2021179838A1 (zh) * 2020-03-10 2021-09-16 支付宝(杭州)信息技术有限公司 一种基于异构图神经网络模型进行预测的方法和系统
CN113505294A (zh) * 2021-06-15 2021-10-15 黄萌 一种融合元路径的异质网络表示推荐算法
CN113254803A (zh) * 2021-06-24 2021-08-13 暨南大学 一种基于多特征异质图神经网络的社交推荐方法
CN113505310A (zh) * 2021-07-07 2021-10-15 辽宁工程技术大学 一种基于时空注意网络的校园用户下一个位置推荐方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LIWEI HUANG ET AL.: "An Attention-Based Spatiotemporal LSTM Network for Next POI Recommendation", 《IEEE TRANSACTIONS ON SERVICES COMPUTING》 *
孟祥武等: "基于用户轨迹数据的移动推荐系统研究", 《软件学报》 *
程静等: "基于时间序列聚类方法分析北京出租车出行量的时空特征", 《地球信息科学学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114896514A (zh) * 2022-07-14 2022-08-12 西安电子科技大学 一种基于图神经网络的Web API标签推荐方法
CN114896514B (zh) * 2022-07-14 2022-09-30 西安电子科技大学 一种基于图神经网络的Web API标签推荐方法

Also Published As

Publication number Publication date
CN114398462B (zh) 2022-08-09

Similar Documents

Publication Publication Date Title
Wang et al. Learning to estimate the travel time
Hamdi et al. Spatiotemporal data mining: a survey on challenges and open problems
Siła-Nowicka et al. Analysis of human mobility patterns from GPS trajectories and contextual information
Zheng Trajectory data mining: an overview
Biagioni et al. Inferring road maps from global positioning system traces: Survey and comparative evaluation
Wang et al. The spatio-temporal modeling for criminal incidents
US20160125307A1 (en) Air quality inference using multiple data sources
Chen et al. CEM: A convolutional embedding model for predicting next locations
Rossi et al. Vehicle trajectory prediction and generation using LSTM models and GANs
Karagiorgou et al. A layered approach for more robust generation of road network maps from vehicle tracking data
CN114398462B (zh) 一种基于多源异构信息网络的目的地推荐方法及系统
Nohekhan et al. A deep learning model for off-ramp hourly traffic volume estimation
Rehrl et al. Why did a vehicle stop? A methodology for detection and classification of stops in vehicle trajectories
Wang et al. A deep trajectory clustering method based on sequence‐to‐sequence autoencoder model
CN114444794A (zh) 基于双注意力图嵌入网络的出行意图预测方法
Chen et al. Estimating traffic volume for local streets with imbalanced data
Wei et al. Delle: Detecting latest local events from geotagged tweets
WO2023178608A1 (zh) 一种基于多源异构信息网络的目的地推荐方法及系统
Bassetti et al. Exploiting user behavior to predict parking availability through machine learning
Huang Anomalous behavior detection in single-trajectory data
Hwang et al. Systematic Social Observation at Scale: Using Crowdsourcing and Computer Vision to Measure Visible Neighborhood Conditions
Hu et al. An image-based crash risk prediction model using visual attention mapping and a deep convolutional neural network
CN111949840A (zh) 一种基于物联网数据的拓扑图结构的构建方法、装置
CN115878877A (zh) 基于概念漂移的航空服务器访问爬虫的可视检测方法
Wang et al. Accurate Detection of Road Network Anomaly by Understanding Crowd's Driving Strategies from Human Mobility

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant