CN116484953A

CN116484953A - 一种出行目的推断方法及终端

Info

Publication number: CN116484953A
Application number: CN202310738026.5A
Authority: CN
Inventors: 宋轩; 张家祺; 范子沛; 赵奕丞; 舒家阳
Original assignee: Southwest University of Science and Technology
Current assignee: Southwest University of Science and Technology
Priority date: 2023-06-21
Filing date: 2023-06-21
Publication date: 2023-07-25
Anticipated expiration: 2043-06-21
Also published as: CN116484953B

Abstract

本发明公开一种出行目的推断方法及终端，提取与获取的轨迹数据对应的时间特征和空间兴趣点特征，将轨迹数据的起点位置、终点位置、时间特征和空间兴趣点特征输入至嵌入表示学习模型，输出与轨迹数据对应的低维向量表示，将低维向量表示输入至神经主题模型，使用无监督学习方法进行模型训练，得到训练完成的神经主题模型，使用训练完成的神经主题模型对待推断轨迹数据进行出行目的推断，通过结合轨迹数据与地图兴趣点数据，增强了出现目的推断的可解释性和合理性，结合嵌入表示学习和无监督学习完成模型训练，提高了模型的鲁棒性和泛化能力，且无需依赖数据标签，考虑到了不同出行场景和需求的影响，从而有效、准确地推断出行目的。

Description

一种出行目的推断方法及终端

技术领域

本发明涉及数据分析技术领域，尤其涉及一种出行目的推断方法及终端。

背景技术

近年来，随着移动互联网和智能化技术的快速发展，人们出行方式和出行目的也发生了巨大变化。在此背景下，如何更好地理解用户出行行为和出行目的，提供更为个性化的出行服务成为了出行服务领域的研究热点。

现有技术中，已经有一些方法被提出来解决出行目的推断问题。例如通过将旅游历史向量序列和商务历史向量序列输入已训练好的神经网络，得到旅游特征向量和商务特征向量，进而实现出行目的的预测。但这类方法对轨迹数据的预处理不足，并且未充分利用轨迹数据的时空特征以及地理空间信息，而这些信息对于提高出行目的推断的准确性至关重要。其次，现有技术在构建模型时不仅需要获取轨迹数据，还需要预先调查该轨迹的出行意图，这使得模型在不同场景下的适应性较差，缺乏可拓展性。此外，现有技术在处理不同出行目的类别方面也存在一定的局限性，即仅能粗粒度获取旅游出行和商务出行为的结果，对于城市内的日常出行目的无法有效推断。

发明内容

本发明所要解决的技术问题是：提供一种出行目的推断方法及终端，能够有效、准确地推断出行目的。

为了解决上述技术问题，本发明采用的一种技术方案为：

一种出行目的推断方法，包括步骤：

获取轨迹数据，并提取与所述轨迹数据对应的时间特征和空间兴趣点特征；

将所述轨迹数据的起点位置、终点位置、所述时间特征和所述空间兴趣点特征输入至嵌入表示学习模型，输出与所述轨迹数据对应的低维向量表示；

将所述低维向量表示输入至神经主题模型，使用无监督学习方法进行模型训练，得到训练完成的神经主题模型；

获取待推断轨迹数据，并使用所述训练完成的神经主题模型对所述待推断轨迹数据进行出行目的推断，得到推断结果。

为了解决上述技术问题，本发明采用的另一种技术方案为：

一种出行目的推断终端，包括存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

本发明的有益效果在于：提取与获取的轨迹数据对应的时间特征和空间兴趣点特征，将轨迹数据的起点位置、终点位置、时间特征和空间兴趣点特征输入至嵌入表示学习模型，输出与轨迹数据对应的低维向量表示，将低维向量表示输入至神经主题模型，使用无监督学习方法进行模型训练，得到训练完成的神经主题模型，使用训练完成的神经主题模型对待推断轨迹数据进行出行目的推断，通过结合轨迹数据与地图兴趣点数据，增强了出现目的推断的可解释性和合理性，结合嵌入表示学习和无监督学习完成模型训练，提高了模型的鲁棒性和泛化能力，且无需依赖数据标签，考虑到了不同出行场景和需求的影响，从而有效、准确地推断出行目的。

附图说明

图1为本发明实施例的一种出行目的推断方法的步骤流程图；

图2为本发明实施例的一种出行目的推断终端的结构示意图。

具体实施方式

为详细说明本发明的技术内容、所实现目的及效果，以下结合实施方式并配合附图予以说明。

请参照图1，本发明实施例提供了一种出行目的推断方法，包括步骤：

从上述描述可知，本发明的有益效果在于：提取与获取的轨迹数据对应的时间特征和空间兴趣点特征，将轨迹数据的起点位置、终点位置、时间特征和空间兴趣点特征输入至嵌入表示学习模型，输出与轨迹数据对应的低维向量表示，将低维向量表示输入至神经主题模型，使用无监督学习方法进行模型训练，得到训练完成的神经主题模型，使用训练完成的神经主题模型对待推断轨迹数据进行出行目的推断，通过结合轨迹数据与地图兴趣点数据，增强了出现目的推断的可解释性和合理性，结合嵌入表示学习和无监督学习完成模型训练，提高了模型的鲁棒性和泛化能力，且无需依赖数据标签，考虑到了不同出行场景和需求的影响，从而有效、准确地推断出行目的。

进一步地，所述提取与所述轨迹数据对应的时间特征和空间兴趣点特征包括：

从所述轨迹数据中确定开始时间、结束时间、出行持续时间、星期信息以及法定节假日信息；

根据所述开始时间、结束时间、出行持续时间、星期信息以及法定节假日信息生成与所述轨迹数据对应的时间特征；

获取所述轨迹数据在第一预设范围内的地图兴趣点数据；

将所述地图兴趣点数据与所述轨迹数据进行整合，得到所述轨迹数据中的关键点；

确定每一所述关键点在第二预设范围内的所有兴趣点；

确定每一所述兴趣点的类别，并计算每一所述兴趣点的类别在所述关键点出现的频率；

根据每一所述兴趣点的类别在所述关键点出现的频率生成与所述轨迹数据对应的空间兴趣点特征。

由上述描述可知，从轨迹数据中提取时间特征，然后将轨迹数据与地图兴趣点数据结合提取得到空间兴趣点特征，有助于捕捉轨迹周围环境的特征，便于后续模型训练时，模型进行特征学习。

进一步地，所述将所述低维向量表示输入至神经主题模型，使用无监督学习方法进行模型训练，得到训练完成的神经主题模型包括：

将所述低维向量表示输入至神经主题模型，使用变分自编码器和组合损失函数进行模型训练，得到训练完成的神经主题模型。

由上述描述可知，变分自编码器是一种无监督学习方法，可以将高维数据压缩成低维的潜在空间，并学习数据的生成分布，主题模型则可以将文本数据表示为一组主题，每个主题包含一些相关的单词，并用一个主题分布向量来表示文档中各个主题的重要性，使用无监督学习方法用于神经主题模型训练，可将轨迹数据转换为主题分布的形式，能够对轨迹数据进行全局建模和推断，无需依赖数据标签，提高了模型的预测精度和可解释性。

进一步地，所述组合损失函数包括边际似然函数和几何代理损失函数；

所述组合损失函数为：

；

，/>；

；

式中，表示所述组合损失函数，/>表示所述几何代理损失函数，/>表示所述边际似然函数，λ表示正则化参数，/>表示相似轨迹特征的隐藏表示之间的欧氏距离，S表示具有相似轨迹的集合，/>表示第i条轨迹的隐藏表示，/>表示第j条轨迹的隐藏表示，表示给定输入数据潜在表示的情况下输入数据的低维向量的概率分布，/>表示给定输入数据低维向量的情况下输入数据潜在表示的概率分布，/>表示输入数据低维向量的概率分布，e表示所述低维向量表示，z表示输入数据的潜在表示。

由上述描述可知，组合损失函数包括边际似然函数和几何代理损失函数，使得训练完成的模型能够从轨迹特征嵌入中学习主题分布，同时保持特征之间的几何关系，从而提高最后的出行目的推断的准确性和可靠性。

进一步地，还包括：

使用困惑度指标和主题一致性指标对所述训练完成的神经主题模型进行评估，得到评估结果；

根据所述评估结果对所述训练完成的神经主题模型进行优化。

由上述描述可知，采用困惑度和主题一致性这两个指标进行模型评估，可以确定模型的性能表现，困惑度可以用于评估模型对于新的轨迹数据的推断能力，主题一致性用于评估主题模型生成的主题是否具有一定的语义连贯性，根据评估结果对训练完成的神经主题模型进行优化，能够不断保持模型的精度，从而提高出行目的推断的准确性。

请参照图2，一种出行目的推断终端，包括存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

获取所述轨迹数据在第一预设范围内的地图兴趣点数据；

确定每一所述关键点在第二预设范围内的所有兴趣点；

所述组合损失函数为：

；

，/>；

；

进一步地，还包括：

本发明上述的出行目的推断方法及终端能够适用于智能交通管理、个性化推荐等场景中，以下通过具体实施方式进行说明：

实施例一

请参照图1，本实施例的一种出行目的推断方法，包括步骤：

S1、获取轨迹数据，并提取与所述轨迹数据对应的时间特征和空间兴趣点特征，具体包括：

S11、获取轨迹数据；

在一种可选的实施方式中，获取轨迹数据之后，对所述轨迹数据进行预处理，包括数据清洗、去噪、去重、标准化等，得到处理后的轨迹数据，以此保证数据的质量和可靠性。

S12、从所述轨迹数据中确定开始时间、结束时间、出行持续时间、星期信息以及法定节假日信息；

其中，所述星期信息即出行当天是一周中的星期几，以确定是工作日或周末，所述法定节假日信息即出行当天是否为法定节假日。

S13、根据所述开始时间、结束时间、出行持续时间、星期信息以及法定节假日信息生成与所述轨迹数据对应的时间特征。

S14、获取所述轨迹数据在第一预设范围内的地图兴趣点数据；

其中，所述第一预设范围为第一指定半径；

具体的，将所述轨迹数据的起点与终点分别作为原点，获取第一指定半径内的地图兴趣点（POI）数据。

S15、将所述地图兴趣点数据与所述轨迹数据进行整合，得到所述轨迹数据中的关键点。

S16、确定每一所述关键点在第二预设范围内的所有兴趣点；

其中，所述第二预设范围为第二指定半径；

具体的，以每一所述关键点为原点，确定在第二指定半径内的所有兴趣点。

S17、确定每一所述兴趣点的类别，并计算每一所述兴趣点的类别在所述关键点出现的频率，具体的：

；

式中，P_i表示每一所述兴趣点的类别在所述关键点出现的频率，N_i表示以每一所述关键点为原点确定的在第二指定半径内的所有兴趣点的类别的总数，表示以每一所述关键点为原点确定的在第二指定半径内的所有兴趣点的总数。

S18、根据每一所述兴趣点的类别在所述关键点出现的频率生成与所述轨迹数据对应的空间兴趣点特征。

S2、将所述轨迹数据的起点位置、终点位置、所述时间特征和所述空间兴趣点特征输入至嵌入表示学习模型，输出与所述轨迹数据对应的低维向量表示；

其中，将所有的轨迹数据表示为一个文本语料库，每条轨迹数据对应一个文档，轨迹中的每个特征对应一个单词，因此对于轨迹中的特征表示为：；M_ij表示第i条轨迹中的第j个特征，/>表示轨迹特征嵌入参数，/>表示出行目的嵌入参数。

S3、将所述低维向量表示输入至神经主题模型，使用无监督学习方法进行模型训练，得到训练完成的神经主题模型；

具体的，将所述低维向量表示输入至神经主题模型，使用变分自编码器（Variational Autoencoder，VAE）和组合损失函数进行模型训练，得到训练完成的神经主题模型；通过将每条轨迹数据看作一个文档，将轨迹中的每一个特征看作一个单词，对于每个文档，可以将其表示为一个由多个单词（即特征）组成的序列。

其中，所述组合损失函数包括边际似然函数和几何代理损失函数；

所述组合损失函数为：

；

，/>；

；

其中，所述组合损失函数需以最小化为目标，所述边际似然函数需以最大化为目标，所述几何代理损失函数需以最小化为目标，通过增加正则化参数使组合损失函数实现最小化。

在一种可选的实施方式中，使用随机ELBO（Evidence Lower Bound，证据下界）进行优化，并使用Adam优化器设置学习率。

S4、获取待推断轨迹数据，并使用所述训练完成的神经主题模型对所述待推断轨迹数据进行出行目的推断，得到推断结果。

S5、使用困惑度（perplexity）指标和主题一致性（topic coherence）指标对所述训练完成的神经主题模型进行评估，得到评估结果；

具体的，使用困惑度指标对所述训练完成的神经主题模型进行评估，得到困惑度数值，并使用基于词汇相关性的主题一致性方法，计算每个主题中的前n个高频词语之间的关联程度，得到主题一致性数值。

S6、根据所述评估结果对所述训练完成的神经主题模型进行优化。

采用了困惑度和主题一致性指标对模型进行评估，能够客观地反映模型的预测效果和解释性，同时，在模型设计过程中，充分考虑了模型的可解释性和可操作性，使得模型的结果更容易被理解和应用，此外，模型在前期设计效果不佳时允许反复迭代优化，进而可以快速提高出行目的推断的准确率。

表1保留轨迹特征嵌入与主题分布之间的几何关系对模型的影响

所述几何代理损失函数能够保留轨迹特征嵌入与主题分布之间的几何关系，如表1所示，当模型考虑轨迹特征嵌入与主题分布之间的几何关系时，困惑度低于不考虑该几何关系的模型，且主题一致性高于不考虑该几何关系的模型，说明考虑轨迹特征嵌入与主题分布之间的几何关系的神经主题模型具有更好的预测能力和语义连贯性，从而有效、准确地推断出行目的。

实施例二

请参照图2，本实施例的一种出行目的推断终端，包括存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现实施例一中的出行目的推断方法中的各个步骤。

综上所述，本发明提供的一种出行目的推断方法及终端，获取轨迹数据，并提取与所述轨迹数据对应的时间特征和空间兴趣点特征；将所述轨迹数据的起点位置、终点位置、所述时间特征和所述空间兴趣点特征输入至嵌入表示学习模型，输出与所述轨迹数据对应的低维向量表示；将所述低维向量表示输入至神经主题模型，使用无监督学习方法进行模型训练，得到训练完成的神经主题模型；获取待推断轨迹数据，并使用所述训练完成的神经主题模型对所述待推断轨迹数据进行出行目的推断，得到推断结果，通过结合轨迹数据与地图兴趣点数据，增强了出现目的推断的可解释性和合理性，结合嵌入表示学习和无监督学习完成模型训练，提高了模型的鲁棒性和泛化能力，且无需依赖数据标签，考虑到了不同出行场景和需求的影响，从而有效、准确地推断出行目的；并且，采用困惑度和主题一致性这两个指标进行模型评估，可以确定模型的性能表现，困惑度可以用于评估模型对于新的轨迹数据的推断能力，主题一致性用于评估主题模型生成的主题是否具有一定的语义连贯性，根据评估结果对训练完成的神经主题模型进行优化，能够不断保持模型的精度，从而提高出行目的推断的准确性。

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等同变换，或直接或间接运用在相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种出行目的推断方法，其特征在于，包括步骤：

2.根据权利要求1所述的一种出行目的推断方法，其特征在于，所述提取与所述轨迹数据对应的时间特征和空间兴趣点特征包括：

获取所述轨迹数据在第一预设范围内的地图兴趣点数据；

确定每一所述关键点在第二预设范围内的所有兴趣点；

3.根据权利要求1所述的一种出行目的推断方法，其特征在于，所述将所述低维向量表示输入至神经主题模型，使用无监督学习方法进行模型训练，得到训练完成的神经主题模型包括：

4.根据权利要求3所述的一种出行目的推断方法，其特征在于，所述组合损失函数包括边际似然函数和几何代理损失函数；

所述组合损失函数为：

；

，/>；

；

式中，表示所述组合损失函数，/>表示所述几何代理损失函数，/>表示所述边际似然函数，λ表示正则化参数，/>表示相似轨迹特征的隐藏表示之间的欧氏距离，S表示具有相似轨迹的集合，/>表示第i条轨迹的隐藏表示，/>表示第j条轨迹的隐藏表示，/>表示给定输入数据潜在表示的情况下输入数据的低维向量的概率分布，表示给定输入数据低维向量的情况下输入数据潜在表示的概率分布，/>表示输入数据低维向量的概率分布，e表示所述低维向量表示，z表示输入数据的潜在表示。

5.根据权利要求1所述的一种出行目的推断方法，其特征在于，还包括：

6.一种出行目的推断终端，包括存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现以下步骤：

7.根据权利要求6所述的一种出行目的推断终端，其特征在于，所述提取与所述轨迹数据对应的时间特征和空间兴趣点特征包括：

获取所述轨迹数据在第一预设范围内的地图兴趣点数据；

确定每一所述关键点在第二预设范围内的所有兴趣点；

8.根据权利要求6所述的一种出行目的推断终端，其特征在于，所述将所述低维向量表示输入至神经主题模型，使用无监督学习方法进行模型训练，得到训练完成的神经主题模型包括：

9.根据权利要求8所述的一种出行目的推断终端，其特征在于，所述组合损失函数包括边际似然函数和几何代理损失函数；

所述组合损失函数为：

；

，/>；

；

10.根据权利要求6所述的一种出行目的推断终端，其特征在于，还包括：