CN116484953A - 一种出行目的推断方法及终端 - Google Patents
一种出行目的推断方法及终端 Download PDFInfo
- Publication number
- CN116484953A CN116484953A CN202310738026.5A CN202310738026A CN116484953A CN 116484953 A CN116484953 A CN 116484953A CN 202310738026 A CN202310738026 A CN 202310738026A CN 116484953 A CN116484953 A CN 116484953A
- Authority
- CN
- China
- Prior art keywords
- track data
- data
- representing
- track
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000001537 neural effect Effects 0.000 claims abstract description 69
- 239000013598 vector Substances 0.000 claims abstract description 59
- 238000012549 training Methods 0.000 claims abstract description 28
- 230000006870 function Effects 0.000 claims description 50
- 238000011156 evaluation Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 8
- 230000002123 temporal effect Effects 0.000 claims description 4
- 230000002708 enhancing effect Effects 0.000 abstract description 5
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/041—Abduction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Databases & Information Systems (AREA)
- Remote Sensing (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种出行目的推断方法及终端,提取与获取的轨迹数据对应的时间特征和空间兴趣点特征,将轨迹数据的起点位置、终点位置、时间特征和空间兴趣点特征输入至嵌入表示学习模型,输出与轨迹数据对应的低维向量表示,将低维向量表示输入至神经主题模型,使用无监督学习方法进行模型训练,得到训练完成的神经主题模型,使用训练完成的神经主题模型对待推断轨迹数据进行出行目的推断,通过结合轨迹数据与地图兴趣点数据,增强了出现目的推断的可解释性和合理性,结合嵌入表示学习和无监督学习完成模型训练,提高了模型的鲁棒性和泛化能力,且无需依赖数据标签,考虑到了不同出行场景和需求的影响,从而有效、准确地推断出行目的。
Description
技术领域
本发明涉及数据分析技术领域,尤其涉及一种出行目的推断方法及终端。
背景技术
近年来,随着移动互联网和智能化技术的快速发展,人们出行方式和出行目的也发生了巨大变化。在此背景下,如何更好地理解用户出行行为和出行目的,提供更为个性化的出行服务成为了出行服务领域的研究热点。
现有技术中,已经有一些方法被提出来解决出行目的推断问题。例如通过将旅游历史向量序列和商务历史向量序列输入已训练好的神经网络,得到旅游特征向量和商务特征向量,进而实现出行目的的预测。但这类方法对轨迹数据的预处理不足,并且未充分利用轨迹数据的时空特征以及地理空间信息,而这些信息对于提高出行目的推断的准确性至关重要。其次,现有技术在构建模型时不仅需要获取轨迹数据,还需要预先调查该轨迹的出行意图,这使得模型在不同场景下的适应性较差,缺乏可拓展性。此外,现有技术在处理不同出行目的类别方面也存在一定的局限性,即仅能粗粒度获取旅游出行和商务出行为的结果,对于城市内的日常出行目的无法有效推断。
发明内容
本发明所要解决的技术问题是:提供一种出行目的推断方法及终端,能够有效、准确地推断出行目的。
为了解决上述技术问题,本发明采用的一种技术方案为:
一种出行目的推断方法,包括步骤:
获取轨迹数据,并提取与所述轨迹数据对应的时间特征和空间兴趣点特征;
将所述轨迹数据的起点位置、终点位置、所述时间特征和所述空间兴趣点特征输入至嵌入表示学习模型,输出与所述轨迹数据对应的低维向量表示;
将所述低维向量表示输入至神经主题模型,使用无监督学习方法进行模型训练,得到训练完成的神经主题模型;
获取待推断轨迹数据,并使用所述训练完成的神经主题模型对所述待推断轨迹数据进行出行目的推断,得到推断结果。
为了解决上述技术问题,本发明采用的另一种技术方案为:
一种出行目的推断终端,包括存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取轨迹数据,并提取与所述轨迹数据对应的时间特征和空间兴趣点特征;
将所述轨迹数据的起点位置、终点位置、所述时间特征和所述空间兴趣点特征输入至嵌入表示学习模型,输出与所述轨迹数据对应的低维向量表示;
将所述低维向量表示输入至神经主题模型,使用无监督学习方法进行模型训练,得到训练完成的神经主题模型;
获取待推断轨迹数据,并使用所述训练完成的神经主题模型对所述待推断轨迹数据进行出行目的推断,得到推断结果。
本发明的有益效果在于:提取与获取的轨迹数据对应的时间特征和空间兴趣点特征,将轨迹数据的起点位置、终点位置、时间特征和空间兴趣点特征输入至嵌入表示学习模型,输出与轨迹数据对应的低维向量表示,将低维向量表示输入至神经主题模型,使用无监督学习方法进行模型训练,得到训练完成的神经主题模型,使用训练完成的神经主题模型对待推断轨迹数据进行出行目的推断,通过结合轨迹数据与地图兴趣点数据,增强了出现目的推断的可解释性和合理性,结合嵌入表示学习和无监督学习完成模型训练,提高了模型的鲁棒性和泛化能力,且无需依赖数据标签,考虑到了不同出行场景和需求的影响,从而有效、准确地推断出行目的。
附图说明
图1为本发明实施例的一种出行目的推断方法的步骤流程图;
图2为本发明实施例的一种出行目的推断终端的结构示意图。
具体实施方式
为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图予以说明。
请参照图1,本发明实施例提供了一种出行目的推断方法,包括步骤:
获取轨迹数据,并提取与所述轨迹数据对应的时间特征和空间兴趣点特征;
将所述轨迹数据的起点位置、终点位置、所述时间特征和所述空间兴趣点特征输入至嵌入表示学习模型,输出与所述轨迹数据对应的低维向量表示;
将所述低维向量表示输入至神经主题模型,使用无监督学习方法进行模型训练,得到训练完成的神经主题模型;
获取待推断轨迹数据,并使用所述训练完成的神经主题模型对所述待推断轨迹数据进行出行目的推断,得到推断结果。
从上述描述可知,本发明的有益效果在于:提取与获取的轨迹数据对应的时间特征和空间兴趣点特征,将轨迹数据的起点位置、终点位置、时间特征和空间兴趣点特征输入至嵌入表示学习模型,输出与轨迹数据对应的低维向量表示,将低维向量表示输入至神经主题模型,使用无监督学习方法进行模型训练,得到训练完成的神经主题模型,使用训练完成的神经主题模型对待推断轨迹数据进行出行目的推断,通过结合轨迹数据与地图兴趣点数据,增强了出现目的推断的可解释性和合理性,结合嵌入表示学习和无监督学习完成模型训练,提高了模型的鲁棒性和泛化能力,且无需依赖数据标签,考虑到了不同出行场景和需求的影响,从而有效、准确地推断出行目的。
进一步地,所述提取与所述轨迹数据对应的时间特征和空间兴趣点特征包括:
从所述轨迹数据中确定开始时间、结束时间、出行持续时间、星期信息以及法定节假日信息;
根据所述开始时间、结束时间、出行持续时间、星期信息以及法定节假日信息生成与所述轨迹数据对应的时间特征;
获取所述轨迹数据在第一预设范围内的地图兴趣点数据;
将所述地图兴趣点数据与所述轨迹数据进行整合,得到所述轨迹数据中的关键点;
确定每一所述关键点在第二预设范围内的所有兴趣点;
确定每一所述兴趣点的类别,并计算每一所述兴趣点的类别在所述关键点出现的频率;
根据每一所述兴趣点的类别在所述关键点出现的频率生成与所述轨迹数据对应的空间兴趣点特征。
由上述描述可知,从轨迹数据中提取时间特征,然后将轨迹数据与地图兴趣点数据结合提取得到空间兴趣点特征,有助于捕捉轨迹周围环境的特征,便于后续模型训练时,模型进行特征学习。
进一步地,所述将所述低维向量表示输入至神经主题模型,使用无监督学习方法进行模型训练,得到训练完成的神经主题模型包括:
将所述低维向量表示输入至神经主题模型,使用变分自编码器和组合损失函数进行模型训练,得到训练完成的神经主题模型。
由上述描述可知,变分自编码器是一种无监督学习方法,可以将高维数据压缩成低维的潜在空间,并学习数据的生成分布,主题模型则可以将文本数据表示为一组主题,每个主题包含一些相关的单词,并用一个主题分布向量来表示文档中各个主题的重要性,使用无监督学习方法用于神经主题模型训练,可将轨迹数据转换为主题分布的形式,能够对轨迹数据进行全局建模和推断,无需依赖数据标签,提高了模型的预测精度和可解释性。
进一步地,所述组合损失函数包括边际似然函数和几何代理损失函数;
所述组合损失函数为:
;
,/>;
;
式中,表示所述组合损失函数,/>表示所述几何代理损失函数,/>表示所述边际似然函数,λ表示正则化参数,/>表示相似轨迹特征的隐藏表示之间的欧氏距离,S表示具有相似轨迹的集合,/>表示第i条轨迹的隐藏表示,/>表示第j条轨迹的隐藏表示,表示给定输入数据潜在表示的情况下输入数据的低维向量的概率分布,/>表示给定输入数据低维向量的情况下输入数据潜在表示的概率分布,/>表示输入数据低维向量的概率分布,e表示所述低维向量表示,z表示输入数据的潜在表示。
由上述描述可知,组合损失函数包括边际似然函数和几何代理损失函数,使得训练完成的模型能够从轨迹特征嵌入中学习主题分布,同时保持特征之间的几何关系,从而提高最后的出行目的推断的准确性和可靠性。
进一步地,还包括:
使用困惑度指标和主题一致性指标对所述训练完成的神经主题模型进行评估,得到评估结果;
根据所述评估结果对所述训练完成的神经主题模型进行优化。
由上述描述可知,采用困惑度和主题一致性这两个指标进行模型评估,可以确定模型的性能表现,困惑度可以用于评估模型对于新的轨迹数据的推断能力,主题一致性用于评估主题模型生成的主题是否具有一定的语义连贯性,根据评估结果对训练完成的神经主题模型进行优化,能够不断保持模型的精度,从而提高出行目的推断的准确性。
请参照图2,一种出行目的推断终端,包括存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取轨迹数据,并提取与所述轨迹数据对应的时间特征和空间兴趣点特征;
将所述轨迹数据的起点位置、终点位置、所述时间特征和所述空间兴趣点特征输入至嵌入表示学习模型,输出与所述轨迹数据对应的低维向量表示;
将所述低维向量表示输入至神经主题模型,使用无监督学习方法进行模型训练,得到训练完成的神经主题模型;
获取待推断轨迹数据,并使用所述训练完成的神经主题模型对所述待推断轨迹数据进行出行目的推断,得到推断结果。
从上述描述可知,本发明的有益效果在于:提取与获取的轨迹数据对应的时间特征和空间兴趣点特征,将轨迹数据的起点位置、终点位置、时间特征和空间兴趣点特征输入至嵌入表示学习模型,输出与轨迹数据对应的低维向量表示,将低维向量表示输入至神经主题模型,使用无监督学习方法进行模型训练,得到训练完成的神经主题模型,使用训练完成的神经主题模型对待推断轨迹数据进行出行目的推断,通过结合轨迹数据与地图兴趣点数据,增强了出现目的推断的可解释性和合理性,结合嵌入表示学习和无监督学习完成模型训练,提高了模型的鲁棒性和泛化能力,且无需依赖数据标签,考虑到了不同出行场景和需求的影响,从而有效、准确地推断出行目的。
进一步地,所述提取与所述轨迹数据对应的时间特征和空间兴趣点特征包括:
从所述轨迹数据中确定开始时间、结束时间、出行持续时间、星期信息以及法定节假日信息;
根据所述开始时间、结束时间、出行持续时间、星期信息以及法定节假日信息生成与所述轨迹数据对应的时间特征;
获取所述轨迹数据在第一预设范围内的地图兴趣点数据;
将所述地图兴趣点数据与所述轨迹数据进行整合,得到所述轨迹数据中的关键点;
确定每一所述关键点在第二预设范围内的所有兴趣点;
确定每一所述兴趣点的类别,并计算每一所述兴趣点的类别在所述关键点出现的频率;
根据每一所述兴趣点的类别在所述关键点出现的频率生成与所述轨迹数据对应的空间兴趣点特征。
由上述描述可知,从轨迹数据中提取时间特征,然后将轨迹数据与地图兴趣点数据结合提取得到空间兴趣点特征,有助于捕捉轨迹周围环境的特征,便于后续模型训练时,模型进行特征学习。
进一步地,所述将所述低维向量表示输入至神经主题模型,使用无监督学习方法进行模型训练,得到训练完成的神经主题模型包括:
将所述低维向量表示输入至神经主题模型,使用变分自编码器和组合损失函数进行模型训练,得到训练完成的神经主题模型。
由上述描述可知,变分自编码器是一种无监督学习方法,可以将高维数据压缩成低维的潜在空间,并学习数据的生成分布,主题模型则可以将文本数据表示为一组主题,每个主题包含一些相关的单词,并用一个主题分布向量来表示文档中各个主题的重要性,使用无监督学习方法用于神经主题模型训练,可将轨迹数据转换为主题分布的形式,能够对轨迹数据进行全局建模和推断,无需依赖数据标签,提高了模型的预测精度和可解释性。
进一步地,所述组合损失函数包括边际似然函数和几何代理损失函数;
所述组合损失函数为:
;
,/>;
;
式中,表示所述组合损失函数,/>表示所述几何代理损失函数,/>表示所述边际似然函数,λ表示正则化参数,/>表示相似轨迹特征的隐藏表示之间的欧氏距离,S表示具有相似轨迹的集合,/>表示第i条轨迹的隐藏表示,/>表示第j条轨迹的隐藏表示,表示给定输入数据潜在表示的情况下输入数据的低维向量的概率分布,/>表示给定输入数据低维向量的情况下输入数据潜在表示的概率分布,/>表示输入数据低维向量的概率分布,e表示所述低维向量表示,z表示输入数据的潜在表示。
由上述描述可知,组合损失函数包括边际似然函数和几何代理损失函数,使得训练完成的模型能够从轨迹特征嵌入中学习主题分布,同时保持特征之间的几何关系,从而提高最后的出行目的推断的准确性和可靠性。
进一步地,还包括:
使用困惑度指标和主题一致性指标对所述训练完成的神经主题模型进行评估,得到评估结果;
根据所述评估结果对所述训练完成的神经主题模型进行优化。
由上述描述可知,采用困惑度和主题一致性这两个指标进行模型评估,可以确定模型的性能表现,困惑度可以用于评估模型对于新的轨迹数据的推断能力,主题一致性用于评估主题模型生成的主题是否具有一定的语义连贯性,根据评估结果对训练完成的神经主题模型进行优化,能够不断保持模型的精度,从而提高出行目的推断的准确性。
本发明上述的出行目的推断方法及终端能够适用于智能交通管理、个性化推荐等场景中,以下通过具体实施方式进行说明:
实施例一
请参照图1,本实施例的一种出行目的推断方法,包括步骤:
S1、获取轨迹数据,并提取与所述轨迹数据对应的时间特征和空间兴趣点特征,具体包括:
S11、获取轨迹数据;
在一种可选的实施方式中,获取轨迹数据之后,对所述轨迹数据进行预处理,包括数据清洗、去噪、去重、标准化等,得到处理后的轨迹数据,以此保证数据的质量和可靠性。
S12、从所述轨迹数据中确定开始时间、结束时间、出行持续时间、星期信息以及法定节假日信息;
其中,所述星期信息即出行当天是一周中的星期几,以确定是工作日或周末,所述法定节假日信息即出行当天是否为法定节假日。
S13、根据所述开始时间、结束时间、出行持续时间、星期信息以及法定节假日信息生成与所述轨迹数据对应的时间特征。
S14、获取所述轨迹数据在第一预设范围内的地图兴趣点数据;
其中,所述第一预设范围为第一指定半径;
具体的,将所述轨迹数据的起点与终点分别作为原点,获取第一指定半径内的地图兴趣点(POI)数据。
S15、将所述地图兴趣点数据与所述轨迹数据进行整合,得到所述轨迹数据中的关键点。
S16、确定每一所述关键点在第二预设范围内的所有兴趣点;
其中,所述第二预设范围为第二指定半径;
具体的,以每一所述关键点为原点,确定在第二指定半径内的所有兴趣点。
S17、确定每一所述兴趣点的类别,并计算每一所述兴趣点的类别在所述关键点出现的频率,具体的:
;
式中,Pi表示每一所述兴趣点的类别在所述关键点出现的频率,Ni表示以每一所述关键点为原点确定的在第二指定半径内的所有兴趣点的类别的总数,表示以每一所述关键点为原点确定的在第二指定半径内的所有兴趣点的总数。
S18、根据每一所述兴趣点的类别在所述关键点出现的频率生成与所述轨迹数据对应的空间兴趣点特征。
S2、将所述轨迹数据的起点位置、终点位置、所述时间特征和所述空间兴趣点特征输入至嵌入表示学习模型,输出与所述轨迹数据对应的低维向量表示;
其中,将所有的轨迹数据表示为一个文本语料库,每条轨迹数据对应一个文档,轨迹中的每个特征对应一个单词,因此对于轨迹中的特征表示为:;Mij表示第i条轨迹中的第j个特征,/>表示轨迹特征嵌入参数,/>表示出行目的嵌入参数。
S3、将所述低维向量表示输入至神经主题模型,使用无监督学习方法进行模型训练,得到训练完成的神经主题模型;
具体的,将所述低维向量表示输入至神经主题模型,使用变分自编码器(Variational Autoencoder,VAE)和组合损失函数进行模型训练,得到训练完成的神经主题模型;通过将每条轨迹数据看作一个文档,将轨迹中的每一个特征看作一个单词,对于每个文档,可以将其表示为一个由多个单词(即特征)组成的序列。
其中,所述组合损失函数包括边际似然函数和几何代理损失函数;
所述组合损失函数为:
;
,/>;
;
式中,表示所述组合损失函数,/>表示所述几何代理损失函数,/>表示所述边际似然函数,λ表示正则化参数,/>表示相似轨迹特征的隐藏表示之间的欧氏距离,S表示具有相似轨迹的集合,/>表示第i条轨迹的隐藏表示,/>表示第j条轨迹的隐藏表示,表示给定输入数据潜在表示的情况下输入数据的低维向量的概率分布,/>表示给定输入数据低维向量的情况下输入数据潜在表示的概率分布,/>表示输入数据低维向量的概率分布,e表示所述低维向量表示,z表示输入数据的潜在表示。
其中,所述组合损失函数需以最小化为目标,所述边际似然函数需以最大化为目标,所述几何代理损失函数需以最小化为目标,通过增加正则化参数使组合损失函数实现最小化。
在一种可选的实施方式中,使用随机ELBO(Evidence Lower Bound,证据下界)进行优化,并使用Adam优化器设置学习率。
S4、获取待推断轨迹数据,并使用所述训练完成的神经主题模型对所述待推断轨迹数据进行出行目的推断,得到推断结果。
S5、使用困惑度(perplexity)指标和主题一致性(topic coherence)指标对所述训练完成的神经主题模型进行评估,得到评估结果;
具体的,使用困惑度指标对所述训练完成的神经主题模型进行评估,得到困惑度数值,并使用基于词汇相关性的主题一致性方法,计算每个主题中的前n个高频词语之间的关联程度,得到主题一致性数值。
S6、根据所述评估结果对所述训练完成的神经主题模型进行优化。
采用了困惑度和主题一致性指标对模型进行评估,能够客观地反映模型的预测效果和解释性,同时,在模型设计过程中,充分考虑了模型的可解释性和可操作性,使得模型的结果更容易被理解和应用,此外,模型在前期设计效果不佳时允许反复迭代优化,进而可以快速提高出行目的推断的准确率。
表1保留轨迹特征嵌入与主题分布之间的几何关系对模型的影响
所述几何代理损失函数能够保留轨迹特征嵌入与主题分布之间的几何关系,如表1所示,当模型考虑轨迹特征嵌入与主题分布之间的几何关系时,困惑度低于不考虑该几何关系的模型,且主题一致性高于不考虑该几何关系的模型,说明考虑轨迹特征嵌入与主题分布之间的几何关系的神经主题模型具有更好的预测能力和语义连贯性,从而有效、准确地推断出行目的。
实施例二
请参照图2,本实施例的一种出行目的推断终端,包括存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现实施例一中的出行目的推断方法中的各个步骤。
综上所述,本发明提供的一种出行目的推断方法及终端,获取轨迹数据,并提取与所述轨迹数据对应的时间特征和空间兴趣点特征;将所述轨迹数据的起点位置、终点位置、所述时间特征和所述空间兴趣点特征输入至嵌入表示学习模型,输出与所述轨迹数据对应的低维向量表示;将所述低维向量表示输入至神经主题模型,使用无监督学习方法进行模型训练,得到训练完成的神经主题模型;获取待推断轨迹数据,并使用所述训练完成的神经主题模型对所述待推断轨迹数据进行出行目的推断,得到推断结果,通过结合轨迹数据与地图兴趣点数据,增强了出现目的推断的可解释性和合理性,结合嵌入表示学习和无监督学习完成模型训练,提高了模型的鲁棒性和泛化能力,且无需依赖数据标签,考虑到了不同出行场景和需求的影响,从而有效、准确地推断出行目的;并且,采用困惑度和主题一致性这两个指标进行模型评估,可以确定模型的性能表现,困惑度可以用于评估模型对于新的轨迹数据的推断能力,主题一致性用于评估主题模型生成的主题是否具有一定的语义连贯性,根据评估结果对训练完成的神经主题模型进行优化,能够不断保持模型的精度,从而提高出行目的推断的准确性。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种出行目的推断方法,其特征在于,包括步骤:
获取轨迹数据,并提取与所述轨迹数据对应的时间特征和空间兴趣点特征;
将所述轨迹数据的起点位置、终点位置、所述时间特征和所述空间兴趣点特征输入至嵌入表示学习模型,输出与所述轨迹数据对应的低维向量表示;
将所述低维向量表示输入至神经主题模型,使用无监督学习方法进行模型训练,得到训练完成的神经主题模型;
获取待推断轨迹数据,并使用所述训练完成的神经主题模型对所述待推断轨迹数据进行出行目的推断,得到推断结果。
2.根据权利要求1所述的一种出行目的推断方法,其特征在于,所述提取与所述轨迹数据对应的时间特征和空间兴趣点特征包括:
从所述轨迹数据中确定开始时间、结束时间、出行持续时间、星期信息以及法定节假日信息;
根据所述开始时间、结束时间、出行持续时间、星期信息以及法定节假日信息生成与所述轨迹数据对应的时间特征;
获取所述轨迹数据在第一预设范围内的地图兴趣点数据;
将所述地图兴趣点数据与所述轨迹数据进行整合,得到所述轨迹数据中的关键点;
确定每一所述关键点在第二预设范围内的所有兴趣点;
确定每一所述兴趣点的类别,并计算每一所述兴趣点的类别在所述关键点出现的频率;
根据每一所述兴趣点的类别在所述关键点出现的频率生成与所述轨迹数据对应的空间兴趣点特征。
3.根据权利要求1所述的一种出行目的推断方法,其特征在于,所述将所述低维向量表示输入至神经主题模型,使用无监督学习方法进行模型训练,得到训练完成的神经主题模型包括:
将所述低维向量表示输入至神经主题模型,使用变分自编码器和组合损失函数进行模型训练,得到训练完成的神经主题模型。
4.根据权利要求3所述的一种出行目的推断方法,其特征在于,所述组合损失函数包括边际似然函数和几何代理损失函数;
所述组合损失函数为:
;
,/>;
;
式中,表示所述组合损失函数,/>表示所述几何代理损失函数,/>表示所述边际似然函数,λ表示正则化参数,/>表示相似轨迹特征的隐藏表示之间的欧氏距离,S表示具有相似轨迹的集合,/>表示第i条轨迹的隐藏表示,/>表示第j条轨迹的隐藏表示,/>表示给定输入数据潜在表示的情况下输入数据的低维向量的概率分布,表示给定输入数据低维向量的情况下输入数据潜在表示的概率分布,/>表示输入数据低维向量的概率分布,e表示所述低维向量表示,z表示输入数据的潜在表示。
5.根据权利要求1所述的一种出行目的推断方法,其特征在于,还包括:
使用困惑度指标和主题一致性指标对所述训练完成的神经主题模型进行评估,得到评估结果;
根据所述评估结果对所述训练完成的神经主题模型进行优化。
6.一种出行目的推断终端,包括存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
获取轨迹数据,并提取与所述轨迹数据对应的时间特征和空间兴趣点特征;
将所述轨迹数据的起点位置、终点位置、所述时间特征和所述空间兴趣点特征输入至嵌入表示学习模型,输出与所述轨迹数据对应的低维向量表示;
将所述低维向量表示输入至神经主题模型,使用无监督学习方法进行模型训练,得到训练完成的神经主题模型;
获取待推断轨迹数据,并使用所述训练完成的神经主题模型对所述待推断轨迹数据进行出行目的推断,得到推断结果。
7.根据权利要求6所述的一种出行目的推断终端,其特征在于,所述提取与所述轨迹数据对应的时间特征和空间兴趣点特征包括:
从所述轨迹数据中确定开始时间、结束时间、出行持续时间、星期信息以及法定节假日信息;
根据所述开始时间、结束时间、出行持续时间、星期信息以及法定节假日信息生成与所述轨迹数据对应的时间特征;
获取所述轨迹数据在第一预设范围内的地图兴趣点数据;
将所述地图兴趣点数据与所述轨迹数据进行整合,得到所述轨迹数据中的关键点;
确定每一所述关键点在第二预设范围内的所有兴趣点;
确定每一所述兴趣点的类别,并计算每一所述兴趣点的类别在所述关键点出现的频率;
根据每一所述兴趣点的类别在所述关键点出现的频率生成与所述轨迹数据对应的空间兴趣点特征。
8.根据权利要求6所述的一种出行目的推断终端,其特征在于,所述将所述低维向量表示输入至神经主题模型,使用无监督学习方法进行模型训练,得到训练完成的神经主题模型包括:
将所述低维向量表示输入至神经主题模型,使用变分自编码器和组合损失函数进行模型训练,得到训练完成的神经主题模型。
9.根据权利要求8所述的一种出行目的推断终端,其特征在于,所述组合损失函数包括边际似然函数和几何代理损失函数;
所述组合损失函数为:
;
,/>;
;
式中,表示所述组合损失函数,/>表示所述几何代理损失函数,/>表示所述边际似然函数,λ表示正则化参数,/>表示相似轨迹特征的隐藏表示之间的欧氏距离,S表示具有相似轨迹的集合,/>表示第i条轨迹的隐藏表示,/>表示第j条轨迹的隐藏表示,/>表示给定输入数据潜在表示的情况下输入数据的低维向量的概率分布,表示给定输入数据低维向量的情况下输入数据潜在表示的概率分布,/>表示输入数据低维向量的概率分布,e表示所述低维向量表示,z表示输入数据的潜在表示。
10.根据权利要求6所述的一种出行目的推断终端,其特征在于,还包括:
使用困惑度指标和主题一致性指标对所述训练完成的神经主题模型进行评估,得到评估结果;
根据所述评估结果对所述训练完成的神经主题模型进行优化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310738026.5A CN116484953B (zh) | 2023-06-21 | 2023-06-21 | 一种出行目的推断方法及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310738026.5A CN116484953B (zh) | 2023-06-21 | 2023-06-21 | 一种出行目的推断方法及终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116484953A true CN116484953A (zh) | 2023-07-25 |
CN116484953B CN116484953B (zh) | 2023-09-12 |
Family
ID=87212263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310738026.5A Active CN116484953B (zh) | 2023-06-21 | 2023-06-21 | 一种出行目的推断方法及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116484953B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147892A (zh) * | 2019-02-20 | 2019-08-20 | 电子科技大学 | 基于变分轨迹上下文感知的人类移动模式推测模型、训练方法及推测方法 |
CN111400620A (zh) * | 2020-03-27 | 2020-07-10 | 东北大学 | 基于时空嵌入Self-Attention的用户轨迹位置预测方法 |
US20200364507A1 (en) * | 2019-05-14 | 2020-11-19 | Here Global B.V. | Method, apparatus, and system for providing map emedding analytics |
CN112380426A (zh) * | 2020-10-23 | 2021-02-19 | 南京邮电大学 | 一种基于图嵌入与用户长短期兴趣融合的兴趣点推荐方法、系统 |
CN112529294A (zh) * | 2020-12-09 | 2021-03-19 | 中国科学院深圳先进技术研究院 | 个体随机出行目的地预测模型的训练方法、介质和设备 |
CN112966193A (zh) * | 2021-03-05 | 2021-06-15 | 北京百度网讯科技有限公司 | 出行意图推断方法、模型训练方法、相关装置及电子设备 |
CN113158030A (zh) * | 2021-03-12 | 2021-07-23 | 北京百度网讯科技有限公司 | 异地兴趣点的推荐方法、装置、电子设备及存储介质 |
US20230169271A1 (en) * | 2021-11-30 | 2023-06-01 | Adobe Inc. | System and methods for neural topic modeling using topic attention networks |
-
2023
- 2023-06-21 CN CN202310738026.5A patent/CN116484953B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147892A (zh) * | 2019-02-20 | 2019-08-20 | 电子科技大学 | 基于变分轨迹上下文感知的人类移动模式推测模型、训练方法及推测方法 |
US20200364507A1 (en) * | 2019-05-14 | 2020-11-19 | Here Global B.V. | Method, apparatus, and system for providing map emedding analytics |
CN111400620A (zh) * | 2020-03-27 | 2020-07-10 | 东北大学 | 基于时空嵌入Self-Attention的用户轨迹位置预测方法 |
CN112380426A (zh) * | 2020-10-23 | 2021-02-19 | 南京邮电大学 | 一种基于图嵌入与用户长短期兴趣融合的兴趣点推荐方法、系统 |
CN112529294A (zh) * | 2020-12-09 | 2021-03-19 | 中国科学院深圳先进技术研究院 | 个体随机出行目的地预测模型的训练方法、介质和设备 |
CN112966193A (zh) * | 2021-03-05 | 2021-06-15 | 北京百度网讯科技有限公司 | 出行意图推断方法、模型训练方法、相关装置及电子设备 |
CN113158030A (zh) * | 2021-03-12 | 2021-07-23 | 北京百度网讯科技有限公司 | 异地兴趣点的推荐方法、装置、电子设备及存储介质 |
US20230169271A1 (en) * | 2021-11-30 | 2023-06-01 | Adobe Inc. | System and methods for neural topic modeling using topic attention networks |
Non-Patent Citations (2)
Title |
---|
XUERONG XIAO 等: "VAE-Info-cGAN: Generating Synthetic Images by Combining Pixel-level and Feature-level Geospatial Conditional Inputs", 《IWCTS’20》, pages 1 - 10 * |
张家祺 等: "基于符号学的车载手势交互的手势轨迹研究", 《包装工程》, vol. 40, no. 16, pages 187 - 193 * |
Also Published As
Publication number | Publication date |
---|---|
CN116484953B (zh) | 2023-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10536580B2 (en) | Recommendations based on feature usage in applications | |
US9965717B2 (en) | Learning image representation by distilling from multi-task networks | |
CN109993102B (zh) | 相似人脸检索方法、装置及存储介质 | |
CN111382361B (zh) | 信息推送方法、装置、存储介质和计算机设备 | |
US20060218192A1 (en) | Method and System for Providing Information Services Related to Multimodal Inputs | |
CN112955893A (zh) | 文档的自动超链接 | |
CN111950497B (zh) | 一种基于多任务学习模型的ai换脸视频检测方法 | |
CN111783474A (zh) | 一种评论文本观点信息处理方法、装置及存储介质 | |
CN107507620A (zh) | 一种语音播报声音设置方法、装置、移动终端及存储介质 | |
CN115048586B (zh) | 一种融合多特征的新闻推荐方法及系统 | |
US20240054293A1 (en) | Multi-turn dialogue response generation using asymmetric adversarial machine classifiers | |
CN115544279B (zh) | 一种基于协同注意力的多模态情感分类方法及其应用 | |
CN112632244A (zh) | 一种人机通话的优化方法、装置、计算机设备及存储介质 | |
CN112836025A (zh) | 一种意图识别方法及装置 | |
CN111538818A (zh) | 数据查询方法、装置、电子设备及存储介质 | |
CN113468891A (zh) | 文本处理方法以及装置 | |
CN110674313B (zh) | 一种基于用户日志动态更新知识图谱的方法 | |
CN116150306A (zh) | 问答机器人的训练方法、问答方法及装置 | |
CN116484953B (zh) | 一种出行目的推断方法及终端 | |
CN117033657A (zh) | 一种信息检索方法及装置 | |
CN117132923A (zh) | 视频分类方法、装置、电子设备及存储介质 | |
CN116881730A (zh) | 基于语境的聊天场景匹配系统、方法、设备及存储介质 | |
CN114254205B (zh) | 一种基于音乐多模态数据的用户长短期偏好推荐预测方法 | |
US20230027078A1 (en) | Systems and methods for generation and deployment of a human-personified virtual agent using pre-trained machine learning-based language models and a video response corpus | |
CN113792121B (zh) | 阅读理解模型的训练方法及装置、阅读理解方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |