CN115907107A - 轨迹预测模型训练方法、装置、设备和轨迹预测方法 - Google Patents
轨迹预测模型训练方法、装置、设备和轨迹预测方法 Download PDFInfo
- Publication number
- CN115907107A CN115907107A CN202211378221.3A CN202211378221A CN115907107A CN 115907107 A CN115907107 A CN 115907107A CN 202211378221 A CN202211378221 A CN 202211378221A CN 115907107 A CN115907107 A CN 115907107A
- Authority
- CN
- China
- Prior art keywords
- data
- training
- node
- initial
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种轨迹预测模型训练方法、装置、设备和轨迹预测方法。所述方法包括:获取初始数据,所述初始数据至少包括目标对象信息以及环境信息;基于时间属性将所述初始数据转化为有向图数据,所述有向图数据包括节点向量和有向边向量;基于每个所述节点向量的相邻节点向量确定每个所述节点向量的权重,得到训练数据集,所述训练数据集包括多个时刻的轨迹数据;基于所述训练数据集对初始模型进行训练,得到目标轨迹预测模型。采用本方法能够综合各个节点对应的特征信息,以及各个特征信息之间的联系对初始模型的训练数据进行优化,进而提高目标轨迹预测模型的轨迹预测能力,进一步提高轨迹预测的准确率。
Description
技术领域
本申请涉及及其学习技术领域,特别是涉及一种轨迹预测模型训练方法、装置、设备和轨迹预测方法。
背景技术
随着人工智能技术的迅速发展,行人轨迹预测在多个领域中受到越来越多的关注,例如自动驾驶汽车、智能交通、智慧城市等领域中均广泛的应用了行人轨迹预测技术。
在现有的行人轨迹预测方法中,通常根据获取到的各个节点之间的关系进行轨迹预测。但在现有的行人轨迹预测方法中,无法利用各个节点的特征信息,例如经纬度信息,时间信息,当前时刻人体的动作等均未被使用。借助行人轨迹预测方法无法处理得到各个特征信息之间的相关性。因此,实际应用过程中,尤其是在长期预测的场景下往往无法达到预期的预测效果。
针对相关技术中存在如何进一步提高轨迹预测的准确率,目前还没有提出有效的解决方案。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高行人轨迹预测的准确率的轨迹预测模型训练方法、装置、设备和轨迹预测方法。
第一方面,本申请提供了一种轨迹预测模型训练方法,所述方法包括:
获取初始数据,所述初始数据至少包括目标对象信息以及环境信息;
基于时间属性将所述初始数据转化为有向图数据,所述有向图数据包括节点向量和有向边向量;
基于每个所述节点向量的相邻节点向量确定每个所述节点向量的权重,得到训练数据集,所述训练数据集包括多个时刻的轨迹数据;
基于所述训练数据集对初始模型进行训练,得到目标轨迹预测模型。
在其中一个实施例中,所述环境信息包括地理位置信息,时间信息和区域环境信息,所述基于时间属性将所述初始数据转化为有向图数据集包括:
基于时间属性将所述初始数据转化为数据链;
基于所述数据链的节点特征信息和有向边特征信息将所述数据链转化为有向图数据集,其中所述节点特征信息确定节点向量,所述有向边特征信息确定有向边向量。
在其中一个实施例中,所述基于每个所述节点向量的相邻节点向量确定每个所述节点向量的权重包括:
采用注意力机制,基于每个所述节点向量的相邻节点向量确定每个所述节点向量的权重。
在其中一个实施例中,所述基于所述训练数据集对初始模型进行训练,得到目标轨迹预测模型包括:
将t时刻的轨迹数据作为输入,将t+1时刻的轨迹数据作为参考数据,对所述目标轨迹预测模型进行训练。
在其中一个实施例中,所述基于所述训练数据集对初始模型进行训练之前包括:
以任一所述节点向量为起点,沿预设方向行走预设步数,得到参考轨迹,作为训练数据集。
在其中一个实施例中,所述方法包括:
获取待预测数据,所述待预测数据为有向图数据,包括当前时刻的轨迹数据;
将所述待预测数据输入轨迹预测模型中,得到下一时刻的轨迹数据。
在其中一个实施例中,所述将所述待预测数据输入轨迹预测模型中,得到下一时刻的轨迹数据之后还包括:
将所述待预测数据以及下一时刻的轨迹数据作为训练数据集,对所述轨迹预测模型进行训练。
第二方面,本申请还提供了一种轨迹预测模型训练装置,所述装置包括:
获取模块,用于获取初始数据,所述初始数据至少包括目标对象信息以及环境信息;
转化模块,用于基于时间属性将所述初始数据转化为有向图数据集,所述有向图数据集包括节点向量和有向边向量;
权重确定模块,用于基于每个所述节点向量的相邻节点向量确定每个所述节点向量的权重,得到训练数据集,所述训练数据集包括多个时刻的轨迹数据;
训练模块,用于基于所述训练数据集对初始模型进行训练,得到目标轨迹预测模型。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取初始数据,所述初始数据至少包括目标对象信息以及环境信息;
基于时间属性将所述初始数据转化为有向图数据,所述有向图数据包括节点向量和有向边向量;
基于每个所述节点向量的相邻节点向量确定每个所述节点向量的权重,得到训练数据集,所述训练数据集包括多个时刻的轨迹数据;
基于所述训练数据集对初始模型进行训练,得到目标轨迹预测模型。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取初始数据,所述初始数据至少包括目标对象信息以及环境信息;
基于时间属性将所述初始数据转化为有向图数据,所述有向图数据包括节点向量和有向边向量;
基于每个所述节点向量的相邻节点向量确定每个所述节点向量的权重,得到训练数据集,所述训练数据集包括多个时刻的轨迹数据;
基于所述训练数据集对初始模型进行训练,得到目标轨迹预测模型。
上述轨迹预测模型训练方法、装置、设备和轨迹预测方法,通过获取初始数据,所述初始数据至少包括目标对象信息以及环境信息。再基于时间属性将所述初始数据转化为有向图数据,所述有向图数据包括节点向量和有向边向量。然后基于每个所述节点向量的相邻节点向量确定每个所述节点向量的权重,得到训练数据集,所述训练数据集包括多个时刻的轨迹数据。最后基于所述训练数据集对初始模型进行训练,得到目标轨迹预测模型。能够综合各个节点对应的特征信息,以及各个特征信息之间的联系对初始模型的训练数据进行优化,进而提高目标轨迹预测模型的轨迹预测能力,进一步提高轨迹预测的准确率。
附图说明
图1为RNN变体轨迹预测模型结构示意图;
图2为RNN变体轨迹预测模型特征参数的获取流程示意图;
图3为一个实施例中轨迹预测模型训练方法的应用环境图;
图4为一个实施例中轨迹预测模型训练方法的流程示意图;
图5为一个实施例中初始有向图数据的向量分解示意图;
图6为一个实施例中数据集切割方式示意图;
图7为一个实施例中数据扩充方式的示意图;
图8为一个优选实施例中的轨迹预测模型训练方法的流程图;
图9为一个实施例中轨迹预测模型训练装置的结构框图;
图10为一个实施例中轨迹预测装置的结构框图;
图11为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在传统的轨迹预测模型的算法中,通常通过对收集到的数据的时序特征进行简单计算来实现轨迹预测,但针对新采集到的数据,需要重新进行表征训练,然后再进行轨迹预测。例如DeepWalk,Node2Vec等算法均能够完成对图节点的表征,但无法对新加入图节点进行表征更新。进而导致了轨迹预测的预测效率低下。进一步的,随着采集数据的增多,表征训练时的总参数量也随之增加,在实际的应用过程中,针对长期预测的情况,往往无法达到预期效果。
针对如何有效提高轨迹预测的预测效率,目前主要引入了人工智能和深度学习等知识来解决,具体的,可分为基于循环网络方向和基于卷积神经网络方向。
图1为RNN变体轨迹预测模型结构示意图,在循环神经网络(Recurrent NeuralNetwork,简称RNN)变体的轨迹预测模型中,其模型结构图如图1所示,可以从数据即中提取带有时序性的语义特征,并通过神经网络和卷积网络进行可视化轨迹预测。
为获取能够适应上述模型的特征参数,需要通过如下流程获取对应的参数。图2为RNN变体轨迹预测模型特征参数的获取流程示意图,如图2所示,首先获取个体数据集,然后在清洗阶段在个体用户数据集上提取属性的相关特征,并判断是否存在行为标签。若存在行为标签则将行为标签加注至节点中形成完整路径数据集,若不存在行为标签,则进行其他方向的研究,其中,进行加注时包括利用时序特征从前置后排序形成多段轨迹路径,将行为标签与轨迹路径相对应进而得到完整路径数据集。接下来通过图像特征工程得到连续时序性的链路向量,具体的,可使用图像特征工程表征路径,适当对分布数量存在差异的数据进行删除进而获取到连续时序性的长链数据向量。最后将链路向量输入至图神经网络(Graph Neural Network)进行学习预测。
可选的,上述链路向量属于有向图数据,其具有比图片、序列更强的数据和知识表示能力,不仅能表示节点的独立特性,还能表达相同类型甚至不同类型样本之间的联系,能够高效地利用样本实例之间的结构性特征。被认为是推动认知智能发展强有力的推理方法,有望解决深度学习无法处理的关系推理等一系列问题。
图神经网络能够很好地对图节点特征信息进行操作处理,通过用有向图将历史数据库中的数据进行清理融合成具有连续时序特征的基本字典集,根据针对用户和用户行为的特征分别对图上的节点信息和边信息做特征加注后,结合信息素衰减理论,最后借助模型预测和实时训练得到低偏差的预测效果。
在上述研究方向中可通过各个节点之间的关系进行预测,但是无法使用对应节点的特征信息的相关性,仅可使用单独的节点特征信息完成预测。示例性的,若节点特征信息包括经纬度、时间、海拔、动作等,则这些特征信息之间的相关性无法被处理。进一步的,在实际使用过程中,采集到的数据多为非欧几里得空间域生成的数据且表现为具有复杂关系和对象表之间相互依赖的图形。而传统的神经网络结构接收的数据属于欧几里得空间域,无法处理非欧几里得空间域下收集到的复杂图像数据结构。
本申请实施例提供的轨迹预测模型训练方法,可以应用于如图3所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。具体的,可通过终端102获取初始数据,将初始数据发送至服务器104中,然后由服务器104基于时间属性将所述初始数据转化为有向图数据,其中有向图数据包括节点向量和有向边向量;然后基于每个所述节点向量的相邻节点向量确定每个所述节点向量的权重,得到训练数据集,所述训练数据集包括多个时刻的轨迹数据;最后基于所述训练数据集对初始模型进行训练,得到目标轨迹预测模型。其中,终端102可以但不限于是各种图像传感器,位置传感器,环境传感器等数据传感器。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,提供了一种轨迹预测模型训练方法。图4为本实施例中轨迹预测模型训练方法的流程示意图,如图4所示,该方法包括以下步骤:
步骤S401,获取初始数据,所述初始数据至少包括目标对象信息以及环境信息。
其中,初始数据为传感器获取到的当前时刻的目标对象的实时数据,目标对象信息包括目标对象自身携带的属性信息,例如,当目标对象为人时,对应的目标对象信息可以为人体的身高,当目标对象为车辆时,目标对象信息可以为车身的车重,车身的体积等,当目标对象为猫、狗等动物体时,目标对象信息可以为动物体的体型等。环境信息包括当前时刻目标对象所处的地理位置信息,时间信息、区域环境信息。其中地理位置信息可以包括经纬度信息、海拔高度,地形信息等,区域环境信息包括预设区域内的路标信息,路况信息,周边建筑信息等。进一步的,预设区域为目标对象实时图像中的所在区域,示例性的,可以以目标对象为中点,规定一个指定距离,在预设区域则为根据目标对象和指定距离确定的区域。
具体地,可通过GPS传感器,高精度地图,摄像装置等多种途径获取实时采集数据,然后对采集到的图像进行图像识别,获取图像中的目标对象信息与环境信息,在结合其他传感器信息得到初始数据。
步骤S402,基于时间属性将所述初始数据转化为有向图数据,所述有向图数据包括节点向量和有向边向量。
其中,有向图在数学上是表示物件与物件之间的关系的方法,是图论的基本研究对象,其具体可表现为一副具有方向性的图,由一组顶点和一组有方向的边组成的,每条方向的边都连接着一对有序的顶点。在本实施例中,有向图数据由带有目标对象特征的节点向量和表示节点向量之间关联的有向边向量构成,节点向量即为顶点,有向边向量即为有方向的边。
具体的,在获取到初始数据后,可先对初始数据进行预处理,筛除无效数据。然后根据初始数据中的时间属性,对初始数据进行分解转换,确定节点向量与有向边向量,进而得到有向图数据。
步骤S403,基于每个所述节点向量的相邻节点向量确定每个所述节点向量的权重,得到训练数据集,所述训练数据集包括多个时刻的轨迹数据。
具体的,每个节点的权重需要根据其相邻节点的节点特征以及与相邻节点之间的相关性确定。可选的,可通过权重减少的方式模拟信息素衰减的过程没讲上个节点的信息通过信息素衰减的方式加入至下一节点中。
步骤S404,基于所述训练数据集对初始模型进行训练,得到目标轨迹预测模型。
具体的,本实施例中还包括测试数据集,将上述训练数据集输入至初始模型后,得到对应的输出值,可通过将输出值与测试数据集进行对比确定对初始数据的调整参数,进而完成对初始模型的训练,得到目标轨迹预测模型。
上述轨迹预测模型训练方法中,在获取到初始数据后,可基于初始数据中的时间属性将确定节点向量和有向边向量,然后对基于每个节点向量的相邻节点向量确定每个节点向量的权重,进而得到训练数据集。通过对初始数据进行预先处理得到对应的有向图数据,确定各有向图数据中节点向量的权重后得到对应的训练数据集,实现了对模型输入数据的优化处理。进而使得模型输入数据能够包含有各个节点的特征信息以及各特征信息之间的相关性,确保了各节点以及节点特征信息之间的完整性。在基于所述训练集对初始模型进行训练得到对应的目标轨迹预测模型时,能够提高目标轨迹预测模型的轨迹预测能力,进一步提高轨迹预测的准确率,以及轨迹预测时的模型预测效率。
在一个实施例中,所述基于时间属性将所述初始数据转化为有向图数据集包括:基于时间属性将所述初始数据转化为数据链;基于所述数据链的节点特征信息和有向边特征信息将所述数据链转化为有向图数据集,其中所述节点特征信息确定节点向量,所述有向边特征信息确定有向边向量。
在初始数据中包含多个不同目标对象在多个不同时间段内的数据,并非所有数据都可用于轨迹预测,因此在使用前,需要对初始数据进行数据清洗获取有效初始数据。然后需要对有效初始数据进行数据融合,获取初始有向图数据。其中,数据融合是一种从不确定、不精确、不一致、冲突和类似的原始数据中得到更加一致、更有信息量、更准确信息的技术。具体的,可先对地理位置信息进行计算处理,得到能够表示位置的数据;然后结合时间信息,获取隐藏信息,其中,隐藏信息包括速度,当前倾角等;再接着根据时间差,对处理后的有效初始数据进行排列,确定初始有向图数据。进一步的,还需要对上述初始有向图数据进行泛化,示例性的,泛化内容包括对上述初始数据的数量进行泛化,对模型的识别能力进行优化,识别能力越强,泛化能力越强。
在完成对初始数据的融合与泛化后,还需要将得到的初始有向图数据进行分解,得到节点向量与有向边向量。图5为初始有向图数据的向量分解示意图,如图5所示,可将目标对象信息、地理位置信息以及时间信息定义为节点特征信息,根据节点特征信息确定节点向量;将融合过程得到的时间差信息(例如速度)和影响这些时间差信息的周边环境信息定义为有向边特征信息,根据有向边特征信息确定有向边向量。其中节点特征信息为能够影响目标对象行为以及上述数据融合过程中所需的信息,有向边特征信息为能够维持节点向量之间关联的考依据。在得到节点向量以及有向边向量之后即可初步搭建有向图数据集,即多个节点向量有方向性的数据结合,用于表示有关联性的图结构。
在本实施例中,先对初始数据进行数据清洗以及数据融合,然后将其转换为数据链,再基于数据链的节点特征信息和有向边特征信息将所述数据链转化为有向图数据集,能够对初始数据中的有效信息进行准确分析,将有向图数据向量化,得到各数据间的联系,而不是仅通过数据的时序性得到各个离散数据之间的关联。即使在处理复杂的非线性结构数据时,也能够将其准确转换。进一步的,得到的有向图数据更有利于后续对初始模型进行训练,提高训练效率。
在一个实施例中,所述基于每个所述节点向量的相邻节点向量确定每个所述节点向量的权重包括:采用注意力机制,基于每个所述节点向量的相邻节点向量确定每个所述节点向量的权重。
注意力机制(Attention Mechanism)是机器学习中的一种数据处理方法,其本质为定位到感兴趣的信息,抑制无用信息,结果通常都是以概率图或者概率特征向量的形式展示。
具体的,在确定各个节点向量的权重时,可通过每个节点向量与相邻节点向量之间关联程度,借助有向边向量,依据信息素衰减原理,将前一个节点的特征经过淡化后汇聚至下一节点上,以此类推,对所有节点向量完成特征加注。其中,信息素衰减原理源自于蚁群算法中的信息交互,每个个体可以通过释放信息素来改变周围的环境,且每个个体能够感知周围环境的实时变化,个体间通过环境进行间接地通讯,增强了个体间的联系性,能够大大提高算法的计算能力和运行效率。可以理解的是,对于本申请实施例中的每个节点向量而言,每个节点向量的特征信息中均包含有上一节点的特征信息的淡化信息,特征信息在传递的过程中,将淡化部分特征的权重。本实施例中在使用信息衰减原理对各节点向量进行处理的基础上,加入注意力机制以确定每个节点向量的权重。注意力机制在权重确定过程中的作用为人为地控制了上述淡化的特征的衰减程度。
可选的,本实施例中还可以,还可以通过加权注意力的方式,在结构向量上做递减的向量稀释,进而确定各个节点向量的权重。
本实施例中可以将泛化后的节点向量集合与有向边向量集合作为图神经网络的输入数据,该输入数据是一段带有加注特征属性,具有时序性和方向性的,连续经纬度坐标点结合的轨迹数据向量,经过图神经网络训练后,可对应输出下一段轨迹数据坐标。
在本实施例中,通过注意力机制对各个节点向量的权重进行确定,合理的规划了各节点向量之间的相关性,确保了各节点之间均存在信息传递,有利于得到更加准确的训练数据集。进一步的,本实施例中采用注意力机制对节点向量的权重进行确定,能够自动完成对节点的特征信息进行分析,避免了人工分析加注节点的特征信息,进而提高了计算效率。
在一个实施例中,所述基于所述训练数据集对初始模型进行训练,得到目标轨迹预测模型包括:将t时刻的轨迹数据作为输入,将t+1时刻的轨迹数据作为参考数据,对所述目标轨迹预测模型进行训练。
在对初始模型进行训练之前,需要对上述训练数据集中的轨迹数据链信息进行切割,得到作为模型输入的输入数据,以及与模型输出进行对比的参考数据。
图6为本实施例中数据集切割方式示意图,如图6所示,每个小正方形表示处理后的一条完整的轨迹数据,该轨迹数据中包含有节点向量和有向边向量,长方形表示滑块的范围为1.5小时,每次框选是均选取连续的多个正方形进行合并。在进行切割时可将选中的1.5小时区间内的数据作为输入数据,其后的0.5小时的数据作为参考数据。需要说明的是,本申请的每个输入数据有且仅有一个对应的参考数据,但参考数据可对应有多个输入数据,因此在切割后还需要获取输入数据与参考数据之间的映射关系。以便于后续进行训练时根据映射关系确定训练使用的输入数据对应的参考数据,进而对输出结果进行对比。
在进行模型训练时,可将输入数据输入至初始模型中,得到对应的输出结果。然后将输出结果与参考数据进行对比,获取对比结果。再根据对比结果调整初始模型的模型参数,然后再次向调整后的初始模型输入新的输入数据或重复输入上述输入数据,再次获取输出结果,并将输出结果与对应的参考数据进行对比得到对比结果,根据对比结果调整模型。重复上述步骤,直至对比结果符合预设结果。示例性的,对比结果可以是输出结果和参考数据之间的相似度,在相似度小于预设阈值时即完成训练你,得到目标轨迹预测模型。可选的,上述目标轨迹预测模型的训练方法还可以使用机器学习中的常用方法进行训练。
在本实施例中,通过对轨迹数据链信息切割,得到初始模型的输入值与可对输出值进行对比的参考数据,有利于在训练的过程中,不断调整初始模型的参数,提高了最终目标轨迹预测模型的预测准确度。
在一个实施例中,所述基于所述训练数据集对初始模型进行训练之前包括:以任一所述节点向量为起点,沿预设方向行走预设步数,得到参考轨迹,作为训练数据集。
图7为本实施例中数据扩充方式的示意图,如图7所示,可在一条完整的轨迹数据链而言,可包含有多个节点向量以及有向边向量,在进行扩充时选取任意一个节点向量作为起点,然后按照预设的方向,行走预设步数得到参考轨迹,其中预设方向以及预设步数可基于节点特征信息和有向边特征信息确定。最后可将上述参考轨迹作为训练数据集,进而完成样本扩充。进一步的,在本实施例中,还可以通过随机行走的方式进行样本扩充。
在本实施例中,通过对已知的数据链进行样本扩充,有利于丰富训练数据集的多样性,进而从多角度训练初始模型,使得训练后的初始模型能够更加准确处理实时数据。
图8为优选实施例中的轨迹预测模型训练方法的流程图,如图8所示,该轨迹预测模型训练方法包括如下步骤:
步骤S801,获取实时数据,对初始数据进行数据清洗与数据融合得到初始有向图数据。
其中,实时数据通过实时数据库(Real Time Data Base,简称RTDB)获取,实时数据库为数据库系统发展的一个分支,是数据库技术结合实时处理技术产生的,可直接实时采集、获取企业运行过程中的各种数据,并将其转化为对各类业务有效的公共信息,是一种能够很好解决数据资源调用的方式。
在数据清洗与数据融合时,可先对实时数据进行过滤,得到目标对象的属性信息,当前时刻的地理位置信息,区域环境信息以及时间信息。然后根据时间信息进行数据融合得到时间差信息,再基于目标对象的属性信息、当前时刻的地理位置信息、区域环境信息、时间信息以及时间差信息得到初始有向图数据
步骤S802,对初始有向图数据进行数据泛化,基于泛化后的初始有向图数据与历史数据进行向量分解,得到节点向量以及有向边向量。
具体的,可根据目标对象的属性信息、当前时刻的地理位置信息以及时间信息确定节点向量,根据区域环境信息与时间差信息确定有向边向量。
步骤S803,基于节点向量与有向边向量确定有向图样本,并对有向图样本进行扩充得到多个轨迹数据。
步骤S804,对上述轨迹数据进行切割,得到训练数据集。
其中,训练数据集包括输入数据和参考数据,输入数据为对初始模型训练过程中的模型输入,参考数据为对初始模型训练过程中的模型输出对比数据。可选的,在切割完成后还需要确定输入数据与参考数据之间的数据映射关系,每个参考数据有且仅对应有一个参考数据,但根据切割方式的不同,参考数据可对应有多个输入数据。
步骤S805,基于注意力机制分别对输入数据与输入数据进行特征加注,得到输入数据中的训练节点权重和训练有向边权重,以及参考数据中的参考节点权重和参考有向边权重。
步骤S806,基于训练数据集和测试数据集对初始模型进行训练,得到目标轨迹模型。
可选的,得到目标轨迹模型之后可以将模型进行封装,以实现根据输入的有向图信息,预测图节点的走向和分布情况。然后再将模型的输出结果更新至历史数据库中,作为新的有向图数据集再次训练目标轨迹模型,进行模型更新。
在本实施例中,上述步骤通过综合实时数据与历史数据库中的数据,在获取到新的实时数据之后,能够将其与历史数据进行结合得到对应的有向图数据,进而得到了动态数据集用于对模型进行训练并进行模型更新,提高了目标轨迹预测模型的复用性,避免了固定数据集对模型的预测能力进行局限。进一步的,在得到有向图数据之后,在对其进行向量分解、数据扩充、数据切割以及采用注意力机制对节点向量以及有向边向量进行特征加注,得到对应的训练数据集,完整的分析了有向图数据中各个节点的特征信息以及各个特征信息之间的相关性,实现了对模型输入数据的优化处理。进而在基于所述训练集对初始模型进行训练得到对应的目标轨迹预测模型时,能够提高目标轨迹预测模型的轨迹预测能力与模型复用性,进一步提高了轨迹预测的准确率,以及轨迹预测时的模型预测效率。
在一个实施例中还公开了一种轨迹预测方法,所述方法包括:获取待预测数据,所述待预测数据为有向图数据,包括当前时刻的轨迹数据;将所述待预测数据输入轨迹预测模型中,得到下一时刻的轨迹数据。
在完成模型训练后,即可通过该模型进行轨迹预测。具体的,可先获取当前时刻的待预测数据,将待预测数据输入至训练好的目标轨迹预测模型后即可得到下一时刻的轨迹数据。其中,待预测数据与训练数据集中的有向图数据相同,在待预测数据的获取过程中,可基于传感器获取到的实时数据,进行数据清洗,数据融合并确定对应的待预测节点向量与待预测有向边向量,以及注意力加权进而得到待预测数据。可选的,轨迹数据可以为轨迹坐标,
在本实施例中,通过目标轨迹预测模型对待预测数据进行预测,能够快速对实时数据进行分析,并预判得到下一时刻的轨迹坐标,便于用户根据预测结果进行实时行为调整。
在一个实施例中,所述将所述待预测数据输入轨迹预测模型中,得到下一时刻的轨迹数据之后还包括:将所述待预测数据以及下一时刻的轨迹数据作为训练数据集,对所述轨迹预测模型进行训练。
与现有技术相比,本申请中训练数据集中的数据可进行实时更新,并非固定不变。具体的,可将下一时刻对应节点的节点特征信息与有向边特征信息更新至当前的训练数据集中,然后将更新后的训练数据集再次对目标轨迹预测模型训练,将模型进行更新。
在本实施例中,通过待预测数据以及下一时刻的轨迹数据对训练数据集进行更新,有利于对目标轨迹预测模型进行实时调整,提高模型的预测能力。
在现有的轨迹预测模型中,其对应的输入参数必须有顺序,且有固定数量,对应的模型内设的卷积核也设置有固定大小,这也导致了有向图像素点之间的参数必须是确定的且符合预设要求的才能给进行轨迹预测。对使用者而言,上述模型输入的限制将直接影响其使用体验感,并且上述限制也将对使用者的技术进行限定,使得模型不具有很好的普适性。示例性的,现有技术中,轨迹预测模型的匹配规则在设计的时候已成型固定。若此时再添加新的特征因素或者改变分析任务意图,模型的预测效果将存在较大偏差,导致模型缺乏了泛化能力。而一般轨迹预测是实时动态的,随着时间的推移即便再对模型进行重新学习,得到对应预测结果的准确度将降低,呈现逐渐衰减的趋势。
进一步的,现有技术中,轨迹预测模型对有向图的大小也有要求,无法让同一个模型同时适用不同大小的有向图和复杂的有向图拓扑结构。同时对图像层的运算处理需要消耗较大的内存和较多的计算资源。
可选的,在本申请中提供的轨迹预测模型训练方法中,模型的输入数据并非是有固定顺序且数量确定的,而采用了动态数据集进行训练得到,避免了根据固定数据集迭代训练得到目标轨迹预测模型,进而影响模型的普适性和复用性。在对模型进行训练之前,通过采集到的实时数据进行数据清洗以及数据融合能够有效的处理非欧几里得空间数据,针对目标对象的直接或间接的相关数据,进行多种角度,多种概念的关系定义。
进一步的,针对有向图数据的向量分解以及注意力机制对节点的分析,合理规划各个节点向量之间的相关性,在原先自带的注意力机制上再构建更加细腻的关联关系,确保各节点之间都存在信息传递。避免了通过节点间的序列性来定义节点之间的相关性,简化了数据的校验步骤,缩短了特征提取时间,节省了大量的计算时间和计算内存。
更进一步的,本申请的轨迹预测模型训练方法从结构和功能两个方面建模,不仅可以分析数据间本身的关联,也能从数据间的传递过程中分析,能够结合应用场景,具有更强的普适性。也在训练完成之后利用了更新机制能够动态调节模型的预测性能,对模型进行实时回调,避免了使用大量人力进行数据挖掘与分析,即使短时间缺少数据来源,也能够进行自我调整,提高了模型的复用性。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的轨迹预测模型训练方法的轨迹预测模型训练装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个轨迹预测模型训练装置实施例中的具体限定可以参见上文中对于轨迹预测模型训练方法的限定,在此不再赘述。
在一个实施例中,如图9所示,提供了一种轨迹预测模型训练装置,包括:获取模块91、转化模块92、权重确定模块93和训练模块94,其中:
获取模块91,用于获取初始数据,所述初始数据至少包括目标对象信息以及环境信息;
转化模块92,用于基于时间属性将所述初始数据转化为有向图数据集,所述有向图数据集包括节点向量和有向边向量;
权重确定模块93,用于基于每个所述节点向量的相邻节点向量确定每个所述节点向量的权重,得到训练数据集,所述训练数据集包括多个时刻的轨迹数据;
训练模块94,用于基于所述训练数据集对初始模型进行训练,得到目标轨迹预测模型。
通过上述轨迹预测模型训练装置在获取到初始数据后,可基于初始数据中的时间属性将确定节点向量和有向边向量,然后对基于每个节点向量的相邻节点向量确定每个节点向量的权重,进而得到训练数据集。通过对初始数据进行预先处理得到对应的有向图数据,确定各个有向图数据中节点向量的权重后得到对应的训练数据集,实现了对模型输入数据的优化处理。进而使得模型输入数据能够包含有各个节点的特征信息以及各个特征信息之间的相关性,确保了各节点以及节点特征信息之间的完整性。在基于所述训练集对初始模型进行训练得到对应的目标轨迹预测模型时,能够提高目标轨迹预测模型的轨迹预测能力,进一步提高轨迹预测的准确率,以及轨迹预测时的模型预测效率。
进一步的,转换模块92还用于基于时间属性将所述初始数据转化为数据链;基于所述数据链的节点特征信息和有向边特征信息将所述数据链转化为有向图数据集,其中所述节点特征信息确定节点向量,所述有向边特征信息确定有向边向量。
进一步的,权重确定模块93还用于采用注意力机制,基于每个所述节点向量的相邻节点向量确定每个所述节点向量的权重。
进一步的,训练模块94还用于将t时刻的轨迹数据作为输入,将t+1时刻的轨迹数据作为参考数据,对所述目标轨迹预测模型进行训练。
进一步的,训练模块94还用于以任一所述节点向量为起点,沿预设方向行走预设步数,得到参考轨迹,作为训练数据集。
进一步的,所述装置还包括预测模块,用于获取待预测数据,所述待预测数据为有向图数据,包括当前时刻的轨迹数据;将所述待预测数据输入轨迹预测模型中,得到下一时刻的轨迹数据,所述轨迹预测模型通过上述轨迹预测模型训练方法训练得到。
进一步的,所述预测模块还用于将所述待预测数据以及下一时刻的轨迹数据作为训练数据集,对所述轨迹预测模型进行训练。
图10为一个实施例中的轨迹预测装置的结构框图,如图10所示,包括:多维信息融合模块101、向量分解模块102、特征加注模块103、预测输出模块104以及历史数据存储模块105。其中,多维信息融合模块101用于对实时数据进行数据清洗以及数据融合,将实时数据转化为有向图数据,然后将有向图数据发送至向量分解模块102与历史数据存储模块105。向量分解模块102用于结合历史数据存储模块105中的历史有向图数据与多维信息融合模块101输出的实时的有向图数据进行向量分解,得到节点向量以及有向边向量。特征加注模块103用于通过注意力加注机制确定有向图数据中节点向量的权重,得到训练数据集以待预测数据。预测输出模块104用于基于训练数据集对目标轨迹预测模型进行更新,并将待预测数据输入至更新后的目标轨迹预测模型,得到预测结果。历史数据存储模块105接收多维信息融合模块101输出的有向图数据以及预测输出模块104输出的预测结果对历史数据库进行更新。
在本实施例中,上述装置能够通过综合实时数据与历史数据库中的数据,在获取到新的实时数据之后,能够将其与历史数据进行结合得到对应的有向图数据,进而得到了动态数据集用于对模型进行训练并进行模型更新,提高了目标轨迹预测模型的复用性,避免了固定数据集对模型的预测能力进行局限。进一步的,在得到有向图数据之后,在对其进行向量分解、数据扩充、数据切割以及采用注意力机制对节点向量以及有向边向量进行特征加注,得到对应的待预测数据,完整的分析了有向图数据中各个节点的特征信息以及各个特征信息之间的相关性,实现了对模型输入数据的优化处理。以便于在复杂情况下,进行轨迹预测,进一步提高了轨迹预测的准确率,以及轨迹预测时的模型预测效率。
上述轨迹预测模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种轨迹预测模型训练方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取初始数据,所述初始数据至少包括目标对象信息以及环境信息;
基于时间属性将所述初始数据转化为有向图数据,所述有向图数据包括节点向量和有向边向量;
基于每个所述节点向量的相邻节点向量确定每个所述节点向量的权重,得到训练数据集,所述训练数据集包括多个时刻的轨迹数据;
基于所述训练数据集对初始模型进行训练,得到目标轨迹预测模型。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取初始数据,所述初始数据至少包括目标对象信息以及环境信息;
基于时间属性将所述初始数据转化为有向图数据,所述有向图数据包括节点向量和有向边向量;
基于每个所述节点向量的相邻节点向量确定每个所述节点向量的权重,得到训练数据集,所述训练数据集包括多个时刻的轨迹数据;
基于所述训练数据集对初始模型进行训练,得到目标轨迹预测模型。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种轨迹预测模型训练方法,其特征在于,所述方法包括:
获取初始数据,所述初始数据至少包括目标对象信息以及环境信息;
基于时间属性将所述初始数据转化为有向图数据,所述有向图数据包括节点向量和有向边向量;
基于每个所述节点向量的相邻节点向量确定每个所述节点向量的权重,得到训练数据集,所述训练数据集包括多个时刻的轨迹数据;
基于所述训练数据集对初始模型进行训练,得到目标轨迹预测模型。
2.根据权利要求1所述的方法,其特征在于,所述环境信息包括地理位置信息,时间信息和区域环境信息,所述基于时间属性将所述初始数据转化为有向图数据集包括:
基于时间属性将所述初始数据转化为数据链;
基于所述数据链的节点特征信息和有向边特征信息将所述数据链转化为有向图数据集,其中所述节点特征信息确定节点向量,所述有向边特征信息确定有向边向量。
3.根据权利要求1所述的方法,其特征在于,所述基于每个所述节点向量的相邻节点向量确定每个所述节点向量的权重包括:
采用注意力机制,基于每个所述节点向量的相邻节点向量确定每个所述节点向量的权重。
4.根据权利要求1所述的方法,其特征在于,所述基于所述训练数据集对初始模型进行训练,得到目标轨迹预测模型包括:
将t时刻的轨迹数据作为输入,将t+1时刻的轨迹数据作为参考数据,对所述目标轨迹预测模型进行训练。
5.根据权利要求1所述的方法,其特征在于,所述基于所述训练数据集对初始模型进行训练之前包括:
以任一所述节点向量为起点,沿预设方向行走预设步数,得到参考轨迹,作为训练数据集。
6.一种轨迹预测方法,其特征在于,所述方法包括:
获取待预测数据,所述待预测数据为有向图数据,包括当前时刻的轨迹数据;
将所述待预测数据输入轨迹预测模型中,得到下一时刻的轨迹数据,所述轨迹预测模型通过权利要求1-5所述的轨迹预测模型训练方法训练得到。
7.根据权利要求6所述的方法,其特征在于,所述将所述待预测数据输入轨迹预测模型中,得到下一时刻的轨迹数据之后还包括:
将所述待预测数据以及下一时刻的轨迹数据作为训练数据集,对所述轨迹预测模型进行训练。
8.一种轨迹预测模型训练装置,其特征在于,所述装置包括:
获取模块,用于获取初始数据,所述初始数据至少包括目标对象信息以及环境信息;
转化模块,用于基于时间属性将所述初始数据转化为有向图数据集,所述有向图数据集包括节点向量和有向边向量;
权重确定模块,用于基于每个所述节点向量的相邻节点向量确定每个所述节点向量的权重,得到训练数据集,所述训练数据集包括多个时刻的轨迹数据;
训练模块,用于基于所述训练数据集对初始模型进行训练,得到目标轨迹预测模型。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211378221.3A CN115907107A (zh) | 2022-11-04 | 2022-11-04 | 轨迹预测模型训练方法、装置、设备和轨迹预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211378221.3A CN115907107A (zh) | 2022-11-04 | 2022-11-04 | 轨迹预测模型训练方法、装置、设备和轨迹预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115907107A true CN115907107A (zh) | 2023-04-04 |
Family
ID=86475722
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211378221.3A Pending CN115907107A (zh) | 2022-11-04 | 2022-11-04 | 轨迹预测模型训练方法、装置、设备和轨迹预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115907107A (zh) |
-
2022
- 2022-11-04 CN CN202211378221.3A patent/CN115907107A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xu et al. | Simulation of urban expansion via integrating artificial neural network with Markov chain–cellular automata | |
US12050845B2 (en) | Estimating physical parameters of a physical system based on a spatial-temporal emulator | |
Al-Sharif et al. | A novel approach for predicting the spatial patterns of urban expansion by combining the chi-squared automatic integration detection decision tree, Markov chain and cellular automata models in GIS | |
Winter et al. | Directed movements in probabilistic time geography | |
CN107111794B (zh) | 预测和利用地图服务中出行时间的可变性 | |
Liu et al. | Simulating urban growth by integrating landscape expansion index (LEI) and cellular automata | |
Downs et al. | Voxel-based probabilistic space-time prisms for analysing animal movements and habitat use | |
CN112365708B (zh) | 基于多图卷积网络的景区交通量预测模型建立和预测方法 | |
Cheng et al. | Multi-task and multi-view learning based on particle swarm optimization for short-term traffic forecasting | |
CN115797781A (zh) | 农作物识别方法、装置、计算机设备和存储介质 | |
Yang et al. | Feature selection in conditional random fields for map matching of GPS trajectories | |
Zhao et al. | Mastgn: Multi-attention spatio-temporal graph networks for air pollution prediction | |
CN117079148A (zh) | 城市功能区的识别方法、装置、设备和介质 | |
Turukmane et al. | Multispectral image analysis for monitoring by IoT based wireless communication using secure locations protocol and classification by deep learning techniques | |
Crosby et al. | Embedding road networks and travel time into distance metrics for urban modelling | |
CN107844602A (zh) | 一种基于时空属性关联规则的预测方法 | |
Tu et al. | Spatial cooperative simulation of land use-population-economy in the Greater Bay Area, China | |
Qian et al. | Vehicle trajectory modelling with consideration of distant neighbouring dependencies for destination prediction | |
Chen et al. | A cellular automaton integrating spatial case-based reasoning for predicting local landslide hazards | |
Devi et al. | AI‐Based Weather Forecasting System for Smart Agriculture System Using a Recurrent Neural Networks (RNN) Algorithm | |
Xue et al. | Urban population density estimation based on spatio‐temporal trajectories | |
CN115907107A (zh) | 轨迹预测模型训练方法、装置、设备和轨迹预测方法 | |
CN112749209B (zh) | 面向时空数据的移动行为图谱构建方法 | |
CN115310672A (zh) | 城市发展预测模型的构建方法、城市发展预测方法及装置 | |
CN115169718A (zh) | 基于元胞自动机的区域滑坡危险性动态预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |